JP2023547620A - 分配および塩基変換を使用してdnaを解析するための組成物および方法 - Google Patents
分配および塩基変換を使用してdnaを解析するための組成物および方法 Download PDFInfo
- Publication number
- JP2023547620A JP2023547620A JP2023524623A JP2023524623A JP2023547620A JP 2023547620 A JP2023547620 A JP 2023547620A JP 2023524623 A JP2023524623 A JP 2023524623A JP 2023524623 A JP2023524623 A JP 2023524623A JP 2023547620 A JP2023547620 A JP 2023547620A
- Authority
- JP
- Japan
- Prior art keywords
- dna
- nucleobase
- subsample
- target region
- aliquot
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 455
- 238000006243 chemical reaction Methods 0.000 title claims description 83
- 239000000203 mixture Substances 0.000 title abstract description 37
- 238000000638 solvent extraction Methods 0.000 title description 44
- 206010028980 Neoplasm Diseases 0.000 claims abstract description 382
- 201000011510 cancer Diseases 0.000 claims abstract description 284
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 claims abstract description 164
- 230000004048 modification Effects 0.000 claims abstract description 90
- 238000012986 modification Methods 0.000 claims abstract description 90
- 229940104302 cytosine Drugs 0.000 claims abstract description 53
- 108020004414 DNA Proteins 0.000 claims description 594
- 239000000523 sample Substances 0.000 claims description 434
- 238000007069 methylation reaction Methods 0.000 claims description 188
- 238000012163 sequencing technique Methods 0.000 claims description 188
- 230000011987 methylation Effects 0.000 claims description 181
- 230000001973 epigenetic effect Effects 0.000 claims description 154
- 230000027455 binding Effects 0.000 claims description 95
- 210000004027 cell Anatomy 0.000 claims description 80
- 238000011282 treatment Methods 0.000 claims description 70
- 230000003321 amplification Effects 0.000 claims description 45
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 45
- 101710163270 Nuclease Proteins 0.000 claims description 43
- 238000012360 testing method Methods 0.000 claims description 39
- UORVGPXVDQYIDP-UHFFFAOYSA-N trihydridoboron Substances B UORVGPXVDQYIDP-UHFFFAOYSA-N 0.000 claims description 38
- 229910000085 borane Inorganic materials 0.000 claims description 36
- 230000009466 transformation Effects 0.000 claims description 35
- 108700009124 Transcription Initiation Site Proteins 0.000 claims description 33
- LSNNMFCWUKXFEE-UHFFFAOYSA-M Bisulfite Chemical compound OS([O-])=O LSNNMFCWUKXFEE-UHFFFAOYSA-M 0.000 claims description 32
- 108010014064 CCCTC-Binding Factor Proteins 0.000 claims description 30
- UORVGPXVDQYIDP-BJUDXGSMSA-N borane Chemical class [10BH3] UORVGPXVDQYIDP-BJUDXGSMSA-N 0.000 claims description 29
- 239000003638 chemical reducing agent Substances 0.000 claims description 29
- 210000004881 tumor cell Anatomy 0.000 claims description 29
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 claims description 27
- 238000013467 fragmentation Methods 0.000 claims description 24
- 238000006062 fragmentation reaction Methods 0.000 claims description 24
- LRSASMSXMSNRBT-UHFFFAOYSA-N 5-methylcytosine Chemical compound CC1=CNC(=O)N=C1N LRSASMSXMSNRBT-UHFFFAOYSA-N 0.000 claims description 23
- 238000012545 processing Methods 0.000 claims description 23
- NNTOJPXOCKCMKR-UHFFFAOYSA-N boron;pyridine Chemical compound [B].C1=CC=NC=C1 NNTOJPXOCKCMKR-UHFFFAOYSA-N 0.000 claims description 18
- RYVNIFSIEDRLSJ-UHFFFAOYSA-N 5-(hydroxymethyl)cytosine Chemical compound NC=1NC(=O)N=CC=1CO RYVNIFSIEDRLSJ-UHFFFAOYSA-N 0.000 claims description 15
- QHXLIQMGIGEHJP-UHFFFAOYSA-N boron;2-methylpyridine Chemical compound [B].CC1=CC=CC=N1 QHXLIQMGIGEHJP-UHFFFAOYSA-N 0.000 claims description 14
- JBANFLSTOJPTFW-UHFFFAOYSA-N azane;boron Chemical compound [B].N JBANFLSTOJPTFW-UHFFFAOYSA-N 0.000 claims description 11
- GKFJEDWZQZKYHV-UHFFFAOYSA-N borane;2-methylpropan-2-amine Chemical compound B.CC(C)(C)N GKFJEDWZQZKYHV-UHFFFAOYSA-N 0.000 claims description 9
- 239000003153 chemical reaction reagent Substances 0.000 claims description 9
- 230000009615 deamination Effects 0.000 claims description 9
- 238000006481 deamination reaction Methods 0.000 claims description 9
- 102000004190 Enzymes Human genes 0.000 claims description 8
- 108090000790 Enzymes Proteins 0.000 claims description 8
- 230000015572 biosynthetic process Effects 0.000 claims description 8
- 239000007787 solid Substances 0.000 claims description 8
- 230000000593 degrading effect Effects 0.000 claims description 3
- 230000013595 glycosylation Effects 0.000 claims description 3
- 238000006206 glycosylation reaction Methods 0.000 claims description 3
- 102000016897 CCCTC-Binding Factor Human genes 0.000 claims 2
- LWTNJZJJELQQJM-UHFFFAOYSA-N boron;butan-1-amine Chemical compound [B].CCCCN LWTNJZJJELQQJM-UHFFFAOYSA-N 0.000 claims 1
- YBRBMKDOPFTVDT-UHFFFAOYSA-N tert-butylamine Chemical compound CC(C)(C)N YBRBMKDOPFTVDT-UHFFFAOYSA-N 0.000 claims 1
- 125000003729 nucleotide group Chemical group 0.000 abstract description 68
- 239000002773 nucleotide Substances 0.000 abstract description 55
- 102000053602 DNA Human genes 0.000 description 527
- 150000007523 nucleic acids Chemical class 0.000 description 280
- 102000039446 nucleic acids Human genes 0.000 description 276
- 108020004707 nucleic acids Proteins 0.000 description 276
- 238000009826 distribution Methods 0.000 description 135
- 238000005192 partition Methods 0.000 description 101
- 108090000623 proteins and genes Proteins 0.000 description 87
- 230000000875 corresponding effect Effects 0.000 description 59
- 238000004458 analytical method Methods 0.000 description 45
- 230000035772 mutation Effects 0.000 description 35
- 230000002068 genetic effect Effects 0.000 description 33
- 210000001519 tissue Anatomy 0.000 description 33
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 32
- 239000013615 primer Substances 0.000 description 32
- 201000010099 disease Diseases 0.000 description 30
- 102100027671 Transcriptional repressor CTCF Human genes 0.000 description 28
- 102000004169 proteins and genes Human genes 0.000 description 28
- 239000012634 fragment Substances 0.000 description 27
- 102000040430 polynucleotide Human genes 0.000 description 26
- 108091033319 polynucleotide Proteins 0.000 description 26
- 239000002157 polynucleotide Substances 0.000 description 26
- 230000001965 increasing effect Effects 0.000 description 24
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N biotin Natural products N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 23
- 206010009944 Colon cancer Diseases 0.000 description 21
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 21
- 230000004927 fusion Effects 0.000 description 21
- 238000003860 storage Methods 0.000 description 20
- 239000011324 bead Substances 0.000 description 19
- 208000035269 cancer or benign tumor Diseases 0.000 description 19
- -1 cfDNA Chemical class 0.000 description 19
- 150000003839 salts Chemical class 0.000 description 19
- 230000015654 memory Effects 0.000 description 18
- 208000001333 Colorectal Neoplasms Diseases 0.000 description 17
- 238000013459 approach Methods 0.000 description 17
- 210000004369 blood Anatomy 0.000 description 17
- 239000008280 blood Substances 0.000 description 17
- OIVLITBTBDPEFK-UHFFFAOYSA-N 5,6-dihydrouracil Chemical compound O=C1CCNC(=O)N1 OIVLITBTBDPEFK-UHFFFAOYSA-N 0.000 description 16
- 230000007067 DNA methylation Effects 0.000 description 16
- 108010047956 Nucleosomes Proteins 0.000 description 16
- 238000001514 detection method Methods 0.000 description 16
- 238000007481 next generation sequencing Methods 0.000 description 16
- 210000001623 nucleosome Anatomy 0.000 description 16
- 108091034117 Oligonucleotide Proteins 0.000 description 15
- 238000009396 hybridization Methods 0.000 description 15
- 108091008146 restriction endonucleases Proteins 0.000 description 15
- 206010069754 Acquired gene mutation Diseases 0.000 description 14
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 14
- 230000002159 abnormal effect Effects 0.000 description 14
- 238000002360 preparation method Methods 0.000 description 14
- 230000037439 somatic mutation Effects 0.000 description 14
- 239000003795 chemical substances by application Substances 0.000 description 13
- 230000037430 deletion Effects 0.000 description 13
- 238000012217 deletion Methods 0.000 description 13
- 230000006607 hypermethylation Effects 0.000 description 13
- 241000282414 Homo sapiens Species 0.000 description 12
- 229960002685 biotin Drugs 0.000 description 12
- 235000020958 biotin Nutrition 0.000 description 12
- 239000011616 biotin Substances 0.000 description 12
- 238000000926 separation method Methods 0.000 description 12
- 230000029087 digestion Effects 0.000 description 11
- 238000005259 measurement Methods 0.000 description 11
- 241001465754 Metazoa Species 0.000 description 10
- 210000001124 body fluid Anatomy 0.000 description 10
- 239000010839 body fluid Substances 0.000 description 10
- 230000008859 change Effects 0.000 description 10
- 230000005291 magnetic effect Effects 0.000 description 10
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 10
- 229940035893 uracil Drugs 0.000 description 10
- 206010058467 Lung neoplasm malignant Diseases 0.000 description 9
- 108010090804 Streptavidin Proteins 0.000 description 9
- 239000011230 binding agent Substances 0.000 description 9
- 239000000872 buffer Substances 0.000 description 9
- 210000000349 chromosome Anatomy 0.000 description 9
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 9
- 238000003780 insertion Methods 0.000 description 9
- 230000037431 insertion Effects 0.000 description 9
- 201000005202 lung cancer Diseases 0.000 description 9
- 208000020816 lung neoplasm Diseases 0.000 description 9
- 210000002381 plasma Anatomy 0.000 description 9
- 230000008569 process Effects 0.000 description 9
- FHSISDGOVSHJRW-UHFFFAOYSA-N 5-formylcytosine Chemical compound NC1=NC(=O)NC=C1C=O FHSISDGOVSHJRW-UHFFFAOYSA-N 0.000 description 8
- 238000003556 assay Methods 0.000 description 8
- 238000003776 cleavage reaction Methods 0.000 description 8
- 230000007017 scission Effects 0.000 description 8
- 108020004682 Single-Stranded DNA Proteins 0.000 description 7
- 238000004891 communication Methods 0.000 description 7
- 210000004602 germ cell Anatomy 0.000 description 7
- 239000000463 material Substances 0.000 description 7
- 210000005170 neoplastic cell Anatomy 0.000 description 7
- BLQMCTXZEMGOJM-UHFFFAOYSA-N 5-carboxycytosine Chemical compound NC=1NC(=O)N=CC=1C(O)=O BLQMCTXZEMGOJM-UHFFFAOYSA-N 0.000 description 6
- 102100030708 GTPase KRas Human genes 0.000 description 6
- 108020005187 Oligonucleotide Probes Proteins 0.000 description 6
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 6
- 238000011528 liquid biopsy Methods 0.000 description 6
- 239000002751 oligonucleotide probe Substances 0.000 description 6
- 239000000047 product Substances 0.000 description 6
- 230000003252 repetitive effect Effects 0.000 description 6
- 230000035945 sensitivity Effects 0.000 description 6
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 5
- CKOMXBHMKXXTNW-UHFFFAOYSA-N 6-methyladenine Chemical compound CNC1=NC=NC2=C1N=CN2 CKOMXBHMKXXTNW-UHFFFAOYSA-N 0.000 description 5
- 108020004705 Codon Proteins 0.000 description 5
- 108010058546 Cyclin D1 Proteins 0.000 description 5
- 108700024394 Exon Proteins 0.000 description 5
- 101710182389 Fibroblast growth factor receptor 2 Proteins 0.000 description 5
- 102100023600 Fibroblast growth factor receptor 2 Human genes 0.000 description 5
- 102100024165 G1/S-specific cyclin-D1 Human genes 0.000 description 5
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 5
- 101001030211 Homo sapiens Myc proto-oncogene protein Proteins 0.000 description 5
- 101001126417 Homo sapiens Platelet-derived growth factor receptor alpha Proteins 0.000 description 5
- 101001012157 Homo sapiens Receptor tyrosine-protein kinase erbB-2 Proteins 0.000 description 5
- 101000984753 Homo sapiens Serine/threonine-protein kinase B-raf Proteins 0.000 description 5
- 102100038895 Myc proto-oncogene protein Human genes 0.000 description 5
- 108091028043 Nucleic acid sequence Proteins 0.000 description 5
- 102100030485 Platelet-derived growth factor receptor alpha Human genes 0.000 description 5
- 102100030086 Receptor tyrosine-protein kinase erbB-2 Human genes 0.000 description 5
- 102100027103 Serine/threonine-protein kinase B-raf Human genes 0.000 description 5
- 108010078814 Tumor Suppressor Protein p53 Proteins 0.000 description 5
- 102000015098 Tumor Suppressor Protein p53 Human genes 0.000 description 5
- 230000001594 aberrant effect Effects 0.000 description 5
- 230000004075 alteration Effects 0.000 description 5
- 238000001574 biopsy Methods 0.000 description 5
- 230000036952 cancer formation Effects 0.000 description 5
- 230000030833 cell death Effects 0.000 description 5
- 238000002512 chemotherapy Methods 0.000 description 5
- 230000000295 complement effect Effects 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 102000052116 epidermal growth factor receptor activity proteins Human genes 0.000 description 5
- 108700015053 epidermal growth factor receptor activity proteins Proteins 0.000 description 5
- 230000008995 epigenetic change Effects 0.000 description 5
- 230000004049 epigenetic modification Effects 0.000 description 5
- 230000002779 inactivation Effects 0.000 description 5
- 201000007270 liver cancer Diseases 0.000 description 5
- 208000014018 liver neoplasm Diseases 0.000 description 5
- 238000012544 monitoring process Methods 0.000 description 5
- YOHYSYJDKVYCJI-UHFFFAOYSA-N n-[3-[[6-[3-(trifluoromethyl)anilino]pyrimidin-4-yl]amino]phenyl]cyclopropanecarboxamide Chemical compound FC(F)(F)C1=CC=CC(NC=2N=CN=C(NC=3C=C(NC(=O)C4CC4)C=CC=3)C=2)=C1 YOHYSYJDKVYCJI-UHFFFAOYSA-N 0.000 description 5
- 230000001613 neoplastic effect Effects 0.000 description 5
- 238000011176 pooling Methods 0.000 description 5
- 238000000746 purification Methods 0.000 description 5
- 238000006467 substitution reaction Methods 0.000 description 5
- 238000005406 washing Methods 0.000 description 5
- 206010006187 Breast cancer Diseases 0.000 description 4
- 208000026310 Breast neoplasm Diseases 0.000 description 4
- 208000005623 Carcinogenesis Diseases 0.000 description 4
- ZEOWTGPWHLSLOG-UHFFFAOYSA-N Cc1ccc(cc1-c1ccc2c(n[nH]c2c1)-c1cnn(c1)C1CC1)C(=O)Nc1cccc(c1)C(F)(F)F Chemical compound Cc1ccc(cc1-c1ccc2c(n[nH]c2c1)-c1cnn(c1)C1CC1)C(=O)Nc1cccc(c1)C(F)(F)F ZEOWTGPWHLSLOG-UHFFFAOYSA-N 0.000 description 4
- 108010077544 Chromatin Proteins 0.000 description 4
- 108091029430 CpG site Proteins 0.000 description 4
- 230000030933 DNA methylation on cytosine Effects 0.000 description 4
- 101100310856 Drosophila melanogaster spri gene Proteins 0.000 description 4
- 101710182386 Fibroblast growth factor receptor 1 Proteins 0.000 description 4
- 102100023593 Fibroblast growth factor receptor 1 Human genes 0.000 description 4
- 101000605639 Homo sapiens Phosphatidylinositol 4,5-bisphosphate 3-kinase catalytic subunit alpha isoform Proteins 0.000 description 4
- 238000012408 PCR amplification Methods 0.000 description 4
- 102100038332 Phosphatidylinositol 4,5-bisphosphate 3-kinase catalytic subunit alpha isoform Human genes 0.000 description 4
- 238000012300 Sequence Analysis Methods 0.000 description 4
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 4
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 4
- 208000036878 aneuploidy Diseases 0.000 description 4
- 231100001075 aneuploidy Toxicity 0.000 description 4
- 230000006907 apoptotic process Effects 0.000 description 4
- 229910052799 carbon Inorganic materials 0.000 description 4
- 231100000504 carcinogenesis Toxicity 0.000 description 4
- 210000003483 chromatin Anatomy 0.000 description 4
- 208000029742 colonic neoplasm Diseases 0.000 description 4
- 238000013500 data storage Methods 0.000 description 4
- 230000001419 dependent effect Effects 0.000 description 4
- 238000010828 elution Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 230000002255 enzymatic effect Effects 0.000 description 4
- 230000006718 epigenetic regulation Effects 0.000 description 4
- 238000005194 fractionation Methods 0.000 description 4
- FDGQSTZJBFJUBT-UHFFFAOYSA-N hypoxanthine Chemical compound O=C1NC=NC2=C1NC=N2 FDGQSTZJBFJUBT-UHFFFAOYSA-N 0.000 description 4
- 238000001114 immunoprecipitation Methods 0.000 description 4
- 150000002500 ions Chemical class 0.000 description 4
- 230000003902 lesion Effects 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 230000001590 oxidative effect Effects 0.000 description 4
- 239000012071 phase Substances 0.000 description 4
- 238000004393 prognosis Methods 0.000 description 4
- 210000002966 serum Anatomy 0.000 description 4
- 239000007790 solid phase Substances 0.000 description 4
- 230000000392 somatic effect Effects 0.000 description 4
- 241000894007 species Species 0.000 description 4
- 238000001847 surface plasmon resonance imaging Methods 0.000 description 4
- 206010044412 transitional cell carcinoma Diseases 0.000 description 4
- 230000005945 translocation Effects 0.000 description 4
- 238000011144 upstream manufacturing Methods 0.000 description 4
- 102100033793 ALK tyrosine kinase receptor Human genes 0.000 description 3
- 229930024421 Adenine Natural products 0.000 description 3
- 108091023043 Alu Element Proteins 0.000 description 3
- 108090001008 Avidin Proteins 0.000 description 3
- 101001042041 Bos taurus Isocitrate dehydrogenase [NAD] subunit beta, mitochondrial Proteins 0.000 description 3
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 3
- 102000014914 Carrier Proteins Human genes 0.000 description 3
- 108010025464 Cyclin-Dependent Kinase 4 Proteins 0.000 description 3
- 108010025468 Cyclin-Dependent Kinase 6 Proteins 0.000 description 3
- 102100036252 Cyclin-dependent kinase 4 Human genes 0.000 description 3
- 102100026804 Cyclin-dependent kinase 6 Human genes 0.000 description 3
- 102100040263 DNA dC->dU-editing enzyme APOBEC-3A Human genes 0.000 description 3
- 102100038595 Estrogen receptor Human genes 0.000 description 3
- 102100027842 Fibroblast growth factor receptor 3 Human genes 0.000 description 3
- 101710182396 Fibroblast growth factor receptor 3 Proteins 0.000 description 3
- 102100024185 G1/S-specific cyclin-D2 Human genes 0.000 description 3
- 102100037858 G1/S-specific cyclin-E1 Human genes 0.000 description 3
- 102100029974 GTPase HRas Human genes 0.000 description 3
- 102100039788 GTPase NRas Human genes 0.000 description 3
- 102100025334 Guanine nucleotide-binding protein G(q) subunit alpha Human genes 0.000 description 3
- 102100032610 Guanine nucleotide-binding protein G(s) subunit alpha isoforms XLas Human genes 0.000 description 3
- 102100036738 Guanine nucleotide-binding protein subunit alpha-11 Human genes 0.000 description 3
- 108010033040 Histones Proteins 0.000 description 3
- 101000779641 Homo sapiens ALK tyrosine kinase receptor Proteins 0.000 description 3
- 101000964378 Homo sapiens DNA dC->dU-editing enzyme APOBEC-3A Proteins 0.000 description 3
- 101000967216 Homo sapiens Eosinophil cationic protein Proteins 0.000 description 3
- 101000882584 Homo sapiens Estrogen receptor Proteins 0.000 description 3
- 101000980741 Homo sapiens G1/S-specific cyclin-D2 Proteins 0.000 description 3
- 101000738568 Homo sapiens G1/S-specific cyclin-E1 Proteins 0.000 description 3
- 101000584633 Homo sapiens GTPase HRas Proteins 0.000 description 3
- 101000744505 Homo sapiens GTPase NRas Proteins 0.000 description 3
- 101000857888 Homo sapiens Guanine nucleotide-binding protein G(q) subunit alpha Proteins 0.000 description 3
- 101001014590 Homo sapiens Guanine nucleotide-binding protein G(s) subunit alpha isoforms XLas Proteins 0.000 description 3
- 101001014594 Homo sapiens Guanine nucleotide-binding protein G(s) subunit alpha isoforms short Proteins 0.000 description 3
- 101001072407 Homo sapiens Guanine nucleotide-binding protein subunit alpha-11 Proteins 0.000 description 3
- 101000960234 Homo sapiens Isocitrate dehydrogenase [NADP] cytoplasmic Proteins 0.000 description 3
- 101000599886 Homo sapiens Isocitrate dehydrogenase [NADP], mitochondrial Proteins 0.000 description 3
- 101001014610 Homo sapiens Neuroendocrine secretory protein 55 Proteins 0.000 description 3
- 101000797903 Homo sapiens Protein ALEX Proteins 0.000 description 3
- 101000712530 Homo sapiens RAF proto-oncogene serine/threonine-protein kinase Proteins 0.000 description 3
- 101000628562 Homo sapiens Serine/threonine-protein kinase STK11 Proteins 0.000 description 3
- 101000819111 Homo sapiens Trans-acting T-cell-specific transcription factor GATA-3 Proteins 0.000 description 3
- 102100039905 Isocitrate dehydrogenase [NADP] cytoplasmic Human genes 0.000 description 3
- 102100037845 Isocitrate dehydrogenase [NADP], mitochondrial Human genes 0.000 description 3
- 208000008839 Kidney Neoplasms Diseases 0.000 description 3
- 108010071382 NF-E2-Related Factor 2 Proteins 0.000 description 3
- 102100031701 Nuclear factor erythroid 2-related factor 2 Human genes 0.000 description 3
- 108010011536 PTEN Phosphohydrolase Proteins 0.000 description 3
- 102000014160 PTEN Phosphohydrolase Human genes 0.000 description 3
- 102100033479 RAF proto-oncogene serine/threonine-protein kinase Human genes 0.000 description 3
- 108020004518 RNA Probes Proteins 0.000 description 3
- 239000003391 RNA probe Substances 0.000 description 3
- 206010038389 Renal cancer Diseases 0.000 description 3
- 108020004487 Satellite DNA Proteins 0.000 description 3
- 102100026715 Serine/threonine-protein kinase STK11 Human genes 0.000 description 3
- 208000000453 Skin Neoplasms Diseases 0.000 description 3
- 208000005718 Stomach Neoplasms Diseases 0.000 description 3
- 102100021386 Trans-acting T-cell-specific transcription factor GATA-3 Human genes 0.000 description 3
- 230000005856 abnormality Effects 0.000 description 3
- 229960000643 adenine Drugs 0.000 description 3
- 108091008324 binding proteins Proteins 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 3
- 210000000481 breast Anatomy 0.000 description 3
- 210000001175 cerebrospinal fluid Anatomy 0.000 description 3
- 238000004587 chromatography analysis Methods 0.000 description 3
- 210000001072 colon Anatomy 0.000 description 3
- 230000002596 correlated effect Effects 0.000 description 3
- 238000006352 cycloaddition reaction Methods 0.000 description 3
- 238000007405 data analysis Methods 0.000 description 3
- 238000004925 denaturation Methods 0.000 description 3
- 230000036425 denaturation Effects 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 230000018109 developmental process Effects 0.000 description 3
- 238000011143 downstream manufacturing Methods 0.000 description 3
- 230000009144 enzymatic modification Effects 0.000 description 3
- 239000012530 fluid Substances 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 206010017758 gastric cancer Diseases 0.000 description 3
- 230000007614 genetic variation Effects 0.000 description 3
- 210000003917 human chromosome Anatomy 0.000 description 3
- 239000002955 immunomodulating agent Substances 0.000 description 3
- 238000009169 immunotherapy Methods 0.000 description 3
- 238000012405 in silico analysis Methods 0.000 description 3
- 238000011534 incubation Methods 0.000 description 3
- 201000010982 kidney cancer Diseases 0.000 description 3
- 210000004072 lung Anatomy 0.000 description 3
- 239000002777 nucleoside Substances 0.000 description 3
- 239000002245 particle Substances 0.000 description 3
- 229920000642 polymer Polymers 0.000 description 3
- 201000000849 skin cancer Diseases 0.000 description 3
- 239000011780 sodium chloride Substances 0.000 description 3
- 201000011549 stomach cancer Diseases 0.000 description 3
- 239000000758 substrate Substances 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 229940113082 thymine Drugs 0.000 description 3
- 230000035897 transcription Effects 0.000 description 3
- 238000013518 transcription Methods 0.000 description 3
- 238000000844 transformation Methods 0.000 description 3
- 210000002700 urine Anatomy 0.000 description 3
- BSKHPKMHTQYZBB-UHFFFAOYSA-N 2-methylpyridine Chemical compound CC1=CC=CC=N1 BSKHPKMHTQYZBB-UHFFFAOYSA-N 0.000 description 2
- KOLPWZCZXAMXKS-UHFFFAOYSA-N 3-methylcytosine Chemical compound CN1C(N)=CC=NC1=O KOLPWZCZXAMXKS-UHFFFAOYSA-N 0.000 description 2
- 208000024893 Acute lymphoblastic leukemia Diseases 0.000 description 2
- 208000014697 Acute lymphocytic leukaemia Diseases 0.000 description 2
- 108700028369 Alleles Proteins 0.000 description 2
- 241000473391 Archosargus rhomboidalis Species 0.000 description 2
- 208000023275 Autoimmune disease Diseases 0.000 description 2
- 208000032791 BCR-ABL1 positive chronic myelogenous leukemia Diseases 0.000 description 2
- 206010005003 Bladder cancer Diseases 0.000 description 2
- 241000283690 Bos taurus Species 0.000 description 2
- 208000003174 Brain Neoplasms Diseases 0.000 description 2
- 102100026548 Caspase-8 Human genes 0.000 description 2
- 102100028914 Catenin beta-1 Human genes 0.000 description 2
- 108091061744 Cell-free fetal DNA Proteins 0.000 description 2
- 206010008342 Cervix carcinoma Diseases 0.000 description 2
- 208000010693 Charcot-Marie-Tooth Disease Diseases 0.000 description 2
- 208000037051 Chromosomal Instability Diseases 0.000 description 2
- 208000010833 Chronic myeloid leukaemia Diseases 0.000 description 2
- 102000012410 DNA Ligases Human genes 0.000 description 2
- 108010061982 DNA Ligases Proteins 0.000 description 2
- 108020001019 DNA Primers Proteins 0.000 description 2
- 230000004544 DNA amplification Effects 0.000 description 2
- 239000003155 DNA primer Substances 0.000 description 2
- 206010061818 Disease progression Diseases 0.000 description 2
- 206010061819 Disease recurrence Diseases 0.000 description 2
- 108060002716 Exonuclease Proteins 0.000 description 2
- 108010010285 Forkhead Box Protein L2 Proteins 0.000 description 2
- 102100035137 Forkhead box protein L2 Human genes 0.000 description 2
- 102100025190 Histone-binding protein RBBP4 Human genes 0.000 description 2
- 101000916173 Homo sapiens Catenin beta-1 Proteins 0.000 description 2
- 101000614988 Homo sapiens Mediator of RNA polymerase II transcription subunit 12 Proteins 0.000 description 2
- 101000615488 Homo sapiens Methyl-CpG-binding domain protein 2 Proteins 0.000 description 2
- 101000579425 Homo sapiens Proto-oncogene tyrosine-protein kinase receptor Ret Proteins 0.000 description 2
- 101000779418 Homo sapiens RAC-alpha serine/threonine-protein kinase Proteins 0.000 description 2
- 101000783404 Homo sapiens Serine/threonine-protein phosphatase 2A 65 kDa regulatory subunit A alpha isoform Proteins 0.000 description 2
- 101000808799 Homo sapiens Splicing factor U2AF 35 kDa subunit Proteins 0.000 description 2
- UGQMRVRMYYASKQ-UHFFFAOYSA-N Hypoxanthine nucleoside Natural products OC1C(O)C(CO)OC1N1C(NC=NC2=O)=C2N=C1 UGQMRVRMYYASKQ-UHFFFAOYSA-N 0.000 description 2
- 241000124008 Mammalia Species 0.000 description 2
- 102100021070 Mediator of RNA polymerase II transcription subunit 12 Human genes 0.000 description 2
- 206010027476 Metastases Diseases 0.000 description 2
- 102000006890 Methyl-CpG-Binding Protein 2 Human genes 0.000 description 2
- 108010072388 Methyl-CpG-Binding Protein 2 Proteins 0.000 description 2
- 102100021299 Methyl-CpG-binding domain protein 2 Human genes 0.000 description 2
- 208000033761 Myelogenous Chronic BCR-ABL Positive Leukemia Diseases 0.000 description 2
- 208000002454 Nasopharyngeal Carcinoma Diseases 0.000 description 2
- 206010061306 Nasopharyngeal cancer Diseases 0.000 description 2
- 208000015914 Non-Hodgkin lymphomas Diseases 0.000 description 2
- 108700020796 Oncogene Proteins 0.000 description 2
- 206010033128 Ovarian cancer Diseases 0.000 description 2
- 206010061535 Ovarian neoplasm Diseases 0.000 description 2
- 206010061902 Pancreatic neoplasm Diseases 0.000 description 2
- 108091007412 Piwi-interacting RNA Proteins 0.000 description 2
- 208000020584 Polyploidy Diseases 0.000 description 2
- 208000006664 Precursor Cell Lymphoblastic Leukemia-Lymphoma Diseases 0.000 description 2
- 206010036790 Productive cough Diseases 0.000 description 2
- 206010060862 Prostate cancer Diseases 0.000 description 2
- 208000000236 Prostatic Neoplasms Diseases 0.000 description 2
- 102100028286 Proto-oncogene tyrosine-protein kinase receptor Ret Human genes 0.000 description 2
- 102100033810 RAC-alpha serine/threonine-protein kinase Human genes 0.000 description 2
- 208000015634 Rectal Neoplasms Diseases 0.000 description 2
- 208000006265 Renal cell carcinoma Diseases 0.000 description 2
- 108010071034 Retinoblastoma-Binding Protein 4 Proteins 0.000 description 2
- 102100036122 Serine/threonine-protein phosphatase 2A 65 kDa regulatory subunit A alpha isoform Human genes 0.000 description 2
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 2
- 108020003224 Small Nucleolar RNA Proteins 0.000 description 2
- 102000042773 Small Nucleolar RNA Human genes 0.000 description 2
- 102100038501 Splicing factor U2AF 35 kDa subunit Human genes 0.000 description 2
- IQFYYKKMVGJFEH-XLPZGREQSA-N Thymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 IQFYYKKMVGJFEH-XLPZGREQSA-N 0.000 description 2
- 208000007097 Urinary Bladder Neoplasms Diseases 0.000 description 2
- 208000006105 Uterine Cervical Neoplasms Diseases 0.000 description 2
- 201000005969 Uveal melanoma Diseases 0.000 description 2
- 150000001540 azides Chemical class 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000003766 bioinformatics method Methods 0.000 description 2
- 230000010261 cell growth Effects 0.000 description 2
- 230000006037 cell lysis Effects 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 238000005119 centrifugation Methods 0.000 description 2
- 210000002230 centromere Anatomy 0.000 description 2
- 201000010881 cervical cancer Diseases 0.000 description 2
- 238000012512 characterization method Methods 0.000 description 2
- 238000007385 chemical modification Methods 0.000 description 2
- 208000006990 cholangiocarcinoma Diseases 0.000 description 2
- 238000002487 chromatin immunoprecipitation Methods 0.000 description 2
- 230000002759 chromosomal effect Effects 0.000 description 2
- 210000001726 chromosome structure Anatomy 0.000 description 2
- 210000003040 circulating cell Anatomy 0.000 description 2
- 230000001186 cumulative effect Effects 0.000 description 2
- 238000013502 data validation Methods 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000003745 diagnosis Methods 0.000 description 2
- 230000005750 disease progression Effects 0.000 description 2
- 208000035475 disorder Diseases 0.000 description 2
- 230000002708 enhancing effect Effects 0.000 description 2
- 230000001747 exhibiting effect Effects 0.000 description 2
- 102000013165 exonuclease Human genes 0.000 description 2
- 210000003722 extracellular fluid Anatomy 0.000 description 2
- 210000003754 fetus Anatomy 0.000 description 2
- 238000007672 fourth generation sequencing Methods 0.000 description 2
- 201000011243 gastrointestinal stromal tumor Diseases 0.000 description 2
- 230000004545 gene duplication Effects 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 239000012145 high-salt buffer Substances 0.000 description 2
- 238000012165 high-throughput sequencing Methods 0.000 description 2
- 102000033785 histone binding proteins Human genes 0.000 description 2
- 108091009732 histone binding proteins Proteins 0.000 description 2
- 238000000338 in vitro Methods 0.000 description 2
- 210000003734 kidney Anatomy 0.000 description 2
- 208000032839 leukemia Diseases 0.000 description 2
- 210000004185 liver Anatomy 0.000 description 2
- 210000002751 lymph Anatomy 0.000 description 2
- 238000007885 magnetic separation Methods 0.000 description 2
- 230000003211 malignant effect Effects 0.000 description 2
- 208000015486 malignant pancreatic neoplasm Diseases 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 230000008774 maternal effect Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000001404 mediated effect Effects 0.000 description 2
- 201000001441 melanoma Diseases 0.000 description 2
- 230000009401 metastasis Effects 0.000 description 2
- 238000010369 molecular cloning Methods 0.000 description 2
- 201000011216 nasopharynx carcinoma Diseases 0.000 description 2
- 208000002154 non-small cell lung carcinoma Diseases 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 238000007899 nucleic acid hybridization Methods 0.000 description 2
- 125000003835 nucleoside group Chemical group 0.000 description 2
- 239000002674 ointment Substances 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 230000002018 overexpression Effects 0.000 description 2
- 201000002528 pancreatic cancer Diseases 0.000 description 2
- 208000008443 pancreatic carcinoma Diseases 0.000 description 2
- 239000013610 patient sample Substances 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 238000009598 prenatal testing Methods 0.000 description 2
- 239000002987 primer (paints) Substances 0.000 description 2
- 108090000765 processed proteins & peptides Proteins 0.000 description 2
- 210000002307 prostate Anatomy 0.000 description 2
- 238000012175 pyrosequencing Methods 0.000 description 2
- 206010038038 rectal cancer Diseases 0.000 description 2
- 210000000664 rectum Anatomy 0.000 description 2
- 201000001275 rectum cancer Diseases 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 238000009666 routine test Methods 0.000 description 2
- 238000007789 sealing Methods 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000007841 sequencing by ligation Methods 0.000 description 2
- 239000004055 small Interfering RNA Substances 0.000 description 2
- 210000003802 sputum Anatomy 0.000 description 2
- 208000024794 sputum Diseases 0.000 description 2
- 230000001629 suppression Effects 0.000 description 2
- 238000001356 surgical procedure Methods 0.000 description 2
- 230000001225 therapeutic effect Effects 0.000 description 2
- RYYWUUFWQRZTIU-UHFFFAOYSA-K thiophosphate Chemical compound [O-]P([O-])([O-])=S RYYWUUFWQRZTIU-UHFFFAOYSA-K 0.000 description 2
- 230000002103 transcriptional effect Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000032258 transport Effects 0.000 description 2
- 208000029729 tumor suppressor gene on chromosome 11 Diseases 0.000 description 2
- 230000009452 underexpressoin Effects 0.000 description 2
- 201000005112 urinary bladder cancer Diseases 0.000 description 2
- 208000023747 urothelial carcinoma Diseases 0.000 description 2
- 238000012070 whole genome sequencing analysis Methods 0.000 description 2
- YKBGVTZYEHREMT-KVQBGUIXSA-N 2'-deoxyguanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@H]1C[C@H](O)[C@@H](CO)O1 YKBGVTZYEHREMT-KVQBGUIXSA-N 0.000 description 1
- MJEQLGCFPLHMNV-UHFFFAOYSA-N 4-amino-1-(hydroxymethyl)pyrimidin-2-one Chemical compound NC=1C=CN(CO)C(=O)N=1 MJEQLGCFPLHMNV-UHFFFAOYSA-N 0.000 description 1
- CKTSBUTUHBMZGZ-ULQXZJNLSA-N 4-amino-1-[(2r,4s,5r)-4-hydroxy-5-(hydroxymethyl)oxolan-2-yl]-5-tritiopyrimidin-2-one Chemical compound O=C1N=C(N)C([3H])=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 CKTSBUTUHBMZGZ-ULQXZJNLSA-N 0.000 description 1
- LQLQRFGHAALLLE-UHFFFAOYSA-N 5-bromouracil Chemical compound BrC1=CNC(=O)NC1=O LQLQRFGHAALLLE-UHFFFAOYSA-N 0.000 description 1
- SJJUZWMENLLQJP-LOFWALOHSA-N 6-(hydroxymethylamino)-5-[(3r,4r,5s,6r)-3,4,5-trihydroxy-6-(hydroxymethyl)oxan-2-yl]-1h-pyrimidin-2-one Chemical compound N1C(=O)N=CC(C2[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O2)O)=C1NCO SJJUZWMENLLQJP-LOFWALOHSA-N 0.000 description 1
- KFYZVFUMYFTSNB-UHFFFAOYSA-N 6-hydroxymethyladenine Chemical compound OCNC1=NC=NC2=C1NC=N2 KFYZVFUMYFTSNB-UHFFFAOYSA-N 0.000 description 1
- 102100028348 60S ribosomal protein L26 Human genes 0.000 description 1
- 240000005020 Acaciella glauca Species 0.000 description 1
- 206010073363 Acinar cell carcinoma of pancreas Diseases 0.000 description 1
- 208000031261 Acute myeloid leukaemia Diseases 0.000 description 1
- 208000036764 Adenocarcinoma of the esophagus Diseases 0.000 description 1
- 102100034540 Adenomatous polyposis coli protein Human genes 0.000 description 1
- 208000002485 Adiposis dolorosa Diseases 0.000 description 1
- 108091093088 Amplicon Proteins 0.000 description 1
- 208000003343 Antiphospholipid Syndrome Diseases 0.000 description 1
- 206010003445 Ascites Diseases 0.000 description 1
- 206010003571 Astrocytoma Diseases 0.000 description 1
- 206010003805 Autism Diseases 0.000 description 1
- 208000020706 Autistic disease Diseases 0.000 description 1
- 208000010061 Autosomal Dominant Polycystic Kidney Diseases 0.000 description 1
- 241000271566 Aves Species 0.000 description 1
- 208000010839 B-cell chronic lymphocytic leukemia Diseases 0.000 description 1
- 208000003950 B-cell lymphoma Diseases 0.000 description 1
- 102100022983 B-cell lymphoma/leukemia 11B Human genes 0.000 description 1
- 102000036365 BRCA1 Human genes 0.000 description 1
- 108700020463 BRCA1 Proteins 0.000 description 1
- 101150072950 BRCA1 gene Proteins 0.000 description 1
- 102000052609 BRCA2 Human genes 0.000 description 1
- 108700020462 BRCA2 Proteins 0.000 description 1
- 102100022548 Beta-hexosaminidase subunit alpha Human genes 0.000 description 1
- 206010004593 Bile duct cancer Diseases 0.000 description 1
- 206010005949 Bone cancer Diseases 0.000 description 1
- 208000018084 Bone neoplasm Diseases 0.000 description 1
- 101150008921 Brca2 gene Proteins 0.000 description 1
- 101710098191 C-4 methylsterol oxidase ERG25 Proteins 0.000 description 1
- 101100002344 Caenorhabditis elegans arid-1 gene Proteins 0.000 description 1
- 201000009030 Carcinoma Diseases 0.000 description 1
- 101150056960 Casp8 gene Proteins 0.000 description 1
- 108090000538 Caspase-8 Proteins 0.000 description 1
- 241000282693 Cercopithecidae Species 0.000 description 1
- 206010008723 Chondrodystrophy Diseases 0.000 description 1
- 208000005443 Circulating Neoplastic Cells Diseases 0.000 description 1
- 208000030808 Clear cell renal carcinoma Diseases 0.000 description 1
- 108091026890 Coding region Proteins 0.000 description 1
- 206010052360 Colorectal adenocarcinoma Diseases 0.000 description 1
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 108091029523 CpG island Proteins 0.000 description 1
- 208000011231 Crohn disease Diseases 0.000 description 1
- 102000009512 Cyclin-Dependent Kinase Inhibitor p15 Human genes 0.000 description 1
- 108010009356 Cyclin-Dependent Kinase Inhibitor p15 Proteins 0.000 description 1
- 108010009392 Cyclin-Dependent Kinase Inhibitor p16 Proteins 0.000 description 1
- 201000003883 Cystic fibrosis Diseases 0.000 description 1
- 230000030914 DNA methylation on adenine Effects 0.000 description 1
- 230000033616 DNA repair Effects 0.000 description 1
- 102000052510 DNA-Binding Proteins Human genes 0.000 description 1
- 101710096438 DNA-binding protein Proteins 0.000 description 1
- 201000010374 Down Syndrome Diseases 0.000 description 1
- 102100031480 Dual specificity mitogen-activated protein kinase kinase 1 Human genes 0.000 description 1
- 102100023266 Dual specificity mitogen-activated protein kinase kinase 2 Human genes 0.000 description 1
- 201000000913 Duane retraction syndrome Diseases 0.000 description 1
- 208000020129 Duane syndrome Diseases 0.000 description 1
- 206010013801 Duchenne Muscular Dystrophy Diseases 0.000 description 1
- 101001003194 Eleusine coracana Alpha-amylase/trypsin inhibitor Proteins 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 206010014733 Endometrial cancer Diseases 0.000 description 1
- 206010014759 Endometrial neoplasm Diseases 0.000 description 1
- 102100031780 Endonuclease Human genes 0.000 description 1
- 108010042407 Endonucleases Proteins 0.000 description 1
- 241000283086 Equidae Species 0.000 description 1
- 208000000461 Esophageal Neoplasms Diseases 0.000 description 1
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 1
- 102100028138 F-box/WD repeat-containing protein 7 Human genes 0.000 description 1
- 101710105178 F-box/WD repeat-containing protein 7 Proteins 0.000 description 1
- 206010016207 Familial Mediterranean fever Diseases 0.000 description 1
- 102100040997 Forkhead box protein I3 Human genes 0.000 description 1
- 102100035130 Forkhead box protein K1 Human genes 0.000 description 1
- 102100035129 Forkhead box protein K2 Human genes 0.000 description 1
- 102100028122 Forkhead box protein P1 Human genes 0.000 description 1
- 102100027579 Forkhead box protein P4 Human genes 0.000 description 1
- 208000001914 Fragile X syndrome Diseases 0.000 description 1
- 102100027541 GTP-binding protein Rheb Human genes 0.000 description 1
- 208000022072 Gallbladder Neoplasms Diseases 0.000 description 1
- 201000003741 Gastrointestinal carcinoma Diseases 0.000 description 1
- 208000015872 Gaucher disease Diseases 0.000 description 1
- 208000032612 Glial tumor Diseases 0.000 description 1
- 206010018338 Glioma Diseases 0.000 description 1
- 208000018565 Hemochromatosis Diseases 0.000 description 1
- 208000031220 Hemophilia Diseases 0.000 description 1
- 208000009292 Hemophilia A Diseases 0.000 description 1
- HTTJABKRGRZYRN-UHFFFAOYSA-N Heparin Chemical compound OC1C(NC(=O)C)C(O)OC(COS(O)(=O)=O)C1OC1C(OS(O)(=O)=O)C(O)C(OC2C(C(OS(O)(=O)=O)C(OC3C(C(O)C(O)C(O3)C(O)=O)OS(O)(=O)=O)C(CO)O2)NS(O)(=O)=O)C(C(O)=O)O1 HTTJABKRGRZYRN-UHFFFAOYSA-N 0.000 description 1
- 102100022057 Hepatocyte nuclear factor 1-alpha Human genes 0.000 description 1
- 208000002972 Hepatolenticular Degeneration Diseases 0.000 description 1
- 206010019842 Hepatomegaly Diseases 0.000 description 1
- 208000008051 Hereditary Nonpolyposis Colorectal Neoplasms Diseases 0.000 description 1
- 208000017095 Hereditary nonpolyposis colon cancer Diseases 0.000 description 1
- 102100038970 Histone-lysine N-methyltransferase EZH2 Human genes 0.000 description 1
- 102000006947 Histones Human genes 0.000 description 1
- 101001080179 Homo sapiens 60S ribosomal protein L26 Proteins 0.000 description 1
- 101000924577 Homo sapiens Adenomatous polyposis coli protein Proteins 0.000 description 1
- 101000892881 Homo sapiens Forkhead box protein I3 Proteins 0.000 description 1
- 101001023398 Homo sapiens Forkhead box protein K1 Proteins 0.000 description 1
- 101001023393 Homo sapiens Forkhead box protein K2 Proteins 0.000 description 1
- 101001059893 Homo sapiens Forkhead box protein P1 Proteins 0.000 description 1
- 101000861403 Homo sapiens Forkhead box protein P4 Proteins 0.000 description 1
- 101000574654 Homo sapiens GTP-binding protein Rit1 Proteins 0.000 description 1
- 101000584612 Homo sapiens GTPase KRas Proteins 0.000 description 1
- 101001045751 Homo sapiens Hepatocyte nuclear factor 1-alpha Proteins 0.000 description 1
- 101000882127 Homo sapiens Histone-lysine N-methyltransferase EZH2 Proteins 0.000 description 1
- 101000994375 Homo sapiens Integrin alpha-4 Proteins 0.000 description 1
- 101000653374 Homo sapiens Methylcytosine dioxygenase TET2 Proteins 0.000 description 1
- 101001109719 Homo sapiens Nucleophosmin Proteins 0.000 description 1
- 101001105683 Homo sapiens Pre-mRNA-processing-splicing factor 8 Proteins 0.000 description 1
- 101000883798 Homo sapiens Probable ATP-dependent RNA helicase DDX53 Proteins 0.000 description 1
- 101000995332 Homo sapiens Protein NDRG4 Proteins 0.000 description 1
- 101000686031 Homo sapiens Proto-oncogene tyrosine-protein kinase ROS Proteins 0.000 description 1
- 101000932478 Homo sapiens Receptor-type tyrosine-protein kinase FLT3 Proteins 0.000 description 1
- 101000632056 Homo sapiens Septin-9 Proteins 0.000 description 1
- 101000771237 Homo sapiens Serine/threonine-protein kinase A-Raf Proteins 0.000 description 1
- 101000799466 Homo sapiens Thrombopoietin receptor Proteins 0.000 description 1
- 101000819074 Homo sapiens Transcription factor GATA-4 Proteins 0.000 description 1
- 101000997832 Homo sapiens Tyrosine-protein kinase JAK2 Proteins 0.000 description 1
- 101000934996 Homo sapiens Tyrosine-protein kinase JAK3 Proteins 0.000 description 1
- 101001087416 Homo sapiens Tyrosine-protein phosphatase non-receptor type 11 Proteins 0.000 description 1
- 101000803403 Homo sapiens Vimentin Proteins 0.000 description 1
- 101001125402 Homo sapiens Vitamin K-dependent protein C Proteins 0.000 description 1
- 208000023105 Huntington disease Diseases 0.000 description 1
- 208000025500 Hutchinson-Gilford progeria syndrome Diseases 0.000 description 1
- 206010020608 Hypercoagulation Diseases 0.000 description 1
- 208000000563 Hyperlipoproteinemia Type II Diseases 0.000 description 1
- 206010061598 Immunodeficiency Diseases 0.000 description 1
- 208000029462 Immunodeficiency disease Diseases 0.000 description 1
- 102100032818 Integrin alpha-4 Human genes 0.000 description 1
- 206010061252 Intraocular melanoma Diseases 0.000 description 1
- 208000017924 Klinefelter Syndrome Diseases 0.000 description 1
- 208000031671 Large B-Cell Diffuse Lymphoma Diseases 0.000 description 1
- 108020005198 Long Noncoding RNA Proteins 0.000 description 1
- 102100024640 Low-density lipoprotein receptor Human genes 0.000 description 1
- 206010025323 Lymphomas Diseases 0.000 description 1
- 201000005027 Lynch syndrome Diseases 0.000 description 1
- 108010068342 MAP Kinase Kinase 1 Proteins 0.000 description 1
- 108010068353 MAP Kinase Kinase 2 Proteins 0.000 description 1
- 208000025205 Mantle-Cell Lymphoma Diseases 0.000 description 1
- 208000001826 Marfan syndrome Diseases 0.000 description 1
- 206010027406 Mesothelioma Diseases 0.000 description 1
- 102100030803 Methylcytosine dioxygenase TET2 Human genes 0.000 description 1
- 108020005196 Mitochondrial DNA Proteins 0.000 description 1
- 102100025725 Mothers against decapentaplegic homolog 4 Human genes 0.000 description 1
- 101710143112 Mothers against decapentaplegic homolog 4 Proteins 0.000 description 1
- 208000034578 Multiple myelomas Diseases 0.000 description 1
- 241000699666 Mus <mouse, genus> Species 0.000 description 1
- 102000013609 MutL Protein Homolog 1 Human genes 0.000 description 1
- 108010026664 MutL Protein Homolog 1 Proteins 0.000 description 1
- 206010068871 Myotonic dystrophy Diseases 0.000 description 1
- 206010028851 Necrosis Diseases 0.000 description 1
- 206010029260 Neuroblastoma Diseases 0.000 description 1
- 208000009905 Neurofibromatoses Diseases 0.000 description 1
- 102000007530 Neurofibromin 1 Human genes 0.000 description 1
- 108010085793 Neurofibromin 1 Proteins 0.000 description 1
- 206010029748 Noonan syndrome Diseases 0.000 description 1
- 208000010505 Nose Neoplasms Diseases 0.000 description 1
- 102000001759 Notch1 Receptor Human genes 0.000 description 1
- 108010029755 Notch1 Receptor Proteins 0.000 description 1
- 102100022678 Nucleophosmin Human genes 0.000 description 1
- 206010030137 Oesophageal adenocarcinoma Diseases 0.000 description 1
- 206010030155 Oesophageal carcinoma Diseases 0.000 description 1
- 206010061534 Oesophageal squamous cell carcinoma Diseases 0.000 description 1
- 206010031096 Oropharyngeal cancer Diseases 0.000 description 1
- 206010057444 Oropharyngeal neoplasm Diseases 0.000 description 1
- 206010031243 Osteogenesis imperfecta Diseases 0.000 description 1
- 208000018737 Parkinson disease Diseases 0.000 description 1
- 208000027190 Peripheral T-cell lymphomas Diseases 0.000 description 1
- 201000011252 Phenylketonuria Diseases 0.000 description 1
- 206010035226 Plasma cell myeloma Diseases 0.000 description 1
- 208000002151 Pleural effusion Diseases 0.000 description 1
- 208000019222 Poland syndrome Diseases 0.000 description 1
- 241000097929 Porphyria Species 0.000 description 1
- 208000010642 Porphyrias Diseases 0.000 description 1
- ZLMJMSJWJFRBEC-UHFFFAOYSA-N Potassium Chemical compound [K] ZLMJMSJWJFRBEC-UHFFFAOYSA-N 0.000 description 1
- 102100021231 Pre-mRNA-processing-splicing factor 8 Human genes 0.000 description 1
- 208000032758 Precursor T-lymphoblastic lymphoma/leukaemia Diseases 0.000 description 1
- 241000288906 Primates Species 0.000 description 1
- 102100038236 Probable ATP-dependent RNA helicase DDX53 Human genes 0.000 description 1
- 208000007932 Progeria Diseases 0.000 description 1
- 102100034432 Protein NDRG4 Human genes 0.000 description 1
- 102100023347 Proto-oncogene tyrosine-protein kinase ROS Human genes 0.000 description 1
- 101150020518 RHEB gene Proteins 0.000 description 1
- 101150111584 RHOA gene Proteins 0.000 description 1
- 102100029981 Receptor tyrosine-protein kinase erbB-4 Human genes 0.000 description 1
- 101710100963 Receptor tyrosine-protein kinase erbB-4 Proteins 0.000 description 1
- 102100020718 Receptor-type tyrosine-protein kinase FLT3 Human genes 0.000 description 1
- 208000007014 Retinitis pigmentosa Diseases 0.000 description 1
- 102000014011 SANT domains Human genes 0.000 description 1
- 108050003888 SANT domains Proteins 0.000 description 1
- 108700028341 SMARCB1 Proteins 0.000 description 1
- 101150008214 SMARCB1 gene Proteins 0.000 description 1
- 102000001332 SRC Human genes 0.000 description 1
- 108060006706 SRC Proteins 0.000 description 1
- 102100025746 SWI/SNF-related matrix-associated actin-dependent regulator of chromatin subfamily B member 1 Human genes 0.000 description 1
- 102100028024 Septin-9 Human genes 0.000 description 1
- 102100029437 Serine/threonine-protein kinase A-Raf Human genes 0.000 description 1
- FCHAMFUEENBIDH-UHFFFAOYSA-N Severin Natural products CC1CCC2C(C)C3CCC4(O)C(CC5C4CC(O)C6CC(CCC56C)OC(=O)C)C3CN2C1 FCHAMFUEENBIDH-UHFFFAOYSA-N 0.000 description 1
- 108020004459 Small interfering RNA Proteins 0.000 description 1
- 102000013380 Smoothened Receptor Human genes 0.000 description 1
- 101710090597 Smoothened homolog Proteins 0.000 description 1
- 208000000102 Squamous Cell Carcinoma of Head and Neck Diseases 0.000 description 1
- 208000034254 Squamous cell carcinoma of the cervix uteri Diseases 0.000 description 1
- 208000036765 Squamous cell carcinoma of the esophagus Diseases 0.000 description 1
- 241000282887 Suidae Species 0.000 description 1
- 230000005867 T cell response Effects 0.000 description 1
- 208000031672 T-Cell Peripheral Lymphoma Diseases 0.000 description 1
- 208000029052 T-cell acute lymphoblastic leukemia Diseases 0.000 description 1
- 206010042971 T-cell lymphoma Diseases 0.000 description 1
- 208000027585 T-cell non-Hodgkin lymphoma Diseases 0.000 description 1
- 208000022292 Tay-Sachs disease Diseases 0.000 description 1
- 108091046869 Telomeric non-coding RNA Proteins 0.000 description 1
- 208000002903 Thalassemia Diseases 0.000 description 1
- 206010043515 Throat cancer Diseases 0.000 description 1
- 102100034196 Thrombopoietin receptor Human genes 0.000 description 1
- 208000024770 Thyroid neoplasm Diseases 0.000 description 1
- 101710120037 Toxin CcdB Proteins 0.000 description 1
- 102000040945 Transcription factor Human genes 0.000 description 1
- 108091023040 Transcription factor Proteins 0.000 description 1
- 102100021380 Transcription factor GATA-4 Human genes 0.000 description 1
- 102100022387 Transforming protein RhoA Human genes 0.000 description 1
- 206010068233 Trimethylaminuria Diseases 0.000 description 1
- 108700025716 Tumor Suppressor Genes Proteins 0.000 description 1
- 102000044209 Tumor Suppressor Genes Human genes 0.000 description 1
- 102000001742 Tumor Suppressor Proteins Human genes 0.000 description 1
- 108010040002 Tumor Suppressor Proteins Proteins 0.000 description 1
- 102100033254 Tumor suppressor ARF Human genes 0.000 description 1
- 208000026928 Turner syndrome Diseases 0.000 description 1
- 206010045261 Type IIa hyperlipidaemia Diseases 0.000 description 1
- 102100033444 Tyrosine-protein kinase JAK2 Human genes 0.000 description 1
- 102100025387 Tyrosine-protein kinase JAK3 Human genes 0.000 description 1
- 102100033019 Tyrosine-protein phosphatase non-receptor type 11 Human genes 0.000 description 1
- 208000002495 Uterine Neoplasms Diseases 0.000 description 1
- 108010053099 Vascular Endothelial Growth Factor Receptor-2 Proteins 0.000 description 1
- 102100033177 Vascular endothelial growth factor receptor 2 Human genes 0.000 description 1
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 1
- 102100035071 Vimentin Human genes 0.000 description 1
- 102100029477 Vitamin K-dependent protein C Human genes 0.000 description 1
- 201000007960 WAGR syndrome Diseases 0.000 description 1
- 208000008383 Wilms tumor Diseases 0.000 description 1
- 208000018839 Wilson disease Diseases 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 230000021736 acetylation Effects 0.000 description 1
- 238000006640 acetylation reaction Methods 0.000 description 1
- 208000008919 achondroplasia Diseases 0.000 description 1
- 239000007801 affinity label Substances 0.000 description 1
- 208000006682 alpha 1-Antitrypsin Deficiency Diseases 0.000 description 1
- 239000012491 analyte Substances 0.000 description 1
- 238000000137 annealing Methods 0.000 description 1
- 238000003782 apoptosis assay Methods 0.000 description 1
- 239000007900 aqueous suspension Substances 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 208000022185 autosomal dominant polycystic kidney disease Diseases 0.000 description 1
- 235000015278 beef Nutrition 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 208000026900 bile duct neoplasm Diseases 0.000 description 1
- 239000012472 biological sample Substances 0.000 description 1
- 238000001369 bisulfite sequencing Methods 0.000 description 1
- 210000001772 blood platelet Anatomy 0.000 description 1
- 210000001185 bone marrow Anatomy 0.000 description 1
- 230000000711 cancerogenic effect Effects 0.000 description 1
- 238000005251 capillar electrophoresis Methods 0.000 description 1
- 239000002775 capsule Substances 0.000 description 1
- 231100000315 carcinogenic Toxicity 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000024245 cell differentiation Effects 0.000 description 1
- 108091092259 cell-free RNA Proteins 0.000 description 1
- 201000006612 cervical squamous cell carcinoma Diseases 0.000 description 1
- 108091006090 chromatin-associated proteins Proteins 0.000 description 1
- 239000012539 chromatography resin Substances 0.000 description 1
- 201000010902 chronic myelomonocytic leukemia Diseases 0.000 description 1
- 206010073251 clear cell renal cell carcinoma Diseases 0.000 description 1
- 108010045512 cohesins Proteins 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 239000000356 contaminant Substances 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 208000035250 cutaneous malignant susceptibility to 1 melanoma Diseases 0.000 description 1
- 208000030381 cutaneous melanoma Diseases 0.000 description 1
- 230000009089 cytolysis Effects 0.000 description 1
- 235000013365 dairy product Nutrition 0.000 description 1
- 230000034994 death Effects 0.000 description 1
- 231100000517 death Toxicity 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 239000005549 deoxyribonucleoside Substances 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000009274 differential gene expression Effects 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 206010012818 diffuse large B-cell lymphoma Diseases 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000001493 electron microscopy Methods 0.000 description 1
- 239000012149 elution buffer Substances 0.000 description 1
- 239000000839 emulsion Substances 0.000 description 1
- 108010030074 endodeoxyribonuclease MluI Proteins 0.000 description 1
- 201000000330 endometrial stromal sarcoma Diseases 0.000 description 1
- 208000029179 endometrioid stromal sarcoma Diseases 0.000 description 1
- 210000002889 endothelial cell Anatomy 0.000 description 1
- 210000003743 erythrocyte Anatomy 0.000 description 1
- 208000028653 esophageal adenocarcinoma Diseases 0.000 description 1
- 201000004101 esophageal cancer Diseases 0.000 description 1
- 208000007276 esophageal squamous cell carcinoma Diseases 0.000 description 1
- 210000001723 extracellular space Anatomy 0.000 description 1
- 108010091897 factor V Leiden Proteins 0.000 description 1
- 201000001386 familial hypercholesterolemia Diseases 0.000 description 1
- 210000003608 fece Anatomy 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 201000008396 gallbladder adenocarcinoma Diseases 0.000 description 1
- 201000010175 gallbladder cancer Diseases 0.000 description 1
- 239000000499 gel Substances 0.000 description 1
- 238000012239 gene modification Methods 0.000 description 1
- 102000034356 gene-regulatory proteins Human genes 0.000 description 1
- 108091006104 gene-regulatory proteins Proteins 0.000 description 1
- 230000005017 genetic modification Effects 0.000 description 1
- 235000013617 genetically modified food Nutrition 0.000 description 1
- 230000037442 genomic alteration Effects 0.000 description 1
- 210000003731 gingival crevicular fluid Anatomy 0.000 description 1
- 239000008187 granular material Substances 0.000 description 1
- 230000012010 growth Effects 0.000 description 1
- 230000003394 haemopoietic effect Effects 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 201000005787 hematologic cancer Diseases 0.000 description 1
- 208000024200 hematopoietic and lymphoid system neoplasm Diseases 0.000 description 1
- 229960002897 heparin Drugs 0.000 description 1
- 229920000669 heparin Polymers 0.000 description 1
- 208000006359 hepatoblastoma Diseases 0.000 description 1
- 206010073071 hepatocellular carcinoma Diseases 0.000 description 1
- 231100000844 hepatocellular carcinoma Toxicity 0.000 description 1
- 210000003494 hepatocyte Anatomy 0.000 description 1
- 125000005842 heteroatom Chemical group 0.000 description 1
- 208000009624 holoprosencephaly Diseases 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 238000007031 hydroxymethylation reaction Methods 0.000 description 1
- 230000028993 immune response Effects 0.000 description 1
- 230000007813 immunodeficiency Effects 0.000 description 1
- 239000012133 immunoprecipitate Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000000126 in silico method Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 201000002313 intestinal cancer Diseases 0.000 description 1
- 230000003834 intracellular effect Effects 0.000 description 1
- 238000007915 intraurethral administration Methods 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 210000000265 leukocyte Anatomy 0.000 description 1
- 239000003446 ligand Substances 0.000 description 1
- 238000007834 ligase chain reaction Methods 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 238000011068 loading method Methods 0.000 description 1
- 230000002934 lysing effect Effects 0.000 description 1
- 238000007403 mPCR Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 210000004962 mammalian cell Anatomy 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 208000020968 mature T-cell and NK-cell non-Hodgkin lymphoma Diseases 0.000 description 1
- 238000002844 melting Methods 0.000 description 1
- 230000008018 melting Effects 0.000 description 1
- 208000037819 metastatic cancer Diseases 0.000 description 1
- 208000011575 metastatic malignant neoplasm Diseases 0.000 description 1
- 108091070501 miRNA Proteins 0.000 description 1
- 239000002679 microRNA Substances 0.000 description 1
- 230000033607 mismatch repair Effects 0.000 description 1
- 210000003097 mucus Anatomy 0.000 description 1
- 230000000869 mutational effect Effects 0.000 description 1
- YHNZVIUHARVGLV-UHFFFAOYSA-N n-(7h-purin-6-yl)formamide Chemical compound O=CNC1=NC=NC2=C1NC=N2 YHNZVIUHARVGLV-UHFFFAOYSA-N 0.000 description 1
- 230000017074 necrotic cell death Effects 0.000 description 1
- 239000013642 negative control Substances 0.000 description 1
- 201000008026 nephroblastoma Diseases 0.000 description 1
- 238000007857 nested PCR Methods 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 201000004931 neurofibromatosis Diseases 0.000 description 1
- 108010087904 neutravidin Proteins 0.000 description 1
- 210000004882 non-tumor cell Anatomy 0.000 description 1
- 201000011330 nonpapillary renal cell carcinoma Diseases 0.000 description 1
- 230000001293 nucleolytic effect Effects 0.000 description 1
- 150000003833 nucleoside derivatives Chemical class 0.000 description 1
- 201000002575 ocular melanoma Diseases 0.000 description 1
- 230000008266 oncogenic mechanism Effects 0.000 description 1
- 201000005443 oral cavity cancer Diseases 0.000 description 1
- 201000002740 oral squamous cell carcinoma Diseases 0.000 description 1
- 201000006958 oropharynx cancer Diseases 0.000 description 1
- 201000008968 osteosarcoma Diseases 0.000 description 1
- 239000007800 oxidant agent Substances 0.000 description 1
- 201000010287 pancreatic acinar cell adenocarcinoma Diseases 0.000 description 1
- 208000030352 pancreatic acinar cell carcinoma Diseases 0.000 description 1
- 201000008129 pancreatic ductal adenocarcinoma Diseases 0.000 description 1
- 230000005298 paramagnetic effect Effects 0.000 description 1
- 230000007170 pathology Effects 0.000 description 1
- 238000002823 phage display Methods 0.000 description 1
- 239000008194 pharmaceutical composition Substances 0.000 description 1
- 230000000865 phosphorylative effect Effects 0.000 description 1
- 229910052700 potassium Inorganic materials 0.000 description 1
- 239000011591 potassium Substances 0.000 description 1
- 244000144977 poultry Species 0.000 description 1
- 230000035935 pregnancy Effects 0.000 description 1
- 102000004196 processed proteins & peptides Human genes 0.000 description 1
- 230000005522 programmed cell death Effects 0.000 description 1
- 230000001915 proofreading effect Effects 0.000 description 1
- 201000005825 prostate adenocarcinoma Diseases 0.000 description 1
- 230000009145 protein modification Effects 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 230000005855 radiation Effects 0.000 description 1
- 238000001959 radiotherapy Methods 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 235000003499 redwood Nutrition 0.000 description 1
- 230000022983 regulation of cell cycle Effects 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 210000005132 reproductive cell Anatomy 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000002271 resection Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 239000002342 ribonucleoside Substances 0.000 description 1
- 210000003296 saliva Anatomy 0.000 description 1
- 238000007480 sanger sequencing Methods 0.000 description 1
- 230000028327 secretion Effects 0.000 description 1
- 210000000582 semen Anatomy 0.000 description 1
- 208000007056 sickle cell anemia Diseases 0.000 description 1
- 239000000377 silicon dioxide Substances 0.000 description 1
- 201000003708 skin melanoma Diseases 0.000 description 1
- 239000010454 slate Substances 0.000 description 1
- 201000002314 small intestine cancer Diseases 0.000 description 1
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 1
- 210000001082 somatic cell Anatomy 0.000 description 1
- 208000002320 spinal muscular atrophy Diseases 0.000 description 1
- 239000007921 spray Substances 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 239000000829 suppository Substances 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 210000004243 sweat Anatomy 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 208000011580 syndromic disease Diseases 0.000 description 1
- 210000001179 synovial fluid Anatomy 0.000 description 1
- 239000003826 tablet Substances 0.000 description 1
- 238000002626 targeted therapy Methods 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 229940124597 therapeutic agent Drugs 0.000 description 1
- 238000002560 therapeutic procedure Methods 0.000 description 1
- 201000005665 thrombophilia Diseases 0.000 description 1
- 210000003813 thumb Anatomy 0.000 description 1
- 201000002510 thyroid cancer Diseases 0.000 description 1
- 230000000699 topical effect Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 230000017105 transposition Effects 0.000 description 1
- 206010046766 uterine cancer Diseases 0.000 description 1
- 208000037965 uterine sarcoma Diseases 0.000 description 1
- 229960005486 vaccine Drugs 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
- 238000007482 whole exome sequencing Methods 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
- C12Q1/6886—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/1034—Isolating an individual clone by screening libraries
- C12N15/1065—Preparation or screening of tagged libraries, e.g. tagged microorganisms by STM-mutagenesis, tagged polynucleotides, gene tags
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6806—Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/80—Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/112—Disease subtyping, staging or classification
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/154—Methylation markers
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/156—Polymorphic or mutational markers
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Biotechnology (AREA)
- Analytical Chemistry (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Microbiology (AREA)
- Immunology (AREA)
- Physics & Mathematics (AREA)
- Pathology (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Hospice & Palliative Care (AREA)
- Oncology (AREA)
- Medicinal Chemistry (AREA)
- Bioinformatics & Computational Biology (AREA)
- Crystallography & Structural Chemistry (AREA)
- Plant Pathology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本開示は、DNA、例えば、無細胞DNAを解析することに関連する組成物および方法を提供する。一部の実施形態では、無細胞DNAは、がんを有するかもしくはがんを有することが疑われる対象に由来する、かつ/または無細胞DNAは、がん細胞に由来するDNAを含む。一部の実施形態では、DNAは、第1の部分試料および第2の部分試料に分配され、第1の部分試料は、第2の部分試料よりも高い割合でヌクレオチド改変(例えば、シトシン改変)を有するDNAを含み、第2の部分試料は、第1の部分試料のDNA内の第1の核酸塩基に対してDNA内の第2の核酸塩基とは異なって影響を及ぼす手順に供され、DNAは、第2の部分試料のDNA内の第1の核酸塩基を第2の核酸塩基と識別する様式でシーケンシングされる。
Description
関連出願への相互参照
本出願は、2020年10月23日に出願された米国仮特許出願第63/105,184号に基づく優先権を主張し、この仮特許出願は、あらゆる目的で参照によりその全体が本明細書に組み込まれる。
本出願は、2020年10月23日に出願された米国仮特許出願第63/105,184号に基づく優先権を主張し、この仮特許出願は、あらゆる目的で参照によりその全体が本明細書に組み込まれる。
発明の分野
本開示は、DNA、例えば、無細胞DNAを解析することに関連する組成物および方法を提供する。一部の実施形態では、無細胞DNAは、がんを有するかもしくはがんを有することが疑われる対象に由来する、かつ/または無細胞DNAは、がん細胞に由来するDNAを含む。一部の実施形態では、DNAは、第1の部分試料および第2の部分試料に分配され、第1の部分試料は、第2の部分試料よりも高い割合でヌクレオチド改変(例えば、シトシン改変)を有するDNAを含み、第2の部分試料は、第1の部分試料のDNA内の第1の核酸塩基に対してDNA内の第2の核酸塩基とは異なって影響を及ぼす手順に供され、DNAは、第2の部分試料のDNA内の第1の核酸塩基を第2の核酸塩基と識別する様式でシーケンシングされる。
本開示は、DNA、例えば、無細胞DNAを解析することに関連する組成物および方法を提供する。一部の実施形態では、無細胞DNAは、がんを有するかもしくはがんを有することが疑われる対象に由来する、かつ/または無細胞DNAは、がん細胞に由来するDNAを含む。一部の実施形態では、DNAは、第1の部分試料および第2の部分試料に分配され、第1の部分試料は、第2の部分試料よりも高い割合でヌクレオチド改変(例えば、シトシン改変)を有するDNAを含み、第2の部分試料は、第1の部分試料のDNA内の第1の核酸塩基に対してDNA内の第2の核酸塩基とは異なって影響を及ぼす手順に供され、DNAは、第2の部分試料のDNA内の第1の核酸塩基を第2の核酸塩基と識別する様式でシーケンシングされる。
序説および要旨
がんは、世界中で年間数百万人もの死亡の原因となっている。がんの早期検出は、初期のがんが処置に対してより感受性となる傾向があるため、転帰の改善をもたらす可能性がある。
がんは、世界中で年間数百万人もの死亡の原因となっている。がんの早期検出は、初期のがんが処置に対してより感受性となる傾向があるため、転帰の改善をもたらす可能性がある。
不適切に制御された細胞成長は、遺伝子変化およびエピジェネティック変化、例えば、コピー数変異(CNV)、単一ヌクレオチド変異(SNV)、遺伝子融合、挿入、および/または欠失(インデル)、シトシンの改変を含むエピジェネティック変異(例えば、5-メチルシトシン、5-ヒドロキシメチルシトシン、および他のより酸化した形態)、ならびにDNAのクロマチンタンパク質および転写因子との会合の蓄積により一般的に生じる、がんの顕著な特徴である。
生検は、可能性のあるがんの部位から細胞または組織を抽出し、関連する表現型および/または遺伝子型特色について解析する、がんを検出または診断するための従来的なアプローチを表す。生検は、侵襲的であるという欠点を有する。
体液(「液体生検」)、例えば、血液の解析に基づくがんの検出は、がん細胞に由来するDNAが体液中に放出されるという観察に基づく興味深い代替法である。液体生検は、非侵襲的である(採血だけは必要な場合がある)。無細胞核酸(例えば、無細胞DNAまたは無細胞RNA)のがん診断アッセイの現在の方法は、単一ヌクレオチド変異体(SNV)、コピー数変異(CNV)、融合、およびインデル(すなわち、挿入または欠失)を含む、腫瘍関連の体細胞変異体の検出に焦点を当てている可能性があり、これらは全て、液体生検の主流の標的である。無細胞DNAにおけるメチル化状態およびフラグメントームシグナルなどの非配列改変が、無細胞DNAの起源および疾患レベルに関する情報を提供し得るという根拠が増えてきている。無細胞DNAの非配列改変は、体細胞突然変異のコーリングと組み合わせた場合に、いずれかのアプローチ単独で入手可能なものよりも包括的な腫瘍状態評価を得ることができる。しかしながら、無細胞DNAの低い濃度および不均一性を考えると、核酸塩基改変に関する詳細な情報を提供する液体生検材料を解析するための正確かつ感度の高い方法を開発することは、困難となっている。
液体生検手順におけるさらなる解析に有用な無細胞DNAの分画を単離しプロセシングすることは、これらの方法の重要な部分である。したがって、例えば、液体生検において、無細胞DNAを解析するための改善された方法および組成物が、必要とされている。
本開示は、無細胞DNAの改善された解析の必要性を満たすこと、および/または他の利点を提供することを目的としている。したがって、以下の例示的な実施形態を提供する。
実施形態1は、試料中のDNAを解析する方法であって、
a)試料を、第1の部分試料および第2の部分試料を含む複数の部分試料に分配するステップであって、第1の部分試料が、第2の部分試料よりも高い割合で、シトシン改変を有するDNAを含む、ステップと、
b)第2の部分試料を、第2の部分試料のDNA内の第1の核酸塩基に対してDNA内の第2の核酸塩基とは異なって影響を及ぼす手順に供するステップであって、第1の核酸塩基が改変または非改変核酸塩基であり、第2の核酸塩基が第1の核酸塩基とは異なる改変または非改変核酸塩基であり、第1の核酸塩基および第2の核酸塩基が同じ塩基対形成特異性を有し、それによって処置された部分試料を産生するステップと、
c)処置された部分試料から、エピジェネティック標的領域を含む標的領域セットを捕捉するステップと、
d)標的領域セット中のDNAおよび第1の部分試料に由来するDNAをシーケンシングするステップであって、第2の部分試料に由来するDNAが、標的領域セットのDNA内の第1の核酸塩基を第2の核酸塩基と識別する様式でシーケンシングされる、ステップと
を含む、方法である。
a)試料を、第1の部分試料および第2の部分試料を含む複数の部分試料に分配するステップであって、第1の部分試料が、第2の部分試料よりも高い割合で、シトシン改変を有するDNAを含む、ステップと、
b)第2の部分試料を、第2の部分試料のDNA内の第1の核酸塩基に対してDNA内の第2の核酸塩基とは異なって影響を及ぼす手順に供するステップであって、第1の核酸塩基が改変または非改変核酸塩基であり、第2の核酸塩基が第1の核酸塩基とは異なる改変または非改変核酸塩基であり、第1の核酸塩基および第2の核酸塩基が同じ塩基対形成特異性を有し、それによって処置された部分試料を産生するステップと、
c)処置された部分試料から、エピジェネティック標的領域を含む標的領域セットを捕捉するステップと、
d)標的領域セット中のDNAおよび第1の部分試料に由来するDNAをシーケンシングするステップであって、第2の部分試料に由来するDNAが、標的領域セットのDNA内の第1の核酸塩基を第2の核酸塩基と識別する様式でシーケンシングされる、ステップと
を含む、方法である。
実施形態2は、試料中のDNAを解析する方法であって、
a)試料から、エピジェネティック標的領域を含む標的領域セットを捕捉するステップと、
b)標的領域セットを、第1の部分試料および第2の部分試料を含む複数の部分試料に分配するステップであって、第1の部分試料が、第2の部分試料よりも高い割合で、シトシン改変を有するDNAを含む、ステップと、
c)第2の部分試料を、第2の部分試料のDNA内の第1の核酸塩基に対してDNA内の第2の核酸塩基とは異なって影響を及ぼす手順に供するステップであって、ステップであって、第1の核酸塩基が改変または非改変核酸塩基であり、第2の核酸塩基が第1の核酸塩基とは異なる改変または非改変核酸塩基であり、第1の核酸塩基および第2の核酸塩基が同じ塩基対形成特異性を有し、それによって処置された部分試料を産生するステップと、
d)第1の部分試料に由来するDNAおよび第2の部分試料に由来するDNAをシーケンシングするステップであって、第2の部分試料に由来するDNAが、標的領域セットのDNA内の第1の核酸塩基を第2の核酸塩基と識別する様式でシーケンシングされる、ステップと
を含む、方法である。
a)試料から、エピジェネティック標的領域を含む標的領域セットを捕捉するステップと、
b)標的領域セットを、第1の部分試料および第2の部分試料を含む複数の部分試料に分配するステップであって、第1の部分試料が、第2の部分試料よりも高い割合で、シトシン改変を有するDNAを含む、ステップと、
c)第2の部分試料を、第2の部分試料のDNA内の第1の核酸塩基に対してDNA内の第2の核酸塩基とは異なって影響を及ぼす手順に供するステップであって、ステップであって、第1の核酸塩基が改変または非改変核酸塩基であり、第2の核酸塩基が第1の核酸塩基とは異なる改変または非改変核酸塩基であり、第1の核酸塩基および第2の核酸塩基が同じ塩基対形成特異性を有し、それによって処置された部分試料を産生するステップと、
d)第1の部分試料に由来するDNAおよび第2の部分試料に由来するDNAをシーケンシングするステップであって、第2の部分試料に由来するDNAが、標的領域セットのDNA内の第1の核酸塩基を第2の核酸塩基と識別する様式でシーケンシングされる、ステップと
を含む、方法である。
実施形態3は、標的領域セットが、低メチル化可変標的領域セットを含む、先行する実施形態のいずれか1つに記載の方法である。
実施形態4は、低メチル化可変標的領域セットが、少なくとも1つのタイプの組織において、健康な対象に由来する無細胞DNAにおけるメチル化の程度よりも低い程度のメチル化を有する領域を含む、直前の実施形態に記載の方法である。
実施形態5は、標的領域セットが、メチル化対照標的領域セットを含む、実施形態3または4に記載の方法である。
実施形態6は、標的領域セットが、断片化可変標的領域セットを含む、先行する実施形態のいずれか1つに記載の方法である。
実施形態7は、断片化可変標的領域セットが、転写開始部位領域を含む、直前の実施形態に記載の方法である。
実施形態8は、断片化可変標的領域セットが、CTCF結合領域を含む、実施形態6または7に記載の方法である。
実施形態9は、標的領域セットが、配列可変標的領域をさらに含む、先行する実施形態のいずれか1つに記載の方法である。
実施形態10は、配列可変標的領域セットに対応するDNA分子が、エピジェネティック標的領域セットに対応するDNA分子よりも高い捕捉収率で捕捉される、直前の実施形態に記載の方法である。
実施形態11は、試料中のDNAを解析する方法であって、
a)試料を、第1の部分試料および第2の部分試料を含む複数の部分試料に分配するステップであって、第1の部分試料が、第2の部分試料よりも高い割合で、シトシン改変を有するDNAを含む、ステップと、
b)第2の部分試料を、第2の部分試料のDNA内の第1の核酸塩基に対してDNA内の第2の核酸塩基とは異なって影響を及ぼす手順に供するステップであって、第1の核酸塩基が改変または非改変核酸塩基であり、第2の核酸塩基が第1の核酸塩基とは異なる改変または非改変核酸塩基であり、第1の核酸塩基および第2の核酸塩基が同じ塩基対形成特異性を有し、それによって処置された部分試料を産生するステップと、
c)処置された部分試料に由来するDNAおよび第1の部分試料に由来するDNAを、標的領域セットのDNA内の第1の核酸塩基を第2の核酸塩基と識別する様式でシーケンシングするステップと
を含む、方法である。
a)試料を、第1の部分試料および第2の部分試料を含む複数の部分試料に分配するステップであって、第1の部分試料が、第2の部分試料よりも高い割合で、シトシン改変を有するDNAを含む、ステップと、
b)第2の部分試料を、第2の部分試料のDNA内の第1の核酸塩基に対してDNA内の第2の核酸塩基とは異なって影響を及ぼす手順に供するステップであって、第1の核酸塩基が改変または非改変核酸塩基であり、第2の核酸塩基が第1の核酸塩基とは異なる改変または非改変核酸塩基であり、第1の核酸塩基および第2の核酸塩基が同じ塩基対形成特異性を有し、それによって処置された部分試料を産生するステップと、
c)処置された部分試料に由来するDNAおよび第1の部分試料に由来するDNAを、標的領域セットのDNA内の第1の核酸塩基を第2の核酸塩基と識別する様式でシーケンシングするステップと
を含む、方法である。
実施形態12は、第1の部分試料のDNAを、メチル化感受性ヌクレアーゼと接触させ、それによって第1の部分試料中の非特異的に分配されたDNAを分解する、先行する実施形態のいずれか1つに記載の方法である。
実施形態13は、DNAが、試験対象から得られた無細胞DNA(cfDNA)を含む、先行する実施形態のいずれか1つに記載の方法である。
実施形態14は、第1の部分試料から、追加の標的領域セットを捕捉するステップをさらに含み、シーケンシングされる第1の部分試料に由来するDNAが、追加の標的領域セットを含む、先行する実施形態のいずれか1つに記載の方法。
実施形態15は、第1の部分試料を、第2の部分試料のDNA内の第1の核酸塩基に対してDNA内の第2の核酸塩基とは異なって影響を及ぼす手順に供するステップであって、第1の核酸塩基が改変または非改変核酸塩基であり、第2の核酸塩基が第1の核酸塩基とは異なる改変または非改変核酸塩基であり、第1の核酸塩基および第2の核酸塩基が同じ塩基対形成特異性を有し、それによって追加の処置された部分試料を産生するステップをさらに含む、先行する実施形態のいずれか1つに記載の方法である。
実施形態16は、追加の処置された部分試料から、追加の標的領域セットを捕捉するステップをさらに含む、直前の実施形態に記載の方法である。
実施形態17は、追加の標的領域セットが、高メチル化可変標的領域セットを含む、実施形態14または16に記載の方法である。
実施形態18は、高メチル化可変標的領域セットが、少なくとも1つのタイプの組織において、健康な対象に由来する無細胞DNAにおけるメチル化の程度よりも高い程度のメチル化を有する領域を含む、直前の実施形態に記載の方法である。
実施形態19は、追加の標的領域セットが、メチル化対照標的領域セットを含む、実施形態18または19に記載の方法である。
実施形態20は、追加の標的領域セットが、断片化可変標的領域セットを含む、実施形態16~19のいずれか1つに記載の方法である。
実施形態21は、断片化可変標的領域セットが、転写開始部位領域を含む、直前の実施形態に記載の方法である。
実施形態22は、断片化可変標的領域セットが、CTCF結合領域を含む、実施形態20または21に記載の方法である。
実施形態23は、追加の標的領域セットが、配列可変標的領域をさらに含む、実施形態16~22のいずれか1つに記載の方法である。
実施形態24は、配列可変標的領域セットに対応するDNA分子が、エピジェネティック標的領域セットに対応するDNA分子よりも高い捕捉収率で捕捉される、直前の実施形態に記載の方法である。
実施形態25は、捕捉するステップが、捕捉しようとするDNAを、標的特異的プローブのセットと接触させることを含み、それによって標的特異的プローブとDNAとの複合体が形成される、先行する実施形態のいずれか1つに記載の方法である。
実施形態26は、捕捉するステップが、複合体を、標的特異的プローブに結合していないDNAから分離させ、それによって捕捉されたDNAを得ることをさらに含む、直前の実施形態に記載の方法である。
実施形態27は、標的特異的プローブのセットが、エピジェネティック標的領域セットに対応するDNAよりも高い捕捉収率で配列可変標的領域セットに対応するDNAを捕捉するように構成される、実施形態25または26に記載の方法である。
実施形態28は、エピジェネティック標的領域セットに対応するDNA分子よりも大きいシーケンシング深度まで、配列可変標的領域セットに対応するDNA分子をシーケンシングするステップを含む、実施形態9~22のいずれか1つに記載の方法である。
実施形態29は、DNAが、シーケンシングするステップの前に増幅されるか、またはDNAが、捕捉するステップの前に増幅される、先行する実施形態のいずれか1つに記載の方法である。
実施形態30は、捕捉の前にDNAにバーコード含有アダプターをライゲーションするステップをさらに含み、必要に応じて、ライゲーションするステップが、増幅の前または増幅と同時に生じる、先行する実施形態のいずれか1つに記載の方法である。
実施形態31は、試料を複数の部分試料に分配するステップが、メチル化レベルに基づいて分配することを含む、先行する実施形態のいずれか1つに記載の方法である。
実施形態32は、分配するステップが、収集したcfDNAを、固体支持体に固定化されたメチル結合試薬と接触させることを含む、直前の実施形態に記載の方法である。
実施形態33は、第1の部分試料および第2の部分試料または第1の部分試料および処置された部分試料を、差次的にタグ付けするステップを含む、先行する実施形態のいずれか1つに記載の方法である。
実施形態34は、第1の部分試料および標的領域セットまたは第2の部分試料に由来するDNAが、プールされる、直前の実施形態に記載の方法である。
実施形態35は、第1の部分試料および標的領域セットまたは第2の部分試料に由来するDNAが、同じシーケンシングセルにおいてシーケンシングされる、実施形態33~34のいずれか1つに記載の方法である。
実施形態36は、複数の部分試料が、第2部分試料よりも高い割合であるが第1の部分試料よりも低い割合でシトシン改変を有するDNAを含む、第3の部分試料を含む、先行する実施形態のいずれか1つに記載の方法である。
実施形態37は、第3の部分試料を差次的にタグ付けするステップをさらに含む、直前の実施形態に記載の方法である。
実施形態38は、第1の部分試料に由来するDNA、第3の試料に由来するDNA、および標的領域セットが、プールされ、必要に応じて、第1、第2、および第3の部分試料に由来するDNAが、同じシーケンシングセルにおいてシーケンシングされる、直前の実施形態に記載の方法である。
実施形態39は、対象ががんを有する可能性を決定するステップをさらに含む、先行する実施形態のいずれか1つに記載の方法である。
実施形態40は、シーケンシングするステップが、複数のシーケンシング読み取りデータを生成し、方法が、複数の配列読み取りデータを1つまたは複数の参照配列にマッピングして、マッピングされた配列読み取りデータを生成するステップと、配列可変標的領域セットおよびエピジェネティック標的領域セットに対応するマッピングされた配列読み取りデータをプロセシングして、対象ががんを有する可能性を決定するステップとをさらに含む、直前の実施形態に記載の方法である。
実施形態41は、試験対象が、以前にがんと診断され、1つまたは複数の以前のがん処置を受けており、必要に応じて、cfDNAが、1つまたは複数の以前のがん処置の後の1つまたは複数の事前に選択された時点で取得され、cfDNA分子の捕捉されたセットをシーケンシングし、それによって配列情報のセットが産生される、実施形態1~38のいずれか1つに記載の方法である。
実施形態42は、配列情報のセットを使用して、事前に選択された時点において、腫瘍細胞を起源とするかまたはそれに由来するDNAの存在または非存在を検出するステップをさらに含む、直前の実施形態に記載の方法である。
実施形態43は、試験対象について、腫瘍細胞を起源とするかまたはそれに由来するDNAの存在または非存在を示すがん再発スコアを決定するステップをさらに含み、必要に応じて、がん再発スコアに基づいて、がん再発ステータスを決定するステップをさらに含み、試験対象のがん再発ステータスが、がん再発スコアが所定の閾値であるかもしくはそれを上回ると決定された場合にがん再発のリスクがあると決定されるか、または試験対象のがん再発ステータスが、がん再発スコアが所定の閾値よりも低い場合にがん再発のリスクが低いと決定される、直前の実施形態に記載の方法である。
実施形態44は、試験対象のがん再発スコアを所定のがん再発閾値と比較するステップをさらに含み、試験対象が、がん再発スコアががん再発閾値を上回る場合に後続のがん処置の候補として分類されるか、またはがん再発スコアががん再発閾値よりも低い場合に後続のがん処置の候補ではないとして分類される、直前の実施形態に記載の方法である。
実施形態45は、シトシン改変が、メチル化である、先行する実施形態のいずれか1つに記載の方法である。
実施形態46は、シトシン改変が、シトシンの5位におけるメチル化である、先行する実施形態のいずれか1つに記載の方法である。
実施形態47は、第2の部分試料が供される手順が、第2の核酸塩基の塩基対形成特異性を実質的に変化させることなく、第1の核酸塩基の塩基対形成特異性を変化させる、先行する実施形態のいずれか1つに記載の方法である。
実施形態48は、第1の核酸塩基が、改変または非改変シトシンであり、第2の核酸塩基が、改変または非改変シトシンである、先行する実施形態のいずれか1つに記載の方法。
実施形態49は、第1の核酸塩基が、非改変シトシン(C)を含む、先行する実施形態のいずれか1つに記載の方法である。
実施形態50は、第2の核酸塩基が、5-メチルシトシン(mC)を含む、先行する実施形態のいずれか1つに記載の方法である。
実施形態51は、第1の部分試料が供される手順が、バイサルファイト変換を含む、先行する実施形態のいずれか1つに記載の方法である。
実施形態52は、第1の核酸塩基が、mCを含む、実施形態1~49のいずれか1つに記載の方法である。
実施形態53は、第2の核酸塩基が、5-ヒドロキシメチルシトシン(hmC)を含む、先行する実施形態のいずれか1つに記載の方法である。
実施形態54は、第2の部分試料が供される手順が、5hmCの保護を含む、実施形態53に記載の方法である。
実施形態55は、第2の部分試料が供される手順が、Tet補助バイサルファイト変換を含む、実施形態53に記載の方法である。
実施形態56は、第2の部分試料が供される手順が、置換ボラン還元剤を用いたTet補助変換を含み、必要に応じて、置換ボラン還元剤が、2-ピコリンボラン、ボランピリジン、tert-ブチルアミンボラン、またはアンモニアボランである、実施形態53に記載の方法である。
実施形態57は、置換ボラン還元剤が、2-ピコリンボランまたはボランピリジンである、実施形態56に記載の方法である。
実施形態58は、第2の核酸塩基が、Cを含む、実施形態52~54または56~57のいずれか1つに記載の方法である。
実施形態59は、第2の部分試料が供される手順が、hmCの保護、続いて置換ボラン還元剤を用いたTet補助変換を含み、必要に応じて、置換ボラン還元剤が、2-ピコリンボラン、ボランピリジン、tert-ブチルアミンボラン、またはアンモニアボランである、実施形態52~54、または58のいずれか1つに記載の方法である。
実施形態60は、置換ボラン還元剤が、2-ピコリンボランまたはボランピリジンである、実施形態59に記載の方法である。
実施形態61は、第1の部分試料が供される手順が、hmCの保護、続いてmCおよび/またはCの脱アミノ化を含む、実施形態49、50、52~54、または58のいずれか1つに記載の方法である。
実施形態62は、mCおよび/またはCの脱アミノ化が、AID/APOBECファミリーDNAデアミナーゼ酵素での処置を含む、実施形態61に記載の方法である。
実施形態63は、hmCの保護が、hmCのグルコシル化を含む、実施形態54または58~62のいずれか1つに記載の方法である。
実施形態64は、第1の部分試料が供される手順が、置換ボラン還元剤を用いた化学物質補助変換を含み、必要に応じて、置換ボラン還元剤が、2-ピコリンボラン、ボランピリジン、tert-ブチルアミンボラン、またはアンモニアボランである、実施形態1~48、50、52、または58のいずれか1つに記載の方法である。
実施形態65は、置換ボラン還元剤が、2-ピコリンボランまたはボランピリジンである、実施形態64に記載の方法である。
実施形態66は、第1の核酸塩基が、hmCを含む、実施形態1~48、50、52、58、または64~65のいずれか1つに記載の方法である。
実施形態67は、第1の部分試料のDNAおよび第2の部分試料のDNAが、差次的にタグ付けされ、差次的タグ付けの後に、第2の部分試料または処置された部分試料に由来するDNAの一部分が、第1の部分試料または追加の処置された部分試料またはその少なくとも一部分に添加され、それによってプールが形成され、配列可変標的領域およびエピジェネティック標的領域が、プールから捕捉される、先行する実施形態のいずれか1つに記載の方法である。
実施形態68は、プールが、第2の部分試料のDNAのうちの約45%未満もしくはそれに等しい、40%未満もしくはそれに等しい、35%未満もしくはそれに等しい、30%未満もしくはそれに等しい、25%未満もしくはそれに等しい、20%未満もしくはそれに等しい、15%未満もしくはそれに等しい、10%未満もしくはそれに等しい、または5%未満もしくはそれに等しいを含む、直前の実施形態に記載の方法である。
実施形態69は、プールが、第2の部分試料のDNAのうちの約70~90%、約75~85%、または約80%を含む、直前の実施形態に記載の方法である。
実施形態70は、プールが、第1の部分試料のDNAの実質的に全てを含む、実施形態67~69のいずれか1つに記載の方法である。
実施形態71は、プールが、第1の部分試料または処置された第1の部分試料のDNAの実質的に全てを含む、実施形態67~70のいずれか1つに記載の方法である。
実施形態72は、第1の標的領域セットが、プールの形成後に、第1の部分試料または処置された第1の部分試料の少なくとも一部分から捕捉される、実施形態67~72のいずれか1つに記載の方法である。
実施形態73は、第1の部分試料を、第2の部分試料のDNA内の第1の核酸塩基に対してDNA内の第2の核酸塩基とは異なって影響を及ぼす手順に供するステップであって、第1の部分試料が供される手順が、第2の部分試料が供される手順と同じである、ステップをさらに含む、実施形態47~72のいずれか1つに記載の方法である。
実施形態74は、第1の部分試料を、第2の部分試料のDNA内の第1の核酸塩基に対してDNA内の第2の核酸塩基とは異なって影響を及ぼす手順に供するステップであって、第1の部分試料が供される手順が、第2の部分試料が供される手順とは異なる、ステップをさらに含む、実施形態47~72のいずれか1つに記載の方法である。
I.図面の簡単な説明
I.図面の簡単な説明
II.ある特定の実施形態の詳細な説明
ここで、本発明のある特定の実施形態への詳細な参照がなされる。本発明は、そのような実施形態と関連して記載されているが、それらが、本発明をそれらの実施形態に制限することを意図するものではないことが理解される。逆に、本発明は、全ての代替形態、改変形態、および等価物を網羅することを意図し、それらは、添付の特許請求の範囲によって定義される本発明内に含まれ得る。
ここで、本発明のある特定の実施形態への詳細な参照がなされる。本発明は、そのような実施形態と関連して記載されているが、それらが、本発明をそれらの実施形態に制限することを意図するものではないことが理解される。逆に、本発明は、全ての代替形態、改変形態、および等価物を網羅することを意図し、それらは、添付の特許請求の範囲によって定義される本発明内に含まれ得る。
本教示を詳細に説明する前に、本開示が、特定の組成物またはプロセスステップに限定されるものではなく、それが変動し得ることを理解されたい。本明細書および添付の特許請求の範囲において使用されるとき、単数形の「1つの(a)」、「1つの(an)」、および「その(the)」は、文脈により別途明確に示されない限り、複数形の参照物を含むことに留意すべきである。したがって、例えば、「核酸(a nucleic acid)」への言及は、複数の核酸を含み、「細胞(a cell)」への言及は、複数の細胞を含むなどである。
数値範囲は、その範囲を定める数を含む。測定値および測定可能な値は、測定と関連する有効桁および誤差を考慮した、近似値であるとして理解される。また、「含む(comprise)」、「含む(comprises)」、「含むこと(comprising)」、「含有する(contain)」、「含有する(contains)」、「含有すること(containing)」、「含む(include)」、「含む(includes)」、および「含むこと(including)」の使用は、制限することを意図するものではない。前述の一般的な説明および詳細な説明は、いずれも、例示的および説明的であるにすぎず、教示を制限するものではないことを理解されたい。
上記の明細書に具体的に言及されていない限り、様々な構成要素を「含む」と列挙した本明細書における実施形態はまた、列挙された構成要素「からなる」または「から本質的になる」ことも企図され、様々な構成要素「からなる」と列挙した本明細書における実施形態はまた、列挙された構成要素を「含む」またはそれ「から本質的になる」ことも企図され、様々な構成要素「から本質的になる」と列挙した本明細書における実施形態はまた、列挙された構成要素「からなる」またはそれを「含む」ことも企図される(この互換可能性は、特許請求の範囲におけるこれらの用語の使用には適用されない)。
本明細書において使用される節の見出しは、構成上の目的のためのものであり、決して開示される主題を制限するものと解釈されるべきではない。参照によって組み込まれる任意の文書または他の材料が、本明細書の任意の明示的な内容と相反する場合、定義を含め、本明細書が優先される。
A.定義
A.定義
「無細胞DNA」、「cfDNA分子」、または単純に「cfDNA」は、対象において細胞外形態で(例えば、血液、血清、血漿、または他の体液、例えば、リンパ液、脳脊髄液、尿、もしくは喀痰中に)天然に存在するDNA分子を含む。cfDNAは、大型の複合生物体、例えば、哺乳動物の細胞(単数または複数)においてもともと存在していたが、細胞から生物において見出される流体中への放出を受けており、in vitro細胞溶解ステップを行う必要なしに、流体の試料から得ることができる。
本明細書で使用される場合、「細胞核酸」とは、核酸が後に所与の解析プロセスの一部として取り出される(例えば、細胞溶解によって)としても、少なくとも試料が対象から採取または収集された時点において、核酸が起源とする1つまたは複数の細胞内に配置されている、核酸を意味する。
本明細書で使用される場合、改変または他の特色は、改変または他の特色を有するヌクレオチドの分画が、第1の試料または集団において、第2の集団におけるよりも高い場合に、第1の試料または核酸の集団において第2の試料または集団よりも「高い割合」で存在する。例えば、第1の試料において、ヌクレオチドのうちの10分の1がmCであり、第2の試料において、ヌクレオチドのうちの20分の1がmCである場合には、第1の試料は、第2の試料よりも高い割合で、シトシンの5-メチル化改変を含む。
本明細書で使用される場合、所与の核酸塩基の「塩基対形成特異性を実質的に変化させることなく」とは、シーケンシングすることができるその核酸塩基を含む分子の大部分が、それがもともと単離された試料中にあったときのその塩基対形成特異性と比べて、第2の核酸塩基の塩基対形成特異性の変更を有さないことを意味する。一部の実施形態では、シーケンシングすることができるその核酸塩基を含む分子のうちの75%、90%、95%、または99%が、それがもともと単離された試料中にあったときのその塩基対形成特異性と比べて、第2の核酸塩基の塩基対形成特異性の変更を有さない。
本明細書で使用される場合、「塩基対形成特異性」とは、所与の塩基がもっとも優先的に対を形成する標準的なDNA塩基(A、C、G、またはT)を指す。したがって、例えば、非改変シトシンおよび5-メチルシトシンは、同じ塩基対形成特異性(すなわち、Gに対する特異性)を有するが、ウラシルおよびシトシンは、ウラシルがAに対する塩基対形成特異性を有する一方でシトシンがGに対する塩基対形成特異性を有するため、異なる塩基対形成特異性を有する。ウラシルは、いずれにせよ、4つの標準的なDNA塩基の中でもAともっとも優先的に対を形成するため、ウラシルがGと不安定な対を形成する能力は、無関係である。
本明細書で使用される場合、複数のメンバーを含む「組合せ」は、メンバーを含む単一の組成物、または近傍にある、例えば、より大きな容器、例えば、マルチウェルプレート、チューブラック、冷蔵庫、冷凍庫、インキュベーター、水浴、アイスバケット、機械、もしくは他の保管形態内の別個の容器もしくはコンパートメント内にある組成物のセットのいずれかを指す。
所与の標的セットに対するプローブのコレクションの「捕捉収率」とは、典型的な条件下においてプローブのコレクションが捕捉する標的セットに対応する核酸の量(例えば、別の標的セットと比べた量または絶対量)を指す。例示的な典型的な捕捉条件は、試料核酸およびプローブの、ストリンジェントなハイブリダイゼーション緩衝液を含有する小さな反応体積(約20μL)における、65℃で10~18時間のインキュベーションである。捕捉収率は、絶対値で、または複数のプローブのコレクションについては、相対値で表され得る。複数の標的領域のセットの捕捉収率を比較する場合、それらは、標的領域セットのフットプリントサイズに関して(例えば、キロ塩基に基づいて)正規化される。したがって、例えば、第1および第2の標的領域のフットプリントサイズが、それぞれ、50kbおよび500kbである場合(正規化係数0.1となる)には、第1の標的領域セットに対応するDNAは、第1の標的領域セットに対応する捕捉されたDNAの体積濃度あたりの質量が、第2の標的領域セットに対応する捕捉されたDNAの体積濃度あたりの質量の0.1倍を上回る場合に、第2の標的領域セットに対応するDNAよりも高い収率で捕捉される。さらなる例として、同じフットプリントサイズを使用すると、第1の標的領域セットに対応する捕捉されたDNAが、第2の標的領域セットに対応する捕捉されたDNAの体積濃度あたりの質量の0.2倍の体積濃度あたりの質量を有する場合には、第1の標的領域セットに対応するDNAは、第2の標的領域セットに対応するDNAよりも2倍高い捕捉収率で捕捉されている。
1つまたは複数の標的核酸を「捕捉する」とは、1つまたは複数の標的核酸を、非標的核酸から優先的に単離または分離することを指す。
核酸の「捕捉されたセット」とは、捕捉を受けた核酸を指す。
「標的領域セット」または「標的領域のセット」とは、捕捉の標的とされる、かつ/またはプローブのセットによって標的とされる(例えば、配列相補性を通じて)、複数のゲノム座を指す。
「標的領域セットに対応する」とは、核酸、例えば、cfDNAが、標的領域セット中の座を起源としているか、または標的領域セットに対する1つまたは複数のプローブに特異的に結合することを意味する。
プローブまたは他のオリゴヌクレオチドおよび標的配列の文脈における「特異的に結合する」とは、適切なハイブリダイゼーション条件下において、オリゴヌクレオチドまたはプローブが、その標的配列またはその複製物にハイブリダイズして、安定なプローブ:標的ハイブリッドを形成し、同時に、安定なプローブ:非標的ハイブリッドの形成を最小限に抑えることを意味する。したがって、プローブは、非標的配列よりも十分に高い程度で、標的配列またはその複製物にハイブリダイズして、標的配列の捕捉または検出を可能にする。適切なハイブリダイゼーション条件は、当技術分野において周知であり、配列組成物に基づいて予測され得るか、または慣例的な試験方法を使用することによって決定することができる(例えば、参照により本明細書に組み込まれる、Sambrook et al., Molecular Cloning, A Laboratory Manual, 2nd ed. (Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, 1989)、§§ 1.90-1.91, 7.37-7.57, 9.47-9.51および11.47-11.57、特に、§§ 9.50-9.51, 11.12-11.13, 11.45-11.47および11.55-11.57を参照されたい)。
「配列可変標的領域セット」とは、新生物細胞(例えば、腫瘍細胞およびがん細胞)において、配列の変化、例えば、ヌクレオチド置換(すなわち、単一ヌクレオチド変異)、挿入、欠失、または遺伝子融合もしくは転位を示し得る、標的領域のセットを指す。
「エピジェネティック標的領域セット」とは、新生物細胞(例えば、腫瘍細胞およびがん細胞)において、配列とは独立した変化を示し得るか、または健康な対象に由来するcfDNAと比べて、がんを有する対象に由来するcfDNAにおいて配列とは独立した変化を示し得る、標的領域のセットを指す。配列とは独立した変化の例としては、メチル化(増加または減少)、ヌクレオソーム分布、CTCF結合、転写開始部位、および制御性タンパク質結合領域における変化が挙げられるが、これらに限定されない。本目的のために、新生物、腫瘍、またはがんに関連する局所増幅および/または遺伝子融合を受けやすい座もまた、エピジェネティック標的領域セットに含まれ得るが、これは、シーケンシングによるコピー数変化の検出または参照ゲノム内の1つを上回る座にマッピングする融合配列が、例えば、局所増幅および/または遺伝子融合の検出は1つまたは数個の個別の位置における塩基コールの正確度に依存しないため比較的浅いシーケンシング深度で検出することができるという点において、ヌクレオチド置換、挿入、または欠失の検出よりも、上記で考察された例示的なエピジェネティック変化の検出に類似する傾向にあるためである。
核酸は、腫瘍細胞を起源とする場合、「腫瘍によって産生される」またはctDNAもしくは循環腫瘍DNAによって産生される。腫瘍細胞は、それらが、腫瘍内にとどまっているか、または腫瘍から分離されているか(例えば、転移がん細胞および循環腫瘍細胞の場合にあるような)にかかわらず、腫瘍を起源とする新生物細胞である。
「メチル化」または「DNAメチル化」という用語は、核酸分子におけるヌクレオチド塩基へのメチル基の付加を指す。一部の実施形態では、メチル化は、CpG部位(シトシン-リン酸-グアニン部位(すなわち、核酸配列の5’→3’方向でシトシンの後にグアニンがある)におけるシトシンへのメチル基の付加を指す。一部の実施形態では、DNAメチル化は、アデニンへのメチル基の付加、例えば、N6-メチルアデニンにおけるものを指す。一部の実施形態では、DNAメチル化は、5-メチル化(シトシンの6炭素環の5番目の炭素の改変)である。一部の実施形態では、5-メチル化は、5-メチルシトシン(5mC)を作製するためのシトシンの5C位へのメチル基の付加を指す。一部の実施形態では、メチル化は、5mCの誘導体を含む。5mCの誘導体としては、5-ヒドロキシメチルシトシン(5-hmC)、5-ホルミルシトシン(5-fC)、および5-カルボキシルシトシン(caryboxylcytosine)(5-caC)が挙げられるが、これらに限定されない。一部の実施形態では、DNAメチル化は、3Cメチル化(シトシンの6炭素環の3番目の炭素の改変)である。一部の実施形態では、3Cメチル化は、3-メチルシトシン(3mC)を生成するためのシトシンの3C位へのメチル基の付加を含む。メチル化はまた、非CpG部位でも生じ得、例えば、メチル化は、CpA、CpT、またはCpC部位で生じ得る。DNAメチル化は、メチル化DNA領域の活性を変化させ得る。例えば、プロモーター領域内のDNAがメチル化された場合、遺伝子の転写が抑制され得る。DNAメチル化は、正常な発達に極めて重要であり、メチル化の異常は、エピジェネティック調節を破壊し得る。エピジェネティック調節における破壊、例えば、抑制は、疾患、例えば、がんを引き起こし得る。DNAにおけるプロモーターメチル化は、がんを示し得る。
「高メチル化」という用語は、核酸分子の集団(例えば、試料)内の他の核酸分子と比べて、増加したレベルまたは程度の核酸分子のメチル化を指す。一部の実施形態では、高メチル化DNAは、少なくとも1個のメチル化された残基、少なくとも2個のメチル化された残基、少なくとも3個のメチル化された残基、少なくとも5個のメチル化された残基、または少なくとも10個のメチル化された残基を含む、DNA分子を含み得る。
「低メチル化」という用語は、核酸分子の集団(例えば、試料)内の他の核酸分子と比べて、減少したレベルまたは程度の核酸分子のメチル化を指す。一部の実施形態では、低メチル化DNAには、非メチル化DNA分子が含まれる。一部の実施形態では、低メチル化DNAは、0個のメチル化された残基、多くとも1個のメチル化された残基、多くとも2個のメチル化された残基、多くとも3個のメチル化された残基、多くとも4個のメチル化された残基、または多くとも5個のメチル化された残基を含む、DNA分子を含み得る。
「メチル化感受性ヌクレアーゼ」という用語は、メチル化DNAと比べて、非メチル化DNAを優先的に切断する、ヌクレアーゼを指す。例えば、メチル化感受性ヌクレアーゼは、認識配列内の核酸塩基のうちの少なくとも1つ、例えば、シトシンのメチル化の欠如に依存する様式で、制限部位などの認識配列においてまたはその近傍で、切断し得る。一部の実施形態では、メチル化感受性ヌクレアーゼの核酸溶解活性は、標準的な核酸溶解アッセイにおいて、非メチル化認識配列に対して、メチル化対照と比べて少なくとも10倍、20倍、50倍、または100倍高い。メチル化感受性ヌクレアーゼは、メチル化感受性制限酵素を含む。
本明細書で使用される場合、「メチル化感受性制限酵素」または「MSRE」は、DNAのメチル化状態(例えば、シトシンメチル化)に感受性である、制限酵素を指し、すなわち、ヌクレオチド塩基におけるメチル基の存在または非存在により、酵素が標的DNAを切断する割合が変化する。一部の実施形態では、メチル化感受性制限酵素は、特定のヌクレオチド塩基が、認識配列においてメチル化されている場合、DNAを切断しない。例えば、HpaIIは、認識配列「CCGG」を有するメチル化感受性制限酵素であり、認識配列内の第2のシトシンがメチル化されている場合、DNAを切断しない。
本明細書で使用される場合、「メチル化状態」は、核酸分子中の特定のゲノム位置のDNA塩基(例えばシトシン)上のメチル基の存在または非存在を指すことができる。これはまた、核酸配列中のメチル化の程度(例えば、高メチル化、低メチル化、中間メチル化、または非メチル化核酸分子)も指し得る。メチル化状態はまた、特定の核酸分子においてメチル化されたヌクレオチドの数も指し得る。
本明細書で使用される場合、「突然変異」は、公知の参照配列からの変異を指し、例えば単一ヌクレオチド変異体(SNV)、および挿入または欠失(インデル)などの突然変異を含む。突然変異は、生殖系列または体細胞突然変異であり得る。一部の実施形態では、比較目的のための参照配列は、試験試料を提供する対象の種の野生型ゲノム配列、典型的にヒトゲノムである。
本明細書で使用される場合、「新生物」および「腫瘍」という用語は、互換的に使用される。それらは、対象における細胞の異常な成長を指す。新生物または腫瘍は、良性、おそらく悪性、または悪性であり得る。悪性腫瘍は、がんまたはがん様腫瘍と呼ばれる。
本明細書で使用される場合、「次世代シーケンシング」または「NGS」は、従来のサンガーおよびキャピラリー電気泳動に基づくアプローチと比較して増加した処理能力を有する、例えば一度に何十万もの比較的小さい配列読み取りデータを生成する能力を有するシーケンシングテクノロジーを指す。次世代シーケンシング技術の一部の例としては、これらに限定されないが、合成によるシーケンシング、ライゲーションによるシーケンシング、およびハイブリダイゼーションによるシーケンシングが挙げられる。一部の実施形態では、次世代シーケンシングは、単一の分子をシーケンシングすることが可能な機器の使用を含む。次世代シーケンシングを実施するための市販の機器の例としては、これらに限定されないが、NextSeq、HiSeq、NovaSeq、MiSeq、Ion PGM、およびIon GeneStudio S5が挙げられる。
本明細書で使用される場合、「核酸タグ」は、異なる試料からの核酸(例えば、試料インデックスを表す)を識別するため、異なる分配からの核酸(例えば、分配タグを表す)、または異なるタイプのもしくは異なるプロセシングを受けている同じ試料中の異なる核酸分子(例えば、分子バーコードを表す)を識別するために使用される短い核酸(例えば、長さが約500ヌクレオチド未満、約100ヌクレオチド未満、約50ヌクレオチド未満、または約10ヌクレオチド未満)を指す。核酸タグは、既定の、固定された、非ランダム、ランダム、または半ランダムオリゴヌクレオチド配列を含む。そのような核酸タグは、異なる核酸分子または異なる核酸試料もしくは部分試料を標識するために使用され得る。核酸タグは、一本鎖、二本鎖、または少なくとも部分的に二本鎖であり得る。核酸タグは、必要に応じて同じ長さまたは多様な長さを有する。核酸タグはまた、1つもしくは複数の平滑末端を有する二本鎖分子を含み、5’もしくは3’一本鎖領域(例えば、オーバーハング)を含み、および/または所定の分子内の他の場所で1つもしくは複数の他の一本鎖領域を含み得る。核酸タグは、他の核酸(例えば、増幅および/またはシーケンシングされる試料核酸)の1つの末端または両方の末端に付着させることができる。核酸タグは、所定の核酸の起源の試料、形態、またはプロセシングなどの情報を明らかにするために復号することができる。例えば、核酸タグはまた、核酸タグを検出する(例えば、読み取る)ことによって核酸がその後にデコンボリュートされる、異なる分子バーコードおよび/または試料インデックスを有する核酸を含む複数の試料のプールおよび/または並列プロセシングを可能にするためにも使用することができる。核酸タグはまた、識別子(例えば、分子識別子、試料識別子)とも呼ばれ得る。さらに、またはあるいは、核酸タグは分子識別子(例えば、異なる分子、または同じ試料もしくは部分試料中の異なる親分子のアンプリコンの間を識別するために)として使用することができる。これは、例えば、所定の試料中の異なる核酸分子を一意的にタグ付けすること、またはそのような分子を非一意的にタグ付けすることを含む。非一意的タグ付け応用の場合、限定数のタグ(すなわち、分子バーコード)を使用して、異なる分子を、少なくとも1つの分子バーコードと組み合わせてその内因性の配列情報(例えば、それらが選択された参照ゲノムにマッピングされる開始および/もしくは終止位置、配列の一方もしくは両方の末端の部分配列、ならびに/または配列の長さ)に基づいて識別することができるように、各核酸分子をタグ付けしてもよい。典型的に、任意の2つの分子が同じ内因性の配列情報(例えば、開始および/もしくは終止位置、配列の一方もしくは両方の末端の部分配列、ならびに/または長さ)を有し得る確率、同様に同じ分子バーコードを有し得る確率が低くなるように(例えば、約10%未満、約5%未満、約1%未満、または約0.1%未満の見込み)、十分数の異なる分子バーコードを使用する。
本明細書で使用される場合、「分配すること」とは、核酸分子の特徴に基づいて、試料中の核酸分子の混合物を物理的に分離または分画することを指す。分配は、分子の物理的分配であり得る。分配は、核酸分子を、エピジェネティック特色(例えば、メチル化に関する)のレベルに基づいて、群またはセットに分離することを含み得る。例えば、核酸分子は、核酸分子のメチル化のレベルに基づいて、分配することができる。一部の実施形態では、分配に使用される方法およびシステムは、PCT特許出願第PCT/US2017/068329号に見出すことができ、これは、参照によりその全体が本明細書に組み込まれる。
本明細書で使用される場合、「分配セット」または「分配」は、核酸分子または核酸分子と会合したタンパク質の結合剤への差次的結合親和性に基づいてセットまたは群に分配された、核酸分子のセットを指す。分配セットはまた、部分試料とも称され得る。結合剤は、エピジェネティック改変を有するヌクレオチドを含む核酸分子に優先的に結合する。例えば、エピジェネティック改変がメチル化である場合、結合剤は、メチル結合ドメイン(MBD)タンパク質であり得る。一部の実施形態では、分配セットは、特定のエピジェネティック特色(例えば、メチル化)のレベルまたは程度に属する核酸分子を含み得る。例えば、核酸分子は、高度メチル化核酸分子の1つのセット(第1の部分試料、高分配、高分配セット、または高メチル化分配セット)、低メチル化核酸分子の第2のセット(第2の部分試料、低分配、低分配セット、または低メチル化分配セット)、および中間メチル化核酸分子の第3のセット(第3の部分試料、中間分配セット、中間メチル化分配セット、残留分配セット、または残留分配)の3つのセットに分配され得る。別の例では、核酸分子は、メチル化ヌクレオチドの数に基づいて、分配され得、1つの分配セットは、9個のメチル化ヌクレオチドを有する核酸分子を有し得、別の分配セットは、非メチル化核酸分子(0個のメチル化ヌクレオチド)を有し得る。
本明細書で使用される場合、「ポリヌクレオチド」、「核酸」、「核酸分子」、または「オリゴヌクレオチド」は、ヌクレオシド間の連結によって接合したヌクレオシド(デオキシリボヌクレオシド、リボヌクレオシド、またはそのアナログを含む)の線形ポリマーを指す。典型的に、ポリヌクレオチドは、少なくとも3つのヌクレオシドを含む。オリゴヌクレオチドはしばしば、少数の単量体単位、例えば3~4から数百もの単量体単位のサイズの範囲である。ポリヌクレオチドが文字の配列、例えば「ATGCCTG」によって表される場合は必ず、ヌクレオチドは、左から右に5’→3’の順であり、DNAの場合、特に記載されていない限り、「A」はデオキシアデノシンを示し、「C」は、デオキシシチジンを示し、「G」は、デオキシグアノシンを示し、「T」は、デオキシチミジンを示す。文字A、C、G、およびTは、塩基そのもの、ヌクレオシド、または塩基を含むヌクレオチドを指すために使用され得る。
本明細書で使用される場合、「プロセシング」は、シーケンシングにとって好適である核酸のライブラリーを生成するために使用されるステップのセットを指す。ステップのセットは、これらに限定されないが、分配するステップ、末端修復するステップ、シーケンシングアダプターの付加、タグ付けするステップ、および/または核酸のPCR増幅を含み得る。
本明細書で使用される場合、「定量的測定」は、絶対的または相対的測定を指す。定量的測定は、これらに限定されないが、数、統計学的測定(例えば、頻度、平均値、中央値、標準偏差、または分位数)、または程度もしくは相対的数量(例えば、高、中、および低)であり得る。定量的測定は、2つの定量的測定の比であり得る。定量的測定は、定量的測定の線形の組合せであり得る。定量的測定は正規化した測定であり得る。
本明細書で使用される場合、「参照配列」は、実験によって決定した配列と比較する目的のために使用される公知の配列を指す。例えば、公知の配列は、全ゲノム、染色体、またはその任意のセグメントであり得る。参照配列は、ゲノム、もしくは染色体、もしくは染色体アームの単一の連続する配列と整列することができるか、またはゲノムもしくは染色体の異なる領域と整列する非連続セグメントを含み得る。参照配列の例としては、例えばヒトゲノム、例えばhg19およびhg38が挙げられる。
本明細書で使用される場合、「制限酵素」は、特異的認識部位またはその付近でDNAを認識し、切断する酵素である。
本明細書で使用される場合、「試料」は、本明細書に開示される方法および/またはシステムによって解析されることが可能な任意のものを意味する。
本明細書で使用される場合、「シーケンシング」は、生体分子、例えばDNAまたはRNAなどの核酸の配列(例えば、同一性および単量体単位の順序)を決定するために使用されるいくつかのテクノロジーのいずれかを指す。シーケンシング方法の例としては、これらに限定されないが、標的化シーケンシング、一分子リアルタイムシーケンシング、エクソンまたはエクソームシーケンシング、イントロンシーケンシング、電子顕微鏡に基づくシーケンシング、パネルシーケンシング、トランジスタ媒介シーケンシング、直接シーケンシング、ランダムショットガンシーケンシング、サンガージデオキシターミネーションシーケンシング、全ゲノムシーケンシング、ハイブリダイゼーションによるシーケンシング、パイロシーケンシング、二重鎖シーケンシング、サイクルシーケンシング、一塩基伸長シーケンシング、固相シーケンシング、ハイスループットシーケンシング、超並列シグネチャーシーケンシング、エマルジョンPCR、より低い変性温度での同時増幅-PCR(COLD-PCR)、マルチプレックスPCR、可逆的色素ターミネーターによるシーケンシング、ペアードエンドシーケンシング、ニアターム(near-term)シーケンシング、エキソヌクレアーゼシーケンシング、ライゲーションによるシーケンシング、ショートリードシーケンシング、一分子シーケンシング、合成によるシーケンシング、リアルタイムシーケンシング、リバースターミネーターシーケンシング、ナノポアシーケンシング、454シーケンシング、Solexa Genome Analyzerシーケンシング、SOLiD(商標)シーケンシング、MS-PETシーケンシング、およびそれらの組合せが挙げられる。一部の実施形態では、シーケンシングは、遺伝子アナライザー、数ある中でも例えばIllumina,Inc.、Pacific Biosciences,Inc.、またはApplied Biosystems/Thermo Fisher Scientificなどから市販されている遺伝子アナライザーによって実施され得る。
本明細書で使用される場合、核酸ポリマーの文脈における「配列情報」は、そのポリマーにおける単量体単位(例えば、ヌクレオチドなど)の順序および同一性を意味する。
本明細書で使用される場合、「配列可変標的領域セット」とは、新生物細胞(例えば、腫瘍細胞およびがん細胞)において、配列の変化、例えば、ヌクレオチド置換、挿入、欠失、または遺伝子融合もしくは転位を示し得る、標的領域のセットを指す。
本明細書で使用される場合、「体細胞突然変異」または「体細胞変異」という用語は、互換的に使用される。それらは、受胎後に起こるゲノムの突然変異を指す。体細胞突然変異は、生殖細胞を除く体の任意の細胞で起こり得、したがって子孫に受け継がれない。
本明細書で使用される場合、プローブまたは他のオリゴヌクレオチドおよび標的配列の文脈における「特異的に結合する」は、適切なハイブリダイゼーション条件下で、オリゴヌクレオチドまたはプローブがその標的配列またはその複製物にハイブリダイズして安定なプローブ:標的ハイブリッドを形成するが、同時に安定なプローブ:非標的ハイブリッドの形成は最小限であることを意味する。このように、プローブは、非標的配列に対してよりも十分に大きい程度に標的配列またはその複製物にハイブリダイズして、標的配列の捕捉または検出を可能にする。適切なハイブリダイゼーション条件は、当技術分野で周知であり、配列組成に基づいて予測され得るか、または通常の試験方法を使用することにより決定され得る(例えば、参照により本明細書に組み込まれる、Sambrook et al., Molecular Cloning, A Laboratory Manual, 2nd ed.(Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, 1989)§§ 1.90-1.91, 7.37-7.57, 9.47-9.51および11.47-11.57、特に§§ 9.50-9.51, 11.12-11.13, 11.45-11.47および11.55-11.57を参照されたい)。
本明細書で使用される場合、「対象」は、動物、例えば哺乳動物種(例えば、ヒト)、または鳥類(例えば、鳥)種、または他の生物、例えば植物を指す。より具体的には、対象は脊椎動物、例えば哺乳動物、例えばマウス、霊長類、サル、またはヒトであり得る。動物は、農場動物(例えば、肉牛、乳牛、家禽、ウマ、ブタなど)、競技用動物、およびコンパニオン動物(例えば、ペットまたは介助動物)を含む。対象は、健康な個体、疾患もしくは疾患に対する素因を有するもしくは有することが疑われる個体、または治療を必要とするもしくは治療を必要とすることが疑われる個体であり得る。「個体」または「患者」という用語は、「対象」と互換的であると意図される。例えば、対象は、がんを有すると診断されている、がん治療を受ける予定である、および/または少なくとも1つのがん治療を受けたことがある個体であり得る。対象はがんの寛解期にあり得る。別の例として、対象は、自己免疫疾患を有すると診断された個体であり得る。別の例として、対象は、疾患、例えばがん、自己免疫疾患を有すると診断されているまたは有することが疑われ得る、妊娠中であるまたは妊娠を計画している女性個体であり得る。
本明細書で使用される場合、「標的領域セット」または「標的領域のセット」、または「標的領域」、または「目的の標的領域」、または「目的の領域」、または「目的のゲノム領域」は、捕捉のために標的化されるおよび/またはプローブのセットによって標的化される(例えば、配列相補性を通して)複数のゲノム座または複数のゲノム領域を指す。
本明細書で使用される場合、「腫瘍分画」は、所定の試料または試料-領域対に関する、腫瘍細胞を起源とするcfDNA分子の割合を指す。
「またはその組合せ」(単数および複数)という用語は、本明細書で使用される場合、用語の前に列挙される用語のあらゆる全ての順列および組合せを指す。例えば、「A、B、C、またはそれらの組合せ」は、A、B、C、AB、AC、BC、またはABCのうちの少なくとも1つを含むと意図され、特定の文脈において順序が重要である場合、BA、CA、CB、ACB、CBA、BCA、BAC、またはCABも含むと意図される。この例を続けると、1つまたは複数の項目または用語の反復、例えばBB、AAA、AAB、BBC、AAABCCCC、CBBAAA、CABABBなどを含有する組合せが明白に含まれる。当業者は、文脈から特に明白でない限り、典型的に任意の組合せにおける項目または用語の数に制限はないことを理解するであろう。
「または」は、包括的な意味で使用され、すなわち文脈が特に必要としていない限り、「および/または」と等価である。
B.例示的な方法
1.概要
B.例示的な方法
1.概要
がんの形成および進行は、デオキシリボ核酸(DNA)の遺伝子改変およびエピジェネティック特色の両方から生じ得る。本開示は、無細胞DNA(cfDNA)などのDNAを解析するための方法およびシステムを提供する。本開示は、メチル化分配アッセイのシグナル対ノイズ比を低減するための方法およびシステムを提供する。
いかなる特定の理論にも拘束されることを望まないが、がんまたは新生物におけるまたはその周囲の細胞は、健康な対象における同じ組織タイプの細胞よりも多くのDNAを脱落させ得る。そのため、ある特定のDNA試料、例えばcfDNAの起源の組織の分布は、発癌の際に変化し得る。このため、例えば、少なくとも1つの他の組織タイプよりも健康なcfDNAにおいて低いメチル化を示す高メチル化可変標的領域のレベルの増加は、がんの存在(または対象の既往に応じて再発)の指標であり得る。同様に、試料中の低メチル化可変標的領域のレベルの増加は、がんの存在(または対象の既往に応じて再発)の指標であり得る。
さらに、がんは、メチル化などの非配列改変によって示され得る。がんにおけるメチル化変化の例としては、正常な成長の制御、DNA修復、細胞周期調節、および/または細胞分化に関係する遺伝子のTSSでCpGアイランドにおけるDNAメチル化の局所増加が挙げられる。この高メチル化は、関係する遺伝子の転写能の異常な喪失に関連し得、変更された遺伝子発現の原因としての点突然変異および欠失と少なくとも同程度の頻度で起こる。
したがって、DNAメチル化プロファイリングを使用して、試料のDNAにおける異常なメチル化を検出することができる。DNAは、所与の試料タイプ(例えば、血流に由来するcfDNA)において通常高メチル化または低メチル化されているが、例えば、その試料タイプへの組織の寄与が異常に増加しているために(例えば、新生物もしくはがんにおけるまたはその周囲のDNAの脱落の増加に起因して)、および/または発達中に変更されるか、もしくは疾患、例えば、がんもしくは任意のがん関連疾患によって乱れる、ゲノムのメチル化の程度から、新生物またはがんと相関する異常なメチル化の程度を示し得る、ある特定のゲノム領域(「差次的にメチル化された領域」または「DMR」)に対応し得る。
一部の実施形態では、DNAメチル化は、CpG部位(シトシン-リン酸-グアニン部位(すなわち、核酸配列の5’→3’方向にシトシンの後にグアニン)でのシトシン残基へのメチル基の付加を含む。一部の実施形態では、DNAメチル化は、例えばN6-メチルアデニンの場合のように、アデニン残基へのメチル基の付加を含む。一部の実施形態では、DNAメチル化は5-メチル化(シトシンの6-炭素環の5番目の炭素の改変)である。一部の実施形態では、5-メチル化は、5-メチルシトシン(m5cまたは5-mCまたは5mC)を作製するためのシトシン残基の5C位へのメチル基の付加を含む。一部の実施形態では、メチル化は、m5cの誘導体を含む。m5cの誘導体としては、これらに限定されないが、5-ヒドロキシメチルシトシン(5-hmCまたは5hmC)、5-ホルミルシトシン(5-fC)、および5-カルボキシルシトシン(5-caC)が挙げられる。一部の実施形態では、DNAメチル化は3Cメチル化(シトシン残基の6-炭素環の3番目の炭素の改変)である。一部の実施形態では、3Cメチル化は、3-メチルシトシン(3mC)を生成するためのシトシン残基の3C位へのメチル基の付加を含む。メチル化はまた、非CpG部位でも起こり得、例えばメチル化は、CpA、CpT、またはCpC部位で起こり得る。DNAメチル化は、メチル化DNA領域の活性を変化させることができる。例えば、プロモーター領域のDNAがメチル化される場合、遺伝子の転写は抑制され得る。DNAメチル化は、正常な発達にとって極めて重要であり、メチル化の異常はエピジェネティック調節を破壊し得る。エピジェネティック調節の破壊、例えば抑制は、がんなどの疾患を引き起こし得る。DNAにおけるプロモーターのメチル化はがんを示し得る。
メチル化プロファイリングは、ゲノムの異なる領域にわたるメチル化パターンを決定することを含み得る。例えば、メチル化の程度(例えば、分子あたりのメチル化ヌクレオチドの相対数)に基づいて分子を分配およびシーケンシングした後、異なる分配中の分子の配列を参照ゲノムにマッピングすることができる。これは、他の領域と比較してより高度にメチル化されるか、またはあまり高度にメチル化されないゲノムの領域を示すことができる。このようにして、ゲノム領域は、個々の分子と対比するとメチル化の程度が異なり得る。
一部の実施形態では、メチル化プロファイリングから得られたシグナルを、体細胞変異(例えば、SNV、インデル、CNV、および遺伝子融合)から得られたシグナルと組み合わせることにより、がんの検出が容易となる。
試料中の核酸分子は、核酸分子のメチル化状態に基づいて、分画または分配され得る。試料中の核酸分子を分配することにより、希少なシグナルが増加し得る。例えば、高メチル化DNAに存在するが、低メチル化DNAにはあまり(またはまったく)存在しない、遺伝的変異は、試料を、高メチル化核酸分子と低メチル化核酸分子とに分配することによって、より容易に検出することができる。試料の複数の分画を解析することによって、単一分子の多次元解析を行うことができ、したがって、より高い感度を達成することができる。分配は、核酸分子を、1つまたは複数のメチル化ヌクレオチドの存在または非存在に基づいて、サブセットまたは群に物理的に分配することを含み得る。試料は、差次的遺伝子発現または疾患状態を示す特徴に基づいて、1つまたは複数の分配セットに分画または分配され得る。試料は、核酸、例えば、無細胞DNA(「cfDNA」)、非cfDNA、腫瘍DNA、循環腫瘍DNA(「ctDNA」)、および無細胞核酸(「cfNA」)の解析中に、正常状態および罹患状態の間でシグナルに相違をもたらす特徴またはその組合せに基づいて、分画され得る。
分配する手順は、部分試料間で、DNA分子の不完全な選別をもたらす場合がある。例えば、第2の部分試料中の分子のうちの少数部分は、高度に改変されていてもよく(例えば、高メチル化)、および/または第1の部分試料中の分子のうちの少数部分は、改変されていないかもしくはほとんど改変されていなくてもよい(例えば、非メチル化であるかもしくはほとんど非メチル化である)。第2の部分試料中の高度に改変された分子および第1の部分試料中の改変されていないかほとんど改変されていない分子は、非特異的に分配されると考えられる。本明細書に記載される方法は、非特異的に分配されたDNAに由来する技術的ノイズを、例えば、非特異的に分配されたDNAをシーケンシングの後に同定することができるようにある特定の塩基を変換することによって、および/またはそれを分解することによって、低減させることができるステップを含む。したがって、本明細書に記載される方法は、改善された感度および/または合理化された解析を提供し得る。
図1は、例えば、cfDNA試料で開始する、本開示のある特定の実施形態による、がんの存在または非存在を検出するための例示的なワークフローを図示し、ここで、cfDNAを、血液試料から単離し、cfDNA試料は、高メチル化可変標的領域(高DMR)に属するcfDNA分子および低メチル化可変標的領域(低DMR)に属するcfDNA分子、ならびに非メチル化対照領域に属するcfDNA分子を含む。cfDNAは、メチル結合ドメインタンパク質(MBD)を使用して、低メチル化部分試料および高メチル化部分試料に分配され、各部分試料を、分子バーコード化に供して、部分試料に由来するDNAを識別可能にタグ付けし、低部分試料、および必要に応じて高部分試料を、変換手順に供して、非特異的に分配された分子の同定を容易にし、次いで、分配セットをプールし、捕捉し、増幅させ、シーケンシングする。低部分試料で使用される変換手順は、mCの塩基対形成特異性を変化させるが、非メチル化Cには影響を及ぼさない変換手順、例えば、TAPであり得る。使用される場合、高試料の変換手順は、Cの塩基対形成特異性を変化させるが、mCには影響を及ぼさない変換手順、例えば、EMであり得る。
図2は、対象から得られた試料中の核酸分子のメチル化状態を決定するための方法200の例としての実施形態を図示する。202において、ポリヌクレオチド試料を、対象から得る。一部の実施形態では、試料は、腫瘍組織生検から得られたDNA試料である。一部の実施形態では、試料は、血液から得られた無細胞DNA(cfDNA)試料である。204において、ポリヌクレオチド試料を、少なくとも2つの分配セット(部分試料)に分配する。一部の実施形態では、分配は、メチル化ヌクレオチドを含むポリヌクレオチドに優先的に結合する結合剤に対するポリヌクレオチドの差次的結合親和性に基づいて、核酸分子を分配することを含む。
206において、少なくとも1つの分配セット、例えば、第2の部分試料(低メチル化分配)内の核酸分子は、塩基変換手順、すなわち、第2の部分試料のDNA内の第1の核酸塩基に対してDNA内の第2の核酸塩基とは異なって影響を及ぼす手順に供され、第1の核酸塩基は改変または非改変核酸塩基であり、第2の核酸塩基は第1の核酸塩基とは異なる改変または非改変核酸塩基であり、第1の核酸塩基および第2の核酸塩基は同じ塩基対形成特異性を有し、それによって処置された部分試料を産生する。様々な変換手順が、本明細書に記載されている。一部の実施形態では、変換手順は、メチル化シトシンを異なる核酸塩基に変換する。第1および第2の部分試料が変換手順に供される場合、手順は、同じであっても異なってもよい。一部の実施形態では、第1の部分試料は、メチル化シトシンを異なる核酸塩基に変換する手順に供され、第2の部分試料は、非メチル化シトシンを異なる核酸塩基に変換する手順に供される。
一部の実施形態では、変換の前に、少なくとも1つのアダプターを、核酸分子の少なくとも一方の末端(すなわち、DNA分子の5’および/または3’末端)に付着させる。他の実施形態では、消化の後であるが、208において富化する前に、少なくとも1つのアダプターを、核酸分子の少なくとも一方の末端に付着させる。一部の実施形態では、アダプターは、例えば、非メチル化であるヌクレオチドまたは適切なヌクレオチドアナログの存在に起因して、変換手順による変換に抵抗性である。
208において、変換の後に、1つまたは複数の分配セット中の核酸分子は、目的のゲノム領域に関して富化することができる。あるいは、富化ステップは、分配するステップの前に行うことができる。一部の実施形態では、目的のゲノム領域は、がんの検出のために差次的にメチル化された領域(例えば、高メチル化可変標的領域セットおよび/または低メチル化可変標的領域セット)を含み得る。210において、富化された分子の少なくともサブセットを、次世代シーケンサーによってシーケンシングする。212において、シーケンサーによって生成されたシーケンシング読み取りデータを、次いで、バイオインフォマティックツール/アルゴリズムを使用して解析して、1つまたは複数の分配セット中の分子の数を決定し、次にこれを使用して、少なくとも1つの分配セット中の核酸分子の1つまたは複数の遺伝子座でのメチル化状態を決定する。一部の実施形態では、1つまたは複数の遺伝子座は、複数の遺伝子座を含み得る。一部の実施形態では、1つまたは複数の遺伝子座は、1つまたは複数のゲノム領域を含み得る。一部の実施形態では、ゲノム領域は、遺伝子のプロモーター領域であり得る。一部の実施形態では、シーケンシングの前に、核酸分子を、PCR増幅によって増幅することができる。一部の実施形態では、増幅において使用されるプライマーは、少なくとも1つの試料インデックスを含み得る。
図3は、本開示の実施形態による、対象から得られた試料中の核酸分子のメチル化状態を決定するための方法300の例としての実施形態を図示する。302において、ポリヌクレオチド試料を、対象から得る。一部の実施形態では、ポリヌクレオチド試料は、腫瘍組織生検から得られたDNA試料である。一部の実施形態では、ポリヌクレオチド試料は、血液から得られた無細胞DNA(cfDNA)試料である。304において、ポリヌクレオチド試料を、少なくとも2つの分配セットに分配する。一部の実施形態では、分配は、メチル化ヌクレオチドを含むポリヌクレオチドに優先的に結合する結合剤に対するポリヌクレオチドの差次的結合親和性に基づいて、核酸分子を分配することを含む。結合剤の例としては、メチル結合ドメイン(MBD)、メチル結合タンパク質(MBP)、およびメチル化ヌクレオチドに対する抗体が挙げられるがこれらに限定されず、これらは、本明細書の他の箇所において詳細に考察されている。
306において、1つまたは複数の分配セット中の核酸分子を、アダプターに付着させ、アダプターは、少なくとも1つのタグを含み、核酸分子の少なくとも一方の末端(すなわち、DNA分子の5’および/3’末端)に付着させられる。一部の実施形態では、タグが、アダプターの構成要素として提供され得る。一部の実施形態では、タグは、分子バーコード(すなわち、分子識別子)を含む。一部の実施形態では、一方の分配セット中の核酸分子に付着させられるタグは、他方の分配セット中の核酸分子に付着させられるタグとは異なる。一部の実施形態では、一方の分配セットは、他方の分配セットとは差次的にタグ付けされる。分配セットの差次的タグ付けは、特定の分配セットに属する核酸分子を追跡し続けるのを補助する。異なる分配セット中の核酸分子は、一方の分配セットのメンバーを別のものと識別することが可能な異なるタグを受容する。同じ分配セットの核酸分子に連結されるタグは、互いに同じであっても、異なってもよい。しかし、互いに異なる場合、タグは、それらが付着した分子を、特定の分配セットのものであるとして同定するように、共通した配列の部分を有し得る。例えば、試料の分子が、P1およびP2の2つの分配セットに分配される場合には、P1内の分子は、A1、A2、A3などでタグ付けされ得、P2内の分子は、B1、B2、B3、などでタグ付けされ得る。そのようなタグ付けシステムにより、分配セット、および分配セット内の分子間で、識別することが可能となる。一部の実施形態では、タグは、分配タグ(すなわち、分配識別子)を含む。そのような実施形態では、分配セット内の核酸分子は、同じ分配タグを受容し、これは、他の分配セットの核酸分子に付着させられる分配タグとは異なる。
308において、少なくとも1つの分配セット、例えば、第2の部分試料(低メチル化分配)内の核酸分子は、塩基変換手順、すなわち、第2の部分試料のDNA内の第1の核酸塩基に対してDNA内の第2の核酸塩基とは異なって影響を及ぼす手順に供され、第1の核酸塩基は改変または非改変核酸塩基であり、第2の核酸塩基は第1の核酸塩基とは異なる改変または非改変核酸塩基であり、第1の核酸塩基および第2の核酸塩基は同じ塩基対形成特異性を有し、それによって処置された部分試料を産生する。様々な変換手順が、本明細書に記載されている。一部の実施形態では、変換手順は、メチル化シトシンを異なる核酸塩基に変換する。第1および第2の部分試料が変換手順に供される場合、手順は、同じであっても異なってもよい。一部の実施形態では、第1の部分試料は、メチル化シトシンを異なる核酸塩基に変換する手順に供され、第2の部分試料は、非メチル化シトシンを異なる核酸塩基に変換する手順に供される。
一部の実施形態では、アダプターは、塩基変換手順による変換に対して抵抗性である。一部の実施形態では、第2の部分試料に付着したアダプターは、非メチル化であるヌクレオチドを含むか、またはそれからなる。一部の実施形態では、第1の部分試料に付着したアダプターは、メチル化ヌクレオチドを含む。一部の実施形態では、アダプターは、メチル化依存性制限酵素に対して抵抗性の1つまたは複数のヌクレオチドアナログを含む。
310において、変換の後に、1つまたは複数の分配セット中の核酸分子は、目的のゲノム領域に関して富化することができる。あるいは、富化ステップは、分配するステップの前に行うことができる。一部の実施形態では、目的のゲノム領域は、がん検出のために差次的にメチル化された領域を含み得る。312において、富化された分子の少なくともサブセットを、次世代シーケンサーによってシーケンシングする。314において、シーケンサーによって生成されたシーケンシング読み取りデータを、次いで、バイオインフォマティックツール/アルゴリズムを使用して解析して、1つまたは複数の分配セット中の分子の数を決定し、次にこれを使用して、少なくとも1つの分配セット中の核酸分子の1つまたは複数の遺伝子座でのメチル化状態を決定する。一部の実施形態では、1つまたは複数の遺伝子座は、複数の遺伝子座を含み得る。一部の実施形態では、1つまたは複数の遺伝子座は、1つまたは複数のゲノム領域を含み得る。一部の実施形態では、ゲノム領域は、遺伝子のプロモーター領域であり得る。一部の実施形態では、シーケンシングの前に、核酸分子を、PCR増幅によって増幅することができる。一部の実施形態では、増幅において使用されるプライマーは、少なくとも1つの試料インデックスを含み得る。
一部の実施形態では、方法は、例えば、少なくとも1つの分配セット中の核酸分子の1つまたは複数の遺伝子座でのメチル化状態に基づいて、対象におけるがんの存在または非存在を検出するステップをさらに含み得る。一部の実施形態では、方法は、ポリヌクレオチド試料における腫瘍細胞に由来するDNAのレベルを決定するステップをさらに含む。
2.試料を複数の部分試料に分配する;試料の態様
2.試料を複数の部分試料に分配する;試料の態様
本明細書に記載されるある特定の実施形態では、異なる形態の核酸の集団(例えば、試料中の高メチル化および低メチル化DNA、例えば、cfDNA)は、さらなる解析、例えば、ヌクレアーゼと接触させ、核酸塩基を差次的に改変もしくは単離し、タグ付けし、および/またはシーケンシングする前に、核酸の1つまたは複数の特徴に基づいて、物理的に分配され得る。このアプローチを使用して、例えば、ある特定の配列が、高メチル化であるかまたは低メチル化であるかを決定することができる。さらに、不均一な核酸集団を分配することによって、例えば、集団の1つの分画(または分配)により多く存在する希少な核酸分子を富化することにより、希少なシグナルを増加させることができる。例えば、高メチル化DNAに存在するが、低メチル化DNAにはあまり(またはまったく)存在しない、遺伝的変異は、試料を、高メチル化核酸分子と低メチル化核酸分子とに分配することによって、より容易に検出することができる。試料の複数の分画を解析することによって、核酸のゲノムまたは種の単一の座の多次元解析を行うことができ、したがって、より高い感度を達成することができる。
一部の例では、不均一な核酸試料は、2つまたはそれよりも多くの分配(例えば、少なくとも3つ、4つ、5つ、6つ、または7つの分配)に分配される。試料の分配は、本明細書において、部分試料とも称される。一部の実施形態では、各分配は、差次的にタグ付けされる。タグ付けされた分配は、次いで、集合的試料調製および/またはシーケンシングのために、一緒にプールされ得る。分配-タグ付け-プーリングのステップは、1回を上回って行われ得、各回の分配は、異なる特徴(例は本明細書に提供されている)に基づいて行われ、他の分配および分配手段と識別される差次的タグを使用してタグ付けされる。
分配に使用することができる特徴の例としては、配列の長さ、メチル化レベル、ヌクレオソーム結合、配列ミスマッチ、免疫沈降、および/またはDNAに結合するタンパク質が挙げられる。結果として得られる分配は、以下の核酸形態のうちの1つまたは複数を含み得る:一本鎖DNA(ssDNA)、二本鎖DNA(dsDNA)、より短いDNA断片、およびより長いDNA断片。一部の実施形態では、シトシン改変(例えば、シトシンメチル化)またはメチル化に基づく分配が一般に行われ、必要に応じて、前述のDNAの特徴または形態のうちのいずれかに基づき得る少なくとも1つの追加の分配するステップと組み合わされる。一部の実施形態では、不均一な核酸集団は、1つまたは複数のエピジェネティック改変を有する核酸および1つまたは複数のエピジェネティック改変を有さない核酸に分配される。エピジェネティック改変の例としては、メチル化の存在または非存在;メチル化のレベル;メチル化のタイプ(例えば、5-メチルシトシン対他のタイプのメチル化、例えば、アデニンメチル化および/またはシトシンヒドロキシメチル化)、ならびに1つまたは複数のタンパク質、例えばヒストンとの会合および会合のレベルが挙げられる。あるいはまたはさらに、不均一な核酸集団は、ヌクレオソームと会合した核酸分子およびヌクレオソームが欠如した核酸分子に分配され得る。あるいはまたはさらに、不均一な核酸集団は、一本鎖DNA(ssDNA)および二本鎖DNA(dsDNA)に分配してもよい。あるいはまたはさらに、不均一な核酸集団は、核酸の長さ(例えば、最大で160bpの分子および160bpより長い長さを有する分子)に基づいて分配してもよい。
一部の例では、各分配(異なる核酸形態を表す)は、差次的に標識され、分配は、シーケンシングする前に一緒にプールされる。他の例では、異なる形態は、別個にシーケンシングされる。
一部の実施形態では、異なる核酸の集団は、2つまたはそれよりも多くの異なる分配に分配される。各分配は、異なる核酸形態を表し、第1の分配(部分試料とも称される)は、第2の部分試料よりも高い割合でシトシン改変を有するDNAを含む。各分配は、明確にタグ付けされる。第1の部分試料は、第1の部分試料のDNA内の第1の核酸塩基に対してDNA内の第2の核酸塩基とは異なって影響を及ぼす手順に供され、第1の核酸塩基は、改変または非改変核酸塩基であり、第2の核酸塩基は、第1の核酸塩基とは異なる改変または非改変核酸塩基であり、第1の核酸塩基および第2の核酸塩基は、同じ塩基対形成特異性を有する。タグ付けされた核酸は、シーケンシングの前に一緒にプールされる。配列読み取りデータを得、例えば、第1の部分試料のDNAにおいて第1の核酸塩基を第2の核酸塩基と識別するために、in silicoで解析する。タグを使用して、異なる分配に由来する読み取りデータを選別する。遺伝的変異体を検出するための解析は、分配ごとのレベル、ならびに全核酸集団レベルで行われ得る。例えば、解析は、各分配中の核酸における遺伝的変異体、例えば、CNV、SNV、インデル、融合を決定するためのin silico解析を含み得る。一部の例では、in silico解析は、クロマチン構造を決定することを含み得る。例えば、配列読み取りデータのカバレッジを使用して、クロマチンにおけるヌクレオソームの位置付けを決定することができる。より高いカバレッジは、ゲノム領域におけるより高いヌクレオソーム占有率と相関し、一方でより低いカバレッジは、より低いヌクレオソーム占有率またはヌクレオソーム枯渇領域(NDR)と相関し得る。
試料は、ヌクレオチドに対する複製後改変を含む改変、および通常は非共有結合による1つまたは複数のタンパク質への結合が異なる核酸を含み得る。
一実施形態では、核酸の集団は、新生物、腫瘍、もしくはがんを有することが疑われる対象、または新生物、腫瘍、もしくはがんを有すると以前に診断されている対象に由来する血清、血漿、または血液試料から得られたものである。核酸の集団は、様々なレベルのメチル化を有する核酸を含む。メチル化は、任意の1つまたは複数の複製後または転写改変により生じ得る。複製後改変は、ヌクレオチドシトシンの改変、特に、核酸塩基の5位におけるもの、例えば、5-メチルシトシン、5-ヒドロキシメチルシトシン、5-ホルミルシトシン、および5-カルボキシルシトシンを含む。
親和性剤は、所望の特異性を有する抗体、天然の結合パートナーもしくはその変異体(Bock et al., Nat Biotech 28: 1106-1114 (2010)、Song et al., Nat Biotech 29: 68-72 (2011))、または例えばファージディスプレイによって所与の標的に対する特異性を有するように選択された人工ペプチドであり得る。
本明細書において企図される捕捉部分の例としては、本明細書に記載されるメチル結合ドメイン(MBD)およびメチル結合タンパク質(MBP)が挙げられ、これには、タンパク質、例えば、MeCP2、MBD、例えば、MBD2、ならびに5-メチルシトシンに優先的に結合する抗体が挙げられる。抗体を使用してメチル化DNAを免疫沈降する場合、メチル化DNAは、一本鎖形態で回収され得る。そのような実施形態では、第2の鎖を合成することができる。高メチル化(および必要に応じて中間メチル化)部分試料は、次いで、半メチル化DNAを切断しないメチル化感受性ヌクレアーゼ、例えば、HpaII、BstUI、またはHin6iと接触させられ得る。あるいはまたはさらに、低メチル化(および必要に応じて、中間メチル化)部分試料は、次いで、半メチル化DNAを切断するメチル化依存性ヌクレアーゼと接触させられ得る。
同様に、異なる形態の核酸を分配するステップは、ヒストンに結合した核酸を遊離または非結合の核酸から分離することができるヒストン結合タンパク質を使用して行うことができる。本明細書に開示される方法において使用することができるヒストン結合タンパク質の例としては、RBBP4、RbAp48、およびSANTドメインペプチドが挙げられる。
一部の親和性剤および改変に関して、作用剤への結合は、核酸が改変を有するかどうかに応じて、本質的に全か無かの様式で生じ得るが、分離は、程度に応じたものであってもよい。そのような例では、改変が過剰発現する核酸は、改変が過少発現する核酸よりも高い程度で、作用剤に結合する。あるいは、改変を有する核酸は、全か無かの様式で結合し得る。しかし、次いで、様々なレベルの改変は、結合剤から逐次的に溶出されてもよい。
例えば、一部の実施形態では、分配は、バイナリであり得るか、または改変の程度/レベルに基づき得る。例えば、全てのメチル化断片は、メチル結合ドメインタンパク質(例えば、MethylMinder Methylated DNA Enrichment Kit(ThermoFisher Scientific)を使用して、非メチル化断片から分配することができる。続いて、さらなる分配には、メチル結合ドメインおよび結合断片を有する溶液中の塩濃度を調整することによって、異なるレベルのメチル化を有する断片を溶出することが含まれ得る。塩濃度が増加するにつれ、より高いメチル化レベルを有する断片が溶出される。
一部の例では、最終的な分配は、異なる程度の改変(改変の過剰発現または過少発現)を有する核酸を表す。過剰発現および過少発現は、集団において鎖あたりの改変の中央値数と比べた、核酸が有する改変の数によって定義され得る。例えば、試料中の核酸における5-メチルシトシン残基の中央値数が2である場合、2つより多くの5-メチルシトシン残基を含む核酸は、この改変が過剰発現しており、1または0個の5-メチルシトシン残基を有する核酸は、過少発現している。親和性分離の効果は、結合相で改変が過剰発現している核酸および非結合相(すなわち、溶液中)で改変が過少発現している核酸を富化することである。結合相内の核酸は、後続のプロセシングの前に溶出することができる。
MethylMiner Methylated DNA Enrichment Kit(ThermoFisher Scientific)を使用する場合、様々なレベルのメチル化を、逐次溶出を使用して分配することができる。例えば、低メチル化分配(メチル化なし)は、核酸集団を、磁気ビーズに付着した、キットからのMBDと接触させることによって、メチル化分配から分離することができる。ビーズを使用して、メチル化核酸を、非メチル化核酸から分離する。続いて、1つまたは複数の溶出ステップを逐次的に行って、異なるレベルのメチル化を有する核酸を溶出させる。例えば、メチル化核酸の第1のセットを、160mMまたはそれよりも高い、例えば、少なくとも150mM、少なくとも200mM、300mM、400mM、500mM、600mM、700mM、800mM、900mM、1000mM、または2000mMの塩濃度で溶出させることができる。そのようなメチル化核酸を溶出させた後、磁気分離を、もう一度使用して、より高いレベルのメチル化核酸を、より低いレベルのメチル化を有するものから分離する。溶出および磁気分離ステップ自体を反復して、様々な分配、例えば、低メチル化分配(メチル化がないことを表す)、メチル化分配(低いレベルのメチル化を表す)、および高メチル化分配(高いレベルのメチル化を表す)を作成することができる。
一部の方法において、親和性分離に使用される作用剤に結合した核酸を、洗浄ステップに供する。洗浄ステップは、親和性剤に弱く結合した核酸を洗い流す。そのような核酸は、平均または中央値に近い程度(すなわち、試料を作用剤と最初に接触させたときに固相に結合したままの核酸と、固相に結合していない核酸との中間値)に近い程度に改変を有する核酸を富化することができる。
親和性分離は、異なる程度の改変を有する核酸の少なくとも2つ、ときには3つまたはそれよりも多くの分配をもたらす。分配は、依然として、別個であるが、少なくとも1つの分配の核酸、および通常は2つまたは3つ(またはそれよりも多く)の分配を、通常はアダプターの構成要素として提供される核酸タグに連結させ、異なる分配中の核酸は、1つ分配のメンバーを別のものと識別する異なるタグを受容する。同じ分配の核酸分子に連結されるタグは、互いに同じであっても異なっていてもよい。しかし、互いに異なる場合、タグは、それらが付着した分子を、特定の分配のものであるとして同定するように、共通したコードの部分を有し得る。
メチル化などの特徴に基づいて核酸試料を分配することに関するさらなる詳細については、参照により本明細書に組み込まれるWO2018/119452を参照されたい。
一部の実施形態では、核酸分子は、特定のタンパク質またはその断片に結合している核酸分子およびその特定のタンパク質またはその断片に結合していないものに基づいて、異なる分配に分配され得る。
核酸分子は、DNA-タンパク質結合に基づいて分配され得る。タンパク質-DNA複合体は、タンパク質の特定の特性に基づいて分配され得る。そのような特性の例としては、様々なエピトープ、改変(例えば、ヒストンメチル化またはアセチル化)、または酵素活性が挙げられる。DNAに結合することができ、分画の基準としての機能を果たし得るタンパク質の例としては、プロテインAおよびプロテインGが挙げられ得るが、これらに限定されない。任意の好適な方法を使用して、タンパク質結合領域に基づいて、核酸分子を分配することができる。タンパク質結合領域に基づいて核酸分子を分配するために使用される方法の例としては、SDS-PAGE、クロマチン免疫沈降(ChIP)、ヘパリンクロマトグラフィー、および非対称流れ流動場分離法(AF4)が挙げられるが、これらに限定されない。
一部の実施形態では、核酸を分配するステップは、核酸を、メチル化結合タンパク質(「MBP」)のメチル化結合ドメイン(「MBD」)と接触させることによって行われる。MBDは、5-メチルシトシン(5mC)に結合する。MBDは、常磁性ビーズ、例えば、Dynabeads(登録商標)M-280ストレプトアビジンにビオチンリンカーを介してカップリングされる。異なる程度のメチル化を有する分画への分配は、NaCl濃度を増加させることによって分画を溶出させることにより行うことができる。
本明細書において企図されるMBPの例としては、以下のものが挙げられるが、これらに限定されない:
(a)MeCP2およびMBD2は、非改変シトシンよりも、5-メチル-シトシンに優先的に結合するタンパク質である。
(b)RPL26、PRP8、およびDNAミスマッチ修復タンパク質MHS6は、非改変シトシンよりも、5-ヒドロキシメチル-シトシンに優先的に結合する。
(c)FOXK1、FOXK2、FOXP1、FOXP4、およびFOXI3は、好ましくは、非改変シトシンよりも、5-ホルミル-シトシンに結合する(Iurlaro et al., Genome Biol. 14: R119 (2013))。
(d)1つまたは複数のメチル化ヌクレオチド塩基に特異的な抗体(例えば、MeDIP)。
(a)MeCP2およびMBD2は、非改変シトシンよりも、5-メチル-シトシンに優先的に結合するタンパク質である。
(b)RPL26、PRP8、およびDNAミスマッチ修復タンパク質MHS6は、非改変シトシンよりも、5-ヒドロキシメチル-シトシンに優先的に結合する。
(c)FOXK1、FOXK2、FOXP1、FOXP4、およびFOXI3は、好ましくは、非改変シトシンよりも、5-ホルミル-シトシンに結合する(Iurlaro et al., Genome Biol. 14: R119 (2013))。
(d)1つまたは複数のメチル化ヌクレオチド塩基に特異的な抗体(例えば、MeDIP)。
一部の実施形態では、分配は、メチル化DNA免疫沈降を含む。例えば、メチル化DNA免疫沈降による分配は、標的領域セットが分配が生じる前に捕捉される方法において、使用され得る。
一般に、溶出は、分子あたりのメチル化部位の数の関数であり、高い塩濃度下では、より多くのメチル化を有する分子が溶出する。DNAを、メチル化の程度にも基づいて、別個の集団に溶出させるために、漸増NaCl濃度の一連の溶出緩衝液を使用することができる。塩濃度は、約100nm~約2500mMのNaClの範囲であり得る。一実施形態では、プロセスにより、3つの分配が得られる。分子を、第1の塩濃度で、メチル結合ドメインを含む分子を含む溶液と接触させ、分子が、捕捉部分、例えば、ストレプトアビジンに付着し得る。第1の塩濃度において、ある分子集団は、MBDに結合し、ある集団は、結合しないままとなる。非結合の集団を、「低メチル化」集団として分離することができる。例えば、DNAの低メチル化形態を表す第1の分配は、低い塩濃度、例えば、100mMまたは160mMにおいて、非結合のままであるものである。中間メチル化DNAを表す第2の分配は、中間の塩濃度、例えば、100mM~2000mMの間の濃度を使用して溶出される。これもまた、試料から分離される。DNAの高メチル化形態を表す第3の分配は、高い塩濃度、例えば、少なくとも約2000mMを使用して溶出される。
a.分配のタグ付け
a.分配のタグ付け
一部の実施形態では、2つまたはそれよりも多くの分配、例えば、各分配は、差次的にタグ付けされる。タグまたはインデックスは、タグが会合する分子の特色を示す情報を含有する、分子、例えば、核酸であり得る。タグは、配列読み取りデータの起源である分子を区別することを可能にし得る。例えば、分子は、試料タグまたは試料インデックス(これにより、1つの試料中の分子を、異なる試料中ものと識別する)、分配タグ(これにより、1つの分配中の分子を、異なる分配中のものと識別する)、または分子タグ/分子バーコード/バーコード(これにより、異なる分子を、互いに識別する(一意的および非一意的タグ付けシナリオの両方で)を有し得る。ある特定の実施形態では、タグは、1つのバーコードまたはバーコードの組合せを含み得る。本明細書で使用される場合、「バーコード」という用語は、文脈に応じて、特定のヌクレオチド配列を有する核酸分子、またはヌクレオチド配列自体を指す。バーコードは、例えば、10~100個の間のヌクレオチドを有し得る。バーコードのコレクションは、具体的な目的に所望されるように、縮重配列を有し得るか、またはある特定のハミング距離を有する配列を有し得る。そのため、例えば、分子バーコードは、1つのバーコード、または各々が分子の異なる末端に付着する2つのバーコードの組合せから構成され得る。さらにまたはあるいは、異なる分配および/または試料について、バーコードが、個々の配列を通じて分子タグとしての機能を果たし、それらがメンバーであるセットに基づいて対応する分配および/または試料を同定する機能も果たすように、異なるセットの分子バーコード、分子タグ、または分子インデックスが、使用され得る。バーコードを含むタグは、アダプターに組み込まれ得るか、またはそうでなければ、アダプターに接合され得る。タグは、他の方法の中でもとりわけ、ライゲーション、オーバーラップ伸長PCRによって、組み込まれ得る。
タグ付け戦略は、一意的タグ付け戦略および非一意的タグ付け戦略に分けることができる。一意的タグ付けでは、試料中の全てまたは実質的に全ての分子が、異なるタグを有し、そのため、読み取りデータは、タグ情報単独に基づいて、もともとの分子に割り当てることができる。そのような方法において使用されるタグは、「一意的タグ」と称される場合がある。非一意的タグ付けでは、同じ試料中の異なる分子が同じタグを有し得、そのため、タグ情報に加えて他の情報を使用して、配列読み取りデータがもともとの分子に割り当てられる。そのような情報としては、開始および終止座標、分子がマッピングされる座標、開始または終止座標単独などを挙げることができる。そのような方法において使用されるタグは、「非一意的タグ」と称される場合がある。したがって、必ずしも、試料中の全ての分子を一意的にタグ付けするわけではない。試料内の同定可能なクラス内に含まれる分子を一意的にタグ付けすることで十分である。したがって、異なる同定可能なファミリー内の分子は、タグ付けされた分子の同一性に関する情報を失うことなく、同じタグを有し得る。
非一意的タグ付けのある特定の実施形態では、使用される異なるタグの数は、特定の群の全ての分子が異なるタグを有する非常に高い可能性(例えば、少なくとも99%、少なくとも99.9%、少なくとも99.99%、または少なくとも99.999%)であれば、十分であり得る。バーコードをタグとして使用する場合、およびバーコードが、例えば、ランダムに分子の両方の末端に付着している場合、バーコードの組合せが、一緒に、タグを構成し得ることに留意されたい。この数は、明確にコールに含まれる分子の数の関数である。例えば、クラスは、参照ゲノム上の同じ開始-終止位置にマッピングされる全ての分子であり得る。クラスは、特定の遺伝子座、例えば、特定の塩基または特定の領域(例えば、最大100個の塩基または遺伝子または遺伝子のエクソン)にわたってマッピングする全ての分子であり得る。ある特定の実施形態では、クラス内の分子の数zを一意的に同定するために使用される異なるタグの数は、2*z、3*z、4*z、5*z、6*z、7*z、8*z、9*z、10*z、11*z、12*z、13*z、14*z、15*z、16*z、17*z、18*z、19*z、20*z、または100*zのうちのいずれか(例えば、下限)と、100,000*z、10,000*z、1000*z、または100*zのうちのいずれか(例えば、上限)との間であり得る。
例えば、約5ng~30ngの無細胞DNAの試料において、およそ3000個の分子が、特定のヌクレオチド座標にマッピングされ、任意の開始座標を有する約3~10個の間の分子が、同じ終止座標を共有することが予測される。したがって、約50~約50,000個の異なるタグ(例えば、約6~220個の間のバーコードの組合せ)が、全てのそのような分子を一意的にタグ付けするのに十分であり得る。ヌクレオチド座標全体にマッピングされる3000個全ての分子を一意的にタグ付けするためには、約100万個~約2000万個の異なるタグが必要となるであろう。
一般に、反応における一意的または非一意的タグバーコードの割り当ては、米国特許出願第20010053519号、同第20030152490号、同第20110160078号、ならびに米国特許第6,582,908号および米国特許第7,537,898号および米国特許第9,598,731号によって記載される方法およびシステムに従う。
タグは、ランダムまたは非ランダムに、試料核酸に連結され得る。
一部の実施形態では、タグ付けされた核酸は、マイクロウェルプレートにロードした後にシーケンシングされる。マイクロウェルプレートは、96、384、または1536個のマイクロウェルを有し得る。一部の場合には、それらは、予想される、一意的タグのマイクロウェルに対する比で、導入される。例えば、一意的タグは、ゲノム試料あたり約1個を上回る、2個を上回る、3個を上回る、4個を上回る、5個を上回る、6個を上回る、7個を上回る、8個を上回る、9個を上回る、10個を上回る、20個を上回る、50個を上回る、100個を上回る、500個を上回る、1000個を上回る、5000個を上回る、10000個を上回る、50,000個を上回る、100,000個を上回る、500,000個を上回る、1,000,000個を上回る、10,000,000個を上回る、50,000,000個を上回る、または1,000,000,000個を上回る一意的タグがロードされるように、ロードされ得る。一部の場合には、一意的タグは、ゲノム試料あたり約2個を下回る、3個を下回る、4個を下回る、5個を下回る、6個を下回る、7個を下回る、8個を下回る、9個を下回る、10個を下回る、20個を下回る、50個を下回る、100個を下回る、500個を下回る、1000個を下回る、5000個を下回る、10000個を下回る、50,000個を下回る、100,000個を下回る、500,000個を下回る、1,000,000個を下回る、10,000,000個を下回る、50,000,000個を下回る、または1,000,000,000個を下回る一意的タグがロードされるように、ロードされ得る。一部の場合には、試料ゲノムあたりのロードされる一意的タグの平均数は、ゲノム試料あたり約1個未満もしくはそれより多くの、2個未満もしくはそれより多くの、3個未満もしくはそれより多くの、4個未満もしくはそれより多くの、5個未満もしくはそれより多くの、6個未満もしくはそれより多くの、7個未満もしくはそれより多くの、8個未満もしくはそれより多くの、9個未満もしくはそれより多くの、10個未満もしくはそれより多くの、20個未満もしくはそれより多くの、50個未満もしくはそれより多くの、100個未満もしくはそれより多くの、500個未満もしくはそれより多くの、1000個未満もしくはそれより多くの、5000個未満もしくはそれより多くの、10000個未満もしくはそれより多くの、50,000個未満もしくはそれより多くの、100,000個未満もしくはそれより多くの、500,000個未満もしくはそれより多くの、1,000,000個未満もしくはそれより多くの、10,000,000個未満もしくはそれより多くの、50,000,000個未満もしくはそれより多くの、または1,000,000,000個未満もしくはそれより多くの一意的タグである。
好ましいフォーマットは、標的核酸の両方の末端にライゲーションされた20~50個の異なるタグ(例えば、バーコード)を使用する。例えば、標的分子の両方の末端に、35個の異なるタグ(例えば、バーコード)をライゲーションすると、35×35の順列を作製し、これは、35個のタグについて1225個に等しい。そのような数のタグは、同じ開始点および終止点を有する異なる分子が、高い確率(例えば、少なくとも94%、99.5%、99.99%、99.999%)で異なる組合せのタグを受容するのに十分である。他のバーコードの組合せとしては、10~500の間の任意の数、例えば、約15×15、約35×35、約75×75、約100×100、約250×250、約500×500が挙げられる。
一部の場合には、一意的タグは、所定のまたはランダムなまたは半ランダムな配列のオリゴヌクレオチドであり得る。他の場合には、バーコードが複数の中で必ずしも互いに一意的とならないような、複数のバーコードが使用されてもよい。この例では、バーコードは、バーコードおよびそれがライゲーションされ得る配列の組合せが、個個々に追跡され得る一意的配列を作製するように、個々の分子にライゲーションされ得る。本明細書に記載されるように、配列読み取りデータの始まり(開始)および終わり(終止)の部分の配列データと組み合わせた非一意的バーコードの検出により、特定の分子に対する一意的同一性の割り当てが可能となり得る。個々の配列読み取りデータの長さまたは塩基対の数もまた、そのような分子に一意的同一性を割り当てるために使用することができる。本明細書に記載されるように、一意的同一性が割り当てられた核酸の一本鎖に由来する断片は、それによって、後続の親鎖に由来する断片の同定を可能にし得る。
タグ(単数または複数)を特定の分配と相関付けるために、タグを使用して、個々のポリヌクレオチド集団分配を標識することができる。あるいは、タグは、分配するステップを用いない本発明の実施形態において使用することができる。一部の実施形態では、単一のタグを使用して、特定の分配を標識することができる。一部の実施形態では、複数の異なるタグを使用して、特定の分配を標識することができる。複数のタグを用いて特定の分配を標識する実施形態では、1つの分配を標識するために使用されるタグのセットは、他の分配を標識するために使用されるタグのセットと容易に区別することができる。一部の実施形態では、タグは、追加の機能を有してもよく、例えば、タグを、試料の起源に索引を付けるために使用するか、または一意的分子識別子(これは、例えば、Kinde et al., Proc Nat'l Acad Sci USA 108: 9530-9535 (2011)、Kou et al., PLoS ONE,11: e0146638 (2016)にあるように、シーケンシングエラーを突然変異とは区別することによって、シーケンシングデータの品質を改善するために使用することができる)として使用するか、または例えば、米国特許第9,598,731号に記載されるように、非一意的分子識別子として使用することができる。同様に、一部の実施形態では、タグは、追加の機能を有し得、例えば、タグを、試料の起源に索引を付けるために使用するか、または非一意的分子識別子(これは、シーケンシングエラーを突然変異とは区別することによって、シーケンシングデータの品質を改善するために使用することができる)として使用することができる。
一実施形態では、分配のタグ付けは、各分配における分子を、分配タグでタグ付けすることを含む。分配を再度組み合わせ(例えば、必要とされるシーケンシング実行数を低減させ、不必要な費用を回避するため)、分子をシーケンシングした後に、分配タグにより、起源の分配が同定される。別の実施形態では、異なる分配は、例えば、バーコード対から構成される、分子タグの異なるセットでタグ付けされる。このようにして、各分子バーコードは、起源の分配、ならびに分配内の分子を識別するのに有用であることを示す。例えば、35個のバーコードの第1のセットを使用して、第1の分配における分子をタグ付けすることができ、一方で、35個のバーコードの第2のセットを使用して、第2の分配中の分子をタグ付けすることができる。
一部の実施形態では、分配および分配タグでのタグ付けの後に、分子は、単回でのシーケンシングのためにプールされ得る。一部の実施形態では、試料タグは、例えば、分配タグの付加およびプールの後のステップにおいて、分子に付加される。試料タグは、単回シーケンシングでのシーケンシングのために複数の試料から生成された材料をプールすることを容易にし得る。
あるいは、一部の実施形態では、分配タグは、試料ならびに分配と相関付けられてもよい。単純な例として、第1のタグは、第1の試料の第1の分配を示し得、第2のタグは、第1の試料の第2の分配を示し得、第3のタグは、第2の試料の第1の分配を示し得、第4のタグは、第2の試料の第2の分配を示し得る。
タグは、1つまたは複数の特徴に基づいて、既に分配された分子に付着され得るが、ライブラリー内の最終的なタグ付けされた分子は、もはやその特徴を有さない場合がある。例えば、一本鎖DNA分子が、分配されタグ付けされ得るが、ライブラリー内の最終的なタグ付けされた分子は、二本鎖である可能性が高い。同様に、DNAは、異なるレベルのメチル化に基づく分配に供され得るが、最終的なライブラリーにおいて、これらの分子に由来するタグ付けされた分子は、非メチル化である可能性が高い。したがって、ライブラリー内の分子に付着したタグは、典型的には、必ずしもタグ付けされた分子自体の特徴ではなく、最終的なタグ付けされた分子が由来する「親分子」の特徴を示す。
一例として、バーコード1、2、3、4などを使用して、第1の分配中の分子をタグ付けおよび標識し、バーコードA、B、C、Dなどを使用して、第2の分配中の分子をタグ付けおよび標識し、バーコードa、b、c、dなどを使用して、第3の分配中の分子をタグ付けおよび標識する。差次的にタグ付けされた分配は、シーケンシングの前にプールされ得る。差次的にタグ付けされた分配は、別個にシーケンシングされるか、または例えば、Illuminaシーケンサーの同じフローセルにおいて、一緒に同時にシーケンシングされてもよい。
シーケンシングした後に、遺伝的変異体を検出するための読み取りデータの解析は、分配ごとのレベル、ならびに全核酸集団レベルで行われ得る。タグを使用して、異なる分配に由来する読み取りデータを選別する。解析には、配列情報、ゲノム座標の長さ、カバレッジ、および/またはコピー数を使用して、遺伝的変異およびエピジェネティック変異(メチル化、クロマチン構造などのうちの1つまたは複数)を決定するためのin silico解析が含まれ得る。一部の実施形態では、より高いカバレッジは、ゲノム領域におけるより高いヌクレオソーム占有率と相関し得、一方でより低いカバレッジは、より低いヌクレオソーム占有率またはヌクレオソーム枯渇領域(NDR)と相関し得る。
一部の実施形態では、方法において使用されるヌクレアーゼによって認識される配列を含まない、および/または例えば、ヌクレオチド改変、例えば、連結改変(例えば、ホスホロチオエート)の存在に起因して、切断に対して抵抗性である、アダプターが使用される。一部の実施形態では、方法において使用されるヌクレアーゼによって認識される配列を含まない、および/または例えば、ヌクレオチド改変、例えば、連結改変(例えば、ホスホロチオエート)の存在に起因して、切断に対して抵抗性である、タグが使用される。1つまたは複数のメチル化依存性制限酵素および1つまたは複数のメチル化感受性制限酵素の両方が使用される場合、アダプターおよび/またはタグは、それらが、使用される制限酵素のうちのいずれかによる切断の基質とはならないように、メチル化が欠如し得、1つまたは複数のメチル化感受性制限酵素の認識配列が欠如し得る。
b.改変された核酸解析の代替的な方法
b.改変された核酸解析の代替的な方法
一部の実施形態では、アダプターは、核酸を分配した後に核酸に付加され、他の実施形態では、アダプターは、核酸を分配する前に核酸に付加され得る。一部のそのような方法では、異なる程度で改変(例えば、核酸分子あたり0個、1個、2個、3個、4個、5個、またはそれよりも多くのメチル基)を有する核酸の集団を、改変の程度に応じて、集団の分画の前に、アダプターと接触させる。アダプターは、集団内の核酸分子の一方の末端または両方の末端に付着する。好ましくは、アダプターは、タグの組合せ数が、同じ開始および終止点を有する2つの核酸が同じタグの組合せを受容する低い確率、例えば、95、99、または99.9%をもたらすのに十分な数の異なるタグを含む。アダプターは、同じタグを有するかまたは異なるタグを有するかに関係なく、同じかまたは異なるプライマー結合部位を含み得るが、好ましくは、アダプターは、同じプライマー結合部位を含む。アダプターの付着後に、核酸を、改変を有する核酸に優先的に結合する作用剤(例えば、以前に説明されたそのような作用剤)と接触させる。核酸を、作用剤への結合から、核酸が改変を有する程度が異なる少なくとも2つの部分試料に分配する。例えば、作用剤が、改変を有する核酸に対する親和性を有する場合、改変が過剰発現した核酸(集団内の中央値出現と比較して)は、作用剤に優先的に結合し、一方で、改変が過少発現する核酸は、結合しないか、または作用剤からより容易に溶出される。分配した後に、第1の部分試料は、第1の部分試料のDNA内の第1の核酸塩基に対してDNA内の第2の核酸塩基とは異なって影響を及ぼす手順に供され、第1の核酸塩基は、改変または非改変核酸塩基であり、第2の核酸塩基は、第1の核酸塩基とは異なる改変または非改変核酸塩基であり、第1の核酸塩基および第2の核酸塩基は、同じ塩基対形成特異性を有する。核酸を、次いで、アダプター内のプライマー結合部位に結合するプライマーから増幅させる。増幅の後に、異なる分配は、次いで、さらなるプロセシングステップに供され得るが、これには、典型的に、並行であるが別個での、さらなる(例えば、クローン)増幅、および配列解析が含まれる。異なる分配からの配列データを、次いで、比較することができる。
別の実施形態では、以下の例示的な手順を使用して、分配するスキームを行うことができる。核酸を、プライマー結合部位およびタグを含む、Y字形状アダプターの両方の末端に連結させる。分子を増幅させる。増幅させた分子を、次いで、5-メチルシトシンに優先的に結合する抗体との接触によって分画して、2つの分配を産生する。一方の分配には、メチル化が欠如したもともとの分子、およびメチル化が失われた増幅コピーが含まれる。他方の分配には、メチル化を有するもともとのDNA分子が含まれる。メチル化を有するもともとのDNA分子を含む分配を、第1の部分試料のDNA内の第1の核酸塩基に対してDNA内の第2の核酸塩基とは異なって影響を及ぼす手順に供し、ここで、第1の核酸塩基は、改変または非改変核酸塩基であり、第2の核酸塩基は、第1の核酸塩基とは異なる改変または非改変核酸塩基であり、第1の核酸塩基および第2の核酸塩基は、同じ塩基対形成特異性を有する。2つの分配を、次いで、メチル化分配のさらなる増幅とは別個に、プロセシングおよびシーケンシングする。2つの分配の配列データを、次いで、比較することができる。この例では、タグは、メチル化DNAと非メチル化DNAとを識別するためではなく、同じ開始および終止点を有する読み取りデータが、同じ分子に基づくか異なる分子に基づくかを決定するこができるように、これらの分配内の異なる分子間での識別するために使用される。
本開示はさらに、核酸のうちの少なくとも一部が5-メチルシトシンなどの1つまたは複数の改変シトシン残基および前述の他の改変のうちのいずれかを含む、核酸の集団を解析するための方法を提供する。これらの方法において、分配した後に、核酸の部分試料を、5C位置において改変された1つまたは複数のシトシン残基、例えば、5-メチルシトシンを含むアダプターと接触させる。好ましくは、そのようなアダプター内の全てのシトシン残基も改変されているか、またはアダプターのプライマー結合領域内の全てのそのようなシトシンが改変されている。アダプターは、集団内の核酸分子の両方の末端に付着する。好ましくは、アダプターは、タグの組合せ数が、同じ開始および終止点を有する2つの核酸が同じタグの組合せを受容する低い確率、例えば、95、99、または99.9%をもたらすのに十分な数の異なるタグを含む。そのようなアダプター内のプライマー結合部位は、同じであっても異なってもよいが、好ましくは、同じである。アダプターの付着後に、核酸を、アダプターのプライマー結合部位に結合するプライマーから増幅させる。増幅させた核酸を、第1のアリコートおよび第2のアリコートに分ける。第1のアリコートを、さらなるプロセシングありまたはなしで、配列データに関してアッセイする。第1のアリコート内の分子の配列データは、したがって、核酸分子の初期メチル化状態に関係なく、決定される。第2のアリコート内の核酸分子を、DNA内の第1の核酸塩基に対してDNA内の第2の核酸塩基とは異なって影響を及ぼす手順に供し、ここで、第1の核酸塩基は、5位で改変されたシトシンを含み、第2の核酸塩基は、非改変シトシンを含む。この手順は、バイサルファイト処置または非改変シトシンをウラシルに変換する別の手順であり得る。手順に供した核酸を、次いで、核酸に連結したアダプターのもともとのプライマー結合部位に対するプライマーで増幅させる。これらの核酸は、アダプターのプライマー結合部位にシトシンを保持しているが、一方で増幅産物は、バイサルファイト処置においてウラシルへの変換を受けてこれらのシトシン残基のメチル化が失われているため、アダプターにもともと連結していた核酸分子(その増幅産物とは異なる)のみが、ここで増幅可能である。したがって、少なくとも一部がメチル化されている集団内のもともとの分子のみが、増幅を受ける。増幅後に、これらの核酸は、配列解析に供される。第1のアリコートおよび第2のアリコートから決定された配列の比較は、とりわけ、核酸集団内のどのシトシンがメチル化に供されたかを示し得る。
そのような解析は、以下の例示的な手順を使用して行うことができる。分配した後に、メチル化DNAは、プライマー結合部位およびタグを含むY形状アダプターの両方の末端に連結される。アダプター内のシトシンは、5位において改変されている(例えば、5-メチル化)。アダプターの改変は、後続の変換ステップ(例えば、バイサルファイト処置、TAP変換、または改変シトシンには影響を及ぼさないが、非改変シトシンに影響を及ぼす任意の他の変換)においてプライマー結合部位を保護するように機能する。アダプターの付着後に、DNA分子を増幅させる。増幅産物を、変換ありおよび変換なしでのシーケンシングのために2つのアリコートに分ける。変換に供さないアリコートは、さらなるプロセシングありまたはなしで、配列解析に供され得る。他方のアリコートは、DNA内の第1の核酸塩基に対してDNA内の第2の核酸塩基とは異なって影響を及ぼす手順に供され、ここで、第1の核酸塩基は、5位で改変されたシトシンを含み、第2の核酸塩基は、非改変シトシンを含む。この手順は、バイサルファイト処置または非改変シトシンをウラシルに変換する別の手順であり得る。もともとのプライマー結合部位に特異的なプライマーと接触させた場合に、シトシンの改変によって保護されたプライマー結合部位のみが、増幅を補助し得る。したがって、第1の増幅に由来するコピーではなく、もともとの分子のみが、さらなる増幅に供される。さらに増幅された分子を、次いで、配列解析に供する。配列を、次いで2つのアリコートから比較することができる。上記で考察される分離スキームにあるように、アダプター内の核酸タグは、メチル化DNAと非メチル化DNAとを識別するためではなく、同じ分配内の核酸分子を識別するために使用される。
3.第1の部分試料を、第1の部分試料のDNA内の第1の核酸塩基に対してDNA内の第2の核酸塩基とは異なって影響を及ぼす手順に供する
3.第1の部分試料を、第1の部分試料のDNA内の第1の核酸塩基に対してDNA内の第2の核酸塩基とは異なって影響を及ぼす手順に供する
第2の部分試料を、第2の部分試料のDNA内の第1の核酸塩基に対してDNA内の第2の核酸塩基とは異なって影響を及ぼす手順に供するステップであって、第1の核酸塩基が、改変または非改変核酸塩基であり、第2の核酸塩基が、第1の核酸塩基とは異なる改変または非改変核酸塩基であり、第1の核酸塩基および第2の核酸塩基が、同じ塩基対形成特異性を有する、ステップを含む、方法が、本明細書において開示される。一部の実施形態では、第1の核酸塩基が、改変または非改変アデニンである場合には、第2の核酸塩基は、改変または非改変アデニンであり、第1の核酸塩基が、改変または非改変シトシンである場合には、第2の核酸塩基は、改変または非改変シトシンであり、第1の核酸塩基が、改変または非改変グアニンである場合には、第2の核酸塩基は、改変または非改変グアニンであり、第1の核酸塩基が、改変または非改変チミンである場合には、第2の核酸塩基は、改変および非改変チミンである(改変および非改変ウラシルは、このステップの目的で、改変チミン内に包含される)。方法はまた、第1の部分試料を、第1の部分試料のDNA内の第1の核酸塩基に対してDNA内の第2の核酸塩基とは異なって影響を及ぼす手順に供するステップであって、第1の核酸塩基が、改変または非改変核酸塩基であり、第2の核酸塩基が、第1の核酸塩基とは異なる改変または非改変核酸塩基であり、第1の核酸塩基および第2の核酸塩基が、同じ塩基対形成特異性を有する、ステップを含み得る。そのような実施形態では、同じかまたは異なる手順が、第1および第2の部分試料に対して使用され得る。そのような手順を使用して、ある特定の改変、例えば、メチル化を有するかまたはそれが欠如した、部分試料中のヌクレオチドを同定することができる。
第2の部分試料が供される手順に関して、一部の実施形態では、第1の核酸塩基は、改変または非改変シトシンであり、そして第2の核酸塩基は、改変または非改変シトシンである。例えば、第1の核酸塩基は、非改変シトシン(C)を含み得、第2の核酸塩基は、5-メチルシトシン(mC)および5-ヒドロキシメチルシトシン(hmC)のうちの1つまたは複数を含み得る。あるいは、第2の核酸塩基は、Cを含み得、第1の核酸塩基は、mCおよびhmCのうちの1つまたは複数を含み得る。例えば、上記の発明の概要および以下の考察において示されるように、第1および第2の核酸塩基のうちの一方がmCを含み、他方がhmCを含む場合など、他の組合せもまた可能である。第1の部分試料もそのような手順に供される場合、前述のもののいずれも、第1の部分試料が供される手順に適用され得る。
一部の実施形態では、第1および/または第2の部分試料が供される、第1の部分試料のDNA内の第1の核酸塩基に対してDNA内の第2の核酸塩基とは異なって影響を及ぼす手順は、バイサルファイト変換を含む。バイサルファイトでの処置により、非改変シトシンおよびある特定の改変シトシンヌクレオチド(例えば、5-ホルミルシトシン(fC)または5-カルボキシルシトシン(caC))を、ウラシルに変換し、一方で他の改変シトシン(例えば、5-メチルシトシン、5-ヒドロキシルメチルシトシン)は変換されない。したがって、バイサルファイト変換が使用される場合、第1の核酸塩基は、非改変シトシン、5-ホルミルシトシン、5-カルボキシルシトシン、またはバイサルファイトによって影響を受ける他のシトシン形態のうちの1つまたは複数を含み、第2の核酸塩基は、mCおよびhmCのうちの1つまたは複数、例えば、mCおよび必要に応じてhmCを含み得る。バイサルファイトで処置したDNAのシーケンシングは、シトシンとして読み取られる位置を、mCまたはhmC位置であるとして同定する。一方、Tとして読み取られる位置は、T、またはCのバイサルファイト感受性形態、例えば、非改変シトシン、5-ホルミルシトシン、または5-カルボキシルシトシンであるとして同定される。本明細書に記載されるように第1の部分試料にバイサルファイト変換を行うことは、したがって、第1の部分試料から得られた配列読み取りデータを使用して、mCまたはhmCを含有する位置を同定することを容易にする。バイサルファイト変換の例示的な説明については、例えば、Moss et al., Nat Commun. 2018; 9: 5068を参照されたい。
一部の実施形態では、第1および/または第2の部分試料が供される、第1の部分試料のDNA内の第1の核酸塩基に対してDNA内の第2の核酸塩基とは異なって影響を及ぼす手順は、酸化的バイサルファイト(Ox-BS)変換を含む。この手順は、まず、hmCを、バイサルファイト感受性であるfCに変換し、続いて、バイサルファイト変換を行う。したがって、酸化的バイサルファイト変換が使用される場合、第1の核酸塩基は、非改変シトシン、fC、caC、hmC、またはバイサルファイトによって影響を受ける他のシトシン形態のうちの1つまたは複数を含み、第2の核酸塩基は、mCを含む。Ox-BSで変換されたDNAのシーケンシングは、シトシンとして読み取られる位置を、mC位置であるとして同定する。一方、Tとして読み取られる位置は、T、hmC、またはCのバイサルファイト感受性形態、例えば、非改変シトシン、fC、またはhmCであるとして同定される。本明細書に記載されるように第1の部分試料にOx-BS変換を行うことは、したがって、第1の部分試料から得られた配列読み取りデータを使用して、mCを含有する位置を同定することを容易にする。酸化的バイサルファイト変換の例示的な説明については、例えば、Booth et al., Science 2012; 336: 934-937を参照されたい。
一部の実施形態では、第1および/または第2の部分試料が供される、第1の部分試料のDNA内の第1の核酸塩基に対してDNA内の第2の核酸塩基とは異なって影響を及ぼす手順は、Tet補助バイサルファイト(TAB)変換を含む。TAB変換において、hmCは、変換から保護され、mCは、バイサルファイト処置に先立って酸化され、その結果、もともとmCによって占有されていた位置が、Uに変換され、もともとhmCによって占有されていた位置が、シトシンの保護形態として残る。例えば、Yu et al., Cell 2012; 149: 1368-80に記載されるように、β-グルコシルトランスフェラーゼを使用して、hmCを保護することができ(5-グルコシルヒドロキシメチルシトシン(ghmC)を形成する)、次いで、TETタンパク質、例えば、mTet1を使用して、mCをcaCに変換することができ、次いで、バイサルファイト処置を使用して、CおよびcaCをUに変換することができるが、ghmCは影響を受けないままである。したがって、TAB変換が使用される場合、第1の核酸塩基は、非改変シトシン、fC、caC、mC、またはバイサルファイトによって影響を受ける他のシトシン形態のうちの1つまたは複数を含み、第2の核酸塩基は、hmCを含む。TABで変換されたDNAのシーケンシングは、シトシンとして読み取られる位置を、hmC位置であるとして同定する。一方、Tとして読み取られる位置は、T、mC、またはCのバイサルファイト感受性形態、例えば、非改変シトシン、fC、またはcaCであるとして同定される。本明細書に記載されるように第1の部分試料にTAB変換を行うことは、したがって、第1の部分試料から得られた配列読み取りデータを使用して、hmCを含有する位置を同定することを容易にする。
一部の実施形態では、第1および/または第2の部分試料が供される、第1の部分試料のDNA内の第1の核酸塩基に対してDNA内の第2の核酸塩基とは異なって影響を及ぼす手順は、置換ボラン還元剤を用いたTet補助変換を含み、必要に応じて、置換ボラン還元剤は、2-ピコリンボラン、ボランピリジン、tert-ブチルアミンボラン、またはアンモニアボランである。置換ボラン還元剤を用いたTet補助pic-ボラン変換(例えば、TAP)では、TETタンパク質を使用して、非改変Cに影響を及ぼすことなく、mCおよびhmCをcaCに変換する。caCおよび存在する場合にはfCは、次いで、2-ピコリンボラン(pic-ボラン)または別の置換ボラン還元剤、例えば、ボランピリジン、tert-ブチルアミンボラン、またはアンモニアボランでの処置によって、これもまた非改変Cに影響を及ぼすことなく、ジヒドロウラシル(DHU)に変換される。例えば、Liu et al., Nature Biotechnology 2019; 37:424-429(例えば、補足の図1および補足説明7)を参照されたい。DHUは、シーケンシングにおいてTとして読み取られる。したがって、このタイプの変換が使用される場合、第1の核酸塩基は、mC、fC、caC、またはhmCのうちの1つまたは複数を含み、第2の核酸塩基は、非改変シトシンを含む。変換されたDNAのシーケンシングは、シトシンとして読み取られる位置を、非改変C位置であるとして同定する。一方、Tとして読み取られる位置は、T、mC、fC、caC、またはhmCであるとして同定される。本明細書に記載されるように第1の部分試料にTAP変換を行うことは、したがって、第1の部分試料から得られた配列読み取りデータを使用して、非改変Cを含有する位置を同定することを容易にする。この手順は、Liu et al. 2019(上記)にさらに詳細に記載されているTet補助ピリジンボランシーケンシング(TAPS)を包含する。一部の実施形態では、第2の部分試料が供される手順は、置換ボラン還元剤を用いたTet補助pic-ボラン変換であるが、一方で、第1の部分試料が供される手順は、本明細書に記載されるもののうちのいずれかなど、非メチル化シトシンを変換する手順である。この手順の組合せは、高メチル化分配内の高メチル化分子および低メチル化分配内の低メチル化分子に対する影響を最小限に抑えながら、非特異的に分配された分子の同定を容易するはずである。
あるいは、hmCの保護(例えば、βGTを使用)は、置換ボラン還元剤を用いたTet補助変換と組み合わせることができる。hmCは、βGTを使用したグルコシル化を通じて上述のように保護して、ghmCを形成することができる。TETタンパク質、例えば、mTet1での処置は、次いで、mCをcaCに変換するが、CもghmCも変換しない。caCは、次いで、pic-ボランまたは別の置換ボラン還元剤、例えば、ボランピリジン、tert-ブチルアミンボラン、またはアンモニアボランでの処置によって、これもまた非改変CまたはghmCに影響を及ぼすことなく、DHUに変換される。したがって、置換ボラン還元剤を用いたTet補助変換が使用される場合、第1の核酸塩基は、mCを含み、第2の核酸塩基は、非改変シトシンまたはhmCのうちの1つまたは複数、例えば、非改変シトシン、ならびに必要に応じてhmC、fC、および/またはcaCを含む。変換されたDNAのシーケンシングは、シトシンとして読み取られる位置を、hmCまたは非改変C位置であるとして同定する。一方、Tとして読み取られる位置は、T、fC、caC、またはmCであるとして同定される。本明細書に記載されるように第1の部分試料にTAPSβ変換を行うことは、したがって、第1の部分試料から得られた配列読み取りデータを使用して、一方で非改変のCまたはhmCを含有する位置をmCを含有する位置と識別することを容易にする。このタイプの変換の例示的な説明については、例えば、Liu et al., Nature Biotechnology 2019; 37:424-429を参照されたい。
一部の実施形態では、第1の部分試料のDNA内の第1の核酸塩基に対してDNA内の第2の核酸塩基とは異なって影響を及ぼす手順は、置換ボラン還元剤を用いた化学物質補助変換を含み、必要に応じて、置換ボラン還元剤は、2-ピコリンボラン、ボランピリジン、tert-ブチルアミンボラン、またはアンモニアボランである。置換ボラン還元剤を用いた化学物質補助変換において、酸化剤、例えば、過ルテニウム酸カリウム(KRuO4)(ox-BS変換における使用にも好適である)を使用して、特異的にhmCをfCに酸化させる。pic-ボランまたは他の置換ボラン還元剤、例えば、ボランピリジン、tert-ブチルアミンボラン、またはアンモニアボランでの処置は、fCおよびcaCをDHUに変換させるが、mCにも非改変Cにも影響を及ぼさない。したがって、このタイプの変換が使用される場合、第1の核酸塩基は、hmC、fC、およびcaCのうちの1つまたは複数を含み、第2の核酸塩基は、非改変シトシンまたはmCのうちの1つまたは複数、例えば、非改変シトシンおよび必要に応じてmCを含む。変換されたDNAのシーケンシングは、シトシンとして読み取られる位置を、mCまたは非改変C位置であるとして同定する。一方、Tとして読み取られる位置は、T、fC、caC、またはhmCであるとして同定される。本明細書に記載されるように第1の部分試料にこのタイプの変換を行うことは、したがって、第1の部分試料から得られた配列読み取りデータを使用して、一方で非改変のCまたはmCを含有する位置をhmCを含有する位置と識別することを容易にする。このタイプの変換の例示的な説明については、例えば、Liu et al., Nature Biotechnology 2019; 37:424-429を参照されたい。
一部の実施形態では、第1の部分試料のDNA内の第1の核酸塩基に対してDNA内の第2の核酸塩基とは異なって影響を及ぼす手順は、APOBECカップリングエピジェネティック(ACE)変換を含む。ACE変換において、AID/APOBECファミリーDNAデアミナーゼ酵素、例えば、APOBEC3A(A3A)を使用して、hmC、fC、またはcaCを脱アミノ化することなく、非改変シトシンおよびmCを脱アミノ化する。したがって、ACE変換が使用される場合、第1の核酸塩基は、非改変Cおよび/またはmC(例えば、非改変Cおよび必要に応じてmC)を含み、第2の核酸塩基は、hmCを含む。ACE変換DNAのシーケンシングは、シトシンとして読み取られる位置を、hmC、fC、またはcaC位置であるとして同定する。一方、Tとして読み取られる位置は、T、非改変C、またはmCであるとして同定される。本明細書に記載されるように第1の部分試料にACE変換を行うことは、したがって、第1の部分試料から得られた配列読み取りデータを使用して、hmCを含有する位置を、mCまたは非改変Cを含有する位置と識別することを容易にする。ACE変換の例示的な説明については、例えば、Schutsky et al., Nature Biotechnology 2018; 36: 1083-1090を参照されたい。
一部の実施形態では、第1の部分試料のDNA内の第1の核酸塩基に対してDNA内の第2の核酸塩基とは異なって影響を及ぼす手順は、例えば、EM-Seqにあるように、第1の核酸塩基の酵素的変換を含む。例えばwww.biorxiv.org/content/10.1101/2019.12.20.884692v1において利用可能な、Vaisvila R, et al. (2019) EM-seq: Detection of DNA methylation at single base resolution from picograms of DNA. bioRxiv; DOI: 10.1101/2019.12.20.884692を参照されたい。例えば、TET2およびT4-βGTを使用して、5mCおよび5hmCを、デアミナーゼ(例えば、APOBEC3A)によって脱アミノ化することができない基質に変換することができ、次いで、デアミナーゼ(例えば、APOBEC3A)を使用して、非改変シトシンを脱アミノ化してウラシルに変換することができる。
一部の実施形態では、第1の部分試料のDNA内の第1の核酸塩基に対してDNA内の第2の核酸塩基とは異なって影響を及ぼす手順は、もともと第1の核酸塩基を含むDNAを、もともと第1の核酸塩基を含んでいないDNAから分離することを含む。一部のそのような実施形態では、第1の核酸塩基は、hmCである。もともと第1の核酸塩基を含むDNAは、もともと第1の核酸塩基を含んでいた位置をビオチン化することを含む標識化手順を使用して、他のDNAから分離され得る。一部の実施形態では、第1の核酸塩基は、まず、アジド含有部分、例えば、グルコシル-アジド含有部分で誘導体化される。アジド含有部分は、次いで、例えば、ヒュスゲン環化付加化学反応を通じてビオチンを付着させるための試薬としての機能を果たし得る。次いで、ここでビオチン化されたもともと第1の核酸塩基を含むDNAは、ビオチン結合剤、例えば、アビジン、ニュートラアビジン(約6.3の等電点を有する脱グリコシル化アビジン)、またはストレプトアビジンを使用して、もともと第1の核酸塩基を含まないDNAから分離され得る。もともと第1の核酸塩基を含むDNAを、もともと第1の核酸塩基を含まないDNAから分離するための手順の例は、hmC-シールであり、これは、hmCを標識して、β-6-アジド-グルコシル-5-ヒドロキシメチルシトシンを形成し、次いで、ヒュスゲン環化付加を通じてビオチン部分を付着させ、続いて、ビオチン結合剤を使用して、ビオチン化DNAを他のDNAから分離する。hmC-シールの例示的な説明については、例えば、Han et al., Mol. Cell 2016; 63: 711-719を参照されたい。このアプローチは、1つまたは複数のhmC核酸塩基を含む断片を特定するのに有用である。
一部の実施形態では、そのような分離に続いて、方法は、もともと第1の核酸塩基を含むDNAの各々を、もともと第1の核酸塩基を含まないDNAおよび第2の部分試料のDNAとは差次的にタグ付けするステップをさらに含む。方法は、差次的タグ付けの後に、もともと第1の核酸塩基を含むDNA、もともと第1の核酸塩基を含まないDNA、および第2の部分試料のDNAをプールするステップをさらに含む。もともと第1の核酸塩基を含むDNA、もともと第1の核酸塩基を含まないDNA、および第2の部分試料のDNAは、次いで、同じシーケンシングセルにおいてシーケンシングされ得るが、差次的タグを使用して、所与の読み取りデータが、もともと第1の核酸塩基を含むDNA、もともと第1の核酸塩基を含まないDNA、または第2の部分試料のDNAの分子に由来するかを解明する能力は保持する。
一部の実施形態では、第1の核酸塩基は、改変または非改変アデニンであり、第2の核酸塩基は、改変または非改変アデニンである。一部の実施形態では、改変アデニンは、N6-メチルアデニン(mA)である。一部の実施形態では、改変アデニンは、N6-メチルアデニン(mA)、N6-ヒドロキシメチルアデニン(hmA)、またはN6-ホルミルアデニン(fA)のうちの1つまたは複数である。
メチル化DNA免疫沈降(MeDIP)を含む技術を使用して、改変塩基、例えば、mAを含有するDNAを、他のDNAから分離することができる。例えば、Kumar et al., Frontiers Genet. 2018; 9: 640; Greer et al., Cell 2015; 161: 868-878を参照されたい。mAに特異的な抗体は、Sun et al., Bioessays 2015; 37:1155-62に記載されている。様々な改変核酸塩基、例えば、ハロゲン化形態、例えば、5-ブロモウラシルを含むチミン/ウラシルの形態に対する抗体が、市販されている。様々な改変塩基はまた、その塩基対形成特異性における変化に基づいて検出することができる。例えば、ヒポキサンチンは、脱アミノ化により生じ得るアデニンの改変形態であり、シーケンシングにおいてGとして読み取られる。例えば、米国特許第8,486,630号、Brown, Genomes, 2nd Ed., John Wiley & Sons, Inc., New York, N.Y., 2002, chapter 14, "Mutation, Repair, and Recombination"を参照されたい。
4.部分試料を、メチル化感受性ヌクレアーゼと接触させる
4.部分試料を、メチル化感受性ヌクレアーゼと接触させる
一部の実施形態では、部分試料(例えば、本明細書に記載されるように、例えば、シトシン改変、例えば、メチル化、例えば、5-メチル化のレベルに基づいて、試料を分配することによって調製された、第1および/または第3の部分試料)を、メチル化感受性ヌクレアーゼと接触させる。別途示されない限り、分配が、シトシン改変に基づいて行われる場合、第1の部分試料は、より高いレベルの改変を有する部分試料であり、第2の部分試料は、より低いレベルの改変を有する部分試料であり、存在する場合、第3の部分試料は、第1の部分試料と第2の部分試料との間の中間のレベルの改変を有する。
上記で考察されるように、分配する手順は、部分試料間で、DNA分子の不完全な選別をもたらす場合がある。メチル化感受性ヌクレアーゼを使用して、第1または第3の部分試料中の非特異的に分配されたDNA(例えば、低メチル化DNA)を分解することができる。一部の実施形態では、第1の部分試料を、メチル化感受性エンドヌクレアーゼ、例えば、メチル化感受性制限酵素と接触させ、それによって第1の部分試料中の非特異的に分配されたDNAを分解して、処置された第1の部分試料を産生することができる。非特異的に分配されたDNAの分解は、例えば、試料中の異常に改変されたDNAの存在を検出するため、DNAの起源である組織を決定するため、および/または対象ががんを有するかどうかを決定するために、シトシン改変に基づくDNAの正確な分配に依存する方法の性能の改善として、提案される。例えば、そのような分解は、改善された感度をもたらし、かつ/または下流の解析を単純化し得る。
部分試料をヌクレアーゼと接触させるとき、1つまたは複数のヌクレアーゼを使用することができる。一部の実施形態では、部分試料を、複数のヌクレアーゼと接触させる。部分試料は、逐次的または同時に、ヌクレアーゼと接触させてもよい。ヌクレアーゼの同時使用は、ヌクレアーゼが、類似の条件(例えば、緩衝液組成)下において活性である場合に、不必要な試料操作を回避するため有益であり得る。第2の部分試料を、1つを上回るメチル化依存性制限酵素と接触させることにより、非特異的に分配された高メチル化DNAをより完全に分解することができる。同様に、第1の部分試料を、1つを上回るメチル化感受性制限酵素と接触させることにより、非特異的に分配された低メチル化DNAおよび/または非メチル化DNAをより完全に分解することができる。
一部の実施形態では、メチル化感受性ヌクレアーゼは、AatII、AccII、AciI、Aor13HI、Aor15HI、BspT104I、BssHII、BstUI、Cfr10I、ClaI、CpoI、Eco52I、HaeII、HapII、HhaI、Hin6I、HpaII、HpyCH4IV、MluI、MspI、NaeI、NotI、NruI、NsbI、PmaCI、Psp1406I、PvuI、SacII、SalI、SmaI、およびSnaBIのうちの1つまたは複数を含む。一部の実施形態では、少なくとも2つのメチル化感受性ヌクレアーゼが使用される。一部の実施形態では、少なくとも3つのメチル化感受性ヌクレアーゼが使用される。一部の実施形態では、メチル化感受性ヌクレアーゼは、BstUIおよびHpaIIを含む。一部の実施形態では、2つのメチル化感受性ヌクレアーゼは、HhaIおよびAccIIを含む。一部の実施形態では、メチル化感受性ヌクレアーゼは、BstUI、HpaII、およびHin6Iを含む。
第3の部分試料(例えば、中間メチル化分配)を含む実施形態では、その中の核酸分子は、メチル化感受性ヌクレアーゼで消化され得る。一部の実施形態では、第3の部分試料(例えば、中間メチル化分配)中の核酸分子は、第1の部分試料(例えば、高メチル化分配)と同じヌクレアーゼで消化される。例えば、第3の部分試料(例えば、中間メチル化分配)は、第1の部分試料(例えば、高メチル化分配)とともにプールされてもよく、次いで、プールされた分配を、消化に供してもよい。
一部の実施形態では、部分試料を、DNAの両方の末端へタグ付けするまたはアダプターを付着するステップの後に、上述のようにヌクレアーゼと接触させる。タグまたはアダプターは、上述のアプローチのうちのいずれかを使用したヌクレアーゼによる切断に対して抵抗性であり得る。このアプローチにおいて、切断は、非特異的に分配された分子が解析まで持ち込まれることを防止し得るが、これは、切断産物が、両方の末端においてタグまたはアダプターが欠如しているためである。
あるいは、タグ付けするまたはアダプターを付着するステップは、上述のようにヌクレアーゼによる切断の後に行うことができる。切断された分子を、次いで、ヌクレアーゼ認識部位に対応する末端(タグまたはアダプターへの付着点)を有することに基づいて、配列読み取りデータ内で同定することができる。このようにして分子をプロセシングすることによっても、切断された分子、例えば、体細胞突然変異の観察からの情報の獲得が可能となり得る。部分試料をヌクレアーゼと接触させた後にタグ付けするまたはアダプターを付着し、低分子量DNA、例えば、cfDNAを解析する場合、接触させるステップの前に、試料から高分子量DNA(例えば、混入しているゲノムDNA)を除去することが望ましい場合がある。また、変性は後続のライゲーションステップを妨害し得るという点で、比較的低い温度(例えば、65℃もしくはそれ未満、または60℃もしくはそれ未満)で熱不活化することができるヌクレアーゼを使用して、DNAの変性を回避することが望ましい場合もある。
試料を、中間メチル化分子を含有する第3の部分試料を含む、3つの部分試料に分配する場合、第3の部分試料は、一部の実施形態では、メチル化感受性ヌクレアーゼと接触させられる。そのようなステップは、接触させるステップと関連する本明細書の他の箇所に記載される特色のうちのいずれかを有し得、上記で考察されるように、タグ付けするまたはアダプターを付着するステップの前または後に行われ得る。一部の実施形態では、第1および第3の部分試料は、メチル化感受性ヌクレアーゼと接触させる前に、組み合わされる。そのようなステップは、接触させるステップと関連する本明細書の他の箇所に記載される特色のうちのいずれかを有し得、上記で考察されるように、タグ付けするまたはアダプターを付着するステップの前または後に行われ得る。一部の実施形態では、第1および第3の部分試料は、組み合わせる前に、差次的にタグ付けされる。
一部の実施形態では、DNAは、ヌクレアーゼと接触させた後、例えば、SPRIビーズを使用して精製される。そのような精製は、ヌクレアーゼの熱不活化後に行われ得る。あるいは、精製は、省略されてもよく、したがって、例えば、増幅などの後続のステップが、熱不活化されたヌクレアーゼを含有する部分試料に行われ得る。別の実施形態では、接触ステップは、例えば、チューブ移送と関連する消失が最小限となるように、精製試薬、例えば、SPRIビーズの存在下で行われ得る。切断および熱不活化後に、SPRIビーズは、分子クラウディング試薬(例えば、PEG)および塩を添加することによるクリーンアップに再利用され得る。
5.富化/捕捉ステップ;増幅、アダプター、バーコード
5.富化/捕捉ステップ;増幅、アダプター、バーコード
一部の実施形態では、本明細書に開示される方法は、DNA、例えば、cfDNAの標的領域の1つまたは複数のセットを捕捉するステップを含む。捕捉は、当技術分野において公知の任意の好適なアプローチを使用して行われ得る。
一部の実施形態では、捕捉するステップは、捕捉しようとするDNAを、標的特異的プローブのセットと接触させることを含む。標的特異的プローブのセットは、上述の実施形態および下記のプローブに関連する節におけるものを含むがこれらに限定されない、標的特異的プローブのセットに関して本明細書に記載される特色のうちのいずれかを有し得る。捕捉するステップは、本明細書において開示される方法の間に調製される1つまたは複数の部分試料に行われ得る。一部の実施形態では、DNAは、少なくとも第1の部分試料または第2の部分試料、例えば、少なくとも第1の部分試料および第2の部分試料から、捕捉される。一部の実施形態では、部分試料は、差次的にタグ付けされ(例えば、本明細書に記載されるように)、次いで、プールされた後、捕捉を受ける。
捕捉するステップは、一般的に長さ、塩基組成などのプローブの特色にある程度依存する特異的核酸ハイブリダイゼーションにとって好適な条件を使用して実施され得る。当業者は、核酸ハイブリダイゼーションに関して当技術分野で一般的な知識を考慮して適切な条件を熟知している。一部の実施形態では、標的特異的プローブおよびDNAの複合体が形成される。
一部の実施形態では、本明細書に記載される方法は、複数の標的領域のセットに関して、試験対象から得られたcfDNAを捕捉するステップを含む。標的領域は、エピジェネティック標的領域を含み、これは、それらが腫瘍を起源とするか、健康な細胞を起源とするかに応じて、メチル化レベルおよび/または断片化パターンに相違を示し得る。標的領域はまた、配列可変標的領域を含み、これは、それらが腫瘍を起源とするか、健康な細胞を起源とするかに応じて、配列に相違を示し得る。捕捉するステップは、cfDNA分子の捕捉されたセットを産生し、配列可変標的領域セットに対応するcfDNA分子は、cfDNA分子の捕捉されたセットにおいて、エピジェネティック標的領域セットに対応するcfDNA分子よりも高い捕捉収率で捕捉される。捕捉するステップ、捕捉収率、および関連する態様に関するさらなる考察については、全ての目的に関して参照により本明細書に組み込まれる、WO2020/160414を参照されたい。
一部の実施形態では、本明細書に記載される方法は、試験対象から得られたcfDNAを、標的特異的プローブのセットと接触させることを含み、標的特異的プローブのセットは、エピジェネティック標的領域セットに対応するcfDNAよりも高い捕捉収率で配列可変標的領域セットに対応するcfDNAを捕捉するように構成される。
配列可変標的領域を十分な信頼度または精度で解析するためには、エピジェネティック標的領域を解析するために必要であり得るよりも大きい深度のシーケンシングが必要であり得ることから、配列可変標的領域セットに対応するcfDNAを、エピジェネティック標的領域セットに対応するcfDNAよりも高い捕捉収率で捕捉することは有益であり得る。断片化パターン(例えば、転写開始部位またはCTCF結合部位の乱れに関して試験するために)または断片の存在量(例えば、高メチル化および低メチル化分配における)を決定するために必要なデータ量は、一般的に、がん関連配列突然変異の存在または非存在を決定するために必要なデータ量よりも少ない。異なる収率で標的領域セットを捕捉することは、同じシーケンシングの実行においてシーケンシングの異なる深度まで標的領域をシーケンシングすることを容易にし得る(例えば、プールした混合物を使用しておよび/または同じシーケンシングセル中で)。
様々な実施形態では、方法は、本明細書における考察と一貫して、捕捉されたcfDNAを、例えば、エピジェネティックおよび配列可変標的領域セットに関して様々な程度のシーケンシング深度までシーケンシングするステップをさらに含む。
一部の実施形態では、標的特異的プローブおよびDNAの複合体を、標的特異的プローブに結合していないDNAから分離する。例えば、標的特異的プローブが共有結合または非共有結合によって固体支持体に結合している場合、洗浄または吸引ステップを使用して非結合材料を分離することができる。あるいは、複合体が、非結合材料とは別個のクロマトグラフィー特性を有する場合(例えば、プローブが、クロマトグラフィー樹脂に結合するリガンドを含む場合)、クロマトグラフィーを使用することができる。
本明細書において他所で詳細に考察するように、標的特異的プローブのセットは、配列可変標的領域セットのプローブおよびエピジェネティック標的領域セットのプローブなどの複数のセットを含み得る。一部のそのような実施形態では、捕捉するステップは、同じ容器で同時に、配列可変標的領域セットのプローブおよびエピジェネティック標的領域セットのプローブについて実施され、例えば配列可変標的領域セットおよびエピジェネティック標的領域セットのプローブは、同じ組成物中にある。このアプローチは、比較的合理化されたワークフローを提供する。一部の実施形態では、配列可変標的領域セットのプローブの濃度は、エピジェネティック標的領域セットのプローブの濃度よりも高い。
あるいは、捕捉するステップは、第1の容器中で配列可変標的領域プローブセットについて、および第2の容器中でエピジェネティック標的領域プローブセットについて実施されるか、または接触させることは、第1の時間および第1の容器で配列可変標的領域プローブセットについて、ならびに第1の時間の前もしくは後の第2の時間でエピジェネティック標的領域プローブセットについて実施される。このアプローチは、配列可変標的領域セットに対応する捕捉されたDNAおよびエピジェネティック標的領域セットに対応する捕捉されたDNAを含む個別の第1および第2の組成物の調製を可能にする。組成物を、所望のように個別にプロセシングし(例えば、本明細書において他所で記載されるようにメチル化に基づいて分画するために)、適切な割合で組み換えて、さらなるプロセシングおよびシーケンシングなどの解析のための材料を提供することができる。
一部の実施形態では、DNAは増幅される。一部の実施形態では、増幅は、捕捉するステップの前に実施される。一部の実施形態では、増幅は、捕捉するステップの後に実施される。
一部の実施形態では、アダプターは、DNAに含まれる。これは、例えば上記のように、例えばプライマーの5’部分にアダプターを提供することによって、増幅手順と同時に行われ得る。あるいは、アダプターは、ライゲーションなどの他のアプローチによって付加され得る。
一部の実施形態では、バーコードであり得るかまたはそれを含み得るタグは、DNAに含まれる。タグは、核酸の起源の同定を容易にし得る。例えば、並列シーケンシングのために複数の試料をプールした後に、バーコードを使用して、DNAが由来する起源(例えば、対象)を同定することが可能であり得る。これは、例えば、上述のように、例えば、プライマーの5’部分にバーコードを提供することによって、増幅手順と同時に行うことができる。一部の実施形態では、アダプターおよびタグ/バーコードは、同じプライマーまたはプライマーセットによって提供される。例えば、バーコードは、アダプターの3’およびプライマーの標的にハイブリダイズする部分の5’に位置付けられ得る。あるいは、バーコードは、他のアプローチ、例えば、ライゲーションによって、必要に応じて同じライゲーション基質においてアダプターと一緒に、付加され得る。
増幅、タグ、およびバーコードに関するさらなる詳細は、以下の「方法の全般的特色」の節において考察されており、これは、実用的な程度で、前述の実施形態ならびに序説および概要の節に記載される実施形態のいずれかと組み合わせることができる。
6.捕捉されたセット
6.捕捉されたセット
一部の実施形態では、DNA(例えば、cfDNA)の捕捉されたセットが提供される。開示される方法に関して、DNAの捕捉されたセットは、例えば、本明細書に記載されるように分配するステップの後に捕捉するステップを行うことによって、提供され得る。捕捉されたセットは、配列可変標的領域セット、エピジェネティック標的領域セット、またはこれらの組合せに対応するDNAを含み得る。
一部の実施形態では、第1の標的領域セットは、少なくともエピジェネティック標的領域を含む、第1の部分試料から捕捉される。第1の部分試料から捕捉されるエピジェネティック標的領域は、高メチル化可変標的領域を含み得る。一部の実施形態では、高メチル化可変標的領域は、健康な対象に由来するcfDNAにおいて、非メチル化であるか、または低いメチル化(例えば、バルクcfDNAと比べて、平均を下回るメチル化)を有するCpGを含有領域である。一部の実施形態では、高メチル化可変標的領域は、健康なcfDNAにおいて、少なくとも1つの他の組織タイプにおけるものよりも低いメチル化を示す、領域である。いずれの特定の理論によっても束縛されることを望むものではないが、がん細胞は、同じ組織タイプの健康な細胞よりも多くのDNAを、血流中に脱落させ得る。そのため、cfDNAの起源の組織の分布は、発癌の際に変化し得る。したがって、第1の部分試料における高メチル化可変標的領域のレベルの増加は、がんの存在(または対象の既往に応じて、再発)を示し得る。
一部の実施形態では、第2の標的領域セットは、少なくともエピジェネティック標的領域を含む、第2の部分試料から捕捉される。エピジェネティック標的領域は、低メチル化可変標的領域を含み得る。一部の実施形態では、低メチル化可変標的領域は、健康な対象に由来するcfDNAにおいて、メチル化されているか、または高いメチル化(例えば、バルクcfDNAと比べて、平均を上回るメチル化)を有するCpG含有領域である。一部の実施形態では、低メチル化可変標的領域は、健康なcfDNAにおいて、少なくとも1つの他の組織タイプにおけるものよりも高いメチル化を示す、領域である。いずれの特定の理論によっても束縛されることを望むものではないが、がん細胞は、同じ組織タイプの健康な細胞よりも多くのDNAを、血流中に脱落させ得る。そのため、cfDNAの起源の組織の分布は、発癌の際に変化し得る。したがって、第2の部分試料における低メチル化可変標的領域のレベルの増加は、がんの存在(または対象の既往に応じて、再発)を示し得る。
一部の実施形態では、捕捉された配列可変標的領域DNAの数量は、標的とされる領域のサイズ(フットプリントサイズ)の差に関して正規化した場合、捕捉されたエピジェネティック標的領域DNAの数量よりも多い。
あるいは、それぞれ、配列可変標的領域セットに対応するDNAおよびエピジェネティック標的領域セットに対応するDNAを含む、第1および第2の捕捉されたセットが提供されてもよい。第1および第2の捕捉されたセットを組み合わせて、組合せの捕捉されたセットを提供してもよい。
配列可変標的領域セットおよびエピジェネティック標的領域セットに対応するDNAを含む捕捉されたセットが、上記で考察したように組合せの捕捉されたセットを含む一部の実施形態では、配列可変標的領域セットに対応するDNAは、エピジェネティック標的領域セットに対応するDNAよりも高い濃度、例えば、1.1倍~1.2倍高い濃度、1.2倍~1.4倍高い濃度、1.4倍~1.6倍高い濃度、1.6倍~1.8倍高い濃度、1.8倍~2.0倍高い濃度、2.0倍~2.2倍高い濃度、2.2倍~2.4倍高い濃度、2.4倍~2.6倍高い濃度、2.6倍~2.8倍高い濃度、2.8倍~3.0倍高い濃度、3.0倍~3.5倍高い濃度、3.5倍~4.0、4.0倍~4.5倍高い濃度、4.5倍~5.0倍高い濃度、5.0倍~5.5倍高い濃度、5.5倍~6.0倍高い濃度、6.0倍~6.5倍高い濃度、6.5倍~7.0倍高い、7.0倍~7.5倍高い濃度、7.5倍~8.0倍高い濃度、8.0倍~8.5倍高い濃度、8.5倍~9.0倍高い濃度、9.0倍~9.5倍高い濃度、9.5倍~10.0倍高い濃度、10倍~11倍高い濃度、11倍~12倍高い濃度、12倍~13倍高い濃度、13倍~14倍高い濃度、14倍~15倍高い濃度、15倍~16倍高い濃度、16倍~17倍高い濃度、17倍~18倍高い濃度、18倍~19倍高い濃度、19倍~20倍高い濃度、20倍~30倍高い濃度、30倍~40倍高い濃度、40倍~50倍高い濃度、50倍~60倍高い濃度、60倍~70倍高い濃度、70倍~80倍高い濃度、80倍~90倍高い濃度、または90倍~100倍高い濃度で存在し得る。濃度の差の程度は、定義の節において考察されるように、標的領域のフットプリントサイズに関する正規化を説明する。
a.エピジェネティック標的領域セット
a.エピジェネティック標的領域セット
エピジェネティック標的領域セットは、新生物(例えば、腫瘍またはがん)細胞に由来するDNAと、健康な細胞、例えば、非新生物循環細胞に由来するものとを区別する可能性が高い1つまたは複数のタイプの標的領域を含み得る。そのような領域の例示的なタイプは、本明細書において詳細に考察されている。エピジェネティック標的領域セットはまた、例えば、本明細書に記載されるように、1つまたは複数の対照領域も含み得る。
一部の実施形態では、エピジェネティック標的領域セットは、少なくとも100kbp、例えば、少なくとも200kbp、少なくとも300kbp、または少なくとも400kbpのフットプリントを有する。一部の実施形態では、エピジェネティック標的領域セットは、100~20Mbp、例えば、100~200kbp、200~300kbp、300~400kbp、400~500kbp、500~600kbp、600~700kbp、700~800kbp、800~900kbp、900~1,000kbp、1~1.5Mbp、1.5~2Mbp、2~3Mbp、3~4Mbp、4~5Mbp、5~6Mbp、6~7Mbp、7~8Mbp、8~9Mbp、9~10Mbp、または10~20Mbpの範囲のフットプリントを有する。一部の実施形態では、エピジェネティック標的領域セットは、少なくとも20Mbpのフットプリントを有する。
i.高メチル化可変標的領域
i.高メチル化可変標的領域
一部の実施形態では、エピジェネティック標的領域セットは、1つまたは複数の高メチル化可変標的領域を含む。一般に、高メチル化可変標的領域は、例えば、cfDNA試料において観察されるメチル化のレベルの増加が、(例えば、cfDNAの)試料が新生物細胞、例えば、腫瘍細胞またはがん細胞によって産生されるDNAを含有する可能性の増加を示す、領域を指す。例えば、腫瘍抑制遺伝子のプロモーターの高メチル化は、反復的に観察されている。例えば、Kang et al., Genome Biol. 18:53 (2017)およびそこに引用されている参考文献を参照されたい。別の例では、上記で考察されるように、高メチル化可変標的領域は、がん性組織において、必ずしも、同じタイプの健康な組織に由来するDNAと比べてメチル化が異なるわけではないが、健康な対象において典型的なcfDNAと比べてメチル化が異なる(例えば、より多くのメチル化を有する)、領域を含み得る。例えば、がんの存在が、細胞死、例えば、がんに対応する組織タイプの細胞のアポトーシスの増加をもたらす場合、そのようながんは、少なくとも部分的に、そのような高メチル化可変標的領域を使用して検出することができる。
結腸直腸がんにおけるメチル化可変標的領域に関する広範な考察は、Lam et al., Biochim Biophys Acta. 1866:106-20 (2016)に提供されている。これらには、VIM、SEPT9、ITGA4、OSM4、GATA4、およびNDRG4が含まれる。結腸直腸がん(CRC)研究に基づく高メチル化可変標的領域の例示的なセットは、表1に提供されている。これらの遺伝子の多くは、結腸直腸がん以外のがんにも関連性を有する可能性が高く、例えば、TP53は、極めて重要な腫瘍抑制因子として広く認識されており、この遺伝子の高メチル化に基づく不活化は、一般的な発癌機序であり得る。
一部の実施形態では、高メチル化可変標的領域は、表1に列挙される座のうちの複数、例えば、表1に列挙される座のうちの少なくとも10%、20%、30%、40%、50%、60%、70%、80%、90%、または100%を含む。例えば、標的領域として含まれる各座に関して、遺伝子の転写開始部位と終止コドン(選択的にスプライシングされる遺伝子の最後の終止コドン)との間または遺伝子のプロモーター領域に結合するハイブリダイゼーション部位を有する1つまたは複数のプローブが存在し得る。一部の実施形態では、1つまたは複数のプローブは、表1における遺伝子の転写開始部位から300bp以内、例えば、200または100bp以内に結合する。
様々なタイプの肺がんにおけるメチル化可変標的領域は、例えば、Ooki et al., Clin. Cancer Res. 23:7141-52 (2017)、Belinksy, Annu. Rev. Physiol. 77:453-74 (2015)、Hulbert et al., Clin. Cancer Res. 23:1998-2005 (2017)、Shi et al., BMC Genomics 18:901 (2017)、Schneider et al., BMC Cancer. 11:102 (2011)、Lissa et al., Transl Lung Cancer Res 5(5):492-504 (2016)、Skvortsova et al., Br. J. Cancer. 94(10):1492-1495 (2006)、Kim et al., Cancer Res. 61:3419-3424 (2001)、Furonaka et al., Pathology International 55:303-309 (2005)、Gomes et al., Rev. Port. Pneumol. 20:20-30 (2014)、Kim et al., Oncogene. 20:1765-70 (2001)、Hopkins-Donaldson et al., Cell Death Differ. 10:356-64 (2003)、Kikuchi et al., Clin. Cancer Res. 11:2954-61 (2005)、Heller et al., Oncogene 25:959-968 (2006)、Licchesi et al., Carcinogenesis. 29:895-904 (2008)、Guo et al., Clin. Cancer Res. 10:7917-24 (2004)、Palmisano et al., Cancer Res. 63:4620-4625 (2003)、およびToyooka et al., Cancer Res. 61:4556-4560, (2001)において詳細に考察されている。
肺がん研究に基づく高メチル化可変標的領域の例示的なセットは、表2に提供されている。これらの遺伝子の多くは、肺がん以外のがんにも関連性を有する可能性が高く、例えば、Casp8(カスパーゼ8)は、プログラム細胞死における鍵となる酵素であり、この遺伝子の高メチル化に基づく不活化は、肺がんに限定されない一般的な発癌機序であり得る。さらに、いくつかの遺伝子は、表1および2の両方に出現し、一般性を示す。
表2において同定される標的領域に関する前述の実施形態のうちのいずれかを、表1において同定される標的領域に関して上述された実施形態のうちのいずれかと組み合わせてもよい。一部の実施形態では、高メチル化可変標的領域は、表1または表2に列挙される座のうちの複数、例えば、表1または表2に列挙される座のうちの少なくとも10%、20%、30%、40%、50%、60%、70%、80%、90%、または100%を含む。
さらなる高メチル化標的領域は、例えば、Cancer Genome Atlasから得ることができる。Kang et al., Genome Biology 18:53 (2017)は、乳房、結腸、腎臓、肝臓、および肺に由来する高メチル化標的領域を使用したCancerLocatorと称される確率的方法の構築について記載している。一部の実施形態では、高メチル化標的領域は、がんの1つまたは複数のタイプに特異的であり得る。したがって、一部の実施形態では、高メチル化標的領域は、乳がん、結腸がん、腎臓がん、肝臓がん、および肺がんのうちの1つ、2つ、3つ、4つ、または5つにおいて高メチル化を集合的に示す高メチル化標的領域の1つ、2つ、3つ、4つ、または5つのサブセットを含む。
一部の実施形態では、異なるエピジェネティック標的領域が、第1および第2の部分試料から捕捉される場合、第1の部分試料から捕捉されるエピジェネティック標的領域は、高メチル化可変標的領域を含む。
ii.低メチル化可変標的領域
ii.低メチル化可変標的領域
全体的な低メチル化は、様々ながんにおいて共通して観察される現象である。例えば、Hon et al., Genome Res. 22:246-258 (2012)(乳がん)、Ehrlich, Epigenomics 1:239-259 (2009)(結腸がん、卵巣がん、前立腺がん、白血病、肝細胞がん、および子宮頸がんにおける低メチル化の観察に言及した総説論文)を参照されたい。例えば、反復エレメント、例えば、LINE1エレメント、Aluエレメント、セントロメアタンデムリピート、ペリセントロメアタンデムリピート、およびサテライトDNAなどの領域、ならびに健康な細胞において通常メチル化されている遺伝子間領域は、腫瘍細胞において、低減されたメチル化を示し得る。したがって、一部の実施形態では、エピジェネティック標的領域セットは、観察されるメチル化のレベルの減少が、(例えば、cfDNAの)試料が新生物細胞、例えば、腫瘍細胞またはがん細胞によって産生されるDNAを含有する可能性の増加を示す、低メチル化可変標的領域を含む。別の例では、上記で考察されるように、低メチル化可変標的領域は、がん性組織において、必ずしも、同じタイプの健康な組織に由来するDNAと比べてメチル化が異なるわけではないが、健康な対象において典型的なcfDNAと比べてメチル化が異なる(例えば、あまり非メチル化である)、領域を含み得る。例えば、がんの存在が、細胞死、例えば、がんに対応する組織タイプの細胞のアポトーシスの増加をもたらす場合、そのようながんは、少なくとも部分的に、そのような低メチル化可変標的領域を使用して検出することができる。
一部の実施形態では、低メチル化可変標的領域は、反復エレメントおよび/または遺伝子間領域を含む。一部の実施形態では、反復エレメントは、LINE1エレメント、Aluエレメント、セントロメアタンデムリピート、ペリセントロメアタンデムリピート、および/またはサテライトDNAのうちの1つ、2つ、3つ、4つ、または5つを含む。
がんに関連する低メチル化を示す例示的な特定のゲノム領域としては、ヒト第1染色体のヌクレオチド8403565~8953708および151104701~151106035が挙げられる。一部の実施形態では、低メチル化可変標的領域は、これらの領域のうちの一方または両方と重複するか、またはそれを含む。
一部の実施形態では、異なるエピジェネティック標的領域が、第1および第2の部分試料から捕捉される場合、第2の部分試料から捕捉されるエピジェネティック標的領域は、低メチル化可変標的領域を含む。一部の実施形態では、第2の部分試料から捕捉されるエピジェネティック標的領域は、低メチル化可変標的領域を含み、第1の部分試料から捕捉されるエピジェネティック標的領域は、高メチル化可変標的領域を含む。
iii.CTCF結合領域
iii.CTCF結合領域
CTCFは、クロマチン構成に寄与し、しばしば、コヒーシンと共局在化する、DNA結合タンパク質である。CTCF結合部位の乱れが、様々な異なるがんにおいて報告されている。例えば、Katainen et al., Nature Genetics, doi:10.1038/ng.3335, published online 8 June 2015、Guo et al., Nat. Commun. 9:1520 (2018)を参照されたい。CTCF結合は、シーケンシングによって、例えば、断片長解析を通じて検出することができる、cfDNAにおける認識可能なパターンをもたらす。シーケンシングに基づく断片長解析に関する詳細は、Snyder et al., Cell 164:57-68 (2016)、WO2018/009723、およびUS20170211143A1において提供されており、これらのそれぞれは、参照により本明細書に組み込まれる。
したがって、CTCF結合の乱れは、cfDNAの断片化パターンに変動をもたらす。そのため、CTCF結合部位は、断片化可変標的領域の1つのタイプを表す。
多数の公知のCTCF結合部位が存在する。例えば、例えばその各々が参照により組み込まれる、insulatordb.uthsc.edu/においてインターネット上で利用可能なCTCFBSDB(CTCF結合部位データベース)、Cuddapah et al., Genome Res. 19:24-32 (2009)、Martin et al., Nat. Struct. Mol. Biol. 18:708-14 (2011)、Rhee et al., Cell. 147:1408-19 (2011)を参照されたい。例示的なCTCF結合部位は、第8染色体のヌクレオチド56014955~56016161、および第13染色体のヌクレオチド95359169~95360473である。
したがって、一部の実施形態では、エピジェネティック標的領域セットは、CTCF結合領域を含む。一部の実施形態では、CTCF結合領域は、少なくとも10個、20個、50個、100個、200個、もしくは500個のCTCF結合領域、または10~20個、20~50個、50~100個、100~200個、200~500個、もしくは500~1000個のCTCF結合領域、例えば、上述または上記に列挙されたCTCFBSDBもしくはCuddapahら、Martinら、もしくはRheeらの論文のうちの1つもしくは複数に記載されるCTCF結合領域などを含む。
一部の実施形態では、CTCF部位のうちの少なくともいくつかは、メチル化されていても、メチル化されていなくてもよく、ここで、メチル化状態は、細胞ががん細胞であるかそうでないかと相関する。一部の実施形態では、エピジェネティック標的領域セットは、CTCF結合部位の少なくとも100bp、少なくとも200bp、少なくとも300bp、少なくとも400bp、少なくとも500bp、少なくとも750bp、少なくとも1000bp上流および下流の領域を含む。
iv.転写開始部位
iv.転写開始部位
転写開始部位もまた、新生物細胞において、乱れを示し得る。例えば、造血系列の健康な細胞における様々な転写開始部位におけるヌクレオソーム構成(これは、健康な個体におけるcfDNAに実質的に寄与する)は、新生物細胞におけるそれらの転写開始部位では、ヌクレオソーム構成が異なり得る。これは、Snyder et al., Cell 164:57-68 (2016)、WO2018/009723、およびUS20170211143A1において一般に考察されているように、シーケンシングによって検出することができる異なるcfDNAパターンをもたらす。別の例では、転写開始部位は、がん性組織において、必ずしも、同じタイプの健康な組織に由来するDNAと比べてエピジェネティックに異なるわけではないが、健康な対象において典型的であるcfDNAと比べてエピジェネティックに異なる(例えば、ヌクレオソーム構成に関して)。例えば、がんの存在が、細胞死、例えば、がんに対応する組織タイプの細胞のアポトーシスの増加をもたらす場合、そのようながんは、少なくとも部分的に、そのような転写開始部位を使用して検出することができる。
したがって、転写開始部位の乱れもまた、cfDNAの断片化パターンに変動をもたらす。そのため、転写開始部位もまた、断片化可変標的領域の1つのタイプを表す。
ヒト転写開始部位は、btss.hgc.jpにおいてインターネット上で利用可能なDBTSS(DataBase of Human Transcription Start Sites)から利用可能であり、Yamashita et al., Nucleic Acids Res. 34(Database issue): D86-D89 (2006)において記載されており、これは、参照により本明細書に組み込まれる。
したがって、一部の実施形態では、エピジェネティック標的領域セットは、転写開始部位を含む。一部の実施形態では、転写開始部位は、少なくとも10個、20個、50個、100個、200個、もしくは500個の転写開始部位、または10~20個、20~50個、50~100個、100~200個、200~500個、もしくは500~1000個の転写開始部位、例えば、DBTSSにおいて列挙されている転写開始部位などを含む。一部の実施形態では、転写開始部位のうちの少なくともいくつかは、メチル化されていても、メチル化されていなくてもよく、ここで、メチル化状態は、細胞ががん細胞であるかそうでないかと相関する。一部の実施形態では、エピジェネティック標的領域セットは、転写開始部位の少なくとも100bp、少なくとも200bp、少なくとも300bp、少なくとも400bp、少なくとも500bp、少なくとも750bp、少なくとも1000bp上流および下流の領域を含む。
v.局所増幅
v.局所増幅
局所増幅は、体細胞突然変異であるが、それらは、ある特定のエピジェネティック変化、例えば、メチル化の変化を検出するためのアプローチと類似の様式で、読み取りデータの頻度に基づいてシーケンシングすることによって検出することができる。そのため、がんにおいて局所増幅を示し得る領域は、エピジェネティック標的領域セットに含まれ得、AR、BRAF、CCND1、CCND2、CCNE1、CDK4、CDK6、EGFR、ERBB2、FGFR1、FGFR2、KIT、KRAS、MET、MYC、PDGFRA、PIK3CA、およびRAF1のうちの1つまたは複数を含み得る。例えば、一部の実施形態では、エピジェネティック標的領域セットは、前述の標的のうちの少なくとも2個、3個、4個、5個、6個、7個、8個、9個、10個、11個、12個、13個、14個、15個、16個、17個、または18個を含む。
vi.メチル化対照領域
vi.メチル化対照領域
データの検証を容易にするために対照領域を含めることは有用であり得る。一部の実施形態では、エピジェネティック標的領域セットは、DNAががん細胞または正常細胞に由来するか否かによらず、本質的に全ての試料においてメチル化または非メチル化であると予想される対照領域を含む。一部の実施形態では、エピジェネティック標的領域セットは、本質的に全ての試料において低メチル化であると予想される対照低メチル化領域を含む。一部の実施形態では、エピジェネティック標的領域セットは、本質的に全ての試料において高メチル化であると予想される対照高メチル化領域を含む。
b.配列可変標的領域セット
b.配列可変標的領域セット
一部の実施形態では、配列可変標的領域セットは、がんにおいて体細胞突然変異を受けることが公知の複数の領域を含む。
一部の態様では、配列可変標的領域セットは、がんを有する対象のうちの決定された割合が、パネル内の1つまたは複数の異なる遺伝子またはゲノム領域において遺伝的変異体または腫瘍マーカーを示すように選択された、複数の異なる遺伝子またはゲノム領域(「パネル」)を標的とする。パネルは、シーケンシングのための領域を、固定数の塩基対に限定するように選択され得る。パネルは、本明細書の他の箇所に記載されるように、例えば、プローブの親和性および/または量を調整することによって、所望の量のDNAをシーケンシングするように選択され得る。パネルは、さらに、所望の配列読み取りデータ深度を達成するように選択され得る。パネルは、シーケンシングされる塩基対の量に所望される配列読み取りデータ深度または配列読み取りデータカバレッジを達成するように選択され得る。パネルは、試料中の1つまたは複数の遺伝的変異体を検出するための理論上の感度、理論上の特異度、および/または理論上の正確度を達成するように選択され得る。
領域のパネルを検出するためのプローブとしては、目的のゲノム領域(ホットスポット領域)を検出するためのもの、ならびにヌクレオソーム認識プローブ(例えば、KRASコドン12および13)を挙げることができ、ヌクレオソーム結合パターンおよびGC配列組成によって影響を受けるcfDNAカバレッジおよび断片サイズ変動の解析に基づいて捕捉を最適化するように設計され得る。本明細書において使用される領域としては、ヌクレオソーム位置およびGCモデルに基づいて最適化された非ホットスポット領域も含まれ得る。
目的のゲノムの場所の一覧の例は、表3および表4に見出すことができる。一部の実施形態では、本開示の方法において使用される配列可変標的領域セットは、表3の遺伝子のうちの少なくとも5個、少なくとも10個、少なくとも15個、少なくとも20個、少なくとも25個、少なくとも30個、少なくとも35個、少なくとも40個、少なくとも45個、少なくとも50個、少なくとも55個、少なくとも60個、少なくとも65個、または70個の少なくとも一部分を含む。一部の実施形態では、本開示の方法において使用される配列可変標的領域セットは、表3のSNVのうちの少なくとも5個、少なくとも10個、少なくとも15個、少なくとも20個、少なくとも25個、少なくとも30個、少なくとも35個、少なくとも40個、少なくとも45個、少なくとも50個、少なくとも55個、少なくとも60個、少なくとも65個、または70個を含む。一部の実施形態では、本開示の方法において使用される配列可変標的領域セットは、表3の融合体のうちの少なくとも1個、少なくとも2個、少なくとも3個、少なくとも4個、少なくとも5個、または6個を含む。一部の実施形態では、本開示の方法において使用される配列可変標的領域セットは、表3のインデルのうちの少なくとも1個、少なくとも2個、または3個の少なくとも一部分を含む。一部の実施形態では、本開示の方法において使用される配列可変標的領域セットは、表4の遺伝子のうちの少なくとも5個、少なくとも10個、少なくとも15個、少なくとも20個、少なくとも25個、少なくとも30個、少なくとも35個、少なくとも40個、少なくとも45個、少なくとも50個、少なくとも55個、少なくとも60個、少なくとも65個、少なくとも70個、または73個の少なくとも一部分を含む。一部の実施形態では、本開示の方法において使用される配列可変標的領域セットは、表4のSNVのうちの少なくとも5個、少なくとも10個、少なくとも15個、少なくとも20個、少なくとも25個、少なくとも30個、少なくとも35個、少なくとも40個、少なくとも45個、少なくとも50個、少なくとも55個、少なくとも60個、少なくとも65個、少なくとも70個、または73個を含む。一部の実施形態では、本開示の方法において使用される配列可変標的領域セットは、表4の融合体のうちの少なくとも1個、少なくとも2個、少なくとも3個、少なくとも4個、少なくとも5個、または6個を含む。一部の実施形態では、本開示の方法において使用される配列可変標的領域セットは表4のインデルのうちの少なくとも1個、少なくとも2個、少なくとも3個、少なくとも4個、少なくとも5個、少なくとも6個、少なくとも7個、少なくとも8個、少なくとも9個、少なくとも10個、少なくとも11個、少なくとも12個、少なくとも13個、少なくとも14個、少なくとも15個、少なくとも16個、少なくとも17個、または18個の少なくとも一部分を含む。これらの目的のゲノムの場所の各々は、所与のパネルの骨格領域またはホットスポット領域として同定され得る。目的のホットスポットゲノムの場所の一覧の例は、表5に見出すことができる。一部の実施形態では、本開示の方法において使用される配列可変標的領域セットは、表5の遺伝子のうちの少なくとも1個、少なくとも2個、少なくとも3個、少なくとも4個、少なくとも5個、少なくとも6個、少なくとも7個、少なくとも8個、少なくとも9個、少なくとも10個、少なくとも11個、少なくとも12個、少なくとも13個、少なくとも14個、少なくとも15個、少なくとも16個、少なくとも17個、少なくとも18個、少なくとも19個、または少なくとも20個の少なくとも一部分を含む。各ホットスポットゲノム領域は、関連する遺伝子、それが存在する染色体、遺伝子の座を表すゲノムの開始位置および終止位置、塩基対における遺伝子の座の長さ、遺伝子によってカバーされるエクソン、および目的の所与のゲノム領域が捕捉しようとし得る重要な特色(例えば、突然変異のタイプ)を含む、いくつかの特徴とともに列挙されている。
さらに、またはあるいは、好適な標的領域セットは、文献から入手可能である。例えば、参照により本明細書に組み込まれる、Gale et al., PLoS One 13: e0194630 (2018)は、配列可変標的領域セットの一部または全てとして使用することができる35個のがん関連遺伝子標的のパネルを記載する。これらの35個の標的は、AKT1、ALK、BRAF、CCND1、CDK2A、CTNNB1、EGFR、ERBB2、ESR1、FGFR1、FGFR2、FGFR3、FOXL2、GATA3、GNA11、GNAQ、GNAS、HRAS、IDH1、IDH2、KIT、KRAS、MED12、MET、MYC、NFE2L2、NRAS、PDGFRA、PIK3CA、PPP2R1A、PTEN、RET、STK11、TP53、およびU2AF1である。
一部の実施形態では、配列可変標的領域セットは、上に列挙されたがん関連遺伝子などの少なくとも10、20、30、または35個のがん関連遺伝子からの標的領域を含む。
一部の実施形態では、配列可変標的領域セットは、少なくとも50kbp、例えば、少なくとも100kbp、少なくとも200kbp、少なくとも300kbp、または少なくとも400kbpのフットプリントを有する。一部の実施形態では、配列可変標的領域セットは、100~2000kbp、例えば、100~200kbp、200~300kbp、300~400kbp、400~500kbp、500~600kbp、600~700kbp、700~800kbp、800~900kbp、900~1,000kbp、1~1.5Mbp、または1.5~2Mbpの範囲のフットプリントを有する。一部の実施形態では、配列可変標的領域セットは、少なくとも2Mbpのフットプリントを有する。
7.対象
7.対象
一部の実施形態では、DNA(例えば、cfDNA)は、がんを有する対象から得られる。一部の実施形態では、DNA(例えば、cfDNA)は、がんを有することが疑われる対象から得られる。一部の実施形態では、DNA(例えば、cfDNA)は、腫瘍を有する対象から得られる。一部の実施形態では、DNA(例えば、cfDNA)は、腫瘍を有することが疑われる対象から得られる。一部の実施形態では、DNA(例えば、cfDNA)は、新生物を有する対象から得られる。一部の実施形態では、DNA(例えば、cfDNA)は、新生物を有することが疑われる対象から得られる。一部の実施形態では、DNA(例えば、cfDNA)は、(例えば、化学療法、外科的切除、放射線照射、またはこれらの組合せの後に)腫瘍、がん、または新生物から寛解した対象から得られる。前述の実施形態のいずれかでは、がん、腫瘍、もしくは新生物、または疑われるがん、腫瘍、もしくは新生物は、肺、結腸、直腸、腎臓、乳房、前立腺、または肝臓のものであり得る。一部の実施形態では、がん、腫瘍、もしくは新生物、または疑われるがん、腫瘍、もしくは新生物は、肺のものである。一部の実施形態では、がん、腫瘍、もしくは新生物、または疑われるがん、腫瘍、もしくは新生物は、結腸または直腸のものである。一部の実施形態では、がん、腫瘍、もしくは新生物、または疑われるがん、腫瘍、もしくは新生物は、乳房のものである。一部の実施形態では、がん、腫瘍、もしくは新生物、または疑われるがん、腫瘍、もしくは新生物は、前立腺のものである。前述の実施形態のいずれかでは、対象は、ヒト対象であり得る。
8.第1および第2の部分試料またはその一部分に由来するDNAのプール
8.第1および第2の部分試料またはその一部分に由来するDNAのプール
一部の実施形態では、方法は、処置された部分試料または第2の部分試料のDNAの少なくとも一部分(低メチル化分配とも称される)および第1の部分試料または追加の処置された部分試料のDNAの少なくとも一部分(高メチル化分配とも称される)を含むプールを調製するステップを含む。例えば、エピジェネティック標的領域および/または配列可変標的領域を含む、標的領域は、プールから捕捉され得る。本明細書の他の箇所に記載される部分試料の少なくとも一部分から標的領域セットを捕捉するステップは、第1および第2の部分試料に由来するDNAを含むプールに対して行われる捕捉ステップを包含する。プール内のDNAを増幅させるステップは、プールから標的領域を捕捉する前に行われ得る。捕捉するステップは、本明細書の他の箇所で捕捉ステップに関して記載される特色のうちのいずれかを有し得る。
エピジェネティック標的領域は、本明細書の他の箇所で考察されるように、それらが、腫瘍を起源とするかもしくは健康な細胞を起源とするか、またはどの組織タイプを起源とするかに応じて、メチル化レベルおよび/または断片化パターンに相違を示し得る。配列可変標的領域は、それらが腫瘍を起源とするか、健康な細胞を起源とするかに応じて、配列に相違を示し得る。
低メチル化分配に由来するエピジェネティック標的領域の解析は、一部の適用において、高メチル化および低メチル化分配に由来する配列可変標的領域ならびに高メチル化分配に由来するエピジェネティック標的領域の解析よりも、情報量が少ない場合がある。そのため、配列可変標的領域およびエピジェネティック標的領域を捕捉する方法では、後者は、高メチル化および低メチル化分配に由来する配列可変標的領域ならびに高メチル化分配に由来するエピジェネティック標的領域のうちの1つまたは複数よりも、低い程度で捕捉され得る。例えば、配列可変標的領域は、高メチル化分配とともにプールされていない低メチル化分配の部分から捕捉され得、プールは、高メチル化分配に由来するDNAの一部(例えば、大部分、実質的に全て、または全て)および低メチル化分配に由来するDNAなしまたはその一部(例えば、少数)を用いて調製され得る。そのようなアプローチにより、低メチル化分配に由来するエピジェネティック標的領域のシーケンシングを低減または排除し、それによって、さらなる解析にとって十分であるシーケンシングデータの量を低減することができる。
一部の実施形態では、プール内の低メチル化分配のDNAのうちの少数部分を含めることで、1つまたは複数のエピジェネティック特色(例えば、メチル化または本明細書の他の箇所において考察されている他のエピジェネティック特色)の定量が、例えば、相対的に、容易になる。
一部の実施形態では、プールは、例えば、低メチル化分配のDNAのうちの約50%未満、例えば、低メチル化分配のDNAのうちの約45%未満もしくはそれに等しい、40%未満もしくはそれに等しい、35%未満もしくはそれに等しい、30%未満もしくはそれに等しい、25%未満もしくはそれに等しい、20%未満もしくはそれに等しい、15%未満もしくはそれに等しい、10%未満もしくはそれに等しい、または5%未満もしくはそれに等しい、低メチル化分配のDNAの少数部分を含む。一部の実施形態では、プールは、低メチル化分配のDNAのうちの約5%~25%を含む。一部の実施形態では、プールは、低メチル化分配のDNAのうちの約10%~20%を含む。一部の実施形態では、プールは、低メチル化分配のDNAのうちの約10%を含む。一部の実施形態では、プールは、低メチル化分配のDNAのうちの約15%を含む。一部の実施形態では、プールは、低メチル化分配のDNAのうちの約20%を含む。
一部の実施形態では、プールは、高メチル化分配の一部分を含み、これは、高メチル化分配のDNAのうちの少なくとも約50%であり得る。例えば、プールは、高メチル化分配のDNAのうちの少なくとも約55%、60%、65%、70%、75%、80%、85%、90%、または95%を含み得る。一部の実施形態では、プールは、高メチル化分配のDNAのうちの50~55%、55~60%、60~65%、65~70%、70~75%、75~80%、80~85%、85~90%、90~95%、または95~100%を含む。一部の実施形態では、第2のプールは、高メチル化分配の全てまたは実質的に全てを含む。
一部の実施形態では、方法は、低メチル化分配のDNAのうちの少なくとも一部分を含む、第1のプールを調製するステップを含む。一部の実施形態では、方法は、高メチル化分配のDNAのうちの少なくとも一部分を含む、第2のプールを調製するステップを含む。一部の実施形態では、第1のプールは、高メチル化分配のDNAのうちの一部分をさらに含む。一部の実施形態では、第2のプールは、低メチル化分配のDNAのうちの一部分をさらに含む。一部の実施形態では、第1のプールは、低メチル化分配のDNAのうちの大部分を含み、必要に応じて、高メチル化分配のDNAのうちの少数部分を含む。一部の実施形態では、第2のプールは、高メチル化分配のDNAのうちの大部分を含み、低メチル化分配のDNAのうちの少数部分を含む。中間メチル化分配を含む一部の実施形態では、第2のプールは、中間メチル化分配のDNAのうちの少なくとも一部分、例えば、中間メチル化分配のDNAのうちの大部分を含む。一部の実施形態では、第1のプールは、低メチル化分配のDNAのうちの大部分を含み、第2のプールは、高メチル化分配のDNAのうちの大部分および中間メチル化分配のDNAのうちの大部分を含む。
一部の実施形態では、方法は、第1のプールから少なくとも標的領域の第1のセットを捕捉するステップを含み、例えば、第1のプールは、上述の実施形態のうちのいずれかに記載される通りである。一部の実施形態では、第1のセットは、配列可変標的領域を含む。一部の実施形態では、第1のセットは、低メチル化可変標的領域および/または断片化可変標的領域を含む。一部の実施形態では、第1のセットは、配列可変標的領域および断片化可変標的領域を含む。一部の実施形態では、第1のセットは、配列可変標的領域、低メチル化可変標的領域、および断片化可変標的領域を含む。第1のプール内のDNAを増幅させるステップは、この捕捉ステップの前に行われ得る。一部の実施形態では、第1のプールから標的領域の第1のセットを捕捉するステップは、第1のプールのDNAを、標的特異的プローブの第1のセットと接触させることを含む。一部の実施形態では、標的特異的プローブの第1のセットは、配列可変標的領域に特異的な標的結合プローブを含む。一部の実施形態では、標的特異的プローブの第1のセットは、配列可変標的領域、低メチル化可変標的領域、および/または断片化可変標的領域に特異的な標的結合プローブを含む。
一部の実施形態では、方法は、第2のプールから、標的領域の第2のセットまたは標的領域の複数のセットを捕捉するステップを含み、例えば、第1のプールは、上述の実施形態のうちのいずれかに記載される通りである。一部の実施形態では、第2の複数物は、エピジェネティック標的領域、例えば、高メチル化可変標的領域および/または断片化可変標的領域を含む。一部の実施形態では、第2の複数物は、配列可変標的領域およびエピジェネティック標的領域、例えば、高メチル化可変標的領域および/または断片化可変標的領域を含む。第2のプール内のDNAを増幅させるステップは、この捕捉ステップの前に行われ得る。一部の実施形態では、第2のプールから標的領域の第2の複数のセットを捕捉するステップは、第1のプールのDNAを、標的特異的プローブの第2のセットと接触させることを含み、標的特異的プローブの第2のセットは、配列可変標的領域に特異的な標的結合プローブおよびエピジェネティック標的領域に特異的な標的結合プローブを含む。一部の実施形態では、標的領域の第1のセットおよび標的領域の第2のセットは、同一ではない。例えば、標的領域の第1のセットは、標的領域の第2のセットには存在しない1つまたは複数の標的領域を含み得る。あるいは、または追加として、標的領域の第2のセットは、標的領域の第1のセットには存在しない1つまたは複数の標的領域を含み得る。一部の実施形態では、少なくとも1つの高メチル化可変標的領域は、第1のプールからではなく、第2のプールから捕捉される。一部の実施形態では、複数の高メチル化可変標的領域は、第1のプールからではなく、第2のプールから捕捉される。一部の実施形態では、標的領域の第1のセットは、配列可変標的領域を含み、および/または標的領域の第2のセットは、エピジェネティック標的領域を含む。一部の実施形態では、標的領域の第1のセットは、配列可変標的領域および断片化可変標的領域を含み、標的領域の第2のセットは、エピジェネティック標的領域、例えば、高メチル化可変標的領域および断片化可変標的領域を含む。一部の実施形態では、標的領域の第1のセットは、配列可変標的領域、断片化可変標的領域を含み、および低メチル化可変標的領域を含み、標的領域の第2のセットは、エピジェネティック標的領域、例えば、高メチル化可変標的領域、および断片化可変標的領域を含む。
一部の実施形態では、第1のプールは、低メチル化分配のDNAのうちの大部分、および高メチル化分配のDNAのうちの一部分(例えば、約半分)を含み、第2のプールは、高メチル化分配のDNAのうちの一部分(例えば、約半分)を含む。一部のそのような実施形態では、標的領域の第1のセットは、配列可変標的領域を含み、および/または標的領域の第2のセットは、エピジェネティック標的領域を含む。配列可変標的領域および/またはエピジェネティック標的領域は、本明細書の他の箇所に記載される実施形態のうちのいずれかに記載される通りであり得る。
9.シーケンシング
9.シーケンシング
一般に、以前の増幅の有無にかかわらず、アダプターが隣接している試料核酸は、シーケンシングに供することができる。シーケンシング方法としては、例えば、サンガーシーケンシング、ハイスループットシーケンシング、パイロシーケンシング、合成によるシーケンシング、一分子シーケンシング、ナノポアシーケンシング、半導体シーケンシング、ライゲーションによるシーケンシング、ハイブリダイゼーションによるシーケンシング、デジタル遺伝子発現(Helicos)、次世代シーケンシング(NGS)、合成による一分子シーケンシング(SMSS)(Helicos)、大規模並列シーケンシング、クローン単一分子アレイ(Solexa)、ショットガンシーケンシング、Ion Torrent、Oxford Nanopore、Roche Genia、マキサム-ギルバートシーケンシング、プライマーウォーキング、およびPacBio、SOLiD、Ion Torrent、またはNanoporeプラットフォームを使用したシーケンシングが挙げられる。シーケンシング反応は、様々な試料プロセシングユニットにおいて行うことができ、これは、複数のレーン、複数のチャネル、複数のウェル、または複数の試料セットを実質的に同時にプロセシングする他の手段を含み得る。試料プロセシングユニットにはまた、複数の実行のプロセシングを同時に可能にする複数の試料チャンバーが含まれ得る。
一部の実施形態では、シーケンシングするステップは、捕捉された標的領域のセットを含むライブラリーに行われ、これは、本明細書に記載される標的領域セットのうちのいずれかを含み得る。一部の実施形態では、シーケンシングするステップは、捕捉/富化を受けていない部分試料(例えば、全ゲノム部分試料)を含むライブラリーに行われる。例えば、標的領域は、第1の部分試料および第2の試料から捕捉され、次いでシーケンシングされ得るか、または標的領域は、第1の部分試料から捕捉され、接触させるステップおよびタグ付けするステップなどのプロセシングの後に、第2の部分試料と組み合わされ得るか、または標的領域は、第2の部分試料から捕捉され、接触させるステップおよびタグ付けするステップなどのプロセシングの後に、第1の部分試料と組み合わされ得るか、または第1および第2の部分試料の両方が、捕捉/富化を受けることなく、プロセシングされ組み合わされ得る。
シーケンシング反応は、少なくとも1つががんまたは他の疾患のマーカーを含有することが公知である、核酸の1つまたは複数の形態に行うことができる。シーケンシング反応はまた、試料中に存在する任意の核酸断片に行うこともできる。一部の実施形態では、ゲノムの配列カバレッジは、5%を下回る、10%を下回る、15%を下回る、20%を下回る、25%を下回る、30%を下回る、40%を下回る、50%を下回る、60%を下回る、70%を下回る、80%を下回る、90%を下回る、95%を下回る、99%を下回る、99.9%を下回る、または100%を下回り得る。一部の実施形態では、配列反応は、ゲノムの少なくとも5%、10%、15%、20%、25%、30%、40%、50%、60%、70%、または80%の配列カバレッジを提供し得る。配列カバレッジは、少なくとも5個、10個、20個、70個、100個、200個、もしくは500個の異なる遺伝子、または多くとも5000個、2500個、1000個、500個、もしくは100個の異なる遺伝子に行うことができる。
多重シーケンシングを使用して、同時のシーケンシング反応を行ってもよい。一部の場合には、無細胞核酸は、少なくとも1000回、2000回、3000回、4000回、5000回、6000回、7000回、8000回、9000回、10000回、50000回、100,000回のシーケンシング反応でシーケンシングされ得る。他の場合には、無細胞核酸は、1000回を下回る、2000回を下回る、3000回を下回る、4000回を下回る、5000回を下回る、6000回を下回る、7000回を下回る、8000回を下回る、9000回を下回る、10000回を下回る、50000回を下回る、100,000回を下回るシーケンシング反応でシーケンシングされ得る。シーケンシング反応は、逐次的に、または同時に行われてもよい。後続のデータ解析は、シーケンシング反応の全てまたは一部で行われ得る。一部の場合には、データ解析は、少なくとも1000回、2000回、3000回、4000回、5000回、6000回、7000回、8000回、9000回、10000回、50000回、100,000回のシーケンシング反応で行われ得る。他の場合には、データ解析は、1000回を下回る、2000回を下回る、3000回を下回る、4000回を下回る、5000回を下回る、6000回を下回る、7000回を下回る、8000回を下回る、9000回を下回る、10000回を下回る、50000回を下回る、100,000回を下回るシーケンシング反応で行われ得る。例示的な読み取りデータ深度は、座(塩基)1つあたり1000~50000読み取りデータである。
a.シーケンシングの差次的深度
a.シーケンシングの差次的深度
一部の実施形態では、配列可変標的領域セットに対応する核酸は、エピジェネティック標的領域セットに対応する核酸よりも大きいシーケンシング深度までシーケンシングされる。例えば、配列変異体標的領域セットに対応する核酸のシーケンシング深度は、エピジェネティック標的領域セットに対応する核酸のシーケンシング深度よりも、少なくとも1.25倍、1.5倍、1.75倍、2倍、2.25倍、2.5倍、2.75倍、3倍、3.5倍、4倍、4.5倍、5倍、6倍、7倍、8倍、9倍、10倍、11倍、12倍、13倍、14倍、もしくは15倍大きいか、または1.25倍~1.5倍、1.5倍~1.75倍、1.75倍~2倍、2倍~2.25倍、2.25倍~2.5倍、2.5倍~2.75倍、2.75倍~3倍、3倍~3.5倍、3.5倍~4倍、4倍~4.5倍、4.5倍~5倍、5倍~5.5倍、5.5倍~6倍、6倍~7倍、7倍~8倍、8倍~9倍、9倍~10倍、10倍~11倍、11倍~12倍、13倍~14倍、14倍~15倍、もしくは15倍~100倍大きくあり得る。一部の実施形態では、前記シーケンシング深度は、少なくとも2倍大きい。一部の実施形態では、前記シーケンシング深度は、少なくとも5倍大きい。一部の実施形態では、前記シーケンシング深度は、少なくとも10倍大きい。一部の実施形態では、前記シーケンシング深度は、4~10倍大きい。一部の実施形態では、前記シーケンシング深度は、4~100倍大きい。これらの実施形態の各々は、配列可変標的領域セットに対応する核酸が、エピジェネティック標的領域セットに対応する核酸よりも大きいシーケンシング深度までシーケンシングされる程度に言及している。
一部の実施形態では、配列可変標的領域セットに対応する捕捉されたcfDNA、およびエピジェネティック標的領域セットに対応する捕捉されたcfDNAは、同時に、例えば、同じシーケンシングセル(例えば、Illuminaシーケンサーのフローセル)において、ならびに/または別個に捕捉されたセットを組み換えることに起因するプールされた組成物もしくは配列可変標的領域セットに対応するcfDNAおよびエピジェネティック標的領域セットに対応する捕捉されたcfDNAを同じ容器に捕捉することによって得られた組成物であり得る同じ組成物において、シーケンシングされる。
10.解析
10.解析
一部の実施形態では、本明細書に記載される方法は、腫瘍(または新生物細胞もしくはがん細胞)によって産生されるDNAの存在を同定するステップを含む。
本方法は、対象における状態、特に、がんの存在を診断するため、状態を特徴付ける(例えば、がんをステージ分類するまたはがんの不均一性を決定する)ため、状態の処置に対する応答をモニタリングするため、状態を発症するリスクまたは状態の後続の経過の予後判定を行うために、使用することができる。本開示はまた、特定の処置選択肢の有効性を決定するのにも有用であり得る。奏功した処置選択肢では、処置が成功している場合、より多くのがんが死滅し、DNAが脱落し得るため、対象の血液中で検出されるコピー数変異または希少な突然変異の量が増加し得る。他の例では、これは生じない場合がある。別の例では、おそらくはある特定の処置選択肢は、経時的に、がんの遺伝子プロファイルと相関付けられ得る。この相関性は、治療を選択するのに有用であり得る。
加えて、がんが、処置後に寛解期にあることが観察された場合、本方法を使用して、残存疾患または疾患の再発をモニタリングすることができる。
検出することができるがんのタイプおよび数としては、血液のがん、脳のがん、肺がん、皮膚がん、鼻のがん、喉のがん、肝臓がん、骨がん、リンパ腫、膵臓がん、皮膚がん、腸がん、直腸がん、甲状腺がん、膀胱がん、腎臓がん、口腔がん、胃がん、固形状態の腫瘍、不均一な腫瘍、均一な腫瘍などを挙げることができる。がんのタイプおよび/またはステージは、突然変異、希少な突然変異、インデル、コピー数変異、塩基転換、転座、逆位、欠失、異数性、部分異数性、倍数性、染色体不安定性、染色体構造の変更、遺伝子融合、染色体融合、遺伝子トランケーション、遺伝子増幅、遺伝子重複、染色体病変、DNA病変、核酸化学修飾の異常な変化、エピジェネティックパターンの異常な変化、および核酸5-メチルシトシンの異常な変化を含む、遺伝的変異から検出することができる。
遺伝子データはまた、がんの特定の形態を特徴付けるためにも使用することができる。がんは、組成およびステージ分類の両方において、不均一であることが多い。遺伝子プロファイルデータにより、その特定のサブタイプの診断または処置に重要であり得る特定のサブタイプのがんの特徴付けが可能となり得る。この情報はまた、対象または従事者に特定のがんタイプの予後に関する手がかりを提供し、対象または従事者のいずれかが、疾患の進行に合わせて処置選択肢を適合させることを可能にし得る。一部のがんは、進行すると、より侵襲性かつ遺伝子的に不安定になり得る。他のがんは、良性、不活性、または休眠中のままであり得る。本開示のシステムおよび方法は、疾患の進行を決定するのに有用であり得る。
さらに、本開示の方法は、対象における異常な状態の不均一性を特徴付けるために使用され得る。そのような方法には、例えば、対象に由来する細胞外ポリヌクレオチドの遺伝子プロファイルを生成するステップが含まれ得、ここで、遺伝子プロファイルは、コピー数変異および希少な突然変異の解析により得られる複数のデータを含む。一部の実施形態では、異常な状態は、がんである。一部の実施形態では、異常な状態は、不均一なゲノム集団をもたらすものであり得る。がんの例では、一部の腫瘍は、がんの異なるステージにある腫瘍細胞を含むことが公知である。他の例では、不均一性は、複数の疾患病巣を構成し得る。さらに、がんの例では、おそらくは1つまたは複数の病巣が原発部位から拡がった転移の結果である複数の腫瘍病巣が、存在し得る。
本方法は、不均一な疾患における異なる細胞に由来する遺伝子情報をまとめたものであるデータのプロファイル、フィンガープリント、またはセットを生成するために使用することができる。このデータのセットは、コピー数変異、エピジェネティック変異、および突然変異の解析を、単独または組合せで含み得る。
本方法を使用して、がんまたは他の疾患を診断、予後判定、モニタリング、または観察することができる。一部の実施形態では、本明細書の方法は、胎児を診断することも、予後判定することも、モニタリングすることも含まず、そのため、非侵襲性の出生前検査を対象としない。他の実施形態では、これらの方法論は、DNAおよび他のポリヌクレオチドが母体分子と共循環し得る、出生前の対象におけるがんまたは他の疾患を診断、予後判定、モニタリング、または観察するために、妊娠している対象において用いられ得る。
第2の部分試料を、第1の部分試料のDNA内の第1の核酸塩基に対してDNA内の第2の核酸塩基とは異なって影響を及ぼす手順に供するステップを含む、NGSを通じてMBDビーズにより分配されるライブラリーの分子タグ同定のための例示的な方法は、以下の通りである。
1.メチル結合ドメインタンパク質-ビーズ精製キットを使用して、抽出されたDNA試料(例えば、ヒト試料に由来する抽出された血液血漿DNA、これは、必要に応じて、本明細書に記載される標的捕捉に供されている)を物理的に分配し、下流プロセシングのためにプロセスからの全ての溶出物を保管すること。
2.差次的分子タグおよびNGSにより実行されるアダプター配列の各分配への並行した適用。例えば、高メチル化、残留メチル化(「ウォッシュ」)、および低メチル化分配を、分子タグを有するNGS-アダプターとライゲーションする。
3.低メチル化分配を、本明細書に記載されるもののうちのいずれかなど、DNA内の第1の核酸塩基に対してDNA内の第2の核酸塩基とは異なって影響を及ぼす手順に供する。
4.全ての分子タグ付けした分配を組み換え、続いて、アダプター特異的DNAプライマー配列を使用して増幅させる。
5.目的のゲノム領域(例えば、がん特異的遺伝的変異体および差次的にメチル化された領域)を標的とする、組み換え、増幅させた全ライブラリーの捕捉/ハイブリダイゼーション。
6.捕捉されたDNAライブラリーを再増幅させ、試料タグを付加する。異なる試料をプールし、NGS機器で多重にアッセイする。
7.分子タグを使用して一意的分子を同定する、NGSデータのバイオインフォマティクス解析、ならびに試料の差次的にMBD分配された分子へのデコンボリューション。この解析により、標準的な遺伝子シーケンシング/変異体検出と同時に、ゲノム領域に関して相対的5-メチルシトシンの情報を得ることができる。
1.メチル結合ドメインタンパク質-ビーズ精製キットを使用して、抽出されたDNA試料(例えば、ヒト試料に由来する抽出された血液血漿DNA、これは、必要に応じて、本明細書に記載される標的捕捉に供されている)を物理的に分配し、下流プロセシングのためにプロセスからの全ての溶出物を保管すること。
2.差次的分子タグおよびNGSにより実行されるアダプター配列の各分配への並行した適用。例えば、高メチル化、残留メチル化(「ウォッシュ」)、および低メチル化分配を、分子タグを有するNGS-アダプターとライゲーションする。
3.低メチル化分配を、本明細書に記載されるもののうちのいずれかなど、DNA内の第1の核酸塩基に対してDNA内の第2の核酸塩基とは異なって影響を及ぼす手順に供する。
4.全ての分子タグ付けした分配を組み換え、続いて、アダプター特異的DNAプライマー配列を使用して増幅させる。
5.目的のゲノム領域(例えば、がん特異的遺伝的変異体および差次的にメチル化された領域)を標的とする、組み換え、増幅させた全ライブラリーの捕捉/ハイブリダイゼーション。
6.捕捉されたDNAライブラリーを再増幅させ、試料タグを付加する。異なる試料をプールし、NGS機器で多重にアッセイする。
7.分子タグを使用して一意的分子を同定する、NGSデータのバイオインフォマティクス解析、ならびに試料の差次的にMBD分配された分子へのデコンボリューション。この解析により、標準的な遺伝子シーケンシング/変異体検出と同時に、ゲノム領域に関して相対的5-メチルシトシンの情報を得ることができる。
上に示される方法を含むがこれらに限定されない本明細書に記載される方法のうちの一部の実施形態では、分子タグは、DNA内の第1の核酸塩基に対してDNA内の第2の核酸塩基とは異なって影響を及ぼす手順によって変更されないヌクレオチド、例えば、本明細書に記載されるもののうちのいずれか(例えば、手順がバイサルファイト変換またはmCに影響を及ぼさない任意の他の変換である場合、A、T、およびGとともにmC、手順がhmCに影響を及ぼさない変換である場合、A、T、およびGとともにhmCなど)からなる。上に示される方法を含むがこれらに限定されない本明細書に記載される方法のうちの一部の実施形態では、分子タグは、DNA内の第1の核酸塩基に対してDNA内の第2の核酸塩基とは異なって影響を及ぼす手順によって変更されるヌクレオチド、例えば、本明細書に記載されるもののうちのいずれかを含まない(例えば、手順がバイサルファイト変換またはCに影響を及ぼす任意の他の変換である場合、タグは、改変されていないCを含まず、手順がmCに影響を及ぼす変換である場合、タグは、mCを含まず、手順がhmCに影響を及ぼす変換である場合、hmCを含まないなど)。
一般に、DNA内の第1の核酸塩基に対してDNAの内の第2の核酸塩基とは異なって影響を及ぼす手順は、代わりに、差次的分子タグおよびNGSにより実行されるアダプター配列の各分配への並行した適用のステップの前に、行われてもよい。例えば、これは、DNA内の第1の核酸塩基に対してDNA内の第2の核酸塩基とは異なって影響を及ぼす手順が、分離、例えば、hmC-シールである場合に行われてもよく、そのような場合には、分離された集団は、それら自体が、互いに対して差次的にタグ付けされていてもよい。そのような例示的な方法は、以下の通りである。
1.メチル結合ドメインタンパク質-ビーズ精製キットを使用して、抽出されたDNA試料(例えば、ヒト試料に由来する抽出された血液血漿DNA、これは、必要に応じて、本明細書に記載される標的捕捉に供されている)を物理的に分配し、下流プロセシングのためにプロセスからの全ての溶出物を保管すること。
2.低メチル化分配を、本明細書に記載されるもののうちのいずれかなど、DNA内の第1の核酸塩基に対してDNA内の第2の核酸塩基とは異なって影響を及ぼす手順に供する。
3.差次的分子タグおよびNGSにより実行されるアダプター配列の各分配への並行した適用。例えば、高メチル化分配(または該当する場合には、高メチル化分配の2つもしくはそれよりも多くの部分分配)、残留メチル化(「ウォッシュ」)分配、および低メチル化分配を、分子タグを有するNGS-アダプターとライゲーションする。
4.全ての分子タグ付けした分配を組み換え、続いて、アダプター特異的DNAプライマー配列を使用して増幅させる。
5.目的のゲノム領域(例えば、がん特異的遺伝的変異体および差次的にメチル化された領域)を標的とする、組み換え、増幅させた全ライブラリーの捕捉/ハイブリダイゼーション。
6.捕捉されたDNAライブラリーを再増幅させ、試料タグを付加する。異なる試料をプールし、NGS機器で多重にアッセイする。
7.分子タグを使用して一意的分子を同定する、NGSデータのバイオインフォマティクス解析、ならびに試料の差次的にMBD分配された分子へのデコンボリューション。この解析により、標準的な遺伝子シーケンシング/変異体検出と同時に、ゲノム領域に関して相対的5-メチルシトシンの情報を得ることができる。
11.例示的なワークフロー
1.メチル結合ドメインタンパク質-ビーズ精製キットを使用して、抽出されたDNA試料(例えば、ヒト試料に由来する抽出された血液血漿DNA、これは、必要に応じて、本明細書に記載される標的捕捉に供されている)を物理的に分配し、下流プロセシングのためにプロセスからの全ての溶出物を保管すること。
2.低メチル化分配を、本明細書に記載されるもののうちのいずれかなど、DNA内の第1の核酸塩基に対してDNA内の第2の核酸塩基とは異なって影響を及ぼす手順に供する。
3.差次的分子タグおよびNGSにより実行されるアダプター配列の各分配への並行した適用。例えば、高メチル化分配(または該当する場合には、高メチル化分配の2つもしくはそれよりも多くの部分分配)、残留メチル化(「ウォッシュ」)分配、および低メチル化分配を、分子タグを有するNGS-アダプターとライゲーションする。
4.全ての分子タグ付けした分配を組み換え、続いて、アダプター特異的DNAプライマー配列を使用して増幅させる。
5.目的のゲノム領域(例えば、がん特異的遺伝的変異体および差次的にメチル化された領域)を標的とする、組み換え、増幅させた全ライブラリーの捕捉/ハイブリダイゼーション。
6.捕捉されたDNAライブラリーを再増幅させ、試料タグを付加する。異なる試料をプールし、NGS機器で多重にアッセイする。
7.分子タグを使用して一意的分子を同定する、NGSデータのバイオインフォマティクス解析、ならびに試料の差次的にMBD分配された分子へのデコンボリューション。この解析により、標準的な遺伝子シーケンシング/変異体検出と同時に、ゲノム領域に関して相対的5-メチルシトシンの情報を得ることができる。
11.例示的なワークフロー
分配およびライブラリー調製の例示的なワークフローが、本明細書に提供される。一部の実施形態では、分配およびライブラリー調製ワークフローの一部または全ての特色は、組み合わせて使用され得る。
a.分配
a.分配
一部の実施形態では、試料DNA(例えば、5~200ngの間)を、メチル結合ドメイン(MBD)緩衝液と混合し、磁気ビーズをMBDタンパク質とコンジュゲートさせ、一晩インキュベートする。メチル化DNA(高メチル化DNA)は、このインキュベーション中に磁気ビーズ上のMBDタンパク質に結合する。非メチル化である(低メチル化DNA)またはあまり非メチル化であるDNA(中間メチル化)は、漸増濃度の塩を含有する緩衝液で、ビーズから洗い流される。例えば、非メチル化、低メチル化、および/または中間メチル化DNAを含有する、1つ、2つ、またはそれよりも多くの分画が、そのような洗浄から得られ得る。最終的に、高塩緩衝液を使用して、MBDタンパク質から、高度メチル化DNA(高メチル化DNA)を溶出させる。一部の実施形態では、これらの洗浄により、漸増メチル化レベルを有するDNAの3つの分配(低メチル化分配、中間メチル化分画、および高メチル化分配)が得られる。
一部の実施形態では、DNAの3つの分配は、ライブラリー調製の酵素ステップの準備において脱塩および濃縮される。
b.ライブラリーの調製
b.ライブラリーの調製
一部の実施形態では(例えば、分配中のDNAを濃縮した後)、分配されたDNAは、例えば、DNA分子の末端オーバーハングを伸長させ、断片の3’末端にアデノシン残基を付加し、各DNA断片の5’末端をリン酸化することによって、ライゲーション可能となる。DNAリガーゼおよびアダプターを添加して、各分配されたDNA分子を、各末端でアダプターとライゲーションさせる。これらのアダプターは、他の分配において使用されるアダプターの分配タグと識別可能な分配タグ(例えば、非ランダム、非一意的バーコード)を含有する。小分けにしたDNAをライゲーション可能にすることおよびライゲーションを行うことの前または後のいずれかで、低メチル化分配を、本明細書に記載されるもののうちのいずれかなど、DNA内の第1の核酸塩基に対してDNA内の第2の核酸塩基とは異なって影響を及ぼす手順に供する。DNA内の第1の核酸塩基に対してDNA内の第2の核酸塩基とは異なって影響を及ぼす手順により、さらに、低メチル化分配を分配する場合、アダプターのライゲーションは、低メチル化分配の部分分配が差次的にタグ付けされ得るように、この手順の後に行うべきである。必要に応じて、高メチル化分配は、メチル化感受性ヌクレアーゼ、例えば、メチル化感受性制限酵素(例えば、HpaII、BstUI、およびHin6iのうちの1つもしくは複数、または各々)で消化させてもよい。必要に応じて、高メチル化分配は、本明細書に記載されるもののうちのいずれかなど、DNA内の第1の核酸塩基に対してDNA内の第2の核酸塩基とは異なって影響を及ぼす手順に供され得る。DNA内の第1の核酸塩基に対してDNA内の第2の核酸塩基とは異なって影響を及ぼす手順により、さらに、高メチル化分配を分配する場合、アダプターのライゲーションは、高メチル化分配の部分分配が差示的にタグ付けされ得るように、この手順の後に行うべきである。次いで、2つ、3つ、またはそれよりも多くの分配が、一緒にプールされ、増幅される(例えば、PCRによって、例えば、アダプターに特異的なプライマーを用いて)。
PCR後、増幅されたDNAは、富化の前に、清浄され、濃縮され得る。増幅されたDNAは、目的の特定の領域を標的とする、本明細書に記載されるプローブのコレクション(これは、例えば、ビオチン化RNAプローブであり得る)と接触させられる。混合物を、例えば、塩緩衝液中で、例えば、一晩インキュベートする。プローブを捕捉し(例えば、ストレプトアビジン磁気ビーズを使用して)、捕捉されなかった増幅されたDNAから、例えば、一連の塩洗浄によって分離させ、それによって、試料を富化する。富化後に、富化させた試料を、PCRによって増幅させる。一部の実施形態では、PCRプライマーは、試料タグを含有し、それによって、試料タグをDNA分子に組み込む。一部の実施形態では、異なる試料に由来するDNAが一緒にプールされ、次いで、例えば、Illumina NovaSeqシーケンサーを使用して、多重シーケンシングされる。
C.ある特定の開示される方法のさらなる特色
1.試料
C.ある特定の開示される方法のさらなる特色
1.試料
試料は、対象から単離された任意の生体試料であり得る。試料は、身体試料であり得る。試料としては、体組織、例えば、判明しているかまたは疑われる固形腫瘍、全血、血小板、血清、血漿、糞便、赤血球、白血球(white blood cell)または白血球(leucocyte)、内皮細胞、組織生検、脳脊髄液 滑液、リンパ液、腹水、間質液または細胞外液、細胞間の空間の流体が挙げられ得、歯肉溝滲出液、骨髄、胸水、脳脊髄液、唾液、粘液、喀痰、精液、汗、尿が挙げられる。試料は、好ましくは、体液、特に、血液およびその分画、ならびに尿である。試料は、対象からもともと単離されている形態であってもよく、または成分、例えば、細胞を除去もしくは追加するため、または1つの構成要素を別の構成要素と比べて富化するために、さらなるプロセシングに供されていてもよい。したがって、解析のための好ましい体液は、無細胞核酸を含有する血漿または血清である。試料は、対象から単離または取得することができ、試料解析の現場へと輸送され得る。試料は、望ましい温度、例えば、室温、4℃、-20℃、および/または-80℃で保存または発送され得る。試料は、試料解析の現場で、対象から単離または取得することができる。対象は、ヒト、哺乳動物、動物、コンパニオン動物、介助動物、または愛玩動物であり得る。対象は、がんを有し得る。対象は、がんまたは検出可能ながんの症状を有さない場合がある。対象は、1つまたは複数のがん治療、例えば、化学療法、抗体、ワクチン、または生物学のうちのいずれか1つまたは複数で処置されていてもよい。対象は、寛解期にあってもよい。対象は、がんまたは任意のがん関連遺伝子突然変異/障害に罹患しやすいと診断されていてもよく、またはされていなくてもよい。
血漿の体積は、シーケンシングされる領域の所望の読み取りデータ深度に依存し得る。例示的な体積は、0.4~40ml、5~20ml、10~20mlである。例えば、体積は、0.5mL、1mL、5mL、10mL、20mL、30mL、または40mLであり得る。試料採取される血漿の体積は、5~20mLであり得る。
試料は、ゲノム等価物を含有する様々な量の核酸を含み得る。例えば、約30ngのDNAの試料は、約10,000(104)個の半数体ヒトゲノム等価物を含有し、cfDNAの場合、約2000億(2×1011)個の個々のポリヌクレオチド分子を含有し得る。同様に、約100ngのDNAの試料は、約30,000個の半数体ヒトゲノム等価物を含有し、cfDNAの場合、約6000億個の個々の分子を含有し得る。
試料は、異なる起源、例えば、同じ対象の細胞および無細胞、異なる対象の細胞および無細胞に由来する核酸を含み得る。試料は、突然変異を有する核酸を含み得る。例えば、試料は、生殖系列突然変異および/または体細胞突然変異を有するDNAを含み得る。生殖系列突然変異は、対象の生殖系列DNAに存在する突然変異を指す。体細胞突然変異は、対象の体細胞、例えば、がん細胞を起源とする突然変異を指す。試料は、がん関連突然変異(例えば、がん関連体細胞突然変異)を有するDNAを含み得る。試料は、エピジェネティック変異体(すなわち、化学的またはタンパク質改変)を含み得、ここで、エピジェネティック変異体は、遺伝的変異体、例えば、がん関連突然変異の存在と関連付けられる。一部の実施形態では、試料は、遺伝的変異体の存在と関連するエピジェネティック変異体を含み、ここで、試料は、遺伝的変異体を含まない。
増幅前の試料中の無細胞核酸の例示的な量は、約1fg~約1μg、例えば、1pg~200ng、1ng~100ng、10ng~1000ngの範囲である。例えば、量は、最大約600ng、最大約500ng、最大約400ng、最大約300ng、最大約200ng、最大約100ng、最大約50ng、または最大約20ngの無細胞核酸分子であり得る。量は、少なくとも1fg、少なくとも10fg、少なくとも100fg、少なくとも1pg、少なくとも10pg、少なくとも100pg、少なくとも1ng、少なくとも10ng、少なくとも100ng、少なくとも150ng、または少なくとも200ngの無細胞核酸分子であり得る。量は、最大1フェムトグラム(fg)、10fg、100fg、1ピコグラム(pg)、10pg、100pg、1ng、10ng、100ng、150ng、または200ngの無細胞核酸分子であり得る。方法は、1フェムトグラム(fg)~200ngを得ることを含み得る。
無細胞DNAは、対象からのその単離の時点において、細胞内に含有されていないDNAを指す。例えば、cfDNAは、細胞を溶解することも、それ以外では細胞内DNAを抽出することもなしに、インタクトな細胞を除去した後に試料中に残留しているDNAとして、試料から単離され得る。無細胞核酸としては、DNA、RNA、およびそれらのハイブリッドが挙げられ、これには、ゲノムDNA、ミトコンドリアDNA、siRNA、miRNA、循環RNA(cRNA)、tRNA、rRNA、核小体低分子RNA(snoRNA)、Piwi相互作用RNA(piRNA)、長鎖非コードRNA(長鎖ncRNA)、またはこれらのうちのいずれかの断片が含まれる。無細胞核酸は、二本鎖、一本鎖、またはそれらのハイブリッドであり得る。無細胞核酸は、分泌または細胞死プロセス、例えば、細胞壊死およびアポトーシスを通じて、体液中に放出され得る。一部の無細胞核酸は、がん細胞、例えば、循環腫瘍DNA(ctDNA)から、体液中に放出される。その他のものは、健康な細胞から放出される。一部の実施形態では、cfDNAは、無細胞胎児DNA(cffDNA)である。一部の実施形態では、無細胞核酸は、腫瘍細胞によって産生される。一部の実施形態では、無細胞核酸は、腫瘍細胞と非腫瘍細胞との混合物によって産生される。
無細胞核酸は、約100~500ヌクレオチドの例示的なサイズ分布を有し、110~約230ヌクレオチドの分子が、分子の約90%に相当し、最頻値は約168ヌクレオチドであり、第2のマイナーピークは、240~440ヌクレオチドの間の範囲にある。
無細胞核酸は、溶液中に見出される無細胞核酸を、インタクトな細胞および体液の他の不溶性構成要素から分離する、分画または分配ステップによって、体液から単離することができる。分配するステップには、遠心分離または濾過などの技術が含まれ得る。あるいは、体液中の細胞を、溶解し、無細胞核酸および細胞核酸を、一緒にプロセシングしてもよい。一般に、緩衝液の添加および洗浄ステップの後に、核酸は、アルコールで沈殿させることができる。シリカに基づくカラムなどのさらなる洗浄ステップを使用して、夾雑物または塩を除去してもよい。バイサルファイトシーケンシング、ハイブリダイゼーション、および/またはライゲーションのための非特異的バルク担体核酸、例えば、C 1 DNA、DNA、またはタンパク質を、手順のある特定の態様、例えば、収量を最適化するために、反応全体にわたって添加してもよい。
そのようなプロセシングの後、試料は、二本鎖DNA、一本鎖DNA、および一本鎖RNAを含む、様々な形態の核酸を含み得る。一部の実施形態では、一本鎖DNAおよびRNAは、後続のプロセシングおよび解析ステップに含められるように、二本鎖形態に変換してもよい。
試料中の二本鎖DNA分子および二本鎖DNA分子に変換される一本鎖核酸分子は、一方の末端または両方の末端において、アダプターに連結され得る。典型的には、二本鎖分子は、4つ全ての標準的なヌクレオチドの存在下において、5’-3’ポリメラーゼおよび3’-5’エクソヌクレアーゼ(またはプルーフリーディング機能)を有するポリメラーゼでの処置によって、平滑末端化される。クレノウラージ断片およびT4ポリメラーゼが、好適なポリメラーゼの例である。平滑末端化されたDNA分子は、少なくとも部分的に二本鎖のアダプター(例えば、Y字形状またはベル形状のアダプター)とライゲーションされ得る。あるいは、ライゲーションを容易にするために、相補的なヌクレオチドが、試料核酸およびアダプターの平滑末端に付加されてもよい。平滑末端ライゲーションおよび付着末端ライゲーションの両方が、本明細書において企図される。平滑末端ライゲーションでは、核酸分子およびアダプタータグの両方が、平滑末端を有する。付着末端ライゲーションでは、典型的には、核酸分子は、「A」オーバーハングを有し、アダプターは、「T」オーバーハングを有する。
2.増幅
2.増幅
アダプターが隣接する試料核酸は、PCRおよび他の増幅方法によって増幅され得る。増幅は、典型的には、増幅させようとするDNA分子に隣接するアダプター内のプライマー結合部位にプライマーが結合することによって、プライミングされる。増幅方法は、サーモサイクリングの結果としての変性、アニーリング、および伸長のサイクルを含み得るか、または転写媒介増幅におけるような等温のものであってもよい。他の増幅方法としては、リガーゼ連鎖反応、鎖置換増幅、核酸配列に基づく増幅、および自家持続性配列に基づく複製法が挙げられる。
一部の実施形態では、本方法は、TテールおよびCテールアダプターを用いてdsDNAライゲーションを行い、これにより、アダプターへ連結する前に、二本鎖核酸のうちの少なくとも50、60、70、または80%の増幅がもたらされる。好ましくは、本方法は、Tテールアダプターを単独で用いて行われる対照方法と比べて、増幅される分子の量または数を、少なくとも10、15、または20%増加させる。
3.ベイトセット;捕捉部分
3.ベイトセット;捕捉部分
上記で考察されるように、試料中の核酸は、捕捉ステップに供することができ、ここで、標的配列を有する分子が、後続の解析のために捕捉される。標的の捕捉は、捕捉部分、例えば、ビオチンまたは以下に記載される他の例で標識されたオリゴヌクレオチドベイトを含むベイトセットの使用を伴い得る。プローブは、遺伝子など、領域のパネルにわたってタイリングするように選択された配列を有し得る。一部の実施形態では、ベイトセットは、本明細書の他の箇所において考察されるように、標的領域のセット、例えば、それぞれ、配列可変標的領域セットおよびエピジェネティック標的領域セットに関して、より高い捕捉収率およびより低い捕捉収率を有し得る。そのようなベイトセットは、標的分子のベイトとのハイブリダイゼーションを可能にする条件下において、試料と組み合わされる。次いで、捕捉された分子は、捕捉部分を使用して単離される。例えば、ビーズに基づくストレプトアビジンによるビオチン捕捉部分。そのような方法は、例えば、2017年12月26日に発行された米国特許第9,850,523号において、さらに説明されており、これは、参照により本明細書に組み込まれる。
捕捉部分としては、限定することなく、ビオチン、アビジン、ストレプトアビジン、特定のヌクレオチド配列を含む核酸、抗体によって認識されるハプテン、および磁気吸着可能な粒子が挙げられる。抽出部分は、結合ペア、例えば、ビオチン/ストレプトアビジンまたはハプテン/抗体のメンバーであり得る。一部の実施形態では、検体に付着した捕捉部分は、単離可能な部分、例えば、磁気吸着可能な粒子または遠心分離によって沈降させることができる大きい粒子に付着した、その結合ペアによって捕捉される。捕捉部分は、捕捉部分を有する核酸の、捕捉部分が欠如した核酸からの親和性分離を可能にする、任意のタイプの分子であり得る。例示的な捕捉部分は、固相に連結しているかもしくは連結可能なストレプトアビジンへの結合による親和性分離を可能にするビオチン、または固相に連結しているかもしくは連結可能な相補的なオリゴヌクレオチドへの結合を通じた親和性分離を可能にするオリゴヌクレオチドである。
D.標的特異的プローブのコレクション
D.標的特異的プローブのコレクション
一部の実施形態では、標的特異的プローブのコレクションを、本明細書に記載される方法において使用する。一部の実施形態では、標的特異的プローブのコレクションは、配列可変標的領域セットに対して特異的な標的結合プローブおよびエピジェネティック標的領域セットに対して特異的な標的結合プローブを含む。一部の実施形態では、配列可変標的領域セットに対して特異的な標的結合プローブの捕捉収率は、エピジェネティック標的領域セットに対して特異的な標的結合プローブの捕捉収率よりも高い(例えば、少なくとも2倍高い)。一部の実施形態では、標的特異的プローブのコレクションは、エピジェネティック標的領域セットに対して特異的なその捕捉収率よりも高い(例えば、少なくとも2倍高い)配列可変標的領域セットに対して特異的な捕捉収率を有するように構成される。
一部の実施形態では、配列可変標的領域セットに対して特異的な標的結合プローブの捕捉収率は、エピジェネティック標的領域セットに対して特異的な標的結合プローブの捕捉収率よりも少なくとも1.25倍、1.5倍、1.75倍、2倍、2.25倍、2.5倍、2.75倍、3倍、3.5倍、4倍、4.5倍、5倍、6倍、7倍、8倍、9倍、10倍、11倍、12倍、13倍、14倍、または15倍高い。一部の実施形態では、配列可変標的領域セットに対して特異的な標的結合プローブの捕捉収率は、エピジェネティック標的領域セットに対して特異的な標的結合プローブの捕捉収率よりも1.25倍~1.5倍、1.5倍~1.75倍、1.75倍~2倍、2倍~2.25倍、2.25倍~2.5倍、2.5倍~2.75倍、2.75倍~3倍、3倍~3.5倍、3.5倍~4倍、4倍~4.5倍、4.5倍~5倍、5倍~5.5倍、5.5倍~6倍、6倍~7倍、7倍~8倍、8倍~9倍、9倍~10倍、10倍~11倍、11倍~12倍、13倍~14倍、または14倍~15倍高い。
一部の実施形態では、標的特異的プローブのコレクションは、エピジェネティック標的領域セットに対するその捕捉収率よりも少なくとも1.25倍、1.5倍、1.75倍、2倍、2.25倍、2.5倍、2.75倍、3倍、3.5倍、4倍、4.5倍、5倍、6倍、7倍、8倍、9倍、10倍、11倍、12倍、13倍、14倍、または15倍高い、配列可変標的領域セットに対して特異的な捕捉収率を有するように構成される。一部の実施形態では、標的特異的プローブのコレクションは、エピジェネティック標的領域セットに対して特異的なその捕捉収率よりも1.25倍~1.5倍、1.5倍~1.75倍、1.75倍~2倍、2倍~2.25倍、2.25倍~2.5倍、2.5倍~2.75倍、2.75倍~3倍、3倍~3.5倍、3.5倍~4倍、4倍~4.5倍、4.5倍~5倍、5倍~5.5倍、5.5倍~6倍、6倍~7倍、7倍~8倍、8倍~9倍、9倍~10倍、10倍~11倍、11倍~12倍、13倍~14倍、または14倍~15倍高い、配列可変標的領域セットに対して特異的な捕捉収率を有するように構成される。
プローブのコレクションは、濃度、様々な長さ、および/または化学(例えば、親和性に影響を及ぼす)、ならびにそれらの組合せを含む様々な方法で配列可変標的領域セットに対してより高い捕捉収率を提供するように構成され得る。親和性は、以下に考察するように、プローブの長さを調整する、および/またはヌクレオチド改変を含めることによってモジュレートすることができる。
一部の実施形態では、配列可変標的領域セットに対して特異的な標的特異的プローブは、エピジェネティック標的領域セットに対して特異的な標的特異的プローブよりも高い濃度で存在する。一部の実施形態では、配列可変標的領域セットに対して特異的な標的結合プローブの濃度は、エピジェネティック標的領域セットに対して特異的な標的結合プローブの濃度よりも少なくとも1.25倍、1.5倍、1.75倍、2倍、2.25倍、2.5倍、2.75倍、3倍、3.5倍、4倍、4.5倍、5倍、6倍、7倍、8倍、9倍、10倍、11倍、12倍、13倍、14倍、または15倍高い。一部の実施形態では、配列可変標的領域セットに対して特異的な標的結合プローブの濃度は、エピジェネティック標的領域セットに対して特異的な標的結合プローブの濃度よりも1.25倍~1.5倍、1.5倍~1.75倍、1.75倍~2倍、2倍~2.25倍、2.25倍~2.5倍、2.5倍~2.75倍、2.75倍~3倍、3倍~3.5倍、3.5倍~4倍、4倍~4.5倍、4.5倍~5倍、5倍~5.5倍、5.5倍~6倍、6倍~7倍、7倍~8倍、8倍~9倍、9倍~10倍、10倍~11倍、11倍~12倍、13倍~14倍、または14倍~15倍高い。そのような実施形態では、濃度は、各セット中の個々のプローブの体積濃度あたりの平均質量を指し得る。
一部の実施形態では、配列可変標的領域セットに対して特異的な標的特異的プローブは、エピジェネティック標的領域セットに対して特異的な標的特異的プローブよりもそれらの標的に対する高い親和性を有する。親和性は、異なるプローブ化学を使用することによってを含む、当業者に公知の任意の方法でモジュレートすることができる。ある特定のヌクレオチド改変、例えばシトシン5-メチル化(ある特定の配列の文脈において)、糖の2’位でヘテロ原子を提供する改変、およびLNAヌクレオチドは、二本鎖核酸の安定性を増加させることができ、そのような改変を有するオリゴヌクレオチドが、その相補的配列に関して比較的高い親和性を有することを示している。例えば、Severin et al., Nucleic Acids Res. 39: 8740-8751 (2011); Freier et al., Nucleic Acids Res. 25: 4429-4443 (1997);米国特許第9,738,894号を参照されたい。同様に、より長い配列長は、一般的に親和性の増加を提供する。他のヌクレオチド改変、例えば、核酸塩基ヒポキサンチンをグアニンの代わりに置換すると、オリゴヌクレオチドとその相補配列の間の水素結合の量を低減させることによって親和性を低減する。一部の実施形態では、配列可変標的領域セットに対して特異的な標的特異的プローブは、その標的に対するその親和性を増加させる改変を有する。一部の実施形態では、あるいはまたはさらに、エピジェネティック標的領域セットに対して特異的な標的特異的プローブは、その標的に対するその親和性を減少させる改変を有する。一部の実施形態では、配列可変標的領域セットに対して特異的な標的特異的プローブは、エピジェネティック標的領域セットに対して特異的な標的特異的プローブよりも長い平均長および/または高い平均融解温度を有する。これらの実施形態を互いに、および/または上記で考察した濃度の差と組み合わせて、上記の任意の倍率の差またはその範囲などの、捕捉収率の所望の倍率の差を達成してもよい。
一部の実施形態では、標的特異的プローブは、捕捉部分を含む。捕捉部分は、本明細書に記載される捕捉分子のいずれか、例えばビオチンであってもよい。一部の実施形態では、標的特異的プローブは、固体支持体に、例えば捕捉部分の結合対の相互作用などを通して共有結合または非共有結合により連結される。一部の実施形態では、固体支持体はビーズ、例えば磁気ビーズである。
一部の実施形態では、配列可変標的領域セットに対して特異的な標的特異的プローブおよび/またはエピジェネティック標的領域セットに対して特異的な標的特異的プローブは、上記で考察したようにベイトセット、例えば、捕捉部分および遺伝子などの領域のパネルにわたってタイリングするために選択された配列を含むプローブである。
一部の実施形態では、標的特異的プローブは、単一の組成物中で提供される。単一の組成物は溶液(液体または凍結)であり得る。あるいは、これは凍結乾燥物であり得る。
あるいは、標的特異的プローブは、例えば、エピジェネティック標的領域セットに対して特異的なプローブを含む第1の組成物、および配列可変標的領域セットに対して特異的なプローブを含む第2の組成物を含む、複数の組成物として提供され得る。これらのプローブを適切な割合で混合して、濃度および/または捕捉収率の前述の倍率の差のいずれかを有する組み合わせたプローブ組成物を提供してもよい。あるいは、それらを個別の捕捉手順(例えば、試料のアリコートを用いて、または同じ試料で逐次的に)で使用して、捕捉されたエピジェネティック標的領域および配列可変標的領域をそれぞれ含む第1および第2の組成物を提供してもよい。
1.エピジェネティック標的領域に対して特異的なプローブ
1.エピジェネティック標的領域に対して特異的なプローブ
エピジェネティック標的領域セットのプローブは、新生物(例えば、腫瘍またはがん)細胞からのDNAを、健康な細胞、例えば非新生物の循環細胞と区別する可能性が高い1つまたは複数のタイプの標的領域に対して特異的なプローブを含み得る。そのような領域の例示的なタイプは、本明細書において、例えば捕捉されたセットに関する上記の節に詳細に考察されている。エピジェネティック標的領域セットのプローブはまた、例えば本明細書に記載される1つまたは複数の対照領域のプローブも含み得る。
一部の実施形態では、エピジェネティック標的領域セットのプローブは、少なくとも100kbp、例えば、少なくとも200kbp、少なくとも300kbp、または少なくとも400kbpのフットプリントを有する。一部の実施形態では、エピジェネティック標的領域セットは、100~20Mbp、例えば、100~200kbp、200~300kbp、300~400kbp、400~500kbp、500~600kbp、600~700kbp、700~800kbp、800~900kbp、900~1,000kbp、1~1.5Mbp、1.5~2Mbp、2~3Mbp、3~4Mbp、4~5Mbp、5~6Mbp、6~7Mbp、7~8Mbp、8~9Mbp、9~10Mbp、または10~20Mbpの範囲のフットプリントを有する。一部の実施形態では、エピジェネティック標的領域セットは、少なくとも20Mbpのフットプリントを有する。
a.高メチル化可変標的領域
a.高メチル化可変標的領域
一部の実施形態では、エピジェネティック標的領域セットのプローブは、1つまたは複数の高メチル化可変標的領域に対して特異的なプローブを含む。高メチル化可変標的領域はまた、本明細書において高メチル化DMR(差次的にメチル化された領域)とも呼ばれ得る。高メチル化可変標的領域は、上記のそれらのいずれかであり得る。例えば、一部の実施形態では、高メチル化可変標的領域に対して特異的なプローブは、表1に列挙される複数の座、例えば表1に列挙される座の少なくとも10%、20%、30%、40%、50%、60%、70%、80%、90%、または100%に対して特異的なプローブを含む。一部の実施形態では、高メチル化可変標的領域に対して特異的なプローブは、表2に列挙される複数の座、例えば表2に列挙される座の少なくとも10%、20%、30%、40%、50%、60%、70%、80%、90%、または100%に対して特異的なプローブを含む。一部の実施形態では、高メチル化可変標的領域に対して特異的なプローブは、表1または表2に列挙される複数の座、例えば表1または表2に列挙される座の少なくとも10%、20%、30%、40%、50%、60%、70%、80%、90%、または100%に対して特異的なプローブを含む。一部の実施形態では、標的領域として含まれる各座に関して、遺伝子の転写開始部位と終止コドン(選択的にスプライシングされる遺伝子の場合は最後の終止コドン)の間に結合するハイブリダイゼーション部位を有する1つまたは複数のプローブが存在し得る。一部の実施形態では、1つまたは複数のプローブは、列挙された位置の300bp以内、例えば200または100bp以内に結合する。一部の実施形態では、プローブは、上に列挙された位置と重複するハイブリダイゼーション部位を有する。一部の実施形態では、高メチル化標的領域に対して特異的なプローブは、乳がん、結腸がん、腎臓がん、肝臓がん、および肺がんのうちの1、2、3、4、または5つにおいて集合的に高メチル化を示す高メチル化標的領域の1、2、3、4、または5つのサブセットに対して特異的なプローブを含む。
b.低メチル化可変標的領域
b.低メチル化可変標的領域
一部の実施形態では、エピジェネティック標的領域セットのプローブは、1つまたは複数の低メチル化可変標的領域に対して特異的なプローブを含む。低メチル化可変標的領域はまた、本明細書において低メチル化DMR(差次的にメチル化された領域)とも呼ばれ得る。低メチル化可変標的領域は、上記のそれらのいずれかであり得る。例えば、1つまたは複数の低メチル化可変標的領域に対して特異的なプローブは、反復エレメント、例えば、LINE1エレメント、Aluエレメント、セントロメアタンデムリピート、ペリセントロメアタンデムリピート、およびサテライトDNAなどの領域のプローブを含んでもよく、健康な細胞において通常メチル化される遺伝子間領域は、腫瘍細胞において低減されたメチル化を示し得る。
一部の実施形態では、低メチル化可変標的領域に対して特異的なプローブは、反復エレメントおよび/または遺伝子間領域に対して特異的なプローブを含む。一部の実施形態では、反復エレメントに対して特異的なプローブは、LINE1エレメント、Aluエレメント、セントロメアタンデムリピート、ペリセントロメアタンデムリピート、および/またはサテライトDNAのうちの1、2、3、4、または5個に対して特異的なプローブを含む。
がん関連低メチル化を示すゲノム領域に対して特異的な例示的なプローブは、ヒト第1染色体のヌクレオチド8403565~8953708および/または151104701~151106035に対して特異的なプローブを含む。一部の実施形態では、低メチル化可変標的領域に対して特異的なプローブは、ヒト第1染色体のヌクレオチド8403565~8953708および/または151104701~151106035と重複するまたはそれらを含む領域に対して特異的なプローブを含む。
c.CTCF結合領域
c.CTCF結合領域
一部の実施形態では、エピジェネティック標的領域セットのプローブは、CTCF結合領域に対して特異的なプローブを含む。一部の実施形態では、CTCF結合領域に対して特異的なプローブは、少なくとも10、20、50、100、200、もしくは500個のCTCF結合領域、または10~20、20~50、50~100、100~200、200~500、もしくは500~1000個のCTCF結合領域、例えば上記の、またはCTCFBSDBの1つもしくは複数、または上記で引用したCuddapahら、Martinら、もしくはRheeらの論文におけるCTCF結合領域などに対して特異的なプローブを含む。一部の実施形態では、エピジェネティック標的領域セットのプローブは、CTCF結合部位の少なくとも100bp、少なくとも200bp、少なくとも300bp、少なくとも400bp、少なくとも500bp、少なくとも750bp、または少なくとも1000bp上流および下流の領域を含む。
d.転写開始部位
d.転写開始部位
一部の実施形態では、エピジェネティック標的領域セットのプローブは、転写開始部位に対して特異的なプローブを含む。一部の実施形態では、転写開始部位に対して特異的なプローブは、少なくとも10、20、50、100、200、もしくは500個の転写開始部位、または10~20、20~50、50~100、100~200、200~500、もしくは500~1000個の転写開始部位、例えばDBTSSに列挙される転写開始部位などに対して特異的なプローブを含む。一部の実施形態では、エピジェネティック標的領域セットのプローブは、転写開始部位の少なくとも100bp、少なくとも200bp、少なくとも300bp、少なくとも400bp、少なくとも500bp、少なくとも750bp、または少なくとも1000bp上流および下流の配列のプローブを含む。
e.局所増幅
e.局所増幅
上記のように、局所増幅が体細胞突然変異であるが、それらは、メチル化の変化などのある特定のエピジェネティック変化を検出するためのアプローチと類似の方法で読み取りデータの頻度に基づいてシーケンシングすることによって検出することができる。そのため、がんにおいて局所増幅を示し得る領域を、上記で考察したようにエピジェネティック標的領域セットに含めることができる。一部の実施形態では、エピジェネティック標的領域セットに対して特異的なプローブは、局所増幅に対して特異的なプローブを含む。一部の実施形態では、局所増幅に対して特異的なプローブは、AR、BRAF、CCND1、CCND2、CCNE1、CDK4、CDK6、EGFR、ERBB2、FGFR1、FGFR2、KIT、KRAS、MET、MYC、PDGFRA、PIK3CA、およびRAF1のうちの1つまたは複数に対して特異的なプローブを含む。例えば、一部の実施形態では、局所増幅に対して特異的なプローブは、前述の標的の少なくとも2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、または18個のうちの1つまたは複数に対して特異的なプローブを含む。
f.対照領域
f.対照領域
データ検証を容易にするために対照領域を含めることは有用であり得る。一部の実施形態では、エピジェネティック標的領域セットに対して特異的なプローブは、本質的に全ての試料においてメチル化されると予想される対照メチル化領域に対して特異的なプローブを含む。一部の実施形態では、エピジェネティック標的領域セットに対して特異的なプローブは、本質的に全ての試料において低メチル化であると予想される対照低メチル化領域に対して特異的なプローブを含む。
2.配列可変標的領域に対して特異的なプローブ
2.配列可変標的領域に対して特異的なプローブ
配列可変標的領域セットのプローブは、がんにおいて体細胞突然変異を受けることが公知である複数の領域に対して特異的なプローブを含み得る。プローブは、本明細書に記載される任意の配列可変標的領域セットに対して特異的であり得る。例示的な配列可変標的領域セットは、本明細書において、例えば捕捉されたセットに関する上記の節で詳細に考察される。
一部の実施形態では、配列可変標的領域プローブセットは、少なくとも0.5kb、例えば、少なくとも1kb、少なくとも2kb、少なくとも5kb、少なくとも10kb、少なくとも20kb、少なくとも30kb、または少なくとも40kbのフットプリントを有する。一部の実施形態では、エピジェネティック標的領域プローブセットは、0.5~100kb、例えば、0.5~2kb、2~10kb、10~20kb、20~30kb、30~40kb、40~50kb、50~60kb、60~70kb、70~80kb、80~90kb、および90~100kbの範囲のフットプリントを有する。一部の実施形態では、配列可変標的領域プローブセットは、少なくとも50kbp、例えば、少なくとも100kbp、少なくとも200kbp、少なくとも300kbp、または少なくとも400kbpのフットプリントを有する。一部の実施形態では、配列可変標的領域プローブセットは、100~2000kbp、例えば、100~200kbp、200~300kbp、300~400kbp、400~500kbp、500~600kbp、600~700kbp、700~800kbp、800~900kbp、900~1,000kbp、1~1.5Mbp、または1.5~2Mbpの範囲のフットプリントを有する。一部の実施形態では、配列可変標的領域セットは、少なくとも2Mbpのフットプリントを有する。
一部の実施形態では、配列可変標的領域セットに特異的なプローブは、表3の遺伝子のうちの少なくとも5個、少なくとも10個、少なくとも15個、少なくとも20個、少なくとも25個、少なくとも30個、少なくとも35個、少なくとも40個、少なくとも45個、少なくとも50個、少なくとも55個、少なくとも60個、少なくとも65個、または70個の少なくとも一部分に特異的なプローブを含む。一部の実施形態では、配列可変標的領域セットに特異的なプローブは、表3のSNVのうちの少なくとも5個、少なくとも10個、少なくとも15個、少なくとも20個、少なくとも25個、少なくとも30個、少なくとも35個、少なくとも40個、少なくとも45個、少なくとも50個、少なくとも55個、少なくとも60個、少なくとも65個、または70個に特異的なプローブを含む。一部の実施形態では、配列可変標的領域セットに特異的なプローブは、表3の融合体のうちの少なくとも1個、少なくとも2個、少なくとも3個、少なくとも4個、少なくとも5個、または6個に特異的なプローブを含む。一部の実施形態では、配列可変標的領域セットに特異的なプローブは、表3のインデルのうちの少なくとも1個、少なくとも2個、または3個の少なくとも一部分に特異的なプローブを含む。一部の実施形態では、配列可変標的領域セットに特異的なプローブは、表4の遺伝子のうちの少なくとも5個、少なくとも10個、少なくとも15個、少なくとも20個、少なくとも25個、少なくとも30個、少なくとも35個、少なくとも40個、少なくとも45個、少なくとも50個、少なくとも55個、少なくとも60個、少なくとも65個、少なくとも70個、または73個の少なくとも一部分に特異的なプローブを含む。一部の実施形態では、配列可変標的領域セットに特異的なプローブは、表4のSNVのうちの少なくとも5個、少なくとも10個、少なくとも15個、少なくとも20個、少なくとも25個、少なくとも30個、少なくとも35個、少なくとも40個、少なくとも45個、少なくとも50個、少なくとも55個、少なくとも60個、少なくとも65個、少なくとも70個、または73個に特異的なプローブを含む。一部の実施形態では、配列可変標的領域セットに特異的なプローブは、表4の融合体のうちの少なくとも1個、少なくとも2個、少なくとも3個、少なくとも4個、少なくとも5個、または6個に特異的なプローブを含む。一部の実施形態では、配列可変標的領域セットに特異的なプローブは、表4のインデルのうちの少なくとも1個、少なくとも2個、少なくとも3個、少なくとも4個、少なくとも5個、少なくとも6個、少なくとも7個、少なくとも8個、少なくとも9個、少なくとも10個、少なくとも11個、少なくとも12個、少なくとも13個、少なくとも14個、少なくとも15個、少なくとも16個、少なくとも17個、または18個の少なくとも一部分に特異的なプローブを含む。一部の実施形態では、配列可変標的領域セットに特異的なプローブは、表5の遺伝子のうちの少なくとも1個、少なくとも2個、少なくとも3個、少なくとも4個、少なくとも5個、少なくとも6個、少なくとも7個、少なくとも8個、少なくとも9個、少なくとも10個、少なくとも11個、少なくとも12個、少なくとも13個、少なくとも14個、少なくとも15個、少なくとも16個、少なくとも17個、少なくとも18個、少なくとも19個、または少なくとも20個の少なくとも一部分に特異的なプローブを含む。
一部の実施形態では、配列可変標的領域セットに対して特異的なプローブは、少なくとも10、20、30、または35個のがん関連遺伝子、例えばAKT1、ALK、BRAF、CCND1、CDK2A、CTNNB1、EGFR、ERBB2、ESR1、FGFR1、FGFR2、FGFR3、FOXL2、GATA3、GNA11、GNAQ、GNAS、HRAS、IDH1、IDH2、KIT、KRAS、MED12、MET、MYC、NFE2L2、NRAS、PDGFRA、PIK3CA、PPP2R1A、PTEN、RET、STK11、TP53、およびU2AF1からの標的領域に対して特異的なプローブを含む。
E.捕捉されたDNAを含む組成物
E.捕捉されたDNAを含む組成物
DNAの第1および第2の集団を含む組合せであって、第2の集団が、DNAの断片を含み、第1の核酸塩基が、変換手順、例えば、本明細書に記載される変換手順のうちのいずれかを受けている、組合せが、本明細書において提供される。例えば、DNAは、メチル化シトシンから別の核酸塩基、例えば、チミンに変換された塩基を含み得る。一部の実施形態では、第1および第2の集団は、差次的にタグ付けされる。DNAの第1および第2の集団を含む組合せであって、第2の集団が、変更された塩基対形成特異性を有するDNAにもともと存在していた第1の核酸塩基の形態および変更された塩基対形成特異性を有さない第2の核酸塩基を含み得、塩基対形成特異性の変更前にDNAにもともと存在する第1の核酸塩基の形態が、改変または非改変核酸塩基であり、第2の核酸塩基が、第1の核酸塩基とは異なる改変または非改変核酸塩基であり、塩基対形成特異性の変更前にDNAにもともと存在する第1の核酸塩基の形態および第2の核酸塩基が、同じ塩基対形成特異性を有する、組合せが、本明細書において提供される。第1の集団は、第2の集団よりも高い割合でシトシン改変(例えば、シトシンメチル化)を有するDNAを含むか、またはそれに由来し得る。第1の集団は、変更された塩基対形成特異性を有するDNAにもともと存在していた第1の核酸塩基の形態および変更された塩基対形成特異性を有さない第2の核酸塩基を含み得、ここで、塩基対形成特異性の変更前にDNAにもともと存在する第1の核酸塩基の形態は、改変または非改変核酸塩基であり、第2の核酸塩基は、第1の核酸塩基とは異なる改変または非改変核酸塩基であり、塩基対形成特異性の変更前にDNAにもともと存在する第1の核酸塩基の形態および第2の核酸塩基は、同じ塩基対形成特異性を有する。一部の実施形態では、シトシン改変は、シトシンメチル化である。一部の実施形態では、第1の核酸塩基は、改変または非改変シトシンであり、第2の核酸塩基は、改変または非改変シトシンである。第1および第2の核酸塩基は、本明細書において発明の概要で、または第1の部分試料を、第1の部分試料のDNA内の第1の核酸塩基に対してDNA内の第2の核酸塩基とは異なって影響を及ぼす手順に供することに関して、考察されているもののうちのいずれかであり得る。一部の実施形態では、第1の集団は、本明細書に記載されるメチル化感受性ヌクレアーゼのうちのいずれか1つまたは任意の組合せであり得る少なくとも1つのメチル化感受性ヌクレアーゼの認識部位において、末端、または付着したタグもしくはアダプターを有するDNAの断片を含む。
一部の実施形態では、第1の集団は、1つまたは複数の配列タグの第1のセットから選択される配列タグを含み、第2の集団は、1つまたは複数の配列タグの第2のセットから選択される配列タグを含み、配列タグの第2のセットは、配列タグの第1のセットとは異なる。配列タグは、バーコードを含み得る。
一部の実施形態では、第1の集団は、保護されたhmC、例えばグルコシル化hmCを含む。
一部の実施形態では、第1の集団は、本明細書で考察される変換手順、例えばバイサルファイト変換、Ox-BS変換、TAB変換、ACE変換、TAP変換、TAPSβ変換、またはCAP変換のいずれかに供された。一部の実施形態では、第1の集団は、hmCの保護後にmCおよび/またはCの脱アミノ化に供された。
組合せの一部の実施形態では、第1の集団は、第2の集団よりも大きい割合でシトシン改変を有するDNAを含むかまたはそれに由来し、第1の集団は、第1および第2の部分集団を含み、第1の核酸塩基は、改変または非改変核酸塩基であり、第2の核酸塩基は、第1の核酸塩基とは異なる改変または非改変核酸塩基であり、第1の核酸塩基および第2の核酸塩基は同じ塩基対形成特異性を有する。一部の実施形態では、第2の集団は、第1の核酸塩基を含まない。一部の実施形態では、第1の核酸塩基は、改変または非改変シトシンであり、第2の核酸塩基は、改変または非改変シトシンであり、必要に応じて改変シトシンはmCまたはhmCである。一部の実施形態では、第1の核酸塩基は、改変または非改変アデニンであり、第2の核酸塩基は改変または非改変アデニンであり、必要に応じて改変アデニンはmAである。
一部の実施形態では、第1の核酸塩基(例えば、改変シトシン)はビオチン化される。一部の実施形態では、第1の核酸塩基(例えば、改変シトシン)は親和性標識(例えば、ビオチン)を含むβ-6-アジド-グルコシル-5-ヒドロキシメチルシトシンに対するヒュスゲン環化付加の生成物である。
本明細書に記載される組合せのいずれかでは、捕捉されたDNAは、cfDNAを含み得る。
捕捉されたDNAは、例えばエピジェネティック標的領域セットに対応するDNAの濃度よりも配列可変標的領域セット(上記で考察したようにフットプリントサイズに関して正規化)に対応するDNAの高い濃度を含む、捕捉セットに関する本明細書に記載される特色のいずれかを有し得る。一部の実施形態では、捕捉セットのDNAは、本明細書に記載されるDNAに付加され得る配列タグを含む。一般的に、配列タグを含めることは、その天然に存在する非タグ付け形態とは異なるDNA分子をもたらす。
組合せはさらに、その各々が、天然に存在する核酸分子とは異なり得る、本明細書に記載されるプローブセットまたはシーケンシングプライマーを含み得る。例えば、本明細書に記載されるプローブセットは、捕捉部分を含み得、シーケンシングプライマーは、天然に存在しない標識を含み得る。
F.コンピュータシステム
F.コンピュータシステム
本開示の方法は、コンピュータシステムを使用して、またはその補助を用いて、実装することができる。例えば、そのような方法は、試料を、第1の部分試料および第2の部分試料を含む複数の部分試料に分配するステップであって、第1の部分試料が、第2の部分試料よりも高い割合でシトシン改変を有するDNAを含む、ステップと、第2の部分試料を、第2の部分試料のDNA内の第1の核酸塩基に対してDNA内の第2の核酸塩基とは異なって影響を及ぼす手順に供するステップであって、第1の核酸塩基が改変または非改変核酸塩基であり、第2の核酸塩基が第1の核酸塩基とは異なる改変または非改変核酸塩基であり、第1の核酸塩基および第2の核酸塩基が同じ塩基対形成特異性を有し、それによって処置された部分試料を産生するステップと、処置された部分試料から、エピジェネティック標的領域を含む標的領域セットを捕捉するステップと、標的領域セット中のDNAおよび第1の部分試料に由来するDNAをシーケンシングするステップであって、第2の部分試料に由来するDNAが、標的領域セットのDNA内の第1の核酸塩基を第2の核酸塩基と識別する様式でシーケンシングされる、ステップとを含み得る。
図4は、本開示の方法を実装するようにプログラミングされるか、またはそうでなければそのように構成される、コンピュータシステム401を示す。コンピュータシステム401は、試料調製、シーケンシング、および/または解析の様々な態様を調節することができる。一部の例では、コンピュータシステム401は、試料調製、および核酸シーケンシングを含む試料解析を行うように構成される。
コンピュータシステム401は、中央処理装置(CPU、本明細書において「プロセッサー」および「コンピュータプロセッサー」とも)405を含み、これは、シングルコアもしくはマルチコアプロセッサー、または並列処理のための複数のプロセッサーであり得る。コンピュータシステム401はまた、メモリーまたはメモリー場所410(例えば、ランダムアクセスメモリー、読み取り専用メモリー、フラッシュメモリー)、電子ストレージユニット415(例えば、ハードディスク)、1つまたは複数の他のシステムと通信するための通信インターフェース420(例えば、ネットワークアダプター)、ならびに周辺デバイス425、例えば、キャッシュ、他のメモリー、データストレージ、および/もしくは電子ディスプレイアダプターも含む。メモリー410、ストレージユニット415、インターフェース420、および周辺デバイス425は、通信ネットワークまたはバス(実線)、例えば、マザーボードを通じて、CPU405と通信する。ストレージユニット415は、データを保存するためのデータストレージユニット(またはデータリポジトリ)であり得る。コンピュータシステム401は、通信インターフェース420を利用して、コンピュータネットワーク430に作動可能にカップリングされ得る。コンピュータネットワーク430は、Internet、インターネットおよび/もしくはエクストラネット、またはInternetと通信するイントラネットおよび/もしくはエクストラネットであり得る。コンピュータネットワーク430は、一部の場合には、電気通信および/またはデータネットワークである。コンピュータネットワーク430は、クラウドコンピューティングなどの分散型コンピューティングを可能にすることができる、1つまたは複数のコンピュータサーバーを含み得る。コンピュータネットワーク430は、一部の場合には、コンピュータシステム401を利用して、コンピュータシステム401にカップリングされたデバイスが、クライアントまたはサーバーとして挙動することを可能にし得る、ピアツーピアネットワークを実装することができる。
CPU405は、プログラムまたはソフトウェアで具現化され得る、一連の機械可読命令を実行することができる。命令は、メモリー410などのメモリー場所に保存され得る。CPU405によって実施される操作の例としては、フェッチ、復号、実行、およびライトバックを挙げることができる。
ストレージユニット415は、ドライバー、ライブラリー、およびセーブしたプログラムなど、ファイルを保存することができる。ストレージユニット415は、ユーザーによって生成されたプログラムおよび記録されたセッション、ならびにプログラムと関連する出力を保存することができる。ストレージユニット415は、ユーザーデータ、例えば、ユーザーの好みおよびユーザープログラムを保存することができる。コンピュータシステム401は、一部の場合には、コンピュータシステム401に対して外部にある、例えば、イントラネットまたはInternetを通じてコンピュータシステム401と通信するリモートサーバーに位置付けられた、1つまたは複数の追加のデータストレージユニットを含み得る。データは、例えば、通信ネットワークまたは物理的データ転送を使用して(例えば、ハードドライブ、サムドライブ、または他のデータストレージ機構を使用して)、1つの場所から別の場所へと転送され得る。
コンピュータシステム401は、ネットワーク430を通じて、1つまたは複数のリモートコンピュータシステムと通信することができる。実施形態について、コンピュータシステム401は、ユーザー(例えば、オペレーター)のリモートコンピュータシステムと通信し得る。リモートコンピュータシステムの例としては、パーソナルコンピュータ(例えば、携帯型PC)、スレートもしくはタブレットPC(例えば、Apple(登録商標)のiPad(登録商標)、Samsung(登録商標)のGalaxy Tab)、電話、スマートフォン(例えば、Apple(登録商標)のiPhone(登録商標)、Android(登録商標)対応デバイス、Blackberry(登録商標))、または携帯情報端末が挙げられる。ユーザーは、ネットワーク430を介して、コンピュータシステム401にアクセスすることができる。
本明細書に記載される方法は、コンピュータシステム401の電子ストレージ場所、例えば、メモリー410または電子ストレージユニット415などに保存された、機械(例えば、コンピュータプロセッサー)実行可能なコードを用いて実装され得る。機械実行可能または機械可読コードは、ソフトウェアの形態で提供され得る。使用の際、コードが、プロセッサー405によって実行され得る。一部の場合では、コードは、ストレージユニット415から取り出され、プロセッサー405による即時アクセスのために、メモリー410に保存され得る。一部の状況では、電子ストレージユニット415は、除外され得、機械実行可能命令は、メモリー410に保存される。
ある態様では、本開示は、少なくとも1つの電子プロセッサーによって実行されると、a)試料を、第1の部分試料および第2の部分試料を含む複数の部分試料に分配するステップであって、第1の部分試料が、第2の部分試料よりも高い割合でシトシン改変を有するDNAを含む、ステップと、b)第2の部分試料を、第2の部分試料のDNA内の第1の核酸塩基に対してDNA内の第2の核酸塩基とは異なって影響を及ぼす手順に供するステップであって、第1の核酸塩基が改変または非改変核酸塩基であり、第2の核酸塩基が第1の核酸塩基とは異なる改変または非改変核酸塩基であり、第1の核酸塩基および第2の核酸塩基が同じ塩基対形成特異性を有し、それによって処置された部分試料を産生するステップと、c)処置された部分試料から、エピジェネティック標的領域を含む標的領域セットを捕捉するステップと、d)標的領域セット中のDNAおよび第1の部分試料に由来するDNAをシーケンシングするステップであって、第2の部分試料に由来するDNAが、標的領域セットのDNA内の第1の核酸塩基を第2の核酸塩基と識別する様式でシーケンシングされる、ステップとを含む方法の少なくとも一部分を実行するコンピュータ実行可能命令を含む、非一時的コンピュータ可読媒体を提供する。ある態様では、本開示は、少なくとも1つの電子プロセッサーによって実行されると、a)試料から、エピジェネティック標的領域を含む標的領域セットを捕捉するステップと、b)標的領域セットを、第1の部分試料および第2の部分試料を含む複数の部分試料に分配するステップであって、第1の部分試料が、第2の部分試料よりも高い割合でシトシン改変を有するDNAを含む、ステップと、c)第2の部分試料を、第2の部分試料のDNA内の第1の核酸塩基に対してDNA内の第2の核酸塩基とは異なって影響を及ぼす手順に供するステップであって、第1の核酸塩基が改変または非改変核酸塩基であり、第2の核酸塩基が第1の核酸塩基とは異なる改変または非改変核酸塩基であり、第1の核酸塩基および第2の核酸塩基が、同じ塩基対形成特異性を有し、それによって処置された部分試料を産生するステップと、d)第1の部分試料に由来するDNAおよび第2の部分試料に由来するDNAをシーケンシングするステップであって、第2の部分試料に由来するDNAが、標的領域セットのDNA内の第1の核酸塩基を第2の核酸塩基と識別する様式でシーケンシングされる、ステップとを含む方法の少なくとも一部分を実行するコンピュータ実行可能命令を含む、非一時的コンピュータ可読媒体を提供する。ある態様では、本開示は、少なくとも1つの電子プロセッサーによって実行されると、a)試料を、第1の部分試料および第2の部分試料を含む複数の部分試料に分配するステップであって、第1の部分試料が、第2の部分試料よりも高い割合でシトシン改変を有するDNAを含む、ステップと、b)第2の部分試料を、第2の部分試料のDNA内の第1の核酸塩基に対してDNA内の第2の核酸塩基とは異なって影響を及ぼす手順に供するステップであって、第1の核酸塩基が改変または非改変核酸塩基であり、第2の核酸塩基が第1の核酸塩基とは異なる改変または非改変核酸塩基であり、第1の核酸塩基および第2の核酸塩基が同じ塩基対形成特異性を有し、それによって処置された部分試料を産生するステップと、c)処置された部分試料に由来するDNAおよび第1の部分試料に由来するDNAを、標的領域セットのDNA内の第1の核酸塩基を第2の核酸塩基と識別する様式でシーケンシングするステップとを含む方法の少なくとも一部分を実行するコンピュータ実行可能命令を含む、非一時的コンピュータ可読媒体を提供する。一部の実施形態では、方法は、核酸シーケンサーによってシーケンシングから生成された複数の配列読み取りデータを取得するステップと、複数の配列読み取りデータを、1つまたは複数の参照配列にマッピングして、マッピングされた配列読み取りデータを生成するステップと、マッピングされた配列読み取りデータをプロセシングして、対象ががんを有する可能性を決定するステップとをさらに含む。
コードは、事前にコンパイルされ、コードを実行するように適合させたプロセッサーを有する機械と共に使用するように構成することができ、または実行時間の間にコンパイルすることができる。コードは、コードが、事前にコンパイルされた、またはコンパイルされた通りに実行することが可能となるように選択することができるプログラミング言語で供給することができる。
本明細書に提供されるシステムおよび方法の態様、例えばコンピュータシステム401は、プログラミングにおいて具体化することができる。テクノロジーの様々な態様は、典型的に、機械可読媒体の1つのタイプにおいて実行または具体化される機械(またはプロセッサー)実行可能コードおよび/または関連データの形態の「生成物」または「製造品」であると考えられ得る。機械実行可能コードは、電子ストレージユニット、そのようなメモリー(例えば、読み取り専用メモリー、ランダムアクセスメモリー、フラッシュメモリー)またはハードディスクに保存することができる。「ストレージ」型の媒体は、ソフトウェアプログラミングのためにいついかなる時にも非一時的ストレージを提供し得るコンピュータの有形メモリー、プロセッサーなど、またはその関連するモジュール、例えば様々な半導体メモリー、テープドライブ、ディスクドライブなどのいずれかまたは全てを含み得る。
ソフトウェアの全てまたは一部は、時に、Internetまたは様々な他の電気通信ネットワークを通して通信され得る。そのような通信は、例えば、1つのコンピュータまたはプロセッサーからのソフトウェアを別のコンピュータまたはプロセッサーにロードすること、例えば管理サーバーまたはホストコンピュータからアプリケーションサーバーのコンピュータプラットフォームにロードすることを可能にし得る。このように、ソフトウェア要素を有し得る別のタイプの媒体は、光波、電波、および電磁波、例えば有線および光学的固定電話ネットワーク、ならびに様々なエアリンクを通してローカルデバイス間の物理的インターフェースを越えて使用される媒体を含む。そのような波動を伝える物理的要素、例えば有線または無線リンク、光学的リンクなどもまた、ソフトウェアを有する媒体であると考えられ得る。本明細書で使用される場合、非一時的有形「ストレージ」媒体に限定されない限り、コンピュータまたは機械「可読媒体」などの用語は、実行のためにプロセッサーに命令を提供することに関与する任意の媒体を指す。
したがって、機械可読媒体、例えばコンピュータ実行可能コードは、これらに限定されないが有形ストレージ媒体、搬送波媒体、または物理的伝送媒体を含む多くの形態をとり得る。不揮発性ストレージ媒体は、図面に示されるように、例えば、光学または磁気ディスク、例えば任意のコンピュータなどにおけるストレージデバイスのいずれか、例えばデータベースをインプリメントするために使用され得るものなどを含む。揮発性ストレージ媒体は、ダイナミックメモリー、例えばそのようなコンピュータプラットフォームのメインメモリーを含む。有形伝送媒体は、同軸ケーブル;コンピュータシステム内のバスを含むワイヤーを含む銅線および光ファイバーを含む。搬送波伝送媒体は、電気もしくは電磁シグナル、または音波もしくは光波の形態、例えば高周波(RF)および赤外線(IR)データ通信の間に生成される形態をとり得る。したがって、コンピュータ可読媒体の一般的な形態は、例えば、フロッピー(登録商標)ディスク、フレキシブルディスク、ハードディスク、磁気テープ、任意の他の磁気媒体、CD-ROM、DVDもしくはDVD-ROM、任意の他の光学媒体、パンチカード、紙テープ、穴パターンを有する任意の他の物理的ストレージ媒体、RAM、ROM、PROMおよびEPROM、FLASH-EPROM、任意の他のメモリーチップもしくはカートリッジ、搬送波輸送データもしくは命令、そのような搬送波を輸送するケーブルもしくはリンク、またはそこからコンピュータがプログラミングコードおよび/もしくはデータを読み取り得る任意の他の媒体を含む。コンピュータ可読媒体のこれらの形態の多くは、実行のためにプロセッサーに1つまたは複数の命令の1つまたは複数のシーケンスを伝えることに関係し得る。
コンピュータシステム401は、例えば、試料解析の1つまたは複数の結果を提供するための、ユーザーインターフェース(UI)440を含む、電子ディスプレイ435を含むか、またはそれと通信し得る。UIの例としては、グラフィカルユーザーインターフェース(GUI)およびウェブに基づくユーザーインターフェースが挙げられるが、これらに限定されない。
コンピュータシステムおよびネットワーク、データベース、ならびにコンピュータプログラム生成物に関する追加の詳細はまた、例えば、その各々の全体がこれにより参照により本明細書に組み込まれる、Peterson, Computer Networks: A Systems Approach, Morgan Kaufmann, 5th Ed. (2011), Kurose, Computer Networking: A Top-Down Approach, Pearson, 7th Ed. (2016), Elmasri, Fundamentals of Database Systems, Addison Wesley, 6th Ed. (2010), Coronel, Database Systems: Design, Implementation, & Management, Cengage Learning, 11th Ed. (2014), Tucker, Programming Languages, McGraw-Hill Science/Engineering/Math, 2nd Ed. (2006)、およびRhoton, Cloud Computing Architected: Solution Design Handbook, Recursive Press(2011)にも提供されている。
G.応用
1.がんおよび他の疾患
G.応用
1.がんおよび他の疾患
本方法は、対象における状態、特に、がんの存在を診断するため、状態を特徴付ける(例えば、がんをステージ分類するかまたはがんの不均一性を決定する)ため、状態の処置に対する応答をモニタリングするため、状態を発症するリスクまたは状態の後続の経過の予後判定を達成するために、使用することができる。本開示はまた、特定の処置選択肢の有効性を決定するのにも有用であり得る。奏功した処置選択肢では、処置が成功している場合、より多くのがんが死滅し、DNAが脱落し得るため、対象の血液中で検出されるコピー数変異または希少な突然変異の量が増加し得る。他の例では、これは生じない場合がある。別の例では、おそらくはある特定の処置選択肢は、経時的に、がんの遺伝子プロファイルと相関付けられ得る。この相関性は、治療を選択するのに有用であり得る。一部の実施形態では、高メチル化可変エピジェネティック標的領域は、それらが、腫瘍細胞もしくは通常はcfDNAに有意に寄与しない細胞の高メチル化特徴を示すかどうかを決定する、および/または低メチル化可変エピジェネティック標的領域は、それらが、腫瘍細胞もしくは通常はcfDNAに有意に寄与しない細胞の低メチル化特徴を示すかどうかを決定するために解析される。
さらに、がんが処置後に寛解期にあることが観察される場合、本方法を使用して、残存疾患または疾患の再発をモニタリングすることができる。
一部の実施形態では、本明細書に開示される方法およびシステムを使用して、核酸変異体が体細胞または生殖系列起源であるという分類に基づいて、患者における所定の疾患または状態を処置するためのカスタマイズされたまたは標的化治療を同定してもよい。典型的に、検討中の疾患は、あるタイプのがんである。そのようながんの非限定的な例としては、胆管がん、膀胱がん、移行上皮癌、尿路上皮癌、脳がん、神経膠腫、星細胞腫、乳癌、化生癌、子宮頸がん、子宮頸部扁平上皮癌、直腸がん、結腸直腸癌、結腸がん、遺伝性非ポリポーシス大腸がん、結腸直腸腺癌、消化管間質腫瘍(GIST)、子宮内膜癌、子宮内膜間質肉腫、食道がん、食道扁平上皮癌、食道腺癌、眼内黒色腫、ぶどう膜黒色腫、胆嚢癌、胆嚢腺癌、腎細胞癌、明細胞腎細胞癌、移行上皮癌、尿路上皮癌、ウィルムス腫瘍、白血病、急性リンパ球性白血病(ALL)、急性骨髄性白血病(AML)、慢性リンパ球性白血病(CLL)、慢性骨髄性白血病(CML)、慢性骨髄単球性白血病(CMML)、肝臓がん、肝臓癌、肝腫、肝細胞癌、胆管癌、肝芽腫、肺がん、非小細胞肺がん(NSCLC)、中皮腫、B細胞リンパ腫、非ホジキンリンパ腫、びまん性大細胞型B細胞リンパ腫、マントル細胞リンパ腫、T細胞リンパ腫、非ホジキンリンパ腫、前駆Tリンパ芽球性リンパ腫/白血病、末梢性T細胞リンパ腫、多発性骨髄腫、鼻咽頭癌(NPC)、神経芽腫、中咽頭がん、口腔扁平上皮癌、骨肉腫、卵巣癌、膵臓がん、膵管腺癌、偽乳頭状腫瘍、膵腺房細胞癌、前立腺がん、前立腺腺癌、皮膚がん、黒色腫、悪性黒色腫、皮膚黒色腫、小腸癌、胃がん、胃癌、消化管間質腫瘍(GIST)、子宮がん、または子宮肉腫が挙げられる。がんのタイプおよび/またはステージは、突然変異、まれな突然変異、インデル、コピー数変異、塩基転換、転座、逆位、欠失、異数性、部分的異数性、倍数性、染色体不安定性、染色体構造の変更、遺伝子融合、染色体融合、遺伝子トランケーション、遺伝子増幅、遺伝子重複、染色体病変、DNA病変、核酸化学修飾の異常な変化、エピジェネティックパターンの異常な変化、および核酸5-メチルシトシンの異常な変化を含む遺伝的変異から検出することができる。
遺伝子データはまた、がんの特定の形態を特徴付けるためにも使用することができる。がんはしばしば、組成およびステージ分類の両方が不均一である。遺伝子プロファイルデータは、その特定のサブタイプの診断または処置において重要であり得るがんの特定のサブタイプの特徴付けを可能にし得る。この情報はまた、がんの特定のタイプの予後に関する手がかりを対象または従事者に提供し、対象または従事者は、疾患の進行に従って処置選択肢を適合させることを可能にし得る。一部のがんは、進行してより侵襲性となり、遺伝的に不安定となり得る。他のがんは、良性、不活性、または休眠中のままであり得る。本開示のシステムおよび方法は、疾患進行を決定するために有用であり得る。
さらに、本開示の方法は、対象における異常な状態の不均一性を特徴付けるために使用され得る。そのような方法には、例えば、対象に由来する細胞外ポリヌクレオチドの遺伝子プロファイルを生成するステップが含まれ得、ここで、遺伝子プロファイルは、コピー数変異および希少な突然変異の解析により得られる複数のデータを含む。一部の実施形態では、異常な状態は、がんである。一部の実施形態では、異常な状態は、不均一なゲノム集団をもたらすものであり得る。がんの例では、一部の腫瘍は、がんの異なるステージにある腫瘍細胞を含むことが公知である。他の例では、不均一性は、複数の疾患病巣を構成し得る。さらに、がんの例では、おそらくは1つまたは複数の病巣が原発部位から拡がった転移の結果である複数の腫瘍病巣が、存在し得る。
本方法を使用して、不均一な疾患における異なる細胞に由来する遺伝情報の要約であるデータのフィンガープリントまたはセットを作成またはプロファイリングすることができる。このデータのセットは、コピー数変異、エピジェネティック変異、および突然変異解析を単独または組み合わせて含み得る。
本方法を使用して、がんまたは他の疾患を診断、予後判定、モニタリング、または観察することができる。一部の実施形態では、本明細書の方法は、胎児を診断することも、予後判定することも、モニタリングすることも伴わず、そのため、非侵襲性の出生前検査を対象としない。他の実施形態では、これらの方法論を、妊娠中の対象に用いて、そのDNAおよび他のポリヌクレオチドが、母体の分子と共循環し得るまだ生まれていない対象におけるがんまたは他の疾患を診断、予後判定、モニタリング、または観察してもよい。
本明細書に開示される方法およびシステムを使用して必要に応じて評価される他の遺伝子に基づく疾患、障害、または状態の非限定的な例としては、軟骨無形成症、アルファ-1アンチトリプシン欠乏症、抗リン脂質抗体症候群、自閉症、常染色体優性多発性嚢胞腎、シャルコー-マリー-トゥース病(CMT)、クリデュチャット病、クローン病、嚢胞性線維症、ダーカム病、ダウン症候群、デュアン症候群、デュシェンヌ型筋ジストロフィー、第V因子ライデン血栓形成傾向、家族性高コレステロール血症、家族性地中海熱、脆弱X症候群、ゴーシェ病、ヘモクロマトーシス、血友病、全前脳胞症、ハンチントン病、クラインフェルター症候群、マルファン症候群、筋強直性ジストロフィー、神経線維腫症、ヌーナン症候群、骨形成不全症、パーキンソン病、フェニルケトン尿症、ポーランド症候群、ポルフィリン症、早老症、網膜色素変性症、重度複合免疫不全(SCID)、鎌状赤血球症、脊髄性筋萎縮症、テイサックス病、サラセミア、トリメチルアミン尿症、ターナー症候群、口蓋心臓顔面症候群、WAGR症候群、ウィルソン病などが挙げられる。
一部の実施形態では、本明細書に記載される方法は、本明細書に記載されるように得られた配列情報のセットを使用してがんを有することが以前に診断された対象の以前のがん処置後の予め選択した時点で、腫瘍細胞を起源とするまたは腫瘍細胞に由来するDNAの存在または非存在を検出するステップを含む。方法は、試験対象に関して腫瘍細胞を起源とするまたは腫瘍細胞に由来するDNAの存在または非存在を示すがん再発スコアを決定するステップをさらに含み得る。
がん再発スコアが決定される場合、これをさらに使用してがん再発ステータスを決定してもよい。例えば、がん再発スコアが既定の閾値より上である場合、がん再発ステータスは、がん再発のリスクがあり得る。例えば、がん再発スコアが既定の閾値より上である場合、がん再発ステータスは、がんの再発のリスクが低いまたはより低いリスクであり得る。特定の実施形態では、既定の閾値に等しいがん再発スコアは、がん再発のリスクがあるか、またはがん再発のリスクが低いもしくはより低いリスクであるいずれかのがん再発ステータスをもたらし得る。
一部の実施形態では、がん再発スコアを既定のがん再発閾値と比較し、がん再発スコアががん再発閾値より上である場合、試験対象はその後のがん処置の候補であると分類され、がん再発スコアががん再発閾値より下である場合、試験対象は治療の候補ではないと分類される。特定の実施形態では、がん再発閾値に等しいがん再発スコアは、その後のがん処置の候補であるか、または治療の候補ではないといういずれかの分類をもたらし得る。
上記で考察した方法は、試験対象におけるがん再発のリスクを決定するおよび/または試験対象がその後のがん処置の候補であると分類する方法に関する節を含む、本明細書の他所で記載した任意の適合性の特色(単数または複数)をさらに含み得る。
2.試験対象におけるがん再発のリスクを決定するおよび/または試験対象がその後のがん処置の候補であると分類する方法
2.試験対象におけるがん再発のリスクを決定するおよび/または試験対象がその後のがん処置の候補であると分類する方法
一部の実施形態では、本明細書に提供される方法は、試験対象におけるがん再発のリスクを決定する方法である。一部の実施形態では、本明細書に提供される方法は、試験対象をその後のがん処置の候補であると分類する方法である。
そのような方法のいずれかは、試験対象に対する1つまたは複数の以前のがん処置の後の1つまたは複数の事前に選択された時点で、がんを有すると診断された試験対象からDNA(例えば、腫瘍細胞を起源とするまたは腫瘍細胞に由来する)を収集するステップを含み得る。対象は、本明細書に記載される対象のいずれかであり得る。DNAはcfDNAであり得る。DNAは、組織試料から得られ得る。
そのような方法のいずれかは、対象のDNAから複数の標的領域のセットを捕捉するステップであって、複数の標的領域セットが、配列可変標的領域セットおよびエピジェネティック標的領域セットを含み、それによって捕捉されたDNA分子のセットが産生される、ステップを含み得る。捕捉するステップは、本明細書の他所で記載される実施形態のいずれかに従って実施され得る。
そのような方法のいずれかにおいて、以前のがん処置は、手術、治療組成物の投与、および/または化学療法を含み得る。
そのような方法のいずれかは、捕捉されたDNA分子をシーケンシングすることであって、それによって配列情報のセットが産生されることを含み得る。配列可変標的領域セットの捕捉されたDNA分子は、エピジェネティック標的領域セットの捕捉されたDNA分子よりもシーケンシングの大きい深度までシーケンシングされ得る。
そのような方法のいずれかは、配列情報のセットを使用して事前に選択した時点で腫瘍細胞を起源とするまたは腫瘍細胞に由来するDNAの存在または非存在を検出するステップを含み得る。腫瘍細胞を起源とするまたは腫瘍細胞に由来するDNAの存在または非存在の検出は、本明細書の他所で記載されるその実施形態のいずれかに従って実施され得る。
試験対象においてがん再発のリスクを決定する方法は、試験対象の腫瘍細胞を起源とするまたは腫瘍細胞に由来するDNAの存在もしくは非存在、または量を示すがん再発スコアを決定するステップを含み得る。がん再発スコアをさらに使用して、がん再発ステータスを決定してもよい。がん再発ステータスは、例えばがん再発スコアが既定の閾値より上である場合、がん再発のリスクがあり得る。がん再発ステータスは、例えばがん再発スコアが既定の閾値より上である場合、がん再発のリスクが低いまたはより低いリスクであり得る。特定の実施形態では、既定の閾値に等しいがん再発スコアは、がん再発のリスクがあるか、またはがん再発のリスクが低いもしくはより低いリスクであるいずれかのがん再発ステータスをもたらし得る。
試験対象をその後のがん処置の候補であると分類する方法は、試験対象のがん再発スコアを既定のがん再発閾値と比較して、それによってがん再発スコアががん再発閾値より上である場合、試験対象をその後のがん処置の候補であると分類するステップ、またはがん再発スコアががん再発閾値より下である場合、治療の候補ではないと分類するステップを含み得る。特定の実施形態では、がん再発閾値に等しいがん再発スコアは、その後のがん処置の候補であるか、または治療の候補ではないといういずれかの分類をもたらし得る。一部の実施形態では、その後のがん処置は、化学療法または治療組成物の投与を含む。
そのような方法のいずれかは、がん再発スコアに基づいて試験対象の無病生存(DFS)期間を決定するステップを含み得、例えば、DFS期間は、1年、2年、3年、4年、5年、または10年であり得る。
一部の実施形態では、配列情報のセットは、配列可変標的領域配列を含み、がん再発スコアを決定するステップは、配列可変標的領域配列に存在するSNV、挿入/欠失、CNV、および/または融合の量を示す少なくとも第1のサブスコアを決定するステップを含み得る。
一部の実施形態では、1個、2個、3個、4個、または5個から選択される配列可変標的領域における突然変異の数は、第1のサブスコアが、がん再発に関して陽性であると分類されるがん再発スコアをもたらすために十分である。一部の実施形態では、突然変異の数は、1個、2個、または3個から選択される。
一部の実施形態では、配列情報のセットは、エピジェネティック標的領域配列を含み、がん再発スコアを決定することは、健康な対象に由来する対応する試料において見出されるDNA(例えば、健康な対象に由来する血液試料において見出されるcfDNA、または健康な対象に由来する組織試料において見出されるDNA、組織試料は、試験対象から得られたものと同じタイプの組織のものである)とは異なるエピジェネティック状態を表す分子(エピジェネティック標的領域配列から得られる)の量を示す、第2の部分スコアを決定することを含む。これらの異常な分子(すなわち、健康な対象に由来する対応する試料において見出されるDNAとは異なるエピジェネティック状態を有する分子)は、がんと関連するエピジェネティック変化、例えば、高メチル化可変標的領域のメチル化、および/または断片化可変標的領域の断片化の乱れと一致し得、ここで、「乱れ」は、健康な対象に由来する対応する試料において見出されるDNAとは異なることを意味する。
一部の実施形態では、0.001%~10%の範囲の値よりも大きいまたはそれに等し、高メチル化可変標的領域セットにおける高メチル化および/または断片化可変標的領域セットにおける異常な断片化を示す高メチル化可変標的領域セットおよび/または断片化可変標的領域セットに対応する分子の割合は、第2の部分スコアががん再発に関して陽性として分類されるのに十分である。範囲は、0.001%~1%、0.005%~1%、0.01%~5%、0.01%~2%、または0.01%~1%であり得る。
一部の実施形態では、そのような方法のいずれかは、腫瘍細胞からの起源を示す1つまたは複数の特色を示す配列情報のセット中の分子の分画から腫瘍DNAの分画を決定するステップを含み得る。これは、例えば、高メチル化可変標的領域および断片化可変標的領域(高メチル化可変標的領域の高メチル化および/または断片化可変標的領域の異常な断片化は、腫瘍細胞からの起源を示すと考えられ得る)の一方または両方を含む、エピジェネティック標的領域の一部または全てに対応する分子について行われ得る。これは、配列可変標的領域に対応する分子、例えばがんと一貫する変更、例えばSNV、インデル、CNV、および/また融合を含む分子について行われ得る。腫瘍DNAの分画は、エピジェネティック標的領域に対応する分子および配列可変標的領域に対応する分子の組合せに基づいて決定され得る。
がん再発スコアの決定は、腫瘍DNAの分画に少なくとも部分的に基づき得、10-11~1または10-10~1の範囲の閾値よりも大きい腫瘍DNAの分画は、がん再発スコアががん再発に関して陽性であると分類されるために十分である。一部の実施形態では、10-10~10-9、10-9~10-8、10-8~10-7、10-7~10-6、10-6~10-5、10-5~10-4、10-4~10-3、10-3~10-2、または10-2~10-1の範囲の閾値よりも大きいまたはそれに等しい腫瘍DNAの分画は、がん再発スコアが、がん再発に関して陽性であると分類されるために十分である。一部の実施形態では、少なくとも10-7の閾値よりも大きい腫瘍DNAの分画は、がん再発スコアが、がん再発に関して陽性であると分類されるために十分である。腫瘍DNAの分画が閾値、例えば前述の実施形態のいずれかに対応する閾値よりも大きいという決定は、累積確率に基づいて行われ得る。例えば、試料は、腫瘍分画が前述の範囲のいずれかにおける閾値よりも大きい累積確率が、少なくとも0.5、0.75、0.9、0.95、0.98、0.99、0.995、または0.999の確率閾値を超える場合に陽性であるとみなされた。一部の実施形態では、確率閾値は、少なくとも0.95、例えば0.99である。
一部の実施形態では、配列情報のセットは、配列可変標的領域配列およびエピジェネティック標的領域配列を含み、がん再発スコアを決定するステップは、配列可変標的領域配列に存在するSNV、挿入/欠失、CNVおよび/または融合の量を示す第1のサブスコア、ならびにエピジェネティック標的領域配列中の異常な分子の量を示す第2のサブスコアを決定するステップ、ならびに第1および第2のサブスコアを組み合わせてがん再発スコアを提供するステップを含む。第1および第2のサブスコアを組み合わせる場合、それらを、独立して各サブスコア(例えば、配列可変標的領域における既定の数の突然変異(例えば、>1)よりも大きく、エピジェネティック標的領域中の異常な分子(すなわち、健康な対象からの対応する試料中で見出されるDNAとは異なるエピジェネティック状態を有する分子、例えば腫瘍)の既定の分画よりも大きい)に閾値を適用するか、または機械学習分類器を訓練して、複数の陽性および陰性訓練試料に基づいて状態を決定することによって組み合わせてもよい。
一部の実施形態では、-4~2または-3~1の範囲の組み合わせたスコアの値は、がん再発スコアががん再発に関して陽性であると分類されるために十分である。
がん再発スコアががん再発に関して陽性であると分類される任意の実施形態では、対象のがん再発ステータスはがん再発のリスクがあり得る、および/または対象はその後のがん処置の候補であると分類され得る。
一部の実施形態では、がんは、本明細書の他所で記載されるがんのタイプのいずれか1つ、例えば結腸直腸がんである。
3.治療および関連する投与
3.治療および関連する投与
ある特定の実施形態では、本明細書に開示される方法は、核酸変異体の状態が体細胞または生殖系列起源であることを考慮して、カスタマイズされた治療を同定すること、およびそれを患者に投与することに関する。一部の実施形態では、本質的に任意のがん治療(例えば、外科治療、放射線治療、化学療法および/またはそれと同様のもの)を、これらの方法の一部として含めてもよい。典型的に、カスタマイズされた治療は、少なくとも1つの免疫療法(または免疫療法剤)を含む。免疫療法は一般的に、所定のがんタイプに対する免疫応答を増強する方法を指す。ある特定の実施形態では、免疫療法は、腫瘍またはがんに対するT細胞応答を増強する方法を指す。
ある特定の実施形態では、体細胞または生殖系列起源である対象由来の試料からの核酸変異体の状態を、その対象のカスタマイズされたまたは標的化治療を同定するために参照集団からの比較器の結果のデータベースと比較してもよい。典型的に、参照集団は、試験対象と同じがんもしくは疾患タイプを有する患者、ならびに/または試験対象と同じ治療を受けているもしくは受けたことがある患者を含む。カスタマイズされたまたは標的化治療(または複数の治療)は、核酸変異体および比較器の結果がある特定の分類基準(例えば、実質的またはおおよそマッチする)を満たす場合に同定され得る。
ある特定の実施形態では、本明細書に記載されるカスタマイズされた治療は、典型的に非経口(例えば、静脈内、または皮下)投与される。免疫療法剤を含有する医薬組成物は、典型的に静脈内投与される。ある特定の治療剤は経口投与される。しかし、カスタマイズされた治療(例えば、免疫療法剤など)はまた、例えば口腔内、舌下、直腸、膣、尿道内、局所、眼内、鼻腔内、および/または耳介内などの方法によって投与されてもよく、投与は、錠剤、カプセル剤、顆粒剤、水性懸濁剤、ゲル剤、スプレー剤、坐剤、塗擦剤、軟膏剤などを含み得る。
本発明の好ましい実施形態が本明細書において示され、説明されているが、そのような実施形態が単なる例として提供されることは、当業者には明らかであろう。本発明が本明細書内に提供されている具体的な例によって制限されることは、意図されない。本発明は、前述の明細書を参照して記載されているが、本明細書における実施形態の説明および例示は、制限的な意味で解釈されることを意味するものではない。当業者であれば、本発明から逸脱することなく、多数の変化形、変更、および置換を想起するであろう。さらに、本発明の全ての態様は、本明細書において記載されている具体的な説明、構成、または相対的割合に制限されず、それらは、様々な条件および変数に依存することを理解すべきである。本明細書に記載される本開示の実施形態に対する様々な代替形態を、本開示の実施に用いることができることを理解すべきである。したがって、本開示はまた、任意のそのような代替形態、改変形態、変動形態、または等価物を網羅するものとすることが企図される。以下の特許請求の範囲が本発明の範囲を定めること、ならびにこれらの特許請求の範囲内の方法および構造、ならびにそれらの等価物が、それによって網羅されることが意図される。
前述の開示は、明確さおよび理解の目的で、例証および例によって一部詳細に説明されているが、当業者には、本開示を読むことによって、形態および細部における様々な変化が、本開示の真の範囲から逸脱することなく行われ得、添付の特許請求の範囲内で実施され得ることは明白である。例えば、全ての方法、システム、コンピュータ可読媒体、および/または構成要素の特色、ステップ、要素、もしくはこれらの他の態様を、様々な組合せで使用することができる。
H.キット
H.キット
また、本明細書に記載される組成物を含む、キットも提供される。キットは、本明細書に記載される方法を行うのに有用であり得る。一部の実施形態では、キットは、本明細書に記載されるように、試料を複数の部分試料に分配するための第1の試薬、例えば、本明細書の他の箇所に記載される分配試薬のいずれかを含む。一部の実施形態では、キットは、第1の部分試料を、第1の部分試料のDNA内の第1の核酸塩基に対してDNA内の第2の核酸塩基とは異なって影響を及ぼす手順に供するための第2の試薬を含み、ここで、第1の核酸塩基は、改変または非改変核酸塩基であり、第2の核酸塩基は、第1の核酸塩基とは異なる改変または非改変核酸塩基であり、第1の核酸塩基および第2の核酸塩基は、同じ塩基対形成特異性を有する(例えば、核酸塩基、例えば、シトシンまたはメチル化シトシンを異なる核酸塩基に変換するための本明細書の他の箇所に記載される試薬のうちのいずれか)。キットは、第1および第2の試薬、ならびに以下および/または本明細書の他の箇所において考察される追加のエレメントを含み得る。
キットは、ALK、APC、BRAF、CDKN2A、EGFR、ERBB2、FBXW7、KRAS、MYC、NOTCH1、NRAS、PIK3CA、PTEN、RBI、TP53、MET、AR、ABLl、AKTl、ATM、CDHl、CSFIR、CTNNBl、ERBB4、EZH2、FGFRl、FGFR2、FGFR3、FLT3、GNA11、GNAQ、GNAS、HNF1A、HRAS、IDH1、IDH2、JAK2、JAK3、KDR、KIT、MLH1、MPL、NPM1、PDGFRA、PROC、PTPN11、RET,SMAD4、SMARCB1、SMO、SRC、STK11、VHL、TERT、CCND1、CDK4、CDKN2B、RAF1、BRCA1、CCND2、CDK6、NF1、TP53、ARID 1 A、BRCA2、CCNE1、ESR1、RIT1、GATA3、MAP2K1、RHEB、ROS1、ARAF、MAP2K2、NFE2L2、RHOA、およびNTRKlからなる群から選択される少なくとも5個、6個、7個、8個、9個、10個、20個、30個、40個、または全ての遺伝子に選択的にハイブリダイズする、複数のオリゴヌクレオチドプローブをさらに含み得る。オリゴヌクレオチドプローブが選択的にハイブリダイズすることができる遺伝子の数は、変動し得る。例えば、遺伝子の数は、1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、11個、12個、13個、14個、15個、16個、17個、18個、19個、20個、21個、22個、23個、24個、25個、26個、27個、28個、29個、30個、31個、32個、33個、34個、35個、36個、37個、38個、39個、40個、41個、42個、43個、44個、45個、46個、47個、48個、49個、50個、51個、52個、53個、または54個を含み得る。キットは、複数のオリゴヌクレオチドプローブ、および本明細書に記載される方法のうちのいずれかを行うための使用説明書を含む、容器を含み得る。
オリゴヌクレオチドプローブは、遺伝子、例えば、少なくとも5個の遺伝子のエクソン領域に選択的にハイブリダイズし得る。一部の場合では、オリゴヌクレオチドプローブは、遺伝子、例えば、少なくとも5個の遺伝子の少なくとも30個のエクソンに選択的にハイブリダイズし得る。一部の場合では、複数のプローブが、少なくとも30個のエクソンの各々に選択的にハイブリダイズし得る。各エクソンにハイブリダイズするプローブは、少なくとも1つの他のプローブとオーバーラップする配列を有し得る。一部の実施形態では、オリゴプローブは、本明細書に開示される遺伝子の非コード領域、例えば、遺伝子のイントロン領域に選択的にハイブリダイズし得る。オリゴプローブはまた、本明細書に開示される遺伝子のエクソン領域およびイントロン領域の両方を含む遺伝子の領域に選択的にハイブリダイズし得る。
任意の数のエクソンが、オリゴヌクレオチドプローブによって標的とされ得る。例えば、少なくとも1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、11個、12個、13個、14個、15個、16個、17個、18個、19個、20個、21個、22個、23個、24個、25個、30個、35個、40個、45個、50個、55個、60個、65個、70個、75個、80個、85個、90個、95個、100個、105個、110個、115個、120個、125個、130個、135個、140個、145個、150個、155個、160個、165個、170個、175個、180個、185個、190個、195個、200個、205個、210個、215個、220個、225個、230個、235個、240個、245個、250個、255個、260個、265個、270個、275個、280個、285個、290個、295個、300個、400個、500個、600個、700個、800個、900個、1,000個、またはそれよりも多くのエクソンが、標的とされ得る。
キットは、別個の分子バーコードおよび同一の試料バーコードを有する少なくとも4個、5個、6個、7個、または8個の異なるライブラリーアダプターを含み得る。ライブラリーアダプターは、シーケンシングアダプターでなくてもよい。例えば、ライブラリーアダプターは、フローセル配列またはシーケンシングのためのヘアピンループの形成を可能にする配列を含まない。異なる変異ならびに分子バーコードおよび試料バーコードの組合せが、本明細書全体を通して記載されており、キットに応用可能である。さらに、一部の例では、アダプターは、シーケンシングアダプターではない。さらに、キットに提供されるアダプターはまた、シーケンシングアダプターも含み得る。シーケンシングアダプターは、1つまたは複数のシーケンシングプライマーにハイブリダイズする配列を含み得る。シーケンシングアダプターはさらに、固体支持体にハイブリダイズする配列、例えばフローセル配列も含み得る。例えば、シーケンシングアダプターはフローセルアダプターであり得る。シーケンシングアダプターを、ポリヌクレオチド断片の一方または両方の末端に付着させることができる。一部の例では、キットは、別個の分子バーコードおよび同一の試料バーコードを有する少なくとも8個の異なるライブラリーアダプターを含み得る。ライブラリーアダプターは、シーケンシングアダプターでなくてもよい。キットはさらに、ライブラリーアダプターに選択的にハイブリダイズする第1の配列およびフローセル配列に選択的にハイブリダイズする第2の配列を有するシーケンシングアダプターも含み得る。別の例では、シーケンシングアダプターは、ヘアピン形状であり得る。例えば、ヘアピン形状のアダプターは、相補的二本鎖部分およびループ部分を含み得、二本鎖部分は、二本鎖ポリヌクレオチドに付着(例えば、ライゲーション)することができる。ヘアピン形状のシーケンシングアダプターを、ポリヌクレオチド断片の両方の末端に付着させて、環状分子を生成することができ、これを複数回シーケンシングすることができる。シーケンシングアダプターは、末端から末端まで最大10個、11個、12個、13個、14個、15個、16個、17個、18個、19個、20個、21個、22個、23個、24個、25個、26個、27個、28個、29個、30個、31個、32個、33個、34個、35個、36個、37個、38個、39個、40個、41個、42個、43個、44個、45個、46個、47個、48個、49個、50個、51個、52個、53個、54個、55個、56個、57個、58個、59個、60個、61個、62個、63個、64個、65個、66個、67個、68個、69個、70個、71個、72個、73個、74個、75個、76個、77個、78個、79個、80個、81個、82個、83個、84個、85個、86個、87個、88個、89個、90個、91個、92個、93個、94個、95個、96個、97個、98個、99個、100個、またはそれより多くの塩基であり得る。シーケンシングアダプターは、末端から末端まで20~30個、20~40個、30~50個、30~60個、40~60個、40~70個、50~60個、50~70個の塩基を含み得る。特定の例では、シーケンシングアダプターは、末端から末端まで20~30個の塩基を含み得る。別の例では、シーケンシングアダプターは、末端から末端まで50~60個の塩基を含み得る。シーケンシングアダプターは、1つまたは複数のバーコードを含み得る。例えば、シーケンシングアダプターは、試料バーコードを含み得る。試料バーコードは既定の配列を含み得る。試料バーコードを使用してポリヌクレオチドの起源を同定することができる。試料バーコードは、少なくとも1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、11個、12個、13個、14個、15個、16個、17個、18個、19個、20個、21個、22個、23個、24個、25個、またはそれより多くの(または本明細書全体を通して記載される任意の長さの)核酸塩基、例えば少なくとも8個の塩基であり得る。バーコードは、上記のように連続または不連続配列であり得る。
ライブラリーアダプターは、平滑末端化され、Y字形状であり得、40核酸塩基未満またはそれに等しい長さであり得る。他の変形形態は、全体を通して見出すことができ、キットに応用可能である。
本明細書に引用される全ての特許、特許出願、ウェブサイト、他の刊行物、または文書、受託番号などは、各々の個々の項目が、具体的かつ個別に、参照により組み込まれると示されるのと同程度に、あらゆる目的で、参照によりその全体が組み込まれる。配列の異なるバージョンが、異なる時間で、1つの受託番号と関連付けられている場合、本出願の有効出願日で受託番号と関連付けられているバージョンを意味する。有効出願日は、実際の出願日、または該当する場合には受託番号に言及している優先出願の出願日のうちの早い方を意味する。同様に、刊行物、ウェブサイトなどの異なるバージョンが、異なる時期に公開されている場合、別途示されない限り、本出願の有効出願日でもっとも新しく公開されているバージョンを意味する。
III.実施例
以下の実施例は、開示される方法のある特定の態様を例示するために提供される。実施例は、本開示を限定するものではない。
(実施例1)
腫瘍の存在/非存在を検出するためのcfDNAの解析
以下の実施例は、開示される方法のある特定の態様を例示するために提供される。実施例は、本開示を限定するものではない。
(実施例1)
腫瘍の存在/非存在を検出するためのcfDNAの解析
患者試料のセットを、がんの存在/非存在を検出するために、Guardant Health(Redwood City、CA、USA)において血液に基づくNGSアッセイによって解析する。cfDNAを、これらの患者の血漿から抽出する。患者試料のcfDNAを、次いで、メチル結合ドメイン(MBD)緩衝液と組み合わせ、磁気ビーズをMBDタンパク質とコンジュゲートさせ、一晩インキュベートする。メチル化cfDNA(存在する場合、cfDNA試料中)は、このインキュベーション中に、MBDタンパク質に結合する。非メチル化であるか、またはあまり非メチル化であるDNAは、漸増濃度の塩を含有する緩衝液で、ビーズから洗い流される。最終的に、高塩緩衝液を使用して、MBDタンパク質から、高度メチル化DNAを洗い流す。これらの洗浄により、漸増メチル化cfDNAの3つの分配(低メチル化、残留メチル化、および高メチル化分配)が得られる。
低メチル化分配内のcfDNA分子は、mCを、シーケンシングにおいてTとして読み取られる塩基(TAPの場合にはDHU)に変換する、TAPなどの変換手順に供される。したがって、低メチル化分配における非特異的に分配されたDNAは、中間メチル化から低メチル化を示す塩基変換を示すであろう。
必要に応じて、高メチル化分配中のcfDNA分子を、酵素的改変(EM)に供し、それによって、非改変シトシンは、脱アミノ化を受けるが、mCおよびhmCはそれを受けず、それによって、非改変シトシンからウラシルへの変換により、第1の部分試料中の非特異的に分配された低メチル化分子に印を付ける。
必要に応じて、残留分配におけるcfDNAは、メチル化C残基を非メチル化C残基と識別し、非特異的に分配された分子(低メチル化または高メチル化分子)を同定する変換手順に供されてもよい。
3つの分配中のcfDNA分子は、清浄されて、塩が除去され、ライブラリー調製の酵素ステップの準備において濃縮される。分配中のcfDNAを濃縮した後、分配されたcfDNAの末端オーバーハングを伸長させ、アデノシン残基を、伸長中にポリメラーゼによってcfDNA断片の3’末端に付加する。各断片の5’末端を、リン酸化する。これらの改変により、分配されたcfDNAがライゲーション可能となる。DNAリガーゼおよびアダプターを添加して、各分配されたcfDNA分子を、各末端でアダプターとライゲーションさせる。これらのアダプターは、非一意的分子バーコードを含有し、各分配を、他の分配において使用されるアダプター内のバーコードと識別可能な非一意的分子バーコードを有するアダプターとライゲーションさせる。ライゲーションの後に、4つの分配を一緒にプールし、PCRによって増幅させる。
PCR後、増幅したDNAを、富化の前に、洗浄し、濃縮する。濃縮した後、増幅したDNAを、塩緩衝液ならびに配列可変標的領域セットのプローブおよびエピジェネティック標的領域セットのプローブを含むビオチン化RNAプローブと組み合わせ、この混合物を、一晩インキュベートする。配列可変領域セットのプローブは、約50kbのフットプリントを有し、エピジェネティック標的領域セットのプローブは、約500kbのフットプリントを有する。配列可変標的領域セットのプローブは、表3~5において同定される遺伝子の少なくともサブセットを標的とするオリゴヌクレオチドを含み、エピジェネティック標的領域セットのプローブは、高メチル化可変標的領域、低メチル化可変標的領域、CTCF結合標的領域、転写開始部位標的領域、局所増幅標的領域、およびメチル化対照領域の選択物を標的とするオリゴヌクレオチドを含む。
ビオチン化RNAプローブ(DNAにハイブリダイズしている)を、ストレプトアビジン磁気ビーズによって捕捉し、一連の塩に基づく洗浄によって捕捉されない増幅されたDNAから分離し、それによって試料を富化する。富化後に、富化した試料のアリコートを、Illumina NovaSeqシーケンサーを使用してシーケンシングする。シーケンサーによって生成された配列読み取りデータを、次いで、バイオインフォマティックツール/アルゴリズムを使用して解析する。分子バーコードは、一意的分子を同定するため、ならびに試料の差次的にMBD分配された分子へのデコンボリューションのために、使用する。この実施例に記載される方法は、その分配に基づく分子の全体的なメチル化(すなわち、メチル化されたシトシン残基)レベルに関する情報を提供することとは別に、メチル化シトシン(すなわち、mCまたはhmC)の同一性および/または位置に関するより高い分解能の情報も提供し、それらが出現する分配との塩基変換の不一致性を示す非特異的に分配された分子の同定も可能にし得る。配列可変標的領域配列を、実際の腫瘍変異体を技術的エラー(例えば、PCRエラー、シーケンシングエラー)とは区別する十分な根拠でコールすることができるゲノム変更、例えば、SNV、挿入、欠失、および融合を検出することによって、解析する。エピジェネティック標的領域配列を独立して解析して、例えば、可能性としてがん性の組織において、健康なcfDNAと比較して、差次的にメチル化されることが示されている領域において、cfDNA分子のメチル化状態を検出する。非特異的分配を示す塩基変換を示す分子は、正確度および/または感度を増加させるために、この解析から除外され得る。最後に、両方の解析の結果を組み合わせて、最終的な腫瘍の存在/非存在のコールを生成する。
(実施例2)
健康な対象および初期結腸直腸がんを有する対象に由来するcfDNA試料における単一ヌクレオチド分解能におけるメチル化の解析
(実施例2)
健康な対象および初期結腸直腸がんを有する対象に由来するcfDNA試料における単一ヌクレオチド分解能におけるメチル化の解析
健康な対象および初期結腸直腸がんを有する対象に由来するcfDNAの試料を、以下のように解析した。cfDNAを、MBDを使用して分配して、高メチル化分配、中間分配、および低メチル化分配を得た。各分配の分配されたDNAを、アダプターにライゲーションし、それによって非改変シトシンは脱アミノ化を受けるが、mCおよびhmCは受けないEM-seq変換手順に供したが、代替的な手順では、低メチル化分配のcfDNA分子は、低メチル化分配における非特異的に分配されたDNAが中間メチル化から高メチル化を示す塩基変換を示すように、mCをシーケンシングにおいてTとして読み取られる塩基(TAPの場合にはDHU)に変換する変換手順、例えば、TAPに供してもよい。脱アミノ化の後に、分配を、シーケンシングのために調製し、全ゲノムシーケンシングに供した。各分配を、別個にシーケンシングしたが、代替的な手順では、分配は、差次的にタグ付し(例えば、分配後でEM-seq変換前、または分配およびEM-seq変換後でシーケンシングのためのさらなる調製の前に)、プールし、プロセシングされ、並列してシーケンシングしてもよい。
高メチル化可変標的領域からの配列データを、バイオインフォマティクスによって単離したが、代替的な手順では、標的領域は、シーケンシングの前にin vitroで富化してもよい。高メチル化可変標的領域の塩基あたりのメチル化を、図5に示されるように定量し、これは、高メチル化分配に由来する高メチル化可変標的領域内の分子あたりのメチル化CpGの数を示す。x軸は、分子あたりのCpGの総数を示し、そのため、対角線に沿った点は、CpGごとにメチル化を有する分子を表す。したがって、メチル化を、単一塩基分解能で解析し、MBD分配材料の塩基あたりのメチル化および部分的な分子メチル化を定量することが可能であった。結腸直腸がんを有する対象に由来する試料は、これらの領域において、健康な対象に由来する試料よりもはるかに高い全体的なメチル化を示した。
(実施例3)
非特異的に分配されたDNAの消化による技術的ノイズの低減
(実施例3)
非特異的に分配されたDNAの消化による技術的ノイズの低減
2つの健康な正常試料に由来するcfDNAのプールを組み合わせて、そこから18.6ngを、本明細書に記載されるMBD分配アッセイへの入力として使用した。試料のサブセットに対して、結腸直腸がん試料(CRC)に由来するcfDNAを、0.5%のMAF(変異型アレル分画)で添加し、0.16%のMAFを有する希釈CRC試料を得た。正常試料および希釈CRC試料の3つのセットを、アッセイにおいて使用した。3つのセットの試料を、次いで、MBDタンパク質を使用して、3つの分配(高分配、残留分配、および低分配)に分配した。クリーンアップ後に、各分配中のcfDNA分子を、分子バーコードを含む分配特異的アダプターとライゲーションさせた。
高分配および残留分配に使用する分子バーコードは、MSRE認識部位を有さず、そのため下流のプロセシング(cfDNAメチル化状態とは無関係)において消化されないように、選択する。ライゲーション後に、ライゲーションクリーンアップを行った。ライゲーションクリーンアップの後に、高および残留分配を、MSRE消化反応に供した。第1の試料セット(正常試料および希釈CRC試料)を、BstUIおよびHpaIIで処置し、別の試料セットを、BstUI、HpaII、およびHin6I酵素で処置した。第3の試料セットに、対照として、MBD分配アッセイにおいて疑消化(MSREなし)を行った。MSRE消化後に、酵素を、熱不活化させ(65℃、20分間)、SPRIビーズを使用してクリーンアップした。消化クリーンアップ後に、高、残留、および(非消化)低分配(アダプターライゲーションしたcfDNA)を組み合わせ、PCR増幅、目的のゲノム領域における分子の富化、試料をプールし、それよって、NovaSeqを使用したプールした試料の多重シーケンシングおよびシーケンシングを可能にすることを含む、NGSアッセイワークフローを進めた。
図6は、MSRE消化を適用した場合に、正常試料中の非メチル化分子からの技術的ノイズと比較してDMRでのがんメチル化シグナルの増加を明らかに示す。図6で示される陰性対照領域(DNA分子が疾患状態によらず、ほぼ全ての時間で非メチル化である)では、「a」は、MSRE消化が高分配に誤って分配された非メチル化分子を除去することが明白であったことを明らかに示し、すなわち90個の分子が、偽消化では高分配に分配されたが、BstUI、HpaII、およびHin6I消化では、分子数は10個に低減された。図6に示される分類DMRでは、cfDNA分子は、MSREによる消化により正常試料(b;350→100)では希釈したCRC試料(c;1500→1100)よりもかなり高い割合で除去された。
本明細書の他の箇所に記載されるように、低分配(第2の部分試料)は、例えば、低メチル化分配における非特異的に分配されたDNAが、中間メチル化から高メチル化を示す塩基変換を示すように、mCを、シーケンシングにおいてTとして読み取られる塩基(TAPの場合にはDHU)に変換するTAPなど、第2の部分試料のDNA内の第1の核酸塩基に対してDNA内の第2の核酸塩基とは異なって影響を及ぼす手順に供され得、第1の核酸塩基は、改変または非改変核酸塩基であり、第2の核酸塩基は、第1の核酸塩基とは異なる改変または非改変核酸塩基であり、第1の核酸塩基および第2の核酸塩基は、同じ塩基対形成特異性を有する。手順は、例えば、分配の後および/もしくは分配特異的アダプターのライゲーションの前、または本明細書の他の箇所に記載される任意の他の適切な段階で、使用され得る。
本発明の好ましい実施形態が本明細書において示され、説明されているが、そのような実施形態が単なる例として提供されることは、当業者には明らかであろう。本発明が本明細書内に提供されている具体的な実施例によって制限されることは、意図されない。本発明は、前述の明細書を参照して記載されているが、本明細書における実施形態の説明および例示は、制限的な意味で解釈されることを意味するものではない。当業者であれば、本発明から逸脱することなく、多数の変化形、変更、および置換を想起するであろう。さらに、本発明の全ての態様は、本明細書において記載されている具体的な説明、構成、または相対的割合に制限されず、それらは、様々な条件および変数に依存することを理解すべきである。本明細書に記載される本開示の実施形態に対する様々な代替形態を、本開示の実施に用いることができることを理解すべきである。したがって、本開示はまた、任意のそのような代替形態、改変形態、変動形態、または等価物を網羅するものとすることが企図される。以下の特許請求の範囲が本発明の範囲を定めること、ならびにこれらの特許請求の範囲内の方法および構造、ならびにそれらの等価物が、それによって網羅されることが意図される。
前述の開示は、明快にするためおよび理解目的のために、例証および例によって一部詳細に記載されているが、当業者には、本開示を読むことによって、形態および詳細の様々な変化が、本発明の真の範囲から逸脱することなく行われ得ること、ならびに添付の特許請求の範囲内で実践され得ることは明白である。例えば、全ての方法、システム、コンピュータ可読媒体、および/またはその構成要素の特色、ステップ、要素、もしくは他の態様は、様々な組合せで使用することができる。
本明細書で引用される全ての特許、特許出願、ウェブサイト、他の刊行物または文書、受託番号などは、各々の個々の項目が具体的かつ個々に参照により組み込まれることが示されているのと同程度に全ての目的に関してその全体が参照によりに組み込まれる。配列の異なるバージョンが異なる時間で受託番号に関連している場合、本出願の有効な提出日で受託番号に関連するバージョンを意味する。有効な提出日は、実際の提出日、または該当する場合、受託番号を参照する優先権出願の提出日の早いほうを意味する。同様に、異なるバージョンの刊行物、ウェブサイトなどが異なる時期に公開されている場合、特に示していない限り、出願の有効な提出日で公開された最新のバージョンを意味する。
Claims (74)
- 試料中のDNAを解析する方法であって、
a)前記試料を、第1の部分試料および第2の部分試料を含む複数の部分試料に分配するステップであって、前記第1の部分試料が、前記第2の部分試料よりも高い割合で、シトシン改変を有するDNAを含む、ステップと、
b)前記第2の部分試料を、前記第2の部分試料の前記DNA内の第1の核酸塩基に対して前記DNA内の第2の核酸塩基とは異なって影響を及ぼす手順に供するステップであって、前記第1の核酸塩基が改変または非改変核酸塩基であり、前記第2の核酸塩基が前記第1の核酸塩基とは異なる改変または非改変核酸塩基であり、前記第1の核酸塩基および前記第2の核酸塩基が同じ塩基対形成特異性を有し、それによって処置された部分試料を産生するステップと、
c)前記処置された部分試料から、エピジェネティック標的領域を含む標的領域セットを捕捉するステップと、
d)前記標的領域セット中のDNAおよび前記第1の部分試料に由来するDNAをシーケンシングするステップであって、前記第2の部分試料に由来するDNAが、前記標的領域セットの前記DNA内の前記第1の核酸塩基を前記第2の核酸塩基と識別する様式でシーケンシングされる、ステップと
を含む、方法。 - 試料中のDNAを解析する方法であって、
a)前記試料から、エピジェネティック標的領域を含む標的領域セットを捕捉するステップと、
b)前記標的領域セットを、第1の部分試料および第2の部分試料を含む複数の部分試料に分配するステップであって、前記第1の部分試料が、前記第2の部分試料よりも高い割合で、シトシン改変を有するDNAを含む、ステップと、
c)前記第2の部分試料を、前記第2の部分試料の前記DNA内の第1の核酸塩基に対して前記DNA内の第2の核酸塩基とは異なって影響を及ぼす手順に供するステップであって、前記第1の核酸塩基が改変または非改変核酸塩基であり、前記第2の核酸塩基が前記第1の核酸塩基とは異なる改変または非改変核酸塩基であり、前記第1の核酸塩基および前記第2の核酸塩基が同じ塩基対形成特異性を有し、それによって処置された部分試料を産生するステップと、
d)前記第1の部分試料に由来するDNAおよび前記第2の部分試料に由来するDNAをシーケンシングするステップであって、前記第2の部分試料に由来するDNAが、前記標的領域セットの前記DNA内の前記第1の核酸塩基を前記第2の核酸塩基と識別する様式でシーケンシングされる、ステップと
を含む、方法。 - 前記標的領域セットが、低メチル化可変標的領域セットを含む、上記請求項のいずれか一項に記載の方法。
- 前記低メチル化可変標的領域セットが、少なくとも1つのタイプの組織において、健康な対象に由来する無細胞DNAにおけるメチル化の程度よりも低い程度のメチル化を有する領域を含む、直前の請求項に記載の方法。
- 前記標的領域セットが、メチル化対照標的領域セットを含む、請求項3または4に記載の方法。
- 前記標的領域セットが、断片化可変標的領域セットを含む、上記請求項のいずれか一項に記載の方法。
- 前記断片化可変標的領域セットが、転写開始部位領域を含む、直前の請求項に記載の方法。
- 前記断片化可変標的領域セットが、CTCF結合領域を含む、請求項6または7に記載の方法。
- 前記標的領域セットが、配列可変標的領域をさらに含む、上記請求項のいずれか一項に記載の方法。
- 前記配列可変標的領域セットに対応するDNA分子が、前記エピジェネティック標的領域セットに対応するDNA分子よりも高い捕捉収率で捕捉される、直前の請求項に記載の方法。
- 試料中のDNAを解析する方法であって、
a)前記試料を、第1の部分試料および第2の部分試料を含む複数の部分試料に分配するステップであって、前記第1の部分試料が、前記第2の部分試料よりも高い割合で、シトシン改変を有するDNAを含む、ステップと、
b)前記第2の部分試料を、前記第2の部分試料の前記DNA内の第1の核酸塩基に対して前記DNA内の第2の核酸塩基とは異なって影響を及ぼす手順に供するステップであって、前記第1の核酸塩基が改変または非改変核酸塩基であり、前記第2の核酸塩基が前記第1の核酸塩基とは異なる改変または非改変核酸塩基であり、前記第1の核酸塩基および前記第2の核酸塩基が同じ塩基対形成特異性を有し、それによって処置された部分試料を産生するステップと、
c)前記処置された部分試料に由来するDNAおよび前記第1の部分試料に由来するDNAを、前記標的領域セットの前記DNA内の前記第1の核酸塩基を前記第2の核酸塩基と識別する様式でシーケンシングするステップと
を含む、方法。 - 前記第1の部分試料のDNAが、メチル化感受性ヌクレアーゼと接触させられ、それによって前記第1の部分試料中の非特異的に分配されたDNAを分解する、上記請求項のいずれか一項に記載の方法。
- 前記DNAが、試験対象から得られた無細胞DNA(cfDNA)を含む、上記請求項のいずれか一項に記載の方法。
- 前記第1の部分試料から、追加の標的領域セットを捕捉するステップをさらに含み、シーケンシングされる前記第1の部分試料に由来するDNAが、前記追加の標的領域セットを含む、上記請求項のいずれか一項に記載の方法。
- 前記第1の部分試料を、前記第2の部分試料の前記DNA内の第1の核酸塩基に対して前記DNA内の第2の核酸塩基とは異なって影響を及ぼす手順に供するステップであって、前記第1の核酸塩基が改変または非改変核酸塩基であり、前記第2の核酸塩基が前記第1の核酸塩基とは異なる改変または非改変核酸塩基であり、前記第1の核酸塩基および前記第2の核酸塩基が同じ塩基対形成特異性を有し、それによって追加の処置された部分試料を産生するステップをさらに含む、上記請求項のいずれか一項に記載の方法。
- 前記追加の処置された部分試料から、追加の標的領域セットを捕捉するステップをさらに含む、直前の請求項に記載の方法。
- 前記追加の標的領域セットが、高メチル化可変標的領域セットを含む、請求項14または16に記載の方法。
- 前記高メチル化可変標的領域セットが、少なくとも1つのタイプの組織において、健康な対象に由来する無細胞DNAにおけるメチル化の程度よりも高い程度のメチル化を有する領域を含む、直前の請求項に記載の方法。
- 前記追加の標的領域セットが、メチル化対照標的領域セットを含む、請求項17または18に記載の方法。
- 前記追加の標的領域セットが、断片化可変標的領域セットを含む、請求項16~19のいずれか一項に記載の方法。
- 前記断片化可変標的領域セットが、転写開始部位領域を含む、直前の請求項に記載の方法。
- 前記断片化可変標的領域セットが、CTCF結合領域を含む、請求項20または21に記載の方法。
- 前記追加の標的領域セットが、配列可変標的領域をさらに含む、請求項16~22のいずれか一項に記載の方法。
- 前記配列可変標的領域セットに対応するDNA分子が、前記エピジェネティック標的領域セットに対応するDNA分子よりも高い捕捉収率で捕捉される、直前の請求項に記載の方法。
- 捕捉するステップが、捕捉しようとするDNAを、標的特異的プローブのセットと接触させることを含み、それによって標的特異的プローブとDNAとの複合体が形成される、上記請求項のいずれか一項に記載の方法。
- 捕捉するステップが、前記複合体を、標的特異的プローブに結合していないDNAから分離させ、それによって捕捉されたDNAを得ることをさらに含む、直前の請求項に記載の方法。
- 前記標的特異的プローブのセットが、前記エピジェネティック標的領域セットに対応するDNAよりも高い捕捉収率で前記配列可変標的領域セットに対応するDNAを捕捉するように構成される、請求項25または26に記載の方法。
- 前記エピジェネティック標的領域セットに対応するDNA分子よりも大きいシーケンシング深度まで、前記配列可変標的領域セットに対応するDNA分子をシーケンシングするステップを含む、請求項9~22のいずれか一項に記載の方法。
- 前記DNAが、前記シーケンシングするステップの前に増幅されるか、または前記DNAが、前記捕捉するステップの前に増幅される、上記請求項のいずれか一項に記載の方法。
- 捕捉の前に前記DNAにバーコード含有アダプターをライゲーションするステップをさらに含み、必要に応じて、前記ライゲーションするステップが、増幅の前または増幅と同時に生じる、上記請求項のいずれか一項に記載の方法。
- 前記試料を複数の部分試料に分配するステップが、メチル化レベルに基づいて分配することを含む、上記請求項のいずれか一項に記載の方法。
- 前記分配するステップが、収集したcfDNAを、固体支持体に固定化されたメチル結合試薬と接触させることを含む、直前の請求項に記載の方法。
- 前記第1の部分試料および第2の部分試料または前記第1の部分試料および前記処置された部分試料を、差次的にタグ付けするステップを含む、上記請求項のいずれか一項に記載の方法。
- 前記第1の部分試料および前記標的領域セットまたは第2の部分試料に由来するDNAが、プールされる、直前の請求項に記載の方法。
- 前記第1の部分試料および前記標的領域セットまたは第2の部分試料に由来するDNAが、同じシーケンシングセルにおいてシーケンシングされる、請求項33~34のいずれか一項に記載の方法。
- 前記複数の部分試料が、前記第2の部分試料よりも高い割合であるが前記第1の部分試料よりも低い割合でシトシン改変を有するDNAを含む、第3の部分試料を含む、上記請求項のいずれか一項に記載の方法。
- 前記第3の部分試料を差次的にタグ付けするステップをさらに含む、直前の請求項に記載の方法。
- 前記第1の部分試料に由来するDNA、前記第3の部分試料に由来するDNA、および前記標的領域セットが、プールされ、必要に応じて、前記第1、第2、および第3の部分試料に由来するDNAが、同じシーケンシングセルにおいてシーケンシングされる、直前の請求項に記載の方法。
- 前記対象ががんを有する可能性を決定するステップをさらに含む、上記請求項のいずれか一項に記載の方法。
- 前記シーケンシングするステップが、複数のシーケンシング読み取りデータを生成し、前記方法が、前記複数の配列読み取りデータを1つまたは複数の参照配列にマッピングして、マッピングされた配列読み取りデータを生成するステップ、ならびに前記配列可変標的領域セットおよび前記エピジェネティック標的領域セットに対応する前記マッピングされた配列読み取りデータをプロセシングして、前記対象ががんを有する可能性を決定するステップをさらに含む、直前の請求項に記載の方法。
- 前記試験対象が、以前にがんと診断され、1つまたは複数の以前のがん処置を受けており、必要に応じて、前記cfDNAが、前記1つまたは複数の以前のがん処置の後の1つまたは複数の事前に選択された時点で取得され、前記cfDNA分子の捕捉されたセットをシーケンシングし、それによって列情報のセットが産生される、請求項1~38のいずれか一項に記載の方法。
- 前記配列情報のセットを使用して、事前に選択された時点において、腫瘍細胞を起源とするかまたはそれに由来するDNAの存在または非存在を検出するステップをさらに含む、直前の請求項に記載の方法。
- 前記試験対象について、前記腫瘍細胞を起源とするかまたはそれに由来する前記DNAの存在または非存在を示すがん再発スコアを決定するステップをさらに含み、必要に応じて、前記がん再発スコアに基づいて、がん再発ステータスを決定するステップをさらに含み、前記試験対象の前記がん再発ステータスが、がん再発スコアが所定の閾値であるかもしくはそれを上回ると決定された場合にがん再発のリスクがあると決定されるか、または前記試験対象の前記がん再発ステータスが、前記がん再発スコアが前記所定の閾値よりも低い場合にがん再発のリスクが低いと決定される、直前の請求項に記載の方法。
- 前記試験対象の前記がん再発スコアを所定のがん再発閾値と比較するステップをさらに含み、前記試験対象が、前記がん再発スコアが前記がん再発閾値を上回る場合に後続のがん処置の候補として分類されるか、または前記がん再発スコアが前記がん再発閾値よりも低い場合に後続のがん処置の候補ではないとして分類される、直前の請求項に記載の方法。
- 前記シトシン改変が、メチル化である、上記請求項のいずれか一項に記載の方法。
- 前記シトシン改変が、シトシンの5位におけるメチル化である、上記請求項のいずれか一項に記載の方法。
- 前記第2の部分試料が供される前記手順が、前記第2の核酸塩基の塩基対形成特異性を実質的に変化させることなく、前記第1の核酸塩基の塩基対形成特異性を変化させる、上記請求項のいずれか一項に記載の方法。
- 前記第1の核酸塩基が、改変または非改変シトシンであり、前記第2の核酸塩基が、改変または非改変シトシンである、上記請求項のいずれか一項に記載の方法。
- 前記第1の核酸塩基が、非改変シトシン(C)を含む、上記請求項のいずれか一項に記載の方法。
- 前記第2の核酸塩基が、5-メチルシトシン(mC)を含む、上記請求項のいずれか一項に記載の方法。
- 前記第1の部分試料が供される前記手順が、バイサルファイト変換を含む、上記請求項のいずれか一項に記載の方法。
- 前記第1の核酸塩基が、mCを含む、請求項1~49のいずれか一項に記載の方法。
- 前記第2の核酸塩基が、5-ヒドロキシメチルシトシン(hmC)を含む、上記請求項のいずれか一項に記載の方法。
- 前記第2の部分試料が供される前記手順が、5hmCの保護を含む、請求項53に記載の方法。
- 前記第2の部分試料が供される前記手順が、Tet補助バイサルファイト変換を含む、請求項53に記載の方法。
- 前記第2の部分試料が供される前記手順が、置換ボラン還元剤を用いたTet補助変換を含み、必要に応じて、前記置換ボラン還元剤が、2-ピコリンボラン、ボランピリジン、tert-ブチルアミンボラン、またはアンモニアボランである、請求項53に記載の方法。
- 前記置換ボラン還元剤が、2-ピコリンボランまたはボランピリジンである、請求項56に記載の方法。
- 前記第2の核酸塩基が、Cを含む、請求項52~54または56~57のいずれか一項に記載の方法。
- 前記第2の部分試料が供される前記手順が、hmCの保護、続いて置換ボラン還元剤を用いたTet補助変換を含み、必要に応じて、前記置換ボラン還元剤が、2-ピコリンボラン、ボランピリジン、tert-ブチルアミンボラン、またはアンモニアボランである、請求項52~54、または58のいずれか一項に記載の方法。
- 前記置換ボラン還元剤が、2-ピコリンボランまたはボランピリジンである、請求項59に記載の方法。
- 前記第1の部分試料が供される前記手順が、hmCの保護、続いてmCおよび/またはCの脱アミノ化を含む、請求項49、50、52~54、または58のいずれか一項に記載の方法。
- 前記mCおよび/またはCの脱アミノ化が、AID/APOBECファミリーDNAデアミナーゼ酵素での処置を含む、請求項61に記載の方法。
- hmCの保護が、hmCのグルコシル化を含む、請求項54または58~62のいずれか一項に記載の方法。
- 前記第1の部分試料が供される前記手順が、置換ボラン還元剤を用いた化学物質補助変換を含み、必要に応じて、前記置換ボラン還元剤が、2-ピコリンボラン、ボランピリジン、tert-ブチルアミンボラン、またはアンモニアボランである、請求項1~48、50、52、または58のいずれか一項に記載の方法。
- 前記置換ボラン還元剤が、2-ピコリンボランまたはボランピリジンである、請求項64に記載の方法。
- 前記第1の核酸塩基が、hmCを含む、請求項1~48、50、52、58、または64~65のいずれか一項に記載の方法。
- 前記第1の部分試料のDNAおよび前記第2の部分試料のDNAが、差次的にタグ付けされ、差次的タグ付けの後に、前記第2の部分試料または処置された部分試料に由来するDNAの一部分が、前記第1の部分試料または追加の処置された部分試料またはその少なくとも一部分に添加され、それによってプールが形成され、配列可変標的領域およびエピジェネティック標的領域が、前記プールから捕捉される、上記請求項のいずれか一項に記載の方法。
- 前記プールが、前記第2の部分試料のDNAのうちの約45%未満もしくはそれに等しい、40%未満もしくはそれに等しい、35%未満もしくはそれに等しい、30%未満もしくはそれに等しい、25%未満もしくはそれに等しい、20%未満もしくはそれに等しい、15%未満もしくはそれに等しい、10%未満もしくはそれに等しい、または5%未満もしくはそれに等しいを含む、直前の請求項に記載の方法。
- 前記プールが、前記第2の部分試料のDNAのうちの約70~90%、約75~85%、または約80%を含む、直前の請求項に記載の方法。
- 前記プールが、前記第1の部分試料のDNAの実質的に全てを含む、請求項67~69のいずれか一項に記載の方法。
- 前記プールが、前記第1の部分試料または処置された第1の部分試料のDNAの実質的に全てを含む、請求項67~70のいずれか一項に記載の方法。
- 前記第1の標的領域セットが、前記プールの形成後に、前記第1の部分試料または処置された第1の部分試料の少なくとも一部分から捕捉される、請求項67~72のいずれか一項に記載の方法。
- 前記第1の部分試料を、前記第2の部分試料の前記DNA内の第1の核酸塩基に対して前記DNA内の第2の核酸塩基とは異なって影響を及ぼす手順に供するステップであって、前記第1の部分試料が供される前記手順が、前記第2の部分試料が供される手順と同じである、ステップをさらに含む、請求項47~72のいずれか一項に記載の方法。
- 前記第1の部分試料を、前記第2の部分試料の前記DNA内の第1の核酸塩基に対して前記DNA内の第2の核酸塩基とは異なって影響を及ぼす手順に供するステップであって、前記第1の部分試料が供される前記手順が、前記第2の部分試料が供される手順とは異なる、ステップをさらに含む、請求項47~72のいずれか一項に記載の方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202063105184P | 2020-10-23 | 2020-10-23 | |
US63/105,184 | 2020-10-23 | ||
PCT/US2021/056106 WO2022087309A1 (en) | 2020-10-23 | 2021-10-21 | Compositions and methods for analyzing dna using partitioning and base conversion |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2023547620A true JP2023547620A (ja) | 2023-11-13 |
Family
ID=78622081
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023524623A Pending JP2023547620A (ja) | 2020-10-23 | 2021-10-21 | 分配および塩基変換を使用してdnaを解析するための組成物および方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20220154286A1 (ja) |
EP (1) | EP4232599A1 (ja) |
JP (1) | JP2023547620A (ja) |
CA (1) | CA3195797A1 (ja) |
WO (1) | WO2022087309A1 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022221853A1 (en) * | 2021-04-13 | 2022-10-20 | Elegen Corp. | Methods and compositions for cell-free cloning |
CA3226747A1 (en) * | 2021-07-27 | 2023-02-02 | Chunxiao Song | Compositions and methods related to tet-assisted pyridine borane sequencing for cell-free dna |
WO2024006908A1 (en) * | 2022-06-30 | 2024-01-04 | Guardant Health, Inc. | Enrichment of aberrantly methylated dna |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6582908B2 (en) | 1990-12-06 | 2003-06-24 | Affymetrix, Inc. | Oligonucleotides |
US20030017081A1 (en) | 1994-02-10 | 2003-01-23 | Affymetrix, Inc. | Method and apparatus for imaging a sample on a device |
DE60234464D1 (de) | 2001-11-28 | 2009-12-31 | Applied Biosystems Llc | Zusammensetzungen und Verfahren zur selektiven Nukleinsäureisolierung |
DE602004023279D1 (de) | 2003-03-21 | 2009-11-05 | Santaris Pharma As | Analoga kurzer interferierender rna (sirna) |
US8486630B2 (en) | 2008-11-07 | 2013-07-16 | Industrial Technology Research Institute | Methods for accurate sequence data and modified base position determination |
US8835358B2 (en) | 2009-12-15 | 2014-09-16 | Cellular Research, Inc. | Digital counting of individual molecules by stochastic attachment of diverse labels |
EP2893040B1 (en) | 2012-09-04 | 2019-01-02 | Guardant Health, Inc. | Methods to detect rare mutations and copy number variation |
AU2015292311B2 (en) | 2014-07-25 | 2022-01-20 | University Of Washington | Methods of determining tissues and/or cell types giving rise to cell-free DNA, and methods of identifying a disease or disorder using same |
KR102610098B1 (ko) | 2016-07-06 | 2023-12-04 | 가던트 헬쓰, 인크. | 무세포 핵산의 프래그멘톰 프로파일링을 위한 방법 |
US9850523B1 (en) | 2016-09-30 | 2017-12-26 | Guardant Health, Inc. | Methods for multi-resolution analysis of cell-free nucleic acids |
MX2019007444A (es) * | 2016-12-22 | 2019-08-16 | Guardant Health Inc | Metodos y sistemas para analisis de moleculas de acido nucleico. |
CA3087915A1 (en) * | 2018-01-08 | 2019-07-11 | Ludwig Institute For Cancer Research Ltd | Bisulfite-free, base-resolution identification of cytosine modifications |
WO2020006369A1 (en) * | 2018-06-29 | 2020-01-02 | Guardant Health, Inc. | Methods and systems for analysis of ctcf binding regions in cell-free dna |
WO2020160414A1 (en) | 2019-01-31 | 2020-08-06 | Guardant Health, Inc. | Compositions and methods for isolating cell-free dna |
-
2021
- 2021-10-21 EP EP21807429.2A patent/EP4232599A1/en active Pending
- 2021-10-21 JP JP2023524623A patent/JP2023547620A/ja active Pending
- 2021-10-21 WO PCT/US2021/056106 patent/WO2022087309A1/en active Application Filing
- 2021-10-21 US US17/507,697 patent/US20220154286A1/en active Pending
- 2021-10-21 CA CA3195797A patent/CA3195797A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
US20220154286A1 (en) | 2022-05-19 |
CA3195797A1 (en) | 2022-04-28 |
WO2022087309A1 (en) | 2022-04-28 |
EP4232599A1 (en) | 2023-08-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11643693B2 (en) | Compositions and methods for isolating cell-free DNA | |
US11891653B2 (en) | Compositions and methods for analyzing cell-free DNA in methylation partitioning assays | |
US20220154285A1 (en) | Analysis of methylated dna comprising methylation-sensitive or methylation-dependent restrictions | |
US20220154286A1 (en) | Compositions and methods for analyzing dna using partitioning and base conversion | |
US20240167099A1 (en) | Detection of epigenetic status using sequence-specific degradation | |
US20240229113A1 (en) | Methods and compositions for detecting nucleic acid variants | |
US20240150844A1 (en) | Compositions and methods for enriching methylated polynucleotides | |
US20230313288A1 (en) | Methods for sequence determination using partitioned nucleic acids | |
US20240093292A1 (en) | Quality control method | |
US20240191290A1 (en) | Methods for detection and reduction of sample preparation-induced methylation artifacts | |
CN116529394A (zh) | 使用分区和甲基化依赖性核酸酶分析dna的组合物和方法 | |
JP2024511425A (ja) | 免疫細胞dnaを定量するための方法および組成物 | |
JP2024523401A (ja) | コピー数情報に基づく組織起源分析のための方法および組成物 | |
EP4409024A1 (en) | Compositions and methods for synthesis and use of probes targeting nucleic acid rearrangements |