JP2023502752A - メチル化ポリヌクレオチドの結合を改善するための方法、組成物およびシステム - Google Patents
メチル化ポリヌクレオチドの結合を改善するための方法、組成物およびシステム Download PDFInfo
- Publication number
- JP2023502752A JP2023502752A JP2022529847A JP2022529847A JP2023502752A JP 2023502752 A JP2023502752 A JP 2023502752A JP 2022529847 A JP2022529847 A JP 2022529847A JP 2022529847 A JP2022529847 A JP 2022529847A JP 2023502752 A JP2023502752 A JP 2023502752A
- Authority
- JP
- Japan
- Prior art keywords
- nucleic acid
- subset
- acid molecules
- carrier nucleic
- methylated
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 153
- 102000040430 polynucleotide Human genes 0.000 title claims abstract description 140
- 108091033319 polynucleotide Proteins 0.000 title claims abstract description 140
- 239000002157 polynucleotide Substances 0.000 title claims abstract description 140
- 230000027455 binding Effects 0.000 title description 41
- 239000000203 mixture Substances 0.000 title description 10
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 775
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 761
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 761
- 206010028980 Neoplasm Diseases 0.000 claims abstract description 161
- 238000012163 sequencing technique Methods 0.000 claims abstract description 156
- 238000012545 processing Methods 0.000 claims abstract description 35
- 239000003795 chemical substances by application Substances 0.000 claims abstract description 21
- 108020004414 DNA Proteins 0.000 claims description 264
- 125000003729 nucleotide group Chemical group 0.000 claims description 232
- 239000002773 nucleotide Substances 0.000 claims description 122
- 238000007069 methylation reaction Methods 0.000 claims description 66
- 230000011987 methylation Effects 0.000 claims description 63
- 238000000638 solvent extraction Methods 0.000 claims description 48
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 claims description 43
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 40
- 241000282414 Homo sapiens Species 0.000 claims description 36
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Natural products O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 claims description 25
- -1 uracil nucleoside Chemical class 0.000 claims description 25
- 210000004369 blood Anatomy 0.000 claims description 20
- 239000008280 blood Substances 0.000 claims description 20
- 125000001436 propyl group Chemical group [H]C([*])([H])C([H])([H])C([H])([H])[H] 0.000 claims description 20
- 210000001519 tissue Anatomy 0.000 claims description 20
- 108091029430 CpG site Proteins 0.000 claims description 19
- LRSASMSXMSNRBT-UHFFFAOYSA-N 5-methylcytosine Chemical compound CC1=CNC(=O)N=C1N LRSASMSXMSNRBT-UHFFFAOYSA-N 0.000 claims description 18
- 229940035893 uracil Drugs 0.000 claims description 16
- 125000001797 benzyl group Chemical group [H]C1=C([H])C([H])=C(C([H])=C1[H])C([H])([H])* 0.000 claims description 14
- 125000001495 ethyl group Chemical group [H]C([H])([H])C([H])([H])* 0.000 claims description 14
- 125000000524 functional group Chemical group 0.000 claims description 14
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 claims description 12
- 230000015572 biosynthetic process Effects 0.000 claims description 11
- 238000003786 synthesis reaction Methods 0.000 claims description 11
- 239000005546 dideoxynucleotide Substances 0.000 claims description 10
- 239000002777 nucleoside Substances 0.000 claims description 10
- 210000001175 cerebrospinal fluid Anatomy 0.000 claims description 9
- 238000007385 chemical modification Methods 0.000 claims description 9
- 210000002381 plasma Anatomy 0.000 claims description 9
- 210000002700 urine Anatomy 0.000 claims description 9
- 230000001580 bacterial effect Effects 0.000 claims description 8
- 125000002887 hydroxy group Chemical group [H]O* 0.000 claims description 8
- 210000002966 serum Anatomy 0.000 claims description 8
- 230000003612 virological effect Effects 0.000 claims description 8
- CKOMXBHMKXXTNW-UHFFFAOYSA-N 6-methyladenine Chemical compound CNC1=NC=NC2=C1N=CN2 CKOMXBHMKXXTNW-UHFFFAOYSA-N 0.000 claims description 7
- 230000002255 enzymatic effect Effects 0.000 claims description 7
- 239000012038 nucleophile Substances 0.000 claims description 7
- 125000006850 spacer group Chemical group 0.000 claims description 7
- MJEQLGCFPLHMNV-UHFFFAOYSA-N 4-amino-1-(hydroxymethyl)pyrimidin-2-one Chemical compound NC=1C=CN(CO)C(=O)N=1 MJEQLGCFPLHMNV-UHFFFAOYSA-N 0.000 claims description 6
- 210000003608 fece Anatomy 0.000 claims description 6
- XBCXJKGHPABGSD-UHFFFAOYSA-N methyluracil Natural products CN1C=CC(=O)NC1=O XBCXJKGHPABGSD-UHFFFAOYSA-N 0.000 claims description 6
- 210000003296 saliva Anatomy 0.000 claims description 6
- 239000000523 sample Substances 0.000 description 286
- 201000011510 cancer Diseases 0.000 description 109
- 102000053602 DNA Human genes 0.000 description 72
- CTMZLDSMFCVUNX-VMIOUTBZSA-N cytidylyl-(3'->5')-guanosine Chemical group O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@H](OP(O)(=O)OC[C@@H]2[C@H]([C@@H](O)[C@@H](O2)N2C3=C(C(N=C(N)N3)=O)N=C2)O)[C@@H](CO)O1 CTMZLDSMFCVUNX-VMIOUTBZSA-N 0.000 description 63
- 108090000623 proteins and genes Proteins 0.000 description 40
- 210000004027 cell Anatomy 0.000 description 39
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 39
- 230000001973 epigenetic effect Effects 0.000 description 37
- 238000003199 nucleic acid amplification method Methods 0.000 description 37
- 230000003321 amplification Effects 0.000 description 36
- 238000012986 modification Methods 0.000 description 30
- 230000004048 modification Effects 0.000 description 29
- 238000003752 polymerase chain reaction Methods 0.000 description 23
- 238000011282 treatment Methods 0.000 description 23
- 230000000875 corresponding effect Effects 0.000 description 22
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 22
- 238000004458 analytical method Methods 0.000 description 20
- 201000010099 disease Diseases 0.000 description 19
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 19
- 238000003860 storage Methods 0.000 description 19
- 229940104302 cytosine Drugs 0.000 description 18
- 230000015654 memory Effects 0.000 description 18
- 230000035772 mutation Effects 0.000 description 18
- 108700009124 Transcription Initiation Site Proteins 0.000 description 17
- 239000012634 fragment Substances 0.000 description 17
- 238000006243 chemical reaction Methods 0.000 description 16
- 108010014064 CCCTC-Binding Factor Proteins 0.000 description 15
- 102100027671 Transcriptional repressor CTCF Human genes 0.000 description 15
- 238000012360 testing method Methods 0.000 description 15
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 14
- 239000002609 medium Substances 0.000 description 14
- 238000007481 next generation sequencing Methods 0.000 description 13
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 12
- 238000003556 assay Methods 0.000 description 12
- 102000004169 proteins and genes Human genes 0.000 description 12
- 108010047956 Nucleosomes Proteins 0.000 description 11
- 210000001124 body fluid Anatomy 0.000 description 11
- 230000000295 complement effect Effects 0.000 description 11
- 210000001623 nucleosome Anatomy 0.000 description 11
- 238000007792 addition Methods 0.000 description 10
- 230000007067 DNA methylation Effects 0.000 description 9
- 230000000694 effects Effects 0.000 description 9
- 230000004049 epigenetic modification Effects 0.000 description 9
- 206010069754 Acquired gene mutation Diseases 0.000 description 8
- 102000014914 Carrier Proteins Human genes 0.000 description 8
- 206010009944 Colon cancer Diseases 0.000 description 8
- 206010058467 Lung neoplasm malignant Diseases 0.000 description 8
- 238000013459 approach Methods 0.000 description 8
- 108091008324 binding proteins Proteins 0.000 description 8
- 238000012217 deletion Methods 0.000 description 8
- 230000037430 deletion Effects 0.000 description 8
- 238000009826 distribution Methods 0.000 description 8
- 201000005202 lung cancer Diseases 0.000 description 8
- 208000020816 lung neoplasm Diseases 0.000 description 8
- 125000003835 nucleoside group Chemical group 0.000 description 8
- 238000002360 preparation method Methods 0.000 description 8
- 230000037439 somatic mutation Effects 0.000 description 8
- 208000001333 Colorectal Neoplasms Diseases 0.000 description 7
- 102000004190 Enzymes Human genes 0.000 description 7
- 108090000790 Enzymes Proteins 0.000 description 7
- 108091034117 Oligonucleotide Proteins 0.000 description 7
- 108020004682 Single-Stranded DNA Proteins 0.000 description 7
- 239000011230 binding agent Substances 0.000 description 7
- 210000000349 chromosome Anatomy 0.000 description 7
- 238000004891 communication Methods 0.000 description 7
- 230000006607 hypermethylation Effects 0.000 description 7
- 230000001965 increasing effect Effects 0.000 description 7
- 150000003833 nucleoside derivatives Chemical class 0.000 description 7
- 230000008569 process Effects 0.000 description 7
- 150000003839 salts Chemical class 0.000 description 7
- 238000002560 therapeutic procedure Methods 0.000 description 7
- 210000004881 tumor cell Anatomy 0.000 description 7
- 108091093088 Amplicon Proteins 0.000 description 6
- 102000016397 Methyltransferase Human genes 0.000 description 6
- 108060004795 Methyltransferase Proteins 0.000 description 6
- 239000011324 bead Substances 0.000 description 6
- 229960002685 biotin Drugs 0.000 description 6
- 235000020958 biotin Nutrition 0.000 description 6
- 239000011616 biotin Substances 0.000 description 6
- 238000001514 detection method Methods 0.000 description 6
- 230000004076 epigenetic alteration Effects 0.000 description 6
- 229930024421 Adenine Natural products 0.000 description 5
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 5
- 241001465754 Metazoa Species 0.000 description 5
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 5
- 229960000643 adenine Drugs 0.000 description 5
- 239000010839 body fluid Substances 0.000 description 5
- 230000002068 genetic effect Effects 0.000 description 5
- 210000004602 germ cell Anatomy 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 5
- 238000005192 partition Methods 0.000 description 5
- 230000035945 sensitivity Effects 0.000 description 5
- RYVNIFSIEDRLSJ-UHFFFAOYSA-N 5-(hydroxymethyl)cytosine Chemical compound NC=1NC(=O)N=CC=1CO RYVNIFSIEDRLSJ-UHFFFAOYSA-N 0.000 description 4
- 201000009030 Carcinoma Diseases 0.000 description 4
- 239000000872 buffer Substances 0.000 description 4
- 208000035269 cancer or benign tumor Diseases 0.000 description 4
- 238000007405 data analysis Methods 0.000 description 4
- 238000013500 data storage Methods 0.000 description 4
- 238000010828 elution Methods 0.000 description 4
- 238000013467 fragmentation Methods 0.000 description 4
- 238000006062 fragmentation reaction Methods 0.000 description 4
- 230000004927 fusion Effects 0.000 description 4
- 238000009396 hybridization Methods 0.000 description 4
- 238000003780 insertion Methods 0.000 description 4
- 230000037431 insertion Effects 0.000 description 4
- 230000000670 limiting effect Effects 0.000 description 4
- 208000014018 liver neoplasm Diseases 0.000 description 4
- 238000004519 manufacturing process Methods 0.000 description 4
- 230000001404 mediated effect Effects 0.000 description 4
- 210000005170 neoplastic cell Anatomy 0.000 description 4
- 238000011176 pooling Methods 0.000 description 4
- 239000000047 product Substances 0.000 description 4
- 230000002829 reductive effect Effects 0.000 description 4
- 230000003252 repetitive effect Effects 0.000 description 4
- 238000000926 separation method Methods 0.000 description 4
- 230000000392 somatic effect Effects 0.000 description 4
- 206010044412 transitional cell carcinoma Diseases 0.000 description 4
- 238000005406 washing Methods 0.000 description 4
- FHSISDGOVSHJRW-UHFFFAOYSA-N 5-formylcytosine Chemical compound NC1=NC(=O)NC=C1C=O FHSISDGOVSHJRW-UHFFFAOYSA-N 0.000 description 3
- 206010006187 Breast cancer Diseases 0.000 description 3
- 208000026310 Breast neoplasm Diseases 0.000 description 3
- 108010077544 Chromatin Proteins 0.000 description 3
- 241000701959 Escherichia virus Lambda Species 0.000 description 3
- 238000012408 PCR amplification Methods 0.000 description 3
- 208000005718 Stomach Neoplasms Diseases 0.000 description 3
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 3
- 238000001574 biopsy Methods 0.000 description 3
- 238000005251 capillar electrophoresis Methods 0.000 description 3
- 230000001413 cellular effect Effects 0.000 description 3
- 238000002512 chemotherapy Methods 0.000 description 3
- 208000006990 cholangiocarcinoma Diseases 0.000 description 3
- 210000003483 chromatin Anatomy 0.000 description 3
- 238000004590 computer program Methods 0.000 description 3
- 238000004925 denaturation Methods 0.000 description 3
- 230000036425 denaturation Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 210000003722 extracellular fluid Anatomy 0.000 description 3
- 239000012530 fluid Substances 0.000 description 3
- 238000005194 fractionation Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 206010017758 gastric cancer Diseases 0.000 description 3
- 230000007614 genetic variation Effects 0.000 description 3
- 206010073071 hepatocellular carcinoma Diseases 0.000 description 3
- 239000002955 immunomodulating agent Substances 0.000 description 3
- 238000009169 immunotherapy Methods 0.000 description 3
- 201000002313 intestinal cancer Diseases 0.000 description 3
- 208000032839 leukemia Diseases 0.000 description 3
- 201000007270 liver cancer Diseases 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 201000001441 melanoma Diseases 0.000 description 3
- 230000008520 organization Effects 0.000 description 3
- 239000012071 phase Substances 0.000 description 3
- 238000012175 pyrosequencing Methods 0.000 description 3
- 238000002864 sequence alignment Methods 0.000 description 3
- 239000007790 solid phase Substances 0.000 description 3
- 241000894007 species Species 0.000 description 3
- 201000011549 stomach cancer Diseases 0.000 description 3
- 239000000126 substance Substances 0.000 description 3
- 229940113082 thymine Drugs 0.000 description 3
- 238000011144 upstream manufacturing Methods 0.000 description 3
- 208000024893 Acute lymphoblastic leukemia Diseases 0.000 description 2
- 208000014697 Acute lymphocytic leukaemia Diseases 0.000 description 2
- 108091023043 Alu Element Proteins 0.000 description 2
- 208000023275 Autoimmune disease Diseases 0.000 description 2
- 241000271566 Aves Species 0.000 description 2
- 208000003950 B-cell lymphoma Diseases 0.000 description 2
- 206010005003 Bladder cancer Diseases 0.000 description 2
- 241000283690 Bos taurus Species 0.000 description 2
- 208000003174 Brain Neoplasms Diseases 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 2
- 102100026548 Caspase-8 Human genes 0.000 description 2
- ZEOWTGPWHLSLOG-UHFFFAOYSA-N Cc1ccc(cc1-c1ccc2c(n[nH]c2c1)-c1cnn(c1)C1CC1)C(=O)Nc1cccc(c1)C(F)(F)F Chemical compound Cc1ccc(cc1-c1ccc2c(n[nH]c2c1)-c1cnn(c1)C1CC1)C(=O)Nc1cccc(c1)C(F)(F)F ZEOWTGPWHLSLOG-UHFFFAOYSA-N 0.000 description 2
- 206010008342 Cervix carcinoma Diseases 0.000 description 2
- 108020004705 Codon Proteins 0.000 description 2
- 108091035707 Consensus sequence Proteins 0.000 description 2
- 108091029523 CpG island Proteins 0.000 description 2
- 108010058546 Cyclin D1 Proteins 0.000 description 2
- 108700024394 Exon Proteins 0.000 description 2
- 108060002716 Exonuclease Proteins 0.000 description 2
- 102100023593 Fibroblast growth factor receptor 1 Human genes 0.000 description 2
- 101710182386 Fibroblast growth factor receptor 1 Proteins 0.000 description 2
- 102100023600 Fibroblast growth factor receptor 2 Human genes 0.000 description 2
- 101710182389 Fibroblast growth factor receptor 2 Proteins 0.000 description 2
- 102100024165 G1/S-specific cyclin-D1 Human genes 0.000 description 2
- 201000003741 Gastrointestinal carcinoma Diseases 0.000 description 2
- 102000006947 Histones Human genes 0.000 description 2
- 108010033040 Histones Proteins 0.000 description 2
- 101001030211 Homo sapiens Myc proto-oncogene protein Proteins 0.000 description 2
- 101000605639 Homo sapiens Phosphatidylinositol 4,5-bisphosphate 3-kinase catalytic subunit alpha isoform Proteins 0.000 description 2
- 101001126417 Homo sapiens Platelet-derived growth factor receptor alpha Proteins 0.000 description 2
- 101001012157 Homo sapiens Receptor tyrosine-protein kinase erbB-2 Proteins 0.000 description 2
- 101000984753 Homo sapiens Serine/threonine-protein kinase B-raf Proteins 0.000 description 2
- 208000026350 Inborn Genetic disease Diseases 0.000 description 2
- 206010025323 Lymphomas Diseases 0.000 description 2
- 206010027406 Mesothelioma Diseases 0.000 description 2
- 102100038895 Myc proto-oncogene protein Human genes 0.000 description 2
- 208000002454 Nasopharyngeal Carcinoma Diseases 0.000 description 2
- 206010061306 Nasopharyngeal cancer Diseases 0.000 description 2
- 208000015914 Non-Hodgkin lymphomas Diseases 0.000 description 2
- 108700020796 Oncogene Proteins 0.000 description 2
- 206010033128 Ovarian cancer Diseases 0.000 description 2
- 206010061535 Ovarian neoplasm Diseases 0.000 description 2
- 206010061902 Pancreatic neoplasm Diseases 0.000 description 2
- 102100038332 Phosphatidylinositol 4,5-bisphosphate 3-kinase catalytic subunit alpha isoform Human genes 0.000 description 2
- 108091007412 Piwi-interacting RNA Proteins 0.000 description 2
- 102100030485 Platelet-derived growth factor receptor alpha Human genes 0.000 description 2
- 208000006664 Precursor Cell Lymphoblastic Leukemia-Lymphoma Diseases 0.000 description 2
- 206010060862 Prostate cancer Diseases 0.000 description 2
- 208000000236 Prostatic Neoplasms Diseases 0.000 description 2
- 108020004518 RNA Probes Proteins 0.000 description 2
- 239000003391 RNA probe Substances 0.000 description 2
- 239000013614 RNA sample Substances 0.000 description 2
- 102100030086 Receptor tyrosine-protein kinase erbB-2 Human genes 0.000 description 2
- 208000015634 Rectal Neoplasms Diseases 0.000 description 2
- 208000006265 Renal cell carcinoma Diseases 0.000 description 2
- 108020004487 Satellite DNA Proteins 0.000 description 2
- 102100027103 Serine/threonine-protein kinase B-raf Human genes 0.000 description 2
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 2
- 208000000453 Skin Neoplasms Diseases 0.000 description 2
- 108020003224 Small Nucleolar RNA Proteins 0.000 description 2
- 102000042773 Small Nucleolar RNA Human genes 0.000 description 2
- IQFYYKKMVGJFEH-XLPZGREQSA-N Thymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 IQFYYKKMVGJFEH-XLPZGREQSA-N 0.000 description 2
- 108010078814 Tumor Suppressor Protein p53 Proteins 0.000 description 2
- 102000015098 Tumor Suppressor Protein p53 Human genes 0.000 description 2
- 208000007097 Urinary Bladder Neoplasms Diseases 0.000 description 2
- 208000006105 Uterine Cervical Neoplasms Diseases 0.000 description 2
- 239000012491 analyte Substances 0.000 description 2
- 229910052799 carbon Inorganic materials 0.000 description 2
- 230000030833 cell death Effects 0.000 description 2
- 108091092259 cell-free RNA Proteins 0.000 description 2
- 210000003169 central nervous system Anatomy 0.000 description 2
- 238000005119 centrifugation Methods 0.000 description 2
- 210000002230 centromere Anatomy 0.000 description 2
- 201000010881 cervical cancer Diseases 0.000 description 2
- 210000001072 colon Anatomy 0.000 description 2
- 239000002299 complementary DNA Substances 0.000 description 2
- 230000002596 correlated effect Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 238000003745 diagnosis Methods 0.000 description 2
- 230000002708 enhancing effect Effects 0.000 description 2
- 102000052116 epidermal growth factor receptor activity proteins Human genes 0.000 description 2
- 108700015053 epidermal growth factor receptor activity proteins Proteins 0.000 description 2
- 230000006718 epigenetic regulation Effects 0.000 description 2
- 102000013165 exonuclease Human genes 0.000 description 2
- 201000011243 gastrointestinal stromal tumor Diseases 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 208000016361 genetic disease Diseases 0.000 description 2
- 239000001963 growth medium Substances 0.000 description 2
- 238000012165 high-throughput sequencing Methods 0.000 description 2
- 230000002779 inactivation Effects 0.000 description 2
- 150000002500 ions Chemical class 0.000 description 2
- 238000011528 liquid biopsy Methods 0.000 description 2
- 238000007885 magnetic separation Methods 0.000 description 2
- 230000036210 malignancy Effects 0.000 description 2
- 230000003211 malignant effect Effects 0.000 description 2
- 208000015486 malignant pancreatic neoplasm Diseases 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- YOHYSYJDKVYCJI-UHFFFAOYSA-N n-[3-[[6-[3-(trifluoromethyl)anilino]pyrimidin-4-yl]amino]phenyl]cyclopropanecarboxamide Chemical compound FC(F)(F)C1=CC=CC(NC=2N=CN=C(NC=3C=C(NC(=O)C4CC4)C=CC=3)C=2)=C1 YOHYSYJDKVYCJI-UHFFFAOYSA-N 0.000 description 2
- 201000011216 nasopharynx carcinoma Diseases 0.000 description 2
- 230000001613 neoplastic effect Effects 0.000 description 2
- 208000002154 non-small cell lung carcinoma Diseases 0.000 description 2
- 239000002674 ointment Substances 0.000 description 2
- 201000002528 pancreatic cancer Diseases 0.000 description 2
- 208000008443 pancreatic carcinoma Diseases 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 238000004393 prognosis Methods 0.000 description 2
- 238000003753 real-time PCR Methods 0.000 description 2
- 206010038038 rectal cancer Diseases 0.000 description 2
- 201000001275 rectum cancer Diseases 0.000 description 2
- 230000010076 replication Effects 0.000 description 2
- 238000012552 review Methods 0.000 description 2
- 229920002477 rna polymer Polymers 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000007841 sequencing by ligation Methods 0.000 description 2
- 201000000849 skin cancer Diseases 0.000 description 2
- 239000004055 small Interfering RNA Substances 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 238000001356 surgical procedure Methods 0.000 description 2
- 208000011580 syndromic disease Diseases 0.000 description 2
- 238000002626 targeted therapy Methods 0.000 description 2
- 230000001225 therapeutic effect Effects 0.000 description 2
- 230000035897 transcription Effects 0.000 description 2
- 238000013518 transcription Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000001052 transient effect Effects 0.000 description 2
- 208000029729 tumor suppressor gene on chromosome 11 Diseases 0.000 description 2
- 231100000588 tumorigenic Toxicity 0.000 description 2
- 230000000381 tumorigenic effect Effects 0.000 description 2
- 201000005112 urinary bladder cancer Diseases 0.000 description 2
- 208000023747 urothelial carcinoma Diseases 0.000 description 2
- YKBGVTZYEHREMT-KVQBGUIXSA-N 2'-deoxyguanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@H]1C[C@H](O)[C@@H](CO)O1 YKBGVTZYEHREMT-KVQBGUIXSA-N 0.000 description 1
- KOLPWZCZXAMXKS-UHFFFAOYSA-N 3-methylcytosine Chemical compound CN1C(N)=CC=NC1=O KOLPWZCZXAMXKS-UHFFFAOYSA-N 0.000 description 1
- CKTSBUTUHBMZGZ-ULQXZJNLSA-N 4-amino-1-[(2r,4s,5r)-4-hydroxy-5-(hydroxymethyl)oxolan-2-yl]-5-tritiopyrimidin-2-one Chemical compound O=C1N=C(N)C([3H])=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 CKTSBUTUHBMZGZ-ULQXZJNLSA-N 0.000 description 1
- BLQMCTXZEMGOJM-UHFFFAOYSA-N 5-carboxycytosine Chemical compound NC=1NC(=O)N=CC=1C(O)=O BLQMCTXZEMGOJM-UHFFFAOYSA-N 0.000 description 1
- 102100028348 60S ribosomal protein L26 Human genes 0.000 description 1
- 102100033793 ALK tyrosine kinase receptor Human genes 0.000 description 1
- 208000031261 Acute myeloid leukaemia Diseases 0.000 description 1
- 208000036764 Adenocarcinoma of the esophagus Diseases 0.000 description 1
- 108700028369 Alleles Proteins 0.000 description 1
- 208000003343 Antiphospholipid Syndrome Diseases 0.000 description 1
- 206010003445 Ascites Diseases 0.000 description 1
- 206010003571 Astrocytoma Diseases 0.000 description 1
- 206010003805 Autism Diseases 0.000 description 1
- 208000020706 Autistic disease Diseases 0.000 description 1
- 208000010061 Autosomal Dominant Polycystic Kidney Diseases 0.000 description 1
- 208000010839 B-cell chronic lymphocytic leukemia Diseases 0.000 description 1
- 208000032791 BCR-ABL1 positive chronic myelogenous leukemia Diseases 0.000 description 1
- 102100022548 Beta-hexosaminidase subunit alpha Human genes 0.000 description 1
- LSNNMFCWUKXFEE-UHFFFAOYSA-M Bisulfite Chemical compound OS([O-])=O LSNNMFCWUKXFEE-UHFFFAOYSA-M 0.000 description 1
- 206010005949 Bone cancer Diseases 0.000 description 1
- 208000018084 Bone neoplasm Diseases 0.000 description 1
- 101001042041 Bos taurus Isocitrate dehydrogenase [NAD] subunit beta, mitochondrial Proteins 0.000 description 1
- 208000005623 Carcinogenesis Diseases 0.000 description 1
- 208000024172 Cardiovascular disease Diseases 0.000 description 1
- 101150056960 Casp8 gene Proteins 0.000 description 1
- 108090000538 Caspase-8 Proteins 0.000 description 1
- 102100028914 Catenin beta-1 Human genes 0.000 description 1
- 241000282693 Cercopithecidae Species 0.000 description 1
- 206010008723 Chondrodystrophy Diseases 0.000 description 1
- 208000030808 Clear cell renal carcinoma Diseases 0.000 description 1
- 108091026890 Coding region Proteins 0.000 description 1
- 206010052360 Colorectal adenocarcinoma Diseases 0.000 description 1
- 206010010099 Combined immunodeficiency Diseases 0.000 description 1
- 108020004635 Complementary DNA Proteins 0.000 description 1
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 208000011231 Crohn disease Diseases 0.000 description 1
- 108010025464 Cyclin-Dependent Kinase 4 Proteins 0.000 description 1
- 108010025468 Cyclin-Dependent Kinase 6 Proteins 0.000 description 1
- 102100036252 Cyclin-dependent kinase 4 Human genes 0.000 description 1
- 102100026804 Cyclin-dependent kinase 6 Human genes 0.000 description 1
- 201000003883 Cystic fibrosis Diseases 0.000 description 1
- 102000012410 DNA Ligases Human genes 0.000 description 1
- 108010061982 DNA Ligases Proteins 0.000 description 1
- 230000030914 DNA methylation on adenine Effects 0.000 description 1
- 230000008836 DNA modification Effects 0.000 description 1
- 230000033616 DNA repair Effects 0.000 description 1
- 102000052510 DNA-Binding Proteins Human genes 0.000 description 1
- 101710096438 DNA-binding protein Proteins 0.000 description 1
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 1
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 1
- 102000004099 Deoxyribonuclease (Pyrimidine Dimer) Human genes 0.000 description 1
- 108010082610 Deoxyribonuclease (Pyrimidine Dimer) Proteins 0.000 description 1
- 201000010374 Down Syndrome Diseases 0.000 description 1
- 201000000913 Duane retraction syndrome Diseases 0.000 description 1
- 208000020129 Duane syndrome Diseases 0.000 description 1
- 206010013801 Duchenne Muscular Dystrophy Diseases 0.000 description 1
- 101150029707 ERBB2 gene Proteins 0.000 description 1
- 241000283086 Equidae Species 0.000 description 1
- 208000000461 Esophageal Neoplasms Diseases 0.000 description 1
- 102100038595 Estrogen receptor Human genes 0.000 description 1
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 1
- 206010016207 Familial Mediterranean fever Diseases 0.000 description 1
- 102100027842 Fibroblast growth factor receptor 3 Human genes 0.000 description 1
- 101710182396 Fibroblast growth factor receptor 3 Proteins 0.000 description 1
- 108010010285 Forkhead Box Protein L2 Proteins 0.000 description 1
- 102100040997 Forkhead box protein I3 Human genes 0.000 description 1
- 102100035130 Forkhead box protein K1 Human genes 0.000 description 1
- 102100035129 Forkhead box protein K2 Human genes 0.000 description 1
- 102100035137 Forkhead box protein L2 Human genes 0.000 description 1
- 102100028122 Forkhead box protein P1 Human genes 0.000 description 1
- 102100027579 Forkhead box protein P4 Human genes 0.000 description 1
- 208000001914 Fragile X syndrome Diseases 0.000 description 1
- 102100024185 G1/S-specific cyclin-D2 Human genes 0.000 description 1
- 102100037858 G1/S-specific cyclin-E1 Human genes 0.000 description 1
- 102100029974 GTPase HRas Human genes 0.000 description 1
- 102100039788 GTPase NRas Human genes 0.000 description 1
- 208000022072 Gallbladder Neoplasms Diseases 0.000 description 1
- 206010062878 Gastrooesophageal cancer Diseases 0.000 description 1
- 208000015872 Gaucher disease Diseases 0.000 description 1
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 1
- 208000032612 Glial tumor Diseases 0.000 description 1
- 206010018338 Glioma Diseases 0.000 description 1
- 102100025334 Guanine nucleotide-binding protein G(q) subunit alpha Human genes 0.000 description 1
- 102100032610 Guanine nucleotide-binding protein G(s) subunit alpha isoforms XLas Human genes 0.000 description 1
- 102100036738 Guanine nucleotide-binding protein subunit alpha-11 Human genes 0.000 description 1
- 208000018565 Hemochromatosis Diseases 0.000 description 1
- 208000031220 Hemophilia Diseases 0.000 description 1
- 208000009292 Hemophilia A Diseases 0.000 description 1
- 208000002972 Hepatolenticular Degeneration Diseases 0.000 description 1
- 208000008051 Hereditary Nonpolyposis Colorectal Neoplasms Diseases 0.000 description 1
- 208000017095 Hereditary nonpolyposis colon cancer Diseases 0.000 description 1
- 108010034791 Heterochromatin Proteins 0.000 description 1
- 101001080179 Homo sapiens 60S ribosomal protein L26 Proteins 0.000 description 1
- 101000779641 Homo sapiens ALK tyrosine kinase receptor Proteins 0.000 description 1
- 101000916173 Homo sapiens Catenin beta-1 Proteins 0.000 description 1
- 101000967216 Homo sapiens Eosinophil cationic protein Proteins 0.000 description 1
- 101000882584 Homo sapiens Estrogen receptor Proteins 0.000 description 1
- 101000892881 Homo sapiens Forkhead box protein I3 Proteins 0.000 description 1
- 101001023398 Homo sapiens Forkhead box protein K1 Proteins 0.000 description 1
- 101001023393 Homo sapiens Forkhead box protein K2 Proteins 0.000 description 1
- 101001059893 Homo sapiens Forkhead box protein P1 Proteins 0.000 description 1
- 101000861403 Homo sapiens Forkhead box protein P4 Proteins 0.000 description 1
- 101000980741 Homo sapiens G1/S-specific cyclin-D2 Proteins 0.000 description 1
- 101000738568 Homo sapiens G1/S-specific cyclin-E1 Proteins 0.000 description 1
- 101000584633 Homo sapiens GTPase HRas Proteins 0.000 description 1
- 101000744505 Homo sapiens GTPase NRas Proteins 0.000 description 1
- 101000857888 Homo sapiens Guanine nucleotide-binding protein G(q) subunit alpha Proteins 0.000 description 1
- 101001014590 Homo sapiens Guanine nucleotide-binding protein G(s) subunit alpha isoforms XLas Proteins 0.000 description 1
- 101001014594 Homo sapiens Guanine nucleotide-binding protein G(s) subunit alpha isoforms short Proteins 0.000 description 1
- 101001072407 Homo sapiens Guanine nucleotide-binding protein subunit alpha-11 Proteins 0.000 description 1
- 101000994375 Homo sapiens Integrin alpha-4 Proteins 0.000 description 1
- 101000960234 Homo sapiens Isocitrate dehydrogenase [NADP] cytoplasmic Proteins 0.000 description 1
- 101000599886 Homo sapiens Isocitrate dehydrogenase [NADP], mitochondrial Proteins 0.000 description 1
- 101000614988 Homo sapiens Mediator of RNA polymerase II transcription subunit 12 Proteins 0.000 description 1
- 101001014610 Homo sapiens Neuroendocrine secretory protein 55 Proteins 0.000 description 1
- 101000598160 Homo sapiens Nuclear mitotic apparatus protein 1 Proteins 0.000 description 1
- 101001105683 Homo sapiens Pre-mRNA-processing-splicing factor 8 Proteins 0.000 description 1
- 101000797903 Homo sapiens Protein ALEX Proteins 0.000 description 1
- 101000995332 Homo sapiens Protein NDRG4 Proteins 0.000 description 1
- 101000579425 Homo sapiens Proto-oncogene tyrosine-protein kinase receptor Ret Proteins 0.000 description 1
- 101000779418 Homo sapiens RAC-alpha serine/threonine-protein kinase Proteins 0.000 description 1
- 101000712530 Homo sapiens RAF proto-oncogene serine/threonine-protein kinase Proteins 0.000 description 1
- 101000632056 Homo sapiens Septin-9 Proteins 0.000 description 1
- 101000628562 Homo sapiens Serine/threonine-protein kinase STK11 Proteins 0.000 description 1
- 101000783404 Homo sapiens Serine/threonine-protein phosphatase 2A 65 kDa regulatory subunit A alpha isoform Proteins 0.000 description 1
- 101000808799 Homo sapiens Splicing factor U2AF 35 kDa subunit Proteins 0.000 description 1
- 101000819111 Homo sapiens Trans-acting T-cell-specific transcription factor GATA-3 Proteins 0.000 description 1
- 101000819074 Homo sapiens Transcription factor GATA-4 Proteins 0.000 description 1
- 101000803403 Homo sapiens Vimentin Proteins 0.000 description 1
- 208000023105 Huntington disease Diseases 0.000 description 1
- 208000025500 Hutchinson-Gilford progeria syndrome Diseases 0.000 description 1
- 208000000563 Hyperlipoproteinemia Type II Diseases 0.000 description 1
- 102100032818 Integrin alpha-4 Human genes 0.000 description 1
- 208000005016 Intestinal Neoplasms Diseases 0.000 description 1
- 108091092195 Intron Proteins 0.000 description 1
- 102100039905 Isocitrate dehydrogenase [NADP] cytoplasmic Human genes 0.000 description 1
- 102100037845 Isocitrate dehydrogenase [NADP], mitochondrial Human genes 0.000 description 1
- 208000008839 Kidney Neoplasms Diseases 0.000 description 1
- 208000017924 Klinefelter Syndrome Diseases 0.000 description 1
- 108020005198 Long Noncoding RNA Proteins 0.000 description 1
- 102100024640 Low-density lipoprotein receptor Human genes 0.000 description 1
- 201000005027 Lynch syndrome Diseases 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 208000025205 Mantle-Cell Lymphoma Diseases 0.000 description 1
- 102100021070 Mediator of RNA polymerase II transcription subunit 12 Human genes 0.000 description 1
- 102000006890 Methyl-CpG-Binding Protein 2 Human genes 0.000 description 1
- 108010072388 Methyl-CpG-Binding Protein 2 Proteins 0.000 description 1
- 108020005196 Mitochondrial DNA Proteins 0.000 description 1
- 208000003445 Mouth Neoplasms Diseases 0.000 description 1
- 208000034578 Multiple myelomas Diseases 0.000 description 1
- 241000699666 Mus <mouse, genus> Species 0.000 description 1
- 206010068871 Myotonic dystrophy Diseases 0.000 description 1
- 108010071382 NF-E2-Related Factor 2 Proteins 0.000 description 1
- 206010028851 Necrosis Diseases 0.000 description 1
- 206010029260 Neuroblastoma Diseases 0.000 description 1
- 201000004404 Neurofibroma Diseases 0.000 description 1
- 206010029748 Noonan syndrome Diseases 0.000 description 1
- 208000010505 Nose Neoplasms Diseases 0.000 description 1
- 102100031701 Nuclear factor erythroid 2-related factor 2 Human genes 0.000 description 1
- 102100036961 Nuclear mitotic apparatus protein 1 Human genes 0.000 description 1
- 206010030137 Oesophageal adenocarcinoma Diseases 0.000 description 1
- 206010030155 Oesophageal carcinoma Diseases 0.000 description 1
- 206010061534 Oesophageal squamous cell carcinoma Diseases 0.000 description 1
- 108020005187 Oligonucleotide Probes Proteins 0.000 description 1
- 206010031096 Oropharyngeal cancer Diseases 0.000 description 1
- 206010057444 Oropharyngeal neoplasm Diseases 0.000 description 1
- 206010031243 Osteogenesis imperfecta Diseases 0.000 description 1
- 108010011536 PTEN Phosphohydrolase Proteins 0.000 description 1
- 102000014160 PTEN Phosphohydrolase Human genes 0.000 description 1
- 208000018737 Parkinson disease Diseases 0.000 description 1
- 208000027190 Peripheral T-cell lymphomas Diseases 0.000 description 1
- 201000011252 Phenylketonuria Diseases 0.000 description 1
- 206010035226 Plasma cell myeloma Diseases 0.000 description 1
- 208000002151 Pleural effusion Diseases 0.000 description 1
- 241000097929 Porphyria Species 0.000 description 1
- 208000010642 Porphyrias Diseases 0.000 description 1
- 102100021231 Pre-mRNA-processing-splicing factor 8 Human genes 0.000 description 1
- 208000032758 Precursor T-lymphoblastic lymphoma/leukaemia Diseases 0.000 description 1
- 241000288906 Primates Species 0.000 description 1
- 206010036790 Productive cough Diseases 0.000 description 1
- 208000007932 Progeria Diseases 0.000 description 1
- 102100034432 Protein NDRG4 Human genes 0.000 description 1
- 102100028286 Proto-oncogene tyrosine-protein kinase receptor Ret Human genes 0.000 description 1
- 102100033810 RAC-alpha serine/threonine-protein kinase Human genes 0.000 description 1
- 102100033479 RAF proto-oncogene serine/threonine-protein kinase Human genes 0.000 description 1
- 238000003559 RNA-seq method Methods 0.000 description 1
- 206010038389 Renal cancer Diseases 0.000 description 1
- 208000007014 Retinitis pigmentosa Diseases 0.000 description 1
- 206010039491 Sarcoma Diseases 0.000 description 1
- 108091081021 Sense strand Proteins 0.000 description 1
- 102100028024 Septin-9 Human genes 0.000 description 1
- 238000012300 Sequence Analysis Methods 0.000 description 1
- 102100026715 Serine/threonine-protein kinase STK11 Human genes 0.000 description 1
- 102100036122 Serine/threonine-protein phosphatase 2A 65 kDa regulatory subunit A alpha isoform Human genes 0.000 description 1
- 108020004459 Small interfering RNA Proteins 0.000 description 1
- 208000032383 Soft tissue cancer Diseases 0.000 description 1
- 102100038501 Splicing factor U2AF 35 kDa subunit Human genes 0.000 description 1
- 208000000102 Squamous Cell Carcinoma of Head and Neck Diseases 0.000 description 1
- 208000034254 Squamous cell carcinoma of the cervix uteri Diseases 0.000 description 1
- 208000036765 Squamous cell carcinoma of the esophagus Diseases 0.000 description 1
- 108010090804 Streptavidin Proteins 0.000 description 1
- 241000282887 Suidae Species 0.000 description 1
- 230000005867 T cell response Effects 0.000 description 1
- 208000031672 T-Cell Peripheral Lymphoma Diseases 0.000 description 1
- 208000029052 T-cell acute lymphoblastic leukemia Diseases 0.000 description 1
- 206010042971 T-cell lymphoma Diseases 0.000 description 1
- 208000027585 T-cell non-Hodgkin lymphoma Diseases 0.000 description 1
- 208000022292 Tay-Sachs disease Diseases 0.000 description 1
- 208000002903 Thalassemia Diseases 0.000 description 1
- 206010043515 Throat cancer Diseases 0.000 description 1
- 208000024770 Thyroid neoplasm Diseases 0.000 description 1
- 102100021386 Trans-acting T-cell-specific transcription factor GATA-3 Human genes 0.000 description 1
- 102000040945 Transcription factor Human genes 0.000 description 1
- 108091023040 Transcription factor Proteins 0.000 description 1
- 102100021380 Transcription factor GATA-4 Human genes 0.000 description 1
- 206010068233 Trimethylaminuria Diseases 0.000 description 1
- 206010044688 Trisomy 21 Diseases 0.000 description 1
- 108700025716 Tumor Suppressor Genes Proteins 0.000 description 1
- 102000044209 Tumor Suppressor Genes Human genes 0.000 description 1
- 108010040002 Tumor Suppressor Proteins Proteins 0.000 description 1
- 102000001742 Tumor Suppressor Proteins Human genes 0.000 description 1
- 208000026928 Turner syndrome Diseases 0.000 description 1
- 208000034953 Twin anemia-polycythemia sequence Diseases 0.000 description 1
- 206010045261 Type IIa hyperlipidaemia Diseases 0.000 description 1
- 208000002495 Uterine Neoplasms Diseases 0.000 description 1
- 201000005969 Uveal melanoma Diseases 0.000 description 1
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 1
- 102100035071 Vimentin Human genes 0.000 description 1
- 201000007960 WAGR syndrome Diseases 0.000 description 1
- 208000008383 Wilms tumor Diseases 0.000 description 1
- 208000018839 Wilson disease Diseases 0.000 description 1
- 230000001594 aberrant effect Effects 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 208000008919 achondroplasia Diseases 0.000 description 1
- 208000006336 acinar cell carcinoma Diseases 0.000 description 1
- 208000006682 alpha 1-Antitrypsin Deficiency Diseases 0.000 description 1
- 238000000137 annealing Methods 0.000 description 1
- 230000000692 anti-sense effect Effects 0.000 description 1
- 238000003782 apoptosis assay Methods 0.000 description 1
- 230000006907 apoptotic process Effects 0.000 description 1
- 239000007900 aqueous suspension Substances 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000000429 assembly Methods 0.000 description 1
- 230000000712 assembly Effects 0.000 description 1
- 208000022185 autosomal dominant polycystic kidney disease Diseases 0.000 description 1
- 239000012472 biological sample Substances 0.000 description 1
- 210000001772 blood platelet Anatomy 0.000 description 1
- 210000001185 bone marrow Anatomy 0.000 description 1
- 210000000481 breast Anatomy 0.000 description 1
- 238000010804 cDNA synthesis Methods 0.000 description 1
- 230000036952 cancer formation Effects 0.000 description 1
- 239000002775 capsule Substances 0.000 description 1
- 231100000504 carcinogenesis Toxicity 0.000 description 1
- 230000003197 catalytic effect Effects 0.000 description 1
- 230000024245 cell differentiation Effects 0.000 description 1
- 230000032823 cell division Effects 0.000 description 1
- 230000010261 cell growth Effects 0.000 description 1
- 230000006037 cell lysis Effects 0.000 description 1
- 201000006612 cervical squamous cell carcinoma Diseases 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 201000010902 chronic myelomonocytic leukemia Diseases 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 206010073251 clear cell renal cell carcinoma Diseases 0.000 description 1
- 108010045512 cohesins Proteins 0.000 description 1
- 208000029742 colonic neoplasm Diseases 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 239000000356 contaminant Substances 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 208000035250 cutaneous malignant susceptibility to 1 melanoma Diseases 0.000 description 1
- 208000030381 cutaneous melanoma Diseases 0.000 description 1
- 235000013365 dairy product Nutrition 0.000 description 1
- 230000034994 death Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 239000005549 deoxyribonucleoside Substances 0.000 description 1
- 230000009274 differential gene expression Effects 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 238000001493 electron microscopy Methods 0.000 description 1
- 239000000839 emulsion Substances 0.000 description 1
- 201000000330 endometrial stromal sarcoma Diseases 0.000 description 1
- 208000029179 endometrioid stromal sarcoma Diseases 0.000 description 1
- 210000002889 endothelial cell Anatomy 0.000 description 1
- 230000008995 epigenetic change Effects 0.000 description 1
- 210000003743 erythrocyte Anatomy 0.000 description 1
- 208000028653 esophageal adenocarcinoma Diseases 0.000 description 1
- 201000004101 esophageal cancer Diseases 0.000 description 1
- 208000007276 esophageal squamous cell carcinoma Diseases 0.000 description 1
- 230000001747 exhibiting effect Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 108010091897 factor V Leiden Proteins 0.000 description 1
- 201000001386 familial hypercholesterolemia Diseases 0.000 description 1
- 201000010255 female reproductive organ cancer Diseases 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000007672 fourth generation sequencing Methods 0.000 description 1
- 201000008396 gallbladder adenocarcinoma Diseases 0.000 description 1
- 201000010175 gallbladder cancer Diseases 0.000 description 1
- 201000006974 gastroesophageal cancer Diseases 0.000 description 1
- 239000000499 gel Substances 0.000 description 1
- 238000001502 gel electrophoresis Methods 0.000 description 1
- 238000012252 genetic analysis Methods 0.000 description 1
- 208000005017 glioblastoma Diseases 0.000 description 1
- 239000008187 granular material Substances 0.000 description 1
- 230000012010 growth Effects 0.000 description 1
- 230000003394 haemopoietic effect Effects 0.000 description 1
- 201000010536 head and neck cancer Diseases 0.000 description 1
- 208000014829 head and neck neoplasm Diseases 0.000 description 1
- 201000005787 hematologic cancer Diseases 0.000 description 1
- 208000024200 hematopoietic and lymphoid system neoplasm Diseases 0.000 description 1
- 208000006359 hepatoblastoma Diseases 0.000 description 1
- 231100000844 hepatocellular carcinoma Toxicity 0.000 description 1
- 210000004458 heterochromatin Anatomy 0.000 description 1
- 239000012145 high-salt buffer Substances 0.000 description 1
- 208000009624 holoprosencephaly Diseases 0.000 description 1
- 108091008039 hormone receptors Proteins 0.000 description 1
- 210000003917 human chromosome Anatomy 0.000 description 1
- 125000004435 hydrogen atom Chemical group [H]* 0.000 description 1
- 238000007031 hydroxymethylation reaction Methods 0.000 description 1
- 230000028993 immune response Effects 0.000 description 1
- 238000001114 immunoprecipitation Methods 0.000 description 1
- 238000000126 in silico method Methods 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000007915 intraurethral administration Methods 0.000 description 1
- 210000003734 kidney Anatomy 0.000 description 1
- 201000010982 kidney cancer Diseases 0.000 description 1
- 210000000265 leukocyte Anatomy 0.000 description 1
- 238000007834 ligase chain reaction Methods 0.000 description 1
- 208000012987 lip and oral cavity carcinoma Diseases 0.000 description 1
- 210000004185 liver Anatomy 0.000 description 1
- 244000144972 livestock Species 0.000 description 1
- 238000011068 loading method Methods 0.000 description 1
- 210000004072 lung Anatomy 0.000 description 1
- 230000001926 lymphatic effect Effects 0.000 description 1
- 238000007403 mPCR Methods 0.000 description 1
- 201000004792 malaria Diseases 0.000 description 1
- 208000020968 mature T-cell and NK-cell non-Hodgkin lymphoma Diseases 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 108091070501 miRNA Proteins 0.000 description 1
- 239000002679 microRNA Substances 0.000 description 1
- 238000002493 microarray Methods 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 230000033607 mismatch repair Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 210000003097 mucus Anatomy 0.000 description 1
- 230000017074 necrotic cell death Effects 0.000 description 1
- 201000008026 nephroblastoma Diseases 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 201000002120 neuroendocrine carcinoma Diseases 0.000 description 1
- 201000011330 nonpapillary renal cell carcinoma Diseases 0.000 description 1
- 230000009871 nonspecific binding Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 201000002575 ocular melanoma Diseases 0.000 description 1
- 239000002751 oligonucleotide probe Substances 0.000 description 1
- 238000011275 oncology therapy Methods 0.000 description 1
- 201000002740 oral squamous cell carcinoma Diseases 0.000 description 1
- 201000006958 oropharynx cancer Diseases 0.000 description 1
- 201000008968 osteosarcoma Diseases 0.000 description 1
- 230000002611 ovarian Effects 0.000 description 1
- 201000008129 pancreatic ductal adenocarcinoma Diseases 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 230000007170 pathology Effects 0.000 description 1
- 239000008194 pharmaceutical composition Substances 0.000 description 1
- 244000144977 poultry Species 0.000 description 1
- 230000005522 programmed cell death Effects 0.000 description 1
- 210000002307 prostate Anatomy 0.000 description 1
- 201000005825 prostate adenocarcinoma Diseases 0.000 description 1
- 238000001959 radiotherapy Methods 0.000 description 1
- 239000011541 reaction mixture Substances 0.000 description 1
- 230000022983 regulation of cell cycle Effects 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 239000002342 ribonucleoside Substances 0.000 description 1
- 238000007480 sanger sequencing Methods 0.000 description 1
- 210000000582 semen Anatomy 0.000 description 1
- 208000007056 sickle cell anemia Diseases 0.000 description 1
- 239000000377 silicon dioxide Substances 0.000 description 1
- 201000003708 skin melanoma Diseases 0.000 description 1
- 239000010454 slate Substances 0.000 description 1
- 230000009870 specific binding Effects 0.000 description 1
- 208000002320 spinal muscular atrophy Diseases 0.000 description 1
- 239000007921 spray Substances 0.000 description 1
- 210000003802 sputum Anatomy 0.000 description 1
- 208000024794 sputum Diseases 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 239000006228 supernatant Substances 0.000 description 1
- 239000000829 suppository Substances 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 210000004243 sweat Anatomy 0.000 description 1
- 210000001179 synovial fluid Anatomy 0.000 description 1
- 239000003826 tablet Substances 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 229940124597 therapeutic agent Drugs 0.000 description 1
- 229940124598 therapeutic candidate Drugs 0.000 description 1
- 238000005382 thermal cycling Methods 0.000 description 1
- 210000003813 thumb Anatomy 0.000 description 1
- 201000002510 thyroid cancer Diseases 0.000 description 1
- 230000000699 topical effect Effects 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 206010046766 uterine cancer Diseases 0.000 description 1
- 208000037965 uterine sarcoma Diseases 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
- 238000007482 whole exome sequencing Methods 0.000 description 1
- 238000012070 whole genome sequencing analysis Methods 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
- C12Q1/6886—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6806—Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6844—Nucleic acid amplification reactions
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
Abstract
ある態様では、対象から得られたポリヌクレオチド試料において腫瘍の存在または非存在を検出するための方法であって、(i)担体核酸分子をポリヌクレオチド試料に添加して、第1の試料を生成するステップであって、担体核酸分子のセットが、非メチル化担体核酸分子の少なくとも1つのサブセットおよび/またはメチル化担体核酸分子の少なくとも1つのサブセットを含み、担体核酸分子の少なくとも一方の末端が、ライゲーションを防止するように改変される、ステップ;(ii)第1の試料を、メチル化ポリヌクレオチドに選択的に結合する捕捉剤を使用して、少なくとも2つの分配されたセットに分配するステップ;(iii)分配された試料を処理して、処理された試料を生成するステップであって、この処理は、タグ付けするステップ、増幅するステップおよび富化するステップを含む、ステップ;(iv)処理された試料をシーケンシングして、シーケンシングリードのセットを生成するステップ;および(v)複数のシーケンシングリードを解析して、腫瘍の存在または非存在を検出するステップを含む、方法。
Description
関連出願の相互参照
本出願は、すべての目的に関して参照により本明細書に組み込まれる、2019年11月26日に提出された米国仮特許出願第62/940,853号への優先権の利益を主張する。
本出願は、すべての目的に関して参照により本明細書に組み込まれる、2019年11月26日に提出された米国仮特許出願第62/940,853号への優先権の利益を主張する。
背景
がんは、世界全体で疾患の主要な原因である。毎年、数千万人が世界中でがんと診断され、その半分よりも多くが最終的にがんで死亡する。多くの国では、がんは、心血管疾患に次いで2番目に一般的な死亡原因としてランク付けされている。早期検出は、多くのがんについての転帰改善に関連する。
がんは、世界全体で疾患の主要な原因である。毎年、数千万人が世界中でがんと診断され、その半分よりも多くが最終的にがんで死亡する。多くの国では、がんは、心血管疾患に次いで2番目に一般的な死亡原因としてランク付けされている。早期検出は、多くのがんについての転帰改善に関連する。
がんは、そのうち少なくとも一部が不適切に調節された細胞分裂を生じる、個体の正常細胞内での遺伝的バリエーションの蓄積によって引き起こされ得る。そのようなバリエーションには、コピー数変動(CNV)、一塩基変異(single nucleotide variation)(SNV)、遺伝子融合、挿入および/または欠失(インデル)が一般に含まれ、エピジェネティックバリエーションには、シトシンの5-メチル化(5-メチルシトシン)ならびにDNAとクロマチンおよび転写因子との会合が含まれる。
がんは、腫瘍の生検と、その後の細胞、マーカー、または細胞から抽出されたDNAの解析によって検出される場合が多い。しかしより最近、血液または尿等の体液中の無細胞核酸からもがんを検出することができることが提唱されている。そのような試験は、非侵襲性であるという利点を有し、生検中の疑われるがん細胞を同定することなしに実施することができる。しかし、そのようなリキッドバイオプシー試験は、体液中の核酸の量が非常に少なく、存在する核酸が不均一な形態(例えば、RNAおよびDNA、一本鎖および二本鎖、ならびに様々な状態の複製後改変およびヒストン等のタンパク質との会合)であるという事実によって複雑になる。
概要
ある態様では、本開示は、対象における腫瘍の存在または非存在を検出する方法であって、(i)対象からポリヌクレオチド試料を得るステップ;(ii)担体核酸分子のセットをポリヌクレオチド試料に添加して、第1の試料を生成するステップであって、担体核酸分子のセットが、(a)非メチル化担体核酸分子の少なくとも1つのサブセット;および/または(b)メチル化担体核酸分子の少なくとも1つのサブセットを含み、担体核酸分子の少なくとも一方の末端が、ライゲーションを防止するように改変され、非メチル化担体核酸分子が、メチル化ヌクレオチドを含まず、メチル化担体核酸分子が、1つまたは複数のメチル化ヌクレオチドを含む、ステップ;(iii)第1の試料を、メチル化ポリヌクレオチドに選択的に結合する捕捉剤を使用して、少なくとも2つの分配されたセットに分配し、それにより、分配された試料を生成するステップ;(iv)分配された試料の少なくとも一部を処理して、処理された試料を生成するステップであって、この処理は、以下:(a)タグ付けするステップ、(b)増幅するステップ、および(c)目的の特異的領域について分子を富化するステップ、のうち少なくとも1つを含む、ステップ;(v)処理された試料の少なくとも一部をシーケンシングして、シーケンシングリードのセットを生成するステップ;および(vi)シーケンシングリードのセットの少なくとも一部を解析して、腫瘍の存在または非存在を検出するステップを含む方法を提供する。一部の実施形態では、シーケンシングするステップは、少なくとも2つの分配されたセット由来の処理された試料の少なくとも一部をシーケンシングするステップを含む。
ある態様では、本開示は、対象における腫瘍の存在または非存在を検出する方法であって、(i)対象からポリヌクレオチド試料を得るステップ;(ii)担体核酸分子のセットをポリヌクレオチド試料に添加して、第1の試料を生成するステップであって、担体核酸分子のセットが、(a)非メチル化担体核酸分子の少なくとも1つのサブセット;および/または(b)メチル化担体核酸分子の少なくとも1つのサブセットを含み、担体核酸分子の少なくとも一方の末端が、ライゲーションを防止するように改変され、非メチル化担体核酸分子が、メチル化ヌクレオチドを含まず、メチル化担体核酸分子が、1つまたは複数のメチル化ヌクレオチドを含む、ステップ;(iii)第1の試料を、メチル化ポリヌクレオチドに選択的に結合する捕捉剤を使用して、少なくとも2つの分配されたセットに分配し、それにより、分配された試料を生成するステップ;(iv)分配された試料の少なくとも一部を処理して、処理された試料を生成するステップであって、この処理は、以下:(a)タグ付けするステップ、(b)増幅するステップ、および(c)目的の特異的領域について分子を富化するステップ、のうち少なくとも1つを含む、ステップ;(v)処理された試料の少なくとも一部をシーケンシングして、シーケンシングリードのセットを生成するステップ;および(vi)シーケンシングリードのセットの少なくとも一部を解析して、腫瘍の存在または非存在を検出するステップを含む方法を提供する。一部の実施形態では、シーケンシングするステップは、少なくとも2つの分配されたセット由来の処理された試料の少なくとも一部をシーケンシングするステップを含む。
別の態様では、本開示は、ポリヌクレオチドを解析するための方法であって、(i)対象からポリヌクレオチド試料を得るステップ;(ii)担体核酸分子のセットをポリヌクレオチド試料に添加して、第1の試料を生成するステップであって、担体核酸分子のセットが、(a)非メチル化担体核酸分子の少なくとも1つのサブセット;および/または(b)メチル化担体核酸分子の少なくとも1つのサブセットを含み、担体核酸分子の少なくとも一方の末端が、ライゲーションを防止するように改変され、非メチル化担体核酸分子が、メチル化ヌクレオチドを含まず、メチル化担体核酸分子が、1つまたは複数のメチル化ヌクレオチドを含む、ステップ;(iii)第1の試料を、メチル化ポリヌクレオチドに選択的に結合する捕捉剤を使用して、少なくとも2つの分配されたセットに分配し、それにより、分配された試料を生成するステップ;(iv)分配された試料の少なくとも一部を処理して、処理された試料を生成するステップであって、この処理は、以下:(a)タグ付けするステップ、(b)増幅するステップ、および(c)目的の特異的領域について分子を富化するステップのうち少なくとも1つを含む、ステップ;(v)処理された試料の少なくとも一部をシーケンシングして、シーケンシングリードのセットを生成するステップ;および(vi)シーケンシングリードのセットの少なくとも一部を解析して、腫瘍の存在または非存在を検出するステップを含む方法を提供する。一部の実施形態では、シーケンシングするステップは、少なくとも2つの分配されたセット由来の処理された試料の少なくとも一部をシーケンシングするステップを含む。
別の態様では、本開示は、ポリヌクレオチドを解析するための方法であって、(i)担体核酸分子のセットを対象由来のポリヌクレオチド試料に添加して、第1の試料を生成するステップであって、担体核酸分子のセットが、(a)非メチル化担体核酸分子の少なくとも1つのサブセット;および/または(b)メチル化担体核酸分子の少なくとも1つのサブセットを含み、担体核酸分子の少なくとも一方の末端が、ライゲーションを防止するように改変され、非メチル化担体核酸分子が、メチル化ヌクレオチドを含まず、メチル化担体核酸分子が、1つまたは複数のメチル化ヌクレオチドを含む、ステップ;(iii)第1の試料を、メチル化ポリヌクレオチドに選択的に結合する捕捉剤を使用して、少なくとも2つの分配されたセットに分配し、それにより、分配された試料を生成するステップ;(iv)分配された試料の少なくとも一部を処理して、処理された試料を生成するステップであって、この処理は、以下:(a)タグ付けするステップ、(b)増幅するステップ、および(c)目的の特異的領域について分子を富化するステップのうち少なくとも1つを含む、ステップ;(v)処理された試料の少なくとも一部をシーケンシングして、シーケンシングリードのセットを生成するステップ;および(vi)シーケンシングリードのセットの少なくとも一部を解析して、腫瘍の存在または非存在を検出するステップを含む方法を提供する。一部の実施形態では、シーケンシングするステップは、少なくとも2つの分配されたセット由来の処理された試料の少なくとも一部をシーケンシングするステップを含む。
別の態様では、本開示は、ポリヌクレオチドを解析するための方法であって、(i)対象からポリヌクレオチド試料を得るステップ;(ii)担体核酸分子のセットをポリヌクレオチド試料に添加して、第1の試料を生成するステップであって、担体核酸分子のセットが、(a)非メチル化担体核酸分子の少なくとも1つのサブセット;および/または(b)メチル化担体核酸分子の少なくとも1つのサブセットを含み、担体核酸分子の少なくとも一方の末端が、ライゲーションを防止するように改変され、非メチル化担体核酸分子が、メチル化ヌクレオチドを含まず、メチル化担体核酸分子が、1つまたは複数のメチル化ヌクレオチドを含む、ステップ;(iii)第1の試料を、メチル化ポリヌクレオチドに選択的に結合する捕捉剤を使用して、少なくとも2つの分配されたセットに分配し、それにより、分配された試料を生成するステップ;(iv)分配された試料の少なくとも一部を処理して、処理された試料を生成するステップであって、この処理は、以下:(a)タグ付けするステップ、および(b)ポリヌクレオチドを増幅するステップのうち少なくとも1つを含む、ステップ;(v)処理された試料の少なくとも一部をシーケンシングして、シーケンシングリードのセットを生成するステップ;および(vi)シーケンシングリードのセットの少なくとも一部を解析して、腫瘍の存在または非存在を検出するステップを含む方法を提供する。一部の実施形態では、シーケンシングするステップは、少なくとも2つの分配されたセット由来の処理された試料の少なくとも一部をシーケンシングするステップを含む。一部の実施形態では、処理するステップは、目的の特異的領域についてポリヌクレオチドを富化するステップをさらに含む。
別の態様では、本開示は、ポリヌクレオチドのメチル化状態を検出する方法であって、(i)対象からポリヌクレオチド試料を得るステップ;(ii)担体核酸分子のセットをポリヌクレオチド試料に添加して、第1の試料を生成するステップであって、担体核酸分子のセットが、(a)非メチル化担体核酸分子の少なくとも1つのサブセット;および/または(b)メチル化担体核酸分子の少なくとも1つのサブセットを含み、担体核酸分子の少なくとも一方の末端が、ライゲーションを防止するように改変され、非メチル化担体核酸分子が、メチル化ヌクレオチドを含まず、メチル化担体核酸分子が、1つまたは複数のメチル化ヌクレオチドを含む、ステップ;(iii)第1の試料を、メチル化ポリヌクレオチドに選択的に結合する捕捉剤を使用して、少なくとも2つの分配されたセットに分配し、それにより、分配された試料を生成するステップ;(iv)分配された試料の少なくとも一部を処理して、処理された試料を生成するステップであって、この処理は、以下:(a)タグ付けするステップ、(b)増幅するステップ、および(c)目的の特異的領域について分子を富化するステップのうち少なくとも1つを含む、ステップ;(v)処理された試料の少なくとも一部をシーケンシングして、シーケンシングリードのセットを生成するステップ;および(vi)シーケンシングリードのセットの少なくとも一部を解析して、腫瘍の存在または非存在を検出するステップを含む方法を提供する。一部の実施形態では、シーケンシングするステップは、少なくとも2つの分配されたセット由来の処理された試料の少なくとも一部をシーケンシングするステップを含む。
一部の実施形態では、シーケンシングリードのセットの少なくとも一部を解析するステップは、1つまたは複数の体細胞バリエーションを検出するステップを含む。一部の実施形態では、シーケンシングリードのセットの少なくとも一部を解析するステップは、CpG残基(または別のメチル化ヌクレオチド)の数、およびポリヌクレオチドが分配される分配されたセットに基づいて、ポリヌクレオチドのメチル化状態(即ち、ポリヌクレオチドがメチル化されているか否か)を決定するステップを含む。一部の実施形態では、シーケンシングするステップの前に、少なくとも2つの分配されたセット中のポリヌクレオチドは、ヌクレオチド塩基の改変(例えば、メチル化)の情報を提供するようにヌクレオチド塩基を選択的に変換する化学的手順に供され得る。これらの実施形態では、化学的手順は、バイサルファイト処置、TAB-Seq、ACE-Seq、EM-Seq、hmC-Seal、TAPSまたはTAPSBであり得る。これらの実施形態では、シーケンシングリードのセットの少なくとも一部を解析するステップは、ヌクレオチド塩基変換に依存してヌクレオチド塩基の改変を決定するステップを含む。一部の実施形態では、分配のために使用される方法およびシステムは、その全体が参照により本明細書に組み込まれるPCT特許出願番号PCT/US2020/053610において見出され得る。
別の態様では、本開示は、(i)非メチル化担体核酸分子の少なくとも1つのサブセット;および/または(ii)メチル化担体核酸分子の少なくとも1つのサブセットを含む担体核酸分子のセットであって、担体核酸分子の少なくとも一方の末端が、ライゲーションを防止するように改変され、非メチル化担体核酸分子が、メチル化ヌクレオチドを含まず、メチル化担体核酸分子が、1つまたは複数のメチル化ヌクレオチドを含む、担体核酸分子のセットを提供する。
別の態様では、本開示は、(i)(a)非メチル化担体核酸分子の少なくとも1つのサブセット;および/または(b)メチル化担体核酸分子の少なくとも1つのサブセットを含む担体核酸分子のセットであって、担体核酸分子の少なくとも一方の末端が、ライゲーションを防止するように改変され、非メチル化担体核酸分子が、メチル化ヌクレオチドを含まず、メチル化担体核酸分子が、1つまたは複数のメチル化ヌクレオチドを含む、担体核酸分子のセット;および(ii)対象から得られたポリヌクレオチド試料を含む核酸の集団を提供する。
別の態様では、本開示は、少なくとも1つの電子プロセッサーによって実行された場合に、(i)担体核酸分子のセットをポリヌクレオチド試料に添加して、第1の試料を生成するステップであって、担体核酸分子のセットが、(a)非メチル化担体核酸分子の少なくとも1つのサブセット;および/または(b)メチル化担体核酸分子の少なくとも1つのサブセットを含み、担体核酸分子の少なくとも一方の末端が、ライゲーションを防止するように改変され、非メチル化担体核酸分子が、メチル化ヌクレオチドを含まず、メチル化担体核酸分子が、1つまたは複数のメチル化ヌクレオチドを含む、ステップ;(ii)第1の試料を、メチル化ポリヌクレオチドに選択的に結合する捕捉剤を使用して、少なくとも2つの分配されたセットに分配し、それにより、分配された試料を生成するステップ;(iii)分配された試料の少なくとも一部を処理して、処理された試料を生成するステップであって、この処理は、以下:(a)タグ付けするステップ、(b)増幅するステップ、および(c)目的の特異的領域について分子を富化するステップのうち少なくとも1つを含む、ステップ;(iv)処理された試料の少なくとも一部をシーケンシングして、シーケンシングリードのセットを生成するステップ;および(v)シーケンシングリードのセットの少なくとも一部を解析して、腫瘍の存在または非存在を検出するステップを含む方法を実行する非一過性コンピュータ実行可能命令を含むコンピュータ可読媒体を含むかまたはそれにアクセスすることが可能なコントローラーを含むシステムを提供する。
一部の実施形態では、担体核酸分子は、長さが25bpと325bpとの間である。一部の実施形態では、非メチル化担体核酸分子の少なくとも1つのサブセットの第1のサブセットおよび第2のサブセットは、同じヌクレオチド配列を含む。一部の実施形態では、非メチル化担体核酸分子の少なくとも1つのサブセットの第1のサブセットおよび第2のサブセットは、異なるヌクレオチド配列を含む。
一部の実施形態では、非メチル化担体核酸分子の少なくとも1つのサブセットの第1のサブセットおよび第2のサブセットは、ヌクレオチド配列中に、1つまたは複数のCpGジヌクレオチドを含む。一部の実施形態では、非メチル化担体核酸分子の少なくとも1つのサブセットの第1のサブセット中の1つまたは複数のCpGジヌクレオチドの位置は、第2のサブセット中の1つまたは複数のCpGジヌクレオチドの位置とは異なる。一部の実施形態では、非メチル化担体核酸分子の少なくとも1つのサブセットの第1のサブセット中のCpGジヌクレオチドの数は、第2のサブセット中のCpGジヌクレオチドの数とは異なる。一部の実施形態では、非メチル化担体核酸分子の少なくとも1つのサブセットの第1のサブセット中の1つまたは複数のCpGジヌクレオチドに隣接するヌクレオチドの配列は、第2のサブセット中の1つまたは複数のCpGジヌクレオチドに隣接するヌクレオチドの配列とは異なる。一部の実施形態では、第1のサブセットおよび/または第2のサブセット中の1つまたは複数のメチル化ヌクレオチドに隣接するヌクレオチドの配列は、1つまたは複数のメチル化ヌクレオチドに隣接する1ヌクレオチド、2ヌクレオチド、3ヌクレオチド、4ヌクレオチドまたは5ヌクレオチドの配列であり得る。一部の実施形態では、非メチル化担体核酸分子の少なくとも1つのサブセットの第1のサブセットおよび第2のサブセットは、異なる長さのものである。
一部の実施形態では、1つまたは複数のメチル化ヌクレオチドは、(i)5-メチルシトシン、(ii)6-メチルアデニン、(iii)ヒドロキシメチルシトシン、(iv)メチルウラシル、および(v)任意の他のメチル化ヌクレオチドからなる群より選択される。一部の実施形態では、メチル化ヌクレオチドの数は、1、2、3、4、5、6、7、8、9、10、12、14、15、16、17、18、19または少なくとも20である。
一部の実施形態では、メチル化担体核酸分子の少なくとも1つのサブセットの第1のサブセットおよび第2のサブセットは、同じヌクレオチド配列を含む。一部の実施形態では、メチル化担体核酸分子の少なくとも1つのサブセットの第1のサブセットおよび第2のサブセットは、異なるヌクレオチド配列を含む。
一部の実施形態では、メチル化担体核酸分子の少なくとも1つのサブセットの第1のサブセットおよび第2のサブセットは、ヌクレオチド配列中に、1つまたは複数のCpGジヌクレオチドを含む。一部の実施形態では、1つまたは複数のCpGジヌクレオチドは、1つまたは複数のメチル化シトシンを含む。
一部の実施形態では、メチル化担体核酸分子の少なくとも1つのサブセットの第1のサブセット中の1つまたは複数のメチル化ヌクレオチドの位置は、第2のサブセット中の1つまたは複数のメチル化ヌクレオチドの位置とは異なる。一部の実施形態では、メチル化担体核酸分子の少なくとも1つのサブセットの第1のサブセット中のメチル化ヌクレオチドの数は、第2のサブセット中のメチル化ヌクレオチドの数とは異なる。一部の実施形態では、メチル化担体核酸分子の少なくとも1つのサブセットの第1のサブセット中の1つまたは複数のメチル化ヌクレオチドに隣接するヌクレオチドの配列は、第2のサブセット中の1つまたは複数のメチル化ヌクレオチドに隣接するヌクレオチドの配列とは異なる。一部の実施形態では、第1のサブセットおよび/または第2のサブセット中の1つまたは複数のメチル化ヌクレオチドに隣接するヌクレオチドの配列は、1つまたは複数のメチル化ヌクレオチドに隣接する1ヌクレオチド、2ヌクレオチド、3ヌクレオチド、4ヌクレオチドまたは5ヌクレオチドの配列であり得る。
一部の実施形態では、メチル化担体核酸分子の少なくとも1つのサブセットの第1のサブセットおよび第2のサブセットは、異なる長さのものである。
一部の実施形態では、メチル化担体核酸分子の少なくとも1つのサブセットの、非メチル化担体核酸分子の少なくとも1つのサブセットに対する量は、約0:1、0.1:99.9、0.5:99.5、0.75:99.25、1:99、1:95、1:90、1:80、1:75、1:70、1:60、1:50、1:40、1:30、1:25、1:20、1:10、1:5、1:2、1:1.15、1:1、1.15:1、2:1、5:1、10:1、20:1、25:1、30:1、40:1、50:1、60:1、70:1、75:1、80:1、90:1、95:1、99:1、99.25:0.75、99.5:0.5、99.9:0.1または1:0の比である。一部の実施形態では、メチル化担体核酸分子の少なくとも1つのサブセットの、非メチル化担体核酸分子の少なくとも1つのサブセットに対する量は、約1:1の比である。一部の実施形態では、メチル化担体核酸分子の少なくとも1つのサブセットの、非メチル化担体核酸分子の少なくとも1つのサブセットに対する量は、約2:1の比である。一部の実施形態では、メチル化担体核酸分子の少なくとも1つのサブセットの、非メチル化担体核酸分子の少なくとも1つのサブセットに対する量は、約1:2の比である。一部の実施形態では、ポリヌクレオチド試料の、担体核酸分子のセットに対する量は、約1:0.1;1:0.2、1:0.3、1:4、1:0.5、1:6、1:7、1:8、1:0.9、1:1、1:1、1:2、1:3、1:4、1:5、1:6、1:7、1:8、1:9、1:10の比、1:20、1:30、1:40、1:50、1:60、1:70、1:80、1:90、1:100、1:200、1:300;1:400、1:500、1:600、1:700、1:800、1:900、1:1000、1:5000、1:10,000、1:100,000、1:500,000、1:106、1:107、1:108または1:109である。一部の実施形態では、量は、質量を単位とする。一部の実施形態では、量は、モル濃度を単位とする。一部の実施形態では、ポリヌクレオチド試料は、最大1μgである。一部の実施形態では、ポリヌクレオチド試料は、最大200ngである。一部の実施形態では、ポリヌクレオチド試料は、最大150ngである。一部の実施形態では、ポリヌクレオチド試料は、最大100ngである。
一部の実施形態では、担体核酸分子のセットは、ポリヌクレオチド試料と担体核酸分子のセットとの総量が約175ng、200ng、225ng、250ng、275ng、300ng、350ng、400ng、450ng、500ng、600ng、700ng、750ng、800ng、900ng、1μg、1.1μg、1.25μgまたは1.5μgになるように十分な量で添加される。
一部の実施形態では、担体核酸分子の配列は、(i)ウイルスゲノム由来の配列、(ii)細菌ゲノム由来の配列、(iii)ラムダゲノム由来の配列、および(iv)非ヒトゲノム由来の配列からなる群より選択される。一部の実施形態では、担体核酸分子は、合成DNAである。一部の実施形態では、担体核酸分子は、ウラシルヌクレオシドを含む。一部の実施形態では、この方法は、増幅前に、ウラシルデグリコシラーゼおよびDNAグリコシラーゼ-リアーゼを添加するステップをさらに含む(Kropachev KT et al., Biochemistry (2006); 45(39):12039-12049)。一部の実施形態では、担体DNA分子は、PCRによって生成され得る。一部の実施形態では、PCRによって生成された担体核酸分子は、担体核酸分子中の1つまたは複数のヌクレオチドにメチル基を組み込むために、メチルトランスフェラーゼによる処置によってさらに改変され得る。一部の実施形態では、担体核酸分子は、アダプターへの担体核酸分子のライゲーションを防止するように改変ヌクレオシドを組み込むために、ポリメラーゼで末端標識され得る。一部の実施形態では、担体核酸分子は、天然に存在しないヌクレオシド誘導体を含む。一部の実施形態では、担体核酸分子は、ビオチンまたはフルオロフォアで標識され得る。
一部の実施形態では、担体核酸分子の少なくとも一方の末端は、C3(プロピル基)スペーサーを含む。C3スペーサーは、ライゲーションの遮断を助ける。一部の実施形態では、担体核酸分子の少なくとも一方の末端は、ジデオキシヌクレオチドを含む。一部の実施形態では、担体核酸分子の少なくとも一方の末端は、ヒドロキシル基が求核試薬として作用することを阻止する任意の化学的改変を含む。一部の実施形態では、担体核酸分子の5’末端は、以下の改変:(i)反転(5’-5’)-ジデオキシチミン、ジデオキシシトシン、ジデオキシグアニンまたはジデオキシアデニン;(ii)プロピル基、または(iii)例えば、ベンジル、エチルもしくはメチルであるがこれらに限定されない他の有機官能基のうち少なくとも1つを含む。一部の実施形態では、担体核酸分子の3’末端は、以下の改変:(i)酵素的に、または合成の間に付加され得る任意のジデオキシ塩基、例えば、ジデオキシチミン、ジデオキシシトシン、ジデオキシグアニンまたはジデオキシアデニン;(ii)プロピル基、または(iii)例えば、ベンジル、エチルもしくはメチルに限定されない他の有機官能基のうち少なくとも1つを含む。
一部の実施形態では、ポリヌクレオチド試料は、組織、血液、血漿、血清、尿、唾液、糞便、脳脊髄液、頬内スワブまたは胸腔穿刺から得られる。一部の実施形態では、ポリヌクレオチド試料は、組織から得られる。一部の実施形態では、組織から得られたポリヌクレオチド試料は、酵素的手段または機械的手段によって断片化される。一部の実施形態では、ポリヌクレオチド試料は、血液から得られる。一部の実施形態では、血液由来のポリヌクレオチド試料は、無細胞DNA試料である。一部の実施形態では、ポリヌクレオチド試料は、無細胞DNA試料である。一部の実施形態では、担体核酸分子は、二本鎖分子である。一部の実施形態では、本明細書に開示される方法は、アダプターのライゲーション前に変性させるステップを有さない。即ち、第1の試料は、変性させるステップに供されない(言い換えると、二本鎖担体核酸分子がライゲーションに供される)。
一部の実施形態では、本明細書に開示されるシステムおよび/または方法の結果を入力として使用して報告書を作成する。報告書は紙または電子フォーマットであり得る。例えば、本明細書に開示される方法またはシステムによって決定された核酸分子の分配に関する情報および/またはその核酸分子の分配に由来する情報を、そのような報告書に示すことができる。本明細書に開示される方法またはシステムは、第3者、例えば試料を得た対象または医療従事者に報告書を伝えるステップをさらに含み得る。
本明細書に開示される方法の様々なステップまたは本明細書に開示されるシステムによって実施されるステップは、同じ時期もしくは異なる時期、および/または同じ地理的場所もしくは異なる地理的場所、例えば国において実施され得る。本明細書に開示される方法の様々なステップは、同じ人または異なる人々によって実施することができる。
他の実施形態では、本発明は、対象方法を実施するためのキットを含む。このキットは、(a)(i)非メチル化担体核酸分子の少なくとも1つのサブセット;および/または(ii)メチル化担体核酸分子の少なくとも1つのサブセットを含む担体核酸分子のセットであって、担体核酸分子の少なくとも一方の末端が、ライゲーションを防止するように改変され、非メチル化担体核酸分子が、メチル化ヌクレオチドを含まず、メチル化担体核酸分子が、1つまたは複数のメチル化ヌクレオチドを含む、担体核酸分子のセット;および(b)メチル化ポリヌクレオチドに選択的に結合する捕捉剤を含む。
本開示の追加の態様および利点は、本開示の例示的な実施形態のみが示され記載される以下の詳細な説明から当業者に容易に明らかになろう。認識されるように、本開示は、他のおよび異なる実施形態が可能であり、そのいくつかの詳細は、すべて本開示から逸脱することなしに、様々な明らかな点において改変が可能である。したがって、図面および説明は、限定ではなく、事実上例示とみなすべきである。
本明細書に組み込まれ、その一部を構成する添付の図面はある特定の実施形態を説明し、記述した説明とともに、本明細書に開示した方法、コンピュータ可読媒体、およびシステムのある特定の原理を説明するために役立つ。本明細書で提供する説明は、例として含まれ、限定するものではない添付の図面と併せて読めば、より良く理解される。文脈が他を指示しない限り、同様の参照番号は図面全体で同様の成分を特定することが理解されよう。図面のいくつかまたはすべては説明目的の概略図であり、必ずしも示された要素の実際の相対的寸法または位置を描いているのではないことも理解されよう。
定義
本開示がより容易に理解されるように、ある特定の用語を以下で最初に定義する。以下の用語および他の用語についての追加の定義が、本明細書を通じて記載され得る。以下に記載される用語の定義が、参照により組み込まれる出願または特許における定義と矛盾する場合、その用語の意味を理解するために本出願中に記載される定義を使用すべきである。
本開示がより容易に理解されるように、ある特定の用語を以下で最初に定義する。以下の用語および他の用語についての追加の定義が、本明細書を通じて記載され得る。以下に記載される用語の定義が、参照により組み込まれる出願または特許における定義と矛盾する場合、その用語の意味を理解するために本出願中に記載される定義を使用すべきである。
本明細書および添付の特許請求の範囲で使用される場合、単数形「1つの(a)」、「1つの(an)」および「その(the)」は、文脈がそれ以外であることを明らかに示していない限り、複数形を含む。このように、例えば、「1つの方法」という言及は、本明細書に記載されるおよび/または本開示を読んだ当業者に明らかになる型の1つまたは複数の方法および/またはステップ等を含む。
本明細書で使用される専門用語が、特定の実施形態を記載することのみを目的としており、限定を意図しないことも理解すべきである。さらに、それ以外であることが定義されていない限り、本明細書で使用されるすべての技術用語および科学用語は、本開示が属する分野の当業者によって一般に理解される意味と同じ意味を有する。方法、コンピュータ可読媒体およびシステムを記載し特許請求する際には、以下の専門用語およびそれらの文法的異形が、以下に記載される定義に従って使用されよう。
約:本明細書で使用される場合、「約」または「およそ」は、目的の1つまたは複数の値または要素に適用される場合、述べられた参照値または要素と類似している値または要素を指す。ある特定の実施形態では、用語「約」または「およそ」は、それ以外であることが述べられていない限りまたはそれ以外であることが文脈から明らかでない限り、いずれかの方向(それよりも大きいまたはそれよりも小さい)で、述べられた参照値または要素の25%、20%、19%、18%、17%、16%、15%、14%、13%、12%、11%、10%、9%、8%、7%、6%、5%、4%、3%、2%、1%以内またはそれよりも小さい%以内に入る、値または要素の範囲を指す(そのような数が、可能な値または要素の100%を超える場合を除く)。
アダプター:本明細書で使用される場合、「アダプター」は、典型的には少なくとも部分的に二本鎖であり、所与の試料核酸分子のいずれかの末端または両方の末端に結合される、短い核酸(例えば、長さが約500ヌクレオチド未満、約100ヌクレオチド未満または約50ヌクレオチド未満)を指す。アダプターは、両方の末端でアダプターが隣接する核酸分子の増幅を可能にする核酸プライマー結合部位、および/または様々な次世代シーケンシング(NGS)適用等のシーケンシング適用のためのプライマー結合部位を含むシーケンシングプライマー結合部位を含み得る。アダプターは、フローセル支持体等に結合されたオリゴヌクレオチド等の捕捉用プローブのための結合部位もまた含み得る。アダプターは、本明細書に記載される核酸タグもまた含み得る。核酸タグは、典型的には、核酸タグが所与の核酸分子のアンプリコンおよび配列リード中に含まれるように、増幅プライマーおよびシーケンシングプライマー結合部位に対して位置決めされる。同じまたは異なる配列のアダプターが、核酸分子のそれぞれの末端に連結され得る。一部の実施形態では、核酸タグが異なっている点を除いて同じ配列のアダプターが、核酸分子のそれぞれの末端に連結される。一部の実施形態では、アダプターは、これもまた平滑末端であるか、または1つもしくは複数の相補的ヌクレオチドのテイルが付いた核酸分子への結合のために、一方の末端が、本明細書に記載されるように平滑末端であるか、またはテイルが付けられる、Y字形状のアダプターである。さらに他の例示的実施形態では、アダプターは、解析される核酸分子への結合のための平滑末端またはテイル付き末端(tailed end)を含むベル形状のアダプターである。アダプターの他の例には、Tテイル付きおよびCテイル付きのアダプターが含まれる。
増幅する:本明細書で使用される場合、核酸の文脈において、「増幅する」または「増幅」は、少量のポリヌクレオチド(例えば、単一のポリヌクレオチド分子)から典型的には開始する、複数コピーのポリヌクレオチド、またはポリヌクレオチドの一部の産生を指し、増幅産物またはアンプリコンは、一般には検出可能である。ポリヌクレオチドの増幅は、種々の化学的プロセスおよび酵素的プロセスを包含する。増幅には、ポリメラーゼ連鎖反応(PCR)が含まれるがこれに限定されない。
バーコード:本明細書で使用される場合、核酸の文脈において、「バーコード」または「分子バーコード」は、分子識別子として機能することができる配列を含む核酸分子を指す。バーコードまたは分子バーコードは、核酸タグの1つの型である。例えば、典型的には、シーケンシングリードを最終データ解析前に同定および選別することができるように、個々の「バーコード」配列が、次世代シーケンシング(NGS)ライブラリ調製の間にDNA断片に付加される。
がん型:本明細書で使用される場合、「がん型」は、例えば組織病理学によって定義される、がんの型またはサブタイプを指す。がん型は、所与の組織における存在(例えば、血液がん、中枢神経系(CNS)、脳がん、肺がん(小細胞および非小細胞)、皮膚がん、鼻がん、咽喉がん、肝臓がん、骨がん、リンパ腫、膵がん、腸(bowel)がん、直腸がん、甲状腺がん、膀胱がん、腎臓がん、口腔がん、胃がん、乳がん、前立腺がん、卵巣がん、肺がん、腸(intestinal)がん、軟部組織がん、神経内分泌がん、胃食道がん、頭頸部がん、婦人科がん、結腸直腸がん、尿路上皮がん、固形がん、不均一ながん、均一ながん)、原発不明起源等に基づく、ならびに/または同じ細胞系列(例えば、癌腫、肉腫、リンパ腫、胆管癌、白血病、中皮腫、黒色腫または神経膠芽腫)ならびに/または例えばHer2、CA15-3、CA19-9、CA-125、CEA、AFP、PSA、HCG、ホルモン受容体およびNMP-22であるがこれらに限定されないがんマーカーを示すがんに基づく、任意の従来の基準によって定義され得る。がんは、ステージ(例えば、ステージ1、2、3または4)、および原発性の起源であるか続発性の起源であるかによっても分類され得る。
担体核酸分子:本明細書で使用される場合、「担体核酸分子」は、対象における腫瘍の存在または非存在の検出を改善するために、対象から得られたポリヌクレオチド試料に添加され得る核酸分子のセットを指す。一部の実施形態では、担体核酸分子は、一本鎖または二本鎖であり得る。一部の実施形態では、担体核酸分子は、DNAまたはRNAであり得る。一部の実施形態では、担体核酸分子は、合成オリゴヌクレオチドであり得る。一部の実施形態では、担体核酸分子は、ゲノム由来の目的の1つまたは複数の特異的領域を増幅することを介して、PCRによって生成され得る。一部の実施形態では、PCRによって生成された担体核酸分子は、担体核酸分子中の1つまたは複数のヌクレオチドにメチル基を組み込むために、メチルトランスフェラーゼによる処置によってさらに改変され得る。一部の実施形態では、担体核酸分子は、アダプターへの担体核酸分子のライゲーションを防止するように改変ヌクレオシドを組み込むために、ポリメラーゼで末端標識され得る。一部の実施形態では、担体核酸分子は、天然に存在しない核酸配列を有し得る。一部の実施形態では、担体核酸分子は、天然に存在する核酸配列を有し得る。一部の実施形態では、担体核酸分子は、非ヒトゲノムに対応する核酸配列を有し得る。非限定的な例として、これらの担体核酸分子は、(i)ラムダファージDNAもしくはヒトゲノムの領域に対応する配列、(ii)ウイルスゲノムの領域に対応する配列、(iii)細菌ゲノムの領域に対応する配列、(iv)天然に存在しない配列、および/または(v)上記のいずれかの組合せのいずれかを有し得る。一部の実施形態では、担体核酸分子は、天然に存在しないヌクレオシド誘導体を含む。一部の実施形態では、担体DNA分子は、PCRによって生成され得る。一部の実施形態では、PCRによって生成された担体核酸分子は、担体核酸分子中の1つまたは複数のヌクレオチドにメチル基を組み込むために、メチルトランスフェラーゼによる処置によってさらに改変され得る。一部の実施形態では、担体核酸分子は、アダプターへの担体核酸分子のライゲーションを防止するように改変ヌクレオシドを組み込むために、ポリメラーゼで末端標識され得る。一部の実施形態では、担体核酸分子は、天然に存在しないヌクレオシド誘導体を含む。一部の実施形態では、担体核酸分子は、ビオチンまたはフルオロフォアで標識され得る。
無細胞核酸:本明細書で使用される場合、「無細胞核酸」は、細胞内に含まれることも、他の方法で細胞に結合していることもない核酸、または一部の実施形態では、インタクトな細胞の除去後に試料中に残存する核酸を指す。無細胞核酸には、例えば、対象由来の体液(例えば、血液、血漿、血清、尿、脳脊髄液(CSF)等)から供給されるすべての非封入核酸が含まれ得る。無細胞核酸には、ゲノムDNA、ミトコンドリアDNA、循環DNA、siRNA、miRNA、循環RNA(cRNA)、tRNA、rRNA、核小体低分子RNA(snoRNA)、Piwi相互作用RNA(piRNA)、長鎖非コードRNA(長鎖ncRNA)、ならびに/またはこれらのいずれかの断片を含む、DNA(cfDNA)、RNA(cfRNA)、およびそれらのハイブリッドが含まれる。無細胞核酸は、二本鎖、一本鎖、またはそれらのハイブリッドであり得る。無細胞核酸は、分泌または細胞死プロセス、例えば、細胞壊死、アポトーシス等を経て体液中に放出され得る。循環腫瘍DNA(ctDNA)等の一部の無細胞核酸は、がん細胞から体液中に放出される。その他は、健康な細胞から放出される。ctDNAは、非封入の腫瘍由来の断片化されたDNAであり得る。無細胞核酸は、1つまたは複数のエピジェネティック改変を有し得る、例えば、無細胞核酸は、アセチル化、5-メチル化および/またはヒドロキシメチル化され得る。
細胞の核酸:本明細書で使用される場合、「細胞の核酸」は、そのような核酸が所与の解析プロセスの一部として次いで(例えば、細胞溶解を介して)取り出される場合であっても、少なくとも、試料が対象から採取または収集された時点において、核酸が起源する1つまたは複数の細胞内に存在する核酸を意味する。
カバレッジ(coverage):本明細書で使用される場合、用語「カバレッジ」、「総分子カウント」または「総対立遺伝子カウント」は、互換的に使用される。これらは、所与の試料中の、特定のゲノム位置にあるDNA分子の総数を指す。
デオキシリボ核酸またはリボ核酸:本明細書で使用される場合、「デオキシリボ核酸」または「DNA」は、糖部分の2’-位置に水素基を有する天然または改変ヌクレオチドを指す。DNAは、典型的には、4つの型のヌクレオチド塩基;アデニン(A)、チミン(T)、シトシン(C)およびグアニン(G)を含むヌクレオチドの鎖を含む。本明細書で使用される場合、「リボ核酸」または「RNA」は、糖部分の2’-位置にヒドロキシル基を有する天然または改変ヌクレオチドを指す。RNAは、典型的には、4つの型のヌクレオチド塩基;A、ウラシル(U)、GおよびCを含むヌクレオチドの鎖を含む。本明細書で使用される場合、用語「ヌクレオチド」は、天然ヌクレオチドまたは改変ヌクレオチドを指す。ヌクレオチドのある特定の対は、相補的様式で互いに特異的に結合する(相補的塩基対合と呼ばれる)。DNAでは、アデニン(A)はチミン(T)と対合し、シトシン(C)はグアニン(G)と対合する。RNAでは、アデニン(A)はウラシル(U)と対合し、シトシン(C)はグアニン(G)と対合する。第1の核酸鎖が、第1の鎖中のヌクレオチドと相補的であるヌクレオチドから構成される第2の核酸鎖に結合する場合、これら2つの鎖は結合して、二本鎖を形成する。本明細書で使用される場合、「核酸シーケンシングデータ」、「核酸シーケンシング情報」、「配列情報」、「核酸配列」、「ヌクレオチド配列」、「ゲノム配列」、「遺伝子配列」または「断片配列」または「核酸シーケンシングリード」は、DNAまたはRNA等の核酸の分子(例えば、全ゲノム、全トランスクリプトーム、エクソーム、オリゴヌクレオチド、ポリヌクレオチドまたは断片)中のヌクレオチド塩基(例えば、アデニン、グアニン、シトシン、およびチミンまたはウラシル)の順序および/または正体を示す任意の情報またはデータを示す。本教示は、キャピラリー電気泳動、マイクロアレイ、ライゲーションに基づくシステム、ポリメラーゼに基づくシステム、ハイブリダイゼーションに基づくシステム、直接的または間接的なヌクレオチド同定システム、パイロシーケンシング、イオンまたはpHに基づく検出システム、および電子シグネチャーに基づくシステムが含まれるがこれらに限定されないすべての利用可能な種々の手法、プラットフォームまたは技術を使用して得られた配列情報を企図することを理解すべきである。
変異:本明細書で使用される場合、「変異」は、既知の参照配列からのバリエーションを指し、例えば、一塩基バリアント(SNV)、および挿入または欠失(インデル)等の変異を含む。変異は、生殖細胞系列変異または体細胞変異であり得る。一部の実施形態では、比較を目的とした参照配列は、試験試料を提供している対象の種の野生型ゲノム配列、典型的にはヒトゲノムである。
変異コーラー(mutation caller):本明細書で使用される場合、「変異コーラー」は、試験試料データ(例えば、対象から得られる配列情報)中の変異を同定するために使用されるアルゴリズム(典型的には、ソフトウェアで具現化されたまたはそれ以外の方法でコンピュータ実装されたもの)を意味する。
新生物:本明細書で使用される場合、用語「新生物」および「腫瘍」は、互換的に使用される。これらは、対象中の細胞の異常な成長を指す。新生物または腫瘍は、良性、潜在的に悪性または悪性であり得る。悪性腫瘍は、がんまたはがん性腫瘍と呼ばれる。
次世代シーケンシング:本明細書で使用される場合、「次世代シーケンシング」または「NGS」は、伝統的なSangerに基づくアプローチおよびキャピラリー電気泳動に基づくアプローチと比較して増加したスループットを有する、例えば、数十万の比較的小さい配列リードを一度に生成する能力を有するシーケンシング技術を指す。次世代シーケンシング手法の一部の例には、合成によるシーケンシング、ライゲーションによるシーケンシング、およびハイブリダイゼーションによるシーケンシングが含まれるがこれらに限定されない。一部の実施形態では、次世代シーケンシングは、単一の分子をシーケンシングすることが可能な機器の使用を含む。
核酸タグ:本明細書で使用される場合、「核酸タグ」は、異なる試料由来の核酸を区別するために使用される(例えば、試料インデックスを示す)、または異なる型の、もしくは異なる処理を受けた同じ試料中の異なる核酸分子を区別するために使用される(例えば、分子バーコードを示す)、短い核酸(例えば、長さが約500ヌクレオチド、約100ヌクレオチド、約50ヌクレオチドまたは約10ヌクレオチド未満)を指す。核酸タグは、既定の、固定された、非ランダムな、ランダムなまたは半ランダムなオリゴヌクレオチド配列を含む。そのような核酸タグは、異なる核酸分子または異なる核酸試料もしくはサブ試料を標識するために使用され得る。核酸タグは、一本鎖、二本鎖、または少なくとも部分的に二本鎖であり得る。核酸タグは、必要に応じて、同じ長さまたは変動した長さを有する。核酸タグはまた、1つもしくは複数の平滑末端を有する二本鎖分子を含み得、5’もしくは3’一本鎖領域(例えば、オーバーハング)を含み得、および/または所与の分子内の他の場所において1つもしくは複数の他の一本鎖領域を含み得る。核酸タグは、他の核酸(例えば、増幅および/またはシーケンシングされる試料核酸)の一方の末端または両方の末端に結合され得る。核酸タグは、情報、例えば、所与の核酸の起源となる試料、形態または処理を明らかにするために解読され得る。例えば、核酸タグは、異なる分子バーコードおよび/または試料インデックスを有する核酸を含む複数の試料のプールおよび/または並行処理を可能にするためにも使用され得、ここで、核酸は、核酸タグを検出する(例えば、読み取る)ことによって、次いでデコンボリューションされている。核酸タグは、識別子(例えば、分子識別子、試料識別子)とも呼ばれ得る。加えてまたはあるいは、核酸タグは、分子識別子(例えば、同じ試料またはサブ試料中の異なる分子間または異なる親分子のアンプリコン間を区別するため)として使用され得る。これは、例えば、所与の試料中の異なる核酸分子を一意的にタグ付けするステップ、またはそのような分子を非一意的にタグ付けするステップを含む。非一意的タグ付け適用の場合、異なる分子が、少なくとも1つの分子バーコードと組み合わせて、それらの内因性配列情報(例えば、それらが選択された参照ゲノムにマッピングされる場合には開始および/もしくは終止位置、配列の一方もしくは両方の末端のサブ配列、および/または配列の長さ)に基づいて区別され得るように、限定数のタグ(即ち、分子バーコード)が、各核酸分子をタグ付けするために使用され得る。典型的には、任意の2つの分子が同じ内因性配列情報(例えば、開始および/もしくは終止位置、配列の一方もしくは両方の末端のサブ配列、および/または長さ)を有し得、同じ分子バーコードもまた有する確率が低く(例えば、約10%未満、約5%未満、約1%未満または約0.1%未満の可能性)なるように、十分な数の異なる分子バーコードが使用される。
分配:本明細書で使用される場合、「分配」および「エピジェネティック分配」は、互換的に使用される。これは、核酸分子の特徴(例えば、エピジェネティック改変のレベル/程度)に基づいて核酸分子を分離または分画することを指す。分配は、分子の物理的分配であり得る。分配には、エピジェネティック改変(例えば、メチル化)のレベルに基づいて、核酸分子を群またはセットに分離することが関与し得る。例えば、核酸分子は、核酸分子のメチル化のレベルに基づいて分配され得る。一部の実施形態では、分配に使用される方法およびシステムは、その全体が参照により本明細書に組み込まれる、PCT特許出願番号PCT/US2017/068329において見出され得る。また、方法、システムおよび組成物は、PCT特許出願番号PCT/US2019/059217およびPCT/US2020/016120において見出され得、これらの各々は、その全体が参照により本明細書に組み込まれる。
分配されたセット:本明細書で使用される場合、「分配されたセット」は、結合剤への核酸分子の示差的結合親和性に基づいてセット/群に分配された核酸分子のセットを指す。結合剤は、エピジェネティック改変を有するヌクレオチドを含む核酸分子に優先的に結合する。例えば、エピジェネティック改変がメチル化である場合、結合剤は、メチル結合ドメイン(MBD)タンパク質であり得る。一部の実施形態では、分配されたセットは、特定のレベル/程度のエピジェネティック改変に属する核酸分子を含み得る。例えば、核酸分子は、以下の3つのセットに分配され得る:1つのセットは、高メチル化された分配されたセットまたは高度に分配されたセットと呼ばれ得る、高度にメチル化された核酸分子(または高メチル化核酸分子)であり、別のセットは、低メチル化された分配されたセットまたは低度に分配されたセットと呼ばれ得る、低度にメチル化された核酸分子(または低メチル化核酸分子)であり、第3のセットは、中等度にメチル化された分配されたセットまたは中等度の分配されたセットと呼ばれ得る、中等度メチル化核酸分子である。別の例では、核酸分子は、メチル化ヌクレオチドの数に基づいて分配され得る - 1つの分配されたセットは、9個のメチル化ヌクレオチドを有する核酸分子を有し得、別の分配されたセットは、非メチル化核酸分子を有し得る(即ち、0個のメチル化ヌクレオチド)。
ポリヌクレオチド:本明細書で使用される場合、「ポリヌクレオチド」、「核酸」、「核酸分子」または「オリゴヌクレオチド」は、ヌクレオシド間連結によって結合されたヌクレオシド(デオキシリボヌクレオシド、リボヌクレオシド、またはそれらのアナログを含む)の直鎖ポリマーを指す。典型的には、ポリヌクレオチドは、少なくとも3つのヌクレオシドを含む。オリゴヌクレオチドは、数個のモノマー単位、例えば、3~4個のモノマー単位から、数百のモノマー単位までのサイズ範囲である場合が多い。ポリヌクレオチドが、「ATGCCTG」等の文字の配列によって示される場合、ヌクレオチドは、左から右に5’→3’の順序であること、およびDNAの場合には、それ以外であることが記載されていない限り、「A」はデオキシアデノシンを示し、「C」はデオキシシチジンを示し、「G」はデオキシグアノシンを示し、「T」はデオキシチミジンを示すことが理解されよう。文字A、C、GおよびTは、当技術分野で標準的なように、塩基自体、ヌクレオシド、または塩基を含むヌクレオチドを指すために使用され得る。
参照配列:本明細書で使用される場合、「参照配列」は、実験的に決定された配列との比較を目的として使用される既知の配列を指す。例えば、既知の配列は、ゲノム全体、染色体、またはそれらの任意のセグメントであり得る。参照は、典型的には、少なくとも約20、少なくとも約50、少なくとも約100、少なくとも約200、少なくとも約250、少なくとも約300、少なくとも約350、少なくとも約400、少なくとも約450、少なくとも約500、少なくとも約1000、または1000よりも多くのヌクレオチドを含む。一部の実施形態では、参照配列は、ヒトゲノムであり得る。参照配列は、ゲノムもしくは染色体の単一の連続配列とアラインメントし得る、またはゲノムもしくは染色体の異なる領域とアラインメントする非連続セグメントを含み得る。参照配列の例には、例えば、ヒトゲノム、例えば、hG19およびhG38が含まれる。
試料:本明細書で使用される場合、「試料」は、本明細書に開示される方法および/またはシステムによって解析されることが可能なものを意味する。
シーケンシング:本明細書で使用される場合、「シーケンシング」は、生体分子、例えば、DNAまたはRNA等の核酸の配列(例えば、モノマー単位の正体および/または順序)を決定するために使用されるいくつかの技術のいずれかを指す。シーケンシング方法の例には、標的化シーケンシング、単分子リアルタイムシーケンシング、エクソンまたはエクソームシーケンシング、イントロンシーケンシング、電子顕微鏡に基づくシーケンシング、パネルシーケンシング、トランジスタ媒介シーケンシング、ダイレクトシーケンシング、ランダムショットガンシーケンシング、Sangerジデオキシターミネーションシーケンシング、全ゲノムシーケンシング、ハイブリダイゼーションによるシーケンシング、パイロシーケンシング、キャピラリー電気泳動、ゲル電気泳動、二重鎖シーケンシング、サイクルシーケンシング、一塩基伸長シーケンシング、固相シーケンシング、ハイスループットシーケンシング、大規模並列シグネチャーシーケンシング、エマルジョンPCR、より低い変性温度での共増幅-PCR(COLD-PCR)、多重PCR、可逆的ダイターミネーターによるシーケンシング、ペアードエンドシーケンシング、ニアターム(near-term)シーケンシング、エキソヌクレアーゼシーケンシング、ライゲーションによるシーケンシング、ショートリードシーケンシング、単分子シーケンシング、合成によるシーケンシング、リアルタイムシーケンシング、リバース-ターミネーターシーケンシング、ナノポアシーケンシング、454シーケンシング、Solexa Genome Analyzerシーケンシング、SOLiD(商標)シーケンシング、MS-PETシーケンシング、およびそれらの組合せが含まれるがこれらに限定されない。一部の実施形態では、シーケンシングは、遺伝子解析装置、例えば、多くの他のものの中で、Illumina,Inc.、Pacific Biosciences,Inc.またはApplied Biosystems/Thermo Fisher Scientificから市販されている遺伝子解析装置等によって実施され得る。
配列情報:本明細書で使用される場合、「配列情報」は、核酸分子の文脈において、その分子中のモノマー単位(例えば、ヌクレオチド等)の順序および/または正体を意味し、参照配列への核酸分子マッピングの開始ゲノム座標および終止ゲノム座標もまた含み得る。
体細胞変異:本明細書で使用される場合、用語「体細胞変異」または「体細胞バリエーション」は、互換的に使用される。これらは、受胎後に生じるゲノム中の変異を指す。体細胞変異は、胚細胞を除く身体の任意の細胞において生じ得、したがって、子孫には受け継がれない。
対象:本明細書で使用される場合、「対象」は、動物、例えば、哺乳動物種(例えば、ヒト)もしくはトリ(例えば、鳥類)種、または他の生物、例えば植物を指す。より具体的には、対象は、脊椎動物、例えば、哺乳動物、例えば、マウス、霊長類、サルまたはヒトであり得る。動物には、家畜(例えば、生産牛(production cattle)、乳牛、家禽、ウマ、ブタ等)、スポーツ動物、およびコンパニオン動物(例えば、ペットまたは支援動物)が含まれる。対象は、健康な個体、疾患もしくはその疾患の素因を有するもしくは有することが疑われる個体、または治療を必要とするもしくは治療を必要とすることが疑われる個体であり得る。用語「個体」または「患者」は、「対象」と互換性がある意図である。
例えば、対象は、がんを有すると診断された個体、がん治療を受けることになっている個体、および/または少なくとも1つのがん治療を受けたことがある個体であり得る。対象は、がんの寛解状態にあり得る。別の例として、対象は、自己免疫疾患を有すると診断された個体であり得る。別の例として、対象は、疾患、例えば、がん、自己免疫疾患を有すると診断されていてもよいまたはそれを有することが疑われていてもよい、妊娠しているまたは妊娠する計画を立てている雌性個体であり得る。
詳細な説明
I.概観
ゲノム/エピジェネティック分配に基づく方法は、1つのアッセイでの多検体同時シグナル検出を可能にし得る。しかし、分配に基づく検体の検出されたシグナルは、低い分解能を有し得、シグナルの感度および特異度を変更させる可変性のアッセイ条件に供される。プロセスにおける無細胞核酸(元の材料)またはデータの喪失を低減させつつ、リキッドバイオプシーアッセイの感度を増加させることが望ましい。本明細書に記載されるように1つまたは複数の対照を使用することによってアッセイ可変性について対照を取ること(controlling)によって、異なる実験にわたって結果を比較する能力を提供することもまた望ましい。
I.概観
ゲノム/エピジェネティック分配に基づく方法は、1つのアッセイでの多検体同時シグナル検出を可能にし得る。しかし、分配に基づく検体の検出されたシグナルは、低い分解能を有し得、シグナルの感度および特異度を変更させる可変性のアッセイ条件に供される。プロセスにおける無細胞核酸(元の材料)またはデータの喪失を低減させつつ、リキッドバイオプシーアッセイの感度を増加させることが望ましい。本明細書に記載されるように1つまたは複数の対照を使用することによってアッセイ可変性について対照を取ること(controlling)によって、異なる実験にわたって結果を比較する能力を提供することもまた望ましい。
本開示は、分配アッセイにおいてポリヌクレオチドを解析するための方法、組成物およびシステムを提供する。本発明は、担体核酸分子のセットを使用することを含む。一部の実施形態では、担体核酸分子の使用は、メチル化核酸分子に選択的に結合する捕捉剤への非メチル化核酸分子の非特異的結合を防止することによって、メチル化核酸分子の分配の特異性を増加させることができる。
核酸分子、例えば、無細胞ポリヌクレオチドは、メチル化等のエピジェネティック特徴に基づいて異なり得る。核酸は、異なるヌクレオチド配列、例えば、特異的遺伝子または遺伝子座を有し得る。特徴は、程度に関して異なり得る。例えば、DNA分子は、エピジェネティック改変の程度が異なり得る。改変の程度は、分子が供されたいくつかの改変事象、例えば、メチル化基の数(メチル化の程度)または他のエピジェネティック変化の数を指し得る。例えば、DNAは、低メチル化または高メチル化され得る。
核酸分子の特徴は、様々な化学的改変(即ち、エピジェネティック改変)が含まれ得る改変であり得る。化学的改変の非限定的な例には、DNAメチル化を含む共有結合的DNA改変が含まれ得るがこれらに限定されない。一部の実施形態では、DNAメチル化は、CpG部位(シトシン-リン酸-グアニン部位(即ち、核酸配列の5’→3’方向でのシトシンとその後のグアニン))におけるシトシンへのメチル基の付加を含む。一部の実施形態では、DNAメチル化は、アデニンへのメチル基の付加、例えば、N6-メチルアデニンを含む。一部の実施形態では、DNAメチル化は、5-メチル化(シトシンの6員環中の5位における炭素の改変)である。一部の実施形態では、5-メチル化は、5-メチルシトシン(m5c)を生成する、シトシンの5C位へのメチル基の付加を含む。一部の実施形態では、メチル化は、m5cの誘導体を含む。m5cの誘導体には、5-ヒドロキシメチルシトシン(5-hmC)、5-ホルミルシトシン(5-fC)および5-カルボキシルシトシン(caryboxylcytosine)(5-caC)が含まれるがこれらに限定されない。一部の実施形態では、DNAメチル化は、3Cメチル化(シトシンの6員環中の3位における炭素の改変)である。一部の実施形態では、3Cメチル化は、3-メチルシトシン(3mC)を生成する、シトシンの3C位へのメチル基の付加を含む。メチル化は、非CpG部位においても生じ得、例えば、メチル化は、CpA、CpTまたはCpC部位において生じ得る。DNAメチル化は、メチル化DNA領域の活性を変化させることができる。例えば、プロモーター領域中のDNAがメチル化されている場合、遺伝子の転写は抑制され得る。DNAメチル化は、正常な発生にとって重要であり、メチル化における異常は、エピジェネティック調節を破壊し得る。エピジェネティック調節における破壊、例えば抑制は、がん等の疾患を引き起こし得る。DNAにおけるプロモーターメチル化は、がんを示し得る。
CpGダイアドは、二本鎖DNA分子のセンス鎖上のジヌクレオチドCpG(シトシン-リン酸-グアニン、即ち、核酸配列の5’→3’方向でのシトシンとその後のグアニン)と、アンチセンス鎖上のその相補的CpGとである。CpGダイアドは、完全にメチル化されているか半メチル化されている(一方の鎖のみがメチル化されている)かのいずれかであり得る。
CpGジヌクレオチドは、正常なヒトゲノムでは過小出現し、CpGジヌクレオチド配列の大多数は、転写的に不活性であり(例えば、染色体の動原体周囲部分中のおよび反復エレメント中のDNAヘテロクロマチン領域)、メチル化されている。しかし、多くのCpGアイランドは、特に転写開始部位(TSS)周囲では、そのようなメチル化から保護される。
がんは、エピジェネティックバリエーション、例えばメチル化によって示され得る。がんにおけるメチル化変化の例には、正常な成長制御、DNA修復、細胞周期調節および/または細胞分化に関与する遺伝子のTSSにおける、CpGアイランドにおけるDNAメチル化の局所的増加が含まれる。この高メチル化は、関与する遺伝子の転写能の異常な喪失に関連し得、変更された遺伝子発現の原因として点変異および欠失と少なくとも同頻度で生じる。DNAメチル化プロファイリングは、発生の間に変更されるか、または疾患、例えばがんもしくは任意のがん関連疾患により摂動を受けるゲノムの、異なる程度のメチル化(「示差的にメチル化された領域」または「DMR」)を有する領域を検出するために使用され得る。
メチル化プロファイリングは、ゲノムの異なる領域にわたってメチル化パターンを決定することを含み得る。例えば、メチル化の程度(例えば、分子あたりのメチル化ヌクレオチドの相対的な数)およびシーケンシングに基づいて分子を分配した後、異なる画分中の分子の配列は、参照ゲノムにマッピングされ得る。これは、他の領域と比較してより高度にメチル化されたか、またはあまり高度にメチル化されていない、ゲノムの領域を示し得る。このように、ゲノム領域は、個々の分子とは対照的に、メチル化の程度が異なり得る。メチル化に加えて、他のエピジェネティック改変を同様にプロファイリングしてもよい。
試料中の核酸分子は、1つまたは複数の特徴に基づいて分画または分配され得る。試料中の核酸分子の分配は、まれなシグナルを増加させることができる。例えば、高メチル化DNA中に存在するが、低メチル化DNA中には存在が少ない(または存在しない)遺伝的バリエーションは、試料を高メチル化核酸分子および低メチル化核酸分子に分配することによってより容易に検出することができる。試料の複数の分画を解析することによって、単一の分子の多次元解析を実施することができ、したがって、より高い感度を達成することができる。分配は、ゲノム特徴の存在または非存在に基づいて核酸分子をサブセットまたは群に物理的に分配することを含み得る。分画は、ゲノム特徴、例えばエピジェネティック改変が存在する程度に基づいて核酸分子を画分群に物理的に分配することを含み得る。試料は、示差的遺伝子発現または疾患状態を示す特徴に基づいて、1つまたは複数の群画分に分画または分配され得る。試料は、核酸、例えば、無細胞DNA(「cfDNA」)、非cfDNA、腫瘍DNA、循環腫瘍DNA(「ctDNA」)および無細胞核酸(「cfNA」)の解析の間に正常状態と罹患状態との間でのシグナルにおける差異を提供する特徴またはそれらの組合せに基づいて分画され得る。
本開示は、腫瘍の存在または非存在を検出するために分配アッセイを使用してポリヌクレオチドを解析するための方法、組成物およびシステムを提供する。これらの方法は、担体核酸分子を対象から得られたポリヌクレオチド試料に添加するステップを含み得る。一部の実施形態では、担体核酸分子の使用は、メチル結合タンパク質を使用するポリヌクレオチドの分配を改善するのを助ける。メチル結合ドメインタンパク質は、非メチル化分子に対して低い親和性を有する。したがって、対象から得られたDNAと共にインキュベートされると、メチル化シトシンを含まない分子が意図せずに捕捉され得る。これは、メチル化分子を非メチル化分子から効率的に分離する能力を低減させる。したがって、担体核酸分子をアッセイ中に含めることによって、担体核酸分子は、メチル結合タンパク質に結合し、ポリヌクレオチド試料由来の非メチル化分子は、メチル結合タンパク質に結合することができなくなり、こうしてメチル化分子の分配の特異性が改善される。一部の実施形態では、担体核酸分子は、次世代シーケンシングのための分子のライブラリ調製を改善する。
一部の実施形態では、担体核酸分子は、ポリヌクレオチド試料に添加され、分子のメチル化レベルに基づいて異なる分配されたセットに分配され、その後、各画分中の核酸分子がシーケンシング(単独でまたは一緒に)および解析される。一部の実施形態では、核酸の画分は、特異的標的ゲノム領域について富化される。一部の実施形態では、核酸分子の画分は、富化するステップの前および/または後に増幅される。一部の実施形態では、富化は、分配されたセットが、分子バーコードで示差的にタグ付けされ、示差的にタグ付けされた分配されたセットの混合物へと再度合わされた後に、実施され得る。これらの方法は、様々な適用、例えば、疾患の予後判定、診断において、および/またはそのモニタリングのために使用され得る。一部の実施形態では、疾患はがんである。
したがって、一態様では、本開示は、対象における腫瘍の存在または非存在を検出する方法であって、(i)対象からポリヌクレオチド試料を得るステップ;(ii)担体核酸分子のセットをポリヌクレオチド試料に添加して、第1の試料を生成するステップであって、担体核酸分子のセットが、(a)非メチル化担体核酸分子の少なくとも1つのサブセット;および/または(b)メチル化担体核酸分子の少なくとも1つのサブセットを含み、非メチル化担体核酸分子が、メチル化ヌクレオチドを含まず、メチル化担体核酸分子が、1つまたは複数のメチル化ヌクレオチドを含む、ステップ;(iii)第1の試料を、メチル化ポリヌクレオチドに選択的に結合する捕捉剤を使用して、少なくとも2つの分配されたセットに分配し、それにより、分配された試料を生成するステップ;(iv)分配された試料の少なくとも一部を処理して、処理された試料を生成するステップであって、この処理は、以下:(a)タグ付けするステップ、(b)増幅するステップ、および(c)目的の特異的領域についてDNA分子を富化するステップのうち少なくとも1つを含む、ステップ;(v)処理された試料の少なくとも一部をシーケンシングして、シーケンシングリードのセットを生成するステップ;および(vi)シーケンシングリードのセットの少なくとも一部を解析して、腫瘍の存在または非存在を検出するステップを含む方法を提供する。
別の態様では、本開示は、対象における腫瘍の存在または非存在を検出する方法であって、(i)対象からポリヌクレオチド試料を得るステップ;(ii)担体核酸分子のセットをポリヌクレオチド試料に添加して、第1の試料を生成するステップであって、担体核酸分子のセットが、(a)非メチル化担体核酸分子の少なくとも1つのサブセット;および/または(b)メチル化担体核酸分子の少なくとも1つのサブセットを含み、担体核酸分子の少なくとも一方の末端が、ライゲーションを防止するように改変され、非メチル化担体核酸分子が、メチル化ヌクレオチドを含まず、メチル化担体核酸分子が、1つまたは複数のメチル化ヌクレオチドを含む、ステップ;(iii)第1の試料を、メチル化ポリヌクレオチドに選択的に結合する捕捉剤を使用して、少なくとも2つの分配されたセットに分配し、それにより、分配された試料を生成するステップ;(iv)分配された試料の少なくとも一部を処理して、処理された試料を生成するステップであって、この処理は、以下:(a)タグ付けするステップ、(b)増幅するステップ、および(c)目的の特異的領域についてDNA分子を富化するステップのうち少なくとも1つを含む、ステップ;(v)処理された試料の少なくとも一部をシーケンシングして、シーケンシングリードのセットを生成するステップ;および(vi)シーケンシングリードのセットの少なくとも一部を解析して、腫瘍の存在または非存在を検出するステップを含む方法を提供する。
図1は、対象における腫瘍の存在または非存在を検出するための方法100の例示的な実施形態を示す。102では、対象由来のポリヌクレオチド試料が得られる。一部の実施形態では、ポリヌクレオチド試料は、対象の組織、血液、血漿、血清、尿、唾液、糞便、脳脊髄液、頬内スワブまたは胸腔穿刺から得られる。一部の実施形態では、ポリヌクレオチド試料は、組織から得られる。一部の実施形態では、組織から得られたポリヌクレオチド試料は、酵素的手段/方法または機械的手段/方法のいずれかによって断片化される。一部の実施形態では、フラグメンターゼ(fragmentase)酵素が、組織から得られたDNAを断片化するために使用され得る。一部の実施形態では、ポリヌクレオチド試料は、血液から得られる。一部の実施形態では、血液から得られたポリヌクレオチド試料は、無細胞DNA試料である。一部の実施形態では、ポリヌクレオチド試料は、無細胞DNA試料である。
104では、担体核酸分子のセットがポリヌクレオチド試料に添加されて、第1の試料が生成される。一部の実施形態では、担体核酸分子のセットは、非メチル化担体核酸分子の少なくとも1つのサブセットおよび/またはメチル化担体核酸分子の少なくとも1つのサブセットを含み、非メチル化担体核酸分子は、メチル化ヌクレオチドを含まず、メチル化担体核酸分子は、1つまたは複数のメチル化ヌクレオチドを含む。一部の実施形態では、担体核酸分子の少なくとも一方の末端は、ライゲーションを防止するように改変される。一部の実施形態では、担体核酸分子の少なくとも一方の末端は、C3(プロピル基)スペーサーを含む。一部の実施形態では、担体核酸分子の少なくとも一方の末端は、ジデオキシヌクレオチドを含む。一部の実施形態では、担体核酸分子の少なくとも一方の末端は、ヒドロキシル基が求核試薬として作用することを阻止する任意の化学的改変を含む。一部の実施形態では、担体核酸分子の5’末端は、以下の改変:(i)反転(5’-5’)-ジデオキシチミン、ジデオキシシトシン、ジデオキシグアニンまたはジデオキシアデニン;(ii)プロピル基、または(iii)例えば、ベンジル、エチルもしくはメチルであるがこれらに限定されない他の有機官能基のうち少なくとも1つを含む。一部の実施形態では、担体核酸分子の3’末端は、以下の改変:(i)酵素的に、または合成の間に付加され得る任意のジデオキシ塩基、例えば、ジデオキシチミン、ジデオキシシトシン、ジデオキシグアニンまたはジデオキシアデニン;(ii)プロピル基、または(iii)例えば、ベンジル、エチルもしくはメチルであるがこれらに限定されない他の有機官能基のうち少なくとも1つを含む。
一部の実施形態では、1つまたは複数のメチル化ヌクレオチドは、以下:(i)5-メチルシトシン、(ii)6-メチルアデニン、(iii)ヒドロキシメチルシトシン、(iv)メチルウラシル、または(v)任意の他のメチル化ヌクレオチドのうち少なくとも1つである。一部の実施形態では、メチル化担体核酸分子は、1、2、3、4、5、6、7、8、9、10、12、14、15、16、17、18、19または少なくとも20個のメチル化ヌクレオチドを有し得る。一部の実施形態では、担体核酸分子は、長さが25bpと325bpとの間であり得る。一部の実施形態では、1つのサブセットの非メチル化担体核酸分子は、別のサブセットの非メチル化担体核酸分子と同じ配列を有し得る。一部の実施形態では、1つのサブセットのメチル化担体核酸分子は、別のサブセットのメチル化担体核酸分子と同じ配列を有し得る。一部の実施形態では、1つのサブセット中の非メチル化担体核酸分子の配列は、他のサブセット(複数可)中の非メチル化担体核酸分子の配列とは異なる。一部の実施形態では、1つのサブセット中のメチル化担体核酸分子の配列は、他のサブセット(複数可)中のメチル化担体核酸分子の配列とは異なる。
一部の実施形態では、非メチル化担体核酸分子および/またはメチル化担体核酸分子の1つまたは複数のサブセットは、ヌクレオチド配列中に1つまたは複数のCpGジヌクレオチドを有し得る。一部の実施形態では、メチル化担体核酸分子中の1つまたは複数のCpGジヌクレオチドは、1つまたは複数のメチル化シトシンを有し得る。
一部の実施形態では、非メチル化担体核酸分子の1つのサブセット中の1つまたは複数のCpGジヌクレオチドの位置は、他のサブセット(複数可)中の1つまたは複数のCpGジヌクレオチドの位置とは異なる。一部の実施形態では、非メチル化担体核酸分子の1つのサブセット中のCpGジヌクレオチドの数は、他のサブセット(複数可)中のCpGジヌクレオチドの数とは異なる。一部の実施形態では、非メチル化担体核酸分子の1つのサブセット中の1つまたは複数のCpGジヌクレオチドに隣接するヌクレオチドの配列は、他のサブセット(複数可)中の1つまたは複数のCpGジヌクレオチドに隣接するヌクレオチドの配列とは異なる。一部の実施形態では、非メチル化担体核酸分子の1つのサブセット中の非メチル化担体核酸分子の長さは、他のサブセット(複数可)中の非メチル化担体核酸分子の長さとは異なる。
一部の実施形態では、メチル化担体核酸分子の1つのサブセット中の1つまたは複数のメチル化ヌクレオチドの位置(即ち、分子の末端に対する)は、他のサブセット(複数可)中の1つまたは複数のメチル化ヌクレオチドの位置とは異なる。一部の実施形態では、メチル化担体核酸分子の1つのサブセット中のメチル化ヌクレオチドの数は、他のサブセット(複数可)中のメチル化ヌクレオチドの数とは異なる。一部の実施形態では、非メチル化担体核酸分子の1つのサブセット中の1つまたは複数のメチル化ヌクレオチドに隣接するヌクレオチドの配列は、他のサブセット(複数可)中の1つまたは複数のメチル化ヌクレオチドに隣接するヌクレオチドの配列とは異なる。一部の実施形態では、メチル化担体核酸分子の1つのサブセット中のメチル化担体核酸分子の長さは、他のサブセット(複数可)中のメチル化担体核酸分子の長さとは異なる。一部の実施形態では、担体核酸分子は、ウラシルヌクレオシドを含む。これらの実施形態では、この方法は、増幅ステップの前に、ウラシルデグリコシラーゼおよびDNAグリコシラーゼ-リアーゼ(例えば、エンドヌクレアーゼVIII)を添加するステップをさらに含む。
一部の実施形態では、メチル化担体核酸分子の、非メチル化担体核酸分子に対する量は、約0:1、0.1:99.9、0.5:99.5、0.75:99.25、1:99、1:95、1:90、1:80、1:75、1:70、1:60、1:50、1:40、1:30、1:25、1:20、1:10、1:5、1:2、1:1.15、1:1、1.15:1、2:1、5:1、10:1、20:1、25:1、30:1、40:1、50:1、60:1、70:1、75:1、80:1、90:1、95:1、99:1、99.25:0.75、99.5:0.5、99.9:0.1または1:0の比である。一部の実施形態では、ポリヌクレオチド試料の、担体核酸分子のセットに対する量は、約1:0.1;1:0.2、1:0.3、1:4、1:0.5、1:6、1:7、1:8、1:0.9、1:1、1:1、1:2、1:3、1:4、1:5、1:6、1:7、1:8、1:9、1:10の比、1:20、1:30、1:40、1:50、1:60、1:70、1:80、1:90、1:100、1:200、1:300;1:400、1:500、1:600、1:700、1:800、1:900、1:1000、1:5000、1:10,000、1:100,000、1:500,000、1:106、1:107、1:108または1:109である。一部の実施形態では、量は、質量を単位とする。一部の実施形態では、量は、モル濃度を単位とする。一部の実施形態では、ポリヌクレオチド試料は、最大1μgである。一部の実施形態では、ポリヌクレオチド試料は、最大200ngである。一部の実施形態では、ポリヌクレオチド試料は、最大150ngである。一部の実施形態では、ポリヌクレオチド試料は、最大100ngである。一部の実施形態では、担体核酸分子のセットは、ポリヌクレオチド試料と担体核酸分子のセットとの総量が約175ng、200ng、225ng、250ng、275ng、300ng、350ng、400ng、450ng、500ng、600ng、700ng、750ng、800ng、900ng、1μg、1.1μg、1.25μgまたは1.5μgになるように十分な量で添加される。
一部の実施形態では、担体核酸分子の配列は、以下:(i)ウイルスゲノム由来の配列、(ii)細菌ゲノム由来の配列、(iii)ラムダゲノム由来の配列、または(iv)非ヒトゲノム由来の配列のうち1つから選択される。一部の実施形態では、担体核酸分子は、合成DNAである。一部の実施形態では、担体核酸分子は、ウラシルヌクレオシドを含む。一部の実施形態では、担体DNA分子は、PCRによって生成され得る。一部の実施形態では、PCRによって生成された担体核酸分子は、担体核酸分子中の1つまたは複数のヌクレオチドにメチル基を組み込むために、メチルトランスフェラーゼによる処置によってさらに改変され得る。一部の実施形態では、担体核酸分子は、アダプターへの担体核酸分子のライゲーションを防止するように改変ヌクレオシドを組み込むために、ポリメラーゼで末端標識され得る。一部の実施形態では、担体核酸分子は、天然に存在しないヌクレオシド誘導体を含む。一部の実施形態では、担体核酸分子は、ビオチンまたはフルオロフォアで標識され得る。
106では、第1の試料の少なくとも一部は、メチル化ポリヌクレオチドに選択的に結合する捕捉剤を使用して、少なくとも2つの分配されたセットに分配または分画され、それにより、分配された試料を生成する。一部の実施形態では、分配は、結合剤への核酸分子の示差的結合親和性に基づく。結合剤の例には、メチル結合ドメイン(MBD)およびメチル結合タンパク質(MBP)が含まれるがこれらに限定されない。本明細書で企図されるMBPの例には、以下が含まれるがこれらに限定されない:
(a)MeCP2は、未改変のシトシンよりも5-メチル-シトシンに優先的に結合するタンパク質である;
(b)RPL26、PRP8およびDNAミスマッチ修復タンパク質MHS6は、未改変のシトシンよりも5-ヒドロキシメチル-シトシンに優先的に結合する;
(c)FOXK1、FOXK2、FOXP1、FOXP4およびFOXI3は、未改変のシトシンよりも5-ホルミル-シトシンに好適に結合する(Iurlaro et al., Genome Biol. 14, R119 (2013));および
(d)1つまたは複数のメチル化ヌクレオチド塩基に対して特異的な抗体。
(a)MeCP2は、未改変のシトシンよりも5-メチル-シトシンに優先的に結合するタンパク質である;
(b)RPL26、PRP8およびDNAミスマッチ修復タンパク質MHS6は、未改変のシトシンよりも5-ヒドロキシメチル-シトシンに優先的に結合する;
(c)FOXK1、FOXK2、FOXP1、FOXP4およびFOXI3は、未改変のシトシンよりも5-ホルミル-シトシンに好適に結合する(Iurlaro et al., Genome Biol. 14, R119 (2013));および
(d)1つまたは複数のメチル化ヌクレオチド塩基に対して特異的な抗体。
一部の親和性剤および改変に関して、作用剤への結合は、核酸が改変(例えば、メチル化)を有するか否かに応じて本質的に全か無かの様式で起こり得るが、分離は程度の問題であり得る。そのような実施形態では、改変で過剰出現する核酸は、改変で過少出現する核酸より大きい程度に作用剤に結合する。あるいは、改変を有する核酸は、全か無かの様式で結合し得る。しかし、様々なレベルの改変が結合剤から逐次的に溶出され得る。
例えば、一部の実施形態では、分配は、バイナリであるか、またはメチル化の程度/レベルに基づき得る。例えばすべてのメチル化分子は、メチル結合ドメインタンパク質(例えば、MethylMinerメチル化DNA富化キット(ThermoFisher Scientific))を使用して非メチル化分子から分配することができる。次いで、追加の分配は、メチル結合ドメインおよび結合した断片を含む溶液中の塩濃度を調節することによって、異なるレベルのメチル化を有する断片を溶出するステップを伴い得る。塩濃度が増加すると、より大きいメチル化レベルを有する分子が溶出される。
一部の実施形態では、分配は、メチル化ヌクレオチドを含む核酸分子に優先的に結合する結合剤への核酸分子の示差的結合親和性に基づいて核酸分子を分配するステップを含む。
一部の実施形態では、分配されたセットは、異なる程度の改変(改変の過剰出現または過少出現)を有する核酸の代表である。過剰出現および過少出現は、集団における分子あたりのメチル化ヌクレオチドの数の中央値と比較した、核酸が有するメチル化ヌクレオチドの数によって定義することができる。例えば、試料中の核酸分子中の5-メチルシトシンヌクレオチドの数の中央値が2である場合、2つよりも多くの5-メチルシトシン残基を含む核酸分子はこの改変では過剰出現され、1またはゼロ個の5-メチルシトシン残基を有する核酸は過少出現される。親和性分離の効果は、結合相で改変において過剰出現される核酸および非結合相(すなわち、溶液中)で改変において過少出現される核酸を分配することである。結合相における核酸は、その後の処理の前に溶出させることができる。
MethylMinerメチル化DNA富化キット(ThermoFisher Scientific)を使用する場合、様々なレベルのメチル化を、逐次的溶出を使用して分配することができる。例えば、低メチル化画分(メチル化なし)を、核酸集団に、磁気ビーズに結合したキットからのMBDを接触させることによってメチル化画分から分離することができる。ビーズを使用して、非メチル化核酸からメチル化核酸を分離する。次いで、1つまたは複数の溶出ステップを逐次的に実施して、異なるレベルのメチル化を有する核酸を溶出する。例えば、メチル化核酸の第1のセットを、約150mMもしくは約160mMまたはそれよりも高い塩濃度、例えば、少なくとも150mM、200mM、300mM、400mM、500mM、600mM、700mM、800mM、900mM、1000mMまたは2000mMで溶出することができる。そのようなメチル化核酸を溶出後、磁気分離を再度使用して、高レベルのメチル化核酸を低レベルのメチル化を有する核酸から分離する。溶出および磁気分離ステップを繰り返して、低メチル化画分(メチル化なしの代表)、中等度メチル化画分(低レベルのメチル化の代表)、および高メチル化画分(高レベルのメチル化の代表)等の様々な画分を作製することができる。
一部の方法では、親和性分離のために使用した作用剤に結合した核酸を、洗浄ステップに供する。洗浄ステップは、親和性剤に弱く結合した核酸を洗い流す。そのような核酸を、平均値または中央値に近い程度まで改変を有する核酸(すなわち、固相に結合したままである核酸と、試料に作用剤を最初に接触させた場合に固相に結合しない核酸との間の中等度)において富化することができる。親和性分離は、異なる程度の改変を有する核酸の少なくとも2つ、時に3つまたはそれよりも多くの画分をもたらす。核酸分子の分配は、分配された核酸分子のシーケンシングによってまたはデジタル液滴PCR(ddPCR)によってまたは定量的PCR(qPCR)によって解析することができる。一部の実施形態では、分配するステップの前に担体核酸分子を添加する代わりに、担体核酸分子は、洗浄ステップの間(即ち、中等度の分配されたセットを収集している間)または溶出ステップの間(即ち、高度に分配されたセットを収集している間)のいずれかに添加することができる。
108では、分配された試料の少なくとも一部が処理されて、処理された試料が生成される。処理するステップは、タグ付けするステップ;増幅するステップおよび/または目的の特異的領域について分子を富化するステップを含む。一部の実施形態では、増幅の前に、少なくとも2つの分配されたセットの各々は、示差的にタグ付けされる。次いで、タグ付けされた分配されたセットは、増幅の前に共にプールされる。分配されたセットの示差的タグ付けは、特定の分配されたセットに属する核酸分子の追跡を助ける。タグは通常、アダプターの成分として提供される。異なる分配されたセット中の核酸分子は、1つの分配されたセットのメンバーを別の分配されたセットのメンバーから区別することができる異なるタグを受ける。同じ画分セットの核酸分子に連結されたタグは、互いに同じまたは異なり得る。しかし、互いに異なる場合、タグは、それらが結合される分子を、特定の分配されたセットのものであると同定するために、それらの配列の一部を共通して有し得る。例えば、第1の試料の分子が2つの分配されたセット - P1およびP2 - に分配される場合、P1中の分子は、A1、A2、A3等でタグ付けされ得、P2中の分子は、B1、B2、B3等でタグ付けされ得る。そのようなタグ付けシステムは、分配されたセットの区別および分配されたセット内の分子間の区別を可能にする。一部の実施形態では、タグ(即ち、分子バーコード)は、アダプターの一部であり、アダプターは、ユニバーサルプライマー結合部位を含む。タグを含むアダプターは、ライゲーションを介して結合される。一部の実施形態では、担体核酸分子の末端は、ライゲーションを防止するように改変される。これらの実施形態では、アダプター(これは、タグ、即ち、分子バーコードを含む)は、担体核酸分子には結合されない。したがって、担体核酸分子は、ユニバーサルプライマーを使用して増幅することができない。タグ付けの後、これらの分子は、アダプター(分子にライゲーションされている)中に存在するプライマー結合領域に結合するプライマーを使用して増幅される。この増幅では、対象から得られたポリヌクレオチドのみが増幅され、担体核酸分子は増幅されない。増幅の後、分子は、目的の特異的領域について富化される。
110では、処理された試料の少なくとも一部がシーケンシングされて、シーケンシングリードのセットが生成される。一部の実施形態では、少なくとも2つの分配されたセット由来の処理された試料の少なくとも一部がシーケンシングされて、シーケンシングリードのセットが生成される。得られた配列情報は、核酸分子およびポリヌクレオチドに結合されたタグ(即ち、分子バーコード)の配列を含む。ポリヌクレオチドに結合されたタグ(即ち、分子バーコード)の配列から、タグ(即ち、分子バーコード)を、ポリヌクレオチドの分配されたセットと相関させることができる。配列情報は、ポリヌクレオチド(対象から得られた)およびその対応する分配されたセットを同定するために使用される。112では、シーケンシングリードのセットの少なくとも一部が、腫瘍の存在または非存在を検出するために解析される。一部の実施形態では、解析ステップは、分子のメチル化状態を決定するステップを含む。例えば、目的の特異的領域は、健康な個体ではメチル化されておらず、悪性腫瘍を有する個体ではメチル化されていることが、以前に決定されている。解析ステップは、分子が目的のこれらの領域においてメチル化されているか否かを決定するステップを含む。これは、分子、および分子が分配される分配されたセット中のCpG残基の数に基づいて決定され、これは次いで、腫瘍の存在または非存在を検出するために使用される。
II.担体核酸分子
担体核酸分子は、分配アッセイにおいてポリヌクレオチドを解析する際に使用される。一部の実施形態では、担体核酸分子の使用は、メチル結合タンパク質を使用するメチル化ポリヌクレオチドの分配の特異性の増加を助ける。メチル結合ドメインタンパク質は、非メチル化分子に対して低い親和性を有する。したがって、対象から得られたDNAと共にインキュベートされると、メチル化シトシンを含まない分子が意図せずに捕捉され得る。この不完全な特異性は、メチル化分子を非メチル化分子から効率的に分離する能力を低減させる。したがって、担体核酸分子をアッセイ中に含めることによって、担体核酸分子は、メチル結合タンパク質に結合し得、ポリヌクレオチド試料由来の非メチル化分子は、メチル結合タンパク質に結合することができなくなり、こうしてメチル化分子の分配の特異性が改善される。同様に、担体核酸分子は、他のメチル化核酸特異的結合試薬、例えば、抗体、抗体誘導体分子等の分配特異性を改善するために使用され得る。一部の実施形態では、担体核酸分子は、次世代シーケンシングのための分子のライブラリ調製を改善する。
担体核酸分子は、分配アッセイにおいてポリヌクレオチドを解析する際に使用される。一部の実施形態では、担体核酸分子の使用は、メチル結合タンパク質を使用するメチル化ポリヌクレオチドの分配の特異性の増加を助ける。メチル結合ドメインタンパク質は、非メチル化分子に対して低い親和性を有する。したがって、対象から得られたDNAと共にインキュベートされると、メチル化シトシンを含まない分子が意図せずに捕捉され得る。この不完全な特異性は、メチル化分子を非メチル化分子から効率的に分離する能力を低減させる。したがって、担体核酸分子をアッセイ中に含めることによって、担体核酸分子は、メチル結合タンパク質に結合し得、ポリヌクレオチド試料由来の非メチル化分子は、メチル結合タンパク質に結合することができなくなり、こうしてメチル化分子の分配の特異性が改善される。同様に、担体核酸分子は、他のメチル化核酸特異的結合試薬、例えば、抗体、抗体誘導体分子等の分配特異性を改善するために使用され得る。一部の実施形態では、担体核酸分子は、次世代シーケンシングのための分子のライブラリ調製を改善する。
一部の実施形態では、担体核酸分子は、天然に存在する核酸配列を有し得る。一部の実施形態では、担体核酸分子は、天然に存在しない核酸配列を有し得る。一部の実施形態では、担体核酸分子は、合成オリゴヌクレオチドであり得る。一部の実施形態では、担体核酸分子は、非ヒトゲノムに対応する核酸配列を有し得る。例えば、これらの分子は、(i)ラムダファージDNAもしくはヒトゲノムの領域に対応する配列、(ii)ウイルスゲノムもしくは細菌ゲノムの領域に対応する配列、(iii)天然に存在しない配列、および/または(iv)上記のいずれかの組合せのいずれかを有し得る。一部の実施形態では、担体DNA分子は、PCRによって生成され得る。一部の実施形態では、PCRによって生成された担体核酸分子は、担体核酸分子中の1つまたは複数のヌクレオチドにメチル基を組み込むために、メチルトランスフェラーゼによる処置によってさらに改変され得る。一部の実施形態では、担体核酸分子は、アダプターへの担体核酸分子のライゲーションを防止するように改変ヌクレオシドを組み込むために、ポリメラーゼで末端標識され得る。一部の実施形態では、担体核酸分子は、天然に存在しないヌクレオシド誘導体を含む。一部の実施形態では、担体核酸分子は、ビオチンまたはフルオロフォアで標識され得る。
別の態様では、本開示は、(i)非メチル化担体核酸分子の少なくとも1つのサブセット;および/または(ii)メチル化担体核酸分子の少なくとも1つのサブセットを含む担体核酸分子のセットであって、非メチル化担体核酸分子が、メチル化ヌクレオチドを含まず、メチル化担体核酸分子が、1つまたは複数のメチル化ヌクレオチドを含む、担体核酸分子のセットを提供する。一部の実施形態では、担体核酸分子の少なくとも一方の末端は、ライゲーションを防止するように改変される。
別の態様では、本開示は、(i)非メチル化担体核酸分子の少なくとも1つのサブセット;および/または(ii)メチル化担体核酸分子の少なくとも1つのサブセットを含む担体核酸分子のセットであって、非メチル化担体核酸分子の少なくとも1つのサブセットが、メチル化ヌクレオチドを含まず、メチル化担体核酸分子の少なくとも1つのサブセットが、メチル化ヌクレオチドを含み、担体核酸分子の少なくとも一方の末端が、ライゲーションを防止するように改変される、担体核酸分子のセットを提供する。
一部の実施形態では、担体核酸分子の少なくとも一方の末端は、C3(プロピル基)スペーサーを含む。一部の実施形態では、担体核酸分子の少なくとも一方の末端は、ジデオキシヌクレオチドを含む。一部の実施形態では、担体核酸分子の少なくとも一方の末端は、ヒドロキシル基が求核試薬として作用することを阻止する任意の化学的改変を含む。一部の実施形態では、担体核酸分子の5’末端は、以下の改変:(i)反転(5’-5’)-ジデオキシチミン、ジデオキシシトシン、ジデオキシグアニンまたはジデオキシアデニン;(ii)プロピル基、または(iii)例えば、ベンジル、エチルもしくはメチルであるがこれらに限定されない他の有機官能基のうち少なくとも1つを含む。一部の実施形態では、担体核酸分子の3’末端は、以下の改変:(i)酵素的に、または合成の間に付加され得る任意のジデオキシ塩基、例えば、ジデオキシチミン、ジデオキシシトシン、ジデオキシグアニンまたはジデオキシアデニン;(ii)プロピル基、または(iii)例えば、ベンジル、エチルもしくはメチルであるがこれらに限定されない他の有機官能基のうち少なくとも1つを含む。
一部の実施形態では、1つまたは複数のメチル化ヌクレオチドは、以下:(i)5-メチルシトシン、(ii)6-メチルアデニン、(iii)ヒドロキシメチルシトシン、(iv)メチルウラシル、または(v)任意の他のメチル化ヌクレオチドのうち少なくとも1つである。一部の実施形態では、メチル化担体核酸分子は、1、2、3、4、5、6、7、8、9、10、12、14、15、16、17、18、19または少なくとも20個のメチル化ヌクレオチドを有し得る。一部の実施形態では、担体核酸分子は、長さが25bpと325bpとの間であり得る。一部の実施形態では、1つのサブセットの非メチル化担体核酸分子は、別のサブセットの非メチル化担体核酸分子と同じ配列を有し得る。一部の実施形態では、1つのサブセットのメチル化担体核酸分子は、別のサブセットのメチル化担体核酸分子と同じ配列を有し得る。一部の実施形態では、1つのサブセット中の非メチル化担体核酸分子の配列は、他のサブセット(複数可)中の非メチル化担体核酸分子の配列とは異なる。一部の実施形態では、1つのサブセット中のメチル化担体核酸分子の配列は、他のサブセット(複数可)中のメチル化担体核酸分子の配列とは異なる。
一部の実施形態では、非メチル化担体核酸分子および/またはメチル化担体核酸分子の1つまたは複数のサブセットは、ヌクレオチド配列中に1つまたは複数のCpGジヌクレオチドを有し得る。一部の実施形態では、メチル化担体核酸分子中の1つまたは複数のCpGジヌクレオチドは、1つまたは複数のメチル化シトシンを有し得る。
一部の実施形態では、非メチル化担体核酸分子の1つのサブセット中の1つまたは複数のCpGジヌクレオチドの位置は、他のサブセット(複数可)中の1つまたは複数のCpGジヌクレオチドの位置とは異なる。一部の実施形態では、非メチル化担体核酸分子の1つのサブセット中のCpGジヌクレオチドの数は、他のサブセット(複数可)中のCpGジヌクレオチドの数とは異なる。一部の実施形態では、非メチル化担体核酸分子の1つのサブセット中の1つまたは複数のCpGジヌクレオチドに隣接するヌクレオチドの配列は、他のサブセット(複数可)中の1つまたは複数のCpGジヌクレオチドに隣接するヌクレオチドの配列とは異なる。一部の実施形態では、非メチル化担体核酸分子の1つのサブセット中の非メチル化担体核酸分子の長さは、他のサブセット(複数可)中の非メチル化担体核酸分子の長さとは異なる。
一部の実施形態では、メチル化担体核酸分子の1つのサブセット中の1つまたは複数のメチル化ヌクレオチドの位置は、他のサブセット(複数可)中の1つまたは複数のメチル化ヌクレオチドの位置とは異なる。一部の実施形態では、メチル化担体核酸分子の1つのサブセット中のメチル化ヌクレオチドの数は、他のサブセット(複数可)中のメチル化ヌクレオチドの数とは異なる。一部の実施形態では、非メチル化担体核酸分子の1つのサブセット中の1つまたは複数のメチル化ヌクレオチドに隣接するヌクレオチドの配列は、他のサブセット(複数可)中の1つまたは複数のメチル化ヌクレオチドに隣接するヌクレオチドの配列とは異なる。一部の実施形態では、メチル化担体核酸分子の1つのサブセット中のメチル化担体核酸分子の長さは、他のサブセット(複数可)中のメチル化担体核酸分子の長さとは異なる。
一部の実施形態では、メチル化担体核酸分子の、非メチル化担体核酸分子に対する量は、約0:1、0.1:99.9、0.5:99.5、0.75:99.25、1:99、1:95、1:90、1:80、1:75、1:70、1:60、1:50、1:40、1:30、1:25、1:20、1:10、1:5、1:2、1:1.15、1:1、1.15:1、2:1、5:1、10:1、20:1、25:1、30:1、40:1、50:1、60:1、70:1、75:1、80:1、90:1、95:1、99:1、99.25:0.75、99.5:0.5、99.9:0.1または1:0の比である。一部の実施形態では、量は、質量を単位とする。一部の実施形態では、量は、モル濃度を単位とする。一部の実施形態では、担体核酸分子は、ウラシルヌクレオシドを含む。
図2は、本開示の一実施形態に従う担体核酸分子の概略図である。図2中の担体核酸分子は、二本鎖DNA分子である。二本鎖DNA配列中の「---」領域は、任意のDNA配列を示す。R1およびR3は、担体核酸分子のライゲーションを防止する、担体核酸分子の5’末端における改変を示す。R2およびR4は、担体核酸分子のライゲーションを防止する、担体核酸分子の3’末端における改変を示す。一部の実施形態では、担体核酸分子の末端は、C3(プロピル基)スペーサーを含む。一部の実施形態では、担体核酸分子の末端は、ジデオキシヌクレオチドまたは反転ジデオキシヌクレオチドを含む。一部の実施形態では、担体核酸分子の5’末端は、反転ジデオキシヌクレオチドを含む。一部の実施形態では、担体核酸分子の3’末端は、ジデオキシヌクレオチドを含む。一部の実施形態では、担体核酸分子の末端は、ヒドロキシル基が求核試薬として作用することを阻止する任意の化学的改変を含む。一部の実施形態では、担体核酸分子の5’末端は、以下の改変:(i)反転(5’-5’)-ジデオキシチミン、ジデオキシシトシン、ジデオキシグアニンまたはジデオキシアデニン;(ii)プロピル基、または(iii)例えば、ベンジル、エチルもしくはメチルであるがこれらに限定されない他の有機官能基のうち少なくとも1つを含む。一部の実施形態では、担体核酸分子の3’末端は、以下の改変:(i)酵素的に、または合成の間に付加され得る任意のジデオキシ塩基、例えば、ジデオキシチミン、ジデオキシシトシン、ジデオキシグアニンまたはジデオキシアデニン;(ii)プロピル基、または(iii)例えば、ベンジル、エチルもしくはメチルであるがこれらに限定されない他の有機官能基のうち少なくとも1つを含む。一部の実施形態では、担体核酸分子のDNA配列は、1つまたは複数のCpGジヌクレオチドを含む。一部の実施形態では、担体核酸分子は、1つまたは複数のメチル化ヌクレオチドを含む。
図3Aは、本開示の一実施形態に従う担体核酸分子のセットの概略図である。この実施形態では、担体核酸分子は、二本鎖DNA分子であり、担体DNA分子と呼ばれる。また、この実施形態では、担体DNA分子の末端は、ライゲーションを防止するように改変される。他の実施形態では、担体DNA分子の末端は、ライゲーションを防止するように改変される必要はない。例示を目的として、すべてのサブセットについて、単一の担体DNA分子の一方の鎖のみが図中に示される。図3Aでは、担体DNA分子中の「---」領域は、CpGとは別の任意の他の配列を示し、Mは5-メチルシトシンを示し、Cはシトシンを示し、Gはグアニンを示す。この実施形態では、担体DNA分子は、非メチル化担体DNA分子の1つのサブセット(サブセット1)およびメチル化担体DNA分子の1つのサブセット(サブセットA)を有する。この実施形態では、サブセット1およびサブセットAの両方中の担体DNA分子の配列は、同じである。サブセット1およびサブセットAの担体DNA分子は共に、3つのCpGジヌクレオチドを有する。この実施形態、サブセットAでは、3つすべてのCpGジヌクレオチド中のシトシンがメチル化されている(したがって、図3A中でMGと示される)。一部の実施形態では、担体DNA分子は、25bpと325bpとの間の任意の長さのものであり得る。一部の実施形態では、担体DNA分子は、少なくとも50bp、少なくとも60bp、少なくとも80bp、少なくとも100bp、少なくとも120bp、少なくとも150bp、少なくとも200bp、少なくとも250bpまたは少なくとも300bpであり得る。
図3Bは、本開示の一実施形態に従う担体核酸分子のセットの概略図である。この実施形態では、担体核酸分子は、二本鎖DNA分子であり、担体DNA分子と呼ばれる。また、この実施形態では、担体DNA分子の末端は、ライゲーションを防止するように改変される。他の実施形態では、担体DNA分子の末端は、ライゲーションを防止するように改変される必要はない。例示を目的として、すべてのサブセットについて、単一の担体DNA分子の一方の鎖のみが図中に示される。図3Bでは、担体DNA分子中の「---」領域は、CpGとは別の任意の他の配列を示し、Mは5-メチルシトシンを示し、Cはシトシンを示し、Gはグアニンを示す。この実施形態では、担体DNA分子は、非メチル化担体DNA分子の2つのサブセット(サブセット1および2)およびメチル化担体DNA分子の2つのサブセット(サブセットAおよびB)を有する。この実施形態では、各サブセット(サブセット1、2、AおよびB)は、異なるヌクレオチド配列を有し、各サブセットは、異なる数のCpGジヌクレオチドを有する。即ち、サブセット1は、2つのCpGジヌクレオチドを有し、サブセット2は、4つのCpGジヌクレオチドを有し、サブセットAは、3つのCpGジヌクレオチドを有し、サブセットBは、5つのCpGジヌクレオチドを有する。この実施形態では、メチル化担体DNA分子中のCpGジヌクレオチドのすべてのシトシンがメチル化されている(したがって、図3B中でMGと示される)。他の実施形態では、メチル化担体DNA分子中のCpGジヌクレオチドのすべてのシトシンがメチル化される必要はない(例えば、図4を参照されたい)。一部の実施形態では、担体DNA分子は、25bpと325bpとの間の任意の長さのものであり得る。一部の実施形態では、担体DNA分子は、少なくとも50bp、少なくとも60bp、少なくとも80bp、少なくとも100bp、少なくとも120bp、少なくとも150bp、少なくとも200bp、少なくとも250bpまたは少なくとも300bpであり得る。
図4は、本開示の一実施形態に従う担体核酸分子のセットの概略図である。この実施形態では、担体核酸分子は、二本鎖DNA分子であり、担体DNA分子と呼ばれる。また、この実施形態では、担体DNA分子の末端は、ライゲーションを防止するように改変される。他の実施形態では、担体DNA分子の末端は、ライゲーションを防止するように改変される必要はない。この実施形態では、本明細書に記載される担体DNA分子は、核酸分子の分配の間のCpGジヌクレオチド中のメチル化シトシンのメチル化効果を考慮に入れてもよい。例示を目的として、すべてのサブセットについて、単一の担体DNA分子の一方の鎖のみが図中に示される。図4では、担体DNA分子中の「---」領域は、CpGとは別の任意の他の配列を示し、Mは5-メチルシトシンを示し、Cはシトシンを示し、Gはグアニンを示す。この実施形態では、担体DNA分子は、非メチル化担体DNA分子の1つのサブセット(サブセット1)およびメチル化担体DNA分子の3つのサブセット(サブセットA、BおよびC)を有する。この実施形態では、すべてのサブセット中の担体DNA分子の配列は、同じである。即ち、サブセット1、A、BおよびCは、同じヌクレオチド配列を有し、これらはすべて、4つのCpGジヌクレオチドを有する。しかし、メチル化ヌクレオチド(この実施形態では、CpGジヌクレオチドのメチル化シトシン)の数は、メチル化担体DNA分子の各サブセットにおいて異なる。この実施形態では、サブセットAは、CpGヌクレオチド中の2つのメチル化シトシンを有し、サブセットBは、CpGヌクレオチド中の3つのメチル化シトシンを有し、サブセットCは、CpGヌクレオチド中の4つのメチル化シトシンを有する(図4中でMGと示される)。一部の実施形態では、担体DNA分子は、25bpと325bpとの間の任意の長さのものであり得る。一部の実施形態では、担体DNA分子は、少なくとも50bp、少なくとも60bp、少なくとも80bp、少なくとも100bp、少なくとも120bp、少なくとも150bp、少なくとも200bp、少なくとも250bpまたは少なくとも300bpであり得る。
図5は、本開示の一実施形態に従う担体核酸分子のセットの概略図である。この実施形態では、担体核酸分子は、二本鎖DNA分子であり、担体DNA分子と呼ばれる。また、この実施形態では、担体DNA分子の末端は、ライゲーションを防止するように改変される。他の実施形態では、担体DNA分子の末端は、ライゲーションを防止するように改変される必要はない。この実施形態では、本明細書に記載される担体DNA分子は、核酸分子の分配の間のCpGジヌクレオチドの位置特異的効果および/またはメチル化効果を考慮に入れてもよい。例示を目的として、すべてのサブセットについて、単一の担体DNA分子の一方の鎖のみが図中に示される。図5では、担体DNA分子中の「---」領域は、CpGとは別の任意の他の配列を示し、Mは5-メチルシトシンを示し、Cはシトシンを示し、Gはグアニンを示す。この実施形態では、担体DNA分子のセットは、非メチル化担体DNA分子の2つのサブセット(サブセット1および2)およびメチル化担体DNA分子の2つのサブセット(サブセットAおよびB)を有する。この実施形態では、各サブセット中の担体DNA分子の配列は、他のサブセットとは異なる。即ち、サブセット1、2、AおよびBは、異なるヌクレオチド配列を有する。この実施形態では、すべてのサブセット中のCpGジヌクレオチドの数は、同じである。即ち、すべてのサブセット(サブセット1、2、AおよびB)が、4つのCpGジヌクレオチドを有する。この実施形態では、メチル化担体DNA分子の各サブセット中のメチル化ヌクレオチド(この実施形態では、CpGジヌクレオチドのメチル化シトシン)の数は、同じであり、4つのCpGジヌクレオチド中の4つすべてのシトシンがメチル化されている(図5のサブセットAおよびB中でMGと示される)。この実施形態では、CpGジヌクレオチドの位置は、サブセット1とサブセット2との間で異なり、サブセットAとサブセットBとの間で異なる。しかし、サブセット1およびサブセットA中のCpGジヌクレオチドの位置は同じであり、サブセット2およびサブセットB中のCpGジヌクレオチドの位置は同じである。一部の実施形態では、担体DNA分子は、25bpと325bpとの間の任意の長さのものであり得る。一部の実施形態では、担体DNA分子は、少なくとも50bp、少なくとも60bp、少なくとも80bp、少なくとも100bp、少なくとも120bp、少なくとも150bp、少なくとも200bp、少なくとも250bpまたは少なくとも300bpであり得る。
図6は、本開示の一実施形態に従う担体核酸分子のセットの概略図である。この実施形態では、担体核酸分子は、二本鎖DNA分子であり、担体DNA分子と呼ばれる。また、この実施形態では、担体DNA分子の末端は、ライゲーションを防止するように改変される。他の実施形態では、担体DNA分子の末端は、ライゲーションを防止するように改変される必要はない。この実施形態では、本明細書に記載される担体DNA分子は、核酸分子の分配の間のCpGジヌクレオチドに隣接するヌクレオチドの配列特異的効果を考慮に入れてもよい。例示を目的として、すべてのサブセットについて、単一の担体DNA分子の一方の鎖のみが図中に示される。図6では、担体DNA分子中の「---」領域は、CpGジヌクレオチドとは別の任意の他の配列を示し;Mは5-メチルシトシンを示し、Cはシトシンを示し、Gはグアニンを示し;XniおよびYniは、同じ長さniの任意の2つの異なるヌクレオチド配列であり得、ここで、niは、n1、n2、n3、n4、n5またはn6であり得る。即ち、例えば、Xn1およびYn1は、長さn1の2つの異なるヌクレオチド配列であり、n1、n2、n3、n4、n5およびn6は、0と30との間の任意の整数であり得る。この実施形態では、担体DNA分子のセットは、非メチル化担体DNA分子の2つのサブセット(サブセット1および2)およびメチル化担体DNA分子の2つのサブセット(サブセットAおよびB)を有し、すべてのサブセット中のCpGジヌクレオチドの数は、同じである。即ち、サブセット1、2、AおよびBは、4つのCpGジヌクレオチドを有する。しかし、CpGジヌクレオチドに隣接するヌクレオチドの配列は、非メチル化担体DNA分子の2つのサブセット間で異なる。即ち、CpGジヌクレオチドに隣接するヌクレオチドの配列(XniおよびYni)は、サブセット1およびサブセット2において異なる。同様に、CpGジヌクレオチドに隣接するヌクレオチドの配列は、メチル化担体DNA分子の2つのサブセット間で異なる。即ち、CpGジヌクレオチドに隣接するヌクレオチドの配列(XniおよびYni)は、サブセットAおよびサブセットBにおいて異なる。しかし、CpGジヌクレオチドに隣接するヌクレオチドの配列(Xni)は、サブセット1およびサブセットAにおいて同じであり、サブセット1においても同じであり、CpGジヌクレオチドに隣接するヌクレオチドの配列(Yni)は、サブセット2およびサブセットBにおいて同じである。一部の実施形態では、担体DNA分子は、25bpと325bpとの間の任意の長さのものであり得る。一部の実施形態では、担体DNA分子は、少なくとも50bp、少なくとも60bp、少なくとも80bp、少なくとも100bp、少なくとも120bp、少なくとも150bp、少なくとも200bp、少なくとも250bpまたは少なくとも300bpであり得る。一部の実施形態では、niは、長さ最大5bpのヌクレオチド配列であり得る。
別の態様では、本開示は、(i)i)非メチル化担体核酸分子の少なくとも1つのサブセット;および/または(ii)メチル化担体核酸分子の少なくとも1つのサブセットを含む担体核酸分子のセットであって、担体核酸分子の少なくとも一方の末端が、ライゲーションを防止するように改変され、非メチル化担体核酸分子が、メチル化ヌクレオチドを含まず、メチル化担体核酸分子が、1つまたは複数のメチル化ヌクレオチドを含む、担体核酸分子のセット;ならびに(ii)対象から得られたポリヌクレオチド試料を含む核酸の集団を提供する。
一部の実施形態では、担体核酸分子は、(i)ウイルスゲノム、(ii)細菌ゲノム、(iii)ラムダファージゲノム、(iv)ヒトゲノム、(iv)任意の天然に存在する配列、(v)天然に存在しない配列、(vi)非ヒトゲノムおよび/または(vii)上記のいずれかの組合せの領域に対応する配列のいずれかを有し得る。一部の実施形態では、担体核酸分子は、天然に存在しない配列を含み得る。一部の実施形態では、担体核酸分子は、天然に存在する配列を含み得る。一部の実施形態では、担体DNA分子は、PCRによって生成され得る。一部の実施形態では、PCRによって生成された担体核酸分子は、担体核酸分子中の1つまたは複数のヌクレオチドにメチル基を組み込むために、メチルトランスフェラーゼによる処置によってさらに改変され得る。一部の実施形態では、担体核酸分子は、アダプターへの担体核酸分子のライゲーションを防止するように改変ヌクレオシドを組み込むために、ポリメラーゼで末端標識され得る。一部の実施形態では、担体核酸分子は、天然に存在しないヌクレオシド誘導体を含む。一部の実施形態では、担体核酸分子は、ビオチンまたはフルオロフォアで標識され得る。
一部の実施形態では、ポリヌクレオチド試料は、組織、血液、血漿、血清、尿、唾液、糞便、脳脊髄液、頬内スワブまたは胸腔穿刺から得られる。一部の実施形態では、ポリヌクレオチド試料は、組織から得られる。一部の実施形態では、組織から得られたポリヌクレオチド試料は、酵素的手段または機械的手段によって断片化される。一部の実施形態では、ポリヌクレオチド試料は、血液から得られる。一部の実施形態では、血液から得られたポリヌクレオチド試料は、無細胞DNA試料である。一部の実施形態では、ポリヌクレオチド試料は、無細胞DNA試料である。
一部の実施形態では、ポリヌクレオチド試料は、DNA試料、RNA試料、無細胞ポリヌクレオチド試料、無細胞DNA試料または無細胞RNA試料である。一部の実施形態では、ポリヌクレオチド試料は、無細胞DNA試料である。
一部の実施形態では、メチル化担体核酸分子の少なくとも1つのサブセットの、非メチル化担体核酸分子の少なくとも1つのサブセットに対する量は、約0:1、0.1:99.9、0.5:99.5、0.75:99.25、1:99、1:95、1:90、1:80、1:75、1:70、1:60、1:50、1:40、1:30、1:25、1:20、1:10、1:5、1:2、1:1.15、1:1、1.15:1、2:1、5:1、10:1、20:1、25:1、30:1、40:1、50:1、60:1、70:1、75:1、80:1、90:1、95:1、99:1、99.25:0.75、99.5:0.5、99.9:0.1または1:0の比である。一部の実施形態では、ポリヌクレオチド試料の、担体核酸分子のセットに対する量は、約1:0.1;1:0.2、1:0.3、1:4、1:0.5、1:6、1:7、1:8、1:0.9、1:1、1:1、1:2、1:3、1:4、1:5、1:6、1:7、1:8、1:9、1:10の比、1:20、1:30、1:40、1:50、1:60、1:70、1:80、1:90、1:100、1:200、1:300;1:400、1:500、1:600、1:700、1:800、1:900、1:1000、1:5000、1:10,000、1:100,000、1:500,000、1:106、1:107、1:108または1:109である。一部の実施形態では、量は、質量を単位とする。一部の実施形態では、量は、モル濃度を単位とする。
一部の実施形態では、ポリヌクレオチド試料は、少なくとも1ng、少なくとも5ng、少なくとも10ng、少なくとも15ng、少なくとも20ng、少なくとも30ng、少なくとも50ng、少なくとも75ng、少なくとも100ng、少なくとも150ng、少なくとも200ng、少なくとも250ng、少なくとも300ng、少なくとも350ng、少なくとも400ng、少なくとも450ng、少なくとも500ng、少なくとも750ngまたは少なくとも1μgである。一部の実施形態では、ポリヌクレオチド試料は、最大1μgである。一部の実施形態では、ポリヌクレオチド試料は、最大200ngである。一部の実施形態では、ポリヌクレオチド試料は、最大150ngである。一部の実施形態では、ポリヌクレオチド試料は、最大100ngである。一部の実施形態では、担体核酸分子のセットは、ポリヌクレオチド試料と担体核酸分子のセットとの総量が約175ng、200ng、225ng、250ng、275ng、300ng、350ng、400ng、450ng、500ng、600ng、700ng、750ng、800ng、900ng、1μg、1.1μg、1.25μgまたは1.5μgになるように十分な量で添加される。
III.本方法の一般的な特色
A.試料
試料は、対象から単離した任意の生体試料であってよい。試料には、身体組織、全血、血小板、血清、血漿、糞便、赤血球、白血球(white blood cell)または白血球(leucocyte)、内皮細胞、組織生検材料(例えば、既知のまたは疑われる固形腫瘍由来の生検材料)、脳脊髄液、滑液、リンパ液、腹水、間質または細胞外の流体(例えば、細胞間隙由来の流体)、歯肉溝滲出液(gingival fluid)、歯肉溝滲出液(crevicular fluid)、骨髄、胸水、脳脊髄液、唾液、粘液、痰、精液、汗および尿が含まれ得る。試料は、体液、例えば、血液およびその分画、ならびに尿であり得る。そのような試料は、腫瘍から脱落した核酸を含み得る。核酸には、DNAおよびRNAが含まれ得、二本鎖形態および一本鎖形態であり得る。試料は、もともと対象から単離した形態であってよく、あるいは細胞等の成分を除去しもしくは添加し、ある成分を別の成分に対して富化するように、またはある型の核酸を別の型の核酸に、例えば、RNAをDNAにもしくは一本鎖核酸を二本鎖核酸に変換するように、さらに処理に供されたものでもよい。したがって、例えば、解析のための体液は、無細胞核酸、例えば、無細胞DNA(cfDNA)を含む血漿または血清であり得る。
A.試料
試料は、対象から単離した任意の生体試料であってよい。試料には、身体組織、全血、血小板、血清、血漿、糞便、赤血球、白血球(white blood cell)または白血球(leucocyte)、内皮細胞、組織生検材料(例えば、既知のまたは疑われる固形腫瘍由来の生検材料)、脳脊髄液、滑液、リンパ液、腹水、間質または細胞外の流体(例えば、細胞間隙由来の流体)、歯肉溝滲出液(gingival fluid)、歯肉溝滲出液(crevicular fluid)、骨髄、胸水、脳脊髄液、唾液、粘液、痰、精液、汗および尿が含まれ得る。試料は、体液、例えば、血液およびその分画、ならびに尿であり得る。そのような試料は、腫瘍から脱落した核酸を含み得る。核酸には、DNAおよびRNAが含まれ得、二本鎖形態および一本鎖形態であり得る。試料は、もともと対象から単離した形態であってよく、あるいは細胞等の成分を除去しもしくは添加し、ある成分を別の成分に対して富化するように、またはある型の核酸を別の型の核酸に、例えば、RNAをDNAにもしくは一本鎖核酸を二本鎖核酸に変換するように、さらに処理に供されたものでもよい。したがって、例えば、解析のための体液は、無細胞核酸、例えば、無細胞DNA(cfDNA)を含む血漿または血清であり得る。
一部の実施形態では、対象から採取された体液の試料体積は、シーケンシングされる領域の所望のリード深度に依存する。体積の例は、約0.4~40ミリリットル(mL)、約5~20mL、約10~20mLである。例えば、体積は、約0.5mL、約1mL、約5mL、約10mL、約20mL、約30mL、約40mLまたはそれよりも大きいミリリットルであり得る。試料採取された血漿の体積は、典型的には、約5mL~約20mLの間である。
試料は、様々な量の核酸を含み得る。典型的には、所与の試料中の核酸の量は、複数のゲノム等価物と同等とみなされる。例えば、DNA約30ナノグラム(ng)の試料は、約10,000(104)個のハプロイドヒトゲノム等価物を含有し得、cfDNAの場合には約2000億(2×1011)個の個々のポリヌクレオチド分子を含有し得る。同様に、DNA約100ngの試料は、約30,000個のハプロイドヒトゲノム等価物を含有し得、cfDNAの場合には約6000億個の個々の分子を含有し得る。
一部の実施形態では、試料は、異なる供給源から、例えば、細胞からおよび無細胞供給源(例えば、血液試料等)からの核酸を含む。典型的には、試料は、変異を有する核酸を含む。例えば、試料は、必要に応じて、生殖細胞系列変異および/または体細胞変異を有するDNAを含む。典型的には、試料は、がん関連変異(例えば、がん関連体細胞変異)を有するDNAを含む。
増幅前の試料中の無細胞核酸の例示的な量は、典型的には、約1フェムトグラム(fg)~約1マイクログラム(μg)、例えば、約1ピコグラム(pg)~約200ナノグラム(ng)、約1ng~約100ng、約10ng~約1000ngの範囲である。一部の実施形態では、試料は、最大約600ng、最大約500ng、最大約400ng、最大約300ng、最大約200ng、最大約100ng、最大約50ngまたは最大約20ngの無細胞核酸分子を含む。必要に応じて、この量は、少なくとも約1fg、少なくとも約10fg、少なくとも約100fg、少なくとも約1pg、少なくとも約10pg、少なくとも約100pg、少なくとも約1ng、少なくとも約10ng、少なくとも約100ng、少なくとも約150ngまたは少なくとも約200ngの無細胞核酸分子である。一部の実施形態では、この量は、最大約1fg、約10fg、約100fg、約1pg、約10pg、約100pg、約1ng、約10ng、約100ng、約150ng、約200ng、約300ng、約400ng、約500ng、約600ng、約700ng、約800ng、約900ngまたは約1μgの無細胞核酸分子である。一部の実施形態では、方法は、約1fg~約200ngの間の、試料由来の無細胞核酸分子を得るステップを含む。
無細胞核酸は、典型的には、長さが約100ヌクレオチドと長さが約500ヌクレオチドとの間のサイズ分布を有し、長さが約110ヌクレオチド~長さが約230ヌクレオチドの分子が、試料中の分子の約90%に相当し、最頻値は約168ヌクレオチドの長さであり(ヒト対象由来の試料において)、第2の小さなピークは、長さが約240ヌクレオチド~約440ヌクレオチドの間の範囲である。一部の実施形態では、無細胞核酸は、長さが約160ヌクレオチド~約180ヌクレオチド、または長さが約320ヌクレオチド~約360ヌクレオチド、または長さが約440ヌクレオチド~約480ヌクレオチドである。
一部の実施形態では、無細胞核酸は、分配するステップを経て体液から単離され、ここでは、溶液中に見出される無細胞核酸が、インタクトな細胞および体液の他の不溶性成分から分離される。一部の実施形態では、分配は、遠心分離または濾過等の手法を含む。あるいは、体液中の細胞を溶解し、無細胞および細胞の核酸を共に処理することができる。一般に、緩衝液の添加および洗浄ステップの後、例えば、無細胞核酸をアルコール等で沈殿させることができる。一部の実施形態では、夾雑物または塩を除去するためのシリカ系カラム等の追加の清浄ステップを使用する。例示的な手順の態様、例えば収量を最適化するために、例えば、非特異的バルク担体核酸を反応全体にわたって必要に応じて添加する。そのような処理の後、試料は、典型的には、二本鎖DNA、一本鎖DNAおよび/または一本鎖RNAを含む種々の形態の核酸を含む。必要に応じて、それらをその後の処理および分析のステップに含めることができるように、一本鎖DNAおよび/または一本鎖RNAを二本鎖の形態に変換する。
B.分配およびタグ付け
一部の実施形態では、核酸分子(ポリヌクレオチドの試料由来)は、試料インデックスおよび/または分子バーコード(一般に「タグ」と呼ばれる)でタグ付けされ得る。タグは、他の方法の中でも、化学的合成、ライゲーション(例えば、平滑末端ライゲーションまたは付着末端ライゲーション)、または重複伸長ポリメラーゼ連鎖反応(PCR)によって、アダプター中に組み込まれ得るか、またはそれ以外の方法でアダプターに結合され得る。そのようなアダプターは、標的核酸分子に最終的に結合され得る。他の実施形態では、1または複数ラウンドの増幅サイクル(例えば、PCR増幅)が、従来の核酸増幅方法を使用して、核酸分子に試料インデックスを導入するために一般に適用される。増幅は、1つまたは複数の反応混合物(例えば、アレイ中の複数のマイクロウェル)において実施され得る。分子バーコードおよび/または試料インデックスは、同時に、または任意の逐次的順序で導入され得る。一部の実施形態では、分子バーコードおよび/または試料インデックスは、配列捕捉ステップを実施する前および/または配列捕捉ステップを実施した後に導入される。一部の実施形態では、分子バーコードのみがプローブ捕捉前に導入され、試料インデックスは、配列捕捉ステップを実施した後に導入される。一部の実施形態では、分子バーコードおよび試料インデックスが共に、プローブに基づく捕捉ステップを実施する前に導入される。一部の実施形態では、試料インデックスは、配列捕捉ステップを実施した後に導入される。一部の実施形態では、分子バーコードは、ライゲーション(例えば、平滑末端ライゲーションまたは付着末端ライゲーション)を経て、アダプターを介して試料中の核酸分子(例えば、cfDNA分子)に組み込まれる。一部の実施形態では、試料インデックスは、重複伸長ポリメラーゼ連鎖反応(PCR)を経て試料中の核酸分子(例えば、cfDNA分子)に組み込まれる。典型的には、配列捕捉プロトコールは、標的化された核酸配列、例えば、ゲノム領域のコード配列に対して相補的な一本鎖核酸分子を導入することを含み、そのような領域の変異は、がん型に関連する。
一部の実施形態では、核酸分子(ポリヌクレオチドの試料由来)は、試料インデックスおよび/または分子バーコード(一般に「タグ」と呼ばれる)でタグ付けされ得る。タグは、他の方法の中でも、化学的合成、ライゲーション(例えば、平滑末端ライゲーションまたは付着末端ライゲーション)、または重複伸長ポリメラーゼ連鎖反応(PCR)によって、アダプター中に組み込まれ得るか、またはそれ以外の方法でアダプターに結合され得る。そのようなアダプターは、標的核酸分子に最終的に結合され得る。他の実施形態では、1または複数ラウンドの増幅サイクル(例えば、PCR増幅)が、従来の核酸増幅方法を使用して、核酸分子に試料インデックスを導入するために一般に適用される。増幅は、1つまたは複数の反応混合物(例えば、アレイ中の複数のマイクロウェル)において実施され得る。分子バーコードおよび/または試料インデックスは、同時に、または任意の逐次的順序で導入され得る。一部の実施形態では、分子バーコードおよび/または試料インデックスは、配列捕捉ステップを実施する前および/または配列捕捉ステップを実施した後に導入される。一部の実施形態では、分子バーコードのみがプローブ捕捉前に導入され、試料インデックスは、配列捕捉ステップを実施した後に導入される。一部の実施形態では、分子バーコードおよび試料インデックスが共に、プローブに基づく捕捉ステップを実施する前に導入される。一部の実施形態では、試料インデックスは、配列捕捉ステップを実施した後に導入される。一部の実施形態では、分子バーコードは、ライゲーション(例えば、平滑末端ライゲーションまたは付着末端ライゲーション)を経て、アダプターを介して試料中の核酸分子(例えば、cfDNA分子)に組み込まれる。一部の実施形態では、試料インデックスは、重複伸長ポリメラーゼ連鎖反応(PCR)を経て試料中の核酸分子(例えば、cfDNA分子)に組み込まれる。典型的には、配列捕捉プロトコールは、標的化された核酸配列、例えば、ゲノム領域のコード配列に対して相補的な一本鎖核酸分子を導入することを含み、そのような領域の変異は、がん型に関連する。
一部の実施形態では、タグは、試料核酸分子の一方の末端または両方の末端に位置し得る。一部の実施形態では、タグは、既定のまたはランダムなもしくは半ランダムな配列のオリゴヌクレオチドである。一部の実施形態では、タグは、長さが約500、200、100、50、20、10、9、8、7、6、5、4、3、2または1ヌクレオチド未満であり得る。タグは、試料核酸にランダムにまたは非ランダムに連結され得る。
一部の実施形態では、各試料は、試料インデックスまたは試料インデックスの組合せで一意的にタグ付けされる。一部の実施形態では、試料またはサブ試料の各核酸分子は、分子バーコードまたは分子バーコードの組合せで一意的にタグ付けされる。他の実施形態では、分子バーコードが複数の分子バーコード中で互いに必ずしも一意的でない(例えば、非一意的分子バーコード)ように、複数の分子バーコードが使用され得る。これらの実施形態では、一般に、分子バーコードとそれが結合され得る配列との組合せが、個々に追跡され得る一意的配列を作製するように、分子バーコードが個々の分子に(例えば、ライゲーションによって)結合される。典型的には、内因性配列情報(例えば、試料中の元の核酸分子の配列に対応する出発(開始)および/もしくは終了(終止)ゲノム場所/位置、試料中の元の核酸分子の配列に対応する開始および終止ゲノム位置、参照配列にマッピングされる配列リードの出発(開始)および/もしくは終了(終止)ゲノム場所/位置、参照配列にマッピングされる配列リードの開始および終止ゲノム位置、一方もしくは両方の末端にある配列リードのサブ配列、配列リードの長さ、ならびに/または試料中の元の核酸分子の長さ)と組み合わせた非一意的分子バーコードの検出により、特定の分子への一意的正体の割り当てが可能になる。一部の実施形態では、出発領域は、参照配列とアラインメントするシーケンシングリードの5’末端における最初の1、最初の2、最初の5、最初の10、最初の15、最初の20、最初の25、最初の30または少なくとも最初の30個の塩基位置を含む。一部の実施形態では、終了領域は、参照配列とアラインメントするシーケンシングリードの3’末端における最後の1、最後の2、最後の5、最後の10、最後の15、最後の20、最後の25、最後の30または少なくとも最後の30個の塩基位置を含む。個々の配列リードの長さまたは塩基対の数もまた、必要に応じて、所与の分子への一意的正体の割り当てのために使用される。本明細書に記載されるように、一意的正体が割り当てられた核酸の単一ストランドからの断片によって、親ストランドおよび/または相補的ストランドからの断片のその後の同定が可能になり得る。
ある特定の実施形態では、クラスの中の分子の数zを一意的に同定するために使用される異なるタグの数は、2*z、3*z、4*z、5*z、6*z、7*z、8*z、9*z、10*z、11*z、12*z、13*z、14*z、15*z、16*z、17*z、18*z、19*z、20*zまたは100*zのいずれか(例えば下限)と100,000*z、10,000*z、1000*zまたは100*zのいずれか(例えば上限)との間であってよい。一部の実施形態では、分子バーコードは、試料中に識別子のセット(例えば、一意的または非一意的分子バーコードの組合せ) 対 分子の予想される比で、導入される。1つの例示的なフォーマットは、標的分子の両方の末端にライゲーションされる、約2~約1,000,000個の異なる分子バーコード配列、または約5~約150個の異なる分子バーコード配列、または約20~約50個の異なる分子バーコード配列を使用する。あるいは、約25~約1,000,000個の異なる分子バーコード配列が使用され得る。例えば、20~50×20~50個の分子バーコード配列(即ち、20~50個の異なる分子バーコード配列のうち1つが、標的分子の各末端に結合され得る)が使用され得る。識別子のそのような数は、典型的には、同じ開始点および終止点を有する異なる分子が、異なる組合せの識別子を受ける高い確率(例えば、少なくとも94%、99.5%、99.99%または99.999%)を有するために十分である。一部の実施形態では、分子の約80%、約90%、約95%または約99%は、分子バーコードの同じ組合せを有する。
一部の実施形態では、反応における一意的または非一意的分子バーコードの割り当ては、例えば、米国特許出願番号20010053519、同20030152490および同20110160078ならびに米国特許第6,582,908号、同第7,537,898号、同第9,598,731号および同第9,902,992号に記載される方法およびシステムを使用して実施され、その各々は、その全体がこれにより参照により本明細書に組み込まれる。あるいは、一部の実施形態では、試料の異なる核酸分子は、内因性配列情報(例えば、開始および/もしくは終止位置、配列の一方もしくは両方の末端のサブ配列、ならびに/または長さ)のみを使用して同定され得る。
本明細書に記載されるある特定の実施形態では、異なる形態の核酸(例えば、試料中の高メチル化DNAおよび低メチル化DNA)の集団は、解析、例えば、シーケンシング、またはタグ付けおよびシーケンシングの前に、物理的に分配され得る。このアプローチは、例えば、高メチル化可変エピジェネティック標的領域が腫瘍細胞に特徴的な高メチル化を示すかどうか、または低メチル化可変エピジェネティック標的領域が腫瘍細胞に特徴的な低メチル化を示すかどうかを決定するために使用され得る。加えて、不均一な核酸集団を分配することによって、例えば、集団の1つの分画(または画分)中により多く存在するまれな核酸分子を富化することによって、まれなシグナルを増加させてもよい。例えば、高メチル化DNA中に存在するが、低メチル化DNA中には存在が少ない(または存在しない)遺伝的バリエーションは、試料を高メチル化核酸分子および低メチル化核酸分子に分配することによって、より容易に検出することができる。試料の複数の分画を解析することによって、ゲノムの単一の遺伝子座または核酸の種の多次元解析を実施することができ、したがってより高い感度を達成することができる。
一部の例では、不均一な核酸試料は、2つまたはそれよりも多くの画分(例えば、少なくとも3、4、5、6または7つの画分)に分配される。一部の実施形態では、各画分は、示差的にタグ付けされる。即ち、各画分は、異なるセットの分子バーコードを有し得る。次いで、タグ付けされた画分は、集合的な試料調製および/またはシーケンシングのために共にプールされ得る。分配-タグ付け-プールするステップは、1回よりも多く行われ得、分配の各ラウンドは、異なる特徴に基づいて行われ(本明細書に提供される実施例)、他の画分および分配手段とは区別される示差的タグを使用してタグ付けされる。
分配のために使用され得る特徴の例には、配列長さ、メチル化レベル、ヌクレオソーム結合、配列ミスマッチ、免疫沈殿、および/またはDNAに結合するタンパク質が含まれる。得られた画分は、以下の核酸形態のうち1つまたは複数を含み得る:一本鎖DNA(ssDNA)、二本鎖DNA(dsDNA)、短いDNA断片および長いDNA断片。一部の実施形態では、核酸の不均一な集団は、1つまたは複数のエピジェネティック改変を有する核酸と、1つまたは複数のエピジェネティック改変を有さない核酸とに分配される。エピジェネティック改変の例には、メチル化の存在または非存在;メチル化のレベル;メチル化の型(例えば、5-メチルシトシン対他の型のメチル化、例えば、アデニンメチル化および/またはシトシンヒドロキシメチル化);ならびに1つまたは複数のタンパク質、例えばヒストンとの会合および会合のレベルが含まれる。あるいはまたは加えて、核酸の不均一な集団は、ヌクレオソームに関連する核酸分子と、ヌクレオソームを欠く核酸分子とに分配され得る。あるいはまたは加えて、核酸の不均一な集団は、一本鎖DNA(ssDNA)と二本鎖DNA(dsDNA)とに分配され得る。あるいはまたは加えて、核酸の不均一な集団は、核酸長さに基づいて分配してもよい(例えば、最大160bpの分子および160bpよりも長い長さを有する分子)。
一部の例では、各画分(異なる核酸形態を代表する)は、分子バーコードで示差的にタグ付けされ、画分は、シーケンシングの前に共にプールされる。他の例では、異なる形態は、別個にシーケンシングされる。一部の実施形態では、単一のタグが、特異的画分を標識するために使用され得る。一部の実施形態では、複数の異なるタグが、特異的画分を標識するために使用され得る。特異的画分を標識するために複数の異なるタグを使用する実施形態では、1つの画分を標識するために使用されるタグのセットは、他の画分を標識するために使用されるタグのセットから容易に区別することができる。一部の実施形態では、タグは、多機能性であり得る。即ち、タグは、分子識別子(即ち、分子バーコード)、画分識別子(即ち、画分タグ)および試料識別子(即ち、試料インデックス)として同時に作用することができる。例えば、4つのDNA試料が存在し、各DNA試料が3つの画分に分配される場合、12個の画分(即ち、合計して、4つのDNA試料について12個の画分)の各々中のDNA分子を、DNA分子に結合したタグ配列が、DNA分子の正体、それが属する画分、およびそれが起源した試料を明らかにするように、タグの別個のセットでタグ付けすることができる。一部の実施形態では、タグは、分子バーコードとしておよび画分タグとしての両方で使用され得る。例えば、DNA試料が3つの画分に分配される場合、各画分中のDNA分子は、DNA分子に結合したタグ配列が、DNA分子の正体およびそれが属する画分を明らかにするように、タグの分離されたセットでタグ付けされる。一部の実施形態では、タグは、分子バーコードとしておよび試料インデックスとしての両方で使用され得る。例えば、4つのDNA試料が存在する場合、各試料中のDNA分子は、DNA分子に結合したタグ配列が、分子識別子としておよび試料識別子として機能するように、各試料から区別可能であり得るタグの別個のセットでタグ付けされる。
一実施形態では、画分タグ付けは、各画分中の分子を画分タグでタグ付けすることを含む。画分を再び合わせ、分子をシーケンシングした後、画分タグは供給源画分を同定する。別の実施形態では、異なる画分は、例えばバーコードの対から構成される異なるセットの分子タグでタグ付けされる。このように、各分子バーコードは、供給源画分、および画分内の分子を区別するために有用であることを示す。例えば、35個のバーコードの第1のセットは、第1の画分中の分子をタグ付けするために使用され得、一方で、35個のバーコードの第2のセットは、第2の画分中の分子をタグ付けするために使用され得る。
一部の実施形態では、分配および画分タグでのタグ付けの後に、分子を単一の試行でのシーケンシングのためにプールしてもよい。一部の実施形態では、試料タグを、例えば、画分タグの付加およびプールの後のステップにおいて分子に付加する。試料タグは、単一のシーケンシング試行におけるシーケンシングのために複数の試料から生成された材料をプールすることを容易にすることができる。
あるいは、一部の実施形態では、画分タグは、試料および画分と相関し得る。単純な例として、第1のタグは、第1の試料の第1の画分を示し得;第2のタグは、第1の試料の第2の画分を示し得;第3のタグは、第2の試料の第1の画分を示し得;第4のタグは、第2の試料の第2の画分を示し得る。
タグは、1つまたは複数のエピジェネティック特徴に基づいて既に分配された分子に結合してもよいが、ライブラリ中の最終のタグ付けされた分子は、もはやそのエピジェネティック特徴を保有していなくてもよい。例えば、一本鎖DNA分子が分配およびタグ付けされ得るが、ライブラリ中の最終のタグ付けされた分子は、おそらく二本鎖である。同様に、DNAをメチル化の異なるレベルに基づく画分に供してもよいが、最終のライブラリでは、これらの分子に由来するタグ付けされた分子はおそらくメチル化されていない。したがって、ライブラリ中の分子に結合したタグは典型的には、最終的なタグ付けされた分子が由来する「親分子」の特徴を示し、必ずしもタグ付けされた分子自体の特徴ではない。
一例として、バーコード1、2、3、4等を使用して第1の画分中の分子をタグ付けおよび標識し;バーコードA、B、C、D等を使用して第2の画分中の分子をタグ付けおよび標識し;ならびにバーコードa、b、c、d等を使用して第3の画分中の分子をタグ付けおよび標識する。示差的にタグ付けされた画分を、シーケンシング前にプールすることができる。示差的にタグ付けされた画分を、別個にシーケンシングすることができ、または例えば、Illuminaシーケンサーの同じフローセルにおいて、共に同時にシーケンシングすることができる。
シーケンシング後、遺伝子バリアントを検出するためのリードの解析を、画分毎のレベルおよび全核酸集団レベルで実施することができる。タグを使用して、異なる画分からのリードを選別する。解析には、配列情報、ゲノム座標の長さ、カバレッジおよび/またはコピー数を使用して遺伝的およびエピジェネティックバリエーション(メチル化、クロマチン構造等のうち1つまたは複数)を決定するためのin silico解析が含まれ得る。一部の実施形態では、より高いカバレッジは、ゲノム領域におけるより高いヌクレオソーム占有率と相関し得るが、より低いカバレッジは、より低いヌクレオソーム占有率またはヌクレオソーム枯渇領域(NDR)と相関し得る。
C.増幅
試料核酸には、アダプターが隣接してもよく、増幅すべきDNA分子に隣接するアダプターの中のプライマー結合部位に結合する核酸プライマーを使用するPCRおよび他の増幅方法によって増幅することができる。一部の実施形態では、増幅法は、熱サイクリングから生じる伸長、変性およびアニーリングのサイクルを含むか、または例えば転写媒介増幅におけるように定温であってもよい。必要に応じて利用され得る増幅法の他の例には、リガーゼ連鎖反応、鎖置換増幅(strand displacement amplification)、核酸配列に基づく増幅、および配列に基づく自己持続複製が含まれる。
試料核酸には、アダプターが隣接してもよく、増幅すべきDNA分子に隣接するアダプターの中のプライマー結合部位に結合する核酸プライマーを使用するPCRおよび他の増幅方法によって増幅することができる。一部の実施形態では、増幅法は、熱サイクリングから生じる伸長、変性およびアニーリングのサイクルを含むか、または例えば転写媒介増幅におけるように定温であってもよい。必要に応じて利用され得る増幅法の他の例には、リガーゼ連鎖反応、鎖置換増幅(strand displacement amplification)、核酸配列に基づく増幅、および配列に基づく自己持続複製が含まれる。
典型的には、増幅反応は、約150ヌクレオチド(nt)~約700nt、250nt~約350ntまたは約320nt~約550ntのサイズ範囲の、分子バーコードおよび試料インデックスで非一意的にまたは一意的にタグ付けされた複数の核酸アンプリコンを生成する。一部の実施形態では、アンプリコンは、約180ntのサイズを有する。一部の実施形態では、アンプリコンは、約200ntのサイズを有する。
D.富化/捕捉
一部の実施形態では、配列は、核酸をシーケンシングする前に富化される。富化は、必要に応じて、特異的標的領域について実施されるかまたは非特異的に実施される(「標的配列」)。一部の実施形態では、目的の標的化された領域は、示差的タイリング(differential tiling)および捕捉スキームを使用して、1つまたは複数のベイトセットパネルについて選択された核酸捕捉用プローブ(「ベイト」)を用いて富化/捕捉され得る。示差的タイリングおよび捕捉スキームは一般に、異なる相対濃度のベイトセットを使用して、ベイトと会合するゲノム領域にわたって示差的に(例えば、異なる「分解能」で)タイリングし、制約のセット(例えば、シーケンサー制約、例えば、シーケンシング負荷、各ベイトの有用性等)に供し、標的化された核酸を下流のシーケンシングのために所望のレベルで捕捉する。目的のこれらの標的化されたゲノム領域は、必要に応じて、核酸構築物の天然のまたは合成のヌクレオチド配列を含む。一部の実施形態では、目的の1つまたは複数の領域に対するプローブを有するビオチン標識されたビーズが、標的配列を捕捉するために使用され得、必要に応じて、その後、目的の領域について富化するためにそれらの領域を増幅するために使用され得る。
一部の実施形態では、配列は、核酸をシーケンシングする前に富化される。富化は、必要に応じて、特異的標的領域について実施されるかまたは非特異的に実施される(「標的配列」)。一部の実施形態では、目的の標的化された領域は、示差的タイリング(differential tiling)および捕捉スキームを使用して、1つまたは複数のベイトセットパネルについて選択された核酸捕捉用プローブ(「ベイト」)を用いて富化/捕捉され得る。示差的タイリングおよび捕捉スキームは一般に、異なる相対濃度のベイトセットを使用して、ベイトと会合するゲノム領域にわたって示差的に(例えば、異なる「分解能」で)タイリングし、制約のセット(例えば、シーケンサー制約、例えば、シーケンシング負荷、各ベイトの有用性等)に供し、標的化された核酸を下流のシーケンシングのために所望のレベルで捕捉する。目的のこれらの標的化されたゲノム領域は、必要に応じて、核酸構築物の天然のまたは合成のヌクレオチド配列を含む。一部の実施形態では、目的の1つまたは複数の領域に対するプローブを有するビオチン標識されたビーズが、標的配列を捕捉するために使用され得、必要に応じて、その後、目的の領域について富化するためにそれらの領域を増幅するために使用され得る。
配列捕捉は、典型的には、標的核酸配列にハイブリダイズするオリゴヌクレオチドプローブの使用を含む。一部の実施形態では、プローブセット戦略は、目的の領域にわたってプローブをタイリングすることを含む。そのようなプローブは、例えば、長さが約60~約120ヌクレオチドであり得る。セットは、約2×、3×、4×、5×、6×、7×、8×、9×、10×、15×、20×、50×の、または50×よりも大きい深度(例えば、カバレッジの深度)を有し得る。配列捕捉の有効性は、一般に、プローブの配列に対して相補的な(またはほとんど相補的な)、標的分子中の配列の長さに一部依存する。
一部の実施形態では、富化されたDNA分子(または捕捉されたセット)は、配列可変標的領域セットおよびエピジェネティック標的領域セットに対応するDNAを含み得る。一部の実施形態では、捕捉された配列可変標的領域DNAの量は、標的化された領域のサイズ(フットプリントサイズ)の差異について正規化した場合、捕捉されたエピジェネティック標的領域DNAの量よりも多い。一部の実施形態では、その全体がこれにより参照により本明細書に組み込まれるPCT特許出願番号PCT/US2020/016120に記載される組成物、方法およびシステム。
あるいは、配列可変標的領域セットに対応するDNAおよびエピジェネティック標的領域セットに対応するDNAをそれぞれ含む、第1および第2の捕捉されたセットを提供してもよい。第1および第2の捕捉されたセットを組み合わせて、組み合わせた捕捉されたセットを提供してもよい。
上記で考察された組み合わせた捕捉されたセットを含む、配列可変標的領域セットおよびエピジェネティック標的領域セットに対応するDNAを含む捕捉されたセットにおいて、配列可変標的領域セットに対応するDNAは、エピジェネティック標的領域セットに対応するDNAよりも高い濃度で、例えば1.1~1.2倍高い濃度、1.2~1.4倍高い濃度、1.4~1.6倍高い濃度、1.6~1.8倍高い濃度、1.8~2.0倍高い濃度、2.0~2.2倍高い濃度、2.2~2.4倍高い濃度、2.4~2.6倍高い濃度、2.6~2.8倍高い濃度、2.8~3.0倍高い濃度、3.0~3.5倍高い濃度、3.5~4.0、4.0~4.5倍高い濃度、4.5~5.0倍高い濃度、5.0~5.5倍高い濃度、5.5~6.0倍高い濃度、6.0~6.5倍高い濃度、6.5~7.0倍高い、7.0~7.5倍高い濃度、7.5~8.0倍高い濃度、8.0~8.5倍高い濃度、8.5~9.0倍高い濃度、9.0~9.5倍高い濃度、9.5~10.0倍高い濃度、10~11倍高い濃度、11~12倍高い濃度、12~13倍高い濃度、13~14倍高い濃度、14~15倍高い濃度、15~16倍高い濃度、16~17倍高い濃度、17~18倍高い濃度、18~19倍高い濃度、または19~20倍高い濃度で存在し得る。濃度の差の程度は、定義の節で考察したように、標的領域のフットプリントサイズに関する正規化を説明する。
i.エピジェネティック標的領域セット
エピジェネティック標的領域セットは、新生物(例えば、腫瘍またはがん)細胞からのDNAを、健康な細胞、例えば非新生物循環細胞からのDNAとを区別する可能性がある1つまたは複数のタイプの標的領域を含み得る。そのような領域の例示的なタイプを、本明細書において詳細に考察する。一部の実施形態では、本開示に従う方法は、エピジェネティック標的領域セットに対応するcfDNA分子が、がん関連エピジェネティック改変(例えば、1つもしくは複数の高メチル化可変標的領域における高メチル化;CTCF結合の1つもしくは複数の摂動;および/または転写開始部位の1つもしくは複数の摂動)および/またはコピー数変動(例えば、局所的増幅)を含むかまたは示すかを決定するステップを含む。エピジェネティック標的領域セットはまた、例えば本明細書に記載される1つまたは複数の対照領域も含み得る。
エピジェネティック標的領域セットは、新生物(例えば、腫瘍またはがん)細胞からのDNAを、健康な細胞、例えば非新生物循環細胞からのDNAとを区別する可能性がある1つまたは複数のタイプの標的領域を含み得る。そのような領域の例示的なタイプを、本明細書において詳細に考察する。一部の実施形態では、本開示に従う方法は、エピジェネティック標的領域セットに対応するcfDNA分子が、がん関連エピジェネティック改変(例えば、1つもしくは複数の高メチル化可変標的領域における高メチル化;CTCF結合の1つもしくは複数の摂動;および/または転写開始部位の1つもしくは複数の摂動)および/またはコピー数変動(例えば、局所的増幅)を含むかまたは示すかを決定するステップを含む。エピジェネティック標的領域セットはまた、例えば本明細書に記載される1つまたは複数の対照領域も含み得る。
一部の実施形態では、エピジェネティック標的領域セットは、少なくとも100kb、例えば、少なくとも200kb、少なくとも300kb、または少なくとも400kbのフットプリントを有する。一部の実施形態では、エピジェネティック標的領域セットは、100~1000kb、例えば、100~200kb、200~300kb、300~400kb、400~500kb、500~600kb、600~700kb、700~800kb、800~900kb、および900~1,000kbの範囲のフットプリントを有する。
1.高メチル化可変標的領域
一部の実施形態では、エピジェネティック標的領域セットは、1つまたは複数の高メチル化可変標的領域を含む。一般的に、高メチル化可変標的領域は、観察されたメチル化レベルの増加が、試料(例えば、cfDNAの試料)が新生物細胞、例えば腫瘍またはがん細胞によって産生されるDNAを含有する可能性の増加を示す領域を指す。例えば、腫瘍抑制遺伝子のプロモーターの高メチル化は、繰り返し観察されている。例えば、Kang et al., Genome Biol. 18:53 (2017)およびそこに引用されている参考文献を参照されたい。
一部の実施形態では、エピジェネティック標的領域セットは、1つまたは複数の高メチル化可変標的領域を含む。一般的に、高メチル化可変標的領域は、観察されたメチル化レベルの増加が、試料(例えば、cfDNAの試料)が新生物細胞、例えば腫瘍またはがん細胞によって産生されるDNAを含有する可能性の増加を示す領域を指す。例えば、腫瘍抑制遺伝子のプロモーターの高メチル化は、繰り返し観察されている。例えば、Kang et al., Genome Biol. 18:53 (2017)およびそこに引用されている参考文献を参照されたい。
結腸直腸がんにおけるメチル化可変標的領域に関する広範な考察は、Lam et al., Biochim Biophys Acta. 1866:106-20 (2016)に提供される。これらは、VIM、SEPT9、ITGA4、OSM4、GATA4、およびNDRG4を含む。結腸直腸がん(CRC)の研究に基づく遺伝子またはその一部を含む高メチル化可変標的領域の例示的なセットを表1に提供する。これらの遺伝子の多くはおそらく、結腸直腸がん以外のがんに対しても関連を有し、例えばTP53は、極めて重要な腫瘍抑制因子として広く認識されており、この遺伝子の高メチル化に基づく不活化は、共通の腫瘍形成機構であり得る。
一部の実施形態では、高メチル化可変標的領域は、表1に記載の複数の遺伝子またはその一部、例えば、表1に記載の遺伝子またはその一部の少なくとも10%、20%、30%、40%、50%、60%、70%、80%、90%、または100%を含む。例えば、標的領域として含まれる各々の遺伝子座に関して、遺伝子の転写開始部位と終止コドン(代替的にスプライシングされる遺伝子に関しては最後の終止コドン)との間に結合するハイブリダイゼーション部位を有する1つまたは複数のプローブが存在し得る。一部の実施形態では、この1つまたは複数のプローブは、表1に記載の遺伝子またはその一部の上流および/または下流の300bp以内、例えば、200または100bp以内に結合する。
様々なタイプの肺がんにおけるメチル化可変標的領域は、例えば、Ooki et al., Clin. Cancer Res. 23:7141-52 (2017);Belinksy, Annu. Rev. Physiol. 77:453-74 (2015);Hulbert et al., Clin. Cancer Res. 23:1998-2005 (2017);Shi et al., BMC Genomics 18:901 (2017);Schneider et al., BMC Cancer. 11:102 (2011);Lissa et al., Transl Lung Cancer Res 5(5):492-504 (2016);Skvortsova et al., Br. J. Cancer. 94(10):1492-1495 (2006);Kim et al., Cancer Res. 61:3419-3424 (2001);Furonaka et al., Pathology International 55:303-309 (2005);Gomes et al., Rev. Port. Pneumol. 20:20-30 (2014);Kim et al., Oncogene. 20:1765-70 (2001);Hopkins-Donaldson et al., Cell Death Differ. 10:356-64 (2003);Kikuchi et al., Clin. Cancer Res. 11:2954-61 (2005);Heller et al., Oncogene 25:959-968 (2006);Licchesi et al., Carcinogenesis. 29:895-904 (2008);Guo et al., Clin. Cancer Res. 10:7917-24 (2004);Palmisano et al., Cancer Res. 63:4620-4625 (2003);およびToyooka et al., Cancer Res. 61:4556-4560, (2001)において詳細に考察されている。
肺がんの研究に基づく遺伝子またはその一部を含む例示的な高メチル化可変標的領域セットを表2に提供する。これらの遺伝子の多くはおそらく、肺がん以外のがんに対しても関連を有する可能性があり、例えばCasp8(カスパーゼ8)は、プログラム細胞死における重要な酵素であり、この遺伝子の高メチル化に基づく不活化は、肺がんに限定されない共通の腫瘍形成機構であり得る。加えて、いくつかの遺伝子が表1および表2の両方に出現し、一般性を示している。
表2において同定された標的領域に関する前述の実施形態のいずれかを、表1において同定された標的領域に関する上記の実施形態のいずれかと組み合わせてもよい。一部の実施形態では、高メチル化可変標的領域は、表1または表2に記載される複数の遺伝子またはその一部、例えば表1または表2に記載される遺伝子またはその一部の少なくとも10%、20%、30%、40%、50%、60%、70%、80%、90%、または100%を含む。
追加の高メチル化標的領域を、例えばがんゲノムアトラス(Cancer Genome Atlas)から得てもよい。Kang et al., Genome Biology 18:53 (2017)は、乳房、結腸、腎臓、肝臓、および肺からの高メチル化標的領域を使用してCancer Locatorと呼ばれる確率論的方法の構築を記載している。一部の実施形態では、高メチル化標的領域は、1つまたは複数のタイプのがんに対して特異的であり得る。したがって一部の実施形態では、高メチル化標的領域は、乳がん、結腸がん、腎臓がん、肝臓がん、および肺がんのうちの1つ、2つ、3つ、4つ、または5つにおいて高メチル化を集合的に示す高メチル化標的領域の1つ、2つ、3つ、4つ、または5つのサブセットを含む。
ii.低メチル化可変標的領域
グローバルな低メチル化は、様々ながんにおいて共通して観察される現象である。例えば、Hon et al., Genome Res. 22:246-258 (2012)(乳がん);Ehrlich, Epigenomics 1:239-259 (2009)(結腸がん、卵巣がん、前立腺がん、白血病、肝細胞がん、および子宮頸がんにおける低メチル化に関する知見を記載する総説論文)を参照されたい。例えば、反復エレメント、例えばLINE1エレメント、Aluエレメント、セントロメアタンデムリピート、傍セントロメアタンデムリピート、およびサテライトDNA等の領域、ならびに通常は健康な細胞中でメチル化されている遺伝子間領域は、腫瘍細胞中ではメチル化の低減を示し得る。したがって一部の実施形態では、エピジェネティック標的領域セットは、低メチル化可変標的領域を含み、観察されたメチル化レベルの減少は、試料(例えば、cfDNAの試料)が、新生物細胞、例えば腫瘍細胞またはがん細胞によって産生されたDNAを含有する可能性の増加を示している。
グローバルな低メチル化は、様々ながんにおいて共通して観察される現象である。例えば、Hon et al., Genome Res. 22:246-258 (2012)(乳がん);Ehrlich, Epigenomics 1:239-259 (2009)(結腸がん、卵巣がん、前立腺がん、白血病、肝細胞がん、および子宮頸がんにおける低メチル化に関する知見を記載する総説論文)を参照されたい。例えば、反復エレメント、例えばLINE1エレメント、Aluエレメント、セントロメアタンデムリピート、傍セントロメアタンデムリピート、およびサテライトDNA等の領域、ならびに通常は健康な細胞中でメチル化されている遺伝子間領域は、腫瘍細胞中ではメチル化の低減を示し得る。したがって一部の実施形態では、エピジェネティック標的領域セットは、低メチル化可変標的領域を含み、観察されたメチル化レベルの減少は、試料(例えば、cfDNAの試料)が、新生物細胞、例えば腫瘍細胞またはがん細胞によって産生されたDNAを含有する可能性の増加を示している。
一部の実施形態では、低メチル化可変標的領域は、反復エレメントおよび/または遺伝子間領域を含む。一部の実施形態では、反復エレメントは、LINE1エレメント、Aluエレメント、セントロメアタンデムリピート、傍セントロメアタンデムリピート、および/またはサテライトDNAのうちの1つ、2つ、3つ、4つ、または5つを含む。
がん関連低メチル化を示す例示的な特定のゲノム領域は、例えばhg19またはhg38ヒトゲノム構築物に従って、ヒト第1染色体のヌクレオチド8403565~8953708および151104701~151106035を含む。一部の実施形態では、低メチル化可変標的領域は、重複するか、またはこれらの領域の1つもしくは両方を含む。
iii.CTCF結合領域
CTCFは、クロマチンの組織化に寄与し、しばしばコヒーシンと共局在するDNA結合タンパク質である。CTCF結合部位の摂動は、多様な異なるがんにおいて報告されている。例えば、2015年6月8日にオンライン発行された、Katainen et al., Nature Genetics, doi:10.1038/ng.3335;Guo et al., Nat. Commun. 9:1520 (2018)を参照されたい。CTCF結合は、シーケンシングによって、例えば断片長解析を通して検出することができる、cfDNAの認識可能なパターンをもたらす。例えば、シーケンシングに基づく断片長解析に関する詳細は、その各々が参照により本明細書に組み込まれる、Snyder et al., Cell 164:57-68 (2016);WO2018/009723号;および米国特許出願公開第20170211143A1号に提供されている。
CTCFは、クロマチンの組織化に寄与し、しばしばコヒーシンと共局在するDNA結合タンパク質である。CTCF結合部位の摂動は、多様な異なるがんにおいて報告されている。例えば、2015年6月8日にオンライン発行された、Katainen et al., Nature Genetics, doi:10.1038/ng.3335;Guo et al., Nat. Commun. 9:1520 (2018)を参照されたい。CTCF結合は、シーケンシングによって、例えば断片長解析を通して検出することができる、cfDNAの認識可能なパターンをもたらす。例えば、シーケンシングに基づく断片長解析に関する詳細は、その各々が参照により本明細書に組み込まれる、Snyder et al., Cell 164:57-68 (2016);WO2018/009723号;および米国特許出願公開第20170211143A1号に提供されている。
このように、CTCF結合の摂動は、cfDNAの断片化パターンの変動をもたらす。そのため、CTCF結合部位は、1つのタイプの断片化可変標的領域を表す。
多くの公知のCTCF結合部位が存在する。例えば、インターネット上のinsulatordb.uthsc.edu/で入手可能であるCTCFBSDB(CTCF Binding Site Database);Cuddapah et al., Genome Res. 19:24-32 (2009);Martin et al., Nat. Struct. Mol. Biol. 18:708-14 (2011);Rhee et al., Cell. 147:1408-19 (2011)を参照されたく、それらはその各々が参照により本明細書に組み込まれる。例示的なCTCF結合部位は、hg19またはhg38ヒトゲノム構築物に従って、第8染色体上のヌクレオチド56014955~56016161および第13染色体上のヌクレオチド95359169~95360473である。
したがって、一部の実施形態では、エピジェネティック標的領域セットは、CTCF結合領域を含む。一部の実施形態では、CTCF結合領域は、少なくとも10、20、50、100、200、もしくは500個のCTCF結合領域、または10~20、20~50、50~100、100~200、200~500、もしくは500~1000個のCTCF結合領域、例えば上記のまたはCTCFBSDBもしくは上記で引用したCuddapahら、Martinら、もしくはRheeらの論文の1つもしくは複数におけるCTCF結合領域を含む。
一部の実施形態では、CTCF部位の少なくとも一部はメチル化されていてもメチル化されていなくてもよく、メチル化状態は、細胞ががん細胞であるか否かと相関する。一部の実施形態では、エピジェネティック標的領域セットは、CTCF結合部位の少なくとも100bp、少なくとも200bp、少なくとも300bp、少なくとも400bp、少なくとも500bp、少なくとも750bp、少なくとも1000bp上流および/または下流の領域を含む。
iv.転写開始部位
転写開始部位もまた、新生物細胞において摂動を示し得る。例えば、造血系列の健康な細胞における様々な転写開始部位でのヌクレオソーム組織化は、健康な個体におけるcfDNAに実質的に寄与するが、新生物細胞におけるそれらの転写開始部位でのヌクレオソーム組織化とは異なり得る。これは、異なるcfDNAパターンをもたらすが、これらは例えば、一般的にSnyder et al., Cell 164:57-68 (2016);WO2018/009723号;および米国特許出願公開第20170211143A1号において考察されるように、シーケンシングによって検出することができる。
転写開始部位もまた、新生物細胞において摂動を示し得る。例えば、造血系列の健康な細胞における様々な転写開始部位でのヌクレオソーム組織化は、健康な個体におけるcfDNAに実質的に寄与するが、新生物細胞におけるそれらの転写開始部位でのヌクレオソーム組織化とは異なり得る。これは、異なるcfDNAパターンをもたらすが、これらは例えば、一般的にSnyder et al., Cell 164:57-68 (2016);WO2018/009723号;および米国特許出願公開第20170211143A1号において考察されるように、シーケンシングによって検出することができる。
このように、転写開始部位の摂動もまた、cfDNAの断片化パターンの変動をもたらす。そのため、転写開始部位もまた、1つのタイプの断片化可変標的領域を表す。
ヒト転写開始部位は、インターネット上のdbtss.hgc.jpで利用可能なDBTSS(DataBase of Human Transcription Start Sites)から入手可能であり、参照により本明細書に組み込まれる、Yamashita et al., Nucleic Acids Res. 34(Database issue): D86-D89 (2006)に記載されている。
したがって、一部の実施形態では、エピジェネティック標的領域セットは、転写開始部位を含む。一部の実施形態では、転写開始部位は、少なくとも10、20、50、100、200、もしくは500個の転写開始部位、または10~20、20~50、50~100、100~200、200~500、もしくは500~1000個の転写開始部位、例えばDBTSSに記載される転写開始部位を含む。一部の実施形態では、転写開始部位の少なくとも一部はメチル化されていてもメチル化されていなくてもよく、メチル化状態は、細胞ががん細胞であるか否かと相関する。一部の実施形態では、エピジェネティック標的領域セットは、転写開始部位の少なくとも100bp、少なくとも200bp、少なくとも300bp、少なくとも400bp、少なくとも500bp、少なくとも750bp、少なくとも1000bp上流および/または下流の領域を含む。
v.コピー数変動;局所的増幅
局所的増幅等のコピー数変動は、体細胞変異であるが、これらは、メチル化の変化等のある特定のエピジェネティック変化を検出するためのアプローチと類似の様式でリード頻度に基づきシーケンシングによって検出することができる。そのため、がんにおける局所的増幅等のコピー数変動を示し得る領域を、エピジェネティック標的領域セットに含めることができ、そうした領域は、AR、BRAF、CCND1、CCND2、CCNE1、CDK4、CDK6、EGFR、ERBB2、FGFR1、FGFR2、KIT、KRAS、MET、MYC、PDGFRA、PIK3CA、およびRAF1のうちの1つまたは複数を含み得る。例えば一部の実施形態では、エピジェネティック標的領域セットは、前述の標的の少なくとも2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、または18個を含む。
局所的増幅等のコピー数変動は、体細胞変異であるが、これらは、メチル化の変化等のある特定のエピジェネティック変化を検出するためのアプローチと類似の様式でリード頻度に基づきシーケンシングによって検出することができる。そのため、がんにおける局所的増幅等のコピー数変動を示し得る領域を、エピジェネティック標的領域セットに含めることができ、そうした領域は、AR、BRAF、CCND1、CCND2、CCNE1、CDK4、CDK6、EGFR、ERBB2、FGFR1、FGFR2、KIT、KRAS、MET、MYC、PDGFRA、PIK3CA、およびRAF1のうちの1つまたは複数を含み得る。例えば一部の実施形態では、エピジェネティック標的領域セットは、前述の標的の少なくとも2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、または18個を含む。
iv.メチル化対照領域
データの検証を容易にするために対照領域を含めることは有用であり得る。一部の実施形態では、エピジェネティック標的領域セットは、DNAががん細胞または正常細胞に由来するか否かにかかわらず、本質的に全ての試料においてメチル化されているまたはメチル化されていないと予想される対照領域を含む。一部の実施形態では、エピジェネティック標的領域セットは、本質的に全ての試料において低メチル化されると予想される対照低メチル化領域を含む。一部の実施形態では、エピジェネティック標的領域セットは、本質的に全ての試料において高メチル化されると予想される対照高メチル化領域を含む。
データの検証を容易にするために対照領域を含めることは有用であり得る。一部の実施形態では、エピジェネティック標的領域セットは、DNAががん細胞または正常細胞に由来するか否かにかかわらず、本質的に全ての試料においてメチル化されているまたはメチル化されていないと予想される対照領域を含む。一部の実施形態では、エピジェネティック標的領域セットは、本質的に全ての試料において低メチル化されると予想される対照低メチル化領域を含む。一部の実施形態では、エピジェネティック標的領域セットは、本質的に全ての試料において高メチル化されると予想される対照高メチル化領域を含む。
b.配列可変標的領域セット
一部の実施形態では、配列可変標的領域セットは、がんにおいて体細胞変異(本明細書においてがん関連変異と呼ぶ)を受けることが公知である複数の領域を含む。したがって、方法は、配列可変標的領域セットに対応するcfDNA分子ががん関連変異を含むか否かを決定するステップを含み得る。
一部の実施形態では、配列可変標的領域セットは、がんにおいて体細胞変異(本明細書においてがん関連変異と呼ぶ)を受けることが公知である複数の領域を含む。したがって、方法は、配列可変標的領域セットに対応するcfDNA分子ががん関連変異を含むか否かを決定するステップを含み得る。
一部の実施形態では、配列可変標的領域セットは、がんを有する対象の既定の比率が、パネルにおける1つまたは複数の異なる遺伝子またはゲノム領域において遺伝子バリアントまたは腫瘍マーカーを示すように選択される複数の異なる遺伝子またはゲノム領域(「パネル」)を標的とする。パネルは、シーケンシング領域を固定数の塩基対に限定するように選択され得る。パネルは、例えば、本明細書において他所で記載されるようにプローブの親和性および/または量を調節することによって、DNAの所望の量をシーケンシングするように選択され得る。パネルはさらに、所望の配列リードの深度を達成するように選択され得る。パネルは、シーケンシングされた塩基対の量に関して所望の配列リード深度または配列リードカバレッジを達成するように選択され得る。パネルは、試料中の1つまたは複数の遺伝子バリアントの検出に関して、理論的感度、理論的特異度、および/または理論的精度を達成するように選択され得る。
領域のパネルを検出するためのプローブは、目的のゲノム領域(ホットスポット領域)ならびにヌクレオソーム認識プローブ(例えば、KRASコドン12および13)を検出するためのプローブを含み得、ヌクレオソーム結合パターンおよびGC配列組成によって影響を受けるcfDNAカバレッジおよび断片サイズ変動の解析に基づいて捕捉を最適化するように設計され得る。本明細書において使用される領域はまた、ヌクレオソーム位置およびGCモデルに基づいて最適化された非ホットスポット領域も含み得る。
目的のゲノム位置の一覧の例は、表3および表4に見出され得る。一部の実施形態では、本開示の方法において使用される配列可変標的領域セットは、表3の遺伝子の少なくとも5個、少なくとも10個、少なくとも15個、少なくとも20個、少なくとも25個、少なくとも30個、少なくとも35個、少なくとも40個、少なくとも45個、少なくとも50個、少なくとも55個、少なくとも60個、少なくとも65個、または70個のうちの少なくとも一部を含む。一部の実施形態では、本開示の方法において使用される配列可変標的領域セットは、表3のSNVの少なくとも5個、少なくとも10個、少なくとも15個、少なくとも20個、少なくとも25個、少なくとも30個、少なくとも35個、少なくとも40個、少なくとも45個、少なくとも50個、少なくとも55個、少なくとも60個、少なくとも65個、または70個を含む。一部の実施形態では、本開示の方法において使用される配列可変標的領域セットは、表3の融合の少なくとも1個、少なくとも2個、少なくとも3個、少なくとも4個、少なくとも5個、または6個を含む。一部の実施形態では、本開示の方法において使用される配列可変標的領域セットは、表3のインデルの少なくとも1個、少なくとも2個、または3個のうちの少なくとも一部を含む。一部の実施形態では、本開示の方法において使用される配列可変標的領域セットは、表4の遺伝子の少なくとも5個、少なくとも10個、少なくとも15個、少なくとも20個、少なくとも25個、少なくとも30個、少なくとも35個、少なくとも40個、少なくとも45個、少なくとも50個、少なくとも55個、少なくとも60個、少なくとも65個、少なくとも70個、または73個のうちの少なくとも一部を含む。一部の実施形態では、本開示の方法において使用される配列可変標的領域セットは、表4のSNVの少なくとも5個、少なくとも10個、少なくとも15個、少なくとも20個、少なくとも25個、少なくとも30個、少なくとも35個、少なくとも40個、少なくとも45個、少なくとも50個、少なくとも55個、少なくとも60個、少なくとも65個、少なくとも70個、または73個を含む。一部の実施形態では、本開示の方法において使用される配列可変標的領域セットは、表4の融合の少なくとも1個、少なくとも2個、少なくとも3個、少なくとも4個、少なくとも5個、または6個を含む。一部の実施形態では、本開示の方法において使用される配列可変標的領域セットは、表4のインデルの少なくとも1個、少なくとも2個、少なくとも3個、少なくとも4個、少なくとも5個、少なくとも6個、少なくとも7個、少なくとも8個、少なくとも9個、少なくとも10個、少なくとも11個、少なくとも12個、少なくとも13個、少なくとも14個、少なくとも15個、少なくとも16個、少なくとも17個、または18個のうちの少なくとも一部を含む。目的のこれらのゲノム位置の各々は、所与のパネルに関する骨格領域またはホットスポット領域として同定され得る。目的のホットスポットゲノム位置の一覧の例は、表5に見出され得る。表5における座標は、ヒトゲノムのhg19アセンブリに基づくが、当業者は他のアセンブリにも通じており、その選択されるアセンブリにおいて示されるエクソン、イントロン、コドン等に対応する座標セットを同定することができる。一部の実施形態では、本開示の方法において使用される配列可変標的領域セットは、表5の遺伝子の少なくとも1個、少なくとも2個、少なくとも3個、少なくとも4個、少なくとも5個、少なくとも6個、少なくとも7個、少なくとも8個、少なくとも9個、少なくとも10個、少なくとも11個、少なくとも12個、少なくとも13個、少なくとも14個、少なくとも15個、少なくとも16個、少なくとも17個、少なくとも18個、少なくとも19個、または少なくとも20個のうちの少なくとも一部を含む。各々のホットスポットゲノム領域を、関連する遺伝子、それが存在する染色体、遺伝子座を表すゲノムの開始位置および終止位置、遺伝子座の塩基対の長さ、遺伝子によってカバーされるエクソン、ならびに目的の所与のゲノム領域が捉えようとし得る重要な特色(例えば、変異のタイプ)を含むいくつかの特徴と共に記載する。
加えてまたはあるいは、適した標的領域セットは、文献から入手可能である。例えば、参照により本明細書に組み込まれる、Gale et al., PLoS One 13: e0194630 (2018)は、配列可変標的領域セットの一部または全てとして使用することができる35個のがんに関係する遺伝子標的のパネルを記載している。これらの35個の標的は、AKT1、ALK、BRAF、CCND1、CDK2A、CTNNB1、EGFR、ERBB2、ESR1、FGFR1、FGFR2、FGFR3、FOXL2、GATA3、GNA11、GNAQ、GNAS、HRAS、IDH1、IDH2、KIT、KRAS、MED12、MET、MYC、NFE2L2、NRAS、PDGFRA、PIK3CA、PPP2R1A、PTEN、RET、STK11、TP53、およびU2AF1である。
一部の実施形態では、配列可変標的領域セットは、少なくとも10、20、30、または35個のがんに関係する遺伝子、例えば上記のがんに関係する遺伝子からの標的領域を含む。
E.シーケンシング
必要に応じてアダプターが隣接する試料核酸は、事前の増幅を伴いまたは伴わずに、一般にシーケンシングに供される。シーケンシング法または必要に応じて利用される市販のフォーマットには、例えばSangerシーケンシング、ハイスループットシーケンシング、パイロシーケンシング、合成によるシーケンシング、単分子シーケンシング、ナノポアに基づくシーケンシング、半導体シーケンシング、ライゲーションによるシーケンシング、ハイブリダイゼーションによるシーケンシング、RNA-Seq(Illumina)、Digital Gene Expression(Helicos)、次世代シーケンシング(NGS)、合成による単分子シーケンシング(SMSS)(Helicos)、大規模並列シーケンシング、Clonal Single Molecule Array(Solexa)、ショットガンシーケンシング、Ion Torrent、Oxford Nanopore、Roche Genia、マキサム-ギルバートシーケンシング、プライマーウォーキング、PacBio、SOLiD、Ion Torrent、またはNanoporeプラットフォームを使用するシーケンシングが含まれる。シーケンシング反応は種々の試料処理ユニットで実施することができ、その中には複数のレーン、複数のチャネル、複数のウェル、または実質的に同時に複数の試料のセットを処理するその他の手段が含まれ得る。試料処理ユニットには、複数の試行を同時に処理することができる複数の試料チャンバーも含まれ得る。
必要に応じてアダプターが隣接する試料核酸は、事前の増幅を伴いまたは伴わずに、一般にシーケンシングに供される。シーケンシング法または必要に応じて利用される市販のフォーマットには、例えばSangerシーケンシング、ハイスループットシーケンシング、パイロシーケンシング、合成によるシーケンシング、単分子シーケンシング、ナノポアに基づくシーケンシング、半導体シーケンシング、ライゲーションによるシーケンシング、ハイブリダイゼーションによるシーケンシング、RNA-Seq(Illumina)、Digital Gene Expression(Helicos)、次世代シーケンシング(NGS)、合成による単分子シーケンシング(SMSS)(Helicos)、大規模並列シーケンシング、Clonal Single Molecule Array(Solexa)、ショットガンシーケンシング、Ion Torrent、Oxford Nanopore、Roche Genia、マキサム-ギルバートシーケンシング、プライマーウォーキング、PacBio、SOLiD、Ion Torrent、またはNanoporeプラットフォームを使用するシーケンシングが含まれる。シーケンシング反応は種々の試料処理ユニットで実施することができ、その中には複数のレーン、複数のチャネル、複数のウェル、または実質的に同時に複数の試料のセットを処理するその他の手段が含まれ得る。試料処理ユニットには、複数の試行を同時に処理することができる複数の試料チャンバーも含まれ得る。
シーケンシング反応は、がんのまたは他の疾患のマーカーを含むことが公知の1つまたは複数の核酸断片型または領域に対して実施され得る。シーケンシング反応は、試料中に存在する任意の核酸断片に対しても実施され得る。配列反応は、ゲノムの少なくとも約5%、10%、15%、20%、25%、30%、40%、50%、60%、70%、80%、90%、95%、99%、99.9%または100%に対して実施され得る。他の例では、配列反応は、ゲノムの約5%、10%、15%、20%、25%、30%、40%、50%、60%、70%、80%、90%、95%、99%、99.9%または100%未満に対して実施され得る。
同時シーケンシング反応は、多重シーケンシング手法を使用して実施してよい。一部の実施形態では、無細胞ポリヌクレオチドは、少なくとも約1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、50000、または100,000回のシーケンシング反応によってシーケンシングされる。他の実施形態では、無細胞ポリヌクレオチドは、約1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、50000、または100,000回未満のシーケンシング反応によってシーケンシングされる。シーケンシング反応は、典型的には逐次的にまたは同時に実施される。その後のデータ解析は一般にシーケンシング反応の全部または一部について実施される。一部の実施形態では、データ解析は少なくとも約1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、50000、または100,000回のシーケンシング反応について実施される。他の実施形態では、データ解析は約1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、50000、または100,000回未満のシーケンシング反応について実施してよい。リード深度の例は、遺伝子座(例えば塩基の位置)あたり約1000~約50000リードである。
F.解析
シーケンシングは、複数のシーケンシングリードまたはリードを生成し得る。シーケンシングリードまたはリードは、長さが約150塩基未満または長さが約90塩基未満のヌクレオチドデータの配列を含み得る。一部の実施形態では、リードは、長さが約80塩基と約90塩基との間、例えば、約85塩基である。一部の実施形態では、本開示の方法は、例えば、長さが約50塩基または約30塩基未満の非常に短いリードに適用される。シーケンシングリードデータは、配列データおよびメタ情報を含み得る。配列リードデータは、例えば、VCFファイル、FASTAファイルまたはFASTQファイルを含む任意の好適なファイルフォーマットで記憶することができる。
シーケンシングは、複数のシーケンシングリードまたはリードを生成し得る。シーケンシングリードまたはリードは、長さが約150塩基未満または長さが約90塩基未満のヌクレオチドデータの配列を含み得る。一部の実施形態では、リードは、長さが約80塩基と約90塩基との間、例えば、約85塩基である。一部の実施形態では、本開示の方法は、例えば、長さが約50塩基または約30塩基未満の非常に短いリードに適用される。シーケンシングリードデータは、配列データおよびメタ情報を含み得る。配列リードデータは、例えば、VCFファイル、FASTAファイルまたはFASTQファイルを含む任意の好適なファイルフォーマットで記憶することができる。
FASTAは、配列データベースを検索するためのコンピュータプログラムを指し得、FASTAという名称は標準ファイルフォーマットをも指し得る。例えば、FASTAは、例えばその全体がこれにより参照により本明細書に組み込まれる、Pearson & Lipman, 1988, Improved tools for biological sequence comparison, PNAS 85:2444-2448に記載されている。FASTAフォーマットにおける配列は1行の説明で始まり、複数行の配列データが続く。説明行は第1欄における「より大(>)」符号によって配列データから区別される。「>」符号に続く単語は配列の識別子であり、行の残りは説明である(いずれも任意)。「>」と識別子の第1文字との間にスペースがあってはならない。テキストのすべての行は80字より短いことが推奨されている。「>」で始まる別の行が現れた場合には配列は終了する。これは別の配列の始まりを示す。
FASTQフォーマットは、生物学的配列(通常、ヌクレオチド配列)とそれに対応する品質スコアとの両方を記憶するための、テキストに基づくフォーマットである。これはFASTAフォーマットに類似しているが、配列データに続く品質スコアを有する。簡略のため、配列文字と品質スコアの両方が単一のASCII文字によってコードされている。FASTQフォーマットは、例えば、これにより全体が参照により本明細書に組み込まれる、Cock et al. (“The Sanger FASTQ file format for sequences with quality scores, and the Solexa/Illumina FASTQ variants,” Nucleic Acids Res 38(6):1767-1771, 2009)に記載されているIlluminaのGenome Analyzer等のハイスループットシーケンシング装置の出力を記憶するための事実上の標準である。
FASTAおよびFASTQのファイルについて、メタ情報は説明行を含み、配列データの行を含まない。一部の実施形態では、FASTQファイルについて、メタ情報は品質スコアを含む。FASTAおよびFASTQのファイルについて、配列データは説明行の後に始まり、典型的には必要に応じて「-」を有するIUPAC多義コードのあるサブセットを使用して存在する。一実施形態では、配列データは、必要に応じて任意に「-」またはU(例えばギャップまたはウラシルを表わす)を含むA、T、C、G、およびN文字を使用し得る。
一部の実施形態では、少なくとも1つのマスター配列リードファイルおよび出力ファイルが、(例えばASCII、ISO/IEC 646、EBCDIC、UTF-8、またはUTF-16等のコーディングを使用して)プレインテキストファイルとして記憶される。本開示によって提供されるコンピュータシステムは、プレインテキストファイルを開くことができるテキストエディタープログラムを含み得る。テキストエディタープログラムは、コンピュータスクリーン上にテキストファイル(例えばプレインテキストファイル)の内容を提示して、(例えばモニター、キーボード、およびマウスを使用して)人がテキストを編集することを可能にすることができるコンピュータプログラムを意味し得る。テキストエディターの例には、限定なくMicrosoft Word、emacs、pico、vi、BBEdit、およびTextWranglerが含まれる。テキストエディタープログラムは、コンピュータスクリーン上にプレインテキストファイルを表示し、メタ情報および配列リードを人が読めるフォーマットで(例えばバイナリーコードでなく、その代わりに印刷または手書きで使用されるような英数字を使用して)示すことができる。
FASTAまたはFASTQファイルを参照して方法を論じたが、本開示の方法およびシステムは、例えばVariant Call Format(VCF)フォーマットのファイルを含む任意の好適な配列ファイルフォーマットを圧縮するために使用し得る。典型的なVCFファイルは、ヘッダーセクションとデータセクションとを含み得る。ヘッダーは、それぞれが文字「##」で始まる任意の数のメタ情報行、および単一の「#」文字で始まるTABで区切られたフィールド定義行を含む。フィールド定義行は必須の8個の欄を命名し、ボディセクションはフィールド定義行によって定義された欄を埋めるデータの行を含有する。VCFフォーマットは、例えばこれによりその全体がこれにより参照により組み込まれる、Danecek et al. ("The variant call format and VCF tools," Bioinformatics 27(15):2156-2158, 2011)に記載されている。ヘッダーセクションは圧縮されたファイルに書き込むメタ情報として処理され得、データセクションはそのそれぞれが固有のものであった場合のみにマスターファイルに記憶される行として処理され得る。
一部の実施形態は、シーケンシングリードのアセンブリを提供する。例えば、アラインメントによるアセンブリでは、シーケンシングリードは相互にアラインメントされるか、または参照配列に対してアラインメントされる。それぞれのリードを今度は参照ゲノムに対してアラインメントすることによって、リードのすべてが相互の関係において位置決めされてアセンブリが生成される。さらに、シーケンシングリードを参照配列に対してアラインメントする、またはマッピングすることは、シーケンシングリード内のバリアント配列を同定するためにも使用され得る。本明細書に記載した方法およびシステムと組み合わせてバリアント配列を同定することを使用して、疾患もしくは状態の診断もしくは予後判定をさらに助け、または処置の決定を導くことができる。
一部の実施形態では、ステップのいずれかまたはすべては自動化される。あるいは、本開示の方法は、全体としてまたは部分的に、例えばそれぞれが必要に応じてC++等のコンパイラ型言語で書かれ、次いでコンパイルされバイナリとして配布される1つまたは複数の専用プログラムに具現化してもよい。本開示の方法は、全体としてまたは部分的に、既存の配列解析プラットフォーム内のモジュールとして、またはその内の機能を呼び出すことによって、実装してもよい。一部の実施形態では、本開示の方法は、すべてが単一の開始キュー(例えば、人の活動、別のコンピュータプログラム、または機械に起因する誘発事象の1つまたは組合せ)に応答して自動的に呼び出されるいくつかのステップを含む。したがって、本開示は、ステップのいずれかまたはステップの任意の組合せがキューに応答して自動的に起こり得る方法を提供する。「自動的に」は一般に、介在する人の入力、影響、または相互作用がないこと(例えば、元のまたはキュー以前の人の活動にのみ応答すること)を意味する。
本開示の方法は、対象の核酸試料の正確かつ感度の良い解釈を含む種々の形態の出力をも包含し得る。検索の出力はコンピュータファイルのフォーマットで提供され得る。一部の実施形態では、出力はFASTAファイル、FASTQファイル、またはVCFファイルである。出力を処理してテキストファイル、または、例えば、核酸の配列を参照ゲノムの配列にアラインメントさせた配列データを含有するXMLファイルを生成させてもよい。他の実施形態では、処理によって参照ゲノムに対する対象核酸の1つまたは複数の変異を記述する座標またはストリングを含有する出力が得られる。アラインメントストリングには、Simple UnGapped Alignment Report(SUGAR)、Verbose Useful Labeled Gapped Alignment Report(VULGAR)、およびCompact Idiosyncratic Gapped Alignment Report(CIGAR)(例えばこれにより全体が参照により本明細書に組み込まれる、Ning et al., Genome Research 11(10):1725-9, 2001に記載されている)が含まれ得る。これらのストリングは、例えばEuropean Bioinformatics Institute(Hinxton、UK)のExonerate配列アラインメントソフトウェアで実装され得る。
一部の実施形態では、例えばCIGARストリングを含む配列アラインメントマップ(SAM)またはバイナリアラインメントマップ(BAM)ファイル等の配列アラインメントが生成される(SAMフォーマットは、例えば、これにより全体が参照により本明細書に組み込まれる、Li et al., “The Sequence Alignment/Map format and SAMtools,” Bioinformatics, 25(16):2078-9, 2009に記載されている)。一部の実施形態では、CIGARは1行あたり1個のギャップアラインメントを呈示しまたは含む。CIGARは、CIGARストリングとして報告される圧縮されたペアワイズアラインメントフォーマットである。CIGARストリングは、長い(例えばゲノムの)ペアワイズアラインメントを表わすのに有用であろう。CIGARストリングは、参照ゲノム配列に対するリードのアラインメントを表わすSAMフォーマットで使用され得る。
CIGARストリングは、確立されたモチーフに従い得る。それぞれの文字の前には事象のベースカウントを与える数字がある。使用する文字にはM、I、D、N、およびSが含まれ得る(M=マッチ、I=挿入、D=欠失、N=ギャップ、S=置換)。CIGARストリングは、マッチ/ミスマッチおよび欠失(またはギャップ)の配列を定義する。例えば、CIGARストリング2MD3M2D2Mは、アラインメントが2つのマッチ、1つの欠失(いくらかスペースを節約するため、数字1は省略する)、3つのマッチ、2つの欠失、および2つのマッチを含むことを示し得る。
一部の実施形態では、一方または両方の末端に一本鎖のオーバーハングを有する二本鎖核酸に平滑末端を酵素的に形成することによるシーケンシングのための核酸の集団が調製される。これらの実施形態では、集団は典型的にはヌクレオチド(例えばA、C、G、およびTまたはU)の存在下に5’-3’DNAポリメラーゼ活性および3’-5’エキソヌクレアーゼ活性を有する酵素で処理される。必要に応じて使用され得る酵素またはその触媒断片の例には、Klenow大断片およびT4ポリメラーゼが含まれる。5’オーバーハングでは、酵素は典型的には対向するストランドの上の後退した3’末端を、それが5’末端と重なって平滑末端を生成するまで伸長する。3’オーバーハングでは、酵素は一般に3’末端から対向するストランドの5’末端まで、時にはそれを越えて、消化する。この消化が対向するストランドの5’末端を越えて進めば、ギャップは5’オーバーハングに使用する同じポリメラーゼ活性を有する酵素によってフィルインされ得る。二本鎖核酸における平滑末端の形成により、例えばアダプターの結合およびその後の増幅が容易になる。
一部の実施形態では、核酸の集団はさらなる処理、例えば一本鎖核酸から二本鎖核酸への変換および/またはRNAからDNA(例えば相補的DNA、即ちcDNA)への変換に供される。これらの形態の核酸も、必要に応じてアダプターに連結され、増幅される。
事前の増幅ありとなしで、上記の平滑末端を形成するプロセスに供する核酸、および必要に応じて試料中の他の核酸をシーケンシングして、シーケンシングされた核酸を産生することができる。シーケンシングされた核酸は、核酸の配列(例えば配列情報)、またはその配列が決定された核酸と称し得る。シーケンシングは、試料中の個々の核酸分子の増幅産物のコンセンサス配列から直接または間接的に試料中の個々の核酸分子の配列データを提供するように、実施することができる。
一部の実施形態では、平滑末端の形成の後の試料中の一本鎖オーバーハングを有する二本鎖核酸は、バーコードを含むアダプターに両末端で連結され、シーケンシングは核酸配列およびアダプターによって導入されたインラインバーコードを決定する。平滑末端DNA分子は、必要に応じて、少なくとも部分的に二本鎖のアダプター(例えばY字形またはベル形のアダプター)の平滑末端にライゲーションされる。あるいは、試料核酸およびアダプターの平滑末端に相補的ヌクレオチドのテイルを付けてライゲーションを容易にする(例えば付着末端ライゲーションのため)ことができる。
核酸試料は、典型的には同じ核酸の任意の2つのコピーが両末端に連結されたアダプターからの同じアダプターバーコードの組合せを受ける確率が低くなる(例えば約1または0.1%未満)ように、十分な数のアダプターと接触させられる。このようにしてアダプターを使用することにより、参照核酸上の同じ出発点および停止点を有し、同じバーコードの組合せに連結された核酸配列のファミリーの特定が可能になる。そのようなファミリーは、増幅前の試料中の核酸の増幅産物の配列を表わし得る。ファミリーメンバーの配列をコンパイルして、平滑末端の形成およびアダプターの結合によって改変された元の試料中の核酸分子のコンセンサスヌクレオチドまたは完全なコンセンサス配列を誘導することができる。換言すれば、試料中の核酸の特定された位置を占めるヌクレオチドは、ファミリーメンバー配列における対応する位置を占めるヌクレオチドのコンセンサスであると決定することができる。ファミリーには、二本鎖核酸の一方または両方のストランドの配列が含まれ得る。ファミリーのメンバーが二本鎖核酸からの両方のストランドの配列を含むならば、配列をコンパイルしてコンセンサスヌクレオチドまたは配列を誘導する目的のために、1つのストランドの配列をその相補体に変換することができる。いくつかのファミリーは単一メンバーの配列のみを含む。この場合には、この配列は増幅前の試料中の核酸の配列とみなすことができる。あるいは、単一メンバー配列のみを有するファミリーを、その後の解析から除外してもよい。
シーケンシングされた核酸におけるヌクレオチドの変動(例えばSNVまたはインデル)は、シーケンシングされた核酸を参照配列と比較することによって決定することができる。参照配列は既知の配列、例えば対象からの既知の全部または一部のゲノム配列(例えばヒト対象の全ゲノム配列)であることが多い。参照配列は、例えばhG19またはhG38であってよい。上記のように、シーケンシングされた核酸は、試料中の核酸について直接決定された配列、またはそのような核酸の増幅産物の配列のコンセンサスを表わし得る。比較は、参照配列の1つまたは複数の指定された位置で実施することができる。シーケンシングされた核酸のサブセットは、それぞれの配列が最大限にアラインメントされた場合に、参照配列の指定された位置に対応する位置を含んで特定することができる。そのようなサブセットの中で、シーケンシングされた核酸がもしあれば、指定された位置にヌクレオチドの変動を含むか、必要に応じてもしあれば、参照ヌクレオチドを含む(例えば参照配列と同じ)かを、決定することができる。ヌクレオチドバリアントを含むサブセット中のシーケンシングされた核酸の数が選択した閾値を超えれば、バリアントヌクレオチドを指定された位置においてコールすることができる。閾値は、他の可能性の中でも、ヌクレオチドバリアントを含むサブセットの中の少なくとも1、2、3、4、5、6、7、8、9、もしくは10個等のシーケンシングされた核酸の単純な数であってもよく、またはヌクレオチドバリアントを含むサブセットの中のシーケンシングされた核酸の少なくとも0.5、1、2、3、4、5、10、15、もしくは20等の比であってもよい。参照配列の中の任意の指定された目的の位置について、比較を繰り返すことができる。時には、参照配列の少なくとも約20、100、200、または300の隣接する位置、例えば約20~500、または約50~300の隣接する位置を占める指定された位置について、比較を実施してもよい。
本明細書に記載したフォーマットおよび適用を含む核酸シーケンシングに関するさらなる詳細は、例えば、そのそれぞれがこれにより全体が参照により本明細書に組み込まれる、Levy et al., Annual Review of Genomics and Human Genetics, 17: 95-115 (2016)、Liu et al., J. of Biomedicine and Biotechnology, Volume 2012, Article ID 251364:1-11 (2012)、Voelkerding et al., Clinical Chem., 55: 641-658 (2009)、MacLean et al., Nature Rev. Microbiol., 7: 287-296 (2009)、Astier et al., J Am Chem Soc., 128(5):1705-10 (2006)、米国特許第6,210,891号、米国特許第6,258,568号、米国特許第6,833,246号、米国特許第7,115,400号、米国特許第6,969,488号、米国特許第5,912,148号、米国特許第6,130,073号、米国特許第7,169,560号、米国特許第7,282,337号、米国特許第7,482,120号、米国特許第7,501,245号、米国特許第6,818,395号、米国特許第6,911,345号、米国特許第7,501,245号、米国特許第7,329,492号、米国特許第7,170,050号、米国特許第7,302,146号、米国特許第7,313,308号、および米国特許第7,476,503号にも提供されている。
IV.コンピュータシステム
本開示の方法は、コンピュータシステムを使用して、またはその助けによって、実装することができる。例えば、そのような方法は、(i)担体核酸分子のセットをポリヌクレオチド試料に添加して、第1の試料を生成するステップであって、担体核酸分子のセットが、(a)非メチル化担体核酸分子の少なくとも1つのサブセット;および/または(b)メチル化担体核酸分子の少なくとも1つのサブセットを含み、担体核酸分子の少なくとも一方の末端が、ライゲーションを防止するように改変され、非メチル化担体核酸分子が、メチル化ヌクレオチドを含まず、メチル化担体核酸分子が、1つまたは複数のメチル化ヌクレオチドを含む、ステップ;(ii)第1の試料を、メチル化ポリヌクレオチドに選択的に結合する捕捉剤を使用して、少なくとも2つの分配されたセットに分配し、それにより、分配された試料を生成するステップ;(iii)分配された試料の少なくとも一部を処理して、処理された試料を生成するステップであって、この処理は、以下:(a)タグ付けするステップ、(b)増幅するステップ、および(c)目的の特異的領域について分子を富化するステップのうち少なくとも1つを含む、ステップ;(iv)処理された試料の少なくとも一部をシーケンシングして、シーケンシングリードのセットを生成するステップ;および(v)シーケンシングリードのセットの少なくとも一部を解析して、腫瘍の存在または非存在を検出するステップを含み得る。この実施形態では、このシステムは、担体核酸分子を添加する、分配する、タグ付けする、増幅する、富化するおよびシーケンシングするためのコンポーネントを含む。
本開示の方法は、コンピュータシステムを使用して、またはその助けによって、実装することができる。例えば、そのような方法は、(i)担体核酸分子のセットをポリヌクレオチド試料に添加して、第1の試料を生成するステップであって、担体核酸分子のセットが、(a)非メチル化担体核酸分子の少なくとも1つのサブセット;および/または(b)メチル化担体核酸分子の少なくとも1つのサブセットを含み、担体核酸分子の少なくとも一方の末端が、ライゲーションを防止するように改変され、非メチル化担体核酸分子が、メチル化ヌクレオチドを含まず、メチル化担体核酸分子が、1つまたは複数のメチル化ヌクレオチドを含む、ステップ;(ii)第1の試料を、メチル化ポリヌクレオチドに選択的に結合する捕捉剤を使用して、少なくとも2つの分配されたセットに分配し、それにより、分配された試料を生成するステップ;(iii)分配された試料の少なくとも一部を処理して、処理された試料を生成するステップであって、この処理は、以下:(a)タグ付けするステップ、(b)増幅するステップ、および(c)目的の特異的領域について分子を富化するステップのうち少なくとも1つを含む、ステップ;(iv)処理された試料の少なくとも一部をシーケンシングして、シーケンシングリードのセットを生成するステップ;および(v)シーケンシングリードのセットの少なくとも一部を解析して、腫瘍の存在または非存在を検出するステップを含み得る。この実施形態では、このシステムは、担体核酸分子を添加する、分配する、タグ付けする、増幅する、富化するおよびシーケンシングするためのコンポーネントを含む。
図7は、本開示の方法を実装するようにプログラムされるか、または他の方法で構成されたコンピュータシステム701を示す。コンピュータシステム701は種々の態様の試料調製、シーケンシングおよび/または解析を制御することができる。一部の例では、コンピュータシステム701は、核酸のシーケンシングを含む試料調製および試料解析を実施するように構成されている。
コンピュータシステム701は中央処理ユニット(CPU、本明細書では「プロセッサー」および「コンピュータプロセッサー」ともいう)705を含み、これは、シングルコアもしくはマルチコアのプロセッサーでよく、または並列処理のための複数のプロセッサーでもよい。コンピュータシステム701は、メモリーまたはメモリーロケーション710(例えば、ランダムアクセスメモリー、リードオンリーメモリー、フラッシュメモリー)、電子的記憶ユニット715(例えば、ハードディスク)、1つまたは複数の他のシステムと通信するための通信インターフェース720(例えば、ネットワークアダプター)、ならびに周辺デバイス725、例えば、キャッシュ、他のメモリー、データストレージ、および/または電子的ディスプレイアダプターも含む。メモリー710、記憶ユニット715、インターフェース720および周辺デバイス725は、マザーボード等の通信ネットワークまたはバス(実線)を通じてCPU705と通信する。記憶ユニット715は、データを記憶するためのデータ記憶ユニット(またはデータレポジトリ)であってよい。コンピュータシステム701は、通信インターフェース720の助けによってコンピュータネットワーク730に作動可能に連結することができる。コンピュータネットワーク730は、インターネット(Internet)、インターネット(internet)および/もしくはエクストラネット、またはインターネットと通信するイントラネットおよび/もしくはエクストラネットであってよい。コンピュータネットワーク730は、一部の場合には、遠隔通信および/またはデータネットワークである。コンピュータネットワーク730は、1つまたは複数のコンピュータサーバを含んでよく、これは、分散コンピューティング、例えばクラウドコンピューティングを可能にすることができる。コンピュータネットワーク730は、コンピュータシステム701の助けがある一部の場合には、ピアツーピアネットワークを実装することができ、これは、デバイスがコンピュータシステム701に連結されてクライアントまたはサーバとして挙動することを可能にし得る。
CPU705は機械可読命令のシーケンスを実行することができ、これはプログラムまたはソフトウェアに具現化することができる。命令はメモリーロケーション、例えばメモリー710に記憶してよい。CPU705によって実施される演算の例には、フェッチ、解読、実行、およびライトバック(writeback)が含まれ得る。
記憶ユニット715は、ファイル、例えばドライバー、ライブラリ、および保存されたプログラムを記憶することができる。記憶ユニット715は、ユーザによって生成されたプログラムおよび記録されたセッション、ならびにプログラムに関連する出力を記憶することができる。記憶ユニット715は、ユーザデータ、例えばユーザの選好およびユーザプログラムを記憶することができる。一部の場合におけるコンピュータシステム701は、コンピュータシステム701の外部の、例えばイントラネットまたはインターネットを通じてコンピュータシステム701と通信するリモートサーバ上に位置するような1つまたは複数の追加的なデータ記憶ユニットを含み得る。データは、例えば通信ネットワークまたは物理的なデータ転送を使用して(例えば、ハードドライブ、サムドライブ、またはその他のデータ記憶機構を使用して)ある場所から別の場所に転送してよい。
コンピュータシステム701は、ネットワーク730を通じて1つまたは複数のリモートコンピュータシステムと通信することができる。実施形態について、コンピュータシステム701は、ユーザ(例えば、オペレータ)のリモートコンピュータシステムと通信することができる。リモートコンピュータシステムの例には、パーソナルコンピュータ(例えば、携帯PC)、スレートまたはタブレットPC(例えば、Apple(登録商標)iPad(登録商標)、Samsung(登録商標)Galaxy Tab)、電話、スマートフォン(例えば、Apple(登録商標)iPhone(登録商標)、Android可能デバイス、Blackberry(登録商標))、またはパーソナルデジタルアシスタントが含まれる。ユーザは、ネットワーク730を介してコンピュータシステム701にアクセスすることができる。
本明細書に記載した方法は、コンピュータシステム701の電子的記憶場所、例えば、メモリー710または電子的記憶ユニット715等に記憶された機械(例えば、コンピュータプロセッサー)実行可能なコードによって実装することができる。機械実行可能または機械可読なコードは、ソフトウェアの形態で提供され得る。使用の間、コードはプロセッサー705によって実行され得る。一部の場合には、コードは、記憶ユニット715から取り出され、プロセッサー705による容易なアクセスのためにメモリー710に記憶される。一部の状況では、電子記憶ユニット715を除外することができ、機械実行可能な命令がメモリー710に記憶される。
ある態様では、本開示は、少なくとも1つの電子プロセッサーによって実行された場合に、(i)担体核酸分子のセットをポリヌクレオチド試料に添加して、第1の試料を生成するステップであって、担体核酸分子のセットが、(a)非メチル化担体核酸分子の少なくとも1つのサブセット;および/または(b)メチル化担体核酸分子の少なくとも1つのサブセットを含み、担体核酸分子の少なくとも一方の末端が、ライゲーションを防止するように改変され、非メチル化担体核酸分子が、メチル化ヌクレオチドを含まず、メチル化担体核酸分子が、1つまたは複数のメチル化ヌクレオチドを含む、ステップ;(ii)第1の試料を、メチル化ポリヌクレオチドに選択的に結合する捕捉剤を使用して、少なくとも2つの分配されたセットに分配し、それにより、分配された試料を生成するステップ;(iii)分配された試料の少なくとも一部を処理して、処理された試料を生成するステップであって、この処理は、以下:(a)タグ付けするステップ、(b)増幅するステップ、および(c)目的の特異的領域について分子を富化するステップのうち少なくとも1つを含む、ステップ;(iv)処理された試料の少なくとも一部をシーケンシングして、シーケンシングリードのセットを生成するステップ;および(v)シーケンシングリードのセットの少なくとも一部を解析して、腫瘍の存在または非存在を検出するステップを含む方法を実行するコンピュータ実行可能命令を含む非一過性コンピュータ可読媒体を提供する。この実施形態では、コンピュータ可読媒体は、担体核酸分子を添加する、分配する、タグ付けする、増幅する、富化するおよびシーケンシングするために要求されるコンピュータ実行可能命令を含む。
コードは、コードを実行するように適合されたプロセッサーを有する機械で使用するためにプリコンパイルされ、かつ構成され得るか、または実行時にコンパイルすることができる。コードは、プリコンパイルされたものとして、またはコンパイルしつつコードを実行することを可能にするように選択され得るプログラミング言語で記述して供給することができる。
本明細書で提供するシステムおよび方法の態様、例えばコンピュータシステム701は、プログラミング中に具現化し得る。本技術の種々の態様は、典型的には機械(またはプロセッサー)実行可能なコードおよび/または機械可読媒体の型に含まれまたは具現化される関連するデータの形態で「製品」または「製造物品」として考えることができる。機械実行可能なコードは、電子的記憶ユニット、例えばメモリー(例えばリードオンリーメモリー、ランダムアクセスメモリー、フラッシュメモリー)またはハードディスクに記憶することができる。「記憶」型媒体には、コンピュータの有形のメモリー、プロセッサーもしくは同様のもの、またはその関連するモジュール、例えば種々の半導体メモリー、テープドライブ、ディスクドライブおよび同様のもののいずれかまたはすべてが含まれ、これらはソフトウェアプログラミングのため、いつでも非一過性記憶を提供し得る。
ソフトウェアの全部または一部は、時にはインターネットまたは他の種々の遠隔通信ネットワークを通じて通信してよい。そのような通信は、例えば1つのコンピュータまたはプロセッサーから別のコンピュータまたはプロセッサーへ、例えばマネージメントサーバまたはホストコンピュータからアプリケーションサーバのコンピュータプラットフォームへのソフトウェアのローディングを可能にし得る。したがって、ソフトウェアエレメントを有し得る別の型の媒体には、ローカルデバイスの間で物理的インターフェースにわたって、有線および光地上通信のネットワークを通じて、種々のエアリンクを介して使用されるもののような光、電気、および電磁波が含まれる。そのような波を運搬する物理的エレメント、例えば有線または無線のリンク、光リンク、または同様のものも、ソフトウェアを有する媒体と考えてよい。本明細書で使用される場合、非一過性な有形「記憶」媒体に制限しなければ、コンピュータまたは機械「可読媒体」等の用語は、実行のための命令をプロセッサーに提供することに寄与する任意の媒体を意味する。
したがって、機械可読媒体、例えばコンピュータ実行可能なコードは、有形記憶媒体、搬送波媒体、または物理的送信媒体を含むがこれらに限定されない多くの形態をとり得る。非揮発性記憶媒体には、例えば図に示すデータベース等を実装するために使用されるような任意のコンピュータ等の記憶デバイスのいずれか等の光または磁気のディスクが含まれる。揮発性記憶媒体には、そのようなコンピュータプラットフォームの主メモリー等のダイナミックメモリーが含まれる。有形送信媒体には、共軸ケーブル、銅線および光ファイバ(コンピュータシステム中のバスを含むワイヤを含む)が含まれる。搬送波送信媒体は、電気的もしくは電磁気的な信号、またはラジオ周波数(RF)および赤外(IR)データ通信中に生成されるもののような音響もしくは光の波の形態をとり得る。したがってコンピュータ可読媒体の一般的な形態には、例えばフロッピー(登録商標)ディスク、フレキシブルディスク、ハードディスク、磁気テープ、他の任意の磁気媒体、CD-ROM、DVDもしくはDVD-ROM、他の任意の光学媒体、パンチカード、紙テープ、穴のパターンを有する他の任意の物理的記憶媒体、RAM、ROM、PROMおよびEPROM、FLASH(登録商標)-EPROM、他の任意のメモリーチップまたはカートリッジ、搬送波輸送データもしくは命令、そのような搬送波を輸送するケーブルもしくはリンク、またはそれからコンピュータがプログラミングコードおよび/またはデータを読み取ることができる他の任意の媒体が含まれる。コンピュータ可読媒体のこれらの形態の多くは、1つまたは複数の命令の1つまたは複数のシーケンスを実行のためにプロセッサーに搬送することに関与し得る。
コンピュータシステム701は、例えば試料分析の1つまたは複数の結果を提供するためのユーザインターフェース(UI)を含む電子的ディスプレイを含むか、またはそれと通信し得る。UIの例には、限定なくグラフィカルユーザインターフェース(GUI)およびウェブベースユーザインターフェースが含まれる。
コンピュータシステムおよびネットワーク、データベース、ならびにコンピュータプログラム製品に関するさらなる詳細は、例えば、そのそれぞれがこれにより全体が参照により本明細書に組み込まれるPeterson, Computer Networks: A Systems Approach, Morgan Kaufmann, 5th Ed. (2011)、Kurose, Computer Networking: A Top-Down Approach, Pearson, 7th Ed. (2016)、Elmasri, Fundamentals of Database Systems, Addison Wesley, 6th Ed. (2010)、Coronel, Database Systems: Design, Implementation, & Management, Cengage Learning, 11th Ed. (2014)、Tucker, Programming Languages, McGraw-Hill Science/Engineering/Math, 2nd Ed. (2006)、およびRhoton, Cloud Computing Architected: Solution Design Handbook, Recursive Press (2011)にも提供されている。
V.適用
A.がんおよび他の疾患
一部の実施形態では、考慮している疾患は、ある型のがんである。そのようながんの非限定的な例には、胆管がん、膀胱がん、移行細胞癌、尿路上皮癌、脳がん、神経膠腫、星状細胞腫、乳癌、化生性癌、子宮頸がん、子宮頸部扁平上皮癌、直腸がん、結腸直腸癌、結腸がん、遺伝性非ポリポーシス性結腸直腸がん、結腸直腸腺癌、消化管間質腫瘍(GIST)、子宮内膜癌、子宮内膜間質肉腫、食道がん、食道扁平上皮癌、食道腺癌、眼黒色腫、ブドウ膜黒色腫、胆嚢癌、胆嚢腺癌、腎細胞癌、明細胞腎細胞癌、移行細胞癌、尿路上皮癌、ウィルムス腫瘍、白血病、急性リンパ性白血病(ALL)、急性骨髄性白血病(AML)、慢性リンパ性白血病(CLL)、慢性骨髄性白血病(CML)、慢性骨髄単球性白血病(CMML)、肝臓がん、肝臓癌、ヘパトーマ、肝細胞癌、胆管癌、肝芽腫、肺がん、非小細胞肺がん(NSCLC)、中皮腫、B細胞リンパ腫、非ホジキンリンパ腫、びまん性大細胞型B細胞リンパ腫、マントル細胞リンパ腫、T細胞リンパ腫、非ホジキンリンパ腫、前駆体Tリンパ芽球性リンパ腫/白血病、末梢T細胞リンパ腫、多発性骨髄腫、鼻咽頭癌(NPC)、神経芽腫、口腔咽頭がん、口腔扁平上皮癌、骨肉腫、卵巣癌、膵がん、膵管腺癌、偽乳頭状新生物(pseudopapillary neoplasm)、腺房細胞癌、前立腺がん、前立腺腺癌、皮膚がん、黒色腫、悪性黒色腫、皮膚黒色腫、小腸癌、胃がん、胃癌、消化管間質腫瘍(GIST)、子宮がんまたは子宮肉腫が含まれる。
A.がんおよび他の疾患
一部の実施形態では、考慮している疾患は、ある型のがんである。そのようながんの非限定的な例には、胆管がん、膀胱がん、移行細胞癌、尿路上皮癌、脳がん、神経膠腫、星状細胞腫、乳癌、化生性癌、子宮頸がん、子宮頸部扁平上皮癌、直腸がん、結腸直腸癌、結腸がん、遺伝性非ポリポーシス性結腸直腸がん、結腸直腸腺癌、消化管間質腫瘍(GIST)、子宮内膜癌、子宮内膜間質肉腫、食道がん、食道扁平上皮癌、食道腺癌、眼黒色腫、ブドウ膜黒色腫、胆嚢癌、胆嚢腺癌、腎細胞癌、明細胞腎細胞癌、移行細胞癌、尿路上皮癌、ウィルムス腫瘍、白血病、急性リンパ性白血病(ALL)、急性骨髄性白血病(AML)、慢性リンパ性白血病(CLL)、慢性骨髄性白血病(CML)、慢性骨髄単球性白血病(CMML)、肝臓がん、肝臓癌、ヘパトーマ、肝細胞癌、胆管癌、肝芽腫、肺がん、非小細胞肺がん(NSCLC)、中皮腫、B細胞リンパ腫、非ホジキンリンパ腫、びまん性大細胞型B細胞リンパ腫、マントル細胞リンパ腫、T細胞リンパ腫、非ホジキンリンパ腫、前駆体Tリンパ芽球性リンパ腫/白血病、末梢T細胞リンパ腫、多発性骨髄腫、鼻咽頭癌(NPC)、神経芽腫、口腔咽頭がん、口腔扁平上皮癌、骨肉腫、卵巣癌、膵がん、膵管腺癌、偽乳頭状新生物(pseudopapillary neoplasm)、腺房細胞癌、前立腺がん、前立腺腺癌、皮膚がん、黒色腫、悪性黒色腫、皮膚黒色腫、小腸癌、胃がん、胃癌、消化管間質腫瘍(GIST)、子宮がんまたは子宮肉腫が含まれる。
必要に応じて本明細書で開示した方法およびシステムを使用して評価される他の遺伝系疾患、障害、または状態の非限定的な例には、軟骨形成不全症、アルファ-1アンチトリプシン欠乏症、抗リン脂質症候群、自閉症、常染色体優性多発性嚢胞腎疾患、シャルコー・マリー・トゥース(CMT)、ネコなき症、クローン病、嚢胞性線維症、ダーカム病、ダウン症候群、デュアンヌ症候群、デュシェンヌ筋ジストロフィー、第V因子ライデン栓友病、家族性高コレステロール血症、家族性地中海熱、脆弱性X症候群、ゴーシュ病、ヘモクロマトーシス、血友病、全前脳症、ハンチントン病、クラインフェルター症候群、マルファン症候群、筋強直性ジストロフィー、神経線維腫、ヌーナン症候群、骨形成不全症、パーキンソン病、フェニルケトン尿症、ポーランド異形、ポルフィリン症、早老症、網膜色素変性、重症複合型免疫不全(SCID)、鎌状赤血球症、脊髄性筋萎縮症、テイサックス病、サラセミア、トリメチルアミン尿症、ターナー症候群、口蓋心顔面症候群、WAGR症候群、ウィルソン病、または同様のものが含まれる。
B.試験対象におけるがんの再発のリスクを決定する方法および/または試験対象をその後のがん処置の候補として分類する方法
一部の実施形態では、本明細書で提供する方法は、試験対象におけるがんの再発のリスクを決定する方法である。一部の実施形態では、本明細書で提供する方法は、試験対象をその後のがん処置の候補として分類する方法である。
一部の実施形態では、本明細書で提供する方法は、試験対象におけるがんの再発のリスクを決定する方法である。一部の実施形態では、本明細書で提供する方法は、試験対象をその後のがん処置の候補として分類する方法である。
そのような方法のいずれかは、試験対象に対する1つまたは複数の以前のがんの処置後の1つまたは複数の予め選択した時点においてがんを有すると診断された試験対象から(例えば腫瘍細胞を起源とするまたはそれに由来する)DNAを収集するステップを含み得る。対象は本明細書に記載した対象のいずれでもよい。DNAはcfDNAであってよい。DNAは組織試料から得られる。
そのような方法のいずれかは、対象からのDNAから複数の標的領域セットを捕捉するステップであって、複数の標的領域セットが配列可変標的領域セットおよびエピジェネティック標的領域セットを含み、捕捉されたDNA分子セットが産生されるステップを含み得る。捕捉するステップは、本明細書の他の箇所に記載した実施形態のいずれかに従って実施され得る。
そのような方法のいずれにおいても、以前のがん処置は手術、治療組成物の投与、および/または化学療法を含み得る。
そのような方法のいずれかは、捕捉されたDNA分子をシーケンシングするステップを含み、それにより配列情報セットが産生される。配列可変標的領域セットの捕捉されたDNA分子は、エピジェネティック標的領域セットの捕捉されたDNA分子よりも高いシーケンシング深度までシーケンシングされ得る。
そのような方法のいずれかは、配列情報セットを使用して、予め選択された時点で腫瘍細胞を起源とするまたはそれに由来するDNAの存在または非存在を検出するステップを含み得る。腫瘍細胞を起源とするまたはそれに由来するDNAの存在または非存在の検出は、本明細書の他の箇所に記載したそれらの実施形態のいずれかに従って実施され得る。
試験対象におけるがん再発のリスクを決定する方法は、その試験対象について腫瘍細胞を起源とするまたはそれに由来するDNAの存在もしくは非存在、または量を示すがん再発スコアを決定するステップを含み得る。がん再発スコアは、がん再発状態を決定するためにさらに使用され得る。がん再発状態は、例えばがん再発スコアが既定の閾値より上である場合にがん再発のリスクがあり得る。がん再発状態は、例えばがん再発スコアが既定の閾値より上である場合にがん再発のリスクが低いまたはより低い。特定の実施形態では、既定の閾値に等しいがん再発スコアは、がん再発のリスクがある、またはがん再発の低いもしくはより低いリスクがあるがん再発状態をもたらし得る。
試験対象をその後のがん処置の候補であると分類する方法は、その試験対象のがん再発スコアを既定のがん再発閾値と比較するステップを含み、がん再発スコアががん再発閾値より上である場合、その試験対象をその後のがん処置の候補であると分類するか、またはがん再発スコアががん再発閾値より下である場合、治療の候補ではないと分類する。特定の実施形態では、がん再発閾値と等しいがん再発スコアは、その後のがん処置の候補であるか、または治療の候補でないという分類をもたらし得る。一部の実施形態では、その後のがん処置は、化学療法または治療組成物の投与を含む。
そのような方法のいずれかは、がん再発スコアに基づいて試験対象の無病生存(DFS)期間を決定するステップを含み得、例えばDFS期間は1年、2年、3年、4年、5年、または10年であってよい。
一部の実施形態では、配列情報セットは配列可変標的領域配列を含み、がん再発スコアを決定するステップは、配列可変標的領域配列に存在するSNV、挿入/欠失、CNV、および/または融合の量を示す少なくとも第1のサブスコアを決定するステップを含み得る。
一部の実施形態では、1、2、3、4、または5から選択される配列可変標的領域における変異の数は、第1のサブスコアががん再発について陽性であると分類されるがん再発スコアをもたらすために十分である。一部の実施形態では、変異の数は1、2、または3から選択される。
一部の実施形態では、配列情報のセットは、エピジェネティック標的領域配列を含み、がん再発スコアを決定するステップは、エピジェネティック標的領域配列中のエピジェネティック特色における変化、例えば、高メチル化可変標的領域のメチル化および/または断片化可変標的領域の摂動を受けた断片化を示す第2のサブスコアを決定するステップを含み、「摂動を受けた」は、健康な対象からの対応する試料中に見出されるDNAとは異なることを意味する。
がん再発スコアががんの再発について陽性であると分類されるいずれかの実施形態では、対象のがん再発状態はがん再発のリスクがある、および/または対象はその後のがん処置の候補として分類され得る。
一部の実施形態では、がんは本明細書の他の箇所に記載したがんの型のいずれか1つ、例えば結腸直腸がんである。
C.治療および関連する投与
ある特定の実施形態では、本明細書に開示した方法は、体細胞または生殖細胞系列の起源である核酸バリアントの状態を与えられた患者にカスタマイズされた療法を特定し投与することに関する。一部の実施形態では、本質的にいずれのがん療法(例えば手術療法、放射線療法、化学療法、および/または同様のもの)も、これらの方法の一部として含まれ得る。典型的には、カスタマイズされた療法には少なくとも1つの免疫療法(または免疫療法剤)が含まれる。免疫療法は一般に、所与のがんの型に対する免疫応答を増強する方法を意味する。ある特定の実施形態では、免疫療法は腫瘍またはがんに対するT細胞の応答を増強する方法を意味する。
ある特定の実施形態では、本明細書に開示した方法は、体細胞または生殖細胞系列の起源である核酸バリアントの状態を与えられた患者にカスタマイズされた療法を特定し投与することに関する。一部の実施形態では、本質的にいずれのがん療法(例えば手術療法、放射線療法、化学療法、および/または同様のもの)も、これらの方法の一部として含まれ得る。典型的には、カスタマイズされた療法には少なくとも1つの免疫療法(または免疫療法剤)が含まれる。免疫療法は一般に、所与のがんの型に対する免疫応答を増強する方法を意味する。ある特定の実施形態では、免疫療法は腫瘍またはがんに対するT細胞の応答を増強する方法を意味する。
ある特定の実施形態では、体細胞または生殖細胞系列の起源である対象からの試料の核酸バリアントの状態は、参照集団からのコンパレータの結果のデータベースと比較され、その対象のためのカスタマイズされたまたは標的化された療法が特定される。典型的には、参照集団は試験対象と同じがんまたは疾患の型を有する患者、および/または試験対象と同じ療法を受けている、または受けた患者を含む。核酸バリアントとコンパレータの結果がある特定の分類基準を満たせば(例えば実質的にまたは近似的に一致すれば)、カスタマイズされたまたは標的化された療法(1つまたは複数の療法)が特定され得る。
ある特定の実施形態では、本明細書に記載したカスタマイズされた療法は、典型的には、非経口的(例えば、静脈内または皮下)に投与される。免疫療法剤を含有する医薬組成物は、典型的には、静脈内投与される。ある特定の治療剤は、経口投与される。しかし、カスタマイズされた療法(例えば、免疫療法剤、その他)は、例えば、頬内、舌下、直腸、膣、尿道内、局所、眼内、鼻内および/または耳介内を含む当該分野で公知の任意の方法によっても投与され得、投与は、錠剤、カプセル剤、顆粒剤、水性懸濁剤、ゲル剤、スプレー剤、坐剤、軟膏剤(salve)、軟膏剤(ointment)、または同様のものを含み得る。
(実施例1:無細胞DNA試料の分配)
培養培地中に放出されたDNAを抽出することによってGM12878細胞系から得られた2つのDNA試料(試料1および試料2)(即ち、DNAを、細胞を遠心分離によって分離した後の培養培地の上清から抽出した)をここで解析する。この実施例では、各無細胞DNA試料を、2つのアリコートに分割し、各アリコートは、10ngの無細胞DNAを有する。試料の一方のアリコートに、140ngの担体DNA分子を添加する。この実施形態では、使用する担体DNA分子は二本鎖であり、担体DNA分子の約50%はメチル化されており、担体DNA分子の50%はメチル化されていない。メチル化担体DNA分子および非メチル化担体DNA分子は共に、同じ配列を有し、これらの担体DNA分子は、3つのCpGジヌクレオチドを有する。メチル化担体DNA分子の3つのCpGジヌクレオチド中のすべてのシトシンは、メチル化されている。試料の他方のアリコートには担体DNA分子を添加しない。
培養培地中に放出されたDNAを抽出することによってGM12878細胞系から得られた2つのDNA試料(試料1および試料2)(即ち、DNAを、細胞を遠心分離によって分離した後の培養培地の上清から抽出した)をここで解析する。この実施例では、各無細胞DNA試料を、2つのアリコートに分割し、各アリコートは、10ngの無細胞DNAを有する。試料の一方のアリコートに、140ngの担体DNA分子を添加する。この実施形態では、使用する担体DNA分子は二本鎖であり、担体DNA分子の約50%はメチル化されており、担体DNA分子の50%はメチル化されていない。メチル化担体DNA分子および非メチル化担体DNA分子は共に、同じ配列を有し、これらの担体DNA分子は、3つのCpGジヌクレオチドを有する。メチル化担体DNA分子の3つのCpGジヌクレオチド中のすべてのシトシンは、メチル化されている。試料の他方のアリコートには担体DNA分子を添加しない。
試料1および試料2由来の2つのアリコート(担体DNA分子ありおよびなし)を、メチル結合ドメイン(MBD)緩衝液およびMBDタンパク質にコンジュゲートした磁気ビーズ(MethylMinerメチル化DNA富化キット(ThermoFisher Scientific))と合わせ、一晩インキュベートする。メチル化DNA分子(存在する場合には、無細胞DNA試料中および担体DNA分子中)に、このインキュベーションの間にMBDタンパク質が結合する。非メチル化DNAまたはメチル化が少ないDNAは、増加する塩濃度を含有する緩衝液によってビーズから洗い流される。最後に、高い塩濃度の緩衝液を使用して、高度にメチル化されたDNAをMBDタンパク質から洗い流す。これらの洗浄は、メチル化が増大するDNAの3つの画分(3つの分配されたセット - 低、中等度および高)をもたらす。分配されたセット中に存在する分配されたDNAは、無細胞DNA試料由来のDNAおよび担体DNA分子を含む。3つの分配されたセット中の分配されたDNAを、清浄し、塩除去し、ライブラリ調製の酵素的ステップのために調製物中で濃縮する。
分配されたセット中のDNAを富化した後、分配されたDNAの末端オーバーハングを伸長させ、アデノシン残基を断片の3’末端に付加する。各断片の5’末端をリン酸化する。これらの改変により、分配されたDNAはライゲーション可能になる。DNAリガーゼおよびアダプターを添加して、各末端で、各分配されたDNA分子をアダプターとライゲーションさせる。これらのアダプターは、非一意的バーコードを含み、各分配されたセットは、他の分配されたセットにおいて使用されるアダプター中のバーコードから区別可能な非一意的バーコードを有するアダプターとライゲーションされる。ライゲーション後、3つの分配されたセットを共にプールし、PCRによって増幅する。担体DNA分子の末端はライゲーションを防止するように改変されているので、アダプターは担体DNA分子にライゲーションされない。したがって、これらの分子はアダプターとはライゲーションされず、アダプターはプライマー結合部位を含むので、担体DNA分子は増幅されない。
PCR後、増幅されたDNAを再度清浄し、富化前に濃縮する。濃縮したら、増幅されたDNAを、塩緩衝液、および目的の特異的領域を標的化するビオチン化RNAプローブと合わせ、この混合物を一晩インキュベートする。ビオチン化RNAプローブを、ストレプトアビジン磁気ビーズによって捕捉し、一連の塩洗浄によって溶出されなかった増幅されたDNAから分離し、それによって試料を富化する。このステップでは、残った担体DNA分子が試料中になおも存在する場合、担体DNA分子は、プローブに結合するための配列類似性を有さず(即ち、担体DNA分子は、この実施例では、非ヒトゲノム由来の配列を有する)また担体DNA分子は捕捉されないので、プローブは担体DNA分子に結合せず、こうして、担体DNA分子がシーケンシングされないことを確実にする。
富化後、試料インデックスを、富化された分子にPCR増幅を経て組み込む。PCR増幅後、(バッチ内の)異なる試料由来の増幅された分子を共にプールし、Illumina NovaSeqシーケンサーを使用してシーケンシングする。次いで、シーケンサーによって生成された配列リードを、バイオインフォマティクスツール/アルゴリズムを使用して解析する。解析ステップは、分子のメチル化状態を決定するステップを含む。例えば、目的の特異的領域は、健康な個体ではメチル化されておらず、悪性腫瘍を有する個体ではメチル化されていることが、以前に決定されている。この実施例では、解析ステップは、分子が目的のこれらの領域においてメチル化されているか否かを決定するステップを含む。これは、分子、および分子が分配される分配されたセット中のCpG残基の数に基づいて決定され、これは次いで、腫瘍の存在または非存在を検出するために使用される。
図8Aおよび8Bは、担体DNA分子の存在下および非存在下での、試料由来の無細胞DNA分子の分配のグラフ図を示す。ヒトゲノムでは、ある特定の領域のメチル化状態は、変動/変化しない場合が多く、常に同じままであるか、または異なる対象および/もしくは異なる型の疾患/疾患ステージと合致したままであることが見出されている。例えば、ある特定のヒトゲノム領域は、対象ががんを有するか否かにかかわらず、メチル化されているのが優勢であるか、またはメチル化されていないのが優勢であるかのいずれかであり得る。図8Aは、高度に分配されたセット中のメチル化されていないのが優勢であることが公知のある特定のヒトゲノム領域の無細胞DNA分子のパーセンテージを示す。図8Aは、高度に分配されたセット中にある可能性が低い非メチル化無細胞DNA分子が、高度に分配されたセットに分配されたことを明らかに示している。そして、試料への担体DNA分子の添加は、高度に分配されたセットに分配されるメチル化されていない無細胞DNA分子の量を大幅に低減させた。例えば、担体DNA分子なしの試料1では、高度に分配されたセット中のメチル化されていないのが優勢であることが公知のある特定のヒトゲノム領域の無細胞DNA分子のパーセンテージは0.37%であるが(図8A中の担体なしの試料1)、担体DNA分子を添加すると、これは0.07%まで低減された(図8A中の担体ありの試料1)。試料2において同様に、高度に分配されたセット中のメチル化されていないのが優勢であることが公知のある特定のヒトゲノム領域の無細胞DNA分子のパーセンテージ(担体DNA分子の非存在下での)は0.46%であるが(図8A中の担体なしの試料2)、担体DNA分子を添加すると、これは0.06%まで低減された(図8A中の担体ありの試料2)。図8Bは、高度に分配されたセット中のゼロ個のCpGジヌクレオチドを有する無細胞DNA分子の分配を示す。理想的には、これらの分子は、高度に分配されたセットに分配されるべきではない。図8Bは、試料1(図8B中の担体なしの試料1)および試料2(図8B中の担体なしの試料2)中のゼロ個のCpGジヌクレオチドを有する無細胞DNA分子の約0.15%および0.22%がそれぞれ、高度に分配されたセットに分配されることを明らかに示している。しかし、担体DNA分子を添加すると、高度に分配されたセット中のゼロ個のCpGジヌクレオチドを有する無細胞DNA分子のパーセンテージは、それぞれ、試料1(図8B中の担体ありの試料1)では0.014%まで、試料2(図8B中の担体ありの試料2)では0.01%まで低減された。図8は、担体DNA分子の使用が、非メチル化DNA分子の誤分配、アッセイノイズを低減させること、したがって、分配アッセイの分子特異性を改善することによって、分配アッセイの信頼度を増加させ、このことは、臨床性能の改善をもたらすことを明らかに示している。
本発明の好ましい実施形態を本明細書に示し、記載したが、そのような実施形態は例としてのみ提供されることは当業者には明白になる。本発明は本明細書内で提供される特定の実施例によって限定されることを意図していない。本発明は上述の明細書を参照して記載しているが、本明細書の実施形態の記述および説明は限定する意味で解釈することを意味していない。ここで多くの変形、変化、および置換が、本発明から逸脱することなく当業者には生じるであろう。さらに、本発明のすべての態様は、種々の条件および変数に依存する本明細書で説明した特定の描写、構成、または相対的な比率に限定されないことを理解されたい。本発明の実施において本明細書に記載した開示の実施形態に対して種々の代替選択肢が採用され得ることを理解されたい。したがって、本開示はいずれのそのような選択肢、改変、変形、または均等物をも包含すべきであることが意図されている。以下の特許請求の範囲が本発明の範囲を定義すること、ならびにこれらの特許請求の範囲およびその均等物の範囲内の方法および構造がそれによって包含されることが意図されている。
上記の開示は明確さおよび理解の目的のために説明および例としていくらか詳細に記載しているが、本開示を読んで、本開示の真の範囲から逸脱することなく形態および詳細において種々の変化を加えることができ、添付の特許請求の範囲内で実施できることは、当業者には明白になる。例えば、すべての方法、システム、コンピュータ可読媒体、および/または成分の特色、ステップ、エレメント、またはその他の態様を、種々の組合せで使用することができる。
本明細書で引用したすべての特許、特許出願、ウェブサイト、その他の刊行物および書類、受託番号、および同様のものは、それぞれの別個の項目が参照により組み込まれると具体的かつ別個に指示されているかのように、同程度にあらゆる目的のために全体が参照により組み込まれる。異なるバージョンの配列が異なる時の受託番号に関連している場合には、本出願の有効な出願日における受託番号に関連するバージョンが意味される。有効な出願日は、実際の出願日、または適用される場合には受託番号に言及する優先出願の提出日のいずれか早い方を意味する。同様に、異なるバージョンの刊行物、ウェブサイト、または同様のものが異なる時に公開された場合には、他に指示されなければ、本出願の有効な出願日に最も近く公開されたバージョンが意味される。
Claims (112)
- 対象における腫瘍の存在または非存在を検出する方法であって、
(i)前記対象からポリヌクレオチド試料を得るステップ;
(ii)担体核酸分子のセットを前記ポリヌクレオチド試料に添加して、第1の試料を生成するステップであって、前記担体核酸分子のセットが、
(a)非メチル化担体核酸分子の少なくとも1つのサブセット;および/または
(b)メチル化担体核酸分子の少なくとも1つのサブセット
を含み、前記担体核酸分子の少なくとも一方の末端が、ライゲーションを防止するように改変され、前記非メチル化担体核酸分子が、メチル化ヌクレオチドを含まず、前記メチル化担体核酸分子が、1つまたは複数のメチル化ヌクレオチドを含む、ステップ;
(iii)前記第1の試料を、メチル化ポリヌクレオチドに選択的に結合する捕捉剤を使用して、少なくとも2つの分配されたセットに分配し、それにより、分配された試料を生成するステップ;
(iv)前記分配された試料の少なくとも一部を処理して、処理された試料を生成するステップであって、前記処理は、以下:(a)タグ付けするステップ、(b)増幅するステップ、および(c)目的の特異的領域について分子を富化するステップのうち少なくとも1つを含む、ステップ;
(v)前記処理された試料の少なくとも一部をシーケンシングして、シーケンシングリードのセットを生成するステップ;ならびに
(vi)前記シーケンシングリードのセットの少なくとも一部を解析して、腫瘍の存在または非存在を検出するステップを含む、方法。 - 前記担体核酸分子の長さが25bpと325bpとの間である、請求項1に記載の方法。
- 前記非メチル化担体核酸分子の少なくとも1つのサブセットの第1のサブセットおよび第2のサブセットが、同じヌクレオチド配列を含む、請求項1に記載の方法。
- 前記非メチル化担体核酸分子の少なくとも1つのサブセットの第1のサブセットおよび第2のサブセットが、異なるヌクレオチド配列を含む、請求項1に記載の方法。
- 前記非メチル化担体核酸分子の少なくとも1つのサブセットの前記第1のサブセットおよび前記第2のサブセットが、ヌクレオチド配列中に、1つまたは複数のCpGジヌクレオチドを含む、請求項3または4に記載の方法。
- 前記非メチル化担体核酸分子の少なくとも1つのサブセットの前記第1のサブセット中の前記1つまたは複数のCpGジヌクレオチドの位置が、前記第2のサブセット中の前記1つまたは複数のCpGジヌクレオチドの位置とは異なる、請求項5に記載の方法。
- 前記非メチル化担体核酸分子の少なくとも1つのサブセットの前記第1のサブセット中の前記CpGジヌクレオチドの数が、前記第2のサブセット中のCpGジヌクレオチドの数とは異なる、請求項5に記載の方法。
- 前記非メチル化担体核酸分子の少なくとも1つのサブセットの前記第1のサブセット中の前記1つまたは複数のCpGジヌクレオチドに隣接するヌクレオチドの配列が、前記第2のサブセット中の前記1つまたは複数のCpGジヌクレオチドに隣接するヌクレオチドの配列とは異なる、請求項5に記載の方法。
- 前記非メチル化担体核酸分子の少なくとも1つのサブセットの第1のサブセットおよび第2のサブセットが、異なる長さのものである、請求項2に記載の方法。
- 前記1つまたは複数のメチル化ヌクレオチドが、(i)5-メチルシトシン、(ii)6-メチルアデニン、(iii)ヒドロキシメチルシトシン、(iv)メチルウラシル、および(v)任意の他のメチル化ヌクレオチドからなる群より選択される、請求項1に記載の方法。
- メチル化ヌクレオチドの数が、1、2、3、4、5、6、7、8、9、10、12、14、15、16、17、18、19または少なくとも20である、請求項10に記載の方法。
- 前記メチル化担体核酸分子の少なくとも1つのサブセットの第1のサブセットおよび第2のサブセットが、同じヌクレオチド配列を含む、請求項10に記載の方法。
- 前記メチル化担体核酸分子の少なくとも1つのサブセットの第1のサブセットおよび第2のサブセットが、異なるヌクレオチド配列を含む、請求項10に記載の方法。
- 前記メチル化担体核酸分子の少なくとも1つのサブセットの前記第1のサブセットおよび前記第2のサブセットが、ヌクレオチド配列中に、1つまたは複数のCpGジヌクレオチドを含む、請求項12または13に記載の方法。
- 前記1つまたは複数のCpGジヌクレオチドが、1つまたは複数のメチル化シトシンを含む、請求項14に記載の方法。
- 前記メチル化担体核酸分子の少なくとも1つのサブセットの前記第1のサブセット中の前記1つまたは複数のメチル化ヌクレオチドの位置が、前記第2のサブセット中の前記1つまたは複数のメチル化ヌクレオチドの位置とは異なる、請求項12または13に記載の方法。
- 前記メチル化担体核酸分子の少なくとも1つのサブセットの前記第1のサブセット中の前記メチル化ヌクレオチドの数が、前記第2のサブセット中のメチル化ヌクレオチドの数とは異なる、請求項12または13に記載の方法。
- 前記メチル化担体核酸分子の少なくとも1つのサブセットの前記第1のサブセット中の前記1つまたは複数のメチル化ヌクレオチドに隣接するヌクレオチドの配列が、前記第2のサブセット中の前記1つまたは複数のメチル化ヌクレオチドに隣接するヌクレオチドの配列とは異なる、請求項13に記載の方法。
- 前記メチル化担体核酸分子の少なくとも1つのサブセットの第1のサブセットおよび第2のサブセットが、異なる長さのものである、請求項10に記載の方法。
- 前記メチル化担体核酸分子の少なくとも1つのサブセットの、前記非メチル化担体核酸分子の少なくとも1つのサブセットに対する量が、約0:1、0.1:99.9、0.5:99.5、0.75:99.25、1:99、1:95、1:90、1:80、1:75、1:70、1:60、1:50、1:40、1:30、1:25、1:20、1:10、1:5、1:2、1:1.15、1:1、1.15:1、2:1、5:1、10:1、20:1、25:1、30:1、40:1、50:1、60:1、70:1、75:1、80:1、90:1、95:1、99:1、99.25:0.75、99.5:0.5、99.9:0.1または1:0の比である、請求項10に記載の方法。
- 前記ポリヌクレオチド試料の、前記担体核酸分子のセットに対する量が、約1:0.1;1:0.2、1:0.3、1:4、1:0.5、1:6、1:7、1:8、1:0.9、1:1、1:1、1:2、1:3、1:4、1:5、1:6、1:7、1:8、1:9、1:10の比、1:20、1:30、1:40、1:50、1:60、1:70、1:80、1:90、1:100、1:200、1:300;1:400、1:500、1:600、1:700、1:800、1:900、1:1000、1:5000、1:10,000、1:100,000、1:500,000、1:106、1:107、1:108または1:109である、請求項1に記載の方法。
- 前記ポリヌクレオチド試料が最大1μgである、請求項1に記載の方法。
- 前記ポリヌクレオチド試料が最大200ngである、請求項1に記載の方法。
- 前記ポリヌクレオチド試料が最大150ngである、請求項1に記載の方法。
- 前記ポリヌクレオチド試料が最大100ngである、請求項1に記載の方法。
- 前記担体核酸分子のセットが、前記ポリヌクレオチド試料と前記担体核酸分子のセットとの総量が約175ng、200ng、225ng、250ng、275ng、300ng、350ng、400ng、450ng、500ng、600ng、700ng、750ng、800ng、900ng、1μg、1.1μg、1.25μgまたは1.5μgになるように十分な量で添加される、請求項22から25のいずれか一項に記載の方法。
- 前記担体核酸分子の配列が、(i)ウイルスゲノム由来の配列、(ii)細菌ゲノム由来の配列、(iii)ラムダゲノム由来の配列、および(iv)非ヒトゲノム由来の配列からなる群より選択される、請求項1に記載の方法。
- 前記担体核酸分子が合成DNAである、請求項1に記載の方法。
- 前記担体核酸分子の前記少なくとも一方の末端が、C3(プロピル基)スペーサーを含む、請求項1に記載の方法。
- 前記担体核酸分子の前記少なくとも一方の末端が、ジデオキシヌクレオチドを含む、請求項1に記載の方法。
- 前記担体核酸分子の前記少なくとも一方の末端が、ヒドロキシル基が求核試薬として作用することを阻止する任意の化学的改変を含む、請求項1に記載の方法。
- 前記担体核酸分子が、ウラシルヌクレオシドを含む、請求項1に記載の方法。
- 前記増幅するステップの前に、ウラシルデグリコシラーゼおよびDNAグリコシラーゼ-リアーゼを添加するステップをさらに含む、請求項32に記載の方法。
- 前記担体核酸分子の5’末端が、以下の改変:(i)反転(5’-5’)、例えば、ジデオキシチミン、ジデオキシシトシン、ジデオキシグアニンまたはジデオキシアデニン;(ii)プロピル基、または(iii)例えば、ベンジル、エチルもしくはメチルであるがこれらに限定されない他の有機官能基のうち少なくとも1つを含む、請求項1に記載の方法。
- 前記担体核酸分子の3’末端が、以下の改変:(i)酵素的に、または合成の間に付加され得る任意のジデオキシ塩基、例えば、ジデオキシチミン、ジデオキシシトシン、ジデオキシグアニンまたはジデオキシアデニン;(ii)プロピル基、または(iii)例えば、ベンジル、エチルもしくはメチルであるがこれらに限定されない他の有機官能基のうち少なくとも1つを含む、請求項1に記載の方法。
- 前記ポリヌクレオチド試料が、組織、血液、血漿、血清、尿、唾液、糞便、脳脊髄液、頬内スワブまたは胸腔穿刺から得られる、請求項1に記載の方法。
- 前記ポリヌクレオチド試料が、組織から得られる、請求項1に記載の方法。
- 前記組織から得られた前記ポリヌクレオチド試料が、酵素的手段または機械的手段によって断片化される、請求項37に記載の方法。
- 前記ポリヌクレオチド試料が、血液から得られる、請求項1に記載の方法。
- 前記血液由来の前記ポリヌクレオチド試料が、無細胞DNA試料である、請求項39に記載の方法。
- (i)非メチル化担体核酸分子の少なくとも1つのサブセット;および/または
(ii)メチル化担体核酸分子の少なくとも1つのサブセット
を含む担体核酸分子のセットであって、
前記担体核酸分子の少なくとも一方の末端が、ライゲーションを防止するように改変され、前記非メチル化担体核酸分子が、メチル化ヌクレオチドを含まず、前記メチル化担体核酸分子が、1つまたは複数のメチル化ヌクレオチドを含む、担体核酸分子のセット。 - 前記担体核酸分子の長さが25bpと325bpとの間である、請求項41に記載の担体核酸分子のセット。
- 前記非メチル化担体核酸分子の少なくとも1つのサブセットの第1のサブセットおよび第2のサブセットが、同じヌクレオチド配列を含む、請求項41に記載の担体核酸分子のセット。
- 前記非メチル化担体核酸分子の少なくとも1つのサブセットの第1のサブセットおよび第2のサブセットが、異なるヌクレオチド配列を含む、請求項41に記載の担体核酸分子のセット。
- 前記非メチル化担体核酸分子の少なくとも1つのサブセットの前記第1のサブセットおよび前記第2のサブセットが、ヌクレオチド配列中に、1つまたは複数のCpGジヌクレオチドを含む、請求項43または44に記載の担体核酸分子のセット。
- 前記非メチル化担体核酸分子の少なくとも1つのサブセットの前記第1のサブセット中の前記1つまたは複数のCpGジヌクレオチドの位置が、前記第2のサブセット中の前記1つまたは複数のCpGジヌクレオチドの位置とは異なる、請求項45に記載の担体核酸分子のセット。
- 前記非メチル化担体核酸分子の少なくとも1つのサブセットの前記第1のサブセット中の前記CpGジヌクレオチドの数が、前記第2のサブセット中のCpGジヌクレオチドの数とは異なる、請求項45に記載の担体核酸分子のセット。
- 前記非メチル化担体核酸分子の少なくとも1つのサブセットの前記第1のサブセット中の前記1つまたは複数のCpGジヌクレオチドに隣接するヌクレオチドの配列が、前記第2のサブセット中の前記1つまたは複数のCpGジヌクレオチドに隣接するヌクレオチドの配列とは異なる、請求項45に記載の担体核酸分子のセット。
- 前記非メチル化担体核酸分子の少なくとも1つのサブセットの第1のサブセットおよび第2のサブセットが、異なる長さのものである、請求項41に記載の担体核酸分子のセット。
- 前記1つまたは複数のメチル化ヌクレオチドが、(i)5-メチルシトシン、(ii)6-メチルアデニン、(iii)ヒドロキシメチルシトシン、(iv)メチルウラシル、および(v)任意の他のメチル化ヌクレオチドからなる群より選択される、請求項41に記載の担体核酸分子のセット。
- メチル化ヌクレオチドの数が、1、2、3、4、5、6、7、8、9、10、12、14、15、16、17、18、19または少なくとも20である、請求項50に記載の担体核酸分子のセット。
- 前記メチル化担体核酸分子の少なくとも1つのサブセットの第1のサブセットおよび第2のサブセットが、同じヌクレオチド配列を含む、請求項50に記載の担体核酸分子のセット。
- 前記メチル化担体核酸分子の少なくとも1つのサブセットの第1のサブセットおよび第2のサブセットが、異なるヌクレオチド配列を含む、請求項50に記載の担体核酸分子のセット。
- 前記メチル化担体核酸分子の少なくとも1つのサブセットの前記第1のサブセットおよび前記第2のサブセットが、ヌクレオチド配列中に、1つまたは複数のCpGジヌクレオチドを含む、請求項52または53に記載の担体核酸分子のセット。
- 前記1つまたは複数のCpGジヌクレオチドが、1つまたは複数のメチル化シトシンを含む、請求項54に記載の担体核酸分子のセット。
- 前記メチル化担体核酸分子の少なくとも1つのサブセットの前記第1のサブセット中の前記1つまたは複数のメチル化ヌクレオチドの位置が、前記第2のサブセット中の前記1つまたは複数のメチル化ヌクレオチドの位置とは異なる、請求項52または53に記載の担体核酸分子のセット。
- 前記メチル化担体核酸分子の少なくとも1つのサブセットの前記第1のサブセット中の前記メチル化ヌクレオチドの数が、前記第2のサブセット中のメチル化ヌクレオチドの数とは異なる、請求項52または53に記載の担体核酸分子のセット。
- 前記メチル化担体核酸分子の少なくとも1つのサブセットの前記第1のサブセット中の前記1つまたは複数のメチル化ヌクレオチドに隣接するヌクレオチドの配列が、前記第2のサブセット中の前記1つまたは複数のメチル化ヌクレオチドに隣接するヌクレオチドの配列とは異なる、請求項53に記載の担体核酸分子のセット。
- 前記メチル化担体核酸分子の少なくとも1つのサブセットの第1のサブセットおよび第2のサブセットが、異なる長さのものである、請求項50に記載の担体核酸分子のセット。
- 前記メチル化担体核酸分子の少なくとも1つのサブセットの、前記非メチル化担体核酸分子の少なくとも1つのサブセットに対する量が、約0:1、0.1:99.9、0.5:99.5、0.75:99.25、1:99、1:95、1:90、1:80、1:75、1:70、1:60、1:50、1:40、1:30、1:25、1:20、1:10、1:5、1:2、1:1.15、1:1、1.15:1、2:1、5:1、10:1、20:1、25:1、30:1、40:1、50:1、60:1、70:1、75:1、80:1、90:1、95:1、99:1、99.25:0.75、99.5:0.5、99.9:0.1または1:0の比である、請求項50に記載の担体核酸分子のセット。
- 前記担体核酸分子の配列が、(i)ウイルスゲノム由来の配列、(ii)細菌ゲノム由来の配列、(iii)ラムダゲノム由来の配列、および(iv)非ヒトゲノム由来の配列からなる群より選択される、請求項41に記載の担体核酸分子のセット。
- 前記担体核酸分子が合成DNAである、請求項41に記載の担体核酸分子のセット。
- 前記担体核酸分子の前記少なくとも一方の末端が、C3(プロピル基)スペーサーを含む、請求項41に記載の担体核酸分子のセット。
- 前記担体核酸分子の前記少なくとも一方の末端が、ジデオキシヌクレオチドを含む、請求項41に記載の担体核酸分子のセット。
- 前記担体核酸分子の前記少なくとも一方の末端が、ヒドロキシル基が求核試薬として作用することを阻止する任意の化学的改変を含む、請求項41に記載の担体核酸分子のセット。
- 前記担体核酸分子が、ウラシルヌクレオシドを含む、請求項41に記載の担体核酸分子のセット。
- 増幅するステップの前に、ウラシルデグリコシラーゼおよびDNAグリコシラーゼ-リアーゼを添加するステップをさらに含む、請求項66に記載の担体核酸分子のセット。
- 前記担体核酸分子の5’末端が、以下の改変:(i)反転(5’-5’)-ジデオキシチミン、ジデオキシシトシン、ジデオキシグアニンまたはジデオキシアデニン;(ii)プロピル基、または(iii)例えば、ベンジル、エチルもしくはメチルであるがこれらに限定されない他の有機官能基のうち少なくとも1つを含む、請求項41に記載の担体核酸分子のセット。
- 前記担体核酸分子の3’末端が、以下の改変:(i)酵素的に、または合成の間に付加され得る任意のジデオキシ塩基、例えば、ジデオキシチミン、ジデオキシシトシン、ジデオキシグアニンまたはジデオキシアデニン;(ii)プロピル基、または(iii)例えば、ベンジル、エチルもしくはメチルであるがこれらに限定されない他の有機官能基のうち少なくとも1つを含む、請求項41に記載の担体核酸分子のセット。
- (i)
(a)非メチル化担体核酸分子の少なくとも1つのサブセット;および/または
(b)メチル化担体核酸分子の少なくとも1つのサブセット
を含む担体核酸分子のセットであって、前記担体核酸分子のセットの少なくとも一方の末端が、ライゲーションを防止するように改変され、前記非メチル化担体核酸分子が、メチル化ヌクレオチドを含まず、前記メチル化担体核酸分子が、1つまたは複数のメチル化ヌクレオチドを含む、担体核酸分子のセット;
(ii)対象から得られたポリヌクレオチド試料
を含む、核酸の集団。 - 前記担体核酸分子の長さが25bpと325bpとの間である、請求項70に記載の核酸の集団。
- 前記非メチル化担体核酸分子の少なくとも1つのサブセットの第1のサブセットおよび第2のサブセットが、同じヌクレオチド配列を含む、請求項70に記載の核酸の集団。
- 前記非メチル化担体核酸分子の少なくとも1つのサブセットの第1のサブセットおよび第2のサブセットが、異なるヌクレオチド配列を含む、請求項70に記載の核酸の集団。
- 前記非メチル化担体核酸分子の少なくとも1つのサブセットの前記第1のサブセットおよび前記第2のサブセットが、ヌクレオチド配列中に、1つまたは複数のCpGジヌクレオチドを含む、請求項72または73に記載の核酸の集団。
- 前記非メチル化担体核酸分子の少なくとも1つのサブセットの前記第1のサブセット中の前記1つまたは複数のCpGジヌクレオチドの位置が、前記第2のサブセット中の前記1つまたは複数のCpGジヌクレオチドの位置とは異なる、請求項72または73に記載の核酸の集団。
- 前記非メチル化担体核酸分子の少なくとも1つのサブセットの前記第1のサブセット中の前記CpGジヌクレオチドの数が、前記第2のサブセット中のCpGジヌクレオチドの数とは異なる、請求項72または73に記載の核酸の集団。
- 前記非メチル化担体核酸分子の少なくとも1つのサブセットの前記第1のサブセット中の前記1つまたは複数のCpGジヌクレオチドに隣接するヌクレオチドの配列が、前記第2のサブセット中の前記1つまたは複数のCpGジヌクレオチドに隣接するヌクレオチドの配列とは異なる、請求項74に記載の核酸の集団。
- 前記非メチル化担体核酸分子の少なくとも1つのサブセットの第1のサブセットおよび第2のサブセットが、異なる長さのものである、請求項70に記載の核酸の集団。
- 前記1つまたは複数のメチル化ヌクレオチドが、(i)5-メチルシトシン、(ii)6-メチルアデニン、(iii)ヒドロキシメチルシトシン、(iv)メチルウラシル、および(v)任意の他のメチル化ヌクレオチドからなる群より選択される、請求項70に記載の核酸の集団。
- メチル化ヌクレオチドの数が、1、2、3、4、5、6、7、8、9、10、12、14、15、16、17、18、19または少なくとも20である、請求項79に記載の核酸の集団。
- 前記メチル化担体核酸分子の少なくとも1つのサブセットの第1のサブセットおよび第2のサブセットが、同じヌクレオチド配列を含む、請求項79に記載の核酸の集団。
- 前記メチル化担体核酸分子の少なくとも1つのサブセットの第1のサブセットおよび第2のサブセットが、異なるヌクレオチド配列を含む、請求項79に記載の核酸の集団。
- 前記メチル化担体核酸分子の少なくとも1つのサブセットの前記第1のサブセットおよび前記第2のサブセットが、ヌクレオチド配列中に、1つまたは複数のCpGジヌクレオチドを含む、請求項81または82に記載の核酸の集団。
- 前記1つまたは複数のCpGジヌクレオチドが、1つまたは複数のメチル化シトシンを含む、請求項83に記載の核酸の集団。
- 前記メチル化担体核酸分子の少なくとも1つのサブセットの前記第1のサブセット中の前記1つまたは複数のメチル化ヌクレオチドの位置が、前記第2のサブセット中の前記1つまたは複数のメチル化ヌクレオチドの位置とは異なる、請求項81または82に記載の核酸の集団。
- 前記メチル化担体核酸分子の少なくとも1つのサブセットの前記第1のサブセット中の前記メチル化ヌクレオチドの数が、前記第2のサブセット中のメチル化ヌクレオチドの数とは異なる、請求項81または82に記載の核酸の集団。
- 前記メチル化担体核酸分子の少なくとも1つのサブセットの前記第1のサブセット中の前記1つまたは複数のメチル化ヌクレオチドに隣接するヌクレオチドの配列が、前記第2のサブセット中の前記1つまたは複数のメチル化ヌクレオチドに隣接するヌクレオチドの配列とは異なる、請求項82に記載の核酸の集団。
- 前記メチル化担体核酸分子の少なくとも1つのサブセットの第1のサブセットおよび第2のサブセットが、異なる長さのものである、請求項79に記載の核酸の集団。
- 前記メチル化担体核酸分子の少なくとも1つのサブセットの、前記非メチル化担体核酸分子の少なくとも1つのサブセットに対する量が、約0:1、0.1:99.9、0.5:99.5、0.75:99.25、1:99、1:95、1:90、1:80、1:75、1:70、1:60、1:50、1:40、1:30、1:25、1:20、1:10、1:5、1:2、1:1.15、1:1、1.15:1、2:1、5:1、10:1、20:1、25:1、30:1、40:1、50:1、60:1、70:1、75:1、80:1、90:1、95:1、99:1、99.25:0.75、99.5:0.5、99.9:0.1または1:0の比である、請求項79に記載の核酸の集団。
- 前記ポリヌクレオチド試料の、前記担体核酸分子のセットに対する量が、約1:0.1;1:0.2、1:0.3、1:4、1:0.5、1:6、1:7、1:8、1:0.9、1:1、1:1、1:2、1:3、1:4、1:5、1:6、1:7、1:8、1:9、1:10の比、1:20、1:30、1:40、1:50、1:60、1:70、1:80、1:90、1:100、1:200、1:300;1:400、1:500、1:600、1:700、1:800、1:900、1:1000、1:5000、1:10,000、1:100,000、1:500,000、1:106、1:107、1:108または1:109である、請求項70に記載の核酸の集団。
- 前記ポリヌクレオチド試料が最大1μgである、請求項70に記載の核酸の集団。
- 前記ポリヌクレオチド試料が最大200ngである、請求項70に記載の核酸の集団。
- 前記ポリヌクレオチド試料が最大150ngである、請求項70に記載の核酸の集団。
- 前記ポリヌクレオチド試料が最大100ngである、請求項70に記載の核酸の集団。
- 前記担体核酸分子のセットが、前記ポリヌクレオチド試料と前記担体核酸分子のセットとの総量が約175ng、200ng、225ng、250ng、275ng、300ng、350ng、400ng、450ng、500ng、600ng、700ng、750ng、800ng、900ng、1μg、1.1μg、1.25μgまたは1.5μgになるように十分な量で添加される、請求項91から94のいずれか一項に記載の核酸の集団。
- 前記担体核酸分子の配列が、(i)ウイルスゲノム由来の配列、(ii)細菌ゲノム由来の配列、(iii)ラムダゲノム由来の配列、および(iv)非ヒトゲノム由来の配列からなる群より選択される、請求項70に記載の核酸の集団。
- 前記担体核酸分子の前記少なくとも一方の末端が、ジデオキシヌクレオチドを含む、請求項70に記載の核酸の集団。
- 前記担体核酸分子の前記少なくとも一方の末端が、ヒドロキシル基が求核試薬として作用することを阻止する任意の化学的改変を含む、請求項70に記載の核酸の集団。
- 前記担体核酸分子が、ウラシルヌクレオシドを含む、請求項70に記載の核酸の集団。
- 増幅するステップの前に、ウラシルデグリコシラーゼおよびDNAグリコシラーゼ-リアーゼを添加するステップをさらに含む、請求項99に記載の核酸の集団。
- 前記担体核酸分子の5’末端が、以下の改変:(i)反転(5’-5’)-ジデオキシチミン、ジデオキシシトシン、ジデオキシグアニンまたはジデオキシアデニン;(ii)プロピル基、または(iii)例えば、ベンジル、エチルもしくはメチルであるがこれらに限定されない他の有機官能基のうち少なくとも1つを含む、請求項70に記載の核酸の集団。
- 前記担体核酸分子の3’末端が、以下の改変:(i)酵素的に、または合成の間に付加され得る任意のジデオキシ塩基、例えば、ジデオキシチミン、ジデオキシシトシン、ジデオキシグアニンまたはジデオキシアデニン;(ii)プロピル基、または(iii)例えば、ベンジル、エチルもしくはメチルであるがこれらに限定されない他の有機官能基のうち少なくとも1つを含む、請求項70に記載の核酸の集団。
- 前記ポリヌクレオチド試料が、組織、血液、血漿、血清、尿、唾液、糞便、脳脊髄液、頬内スワブまたは胸腔穿刺から得られる、請求項70に記載の核酸の集団。
- 前記ポリヌクレオチド試料が、組織から得られる、請求項70に記載の核酸の集団。
- 前記組織から得られた前記ポリヌクレオチド試料が、酵素的手段または機械的手段によって断片化される、請求項104に記載の核酸の集団。
- 前記ポリヌクレオチド試料が、血液から得られる、請求項70に記載の核酸の集団。
- 前記血液から得られた前記ポリヌクレオチド試料が、無細胞DNA試料である、請求項106に記載の核酸の集団。
- 前記担体核酸分子が二本鎖分子である、上記請求項のいずれか一項に記載の方法。
- 前記第1の試料が、変性させるステップに供されない、上記請求項のいずれか一項に記載の方法。
- 前記第1のサブセットおよび/または前記第2のサブセット中の前記1つまたは複数のCpGヌクレオチドまたはメチル化ヌクレオチドに隣接するヌクレオチドの配列が、前記1つまたは複数のCpGヌクレオチドまたはメチル化ヌクレオチドに隣接する1ヌクレオチド、2ヌクレオチド、3ヌクレオチド、4ヌクレオチドまたは5ヌクレオチドの配列であり得る、上記請求項のいずれか一項に記載の方法または担体核酸分子のセット。
- 前記シーケンシングするステップが、少なくとも2つの分配されたセット由来の前記処理された試料のうちの少なくとも一部をシーケンシングするステップを含む、上記請求項のいずれか一項に記載の方法。
- (i)
(a)非メチル化担体核酸分子の少なくとも1つのサブセット、および/または
(b)メチル化担体核酸分子の少なくとも1つのサブセット
を含む担体核酸分子のセットであって、前記担体核酸分子のセットの少なくとも一方の末端が、ライゲーションを防止するように改変され、前記非メチル化担体核酸分子が、メチル化ヌクレオチドを含まず、前記メチル化担体核酸分子が、1つまたは複数のメチル化ヌクレオチドを含む、担体核酸分子のセット;および
(ii)メチル化ポリヌクレオチドに選択的に結合する捕捉剤
を含む、キット。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201962940853P | 2019-11-26 | 2019-11-26 | |
US62/940,853 | 2019-11-26 | ||
PCT/US2020/062419 WO2021108708A1 (en) | 2019-11-26 | 2020-11-25 | Methods, compositions and systems for improving the binding of methylated polynucleotides |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2023502752A true JP2023502752A (ja) | 2023-01-25 |
JPWO2021108708A5 JPWO2021108708A5 (ja) | 2023-12-05 |
Family
ID=73855566
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022529847A Pending JP2023502752A (ja) | 2019-11-26 | 2020-11-25 | メチル化ポリヌクレオチドの結合を改善するための方法、組成物およびシステム |
Country Status (6)
Country | Link |
---|---|
US (1) | US20210214800A1 (ja) |
EP (1) | EP4065725A1 (ja) |
JP (1) | JP2023502752A (ja) |
CN (1) | CN114746560A (ja) |
CA (1) | CA3157560A1 (ja) |
WO (1) | WO2021108708A1 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2020216438A1 (en) | 2019-01-31 | 2021-07-29 | Guardant Health, Inc. | Compositions and methods for isolating cell-free DNA |
Family Cites Families (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6582908B2 (en) | 1990-12-06 | 2003-06-24 | Affymetrix, Inc. | Oligonucleotides |
US20030017081A1 (en) | 1994-02-10 | 2003-01-23 | Affymetrix, Inc. | Method and apparatus for imaging a sample on a device |
ATE226983T1 (de) | 1994-08-19 | 2002-11-15 | Pe Corp Ny | Gekoppeltes ampflikation- und ligationverfahren |
GB9620209D0 (en) | 1996-09-27 | 1996-11-13 | Cemu Bioteknik Ab | Method of sequencing DNA |
GB9626815D0 (en) | 1996-12-23 | 1997-02-12 | Cemu Bioteknik Ab | Method of sequencing DNA |
US6969488B2 (en) | 1998-05-22 | 2005-11-29 | Solexa, Inc. | System and apparatus for sequential processing of analytes |
AR021833A1 (es) | 1998-09-30 | 2002-08-07 | Applied Research Systems | Metodos de amplificacion y secuenciacion de acido nucleico |
US7501245B2 (en) | 1999-06-28 | 2009-03-10 | Helicos Biosciences Corp. | Methods and apparatuses for analyzing polynucleotide sequences |
US6818395B1 (en) | 1999-06-28 | 2004-11-16 | California Institute Of Technology | Methods and apparatus for analyzing polynucleotide sequences |
EP1218543A2 (en) | 1999-09-29 | 2002-07-03 | Solexa Ltd. | Polynucleotide sequencing |
EP1975251A3 (en) | 2000-07-07 | 2009-03-25 | Visigen Biotechnologies, Inc. | Real-time sequence determination |
US7208271B2 (en) | 2001-11-28 | 2007-04-24 | Applera Corporation | Compositions and methods of selective nucleic acid isolation |
US7169560B2 (en) | 2003-11-12 | 2007-01-30 | Helicos Biosciences Corporation | Short cycle methods for sequencing polynucleotides |
CA2579150C (en) | 2004-09-17 | 2014-11-25 | Pacific Biosciences Of California, Inc. | Apparatus and method for analysis of molecules |
US7170050B2 (en) | 2004-09-17 | 2007-01-30 | Pacific Biosciences Of California, Inc. | Apparatus and methods for optical analysis of molecules |
EP1817430B1 (en) * | 2004-11-29 | 2009-09-16 | Klinikum der Universität Regensburg | Means and methods for detecting methylated dna |
US7482120B2 (en) | 2005-01-28 | 2009-01-27 | Helicos Biosciences Corporation | Methods and compositions for improving fidelity in a nucleic acid synthesis reaction |
US7282337B1 (en) | 2006-04-14 | 2007-10-16 | Helicos Biosciences Corporation | Methods for increasing accuracy of nucleic acid sequencing |
US8835358B2 (en) | 2009-12-15 | 2014-09-16 | Cellular Research, Inc. | Digital counting of individual molecules by stochastic attachment of diverse labels |
US20150005199A1 (en) * | 2012-08-14 | 2015-01-01 | 10X Technologies, Inc. | Compositions and methods for sample processing |
KR102028375B1 (ko) | 2012-09-04 | 2019-10-04 | 가던트 헬쓰, 인크. | 희귀 돌연변이 및 카피수 변이를 검출하기 위한 시스템 및 방법 |
US20160040229A1 (en) | 2013-08-16 | 2016-02-11 | Guardant Health, Inc. | Systems and methods to detect rare mutations and copy number variation |
US10087481B2 (en) * | 2013-03-19 | 2018-10-02 | New England Biolabs, Inc. | Enrichment of target sequences |
WO2016015058A2 (en) | 2014-07-25 | 2016-01-28 | University Of Washington | Methods of determining tissues and/or cell types giving rise to cell-free dna, and methods of identifying a disease or disorder using same |
KR102522067B1 (ko) * | 2016-05-03 | 2023-04-13 | 유니버시티 헬스 네트워크 | 무-세포 메틸화된 dna의 포획 방법 및 이의 이용 |
WO2018009723A1 (en) | 2016-07-06 | 2018-01-11 | Guardant Health, Inc. | Methods for fragmentome profiling of cell-free nucleic acids |
BR112019012958A2 (pt) * | 2016-12-22 | 2019-11-26 | Guardant Health Inc | métodos e sistemas para análise de moléculas de ácido nucleico |
JP2020513801A (ja) * | 2017-03-08 | 2020-05-21 | プレジデント アンド フェローズ オブ ハーバード カレッジ | メチル化状態が維持されるdna増幅方法 |
CA3068446A1 (en) * | 2017-06-30 | 2019-01-02 | The Regents Of The University Of California | Methods and systems for evaluating dna methylation in cell-free dna |
-
2020
- 2020-11-25 EP EP20828204.6A patent/EP4065725A1/en active Pending
- 2020-11-25 JP JP2022529847A patent/JP2023502752A/ja active Pending
- 2020-11-25 CA CA3157560A patent/CA3157560A1/en active Pending
- 2020-11-25 US US17/105,407 patent/US20210214800A1/en active Pending
- 2020-11-25 WO PCT/US2020/062419 patent/WO2021108708A1/en unknown
- 2020-11-25 CN CN202080082559.7A patent/CN114746560A/zh active Pending
Also Published As
Publication number | Publication date |
---|---|
WO2021108708A1 (en) | 2021-06-03 |
CN114746560A (zh) | 2022-07-12 |
US20210214800A1 (en) | 2021-07-15 |
EP4065725A1 (en) | 2022-10-05 |
CA3157560A1 (en) | 2021-06-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11643693B2 (en) | Compositions and methods for isolating cell-free DNA | |
US11939636B2 (en) | Methods and systems for improving patient monitoring after surgery | |
US11946106B2 (en) | Methods and systems to improve the signal to noise ratio of DNA methylation partitioning assays | |
JP2022550131A (ja) | メチル化分配アッセイにおいて無細胞dnaを解析するための組成物および方法 | |
JP2023547620A (ja) | 分配および塩基変換を使用してdnaを解析するための組成物および方法 | |
EP4041888A1 (en) | Use of cell free bacterial nucleic acids for detection of cancer | |
US20200232010A1 (en) | Methods, compositions, and systems for improving recovery of nucleic acid molecules | |
JP2023502752A (ja) | メチル化ポリヌクレオチドの結合を改善するための方法、組成物およびシステム | |
US20200131566A1 (en) | Methods, compositions and systems for calibrating epigenetic partitioning assays | |
US20230313288A1 (en) | Methods for sequence determination using partitioned nucleic acids | |
US20240002946A1 (en) | Methods and systems for improving patient monitoring after surgery | |
JP2024056984A (ja) | エピジェネティック区画アッセイを較正するための方法、組成物およびシステム | |
WO2022140629A1 (en) | Methods and systems for analyzing methylated polynucleotides | |
WO2022026761A1 (en) | Methods for isolating cell-free dna | |
WO2023282916A1 (en) | Methods of detecting genomic rearrangements using cell free nucleic acids | |
EP4179111A1 (en) | Methods of detecting genomic rearrangements using cell free nucleic acids |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231127 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20231127 |