JP7264534B2 - 核酸の塩基修飾の決定 - Google Patents
核酸の塩基修飾の決定 Download PDFInfo
- Publication number
- JP7264534B2 JP7264534B2 JP2021514525A JP2021514525A JP7264534B2 JP 7264534 B2 JP7264534 B2 JP 7264534B2 JP 2021514525 A JP2021514525 A JP 2021514525A JP 2021514525 A JP2021514525 A JP 2021514525A JP 7264534 B2 JP7264534 B2 JP 7264534B2
- Authority
- JP
- Japan
- Prior art keywords
- methylation
- dna
- nucleic acid
- molecule
- sequencing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000004048 modification Effects 0.000 title claims description 187
- 238000012986 modification Methods 0.000 title claims description 187
- 150000007523 nucleic acids Chemical class 0.000 title claims description 128
- 102000039446 nucleic acids Human genes 0.000 title claims description 125
- 108020004707 nucleic acids Proteins 0.000 title claims description 125
- 230000011987 methylation Effects 0.000 claims description 857
- 238000007069 methylation reaction Methods 0.000 claims description 856
- 108020004414 DNA Proteins 0.000 claims description 567
- 238000012163 sequencing technique Methods 0.000 claims description 349
- 206010028980 Neoplasm Diseases 0.000 claims description 243
- 210000001519 tissue Anatomy 0.000 claims description 241
- 238000000034 method Methods 0.000 claims description 217
- 125000003729 nucleotide group Chemical group 0.000 claims description 171
- 239000002773 nucleotide Substances 0.000 claims description 169
- 102000053602 DNA Human genes 0.000 claims description 140
- 238000012549 training Methods 0.000 claims description 116
- 239000000523 sample Substances 0.000 claims description 93
- 230000008774 maternal effect Effects 0.000 claims description 70
- 238000011144 upstream manufacturing Methods 0.000 claims description 70
- 201000011510 cancer Diseases 0.000 claims description 66
- 238000013527 convolutional neural network Methods 0.000 claims description 53
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 50
- 230000001605 fetal effect Effects 0.000 claims description 44
- 208000035475 disorder Diseases 0.000 claims description 42
- 108091033409 CRISPR Proteins 0.000 claims description 40
- LRSASMSXMSNRBT-UHFFFAOYSA-N 5-methylcytosine Chemical compound CC1=CNC(=O)N=C1N LRSASMSXMSNRBT-UHFFFAOYSA-N 0.000 claims description 39
- 108090000623 proteins and genes Proteins 0.000 claims description 37
- 108091035707 Consensus sequence Proteins 0.000 claims description 34
- 210000000349 chromosome Anatomy 0.000 claims description 34
- 108020004638 Circular DNA Proteins 0.000 claims description 23
- 210000003754 fetus Anatomy 0.000 claims description 22
- 239000012472 biological sample Substances 0.000 claims description 20
- HPZMWTNATZPBIH-UHFFFAOYSA-N 1-methyladenine Chemical compound CN1C=NC2=NC=NC2=C1N HPZMWTNATZPBIH-UHFFFAOYSA-N 0.000 claims description 19
- 238000010801 machine learning Methods 0.000 claims description 19
- 238000007477 logistic regression Methods 0.000 claims description 16
- RYVNIFSIEDRLSJ-UHFFFAOYSA-N 5-(hydroxymethyl)cytosine Chemical compound NC=1NC(=O)N=CC=1CO RYVNIFSIEDRLSJ-UHFFFAOYSA-N 0.000 claims description 10
- 230000005856 abnormality Effects 0.000 claims description 9
- FZWGECJQACGGTI-UHFFFAOYSA-N 2-amino-7-methyl-1,7-dihydro-6H-purin-6-one Chemical compound NC1=NC(O)=C2N(C)C=NC2=N1 FZWGECJQACGGTI-UHFFFAOYSA-N 0.000 claims description 8
- 230000002759 chromosomal effect Effects 0.000 claims description 8
- 230000003287 optical effect Effects 0.000 claims description 8
- PJKKQFAEFWCNAQ-UHFFFAOYSA-N N(4)-methylcytosine Chemical compound CNC=1C=CNC(=O)N=1 PJKKQFAEFWCNAQ-UHFFFAOYSA-N 0.000 claims description 7
- 230000004075 alteration Effects 0.000 claims description 7
- HCGHYQLFMPXSDU-UHFFFAOYSA-N 7-methyladenine Chemical compound C1=NC(N)=C2N(C)C=NC2=N1 HCGHYQLFMPXSDU-UHFFFAOYSA-N 0.000 claims description 6
- 238000000513 principal component analysis Methods 0.000 claims description 6
- FHSISDGOVSHJRW-UHFFFAOYSA-N 5-formylcytosine Chemical compound NC1=NC(=O)NC=C1C=O FHSISDGOVSHJRW-UHFFFAOYSA-N 0.000 claims description 5
- CKOMXBHMKXXTNW-UHFFFAOYSA-N 6-methyladenine Chemical compound CNC1=NC=NC2=C1N=CN2 CKOMXBHMKXXTNW-UHFFFAOYSA-N 0.000 claims description 5
- IIDONYMEGWHGRU-UHFFFAOYSA-N 3,5-dimethyluracil Chemical compound CC1=CNC(=O)N(C)C1=O IIDONYMEGWHGRU-UHFFFAOYSA-N 0.000 claims description 4
- KOLPWZCZXAMXKS-UHFFFAOYSA-N 3-methylcytosine Chemical compound CN1C(N)=CC=NC1=O KOLPWZCZXAMXKS-UHFFFAOYSA-N 0.000 claims description 4
- BLQMCTXZEMGOJM-UHFFFAOYSA-N 5-carboxycytosine Chemical compound NC=1NC(=O)N=CC=1C(O)=O BLQMCTXZEMGOJM-UHFFFAOYSA-N 0.000 claims description 4
- BXJHWYVXLGLDMZ-UHFFFAOYSA-N 6-O-methylguanine Chemical compound COC1=NC(N)=NC2=C1NC=N2 BXJHWYVXLGLDMZ-UHFFFAOYSA-N 0.000 claims description 4
- 241001465754 Metazoa Species 0.000 claims description 4
- SGSSKEDGVONRGC-UHFFFAOYSA-N N(2)-methylguanine Chemical compound O=C1NC(NC)=NC2=C1N=CN2 SGSSKEDGVONRGC-UHFFFAOYSA-N 0.000 claims description 4
- NWUTZAVMDAGNIG-UHFFFAOYSA-N O(4)-methylthymine Chemical compound COC=1NC(=O)N=CC=1C NWUTZAVMDAGNIG-UHFFFAOYSA-N 0.000 claims description 4
- ICMSBKUUXMDWAQ-UHFFFAOYSA-N N3-Methyladenine Chemical compound CN1C=NC(N)C2=C1N=CN2 ICMSBKUUXMDWAQ-UHFFFAOYSA-N 0.000 claims description 3
- 208000036878 aneuploidy Diseases 0.000 claims description 3
- 231100001075 aneuploidy Toxicity 0.000 claims description 2
- 239000002585 base Substances 0.000 description 283
- 108091029430 CpG site Proteins 0.000 description 201
- 238000004458 analytical method Methods 0.000 description 159
- 102000054766 genetic haplotypes Human genes 0.000 description 145
- 238000005259 measurement Methods 0.000 description 121
- 239000012634 fragment Substances 0.000 description 114
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 104
- 238000001369 bisulfite sequencing Methods 0.000 description 95
- 238000012360 testing method Methods 0.000 description 75
- 206010073071 hepatocellular carcinoma Diseases 0.000 description 63
- 231100000844 hepatocellular carcinoma Toxicity 0.000 description 63
- 238000001514 detection method Methods 0.000 description 60
- 108091029523 CpG island Proteins 0.000 description 57
- 230000000875 corresponding effect Effects 0.000 description 57
- 239000011159 matrix material Substances 0.000 description 57
- 210000002381 plasma Anatomy 0.000 description 54
- 108700028369 Alleles Proteins 0.000 description 53
- 229940104302 cytosine Drugs 0.000 description 50
- 238000006243 chemical reaction Methods 0.000 description 49
- GFFGJBXGBJISGV-UHFFFAOYSA-N adenyl group Chemical group N1=CN=C2N=CNC2=C1N GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 48
- 210000004027 cell Anatomy 0.000 description 48
- 238000013459 approach Methods 0.000 description 44
- 230000000295 complement effect Effects 0.000 description 28
- 108091008146 restriction endonucleases Proteins 0.000 description 28
- 238000013179 statistical model Methods 0.000 description 27
- 230000008569 process Effects 0.000 description 26
- 230000007067 DNA methylation Effects 0.000 description 25
- 230000001965 increasing effect Effects 0.000 description 25
- 239000000203 mixture Substances 0.000 description 25
- LSNNMFCWUKXFEE-UHFFFAOYSA-M Bisulfite Chemical compound OS([O-])=O LSNNMFCWUKXFEE-UHFFFAOYSA-M 0.000 description 24
- 230000003321 amplification Effects 0.000 description 24
- 238000004422 calculation algorithm Methods 0.000 description 24
- 238000003199 nucleic acid amplification method Methods 0.000 description 24
- 230000003169 placental effect Effects 0.000 description 23
- 238000009826 distribution Methods 0.000 description 22
- 238000013412 genome amplification Methods 0.000 description 22
- 238000011282 treatment Methods 0.000 description 22
- 239000003153 chemical reaction reagent Substances 0.000 description 20
- 238000003776 cleavage reaction Methods 0.000 description 20
- 238000003752 polymerase chain reaction Methods 0.000 description 20
- 238000007637 random forest analysis Methods 0.000 description 20
- 230000007017 scission Effects 0.000 description 20
- SMADWRYCYBUIKH-UHFFFAOYSA-N 2-methyl-7h-purin-6-amine Chemical class CC1=NC(N)=C2NC=NC2=N1 SMADWRYCYBUIKH-UHFFFAOYSA-N 0.000 description 17
- 229960000643 adenine Drugs 0.000 description 17
- 230000000694 effects Effects 0.000 description 17
- 229930024421 Adenine Natural products 0.000 description 16
- 230000029087 digestion Effects 0.000 description 15
- 230000002068 genetic effect Effects 0.000 description 15
- 108060002716 Exonuclease Proteins 0.000 description 14
- 102000013165 exonuclease Human genes 0.000 description 14
- 102000004190 Enzymes Human genes 0.000 description 13
- 108090000790 Enzymes Proteins 0.000 description 13
- 210000005228 liver tissue Anatomy 0.000 description 13
- 210000002826 placenta Anatomy 0.000 description 13
- 238000011002 quantification Methods 0.000 description 13
- 230000035945 sensitivity Effects 0.000 description 13
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 12
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 12
- 230000006820 DNA synthesis Effects 0.000 description 11
- 108020005004 Guide RNA Proteins 0.000 description 11
- 238000005516 engineering process Methods 0.000 description 11
- 210000005059 placental tissue Anatomy 0.000 description 11
- 230000035935 pregnancy Effects 0.000 description 11
- 238000012706 support-vector machine Methods 0.000 description 11
- 108091023043 Alu Element Proteins 0.000 description 10
- 210000000601 blood cell Anatomy 0.000 description 10
- 230000002596 correlated effect Effects 0.000 description 10
- 230000002255 enzymatic effect Effects 0.000 description 10
- 238000000126 in silico method Methods 0.000 description 10
- 230000008775 paternal effect Effects 0.000 description 10
- 210000002966 serum Anatomy 0.000 description 10
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical class CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 10
- 238000012408 PCR amplification Methods 0.000 description 9
- 108020004682 Single-Stranded DNA Proteins 0.000 description 9
- 238000003066 decision tree Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 9
- 238000011835 investigation Methods 0.000 description 9
- 238000013178 mathematical model Methods 0.000 description 9
- 108091061744 Cell-free fetal DNA Proteins 0.000 description 8
- 108060004795 Methyltransferase Proteins 0.000 description 8
- 102000016397 Methyltransferase Human genes 0.000 description 8
- 238000013528 artificial neural network Methods 0.000 description 8
- 201000010099 disease Diseases 0.000 description 8
- 230000001973 epigenetic effect Effects 0.000 description 8
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical class O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 8
- 230000001976 improved effect Effects 0.000 description 8
- 230000001404 mediated effect Effects 0.000 description 8
- 102000004169 proteins and genes Human genes 0.000 description 8
- 125000006850 spacer group Chemical group 0.000 description 8
- 239000013598 vector Substances 0.000 description 8
- 241000894006 Bacteria Species 0.000 description 7
- 208000024875 Infantile dystonia-parkinsonism Diseases 0.000 description 7
- 238000000585 Mann–Whitney U test Methods 0.000 description 7
- 108091028113 Trans-activating crRNA Proteins 0.000 description 7
- 102100033254 Tumor suppressor ARF Human genes 0.000 description 7
- 230000001594 aberrant effect Effects 0.000 description 7
- 238000007621 cluster analysis Methods 0.000 description 7
- 238000007405 data analysis Methods 0.000 description 7
- 208000001543 infantile parkinsonism-dystonia Diseases 0.000 description 7
- 238000012417 linear regression Methods 0.000 description 7
- 210000002569 neuron Anatomy 0.000 description 7
- 210000000056 organ Anatomy 0.000 description 7
- 238000011176 pooling Methods 0.000 description 7
- -1 (N1-methylcytosine) adenine Chemical compound 0.000 description 6
- 241000700721 Hepatitis B virus Species 0.000 description 6
- 101710163270 Nuclease Proteins 0.000 description 6
- 108091028043 Nucleic acid sequence Proteins 0.000 description 6
- 241000209094 Oryza Species 0.000 description 6
- 235000007164 Oryza sativa Nutrition 0.000 description 6
- 230000004913 activation Effects 0.000 description 6
- 238000001574 biopsy Methods 0.000 description 6
- 210000000481 breast Anatomy 0.000 description 6
- 238000005094 computer simulation Methods 0.000 description 6
- 230000007423 decrease Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 230000001747 exhibiting effect Effects 0.000 description 6
- 238000007672 fourth generation sequencing Methods 0.000 description 6
- 210000004185 liver Anatomy 0.000 description 6
- 238000000691 measurement method Methods 0.000 description 6
- 238000004393 prognosis Methods 0.000 description 6
- 230000000306 recurrent effect Effects 0.000 description 6
- 230000002787 reinforcement Effects 0.000 description 6
- 230000008439 repair process Effects 0.000 description 6
- 235000009566 rice Nutrition 0.000 description 6
- 201000000046 Beckwith-Wiedemann syndrome Diseases 0.000 description 5
- 108010009392 Cyclin-Dependent Kinase Inhibitor p16 Proteins 0.000 description 5
- 241000588724 Escherichia coli Species 0.000 description 5
- 241000700605 Viruses Species 0.000 description 5
- 238000000137 annealing Methods 0.000 description 5
- 210000004369 blood Anatomy 0.000 description 5
- 239000008280 blood Substances 0.000 description 5
- 230000008859 change Effects 0.000 description 5
- 238000010276 construction Methods 0.000 description 5
- 238000001976 enzyme digestion Methods 0.000 description 5
- 238000003064 k means clustering Methods 0.000 description 5
- 238000013507 mapping Methods 0.000 description 5
- 238000002360 preparation method Methods 0.000 description 5
- 230000006403 short-term memory Effects 0.000 description 5
- 238000000527 sonication Methods 0.000 description 5
- 241000894007 species Species 0.000 description 5
- 230000003612 virological effect Effects 0.000 description 5
- HWPZZUQOWRWFDB-UHFFFAOYSA-N 1-methylcytosine Chemical compound CN1C=CC(N)=NC1=O HWPZZUQOWRWFDB-UHFFFAOYSA-N 0.000 description 4
- 238000010453 CRISPR/Cas method Methods 0.000 description 4
- 206010016654 Fibrosis Diseases 0.000 description 4
- 101001076292 Homo sapiens Insulin-like growth factor II Proteins 0.000 description 4
- 210000002593 Y chromosome Anatomy 0.000 description 4
- 238000013103 analytical ultracentrifugation Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 4
- 230000007882 cirrhosis Effects 0.000 description 4
- 208000019425 cirrhosis of liver Diseases 0.000 description 4
- 230000006378 damage Effects 0.000 description 4
- 238000012217 deletion Methods 0.000 description 4
- 230000037430 deletion Effects 0.000 description 4
- 238000003745 diagnosis Methods 0.000 description 4
- 238000006073 displacement reaction Methods 0.000 description 4
- 230000014509 gene expression Effects 0.000 description 4
- 230000006607 hypermethylation Effects 0.000 description 4
- 210000003734 kidney Anatomy 0.000 description 4
- 208000020816 lung neoplasm Diseases 0.000 description 4
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 4
- 238000007855 methylation-specific PCR Methods 0.000 description 4
- 238000012544 monitoring process Methods 0.000 description 4
- 230000035772 mutation Effects 0.000 description 4
- 230000007170 pathology Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 238000004088 simulation Methods 0.000 description 4
- 239000000126 substance Substances 0.000 description 4
- 239000000758 substrate Substances 0.000 description 4
- 230000008685 targeting Effects 0.000 description 4
- 238000012956 testing procedure Methods 0.000 description 4
- 238000002560 therapeutic procedure Methods 0.000 description 4
- 210000004881 tumor cell Anatomy 0.000 description 4
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 3
- 208000023275 Autoimmune disease Diseases 0.000 description 3
- 206010006187 Breast cancer Diseases 0.000 description 3
- 208000026310 Breast neoplasm Diseases 0.000 description 3
- 238000010356 CRISPR-Cas9 genome editing Methods 0.000 description 3
- 102000014914 Carrier Proteins Human genes 0.000 description 3
- 208000000461 Esophageal Neoplasms Diseases 0.000 description 3
- 102100025947 Insulin-like growth factor II Human genes 0.000 description 3
- 206010058467 Lung neoplasm malignant Diseases 0.000 description 3
- VQAYFKKCNSOZKM-IOSLPCCCSA-N N(6)-methyladenosine Chemical compound C1=NC=2C(NC)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O VQAYFKKCNSOZKM-IOSLPCCCSA-N 0.000 description 3
- 208000006265 Renal cell carcinoma Diseases 0.000 description 3
- 208000005718 Stomach Neoplasms Diseases 0.000 description 3
- 230000002159 abnormal effect Effects 0.000 description 3
- 239000011324 bead Substances 0.000 description 3
- 108091008324 binding proteins Proteins 0.000 description 3
- 108091092356 cellular DNA Proteins 0.000 description 3
- 238000005119 centrifugation Methods 0.000 description 3
- 210000001072 colon Anatomy 0.000 description 3
- 208000029742 colonic neoplasm Diseases 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 3
- 230000007547 defect Effects 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 239000000539 dimer Substances 0.000 description 3
- 230000006862 enzymatic digestion Effects 0.000 description 3
- 238000006911 enzymatic reaction Methods 0.000 description 3
- 238000001914 filtration Methods 0.000 description 3
- 238000009396 hybridization Methods 0.000 description 3
- 238000010348 incorporation Methods 0.000 description 3
- 210000004072 lung Anatomy 0.000 description 3
- 201000005202 lung cancer Diseases 0.000 description 3
- 230000036210 malignancy Effects 0.000 description 3
- 230000000813 microbial effect Effects 0.000 description 3
- 210000000440 neutrophil Anatomy 0.000 description 3
- 239000013612 plasmid Substances 0.000 description 3
- 239000013074 reference sample Substances 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 239000007787 solid Substances 0.000 description 3
- 229940113082 thymine Drugs 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 238000010200 validation analysis Methods 0.000 description 3
- UBKVUFQGVWHZIR-UHFFFAOYSA-N 8-oxoguanine Chemical compound O=C1NC(N)=NC2=NC(=O)N=C21 UBKVUFQGVWHZIR-UHFFFAOYSA-N 0.000 description 2
- 208000010507 Adenocarcinoma of Lung Diseases 0.000 description 2
- 206010052747 Adenocarcinoma pancreas Diseases 0.000 description 2
- 238000010989 Bland-Altman Methods 0.000 description 2
- 108700004991 Cas12a Proteins 0.000 description 2
- 206010009944 Colon cancer Diseases 0.000 description 2
- 102100036279 DNA (cytosine-5)-methyltransferase 1 Human genes 0.000 description 2
- 102000012410 DNA Ligases Human genes 0.000 description 2
- 108010061982 DNA Ligases Proteins 0.000 description 2
- 230000004544 DNA amplification Effects 0.000 description 2
- 230000003350 DNA copy number gain Effects 0.000 description 2
- 230000004536 DNA copy number loss Effects 0.000 description 2
- 108010063593 DNA modification methylase SssI Proteins 0.000 description 2
- 238000001712 DNA sequencing Methods 0.000 description 2
- 208000012239 Developmental disease Diseases 0.000 description 2
- 201000010374 Down Syndrome Diseases 0.000 description 2
- 102100038595 Estrogen receptor Human genes 0.000 description 2
- 208000001914 Fragile X syndrome Diseases 0.000 description 2
- 241000233866 Fungi Species 0.000 description 2
- 241000282412 Homo Species 0.000 description 2
- 101000931098 Homo sapiens DNA (cytosine-5)-methyltransferase 1 Proteins 0.000 description 2
- 101000995924 Homo sapiens Nucleosome assembly protein 1-like 5 Proteins 0.000 description 2
- 101001012157 Homo sapiens Receptor tyrosine-protein kinase erbB-2 Proteins 0.000 description 2
- 101000818631 Homo sapiens Zinc finger imprinted 2 Proteins 0.000 description 2
- 101000730643 Homo sapiens Zinc finger protein PLAGL1 Proteins 0.000 description 2
- 208000026350 Inborn Genetic disease Diseases 0.000 description 2
- 241000124008 Mammalia Species 0.000 description 2
- VQAYFKKCNSOZKM-UHFFFAOYSA-N NSC 29409 Natural products C1=NC=2C(NC)=NC=NC=2N1C1OC(CO)C(O)C1O VQAYFKKCNSOZKM-UHFFFAOYSA-N 0.000 description 2
- 102100034530 Nucleosome assembly protein 1-like 5 Human genes 0.000 description 2
- 206010030155 Oesophageal carcinoma Diseases 0.000 description 2
- 206010061535 Ovarian neoplasm Diseases 0.000 description 2
- 206010061902 Pancreatic neoplasm Diseases 0.000 description 2
- 208000006994 Precancerous Conditions Diseases 0.000 description 2
- 208000005107 Premature Birth Diseases 0.000 description 2
- 102100030086 Receptor tyrosine-protein kinase erbB-2 Human genes 0.000 description 2
- 101150070097 Snurf gene Proteins 0.000 description 2
- 108010090804 Streptavidin Proteins 0.000 description 2
- 210000001744 T-lymphocyte Anatomy 0.000 description 2
- 206010044688 Trisomy 21 Diseases 0.000 description 2
- 108700025716 Tumor Suppressor Genes Proteins 0.000 description 2
- 102000044209 Tumor Suppressor Genes Human genes 0.000 description 2
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 2
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 2
- 108020005202 Viral DNA Proteins 0.000 description 2
- 208000027418 Wounds and injury Diseases 0.000 description 2
- 102100021114 Zinc finger imprinted 2 Human genes 0.000 description 2
- 102100032570 Zinc finger protein PLAGL1 Human genes 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000003556 assay Methods 0.000 description 2
- 210000003719 b-lymphocyte Anatomy 0.000 description 2
- 230000001580 bacterial effect Effects 0.000 description 2
- 230000006399 behavior Effects 0.000 description 2
- 206010005084 bladder transitional cell carcinoma Diseases 0.000 description 2
- 201000001528 bladder urothelial carcinoma Diseases 0.000 description 2
- 229910052799 carbon Inorganic materials 0.000 description 2
- 208000011892 carcinosarcoma of the corpus uteri Diseases 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 238000002512 chemotherapy Methods 0.000 description 2
- 210000003763 chloroplast Anatomy 0.000 description 2
- 238000006731 degradation reaction Methods 0.000 description 2
- 238000004925 denaturation Methods 0.000 description 2
- 230000036425 denaturation Effects 0.000 description 2
- 230000005782 double-strand break Effects 0.000 description 2
- 229940079593 drug Drugs 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- 230000006718 epigenetic regulation Effects 0.000 description 2
- 201000004101 esophageal cancer Diseases 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 239000012530 fluid Substances 0.000 description 2
- 238000013467 fragmentation Methods 0.000 description 2
- 238000006062 fragmentation reaction Methods 0.000 description 2
- 206010017758 gastric cancer Diseases 0.000 description 2
- 238000001502 gel electrophoresis Methods 0.000 description 2
- 230000030279 gene silencing Effects 0.000 description 2
- 208000016361 genetic disease Diseases 0.000 description 2
- 230000003394 haemopoietic effect Effects 0.000 description 2
- 239000012535 impurity Substances 0.000 description 2
- 208000014674 injury Diseases 0.000 description 2
- 238000003780 insertion Methods 0.000 description 2
- 230000037431 insertion Effects 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 208000014018 liver neoplasm Diseases 0.000 description 2
- 235000011475 lollipops Nutrition 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 201000005249 lung adenocarcinoma Diseases 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 208000030159 metabolic disease Diseases 0.000 description 2
- 238000002493 microarray Methods 0.000 description 2
- 210000003470 mitochondria Anatomy 0.000 description 2
- 201000004218 mixed epithelial/mesenchymal metaplastic breast carcinoma Diseases 0.000 description 2
- 238000002663 nebulization Methods 0.000 description 2
- 210000004940 nucleus Anatomy 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 210000003463 organelle Anatomy 0.000 description 2
- 201000010302 ovarian serous cystadenocarcinoma Diseases 0.000 description 2
- 201000002094 pancreatic adenocarcinoma Diseases 0.000 description 2
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 2
- 230000004962 physiological condition Effects 0.000 description 2
- 102000054765 polymorphisms of proteins Human genes 0.000 description 2
- 238000009598 prenatal testing Methods 0.000 description 2
- 102000003998 progesterone receptors Human genes 0.000 description 2
- 108090000468 progesterone receptors Proteins 0.000 description 2
- 210000002307 prostate Anatomy 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000006722 reduction reaction Methods 0.000 description 2
- 210000005084 renal tissue Anatomy 0.000 description 2
- 230000003252 repetitive effect Effects 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 238000007619 statistical method Methods 0.000 description 2
- 210000002784 stomach Anatomy 0.000 description 2
- 201000011549 stomach cancer Diseases 0.000 description 2
- 238000001356 surgical procedure Methods 0.000 description 2
- 201000000596 systemic lupus erythematosus Diseases 0.000 description 2
- 230000005945 translocation Effects 0.000 description 2
- 210000002700 urine Anatomy 0.000 description 2
- 201000005290 uterine carcinosarcoma Diseases 0.000 description 2
- KZMAWJRXKGLWGS-UHFFFAOYSA-N 2-chloro-n-[4-(4-methoxyphenyl)-1,3-thiazol-2-yl]-n-(3-methoxypropyl)acetamide Chemical compound S1C(N(C(=O)CCl)CCCOC)=NC(C=2C=CC(OC)=CC=2)=C1 KZMAWJRXKGLWGS-UHFFFAOYSA-N 0.000 description 1
- MJEQLGCFPLHMNV-UHFFFAOYSA-N 4-amino-1-(hydroxymethyl)pyrimidin-2-one Chemical compound NC=1C=CN(CO)C(=O)N=1 MJEQLGCFPLHMNV-UHFFFAOYSA-N 0.000 description 1
- COHVJBUINVIGOI-UHFFFAOYSA-N 4-amino-4-methyl-1,3-dihydropyrimidin-2-one Chemical compound CC1(N)NC(=O)NC=C1 COHVJBUINVIGOI-UHFFFAOYSA-N 0.000 description 1
- FTNHTYFMIOWXSI-UHFFFAOYSA-N 6-(hydroxymethylamino)-1h-pyrimidin-2-one Chemical class OCNC1=CC=NC(=O)N1 FTNHTYFMIOWXSI-UHFFFAOYSA-N 0.000 description 1
- 208000021970 Abdominal wall defect Diseases 0.000 description 1
- 241000604451 Acidaminococcus Species 0.000 description 1
- 208000024827 Alzheimer disease Diseases 0.000 description 1
- 241000203069 Archaea Species 0.000 description 1
- 101000583086 Bunodosoma granuliferum Delta-actitoxin-Bgr2b Proteins 0.000 description 1
- 101150041972 CDKN2A gene Proteins 0.000 description 1
- 108091079001 CRISPR RNA Proteins 0.000 description 1
- 101710132601 Capsid protein Proteins 0.000 description 1
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 208000005623 Carcinogenesis Diseases 0.000 description 1
- 201000009030 Carcinoma Diseases 0.000 description 1
- 108010077544 Chromatin Proteins 0.000 description 1
- 208000032170 Congenital Abnormalities Diseases 0.000 description 1
- 208000027205 Congenital disease Diseases 0.000 description 1
- 208000029767 Congenital, Hereditary, and Neonatal Diseases and Abnormalities Diseases 0.000 description 1
- 102000009508 Cyclin-Dependent Kinase Inhibitor p16 Human genes 0.000 description 1
- 108010017222 Cyclin-Dependent Kinase Inhibitor p57 Proteins 0.000 description 1
- 102000004480 Cyclin-Dependent Kinase Inhibitor p57 Human genes 0.000 description 1
- 102100033269 Cyclin-dependent kinase inhibitor 1C Human genes 0.000 description 1
- 102000016559 DNA Primase Human genes 0.000 description 1
- 108010092681 DNA Primase Proteins 0.000 description 1
- 230000030914 DNA methylation on adenine Effects 0.000 description 1
- 230000030933 DNA methylation on cytosine Effects 0.000 description 1
- 101100364969 Dictyostelium discoideum scai gene Proteins 0.000 description 1
- 101150064205 ESR1 gene Proteins 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 208000034454 F12-related hereditary angioedema with normal C1Inh Diseases 0.000 description 1
- 208000001362 Fetal Growth Retardation Diseases 0.000 description 1
- 208000018478 Foetal disease Diseases 0.000 description 1
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 1
- 206010071602 Genetic polymorphism Diseases 0.000 description 1
- 208000031448 Genomic Instability Diseases 0.000 description 1
- 102100036263 Glutamyl-tRNA(Gln) amidotransferase subunit C, mitochondrial Human genes 0.000 description 1
- 101150050733 Gnas gene Proteins 0.000 description 1
- 102100032610 Guanine nucleotide-binding protein G(s) subunit alpha isoforms XLas Human genes 0.000 description 1
- 201000005624 HELLP Syndrome Diseases 0.000 description 1
- 206010019463 Hemihypertrophy Diseases 0.000 description 1
- 206010019695 Hepatic neoplasm Diseases 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- 101000882584 Homo sapiens Estrogen receptor Proteins 0.000 description 1
- 101001001786 Homo sapiens Glutamyl-tRNA(Gln) amidotransferase subunit C, mitochondrial Proteins 0.000 description 1
- 101001014590 Homo sapiens Guanine nucleotide-binding protein G(s) subunit alpha isoforms XLas Proteins 0.000 description 1
- 101001014594 Homo sapiens Guanine nucleotide-binding protein G(s) subunit alpha isoforms short Proteins 0.000 description 1
- 101001065765 Homo sapiens Leucine-rich repeat transmembrane neuronal protein 1 Proteins 0.000 description 1
- 101000578932 Homo sapiens Membrane-associated guanylate kinase, WW and PDZ domain-containing protein 2 Proteins 0.000 description 1
- 101001014610 Homo sapiens Neuroendocrine secretory protein 55 Proteins 0.000 description 1
- 101000905839 Homo sapiens Phospholipid-transporting ATPase VA Proteins 0.000 description 1
- 101000797903 Homo sapiens Protein ALEX Proteins 0.000 description 1
- 101000928535 Homo sapiens Protein delta homolog 1 Proteins 0.000 description 1
- 101000855055 Homo sapiens Putative Wilms tumor upstream neighbor 1 gene protein Proteins 0.000 description 1
- 208000023105 Huntington disease Diseases 0.000 description 1
- 208000006031 Hydrops Fetalis Diseases 0.000 description 1
- 206010020529 Hydrops foetalis Diseases 0.000 description 1
- 206010021143 Hypoxia Diseases 0.000 description 1
- 102100031995 Leucine-rich repeat transmembrane neuronal protein 1 Human genes 0.000 description 1
- 208000005777 Lupus Nephritis Diseases 0.000 description 1
- 206010025391 Macroglossia Diseases 0.000 description 1
- 238000007476 Maximum Likelihood Methods 0.000 description 1
- 102100028328 Membrane-associated guanylate kinase, WW and PDZ domain-containing protein 2 Human genes 0.000 description 1
- 206010027476 Metastases Diseases 0.000 description 1
- 108020005196 Mitochondrial DNA Proteins 0.000 description 1
- 101100364971 Mus musculus Scai gene Proteins 0.000 description 1
- 241000244206 Nematoda Species 0.000 description 1
- 206010061309 Neoplasm progression Diseases 0.000 description 1
- 208000012902 Nervous system disease Diseases 0.000 description 1
- 208000025966 Neurological disease Diseases 0.000 description 1
- 108091034117 Oligonucleotide Proteins 0.000 description 1
- 206010033128 Ovarian cancer Diseases 0.000 description 1
- 108010010677 Phosphodiesterase I Proteins 0.000 description 1
- 102100023496 Phospholipid-transporting ATPase VA Human genes 0.000 description 1
- 206010035138 Placental insufficiency Diseases 0.000 description 1
- 108010021757 Polynucleotide 5'-Hydroxyl-Kinase Proteins 0.000 description 1
- 102000008422 Polynucleotide 5'-hydroxyl-kinase Human genes 0.000 description 1
- 201000010769 Prader-Willi syndrome Diseases 0.000 description 1
- 206010060862 Prostate cancer Diseases 0.000 description 1
- 208000000236 Prostatic Neoplasms Diseases 0.000 description 1
- 102100023075 Protein Niban 2 Human genes 0.000 description 1
- 102100036467 Protein delta homolog 1 Human genes 0.000 description 1
- 102100020713 Putative Wilms tumor upstream neighbor 1 gene protein Human genes 0.000 description 1
- 230000006093 RNA methylation Effects 0.000 description 1
- DWAQJAXMDSEUJJ-UHFFFAOYSA-M Sodium bisulfite Chemical compound [Na+].OS([O-])=O DWAQJAXMDSEUJJ-UHFFFAOYSA-M 0.000 description 1
- 101100166144 Staphylococcus aureus cas9 gene Proteins 0.000 description 1
- LSNNMFCWUKXFEE-UHFFFAOYSA-N Sulfurous acid Chemical group OS(O)=O LSNNMFCWUKXFEE-UHFFFAOYSA-N 0.000 description 1
- 108010040002 Tumor Suppressor Proteins Proteins 0.000 description 1
- 102000001742 Tumor Suppressor Proteins Human genes 0.000 description 1
- 206010067584 Type 1 diabetes mellitus Diseases 0.000 description 1
- 102000040856 WT1 Human genes 0.000 description 1
- 108700020467 WT1 Proteins 0.000 description 1
- 101150084041 WT1 gene Proteins 0.000 description 1
- 238000001793 Wilcoxon signed-rank test Methods 0.000 description 1
- 101710086987 X protein Proteins 0.000 description 1
- 101100022813 Zea mays MEG3 gene Proteins 0.000 description 1
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 1
- 230000003187 abdominal effect Effects 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 230000032683 aging Effects 0.000 description 1
- 230000003322 aneuploid effect Effects 0.000 description 1
- 239000000427 antigen Substances 0.000 description 1
- 108091007433 antigens Proteins 0.000 description 1
- 102000036639 antigens Human genes 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 230000006470 autoimmune attack Effects 0.000 description 1
- 238000013477 bayesian statistics method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 208000005980 beta thalassemia Diseases 0.000 description 1
- 230000002902 bimodal effect Effects 0.000 description 1
- 239000000090 biomarker Substances 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- NNTOJPXOCKCMKR-UHFFFAOYSA-N boron;pyridine Chemical compound [B].C1=CC=NC=C1 NNTOJPXOCKCMKR-UHFFFAOYSA-N 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 230000036952 cancer formation Effects 0.000 description 1
- 230000000711 cancerogenic effect Effects 0.000 description 1
- 238000005251 capillar electrophoresis Methods 0.000 description 1
- 231100000504 carcinogenesis Toxicity 0.000 description 1
- 231100000315 carcinogenic Toxicity 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 210000004252 chorionic villi Anatomy 0.000 description 1
- 210000003483 chromatin Anatomy 0.000 description 1
- 238000004587 chromatography analysis Methods 0.000 description 1
- 108091092240 circulating cell-free DNA Proteins 0.000 description 1
- 238000007635 classification algorithm Methods 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 239000000356 contaminant Substances 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000002790 cross-validation Methods 0.000 description 1
- 238000013211 curve analysis Methods 0.000 description 1
- 208000030381 cutaneous melanoma Diseases 0.000 description 1
- 210000000805 cytoplasm Anatomy 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000012350 deep sequencing Methods 0.000 description 1
- 230000003412 degenerative effect Effects 0.000 description 1
- 230000017858 demethylation Effects 0.000 description 1
- 238000010520 demethylation reaction Methods 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 230000001066 destructive effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 239000005546 dideoxynucleotide Substances 0.000 description 1
- 230000003292 diminished effect Effects 0.000 description 1
- BFMYDTVEBKDAKJ-UHFFFAOYSA-L disodium;(2',7'-dibromo-3',6'-dioxido-3-oxospiro[2-benzofuran-1,9'-xanthene]-4'-yl)mercury;hydrate Chemical compound O.[Na+].[Na+].O1C(=O)C2=CC=CC=C2C21C1=CC(Br)=C([O-])C([Hg])=C1OC1=C2C=C(Br)C([O-])=C1 BFMYDTVEBKDAKJ-UHFFFAOYSA-L 0.000 description 1
- 238000010494 dissociation reaction Methods 0.000 description 1
- 230000005593 dissociations Effects 0.000 description 1
- 230000019975 dosage compensation by inactivation of X chromosome Effects 0.000 description 1
- 230000003828 downregulation Effects 0.000 description 1
- 238000001962 electrophoresis Methods 0.000 description 1
- 230000013020 embryo development Effects 0.000 description 1
- 238000001839 endoscopy Methods 0.000 description 1
- 239000003623 enhancer Substances 0.000 description 1
- 230000000925 erythroid effect Effects 0.000 description 1
- 210000003238 esophagus Anatomy 0.000 description 1
- 108010038795 estrogen receptors Proteins 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 208000010706 fatty liver disease Diseases 0.000 description 1
- 208000001031 fetal erythroblastosis Diseases 0.000 description 1
- 230000004578 fetal growth Effects 0.000 description 1
- 208000030941 fetal growth restriction Diseases 0.000 description 1
- 230000009795 fibrotic process Effects 0.000 description 1
- 238000000684 flow cytometry Methods 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 238000005194 fractionation Methods 0.000 description 1
- 239000012458 free base Substances 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000002496 gastric effect Effects 0.000 description 1
- 210000001156 gastric mucosa Anatomy 0.000 description 1
- 238000012268 genome sequencing Methods 0.000 description 1
- 208000005017 glioblastoma Diseases 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 210000002216 heart Anatomy 0.000 description 1
- 208000006454 hepatitis Diseases 0.000 description 1
- 231100000283 hepatitis Toxicity 0.000 description 1
- 210000003494 hepatocyte Anatomy 0.000 description 1
- 208000016861 hereditary angioedema type 3 Diseases 0.000 description 1
- 238000007417 hierarchical cluster analysis Methods 0.000 description 1
- 210000003917 human chromosome Anatomy 0.000 description 1
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 1
- 230000007954 hypoxia Effects 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 208000026278 immune system disease Diseases 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012405 in silico analysis Methods 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 208000015181 infectious disease Diseases 0.000 description 1
- 230000008595 infiltration Effects 0.000 description 1
- 238000001764 infiltration Methods 0.000 description 1
- 208000027866 inflammatory disease Diseases 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000000302 ischemic effect Effects 0.000 description 1
- 208000013049 isolated hemihyperplasia Diseases 0.000 description 1
- 238000011901 isothermal amplification Methods 0.000 description 1
- 230000003902 lesion Effects 0.000 description 1
- 201000007270 liver cancer Diseases 0.000 description 1
- 210000004698 lymphocyte Anatomy 0.000 description 1
- 208000015486 malignant pancreatic neoplasm Diseases 0.000 description 1
- 230000010311 mammalian development Effects 0.000 description 1
- 238000004949 mass spectrometry Methods 0.000 description 1
- 235000013372 meat Nutrition 0.000 description 1
- 238000001531 micro-dissection Methods 0.000 description 1
- 238000012775 microarray technology Methods 0.000 description 1
- 230000006852 mitochondrial response to stress Effects 0.000 description 1
- 230000011278 mitosis Effects 0.000 description 1
- 239000003147 molecular marker Substances 0.000 description 1
- 201000006417 multiple sclerosis Diseases 0.000 description 1
- 201000006938 muscular dystrophy Diseases 0.000 description 1
- 208000010125 myocardial infarction Diseases 0.000 description 1
- 230000001613 neoplastic effect Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 230000007823 neuropathy Effects 0.000 description 1
- 201000001119 neuropathy Diseases 0.000 description 1
- 210000004882 non-tumor cell Anatomy 0.000 description 1
- 239000000101 novel biomarker Substances 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000002611 ovarian Effects 0.000 description 1
- 210000001672 ovary Anatomy 0.000 description 1
- 208000023112 overgrowth syndrome Diseases 0.000 description 1
- 230000003647 oxidation Effects 0.000 description 1
- 238000007254 oxidation reaction Methods 0.000 description 1
- 230000001590 oxidative effect Effects 0.000 description 1
- 108700042657 p16 Genes Proteins 0.000 description 1
- 210000000496 pancreas Anatomy 0.000 description 1
- 201000002528 pancreatic cancer Diseases 0.000 description 1
- 208000008443 pancreatic carcinoma Diseases 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 238000005375 photometry Methods 0.000 description 1
- 238000000053 physical method Methods 0.000 description 1
- 230000028742 placenta development Effects 0.000 description 1
- 239000011148 porous material Substances 0.000 description 1
- 230000003389 potentiating effect Effects 0.000 description 1
- 201000011461 pre-eclampsia Diseases 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 238000002203 pretreatment Methods 0.000 description 1
- 230000001915 proofreading effect Effects 0.000 description 1
- 238000003908 quality control method Methods 0.000 description 1
- 238000004445 quantitative analysis Methods 0.000 description 1
- 230000005855 radiation Effects 0.000 description 1
- 239000011535 reaction buffer Substances 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 238000012502 risk assessment Methods 0.000 description 1
- 238000007789 sealing Methods 0.000 description 1
- 208000011581 secondary neoplasm Diseases 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 201000003708 skin melanoma Diseases 0.000 description 1
- 235000010267 sodium hydrogen sulphite Nutrition 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
- 238000010186 staining Methods 0.000 description 1
- 239000004575 stone Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000008093 supporting effect Effects 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 230000004797 therapeutic response Effects 0.000 description 1
- 238000007671 third-generation sequencing Methods 0.000 description 1
- 230000000451 tissue damage Effects 0.000 description 1
- 231100000827 tissue damage Toxicity 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 230000005751 tumor progression Effects 0.000 description 1
- 208000001072 type 2 diabetes mellitus Diseases 0.000 description 1
- 229940035893 uracil Drugs 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6813—Hybridisation assays
- C12Q1/6816—Hybridisation assays characterised by the detection means
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6844—Nucleic acid amplification reactions
- C12Q1/6851—Quantitative amplification
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B15/00—ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/20—Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
- G16B40/10—Signal processing, e.g. from mass spectrometry [MS] or from PCR
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
- G16B40/20—Supervised data analysis
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2537/00—Reactions characterised by the reaction format or use of a specific feature
- C12Q2537/10—Reactions characterised by the reaction format or use of a specific feature the purpose or use of
- C12Q2537/164—Methylation detection other then bisulfite or methylation sensitive restriction endonucleases
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2565/00—Nucleic acid analysis characterised by mode or means of detection
- C12Q2565/60—Detection means characterised by use of a special device
- C12Q2565/601—Detection means characterised by use of a special device being a microscope, e.g. atomic force microscopy [AFM]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/154—Methylation markers
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/10—Ploidy or copy number detection
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Chemical & Material Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Medical Informatics (AREA)
- Organic Chemistry (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Molecular Biology (AREA)
- Genetics & Genomics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Theoretical Computer Science (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Analytical Chemistry (AREA)
- General Engineering & Computer Science (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Data Mining & Analysis (AREA)
- Immunology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Databases & Information Systems (AREA)
- Epidemiology (AREA)
- Evolutionary Computation (AREA)
- Public Health (AREA)
- Software Systems (AREA)
- Bioethics (AREA)
- Biomedical Technology (AREA)
- Signal Processing (AREA)
- Crystallography & Structural Chemistry (AREA)
- Medicinal Chemistry (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Plant Pathology (AREA)
Description
本出願は、2020年7月13日に出願された「核酸の塩基修飾の決定」と題する米国仮特許出願第63/051,210号、2020年5月4日に出願された「核酸の塩基修飾の決定」と題する米国仮特許出願第63/019,790号、2020年3月19日に出願された「核酸の塩基修飾の決定」と題する米国仮特許出願第62/991,891号、2020年2月5日に出願された「核酸の塩基修飾の決定」と題する米国仮特許出願第62/970,586号、および、2019年8月16日に出願された「核酸の塩基修飾の決定」と題する米国仮特許出願第62/887,987号に対する優先権の利益を主張する。これらすべての内容は、すべての目的のために参照により本明細書に援用される。
「組織」は、機能単位としてともにグループ化する細胞のグループに対応する。2つ以上のタイプの細胞が、単一の組織内に見出され得る。異なるタイプの組織は、異なるタイプの細胞(例えば、肝細胞、肺胞細胞、または血球細胞)から構成されてもよく、異なる生物(母体対胎児、移植を受けた対象の組織、微生物またはウイルスに感染した生物の組織)由来の組織あるいは健康な細胞対腫瘍細胞に対応してもよい。「参照組織」は、組織特異的メチル化レベルを決定するために使用される組織に対応する。異なる個体由来の同じ組織タイプの複数の試料を使用して、その組織タイプの組織特異的メチル化レベルを決定することができる。
本開示の実施形態は、酵素的または化学的変換なしに、塩基修飾を直接検出することを可能にする。単一分子リアルタイム配列決定を通して取得された動態特徴(例えば、配列文脈、IPD、PW)を、機械学習で分析して、修飾を検出するまたは修飾の不在を検出するモデルを開発することができる。修飾レベルは、DNA分子の起源または障害の存在もしくはレベルを決定するために使用することができる。
修飾および/または塩基を酵素的または化学的に変換することなく、塩基の修飾を検出する技術が望まれている。本明細書に記載されるように、標的塩基の修飾は、標的塩基を取り巻く塩基の単一分子リアルタイム配列決定から取得された動態特徴データを使用して、検出され得る。動態特徴には、パルス間隔、パルス幅、および配列文脈が含まれ得る。これらの動態特徴は、標的塩基の上流および下流の特定の数のヌクレオチドの測定ウィンドウについて取得することができる。これらの機能(例えば、測定ウィンドウの特定の場所)を使用して、機械学習モデルを訓練することができる。試料調製の一例として、DNA分子の2本の鎖は、ヘアピンアダプターによって結合され得、それにより、環状DNA分子が形成される。環状DNA分子により、ワトソン鎖およびクリック鎖のいずれかまたは両方の動態特徴を取得することができる。データ分析フレームワークは、測定ウィンドウの動態特徴に基づいて開発され得る。次いで、このデータ分析フレームワークを使用して、メチル化を含む修飾を検出することができる。このセクションでは、修飾を検出するための様々な技術について説明する。
図4に示すように、一例として、Pacific Biosciences SMRT配列決定からワトソン鎖のサブリードを取得して、塩基修飾の状態に関する1つの特定の塩基を分析した。図4では、塩基修飾分析にかけられた塩基の各側からの3つの塩基は、測定ウィンドウ400として定義されるであろう。一実施形態では、これらの7つの塩基(すなわち、3ヌクレオチド(nt)上流および下流の配列ならびに塩基修飾分析のための1ヌクレオチド)についての配列文脈、IPD、およびPWは、測定ウィンドウとして2次元(すなわち、2-D)マトリックスにコンパイルされた。示されている例では、測定ウィンドウ400は、ワトソン鎖の1つのサブリード用である。他の変形が本明細書に記載されている。
図6は、ワトソン鎖およびその相補的なクリック鎖からのデータを組み合わせることができる方法で、測定ウィンドウが実装され得る実施形態を示す。図6に示すように、ワトソン鎖およびクリック鎖のサブリードを単一分子リアルタイム配列決定から取得して、1つの特定の塩基の修飾について分析した。一実施形態では、環状DNA鋳型のクリック鎖からの測定ウィンドウは、塩基修飾分析にかけられたワトソン鎖からの測定ウィンドウと相補的であった。図6では、塩基修飾分析にかけられたワトソン鎖の第1の塩基の各側からの3つの塩基および第1の塩基は、第1の測定ウィンドウとして定義されるであろう。クリック鎖の第2の塩基の各側からの3つの塩基および第2の塩基は、第2の測定ウィンドウとして定義されるであろう。第2の塩基は、第1の塩基と相補的であった。一実施形態では、ワトソンおよびクリック鎖からのこれらの7つの塩基(すなわち、3ヌクレオチド(nt)上流および下流の配列ならびに塩基修飾分析のための1ヌクレオチド)についての配列文脈、IPD、PWは、2次元(すなわち、2-D)マトリックスにコンパイルされた。ワトソン鎖とクリック鎖からのこれらの測定ウィンドウは、それぞれ、第1の測定ウィンドウおよび第2の測定ウィンドウとみなされた。
図9は、測定ウィンドウを使用して任意の塩基修飾を決定する方法に関する一般的な手順を示す。非修飾および修飾が既知のDNA試料を、単一分子リアルタイム配列決定にかけた。修飾されたDNA(例えば、修飾分子902)は、塩基(例えば、塩基904)がその部位に修飾(例えば、メチル化)を有することを意味する。修飾されていないDNA(例えば、非修飾分子906)は、塩基(例えば、塩基908)がその部位に修飾を有しないことを意味する。DNAの両方のセットを、人工的に作成または処理して、修飾/非修飾DNAを形成することができる。
提案されたアプローチの実現可能性および妥当性を試験するために、単一分子リアルタイム配列決定の前に、M.SssI処理(メチル化ライブラリ)およびPCR増幅(非メチル化ライブラリ)を用いて、胎盤DNAライブラリを調製した。それぞれ、421,614および446,285の循環コンセンサス配列(CCS)に対応する、メチル化および非メチル化ライブラリの44,799,736および43,580,452のサブリードを取得した。その結果、各分子は、メチル化ライブラリおよび非メチル化ライブラリにおいて、34倍および32倍の中央値で配列決定された。データセットは、Pacific Biosciences Sequel Sequencing Kit 3.0によって調製されたDNAから生成された。このキットは、最初のPacific Biosciences Sequelシーケンサーを使用するために開発された。本明細書では、Sequelをその後継であるSequel IIと区別するために、最初のSequelをSequel Iと呼ぶ。したがって、本明細書では、Sequel Sequencing Kit 3.0をSequel I Sequencing Kit 3.0と呼ぶ。Sequel IIシーケンサー用に設計された配列決定キットには、Sequel II Sequencing Kit 1.0およびSequel II Sequencing Kit 2.0が含まれ、これらも本開示に記載されている。
図17Aは、訓練データセット中の各単一DNA分子の各CpG部位について、メチル化される確率を示す。メチル化の確率は、非メチル化ライブラリよりもメチル化ライブラリの方がはるかに高かった。メチル化される確率のカットオフが0.5の場合、非メチル化CpG部位の94.7%が非メチル化であると正しく予測され、メチル化CpGの84.7%がメチル化であると正しく予測された。
特定の配列モチーフにおける特定のCのIPDに基づくメチル化の検出は非常に低く、例えば、感度がわずか1.9%であると報告された(Clark et al.,2013)。また、本発明者らは、PWメトリックを使用せずに、かつ本明細書に記載されるデータ構造ではなく、IPDのカットオフのみを使用して、異なる配列モチーフをIPDと組み合わせることによって、このような分析を再現しようとした。例えば、調査されるCpGに隣接する3nt上流および下流を抽出した。そのCpGのIPDを、そのCpGを中心とした6ntの隣接配列(すなわち、それぞれ上流および下流の3nt)の文脈に応じて、異なるグループ(6つの位置について4096グループ)に階層化した。同じ配列モチーフ内のメチル化CpGと非メチル化CpGとの間のIPDは、ROCを使用して研究した。例えば、非メチル化「AATCGGAC」モチーフおよびメチル化「AATmCGGAC」モチーフにおけるCpGのIPDを比較すると、AUCが0.48であった。したがって、特定の配列グループにおけるカットオフを使用すると、様々なものを使用する実施形態と比較して、うまく機能しなかった
別の実施形態では、例えば、限定されないが、ランダムフォレストおよびロジスティック回帰を含む他の数学的/統計モデルは、上記の開発された特徴を適応することによって訓練することができる。CNNモデルに関して、訓練データセットおよび試験データセットは、ランダムフォレストを訓練するのに使用されたM.SssI処理(メチル化)およびPCR増幅(非メチル化)を用いて、DNAから構築された(Breiman,2001)。このランダムフォレスト分析では、6つの特徴:IPD、PW、および塩基識別(base identity)をコードする4成分のバイナリベクトルを用いて、各ヌクレオチドについて説明した。このようなバイナリベクトルでは、A、C、G、およびTは、それぞれ、[1,0,0,0]、[0,1,0,0]、[0,0,1,0]、および[0,0,0,1]でコードされる。本発明者らは、分析される各CpG部位について、両方の鎖のその10nt上流と下流の情報を組み込んで、各特徴が1つの次元を表す252次元(252D)のベクトルを形成した。252Dベクトルを有する上に記載の訓練データセットを使用して、ランダムフォレストモデルならびにロジスティック回帰モデルを訓練した。訓練されたモデルは、独立した試験データセットのメチル化状態を予測するために使用された。ランダムフォレストは、100本の決定木で構成された。ツリーの構築中に、ブートストラップ試料が使用された。各決定木のノードを分割する際、最適な分割を決定するためにジニ不純度を使用し、各分割で、最大15の特徴が考慮される。また、決定木の各リーフには、少なくとも60試料を含有する必要があった。
メチル化CpGに加えて、本明細書に記載の方法はまた、他のDNA塩基修飾を検出することができる。例えば、6mAの形態を含むメチル化アデニンを検出することができる。
核酸の塩基修飾の決定のための開示された実施形態の性能および有用性を評価するために、本発明者らは、さらにN6-アデニンメチル化(6mA)を分析した。一実施形態では、約1ngのヒトDNA(例えば、胎盤組織から抽出された)を増幅して、非メチル化アデニン(uA)、非メチル化シトシン(C)、非メチル化グアニン(G)、および非メチル化チミン(T)を用いた全ゲノム増幅を通して、100ngのDNA産物を取得した。
図36A、36B、39A、および39Bに示されるように、mAデータセットにおける鋳型DNA分子の配列決定されたA塩基にわたって、メチル化の確率の二峰分布があった。言い換えれば、mAデータセットには、uA信号を有する一部の分子が存在した。これは、mAデータセットにおける完全非メチル化分子とヘミメチル化分子の存在によってさらに証明された(図41)。考えられる理由の1つは、6mAを含む分子が全ゲノム増幅ステップ中にDNAの増幅効率を低下させるため、DNA鋳型にuAを含む分子が、全ゲノム増幅後もなお、mAデータセットのかなりの箇所を占めていることである。この説明は、6mAで増幅された1ngのゲノムDNAが10ngのDNA産物しか生成しないのに対して、非メチル化Aで増幅された1ngのゲノムDNAは、同じ増幅条件下で100ngのDNA産物を生成するという事実によって裏付けられた。したがって、mAデータセットの場合、アデニンが通常メチル化されていない(例えば、0.051%)元の鋳型DNA分子(Xiao CL et al.Mol 2018;71:306-318)は、総アデニンの約10%を占めるであろう。
(a)二本鎖DNA分子の場合、ワトソン鎖とクリック鎖のメチルアデニンのレベルは、両方とも0.8よりも大きかった。このような二本鎖分子は、アデニン部位に関して完全メチル化分子として定義された(図44、領域A)。鎖のメチルアデニンのレベルは、その鎖の全A部位の中でメチル化されていると決定されたA部位のパーセンテージとして定義された。
(b)二本鎖DNA分子の場合、一方の鎖のメチルアデニンのレベルは0.8を超えていたが、もう一方の鎖は0.2未満であった。このような分子は、アデニン部位に関してヘミメチル化分子として定義された(図44、領域B1およびB2)。
(c)二本鎖DNA分子の場合、ワトソン鎖とクリック鎖のメチルアデニンのレベルは、両方とも0.2未満であった。このような二本鎖分子は、アデニン部位に関して完全非メチル化分子として定義された(図44、領域C)。
(d)二本鎖DNA分子の場合、ワトソン鎖とクリック鎖のメチルアデニンのレベルは、グループa、b、cに属していなかった。このような二本鎖分子は、アデニン部位に関してインターレースのメチル化パターンを有する分子として定義された(図44、領域D)。インターレースのメチル化パターンは、DNA鎖に存在するメチル化アデニンと非メチル化アデニンの混合物として定義された。
DNAの6mA修飾は、細菌、古細菌、原生生物、真菌のゲノムに存在する(Didier W et al.Nat Rev Micorbiol.2009;4:183-192)。ヒトゲノムには6mAが存在し、アデニン全体の0.051%を占めることも報告されている(Xiao CL et al.Mol Cell.2018;71:306-318)。ヒトゲノムで6mAの含有量が少ないことを考慮すると、一実施形態では、全ゲノム増幅のステップで、dNTPミックス(Nは未修飾のA、C、G、およびTを表す)中の6mAの比率を調整することによって、訓練データセットを作成することができる。例えば、6mAとdNTPの比率として、1:10、1:100、1:1000、1:10000、1:100000、または1:1000000を使用することができる。別の実施形態では、アデニンDNAメチルトランスフェラーゼM.EcoGIIを使用して、6mAの訓練データセットを作成することができる。
A.メチル化の検出
上記の方法を使用したCpG部位でのメチル化の検出は、様々な生体試料およびゲノム領域に対して実施された。一例として、バイサルファイト配列決定を使用したメチル化の決定に対して、単一分子リアルタイム配列決定を使用した妊婦の血漿中の無細胞DNAを用いたメチル化の決定が検証された。メチル化の結果は、コピー数の決定や障害の診断を含む、異なる用途に使用することができる。以下に記載される方法は、CpG部位に限定されず、本明細書に記載の任意の修飾にも適用され得る。
単一分子リアルタイム配列決定は、キロ塩基長のDNA分子を配列決定することができる(Nattestad et al.,2018)。単一分子リアルタイム配列決定のロングリード情報を相乗的に利用することによって、本明細書に記載の本発明を使用したCpG部位のメチル化状態の解読により、メチル化状態のハプロタイプ情報を推測することが可能になる。ロングリードのメチル化状態ならびにそのハプロタイプ情報を推測することの実行可能性を実証するために、28,913,838個のサブリードでカバーされた478,739個の分子を用いて、胎盤組織DNAの配列を決定した。サイズが5kb超の7つの分子があった。各々は、平均で、3つのサブリードでカバーされていた。
別の例として、無細胞DNA(cfDNA)のメチル化も、非侵襲的な出生前検査の重要な分子信号としてますます認識されている。例えば、組織特異的なメチル化を有する領域のcfDNA分子を使用して、妊婦の血漿中の好中球、T細胞、B細胞、肝臓、胎盤などの異なる組織からの比例的な寄与を決定できることを示した(Sun et al.,2015)。21番染色体トリソミーを検出するために妊婦の血漿DNAメチル化を使用することの実行可能性も実証されている(Lun et al.,2013)。母体血漿中のcfDNA分子は、中央値166bpのサイズに断片化された。これは、サイズが約500bpである人工的に断片化された大腸菌DNAよりもはるかに短いものである。cfDNAはランダムに断片化されていないことが報告されている。例えば、胎盤由来などの組織起源に関連する血漿DNAの末端モチーフである。無細胞DNAのこのような特徴的な特性は、人工的に断片化された大腸菌DNAとは非常に異なる配列文脈を提供する。したがって、そのようなポリメラーゼの動態が、典型的には無細胞DNA分子のメチル化レベルを定量的に推定することを可能にするかどうかは不明のままである。この特許出願における開示は、例えば、限定されないが、上記の組織DNA分子から訓練されたメチル化予測モデルを使用することによって、妊婦の血漿中の無細胞DNAをメチル化分析することに適用可能である。
一部の実施形態は、例えば、限定されないが、2、3、4、5、10、20、30、40、50、100個のCpG部位などを含む複数のCpG部位を有するいくつかのゲノム領域でメチル化分析を行うことができる。このようなゲノム領域のサイズは、例えば、限定されないが、50、100、200、300、および500ntなどであり得る。この領域のCpG部位間の距離は、例えば、限定されないが、10、20、30、40、50、100、200、300ntなどであり得る。一実施形態では、50nt内の任意の2つの連続するCpG部位を重ね合わせて、このブロック内のCpG部位の数が11個以上であるようにCpGブロックを形成し得る。このようなブロックベースの方法では、複数の領域を単一のマトリックスとして表される1つのウィンドウに組み合わせて、領域を効果的に一緒に処理できる。
メチル化プロファイルは、組織の起源を検出したり、障害の分類を決定したりするために使用することができる。メチル化プロファイル分析は、イメージング、従来の血液パネル、およびその他の医療診断情報を含む他の臨床データと組み合わせて使用することができる。メチル化プロファイルは、本明細書に記載の任意の方法を使用して決定することができる。
このセクションでは、SMRTがコピー数を決定するのに正確であり、したがって、メチル化プロファイルおよびコピー数プロファイルを、同時に分析できることを示す。
図58に示されるように、メチル化分析の精度により、妊婦の血漿DNAメチル化プロファイルを、異なる参照組織(例えば、肝臓、好中球、リンパ球、胎盤、T細胞、B細胞、心臓、脳など)のメチル化プロファイルと比較できると考えた。したがって、異なる細胞型からの妊婦の血漿DNAプールにおけるDNAの寄与は、以下の手順を使用して推定することができる。本開示に存在する実施形態に従って決定されたDNA混合物(例えば、血漿DNA)のCpGメチル化レベルを、ベクター(X)に記録し、異なる組織にわたって検索された参照メチル化レベルを、定量(限定されないが、バイサルファイト配列決定)することができるマトリックス(M)に記録した。異なる組織からDNA混合物への比例的な寄与(proportional contribution、p)は、限定されないが、二次計画法によって解くことができる。ここでは、数学的な方程式を使用してDNA混合物への異なる臓器の比例的な寄与の推定を説明する。DNA混合物中の異なる部位のメチル化密度と、異なる組織中の対応する部位のメチル化密度との間の数学的関係を以下のように表すことができる。
Σkpk=100%
さらに、すべての臓器の寄与は、非負値である必要がある。
Pk≧0、∀k
このセクションでは、選択したゲノム領域のメチル化の代表的なレベルを決定するための技術について説明する。これは、比較的低レベルの配列決定を使用して実行され得る。メチル化レベルは、メチル化部位の数とメチル化部位の総数とを使用して、鎖ごと、分子ごと、または領域ごとに決定され得る。様々な組織のメチル化レベルも分析される。
一実施形態では、単一の核酸鎖(例えば、DNAまたはRNA)のメチル化密度を測定することができ、鎖内のメチル化塩基の数をその鎖内のメチル化可能な塩基の総数で割ったものとして定義される。この測定値は、「一本鎖メチル化レベル」とも呼ばれる。単一分子リアルタイム配列決定プラットフォームは、二本鎖DNA分子の2本の鎖の各々から配列決定情報を取得できるので、この一本鎖測定は、本開示の文脈において特に実行可能である。これは、配列決定ライブラリを調製する際にヘアピンアダプターを使用することで容易になり、二本鎖DNA分子のワトソン鎖およびクリック鎖が環状の形態で結合されて、一緒に配列決定されるようになる。実際、この構造により、同じ二本鎖DNA分子のパートナーとなるワトソン鎖とクリック鎖を、同じ反応で配列決定することができるため、任意の二本鎖DNA分子のワトソン鎖とクリック鎖の対応する相補部位のメチル化状態を、個別に決定し、直接比較することができる(例えば、図20Aおよび20B)。
図60の表の組織の全ゲノムレベルでのメチル化密度は、本開示に記載されるように、バイサルファイト配列決定および単一分子リアルタイム配列決定を使用して決定される。図62Aは、y軸にバイサルファイト配列決定によって定量されたメチル化密度を示し、x軸に組織型を示す。図62Bは、本開示に記載されている単一分子リアルタイム配列決定により定量したメチル化密度をy軸に示し、組織型をx軸に示す。
メチロミック異常は、癌ゲノムの領域でよく見られる。このような異常の一例は、選択されたゲノム領域の低メチル化および高メチル化である(Cadieux et al.Cancer Res.2006;66:8469-76、Graff et al.Cancer Res.1995;55:5195-9、Costello et al.Nat Genet.2000;24:132-8)。別の例は、選択されたゲノム領域におけるメチル化塩基および非メチル化塩基の異常なパターンである。このセクションでは、メチル化を決定する技術が、腫瘍を分析する際に、定量分析と診断の実施に使用され得ることを示す。
このセクションは、本開示のメチル化技術を使用して、ウイルスDNAのメチル化レベルを正確に決定することができることを示している。
異なるアレルは、異なるメチル化プロファイルに関連付けることができる。例えば、インプリント遺伝子は、他のアレルよりもメチル化レベルが高い1つのアレルを有する場合がある。このセクションでは、メチル化プロファイルを使用して、特定のゲノム領域のアレルを識別することができることを示す。
この例示では、本明細書に開示される方法は、少なくとも1人の胎児の妊婦から取得された血漿または血清中の無細胞核酸の分析に適用可能であることを実証する。妊娠中、胎盤細胞からの無細胞DNA分子および無細胞RNA分子が、母体循環中に見られる。このような胎盤由来の無細胞核酸分子は、母体血漿中の無細胞胎児核酸または循環無細胞胎児核酸とも呼ばれる。無細胞胎児核酸は、母体の無細胞核酸の背景の中で母体血漿中に存在する。例えば、循環無細胞胎児DNA分子は、母体の血漿および血清中の無細胞の母体DNAの背景の中で、希少種として存在する。
このセクションでは、メチル化技術が特定の試薬システムに限定されないことを示す。
図84A、84B、および84Cは、全ゲノム増幅データ(非メチル化CpG部位)およびM.SsssI処理データ(メチル化CpG部位)を含む訓練データセットにおけるSMRT-seq用の異なる試薬キットにわたる異なる測定ウィンドウのサイズの性能を示している。真陽性率はy軸にプロットされ、偽陽性率はx軸にプロットされている。図84Aは、Sequel Sequencing Kit 3.0に基づいて生成されたSMRT-seqデータを示す。図84Bは、Sequel II sequencing Kit 1.0に基づいて生成されたSMRT-seqデータを示す。図84Cは、Sequel II Sequencing Kit 2.0に基づいて生成されたSMRT-seqデータを示す。図中、分析されるCpGシトシン部位の上流信号を、「-」で示した。分析されるCpGシトシン部位の下流信号を、「+」で示した。例えば、「-6nt」は、分析されるCpGシトシン部位の6nt上流信号を表す。「+6nt」は、分析されるCpGシトシン部位の6nt下流信号を表す。「±6nt」は、分析されるCpGシトシン部位の6nt上流信号と6nt下流信号の両方を含むことを示した(すなわち、CpGシトシン部位に隣接する合計12ntの配列)。
図86A、86B、および86Cは、バイサルファイト配列決定およびSMRT-seq(Sequel II Sequencing Kit 2.0)によって定量された全体的なメチル化レベルの相関を示す。図86Aでは、SMRT-seqによって定量されたパーセンテージとしてのメチル化レベルを、y軸に示す。図86Bでは、バイサルファイト配列決定によって定量されたパーセンテージとしてのメチル化レベルを、x軸に示す。黒い線は、近似した回帰直線である。破線は、2つの尺度が等しい対角線である。図86Bは、ブランド・アルトマンプロットを示す。x軸は、本開示によるSMRT-seqおよびバイサルファイト配列決定によって定量されたメチル化レベルの平均を示す。y軸は、本開示によるSMRT-seqとバイサルファイト配列決定(すなわち、Pacific Biosciencesメチル化-バイサルファイトベースのメチル化)との間のメチル化レベルの違いを示す。破線は、2つの尺度間で差がないゼロを横切る水平線に対応する。破線から外れたデータポイントは、尺度間に偏差が存在することを示している。図86Cは、バイサルファイト配列決定によって定量された値に対するパーセンテージ変化を示す。x軸は、本開示によるSMRT-seqおよびバイサルファイト配列決定によって定量されたメチル化レベルの平均を示す。y軸は、メチル化レベルの平均に対する2つの尺度間のメチル化レベルの差のパーセンテージを示す。破線は、2つの尺度間に差がないゼロを横切る水平線に対応する。破線から外れたデータポイントは、尺度間に偏差が存在することを示している。
本開示の実施形態に従って、単一分子リアルタイム配列決定(SMRT-seq、Pacific Biosciences)を使用して、様々な癌のタイプにわたるメチル化分析を実施した。SMRT-seqに使用される癌のタイプには、大腸癌(n=3)、食道癌(n=2)、乳癌(n=2)、腎細胞癌(n=2)、肺癌(n=2)、卵巣癌(n=2)、前立腺癌(n=2)、胃癌(n=2)、および膵臓癌(n=1)が含まれるが、これらに限定されない。それらの一致する隣接する非腫瘍組織も、SMRT-seqに含まれた。データセットは、Sequel II Sequencing Kit 2.0によって調製されたDNAから生成された。
一部の実施形態では、塩基修飾(例えば、メチル化)の分析は、次のパラメータ:配列文脈、IPDおよびPW、のうちの1つ以上を使用して実施され得る。IPDとPWは、参照ゲノムに整列することなく、配列決定反応から決定することができる。単一分子リアルタイム配列決定アプローチの態様により、配列文脈、IPD、およびPWを決定する精度がさらに強化され得る。1つの態様は、配列鋳型の特定の箇所を複数回測定し得る循環コンセンサス配列の性能であり、これにより、これらの複数のリードによる値の平均または分布に基づいて、配列文脈、IPD、およびPWを測定することが可能になる。特定の実施形態では、整列プロセスを伴わない塩基修飾の分析は、計算効率を高め、所用時間を短縮し、分析のコストを削減し得る。実施形態は、整列プロセスなしで実施することができる。さらに他の実施形態では、整列プロセスを使用することができ、また、それが好ましい場合があり、例えば、整列プロセスを使用して、検出された塩基修飾の臨床的または生物学的意味を確認する場合(例えば、腫瘍抑制因子は高メチル化されている場合)、または、整列プロセスを使用して、さらなる分析のために目的の特定のゲノム領域に対応する配列決定データのサブセットを選択する場合である。選択されたゲノム領域からのデータが望まれる実施形態の場合、これらの実施形態は、ゲノム内の目的の領域、例えば、制限酵素またはCRISPR-Cas9システムで切断することができる1つ以上の酵素または酵素ベースの方法論を使用して、そのような領域を標的化することを伴い得る。PCR増幅は、典型的には、DNAの塩基修飾に関する情報が保存されないため、CRISPR-Cas9システムはPCRベースの方法よりも好ましい場合がある。そのような選択された(生物情報学的に〔例えば、整列を介して〕またはCRISPR-Cas9などの方法を介して)領域のメチル化レベルを分析して、組織起源、胎児障害、妊娠障害、および癌に関する情報を提供することができる。
実施形態では、メチル化分析は、参照ゲノムへの整列なしで、サブリードからの動態特徴および配列文脈を含む測定ウィンドウを使用して実施され得る。図88に示されるように、ゼロモード導波(ZMW)に由来するサブリードを使用して、コンセンサス配列8802(循環コンセンサス配列(CCS)としても知られている)を構築した。限定されないがPWおよびIPD値を含むCCSの各位置での平均動態値を計算した。CpG部位を取り巻く配列文脈は、そのCpG部位の上流および下流配列に基づいてCCSから決定された。したがって、本開示で定義される測定ウィンドウは、訓練のために構築され、測定ウィンドウには、CCSに関連する動態特徴を有するサブリードに従う、PW、IPD値、および配列文脈が含まれる。この手順により、サブリードを参照ゲノムに整列することが不要になる。
本明細書に記載の方法はまた、1つ以上の選択されたゲノム領域を分析するために適用され得る。一実施形態では、目的の領域(複数可)は、最初に、目的の領域(複数可)由来のDNA分子が相補的配列を有する合成オリゴヌクレオチドにハイブリダイズすることを可能にするハイブリダイゼーション法によって濃縮され得る。本明細書に記載の方法を使用した塩基修飾の分析では、元のDNA分子の塩基修飾情報がPCR産物に伝達されないため、配列決定にかける前に、標的DNA分子をPCRで増幅することができない。PCR増幅を行わずにこれらの標的領域を濃縮するために、いくつかの方法が開発されている。
crRNA:GCCUGUAAUCCCAGCACUUUGUUUUAGAGCUAUGCU
tracrRNA:AGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUU
crRNA:AGGGUCUCGCUCUGUCGCCCGUUUUAGAGCUAUGCU
tracrRNA:AGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUU
標的のAluリピートは異なる組織で高度にメチル化されていたが、本発明者らは、異なるタイプの癌がそれらのAluリピート全体で異なる脱メチル化パターンを有していると仮定した。一実施形態では、Cas9ベースの標的化単一分子リアルタイム配列決定を使用して、メチル化パターンを分析し、本明細書に存在する開示に従って異なる癌のタイプを決定することができる。
このセクションは、サブリードの深度および/またはサイズカットオフを使用して、メチル化検出の精度および/または効率を改善できることを示す。特定のサブリードの深度またはサイズを試験するために、ライブラリ調製を変更する場合がある。
このセクションでは、制限酵素を使用して、修飾の検出の実用性および/またはスループットおよび/または費用対効果を改善することを説明する。制限酵素で生成されたDNA断片は、試料の起源を特定するために使用することができる。
実施形態では、単一分子リアルタイム配列決定(例えば、Pacific Biosciences systemを使用)の前に、1つ以上の制限酵素を使用して、DNA分子を消化することができる。制限酵素の認識部位の分布は、ヒトゲノムに不均一に存在するため、制限酵素によって消化されたDNAは、歪んだサイズ分布を生成する可能性がある。制限酵素の認識部位がより多いゲノム領域は、より小さな断片に消化され、一方、制限酵素の認識部位が少ないゲノム領域は、より長い断片に消化され得る。実施形態では、サイズ範囲によって、1つ以上の制限酵素の同様の切断パターンを有する1つ以上の領域に由来するDNA分子を選択的に取得することができる。サイズ選択に必要なサイズ範囲は、1つ以上の制限酵素のインシリコの切断分析によって決定することができる。コンピュータプログラムを使用して、参照ゲノム(例えば、ヒト参照ゲノム)における目的の制限酵素の認識部位の数を決定することができる。このような参照ゲノムは、目的のゲノム領域のサイズ情報を提供するそれらの認識サイトに従って、インシリコで断片に剪断された。
このセクションでは、制限酵素消化によって生成された断片を使用して決定されたメチル化プロファイルを使用して、異なる生体試料間を識別しやすくする方法について説明する。
このセクションでは、塩基修飾を検出するために機械学習モデルを訓練する方法、および機械学習モデルを使用して塩基修飾を検出する方法の例を示す。
図102は、核酸分子中のヌクレオチドの修飾を検出する例示的な方法1020を示す。例示的な方法1020は、修飾を検出するためにモデルを訓練する方法であり得る。修飾には、メチル化が含まれ得る。メチル化は、本明細書に記載の任意のメチル化を含み得る。修飾は、メチル化および非メチル化などの個別の状態を有することができ、メチル化の種類を指定する可能性がある。したがって、ヌクレオチドには、3つ以上の状態(分類)が存在してもよい。
図103は、核酸分子中のヌクレオチドの修飾を検出するための方法1030を示す。修飾は、図102の方法1020で説明される任意の修飾であり得る。
2つのハプロタイプ間のメチル化プロファイルの違いは、腫瘍組織の試料で見つかった。したがって、ハプロタイプ間のメチル化不均衡を使用して、癌または他の障害のレベルの分類を決定することができる。ハプロタイプの不均衡はまた、胎児によるハプロタイプの遺伝を特定するために使用され得る。また、胎児の障害は、ハプロタイプ間のメチル化不均衡を分析することを通して特定することもできる。細胞DNAは、ハプロタイプのメチル化レベルを分析するために使用することができる。
単一分子リアルタイム配列決定技術により、個々のSNPを特定することが可能になる。単一分子リアルタイム配列決定ウェルから生成された長いリード(例えば、最大数キロベース)は、各コンセンサスリードに存在するハプロタイプ情報を活用することによって、ゲノムのバリアントを段階化する(phasing)ことができる(Edge et al.Genome Res.2017;27:801-812、Wenger et al.Nat Biotechnol.2019;37:1155-1162)。ハプロタイプのメチル化プロファイルは、図77に示すように、CCSによってそれぞれのハプロタイプのアレルにリンクされたCpG部位のメチル化レベルから分析することができる。この段階的なメチル化ハプロタイプ分析は、相同染色体の2つのコピーが、癌などの異なる臨床関連状態で類似するまたは異なるメチル化パターンを共有するかどうかに関する疑問を解決するために使用することができる。一実施形態では、ハプロタイプのメチル化は、そのハプロタイプに割り当てられたいくつかのDNA断片が寄与する集約されたメチル化レベルであろう。ハプロタイプは、異なるサイズのブロックであり得、限定されないが、50nt、100nt、200nt、300nt、400nt、500nt、1knt、2knt、3knt、4knt、5knt、10knt、20knt、30knt、40knt、50knt、100knt、200knt、300knt、400knt、500knt、1Mnt、2Mnt、および3Mntを含む。
図104は、相対的なハプロタイプベースのメチル化不均衡分析を示す。ハプロタイプ(すなわち、Hap IおよびHap II)は、単一分子リアルタイム配列決定の結果を分析することによって決定された。各ハプロタイプにリンクされたメチル化パターンは、図77に記載されたアプローチに従ってメチル化プロファイルが決定されたハプロタイプ関連の断片を使用して決定することができる。それによって、Hap IとHap IIの間のメチル化パターンを比較することができる。
ΔF=MHapI-MHapII
ここで、ΔFはHap IとHap IIの間のメチル化レベルの差を表し、MHapIとMHapIIは、それぞれ、Hap IとHap IIのメチル化レベルを表す。ΔFの正の値は、Hap IIと比較して、Hap IのDNAのメチル化レベルがより高いことを示唆している。
一実施形態では、ハプロタイプメチル化分析は、癌ゲノムにおけるメチル化異常を検出するのに有用であり得る。例えば、ゲノム領域内の2つのハプロタイプ間のメチル化の変化が分析される。ゲノム領域内のハプロタイプは、ハプロタイプブロックとして定義される。ハプロタイプブロックは、段階化された染色体上のアレルのセットとみなすことができる。一部の実施形態では、ハプロタイプブロックは、染色体上に物理的にリンクした2つのアレルを支持する配列情報のセットに従って、可能な限り長く延長される。ケース3033の場合、隣接する正常組織DNAの配列決定の結果から97,475個のハプロタイプブロックを取得した。ハプロタイプブロックのサイズの中央値は、2.8kbであった。ハプロタイプブロックの25%は、サイズが8.2kbを超えていた。ハプロタイプブロックの最大サイズは、282.2kbであった。データセットは、Sequel II Sequencing Kit 1.0によって調製されたDNAから生成された。
上述のように、ハプロタイプ間のメチル化レベルの分析は、HCC腫瘍組織が、ペアの隣接する非腫瘍組織と比較して、メチル化の不均衡を示すより多くのハプロタイプブロックを有していたことを明らかにした。一例として、腫瘍組織でメチル化不均衡を示すハプロタイプブロックの基準は、次のとおりであった。(1)分析されるハプロタイプブロックには、3つの配列決定ウェルから生成された少なくとも3つのCCS配列が含有されていた。(2)過去のデータに基づく隣接する非腫瘍組織DNAまたは正常組織DNAにおけるHap IとHap IIとの間のメチル化レベルの絶対差は5%未満であった。(3)腫瘍組織DNAにおけるHap IとHap IIとの間のメチル化レベルの絶対差は30%を超えていた。メチル化レベルでハプロタイプ不均衡を示す非腫瘍/正常組織は、腫瘍領域ではなくインプリント領域を示している可能性があるため、基準(2)が含まれた。非腫瘍組織におけるメチル化不均衡を示すハプロタイプブロックの基準は、次のとおりであった。(1)分析されるハプロタイプブロックには、3つの配列決定ウェルから生成された少なくとも3つのCCS配列が含有されていた。(2)過去のデータに基づく隣接する非腫瘍組織DNAまたは正常組織DNAにおけるHap IとHap IIとの間のメチル化レベルの絶対差は30%を超えていた。(3)腫瘍組織DNAにおけるHap IとHap IIとの間のメチル化レベルの絶対差は5%未満であった。
両方の親またはいずれかの親のハプロタイプを決定することができる。ハプロタイピング法には、ロングリード単一分子配列決定、リンクされたショートリード配列決定(例えば、10xゲノミクス)、長距離単一分子PCR、または母集団推論が含まれる。父方のハプロタイプがわかっている場合、父方のハプロタイプに沿って存在する少なくとも1つの父方特異的SNPアレルをそれぞれ含有する複数の無細胞DNA分子のメチル化プロファイルをリンクすることによって、無細胞胎児DNAメチロームを構築することができる。言い換えれば、父方のハプロタイプは、胎児特異的リード配列をリンクするための足場として使用される。
図109は、第1のハプロタイプおよび第2のハプロタイプを有する生物における障害を分類する、例示的な方法1090を示す。方法1090は、2つのハプロタイプ間の相対的なメチル化レベルを比較することを含む。
核酸の塩基修飾の決定に関して本明細書に開示される実施形態の性能および有用性をさらに評価するために、ヒト部分がメチル化され、マウス部分が非メチル化された、またはその逆であるヒトおよびマウスのハイブリッドDNA断片を人工的に作成した。ハイブリッドまたはキメラDNA分子の接合部を決定することにより、癌を含む様々な障害または疾患の遺伝子融合を検出できる可能性がある。
このセクションでは、ハイブリッドDNA断片の作成、次いで断片のメチル化プロファイルを決定する手順について説明する。
このセクションでは、ハイブリッドDNA断片のメチル化の結果について説明する。メチル化密度は、ハイブリッドDNA断片の様々な部分の起源を特定するために使用することができる。
図123は、生体試料中のキメラ分子を検出する方法1230を示す。キメラ分子は、2つの異なる遺伝子、染色体、細胞小器官(例えば、ミトコンドリア、核、葉緑体)、生物(哺乳動物、細菌、ウイルスなど)、および/または種からの配列を含み得る。方法1230は、生体試料からの複数のDNA分子の各々に適用され得る。一部の実施形態では、複数のDNA分子は、細胞DNAであり得る。他の実施形態では、複数のDNA分子は、妊婦の血漿由来の無細胞DNA分子であり得る。
本発明者らは、核酸の塩基修飾(例えば、メチル化)のレベルを、単一塩基の解像度で予測するための効率的なアプローチを開発した。この新しいアプローチは、調査される塩基、配列文脈、および鎖情報を取り巻くポリメラーゼ動態を同時に捕捉するための新しいスキームを実装する。動態のそのような新しい変換は、動態パルスで発生するわずかな中断を特定し、モデル化することを可能にした。IPDのみを使用した以前の方法と比較して、この特許出願に存在する新しいアプローチにより、メチル化分析の分解能および精度が大幅に改善した。この新しいスキームは、他の目的、例えば、5hmC(5-ヒドロキシメチルシトシン)、5fC(5-ホルミルシトシン)、5caC(5-カルボキシルシトシン)、4mC(4-メチルシトシン)、6mA(N6-メチルアデニン)、8oxoG(7,8-ジヒドロ-8-オキソグアニン)、8oxoA(7,8-ジヒドロ-8-オキソアデニン)および他の形態の塩基修飾ならびにDNA損傷の検出に容易に拡張することができる。別の実施形態では、この新しいスキーム(例えば、この用途に存在する2Dデジタルマトリックスに類似した動態変換)は、ナノポア配列決定システムを使用する塩基修飾分析に使用することができる。
図124は、本発明の一実施形態による測定システム12400を示す。示されたシステムは、試料ホルダ12410内のDNA分子などの試料12405を含み、試料12405をアッセイ12408と接触させて、物理的特徴12415の信号を提供することができる。試料ホルダの例は、アッセイのプローブおよび/もしくはプライマー、または液滴が(アッセイを含む液滴とともに)移動するチューブを含む、フローセルであり得る。試料からの物理的特徴12415(例えば、蛍光強度、電圧、または電流)は、検出器12420によって検出される。検出器12402は、データ信号を構成するデータポイントを取得するために、間隔(例えば、周期的な間隔)を空けて測定を行うことができる。一実施形態では、アナログ-デジタル変換器は、検出器からのアナログ信号をデジタル形態へと複数回変換する。試料ホルダ12401および検出器12402は、アッセイデバイス、例えば、本明細書に記載される実施形態に従って配列決定を行う配列決定デバイスを形成することができる。データ信号12425は、検出器12402から論理システム12403へ送信される。データ信号12425は、ローカルメモリ12435、外部メモリ12404、またはストレージデバイス12445に記憶され得る。
参考文献
Albert,T.J.et al.(2007)Direct selection of human genomic loci by microarray hybridization.Nat.Methods,4,903-905.
Beckmann et al.(2014)Detecting epigenetic motifs in low coverage and metagenomics settings.BMC Bioinformatics,15(Suppl 9): S16.
Beaulaurier,J.et al.(2019)Deciphering bacterial epigenomes using modern sequencing technologies.Nature Reviews Genetics,20:157-172.
Blow,M.J.et al.(2016)The Epigenomic Landscape of Prokaryotes.PLOS Genet.,12,e1005854.
Breiman,L.(2001)Random Forests.Mach.Learn.,45,5-32.
Chan,K.C.A.et al.(2013)Noninvasive detection of cancer-associated genome-wide hypomethylation and copy number aberrations by plasma DNA bisulfite sequencing.Proc.Natl.Acad.Sci.U.S.A.,110,18761-8.
Clark,T.A.et al.(2013)Enhanced 5-methylcytosine detection in single-molecule,real-time sequencing via Tet1 oxidation.BMC Biol.,11,4.
Clark,T.A.et al.(2012)Characterization of DNA methyltransferase specificities using single-molecule,real-time DNA sequencing.Nucleic Acids Res.,40:e29.
Eid,J.et al.(2009)Real-Time DNA Sequencing from Single Polymerase Molecules.Science 323,133-138.
Feinberg,A.P.and Irizarry,R.A.(2010)Stochastic epigenetic variation as a driving force of development,evolutionary adaptation,and disease.Proc.Natl.Acad.Sci.,107,1757-1764.
Feng,Z.et al.(2013)Detecting DNA modifications from SMRT sequencing data by modeling sequence context dependence of polymerase kinetic.PLoS Comput Biol.,9:e1002935.
Flusberg,B.A.et al.(2010)Direct detection of DNA methylation during single-molecule,real-time sequencing.Nat.Methods,7,461-465.
Frommer,M.et al.(1992)A genomic sequencing protocol that yields a positive display of 5-methylcytosine residues in individual DNA strands.Proc.Natl.Acad.Sci.,89,1827-1831.
Gai,W.et al.(2018)Liver- and colon-specific DNA methylation markers in plasma for investigation of colorectal cancers with or without liver metastases.Clin.Chem.,64,1239-1249.
Gouil,Q.et al.(2019)Latest techniques to study DNA methylation.Essays Biochem.63(6):639-648.
Grunau,C.(2001)Bisulfite genomic sequencing: systematic investigation of critical experimental parameters.Nucleic Acids Res.,29,65e-65.
Herman,J.G.et al.(1996)Methylation-specific PCR: a novel PCR assay for methylation status of CpG islands.Proc.Natl.Acad.Sci.U.S.A.,93,9821-9826.
Jiang,P.et al.(2014)Methy-Pipe: An Integrated Bioinformatics Pipeline for Whole Genome Bisulfite Sequencing Data Analysis.PLoS One,9,e100360.
LeCun,Y.et al.(1989)Backpropagation Applied to Handwritten Zip Code Recognition.Neural Comput.,1,541-551.
Lee,E.-J.et al.(2011)Targeted bisulfite sequencing by solution hybrid selection and massively parallel sequencing.Nucleic Acids Res.,39,e127-e127.
Lehmann-Werman,R.et al.(2016)Identification of tissue-specific cell death using methylation patterns of circulating DNA.Proc.Natl.Acad.Sci.,113,E1826-E1834.
Lister,R.et al.(2009)Human DNA methylomes at base resolution show widespread epigenomic differences.Nature,462,315-322.
Liu,Q.et al.(2019)Detection of DNA base modifications by deep recurrent neural network on Oxford Nanopore sequencing data.Nature Commun.,10,2449.
Liu,Y.et al.(2019)Bisulfite-free direct detection of 5-methylcytosine and 5-hydroxymethylcytosine at base resolution.Nat.Biotechnol.,37,424-429.
Lun,F.M.F.et al.(2013)Noninvasive prenatal methylomic analysis by genomewide bisulfite sequencing of maternal plasma DNA.Clin.Chem.,59,1583-1594.
Nattestad,M.et al.(2018)Complex rearrangements and oncogene amplifications revealed by long-read DNA and RNA sequencing of a breast cancer cell line.Genome Res.,28,1126-1135.
Ng,A.Y.(2004)Feature selection,L 1 vs.L 2 regularization,and rotational invariance.In,Twenty-first International Conference on Machine Learning-ICML ’04.ACM Press,New York,New York,USA,p.78.
Ni,P.et al.(2019)DeepSignal: detecting DNA methylation state from Nanopore sequencing reads using deep-learning.Bioinformatics,35,4586-4595
Okou,D.T.et al.(2007)Microarray-based genomic selection for high-throughput resequencing.Nat.Methods,4,907-909.
Olova,N.et al.(2018)Comparison of whole-genome bisulfite sequencing library preparation strategies identifies sources of biases affecting DNA methylation data.Genome Biol.,19,33.
Robertson,K.D.(2005)DNA methylation and human disease.Nat.Rev.Genet.,6,597-610.
Smith,Z.D.and Meissner,A.(2013)DNA methylation: roles in mammalian development.Nat.Rev.Genet.,14,204-20.
Schadt,E.E.et al.(2013)Modeling kinetic rate variation in third generation DNA sequencing data to detect putative modifications to DNA bases.Genome Res.,23(1):129-41.
Sun,K.et al.(2015)Plasma DNA tissue mapping by genome-wide methylation sequencing for noninvasive prenatal,cancer,and transplantation assessments.Proc.Natl.Acad.Sci.,112,E5503-E5512.
Suzuki,Y.et al.(2016)AgIn: measuring the landscape of CpG methylation of individual repetitive elements.Bioinformatics,32,2911-2919.
Watson,C.M.et al.(2019)Cas9-based enrichment and single-molecule sequencing for precise characterization of genomic duplications.Lab.Investig,100,135-146.
Zhang,W.et al.(2015)Predicting genome-wide DNA methylation using methylation marks,genomic position,and DNA regulatory elements.Genome Biol.,16,14.
Claims (41)
- 核酸分子におけるヌクレオチドの修飾を検出するための方法であって、
(a)試料核酸分子で配列決定されたヌクレオチドに対応する光信号のパルスを測定することによって得られるデータを受信し、前記データから、以下の特性:
各ヌクレオチドについての
前記ヌクレオチドの識別、
前記試料核酸分子内の前記ヌクレオチドの位置、
前記ヌクレオチドに対応する前記パルスの幅、および
前記ヌクレオチドに対応する前記パルスと近傍のヌクレオチドに対応するパルスとの間の時間を表すパルス間隔、
についての値を得ること;
(b)入力データ構造を作成することであって、入力データ構造は前記試料核酸分子で配列決定された前記ヌクレオチドのウィンドウを含み、ここで前記入力データ構造が、前記ウィンドウ内の各ヌクレオチドについての、以下の特性:
前記ヌクレオチドの前記識別、
前記ウィンドウ内の標的位置に対する前記ヌクレオチドの位置、
前記ヌクレオチドに対応する前記パルスの幅、および
前記パルス間隔、
を含む、作成することと;
(c)前記入力データ構造をモデルに入力することであって、前記モデルは、
第1の複数の第1のデータ構造を受信することであって、前記第1の複数の第1のデータ構造の各第1のデータ構造が、複数の第1の核酸分子のそれぞれの核酸分子において配列決定されたヌクレオチドのそれぞれのウィンドウに対応し、前記第1の核酸分子の各々は、前記ヌクレオチドに対応する前記光信号のパルスを測定することによって配列決定され、前記修飾は、各第1の核酸分子の各ウィンドウにおける標的位置のヌクレオチドの既知の第1の状態を有し、各第1のデータ構造が、前記入力データ構造と同じ特性についての値を含む、受信すること、
複数の第1の訓練試料を記憶することであって、各々が、前記第1の複数の第1のデータ構造のうちの1つと、前記標的位置の前記ヌクレオチドの前記第1の状態を示す第1のラベルとを含む、記憶すること、および、
前記第1の複数の第1のデータ構造が前記モデルに入力されたとき、前記複数の第1の訓練試料を使用して、前記第1のラベルの対応するラベルに一致するかまたは一致しない前記モデルの出力に基づいて前記モデルのパラメータを最適化することであって、前記モデルの出力は、前記それぞれのウィンドウにおける前記標的位置の前記ヌクレオチドが前記修飾を有するかどうかを指定する、最適化すること、によって訓練される、入力することと;並びに
(d)前記モデルを使用して、前記入力データ構造の前記ウィンドウ内の前記標的位置のヌクレオチドに前記修飾が存在するかどうかを決定することと、を含む、方法。 - 前記入力データ構造は、複数の入力データ構造のうちの1つの入力データ構造であり、
前記試料核酸分子は、複数の試料核酸分子のうちの1つの試料核酸分子であり、
前記複数の試料核酸分子は、対象の生体試料から取得され、
各入力データ構造は、前記複数の試料核酸分子のそれぞれの試料核酸分子における配列決定されたヌクレオチドのそれぞれのウィンドウに対応し、
前記方法が、
前記複数の入力データ構造を受信することと、
前記複数の入力データ構造を前記モデルに入力することと、
前記モデルを使用して、各入力データ構造の前記それぞれのウィンドウにおける標的位置のヌクレオチドに修飾が存在するかどうかを決定することと、をさらに含む、請求項1に記載の方法。 - 前記修飾が1つ以上のヌクレオチドに存在することを決定することと、
1つ以上のヌクレオチドの前記修飾の存在を使用して、障害の分類を割り当てることと、をさらに含む、請求項2に記載の方法。 - 前記障害が、癌を含む、請求項3に記載の方法。
- 前記障害の前記分類は、前記対象が前記障害を有することであると割り当てること、
をさらに含む、請求項3又は4に記載の方法。 - 前記修飾の数または前記修飾の部位を使用して、前記障害の前記分類を割り当てる、請求項3~5のいずれか1項に記載の方法。
- 前記修飾が、メチル化である、請求項1~6のいずれか1項に記載の方法。
- 前記メチル化が、4mC(N4-メチルシトシン)、5mC(5-メチルシトシン)、、5hmC(5-ヒドロキシメチルシトシン)、5fC(5-ホルミルシトシン)、5caC(5-カルボキシルシトシン)、1mA(N1-メチルアデニン)、3mA(N3-メチルアデニン)、6mA(N6-メチルアデニン)、7mA(N7-メチルアデニン)、3mC(N3-メチルシトシン)、2mG(N2-メチルグアニン)、6mG(O6-メチルグアニン)、7mG(N7-メチルグアニン)、3mT(N3-メチルチミン)、又は4mT(O4-メチルチミン)を含む、請求項7に記載の方法。
- 前記メチル化が、5mCである、請求項7に記載の方法。
- 前記メチル化が、6mAである、請求項7に記載の方法。
- 前記修飾がメチル化であって、前記方法が:
前記修飾が1つ以上のヌクレオチドに存在するかどうかのメチル化状態を決定することと、
前記1つ以上のヌクレオチドの前記メチル化状態を使用して、臨床関連のDNA画分、胎児のメチル化プロファイル、母体のメチル化プロファイル、インプリント遺伝子領域の存在、または起源の組織を決定することと、をさらに含む、請求項2に記載の方法。 - 請求項11に記載の方法であって、ここで:
前記方法は、起源の組織を決定することを含み、
起源の組織を決定することは、試料核酸分子が胎児または母体起源であるかどうかを決定することを含む、方法。 - 試料核酸分子が胎児または母体起源であるかどうかを決定することが:
前記1つ以上のヌクレオチドの前記メチル化状態を使用して前記試料核酸分子のメチル化レベルを決定すること、および
前記試料核酸分子のメチル化レベルを参照値と比較すること
を含む、請求項12に記載の方法。 - 前記参照値が、1つ以上の母体核酸分子のメチル化レベルから決定される、請求項13に記載の方法。
- 請求項13に記載の方法であって、ここで:
前記試料核酸分子の前記メチル化レベルを前記参照値と比較することは、前記試料核酸分子の前記メチル化レベルが、前記参照値よりも低いことを決定することを含み、
前記試料核酸分子が胎児または母体起源であるかどうかを決定することは、比較を用いて前記試料核酸分子が胎児起源であるかを決定することを含む、
方法。 - 請求項2記載の方法であって、前記修飾がメチル化であり、前記方法がさらに:
複数の試料核酸分子の各試料核酸分子を、ゲノムの領域に整列するものとして同定すること;
前記モデルを使用して、前記修飾が前記複数の試料核酸分子の各試料核酸分子の1つ以上のヌクレオチドに存在するかどうかについてメチル化状態を決定すること;
前記複数の試料核酸分子の前記1つ以上のヌクレオチドの複数のメチル化状態を使用して、前記ゲノムの領域のメチル化レベルを決定すること;及び
前記メチル化レベルを使用して、コピー数異常が前記ゲノムの領域に存在するかどうかを決定すること、
を含む、方法。 - 前記領域のメチル化レベルを参照レベルと比較することをさらに含み、ここでコピー数異常が前記ゲノムの領域に存在するかどうかを決定することが、比較を使用することを含む、請求項16に記載の方法。
- 前記参照レベルが、同じタイプのコピー数異常のない領域を使用して決定される、請求項17に記載の方法。
- 請求項16~18のいずれか一項に記載の方法であって、前記領域が染色体であり、前記対象が胎児を妊娠している女性対象であり、前記方法は、さらに:
コピー数異常が存在することを決定すること、及び
前記胎児が染色体異数性を有することを決定すること、
を含む、方法。 - 前記複数の試料核酸分子の各試料核酸分子が、カットオフサイズよりも大きいサイズを有する、請求項2~19のいずれか1項に記載の方法。
- 前記ウィンドウ内の前記ヌクレオチドが、循環コンセンサス配列を使用して、前記配列決定されたヌクレオチドを参照ゲノムに整列させることなく決定される、1~12のいずれか1項に記載の方法。
- 前記ウィンドウ内のヌクレオチドが、循環コンセンサス配列を使用することなく、かつ前記配列決定されたヌクレオチドを参照ゲノムに整列させることなく決定される、請求項1~12のいずれか1項に記載の方法。
- 前記複数の試料核酸分子が、複数のゲノム領域に整列し、
前記複数のゲノム領域の各ゲノム領域について
いくつかの試料核酸分子が、前記ゲノム領域に整列され、
試料核酸分子の数がカットオフ数よりも大きい、請求項2~12のいずれか1項に記載の方法。 - 前記モデルには、機械学習モデル、主成分分析、畳み込みニューラルネットワーク、またはロジスティック回帰が含まれる、請求項1~23のいずれか1項に記載の方法。
- 前記入力データ構造に対応するヌクレオチドの前記ウィンドウは、前記試料核酸分子の第1の鎖上のヌクレオチドおよび前記試料核酸分子の第2の鎖上のヌクレオチドを含み、
前記入力データ構造は、前記ウィンドウ内の各ヌクレオチドについて、鎖特性の値をさらに含み、前記鎖特性は、前記ヌクレオチドが前記第1の鎖または前記第2の鎖のいずれかに存在することを示す、請求項1~24のいずれか1項に記載の方法。 - 前記試料核酸分子が、環状DNA分子であり、
Cas9複合体を使用して二本鎖DNA分子を切断して、切断された二本鎖DNA分子を形成し、
前記切断された二本鎖DNA分子の末端にヘアピンアダプターを連結すること、によって形成される、請求項25に記載の方法。 - 前記ウィンドウ内の各ヌクレオチドが、濃縮またはフィルタリングされる、請求項1~26のいずれか1項に記載の方法。
- 前記ウィンドウ内の各ヌクレオチドが、
Cas9複合体を使用して二本鎖DNA分子を切断して、切断された二本鎖DNA分子を形成し、前記切断された二本鎖DNA分子の末端にヘアピンアダプターを連結することによって濃縮されるか、または
サイズ範囲のサイズを有する二本鎖DNA分子を選択することによってフィルタリングされる、請求項27に記載の方法。 - 前記光信号は、色素標識ヌクレオチドからの蛍光信号である、請求項1~28のいずれか1項に記載の方法。
- 前記第1の複数の第1のデータ構造に関連する各ウィンドウは、各第1の核酸分子の第1の鎖上の少なくとも4つの連続したヌクレオチドを含む、請求項1~29のいずれか1項に記載の方法。
- 請求項1に記載の方法であって、メチル化の存在を使用して、前記試料核酸分子の組織起源を検出するか、またはキメラおよびハイブリッドDNAを特定することをさらに含み、前記試料核酸分子が前記対象から得られる、方法。
- 前記複数の第1の核酸分子のうちの少なくともいくつかは、各々、第1の参照配列に対応する第1の箇所と、前記第1の参照配列とは異なる第2の参照配列に対応する第2の箇所とを含む、請求項1~31のいずれか1項に記載の方法。
- 複数のキメラ核酸分子を使用して前記モデルを検証することをさらに含み、各々が、第1の参照配列に対応する第1の箇所と、第2の参照配列に対応する第2の箇所とを含み、前記第1の箇所が第1のメチル化パターンを有し、前記第2の箇所が第2のメチル化パターンを有する、請求項1~32のいずれか1項に記載の方法。
- 前記第1の箇所は、メチラーゼで処理される、請求項32または請求項33に記載の方法。
- 前記第2の箇所は、前記第2の参照配列の非メチル化箇所に対応する、請求項34に記載の方法。
- 前記第1の参照配列は、ヒトであり、前記第2の参照配列は、異なる動物に由来する、請求項32または請求項33に記載の方法。
- 前記ウィンドウが、前記ウィンドウ内の標的位置の少なくとも3ヌクレオチド上流を含む、請求項1~36のいずれか1項に記載の方法。
- 前記試料核酸分子の配列決定をさらに含む、請求項1~30のいずれか1項に記載の方法。
- 試料核酸分子の配列決定が、前記試料核酸分子中のヌクレオチドに対応する光信号のパルスを測定することを含む、請求項38に記載の方法。
- コンピュータシステムによって実行されると、前記コンピュータシステムに請求項1~30のいずれか1項に記載の方法を実行させる複数の命令を格納するコンピュータ可読媒体。
- 少なくとも1つの記憶装置;
少なくとも1つの記憶装置に記憶された複数の命令;及び
請求項1~30のいずれか1項に記載の方法を実行するために、複数の命令の少なくともいくつかによってプログラムされた少なくとも1つのプロセッサ
を含む、コンピュータシステム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2023062223A JP7369492B2 (ja) | 2019-08-16 | 2023-04-06 | 核酸の塩基修飾の決定 |
JP2023174256A JP7462993B2 (ja) | 2019-08-16 | 2023-10-06 | 核酸の塩基修飾の決定 |
JP2024043021A JP2024075667A (ja) | 2019-08-16 | 2024-03-19 | 核酸の塩基修飾の決定 |
Applications Claiming Priority (11)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201962887987P | 2019-08-16 | 2019-08-16 | |
US62/887,987 | 2019-08-16 | ||
US202062970586P | 2020-02-05 | 2020-02-05 | |
US62/970,586 | 2020-02-05 | ||
US202062991891P | 2020-03-19 | 2020-03-19 | |
US62/991,891 | 2020-03-19 | ||
US202063019790P | 2020-05-04 | 2020-05-04 | |
US63/019,790 | 2020-05-04 | ||
US202063051210P | 2020-07-13 | 2020-07-13 | |
US63/051,210 | 2020-07-13 | ||
PCT/CN2020/109602 WO2021032060A1 (en) | 2019-08-16 | 2020-08-17 | Determination of base modifications of nucleic acids |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023062223A Division JP7369492B2 (ja) | 2019-08-16 | 2023-04-06 | 核酸の塩基修飾の決定 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2022540966A JP2022540966A (ja) | 2022-09-21 |
JPWO2021032060A5 JPWO2021032060A5 (ja) | 2023-02-07 |
JP7264534B2 true JP7264534B2 (ja) | 2023-04-25 |
Family
ID=74567577
Family Applications (4)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021514525A Active JP7264534B2 (ja) | 2019-08-16 | 2020-08-17 | 核酸の塩基修飾の決定 |
JP2023062223A Active JP7369492B2 (ja) | 2019-08-16 | 2023-04-06 | 核酸の塩基修飾の決定 |
JP2023174256A Active JP7462993B2 (ja) | 2019-08-16 | 2023-10-06 | 核酸の塩基修飾の決定 |
JP2024043021A Pending JP2024075667A (ja) | 2019-08-16 | 2024-03-19 | 核酸の塩基修飾の決定 |
Family Applications After (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023062223A Active JP7369492B2 (ja) | 2019-08-16 | 2023-04-06 | 核酸の塩基修飾の決定 |
JP2023174256A Active JP7462993B2 (ja) | 2019-08-16 | 2023-10-06 | 核酸の塩基修飾の決定 |
JP2024043021A Pending JP2024075667A (ja) | 2019-08-16 | 2024-03-19 | 核酸の塩基修飾の決定 |
Country Status (18)
Country | Link |
---|---|
US (4) | US11091794B2 (ja) |
EP (2) | EP3827092B1 (ja) |
JP (4) | JP7264534B2 (ja) |
KR (4) | KR102658592B1 (ja) |
CN (5) | CN116855595A (ja) |
AU (4) | AU2020323958B2 (ja) |
BR (2) | BR122021009560B1 (ja) |
CA (1) | CA3110884A1 (ja) |
DK (1) | DK3827092T3 (ja) |
GB (13) | GB2606945B (ja) |
IL (3) | IL294153B2 (ja) |
MX (3) | MX2021000931A (ja) |
NZ (5) | NZ786186A (ja) |
PH (1) | PH12021550223A1 (ja) |
SG (1) | SG11202101070QA (ja) |
TW (5) | TWI832483B (ja) |
WO (1) | WO2021032060A1 (ja) |
ZA (1) | ZA202100887B (ja) |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20230148447A9 (en) | 2008-12-11 | 2023-05-11 | Pacific Biosciences Of California, Inc. | Classification of nucleic acid templates |
TWI832483B (zh) | 2019-08-16 | 2024-02-11 | 香港中文大學 | 核酸鹼基修飾的測定 |
TWI771847B (zh) * | 2019-12-30 | 2022-07-21 | 財團法人工業技術研究院 | 擴增和確定目標核苷酸序列的方法 |
US20220237502A1 (en) * | 2021-01-25 | 2022-07-28 | Paypal, Inc. | Systems and methods for training and modifying a computer-based model to perform classification |
IL307398A (en) * | 2021-04-12 | 2023-12-01 | Univ Hong Kong Chinese | Base change analysis using electrical signals |
CN113409885B (zh) * | 2021-06-21 | 2022-09-20 | 天津金域医学检验实验室有限公司 | 一种自动化数据处理以及作图方法及系统 |
CN113981548B (zh) * | 2021-11-24 | 2023-07-11 | 竹石生物科技(苏州)有限公司 | Dna甲基化测序文库的制备方法和甲基化检测方法 |
WO2023183907A2 (en) * | 2022-03-25 | 2023-09-28 | The Penn State Research Foundation | Analysis of genomic word frameworks on genomic methylation data |
WO2023225004A1 (en) * | 2022-05-16 | 2023-11-23 | Bioscreening & Diagnostics Llc | Prediction of alzheimer's disease |
WO2024015138A1 (en) * | 2022-07-15 | 2024-01-18 | Massachusetts Institute Of Technology | Mixture deconvolution method for identifying dna profiles |
WO2024031097A2 (en) * | 2022-08-05 | 2024-02-08 | The Board Of Trustees Of The Leland Stanford Junior University | Systems and methods for cancer screening |
US20240127906A1 (en) * | 2022-10-11 | 2024-04-18 | Illumina, Inc. | Detecting and correcting methylation values from methylation sequencing assays |
WO2024129712A1 (en) * | 2022-12-12 | 2024-06-20 | Flagship Pioneering Innovations, Vi, Llc | Phased sequencing information from circulating tumor dna |
CN116168761B (zh) * | 2023-04-18 | 2023-06-30 | 珠海圣美生物诊断技术有限公司 | 核酸序列特征区域确定方法、装置、电子设备及存储介质 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100221716A1 (en) | 2008-12-11 | 2010-09-02 | Pacific Biosciences Of California, Inc. | Classification of Nucleic Acid Templates |
Family Cites Families (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2002214811B2 (en) * | 2000-11-13 | 2004-09-09 | Human Genetic Signatures Pty Ltd | Detection of methylated DNA molecules |
AU2003900368A0 (en) * | 2003-01-24 | 2003-02-13 | Human Genetic Signatures Pty Ltd | Assay for nucleic acid molecules |
CA2537810C (en) * | 2003-09-04 | 2012-12-18 | Human Genetic Signatures Pty Ltd | Nucleic acid detection assay |
PL2557520T3 (pl) | 2007-07-23 | 2021-10-11 | The Chinese University Of Hong Kong | Określanie zaburzenia równowagi sekwencji kwasu nukleinowego |
AU2009288696A1 (en) * | 2008-09-05 | 2010-03-11 | Pacific Biosciences Of California, Inc. | Sequencing by cognate sampling |
US8486630B2 (en) * | 2008-11-07 | 2013-07-16 | Industrial Technology Research Institute | Methods for accurate sequence data and modified base position determination |
US9175338B2 (en) | 2008-12-11 | 2015-11-03 | Pacific Biosciences Of California, Inc. | Methods for identifying nucleic acid modifications |
HUE061110T2 (hu) | 2009-11-05 | 2023-05-28 | Univ Hong Kong Chinese | Magzati genomelemzés anyai biológiai mintából |
US20120208193A1 (en) | 2011-02-15 | 2012-08-16 | Bio-Rad Laboratories, Inc. | Detecting methylation in a subpopulation of genomic dna |
US9016970B2 (en) * | 2011-06-08 | 2015-04-28 | United States Postal Service | Elastomeric force mitigating joint |
US9238836B2 (en) | 2012-03-30 | 2016-01-19 | Pacific Biosciences Of California, Inc. | Methods and compositions for sequencing modified nucleic acids |
US9175348B2 (en) | 2012-04-24 | 2015-11-03 | Pacific Biosciences Of California, Inc. | Identification of 5-methyl-C in nucleic acid templates |
ES2656023T3 (es) * | 2012-05-14 | 2018-02-22 | Bgi Genomics Co., Ltd. | Procedimiento, sistema y medio legible por ordenador para determinar la información de bases en una región predeterminada del genoma del feto |
GB2557509A (en) | 2012-06-08 | 2018-06-20 | Pacific Biosciences California Inc | Modified base detection with nanopore sequencing |
AU2013274002A1 (en) | 2012-06-15 | 2015-02-05 | Harry Stylli | Methods of detecting diseases or conditions |
CN105051208B (zh) * | 2013-03-28 | 2017-04-19 | 深圳华大基因股份有限公司 | 确定胚胎基因组中预定区域碱基信息的方法、系统和计算机可读介质 |
US10468121B2 (en) | 2013-10-01 | 2019-11-05 | Complete Genomics, Inc. | Phasing and linking processes to identify variations in a genome |
EP3495496B1 (en) | 2013-10-07 | 2020-11-25 | Sequenom, Inc. | Methods and processes for non-invasive assessment of chromosome alterations |
TWI758011B (zh) | 2014-07-18 | 2022-03-11 | 香港中文大學 | Dna混合物中之組織甲基化模式分析 |
TWI732771B (zh) | 2015-07-20 | 2021-07-11 | 香港中文大學 | Dna混合物中組織之單倍型甲基化模式分析 |
US10465232B1 (en) | 2015-10-08 | 2019-11-05 | Trace Genomics, Inc. | Methods for quantifying efficiency of nucleic acid extraction and detection |
TWI832483B (zh) | 2019-08-16 | 2024-02-11 | 香港中文大學 | 核酸鹼基修飾的測定 |
-
2020
- 2020-08-17 TW TW111138492A patent/TWI832483B/zh active
- 2020-08-17 TW TW110146624A patent/TWI783820B/zh active
- 2020-08-17 NZ NZ786186A patent/NZ786186A/en unknown
- 2020-08-17 CN CN202310684365.XA patent/CN116855595A/zh active Pending
- 2020-08-17 NZ NZ788335A patent/NZ788335A/en unknown
- 2020-08-17 NZ NZ796695A patent/NZ796695A/en unknown
- 2020-08-17 EP EP20853612.8A patent/EP3827092B1/en active Active
- 2020-08-17 GB GB2210633.0A patent/GB2606945B/en active Active
- 2020-08-17 BR BR122021009560-4A patent/BR122021009560B1/pt active IP Right Grant
- 2020-08-17 GB GB2315429.7A patent/GB2620315B/en active Active
- 2020-08-17 TW TW110146625A patent/TWI783821B/zh active
- 2020-08-17 CN CN202310692441.1A patent/CN116694745A/zh active Pending
- 2020-08-17 AU AU2020323958A patent/AU2020323958B2/en active Active
- 2020-08-17 TW TW109127986A patent/TWI752593B/zh active
- 2020-08-17 IL IL294153A patent/IL294153B2/en unknown
- 2020-08-17 SG SG11202101070QA patent/SG11202101070QA/en unknown
- 2020-08-17 NZ NZ784999A patent/NZ784999A/en unknown
- 2020-08-17 KR KR1020227026028A patent/KR102658592B1/ko active IP Right Grant
- 2020-08-17 GB GB2313739.1A patent/GB2619217B/en active Active
- 2020-08-17 GB GB2314385.2A patent/GB2619466B/en active Active
- 2020-08-17 GB GB2103003.6A patent/GB2590032B/en active Active
- 2020-08-17 CN CN202310692445.XA patent/CN116694746A/zh active Pending
- 2020-08-17 GB GB2216178.0A patent/GB2609830B/en active Active
- 2020-08-17 CN CN202310683121.XA patent/CN116875669A/zh active Pending
- 2020-08-17 GB GB2103010.1A patent/GB2590573B/en active Active
- 2020-08-17 GB GB2315431.3A patent/GB2620069B/en active Active
- 2020-08-17 MX MX2021000931A patent/MX2021000931A/es unknown
- 2020-08-17 IL IL302199A patent/IL302199B2/en unknown
- 2020-08-17 TW TW111138490A patent/TWI832482B/zh active
- 2020-08-17 US US16/995,607 patent/US11091794B2/en active Active
- 2020-08-17 GB GB2306697.0A patent/GB2615272B/en active Active
- 2020-08-17 JP JP2021514525A patent/JP7264534B2/ja active Active
- 2020-08-17 NZ NZ786185A patent/NZ786185A/en unknown
- 2020-08-17 KR KR1020227026030A patent/KR20220109494A/ko not_active Application Discontinuation
- 2020-08-17 CN CN202080004977.4A patent/CN112752853B/zh active Active
- 2020-08-17 BR BR112021003815A patent/BR112021003815A2/pt active Search and Examination
- 2020-08-17 GB GB2102808.9A patent/GB2590854B/en active Active
- 2020-08-17 IL IL280270A patent/IL280270B/en unknown
- 2020-08-17 GB GB2201811.3A patent/GB2600649B/en active Active
- 2020-08-17 CA CA3110884A patent/CA3110884A1/en active Pending
- 2020-08-17 WO PCT/CN2020/109602 patent/WO2021032060A1/en active Application Filing
- 2020-08-17 GB GB2210631.4A patent/GB2608713B/en active Active
- 2020-08-17 EP EP24151722.6A patent/EP4357461A3/en active Pending
- 2020-08-17 KR KR1020217006378A patent/KR102427319B1/ko active IP Right Grant
- 2020-08-17 KR KR1020227026029A patent/KR20220109493A/ko not_active Application Discontinuation
- 2020-08-17 DK DK20853612.8T patent/DK3827092T3/da active
- 2020-08-17 GB GB2201821.2A patent/GB2600650B/en active Active
-
2021
- 2021-01-22 MX MX2022001469A patent/MX2022001469A/es unknown
- 2021-01-22 MX MX2022001470A patent/MX2022001470A/es unknown
- 2021-01-29 PH PH12021550223A patent/PH12021550223A1/en unknown
- 2021-02-09 ZA ZA2021/00887A patent/ZA202100887B/en unknown
- 2021-07-19 US US17/379,544 patent/US11466308B2/en active Active
-
2022
- 2022-04-27 AU AU2022202791A patent/AU2022202791C1/en active Active
- 2022-08-19 US US17/891,899 patent/US20230193360A1/en active Pending
- 2022-09-14 AU AU2022231719A patent/AU2022231719B9/en active Active
-
2023
- 2023-04-06 JP JP2023062223A patent/JP7369492B2/ja active Active
- 2023-08-02 AU AU2023210593A patent/AU2023210593B2/en active Active
- 2023-09-11 US US18/464,559 patent/US20240018570A1/en active Pending
- 2023-10-06 JP JP2023174256A patent/JP7462993B2/ja active Active
-
2024
- 2024-03-19 JP JP2024043021A patent/JP2024075667A/ja active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100221716A1 (en) | 2008-12-11 | 2010-09-02 | Pacific Biosciences Of California, Inc. | Classification of Nucleic Acid Templates |
Non-Patent Citations (2)
Title |
---|
ChemBioChem,2010年,Vol.11, pp.2499-2501,<DOI: 10.1002/cbic.201000569> |
Nature Methods,2010年,Vol.7, No.6, pp.461-465,(Author manuscript (19 pages)),<doi:10.1038/nmeth.1459.> |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7264534B2 (ja) | 核酸の塩基修飾の決定 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210518 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210518 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20210518 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220726 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20221026 |
|
A524 | Written submission of copy of amendment under article 19 pct |
Free format text: JAPANESE INTERMEDIATE CODE: A524 Effective date: 20230126 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230307 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230406 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7264534 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |