RU2742355C2 - Неинвазивная диагностика путем секвенирования 5-гидроксиметилированной бесклеточной днк - Google Patents
Неинвазивная диагностика путем секвенирования 5-гидроксиметилированной бесклеточной днк Download PDFInfo
- Publication number
- RU2742355C2 RU2742355C2 RU2018138848A RU2018138848A RU2742355C2 RU 2742355 C2 RU2742355 C2 RU 2742355C2 RU 2018138848 A RU2018138848 A RU 2018138848A RU 2018138848 A RU2018138848 A RU 2018138848A RU 2742355 C2 RU2742355 C2 RU 2742355C2
- Authority
- RU
- Russia
- Prior art keywords
- bcdna
- dna
- cancer
- hydroxymethylated
- cell
- Prior art date
Links
- 238000012163 sequencing technique Methods 0.000 title claims abstract description 52
- 238000003745 diagnosis Methods 0.000 title claims description 17
- 238000000034 method Methods 0.000 claims abstract description 130
- 108020004414 DNA Proteins 0.000 claims description 154
- 206010028980 Neoplasm Diseases 0.000 claims description 125
- 201000011510 cancer Diseases 0.000 claims description 87
- 108090000623 proteins and genes Proteins 0.000 claims description 81
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 claims description 56
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 44
- 201000010099 disease Diseases 0.000 claims description 41
- 238000004458 analytical method Methods 0.000 claims description 30
- 229960002685 biotin Drugs 0.000 claims description 29
- 239000011616 biotin Substances 0.000 claims description 29
- 238000007031 hydroxymethylation reaction Methods 0.000 claims description 29
- 235000020958 biotin Nutrition 0.000 claims description 28
- 239000000203 mixture Substances 0.000 claims description 25
- 238000011282 treatment Methods 0.000 claims description 25
- -1 APCDD1L-AS1 Proteins 0.000 claims description 19
- 230000003321 amplification Effects 0.000 claims description 18
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 18
- HSCJRCZFDFQWRP-JZMIEXBBSA-N UDP-alpha-D-glucose Chemical class O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1OP(O)(=O)OP(O)(=O)OC[C@@H]1[C@@H](O)[C@@H](O)[C@H](N2C(NC(=O)C=C2)=O)O1 HSCJRCZFDFQWRP-JZMIEXBBSA-N 0.000 claims description 17
- HSCJRCZFDFQWRP-UHFFFAOYSA-N Uridindiphosphoglukose Natural products OC1C(O)C(O)C(CO)OC1OP(O)(=O)OP(O)(=O)OCC1C(O)C(O)C(N2C(NC(=O)C=C2)=O)O1 HSCJRCZFDFQWRP-UHFFFAOYSA-N 0.000 claims description 17
- 108010033065 DNA beta-glucosyltransferase Proteins 0.000 claims description 14
- 238000006352 cycloaddition reaction Methods 0.000 claims description 14
- 238000002372 labelling Methods 0.000 claims description 14
- 108091093088 Amplicon Proteins 0.000 claims description 10
- 108010090804 Streptavidin Proteins 0.000 claims description 10
- RGWHQCVHVJXOKC-SHYZEUOFSA-J dCTP(4-) Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](COP([O-])(=O)OP([O-])(=O)OP([O-])([O-])=O)[C@@H](O)C1 RGWHQCVHVJXOKC-SHYZEUOFSA-J 0.000 claims description 10
- FTNHTYFMIOWXSI-UHFFFAOYSA-N 6-(hydroxymethylamino)-1h-pyrimidin-2-one Chemical group OCNC1=CC=NC(=O)N1 FTNHTYFMIOWXSI-UHFFFAOYSA-N 0.000 claims description 9
- 238000006243 chemical reaction Methods 0.000 claims description 8
- 238000004393 prognosis Methods 0.000 claims description 8
- 102100039588 Claudin-15 Human genes 0.000 claims description 6
- 101000888605 Homo sapiens Claudin-15 Proteins 0.000 claims description 6
- 101000820477 Homo sapiens Syntaxin-binding protein 3 Proteins 0.000 claims description 6
- 102100021679 Syntaxin-binding protein 3 Human genes 0.000 claims description 6
- 102100034128 Dual specificity phosphatase 28 Human genes 0.000 claims description 5
- 102100020762 Homeobox protein Hox-C5 Human genes 0.000 claims description 5
- 101001017423 Homo sapiens Dual specificity phosphatase 28 Proteins 0.000 claims description 5
- 101001002966 Homo sapiens Homeobox protein Hox-C5 Proteins 0.000 claims description 5
- 101000619914 Homo sapiens LIM/homeobox protein Lhx5 Proteins 0.000 claims description 5
- 102100022139 LIM/homeobox protein Lhx5 Human genes 0.000 claims description 5
- 238000011534 incubation Methods 0.000 claims description 5
- 102100040357 Angiomotin-like protein 1 Human genes 0.000 claims description 4
- 102100022618 COMM domain-containing protein 6 Human genes 0.000 claims description 4
- 102100021507 Costars family protein ABRACL Human genes 0.000 claims description 4
- 102100031051 Cysteine and glycine-rich protein 1 Human genes 0.000 claims description 4
- 102100036931 G-protein coupled receptor 26 Human genes 0.000 claims description 4
- 102100036702 Glucosamine-6-phosphate isomerase 2 Human genes 0.000 claims description 4
- 102100038147 Histone chaperone ASF1B Human genes 0.000 claims description 4
- 101000891169 Homo sapiens Angiomotin-like protein 1 Proteins 0.000 claims description 4
- 101000899991 Homo sapiens COMM domain-containing protein 6 Proteins 0.000 claims description 4
- 101000677808 Homo sapiens Costars family protein ABRACL Proteins 0.000 claims description 4
- 101001071346 Homo sapiens G-protein coupled receptor 26 Proteins 0.000 claims description 4
- 101001072480 Homo sapiens Glucosamine-6-phosphate isomerase 2 Proteins 0.000 claims description 4
- 101000884473 Homo sapiens Histone chaperone ASF1B Proteins 0.000 claims description 4
- 101001091229 Homo sapiens Kinesin-like protein KIF16B Proteins 0.000 claims description 4
- 101001125322 Homo sapiens Na(+)/H(+) exchange regulatory cofactor NHE-RF2 Proteins 0.000 claims description 4
- 101000614335 Homo sapiens P2X purinoceptor 2 Proteins 0.000 claims description 4
- 101000613575 Homo sapiens Paired box protein Pax-1 Proteins 0.000 claims description 4
- 101000890956 Homo sapiens Putative Dol-P-Glc:Glc(2)Man(9)GlcNAc(2)-PP-Dol alpha-1,2-glucosyltransferase Proteins 0.000 claims description 4
- 101000922030 Homo sapiens Putative uncharacterized protein encoded by LINC00158 Proteins 0.000 claims description 4
- 101000734290 Homo sapiens RING finger protein 223 Proteins 0.000 claims description 4
- 101000806155 Homo sapiens Short-chain dehydrogenase/reductase 3 Proteins 0.000 claims description 4
- 101000640782 Homo sapiens Spermatogenesis-associated protein 31E1 Proteins 0.000 claims description 4
- 101000874762 Homo sapiens Synaptotagmin-2 Proteins 0.000 claims description 4
- 101000649115 Homo sapiens Translocating chain-associated membrane protein 1 Proteins 0.000 claims description 4
- 101000645447 Homo sapiens Transmembrane protein 168 Proteins 0.000 claims description 4
- 101000851406 Homo sapiens Transmembrane protein 65 Proteins 0.000 claims description 4
- 101000915738 Homo sapiens Zinc finger Ran-binding domain-containing protein 2 Proteins 0.000 claims description 4
- 102100034894 Kinesin-like protein KIF16B Human genes 0.000 claims description 4
- 102100029448 Na(+)/H(+) exchange regulatory cofactor NHE-RF2 Human genes 0.000 claims description 4
- 102100022883 Nuclear receptor coactivator 3 Human genes 0.000 claims description 4
- 102100040479 P2X purinoceptor 2 Human genes 0.000 claims description 4
- 102100040851 Paired box protein Pax-1 Human genes 0.000 claims description 4
- 102100040383 Putative Dol-P-Glc:Glc(2)Man(9)GlcNAc(2)-PP-Dol alpha-1,2-glucosyltransferase Human genes 0.000 claims description 4
- 102100031094 Putative uncharacterized protein encoded by LINC00158 Human genes 0.000 claims description 4
- 102000001183 RAG-1 Human genes 0.000 claims description 4
- 108060006897 RAG1 Proteins 0.000 claims description 4
- 102100034811 RING finger protein 223 Human genes 0.000 claims description 4
- 102100037857 Short-chain dehydrogenase/reductase 3 Human genes 0.000 claims description 4
- 102100033784 Spermatogenesis-associated protein 31E1 Human genes 0.000 claims description 4
- 102100036151 Synaptotagmin-2 Human genes 0.000 claims description 4
- 102100025712 Transmembrane protein 168 Human genes 0.000 claims description 4
- 102100036854 Transmembrane protein 65 Human genes 0.000 claims description 4
- 102100028956 Zinc finger Ran-binding domain-containing protein 2 Human genes 0.000 claims description 4
- 108091006374 cAMP receptor proteins Proteins 0.000 claims description 4
- SUYVUBYJARFZHO-RRKCRQDMSA-N dATP Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-RRKCRQDMSA-N 0.000 claims description 4
- SUYVUBYJARFZHO-UHFFFAOYSA-N dATP Natural products C1=NC=2C(N)=NC=NC=2N1C1CC(O)C(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-UHFFFAOYSA-N 0.000 claims description 4
- HAAZLUGHYHWQIW-KVQBGUIXSA-N dGTP Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 HAAZLUGHYHWQIW-KVQBGUIXSA-N 0.000 claims description 4
- NHVNXKFIZYSCEB-XLPZGREQSA-N dTTP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C1 NHVNXKFIZYSCEB-XLPZGREQSA-N 0.000 claims description 4
- 238000005406 washing Methods 0.000 claims description 4
- 102100030672 ADP-ribosylation factor-like protein 6-interacting protein 6 Human genes 0.000 claims description 3
- 102100039075 Aldehyde dehydrogenase family 1 member A3 Human genes 0.000 claims description 3
- 102100024371 Arf-GAP domain and FG repeat-containing protein 2 Human genes 0.000 claims description 3
- 102100035526 B melanoma antigen 1 Human genes 0.000 claims description 3
- 102100038521 Calcitonin gene-related peptide 2 Human genes 0.000 claims description 3
- 102100039511 Chymotrypsin-C Human genes 0.000 claims description 3
- 102100024069 Coiled-coil and C2 domain-containing protein 1B Human genes 0.000 claims description 3
- 102100021967 Coiled-coil domain-containing protein 33 Human genes 0.000 claims description 3
- 102100027823 Complexin-2 Human genes 0.000 claims description 3
- 102100021899 Cyclin-L2 Human genes 0.000 claims description 3
- 101700026669 DACH1 Proteins 0.000 claims description 3
- 102100028735 Dachshund homolog 1 Human genes 0.000 claims description 3
- 102100033672 Deleted in azoospermia-like Human genes 0.000 claims description 3
- 102100033267 Early placenta insulin-like peptide Human genes 0.000 claims description 3
- 102100036445 Epsin-3 Human genes 0.000 claims description 3
- 102100023301 Germ cell-less protein-like 2 Human genes 0.000 claims description 3
- 102100030943 Glutathione S-transferase P Human genes 0.000 claims description 3
- 102100028008 Heme oxygenase 2 Human genes 0.000 claims description 3
- 101000793563 Homo sapiens ADP-ribosylation factor-like protein 6-interacting protein 6 Proteins 0.000 claims description 3
- 101000959046 Homo sapiens Aldehyde dehydrogenase family 1 member A3 Proteins 0.000 claims description 3
- 101000833311 Homo sapiens Arf-GAP domain and FG repeat-containing protein 2 Proteins 0.000 claims description 3
- 101000874316 Homo sapiens B melanoma antigen 1 Proteins 0.000 claims description 3
- 101000741431 Homo sapiens Calcitonin gene-related peptide 2 Proteins 0.000 claims description 3
- 101000889306 Homo sapiens Chymotrypsin-C Proteins 0.000 claims description 3
- 101000910424 Homo sapiens Coiled-coil and C2 domain-containing protein 1B Proteins 0.000 claims description 3
- 101000897106 Homo sapiens Coiled-coil domain-containing protein 33 Proteins 0.000 claims description 3
- 101000859628 Homo sapiens Complexin-2 Proteins 0.000 claims description 3
- 101000897452 Homo sapiens Cyclin-L2 Proteins 0.000 claims description 3
- 101000871280 Homo sapiens Deleted in azoospermia-like Proteins 0.000 claims description 3
- 101000998777 Homo sapiens Early placenta insulin-like peptide Proteins 0.000 claims description 3
- 101000920711 Homo sapiens Eppin Proteins 0.000 claims description 3
- 101000851955 Homo sapiens Epsin-3 Proteins 0.000 claims description 3
- 101000830079 Homo sapiens Germ cell-less protein-like 2 Proteins 0.000 claims description 3
- 101001010139 Homo sapiens Glutathione S-transferase P Proteins 0.000 claims description 3
- 101001079615 Homo sapiens Heme oxygenase 2 Proteins 0.000 claims description 3
- 101001032342 Homo sapiens Interferon regulatory factor 7 Proteins 0.000 claims description 3
- 101001027631 Homo sapiens Kinesin-like protein KIF20B Proteins 0.000 claims description 3
- 101000624524 Homo sapiens Leucine-tRNA ligase, cytoplasmic Proteins 0.000 claims description 3
- 101000603399 Homo sapiens Neuronal PAS domain-containing protein 4 Proteins 0.000 claims description 3
- 101001094737 Homo sapiens POU domain, class 4, transcription factor 3 Proteins 0.000 claims description 3
- 101001116123 Homo sapiens Podocalyxin-like protein 2 Proteins 0.000 claims description 3
- 101001133624 Homo sapiens Polyadenylate-binding protein-interacting protein 1 Proteins 0.000 claims description 3
- 101001130147 Homo sapiens Probable D-lactate dehydrogenase, mitochondrial Proteins 0.000 claims description 3
- 101001080401 Homo sapiens Proteasome assembly chaperone 1 Proteins 0.000 claims description 3
- 101000993813 Homo sapiens Protein inscuteable homolog Proteins 0.000 claims description 3
- 101000796015 Homo sapiens Protein turtle homolog B Proteins 0.000 claims description 3
- 101000711577 Homo sapiens RING finger protein 122 Proteins 0.000 claims description 3
- 101001092196 Homo sapiens Ret finger protein-like 3 Proteins 0.000 claims description 3
- 101001111655 Homo sapiens Retinol dehydrogenase 11 Proteins 0.000 claims description 3
- 101000626379 Homo sapiens Synaptotagmin-11 Proteins 0.000 claims description 3
- 101000851425 Homo sapiens Thioredoxin-related transmembrane protein 2 Proteins 0.000 claims description 3
- 101000835726 Homo sapiens Transcription elongation factor A protein 3 Proteins 0.000 claims description 3
- 101000652326 Homo sapiens Transcription factor SOX-18 Proteins 0.000 claims description 3
- 101000629913 Homo sapiens Translocon-associated protein subunit beta Proteins 0.000 claims description 3
- 101001135572 Homo sapiens Tyrosine-protein phosphatase non-receptor type 2 Proteins 0.000 claims description 3
- 101000854879 Homo sapiens V-type proton ATPase 116 kDa subunit a 2 Proteins 0.000 claims description 3
- 101000855027 Homo sapiens WAP four-disulfide core domain protein 6 Proteins 0.000 claims description 3
- 102100038070 Interferon regulatory factor 7 Human genes 0.000 claims description 3
- 102100037691 Kinesin-like protein KIF20B Human genes 0.000 claims description 3
- 102100023339 Leucine-tRNA ligase, cytoplasmic Human genes 0.000 claims description 3
- 102100038877 Neuronal PAS domain-containing protein 4 Human genes 0.000 claims description 3
- 102100035398 POU domain, class 4, transcription factor 3 Human genes 0.000 claims description 3
- 102100024588 Podocalyxin-like protein 2 Human genes 0.000 claims description 3
- 102100034080 Polyadenylate-binding protein-interacting protein 1 Human genes 0.000 claims description 3
- 102100031708 Probable D-lactate dehydrogenase, mitochondrial Human genes 0.000 claims description 3
- 102100027583 Proteasome assembly chaperone 1 Human genes 0.000 claims description 3
- 102100031729 Protein inscuteable homolog Human genes 0.000 claims description 3
- 102100031337 Protein turtle homolog B Human genes 0.000 claims description 3
- 102100034117 RING finger protein 122 Human genes 0.000 claims description 3
- 102100035528 Ret finger protein-like 3 Human genes 0.000 claims description 3
- 102100023916 Retinol dehydrogenase 11 Human genes 0.000 claims description 3
- 102100026974 Sorbitol dehydrogenase Human genes 0.000 claims description 3
- 101710184713 Sorbitol dehydrogenase Proteins 0.000 claims description 3
- 102100024609 Synaptotagmin-11 Human genes 0.000 claims description 3
- 102100036927 Thioredoxin-related transmembrane protein 2 Human genes 0.000 claims description 3
- 102100027188 Thyroid peroxidase Human genes 0.000 claims description 3
- 101710113649 Thyroid peroxidase Proteins 0.000 claims description 3
- 102100026427 Transcription elongation factor A protein 3 Human genes 0.000 claims description 3
- 102100030249 Transcription factor SOX-18 Human genes 0.000 claims description 3
- 102100026229 Translocon-associated protein subunit beta Human genes 0.000 claims description 3
- 102100033141 Tyrosine-protein phosphatase non-receptor type 2 Human genes 0.000 claims description 3
- 102100020745 V-type proton ATPase 116 kDa subunit a 2 Human genes 0.000 claims description 3
- 102100020719 WAP four-disulfide core domain protein 6 Human genes 0.000 claims description 3
- 150000001615 biotins Chemical class 0.000 claims description 3
- 102100027400 A disintegrin and metalloproteinase with thrombospondin motifs 4 Human genes 0.000 claims description 2
- 108091005664 ADAMTS4 Proteins 0.000 claims description 2
- 102100027937 Aurora kinase A and ninein-interacting protein Human genes 0.000 claims description 2
- 108090001008 Avidin Proteins 0.000 claims description 2
- 102100024946 Ciliogenesis-associated TTC17-interacting protein Human genes 0.000 claims description 2
- 102100039502 E3 ubiquitin-protein ligase RNF34 Human genes 0.000 claims description 2
- 108010024044 Glucagon-Like Peptide-2 Receptor Proteins 0.000 claims description 2
- 102000015626 Glucagon-Like Peptide-2 Receptor Human genes 0.000 claims description 2
- 101000697944 Homo sapiens Aurora kinase A and ninein-interacting protein Proteins 0.000 claims description 2
- 101000761406 Homo sapiens Ciliogenesis-associated TTC17-interacting protein Proteins 0.000 claims description 2
- 101001017415 Homo sapiens Dual specificity protein phosphatase 26 Proteins 0.000 claims description 2
- 101001103581 Homo sapiens E3 ubiquitin-protein ligase RNF34 Proteins 0.000 claims description 2
- 101000600748 Homo sapiens Pancreatic progenitor cell differentiation and proliferation factor-like protein Proteins 0.000 claims description 2
- 101000795815 Homo sapiens Tetratricopeptide repeat protein 24 Proteins 0.000 claims description 2
- 101000962469 Homo sapiens Transcription factor MafF Proteins 0.000 claims description 2
- 101000830781 Homo sapiens Tropomyosin alpha-4 chain Proteins 0.000 claims description 2
- 101000607645 Homo sapiens Ubiquilin-4 Proteins 0.000 claims description 2
- 102100037264 Pancreatic progenitor cell differentiation and proliferation factor-like protein Human genes 0.000 claims description 2
- 102100031768 Tetratricopeptide repeat protein 24 Human genes 0.000 claims description 2
- 102100039187 Transcription factor MafF Human genes 0.000 claims description 2
- 102100024944 Tropomyosin alpha-4 chain Human genes 0.000 claims description 2
- 102100039932 Ubiquilin-4 Human genes 0.000 claims description 2
- 230000000694 effects Effects 0.000 abstract description 3
- 239000000126 substance Substances 0.000 abstract description 3
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 abstract 2
- 206010073071 hepatocellular carcinoma Diseases 0.000 description 94
- 231100000844 hepatocellular carcinoma Toxicity 0.000 description 94
- 239000000523 sample Substances 0.000 description 83
- 150000007523 nucleic acids Chemical class 0.000 description 69
- 102000039446 nucleic acids Human genes 0.000 description 62
- 108020004707 nucleic acids Proteins 0.000 description 62
- 239000008280 blood Substances 0.000 description 37
- 210000004369 blood Anatomy 0.000 description 35
- 239000012634 fragment Substances 0.000 description 34
- 239000002773 nucleotide Substances 0.000 description 31
- 125000003729 nucleotide group Chemical group 0.000 description 31
- 206010061902 Pancreatic neoplasm Diseases 0.000 description 29
- 208000015486 malignant pancreatic neoplasm Diseases 0.000 description 28
- 208000008443 pancreatic carcinoma Diseases 0.000 description 28
- 206010050017 Lung cancer metastatic Diseases 0.000 description 27
- 241000700721 Hepatitis B virus Species 0.000 description 26
- 206010058467 Lung neoplasm malignant Diseases 0.000 description 25
- 201000005202 lung cancer Diseases 0.000 description 25
- 208000020816 lung neoplasm Diseases 0.000 description 25
- 108091034117 Oligonucleotide Proteins 0.000 description 20
- 210000004072 lung Anatomy 0.000 description 20
- 201000002528 pancreatic cancer Diseases 0.000 description 20
- 101100495925 Schizosaccharomyces pombe (strain 972 / ATCC 24843) chr3 gene Proteins 0.000 description 19
- 210000001519 tissue Anatomy 0.000 description 18
- 239000000047 product Substances 0.000 description 17
- 239000011324 bead Substances 0.000 description 16
- 210000004027 cell Anatomy 0.000 description 15
- 230000000295 complement effect Effects 0.000 description 15
- 238000001356 surgical procedure Methods 0.000 description 15
- 101000576894 Homo sapiens Macrophage mannose receptor 1 Proteins 0.000 description 14
- 206010017758 gastric cancer Diseases 0.000 description 14
- 206010006187 Breast cancer Diseases 0.000 description 13
- 208000026310 Breast neoplasm Diseases 0.000 description 13
- 206010009944 Colon cancer Diseases 0.000 description 13
- 208000005718 Stomach Neoplasms Diseases 0.000 description 13
- 238000009826 distribution Methods 0.000 description 13
- 230000014509 gene expression Effects 0.000 description 13
- 208000005017 glioblastoma Diseases 0.000 description 13
- 230000009826 neoplastic cell growth Effects 0.000 description 13
- 230000000683 nonmetastatic effect Effects 0.000 description 13
- 102000040430 polynucleotide Human genes 0.000 description 13
- 108091033319 polynucleotide Proteins 0.000 description 13
- 239000002157 polynucleotide Substances 0.000 description 13
- 201000011549 stomach cancer Diseases 0.000 description 13
- 108091092240 circulating cell-free DNA Proteins 0.000 description 12
- 238000005516 engineering process Methods 0.000 description 12
- 238000007637 random forest analysis Methods 0.000 description 12
- MJEQLGCFPLHMNV-UHFFFAOYSA-N 4-amino-1-(hydroxymethyl)pyrimidin-2-one Chemical compound NC=1C=CN(CO)C(=O)N=1 MJEQLGCFPLHMNV-UHFFFAOYSA-N 0.000 description 11
- 208000001333 Colorectal Neoplasms Diseases 0.000 description 10
- 201000009030 Carcinoma Diseases 0.000 description 9
- 201000001441 melanoma Diseases 0.000 description 9
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 8
- HWPZZUQOWRWFDB-UHFFFAOYSA-N 1-methylcytosine Chemical compound CN1C=CC(N)=NC1=O HWPZZUQOWRWFDB-UHFFFAOYSA-N 0.000 description 8
- 239000000872 buffer Substances 0.000 description 8
- 102000053602 DNA Human genes 0.000 description 7
- 206010025323 Lymphomas Diseases 0.000 description 7
- 238000009396 hybridization Methods 0.000 description 7
- 238000007481 next generation sequencing Methods 0.000 description 7
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 6
- 108091092259 cell-free RNA Proteins 0.000 description 6
- 238000001514 detection method Methods 0.000 description 6
- 210000004185 liver Anatomy 0.000 description 6
- 208000003174 Brain Neoplasms Diseases 0.000 description 5
- 206010035226 Plasma cell myeloma Diseases 0.000 description 5
- 208000006265 Renal cell carcinoma Diseases 0.000 description 5
- 206010039491 Sarcoma Diseases 0.000 description 5
- 238000001790 Welch's t-test Methods 0.000 description 5
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 5
- 102000012005 alpha-2-HS-Glycoprotein Human genes 0.000 description 5
- 108010075843 alpha-2-HS-Glycoprotein Proteins 0.000 description 5
- 210000003169 central nervous system Anatomy 0.000 description 5
- 238000002790 cross-validation Methods 0.000 description 5
- 206010012818 diffuse large B-cell lymphoma Diseases 0.000 description 5
- 230000001605 fetal effect Effects 0.000 description 5
- 125000004029 hydroxymethyl group Chemical group [H]OC([H])([H])* 0.000 description 5
- 239000000463 material Substances 0.000 description 5
- 239000002609 medium Substances 0.000 description 5
- 210000000056 organ Anatomy 0.000 description 5
- 230000002980 postoperative effect Effects 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical compound N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 4
- 208000003200 Adenoma Diseases 0.000 description 4
- 208000011691 Burkitt lymphomas Diseases 0.000 description 4
- HMFHBZSHGGEWLO-SOOFDHNKSA-N D-ribofuranose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H]1O HMFHBZSHGGEWLO-SOOFDHNKSA-N 0.000 description 4
- 101001028025 Homo sapiens Mdm2-binding protein Proteins 0.000 description 4
- 101000825475 Homo sapiens Protein shisa-2 homolog Proteins 0.000 description 4
- 208000008839 Kidney Neoplasms Diseases 0.000 description 4
- 208000031422 Lymphocytic Chronic B-Cell Leukemia Diseases 0.000 description 4
- 102100037572 Mdm2-binding protein Human genes 0.000 description 4
- 208000000172 Medulloblastoma Diseases 0.000 description 4
- 206010033128 Ovarian cancer Diseases 0.000 description 4
- 206010061535 Ovarian neoplasm Diseases 0.000 description 4
- 102100022938 Protein shisa-2 homolog Human genes 0.000 description 4
- 206010038389 Renal cancer Diseases 0.000 description 4
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 4
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 4
- 239000003153 chemical reaction reagent Substances 0.000 description 4
- 210000000349 chromosome Anatomy 0.000 description 4
- 238000012650 click reaction Methods 0.000 description 4
- 230000001419 dependent effect Effects 0.000 description 4
- 201000010982 kidney cancer Diseases 0.000 description 4
- 208000032839 leukemia Diseases 0.000 description 4
- 201000007270 liver cancer Diseases 0.000 description 4
- 208000014018 liver neoplasm Diseases 0.000 description 4
- 229920001223 polyethylene glycol Polymers 0.000 description 4
- 208000029340 primitive neuroectodermal tumor Diseases 0.000 description 4
- 230000002441 reversible effect Effects 0.000 description 4
- 239000000243 solution Substances 0.000 description 4
- 206010041823 squamous cell carcinoma Diseases 0.000 description 4
- 235000000346 sugar Nutrition 0.000 description 4
- 201000008271 Atypical teratoid rhabdoid tumor Diseases 0.000 description 3
- 208000003950 B-cell lymphoma Diseases 0.000 description 3
- 206010005003 Bladder cancer Diseases 0.000 description 3
- ZUHQCDZJPTXVCU-UHFFFAOYSA-N C1#CCCC2=CC=CC=C2C2=CC=CC=C21 Chemical compound C1#CCCC2=CC=CC=C2C2=CC=CC=C21 ZUHQCDZJPTXVCU-UHFFFAOYSA-N 0.000 description 3
- 208000024172 Cardiovascular disease Diseases 0.000 description 3
- 102100023759 Cytosolic iron-sulfur assembly component 2A Human genes 0.000 description 3
- IAZDPXIOMUYVGZ-UHFFFAOYSA-N Dimethylsulphoxide Chemical compound CS(C)=O IAZDPXIOMUYVGZ-UHFFFAOYSA-N 0.000 description 3
- 206010061819 Disease recurrence Diseases 0.000 description 3
- 206010014733 Endometrial cancer Diseases 0.000 description 3
- 206010014759 Endometrial neoplasm Diseases 0.000 description 3
- 208000006168 Ewing Sarcoma Diseases 0.000 description 3
- 102100036935 Ewing's tumor-associated antigen 1 Human genes 0.000 description 3
- 206010017533 Fungal infection Diseases 0.000 description 3
- 206010051066 Gastrointestinal stromal tumour Diseases 0.000 description 3
- 208000021309 Germ cell tumor Diseases 0.000 description 3
- 208000017604 Hodgkin disease Diseases 0.000 description 3
- 208000021519 Hodgkin lymphoma Diseases 0.000 description 3
- 208000010747 Hodgkins lymphoma Diseases 0.000 description 3
- 101000906806 Homo sapiens Cytosolic iron-sulfur assembly component 2A Proteins 0.000 description 3
- 101000851494 Homo sapiens Ewing's tumor-associated antigen 1 Proteins 0.000 description 3
- 101000633784 Homo sapiens SLAM family member 7 Proteins 0.000 description 3
- 101000976455 Homo sapiens Zinc finger protein 800 Proteins 0.000 description 3
- 241000124008 Mammalia Species 0.000 description 3
- 206010027476 Metastases Diseases 0.000 description 3
- 108030004080 Methylcytosine dioxygenases Proteins 0.000 description 3
- 208000034578 Multiple myelomas Diseases 0.000 description 3
- PJKKQFAEFWCNAQ-UHFFFAOYSA-N N(4)-methylcytosine Chemical class CNC=1C=CNC(=O)N=1 PJKKQFAEFWCNAQ-UHFFFAOYSA-N 0.000 description 3
- 108091028043 Nucleic acid sequence Proteins 0.000 description 3
- 206010060862 Prostate cancer Diseases 0.000 description 3
- 208000000236 Prostatic Neoplasms Diseases 0.000 description 3
- 201000000582 Retinoblastoma Diseases 0.000 description 3
- 102100029198 SLAM family member 7 Human genes 0.000 description 3
- 108091006484 SLC25A47 Proteins 0.000 description 3
- 206010041067 Small cell lung cancer Diseases 0.000 description 3
- 102100032112 Solute carrier family 25 member 47 Human genes 0.000 description 3
- 210000001744 T-lymphocyte Anatomy 0.000 description 3
- 108700009124 Transcription Initiation Site Proteins 0.000 description 3
- 208000036142 Viral infection Diseases 0.000 description 3
- 102100023643 Zinc finger protein 800 Human genes 0.000 description 3
- 208000009956 adenocarcinoma Diseases 0.000 description 3
- 150000001345 alkine derivatives Chemical class 0.000 description 3
- 125000000304 alkynyl group Chemical group 0.000 description 3
- 238000013459 approach Methods 0.000 description 3
- 125000000852 azido group Chemical group *N=[N+]=[N-] 0.000 description 3
- 239000000090 biomarker Substances 0.000 description 3
- 210000000601 blood cell Anatomy 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 3
- 238000012512 characterization method Methods 0.000 description 3
- 208000029742 colonic neoplasm Diseases 0.000 description 3
- 150000001875 compounds Chemical class 0.000 description 3
- 238000012937 correction Methods 0.000 description 3
- 230000002596 correlated effect Effects 0.000 description 3
- 230000000875 corresponding effect Effects 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 206010012601 diabetes mellitus Diseases 0.000 description 3
- 208000035475 disorder Diseases 0.000 description 3
- 238000002866 fluorescence resonance energy transfer Methods 0.000 description 3
- 238000013467 fragmentation Methods 0.000 description 3
- 238000006062 fragmentation reaction Methods 0.000 description 3
- 201000011243 gastrointestinal stromal tumor Diseases 0.000 description 3
- 125000000623 heterocyclic group Chemical group 0.000 description 3
- 238000012165 high-throughput sequencing Methods 0.000 description 3
- 208000015181 infectious disease Diseases 0.000 description 3
- 150000002500 ions Chemical class 0.000 description 3
- 125000005647 linker group Chemical group 0.000 description 3
- 210000005228 liver tissue Anatomy 0.000 description 3
- 210000004698 lymphocyte Anatomy 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 208000030159 metabolic disease Diseases 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012544 monitoring process Methods 0.000 description 3
- 201000006417 multiple sclerosis Diseases 0.000 description 3
- 208000002154 non-small cell lung carcinoma Diseases 0.000 description 3
- 201000008968 osteosarcoma Diseases 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000000926 separation method Methods 0.000 description 3
- 208000000649 small cell carcinoma Diseases 0.000 description 3
- 208000000587 small cell lung carcinoma Diseases 0.000 description 3
- 239000011780 sodium chloride Substances 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 238000002560 therapeutic procedure Methods 0.000 description 3
- 208000008732 thymoma Diseases 0.000 description 3
- 208000029729 tumor suppressor gene on chromosome 11 Diseases 0.000 description 3
- RYVNIFSIEDRLSJ-UHFFFAOYSA-N 5-(hydroxymethyl)cytosine Chemical compound NC=1NC(=O)N=CC=1CO RYVNIFSIEDRLSJ-UHFFFAOYSA-N 0.000 description 2
- LRSASMSXMSNRBT-UHFFFAOYSA-N 5-methylcytosine Chemical compound CC1=CNC(=O)N=C1N LRSASMSXMSNRBT-UHFFFAOYSA-N 0.000 description 2
- 208000024827 Alzheimer disease Diseases 0.000 description 2
- 206010003571 Astrocytoma Diseases 0.000 description 2
- 241000972773 Aulopiformes Species 0.000 description 2
- 208000010839 B-cell chronic lymphocytic leukemia Diseases 0.000 description 2
- 206010004146 Basal cell carcinoma Diseases 0.000 description 2
- 206010005949 Bone cancer Diseases 0.000 description 2
- 208000018084 Bone neoplasm Diseases 0.000 description 2
- 206010006143 Brain stem glioma Diseases 0.000 description 2
- 208000006547 Central Nervous System Lupus Vasculitis Diseases 0.000 description 2
- 206010008263 Cervical dysplasia Diseases 0.000 description 2
- 206010008342 Cervix carcinoma Diseases 0.000 description 2
- 108091006146 Channels Proteins 0.000 description 2
- 208000005243 Chondrosarcoma Diseases 0.000 description 2
- 208000006332 Choriocarcinoma Diseases 0.000 description 2
- 206010009900 Colitis ulcerative Diseases 0.000 description 2
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 2
- 208000009798 Craniopharyngioma Diseases 0.000 description 2
- 208000011231 Crohn disease Diseases 0.000 description 2
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 2
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 2
- 206010061818 Disease progression Diseases 0.000 description 2
- 206010058314 Dysplasia Diseases 0.000 description 2
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 2
- 201000008228 Ependymoblastoma Diseases 0.000 description 2
- 206010014967 Ependymoma Diseases 0.000 description 2
- 206010014968 Ependymoma malignant Diseases 0.000 description 2
- 201000008808 Fibrosarcoma Diseases 0.000 description 2
- 206010016654 Fibrosis Diseases 0.000 description 2
- ZHNUHDYFZUAESO-UHFFFAOYSA-N Formamide Chemical compound NC=O ZHNUHDYFZUAESO-UHFFFAOYSA-N 0.000 description 2
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 2
- 206010018338 Glioma Diseases 0.000 description 2
- 101000818546 Homo sapiens N-formyl peptide receptor 2 Proteins 0.000 description 2
- 101001071363 Homo sapiens Probable G-protein coupled receptor 21 Proteins 0.000 description 2
- 101001098769 Homo sapiens Protein disulfide-isomerase A6 Proteins 0.000 description 2
- 101000855237 Homo sapiens Putative uncharacterized protein encoded by LINC00304 Proteins 0.000 description 2
- 101000836954 Homo sapiens Sialic acid-binding Ig-like lectin 10 Proteins 0.000 description 2
- 101000716933 Homo sapiens Sterile alpha motif domain-containing protein 11 Proteins 0.000 description 2
- 101000782464 Homo sapiens Zinc finger protein 444 Proteins 0.000 description 2
- 101000785577 Homo sapiens Zinc finger protein 850 Proteins 0.000 description 2
- 101000818522 Homo sapiens fMet-Leu-Phe receptor Proteins 0.000 description 2
- 101000802094 Homo sapiens mRNA decay activator protein ZFP36L1 Proteins 0.000 description 2
- 238000006736 Huisgen cycloaddition reaction Methods 0.000 description 2
- 208000023105 Huntington disease Diseases 0.000 description 2
- 208000022559 Inflammatory bowel disease Diseases 0.000 description 2
- 208000009164 Islet Cell Adenoma Diseases 0.000 description 2
- 208000007766 Kaposi sarcoma Diseases 0.000 description 2
- 108010080643 L-xylulose reductase Proteins 0.000 description 2
- 102100029137 L-xylulose reductase Human genes 0.000 description 2
- 208000006404 Large Granular Lymphocytic Leukemia Diseases 0.000 description 2
- 208000002030 Merkel cell carcinoma Diseases 0.000 description 2
- 102100032118 Mitochondrial outer membrane protein SLC25A46 Human genes 0.000 description 2
- 208000003445 Mouth Neoplasms Diseases 0.000 description 2
- 201000003793 Myelodysplastic syndrome Diseases 0.000 description 2
- 102100021126 N-formyl peptide receptor 2 Human genes 0.000 description 2
- 208000034176 Neoplasms, Germ Cell and Embryonal Diseases 0.000 description 2
- 206010029266 Neuroendocrine carcinoma of the skin Diseases 0.000 description 2
- 206010029461 Nodal marginal zone B-cell lymphomas Diseases 0.000 description 2
- 208000015914 Non-Hodgkin lymphomas Diseases 0.000 description 2
- 206010030155 Oesophageal carcinoma Diseases 0.000 description 2
- 208000018737 Parkinson disease Diseases 0.000 description 2
- 239000002202 Polyethylene glycol Substances 0.000 description 2
- 241000288906 Primates Species 0.000 description 2
- 208000024777 Prion disease Diseases 0.000 description 2
- 102100036934 Probable G-protein coupled receptor 21 Human genes 0.000 description 2
- 102100037061 Protein disulfide-isomerase A6 Human genes 0.000 description 2
- 201000004681 Psoriasis Diseases 0.000 description 2
- 102100026567 Putative uncharacterized protein encoded by LINC00304 Human genes 0.000 description 2
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 2
- 238000003559 RNA-seq method Methods 0.000 description 2
- 108091028664 Ribonucleotide Proteins 0.000 description 2
- 108091006779 SLC19A3 Proteins 0.000 description 2
- 108091006481 SLC25A46 Proteins 0.000 description 2
- 206010061934 Salivary gland cancer Diseases 0.000 description 2
- 201000010208 Seminoma Diseases 0.000 description 2
- 208000000097 Sertoli-Leydig cell tumor Diseases 0.000 description 2
- 102100027164 Sialic acid-binding Ig-like lectin 10 Human genes 0.000 description 2
- 102100020927 Sterile alpha motif domain-containing protein 11 Human genes 0.000 description 2
- 238000000692 Student's t-test Methods 0.000 description 2
- 206010042971 T-cell lymphoma Diseases 0.000 description 2
- 108010006785 Taq Polymerase Proteins 0.000 description 2
- 206010043276 Teratoma Diseases 0.000 description 2
- 102100030103 Thiamine transporter 2 Human genes 0.000 description 2
- 208000024770 Thyroid neoplasm Diseases 0.000 description 2
- 201000006704 Ulcerative Colitis Diseases 0.000 description 2
- 208000006105 Uterine Cervical Neoplasms Diseases 0.000 description 2
- 208000033559 Waldenström macroglobulinemia Diseases 0.000 description 2
- 102100035868 Zinc finger protein 444 Human genes 0.000 description 2
- 102100026589 Zinc finger protein 850 Human genes 0.000 description 2
- 238000003556 assay Methods 0.000 description 2
- 150000001540 azides Chemical class 0.000 description 2
- 230000031018 biological processes and functions Effects 0.000 description 2
- 201000001531 bladder carcinoma Diseases 0.000 description 2
- 201000000053 blastoma Diseases 0.000 description 2
- 210000000988 bone and bone Anatomy 0.000 description 2
- 208000002458 carcinoid tumor Diseases 0.000 description 2
- 201000010881 cervical cancer Diseases 0.000 description 2
- 230000002759 chromosomal effect Effects 0.000 description 2
- 208000032852 chronic lymphocytic leukemia Diseases 0.000 description 2
- 238000003776 cleavage reaction Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 229910052802 copper Inorganic materials 0.000 description 2
- 239000010949 copper Substances 0.000 description 2
- 208000017763 cutaneous neuroendocrine carcinoma Diseases 0.000 description 2
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 2
- 230000006378 damage Effects 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 238000004925 denaturation Methods 0.000 description 2
- 230000036425 denaturation Effects 0.000 description 2
- 239000005547 deoxyribonucleotide Substances 0.000 description 2
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 2
- 230000004069 differentiation Effects 0.000 description 2
- 238000007847 digital PCR Methods 0.000 description 2
- 230000005750 disease progression Effects 0.000 description 2
- 201000008184 embryoma Diseases 0.000 description 2
- 230000002255 enzymatic effect Effects 0.000 description 2
- 102100021145 fMet-Leu-Phe receptor Human genes 0.000 description 2
- 230000002538 fungal effect Effects 0.000 description 2
- 208000024386 fungal infectious disease Diseases 0.000 description 2
- 210000004907 gland Anatomy 0.000 description 2
- 150000002303 glucose derivatives Chemical class 0.000 description 2
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 2
- 201000010536 head and neck cancer Diseases 0.000 description 2
- 208000014829 head and neck neoplasm Diseases 0.000 description 2
- 230000002489 hematologic effect Effects 0.000 description 2
- 238000003384 imaging method Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 201000002529 islet cell tumor Diseases 0.000 description 2
- 238000002955 isolation Methods 0.000 description 2
- 208000012987 lip and oral cavity carcinoma Diseases 0.000 description 2
- 206010024627 liposarcoma Diseases 0.000 description 2
- 102100034702 mRNA decay activator protein ZFP36L1 Human genes 0.000 description 2
- 239000003550 marker Substances 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 201000008203 medulloepithelioma Diseases 0.000 description 2
- 230000009401 metastasis Effects 0.000 description 2
- 230000001394 metastastic effect Effects 0.000 description 2
- 206010061289 metastatic neoplasm Diseases 0.000 description 2
- 239000000178 monomer Substances 0.000 description 2
- 201000000050 myeloid neoplasm Diseases 0.000 description 2
- 208000004296 neuralgia Diseases 0.000 description 2
- 208000021722 neuropathic pain Diseases 0.000 description 2
- 208000022102 pancreatic neuroendocrine neoplasm Diseases 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 229920003023 plastic Polymers 0.000 description 2
- 239000004033 plastic Substances 0.000 description 2
- 230000000750 progressive effect Effects 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 150000003212 purines Chemical class 0.000 description 2
- 150000003230 pyrimidines Chemical class 0.000 description 2
- 238000011002 quantification Methods 0.000 description 2
- 238000004445 quantitative analysis Methods 0.000 description 2
- 239000011541 reaction mixture Substances 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000002829 reductive effect Effects 0.000 description 2
- 201000009410 rhabdomyosarcoma Diseases 0.000 description 2
- 239000002336 ribonucleotide Substances 0.000 description 2
- 125000002652 ribonucleotide group Chemical group 0.000 description 2
- 235000019515 salmon Nutrition 0.000 description 2
- 230000007017 scission Effects 0.000 description 2
- 210000002966 serum Anatomy 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 239000000758 substrate Substances 0.000 description 2
- 208000011580 syndromic disease Diseases 0.000 description 2
- 201000000596 systemic lupus erythematosus Diseases 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 201000002510 thyroid cancer Diseases 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 206010044412 transitional cell carcinoma Diseases 0.000 description 2
- 238000011144 upstream manufacturing Methods 0.000 description 2
- 208000010570 urinary bladder carcinoma Diseases 0.000 description 2
- 206010046766 uterine cancer Diseases 0.000 description 2
- 230000009385 viral infection Effects 0.000 description 2
- 230000003612 virological effect Effects 0.000 description 2
- XJOTXKZIRSHZQV-RXHOOSIZSA-N (3S)-3-amino-4-[[(2S,3R)-1-[[(2S)-1-[[(2S)-1-[(2S)-2-[[(2S,3S)-1-[[(1R,6R,12R,17R,20S,23S,26R,31R,34R,39R,42S,45S,48S,51S,59S)-51-(4-aminobutyl)-31-[[(2S)-6-amino-1-[[(1S,2R)-1-carboxy-2-hydroxypropyl]amino]-1-oxohexan-2-yl]carbamoyl]-20-benzyl-23-[(2S)-butan-2-yl]-45-(3-carbamimidamidopropyl)-48-(hydroxymethyl)-42-(1H-imidazol-4-ylmethyl)-59-(2-methylsulfanylethyl)-7,10,19,22,25,33,40,43,46,49,52,54,57,60,63,64-hexadecaoxo-3,4,14,15,28,29,36,37-octathia-8,11,18,21,24,32,41,44,47,50,53,55,58,61,62,65-hexadecazatetracyclo[32.19.8.26,17.212,39]pentahexacontan-26-yl]amino]-3-methyl-1-oxopentan-2-yl]carbamoyl]pyrrolidin-1-yl]-1-oxo-3-phenylpropan-2-yl]amino]-3-(1H-imidazol-4-yl)-1-oxopropan-2-yl]amino]-3-hydroxy-1-oxobutan-2-yl]amino]-4-oxobutanoic acid Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H]1CCCN1C(=O)[C@H](Cc1ccccc1)NC(=O)[C@H](Cc1cnc[nH]1)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(O)=O)[C@@H](C)O)C(=O)N[C@H]1CSSC[C@H](NC(=O)[C@@H]2CSSC[C@@H]3NC(=O)[C@@H]4CSSC[C@H](NC(=O)[C@H](Cc5ccccc5)NC(=O)[C@@H](NC1=O)[C@@H](C)CC)C(=O)N[C@@H](CSSC[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@H](CO)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](Cc1cnc[nH]1)NC3=O)C(=O)NCC(=O)N[C@@H](CCSC)C(=O)N2)C(=O)NCC(=O)N4)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XJOTXKZIRSHZQV-RXHOOSIZSA-N 0.000 description 1
- GUAHPAJOXVYFON-ZETCQYMHSA-N (8S)-8-amino-7-oxononanoic acid zwitterion Chemical compound C[C@H](N)C(=O)CCCCCC(O)=O GUAHPAJOXVYFON-ZETCQYMHSA-N 0.000 description 1
- PHRGILHPYBRFCZ-UHFFFAOYSA-N 1,3-difluorooct-1-yne Chemical compound CCCCCC(F)C#CF PHRGILHPYBRFCZ-UHFFFAOYSA-N 0.000 description 1
- FGRBYDKOBBBPOI-UHFFFAOYSA-N 10,10-dioxo-2-[4-(N-phenylanilino)phenyl]thioxanthen-9-one Chemical compound O=C1c2ccccc2S(=O)(=O)c2ccc(cc12)-c1ccc(cc1)N(c1ccccc1)c1ccccc1 FGRBYDKOBBBPOI-UHFFFAOYSA-N 0.000 description 1
- 101150029062 15 gene Proteins 0.000 description 1
- PIINGYXNCHTJTF-UHFFFAOYSA-N 2-(2-azaniumylethylamino)acetate Chemical group NCCNCC(O)=O PIINGYXNCHTJTF-UHFFFAOYSA-N 0.000 description 1
- JKMHFZQWWAIEOD-UHFFFAOYSA-N 2-[4-(2-hydroxyethyl)piperazin-1-yl]ethanesulfonic acid Chemical compound OCC[NH+]1CCN(CCS([O-])(=O)=O)CC1 JKMHFZQWWAIEOD-UHFFFAOYSA-N 0.000 description 1
- ASJSAQIRZKANQN-CRCLSJGQSA-N 2-deoxy-D-ribose Chemical compound OC[C@@H](O)[C@@H](O)CC=O ASJSAQIRZKANQN-CRCLSJGQSA-N 0.000 description 1
- WWVANQJRLPIHNS-BKPPORCPSA-N 2-iminobiotin Chemical compound N1C(=N)N[C@H]2[C@H](CCCCC(=O)O)SC[C@H]21 WWVANQJRLPIHNS-BKPPORCPSA-N 0.000 description 1
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 1
- JKNCSZDPWAVQAI-ZKWXMUAHSA-N 5-[(2s,3s,4r)-3,4-diaminothiolan-2-yl]pentanoic acid Chemical compound N[C@H]1CS[C@@H](CCCCC(O)=O)[C@H]1N JKNCSZDPWAVQAI-ZKWXMUAHSA-N 0.000 description 1
- HOSGXJWQVBHGLT-UHFFFAOYSA-N 6-hydroxy-3,4-dihydro-1h-quinolin-2-one Chemical group N1C(=O)CCC2=CC(O)=CC=C21 HOSGXJWQVBHGLT-UHFFFAOYSA-N 0.000 description 1
- 208000030507 AIDS Diseases 0.000 description 1
- 208000002008 AIDS-Related Lymphoma Diseases 0.000 description 1
- 208000024893 Acute lymphoblastic leukemia Diseases 0.000 description 1
- 208000014697 Acute lymphocytic leukaemia Diseases 0.000 description 1
- 208000031261 Acute myeloid leukaemia Diseases 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- 229930024421 Adenine Natural products 0.000 description 1
- 206010001233 Adenoma benign Diseases 0.000 description 1
- 208000037540 Alveolar soft tissue sarcoma Diseases 0.000 description 1
- 206010061424 Anal cancer Diseases 0.000 description 1
- 206010002412 Angiocentric lymphomas Diseases 0.000 description 1
- 201000003076 Angiosarcoma Diseases 0.000 description 1
- 206010002556 Ankylosing Spondylitis Diseases 0.000 description 1
- 208000007860 Anus Neoplasms Diseases 0.000 description 1
- 206010073360 Appendix cancer Diseases 0.000 description 1
- 208000017925 Askin tumor Diseases 0.000 description 1
- 201000001320 Atherosclerosis Diseases 0.000 description 1
- 208000037260 Atherosclerotic Plaque Diseases 0.000 description 1
- 208000004300 Atrophic Gastritis Diseases 0.000 description 1
- 206010003805 Autism Diseases 0.000 description 1
- 208000020706 Autistic disease Diseases 0.000 description 1
- 208000023275 Autoimmune disease Diseases 0.000 description 1
- 206010003827 Autoimmune hepatitis Diseases 0.000 description 1
- 241000271566 Aves Species 0.000 description 1
- 208000036170 B-Cell Marginal Zone Lymphoma Diseases 0.000 description 1
- 208000032791 BCR-ABL1 positive chronic myelogenous leukemia Diseases 0.000 description 1
- 208000035143 Bacterial infection Diseases 0.000 description 1
- 208000023514 Barrett esophagus Diseases 0.000 description 1
- 208000023665 Barrett oesophagus Diseases 0.000 description 1
- 208000023328 Basedow disease Diseases 0.000 description 1
- 206010004446 Benign prostatic hyperplasia Diseases 0.000 description 1
- 206010004593 Bile duct cancer Diseases 0.000 description 1
- 208000020925 Bipolar disease Diseases 0.000 description 1
- 208000023611 Burkitt leukaemia Diseases 0.000 description 1
- 208000016778 CD4+/CD56+ hematodermic neoplasm Diseases 0.000 description 1
- 201000002829 CREST Syndrome Diseases 0.000 description 1
- 241000282472 Canis lupus familiaris Species 0.000 description 1
- 206010007275 Carcinoid tumour Diseases 0.000 description 1
- 206010007279 Carcinoid tumour of the gastrointestinal tract Diseases 0.000 description 1
- 208000017897 Carcinoma of esophagus Diseases 0.000 description 1
- 206010007559 Cardiac failure congestive Diseases 0.000 description 1
- 238000001353 Chip-sequencing Methods 0.000 description 1
- 206010008609 Cholangitis sclerosing Diseases 0.000 description 1
- 201000009047 Chordoma Diseases 0.000 description 1
- 208000031404 Chromosome Aberrations Diseases 0.000 description 1
- 206010008874 Chronic Fatigue Syndrome Diseases 0.000 description 1
- 208000010833 Chronic myeloid leukaemia Diseases 0.000 description 1
- 108091026890 Coding region Proteins 0.000 description 1
- 208000035473 Communicable disease Diseases 0.000 description 1
- 208000020406 Creutzfeldt Jacob disease Diseases 0.000 description 1
- 208000003407 Creutzfeldt-Jakob Syndrome Diseases 0.000 description 1
- 208000010859 Creutzfeldt-Jakob disease Diseases 0.000 description 1
- 201000005171 Cystadenoma Diseases 0.000 description 1
- 102000012410 DNA Ligases Human genes 0.000 description 1
- 108010061982 DNA Ligases Proteins 0.000 description 1
- 230000008836 DNA modification Effects 0.000 description 1
- 206010012289 Dementia Diseases 0.000 description 1
- 102000004099 Deoxyribonuclease (Pyrimidine Dimer) Human genes 0.000 description 1
- 108010082610 Deoxyribonuclease (Pyrimidine Dimer) Proteins 0.000 description 1
- 102000016911 Deoxyribonucleases Human genes 0.000 description 1
- 108010053770 Deoxyribonucleases Proteins 0.000 description 1
- 201000010374 Down Syndrome Diseases 0.000 description 1
- 208000007033 Dysgerminoma Diseases 0.000 description 1
- 208000000471 Dysplastic Nevus Syndrome Diseases 0.000 description 1
- 206010062805 Dysplastic naevus Diseases 0.000 description 1
- 102000004190 Enzymes Human genes 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- 201000005231 Epithelioid sarcoma Diseases 0.000 description 1
- 241000283086 Equidae Species 0.000 description 1
- 208000003021 Erythroplasia Diseases 0.000 description 1
- 208000000461 Esophageal Neoplasms Diseases 0.000 description 1
- 108700024394 Exon Proteins 0.000 description 1
- 206010015839 Extraskeletal chondrosarcomas Diseases 0.000 description 1
- 206010015848 Extraskeletal osteosarcomas Diseases 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 208000001640 Fibromyalgia Diseases 0.000 description 1
- 201000011240 Frontotemporal dementia Diseases 0.000 description 1
- 208000022072 Gallbladder Neoplasms Diseases 0.000 description 1
- 208000036495 Gastritis atrophic Diseases 0.000 description 1
- 201000003741 Gastrointestinal carcinoma Diseases 0.000 description 1
- 208000000527 Germinoma Diseases 0.000 description 1
- 208000003736 Gerstmann-Straussler-Scheinker Disease Diseases 0.000 description 1
- 206010072075 Gerstmann-Straussler-Scheinker syndrome Diseases 0.000 description 1
- 208000032612 Glial tumor Diseases 0.000 description 1
- 201000005618 Glomus Tumor Diseases 0.000 description 1
- 108010055629 Glucosyltransferases Proteins 0.000 description 1
- 102000000340 Glucosyltransferases Human genes 0.000 description 1
- 208000015023 Graves' disease Diseases 0.000 description 1
- 239000007995 HEPES buffer Substances 0.000 description 1
- 208000030836 Hashimoto thyroiditis Diseases 0.000 description 1
- 206010019280 Heart failures Diseases 0.000 description 1
- 208000006050 Hemangiopericytoma Diseases 0.000 description 1
- 208000001258 Hemangiosarcoma Diseases 0.000 description 1
- 206010019799 Hepatitis viral Diseases 0.000 description 1
- 208000017605 Hodgkin disease nodular sclerosis Diseases 0.000 description 1
- 102100027817 Homeobox protein GBX-1 Human genes 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 101000859749 Homo sapiens Homeobox protein GBX-1 Proteins 0.000 description 1
- 101000851376 Homo sapiens Tumor necrosis factor receptor superfamily member 8 Proteins 0.000 description 1
- 101000775702 Homo sapiens V-type proton ATPase subunit C 2 Proteins 0.000 description 1
- 101000785715 Homo sapiens Zinc finger protein 284 Proteins 0.000 description 1
- 101000976599 Homo sapiens Zinc finger protein 423 Proteins 0.000 description 1
- 101000760183 Homo sapiens Zinc finger protein 44 Proteins 0.000 description 1
- 101000964741 Homo sapiens Zinc finger protein 711 Proteins 0.000 description 1
- 101000919269 Homo sapiens cAMP-responsive element modulator Proteins 0.000 description 1
- 206010020772 Hypertension Diseases 0.000 description 1
- 208000029462 Immunodeficiency disease Diseases 0.000 description 1
- 206010061218 Inflammation Diseases 0.000 description 1
- 206010061252 Intraocular melanoma Diseases 0.000 description 1
- 108091092195 Intron Proteins 0.000 description 1
- 206010022971 Iron Deficiencies Diseases 0.000 description 1
- 201000005099 Langerhans cell histiocytosis Diseases 0.000 description 1
- 206010023791 Large granular lymphocytosis Diseases 0.000 description 1
- 208000032004 Large-Cell Anaplastic Lymphoma Diseases 0.000 description 1
- 206010023825 Laryngeal cancer Diseases 0.000 description 1
- 208000018142 Leiomyosarcoma Diseases 0.000 description 1
- 108090000364 Ligases Proteins 0.000 description 1
- 102000003960 Ligases Human genes 0.000 description 1
- 206010025312 Lymphoma AIDS related Diseases 0.000 description 1
- 208000030289 Lymphoproliferative disease Diseases 0.000 description 1
- 208000006644 Malignant Fibrous Histiocytoma Diseases 0.000 description 1
- 208000032271 Malignant tumor of penis Diseases 0.000 description 1
- 208000025205 Mantle-Cell Lymphoma Diseases 0.000 description 1
- 208000037196 Medullary thyroid carcinoma Diseases 0.000 description 1
- 206010027145 Melanocytic naevus Diseases 0.000 description 1
- 201000009906 Meningitis Diseases 0.000 description 1
- 206010027260 Meningitis viral Diseases 0.000 description 1
- 206010027406 Mesothelioma Diseases 0.000 description 1
- 206010063569 Metastatic squamous cell carcinoma Diseases 0.000 description 1
- 208000037942 Methicillin-resistant Staphylococcus aureus infection Diseases 0.000 description 1
- 208000033761 Myelogenous Chronic BCR-ABL Positive Leukemia Diseases 0.000 description 1
- 208000033776 Myeloid Acute Leukemia Diseases 0.000 description 1
- 201000007224 Myeloproliferative neoplasm Diseases 0.000 description 1
- 208000005927 Myosarcoma Diseases 0.000 description 1
- BAQMYDQNMFBZNA-UHFFFAOYSA-N N-biotinyl-L-lysine Natural products N1C(=O)NC2C(CCCCC(=O)NCCCCC(N)C(O)=O)SCC21 BAQMYDQNMFBZNA-UHFFFAOYSA-N 0.000 description 1
- 206010028767 Nasal sinus cancer Diseases 0.000 description 1
- 208000001894 Nasopharyngeal Neoplasms Diseases 0.000 description 1
- 206010061306 Nasopharyngeal cancer Diseases 0.000 description 1
- 102000048850 Neoplasm Genes Human genes 0.000 description 1
- 108700019961 Neoplasm Genes Proteins 0.000 description 1
- 208000012902 Nervous system disease Diseases 0.000 description 1
- 206010029260 Neuroblastoma Diseases 0.000 description 1
- 208000025966 Neurological disease Diseases 0.000 description 1
- 206010029488 Nodular melanoma Diseases 0.000 description 1
- 208000000160 Olfactory Esthesioneuroblastoma Diseases 0.000 description 1
- 101100176188 Onchocerca volvulus gmr-1 gene Proteins 0.000 description 1
- 206010048757 Oncocytoma Diseases 0.000 description 1
- 206010031096 Oropharyngeal cancer Diseases 0.000 description 1
- 206010057444 Oropharyngeal neoplasm Diseases 0.000 description 1
- 208000007571 Ovarian Epithelial Carcinoma Diseases 0.000 description 1
- 208000002063 Oxyphilic Adenoma Diseases 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 206010033701 Papillary thyroid cancer Diseases 0.000 description 1
- 208000003937 Paranasal Sinus Neoplasms Diseases 0.000 description 1
- 208000000821 Parathyroid Neoplasms Diseases 0.000 description 1
- 208000031481 Pathologic Constriction Diseases 0.000 description 1
- 241001494479 Pecora Species 0.000 description 1
- 208000029082 Pelvic Inflammatory Disease Diseases 0.000 description 1
- 206010061336 Pelvic neoplasm Diseases 0.000 description 1
- 208000002471 Penile Neoplasms Diseases 0.000 description 1
- 206010034299 Penile cancer Diseases 0.000 description 1
- 206010073144 Peripheral primitive neuroectodermal tumour of soft tissue Diseases 0.000 description 1
- 208000009565 Pharyngeal Neoplasms Diseases 0.000 description 1
- 206010034811 Pharyngeal cancer Diseases 0.000 description 1
- 208000000609 Pick Disease of the Brain Diseases 0.000 description 1
- 208000009077 Pigmented Nevus Diseases 0.000 description 1
- 206010050487 Pinealoblastoma Diseases 0.000 description 1
- 208000007641 Pinealoma Diseases 0.000 description 1
- 208000007913 Pituitary Neoplasms Diseases 0.000 description 1
- 208000007452 Plasmacytoma Diseases 0.000 description 1
- 201000008199 Pleuropulmonary blastoma Diseases 0.000 description 1
- 208000037062 Polyps Diseases 0.000 description 1
- 229920001213 Polysorbate 20 Polymers 0.000 description 1
- 208000023146 Pre-existing disease Diseases 0.000 description 1
- 208000006994 Precancerous Conditions Diseases 0.000 description 1
- 208000006664 Precursor Cell Lymphoblastic Leukemia-Lymphoma Diseases 0.000 description 1
- 208000007541 Preleukemia Diseases 0.000 description 1
- 208000006399 Premature Obstetric Labor Diseases 0.000 description 1
- 206010065857 Primary Effusion Lymphoma Diseases 0.000 description 1
- 206010036711 Primary mediastinal large B-cell lymphomas Diseases 0.000 description 1
- 206010036832 Prolactinoma Diseases 0.000 description 1
- 208000035416 Prolymphocytic B-Cell Leukemia Diseases 0.000 description 1
- 208000033759 Prolymphocytic T-Cell Leukemia Diseases 0.000 description 1
- 208000004403 Prostatic Hyperplasia Diseases 0.000 description 1
- 238000011529 RT qPCR Methods 0.000 description 1
- 206010071141 Rasmussen encephalitis Diseases 0.000 description 1
- 208000004160 Rasmussen subacute encephalitis Diseases 0.000 description 1
- 208000015634 Rectal Neoplasms Diseases 0.000 description 1
- 102000006382 Ribonucleases Human genes 0.000 description 1
- 108010083644 Ribonucleases Proteins 0.000 description 1
- 208000004337 Salivary Gland Neoplasms Diseases 0.000 description 1
- 206010039710 Scleroderma Diseases 0.000 description 1
- 206010040047 Sepsis Diseases 0.000 description 1
- 208000021386 Sjogren Syndrome Diseases 0.000 description 1
- 208000000453 Skin Neoplasms Diseases 0.000 description 1
- 208000021712 Soft tissue sarcoma Diseases 0.000 description 1
- 206010041925 Staphylococcal infections Diseases 0.000 description 1
- 208000006011 Stroke Diseases 0.000 description 1
- 241000282887 Suidae Species 0.000 description 1
- 208000031673 T-Cell Cutaneous Lymphoma Diseases 0.000 description 1
- 201000008717 T-cell large granular lymphocyte leukemia Diseases 0.000 description 1
- 208000000389 T-cell leukemia Diseases 0.000 description 1
- 208000027585 T-cell non-Hodgkin lymphoma Diseases 0.000 description 1
- 208000024313 Testicular Neoplasms Diseases 0.000 description 1
- 206010057644 Testis cancer Diseases 0.000 description 1
- 206010043515 Throat cancer Diseases 0.000 description 1
- 208000007536 Thrombosis Diseases 0.000 description 1
- 201000009365 Thymic carcinoma Diseases 0.000 description 1
- 102000008579 Transposases Human genes 0.000 description 1
- 108010020764 Transposases Proteins 0.000 description 1
- 239000007983 Tris buffer Substances 0.000 description 1
- 102100036857 Tumor necrosis factor receptor superfamily member 8 Human genes 0.000 description 1
- 206010067584 Type 1 diabetes mellitus Diseases 0.000 description 1
- 208000015778 Undifferentiated pleomorphic sarcoma Diseases 0.000 description 1
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical group O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 1
- 102000006943 Uracil-DNA Glycosidase Human genes 0.000 description 1
- 108010072685 Uracil-DNA Glycosidase Proteins 0.000 description 1
- 208000023915 Ureteral Neoplasms Diseases 0.000 description 1
- 206010046392 Ureteric cancer Diseases 0.000 description 1
- 206010046431 Urethral cancer Diseases 0.000 description 1
- 206010046458 Urethral neoplasms Diseases 0.000 description 1
- 208000007097 Urinary Bladder Neoplasms Diseases 0.000 description 1
- 208000002495 Uterine Neoplasms Diseases 0.000 description 1
- 206010046798 Uterine leiomyoma Diseases 0.000 description 1
- 201000005969 Uveal melanoma Diseases 0.000 description 1
- 102100032185 V-type proton ATPase subunit C 2 Human genes 0.000 description 1
- 208000009311 VIPoma Diseases 0.000 description 1
- 206010053648 Vascular occlusion Diseases 0.000 description 1
- 206010047115 Vasculitis Diseases 0.000 description 1
- 108010067390 Viral Proteins Proteins 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 206010047741 Vulval cancer Diseases 0.000 description 1
- 208000004354 Vulvar Neoplasms Diseases 0.000 description 1
- 208000027207 Whipple disease Diseases 0.000 description 1
- 208000008383 Wilms tumor Diseases 0.000 description 1
- 206010048218 Xeroderma Diseases 0.000 description 1
- 102100026415 Zinc finger protein 284 Human genes 0.000 description 1
- 102100023563 Zinc finger protein 423 Human genes 0.000 description 1
- 102100024660 Zinc finger protein 44 Human genes 0.000 description 1
- 102100040724 Zinc finger protein 711 Human genes 0.000 description 1
- 210000000683 abdominal cavity Anatomy 0.000 description 1
- 210000003815 abdominal wall Anatomy 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 208000009621 actinic keratosis Diseases 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- 208000002517 adenoid cystic carcinoma Diseases 0.000 description 1
- 208000020990 adrenal cortex carcinoma Diseases 0.000 description 1
- 208000007128 adrenocortical carcinoma Diseases 0.000 description 1
- 201000009614 adult lymphoma Diseases 0.000 description 1
- 239000007801 affinity label Substances 0.000 description 1
- 208000015230 aggressive NK-cell leukemia Diseases 0.000 description 1
- 125000001931 aliphatic group Chemical group 0.000 description 1
- 238000005904 alkaline hydrolysis reaction Methods 0.000 description 1
- 150000001412 amines Chemical class 0.000 description 1
- 150000001413 amino acids Chemical group 0.000 description 1
- 206010002026 amyotrophic lateral sclerosis Diseases 0.000 description 1
- 208000036878 aneuploidy Diseases 0.000 description 1
- 231100001075 aneuploidy Toxicity 0.000 description 1
- 230000000692 anti-sense effect Effects 0.000 description 1
- 201000011165 anus cancer Diseases 0.000 description 1
- 208000021780 appendiceal neoplasm Diseases 0.000 description 1
- 239000012062 aqueous buffer Substances 0.000 description 1
- 239000012736 aqueous medium Substances 0.000 description 1
- 230000000712 assembly Effects 0.000 description 1
- 238000000429 assembly Methods 0.000 description 1
- 210000003719 b-lymphocyte Anatomy 0.000 description 1
- 230000001580 bacterial effect Effects 0.000 description 1
- 208000022362 bacterial infectious disease Diseases 0.000 description 1
- 210000000270 basal cell Anatomy 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- BAQMYDQNMFBZNA-MNXVOIDGSA-N biocytin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)NCCCC[C@H](N)C(O)=O)SC[C@@H]21 BAQMYDQNMFBZNA-MNXVOIDGSA-N 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- KCSKCIQYNAOBNQ-YBSFLMRUSA-N biotin sulfoxide Chemical compound N1C(=O)N[C@H]2CS(=O)[C@@H](CCCCC(=O)O)[C@H]21 KCSKCIQYNAOBNQ-YBSFLMRUSA-N 0.000 description 1
- 201000009480 botryoid rhabdomyosarcoma Diseases 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 208000030224 brain astrocytoma Diseases 0.000 description 1
- 208000029028 brain injury Diseases 0.000 description 1
- 201000007980 brain meningioma Diseases 0.000 description 1
- 210000000481 breast Anatomy 0.000 description 1
- 244000309464 bull Species 0.000 description 1
- 102100029387 cAMP-responsive element modulator Human genes 0.000 description 1
- 208000035269 cancer or benign tumor Diseases 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 208000025997 central nervous system neoplasm Diseases 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 208000026106 cerebrovascular disease Diseases 0.000 description 1
- 210000003679 cervix uteri Anatomy 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000001311 chemical methods and process Methods 0.000 description 1
- 239000007795 chemical reaction product Substances 0.000 description 1
- 208000011654 childhood malignant neoplasm Diseases 0.000 description 1
- 208000006990 cholangiocarcinoma Diseases 0.000 description 1
- 208000016644 chronic atrophic gastritis Diseases 0.000 description 1
- 230000001684 chronic effect Effects 0.000 description 1
- 230000007882 cirrhosis Effects 0.000 description 1
- 208000019425 cirrhosis of liver Diseases 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 210000001072 colon Anatomy 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000011109 contamination Methods 0.000 description 1
- 201000007241 cutaneous T cell lymphoma Diseases 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- LNHSQAOQVNHUGL-QRBHCBQLSA-N dbco-peg4-biotin Chemical compound C1C2=CC=CC=C2C#CC2=CC=CC=C2N1C(=O)CCNC(=O)CCOCCOCCOCCOCCNC(=O)CCCC[C@H]1[C@H]2NC(=O)N[C@H]2CS1 LNHSQAOQVNHUGL-QRBHCBQLSA-N 0.000 description 1
- 230000034994 death Effects 0.000 description 1
- 230000000779 depleting effect Effects 0.000 description 1
- 229910052805 deuterium Inorganic materials 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000007865 diluting Methods 0.000 description 1
- 208000016097 disease of metabolism Diseases 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 238000010828 elution Methods 0.000 description 1
- 206010014599 encephalitis Diseases 0.000 description 1
- 208000001991 endodermal sinus tumor Diseases 0.000 description 1
- 201000003914 endometrial carcinoma Diseases 0.000 description 1
- 208000037902 enteropathy Diseases 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000008995 epigenetic change Effects 0.000 description 1
- 230000001973 epigenetic effect Effects 0.000 description 1
- 230000004049 epigenetic modification Effects 0.000 description 1
- 201000004101 esophageal cancer Diseases 0.000 description 1
- 201000005619 esophageal carcinoma Diseases 0.000 description 1
- 208000032099 esthesioneuroblastoma Diseases 0.000 description 1
- 150000002170 ethers Chemical class 0.000 description 1
- IFQUWYZCAGRUJN-UHFFFAOYSA-N ethylenediaminediacetic acid Chemical compound OC(=O)CNCCNCC(O)=O IFQUWYZCAGRUJN-UHFFFAOYSA-N 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 201000008819 extrahepatic bile duct carcinoma Diseases 0.000 description 1
- 210000003754 fetus Anatomy 0.000 description 1
- 230000004761 fibrosis Effects 0.000 description 1
- 238000011049 filling Methods 0.000 description 1
- 238000002795 fluorescence method Methods 0.000 description 1
- 201000003444 follicular lymphoma Diseases 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 201000010175 gallbladder cancer Diseases 0.000 description 1
- 208000010749 gastric carcinoma Diseases 0.000 description 1
- 230000002496 gastric effect Effects 0.000 description 1
- 201000000052 gastrinoma Diseases 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 210000004392 genitalia Anatomy 0.000 description 1
- 201000007116 gestational trophoblastic neoplasm Diseases 0.000 description 1
- 230000002710 gonadal effect Effects 0.000 description 1
- 208000003064 gonadoblastoma Diseases 0.000 description 1
- 210000004209 hair Anatomy 0.000 description 1
- 125000005843 halogen group Chemical group 0.000 description 1
- 210000003128 head Anatomy 0.000 description 1
- 201000010235 heart cancer Diseases 0.000 description 1
- 208000024348 heart neoplasm Diseases 0.000 description 1
- 208000006454 hepatitis Diseases 0.000 description 1
- 231100000283 hepatitis Toxicity 0.000 description 1
- 206010066957 hepatosplenic T-cell lymphoma Diseases 0.000 description 1
- 102000018511 hepcidin Human genes 0.000 description 1
- 108060003558 hepcidin Proteins 0.000 description 1
- 229940066919 hepcidin Drugs 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 1
- 208000017819 hyperplastic polyp Diseases 0.000 description 1
- 206010021198 ichthyosis Diseases 0.000 description 1
- 230000003100 immobilizing effect Effects 0.000 description 1
- 208000026278 immune system disease Diseases 0.000 description 1
- 238000000126 in silico method Methods 0.000 description 1
- 208000027866 inflammatory disease Diseases 0.000 description 1
- 230000004054 inflammatory process Effects 0.000 description 1
- 206010022000 influenza Diseases 0.000 description 1
- 206010022498 insulinoma Diseases 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 201000002313 intestinal cancer Diseases 0.000 description 1
- 208000026876 intravascular large B-cell lymphoma Diseases 0.000 description 1
- 230000010438 iron metabolism Effects 0.000 description 1
- 208000028867 ischemia Diseases 0.000 description 1
- 230000000302 ischemic effect Effects 0.000 description 1
- 210000004153 islets of langerhan Anatomy 0.000 description 1
- 208000003849 large cell carcinoma Diseases 0.000 description 1
- 201000005264 laryngeal carcinoma Diseases 0.000 description 1
- 206010023841 laryngeal neoplasm Diseases 0.000 description 1
- 201000010260 leiomyoma Diseases 0.000 description 1
- 230000003902 lesion Effects 0.000 description 1
- 208000002741 leukoplakia Diseases 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 238000011528 liquid biopsy Methods 0.000 description 1
- 208000012804 lymphangiosarcoma Diseases 0.000 description 1
- 208000006116 lymphomatoid granulomatosis Diseases 0.000 description 1
- 201000007919 lymphoplasmacytic lymphoma Diseases 0.000 description 1
- 238000002826 magnetic-activated cell sorting Methods 0.000 description 1
- 201000004792 malaria Diseases 0.000 description 1
- 230000036210 malignancy Effects 0.000 description 1
- 230000003211 malignant effect Effects 0.000 description 1
- 208000026045 malignant tumor of parathyroid gland Diseases 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 208000023356 medullary thyroid gland carcinoma Diseases 0.000 description 1
- 208000037819 metastatic cancer Diseases 0.000 description 1
- 208000011575 metastatic malignant neoplasm Diseases 0.000 description 1
- 230000000813 microbial effect Effects 0.000 description 1
- 208000024191 minimally invasive lung adenocarcinoma Diseases 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 210000004877 mucosa Anatomy 0.000 description 1
- 206010051747 multiple endocrine neoplasia Diseases 0.000 description 1
- 208000029766 myalgic encephalomeyelitis/chronic fatigue syndrome Diseases 0.000 description 1
- 206010028417 myasthenia gravis Diseases 0.000 description 1
- 201000005962 mycosis fungoides Diseases 0.000 description 1
- 230000002071 myeloproliferative effect Effects 0.000 description 1
- 210000003928 nasal cavity Anatomy 0.000 description 1
- 210000000822 natural killer cell Anatomy 0.000 description 1
- 230000004770 neurodegeneration Effects 0.000 description 1
- 208000015122 neurodegenerative disease Diseases 0.000 description 1
- 208000029974 neurofibrosarcoma Diseases 0.000 description 1
- 208000004649 neutrophil actin dysfunction Diseases 0.000 description 1
- 229910052757 nitrogen Inorganic materials 0.000 description 1
- 201000000032 nodular malignant melanoma Diseases 0.000 description 1
- 208000026878 nongerminomatous germ cell tumor Diseases 0.000 description 1
- 238000001668 nucleic acid synthesis Methods 0.000 description 1
- 125000003835 nucleoside group Chemical group 0.000 description 1
- 201000002575 ocular melanoma Diseases 0.000 description 1
- 210000002747 omentum Anatomy 0.000 description 1
- 201000005443 oral cavity cancer Diseases 0.000 description 1
- 201000006958 oropharynx cancer Diseases 0.000 description 1
- 208000021284 ovarian germ cell tumor Diseases 0.000 description 1
- 229910052760 oxygen Inorganic materials 0.000 description 1
- 239000001301 oxygen Substances 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
- 208000003154 papilloma Diseases 0.000 description 1
- 208000029211 papillomatosis Diseases 0.000 description 1
- 208000007312 paraganglioma Diseases 0.000 description 1
- 201000007052 paranasal sinus cancer Diseases 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 239000013610 patient sample Substances 0.000 description 1
- 230000009984 peri-natal effect Effects 0.000 description 1
- 208000015754 perinatal disease Diseases 0.000 description 1
- 210000005259 peripheral blood Anatomy 0.000 description 1
- 239000011886 peripheral blood Substances 0.000 description 1
- 208000028591 pheochromocytoma Diseases 0.000 description 1
- 230000004962 physiological condition Effects 0.000 description 1
- 230000035790 physiological processes and functions Effects 0.000 description 1
- 230000006461 physiological response Effects 0.000 description 1
- 208000020943 pineal parenchymal cell neoplasm Diseases 0.000 description 1
- 201000003113 pineoblastoma Diseases 0.000 description 1
- 208000010916 pituitary tumor Diseases 0.000 description 1
- 208000024246 polyembryoma Diseases 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 235000010486 polyoxyethylene sorbitan monolaurate Nutrition 0.000 description 1
- 239000000256 polyoxyethylene sorbitan monolaurate Substances 0.000 description 1
- 201000011461 pre-eclampsia Diseases 0.000 description 1
- 230000035935 pregnancy Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 208000025638 primary cutaneous T-cell non-Hodgkin lymphoma Diseases 0.000 description 1
- 208000000814 primary cutaneous anaplastic large cell lymphoma Diseases 0.000 description 1
- 201000000742 primary sclerosing cholangitis Diseases 0.000 description 1
- 210000002307 prostate Anatomy 0.000 description 1
- 102000004169 proteins and genes Human genes 0.000 description 1
- 238000012175 pyrosequencing Methods 0.000 description 1
- 239000002096 quantum dot Substances 0.000 description 1
- 206010038038 rectal cancer Diseases 0.000 description 1
- 201000001275 rectum cancer Diseases 0.000 description 1
- 208000010639 renal pelvis urothelial carcinoma Diseases 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 238000002271 resection Methods 0.000 description 1
- 210000002345 respiratory system Anatomy 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 206010039073 rheumatoid arthritis Diseases 0.000 description 1
- 150000003291 riboses Chemical class 0.000 description 1
- 201000003804 salivary gland carcinoma Diseases 0.000 description 1
- 201000000980 schizophrenia Diseases 0.000 description 1
- 208000010157 sclerosing cholangitis Diseases 0.000 description 1
- 238000007841 sequencing by ligation Methods 0.000 description 1
- 210000003491 skin Anatomy 0.000 description 1
- 201000000849 skin cancer Diseases 0.000 description 1
- 201000008261 skin carcinoma Diseases 0.000 description 1
- 201000011096 spinal cancer Diseases 0.000 description 1
- 210000000278 spinal cord Anatomy 0.000 description 1
- 206010062261 spinal cord neoplasm Diseases 0.000 description 1
- 206010062113 splenic marginal zone lymphoma Diseases 0.000 description 1
- 239000007858 starting material Substances 0.000 description 1
- 230000036262 stenosis Effects 0.000 description 1
- 208000037804 stenosis Diseases 0.000 description 1
- 201000000498 stomach carcinoma Diseases 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 210000002536 stromal cell Anatomy 0.000 description 1
- 208000035458 subtype of a disease Diseases 0.000 description 1
- 150000008163 sugars Chemical class 0.000 description 1
- 229910052717 sulfur Inorganic materials 0.000 description 1
- 201000008205 supratentorial primitive neuroectodermal tumor Diseases 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 230000008961 swelling Effects 0.000 description 1
- 208000006379 syphilis Diseases 0.000 description 1
- 230000002381 testicular Effects 0.000 description 1
- 201000003120 testicular cancer Diseases 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- 208000013818 thyroid gland medullary carcinoma Diseases 0.000 description 1
- 208000025358 tongue carcinoma Diseases 0.000 description 1
- 210000000515 tooth Anatomy 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 208000010556 transitional cell papilloma Diseases 0.000 description 1
- 201000004420 transitional papilloma Diseases 0.000 description 1
- 238000002054 transplantation Methods 0.000 description 1
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 1
- 208000029387 trophoblastic neoplasm Diseases 0.000 description 1
- 201000008827 tuberculosis Diseases 0.000 description 1
- 210000000626 ureter Anatomy 0.000 description 1
- 201000000334 ureter transitional cell carcinoma Diseases 0.000 description 1
- 201000005112 urinary bladder cancer Diseases 0.000 description 1
- 208000012991 uterine carcinoma Diseases 0.000 description 1
- 210000004291 uterus Anatomy 0.000 description 1
- 206010046885 vaginal cancer Diseases 0.000 description 1
- 208000013139 vaginal neoplasm Diseases 0.000 description 1
- 229910052720 vanadium Inorganic materials 0.000 description 1
- 208000021331 vascular occlusion disease Diseases 0.000 description 1
- 201000001862 viral hepatitis Diseases 0.000 description 1
- 201000010044 viral meningitis Diseases 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
- 201000005102 vulva cancer Diseases 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6844—Nucleic acid amplification reactions
- C12Q1/6853—Nucleic acid amplification reactions using modified primers or templates
- C12Q1/6855—Ligating adaptors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6806—Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
- C12Q1/6886—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2525/00—Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
- C12Q2525/10—Modifications characterised by
- C12Q2525/191—Modifications characterised by incorporating an adaptor
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2545/00—Reactions characterised by their quantitative nature
- C12Q2545/10—Reactions characterised by their quantitative nature the purpose being quantitative analysis
- C12Q2545/101—Reactions characterised by their quantitative nature the purpose being quantitative analysis with an internal standard/control
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2563/00—Nucleic acid detection characterized by the use of physical, structural and functional properties
- C12Q2563/185—Nucleic acid dedicated to use as a hidden marker/bar code, e.g. inclusion of nucleic acids to mark art objects or animals
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/154—Methylation markers
-
- C—CHEMISTRY; METALLURGY
- C40—COMBINATORIAL TECHNOLOGY
- C40B—COMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
- C40B40/00—Libraries per se, e.g. arrays, mixtures
- C40B40/04—Libraries containing only organic compounds
- C40B40/06—Libraries containing nucleotides or polynucleotides, or derivatives thereof
- C40B40/08—Libraries containing RNA or DNA which encodes proteins, e.g. gene libraries
-
- C—CHEMISTRY; METALLURGY
- C40—COMBINATORIAL TECHNOLOGY
- C40B—COMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
- C40B50/00—Methods of creating libraries, e.g. combinatorial synthesis
- C40B50/04—Methods of creating libraries, e.g. combinatorial synthesis using dynamic combinatorial chemistry techniques
-
- C—CHEMISTRY; METALLURGY
- C40—COMBINATORIAL TECHNOLOGY
- C40B—COMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
- C40B70/00—Tags or labels specially adapted for combinatorial chemistry or libraries, e.g. fluorescent tags or bar codes
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Health & Medical Sciences (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Analytical Chemistry (AREA)
- Genetics & Genomics (AREA)
- Immunology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- Molecular Biology (AREA)
- Microbiology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Pathology (AREA)
- Oncology (AREA)
- Hospice & Palliative Care (AREA)
- Biomedical Technology (AREA)
- Plant Pathology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Investigating Or Analysing Biological Materials (AREA)
- Enzymes And Modification Thereof (AREA)
Abstract
Изобретение относится к биотехнологии, в частности, представлен способ секвенирования гидроксиметилированной бесклеточной ДНК. В некоторых воплощениях способ включает введение аффинной метки только в молекулы гидроксиметилированной ДНК в образце бкДНК, обогащение молекул ДНК, помеченных аффинной меткой, и секвенирование обогащенных молекул ДНК. 4 н. и 21 з.п. ф-лы, 11 табл., 1 пр., 13 ил.
Description
Перекрестные ссылки
Настоящая заявка претендует на приоритет от предварительной заявки на патент США No. 62/319,702, поданной 7 апреля 2016 г., No. 62/444,122, поданной 9 января 2017 г., и No. 62/461,712, поданной 21 февраля 2017 г., которые включены сюда во всей полноте путем ссылки.
Уровень техники
Модификации ДНК в виде 5-метилцитозина (5mC) и недавно идентифицированного 5-гидроксиметилцитозина (5hmC) представляют две главные эпигенетические метки, обнаруженные в геноме млекопитающих, и они влияют на широкий круг биологических процессов от регуляции генов до нормального развития. Выявление аномальных изменений 5mC и 5hmC в бесклеточной ДНК (cfDNA, бкДНК) может составлять привлекательный неинвазивный подход к диагностике рака. БкДНК - это циркулирующая ДНК, которая встречается в нашей крови и происходит из разных тканей, которая уже используется для неинвазивных пренатальных анализов, диагностики трансплантатов органов и выявления рака. В сравнении с интенсивными исследованиями по бесклеточной 5mC-ДНК в качестве биомаркера для диагностики рака, бесклеточная 5hmC-ДНК остается неиспользованной, главным образом из-за низкого уровня 5hmC по сравнению с 5mC в геноме человека (в 10-100 раз меньше, чем 5mC), а также отсутствия чувствительного метода секвенирования небольших количеств 5hmC при работе с очень маленьким количеством бкДНК (как правило, всего несколько нанограмм на мл плазмы).
Сущность изобретения
Предусмотрен, среди прочего, способ секвенирования гидроксиметилированной ДНК в образцах циркулирующей бесклеточной ДНК. В некоторых воплощениях способ включает введение аффинной метки только в молекулы гидроксиметилированной ДНК в образце бкДНК, обогащение молекул ДНК, помеченных аффинной меткой, и секвенирование обогащенных молекул ДНК.
В некоторых воплощениях способ включает: добавление адаптерных последовательностей на концы бкДНК; инкубирование лигированной с адаптером бкДНК с ДНК-β-глюкозилтрансферазой и UDP-глюкозой, модифицированной хемоселективной группой, при этом происходит ковалентное мечение молекул гидроксиметилированной ДНК в бкДНК хемоселективной группой; присоединение биотинового компонента к хемоселективно модифицированной бкДНК по реакции циклоприсоединения; обогащение биотинилированных молекул ДНК путем связывания с носителем, связывающимся с биотином; амплификацию обогащенной ДНК с помощью праймеров, связывающихся с адаптерами; и секвенирование амплифицированной ДНК с получением множества прочтений последовательности.
Также предусмотрен способ, включающий: (а) получение образца, содержащего циркулирующую бесклеточную ДНК, (b) обогащение гидроксиметилированной ДНК в образце и (с) независимое определение количества таких нуклеиновых кислот в обогащенной гидроксиметилированной ДНК, которые картируются по одному или каждому из нескольких целевых локусов.
Среди прочего, последовательности, полученные данным способом, можно использовать, к примеру, в качестве средств диагностики, тераностики или прогнозирования для различных заболеваний или состояний.
Также предусмотрены различные композиции, включая композиции, содержащие циркулирующую бесклеточную ДНК, причем остатки гидроксиметилцитозина в ДНК модифицированы так, чтобы они содержали метку захвата.
Далее эти и другие особенности настоящего изобретения изложены подробно.
Краткое описание фигур
Специалистам должно быть понятно, что описанные ниже чертежи приводятся только для иллюстрации. Эти чертежи не должны никоим образом ограничивать объем настоящего изобретения.
Фиг. 1A-1C. Секвенирование 5hmC в бкДНК. Фиг. 1A. Общая процедура секвенирования бесклеточного 5hmC. БкДНК лигируется с адаптером Illumina и метится биотином по 5hmC для выделения с помощью стрептавидиновых шариков. Конечная библиотека составляется методом ПЦР прямо из стрептавидиновых гранул. Фиг. 1B. Процент прочтений, относящихся к добавленной контрольной ДНК в библиотеках для секвенирования. Планки погрешностей означают S.D. Фиг. 1C. Метагенные профили log2 изменения бесклеточного 5hmC относительно исходной бкДНК в генах, ранжированных по уровню их экспрессии при секвенировании бесклеточной РНК.
Фиг. 2A-2D. Рак легких ведет к прогрессирующей потере обогащения 5hmC в бкДНК. Фиг. 2A. Распределение бесклеточного 5hmC в районе 10 mb на хромосоме 6 в геномном браузере. Представлено совмещение записей от здоровых образцов, образцов неметастатического рака легких, метастатического рака легких и исходной бкДНК в виде линейных графиков. Фиг. 2B. Теплокарта 1159 дифференциальных генов метастатического рака легких в здоровых образцах, образцах рака легких и необогащенной исходной бкДНК. Проводилась иерархическая кластеризация по генам и образцам. Фиг. 2C. Ящичковая диаграмма количества hMRs, выявленных в каждой группе (нормировано на 1 миллион прочтений). Фиг. 2D. Ящичковые диаграммы FPKM 5hmC у CCNY и PDIA6 в образцах рака легких и других образцах бкДНК. * p<0,05, ** p<0,01, *** p<0,001, **** p<10-5, t-критерий Уэлча.
Фиг. 3A-3E. Бесклеточный 5hmC для мониторинга прогрессирования и лечения HCC. Фиг. 3A. График tSNE по FPKM 5hmC из здоровых образцов, образцов HBV и HCC. Фиг. 3B. Теплокарта 1006 дифференциальных генов HCC в здоровых образцах, образцах HBV и HCC. Проводилась иерархическая кластеризация по генам и образцам. Фиг. 3C-3D. Ящичковые диаграммы AHSG (фиг. 3C) и MTBP (фиг. 3D) 5hmC FPKM в образцах HBV, HCC (до операции), HCC после операции, рецидивов HCC и других образцах бкДНК. * p<0,05, ** p<10-4, *** p<10-5, t-критерий Уэлча. Фиг. 3E. График tSNE по FPKM 5hmC из здоровых образцов, образцов HCC до операции, HCC после операции и рецидивов HCC.
Фиг. 4A-4C. Предсказание типа и стадии рака по бесклеточному 5hmC. Фиг. 4A. График tSNE по FPKM 5hmC в бкДНК из здоровых образцов и различных раковых образцов. Фиг. 4B. Фактическая и прогнозируемая классификация при кросс-валидации с одним пропуском по алгоритмам Mclust (MC) и Random Forest (RF) на основе набора по двум признакам (тело гена и DhMR). Фиг. 4C. Каппа-коэффициент Коэна для измерения согласия между классификаторами (GB означает тело гена). Планки погрешностей означают стандартную ошибку оценки каппа-коэффициента Коэна.
Фиг. 5A-5F. Секвенирование бесклеточного 5hmC модифицированным методом hMe-Seal. Фиг. 5A. Реакции hMe-Seal. 5hmC в ДНК метится модифицированной азидом глюкозой при помощи βGT, а затем соединяется с группой биотина методами клик-химии. Фиг. 5B. Проверка на обогащение одного пула ампликонов, содержащих C, 5mC или 5hmC, добавленных к бкДНК. Анализ геля показывает, что после hMe-Seal только 5hmC-содержащие ампликоны подвергаются ПЦР на стрептавидиновых гранулах. Фиг. 5C. Ящичковая диаграмма глубины секвенирования по всем бесклеточным образцам. Фиг. 5D. Ящичковая диаграмма показателя уникального недвойственного картирования по всем бесклеточным образцам. Фиг. 5E. MA-график нормированного количества прочтений бесклеточного 5hmC (прочтений на 1 миллион) при разбиении по 10 kb по всему геному между техническими пробами. Горизонтальная синяя линия M=0 означает одинаковые значения в двух пробах. Кривая наименьшего соответствия (красная) означает возможный тренд смещения, связанного со средним значением. Фиг. 5F. Диаграмма Венна перекрывания hMR между техническими повторами секвенирования бесклеточного 5hmC и сборным образцом из обеих проб.
Фиг. 6A-6D. Геномное распределение 5hmC в бкДНК. Фиг. 6A. Распределение 5hmC в районе 10 mb на хромосоме 20 в геномном браузере. Представлены записи от обогащенной бкДНК и гДНК из цельной крови вместе с необогащенной исходной бкДНК. Фиг. 6B. Круговая диаграмма общего геномного распределения hMR в бкДНК. Фиг. 6C. Относительное обогащение hMRs по различным участкам генома в бкДНК и гДНК из цельной крови. Фиг. 6D. График tSNE по FPKM 5hmC в бкДНК и гДНК цельной крови из здоровых образцов.
Фиг. 7A-7E. Дифференциальные сигналы 5hmC между бкДНК и гДНК из цельной крови. Фиг. 7A. Теплокарта 2082 дифференциальных генов между бкДНК и гДНК крови. Проводилась иерархическая кластеризация по генам и образцам. Фиг. 7B. Ящичковая диаграмма уровня экспрессии обогащенных 5hmC генов в бкДНК и гДНК из цельной крови. Сверху приведены значения p. Фиг. 7C и 7D. GO-анализ обогащенных 5hmC генов, специфичных для цельной крови (фиг. 7C) и для бкДНК (фиг. 7D), при пороге отсечения значений p в 0,001. Фиг. 7E. Распределение 5hmC в локусах FPR1/FPR2 (сверху) и GLP1R (внизу) в геномном браузере. Представлено совмещение записей от бкДНК, гДНК цельной крови и исходной бкДНК в виде линейных графиков.
Фиг. 8A-8D. Бесклеточный гидроксиметилом при раке легких. Фиг. 8A. График tSNE по FPKM 5hmC из здоровых образцов, образцов неметастатического рака легких и метастатического рака легких, а также необогащенной исходной бкДНК. Фиг. 8B. Метагенные профили бесклеточного 5hmC в здоровой группе и различных раковых группах вместе с необогащенной исходной бкДНК. Заштрихованные участки означают S.E.M. Фиг. 8C. Процент прочтений, картированных относительно добавленной контрольной ДНК в библиотеках для секвенирования из различных групп. Планки погрешностей означают S.D. Фиг. 8D. Распределение бесклеточного 5hmC в локусах CREM/CCNY (слева) и ATP6V1C2/PDIA6 (справа) в здоровых образцах и образцах рака легких в геномном браузере. Представлено совмещение записей в виде линейных графиков.
Фиг. 9A-9E. Бесклеточный гидроксиметилом при HCC. Фиг. 9A. Ящичковая диаграмма уровня экспрессии специфичных для HCC обогащенных и обедненных 5hmC генов в ткани печени. Сверху приведены значения p. Фиг. 9B. Распределение бесклеточного 5hmC в локусе AHSG в здоровых образцах, образцах HBV и HCC в геномном браузере. Представлено совмещение записей в виде линейных графиков. Фиг. 9C. Экспрессия AHSG в печени и других тканях. Фиг. 9D. Распределение бесклеточного 5hmC в локусе MTBP в здоровых образцах, образцах HBV и HCC в геномном браузере. Представлено совмещение записей в виде линейных графиков. Фиг. 9E. Изменения показателя HCC в 4 случаях последующего наблюдения HCC. Внизу представлено состояние заболевания. Сверху представлено время в месяцах. Пунктирные линии представляют медианные значения показателей HCC в группах HCC, HBV и здоровой группе. Треугольники означают лечение. Показатель HCC представляет собой линейную комбинацию из 1006 дифференциальных генов HCC (фиг. 3B), которые наилучшим образом отделяют образцы HCC от HBV и здоровых образцов.
Фиг. 10A-10E. Бесклеточный гидроксиметилом при раке поджелудочной железы. Фиг. 10А. Теплокарта 713 дифференциальных генов рака поджелудочной железы в здоровых образцах и образцах рака поджелудочной железы. Проводилась иерархическая кластеризация по генам и образцам. Фиг. 10B и 10C. Ящичковые диаграммы по FPKM 5hmC в локусах ZFP36L1, DCXR (фиг. 10B) и GPR21, SLC19A3 (фиг.10C) в образцах рака поджелудочной железы и других образцах бкДНК. * p<0,001, ** p<10-5, t-критерий Уэлча. Фиг. 10D и 10E. Распределение бесклеточного 5hmC в локусах ZFP36L1, DCXR (фиг. 10D) и GPR21, SLC19A3 (фиг. 10E) в здоровых образцах и образцах рака поджелудочной железы в геномном браузере. Представлено совмещение записей в виде линейных графиков.
Фиг. 11A-11D. Бесклеточный гидроксиметилом в раковых образцах. Фиг. 11A. График tSNE по FPKM промоторов 5hmC (отстоящих на 5 kb выше от TSS) из здоровых образцов и различных раковых образцов. Фиг. 11B. График tSNE по FPKM 5hmC из здоровых образцов и различных раковых образцов бкДНК вместе с образцами гДНК из цельной крови. Фиг. 11C. Возрастное распределение здоровых лиц и различных больных раком. Фиг. 11D. График tSNE по FPKM 5hmC в бкДНК из здоровых образцов и различных раковых образцов (фиг. 4A), расцвеченных по партиям, пронумерованным в соответствии с продолжительностью процесса.
Фиг. 12A-12G. Предсказание типа и стадии рака по бесклеточному 5hmC. Фиг. 12A и 12B. График байесовского информационного критерия (BIC) по Mclust при обучении по набору из 90 значений признака тела гена (фиг. 12A) и 17 значений признака DhMR (фиг. 12B), указывающий на высокое значение BIC при разбиении на пять групп с использованием модели EEI для Mclust. Фиг. 12C. 4-Мерный график уменьшения размерности на основе Mclust с использованием признака DhMR. В нижней части представлен график разброса, а в верхней части - график плотности. Фиг. 12D и 12E. Важность переменных (среднее снижение Gini) для самых верхних 15 тел генов (фиг. 12D) и DhMRs (фиг. 12E) в обучающейся модели типа случайного леса. На фиг. 12F и 12G представлена важность переменных для тел генов и DhMRs, полученная другим методом.
Фиг. 13. Примеры DhMRs в модели случайного леса. Распределение бесклеточного 5hmC в четырех DhMR с высокой значимостью переменной в модели случайного леса в различных группах в виде геномного браузера. Представлено совмещение записей в виде линейных графиков. Заштрихованные участки означают DhMRs.
Определения
Если не указано иначе, все технические и научные термины, используемые здесь, имеют такие же значения, которые обычно понимается рядовыми специалистами в той области техники, к которой относится настоящее изобретение. Хотя при практическом применении или тестировании настоящего изобретения могут применяться любые способы и материалы, аналогичные или эквивалентные описанным здесь, однако предпочтительны описанные способы и материалы.
Все патенты и публикации, упомянутые здесь, включая все последовательности, приведенные в таких патентах и публикациях, прямо включены сюда путем ссылки.
Числовые диапазоны включают числа, определяющие диапазон. Если не указано иначе, нуклеиновые кислоты записаны слева направо в ориентации от 5'- к 3'-концу; аминокислотные последовательности записаны слева направо в ориентации от N- к C-концу, соответственно.
Приведенные здесь заголовки не налагают ограничений на различные аспекты или воплощения изобретения. Соответственно, приведенные ниже термины более полно определяются со ссылкой на все описание в целом.
Если не указано иначе, все технические и научные термины, используемые здесь, имеют такие же значения, которые обычно понимаются рядовыми специалистами в той области техники, к которой относится настоящее изобретение. Общие значения многих терминов, используемых здесь, приведены в Singleton et al., Dictionary of Microbiology and Molecular Biology, 2nd Ed., John Wiley and Sons, New York (1994); и Hale & Markham, The Harper Collins Dictionary of Biology, Harper Perennial, N.Y. (1991). Тем не менее, для четкости и удобства ссылки некоторые термины определены ниже.
Термин “образец” в настоящем изобретении означает материал или смесь материалов, как правило, хотя и необязательно, в жидком виде, содержащих одно или несколько анализируемых веществ.
Термин “образец нуклеиновой кислоты” в настоящем изобретении означает образец, содержащий нуклеиновые кислоты. Используемые здесь образцы нуклеиновой кислоты могут быть сложными в том, что они содержат несколько различных молекул, содержащих последовательности. Примером сложных образцов является геномная ДНК млекопитающих (например, мыши или человека). Сложные образцы могут содержать более 104, 105, 106 или 107 различных молекул нуклеиновой кислоты. ДНК-мишень может происходить из любого источника типа геномной ДНК или искусственной конструкции из ДНК. При этом можно использовать любые образцы, содержащие нуклеиновую кислоту, например, геномную ДНК, полученную из клеток культуры ткани или образца ткани. Образец нуклеиновой кислоты может быть получен из любого подходящего источника, включая образцы зубов, костей, волос или костей и т.п.
Термин “нуклеотид” охватывает такие молекулы, которые содержат не только известные пуриновые и пиримидиновые основания, но и другие гетероциклические основания, подвергавшиеся модификации. Такие модификации включают метилированные пурины или пиримидины, ацилированные пурины или пиримидины, алкилированные рибозы или другие гетероциклы. Кроме того, термин “нуклеотид” охватывает и такие молекулы, которые содержат гаптены или флуоресцентные метки и могут содержать не только обычные сахара рибозы и дезоксирибозы, но и другие сахара. Модифицированные нуклеозиды или нуклеотиды включают и такие модификации сахаров, например, при которых одна или несколько гидроксильных групп заменены на атомы галогенов или алифатические группы либо функционализированы в виде простых эфиров, аминов и т.п.
Термины “нуклеиновая кислота” и “полинуклеотид” применяются здесь взаимозаменяемо для описания полимеров любой длины, например, более 2 оснований, более 10 оснований, более 100 оснований, более 500 оснований, более 1000 оснований и вплоть до 10000 или больше оснований, состоящих из нуклеотидов, например, дезоксирибонуклеотидов или рибонуклеотидов, и могут быть получены ферментативным или синтетическим путем (например, ПНК, как описано в U.S. Patent No. 5,948,902 и приведенных в нем ссылках), которые могут гибридизироваться с природными нуклеиновыми кислотами специфичным для последовательности образом аналогично гибридизации двух природных нуклеиновых кислот, например, могут участвовать во взаимодействиях типа парных оснований Ватсона-Крика. Природные нуклеотиды включают гуанин, цитозин, аденин и тимин (G, C, A и T, соответственно). ДНК и РНК имеют остов из сахара дезоксирибозы или рибозы, соответственно, тогда как остов ПНК состоит из повторяющихся звеньев N-(2-аминоэтил)глицина, соединенных пептидными связями. В ПНК различные пуриновые и пиримидиновые основания соединяются с остовом метиленкарбонильными связями. Закрытая нуклеиновая кислота (LNA), часто называемая недоступной РНК, состоит из модифицированных РНК-нуклеотидов. Рибозная часть нуклеотидов LNA модифицирована дополнительным мостиком, соединяющим 2'-кислород и 4'-углерод. Мостик “блокирует” рибозу в конформации 3'-эндо (North), которая часто встречается в дуплексах A-формы. При необходимости LNA-нуклеотиды могут быть смешаны с остатками ДНК или РНК в олигонуклеотидах. Термин “неструктурированная нуклеиновая кислота” или “UNA” означает нуклеиновую кислоту, содержащую неприродные нуклеотиды, которые связываются друг с другом с пониженной стабильностью. Например, неструктурированная нуклеиновая кислота может содержать остаток G' и остаток C', причем эти остатки соответствуют неприродным формам, т.е. аналогам G и C, которые образуют пары друг с другом с пониженной стабильностью, но сохраняют способность спариваться с природными остатками C и G, соответственно. Неструктурированная нуклеиновая кислота описана в US 2005/0233340, который включен сюда путем ссылки для раскрытия UNA. Также в это определение включены ZNAs, т.е. zip-нуклеиновые кислоты.
Термин “олигонуклеотид” в настоящем изобретении обозначает одноцепочечный мультимер нуклеотидов длиной от 2 до 200 нуклеотидов, вплоть до 500 нуклеотидов. Олигонуклеотиды могут быть синтетическими или могут быть получены ферментативным путем, в некоторых воплощениях они состоят из 30-150 нуклеотидов. Олигонуклеотиды могут содержать рибонуклеотидные мономеры (то есть это олигорибонуклеотиды) и/или дезоксирибонуклеотидные мономеры. К примеру, олигонуклеотид может содержать от 10 до 20, от 21 до 30, от 31 до 40, от 41 до 50, от 51 до 60, от 61 до 70, от 71 до 80, от 80 до 100, от 100 до 150 или от 150 до 200 нуклеотидов.
Термин “гибридизация” относится к способу, посредством которого одна цепь нуклеиновой кислоты соединяется с комплементарной цепью посредством спаривания оснований, как это известно в данной области. Считается, что нуклеиновая кислота “избирательно гибридизуется” с эталонной последовательностью нуклеиновой кислоты, если две последовательности специфически гибридизуются друг с другом в условиях средней или высокой жесткости гибридизации и отмывки. Условия средней или высокой жесткости гибридизации известны (например, см. Ausubel et al., Short Protocols in Molecular Biology, 3rd ed., Wiley & Sons, 1995; и Sambrook et al., Molecular Cloning: A Laboratory Manual, Third Edition, 2001, Cold Spring Harbor, N.Y.). Один из примеров условий высокой жесткости включает гибридизацию при 42°C в 50% формамиде, 5×SSC, 5×растворе Денхардта, 0,5% SDS и 100 мкг/мл денатурированной ДНК носителя с последующей промывкой два раза в 2×SSC и 0,5% SDS при комнатной температуре и еще два раза в 0,1×SSC и 0,5% SDS при 42°C.
Термин “праймер” означает олигонуклеотид, природный либо синтетический, который при образовании дуплекса с полинуклеотидной матрицей способен действовать в качестве точки запуска синтеза нуклеиновой кислоты и элонгироваться от своего 3'-конца вдоль матрицы с образованием элонгированного дуплекса. Последовательность нуклеотидов, добавленных в процессе элонгации, определяется последовательностью полинуклеотида-матрицы. Обычно праймеры элонгируются под действием ДНК-полимеразы. Праймеры обычно имеют длину, совместимую с их использованием при синтезе продуктов элонгации праймеров, которая обычно составляет от 8 до 100 нуклеотидов, как-то от 10 до 75, от 15 до 60, от 15 до 40, от 18 до 30, от 20 до 40, от 21 до 50, от 22 до 45, от 25 до 40 и т.д. Типичные праймеры могут иметь длину в пределах 10-50 нуклеотидов, как-то 15-45, 18-40, 20-30, 21-25 и т.д., а также любой длины между указанными пределами. В некоторых воплощениях длина праймеров обычно составляет не более 10, 12, 15, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 55, 60, 65 или 70 нуклеотидов.
Термин “дуплекс” или “дуплексный” в настоящем изобретении означает два комплементарных полинуклеотида со спаренными основаниями, т.е. они гибридизованы друг с другом.
Термины “определение”, “измерение”, “оценка”, “установление”, “опробование” и “анализ” применяются здесь взаимозаменяемо для обозначения любых измерений и включают определение наличия или отсутствия элемента. Эти термины включают и количественные, и качественные определения. Оценка может быть относительной или абсолютной. “Оценка присутствия” включает определение количества присутствующего, а также определение того, присутствует оно или отсутствует.
Термин “применение” имеет свое обычное значение и в таком качестве означает использование, например, запуск способа или композиции для достижения цели. Например, если применяется программа для создания файла, то программа исполняется с получением файла, а файл обычно является результатом программы. В другом примере, если применяется компьютерный файл, то его обычно вскрывают, считывают и используют информацию, хранящуюся в файле, для достижения цели. Аналогично, если применяется уникальный идентификатор, например, баркод, то уникальный идентификатор обычно считывают для идентификации, к примеру, объекта или файла, связанного с уникальным идентификатором.
Термин “лигирование” в настоящем изобретении означает катализируемое ферментом соединение концевого нуклеотида на 5'-конце первой молекулы ДНК с концевым нуклеотидом на 3'-конце второй молекулы ДНК.
“Множество” содержит не менее 2 членов. В некоторых случаях множество может содержать по меньшей мере 10, по меньшей мере 100, по меньшей мере 1000, по меньшей мере 10000, по меньшей мере 100000, по меньшей мере 106, по меньшей мере 107, по меньшей мере 108 или по меньшей мере 109 и более членов.
Если две нуклеиновые кислоты “комплементарны”, то каждое основание одной из нуклеиновых кислот образует пару с соответствующим нуклеотидом в другой нуклеиновой кислоте. Две нуклеиновые кислоты не обязательно должны быть совершенно комплементарными, чтобы гибридизироваться друг с другом.
Термин “разделение” в настоящем изобретении означает физическое разделение двух элементов (например, по размеру или по сродству и т.д.), а также разрушение одного элемента, оставляя другой неповрежденным.
Термин “секвенирование” в настоящем изобретении означает метод, при помощи которого устанавливают идентичность по меньшей мере 10 последовательных нуклеотидов (например, по меньшей мере 20, по меньшей мере 50, по меньшей мере 100 или по меньшей мере 200 и более последовательных нуклеотидов) в полинуклеотидах.
Термины “секвенирование следующего поколения” или “высокопроизводительное секвенирование” в настоящем изобретении относятся к так называемым платформам параллельного секвенирования путем синтеза или секвенирования путем лигирования, которые сейчас применяются фирмами Illumina, Life Technologies, Roche и др. Методы секвенирования следующего поколения также могут включать в себя нанопоровые методы секвенирования типа метода фирмы Oxford Nanopore Technologies, методы на основе электронного детектирования типа технологии Ion Torrent фирмы Life Technologies или одномолекулярные методы на основе флуоресценции типа метода фирмы Pacific Biosciences.
Термин “секвенирование следующего поколения” относится к так называемым платформам параллельного секвенирования путем синтеза или секвенирования путем лигирования, которые сейчас применяются фирмами Illumina, Life Technologies, Roche и др. Методы секвенирования следующего поколения также могут включать в себя нанопоровые методы секвенирования или методы на основе электронного детектирования типа технологии Ion Torrent фирмы Life Technologies.
Термин “адаптер” относится к такой нуклеиновой кислоте, которая лигируется с обеими цепями двухцепочечной молекулы ДНК. В одном воплощении адаптер может представлять собой шпилькообразный адаптер (т.е. это одна молекула, которая гибридизуется сама с собой, образуя структуру, которая содержит двухцепочечный стебелек и петлю, причем 3'- и 5'-концы молекулы лигируются с 5'- и 3'-концами двухцепочечной молекулы ДНК, соответственно). В другом воплощении адаптер может представлять собой Y-образный адаптер. В другом воплощении адаптер может сам состоять из двух отдельных молекул олигонуклеотидов, которые гибридизуются друг с другом. Как видно, лигируемый конец адаптера может быть спроектирован так, чтобы он был совместимым с выступами, образующимися при расщеплении рестрикционным ферментом, или же он может иметь тупые концы либо свисающий 5'-T. Термин “адаптер” относится как к двухцепочечным, так и к одноцепочечным молекулам. Адаптером может быть ДНК или РНК либо их смесь. Адаптер, содержащий РНК, может расщепляться при обработке РНКазой или при щелочном гидролизе. Адаптер может содержать от 15 до 100 оснований, например, от 50 до 70 оснований, хотя предусмотрены адаптеры и за пределами этого диапазона.
Термин “лигированная с адаптером” в настоящем изобретении относится к такой нуклеиновой кислоте, которая лигирована с адаптером. Адаптер может быть лигирован с 5'-концом и/или 3'-концом молекулы нуклеиновой кислоты.
Термин “асимметричный адаптер” в настоящем изобретении означает такой адаптер, который при лигировании с обоими концами двухцепочечного фрагмента нуклеиновой кислоты приводит к тому, что верхняя цепь, содержащая последовательность 5'-тега, не будет такой же или комплементарной последовательности метки на 3'-конце. Типичные асимметричные адаптеры описаны в U.S. Patents 5,712,126 и 6,372,434 и WO 2009/032167; которые все включены сюда путем ссылки во всей полноте. Фрагмент с асимметричными тегами может быть амплифицирован при помощи двух праймеров: одного, который гибридизуется с последовательностью первого тега, добавленного к 3'-концу цепи, и другого, который гибридизуется с комплементарной последовательностью второго тега, добавленного к 5'-концу цепи. Примерами асимметричных адаптеров являются Y-адаптеры и шпилькообразные адаптеры (которые могут расщепляться после лигирования с образованием “Y-адаптера”).
Термин “Y-адаптер” означает такой адаптер, который содержит: двухцепочечный участок и одноцепочечный участок, в котором противоположные последовательности не являются комплементарными. Конец двухцепочечного участка может присоединиться к молекулам мишени типа двухцепочечных фрагментов геномной ДНК, например, при помощи лигирования или реакции, катализируемой транспозазой. Каждая цепь двухцепочечной ДНК с тегами от адаптера, которая была лигирована с Y-адаптером, несет асимметричные теги, так как она содержит последовательность одной цепи Y-адаптера на одном конце и другой цепи Y-адаптера на другом конце. Амплификация молекул нуклеиновой кислоты, соединенных с Y-адаптерами на обоих концах, дает нуклеиновую кислоту с асимметричными тегами, то есть такую нуклеиновую кислоту, у которой 5'-конец содержит последовательность одного тега, а 3'-конец содержит последовательность другого тега (метки).
Термин “шпилькообразный адаптер” означает такой адаптер, который имеет вид шпильки. В одном воплощении петля шпильки после лигирования может расщепляться с образованием цепей, содержащих некомплементарные метки-теги на концах. В некоторых случаях петля адаптера типа шпильки может содержать остаток урацила, поэтому петля может расщепляться с помощью урациловой ДНК-гликозилазы и эндонуклеазы VIII, хотя известны и другие способы.
Термин “лигированный с адаптером образец” в настоящем изобретении относится к таким образцам, которые лигированы с адаптером. Как следует из приведенных выше определений, образцы, которые лигированы с асимметричным адаптером, содержат цепи, имеющие некомплементарные последовательности на 5'- и 3'-концах.
“Сайт связывания олигонуклеотида” означает сайт, с которым олигонуклеотид гибридизуется в целевом полинуклеотиде. Если олигонуклеотид “обеспечивает” сайт связывания для праймера, то праймер может гибридизоваться с этим олигонуклеотидом или комплементарным ему.
Термин “нить” в настоящем изобретении относится к нуклеиновой кислоте, состоящей из нуклеотидов, ковалентно связанных между собой ковалентными связями, например, фосфодиэфирными связями. В клетке ДНК обычно существует в двухцепочечной форме и поэтому имеет две комплементарные цепи нуклеиновой кислоты, которые обозначаются здесь как “верхняя” и “нижняя” цепь. В некоторых случаях комплементарные цепи хромосомной области могут обозначаться как “плюс-нить” и “минус-нить”, “первая” и “вторая” цепь, “кодирующая” и “некодирующая” цепь, “нить Уотсона” и “нить Крика” или “смысловая” и “антисмысловая” цепь. Определение цепи как верхней или нижней является произвольным и не подразумевает какой-либо конкретной ориентации, функции или структуры. Нуклеотидные последовательности первой цепи нескольких типичных хромосомных областей млекопитающих (например, BACs, сборных комплектов, хромосом и т.д.) известны и могут находиться, к примеру, в базе данных Genbank NCBI.
Термин “введение метки-тега” в настоящем изобретении означает присоединение тега последовательности (содержащего последовательность идентификатора) к молекуле нуклеиновой кислоты. Метка-тег последовательности может быть добавлена к 5'-концу, 3'-концу или к обоим концам молекулы нуклеиновой кислоты. Метка-тег последовательности может быть введена во фрагменты путем лигирования адаптера с фрагментами при помощи, например, ДНК-лигазы T4 или другой лигазы.
Термин “молекулярный баркод” охватывает последовательности идентификаторов образцов и последовательности идентификаторов молекул, как описано ниже. В некоторых воплощениях молекулярный баркод может иметь длину в пределах от 1 до 36 нуклеотидов, например, от 6 до 30 нуклеотидов или от 8 до 20 нуклеотидов. В некоторых случаях последовательности молекулярных идентификаторов могут быть с коррекцией ошибок, что означает, что даже если есть ошибка (например, если последовательность молекулярного баркода синтезирована неправильно, считывается неправильно или искажается в результате различных стадий обработки, ведущих к определению последовательности молекулярного баркода), то код все равно может быть правильно интерпретирован. Описания типичных последовательностей с коррекцией ошибок можно найти в литературе (например, US 2010/0323348 и US 2009/0105959, которые включены сюда путем ссылки). В некоторых воплощениях последовательность идентификаторов может быть относительно низкой сложности (например, она может состоять из смеси от 4 до 1024 различных последовательностей), хотя в некоторых случаях могут использоваться последовательности идентификаторов большей сложности.
Термин “последовательность идентификатора образца” и “индекс образца” означает последовательность нуклеотидов, которая добавляется к целевому полинуклеотиду, причем эта последовательность идентифицирует источник целевого полинуклеотида (то есть образца, из которого происходит целевой полинуклеотид). На практике каждый образец маркируется другой последовательностью идентификатора образца (например, к каждому образцу присоединяется одна последовательность, а к разным образцам присоединяются различные последовательности), и маркированные тегами образцы объединяются. После секвенирования сборного образца последовательность идентификатора образца может использоваться для идентификации источника последовательностей. Последовательность идентификатора образца может присоединяться к 5'-концу полинуклеотида или 3'-концу полинуклеотида. В некоторых случаях часть последовательности идентификатора образца может находиться на 5'-конце полинуклеотида, а остальная часть последовательности идентификатора образца может находиться на 3'-конце полинуклеотида. Когда элементы имеют последовательности идентификаторов образцов на каждом конце, то вместе эти 3'- и 5'-последовательности идентификаторов образцов идентифицируют всю выборку. Во многих примерах последовательность идентификатора образца составляет лишь часть тех оснований, которые добавляются к целевому олигонуклеотиду.
Термин “последовательность идентификатора молекулы” означает последовательность нуклеотидов, которая добавляется к фрагментам нуклеиновой кислоты в образце с тем, что присоединенная последовательность нуклеотидов, одна или в сочетании с другими признаками фрагментов, например, их точками фрагментации, может использоваться для различения различных молекул фрагментов в образце или его части. Сложность популяции последовательностей идентификаторов молекул, используемых в какой-либо реализации, может варьироваться в зависимости от различных параметров, например, количества фрагментов в образце и/или количества образца, которое используется на следующей стадии. Например, в некоторых случаях последовательность идентификаторов молекул может быть низкой сложности (например, она может состоять из смеси от 8 до 1024 последовательностей). В других случаях последовательность идентификаторов молекул может быть высокой сложности (например, она может состоять от 1025 до 1 млн. и более последовательностей). В некоторых воплощениях популяция последовательностей идентификаторов молекул может содержать участок вырожденных оснований (DBR), содержащий один или несколько (например, по меньшей мере 2, по меньшей мере 3, по меньшей мере 4, по меньшей мере 5 или от 5 до 30 и более) нуклеотидов, выбранных из R, Y, S, W, K, M, B, D, H, V, N (по кодировке IUPAC) либо их вариантов. Как описано в US 8,741,606, последовательность идентификаторов молекул может состоять из последовательностей, которые не являются смежными. В некоторых воплощениях популяция последовательностей идентификаторов молекул может быть получена путем смешивания олигонуклеотидов с определенной последовательностью вместе. В этих воплощениях последовательность идентификаторов молекул у каждого из олигонуклеотидов может быть с коррекцией ошибок. В описанных здесь способах последовательность идентификаторов молекул может применяться для различения различных фрагментов в одной части исходного образца, которая была извлечена из исходного образца. Последовательности идентификаторов молекул могут применяться для различения фрагментов в сочетании с другими признаками фрагментов (например, концевыми последовательностями фрагментов, которые определяют точки фрагментации).
В настоящем изобретении термин “соответствует” в отношении прочтения последовательности, которое соответствует определенной (например, верхней или нижней) цепи фрагмента, относится к прочтению последовательности, полученному из этой цепи или ее продукта амплификации.
Термин “ковалентное связывание” относится к образованию ковалентной связи между двумя отдельными молекулами.
В настоящем изобретении термин “циркулирующая бесклеточная ДНК” относится к той ДНК, которая циркулирует в периферической крови пациента. Молекулы ДНК в бесклеточной ДНК могут иметь средний размер менее 1 тпо (например, в пределах от 50 до 500 п.о., от 80 до 400 п.о. или от 100 до 1000 п.о.), хотя могут присутствовать фрагменты со средним размером за пределами этого диапазона. Бесклеточная ДНК может содержать циркулирующую опухолевую ДНК (ctDNA), то есть опухолевую ДНК, свободно циркулирующую в крови больных раком, или циркулирующую фетальную ДНК (если субъектом является беременная женщина). БкДНК может быть сильно фрагментирована и в некоторых случаях может иметь средний размер фрагментов примерно 165-250 п.о. (Newman et al., Nat., 2014, 20: 548-54). БкДНК может быть получена путем центрифугирования цельной крови для удаления всех клеток, а затем выделения ДНК из оставшейся плазмы или сыворотки. Такие методы хорошо известны (например, см. Lo et al., Am J Hum Genet 1998, 62: 768-75). Циркулирующая бесклеточная ДНК является двухцепочечной, но ее можно сделать одноцепочечной путем денатурации.
В настоящем изобретении термин “добавление последовательностей адаптеров” относится к факту добавления последовательности адаптера к концам фрагментов в образце. Это можно сделать путем заполнения концов фрагментов с помощью полимеразы, добавления непарного A, а затем лигирования адаптера, содержащего выступающий T, с содержащими неспаренный A фрагментами.
В настоящем изобретении термин “UDP-глюкоза, модифицированная хемоселективной группой” относится к UDP-глюкозе, функционализированной, в особенности в положении 6-гидроксила, группой, способной участвовать в реакции 1,3-циклоприсоединения (или “клик-реакции”). К таким группам относятся азидогруппа и алкинил (например, циклооктин), хотя известны и другие (Kolb et al., 2001; Speers and Cravatt, 2004; Sletten and Bertozzi, 2009). Примером UDP-глюкозы, модифицированной хемоселективной группой, является UDP-6-N3-Glu, хотя известны и другие.
В настоящем изобретении термин “биотиновый компонент” означает такую аффинную метку-тег, которая включает биотин или аналог биотина типа детиобиотина, оксибиотина, 2-иминобиотина, диаминобиотина, биотинсульфоксида, биоцитина и т.п. Биотиновые компоненты связываются со стрептавидином со сродством не менее 10-8 М.
В настоящем изобретении термины “реакция циклоприсоединения” и “клик-реакция” применяются взаимозаменяемо в отношении реакции 1,3-циклоприсоединения между азидом и алкином с образованием пятичленного гетероцикла. В некоторых воплощениях алкин может быть деформирован (например, в кольце типа циклооктина), а реакция циклоприсоединения может проводиться в условиях отсутствия меди. Примерами алкинов, которые могут участвовать в реакции циклоприсоединения в отсутствие меди, являются дибензоциклооктин (DBCO) и дифтороктин (DIFO), хотя известны и другие группы. Например, см. Kolb et al. (Drug Discov Today 2003, 8: 1128-113); Baskin et al. (Proc. Natl. Acad. Sci., 2007, 104: 16793-16797); и Sletten et al. (Accounts of Chemical Research 2011, 44: 666-676) насчет обзора по такой химии.
В настоящем изобретении термин “носитель, который связывается с биотином” означает такой носитель (например, шарики, которые могут быть магнитными), который связан со стрептавидином или авидином, либо его функциональный эквивалент.
Термин “амплификация” в настоящем изобретении относится к получению одной или нескольких копий целевой нуклеиновой кислоты с использованием целевой нуклеиновой кислоты в качестве матрицы.
Термин “копии фрагментов” относится к продуктам амплификации, причем копия фрагмента может быть обратно комплементарна одной цепи фрагмента или иметь такую же последовательность, как и одна цепь фрагмента.
Термины “обогащать” и “обогащение” относятся к частичной очистке аналитов, обладающих определенным признаком (например, нуклеиновых кислот, содержащих гидроксиметилцитозин), от аналитов, не обладающих этим признаком (например, нуклеиновых кислот, не содержащих гидроксиметилцитозина). При обогащении концентрация аналитов, обладающих этим признаком (например, нуклеиновых кислот, содержащих гидроксиметилцитозин), обычно повышается по меньшей мере в 2 раза, по меньшей мере в 5 раз или по меньшей мере в 10 раз по сравнению с аналитами, не обладающими этим признаком. После обогащения по меньшей мере 10%, по меньшей мере 20%, по меньшей мере 50%, по меньшей мере 80% или по меньшей мере 90% аналитов в образце могут обладать признаком, используемым для обогащения. Например, по меньшей мере 10%, по меньшей мере 20%, по меньшей мере 50%, по меньшей мере 80% или по меньшей мере 90% молекул нуклеиновой кислоты в обогащенной композиции могут содержать цепь с одним или несколькими гидроксиметилцитозинами, которая подвергалась модификации с тем, чтобы она содержала метку захвата.
По всему описанию могут появляться и другие определения терминов.
Описание типичных воплощений
В настоящем изобретении предусмотрен способ секвенирования гидроксиметилированной бесклеточной ДНК. В некоторых воплощениях способ включает введение аффинной метки только в молекулы гидроксиметилированной ДНК в образце бкДНК; обогащение молекул ДНК, помеченных аффинной меткой; и секвенирование обогащенных молекул ДНК.
На фиг. 1A представлена одна реализация способа. Обращаясь к фиг. 1A, в некоторых воплощениях способ может включать: (а) добавление адаптерных последовательностей на концы бесклеточной ДНК (бкДНК), (b) инкубацию лигированной с адаптерами бкДНК с ДНК-β-глюкозилтрансферазой и UDP-глюкозой, модифицированной хемоселективной группой, при этом молекулы гидроксиметилированной ДНК в бкДНК метятся хемоселективной группой; (c) связывание биотинового компонента с хемоселективно модифицированной бкДНК по реакции циклоприсоединения; (d) обогащение биотинилированных молекул ДНК путем связывания продукта из стадии введения биотиновой метки (стадии c) с носителем, связывающимся с биотином; (e) амплификацию обогащенной ДНК с помощью праймеров, связывающихся с адаптерами; и (f) секвенирование амплифицированной ДНК с получением множества прочтений последовательности.
Как видно из фиг. 1A, в некоторых воплощениях способ не включает высвобождения биотинилированных молекул ДНК из носителя перед амплификацией (т.е. после стадии (d) перед стадией (е)), а в некоторых воплощениях стадия амплификации (d) может включать амплификацию обогащенной ДНК, связанной с носителем (с). Это может быть реализовано путем: i) промывки носителя (d) после того, как молекулы биотинилированной ДНК свяжутся с носителем; а затем ii) проведения реакции амплификации в присутствии носителя, без высвобождения биотинилированных молекул ДНК из носителя.
Также, как видно из фиг. 1A, стадия (a) может выполняться путем лигирования ДНК с универсальным адаптером, то есть таким адаптером, который лигируется с обоими концами фрагментов бкДНК. В некоторых случаях универсальный адаптер может быть получен путем лигирования Y-адаптера (или шпилькообразного адаптера) по концам бкДНК, получая при этом двухцепочечную молекулу ДНК, у которой верхняя цепь содержит последовательность 5'-тега, которая не такая же либо не комплементарна последовательности тега, введенного на 3'-конец этой цепи. Следует иметь в виду, что фрагменты ДНК, используемые на начальной стадии способа, не должны подвергаться амплификации и предварительной денатурации. Как видно из фиг. 1A, эта стадия может потребовать зачистки (то есть затупления) концов бкДНК с помощью полимеразы, введения непарного A во фрагменты, например, с помощью Taq-полимеразы, и лигирования Y-адаптера, содержащего неспаренный T, с содержащими непарный A фрагментами. Эта начальная стадия лигирования может выполняться на минимальном количестве бкДНК. Например, бкДНК, с которой лигируют адаптеры, может содержать менее 200 нг ДНК, например, от 10 пг до 200 нг, от 100 пг до 200 нг, от 1 нг до 200 нг или от 5 нг до 50 нг или менее 10000 (например, менее 5000, менее 1000, менее 500, менее 100 или менее 10) эквивалентов гаплоидного генома, в зависимости от генома. В некоторых воплощениях способ выполняется с использованием менее 50 нг бкДНК (что соответствует примерно 5 мл плазмы) или менее 10 нг бкДНК, что соответствует примерно 1 мл плазмы. Например, Newman et al. (Nat Med. 2014, 20: 548-54) получали библиотеки из 7-32 нг бкДНК, выделенной из 1-5 мл плазмы. Это эквивалентно 2121-9697 гаплоидным геномам (из расчета 3,3 пг на 1 гаплоидный геном). Адаптер, лигированный с бкДНК, может содержать молекулярный баркод для облегчения мультиплексирования и количественного анализа секвенируемых молекул. В частности, адаптер может быть “индексирован” в том смысле, что он содержит молекулярный баркод, который идентифицирует образец, с которым он был лигирован (что позволяет объединять образцы перед секвенированием). С другой стороны, адаптер может содержать случайный баркод или типа того. Такой адаптер можно лигировать с фрагментами, при этом практически каждый фрагмент, соответствующий определенной области, будет помечен другой последовательностью. Это позволит идентифицировать дубликаты при ПЦР и сосчитать молекулы.
На следующей стадии этой реализации способа молекулы гидроксиметилированной ДНК в бкДНК метятся хемоселективной группой, то есть такой группой, которая может участвовать в клик-реакции. Эта стадия может осуществляться путем инкубации лигированной с адаптером бкДНК с ДНК-β-глюкозилтрансферазой (например, с ДНК-β-глюкозилтрансферазой T4, которая коммерчески доступна от ряда поставщиков, хотя существуют и другие ДНК-β-глюкозилтрансферазы) и, например, UDP-6-N3-Glu (т.е. UDP-глюкозой, содержащей азид). Эта стадия может осуществляться по методике, адаптированной, к примеру, из US 2011/0301045 или Song et al. (Nat. Biotechnol., 2011, 29: 68-72).
Следующая стадия этой реализации способа включает присоединение биотинового компонента к хемоселективно модифицированной ДНК по реакции циклоприсоединения (клик-реакции). Эта стадия может осуществляться путем непосредственного добавления биотинилированного реагента, например, модифицированного дибензоциклооктином биотина в глюкозилтрансферазную реакцию по завершении этой реакции, то есть через подходящий промежуток времени (например, через 30 мин или более). В некоторых воплощениях биотинилированный реагент может иметь общую формулу B-L-X, где B означает биотиновый компонент, L - линкер, а X - группа, реагирующая с хемоселективной группой, введенной в бкДНК по реакции циклоприсоединения. В некоторых случаях линкер может сделать соединение более растворимым в водной среде и при этом может содержать полиэтиленгликолевый (ПЭГ) линкер или его эквивалент. В некоторых воплощениях добавляемое соединение может представлять собой дибензоциклооктин-PEGn-биотин, где n равно 2-10, например, 4. Дибензоциклооктин-ПЭГ4-биотин является относительно гидрофильным и растворяется в водном буфере до концентрации 0,35 мМ. Добавляемое на этой стадии соединение не обязательно должно содержать расщепляемую связь, например, может не содержать дисульфидную связь и т.д. На этой стадии реакция циклоприсоединения может быть между азидогруппой, введенной в гидроксиметилированную бкДНК, и алкинильной группой (например, группой дибензоциклооктина), связанной с биотиновым компонентом. Опять же, эта стадия может осуществляться по методике, адаптированной, к примеру, из US 2011/0301045 или Song et al. (Nat. Biotechnol., 2011, 29: 68-72).
Стадия обогащения в этом способе может осуществляться с использованием магнитных стрептавидиновых шариков, хотя можно использовать и другие носители. Как отмечено выше, обогащенные молекулы бкДНК (которые соответствуют молекулам гидроксиметилированной бкДНК) подвергают амплификации методом ПЦР, а затем секвенируют.
В этих воплощениях обогащенный образец ДНК можно амплифицировать с помощью одного или нескольких праймеров, гибридизующихся со введенными адаптерами (или их комплементами). В тех воплощениях, в которых применяются Y-адаптеры, лигированные с адаптерами нуклеиновые кислоты можно амплифицировать методом ПЦР с помощью двух праймеров: первого праймера, который гибридизуется с одноцепочечным участком верхней цепи адаптера, и второго праймера, который гибридизуется с комплементарной последовательностью одноцепочечного участка нижней цепи Y-адаптера (или адаптера типа шпильки после расщепления петли). Например, в некоторых воплощениях используемый Y-адаптер может иметь плечи P5 и P7 (их последовательности совместимы с платформой секвенирования фирмы Illumina), а продукты амплификации будут иметь последовательность P5 на одном конце и последовательности P7 на другом. Эти продукты амплификации можно подвергнуть гибридизации с секвенирующим субстратом фирмы Illumina и просеквенировать. В другом воплощении пара праймеров, используемых для амплификации, может иметь 3'-концы, которые гибридизуются с Y-адаптером, и 5'-концы, которые имеют последовательность P5 либо последовательность P7. В этом воплощении продукты амплификации также будут иметь последовательность Р5 на одном конце и последовательность P7 на другом. Эти продукты амплификации можно подвергнуть гибридизации с секвенирующим субстратом фирмы Illumina и просеквенировать. Эта стадия амплификации может осуществляться методом ПЦР с ограниченным количеством циклов (например, 5-20 циклов).
Стадия секвенирования может осуществляться любым удобным методом секвенирования следующего поколения и может давать по меньшей мере 10000, по меньшей мере 50000, по меньшей мере 100000, по меньшей мере 500000, по меньшей мере 1 млн., по меньшей мере 10 млн., по меньшей мере 100 млн. либо по меньшей мере 1 млрд. прочтений последовательности. В некоторых случаях прочтения являются прочтениями с парными концами. Следует иметь в виду, что праймеры, используемые для амплификации, могут быть совместимы с их применением в любой платформе секвенирования следующего поколения, в которой применяется элонгация праймеров, например, в методе обратимых терминаторов фирмы Illumina, методе пиросеквенирования фирмы Roche, секвенирования путем лигирования фирмы Life Technologies (платформа SOLiD), платформе Ion Torrent фирмы Life Technologies или методе отщепления флуоресцентных оснований фирмы Pacific Biosciences. Примеры таких методов описаны в следующих ссылках: Margulies et al. (Nature 2005, 437: 376-80); Ronaghi et al. (Analytical Biochemistry 1996, 242: 84-9); Shendure (Science 2005, 309: 1728); Imelfort et al. (Brief Bioinform. 2009, 10: 609-18); Fox et al. (Methods Mol Biol. 2009, 553: 79-108); Appleby et al. (Methods Mol Biol. 2009, 513: 19-39) English (PLoS One. 2012, 7:e47768) и Morozova (Genomics 2008, 92: 255-64), которые включены сюда путем ссылки для общего описания методов и конкретных стадий этих методов, включая все исходные материалы, реагенты и конечные продукты по каждой стадии.
В некоторых воплощениях секвенируемый образец может содержать пул молекул ДНК из нескольких образцов, причем нуклеиновые кислоты в образце имеют молекулярный баркод, указывающий на их источник. В некоторых воплощениях анализируемые нуклеиновые кислоты могут происходить из одного источника (например, одного организма, вируса, ткани, клетки, субъекта и т.п.), тогда как в других воплощениях образец нуклеиновой кислоты может представлять собой пул нуклеиновых кислот, выделенных из нескольких источников (например, пул нуклеиновых кислот из нескольких организмов, тканей, клеток, субъектов и т.п.), причем под “несколькими” подразумеваются два или больше. Так, в некоторых воплощениях образец нуклеиновой кислоты может содержать нуклеиновые кислоты из 2 и более источников, 3 и более источников, 5 и более источников, 10 и более источников, 50 и более источников, 100 и более источников, 500 и более источников, 1000 и более источников, 5000 и более источников, вплоть до 10000 и более источников. Молекулярные баркоды позволяют различать последовательности из разных источников после их анализа.
Прочтения последовательностей можно анализировать на компьютере, причем инструкции для выполнения изложенных ниже операций могут быть представлены в виде программного обеспечения, которое может быть записано на подходящем считываемом компьютером физическом носителе данных.
В некоторых воплощениях прочтения последовательностей можно анализировать для количественной оценки того, какие последовательности гидроксиметилированы в бкДНК. Это можно сделать, например, путем подсчета прочтений последовательностей или же подсчета количества исходных молекул до амплификации на основании их точек фрагментации и/или того, что они содержат одну и ту же последовательность индексатора. Для различения фрагментов известно применение молекулярных баркодов в сочетании с другими признаками фрагментов (например, концевыми последовательностями фрагментов, которые определяют точки разрыва). Молекулярные баркоды и типичные методы подсчета индивидуальных молекул описаны в Casbon (Nucl. Acids Res., 2011, 22 e81); Fu et al. (Proc Natl Acad Sci USA 2011, 108: 9026-31) и др. Молекулярные баркоды описаны в US 2015/0044687, US 2015/0024950, US 2014/0227705, US 8,835,358 и US 7,537,897, а также в ряде других публикаций.
В некоторых воплощениях вышеприведенными методами можно сравнивать два различных образца бкДНК. Различные образцы могут состоять из “экспериментального” образца, то есть представляющего интерес образца бкДНК, и “контрольного” образца бкДНК, с которым можно сравнить экспериментальный образец кДНК. Во многих воплощениях различные образцы получают от субъектов, причем один субъект является предметом интереса, например, пациент с заболеванием, а другой - контрольным субъектом, т.е. пациент без заболевания. Типичные пары образцов включают, к примеру, бкДНК от субъекта с заболеванием типа рака толстой кишки, молочной железы, простаты, легких, кожи либо инфицированного патогеном) и бкДНК от нормальных субъектов без заболевания, а также бкДНК из двух разных временных точек от одного и того же субъекта, например, до и после проведения терапии и пр.
Также предусмотрен способ идентификации профиля гидроксиметилирования, коррелирующего с фенотипом, например, заболеванием, состоянием или клиническим исходом и пр. В некоторых воплощениях этот способ может включать (a) выполнение вышеописанного способа на множестве образцов бкДНК, причем образцы бкДНК выделены от пациентов с известным фенотипом, например, заболеванием, состоянием или клиническим результатом, при этом определяется, какие последовательности гидроксиметилированы в бкДНК от каждого из пациентов; и (b) определение сигнатуры гидроксиметилирования, коррелирующей с фенотипом.
В некоторых воплощениях сигнатура гидроксиметилирования может быть диагностической (например, может давать диагноз заболевания или состояния либо типа или стадии заболевания или состояния и т.д.), прогностической (например, указывать на клинический результат, например, выживание или смерть во временных рамках) или тераностической (например, указывать, какое лечение будет наиболее эффективным).
Также предусмотрен способ анализа образцов от пациентов. В этом воплощении способ может включать: (a) идентификацию вышеописанным способом тех последовательностей, которые являются гидроксиметилированными в бкДНК пациента; (b) сравнение идентифицированных последовательностей с набором сигнатурных последовательностей, коррелирующих с фенотипом, например, заболеванием, состоянием или клиническим исходом и пр.; и (c) составление отчета, показывающего корреляцию с фенотипом. Это воплощение может дополнительно включать в себя постановку диагноза, прогноза или тераноза по результатам сравнения.
В некоторых воплощениях способ может включать составление отчета, как описано выше (электронная форма которого могла бы быть отправлена из другого места), и направление отчета врачу или другому медицинскому специалисту для определения того, что у пациента имеется фенотип (например, рак и т.п.), или для определения подходящей терапии для пациента. Отчет может использоваться в качестве диагностического средства для определения того, что у субъекта имеется заболевание, например, рак. В некоторых воплощениях способ может применяться, к примеру, для определения стадии или типа рака, для идентификации метастазирующих клеток или мониторинга реакции пациента на лечение.
В любых воплощениях отчет может быть отправлен в “удаленное место”, причем “удаленное место” означает другое место, чем то, в котором изучается изображение. К примеру, удаленное место может означать другое место (например, офис, лаборатория и т.д.) в том же городе, другое место в другом городе, другое место в другом штате, другое место в другой стране и т.д. При этом, когда один элемент обозначается как “удаленный” от другого, подразумевается, что два элемента могут находиться в одной и той же комнате, но раздельно, или же в разных комнатах или разных зданиях, и могут быть на расстоянии как минимум в одну милю, 10 миль или по меньшей мере 100 миль друг от друга. “Передача” информации означает передачу данных, представляющих эту информацию, в виде электрических сигналов через соответствующий канал связи (например, частную или общедоступную сеть). “Пересылка” элемента означает любой способ передачи этого элемента из одного места в другое, будь то физическая транспортировка этого элемента или иным образом (если это возможно), и включает, по крайней мере в случае данных, физическую транспортировку носителя, несущего данные, или передачу данных. Примеры коммуникационных носителей включают радио- или инфракрасные каналы передачи, а также сетевое подключение к другому компьютеру или сетевому устройству и интернет, в том числе по электронной почте, и передачу информации, записанной на веб-сайтах и т.п. В некоторых воплощениях отчет может проанализировать доктор или другой квалифицированный медицинский специалист, а составленное по результатам анализа изображения сообщение может быть отправлено пациенту, от которого был получен образец.
Также предусмотрен способ анализа образцов, включающий (a) определение вышеописанным способом, какие последовательности гидроксиметилированы в первом образце бкДНК и какие последовательности гидроксиметилированы во втором образце бкДНК, причем первый и второй образец бкДНК получены от одного и того же пациента в двух различных временных точках; и (b) сравнение профиля гидроксиметилирования у первого образца с профилем гидроксиметилирования у второго образца, чтобы установить, было ли изменение гидроксиметилирования с течением времени. Этот способ может быть количественным, а в некоторых воплощениях стадия сравнения (b) может включать сравнение уровня гидроксиметилирования одной или нескольких выбранных последовательностей. Стадия сравнения в этом способе может отражать изменения в гидроксиметилировании в ходе заболевания или при лечении заболевания.
Фенотипом пациента может быть любая наблюдаемая характеристика или признак субъекта, как-то заболевание, стадия заболевания, восприимчивость к заболеванию, прогноз заболевания, физиологическое состояние или реакция на терапию и т.п. Фенотип может быть результатом экспрессии гена у субъекта, а также влияния факторов окружающей среды и взаимодействий между ними, а также эпигенетических модификаций в последовательности нуклеиновых кислот.
Фенотип у субъекта можно охарактеризовать путем анализа бкДНК вышеописанным способом. Например, характеристика фенотипа у субъекта или индивида может включать выявление заболевания (включая предсимптоматическое выявление на ранней стадии), определение прогноза, диагноза или тераноза заболевания или определение стадии или течения заболевания. Характеристика фенотипа также может включать идентификацию подходящих методов лечения, эффективных для лечения определенных заболеваний и стадий заболеваний, прогнозирование и анализ вероятности прогрессирования заболевания, в частности повторности заболевания, распространения метастазов или рецидива заболевания. Фенотип также может означать клинически особый тип или подтип заболевания типа рака или опухоли. Определение фенотипа также может означать определение физиологического состояния или оценку расстройства органа или отторжения органа типа после трансплантации. Описанные здесь продукты и процессы позволяют оценивать субъекта на индивидуальной основе, что может обеспечить преимущества более эффективных и экономичных решений при лечении.
В некоторых воплощениях способ может применяться для идентификации сигнатуры, предсказывающей, будет ли субъект реагировать на лечение заболевания или расстройства.
Характеристика фенотипа может включать прогнозирование статуса восприимчивости/невосприимчивости у субъекта, причем восприимчивые поддаются лечению заболевания, а невосприимчивые - не поддаются лечению. Если сигнатура гидроксиметилирования у субъекта более точно совпадает с таковой у предыдущих субъектов, которые поддавались лечению, то субъекта можно характеризовать или прогнозировать как поддающегося лечению. Аналогично, если сигнатура гидроксиметилирования у субъекта более точно совпадает с таковой у предыдущих субъектов, которые не поддавались лечению, то субъекта можно характеризовать или прогнозировать как не поддающегося лечению. Лечение может быть для любого подходящего заболевания, расстройства или другого состояния. Способ может применяться при любых заболеваниях, при которых известна сигнатура гидроксиметилирования, коррелирующая со статусом восприимчивости/невосприимчивости.
В некоторых воплощениях фенотип включает заболевание типа тех, что перечислены ниже. Например, фенотип может включать наличие или вероятность возникновения опухоли, новообразования или рака. Выявление или определение рака с помощью описанных здесь продуктов или процессов включает, без ограничения, рак молочной железы, рак яичников, рак легких, рак толстой кишки, гиперпластические полипы, аденому, колоректальный рак, дисплазию в сильной степени, дисплазию в слабой степени, гиперплазию предстательной железы, рак простаты, меланому, рак поджелудочной железы, рак мозга (типа глиобластомы), гематологические неоплазии, гепатоцеллюлярную карциному, рак шейки матки, рак эндометрия, рак головы и шеи, рак пищевода, стромальные опухоли желудочно-кишечного тракта (GIST), почечно-клеточную карциному (RCC) или рак желудка. Колоректальный рак может представлять собой CRC Dukes B или Dukes C-D. Гематологическая неоплазия может представлять собой B-клеточную хроническую лимфоцитарную лейкемию, B-клеточную лимфому типа DLBCL, B-клеточную лимфому DLBCL типа зародышевых центров, B-клеточную лимфому DLBCL типа активированных B-клеток и лимфому Беркитта.
В некоторых воплощениях фенотип может означать предраковое состояние типа актинического кератоза, атрофического гастрита, лейкоплакии, эритроплазии, лимфоматоидного гранулематоза, прелейкемии, фиброза, цервикальной дисплазии, дисплазии шейки матки, пигментной ксеродермы, пищевода Барретта, колоректального полипа или другого аномального роста тканей или поражения, которое может превратиться в злокачественную опухоль. Трансформативные вирусные инфекции типа ВИЧ и ВПЧ также представляют фенотипы, которые можно оценивать данным способом.
Характеризуемый настоящим способом рак может представлять собой, без ограничения, карциному, саркому, лимфому или лейкемию, опухоль зародышевых клеток, бластому или другое раковое заболевание. Карциномы включают, без ограничения, эпителиальные неоплазии, плоскоклеточные неоплазии, плоскоклеточные карциномы, базально-клеточные неоплазии, базально-клеточные карциномы, переходно-клеточные папилломы и карциномы, аденомы и аденокарциномы (желез), аденомы, аденокарциномы, пластический линит, инсулиномы, глюкагономы, гастриномы, випомы, холангиокарциномы, гепатоцеллюлярные карциномы, аденоидные кистозные карциномы, карциноидные опухоли аппендикса, пролактиномы, онкоцитомы, аденомы из клеток Гюртле, почечно-клеточные карциномы, опухоли Гравитца, множественные эндокринные аденомы, эндометриоидные аденомы, неоплазии придатков кожи, мукоэпидермоидные неоплазии, кистозные, муцинозные и серозные неоплазии, цистаденомы, псевдомиксомы брюшной полости, протоковые, лобулярные и медуллярные неоплазии, неоплазии ацинарных клеток, комплексные эпителиальные неоплазии, опухоли Уортина, тимомы, специализированные гонадальные неоплазии, стромальные опухоли половых тяжей, текомы, гранулезоклеточные опухоли, арренобластомы, опухоли из клеток Сертоли-Лейдига, гломусные опухоли, параганглиомы, феохромоцитомы, невоидные опухоли и меланомы, меланоцитарный невус, злокачественные меланомы, меланомы, нодулярные меланомы, диспластический невус, лентигинозные меланомы, поверхностно-распространяющиеся меланомы и злокачественные акролентигинозные меланомы. Саркомы включают, без ограничения, опухоли Аскина, ботриоидные саркомы, хондросаркомы, саркомы Юинга, злокачественные гемангиоэндотелиомы, злокачественные шванномы, остеосаркомы, саркомы мягких тканей, в том числе альвеолярные мягкотканные саркомы, ангиосаркомы, филлоидные цистосаркомы, дерматофибросаркомы, десмоидные опухоли, десмопластические мелкокруглоклеточные опухоли, эпителиоидные саркомы, внескелетные хондросаркомы, внескелетные остеосаркомы, фибросаркомы, гемангиоперицитомы, гемангиосаркомы, саркомы Капоши, лейомиосаркомы, липосаркомы, лимфангиосаркомы, лимфосаркомы, злокачественные фиброзные гистиоцитомы, нейрофибросаркомы, рабдомиосаркомы и синовиальные саркомы. Лимфомы и лейкемии включают, без ограничения, хронические лимфоцитарные лейкемии/мелколимфоцитарные лимфомы, B-клеточные пролимфоцитарные лейкемии, лимфоплазмацитарные лимфомы (типа макроглобулинемии Вальденстрома), селезеночные лимфомы маргинальной зоны, плазмацитарные миеломы, плазмацитомы, болезни отложения моноклональных иммуноглобулинов, болезни тяжелой цепи, экстранодальные B-клеточные лимфомы маргинальной зоны, также известные как MALT-лимфомы, нодальные B-клеточные лимфомы маргинальной зоны (NMZL), фолликулярные лимфомы, лимфомы клеток мантии, диффузные крупно-В-клеточные лимфомы, медиастинальные (тимические) крупно-В-клеточные лимфомы, внутрисосудистые крупно-В-клеточные лимфомы, первичные эффузионные лимфомы, лимфомы/лейкемии Беркитта, T-клеточные пролимфоцитарные лейкемии, T-клеточные крупнозернистые лимфоцитарные лейкемии, агрессивные NK-клеточные лейкемии, Т-клеточные лейкемии/лимфомы взрослых, экстранодальные NK/Т-клеточные лимфомы назального типа, Т-клеточные лимфомы типа энтеропатии, гепатоспленические Т-клеточные лимфомы, бластные NK-клеточные лимфомы, грибовидный микоз/синдром Сезари, первичные кожные CD30-положительные Т-клеточные лимфопролиферативные заболевания, первичные кожные анапластические крупноклеточные лимфомы, лимфоматоидный папулез, ангиоиммунобластные Т-клеточные лимфомы, периферические Т-клеточные лимфомы, неустановленные, анапластические крупноклеточные лимфомы, классические лимфомы Ходжкина (с нодулярным склерозом, смешанноклеточный, со множеством лимфоцитов, с подавлением лимфоцитов или без подавления) и нодулярные лимфомы Ходжкина со множеством лимфоцитов. Опухоли зародышевых клеток включают, без ограничения, герминомы, дисгерминомы, семиномы, негерминоматозные опухоли зародышевых клеток, эмбриональные карциномы, эндодермальные синусовые опухоли, хориокарциномы, тератомы, полиэмбриомы и гонадобластомы. Бластомы включают, без ограничения, нефробластомы, медуллобластомы и ретинобластомы. Другие раковые заболевания, включают, без ограничения, губные карциномы, карциномы гортани, подглоточные карциномы, карциномы языка, карциномы слюнных желез, карциномы желудка, аденокарциномы, рак щитовидной железы (медуллярные и папиллярные карциномы щитовидной железы), почечные карциномы, карциномы почечной паренхимы, карциномы шейки матки, карциномы тела матки, карциномы эндометрия, карциномы хориона, карциномы яичек, карциномы мочевого пузыря, меланомы, опухоли головного мозга типа глиобластомы, астроцитомы, менингиомы, медуллобластомы и периферические нейроэктодермальные опухоли, карциномы желчного пузыря, бронхиальные карциномы, множественные миеломы, базалиомы, тератомы, ретинобластомы, хороидальные меланомы, семиномы, рабдомиосаркомы, краниофарингеомы, остеосаркомы, хондросаркомы, миосаркомы, липосаркомы, фибросаркомы, саркомы Юинга и плазмоцитомы.
В другом воплощении подлежащий анализу рак может представлять собой рак легких, включая немелкоклеточный рак легких и мелкоклеточный рак легких, в том числе мелкоклеточные карциномы (овсяноклеточный рак), смешанные мелкоклеточные/крупноклеточные карциномы и комбинированные мелкоклеточные карциномы, рак толстой кишки, рак молочной железы, рак простаты, рак печени, рак поджелудочной железы, рак мозга, рак почек, рак яичников, рак желудка, рак кожи, рак кости, рак желудка, рак молочной железы, рак поджелудочной железы, глиомы, глиобластомы, гепатоцеллюлярные карциномы, папиллярные почечные карциномы, плоскоклеточные карциномы головы и шеи, лейкемии, лимфомы, миеломы или солидные опухоли.
В других воплощениях рак может представлять собой острый лимфобластный лейкоз; острый миелоидный лейкоз; адренокортикальную карциному; связанное со СПИД раковое заболевание; связанную со СПИДом лимфому; анальный рак; рак аппендикса; астроцитому; атипичную тератоидную/рабдоидную опухоль; базально-клеточную карциному; рак мочевого пузыря; глиому ствола мозга; опухоль головного мозга (включая глиому ствола мозга, атипичные тератоидные/рабдоидные опухоли центральной нервной системы, эмбриональные опухоли центральной нервной системы, астроцитому, краниофарингиому, эпендимобластому, эпендимому, медуллобластому, медуллоэпителиому, паренхиматозные опухоли эпифиза промежуточной дифференцировки, супратенториальные примитивные нейроэктодермальные опухоли и пинеобластомы); рак молочной железы; бронхиальную опухоль; лимфому Беркитта; рак с неизвестным первичным очагом; карциноидную опухоль; карциному с неизвестным первичным очагом; атипичную тератоидную/рабдоидную опухоль центральной нервной системы; эмбриональную опухоль центральной нервной системы; рак шейки матки; детское раковое заболевание; хордому; хронический лимфоцитарный лейкоз; хроническую миелогенную лейкемию; хроническое миелопролиферативное заболевание; рак толстой кишки; колоректальный рак; краниофарингиому; кожную Т-клеточную лимфому; опухоль островковых клеток эндокринной поджелудочной железы; рак эндометрия; эпендимобластому; эпендимому; рак пищевода; эстезионейробластому; саркому Юинга; внечерепную опухоль зародышевых клеток; экстрагонадальную опухоль зародышевых клеток; внепеченочный рак желчных протоков; рак желчного пузыря; рак желудка; желудочно-кишечную карциноидную опухоль; опухоль стромальных клеток желудочно-кишечного тракта (GIST); гестационную трофобластную опухоль; глиому; трихоцитарную лейкемию; рак головы и шеи; рак сердца; лимфому Ходжкина; подглоточный рак; внутриглазную меланому; опухоль островковых клеток; саркому Капоши; рак почек; гистиоцитоз клеток Лангерганса; рак гортани; губной рак; рак печени; рак кости типа злокачественной фиброзной гистиоцитомы; медуллобластому; медуллоэпителиому; меланому; карциному клеток Меркеля; кожную карциному клеток Меркеля; мезотелиому; метастатический плоскоклеточный рак шеи с оккультным первичным очагом; рак ротовой полости; синдром множественной эндокринной неоплазии; множественную миелому; множественную миелому/плазмацитарную неоплазию; грибовидный микоз; миелодиспластический синдром; миелопролиферативную неоплазию; рак носовой полости; рак носоглотки; нейробластому; неходжкинскую лимфому; немеланомный рак кожи; немелкоклеточный рак легких; рак полости рта; рак ротовой полости; рак ротоглотки; остеосаркому; другую опухоль головного или спинного мозга; рак яичников; эпителиальный рак яичников; опухоль зародышевых клеток яичников; опухоль яичников с низким потенциалом злокачественности; рак поджелудочной железы; папилломатоз; рак околоносовых пазух; рак паращитовидной железы; рак таза; рак полового члена; рак глотки; паренхиматозную опухоль эпифиза промежуточной дифференцировки; пинеобластому; опухоль гипофиза; плазмацитарную неоплазию/множественную миелому; плевролегочную бластому; первичную лимфому центральной нервной системы (ЦНС); первичный гепатоцеллюлярный рак печени; рак простаты; рак прямой кишки; почечный рак; рак почек; почечно-клеточный рак; рак дыхательных путей; ретинобластому; рабдомиосаркому; рак слюнных желез; синдром Сезари; мелкоклеточный рак легких; рак тонкой кишки; саркому мягких тканей; плоскоклеточную карциному; плоскоклеточный рак шеи; рак желудка; супратенториальную примитивную нейроэктодермальную опухоль; Т-клеточную лимфому; рак яичек; рак горла; тимическую карциному; тимому; рак щитовидной железы; переходно-клеточный рак; переходно-клеточный рак почечной лоханки и мочеточников; трофобластную опухоль; рак мочеточников; рак уретры; рак матки; саркому матки; вагинальный рак; рак вульвы; макроглобулинемию Вальденстрома; или опухоль Вильма. Для характеристики этих и других видов рака могут применяться способы по изобретению. Таким образом, характеристика фенотипа может обеспечить диагностику, прогноз или тераноз одного из описанных здесь раковых заболеваний.
Фенотипом также может быть воспалительное заболевание, иммунное заболевание или аутоиммунное заболевание. Например, заболевание может представлять собой воспалительное заболевание кишечника (IBD), болезнь Крона (CD), язвенный колит (UC), воспаление тазовых органов, васкулит, псориаз, диабет, аутоиммунный гепатит, рассеянный склероз, миастению, диабет I типа, ревматоидный артрит, псориаз, системную красную волчанку (SLE), тиреоидит Хашимото, базедову болезнь, анкилозирующий спондилит, болезнь Шегрена, синдром CREST, склеродермию, ревматизм, отторжение органа, первичный склерозирующий холангит или сепсис.
Фенотип также может включать сердечно-сосудистые заболевания, как-то атеросклероз, застойная сердечная недостаточность, фиброатерома, инсульт или ишемия. Сердечно-сосудистое заболевание или состояние может означать высокое кровяное давление, стеноз, окклюзию сосудов или тромботическое явление.
Фенотип также может включать неврологические заболевания, как-то рассеянный склероз (MS), болезнь Паркинсона (PD), болезнь Альцгеймера (AD), шизофрения, биполярное расстройство, депрессия, аутизм, прионовые болезни, болезнь Пика, деменция, болезнь Хантингтона (HD), синдром Дауна, цереброваскулярные заболевания, энцефалит Расмуссена, вирусный менингит, нейропсихиатрическая системная красная волчанка (NPSLE), боковой амиотрофический склероз, болезнь Крейтцфельдта-Якоба, болезнь Герстмана-Штрауслера-Шейнкера, трансмиссивная спонгиозная энцефалопатия, ишемическо-реперфузионные повреждения (например, инсульт), травмы головного мозга, микробные инфекции или синдром хронической усталости. Фенотип также может означать состояние типа фибромиалгии, хронической невропатической боли или периферической невропатической боли.
Фенотип также может включать инфекционные заболевания, как-то бактериальные, вирусные или дрожжевые инфекции. Например, заболевание может представлять собой болезнь Уиппла, прионовое заболевание, цирроз, устойчивое к метициллину заражение золотистым стафилококком, ВИЧ, гепатит, сифилис, менингит, малярию, туберкулез или грипп. Для характеристики вирусных заболеваний можно определять вирусные белки типа частиц ВИЧ или HCV в пузырьках.
Фенотип также может включать перинатальные или связанные с беременностью заболевания (например, преэклампсию или преждевременные роды), метаболические заболевания типа метаболических заболеваний, связанных с метаболизмом железа. Например, характеристики дефицита железа можно анализировать гепцидин в пузырьках. Метаболическое заболевание также может быть представлено диабетом, воспалением или перинатальным заболеванием.
Коррелятивная “сигнатура” может представлять собой группу из 1, 2, 3, 4, 5, 6, 7, 8, 9 или 10 и более последовательностей, которые независимо друг от друга являются либо недогидроксиметилированными, либо гипергидроксиметилированными относительно контроля (например, “нормальной” бкДНК), причем в совокупности идентичность этих последовательностей и, необязательно, степень гидроксиметилирования в связи с этими последовательностями коррелирует с фенотипом.
Используемая в способе бкДНК может быть от млекопитающих, как-то быков, птиц, собак, лошадей, кошек, овец, свиней или приматов (включая людей и других приматов). В некоторых воплощениях у субъекта может быть уже существующее заболевание типа рака. С другой стороны, у субъекта может не быть никаких известных существующих заболеваний. Субъект также может быть не восприимчивым к существующему или прошлому лечению типа лечения рака. В некоторых воплощениях бкДНК может быть от беременной женщины. В некоторых воплощениях профиль гидроксиметилирования в фетальной фракции бкДНК может коррелировать с хромосомной аномалией у плода (например, анеуплоидией). В других воплощениях можно определить пол у плода по профилю гидроксиметилирования в фетальной фракции бкДНК и/или определить фетальную фракцию бкДНК.
Также предусмотрен способ, включающий: (a) получение образца, содержащего циркулирующую бесклеточную ДНК, (b) обогащение гидроксиметилированной ДНК в образце и (с) независимое определение содержания нуклеиновых кислот в обогащенной гидроксиметилированной ДНК, которые относятся к (то есть их последовательности соответствуют) каждому из одного или нескольких целевых локусов (например, по меньшей мере 1, по меньшей мере 2, по меньшей мере 3, по меньшей мере 4, по меньшей мере 5 или по меньшей мере 10 целевых локусов). Этот способ может дополнительно включать: (d) определение того, является ли одна или несколько последовательностей нуклеиновой кислоты в обогащенной гидроксиметилированной ДНК чрезмерно представленной или недостаточно представленной в обогащенной гидроксиметилированной ДНК относительно контроля. Идентичность тех нуклеиновых кислот, которые чрезмерно или недостаточно представлены в обогащенной гидроксиметилированной ДНК (а в некоторых случаях и степень, в которой эти нуклеиновые кислоты представлены чрезмерно или недостаточно в обогащенной гидроксиметилированной ДНК), может использоваться для получения диагноза, решения о лечении или прогноза. Например, в некоторых случаях анализ обогащенной гидроксиметилированной ДНК может идентифицировать сигнатуру, которая коррелирует с фенотипом, как изложено выше. В некоторых воплощениях содержание тех молекул нуклеиновой кислоты в обогащенной гидроксиметилированной ДНК, которые относятся к каждому из одного или нескольких целевых локусов (например, генов/интервалов, перечисленных ниже), можно определить методом qPCR, цифровой ПЦР, матриц, секвенирования или любым другим количественным методом.
В некоторых воплощениях диагностика, решение о лечении или прогноз может составлять диагностику рака. В этих воплощениях целевые локусы могут включать в себя один или несколько (например, по меньшей мере 1, по меньшей мере 2, по меньшей мере 3, по меньшей мере 4, по меньшей мере 5, по меньшей мере 10, по меньшей мере 15 или по меньшей мере 20) тел генов (т.е. транскрибируемых областей) из следующих: ABRACL, ADAMTS4, AGFG2, ALDH1A3, ALG10B, AMOTL1, APCDD1L-AS1, ARL6IP6, ASF1B, ATP6V0A2, AUNIP, BAGE, C2orf62, C8orf22, CALCB, CC2D1B, CCDC33, CCNL2, CLDN15, COMMD6, CPLX2, CRP, CTRC, DACH1, DAZL, DDX11L1, DHRS3, DUSP26, DUSP28, EPN3, EPPIN-WFDC6, ETAA1, FAM96A, FENDRR, FLJ16779, FLJ31813, GBX1, GLP2R, GMCL1P1, GNPDA2, GPR26, GSTP1, HMOX2, HOXC5, IGSF9B, INSC, INSL4, IRF7, KIF16B, KIF20B, LARS, LDHD, LHX5, LINC00158, LINC00304, LOC100128946, LOC100131234, LOC100132287, LOC100506963, LOC100507250, LOC100507410, LOC255411, LOC729737, MAFF, NPAS4, NRADDP, P2RX2, PAIP1, PAX1, PODXL2, POU4F3, PSMG1, PTPN2, RAG1, RBM14-RBM4, RDH11, RFPL3, RNF122, RNF223, RNF34, SAMD11, SHISA2, SIGLEC10, SLAMF7, SLC25A46, SLC25A47, SLC9A3R2, SORD, SOX18, SPATA31E1, SSR2, STXBP3, SYT11, SYT2, TCEA3, THAP7-AS1, TMEM168, TMEM65, TMX2, TPM4, TPO, TRAM1, TTC24, UBQLN4, WASH7P, ZNF284, ZNF423, ZNF444, ZNF800, ZNF850 и ZRANB2.
Например, в некоторых воплощениях можно независимо определить содержание нуклеиновых кислот, относящихся к каждому из одного или нескольких (например, по меньшей мере 1, по меньшей мере 2, по меньшей мере 3, по меньшей мере 4, по меньшей мере 5 или по меньшей мере 10) следующих тел генов: ZNF800, TMEM65, GNPDA2, ALG10B, CLDN15, TMEM168, ETAA1, AMOTL1, STXBP3, ZNF444, LINC00158, IRF7, SLC9A3R2, TRAM1 и SLC25A46, как показано на фиг. 12D.
В другом примере, в некоторых воплощениях можно независимо определить содержание нуклеиновых кислот, относящихся к каждому из одного или нескольких (например, по меньшей мере 1, по меньшей мере 2, по меньшей мере 3, по меньшей мере 4, по меньшей мере 5 или по меньшей мере 10) следующих тел генов: CLDN15, SLC25A47, ZRANB2, LOC10050693, STXBP3, GPR26, P2RX2, LOC100507410, LHX5, HOXC5, FAM96A, CALCB, RNF223, SHISA2 и SLAMF7, как показано на фиг. 12F.
В этих воплощениях целевые локусы могут включать в себя один или несколько (например, по меньшей мере 1, по меньшей мере 2, по меньшей мере 3, по меньшей мере 4, по меньшей мере 5, по меньшей мере 10 или по меньшей мере 15) следующих интервалов (представлена нумерация относительно эталонного генома hg19, который опубликован как GRCh37 в феврале 2009 г.): chr1:114670001-114672000, chr1:169422001-169424000, chr1:198222001-198224000, chr1:239846001-239848000, chr1:24806001-24808000, chr1:3234001-3236000, chr1:37824001-37826000, chr1:59248001-59250000, chr1:63972001-63974000, chr1:67584001-67586000, chr1:77664001-77666000, chr2:133888001-133890000, chr2:137676001-137678000, chr2:154460001-154462000, chr2:200922001-200924000, chr2:213134001-213136000, chr2:219148001-219150000, chr2:41780001-41782000, chr2:49900001-49902000, chr3:107894001-107896000, chr3:108506001-108508000, chr3:137070001-137072000, chr3:17352001-17354000, chr3:23318001-23320000, chr3:87312001-87314000, chr3:93728001-93730000, chr4:39342001-39344000, chr4:90790001-90792000, chr5:103492001-103494000, chr5:39530001-39532000, chr5:83076001-83078000, chr6:122406001-122408000, chr6:129198001-129200000, chr6:156800001-156802000, chr6:157286001-157288000, chr6:45304001-45306000, chr7:11020001-11022000, chr7:13364001-13366000, chr8:42934001-42936000, chr8:53686001-53688000, chr8:69672001-69674000, chr9:3496001-3498000 и chr9:88044001-88046000.
Например, в некоторых воплощениях можно независимо определить содержание нуклеиновых кислот, относящихся к каждому из одного или нескольких (например, по меньшей мере 1, по меньшей мере 2, по меньшей мере 3, по меньшей мере 4, по меньшей мере 5 или всех) следующих интервалов: chr4:90790001-90792000, chr6:45304001-45306000, chr5:103492001-103494000, chr7:11020001-11022000, chr2:49900001-49902000, chr2:137676001-137678000, chr3:87312001-87314000 и chr9:88044001-88046000, как показано на фиг. 12E.
В другом примере, в некоторых воплощениях можно независимо определить содержание нуклеиновых кислот, относящихся к каждому из одного или нескольких (например, по меньшей мере 1, по меньшей мере 2, по меньшей мере 3, по меньшей мере 4, по меньшей мере 5 или всех) следующих интервалов: chr4:90790001-90792000, chr6:45304001-45306000, chr1:169422001-169424000, chr1:67584001-67586000, chr5:103492001-103494000, chr3:87312001-87314000, chr2:219148001-219150000, chr1:198222001-198224000, chr8:53686001-53688000, chr1:239846001-239848000, chr3:23318001-23320000, chr6:122406001-122408000, chr9:3496001-3498000, chr1:24806001-24808000 и chr8:69672001-69674000, как показано на фиг. 12G.
Если диагноз составляет диагноз рака, то диагностика может включать указание тканевого типа рака, то есть представлен ли он раком легких, раком печени, раком поджелудочной железы и т.п.
Следует отметить, что стадия количественной оценки (c) может выполняться с применением различных методов. Например, как описано выше и ниже, определение может проводиться путем присоединения последовательностей идентификаторов молекул к обогащенным фрагментам, их секвенирования, а затем подсчета количества последовательностей идентификаторов молекул, связанных с прочтениями последовательностей, приуроченных к одному или нескольким локусам (например, см. US 2011/0160078). С другой стороны, количественное определение может осуществляться, к примеру, методом цифровой ПЦР (например, см. Kalinina et al., Nucleic Acids Research, 1997, 25 (10): 1999-2004) или гибридизации с матрицей.
В некоторых воплощениях образец бкДНК может подвергаться дополнительному анализу методом визуализации, описанным в Song et al. (Proc. Natl. Acad. Sci. 2016 113: 4338-43), который включен сюда путем ссылки. В этих воплощениях способ может включать (a) маркировку образца, содержащего бкДНК, путем: (i) добавления метки захвата на концы молекул ДНК в образце; и (ii) маркировку молекул, содержащих гидроксиметилцитозин, первым флуорофором; (b) иммобилизацию молекул ДНК, помеченных на стадии (a), на носителе; и (c) визуализацию индивидуальных молекул гидроксиметилированной ДНК на носителе. В некоторых воплощениях этот способ может включать (d) подсчет количества индивидуальных молекул, помеченных первым флуорофором, тем самым определяя количество молекул гидроксиметилированной ДНК в образце. В этих воплощениях первый флуорофор на стадии (a)(ii) вводится путем инкубации молекул ДНК с ДНК-β-глюкозилтрансферазой и UDP-глюкозой, модифицированной хемоселективной группой, при этом молекулы гидроксиметилированной ДНК ковалентно метятся хемоселективной группой, и связывания первого флуорофора с хемоселективно модифицированной ДНК по реакции циклоприсоединения. В некоторых воплощениях стадия (a)(i) может дополнительно включать добавление второго флуорофора к концам молекул ДНК в образце. В некоторых воплощениях стадия (a) после стадии (ii) может дополнительно включать (iii) маркировку молекул, содержащих метилцитозин, вторым флуорофором; а стадия (c) дополнительно включает визуализацию индивидуальных молекул метилированной ДНК на носителе. В этих воплощениях способ может включать (d) подсчет (i) количества индивидуальных молекул, помеченных первым флуорофором, и (ii) количества индивидуальных молекул, помеченных вторым флуорофором. В этих воплощениях способ может дополнительно включать (e) вычисление относительных количеств гидроксиметилированной ДНК и метилированной ДНК в образце. В некоторых воплощениях молекулы, содержащие метилцитозин, метятся вторым флуорофором путем инкубации продукта стадии (а)(ii) с метилцитозиндиоксигеназой, при этом метилцитозин превращается в гидроксиметилцитозин; инкубации ДНК, обработанной метилцитозиндиоксигеназой, с ДНК-β-глюкозилтрансферазой и UDP-глюкозой, модифицированной хемоселективной группой, при этом молекулы гидроксиметилированной ДНК ковалентно метятся хемоселективной группой; и связывания второго флуорофора с хемоселективно модифицированной ДНК по реакции циклоприсоединения.
В этом способе стадия (a) может дополнительно включать (iii) мечение молекул, содержащих метилцитозин, вторым флуорофором; а стадия (c) может включать визуализацию индивидуальных молекул геномной ДНК путем детектирования сигналов FRET (флуоресцентного резонансного переноса энергии), исходящих из первого или второго флуорофора (a)(ii) или (a)(iii), причем сигнал FRET указывает, что молекула содержит гидроксиметилцитозин и метилцитозин, которые проксимальны (близки) друг к другу. В этих воплощениях способ может включать определение того, содержит ли молекула проксимальный гидроксиметилцитозин и метилцитозин в одной и той же цепи. С другой стороны, способ может включать определение того, содержит ли молекула проксимальный гидроксиметилцитозин и метилцитозин на разных цепях.
Статус гидроксиметилцитозина/метилцитозина у генов/интервалов, перечисленных в таблицах 10A, 10B, 11A и 11B, можно исследовать с помощью матрицы зондов. Например, в некоторых воплощениях способ может включать прикрепление меток к молекулам ДНК, содержащим один или несколько нуклеотидов гидроксиметилцитозина и метилцитозина в образце бкДНК, причем нуклеотиды гидроксиметилцитозина метятся первой оптически детектируемой меткой (например, первым флуорофором), а нуклеотиды метицитозина метятся второй оптически детектируемой меткой (например, вторым флуорофором), которая отличается от первой метки, получая помеченный образец, и гибридизацию образца с матрицей зондов, причем матрица зондов содержит зонды по меньшей мере для 1, по меньшей мере 2, по меньшей мере 3, по меньшей мере 4, по меньшей мере 5, по меньшей мере 10 или по меньшей мере 20 генов или интервалов, перечисленных в таблицах 10A, 10B, 11A и 11B. В некоторых случаях матрица может содержать зонды для верхней цепи и зонды для нижней цепи, что позволяет детектировать помеченные верхние и нижние цепи независимо друг от друга.
В некоторых воплощениях способ может включать присоединение меток к молекулам ДНК, содержащим один или несколько нуклеотидов гидроксиметилцитозина и метилцитозина в образце бкДНК, причем нуклеотиды гидроксиметилцитозина метятся первой меткой захвата, а нуклеотиды метицитозина метятся второй меткой захвата, которая отличается от первой, получая помеченный образец; обогащение помеченных молекул ДНК; и секвенирование обогащенных молекул ДНК. Это воплощение способа может включать раздельное обогащение молекул ДНК, содержащих один или несколько гидроксиметилцитозинов, и молекул ДНК, содержащих один или несколько нуклеотидов метилцитозина. Мечение можно адаптировать из методов, описанных выше, либо из Song et al. (Proc. Natl. Acad. Sci. 2016, 113: 4338-43), используя метки захвата вместо флуоресцентных меток. Например, в некоторых воплощениях способ может включать инкубацию бкДНК (например, лигированной с адаптером бкДНК) с ДНК-β-глюкозилтрансферазой и UDP-глюкозой, модифицированной хемоселективной группой, при этом молекулы гидроксиметилированной ДНК в бкДНК ковалентно метятся хемоселективной группой; связывание первой метки захвата с хемоселективно модифицированной бкДНК через хемоселективную группу, например, по реакции циклоприсоединения; инкубацию продукта этой стадии с метилцитозиндиоксигеназой, ДНК-β-глюкозилтрансферазой и UDP-глюкозой, модифицированной хемоселективной группой; и связывание второй метки захвата с хемоселективно модифицированной ДНК через хемоселективную группу, например, по реакции циклоприсоединения.
В некоторых воплощениях стадия определения может проводиться относительно контроля. В частности, в некоторых воплощениях способ может включать определение того, является ли одна или несколько последовательностей нуклеиновых кислот в обогащенной гидроксиметилированной ДНК чрезмерно представленной относительно контроля и/или определение того, является ли одна или несколько последовательностей нуклеиновых кислот в обогащенной гидроксиметилированной ДНК недостаточно представленной относительно контроля. В некоторых воплощениях контрольные последовательности могут находиться в обогащенной гидроксиметилированной ДНК. В этих воплощениях контрольные последовательности могут находиться в том же образце, что и нуклеиновые кислоты, относящиеся к целевым локусам, но они не относятся к целевым локусам. В других воплощениях контрольные последовательности могут находиться в образце из (a), содержащем циркулирующую бесклеточную ДНК до обогащения по гидроксиметилированной ДНК. В других воплощениях контрольные последовательности могут находиться в образце из (a), содержащем циркулирующую бесклеточную ДНК после обогащения по гидроксиметилированной ДНК (то есть во фракции циркулирующей бесклеточной ДНК, не содержащей гидроксилиметилированной ДНК). В других воплощениях контрольные последовательности могут быть из другого образца. В других воплощениях определение может исходить из полученного эмпирически порога, полученного при анализе нескольких образцов.
Наборы
Настоящим изобретением также предусмотрены наборы, содержащие реагенты для практического применения способов, как описано выше. Данные наборы содержат один или несколько из компонентов, описанных выше. Например, в некоторых воплощениях набор может предназначаться для анализа бкДНК. В этих воплощениях набор может содержать ДНК-β-глюкозилтрансферазу, UDP-глюкозу, модифицированную хемоселективной группой; и адаптер, содержащий молекулярный баркод, как описано выше. В некоторых воплощениях адаптер может быть представлен Y-адаптером или шпилькообразным адаптером. В некоторых воплощениях набор также может содержать биотиновый компонент, причем биотиновый компонент реагирует с хемоселективной группой.
Различные компоненты набора могут находиться в отдельных контейнерах или же некоторые совместимые компоненты могут быть предварительно объединены в одном контейнере, если нужно.
В дополнение к вышеупомянутым компонентам данные наборы могут дополнительно включать инструкции по использованию компонентов набора для практического применения рассматриваемых способов, то есть инструкции по анализу образцов. Инструкции для практического применения рассматриваемых способов обычно записаны на подходящем носителе записи. Например, инструкции могут быть напечатаны на основе типа бумаги или пластика и пр. При этом инструкции могут находиться в наборах в виде вложенной листовки при маркировке контейнера из набора или его компонентов (т.е. связанной с упаковкой или субупаковкой) и т.д. В других воплощениях инструкции представлены в виде электронного файла для хранения данных, находящегося на подходящем считываемом компьютером носителе, например, CD-ROM, дискете и т.п. Еще в других воплощениях в наборе нет фактических инструкций, но представлены средства для получения инструкций из удаленного источника, например, через Интернет. Примером этого воплощения является набор, который включает в себя веб-адрес, где инструкции можно просматривать и/или из которого инструкции можно загрузить. Как и в случае с инструкциями, это средство для получения инструкций записано на подходящей основе.
Композиции
Настоящим изобретением также предусмотрены различные композиции, которые содержат продукты, полученные настоящим способом. В некоторых воплощениях композиции могут содержать циркулирующую бесклеточную ДНК, причем остатки гидроксиметилцитозина в ДНК модифицированы, содержа метку захвата. В этих воплощениях в композиции могут находиться обе цепи циркулирующей бесклеточной ДНК. В некоторых воплощениях ДНК может находиться в двухцепочечной форме. В других воплощениях ДНК может быть в одноцепочечной форме (например, если композиция была денатурирована, к примеру, при инкубации при повышенной температуре).
Как следует из описания в разделе методов настоящего изобретения, меткой захвата может служить биотиновый компонент (например, биотин) или хемоселективная группа (например, азидогруппа или алкинильная группа типа UDP-6-N3-Glu). В некоторых воплощениях композиция может дополнительно содержать: i) β-глюкозилтрансферазу и ii) UDP-глюкозу, модифицированную хемоселективной группой (например, UDP-6-N3-Glu). Эти молекулы не являются флуоресцентно мечеными или мечеными оптически детектируемой меткой.
В некоторых воплощениях бесклеточная гидроксиметилированная ДНК лигирована с адаптерами (то есть она была лигирована с адаптерами). В некоторых воплощениях ДНК может содержать адаптеры, например, двухцепочечные, Y- или шпилькообразные адаптеры, лигированные к обеим цепям на обоих концах.
В некоторых воплощениях композиция может быть обогащенной с тем, что по меньшей мере 10% (например, по меньшей мере 20%, по меньшей мере 50%, по меньшей мере 80% или по меньшей мере 90%) молекул нуклеиновой кислоты в композиции содержат один или несколько гидроксиметилцитозинов, модифицированных так, что они содержат метку захвата. В этих воплощениях композиция может дополнительно содержать в растворе копии бесклеточной гидроксиметилированной ДНК, которые были получены методом ПЦР. В этих воплощениях композиция может содержать популяцию продуктов ПЦР, в которой по меньшей мере 10% (например, по меньшей мере 20%, по меньшей мере 50%, по меньшей мере 80% или по меньшей мере 90%) продуктов ПЦР скопированы (прямо или косвенно) с гидроксиметилированной ДНК.
В некоторых воплощениях композиция может дополнительно содержать носитель (например, шарики типа магнитных шариков или другое твердое вещество), причем носитель и циркулирующая бесклеточная ДНК связаны друг с другом через метку захвата. Связывание может осуществляться через ковалентную связь или нековалентную связь. Отметим, что носитель может быть связан со стрептавидином, а метка захвата может быть связана с биотином.
Примеры
Далее аспекты настоящего изобретения станут более понятными в свете следующих примеров, которые никоим образом не следует воспринимать как ограничивающие объем настоящего изобретения.
Здесь приведен первый глобальный анализ гидроксиметилома в бкДНК. При раке легких наблюдалась характерная глобальная потеря бесклеточного 5hmC, тогда как при HCC и раке поджелудочной железы были идентифицированы значительные изменения бесклеточного 5hmC меньшего масштаба. При HCC проводилось поисковое исследование лонгитюдных образцов, которое показало, что бесклеточный 5hmC можно использовать для мониторинга лечения и рецидивов. Эти три типа рака проявляли разные профили бесклеточного гидроксиметилома, и мы смогли использовать алгоритмы машинного обучения с тренировкой по характеристикам бесклеточного 5hmC для прогнозирования трех типов рака с большой точностью. Предполагается, что профилирование бесклеточного 5hmC будет полезным инструментом для диагностики рака, а также других заболеваний, включая, без ограничения, нейродегенеративные заболевания, сердечно-сосудистые заболевания и диабет. Кроме того, общие рамки этого метода могут быть легко адаптированы для секвенирования других модификаций в бесклеточных нуклеиновых кислотах путем применения соответствующего химизма введения метки к модифицированным основаниям. Это позволит получить всесторонний и глобальный обзор генетических и эпигенетических изменений при различных заболеваниях и еще больше повысить возможности персонализированной диагностики.
Эти данные были получены с использованием low-input whole-genome cell-free 5hmC sequencing method (метода низкозатратного полногеномного секвенирования бесклеточного 5hmC), адаптированного из метода селективной химической маркировки, известного как “hMe-Seal” (например, см. Song et al., Nat. Biotechnol., 2011, 29, 68-72). hMe-Seal - надежный метод, в котором используется β-глюкозилтрансфераза (βGT) для избирательного мечения 5hmC биотином через модифицированную азидом глюкозу для извлечения содержащих 5hmC фрагментов ДНК для секвенирования (см. фиг. 5A). При стандартной процедуре hMe-Seal требуются микрограммы ДНК. В описанном здесь модифицированном подходе сначала лигировали бкДНК с секвенирующими адаптерами и избирательно метили 5hmC биотиновой группой. После захвата содержащей 5hmC бкДНК с помощью стрептавидиновых шариков создавали конечную библиотеку методом ПЦР прямо из гранул вместо элюирования захваченной ДНК. При этом сводится к минимуму потеря образца при очистке. Способ схематически представлен на фиг. 1A.
Материалы и методы
Сбор и обработка образцов
Образцы от здоровых субъектов получали из Гематологического центра Stanford. Пациентов с HCC и раком молочной железы набирали по протоколу, одобренному Наблюдательной комиссией Стэнфордского университета. Пациентов с раком легких, раком поджелудочной железы, GBM, раком желудка и колоректальным раком набирали по протоколу, одобренному Наблюдательной комиссией West China Hospital. Все привлеченные субъекты давали информированное согласие. Кровь собирали в покрытые ЭДТА флаконы Vacutainer. Из образцов крови получали плазму после центрифугирования при 1600×g в течение 10 мин при 4°C и 16000×g в течение 10 мин при 4°C. БкДНК экстрагировали с помощью набора Circulating Nucleic Acid Kit (Qiagen). Геномную ДНК из цельной крови экстрагировали с помощью набора DNA Mini Kit (Qiagen) и фрагментировали с помощью дцДНК-фрагментазы (NEB) в среднем до 300 пар оснований. ДНК определяли на флуориметре Qubit (Life Technologies). Бесклеточную РНК экстрагировали с помощью набора Plasma/Serum Circulating and Exosomal RNA Purification Kit (Norgen). Выделенную бесклеточную РНК дополнительно расщепляли с помощью ДНКаз Baseline-ZERO (Epicenter) и удаляли рРНК с помощью набора для удаления рРНК Ribo-Zero rRNA Removal Kit (Epicenter) по методике фирмы Clontech.
Получение добавляемого контрольного ампликона
Для получения добавляемого (внутреннего) контроля подвергали ПЦР-амплификации ДНК лямбда с помощью ДНК-полимеразы Taq (NEB) и очищали на шариках AMPure XP (Beckman Coulter) в виде неперекрывающихся ампликонов ~180 п.о. с помощью коктейля из dATP/dGTP/dTTP и одного из следующего: dCTP, dmCTP или 10% dhmCTP (Zymo)/90% dCTP. Последовательности праймеров: dCTP, прямой праймер: CGTTTCCGTTCTTCTTCGTC (SEQ ID NO: 1), обратный: TACTCGCACCGAAAATGTCA (SEQ ID NO: 2); dmCTP, прямой праймер: GTGGCGGGTTATGATGAACT (SEQ ID NO: 3), обратный: CATAAAATGCGGGGATTCAC (SEQ ID NO: 4); 10% dhmCTP/90% dCTP, прямой праймер: TGAAAACGAAAGGGGATACG (SEQ ID NO: 5), обратный: GTCCAGCTGGGAGTCGATAC (SEQ ID NO: 6).
Получение, мечение, захват и высокопроизводительное секвенирование 5hmC-библиотек
БкДНК (1-10 нг) или фрагментированную геномную ДНК из цельной крови (1 мкг) с добавленными контрольными ампликонами (0,001 пг каждого ампликона на 10 нг ДНК) подвергали репарации концов, 3'-аденилировали и лигировали с ДНК-баркодами (BioScientific) с помощью набора KAPA Hyper Prep Kit (Kapa Biosystems) в соответствии с инструкциями производителя. Лигированную ДНК инкубировали в 25 мкл раствора, содержащего 50 мМ буфера HEPES (рН 8), 25 мМ MgCl2, 100 мкМ UDP-6-N3-Glc (Active Motif) и 12,5 ед. βGT (Thermo) в течение 2 часов при 37°C. После этого прямо в реакционную смесь добавляли 2,5 мкл DBCO-PEG4-биотина (Click Chemistry Tools, 20 мМ в ДМСО) и инкубировали 2 часа при 37°C. Затем в реакционную смесь добавляли 10 мкг расщепленной ДНК спермы лосося (Life Technologies) и очищали ДНК на колонке Micro Bio-Spin 30 (Bio-Rad). Очищенную ДНК инкубировали с 0,5 мкл стрептавидиновых шариков M270 (Life Technologies), предварительно блокированных ДНК спермы лосося в буфере 1 (5 мМ трис pH 7,5, 0,5 мМ ЭДТА, 1М NaCl и 0,2% Tween 20) в течение 30 мин. После этого шарики отмывали 3 раза по 5 мин, каждый раз буфером 1, буфером 2 (буфер 1 без NaCl), буфером 3 (буфер 1 с рН 9) и буфером 4 (буфер 3 без NaCl). Все операции связывания и отмывки проводили при комнатной температуре с легким вращением. Затем шарики ресуспендировали в воде и подвергали ПЦР-амплификации с 14 (бкДНК) или 9 (геномная ДНК из цельной крови) циклами ПЦР с помощью ДНК-полимеразы Phusion (NEB). Продукты ПЦР очищали с помощью шариков AMPure XP. Отдельно получали вводные библиотеки методом ПЦР прямо из лигированной ДНК без мечения и захвата. Для технических повторов бкДНК от одного субъекта разделяли на две повторные пробы. Проводили секвенирование по спаренным концам в 75 п.о. на приборе NextSeq.
Обработка данных и анализ тел генов
Последовательности FASTQ совмещали с UCSC/hg19 с помощью Bowtie2 v2.2.5 и дополнительно фильтровали с помощью SAMtools 0.1.19 (view-f2-F1548-q30 и rmdup), получая уникальные недублированные соответствия в геноме. Прочтения по спаренным концам подвергали элонгации и преобразовывали в формат BedGraph, нормированный по общему количеству выровненных прочтений с помощью BedTools, а затем преобразовывали в формат BigWig с помощью BedGraphToBigWig из геномного браузера UCSC для визуализации в Integrated Genomics Viewer. Последовательности FASTQ также выравнивали с тремя добавленными контрольными последовательностями для оценки эффективности выделения. Добавленный контроль используется только для подтверждения успешного извлечения в каждом образце. hMRs идентифицировали с помощью MACS, используя необогащенную исходную ДНК в качестве фона и значения по умолчанию (порог отсечения значений p в 10-5). Геномные аннотации hMR проводили путем определения процента hMRs, перекрывающих каждую геномную область ≥1 bp. Метагенные профили получали с помощью NGS.plot. Количество FPKM 5hmC рассчитывали по числу фрагментов в каждом теле гена по RefSeq, полученных с помощью BedTools. При дифференциальном анализе исключали гены меньше 1 kb или относящиеся к хромосомам X и Y. Дифференциальный анализ геномного 5hmC проводили с помощью пакета Limma на языке R. Анализ GO проводили, используя DAVID Bioinformatics Resources с помощью GOTERM_BP_FAT. Тканеспецифическую экспрессию генов получали из BioGPS. Для графиков tSNE в качестве матрицы расстояний для tSNE использовали корреляцию Пирсона по FPKM 5hmC в теле генов для tSNE. MA-графики, иерархические кластеризации, tSNE, LDA и теплокарты выполняли на языке R.
Предсказание типа и стадии рака
Маркерные гены, специфичные к типам рака, выбирали по t-критерию Стьюдента между 1) одной раковой группой и здоровой группой, 2) одной раковой группой и другими раковыми образцами, 3) двумя различными раковыми группами. Затем проводили коррекцию Benjamini-Hochberg для необработанных значений p, а затем сортировали гены по значениям q. Отбирали верхние 5-20 генов с наименьшими значениями q в качестве набора признаков для обучения классификатора. Для более высокого разрешения идентифицировали DhMRs путем разбиения референтного генома (hg19) на окна по 2тпо in silico и вычисления значений FPKM 5hmC для каждого окна. Перед дальнейшим анализом отфильтровывали попадающие в черный список области генома, склонные давать артефактные сигналы по ENCODE. Для специфичных к типам рака DhMRs проводили коррекцию значений p по Benjamini-Hochberg при сравнении между каждым типом рака и здоровыми контролями по t-критерию Стьюдента. Для каждого типа рака отбирали верхние 2-10 DhMRs с наименьшими значениями q. На комплекте данных проводили анализ типа случайного леса и классификатора Mclust по гауссовской модели, используя ранее описанные признаки (тела генов и DhMRs). Классификаторы подвергали тренировке на образцах рака легких, рака поджелудочной железы, HCC и здоровых образцах. Параметры для метода случайного леса, включая случайное зерно и mtry (количество переменных, отбираемых случайным образом в качестве кандидатов при каждом разбиении), настраивали на наименьшую оценку ошибки out-of-bag, используя tuneRF в пакете randomForest R. Верхние 15 признаков с наибольшей важностью переменной наносили на графики. Проводили анализ на нормальной модели смеси, используя пакет Mclust R. Для обучения классификаторов Mclust на этой модели строили график байесовского информационного критерия (BIC) для визуализации эффективности классификации на различных мультипараметрических моделях смесей. По умолчанию для классификации Mclust была выбрана модель типа EEI (диагональ, одинаковый объем и форма) и модель типа EDDA (один компонент для каждого класса с одинаковой структурой ковариации между классами). Для усиления анализа проводили кросс-валидацию с одним пропуском (LOO) для метода случайного леса и классификатора Mclust с одинаковыми значениями параметров. Для кросс-валидации Mclust использоваи cvMclustDA в пакете Mclust R.
Конструирование библиотек бесклеточной РНК и высокопроизводительное секвенирование
Библиотеки бесклеточной РНК получали с помощью набора для приготовления библиотек ScriptSeq v2 RNA-Seq (Epicenter) по протоколу FFPE RNA с 19 циклами ПЦР-амплификации. Затем продукты ПЦР очищали с помощью шариков AMPure XP. Секвенирование по спаренным концам в 75 п.о. проводили на приборе NextSeq. Прочтения RNA-Seq сначала урезали с помощью Trimmomatic 0.33, а затем совмещали с помощью TopHat 2.0.14. Значения экспрессии RPKM получали с помощью CuffLinks 2.2.1, используя модели генов из RefSeq.
Результаты и обсуждение
Вышеописанным способом легко выявляется бесклеточный 5hmC в образцах, содержащих менее 10 нг бкДНК (например, 1-10 нг бкДНК). При добавлении пула ампликонов по 180 п.о., содержащих C, 5mC или 5hmC в бкДНК, было показано, что после извлечения при ПЦР на шариках обнаруживается только содержащая 5hmC ДНК (фиг. 5B). Этот результат подтвердился при секвенировании конечных библиотек, которые проявляли более чем 100-кратное обогащение прочтений, относительно добавленной контрольной 5hmC-ДНК (фиг. 1В). Кроме того, наш подход одинаково хорошо работал и с бкДНК, и с общей геномной ДНК (1 мкг геномной ДНК (гДНК) из цельной крови) (фиг. 1В). Конечные библиотеки бесклеточного 5hmC очень сложны, доля средних уникальных недублированных соответствий составляет 0,75 при легком секвенировании (в среднем 15 миллионов прочтений, ~0,5-кратный охват генома человека) (фиг. 5C-5D и таблица 1 ниже), однако технические повторные пробы хорошо воспроизводимы (фиг. 5E). В данных по последовательности идентифицировали обогащенные 5hmC участки (hMRs) пуассоновским методом. hMRs хорошо согласуются между техническими повторами и объединенным образцом: свыше 75% hMRs в объединенном образце являются общими для каждого из повторов (фиг. 5F), достигая стандарта ENCODE для ChIP-Seq. Эти результаты свидетельствуют, что профиль бесклеточного 5hmC легко и надежно определяется модифицированным методом hMe-Seal.
Таблица 1. Сводка по результатам секвенирования 5hmC
Образец | Тип образца | Общее количество прочтений | Количество уникальных прочтений | Доля уникальных прочтений |
10 | здоровая бкДНК | 20081973 | 15192613 | 0,76 |
11 | здоровая бкДНК | 19142986 | 14762956 | 0,77 |
27 | здоровая бкДНК | 21862078 | 16645192 | 0,76 |
35-1 § | здоровая бкДНК | 29132339 | 16742468 | 0,57 |
35-2 § | здоровая бкДНК | 28694218 | 17346511 | 0,60 |
36-1 § | здоровая бкДНК | 32202519 | 20996955 | 0,65 |
36-2 § | здоровая бкДНК | 31089686 | 20993595 | 0,68 |
38o | здоровая бкДНК | 20124203 | 15295376 | 0,76 |
38 | здоровая бкДНК | 20419287 | 15679281 | 0,77 |
39o | здоровая бкДНК | 22320662 | 17833176 | 0,80 |
Input † | исходная бкДНК | 38574253 | 25910419 | 0,67 |
35-blood | гДНК цельной крови | 44077590 | 31654982 | 0,72 |
36-blood | гДНК цельной крови | 40843066 | 29266169 | 0,72 |
Blood-input † | исходная гДНК цельной крови | 39138506 | 26455609 | 0,68 |
Lung293 | рак легких | 14172402 | 11470840 | 0,81 |
Lung323 | рак легких | 12269885 | 8916594 | 0,73 |
Lung324 | рак легких | 13313728 | 10058078 | 0,76 |
Lung395 | рак легких | 13589263 | 10092883 | 0,74 |
Lung417 | рак легких | 13212811 | 10109574 | 0,77 |
Lung418 | рак легких | 13103903 | 10420656 | 0,80 |
Lung419 | рак легких | 11949356 | 9704240 | 0,81 |
Lung492 | рак легких | 12563742 | 8885504 | 0,71 |
Lung493 | рак легких | 12930120 | 10479700 | 0,81 |
Lung496 | рак легких | 12267496 | 9657956 | 0,79 |
Lung512 | рак легких | 12934833 | 10483836 | 0,81 |
Lung513 | рак легких | 11310088 | 8304508 | 0,73 |
Lung514 | рак легких | 12895079 | 10264145 | 0,80 |
Lung515 | рак легких | 12132995 | 9406700 | 0,78 |
Lung517 | рак легких | 11766082 | 8857054 | 0,75 |
HCC150 | HCC | 15215190 | 11298385 | 0,74 |
HCC237 | HCC | 13439935 | 10109197 | 0,75 |
HCC241 | HCC | 16201676 | 12017320 | 0,74 |
HCC256 | HCC | 14579945 | 10728759 | 0,74 |
HCC260 | HCC | 13791503 | 10021911 | 0,73 |
HCC285 | HCC | 11522024 | 7662330 | 0,67 |
HCC290 | HCC | 13162465 | 9271065 | 0,70 |
HCC320 | HCC | 13462633 | 9696240 | 0,72 |
HCC341 | HCC | 11199473 | 6497400 | 0,58 |
HCC628 | HCC | 15365745 | 11759122 | 0,77 |
HCC324 | HCC | 12525818 | 9598812 | 0,77 |
HCC46 | HCC | 13121530 | 9237102 | 0,70 |
HCC73 | HCC | 13816686 | 10745247 | 0,78 |
HCC489 | HCC | 11446887 | 5575387 | 0,49 |
HCC195 | HCC | 11538777 | 7701351 | 0,67 |
HCC234 | HCC | 11960087 | 8468478 | 0,71 |
HCC626 | HCC | 13552712 | 11087605 | 0,82 |
HCC647 | HCC | 12491614 | 8590321 | 0,69 |
Pancreatic27 | рак поджелудочной железы | 9717087 | 8019436 | 0,83 |
Pancreatic68 | рак поджелудочной железы | 10457109 | 8374219 | 0,80 |
Pancreatic69 | рак поджелудочной железы | 10838005 | 8940883 | 0,82 |
Pancreatic75 | рак поджелудочной железы | 10197772 | 8452749 | 0,83 |
Pancreatic9 | рак поджелудочной железы | 14601356 | 11245279 | 0,77 |
Pancreatic15 | рак поджелудочной железы | 15240467 | 11923009 | 0,78 |
Pancreatic22 | рак поджелудочной железы | 13439343 | 10356395 | 0,77 |
GBM57 | GBM | 8799132 | 6455359 | 0,73 |
GBM58 | GBM | 8874810 | 7253089 | 0,82 |
GBM66 | GBM | 9795211 | 8073651 | 0,82 |
GBM76 | GBM | 8103209 | 6165341 | 0,76 |
Stomach1 | рак желудка | 14282633 | 10365849 | 0,73 |
Stomach2 | рак желудка | 17825012 | 12938872 | 0,73 |
Stomach3 | рак желудка | 16979690 | 12894400 | 0,76 |
Stomach4 | рак желудка | 21192604 | 15675499 | 0,74 |
Stomach8 | рак желудка | 14070772 | 8321549 | 0,59 |
Colon13 | колоректальный рак | 17352371 | 12517451 | 0,72 |
Colon16 | колоректальный рак | 15470656 | 11210513 | 0,72 |
Colon17 | колоректальный рак | 15101557 | 10590748 | 0,70 |
Colon19 | колоректальный рак | 18441208 | 12503926 | 0,68 |
BR5-1 § | рак молочной железы | 17826666 | 13542700 | 0,76 |
BR5-2 § | рак молочной железы | 17746176 | 13004851 | 0,73 |
BR7-1 § | рак молочной железы | 16963664 | 13160842 | 0,78 |
BR7-2 § | рак молочной железы | 15495003 | 12100951 | 0,78 |
BR13 | рак молочной железы | 21382473 | 16015986 | 0,75 |
BR14 | рак молочной железы | 18668112 | 14613260 | 0,78 |
HBV268 | HBV | 8730571 | 5106519 | 0,58 |
HBV334 | HBV | 11838111 | 7848078 | 0,66 |
HBV374 | HBV | 14896634 | 11099981 | 0,75 |
HBV397 | HBV | 12127855 | 8416798 | 0,69 |
HBV455 | HBV | 12796382 | 9001735 | 0,70 |
HBV640 | HBV | 10040349 | 6062886 | 0,60 |
HBV646 | HBV | 9665264 | 5002160 | 0,52 |
§ Технический повтор
† Необогащенная исходная ДНК
Секвенировали бесклеточный 5hmC от 8 здоровых лиц (таблицы 1 и 2). Также секвенировали 5hmC в гДНК из цельной крови от 2 лиц, так как лизированные клетки крови могут быть важным источником бесклеточной нуклеиновой кислоты. Полногеномные профили показали, что распределение бесклеточного 5hmC было почти идентичным у здоровых лиц и четко отличалось от распределения 5hmC и в цельной крови, и в исходной бкДНК (фиг. 6A). Предыдущие исследования 5hmC в тканях мыши и человека показали, что большая часть 5hmC в геноме находится в телах генов и проксимальных участках промоторов (Mellen et al., Cell 2012, 151: 1417-1430; Thomson, Genome Biol. 2012, 13, R93). Полногеномный анализ hMRs в наших данных по бкДНК показал, что большая часть (80%) является внутригенной с наибольшим обогащением в экзонах (соотношение наблюдаемые/ожидаемые, o/e = 7,29) и обеднением в межгенных участках (o/e = 0,46), что соответствует таковому в цельной крови (фиг. 6В-6С) и в других тканях. Известно, что обогащение 5hmC в телах генов коррелирует с транскрипционной активностью в таких тканях, как мозг и печень (например, см. Mellen et al., Cell, 2012, 151: 1417-1430; Thomson, Genome Biol., 2012, 13, R93). Чтобы определить, сохраняется ли это соотношение в бкДНК, мы проводили секвенирование бесклеточной РНК от одних и тех же лиц. При разбиении генов на 3 группы согласно их бесклеточной экспрессии и построении графиков усредненного профиля бесклеточного 5hmC вдоль тела генов (метагенный анализ) оказалось, что 5hmC концентрируется в телах генов и вокруг них у более сильно экспрессируемых генов (фиг. 1С). Эти результаты подтверждают, что бесклеточный 5hmC происходит из самых разных типов тканей и содержит информацию по другим тканям, чем кровь.
Таблица 2. Клиническая информация по здоровым образцам
Образец | Пол | Возраст |
10 | женский | 53 |
11 | женский | 66 |
27 | женский | 66 |
35 | мужской | 51 |
36 | мужской | 73 |
38o | женский | 70 |
38 | женский | 64 |
39o | женский | 49 |
Поскольку бесклеточный 5hmC в основном концентрируется во внутригенных участках, для сравнения бесклеточного гидроксиметилома с гидроксиметиломом цельной крови использовали количество генных фрагментов с 5hmC в 1 т.п.о. гена на 1 млн. картированных прочтений (FPKM). Так, беспристрастный анализ генного 5hmC методом t-распределенного стохастического вложения соседей (tSNE) показал четкое разделение между бесклеточными образцами и образцами цельной крови (фиг. 6D). С помощью пакета Limma (Ritchie et al., Nucleic Acids Res. 2015: 43, e47) было идентифицировано 2082 дифференцированно гидрометилированных гена между образцами цельной кровью и бесклеточными образцами (значения q, т.е. значения p с коррекцией по Benjamini-Hochberg <0,01, кратность отличий >2, фиг. 7A). А именно, проявлялась повышенная экспрессия 735 специфичных для крови обогащенных 5hmC генов в цельной крови по сравнению с 1347 обогащенными 5hmC генами, специфичными для бесклеточных образцов (p<2,2×10-16, t-критерий Уэлча) (фиг. 7В). В согласии с дифференциальной экспрессией, анализ по генной онтологии (GO) специфичных для крови обогащенных 5hmC генов идентифицировал главным образом процессы, связанные с клетками крови (фиг. 7C), тогда как анализ специфичных для бесклеточных образцов обогащенных 5hmC генов идентифицировал гораздо более разнообразные биологические процессы (фиг. 7D). Примеры обогащенных 5hmC генов, специфичных для цельной крови (FPR1, FPR2) и для бесклеточных образцов (GLP1R), представлены на фиг. 7E. В целом эти результаты подтверждают концепцию о том, что все ткани вносят свой 5hmC в бкДНК и что измерение этого является приближенным эквивалентом экспрессии генов.
Для изучения диагностического потенциала бесклеточного 5hmC этот метод применяли к секвенированию бкДНК у комплекта из 49 пациентов с первичным раком без лечения, включая 15 пациентов с раком легких, 10 с гепатоцеллюлярной карциномой (HCC), 7 с раком поджелудочной железы, 4 с глиобластомой (GBM), 5 с раком желудка, 4 с колоректальным раком, 4 с раком молочной железы (таблицы 3-9, ниже). Эти пациенты варьируются от ранней стадии рака до поздней стадии метастатического рака. При раке легких наблюдалась прогрессирующая глобальная потеря обогащения 5hmC с ранней стадии неметастатического рака легких до поздней стадии метастатического рака легких по сравнению со здоровой бкДНК, и постепенно она становилась похожей на необогащенную исходную бкДНК (фиг. 2A). Беспристрастный анализ тел генов методом tSNE также показал зависимый от стадии переход профиля при раке легких от здорового профиля к профилю, похожему на необогащенную исходную бкДНК (фиг. 8A). Примечательно, что даже образцы ранних стадий рака легких хорошо отделены от здоровых образцов (фиг. 8А). Явления глобального гипогидроксиметилирования также подтверждались по другим показателям. Во-первых, при метастатическом раке легких большинство дифференциальных генов (значения q<10-7, 1159 генов) проявляли зависимое от стадии истощение 5hmC по сравнению со здоровыми образцами (фиг. 2B). Во-вторых, метагенный профиль показал зависимое от стадии ослабление сигнала 5hmC из тел генов и сходство с необогащенной исходной бкДНК (фиг. 8B). В-третьих, отмечалось резкое снижение количества hMRs, идентифицированных при раке легких, особенно при метастатическом раке легких, по сравнению со здоровыми и другими раковыми образцами (фиг. 2C). Эти данные подтверждают зависимое от стадии глобальное падение уровня 5hmC в бкДНК при раке легких.
Таблица 3. Клиническая информация по образцам рака легких
Образец | Категория | TNM | Стадия | Пол | Возраст |
Lung395 | неметастатический рак легких | T4N2Mx | III | женский | 62 |
Lung419 | неметастатический рак легких | T1N2M0G2 | IIIa | женский | 53 |
Lung492 | неметастатический рак легких | T2N0M0 | I | мужской | 55 |
Lung493 | неметастатический рак легких | T1N3M0 | IV | женский | 66 |
Lung496 | неметастатический рак легких | T3N1M0 | IIIa | мужской | 68 |
Lung512 | неметастатический рак легких | - | - | женский | 67 |
Lung513 | неметастатический рак легких | T2N1M0 | I-II | мужской | 47 |
Lung514 | неметастатический рак легких | T2N0M0 | I-II | женский | 57 |
Lung515 | неметастатический рак легких | cT3N1M0 | IIIA | мужской | 52 |
Lung293 | метастатический рак легких | cT4N3M1a | IV | женский | 52 |
Lung323 | метастатический рак легких | TxN2M1 | IV | женский | 68 |
Lung324 | метастатический рак легких | TxNxM1 | IV | мужской | 56 |
Lung417 § | метастатический рак легких | - | - | мужской | 62 |
Lung418 | метастатический рак легких | TxN3Mx | IIIb-IV | мужской | 59 |
Lung517 | метастатический рак легких | cT4N2M1b | IV | мужской | 68 |
Все образцы - немелкоклеточного рака легких, если не указано иначе
§ Мелкоклеточный рак легких
Таблица 4. Клиническая информация по образцам HCC
Образец | Категория | TNM | Размер опухоли (см) | Пол | Возраст |
HBV268 | HBV | - | - | мужской | 36 |
HBV334 | HBV | - | - | женский | 55 |
HBV374 | HBV | - | - | женский | 45 |
HBV397 | HBV | - | - | женский | 51 |
HBV455 | HBV | - | - | женский | 66 |
HBV640 | HBV | - | - | женский | 49 |
HBV646 | HBV | - | - | мужской | 60 |
HCC150 | HCC до операции | pT1 pNX pMX | 3,1 § | мужской | 76 |
HCC256 | HCC до операции | pT1 pNX pMX | 15×9 | мужской | 80 |
HCC260 | HCC до операции | pT1 pNX pMX | 1,3 § | мужской | 68 |
HCC290 | HCC до операции | - | 10×13×18 | мужской | 68 |
HCC320 | HCC до операции | - | многоочаговая | женский | 70 |
HCC628 | HCC до операции | pT1 | 1,8 § | мужской | 43 |
HCC285 | HCC до операции | pT3N0M0 | 8 § | мужской | 73 |
HCC324 | HCC после операции | - | - | мужской | 73 |
HCC237 | HCC до операции | pT2 pNX pMX | 4,1 § | мужской | 52 |
HCC241 | HCC после операции | - | - | мужской | 52 |
HCC341 | HCC рецидив | - | 3×1,2 | мужской | 53 |
HCC195 | HCC до операции | pT1 pNX pM0 | - | мужской | 44 |
HCC234 | HCC до операции | - | 1,6 § | мужской | 44 |
HCC626 | HCC рецидив | pT1 pNX pM0 | 1,7×1,7×1,0 | мужской | 50 |
HCC647 | HCC после операции | - | - | мужской | 53 |
HCC46 | HCC до операции | pT2 pNX pMX | 2,8 § | мужской | 69 |
HCC73 | HCC после операции | - | - | мужской | 69 |
HCC398 | HCC впоследст. | - | - | мужской | 72 |
HCC489 | HCC рецидив | - | 2,2 § | мужской | 73 |
HCC - гепатоцеллюлярная карцинома;
HBV - вирус гепатита B
§ - по наибольшему размеру
Таблица 5. Клиническая информация по образцам рака поджелудочной железы
Образец | TNM | Стадия | Метастазы в органы | Пол | Возраст |
Pancreatic9 | T3N0M1 | IV | печень | мужской | 76 |
Pancreatic15 | T1N0M0 | IA | - | мужской | 64 |
Pancreatic22 | T4N1M0 | III | - | женский | 71 |
Pancreatic27 | T4N1M1 | IV | брюшная стенка, сальник | мужской | 55 |
Pancreatic68 | T3N0M1 | IV | печень | мужской | 63 |
Pancreatic69 | T3N0M0 | IIA | - | мужской | 66 |
Pancreatic75 | T3N0M0 | IIA | - | мужской | 54 |
Таблица 6. Клиническая информация по образцам GBM
Образец | Стадия | Пол | Возраст |
GBM57 | IV | женский | 52 |
GBM58 | IV | мужской | 71 |
GBM66 | IV | мужской | 81 |
GBM76 | IV | мужской | 59 |
GBM - глиобластома
Таблица 7. Клиническая информация по образцам рака желудка
Образец | TNM | Стадия | Пол | Возраст |
Stomach1 | T2N1M0 | IIa | мужской | 67 |
Stomach2 | T4aN3bM0 | IIIc | мужской | 54 |
Stomach3 | T1aN0M0 | Ia | мужской | 68 |
Stomach4 | T4bN0M0 | IIIb | мужской | 70 |
Stomach8 | T1bN0M0 | Ia | мужской | 65 |
Таблица 8. Клиническая информация по образцам колоректального рака
Образец | TNM | Стадия | Пол | Возраст |
Colon13 | T4N0M0 | II | мужской | 54 |
Colon16 | T3N0M0 | II | женский | 57 |
Colon17 | T4N0M1 | IV | мужской | 52 |
Colon19 | pT4N1M1 | IV | женский | 62 |
Таблица 9. Клиническая информация по образцам рака молочной железы
Образец | Размер опухоли (см) | Степень опухоли | Возраст |
BR5 | 2,5 | 2 | 54 |
BR7 | 1,2 | 1 | 71 |
BR13 | 1,0 | 2 | 58 |
BR14 | 1,9 | 1 | 61 |
Следует отметить, что глобальная потеря обогащения 5hmC в бкДНК, наблюдавшаяся при раке легких, не обусловлена несостоятельностью нашего метода обогащения, так как добавленный контроль во всех образцах, включая образцы рака легких, проявлял сильное обогащение содержащей 5hmC ДНК (фиг. 8C). Но это явление, уникальное для рака легких, которое не наблюдается при других исследованных раковых заболеваниях, о чем свидетельствует количество hMRs (фиг. 2C) и метагенные профили (фиг. 8B). Примеры обедненных 5hmC генов при раке легких представлены на фиг. 2D и фиг. 8D. В раковой ткани легких может быть низкий уровень 5hmC по сравнению с нормальной тканью легких, а легкие могут давать сравнительно большой вклад в бкДНК. Весьма вероятно, что рак легких, особенно метастатической рак легких, вызывает высвобождение больших количеств гипогидроксиметилированной гДНК в бкДНК, эффективно разбавляя бкДНК и приводя к истощению 5hmC в бесклеточном фонде 5hmC. С другой стороны, гипогидроксиметилирование бкДНК может возникать из-за гипогидроксиметилирования гДНК в крови, наблюдаемого у пациентов с метастатическим раком легким, как сообщалось недавно. В целом эти результаты показывают, что секвенирование бесклеточного 5hmC может использоваться для раннего выявления рака легких, а также для мониторинга прогрессирования и метастазирования рака легких.
Что касается HCC, то секвенировали бесклеточный 5hmC от 7 пациентов с инфекцией вирусом гепатита B (HBV), так как большинство случаев HCC являются следствием заражения вирусным гепатитом (таблица 4). Беспристрастный анализ уровня 5hmC в генах методом tSNE показал, что отмечается постепенное изменение бесклеточного 5hmC при переходе от здоровых к HBV, а затем к HCC, что отражает развитие заболевания (фиг. 3A). Специфичные для HCC дифференциальные гены (значения q<0,001, кратность отличий > 1,41, 1006 генов) способны отделить образцы HCC от здоровых и большей части образцов HBV (фиг. 3B). Можно идентифицировать и обогащенные, и обедненные HCC-специфичные гены при сравнении с другими образцами бкДНК (фиг. 3B), а обогащенные гены (379 генов) проявляли повышенную экспрессию в тканях печени по сравнению с обедненные генами (637 генов) (значения p<2,2×10-16, t-критерий Уэлча) (фиг. 9A), что согласуется с пермиссивным действием 5hmC на экспрессию генов. Примером HCC-специфичных генов, обогащенных 5hmC, является AHSG, секретируемый белок, который сильно экспрессируется в печени (фиг. 3C и фиг. 9B-9C), а примером HCC-специфичных генов, обедненных 5hmC, является MTBP, который, как сообщалось, ингибирует распространение и метастазирование HCC и подавляется в тканях HCC (фиг. 3D, а также данные из фиг. 5D). В целом эти результаты указывают на модель, в которой вирусная инфекция и развитие HCC ведут к постепенному повреждению ткани печени и повышению присутствия ДНК печени в крови.
Для дальнейшего изучения потенциала бесклеточного 5hmC для мониторинга лечения и прогрессирования заболевания продолжали обследовать 4 пациентов с HCC. Этим пациентам проводилась хирургическая резекция, после которой у 3 из них наблюдались рецидивы заболевания (таблица 4). Анализ серийных образцов плазмы у этих пациентов (до операции; после операции; и рецидивы) методом tSNE показал, что образцы «после операции» кластеризуются со здоровыми образцами, а образцы рецидивов кластеризуются с HCC (фиг. 3Е). Такая картина проявлялась и по изменениям FPKM 5hmC у AHSG и MTBP (фиг. 3C-3D). В качестве примера использования бесклеточного 5hmC для отслеживания лечения и прогрессирования HCC использовали линейный дискриминантный анализ (LDA) для сведения линейной комбинации HCC-специфичных дифференциальных генов (фиг. 3B) в одно значение (показатель HCC), которое наилучшим образом отделяет HCC до операции от здоровых и образцов HBV. Затем рассчитывали показатель HCC для образцов после операции и рецидивов HCC и оказалось, что показатель HCC может точно отслеживать состояния лечения и рецидивов (фиг. 5E). В целом эти результаты показывают, что секвенирование бесклеточного 5hmC является мощным инструментом для выявления HCC, а также мониторинга результатов лечения и рецидивов заболевания.
Также было обнаружено, что рак поджелудочной железы вызывает резкие изменения бесклеточного гидроксиметилома даже у некоторых пациентов с ранней стадией рака поджелудочной железы (таблица 5). Подобно HCC, рак поджелудочной железы ведет к появлению генов как с повышенным, так и с пониженным уровнем 5hmC по сравнению со здоровыми лицами (значение q<0,01, кратность отличий > 2, 713 генов) (фиг. 10A). Примеры специфичных для рака поджелудочной железы генов, обогащенных и обедненных 5hmC по сравнению с другими образцами бкДНК, представлены на фиг. 6B-6E. Результаты свидетельствуют, что секвенирование бесклеточного 5hmC может быть потенциально важным для раннего выявления рака поджелудочной железы.
Несмотря на большой интерес к использованию бкДНК в качестве “жидкой биопсии” для выявления рака, оказалось, что трудно идентифицировать происхождение раковой бкДНК, а тем самым и местоположение опухоли. Наши результаты показали, что анализ бесклеточного 5hmC может решить эту проблему, так как анализ методом tSNE всех 7 типов рака показал, что рак легких, HCC и рак поджелудочной железы проявляют четкие сигнатуры и их можно легко отделить друг от друга и от здоровых образцов (фиг. 4A). Другие 4 типа рака проявляли сравнительно небольшие изменения по сравнению со здоровыми образцами. При использовании других признаков типа участков промоторов (на 5 т.п.о. выше от сайта начала транскрипции (TSS)) проявлялась аналогичная картина (фиг. 11A). Отметим, что ни один конкретный тип рака, который был исследован, не был похожим на профиль цельной крови (фиг. 11В), свидетельствуя о том, что загрязнение клетками крови не является значительным источником вариаций. Все пациенты в этой группе примерно того же возраста, что и здоровые лица (фиг. 11C и таблица 2-9), поэтому возраст вряд ли является мешающим фактором. Не наблюдался и групповой эффект (фиг. 11D).
Для дальнейшего изучения способности 5hmC в бкДНК служить биомаркером для прогнозирования типа рака использовали два широко применяемых метода машинного обучения - модель нормальной смеси и метод случайного леса. Прогнозирование было сосредоточено на HCC, раке поджелудочной железы, неметастатическом и метастатическом раке легких. На основании трех правил (см. ниже) было идентифицировано 90 генов (таблица 10), у которых средний уровень 5hmC в телах генов может отличаться между раковыми и здоровыми группами или между самими раковыми группами.
Таблица 10A. Набор из 90 генов, который использовался для прогнозирования рака по признаку тела гена
ASF1B | GLP2R | C2orf62 | SPATA31E1 | SLAMF7 | INSC |
LINC00304 | LOC100507410 | DUSP26 | IRF7 | RNF34 | AUNIP |
TTC24 | ADAMTS4 | TPM4 | DUSP28 | RNF122 | SLC9A3R2 |
LOC255411 | ATP6V0A2 | SYT2 | COMMD6 | POU4F3 | SYT11 |
RFPL3 | KIF16B | SHISA2 | EPPIN-WFDC6 | CPLX2 | SIGLEC10 |
FLJ31813 | RAG1 | SLC25A46 | FLJ16779 | ZNF284 | GBX1 |
PAIP1 | PTPN2 | APCDD1L-AS1 | SOX18 | ZNF850 | C8orf22 |
ZNF800 | TMEM168 | GMCL1P1 | CLDN15 | RDH11 | ZNF423 |
PODXL2 | ABRACL | LOC100507250 | NRADDP | BAGE | EPN3 |
THAP7-AS1 | GSTP1 | CTRC | TRAM1 | ALDH1A3 | PSMG1 |
MAFF | AMOTL1 | IGSF9B | CC2D1B | HOXC5 | LHX5 |
FENDRR | LOC100128946 | PAX1 | TPO | CRP | LOC100131234 |
KIF20B | NPAS4 | STXBP3 | ARL6IP6 | TMEM65 | ETAA1 |
GNPDA2 | ALG10B | DAZL | LINC00158 | TMX2 | RBM14-RBM4 |
SORD | HMOX2 | LDHD | ZNF444 | AGFG2 | DHRS3 |
При втором анализе с использованием другого метода были идентифицированы тела генов, перечисленных в таблице 10B, как прогностические для рака.
Таблица 10B. Набор из 40 верхних генов, который использовался для прогнозирования рака по признаку тела гена
CLDN15 | SLC25A47 | ZRANB2 | LOC100506963 | STXBP3 | GPR26 |
P2RX2 | LOC100507410 | LHX5 | HOXC5 | FAM96A | CALCB |
RNF223 | SHISA2 | SLAMF7 | PAX1 | DACH1 | LOC100128946 |
ASF1B | KIF16B | SSR2 | LARS | DHRS3 | CCDC33 |
GMCL1P1 | COMMD6 | SPATA31E1 | ABRACL | SAMD11 | UBQLN4 |
TCEA3 | SYT2 | INSL4 | RAG1 | CCNL2 | CRP |
DDX11L1 | LOC729737 | WASH7P | LOC100132287 |
Целевые локусы при анализе вышеописанным способом могут включать одно или несколько (например, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 или больше, например, 15 или больше либо 20 или больше) тел генов из приведенных в таблице 10A и/или 10B, как показано выше.
Наряду с телом гена, 5hmC в некодирующих участках вполне мог бы служить биомаркером при прогнозировании типа рака. Был разработан другой набор признаков путем исследования каждого из окон по 2 т.п.о. по всему геному и идентификации дифференциальных hMRs (DhMRs) для каждого типа рака. Было идентифицировано 17 маркерных DhMRs для четырех отдельных групп рака (таблица 11A).
Таблица 11A. Набор из 17 DhMRs, который использовался для прогнозирования рака по признаку DhMR
chr9:88044001-88046000 | chr1:63972001-63974000 | chr1:114670001-114672000 |
chr2:133888001-133890000 | chr1:37824001-37826000 | chr8:53686001-53688000 |
chr2:49900001-49902000 | chr5:103492001-103494000 | chr2:137676001-137678000 |
chr2:200922001-200924000 | chr2:41780001-41782000 | chr3:137070001-137072000 |
chr7:11020001-11022000 | chr4:90790001-90792000 | chr3:93728001-93730000 |
chr3:87312001-87314000 | chr6:45304001-45306000 |
При втором анализе с использованием другого метода были идентифицированы DhMRs, перечисленные в таблице 11B, как прогностические для рака.
Таблица 11B. Набор из 36 верхних DhMRs, который использовался для прогнозирования рака по признаку DhMR
chr4:90790001-90792000 | chr6:45304001-45306000 | chr1:169422001-169424000 |
chr1:67584001-67586000 | chr5:103492001-103494000 | chr3:87312001-87314000 |
chr2:219148001-219150000 | chr1:198222001-198224000 | chr8:53686001-53688000 |
chr1:239846001-239848000 | chr3:23318001-23320000 | chr6:122406001-122408000 |
chr9:3496001-3498000 | chr1:24806001-24808000 | chr8:69672001-69674000 |
chr2:49900001-49902000 | chr3:107894001-107896000 | chr8:42934001-42936000 |
chr3:17352001-17354000 | chr6:157286001-157288000 | chr3:108506001-108508000 |
chr4:39342001-39344000 | chr6:129198001-129200000 | chr3:137070001-137072000 |
chr1:59248001-59250000 | chr5:83076001-83078000 | chr3:93728001-93730000 |
chr2:213134001-213136000 | chr5:39530001-39532000 | chr1:3234001-3236000 |
chr1:37824001-37826000 | chr6:156800001-156802000 | chr7:13364001-13366000 |
chr1:77664001-77666000 | chr2:154460001-154462000 | chr2:41780001-41782000 |
Целевые локусы при анализе вышеописанным способом могут включать один или несколько (например, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 или больше, например, 15 или больше либо 20 или больше) DhMRs из приведенных в таблице 11A и/или 11B, как показано выше.
Два алгоритма машинного обучения подвергали обучению, используя 90 генов либо 17 DhMRs в качестве признака, и оценивали точность прогноза при кросс-валидации с одним пропуском (LOO). Предиктор на основе модели нормальной смеси (Mclust) давал ошибку при кросс-валидации LOO в 10% и 5% при использовании тела гена и DhMR в качестве признака, соответственно (фиг. 4B и фиг. 12A-12B). При снижении размерности по Mclust проявлялись четкие границы между группами (фиг. 12C). Предиктор типа случайного леса давал ошибку при кросс-валидации LOO в 5% и 0% при использовании тела гена и DhMR в качестве признака, соответственно (фиг. 4B). При различных типах рака наблюдались разные профили 5hmC по нескольким DhMRs с высокой важностью переменных при прогнозировании на модели случайного леса (фиг. 12D-12E). Наконец, для оценки степени согласия между различными моделями прогнозирования использовали каппа-коэффициент Коэна. Все комбинации проявляли высокое согласие (каппа Коэна ~0,9) при сравнении между классификаторами и по сравнению с фактической классификацией (фиг. 4C). На фиг. 12F и 12G представлена важность переменной для тел генов и DhMRs, полученная другим методом. Эти результаты свидетельствуют, что бесклеточный 5hmC может применяться для диагностики и выявления стадии рака.
Специалистам в данной области должно быть понятно, что, хотя изобретение и было описано выше в виде предпочтительных воплощений, оно не ограничивается ими. Различные признаки и аспекты вышеописанного изобретения могут применяться индивидуально или совместно. Кроме того, хотя изобретение было описано в контексте его реализации в конкретной среде и для конкретных применений (например, анализа бкДНК), специалистам в данной области должно быть понятно, что его применимость не ограничивается этим, и оно может выгодно применяться в самых разных средах и реализациях, в которых нужно исследовать гидроксиметилирование. Соответственно, приведенная ниже формула изобретения должна восприниматься с учетом всей полноты и сущности изложенного здесь изобретения.
--->
СПИСОК ПОСЛЕДОВАТЕЛЬНОСТЕЙ
<110> THE BOARD OF TRUSTEES OF THE LELAND STANFORD JUNIOR UNIVERSITY
<120> NONINVASIVE DIAGNOSTICS BY SEQUENCING 5 HYDROXYMETHYLATED
CELL-FREE DNA
<130> STAN-1318WO
<150> 62/319,702
<151> 2016-04-07
<150> 62/444,122
<151> 2017-01-09
<150> 62/461,712
<151> 2017-02-21
<160> 6
<170> PatentIn version 3.5
<210> 1
<211> 20
<212> DNA
<213> artificial sequence
<220>
<223> synthetic oligonucleotide
<400> 1
cgtttccgtt cttcttcgtc 20
<210> 2
<211> 20
<212> DNA
<213> artificial sequence
<220>
<223> synthetic oligonucleotide
<400> 2
tactcgcacc gaaaatgtca 20
<210> 3
<211> 20
<212> DNA
<213> artificial sequence
<220>
<223> synthetic oligonucleotide
<400> 3
gtggcgggtt atgatgaact 20
<210> 4
<211> 20
<212> DNA
<213> artificial sequence
<220>
<223> synthetic oligonucleotide
<400> 4
cataaaatgc ggggattcac 20
<210> 5
<211> 20
<212> DNA
<213> artificial sequence
<220>
<223> synthetic oligonucleotide
<400> 5
tgaaaacgaa aggggatacg 20
<210> 6
<211> 20
<212> DNA
<213> artificial sequence
<220>
<223> synthetic oligonucleotide
<400> 6
gtccagctgg gagtcgatac 20
<---
Claims (49)
1. Способ секвенирования гидроксиметилированной бесклеточной ДНК (бкДНК), включающий:
(a) добавление адаптерных последовательностей на концы бкДНК;
(b) инкубацию лигированной с адаптерами бкДНК с ДНК-β-глюкозилтрансферазой и UDP-глюкозой, модифицированной хемоселективной группой, при этом происходит ковалентное мечение молекул гидроксиметилированной ДНК в бкДНК хемоселективной группой;
(c) присоединение биотинового компонента к хемоселективно модифицированной бкДНК по реакции циклоприсоединения;
(d) обогащение биотинилированных молекул ДНК путем связывания продукта из стадии (c) с носителем, связывающимся с биотином;
(e) амплификацию обогащенной ДНК с помощью праймеров, связывающихся с адаптерами; и
(f) секвенирование амплифицированной ДНК с получением множества прочтений последовательности,
причем способ не включает высвобождения биотинилированных молекул ДНК из носителя после стадии (d), перед стадией (e).
2. Способ анализа образцов, включающий:
(a) идентификацию гидроксиметилированных последовательностей в образце бесклеточной ДНК (бкДНК) пациента путем:
(i) добавления адаптерных последовательностей на концы бкДНК;
(ii) инкубации лигированной с адаптерами бкДНК с ДНК-β-глюкозилтрансферазой и UDP-глюкозой, модифицированной хемоселективной группой, при этом происходит ковалентное мечение молекул гидроксиметилированной ДНК в бкДНК хемоселективной группой;
(iii) присоединения биотинового компонента к хемоселективно модифицированной бкДНК по реакции циклоприсоединения;
(iv) обогащения биотинилированных молекул ДНК путем связывания продукта из стадии (iii) с носителем, связывающимся с биотином;
(v) амплификации обогащенной ДНК с помощью праймеров, связывающихся с адаптерами; и причем способ не включает высвобождения биотинилированных молекул ДНК из носителя после стадии (iv), перед стадией (v);
(vi) секвенирования амплифицированной ДНК с получением множества прочтений последовательности, и
(vi) идентификации гидроксиметилированных последовательностей в прочтениях последовательности;
(b) сравнение идентифицированных гидроксиметилированных последовательностей с набором сигнатурных гидроксиметилированных последовательностей, коррелирующих с фенотипом; и
(c) составление отчета, показывающего корреляцию с фенотипом.
3. Способ по п. 2, при этом захватная метка включает биотиновый компонент.
4. Способ по п. 3, при этом захватная метка вводится по остаткам гидроксиметилцитозина в бкДНК на стадии (a)(ii) способом, включающим: инкубацию лигированной с адаптерами бкДНК с ДНК-β-глюкозилтрансферазой и UDP-глюкозой, модифицированной хемоселективной группой, при этом хемоселективная группа ковалентно связывается с остатками 5hmC в бкДНК; и проведение реакции биотинового компонента с хемоселективной группой, получая биотинилированную, гидроксиметилированную бкДНК.
5. Способ по п. 4, при этом бкДНК подвергается амплификации на стадии (a)(iv) с помощью праймеров, связывающихся с адаптерами.
6. Способ по п. 5, дополнительно включающий, после стадии (a)(iii) и перед стадией (a)(iv), отмывку носителя и постановку реакции амплификации, содержащей носитель, без высвобождения биотинилированных молекул ДНК из носителя.
7. Способ по п. 4, при этом UDP-глюкоза, модифицированная хемоселективной группой, включает UDP-6-N3-Glu, биотиновый компонент включает биотин, модифицированный дибензоциклооктином, а носитель включает авидин или стрептавидин.
8. Способ по п. 2, при этом фенотипом является заболевание, состояние или клинический исход.
9. Способ по п. 2, при этом стадия (a)(vi) является количественной.
10. Способ по п. 9, при этом стадия (a) дополнительно включает определение уровня гидроксиметилирования у каждой идентифицированной гидроксиметилированной последовательности, получая первый профиль гидроксиметилирования, включающий уровень гидроксиметилирования у каждой идентифицированной последовательности.
11. Способ по п. 10, дополнительно включающий получение второго образца бкДНК от пациента в другой момент времени и повторение стадии (a) со вторым образцом, получая второй профиль гидроксиметилирования.
12. Способ по п. 11, дополнительно включающий сравнение второго профиля гидроксиметилирования с первым профилем гидроксиметилирования для выявления изменений в гидроксиметилировании с течением времени.
13. Способ по п. 12, при этом сравнение приводит к получению карты изменений гидроксиметилирования в ходе заболевания или при лечении заболевания.
14. Способ по п. 10, при этом набор сигнатурных последовательностей гидроксиметилирования включает карту целевых локусов в контрольном профиле гидроксиметилирования, а стадия (b) включает сравнение уровня гидроксиметилирования для каждой гидроксиметилированной последовательности с уровнем гидроксиметилирования в соответствующем целевом локусе.
15. Способ по п. 14, дополнительно включающий определение того, является ли каждая идентифицированная гидроксиметилированная последовательность по уровню гидроксиметилирования чрезмерно представленной или недостаточно представленной относительно уровня гидроксиметилирования в соответствующем целевом локусе.
16. Способ по п. 15, при этом способ дополнительно включает (e) получение диагноза, решения о лечении или прогноза, исходя из результатов по идентичности тех гидроксиметилированных последовательностей, которые чрезмерно или недостаточно представлены относительно соответствующих целевых локусов.
17. Способ по п. 16, при этом диагноз, решение о лечении или прогноз составляет диагностику рака.
18. Способ по п. 17, при этом целевые локусы включают в себя одно или несколько тел следующих генов: ABRACL, ADAMTS4, AGFG2, ALDH1A3, ALG10B, AMOTL1, APCDD1L-AS1, ARL6IP6, ASF1B, ATP6V0A2, AUNIP, BAGE, C2orf62, C8orf22, CALCB, CC2D1B, CCDC33, CCNL2, CLDN15, COMMD6, CPLX2, CRP, CTRC, DACH1, DAZL, DDX11L1, DHRS3, DUSP26, DUSP28, EPN3, EPPIN-WFDC6, ETAA1, FAM96A, FENDRR, FLJ16779, FLJ31813, GBX1, GLP2R, GMCL1P1, GNPDA2, GPR26, GSTP1, HMOX2, HOXC5, IGSF9B, INSC, INSL4, IRF7, KIF16B, KIF20B, LARS, LDHD, LHX5, LINC00158, LINC00304, LOC100128946, LOC100131234, LOC100132287, LOC100506963, LOC100507250, LOC100507410, LOC255411, LOC729737, MAFF, NPAS4, NRADDP, P2RX2, PAIP1, PAX1, PODXL2, POU4F3, PSMG1, PTPN2, RAG1, RBM14-RBM4, RDH11, RFPL3, RNF122, RNF223, RNF34, SAMD11, SHISA2, SIGLEC10, SLAMF7, SLC25A46, SLC25A47, SLC9A3R2, SORD, SOX18, SPATA31E1, SSR2, STXBP3, SYT11, SYT2, TCEA3, THAP7-AS1, TMEM168, TMEM65, TMX2, TPM4, TPO, TRAM1, TTC24, UBQLN4, WASH7P, ZNF284, ZNF423, ZNF444, ZNF800, ZNF850 и ZRANB2.
19. Способ по п. 18, при этом адаптерные последовательности содержат молекулярный баркод.
20. Способ по п. 19, при этом молекулярный баркод включает последовательность идентификатора образца и последовательность идентификатора молекулы.
21. Способ по п. 2, при этом перед стадией (a) в образец вносится композиция добавляемого контроля.
22. Способ по п. 21, при этом композиция добавляемого контроля включает три ампликона, синтезированных с помощью коктейля из dATP, dGTP, dTTP и (1) dCTP, (2) dmCTP или (3) dhmCTP и dCTP.
23. Набор для ковалентного мечения молекул гидроксиметилированной ДНК в бкДНК хемоселективной группой, включающий:
ДНК-β-глюкозилтрансферазу;
UDP-глюкозу, модифицированную хемоселективной группой;
адаптер, содержащий по меньшей мере один молекулярный баркод; и
добавляемый контроль, включающий три ампликона, синтезированных с помощью коктейля из dATP, dGTP, dTTP и (1) dCTP, (2) dmCTP или (3) dhmCTP и dCTP.
24. Набор по п. 23, при этом по меньшей мере один баркод включает последовательность идентификатора образца и последовательность идентификатора молекулы.
25. Образец, отсеквенированный согласно способу из п. 1,
включающий:
пул молекул бесклеточной ДНК, лигированной с адаптерами, которые получены из нескольких разных источников и содержат один или несколько модифицированных гидроксиметилцитозинов, содержащих захватную метку, причем молекулы ДНК дополнительно включают в себя молекулярные баркоды, указывающие на их источники и позволяющие отличить последовательности из разных источников после анализа; и
добавленный контроль, включающий три ампликона, синтезированных с помощью коктейля из dATP, dGTP, dTTP и (1) dCTP, (2) dmCTP или (3) dhmCTP и dCTP.
Applications Claiming Priority (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201662319702P | 2016-04-07 | 2016-04-07 | |
US62/319,702 | 2016-04-07 | ||
US201762444122P | 2017-01-09 | 2017-01-09 | |
US62/444,122 | 2017-01-09 | ||
US201762461712P | 2017-02-21 | 2017-02-21 | |
US62/461,712 | 2017-02-21 | ||
PCT/US2017/025735 WO2017176630A1 (en) | 2016-04-07 | 2017-04-03 | Noninvasive diagnostics by sequencing 5-hydroxymethylated cell-free dna |
Publications (3)
Publication Number | Publication Date |
---|---|
RU2018138848A RU2018138848A (ru) | 2020-05-12 |
RU2018138848A3 RU2018138848A3 (ru) | 2020-12-15 |
RU2742355C2 true RU2742355C2 (ru) | 2021-02-05 |
Family
ID=60000634
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2018138848A RU2742355C2 (ru) | 2016-04-07 | 2017-04-03 | Неинвазивная диагностика путем секвенирования 5-гидроксиметилированной бесклеточной днк |
Country Status (14)
Country | Link |
---|---|
US (7) | US10718010B2 (ru) |
EP (2) | EP3929290A1 (ru) |
JP (2) | JP7143221B2 (ru) |
CN (1) | CN109312399B (ru) |
AU (1) | AU2017246318B2 (ru) |
CA (1) | CA3019836A1 (ru) |
DK (1) | DK3440205T3 (ru) |
ES (1) | ES2882329T3 (ru) |
MX (1) | MX391039B (ru) |
PL (1) | PL3440205T3 (ru) |
PT (1) | PT3440205T (ru) |
RU (1) | RU2742355C2 (ru) |
SG (1) | SG11201808775PA (ru) |
WO (1) | WO2017176630A1 (ru) |
Families Citing this family (34)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010037001A2 (en) | 2008-09-26 | 2010-04-01 | Immune Disease Institute, Inc. | Selective oxidation of 5-methylcytosine by tet-family proteins |
EP3425065B1 (en) | 2011-12-13 | 2021-04-21 | Oslo Universitetssykehus HF | Methods and kits for detection of methylation status |
CN104955960A (zh) | 2012-11-30 | 2015-09-30 | 剑桥表现遗传学有限公司 | 用于修饰的核苷酸的氧化剂 |
WO2014191981A1 (en) | 2013-05-28 | 2014-12-04 | Ramot At Tel-Aviv University Ltd. | Detection of hydroxymethylcytosine bases |
US10184154B2 (en) | 2014-09-26 | 2019-01-22 | Mayo Foundation For Medical Education And Research | Detecting cholangiocarcinoma |
CN107532124B (zh) | 2015-03-27 | 2022-08-09 | 精密科学公司 | 检测食管疾病 |
EP3355939A4 (en) | 2015-09-30 | 2019-04-17 | Trustees of Boston University | MICROBIAL DEADMAN AND PASS CODE EMERGENCY STOP SWITCHES |
WO2019084489A1 (en) | 2017-10-27 | 2019-05-02 | Juno Diagnostics, Inc. | DEVICES, SYSTEMS AND METHODS FOR ULTRA-LOW VOLUMES LIQUID BIOPSY |
KR102768046B1 (ko) | 2018-01-08 | 2025-02-17 | 루드비히 인스티튜트 포 캔서 리서치 리미티드 | 시토신 변형의 중아황산염-유리 염기-해상도 식별 |
JP7206284B2 (ja) | 2018-02-14 | 2023-01-17 | ブルースター ジェノミクス, インコーポレイテッド | Dna、特にセルフリーdnaのエピジェネティック解析の方法 |
EP3762513A1 (en) | 2018-03-08 | 2021-01-13 | St. Johns University | Circulating serum cell-free dna biomarkers and methods |
DE202019005627U1 (de) | 2018-04-02 | 2021-05-31 | Grail, Inc. | Methylierungsmarker und gezielte Methylierungssondenpanels |
JP2021527436A (ja) * | 2018-06-22 | 2021-10-14 | ブルースター ジェノミクス, インコーポレイテッド | 起源組織を割り当てるための無細胞核酸サンプルのヒドロキシメチル化分析および関連する使用方法 |
WO2020061380A1 (en) | 2018-09-19 | 2020-03-26 | Bluestar Genomics, Inc. | Cell-free dna hydroxymethylation profiles in the evaluation of pancreatic lesions |
EP3856903A4 (en) | 2018-09-27 | 2022-07-27 | Grail, LLC | METHYLATION MARKER AND TARGETED METHYLATION PROBE PANEL |
US20210380971A1 (en) | 2018-10-04 | 2021-12-09 | Bluestar Genomics, Inc. | Simultaneous, sequencing-based analysis of proteins, nucleosomes, and cell-free nucleic acids from a single biological sample |
JP7645178B2 (ja) * | 2018-10-19 | 2025-03-13 | コリア リサーチ インスティチュート オブ バイオサイエンス アンド バイオテクノロジー | Syt11抑制剤を有効成分として含む胃癌治療用組成物 |
CN109321647A (zh) * | 2018-10-26 | 2019-02-12 | 苏州森苗生物科技有限公司 | 标记组合物及羟甲基化核酸文库的构建方法 |
WO2020194057A1 (en) * | 2019-03-22 | 2020-10-01 | Cambridge Epigenetix Limited | Biomarkers for disease detection |
EP3947672A4 (en) * | 2019-03-27 | 2023-01-11 | Juno Diagnostics, Inc. | METHODS, SYSTEMS AND DEVICES FOR OPTIMIZED ULTRA-LOW VOLUME LIQUID BIOPSY |
WO2020263978A1 (en) * | 2019-06-25 | 2020-12-30 | Accuragen Holdings Limited | Methods and systems for disease detection |
US11211144B2 (en) | 2020-02-18 | 2021-12-28 | Tempus Labs, Inc. | Methods and systems for refining copy number variation in a liquid biopsy assay |
US11475981B2 (en) | 2020-02-18 | 2022-10-18 | Tempus Labs, Inc. | Methods and systems for dynamic variant thresholding in a liquid biopsy assay |
US11211147B2 (en) | 2020-02-18 | 2021-12-28 | Tempus Labs, Inc. | Estimation of circulating tumor fraction using off-target reads of targeted-panel sequencing |
WO2021198726A1 (en) * | 2020-03-30 | 2021-10-07 | Vilnius University | Methods and compositions for noninvasive prenatal diagnosis through targeted covalent labeling of genomic sites |
AU2021319150A1 (en) | 2020-07-30 | 2023-03-02 | Biomodal Limited | Compositions and methods for nucleic acid analysis |
JP2023539128A (ja) | 2020-08-19 | 2023-09-13 | マヨ ファウンデーション フォア メディカル エデュケーション アンド リサーチ | 非ホジキンリンパ腫の検出 |
US20220243278A1 (en) | 2021-01-29 | 2022-08-04 | Mayo Foundation For Medical Education And Research | Detecting the presence or absence of multiple types of cancer |
JP2024528704A (ja) * | 2021-07-20 | 2024-07-30 | フリーノム ホールディングス,インク. | 核酸シーケンシングにおける、改善された5-ヒドロキシメチル化シトシンの分解能のための組成物および方法 |
CN113528616A (zh) * | 2021-07-26 | 2021-10-22 | 深圳泰莱生物科技有限公司 | 一种捕获cfDNA5hmC片段的检测方法 |
CN115992203B (zh) * | 2022-07-26 | 2024-07-26 | 生工生物工程(上海)股份有限公司 | 一种全基因组羟甲基化捕获测序的文库构建方法 |
CN115491414A (zh) * | 2022-09-21 | 2022-12-20 | 安徽中医药大学第一附属医院(安徽省中医院) | 类风湿关节炎全转录组m6A甲基化修饰差异表达的综合分析方法 |
WO2024159053A1 (en) | 2023-01-25 | 2024-08-02 | Guardant Health, Inc. | Nucleic acid methylation profiling method |
US20240344141A1 (en) | 2023-03-22 | 2024-10-17 | Clearnote Health, Inc. | Cell-free dna analysis in the detection and monitoring of pancreatic cancer using a combination of features |
Family Cites Families (36)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5712126A (en) | 1995-08-01 | 1998-01-27 | Yale University | Analysis of gene expression by display of 3-end restriction fragments of CDNA |
US5948902A (en) | 1997-11-20 | 1999-09-07 | South Alabama Medical Science Foundation | Antisense oligonucleotides to human serine/threonine protein phosphatase genes |
US6287825B1 (en) | 1998-09-18 | 2001-09-11 | Molecular Staging Inc. | Methods for reducing the complexity of DNA sequences |
US20050233340A1 (en) | 2004-04-20 | 2005-10-20 | Barrett Michael T | Methods and compositions for assessing CpG methylation |
US20100273151A1 (en) * | 2004-05-28 | 2010-10-28 | Fred Hutchinson Cancer Research Center | Genome-wide analysis of palindrome formation and dna methylation |
EP2687608B1 (en) * | 2005-06-08 | 2017-02-08 | Millennium Pharmaceuticals, Inc. | Methods for the identification, assessment, and treatment of patients with cancer therapy |
WO2007087312A2 (en) | 2006-01-23 | 2007-08-02 | Population Genetics Technologies Ltd. | Molecular counting |
WO2008150432A1 (en) | 2007-06-01 | 2008-12-11 | 454 Life Sciences Corporation | System and meth0d for identification of individual samples from a multiplex mixture |
WO2009032167A1 (en) | 2007-08-29 | 2009-03-12 | Illumina Cambridge | Method for sequencing a polynucleotide template |
WO2010037001A2 (en) | 2008-09-26 | 2010-04-01 | Immune Disease Institute, Inc. | Selective oxidation of 5-methylcytosine by tet-family proteins |
EP2340314B8 (en) * | 2008-10-22 | 2015-02-18 | Illumina, Inc. | Preservation of information related to genomic dna methylation |
US20100323348A1 (en) | 2009-01-31 | 2010-12-23 | The Regents Of The University Of Colorado, A Body Corporate | Methods and Compositions for Using Error-Detecting and/or Error-Correcting Barcodes in Nucleic Acid Amplification Process |
US9976177B2 (en) * | 2009-04-01 | 2018-05-22 | Dxterity Diagnostics Incorporated | Chemical ligation dependent probe amplification (CLPA) |
WO2011025819A1 (en) * | 2009-08-25 | 2011-03-03 | New England Biolabs, Inc. | Detection and quantification of hydroxymethylated nucleotides in a polynucleotide preparation |
US8835358B2 (en) | 2009-12-15 | 2014-09-16 | Cellular Research, Inc. | Digital counting of individual molecules by stochastic attachment of diverse labels |
WO2011091146A1 (en) * | 2010-01-20 | 2011-07-28 | New England Biolabs, Inc. | Compositions, methods and related uses for cleaving modified dna |
WO2011127136A1 (en) | 2010-04-06 | 2011-10-13 | University Of Chicago | Composition and methods related to modification of 5-hydroxymethylcytosine (5-hmc) |
US20120034603A1 (en) * | 2010-08-06 | 2012-02-09 | Tandem Diagnostics, Inc. | Ligation-based detection of genetic variants |
ES2523140T3 (es) | 2010-09-21 | 2014-11-21 | Population Genetics Technologies Ltd. | Aumento de la confianza en las identificaciones de alelos con el recuento molecular |
US20120122087A1 (en) * | 2010-11-17 | 2012-05-17 | Weiwei Li | 5-Hydroxymethylcytosine as a biomarker for early detection, treatment and prognostic monitoring of cancer |
US9611510B2 (en) * | 2011-04-06 | 2017-04-04 | The University Of Chicago | Composition and methods related to modification of 5-methylcytosine (5-mC) |
HUE068153T2 (hu) | 2011-04-15 | 2024-12-28 | Univ Johns Hopkins | Biztonságos szekvenálási rendszer |
RS61631B1 (sr) | 2012-02-17 | 2021-04-29 | Hutchinson Fred Cancer Res | Kompozicije i postupci za preciznu identifikaciju mutacija |
EP4234713A3 (en) | 2012-03-20 | 2024-02-14 | University Of Washington Through Its Center For Commercialization | Methods of lowering the error rate of massively parallel dna sequencing using duplex consensus sequencing |
US9732390B2 (en) * | 2012-09-20 | 2017-08-15 | The Chinese University Of Hong Kong | Non-invasive determination of methylome of fetus or tumor from plasma |
EP3351661B1 (en) * | 2012-11-26 | 2025-05-21 | The University of Toledo | Methods for standardized sequencing of nucleic acids and uses thereof |
EP2971100A1 (en) * | 2013-03-13 | 2016-01-20 | Sequenom, Inc. | Primers for dna methylation analysis |
WO2015021282A1 (en) * | 2013-08-09 | 2015-02-12 | New England Biolabs, Inc. | Detecting, sequencing and/or mapping 5-hydroxymethylcytosine and 5-formylcytosine at single-base resolution |
US9932623B2 (en) * | 2013-08-19 | 2018-04-03 | Abbott Molecular Inc. | Nucleotide analogs |
KR102423682B1 (ko) * | 2014-01-07 | 2022-07-20 | 푼다시오 프리바다 인스티튜트 데 메디시나 프레딕티바 이 페르소나리짜다 델 카세르 | 이중 가닥 dna 라이브러리 제공 방법 및 메틸화된 시토신의 확인을 위한 시퀀싱 방법 |
EP3099822A4 (en) * | 2014-01-30 | 2017-08-30 | The Regents of the University of California | Methylation haplotyping for non-invasive diagnosis (monod) |
GB201405226D0 (en) * | 2014-03-24 | 2014-05-07 | Cambridge Entpr Ltd | Nucleic acid preparation method |
SG10201810862YA (en) * | 2014-06-06 | 2019-01-30 | Univ Cornell | Method for identification and enumeration of nucleic acid sequence, expression, copy, or dna methylation changes, using combined nuclease, ligase, polymerase, and sequencing reactions |
EP2975116B1 (en) * | 2014-07-16 | 2019-08-21 | Max-Delbrück-Centrum für Molekulare Medizin | Tgif2-induced reprogramming of hepatic cells to pancreatic progenitor cells and medical uses thereof |
WO2016153434A1 (en) * | 2015-03-24 | 2016-09-29 | Agency For Science, Technology And Research (A*Star) | Normalization methods for measuring gene copy number and expression |
US11162139B2 (en) | 2016-03-02 | 2021-11-02 | Shanghai Epican Genetech Co. Ltd. | Method for genomic profiling of DNA 5-methylcytosine and 5-hydroxymethylcytosine |
-
2017
- 2017-04-03 AU AU2017246318A patent/AU2017246318B2/en active Active
- 2017-04-03 PL PL17779593T patent/PL3440205T3/pl unknown
- 2017-04-03 JP JP2018553116A patent/JP7143221B2/ja active Active
- 2017-04-03 PT PT177795937T patent/PT3440205T/pt unknown
- 2017-04-03 DK DK17779593.7T patent/DK3440205T3/da active
- 2017-04-03 EP EP21167021.1A patent/EP3929290A1/en active Pending
- 2017-04-03 ES ES17779593T patent/ES2882329T3/es active Active
- 2017-04-03 CN CN201780031390.0A patent/CN109312399B/zh active Active
- 2017-04-03 CA CA3019836A patent/CA3019836A1/en active Pending
- 2017-04-03 RU RU2018138848A patent/RU2742355C2/ru active
- 2017-04-03 MX MX2018012156A patent/MX391039B/es unknown
- 2017-04-03 SG SG11201808775PA patent/SG11201808775PA/en unknown
- 2017-04-03 EP EP17779593.7A patent/EP3440205B1/en active Active
- 2017-04-03 WO PCT/US2017/025735 patent/WO2017176630A1/en active Application Filing
-
2018
- 2018-09-28 US US16/146,807 patent/US10718010B2/en active Active
-
2020
- 2020-04-14 US US16/848,498 patent/US20200248248A1/en not_active Abandoned
- 2020-04-14 US US16/848,482 patent/US20200283838A1/en active Pending
- 2020-04-14 US US16/848,515 patent/US20200248249A1/en not_active Abandoned
- 2020-04-15 US US16/849,067 patent/US20200277667A1/en not_active Abandoned
- 2020-04-15 US US16/848,989 patent/US20200277666A1/en active Pending
- 2020-04-15 US US16/849,071 patent/US20200299760A1/en not_active Abandoned
-
2022
- 2022-06-07 JP JP2022092184A patent/JP2022120007A/ja active Pending
Non-Patent Citations (4)
Title |
---|
Chiu R. W. K. et al. Non-invasive prenatal assessment of trisomy 21 by multiplexed maternal plasma DNA sequencing: large scale validity study, Bmj. - 2011, Т. 342, С. 7401. * |
Gromminger S. et al. Fetal aneuploidy detection by cell-free DNA sequencing for multiple pregnancies and quality issues with vanishing twins, Journal of clinical medicine, 2014, Т. 3, No. 3, С. 679-692. * |
Gromminger S. et al. Fetal aneuploidy detection by cell-free DNA sequencing for multiple pregnancies and quality issues with vanishing twins, Journal of clinical medicine, 2014, Т. 3, No. 3, С. 679-692. Chiu R. W. K. et al. Non-invasive prenatal assessment of trisomy 21 by multiplexed maternal plasma DNA sequencing: large scale validity study, Bmj. - 2011, Т. 342, С. 7401. Тетруашвили Н. К. и др. Неинвазивная пренатальная диагностика анеуплоидий методом секвенирования внеклеточной ДНК, Современный взгляд на проблему, Научно-практический журнал, 2014, номер 10, с. 4-7. * |
Тетруашвили Н. К. и др. Неинвазивная пренатальная диагностика анеуплоидий методом секвенирования внеклеточной ДНК, Современный взгляд на проблему, Научно-практический журнал, 2014, номер 10, с. 4-7. * |
Also Published As
Publication number | Publication date |
---|---|
AU2017246318A1 (en) | 2018-11-08 |
DK3440205T3 (da) | 2021-08-16 |
SG11201808775PA (en) | 2018-11-29 |
JP7143221B2 (ja) | 2022-09-28 |
CA3019836A1 (en) | 2017-10-12 |
US10718010B2 (en) | 2020-07-21 |
AU2017246318A2 (en) | 2018-11-08 |
US20200277667A1 (en) | 2020-09-03 |
US20200248248A1 (en) | 2020-08-06 |
JP2019520791A (ja) | 2019-07-25 |
ES2882329T3 (es) | 2021-12-01 |
PT3440205T (pt) | 2021-08-06 |
CN109312399A (zh) | 2019-02-05 |
MX391039B (es) | 2025-03-21 |
CN109312399B (zh) | 2023-02-03 |
AU2017246318B2 (en) | 2023-07-27 |
EP3440205A1 (en) | 2019-02-13 |
MX2018012156A (es) | 2019-02-07 |
WO2017176630A1 (en) | 2017-10-12 |
EP3440205B1 (en) | 2021-05-26 |
EP3440205A4 (en) | 2019-04-03 |
US20200283838A1 (en) | 2020-09-10 |
RU2018138848A3 (ru) | 2020-12-15 |
EP3929290A1 (en) | 2021-12-29 |
US20200248249A1 (en) | 2020-08-06 |
PL3440205T3 (pl) | 2021-11-22 |
US20200277666A1 (en) | 2020-09-03 |
JP2022120007A (ja) | 2022-08-17 |
RU2018138848A (ru) | 2020-05-12 |
US20200299760A1 (en) | 2020-09-24 |
US20190017109A1 (en) | 2019-01-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2742355C2 (ru) | Неинвазивная диагностика путем секвенирования 5-гидроксиметилированной бесклеточной днк | |
JP7504854B2 (ja) | 個別的エピゲノミクスのための天然クロマチンへの転移 |