CN114134205A - 脱氨酶介导的dna中n4-甲基胞嘧啶的单碱基分辨率定位分析方法 - Google Patents
脱氨酶介导的dna中n4-甲基胞嘧啶的单碱基分辨率定位分析方法 Download PDFInfo
- Publication number
- CN114134205A CN114134205A CN202111409397.6A CN202111409397A CN114134205A CN 114134205 A CN114134205 A CN 114134205A CN 202111409397 A CN202111409397 A CN 202111409397A CN 114134205 A CN114134205 A CN 114134205A
- Authority
- CN
- China
- Prior art keywords
- dna
- methylcytosine
- deaminase
- cytosine
- sequencing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 25
- 230000001404 mediated effect Effects 0.000 title claims abstract description 15
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 claims abstract description 43
- 238000000034 method Methods 0.000 claims abstract description 42
- 238000012163 sequencing technique Methods 0.000 claims abstract description 28
- 230000009615 deamination Effects 0.000 claims abstract description 24
- 238000006481 deamination reaction Methods 0.000 claims abstract description 24
- 229940104302 cytosine Drugs 0.000 claims abstract description 21
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 claims abstract description 12
- 102000000311 Cytosine Deaminase Human genes 0.000 claims abstract description 11
- 108010080611 Cytosine Deaminase Proteins 0.000 claims abstract description 11
- HWPZZUQOWRWFDB-UHFFFAOYSA-N 1-methylcytosine Chemical compound CN1C=CC(N)=NC1=O HWPZZUQOWRWFDB-UHFFFAOYSA-N 0.000 claims abstract description 10
- PJKKQFAEFWCNAQ-UHFFFAOYSA-N N(4)-methylcytosine Chemical compound CNC=1C=CNC(=O)N=1 PJKKQFAEFWCNAQ-UHFFFAOYSA-N 0.000 claims abstract description 10
- 230000003321 amplification Effects 0.000 claims abstract description 10
- 238000003199 nucleic acid amplification method Methods 0.000 claims abstract description 10
- LRSASMSXMSNRBT-UHFFFAOYSA-N 5-methylcytosine Chemical compound CC1=CNC(=O)N=C1N LRSASMSXMSNRBT-UHFFFAOYSA-N 0.000 claims abstract description 6
- 229940113082 thymine Drugs 0.000 claims abstract description 6
- 238000006243 chemical reaction Methods 0.000 claims description 13
- IAZDPXIOMUYVGZ-UHFFFAOYSA-N Dimethylsulphoxide Chemical compound CS(C)=O IAZDPXIOMUYVGZ-UHFFFAOYSA-N 0.000 claims description 12
- 238000012408 PCR amplification Methods 0.000 claims description 10
- 238000007480 sanger sequencing Methods 0.000 claims description 9
- 238000004925 denaturation Methods 0.000 claims description 7
- 230000036425 denaturation Effects 0.000 claims description 7
- 238000013507 mapping Methods 0.000 claims description 6
- CCIVGXIOQKPBKL-UHFFFAOYSA-M ethanesulfonate Chemical compound CCS([O-])(=O)=O CCIVGXIOQKPBKL-UHFFFAOYSA-M 0.000 claims description 3
- 239000012634 fragment Substances 0.000 claims description 3
- GPRLSGONYQIRFK-MNYXATJNSA-N triton Chemical compound [3H+] GPRLSGONYQIRFK-MNYXATJNSA-N 0.000 claims description 2
- 125000003275 alpha amino acid group Chemical group 0.000 claims 1
- 108020004414 DNA Proteins 0.000 abstract description 77
- 230000004048 modification Effects 0.000 abstract description 18
- 238000012986 modification Methods 0.000 abstract description 18
- 238000003752 polymerase chain reaction Methods 0.000 abstract description 12
- LSNNMFCWUKXFEE-UHFFFAOYSA-M Bisulfite Chemical compound OS([O-])=O LSNNMFCWUKXFEE-UHFFFAOYSA-M 0.000 abstract description 10
- 239000012491 analyte Substances 0.000 abstract description 3
- 102000053602 DNA Human genes 0.000 description 11
- 238000001294 liquid chromatography-tandem mass spectrometry Methods 0.000 description 9
- 241000192091 Deinococcus radiodurans Species 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 6
- 238000012165 high-throughput sequencing Methods 0.000 description 5
- 238000001369 bisulfite sequencing Methods 0.000 description 4
- 238000001514 detection method Methods 0.000 description 4
- 239000000523 sample Substances 0.000 description 4
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 3
- 230000015556 catabolic process Effects 0.000 description 3
- 238000010276 construction Methods 0.000 description 3
- 238000006731 degradation reaction Methods 0.000 description 3
- 238000009826 distribution Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 239000005457 ice water Substances 0.000 description 3
- 230000004807 localization Effects 0.000 description 3
- 230000011987 methylation Effects 0.000 description 3
- 238000007069 methylation reaction Methods 0.000 description 3
- 238000012164 methylation sequencing Methods 0.000 description 3
- 239000011535 reaction buffer Substances 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000007671 third-generation sequencing Methods 0.000 description 3
- GUAHPAJOXVYFON-ZETCQYMHSA-N (8S)-8-amino-7-oxononanoic acid zwitterion Chemical compound C[C@H](N)C(=O)CCCCCC(O)=O GUAHPAJOXVYFON-ZETCQYMHSA-N 0.000 description 2
- RYVNIFSIEDRLSJ-UHFFFAOYSA-N 5-(hydroxymethyl)cytosine Chemical compound NC=1NC(=O)N=CC=1CO RYVNIFSIEDRLSJ-UHFFFAOYSA-N 0.000 description 2
- 102000004190 Enzymes Human genes 0.000 description 2
- 108090000790 Enzymes Proteins 0.000 description 2
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 2
- 238000000246 agarose gel electrophoresis Methods 0.000 description 2
- 150000001413 amino acids Chemical group 0.000 description 2
- 239000011324 bead Substances 0.000 description 2
- 230000008827 biological function Effects 0.000 description 2
- 239000012472 biological sample Substances 0.000 description 2
- 108091036078 conserved sequence Proteins 0.000 description 2
- 238000005520 cutting process Methods 0.000 description 2
- RGWHQCVHVJXOKC-SHYZEUOFSA-J dCTP(4-) Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](COP([O-])(=O)OP([O-])(=O)OP([O-])([O-])=O)[C@@H](O)C1 RGWHQCVHVJXOKC-SHYZEUOFSA-J 0.000 description 2
- 239000000499 gel Substances 0.000 description 2
- 102000004169 proteins and genes Human genes 0.000 description 2
- 108090000623 proteins and genes Proteins 0.000 description 2
- 238000010791 quenching Methods 0.000 description 2
- 230000008439 repair process Effects 0.000 description 2
- 108091008146 restriction endonucleases Proteins 0.000 description 2
- 241000894007 species Species 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 1
- BLQMCTXZEMGOJM-UHFFFAOYSA-N 5-carboxycytosine Chemical compound NC=1NC(=O)N=CC=1C(O)=O BLQMCTXZEMGOJM-UHFFFAOYSA-N 0.000 description 1
- FVSOUJZKYWEFOB-KBIXCLLPSA-N Ala-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](C)N FVSOUJZKYWEFOB-KBIXCLLPSA-N 0.000 description 1
- YIGLXQRFQVWFEY-NRPADANISA-N Ala-Gln-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O YIGLXQRFQVWFEY-NRPADANISA-N 0.000 description 1
- HXNNRBHASOSVPG-GUBZILKMSA-N Ala-Glu-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O HXNNRBHASOSVPG-GUBZILKMSA-N 0.000 description 1
- HAVKMRGWNXMCDR-STQMWFEESA-N Arg-Gly-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HAVKMRGWNXMCDR-STQMWFEESA-N 0.000 description 1
- NVCIXQYNWYTLDO-IHRRRGAJSA-N Arg-His-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCCN=C(N)N)N NVCIXQYNWYTLDO-IHRRRGAJSA-N 0.000 description 1
- LVMUGODRNHFGRA-AVGNSLFASA-N Arg-Leu-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O LVMUGODRNHFGRA-AVGNSLFASA-N 0.000 description 1
- UGZUVYDKAYNCII-ULQDDVLXSA-N Arg-Phe-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O UGZUVYDKAYNCII-ULQDDVLXSA-N 0.000 description 1
- PCKRJVZAQZWNKM-WHFBIAKZSA-N Asn-Asn-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O PCKRJVZAQZWNKM-WHFBIAKZSA-N 0.000 description 1
- VJTWLBMESLDOMK-WDSKDSINSA-N Asn-Gln-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O VJTWLBMESLDOMK-WDSKDSINSA-N 0.000 description 1
- GLWFAWNYGWBMOC-SRVKXCTJSA-N Asn-Leu-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O GLWFAWNYGWBMOC-SRVKXCTJSA-N 0.000 description 1
- HPNDBHLITCHRSO-WHFBIAKZSA-N Asp-Ala-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)NCC(O)=O HPNDBHLITCHRSO-WHFBIAKZSA-N 0.000 description 1
- YBMUFUWSMIKJQA-GUBZILKMSA-N Asp-Gln-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)O)N YBMUFUWSMIKJQA-GUBZILKMSA-N 0.000 description 1
- QCLHLXDWRKOHRR-GUBZILKMSA-N Asp-Glu-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)O)N QCLHLXDWRKOHRR-GUBZILKMSA-N 0.000 description 1
- QCVXMEHGFUMKCO-YUMQZZPRSA-N Asp-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(O)=O QCVXMEHGFUMKCO-YUMQZZPRSA-N 0.000 description 1
- QHHVSXGWLYEAGX-GUBZILKMSA-N Asp-His-Gln Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)O)N QHHVSXGWLYEAGX-GUBZILKMSA-N 0.000 description 1
- QNMKWNONJGKJJC-NHCYSSNCSA-N Asp-Leu-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O QNMKWNONJGKJJC-NHCYSSNCSA-N 0.000 description 1
- 241000894006 Bacteria Species 0.000 description 1
- 108020000946 Bacterial DNA Proteins 0.000 description 1
- 208000005623 Carcinogenesis Diseases 0.000 description 1
- AEJSNWMRPXAKCW-WHFBIAKZSA-N Cys-Ala-Gly Chemical compound SC[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O AEJSNWMRPXAKCW-WHFBIAKZSA-N 0.000 description 1
- XSELZJJGSKZZDO-UBHSHLNASA-N Cys-Trp-Asp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CS)N XSELZJJGSKZZDO-UBHSHLNASA-N 0.000 description 1
- 102000012410 DNA Ligases Human genes 0.000 description 1
- 108010061982 DNA Ligases Proteins 0.000 description 1
- 102000006465 DNA Restriction-Modification Enzymes Human genes 0.000 description 1
- 108010044289 DNA Restriction-Modification Enzymes Proteins 0.000 description 1
- 230000007067 DNA methylation Effects 0.000 description 1
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 1
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 1
- MLZRSFQRBDNJON-GUBZILKMSA-N Gln-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N MLZRSFQRBDNJON-GUBZILKMSA-N 0.000 description 1
- FALJZCPMTGJOHX-SRVKXCTJSA-N Gln-Met-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O FALJZCPMTGJOHX-SRVKXCTJSA-N 0.000 description 1
- ITYRYNUZHPNCIK-GUBZILKMSA-N Glu-Ala-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O ITYRYNUZHPNCIK-GUBZILKMSA-N 0.000 description 1
- VAZZOGXDUQSVQF-NUMRIWBASA-N Glu-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N)O VAZZOGXDUQSVQF-NUMRIWBASA-N 0.000 description 1
- ZIYGTCDTJJCDDP-JYJNAYRXSA-N Glu-Phe-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N ZIYGTCDTJJCDDP-JYJNAYRXSA-N 0.000 description 1
- MLILEEIVMRUYBX-NHCYSSNCSA-N Glu-Val-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O MLILEEIVMRUYBX-NHCYSSNCSA-N 0.000 description 1
- LZEUDRYSAZAJIO-AUTRQRHGSA-N Glu-Val-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LZEUDRYSAZAJIO-AUTRQRHGSA-N 0.000 description 1
- JPXNYFOHTHSREU-UWVGGRQHSA-N Gly-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)CN JPXNYFOHTHSREU-UWVGGRQHSA-N 0.000 description 1
- UEGIPZAXNBYCCP-NKWVEPMBSA-N Gly-Cys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CS)NC(=O)CN)C(=O)O UEGIPZAXNBYCCP-NKWVEPMBSA-N 0.000 description 1
- QAMMIGULQSIRCD-IRXDYDNUSA-N Gly-Phe-Tyr Chemical compound C([C@H](NC(=O)C[NH3+])C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C([O-])=O)C1=CC=CC=C1 QAMMIGULQSIRCD-IRXDYDNUSA-N 0.000 description 1
- FFALDIDGPLUDKV-ZDLURKLDSA-N Gly-Thr-Ser Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O FFALDIDGPLUDKV-ZDLURKLDSA-N 0.000 description 1
- BKOVCRUIXDIWFV-IXOXFDKPSA-N His-Lys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CN=CN1 BKOVCRUIXDIWFV-IXOXFDKPSA-N 0.000 description 1
- WYKXJGWSJUULSL-AVGNSLFASA-N His-Val-Arg Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)Cc1cnc[nH]1)C(=O)N[C@@H](CCCNC(=N)N)C(=O)O WYKXJGWSJUULSL-AVGNSLFASA-N 0.000 description 1
- 241000282414 Homo sapiens Species 0.000 description 1
- 101000889953 Homo sapiens Apolipoprotein B-100 Proteins 0.000 description 1
- NHJKZMDIMMTVCK-QXEWZRGKSA-N Ile-Gly-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N NHJKZMDIMMTVCK-QXEWZRGKSA-N 0.000 description 1
- YGDWPQCLFJNMOL-MNXVOIDGSA-N Ile-Leu-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N YGDWPQCLFJNMOL-MNXVOIDGSA-N 0.000 description 1
- VEPIBPGLTLPBDW-URLPEUOOSA-N Ile-Phe-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N VEPIBPGLTLPBDW-URLPEUOOSA-N 0.000 description 1
- OMDWJWGZGMCQND-CFMVVWHZSA-N Ile-Tyr-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N OMDWJWGZGMCQND-CFMVVWHZSA-N 0.000 description 1
- SITWEMZOJNKJCH-UHFFFAOYSA-N L-alanine-L-arginine Natural products CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N SITWEMZOJNKJCH-UHFFFAOYSA-N 0.000 description 1
- 241000880493 Leptailurus serval Species 0.000 description 1
- UILIPCLTHRPCRB-XUXIUFHCSA-N Leu-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(C)C)N UILIPCLTHRPCRB-XUXIUFHCSA-N 0.000 description 1
- ZURHXHNAEJJRNU-CIUDSAMLSA-N Leu-Asp-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZURHXHNAEJJRNU-CIUDSAMLSA-N 0.000 description 1
- MMEDVBWCMGRKKC-GARJFASQSA-N Leu-Asp-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N MMEDVBWCMGRKKC-GARJFASQSA-N 0.000 description 1
- PIHFVNPEAHFNLN-KKUMJFAQSA-N Leu-Cys-Tyr Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N PIHFVNPEAHFNLN-KKUMJFAQSA-N 0.000 description 1
- BTNXKBVLWJBTNR-SRVKXCTJSA-N Leu-His-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(O)=O BTNXKBVLWJBTNR-SRVKXCTJSA-N 0.000 description 1
- RGUXWMDNCPMQFB-YUMQZZPRSA-N Leu-Ser-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RGUXWMDNCPMQFB-YUMQZZPRSA-N 0.000 description 1
- BTEMNFBEAAOGBR-BZSNNMDCSA-N Leu-Tyr-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BTEMNFBEAAOGBR-BZSNNMDCSA-N 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- DNDVVILEHVMWIS-LPEHRKFASA-N Met-Asp-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N DNDVVILEHVMWIS-LPEHRKFASA-N 0.000 description 1
- UYAKZHGIPRCGPF-CIUDSAMLSA-N Met-Glu-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCSC)N UYAKZHGIPRCGPF-CIUDSAMLSA-N 0.000 description 1
- 102000016397 Methyltransferase Human genes 0.000 description 1
- 108060004795 Methyltransferase Proteins 0.000 description 1
- 108091028043 Nucleic acid sequence Proteins 0.000 description 1
- BJEYSVHMGIJORT-NHCYSSNCSA-N Phe-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 BJEYSVHMGIJORT-NHCYSSNCSA-N 0.000 description 1
- IDUCUXTUHHIQIP-SOUVJXGZSA-N Phe-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O IDUCUXTUHHIQIP-SOUVJXGZSA-N 0.000 description 1
- RSPUIENXSJYZQO-JYJNAYRXSA-N Phe-Leu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 RSPUIENXSJYZQO-JYJNAYRXSA-N 0.000 description 1
- ZBAGOWGNNAXMOY-IHRRRGAJSA-N Pro-Cys-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ZBAGOWGNNAXMOY-IHRRRGAJSA-N 0.000 description 1
- KAAPNMOKUUPKOE-SRVKXCTJSA-N Ser-Asn-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KAAPNMOKUUPKOE-SRVKXCTJSA-N 0.000 description 1
- CRZRTKAVUUGKEQ-ACZMJKKPSA-N Ser-Gln-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O CRZRTKAVUUGKEQ-ACZMJKKPSA-N 0.000 description 1
- KDGARKCAKHBEDB-NKWVEPMBSA-N Ser-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CO)N)C(=O)O KDGARKCAKHBEDB-NKWVEPMBSA-N 0.000 description 1
- YMDNFPNTIPQMJP-NAKRPEOUSA-N Ser-Ile-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCSC)C(O)=O YMDNFPNTIPQMJP-NAKRPEOUSA-N 0.000 description 1
- GJFYFGOEWLDQGW-GUBZILKMSA-N Ser-Leu-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CO)N GJFYFGOEWLDQGW-GUBZILKMSA-N 0.000 description 1
- ADJDNJCSPNFFPI-FXQIFTODSA-N Ser-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO ADJDNJCSPNFFPI-FXQIFTODSA-N 0.000 description 1
- BCAVNDNYOGTQMQ-AAEUAGOBSA-N Ser-Trp-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)NCC(O)=O BCAVNDNYOGTQMQ-AAEUAGOBSA-N 0.000 description 1
- ZWSZBWAFDZRBNM-UBHSHLNASA-N Ser-Trp-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CO)C(O)=O ZWSZBWAFDZRBNM-UBHSHLNASA-N 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- RZCIEJXAILMSQK-JXOAFFINSA-N TTP Chemical compound O=C1NC(=O)C(C)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 RZCIEJXAILMSQK-JXOAFFINSA-N 0.000 description 1
- 108010006785 Taq Polymerase Proteins 0.000 description 1
- NWECYMJLJGCBOD-UNQGMJICSA-N Thr-Phe-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O NWECYMJLJGCBOD-UNQGMJICSA-N 0.000 description 1
- UMFLBPIPAJMNIM-LYARXQMPSA-N Thr-Trp-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC3=CC=CC=C3)C(=O)O)N)O UMFLBPIPAJMNIM-LYARXQMPSA-N 0.000 description 1
- BZTSQFWJNJYZSX-JRQIVUDYSA-N Thr-Tyr-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O BZTSQFWJNJYZSX-JRQIVUDYSA-N 0.000 description 1
- 229920004890 Triton X-100 Polymers 0.000 description 1
- 239000013504 Triton X-100 Substances 0.000 description 1
- QYSBJAUCUKHSLU-JYJNAYRXSA-N Tyr-Arg-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O QYSBJAUCUKHSLU-JYJNAYRXSA-N 0.000 description 1
- NRFTYDWKWGJLAR-MELADBBJSA-N Tyr-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O NRFTYDWKWGJLAR-MELADBBJSA-N 0.000 description 1
- IEBGHUMBJXIXHM-AVGNSLFASA-N Val-Lys-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(=O)O)N IEBGHUMBJXIXHM-AVGNSLFASA-N 0.000 description 1
- 208000036142 Viral infection Diseases 0.000 description 1
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 1
- 238000000137 annealing Methods 0.000 description 1
- 108010038633 aspartylglutamate Proteins 0.000 description 1
- 108010068265 aspartyltyrosine Proteins 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- 231100000504 carcinogenesis Toxicity 0.000 description 1
- 230000003197 catalytic effect Effects 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- SUYVUBYJARFZHO-RRKCRQDMSA-N dATP Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-RRKCRQDMSA-N 0.000 description 1
- SUYVUBYJARFZHO-UHFFFAOYSA-N dATP Natural products C1=NC=2C(N)=NC=NC=2N1C1CC(O)C(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-UHFFFAOYSA-N 0.000 description 1
- HAAZLUGHYHWQIW-KVQBGUIXSA-N dGTP Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 HAAZLUGHYHWQIW-KVQBGUIXSA-N 0.000 description 1
- 238000001212 derivatisation Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000006862 enzymatic digestion Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000013467 fragmentation Methods 0.000 description 1
- 238000006062 fragmentation reaction Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 108010078144 glutaminyl-glycine Proteins 0.000 description 1
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 1
- JYPCXBJRLBHWME-UHFFFAOYSA-N glycyl-L-prolyl-L-arginine Natural products NCC(=O)N1CCCC1C(=O)NC(CCCN=C(N)N)C(O)=O JYPCXBJRLBHWME-UHFFFAOYSA-N 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 108010040030 histidinoalanine Proteins 0.000 description 1
- 108010018006 histidylserine Proteins 0.000 description 1
- 102000052249 human APOB Human genes 0.000 description 1
- 230000005865 ionizing radiation Effects 0.000 description 1
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000004811 liquid chromatography Methods 0.000 description 1
- 230000017156 mRNA modification Effects 0.000 description 1
- 238000004949 mass spectrometry Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000007481 next generation sequencing Methods 0.000 description 1
- 102000039446 nucleic acids Human genes 0.000 description 1
- 108020004707 nucleic acids Proteins 0.000 description 1
- 150000007523 nucleic acids Chemical class 0.000 description 1
- 239000002777 nucleoside Substances 0.000 description 1
- 125000003835 nucleoside group Chemical group 0.000 description 1
- 239000002773 nucleotide Substances 0.000 description 1
- 125000003729 nucleotide group Chemical group 0.000 description 1
- 230000003647 oxidation Effects 0.000 description 1
- 238000007254 oxidation reaction Methods 0.000 description 1
- 108010051242 phenylalanylserine Proteins 0.000 description 1
- 239000013612 plasmid Substances 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 238000004445 quantitative analysis Methods 0.000 description 1
- 230000000171 quenching effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 108010026333 seryl-proline Proteins 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
- 238000011895 specific detection Methods 0.000 description 1
- 239000011550 stock solution Substances 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 229940035893 uracil Drugs 0.000 description 1
- 230000009385 viral infection Effects 0.000 description 1
- 230000004735 virus-associated carcinogenesis Effects 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6806—Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Analytical Chemistry (AREA)
- Biophysics (AREA)
- Immunology (AREA)
- Microbiology (AREA)
- Molecular Biology (AREA)
- Biotechnology (AREA)
- Physics & Mathematics (AREA)
- Biochemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明公开了一种脱氨酶介导的DNA中N4‑甲基胞嘧啶的单碱基分辨率定位分析方法,属于生物技术领域。本发明方法利用胞嘧啶脱氨酶A3A蛋白对DNA中正常的胞嘧啶和5‑甲基胞嘧啶进行脱氨基,随后在后续聚合酶链式反应扩增形成胸腺嘧啶,而目标分析物N4‑甲基胞嘧啶能够抵抗胞嘧啶脱氨酶A3A的脱氨作用,因此在随后的聚合酶链式反应中扩增为胞嘧啶。这样,只有N4‑甲基胞嘧啶修饰才能在最终的测序中被读为胞嘧啶。本发明方法选择性高,准确性好,无需对DNA样品进行亚硫酸氢盐的处理,可直接获得DNA中N4‑甲基胞嘧啶的单碱基分辨率图谱。
Description
技术领域
本发明涉及生物技术领域,具体涉及一种脱氨酶介导的DNA中N4-甲基胞嘧啶的单碱基分辨率定位分析方法。
背景技术
N4-甲基胞嘧啶(4mC)是一种DNA甲基化修饰,主要存在于极度嗜热菌和部分嗜常温菌DNA中,在真核生物特别是哺乳动物中目前还没有报道。迄今为止,已经发现了多种细菌DNA的4mC甲基转移酶,这些甲基转移酶能够与限制性内切酶结合形成序列特异性限制-修饰系统。宿主DNA中的4mC碱基在识别特定基序的限制性内切酶和保护宿主基因组方面起着非常重要的作用。尽管4mC能够通过液相色谱、液相色谱串联质谱(LC-MS)等技术高灵敏地被检测和定量,但它们在基因组DNA中的定位信息一直是一个挑战。建立4mC的测序技术有助于对其生物学功能进行更加深入的研究。
目前对于DNA中4mC的单碱基分辨率测序方法有两类,一种是基于传统亚硫酸氢盐测序的分析方法,另一种为单分子实时测序(SMRT)方法。亚硫酸氢盐测序是一种广泛使用的DNA中5-甲基胞嘧啶(5mC)单碱基分辨率测序方法,由于5mC对亚硫酸氢盐转化具有严格的抗性,而且5mC广泛分布于各物种基因组中,因此标准亚硫酸氢盐测序并不适用于区分5mC和4mC。基于此,有人开发了一种4mC-Tet辅助的亚硫酸氢盐测序(4mC-TAB-seq) 方法。在4mC-TAB-seq方法中,5mC被Tet蛋白氧化为5-羧基胞嘧啶,后者经亚硫酸氢盐处理后脱氨,并在测序中读作胸腺嘧啶。在4mC-TAB-seq方法中,胞嘧啶和5mC都被测序读为胸腺嘧啶,而只有4mC位点被解读为胞嘧啶,因此,实现了对整个基因组中4mC的特异性检测。然而,基于亚硫酸氢盐的策略需要苛刻的化学脱氨条件,从而导致高达99.9%的DNA 被降解。与二代测序方法不同的是,SMRT技术能够以单核苷酸分辨率直接检测修饰碱基,并已被用于DNA中4mC的检测。然而,与常用的二代测序技术相比,SMRT测序成本更高, DNA用量更大,测序错误率相对较高。
人载脂蛋白B mRNA编辑催化亚基3A(A3A)家族酶的成员能够在单链DNA中将胞嘧啶转化为尿嘧啶,并在病毒感染和癌症发生中具有非常关键的功能。研究表明,A3A对DNA中的胞嘧啶和5mC具有高效的脱氨活性,且两种胞嘧啶衍生物5-羟甲基胞嘧啶(5hmC)和 5-醛基胞嘧啶(5fC)都可以被高效脱氨。A3A的脱氨活性不依赖于序列特异性,因此能够对全基因组上所有胞嘧啶进行脱氨基。在此基础上,有研究开发了用于5hmC测序的A3A辅助的定位分析方法,即ACE-seq和AMD-seq。目前,还没有不依赖于亚硫酸氢盐处理、高选择性、操作简单的4mC定位分析方法。
发明内容
本发明的目的在于提供一种胞嘧啶脱氨酶介导的DNA中N4-甲基胞嘧啶(4mC)单碱基分辨率定位分析方法,即一种不依赖于亚硫酸氢盐处理、高选择性、操作简单的4mC定位分析方法。
本发明的目的通过下述技术方案实现:
一种脱氨酶介导的DNA中N4-甲基胞嘧啶的单碱基分辨率定位分析方法,包括如下步骤:
(1)对待检DNA进行变性处理。
(2)经变性处理的DNA用胞嘧啶脱氨酶进行脱氨处理。
(3)脱氨后的DNA样品进行PCR扩增。
(4)将PCR扩增产物进行测序,待检DNA中的N4-甲基胞嘧啶在测序中被读为胞嘧啶,正常的胞嘧啶和5-甲基胞嘧啶在测序中被读为胸腺嘧啶。
步骤(1)中,DNA变性处理的方法优选为:在0~60%DMSO存在下,将DNA在90~ 98℃高温下孵育2~30分钟后转入冰水浴中。
步骤(2)中,所述的胞嘧啶脱氨酶优选为氨基酸序列如SEQ ID NO.1所示的A3A蛋白。 DNA进行脱氨处理的方法优选为:DNA在含2-(N-吗啉)乙磺酸(MES)10~30mM、TritonX-100 0.05~0.5%、pH 5.5~7.5、A3A蛋白1~10μM的反应体系中,于30~45℃反应0.5~4小时,反应结束后再在75~98℃变性2~30分钟使A3A蛋白灭活。
步骤(4)中,若PCR扩增得到的是特定序列的DNA片段,扩增产物可以直接进行Sanger 测序;若PCR扩增形成DNA文库,则将扩增产物进行高通量测序。
本发明方法的原理见图1,胞嘧啶脱氨酶A3A蛋白对DNA中正常的胞嘧啶(C)和5-甲基胞嘧啶(5mC)进行脱氨基,随后在后续聚合酶链式反应扩增形成胸腺嘧啶(T),而目标分析物N4-甲基胞嘧啶(4mC)能够抵抗胞嘧啶脱氨酶A3A的脱氨作用,因此在随后的聚合酶链式反应中扩增为胞嘧啶。这样,只有N4-甲基胞嘧啶(4mC)修饰才能在最终的测序中被读为胞嘧啶(C)。
本发明方法通过A3A蛋白对DNA中的胞嘧啶和5-mC脱氨基,4mC不脱氨,无需亚硫酸氢盐处理直接测序获得4mC的单碱基分辨率定位信息。
本发明的优点及有益效果如下:
1.本发明中,方法操作简便,无需复杂的样品前处理。
2.本发明无需利用衍生化试剂对分析物进行化学标记,极大地缩短了分析时间。
3.本发明无需亚硫酸氢盐处理,反应条件温和,不会造成DNA的大量降解。
4.本发明DNA用量小,仅需100ng的基因组DNA即可对4mC进行定位分析。
5.本发明涉及的胞嘧啶脱氨酶对胞嘧啶和5mC具有高效的脱氨效率(97%),而对4mC 的脱氨基效率很低(3%),有利于4mC的定位分析。
6.本发明无需采用昂贵的第三代测序平台,只需采用下一代测序平台技术即可完成4mC 的单碱基分辨率定位分析。
7.本发明涉及的方法能够广泛应用于原核生物DNA中4mC修饰位点与相关甲基化酶保守序列的研究,并有助于对4mC的生物学功能进行更加深入的研究。
附图说明
图1为本发明示意图。本发明中,4mC能够抵抗A3A的脱氨作用,而C与5mC能够被A3A转化为U和T。因此,在测序时,只有4mC能够被读成C。
图2A为本发明中利用LC-MS/MS检测人工合成的不含修饰的215bp DNA链脱氨基处理前后dC含量对比图。
图2B为本发明中利用LC-MS/MS检测人工合成的含有4mC修饰的215bp DNA链脱氨基处理前后4mdC含量对比图。
图2C为本发明中利用LC-MS/MS检测人工合成的含有5mC修饰的215bp DNA链脱氨基处理前后5mdC含量对比图。
图3为本发明中对含胞嘧啶、4mC或5mC的215bp DNA链经A3A蛋白处理后,分别利用液相色谱串联质谱和单克隆测序检测到的胞嘧啶、4mC和5mC的脱氨率。
图4A为本发明中人工合成的不含修饰的215bp DNA链经A3A蛋白处理前后,Sanger测序的读出结果,其中每个C经A3A脱氨后均突变为T。
图4B为本发明中人工合成的含5mC修饰的215bp DNA链经A3A蛋白处理前后,Sanger 测序的读出结果,其中每个5mC经A3A脱氨后均突变为T。
图4C为本发明中人工合成的含4mC修饰的215bp DNA链经A3A蛋白处理前后,Sanger 测序的读出结果,其中每个4mC经A3A脱氨后均未突变,仍读作C。
图5为本发明方法对全基因组4mC甲基化测序文库构建流程示意图。
图6为本发明方法对全基因组4mC甲基化测序文库构建过程中使用的接头及引物序列。
图7为应用本发明中方法对耐辐射奇异球菌全基因组4mC进行测序,平行样品1、2和 3检测出来的各4mC位点甲基化率的相关性。
具体实施方式
在一些实施方案中,本发明脱氨酶介导的DNA中N4-甲基胞嘧啶单碱基分辨率定位方法,包括下述步骤:
(1)配制高浓度的A3A反应缓冲液的储存液:200mM 2-(N-吗啉)乙磺酸(MES),1%的triton X-100,pH为5.5-7.5。
(2)表达并纯化A3A蛋白。
(3)从生物样品中提取DNA,用RNaseA酶将DNA中的RNA去除。
(4)取100ng提取的DNA,超声进行片段化处理,片段化的DNA进行末端修复和3’端加dA处理,随后进行接头连接。连接后的DNA进行纯化。
(5)在步骤(4)纯化的DNA中加入2~12μL的DMSO,加水至16μL,在90~98℃水浴中孵育2~30分钟,随后立即转移至冰水浴中猝火。加入2μL步骤(1)配制的A3A反应缓冲液,加入2μL的A3A蛋白(终浓度1~10μM),30~45℃下反应0.5~4小时。反应结束后,将样品加热至75~98℃变性2~30分钟使蛋白失活。
(6)进行第一次聚合酶链式反应,使用与脱氨后的接头互补配对的引物(P5-pre,P7-pre,如图6),对脱氨后的DNA进行扩增。纯化扩增后的DNA,去除多余的引物。
(7)以步骤(6)中纯化后的DNA为模板,使用高通量测序平台所用引物(P5-universal 引物和P7-index引物,如图6),进行第二次聚合酶链式反应。扩增产物进行琼脂糖凝胶电泳,切胶纯化,得到DNA文库。
(8)将纯化后的DNA文库进行高通量测序。
本发明所使用的胞嘧啶脱氨酶A3A蛋白(NCBI GenBank:EAW60278.1)的氨基酸序列如SEQ ID NO.1所示。
以下实施例用于进一步说明本发明,但不应理解为对本发明的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。
若未特别指明,实施例中所用的技术手段(包括核酸的提取、酶解以及聚合酶链式反应等)为本领域技术人员所熟知的常规手段。
实施例1.利用人工合成的含不同修饰的215bp DNA链区分胞嘧啶、5-甲基胞嘧啶和N4- 甲基胞嘧啶
为了验证本发明方法的准确性,首先合成了一段215bp含不同修饰的DNA链,与A3A蛋白反应,通过质谱和Sanger测序验证脱氨率。
A.215bp DNA链的合成方法
在50μL的反应体系中,加入0.5ng pUC19 DNA(Takara生物技术股份有限公司),5μL 10×反应缓冲液,2.5U Taq DNA聚合酶(Takara),2μL 10μM正向引物(序列为 5′-GAGTGAGTGAGGGAGGAAG-3′),2μL 10μM反向引物(序列为 5′-CCACTCACAATTCCACACAACATAC-3′),1μL dATP、dGTP、TTP和dCTP(浓度均为 2.5mM)。当合成5mC或4mC修饰的DNA链时,以5mdCTP或4mdCTP取代dCTP即可。
聚合酶链式反应(PCR)程序为:(1)95℃变性2min;(2)95℃变性1min;(3)52℃退火2min;(4)72℃延伸3min;(2)-(4)步重复30次;72℃延伸7min,放置4℃进行贮存。对PCR产物利用试剂盒进行回收纯化(Omega Bio-Tek Inc.,Norcross,GA,USA)。利用微量分光光度计对合成的DNA浓度进行定量。
合成的215bp DNA序列如SEQ ID NO.2所示。
B.人工合成的DNA链进行脱氨反应
往人工合成的DNA链中加入2μL的DMSO,加水至16μL,在95℃水浴中孵育10分钟,随后立即转移至冰水浴中猝火。加入2μL步骤(1)配制的A3A反应缓冲液,加入2μL的 A3A蛋白(终浓度6μM),37℃下反应2小时。反应结束后,将样品加热至95℃变性5分钟使蛋白失活。
C.液相色谱串联质谱分析C、5mC和4mC修饰的脱氨效率
将A3A处理后的DNA酶解为核苷,利用液相色谱串联质谱分析A3A处理前后dC、5mdC和4mdC含量的变化情况。如图2A-2C所示,A3A处理后C和5mC均脱氨,而4mC含量没有显著降低。如图3所示,C和5mC的脱氨效率达到97%,而4mC脱氨率仅为3%。
D.Sanger测序分析C、5mC和4mC修饰的脱氨效率
液相色谱串联质谱技术只能分析C、5mC和4mC修饰的整体水平,而Sanger测序能够对单个位点上C、5mC和4mC的脱氨情况进行分析。在对三种人工合成的DNA链进行A3A 处理后,利用上述步骤A中的引物进行PCR扩增,扩增产物直接进行Sanger测序。图4A-4B 显示所有位点上的C和5mC在A3A处理后均读为T,而图4C表明所有位点上4mC仍读作 C。此外,还通过单克隆测序对不同位点的脱氨率进行了定量分析。如图3所示,单克隆测序结果显示C完全脱氨,5mC仅1.2%未脱氨,而4mC只有3.0%脱氨。
除了对4mC修饰位点进行鉴定外,本发明还能够对单个位点上4mC的水平进行定量分析。首先混合不同比例含4mC和C的DNA链,随后进行A3A处理和PCR扩增,单克隆测序表明各个4mC位点上C的读出率与理论值一致,不同含量4mC测量值与理论值线性关系良好(R2=0.999)。
以上结果表明,4mC在A3A处理后仍读作C,和C与5mC会被A3A脱氨因而读作T,所以,测序读出的C位点即为4mC修饰位点,基于此,该方法能够应用至生物样品DNA中 4mC的定位分析。
实施例2.脱氨酶介导的DNA中4mC单碱基定位方法用于耐辐射奇异球菌全基因组4mC位点的鉴定
耐辐射奇异球菌是一种特殊的细菌,它对电离辐射、紫外线、氧化和干燥等致命影响具有极强的抵抗能力。有研究表明,4mC在维持耐辐射奇异球菌基因组稳定性方面起着重要作用。目前用于鉴定4mC的方法主要基于亚硫氢盐转化或第三代测序技术,然而,这些技术都存在其各自的缺点。比如,亚硫酸氢盐转化能够对DNA造成大量的降解,而三代测序的准确性一直是个问题。因此,利用上述建立的方法,对耐辐射奇异球菌基因组DNA中特定位点4mC修饰进行了鉴定。
为了探索是否在全基因组水平上4mC的分布及序列保守性,本发明采用建立的4mC单碱基定位方法分析了耐辐射奇异球菌所有两条染色体和两个质粒中4mC的分布情况。对全基因组4mC甲基化测序文库构建流程见图5。具体包括如下步骤:
A.提取耐辐射奇异球菌全基因组,超声将DNA碎裂成200-400bp片段,利用试剂盒对 DNA进行末端修复和3’端加dA(翌圣生物科技股份有限公司)。
B.随后进行接头连接,采用T4 DNA连接酶(Yeasen)根据制造商推荐的条件进行连接。连接后的DNA通过KAPA纯化磁珠(Roche)进行纯化。
C.接着利用实施例1中的方法对连接产物进行脱氨基与灭活处理。
D.脱氨后的DNA首先使用P5-pre引物、P7-pre引物和Q5U热启动超保真DNA聚合酶(NEB)进行扩增,配制如下反应:
扩增程序为:
E.扩增产物通过KAPA纯化磁珠(Roche)进行纯化。
F.进行第二次PCR。配制如下反应体系:
扩增程序为:
G.PCR产物采用低熔点琼脂糖凝胶电泳分离,切胶纯化450-650bp DNA。最后将纯化后的DNA于Illumina NovaSeq 6000平台进行高通量测序(Novogene Co.,Ltd.,China)。
上述过程中所用接头与引物序列见图6。
本发明方法重现性好,三组平行样品测得的含量相关性良好(皮尔逊相关系数大于0.98,如图7),使用本发明脱氨酶介导的DNA中4mC单碱基定位方法发现了1586个4mC位点,其中,约35.6%的4mC位点位于其保守序列“CCGCGG”中。其中,4mC修饰于第二个胞嘧啶处。处于“CCGCGG”基序中的4mC位点甲基化程度普遍较高,含量约为50-90%(平均值为70%)。而处于该基序外的4mC位点的甲基化率绝大部分低于50%(平均值为23%)。该结果与文献报道一致(Li,S.J.et al.Frontier in Microbiology 2019,10),虽然文献中利用单分子实时测序(SMRT)技术也鉴定出了耐辐射奇异球菌中4mC的保守基序“CCGCGG”,但是相比于本发明所采用的高通量测序平台,SMRT测序价格高昂,不利于大批量样品的分析。上述结果表明本发明方法准确度高,能够用于其它物种DNA中4mC的定位分析。
序列表
<110> 武汉大学
<120> 脱氨酶介导的DNA中N4-甲基胞嘧啶的单碱基分辨率定位分析方法
<160> 2
<170> SIPOSequenceListing 1.0
<210> 1
<211> 199
<212> PRT
<213> Homo sapiens
<400> 1
Met Glu Ala Ser Pro Ala Ser Gly Pro Arg His Leu Met Asp Pro His
1 5 10 15
Ile Phe Thr Ser Asn Phe Asn Asn Gly Ile Gly Arg His Lys Thr Tyr
20 25 30
Leu Cys Tyr Glu Val Glu Arg Leu Asp Asn Gly Thr Ser Val Lys Met
35 40 45
Asp Gln His Arg Gly Phe Leu His Asn Gln Ala Lys Asn Leu Leu Cys
50 55 60
Gly Phe Tyr Gly Arg His Ala Glu Leu Arg Phe Leu Asp Leu Val Pro
65 70 75 80
Ser Leu Gln Leu Asp Pro Ala Gln Ile Tyr Arg Val Thr Trp Phe Ile
85 90 95
Ser Trp Ser Pro Cys Phe Ser Trp Gly Cys Ala Gly Glu Val Arg Ala
100 105 110
Phe Leu Gln Glu Asn Thr His Val Arg Leu Arg Ile Phe Ala Ala Arg
115 120 125
Ile Tyr Asp Tyr Asp Pro Leu Tyr Lys Glu Ala Leu Gln Met Leu Arg
130 135 140
Asp Ala Gly Ala Gln Val Ser Ile Met Thr Tyr Asp Glu Phe Lys His
145 150 155 160
Cys Trp Asp Thr Phe Val Asp His Gln Gly Cys Pro Phe Gln Pro Trp
165 170 175
Asp Gly Leu Asp Glu His Ser Gln Ala Leu Ser Gly Arg Leu Arg Ala
180 185 190
Ile Leu Gln Asn Gln Gly Asn
195
<210> 2
<211> 215
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 2
gagtgagtga gggaggaagc ggaagagcgc ccaatacgca aaccgcctct ccccgcgcgt 60
tggccgattc attaatgcag ctggcacgac aggtttcccg actggaaagc gggcagtgag 120
cgcaacgcaa ttaatgtgag ttagctcact cattaggcac cccaggcttt acactttatg 180
cttccggctc gtatgttgtg tggaattgtg agtgg 215
Claims (5)
1.一种脱氨酶介导的DNA中N4-甲基胞嘧啶的单碱基分辨率定位分析方法,其特征在于:包括如下步骤:
(1)对待检DNA进行变性处理;
(2)经变性处理的DNA用胞嘧啶脱氨酶进行脱氨处理;
(3)脱氨后的DNA样品进行PCR扩增;
(4)将PCR扩增产物测序,待检DNA中的N4-甲基胞嘧啶在测序中被读为胞嘧啶,正常的胞嘧啶和5-甲基胞嘧啶在测序中被读为胸腺嘧啶。
2.根据权利要求1中所述的脱氨酶介导的DNA中N4-甲基胞嘧啶的单碱基分辨率定位分析方法,其特征在于:步骤(1)中,DNA变性处理的方法为:在0~60%DMSO存在下,将DNA在90~98℃高温下孵育2~30分钟。
3.根据权利要求1中所述的脱氨酶介导的DNA中N4-甲基胞嘧啶的单碱基分辨率定位分析方法,其特征在于:步骤(2)中,所述的胞嘧啶脱氨酶为氨基酸序列如SEQ ID NO.1所示的A3A蛋白。
4.根据权利要求3中所述的脱氨酶介导的DNA中N4-甲基胞嘧啶的单碱基分辨率定位分析方法,其特征在于:步骤(2)中,DNA进行脱氨处理的方法为:DNA在含2-(N-吗啉)乙磺酸10~30mM、Triton X-100 0.05~0.5%、pH 5.5~7.5、A3A蛋白1~10μM的反应体系中,于30~45℃反应0.5~4小时。
5.根据权利要求1中所述的脱氨酶介导的DNA中N4-甲基胞嘧啶的单碱基分辨率定位分析方法,其特征在于:步骤(4)中,若PCR扩增得到的是特定序列的DNA片段,扩增产物可以直接进行Sanger测序;若PCR扩增形成DNA文库,则将扩增产物进行高通量测序。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111409397.6A CN114134205B (zh) | 2021-11-25 | 2021-11-25 | 脱氨酶介导的dna中n4-甲基胞嘧啶的单碱基分辨率定位分析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111409397.6A CN114134205B (zh) | 2021-11-25 | 2021-11-25 | 脱氨酶介导的dna中n4-甲基胞嘧啶的单碱基分辨率定位分析方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114134205A true CN114134205A (zh) | 2022-03-04 |
CN114134205B CN114134205B (zh) | 2023-11-24 |
Family
ID=80391506
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111409397.6A Active CN114134205B (zh) | 2021-11-25 | 2021-11-25 | 脱氨酶介导的dna中n4-甲基胞嘧啶的单碱基分辨率定位分析方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114134205B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115125292A (zh) * | 2022-06-02 | 2022-09-30 | 武汉大学 | 一种内切酶辅助的rna中肌苷修饰的单碱基分辨率定位分析方法 |
CN116949152A (zh) * | 2023-06-16 | 2023-10-27 | 广州国家实验室 | 一种单碱基水平检测基因组DNA上N4-mC及5mC修饰的测序方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108699598A (zh) * | 2015-10-30 | 2018-10-23 | 新英格兰生物实验室公司 | 通过测序确定修饰的胞嘧啶的组合物和方法 |
CN110358817A (zh) * | 2019-06-25 | 2019-10-22 | 武汉大学 | 脱氨酶辅助的dna中5-羧基胞嘧啶修饰单碱基分辨率定位分析方法 |
-
2021
- 2021-11-25 CN CN202111409397.6A patent/CN114134205B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108699598A (zh) * | 2015-10-30 | 2018-10-23 | 新英格兰生物实验室公司 | 通过测序确定修饰的胞嘧啶的组合物和方法 |
CN110358817A (zh) * | 2019-06-25 | 2019-10-22 | 武汉大学 | 脱氨酶辅助的dna中5-羧基胞嘧啶修饰单碱基分辨率定位分析方法 |
Non-Patent Citations (1)
Title |
---|
DAI Y等: "Quantification and mapping of DNA modifications", RSC CHEM BIOL, vol. 2, no. 4, pages 1096 - 1114, XP055924814, DOI: 10.1039/D1CB00022E * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115125292A (zh) * | 2022-06-02 | 2022-09-30 | 武汉大学 | 一种内切酶辅助的rna中肌苷修饰的单碱基分辨率定位分析方法 |
CN116949152A (zh) * | 2023-06-16 | 2023-10-27 | 广州国家实验室 | 一种单碱基水平检测基因组DNA上N4-mC及5mC修饰的测序方法 |
Also Published As
Publication number | Publication date |
---|---|
CN114134205B (zh) | 2023-11-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2016202081B2 (en) | Methods for detection of nucleotide modification | |
Grunau et al. | Bisulfite genomic sequencing: systematic investigation of critical experimental parameters | |
US7405040B2 (en) | Ligase/polymerase method for detecting cytosine methylation in DNA samples | |
AU2019222723B2 (en) | Methods for the epigenetic analysis of DNA, particularly cell-free DNA | |
CA2399281C (en) | Method for detecting cytosine methylation in dna samples | |
CN114134205B (zh) | 脱氨酶介导的dna中n4-甲基胞嘧啶的单碱基分辨率定位分析方法 | |
EP4047091A1 (en) | Method for detecting target nucleic acid, method for detecting nucleic acid-binding molecule, and method for evaluating nucleic acid-binding ability | |
CN110923314A (zh) | 一组检测SNP位点rs9263726的引物、crRNA序列及其应用 | |
CN115961001A (zh) | Dna甲基转移酶结合胞嘧啶脱氨酶介导的dna中5-甲基胞嘧啶的单碱基定位分析方法 | |
WO2024112441A1 (en) | Double-stranded dna deaminases and uses thereof | |
US20240124867A1 (en) | Bacterial dna cytosine deaminases for mapping dna methylation sites | |
Yang et al. | A genome-phenome association study in native microbiomes identifies a mechanism for cytosine modification in DNA and RNA | |
JP4528475B2 (ja) | 5−位置メチル化変性体の識別方法 | |
US20120183961A1 (en) | Method for functional testing of site-specific dna methylation | |
CN116790733A (zh) | 一种脱氨酶辅助的rna中n6-甲基腺嘌呤的定位分析方法 | |
US7670777B2 (en) | Method for detecting DNA methylation using labelled S-adenosylmethionine analogs | |
CN113862333B (zh) | 一种组合物及其氧化5-甲基胞嘧啶的方法 | |
CN113817723B (zh) | 一种多核苷酸及其标准品、试剂盒与用途 | |
US20230357838A1 (en) | Double-Stranded DNA Deaminases and Uses Thereof | |
CN118207194A (zh) | 人工改造胞嘧啶脱氨酶及dna中5-甲基胞嘧啶单碱基分辨率测序方法 | |
CN117187221A (zh) | 人工改造脱氨酶辅助的dna中5-羟甲基胞嘧啶修饰单碱基分辨率定位分析方法 | |
CN115418391A (zh) | 人工改造脱氨酶辅助的dna中5-甲基胞嘧啶修饰单碱基分辨率定位分析方法 | |
CN115976160A (zh) | 基于点击化学的DNA中5-羧基胞嘧啶(5caC)的富集与定位分析方法 | |
CN117625739A (zh) | 同时进行基因组和甲基化组测序的测序接头组合物、建库方法和测序方法 | |
CN118028272A (zh) | 人工改造脱氨酶辅助的dna中胞嘧啶、5-甲基胞嘧啶和5-羟甲基胞嘧啶定量分析方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |