CN118028272A - 人工改造脱氨酶辅助的dna中胞嘧啶、5-甲基胞嘧啶和5-羟甲基胞嘧啶定量分析方法 - Google Patents
人工改造脱氨酶辅助的dna中胞嘧啶、5-甲基胞嘧啶和5-羟甲基胞嘧啶定量分析方法 Download PDFInfo
- Publication number
- CN118028272A CN118028272A CN202410113179.5A CN202410113179A CN118028272A CN 118028272 A CN118028272 A CN 118028272A CN 202410113179 A CN202410113179 A CN 202410113179A CN 118028272 A CN118028272 A CN 118028272A
- Authority
- CN
- China
- Prior art keywords
- dna
- deamination
- sequencing
- 5hmc
- site
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 title claims abstract description 51
- 238000000034 method Methods 0.000 title claims abstract description 34
- 229940104302 cytosine Drugs 0.000 title claims abstract description 22
- 238000004445 quantitative analysis Methods 0.000 title claims abstract description 14
- RYVNIFSIEDRLSJ-UHFFFAOYSA-N 5-(hydroxymethyl)cytosine Chemical compound NC=1NC(=O)N=CC=1CO RYVNIFSIEDRLSJ-UHFFFAOYSA-N 0.000 title abstract description 44
- LRSASMSXMSNRBT-UHFFFAOYSA-N 5-methylcytosine Chemical compound CC1=CNC(=O)N=C1N LRSASMSXMSNRBT-UHFFFAOYSA-N 0.000 title abstract description 23
- 230000009466 transformation Effects 0.000 title abstract description 6
- 238000006481 deamination reaction Methods 0.000 claims abstract description 59
- 230000009615 deamination Effects 0.000 claims abstract description 56
- 238000012163 sequencing technique Methods 0.000 claims abstract description 42
- 238000011282 treatment Methods 0.000 claims abstract description 22
- 230000003321 amplification Effects 0.000 claims abstract description 18
- 238000003199 nucleic acid amplification method Methods 0.000 claims abstract description 18
- 102000000311 Cytosine Deaminase Human genes 0.000 claims abstract description 17
- 108010080611 Cytosine Deaminase Proteins 0.000 claims abstract description 17
- 238000012408 PCR amplification Methods 0.000 claims abstract description 8
- 238000004364 calculation method Methods 0.000 claims abstract description 5
- 108020004414 DNA Proteins 0.000 claims description 89
- 238000006243 chemical reaction Methods 0.000 claims description 25
- 102000053602 DNA Human genes 0.000 claims description 17
- 230000036425 denaturation Effects 0.000 claims description 16
- 238000004925 denaturation Methods 0.000 claims description 16
- 108020004682 Single-Stranded DNA Proteins 0.000 claims description 13
- 230000004048 modification Effects 0.000 claims description 11
- 238000012986 modification Methods 0.000 claims description 11
- 238000001514 detection method Methods 0.000 claims description 5
- 239000012634 fragment Substances 0.000 claims description 4
- 239000011535 reaction buffer Substances 0.000 claims description 4
- 229920001213 Polysorbate 20 Polymers 0.000 claims description 3
- DBLXOVFQHHSKRC-UHFFFAOYSA-N ethanesulfonic acid;2-piperazin-1-ylethanol Chemical compound CCS(O)(=O)=O.OCCN1CCNCC1 DBLXOVFQHHSKRC-UHFFFAOYSA-N 0.000 claims description 3
- 230000002779 inactivation Effects 0.000 claims description 3
- 235000010486 polyoxyethylene sorbitan monolaurate Nutrition 0.000 claims description 3
- 239000000256 polyoxyethylene sorbitan monolaurate Substances 0.000 claims description 3
- 125000003275 alpha amino acid group Chemical group 0.000 claims 1
- 238000001816 cooling Methods 0.000 claims 1
- 108090000623 proteins and genes Proteins 0.000 abstract description 17
- 102000004169 proteins and genes Human genes 0.000 abstract description 16
- LSNNMFCWUKXFEE-UHFFFAOYSA-M Bisulfite Chemical compound OS([O-])=O LSNNMFCWUKXFEE-UHFFFAOYSA-M 0.000 abstract description 4
- 102000004190 Enzymes Human genes 0.000 abstract description 3
- 108090000790 Enzymes Proteins 0.000 abstract description 3
- 230000035945 sensitivity Effects 0.000 abstract description 2
- 238000000137 annealing Methods 0.000 description 15
- 235000018102 proteins Nutrition 0.000 description 14
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Chemical compound O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 11
- 150000001413 amino acids Chemical group 0.000 description 8
- 239000008367 deionised water Substances 0.000 description 8
- 229910021641 deionized water Inorganic materials 0.000 description 8
- 238000001369 bisulfite sequencing Methods 0.000 description 6
- 108010006785 Taq Polymerase Proteins 0.000 description 5
- 235000001014 amino acid Nutrition 0.000 description 5
- 229940024606 amino acid Drugs 0.000 description 5
- 239000000872 buffer Substances 0.000 description 5
- 238000011534 incubation Methods 0.000 description 5
- 230000004807 localization Effects 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 3
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- NNTOJPXOCKCMKR-UHFFFAOYSA-N boron;pyridine Chemical compound [B].C1=CC=NC=C1 NNTOJPXOCKCMKR-UHFFFAOYSA-N 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 239000004475 Arginine Substances 0.000 description 2
- 108091026890 Coding region Proteins 0.000 description 2
- 230000004544 DNA amplification Effects 0.000 description 2
- 230000008836 DNA modification Effects 0.000 description 2
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 2
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000008827 biological function Effects 0.000 description 2
- 239000003153 chemical reaction reagent Substances 0.000 description 2
- RWSXRVCMGQZWBV-WDSKDSINSA-N glutathione Chemical compound OC(=O)[C@@H](N)CCC(=O)N[C@@H](CS)C(=O)NCC(O)=O RWSXRVCMGQZWBV-WDSKDSINSA-N 0.000 description 2
- 239000005457 ice water Substances 0.000 description 2
- 238000002156 mixing Methods 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 238000007480 sanger sequencing Methods 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 108010091324 3C proteases Proteins 0.000 description 1
- BLQMCTXZEMGOJM-UHFFFAOYSA-N 5-carboxycytosine Chemical compound NC=1NC(=O)N=CC=1C(O)=O BLQMCTXZEMGOJM-UHFFFAOYSA-N 0.000 description 1
- QCAKCQGWSVKCQH-UHFFFAOYSA-N 6-amino-5-(hydroxymethyl)-1h-pyrimidin-2-one;6-amino-5-methyl-1h-pyrimidin-2-one Chemical compound CC1=CNC(=O)N=C1N.NC1=NC(=O)NC=C1CO QCAKCQGWSVKCQH-UHFFFAOYSA-N 0.000 description 1
- 229920000936 Agarose Polymers 0.000 description 1
- 208000005623 Carcinogenesis Diseases 0.000 description 1
- 241000588724 Escherichia coli Species 0.000 description 1
- 102000000340 Glucosyltransferases Human genes 0.000 description 1
- 108010055629 Glucosyltransferases Proteins 0.000 description 1
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 1
- 108010024636 Glutathione Proteins 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 241000430519 Human rhinovirus sp. Species 0.000 description 1
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 1
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 1
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 1
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 1
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 1
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 102000008300 Mutant Proteins Human genes 0.000 description 1
- 108010021466 Mutant Proteins Proteins 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- 102000008579 Transposases Human genes 0.000 description 1
- 108010020764 Transposases Proteins 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- 208000036142 Viral infection Diseases 0.000 description 1
- 235000003704 aspartic acid Nutrition 0.000 description 1
- 239000011324 bead Substances 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- 230000000975 bioactive effect Effects 0.000 description 1
- 230000031018 biological processes and functions Effects 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 125000004432 carbon atom Chemical group C* 0.000 description 1
- 231100000504 carcinogenesis Toxicity 0.000 description 1
- 230000024245 cell differentiation Effects 0.000 description 1
- 230000002759 chromosomal effect Effects 0.000 description 1
- 238000003776 cleavage reaction Methods 0.000 description 1
- 238000001212 derivatisation Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000004049 epigenetic modification Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 229960003180 glutathione Drugs 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 125000004029 hydroxymethyl group Chemical group [H]OC([H])([H])* 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000007481 next generation sequencing Methods 0.000 description 1
- 102000039446 nucleic acids Human genes 0.000 description 1
- 108020004707 nucleic acids Proteins 0.000 description 1
- 150000007523 nucleic acids Chemical class 0.000 description 1
- 230000003647 oxidation Effects 0.000 description 1
- 238000007254 oxidation reaction Methods 0.000 description 1
- 230000001590 oxidative effect Effects 0.000 description 1
- 230000035790 physiological processes and functions Effects 0.000 description 1
- 239000013600 plasmid vector Substances 0.000 description 1
- 108090000765 processed proteins & peptides Proteins 0.000 description 1
- 102000004196 processed proteins & peptides Human genes 0.000 description 1
- 230000006318 protein oxidation Effects 0.000 description 1
- -1 pyridine borane oxide Chemical compound 0.000 description 1
- 125000000714 pyrimidinyl group Chemical group 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 238000006722 reduction reaction Methods 0.000 description 1
- 230000014493 regulation of gene expression Effects 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 238000007634 remodeling Methods 0.000 description 1
- 230000007017 scission Effects 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 238000007671 third-generation sequencing Methods 0.000 description 1
- 230000009385 viral infection Effects 0.000 description 1
- 230000004735 virus-associated carcinogenesis Effects 0.000 description 1
Landscapes
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明公开了一种人工改造脱氨酶辅助的DNA中特定位点胞嘧啶、5‑甲基胞嘧啶和5‑羟甲基胞嘧啶同时定量分析方法,属于生物技术领域。本发明利用人工改造的胞嘧啶脱氨酶eA3A‑M1蛋白实现对DNA中胞嘧啶(C)完全脱氨基、对5‑甲基胞嘧啶(5mC)部分脱氨基、对5‑羟甲基胞嘧啶(5hmC)不脱氨基,随后进行PCR扩增并对扩增产物测序获得5mC的脱氨基率和待测位点的整体脱氨基率,并通过计算直接获得待测位点C、5mC和5hmC的含量信息。本发明方法灵敏度高、选择性高、操作简便,不涉及亚硫酸氢盐处理且无需其他生物酶介导,可以直接获得DNA中特定位点C、5mC和5hmC的定量信息。
Description
技术领域
本发明属于生物技术领域,具体涉及一种人工改造脱氨酶辅助的DNA中特定位点胞嘧啶、5-甲基胞嘧啶和5-羟甲基胞嘧啶修饰同时定量分析方法。
背景技术
5-甲基胞嘧啶(5mC)和5-羟甲基胞嘧啶(5hmC)是哺乳动物DNA中重要的表观遗传修饰。在哺乳动物中,十-十一转座酶(TET)蛋白将5mC嘧啶环第5位碳原子上的甲基氧化成羟甲基,形成5hmC。5mC约占胞嘧啶的1~3%,5hmC约占胞嘧啶的0.1~0.3%,且几乎所有的5mC和5hmC都存在于CpG二核苷酸中。已有大量事实证明,5mC和5hmC参与调控了染色体重塑、基因表达调控、细胞分化以及疾病发生和发展等等复杂的生物过程。此外,5mC和5hmC可以被TET蛋白逐步氧化为5-醛基胞嘧啶(5fC)和5-羧基胞嘧啶(5caC),形成新的修饰。基于5mC和5hmC在一系列生理过程中的重要地位和发挥的关键作用,它们分别被称为DNA中的“第五碱基”和“第六碱基”。迄今为止,对于5mC和5hmC修饰的功能研究一直是核酸表观遗传学的研究热点。为了揭示该修饰精准的生物学功能,则需要依赖于高准确度的定位和定量分析方法。
目前可以对5-甲基胞嘧啶和5-羟甲基胞嘧啶进行定位和定量的方法主要有两类,一是基于亚硫酸氢盐处理的测序方法,包括亚硫酸氢盐测序法、氧化亚硫酸氢盐测序法和TET蛋白辅助亚硫酸氢盐测序法;二是利用生物活性酶介导的测序方法,包括脱氨酶A3A蛋白辅助的测序方法和TET蛋白氧化与A3A脱氨基辅助的测序方法;三是基于吡啶硼烷还原反应的测序方法,包括TET辅助吡啶硼烷测序法、氧化吡啶硼烷测序法和葡萄糖基转移酶封闭后吡啶硼烷测序法。上述方法均只能对DNA中5-甲基胞嘧啶或者5-羟甲基胞嘧啶的单一或者混合信号进行定位和定量分析,例如亚硫酸氢盐测序无法区分5-甲基胞嘧啶和5-羟甲基胞嘧啶,该方法得到的信息为5-甲基胞嘧啶和5-羟甲基胞嘧啶的混合信号。实现分别定位DNA中的5-甲基胞嘧啶5-羟甲胞嘧啶往往需要两种方法联合使用,例如利用亚硫酸氢盐测序获得5-甲基胞嘧啶和5-羟甲基胞嘧啶的混合信号,再使用氧化亚硫酸氢盐测序法获得5-羟甲基胞嘧啶的信号,通过对比两种方法的结果来分别确定胞嘧啶、5-甲基胞嘧啶和5-羟甲基胞嘧啶的定位和定量信息。目前,同时测定DNA中特定位点胞嘧啶、5-甲基胞嘧啶和5-羟甲基胞嘧啶的定量分析方法未见报道。
A3A蛋白是一种胞嘧啶脱氨酶,在病毒感染和癌症发生过程中具有非常关键的功能。野生型A3A(wtA3A)可使单链DNA中的C和5mC有效地脱氨基成为U和T,并可以使5hmC部分脱氨基,其对C的脱氨基能力大于对5mC的脱氨基能力,且其对5mC的脱氨基能力也大于对5hmC的脱氨基能力。因此,wtA3A具有较好的C、5mC和5hmC的底物脱氨筛选能力。如果对wtA3A蛋白进行改造使其保留对C的良好脱氨基能力,但仅能使5mC部分脱氨基,且不能对5hmC脱氨基,则可以直接对DNA中特定位点内C、5mC和5hmC进行同时定量分析而不需要结合其他定位分析方法。
发明内容
本发明的目的在于提供一种人工改造的胞嘧啶脱氨酶eA3A-M1,该胞嘧啶脱氨酶能够对DNA中C完全脱氨基,对5mC部分脱氨基,而不能对5hmC脱氨基。本发明的目的还在于提供一种人工改造的脱氨酶辅助的DNA中特定位点胞嘧啶、5-甲基胞嘧啶和5-羟甲基胞嘧啶修饰同时定量分析方法,即一种能应用于DNA修饰测序领域中,具有高灵敏度、高选择性且操作简便的特定位点胞嘧啶、5-甲基胞嘧啶和5-羟甲基胞嘧啶同时定量分析的测序方法。
本发明通过eA3A-M1蛋白对DNA中同一位点内C完全脱氨基,对5mC部分脱氨基,对5hmC不脱氨基,不需要对5hmC进行转化及保护,直接测序并通过计算获得特定位点内C、5mC和5hmC的定量信息。
本发明的目的通过下述技术方案实现:
一种人工改造的胞嘧啶脱氨酶,其为氨基酸序列如SEQ ID NO.1所示的eA3A-M1蛋白。
所述的胞嘧啶脱氨酶在胞嘧啶脱氨中的应用,所述的胞嘧啶为5mC和/或5hmC。
所述的胞嘧啶脱氨酶在检测C、5mC和/或5hmC中的应用,所述检测包括定位检测、定量检测。
一种人工改造脱氨酶辅助的DNA中5-甲基胞嘧啶和5-羟甲基胞嘧啶修饰定位分析方法,包括如下步骤:
(1)对待检DNA进行变性处理使其形成单链DNA;
(2)用上述人工改造的胞嘧啶脱氨酶eA3A-M1对单链DNA进行脱氨基处理;
(3)对脱氨基的DNA片段进行PCR扩增;
(4)PCR扩增产物进行测序,经eA3A-M1处理的待检DNA中的C位点在测序中被读为T,5mC位点在测序中被读为T/C,5hmC位点在测序中被读为C。
一种人工改造脱氨酶辅助的DNA中特定位点胞嘧啶、5-甲基胞嘧啶和5-羟甲基胞嘧啶修饰定量分析方法,包括如下步骤:
(1)向待检DNA中加入含量为待检DNA质量1%~0.1%的含5mC修饰的内参DNA;
(2)对加入内参DNA的待检DNA进行变性处理使其形成单链DNA;
(3)用上述人工改造的胞嘧啶脱氨酶eA3A-M1对单链DNA进行脱氨基处理;
(4)对脱氨基的DNA片段进行PCR扩增;
(5)PCR扩增产物进行测序,通过内参DNA的测序结果获得5mC的脱氨基率,通过待测DNA的测序结果获得待测位点的整体脱氨基率,根据不同脱氨基处理时间获得的多种脱氨基率组合,计算获得特定位点内C、5mC和5hmC的含量。
以在两个不同的脱氨基处理时间节点取样为例,所述计算的方法具体如下:在脱氨基处理时间1取样,获得待测DNA待测位点的整体脱氨基率R1(待测DNA中待测位点测序结果中T的占比),内参DNA的5mC的脱氨基率R5mC1(内参DNA中5mC位点测序结果中T的占比);在脱氨基处理时间2取样,获得待测DNA待测位点的整体脱氨基率R2,内参DNA的5mC的脱氨基率R5mC2;
将上述数据带入以下方程中:
PC+R5mC1×P5mC=R1
PC+R5mC2×P5mC=R2
PC+P5mC+P5hmC=100%
则待测位点C的含量为:
待测位点5mC的含量为:
待测位点5hmC的含量为:P5hmC=100%-Pc-P5mC。
上述方法中,DNA变性处理的方法优选为:将DNA在90~95℃高温下孵育10~15分钟后立即转入冰浴5~10分钟使双链DNA变性成单链DNA。
上述方法中,单链DNA进行脱氨基处理所使用的脱氨基反应缓冲液中各成分的终浓度优选为20~25mM的4-羟乙基哌嗪乙磺酸和0.01~0.02%(v/v)的Tween-20,pH为6.5~7.0。脱氨基处理反应的条件优选为37℃反应1~2小时,定量分析方法中分别在1小时和2小时的时间节点取样,作为后续扩增的模板。
上述方法中,脱氨基处理后可将反应体系中的脱氨酶进行高温灭活处理,高温灭活处理的条件优选为90~95℃孵育10~15分钟,待反应温度冷却至室温可进行下一步操作。
本发明的技术原理如图1-3所示,改造的eA3A-M1对不同基序的C完全脱氨基成为U,随后通过PCR扩增并在测序中读为T,对5mC部分脱氨基,经PCR扩增后在测序中读作C和T的混合信号,而5hmC能够抵抗eA3A-M1的脱氨基作用,因此通过PCR扩增后在测序中均读为C。通过测定5mC的脱氨基率和该位点整体的脱氨基率,经计算获得DNA中特定位点内胞嘧啶、5-甲基胞嘧啶和5-羟甲基胞嘧啶的定量信息。
本发明的优点及有益效果如下:
本发明提供的特定位点C、5mC和5hmC定量分析方案不依赖于亚硫酸氢盐处理且不涉及其他生物酶的辅助,相对于目前的主流方法而言,操作更简单快捷,更利于推广使用。具体为:
1、本发明中,方法操作简便,无需繁琐的样品前处理,脱氨基处理后可直接进行PCR扩增反应。
2、本发明无需亚硫酸氢盐处理以及随后的纯化处理。
3、本发明无需利用试剂氧化或衍生化试剂标记,极大的缩短了实验的时间。
4、本发明涉及的胞嘧啶脱氨酶对不同基序的胞嘧啶具有高效的脱氨效率(>99%),对不同基序中的5mC部分脱氨基(30~60%)而对不同基序中的5hmC的脱氨基效率较低(<1%)。
5、本发明无需采用昂贵的第三代测序平台,只需采用下一代测序平台技术即可完成5mC和5hmC的单碱基分辨率定位分析。
6、本发明涉及的方法能够广泛应用于不同生物来源5mC和5hmC修饰位点的研究,并有助于对5mC和5hmC的生物学功能进行更加深入的研究。
附图说明
图1为本发明中eA3A-M1对胞嘧啶、5-甲基胞嘧啶和5-羟甲基胞嘧啶的脱氨基结构示意图。
图2为本发明中eA3A-M1对胞嘧啶、5-甲基胞嘧啶和5-羟甲基胞嘧啶的脱氨基定位示意图。
图3为本发明中eA3A-M1对特定位点内胞嘧啶、5-甲基胞嘧啶和5-羟甲基胞嘧啶的定量分析示意图。
图4为本发明中人工合成的分别含有C、5mC和5hmC的DNA链(DNA-C1、DNA-5mC1和DNA-5hmC1)经eA3A-M1脱氨基处理后Sanger测序检测效果。
图5为本发明中人工合成的分别含有C、5mC和5hmC的DNA链(DNA-C2、DNA-5mC2和DNA-5hmC2)按比例混合后,经eA3A-M1脱氨基处理不同时间后测序并通过计算获得C、5mC和5hmC定量信息与理论含量对比的效果图。
具体实施方式
下面结合具体实施例对本发明的技术方案作进一步详细的说明。
实施例1:人工改造的胞嘧啶脱氨酶的筛选
本发明使用的野生型胞嘧啶脱氨酶wtA3A的氨基酸序列参考美国国家生物技术信息中心(NCBI Gene ID:200315),对其进行改造筛选对C完全脱氨基,对5mC部分脱氨基,但不能对5hmC脱氨基的突变蛋白,最后得到eA3A-M1蛋白。eA3A-M1与wtA3A相比仅有5处不同,包括:25位氨基酸和26位氨基酸从甘氨酸和异亮氨酸更改为序列为“谷氨酸脯氨酸色氨酸脯氨酸精氨酸”的短肽,29位氨基酸从组氨酸更改为精氨酸,30位氨基酸从赖氨酸更改为谷氨酰胺,134位氨基酸从脯氨酸更改为苏氨酸,135位氨基酸从亮氨酸更改为天冬氨酸。
eA3A-M1蛋白的编码序列插入pET-41a(+)质粒载体,蛋白N端带有GST标签,C端带有8xHis标签,标签与eA3A-M1蛋白之间含有人鼻病毒3C蛋白酶(HRV 3C)切割位点,蛋白表达于大肠杆菌BL21(DE3)pLySs细胞。蛋白表达后采用谷胱甘肽琼脂糖珠进行纯化,经HRV3C酶切后,分别获得全长的eA3A-M1脱氨酶。
eA3A-M1蛋白的氨基酸序列如下:
MEASPASGPRHLMDPHIFTSNFNNEPWPRGRRQTYLCYEVERLDNGTSVKMDQHRGF
LHNQAKNLLCGFYGRHAELRFLDLVPSLQLDPAQIYRVTWFISWSPCFSWGCAGEVRAFLQ
ENTHVRLRIFAARIYDYDTDYKEALQMLRDAGAQVSIMTYDEFKHCWDTFVDHQGCPFQP
WDGLDEHSQALSGRLRAILQNQGN(SEQ ID NO.1)。
eA3A-M1蛋白的编码序列如下:
atggaagccagcccagcatccgggccccgccacttgatggatccacacatcttcacttccaactttaacaatgagccttggcctcgcgga
cgccgccagacctacctgtgctacgaagtggagcgcctggacaatggcacctcggtcaagatggaccagcacaggggctttctacacaacca
ggctaagaatcttctctgtggcttttacggccgccatgcggagctgcgcttcttggacctggttccttctttgcagttggacccggcccagatctaca
gggtcacttggttcatctcctggagcccctgcttctcctggggctgtgccggggaagtgcgtgcgttccttcaggagaacacacacgtgagactg
cgtatcttcgctgcccgcatctatgattacgacaccgattataaggaggcactgcaaatgctgcgggatgctggggcccaagtctccatcatgac
ctacgatgaatttaagcactgctgggacacctttgtggaccaccagggatgtcccttccagccctgggatggactggatgagcacagccaagcc
ctgagtgggaggctgcgggccattctccagaatcagggaaac(SEQ ID NO.2)。
实施例2:eA3A-M1脱氨基特性确定
商品化合成的分别含有C、5mC和5hmC的DNA链(DNA-C1、DNA-5mC1和DNA-5hmC1)。分别取各DNA 60ng,95℃处理10min后放入冰水浴中处理5min,使双链DNA变性为单链,加入一定量的eA3A-M1(根据所使用的eA3A-M1的实际活性确定最合适的脱氨基浓度),2μL反应缓冲液(反应缓冲液的配制为:将4-羟乙基哌嗪乙磺酸(HEPES)溶解于去离子水中,浓度为200mM,加入0.1%(v/v)的Tween-20,并调节其pH至6.5),加去离子水至反应体系为20μL,在37℃水浴中温育2个小时。随后在95℃水浴中温育10分钟。
取上述反应后的DNA(40ng)进行聚合酶链式扩增反应。反应体系:10×扩增缓冲液5μL,10μmol/L正反向引物各2μL,模板DNA 40ng,Hot Start Taq DNA聚合酶用量10U,补加去离子水至体系为50μL。扩增反应的退火温度根据不同区域选出不同的退火温度;扩增循环时间程序:(1)95℃变性5min;(2)95℃变性30sec;(3)50-72℃退火30sec(退火温度根据引物的长度调节);(4)72℃延伸30sec;(2)-(4)步重复25次;72℃延伸10min,放置4℃进行贮存。样品进行桑格(Sanger)测序。所使用的DNA链的序列及引物序列见下表:
结果见图4,eA3A-M1可以将DNA-C1中不同基序中的C基本完全脱氨基,在测序过程中读作T,可以将DNA-5mC1中不同基序中的5mC部分脱氨基,在测序过程中部分读作T部分读作C,但无法将DNA-5hmC1中不同基序中的5hmC脱氨基,在测序过程中读作C(图4)。该结果表明eA3A-M1对C、5mC和5hmC有截然不同的脱氨基能力。
实施例3:eA3A-M1对DNA中特定位点内的C、5mC和5hmC进行定量分析
商品化合成的分别含有C、5mC和5hmC的DNA链(DNA-C2、DNA-5mC2和DNA-5hmC2),并将三种DNA链进行混合作为待测DNA,使特定位点内C和5mC的含量为30%,5hmC的含量为40%。向混合后的DNA中加入0.1%的内参DNA(5mC spike-in),取上述DNA 60ng,95℃处理10min后放入冰水浴中处理5min,使双链DNA变性为单链,加入一定量的eA3A-M1(根据所使用的eA3A-M1的实际活性确定最合适的脱氨基浓度),2μL反应缓冲液(pH 6.5),加去离子水至反应体系为20μL,在37℃水浴中温育2个小时。随后在95℃水浴中温育10分钟。
37℃水浴中温育1小时后取上述反应后的DNA(30ng)进行聚合酶链式扩增反应。待测DNA扩增,其反应体系:10×扩增缓冲液5μL,10μmol/L正反向引物各2μL,模板DNA 15ng,Hot Start Taq DNA聚合酶用量10U,补加去离子水至体系为50μL。扩增反应的退火温度根据不同区域选出不同的退火温度;扩增循环时间程序:(1)95℃变性5min;(2)95℃变性30sec;(3)50-72℃退火30sec(退火温度根据引物的长度调节);(4)72℃延伸30sec;(2)-(4)步重复25次;72℃延伸10min,放置4℃进行贮存。扩增产物进行桑格(Sanger)测序,获得待测位点的整体脱氨基率R1(待测位点测序结果中T的占比)。内参DNA扩增,其反应体系:10×扩增缓冲液5μL,10μmol/L正反向引物(内参)各2μL,模板DNA 15ng,/>HotStart Taq DNA聚合酶用量10U,补加去离子水至体系为50μL。扩增反应的退火温度根据不同位点选出不同的退火温度;扩增循环时间程序:(1)95℃变性5min;(2)95℃变性30sec;(3)50-72℃退火30sec(退火温度根据引物的长度调节);(4)72℃延伸30sec;(2)-(4)步重复25次;72℃延伸10min,放置4℃进行贮存。样品进行桑格(Sanger)测序,获得5mC的脱氨基率R5mC1(内参DNA中5mC位点测序结果中T的占比)。
37℃水浴中温育2小时后取上述反应后的DNA(30ng)进行聚合酶链式扩增反应。待测DNA扩增,其反应体系:10×扩增缓冲液5μL,10μmol/L正反向引物各2μL,模板DNA 15ng,Hot Start Taq DNA聚合酶用量10U,补加去离子水至体系为50μL。扩增反应的退火温度根据不同区域选出不同的退火温度;扩增循环时间程序:(1)95℃变性5min;(2)95℃变性30sec;(3)50-72℃退火30sec(退火温度根据引物的长度调节);(4)72℃延伸30sec;(2)-(4)步重复25次;72℃延伸10min,放置4℃进行贮存。扩增产物进行桑格(Sanger)测序,获得待测位点的整体脱氨基率R2。内参DNA扩增,其反应体系:10×扩增缓冲液5μL,10μmol/L正反向引物(内参)各2μL,模板DNA 15ng,/>Hot Start Taq DNA聚合酶用量10U,补加去离子水至体系为50μL。扩增反应的退火温度根据不同位点选出不同的退火温度;扩增循环时间程序:(1)95℃变性5min;(2)95℃变性30sec;(3)50-72℃退火30sec(退火温度根据引物的长度调节);(4)72℃延伸30sec;(2)-(4)步重复25次;72℃延伸10min,放置4℃进行贮存。样品进行桑格(Sanger)测序,获得5mC的脱氨基率R5mC2。
将上述数据带入以下方程中:
PC+R5mC1×P5mC=R1
PC+R5mC2×P5mC=R2
PC+P5mC+P5hmC=100%
则待测位点C的含量为:
待测位点5mC的含量为:
待测位点5hmC的含量为:P5hmC=100%-Pc-P5mC。
经检测混合DNA中C的含量为30.1%,5mC的含量为29.5%,5hmC的含量为40.4%(图5),与混合时各种胞嘧啶的含量相近(C与5mC的含量为30%,5hmC为40%)。
所使用的DNA链的序列及引物序列见下表:
上述实施例仅用于举例说明本发明的具体实施方式,本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。
Claims (10)
1.一种人工改造的胞嘧啶脱氨酶,其特征在于:其氨基酸序列如SEQ ID NO.1所示。
2.权利要求1所述的胞嘧啶脱氨酶在胞嘧啶脱氨中的应用,其特征在于:所述的胞嘧啶为C和/或5mC。
3.权利要求1所述的胞嘧啶脱氨酶在检测C、5mC和/或5hmC中的应用,其特征在于:所述检测包括定位检测、定量检测。
4.一种人工改造脱氨酶辅助的DNA中5mC和5hmC修饰定位分析方法,其特征在于:包括如下步骤:
(1)对待检DNA进行变性处理使其形成单链DNA;
(2)用权利要求1所述的胞嘧啶脱氨酶eA3A-M1对单链DNA进行脱氨基处理;
(3)对脱氨基的DNA片段进行PCR扩增;
(4)PCR扩增产物进行测序,经eA3A-M1处理的待检DNA中的C位点在测序中被读为T,5mC位点在测序中被读为T/C,5hmC位点在测序中被读为C。
5.一种人工改造脱氨酶辅助的DNA中特定位点C、5mC和5hmC同时定量分析方法,其特征在于:包括如下步骤:
(1)向待检DNA中加入含量为待检DNA质量1%~0.1%的含5mC修饰的内参DNA;
(2)对加入内参DNA的待检DNA进行变性处理使其形成单链DNA;
(3)用权利要求1所述的胞嘧啶脱氨酶eA3A-M1对单链DNA进行脱氨基处理;
(4)对脱氨基的DNA片段进行PCR扩增;
(5)PCR扩增产物进行测序,经eA3A-M1处理的待检DNA中的C位点在测序中被读为T,5mC位点在测序中被读为T/C,5hmC位点在测序中被读为C;通过内参DNA的测序结果获得5mC的脱氨基率,通过待测DNA的测序结果获得待测位点的整体脱氨基率,根据不同脱氨基处理时间获得多种脱氨基率组合,通过计算获得特定位点内C、5mC和5hmC的含量。
6.根据权利要求4或5所述的方法,其特征在于:DNA变性处理的方法为:将DNA在90~95℃高温下孵育10~15分钟后转入冰浴5~10分钟使双链DNA变性成单链DNA。
7.根据权利要求4或5所述的方法,其特征在于:单链DNA进行脱氨基处理所使用的脱氨基反应缓冲液中各成分的终浓度为20~25mM的4-羟乙基哌嗪乙磺酸和0.01~0.02%的Tween-20,pH为6.5~7.0。
8.根据权利要求4或5所述的方法,其特征在于:脱氨基处理反应的条件为37℃反应1~2小时。
9.根据权利要求5所述的方法,其特征在于:在脱氨基处理反应的1小时和2小时的时间节点取样,作为后续扩增的模板。
10.根据权利要求4所述的方法,其特征在于:脱氨基处理后将反应体系中的胞嘧啶脱氨酶进行高温灭活处理,冷却后进行下一步操作。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410113179.5A CN118028272A (zh) | 2024-01-26 | 2024-01-26 | 人工改造脱氨酶辅助的dna中胞嘧啶、5-甲基胞嘧啶和5-羟甲基胞嘧啶定量分析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410113179.5A CN118028272A (zh) | 2024-01-26 | 2024-01-26 | 人工改造脱氨酶辅助的dna中胞嘧啶、5-甲基胞嘧啶和5-羟甲基胞嘧啶定量分析方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN118028272A true CN118028272A (zh) | 2024-05-14 |
Family
ID=90997705
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410113179.5A Pending CN118028272A (zh) | 2024-01-26 | 2024-01-26 | 人工改造脱氨酶辅助的dna中胞嘧啶、5-甲基胞嘧啶和5-羟甲基胞嘧啶定量分析方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN118028272A (zh) |
-
2024
- 2024-01-26 CN CN202410113179.5A patent/CN118028272A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113166797B (zh) | 基于核酸酶的rna耗尽 | |
CN107541546B (zh) | 用于标靶核酸富集的组合物、方法、系统和试剂盒 | |
Bloch | A biochemical perspective of the polymerase chain reaction | |
CN109055499B (zh) | 基于CRISPR-Cas的等温核酸检测方法及试剂盒 | |
JP5770085B2 (ja) | 粗製核酸サンプルからの直接増幅のための方法 | |
EP1977002A1 (en) | Method for the quantification of nucleic acids, in particular bisulfite treated dna | |
CN108130318B (zh) | 突变型Taq DNA聚合酶、免核酸提取直接PCR扩增的试剂盒及其应用 | |
CN112877410B (zh) | 一种优化的基于crispr介导的核酸检测系统及其检测方法 | |
Bottero et al. | Differentiation of five tuna species by a multiplex primer-extension assay | |
WO2023217291A1 (zh) | 一种聚合酶突变体及其应用 | |
WO2022212584A1 (en) | Bacterial dna cytosine deaminases for mapping dna methylation sites | |
CN110527708A (zh) | 一种区分dna中5-甲基化胞嘧啶和5-羟甲基化胞嘧啶的方法 | |
CN114134205B (zh) | 脱氨酶介导的dna中n4-甲基胞嘧啶的单碱基分辨率定位分析方法 | |
CN118028272A (zh) | 人工改造脱氨酶辅助的dna中胞嘧啶、5-甲基胞嘧啶和5-羟甲基胞嘧啶定量分析方法 | |
WO2005081776A2 (en) | Materials and methods for the detection of sars | |
CN114774399B (zh) | 一种人工改造脱氨酶辅助的dna中5-羟甲基胞嘧啶修饰单碱基分辨率定位分析方法 | |
KR102169528B1 (ko) | 열민감성이 향상된 돌연변이 udg | |
CN112029836A (zh) | 检测braf基因突变的核酸组合物及试剂盒和braf基因突变的检测方法 | |
Ahmed | Differential display (DD) analysis | |
CN117187221A (zh) | 人工改造脱氨酶辅助的dna中5-羟甲基胞嘧啶修饰单碱基分辨率定位分析方法 | |
CN112280832A (zh) | 一种免抽提的核酸检测方法及试剂盒 | |
WO2007039101A1 (en) | Method for the quantification of nucleic acids, in particular bisulfite treated dna | |
JPH1189596A (ja) | Rna量の測定方法並びに測定キット | |
CN118207194A (zh) | 人工改造胞嘧啶脱氨酶及dna中5-甲基胞嘧啶单碱基分辨率测序方法 | |
CN115418391A (zh) | 人工改造脱氨酶辅助的dna中5-甲基胞嘧啶修饰单碱基分辨率定位分析方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |