CN118028272A

CN118028272A - 人工改造脱氨酶辅助的dna中胞嘧啶、5-甲基胞嘧啶和5-羟甲基胞嘧啶定量分析方法

Info

Publication number: CN118028272A
Application number: CN202410113179.5A
Authority: CN
Inventors: 袁必锋; 谢能彬; 王敏
Original assignee: Wuhan University WHU
Current assignee: Wuhan University WHU
Priority date: 2024-01-26
Filing date: 2024-01-26
Publication date: 2024-05-14

Abstract

本发明公开了一种人工改造脱氨酶辅助的DNA中特定位点胞嘧啶、5‑甲基胞嘧啶和5‑羟甲基胞嘧啶同时定量分析方法，属于生物技术领域。本发明利用人工改造的胞嘧啶脱氨酶eA3A‑M1蛋白实现对DNA中胞嘧啶(C)完全脱氨基、对5‑甲基胞嘧啶(5mC)部分脱氨基、对5‑羟甲基胞嘧啶(5hmC)不脱氨基，随后进行PCR扩增并对扩增产物测序获得5mC的脱氨基率和待测位点的整体脱氨基率，并通过计算直接获得待测位点C、5mC和5hmC的含量信息。本发明方法灵敏度高、选择性高、操作简便，不涉及亚硫酸氢盐处理且无需其他生物酶介导，可以直接获得DNA中特定位点C、5mC和5hmC的定量信息。

Description

人工改造脱氨酶辅助的DNA中胞嘧啶、5-甲基胞嘧啶和5-羟甲基胞嘧啶定量分析方法

技术领域

本发明属于生物技术领域，具体涉及一种人工改造脱氨酶辅助的DNA中特定位点胞嘧啶、5-甲基胞嘧啶和5-羟甲基胞嘧啶修饰同时定量分析方法。

背景技术

5-甲基胞嘧啶(5mC)和5-羟甲基胞嘧啶(5hmC)是哺乳动物DNA中重要的表观遗传修饰。在哺乳动物中，十-十一转座酶(TET)蛋白将5mC嘧啶环第5位碳原子上的甲基氧化成羟甲基，形成5hmC。5mC约占胞嘧啶的1～3％，5hmC约占胞嘧啶的0.1～0.3％，且几乎所有的5mC和5hmC都存在于CpG二核苷酸中。已有大量事实证明，5mC和5hmC参与调控了染色体重塑、基因表达调控、细胞分化以及疾病发生和发展等等复杂的生物过程。此外，5mC和5hmC可以被TET蛋白逐步氧化为5-醛基胞嘧啶(5fC)和5-羧基胞嘧啶(5caC)，形成新的修饰。基于5mC和5hmC在一系列生理过程中的重要地位和发挥的关键作用，它们分别被称为DNA中的“第五碱基”和“第六碱基”。迄今为止，对于5mC和5hmC修饰的功能研究一直是核酸表观遗传学的研究热点。为了揭示该修饰精准的生物学功能，则需要依赖于高准确度的定位和定量分析方法。

目前可以对5-甲基胞嘧啶和5-羟甲基胞嘧啶进行定位和定量的方法主要有两类，一是基于亚硫酸氢盐处理的测序方法，包括亚硫酸氢盐测序法、氧化亚硫酸氢盐测序法和TET蛋白辅助亚硫酸氢盐测序法；二是利用生物活性酶介导的测序方法，包括脱氨酶A3A蛋白辅助的测序方法和TET蛋白氧化与A3A脱氨基辅助的测序方法；三是基于吡啶硼烷还原反应的测序方法，包括TET辅助吡啶硼烷测序法、氧化吡啶硼烷测序法和葡萄糖基转移酶封闭后吡啶硼烷测序法。上述方法均只能对DNA中5-甲基胞嘧啶或者5-羟甲基胞嘧啶的单一或者混合信号进行定位和定量分析，例如亚硫酸氢盐测序无法区分5-甲基胞嘧啶和5-羟甲基胞嘧啶，该方法得到的信息为5-甲基胞嘧啶和5-羟甲基胞嘧啶的混合信号。实现分别定位DNA中的5-甲基胞嘧啶5-羟甲胞嘧啶往往需要两种方法联合使用，例如利用亚硫酸氢盐测序获得5-甲基胞嘧啶和5-羟甲基胞嘧啶的混合信号，再使用氧化亚硫酸氢盐测序法获得5-羟甲基胞嘧啶的信号，通过对比两种方法的结果来分别确定胞嘧啶、5-甲基胞嘧啶和5-羟甲基胞嘧啶的定位和定量信息。目前，同时测定DNA中特定位点胞嘧啶、5-甲基胞嘧啶和5-羟甲基胞嘧啶的定量分析方法未见报道。

A3A蛋白是一种胞嘧啶脱氨酶，在病毒感染和癌症发生过程中具有非常关键的功能。野生型A3A(wtA3A)可使单链DNA中的C和5mC有效地脱氨基成为U和T，并可以使5hmC部分脱氨基，其对C的脱氨基能力大于对5mC的脱氨基能力，且其对5mC的脱氨基能力也大于对5hmC的脱氨基能力。因此，wtA3A具有较好的C、5mC和5hmC的底物脱氨筛选能力。如果对wtA3A蛋白进行改造使其保留对C的良好脱氨基能力，但仅能使5mC部分脱氨基，且不能对5hmC脱氨基，则可以直接对DNA中特定位点内C、5mC和5hmC进行同时定量分析而不需要结合其他定位分析方法。

发明内容

本发明的目的在于提供一种人工改造的胞嘧啶脱氨酶eA3A-M1，该胞嘧啶脱氨酶能够对DNA中C完全脱氨基，对5mC部分脱氨基，而不能对5hmC脱氨基。本发明的目的还在于提供一种人工改造的脱氨酶辅助的DNA中特定位点胞嘧啶、5-甲基胞嘧啶和5-羟甲基胞嘧啶修饰同时定量分析方法，即一种能应用于DNA修饰测序领域中，具有高灵敏度、高选择性且操作简便的特定位点胞嘧啶、5-甲基胞嘧啶和5-羟甲基胞嘧啶同时定量分析的测序方法。

本发明通过eA3A-M1蛋白对DNA中同一位点内C完全脱氨基，对5mC部分脱氨基，对5hmC不脱氨基，不需要对5hmC进行转化及保护，直接测序并通过计算获得特定位点内C、5mC和5hmC的定量信息。

本发明的目的通过下述技术方案实现：

一种人工改造的胞嘧啶脱氨酶，其为氨基酸序列如SEQ ID NO.1所示的eA3A-M1蛋白。

所述的胞嘧啶脱氨酶在胞嘧啶脱氨中的应用，所述的胞嘧啶为5mC和/或5hmC。

所述的胞嘧啶脱氨酶在检测C、5mC和/或5hmC中的应用，所述检测包括定位检测、定量检测。

一种人工改造脱氨酶辅助的DNA中5-甲基胞嘧啶和5-羟甲基胞嘧啶修饰定位分析方法，包括如下步骤：

(1)对待检DNA进行变性处理使其形成单链DNA；

(2)用上述人工改造的胞嘧啶脱氨酶eA3A-M1对单链DNA进行脱氨基处理；

(3)对脱氨基的DNA片段进行PCR扩增；

(4)PCR扩增产物进行测序，经eA3A-M1处理的待检DNA中的C位点在测序中被读为T，5mC位点在测序中被读为T/C，5hmC位点在测序中被读为C。

一种人工改造脱氨酶辅助的DNA中特定位点胞嘧啶、5-甲基胞嘧啶和5-羟甲基胞嘧啶修饰定量分析方法，包括如下步骤：

(1)向待检DNA中加入含量为待检DNA质量1％～0.1％的含5mC修饰的内参DNA；

(2)对加入内参DNA的待检DNA进行变性处理使其形成单链DNA；

(3)用上述人工改造的胞嘧啶脱氨酶eA3A-M1对单链DNA进行脱氨基处理；

(4)对脱氨基的DNA片段进行PCR扩增；

(5)PCR扩增产物进行测序，通过内参DNA的测序结果获得5mC的脱氨基率，通过待测DNA的测序结果获得待测位点的整体脱氨基率，根据不同脱氨基处理时间获得的多种脱氨基率组合，计算获得特定位点内C、5mC和5hmC的含量。

以在两个不同的脱氨基处理时间节点取样为例，所述计算的方法具体如下：在脱氨基处理时间1取样，获得待测DNA待测位点的整体脱氨基率R₁(待测DNA中待测位点测序结果中T的占比)，内参DNA的5mC的脱氨基率R_5mC1(内参DNA中5mC位点测序结果中T的占比)；在脱氨基处理时间2取样，获得待测DNA待测位点的整体脱氨基率R₂，内参DNA的5mC的脱氨基率R_5mC2；

将上述数据带入以下方程中：

P_C+R_5mC1×P_5mC＝R₁

P_C+R_5mC2×P_5mC＝R₂

P_C+P_5mC+P_5hmC＝100％

则待测位点C的含量为：

待测位点5mC的含量为：

待测位点5hmC的含量为：P_5hmC＝100％-P_c-P_5mC。

上述方法中，DNA变性处理的方法优选为：将DNA在90～95℃高温下孵育10～15分钟后立即转入冰浴5～10分钟使双链DNA变性成单链DNA。

上述方法中，单链DNA进行脱氨基处理所使用的脱氨基反应缓冲液中各成分的终浓度优选为20～25mM的4-羟乙基哌嗪乙磺酸和0.01～0.02％(v/v)的Tween-20，pH为6.5～7.0。脱氨基处理反应的条件优选为37℃反应1～2小时，定量分析方法中分别在1小时和2小时的时间节点取样，作为后续扩增的模板。

上述方法中，脱氨基处理后可将反应体系中的脱氨酶进行高温灭活处理，高温灭活处理的条件优选为90～95℃孵育10～15分钟，待反应温度冷却至室温可进行下一步操作。

本发明的技术原理如图1-3所示，改造的eA3A-M1对不同基序的C完全脱氨基成为U，随后通过PCR扩增并在测序中读为T，对5mC部分脱氨基，经PCR扩增后在测序中读作C和T的混合信号，而5hmC能够抵抗eA3A-M1的脱氨基作用，因此通过PCR扩增后在测序中均读为C。通过测定5mC的脱氨基率和该位点整体的脱氨基率，经计算获得DNA中特定位点内胞嘧啶、5-甲基胞嘧啶和5-羟甲基胞嘧啶的定量信息。

本发明的优点及有益效果如下：

本发明提供的特定位点C、5mC和5hmC定量分析方案不依赖于亚硫酸氢盐处理且不涉及其他生物酶的辅助，相对于目前的主流方法而言，操作更简单快捷，更利于推广使用。具体为：

1、本发明中，方法操作简便，无需繁琐的样品前处理，脱氨基处理后可直接进行PCR扩增反应。

2、本发明无需亚硫酸氢盐处理以及随后的纯化处理。

3、本发明无需利用试剂氧化或衍生化试剂标记，极大的缩短了实验的时间。

4、本发明涉及的胞嘧啶脱氨酶对不同基序的胞嘧啶具有高效的脱氨效率(>99％)，对不同基序中的5mC部分脱氨基(30～60％)而对不同基序中的5hmC的脱氨基效率较低(<1％)。

5、本发明无需采用昂贵的第三代测序平台，只需采用下一代测序平台技术即可完成5mC和5hmC的单碱基分辨率定位分析。

6、本发明涉及的方法能够广泛应用于不同生物来源5mC和5hmC修饰位点的研究，并有助于对5mC和5hmC的生物学功能进行更加深入的研究。

附图说明

图1为本发明中eA3A-M1对胞嘧啶、5-甲基胞嘧啶和5-羟甲基胞嘧啶的脱氨基结构示意图。

图2为本发明中eA3A-M1对胞嘧啶、5-甲基胞嘧啶和5-羟甲基胞嘧啶的脱氨基定位示意图。

图3为本发明中eA3A-M1对特定位点内胞嘧啶、5-甲基胞嘧啶和5-羟甲基胞嘧啶的定量分析示意图。

图4为本发明中人工合成的分别含有C、5mC和5hmC的DNA链(DNA-C1、DNA-5mC1和DNA-5hmC1)经eA3A-M1脱氨基处理后Sanger测序检测效果。

图5为本发明中人工合成的分别含有C、5mC和5hmC的DNA链(DNA-C2、DNA-5mC2和DNA-5hmC2)按比例混合后，经eA3A-M1脱氨基处理不同时间后测序并通过计算获得C、5mC和5hmC定量信息与理论含量对比的效果图。

具体实施方式

下面结合具体实施例对本发明的技术方案作进一步详细的说明。

实施例1：人工改造的胞嘧啶脱氨酶的筛选

本发明使用的野生型胞嘧啶脱氨酶wtA3A的氨基酸序列参考美国国家生物技术信息中心(NCBI Gene ID:200315)，对其进行改造筛选对C完全脱氨基，对5mC部分脱氨基，但不能对5hmC脱氨基的突变蛋白，最后得到eA3A-M1蛋白。eA3A-M1与wtA3A相比仅有5处不同，包括：25位氨基酸和26位氨基酸从甘氨酸和异亮氨酸更改为序列为“谷氨酸脯氨酸色氨酸脯氨酸精氨酸”的短肽，29位氨基酸从组氨酸更改为精氨酸，30位氨基酸从赖氨酸更改为谷氨酰胺，134位氨基酸从脯氨酸更改为苏氨酸，135位氨基酸从亮氨酸更改为天冬氨酸。

eA3A-M1蛋白的编码序列插入pET-41a(+)质粒载体，蛋白N端带有GST标签，C端带有8xHis标签，标签与eA3A-M1蛋白之间含有人鼻病毒3C蛋白酶(HRV 3C)切割位点，蛋白表达于大肠杆菌BL21(DE3)pLySs细胞。蛋白表达后采用谷胱甘肽琼脂糖珠进行纯化，经HRV3C酶切后，分别获得全长的eA3A-M1脱氨酶。

eA3A-M1蛋白的氨基酸序列如下：

MEASPASGPRHLMDPHIFTSNFNNEPWPRGRRQTYLCYEVERLDNGTSVKMDQHRGF

LHNQAKNLLCGFYGRHAELRFLDLVPSLQLDPAQIYRVTWFISWSPCFSWGCAGEVRAFLQ

ENTHVRLRIFAARIYDYDTDYKEALQMLRDAGAQVSIMTYDEFKHCWDTFVDHQGCPFQP

WDGLDEHSQALSGRLRAILQNQGN(SEQ ID NO.1)。

eA3A-M1蛋白的编码序列如下：

atggaagccagcccagcatccgggccccgccacttgatggatccacacatcttcacttccaactttaacaatgagccttggcctcgcgga

cgccgccagacctacctgtgctacgaagtggagcgcctggacaatggcacctcggtcaagatggaccagcacaggggctttctacacaacca

ggctaagaatcttctctgtggcttttacggccgccatgcggagctgcgcttcttggacctggttccttctttgcagttggacccggcccagatctaca

gggtcacttggttcatctcctggagcccctgcttctcctggggctgtgccggggaagtgcgtgcgttccttcaggagaacacacacgtgagactg

cgtatcttcgctgcccgcatctatgattacgacaccgattataaggaggcactgcaaatgctgcgggatgctggggcccaagtctccatcatgac

ctacgatgaatttaagcactgctgggacacctttgtggaccaccagggatgtcccttccagccctgggatggactggatgagcacagccaagcc

ctgagtgggaggctgcgggccattctccagaatcagggaaac(SEQ ID NO.2)。

实施例2：eA3A-M1脱氨基特性确定

商品化合成的分别含有C、5mC和5hmC的DNA链(DNA-C1、DNA-5mC1和DNA-5hmC1)。分别取各DNA 60ng，95℃处理10min后放入冰水浴中处理5min，使双链DNA变性为单链，加入一定量的eA3A-M1(根据所使用的eA3A-M1的实际活性确定最合适的脱氨基浓度)，2μL反应缓冲液(反应缓冲液的配制为：将4-羟乙基哌嗪乙磺酸(HEPES)溶解于去离子水中，浓度为200mM，加入0.1％(v/v)的Tween-20，并调节其pH至6.5)，加去离子水至反应体系为20μL，在37℃水浴中温育2个小时。随后在95℃水浴中温育10分钟。

取上述反应后的DNA(40ng)进行聚合酶链式扩增反应。反应体系：10×扩增缓冲液5μL，10μmol/L正反向引物各2μL，模板DNA 40ng，Hot Start Taq DNA聚合酶用量10U，补加去离子水至体系为50μL。扩增反应的退火温度根据不同区域选出不同的退火温度；扩增循环时间程序：(1)95℃变性5min；(2)95℃变性30sec；(3)50-72℃退火30sec(退火温度根据引物的长度调节)；(4)72℃延伸30sec；(2)-(4)步重复25次；72℃延伸10min，放置4℃进行贮存。样品进行桑格(Sanger)测序。所使用的DNA链的序列及引物序列见下表：

结果见图4，eA3A-M1可以将DNA-C1中不同基序中的C基本完全脱氨基，在测序过程中读作T，可以将DNA-5mC1中不同基序中的5mC部分脱氨基，在测序过程中部分读作T部分读作C，但无法将DNA-5hmC1中不同基序中的5hmC脱氨基，在测序过程中读作C(图4)。该结果表明eA3A-M1对C、5mC和5hmC有截然不同的脱氨基能力。

实施例3：eA3A-M1对DNA中特定位点内的C、5mC和5hmC进行定量分析

商品化合成的分别含有C、5mC和5hmC的DNA链(DNA-C2、DNA-5mC2和DNA-5hmC2)，并将三种DNA链进行混合作为待测DNA，使特定位点内C和5mC的含量为30％，5hmC的含量为40％。向混合后的DNA中加入0.1％的内参DNA(5mC spike-in)，取上述DNA 60ng，95℃处理10min后放入冰水浴中处理5min，使双链DNA变性为单链，加入一定量的eA3A-M1(根据所使用的eA3A-M1的实际活性确定最合适的脱氨基浓度)，2μL反应缓冲液(pH 6.5)，加去离子水至反应体系为20μL，在37℃水浴中温育2个小时。随后在95℃水浴中温育10分钟。

37℃水浴中温育1小时后取上述反应后的DNA(30ng)进行聚合酶链式扩增反应。待测DNA扩增，其反应体系：10×扩增缓冲液5μL，10μmol/L正反向引物各2μL，模板DNA 15ng，Hot Start Taq DNA聚合酶用量10U，补加去离子水至体系为50μL。扩增反应的退火温度根据不同区域选出不同的退火温度；扩增循环时间程序：(1)95℃变性5min；(2)95℃变性30sec；(3)50-72℃退火30sec(退火温度根据引物的长度调节)；(4)72℃延伸30sec；(2)-(4)步重复25次；72℃延伸10min，放置4℃进行贮存。扩增产物进行桑格(Sanger)测序，获得待测位点的整体脱氨基率R₁(待测位点测序结果中T的占比)。内参DNA扩增，其反应体系：10×扩增缓冲液5μL，10μmol/L正反向引物(内参)各2μL，模板DNA 15ng，/>HotStart Taq DNA聚合酶用量10U，补加去离子水至体系为50μL。扩增反应的退火温度根据不同位点选出不同的退火温度；扩增循环时间程序：(1)95℃变性5min；(2)95℃变性30sec；(3)50-72℃退火30sec(退火温度根据引物的长度调节)；(4)72℃延伸30sec；(2)-(4)步重复25次；72℃延伸10min，放置4℃进行贮存。样品进行桑格(Sanger)测序，获得5mC的脱氨基率R_5mC1(内参DNA中5mC位点测序结果中T的占比)。

37℃水浴中温育2小时后取上述反应后的DNA(30ng)进行聚合酶链式扩增反应。待测DNA扩增，其反应体系：10×扩增缓冲液5μL，10μmol/L正反向引物各2μL，模板DNA 15ng，Hot Start Taq DNA聚合酶用量10U，补加去离子水至体系为50μL。扩增反应的退火温度根据不同区域选出不同的退火温度；扩增循环时间程序：(1)95℃变性5min；(2)95℃变性30sec；(3)50-72℃退火30sec(退火温度根据引物的长度调节)；(4)72℃延伸30sec；(2)-(4)步重复25次；72℃延伸10min，放置4℃进行贮存。扩增产物进行桑格(Sanger)测序，获得待测位点的整体脱氨基率R₂。内参DNA扩增，其反应体系：10×扩增缓冲液5μL，10μmol/L正反向引物(内参)各2μL，模板DNA 15ng，/>Hot Start Taq DNA聚合酶用量10U，补加去离子水至体系为50μL。扩增反应的退火温度根据不同位点选出不同的退火温度；扩增循环时间程序：(1)95℃变性5min；(2)95℃变性30sec；(3)50-72℃退火30sec(退火温度根据引物的长度调节)；(4)72℃延伸30sec；(2)-(4)步重复25次；72℃延伸10min，放置4℃进行贮存。样品进行桑格(Sanger)测序，获得5mC的脱氨基率R_5mC2。

将上述数据带入以下方程中：

P_C+R_5mC1×P_5mC＝R₁

P_C+R_5mC2×P_5mC＝R₂

P_C+P_5mC+P_5hmC＝100％

则待测位点C的含量为：

待测位点5mC的含量为：

待测位点5hmC的含量为：P_5hmC＝100％-P_c-P_5mC。

经检测混合DNA中C的含量为30.1％，5mC的含量为29.5％，5hmC的含量为40.4％(图5)，与混合时各种胞嘧啶的含量相近(C与5mC的含量为30％，5hmC为40％)。

所使用的DNA链的序列及引物序列见下表：

上述实施例仅用于举例说明本发明的具体实施方式，本发明的实施方式并不受上述实施例的限制，其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化，均应为等效的置换方式，都包含在本发明的保护范围之内。

Claims

1.一种人工改造的胞嘧啶脱氨酶，其特征在于：其氨基酸序列如SEQ ID NO.1所示。

2.权利要求1所述的胞嘧啶脱氨酶在胞嘧啶脱氨中的应用，其特征在于：所述的胞嘧啶为C和/或5mC。

3.权利要求1所述的胞嘧啶脱氨酶在检测C、5mC和/或5hmC中的应用，其特征在于：所述检测包括定位检测、定量检测。

4.一种人工改造脱氨酶辅助的DNA中5mC和5hmC修饰定位分析方法，其特征在于：包括如下步骤：

(1)对待检DNA进行变性处理使其形成单链DNA；

(2)用权利要求1所述的胞嘧啶脱氨酶eA3A-M1对单链DNA进行脱氨基处理；

(3)对脱氨基的DNA片段进行PCR扩增；

5.一种人工改造脱氨酶辅助的DNA中特定位点C、5mC和5hmC同时定量分析方法，其特征在于：包括如下步骤：

(2)对加入内参DNA的待检DNA进行变性处理使其形成单链DNA；

(3)用权利要求1所述的胞嘧啶脱氨酶eA3A-M1对单链DNA进行脱氨基处理；

(4)对脱氨基的DNA片段进行PCR扩增；

(5)PCR扩增产物进行测序，经eA3A-M1处理的待检DNA中的C位点在测序中被读为T，5mC位点在测序中被读为T/C，5hmC位点在测序中被读为C；通过内参DNA的测序结果获得5mC的脱氨基率，通过待测DNA的测序结果获得待测位点的整体脱氨基率，根据不同脱氨基处理时间获得多种脱氨基率组合，通过计算获得特定位点内C、5mC和5hmC的含量。

6.根据权利要求4或5所述的方法，其特征在于：DNA变性处理的方法为：将DNA在90～95℃高温下孵育10～15分钟后转入冰浴5～10分钟使双链DNA变性成单链DNA。

7.根据权利要求4或5所述的方法，其特征在于：单链DNA进行脱氨基处理所使用的脱氨基反应缓冲液中各成分的终浓度为20～25mM的4-羟乙基哌嗪乙磺酸和0.01～0.02％的Tween-20，pH为6.5～7.0。

8.根据权利要求4或5所述的方法，其特征在于：脱氨基处理反应的条件为37℃反应1～2小时。

9.根据权利要求5所述的方法，其特征在于：在脱氨基处理反应的1小时和2小时的时间节点取样，作为后续扩增的模板。

10.根据权利要求4所述的方法，其特征在于：脱氨基处理后将反应体系中的胞嘧啶脱氨酶进行高温灭活处理，冷却后进行下一步操作。