CN110029149A

CN110029149A - 一种鉴定碱基修饰的方法

Info

Publication number: CN110029149A
Application number: CN201910308739.1A
Authority: CN
Inventors: 骆观正; 张璋
Original assignee: Sun Yat Sen University
Current assignee: Sun Yat Sen University
Priority date: 2019-04-17
Filing date: 2019-04-17
Publication date: 2019-07-19

Abstract

本发明公开了一种鉴定碱基修饰的方法，所述方法包括如下步骤：I、提供待测核酸样本和待鉴定碱基；II、利用能够特异性区分修饰和非修饰的待鉴定碱基的核酸酶对待测核酸样本进行酶切，获得至少一条经核酸酶酶切后的核酸序列；所述核酸酶的识别位点包含所述待鉴定碱基位点，所述核酸酶对识别位点进行切割后形成包含待鉴定碱基位点的第一末端和不包含待鉴定碱基位点的第二末端；III、分析步骤II经核酸酶酶切后的核酸序列，根据经核酸酶酶切后的核酸序列的情形判断待测核酸样本中是否存在该待鉴定碱基的修饰位点。

Description

一种鉴定碱基修饰的方法

技术领域：

本申请涉及一种鉴定碱基修饰的方法，尤其涉及一种鉴定单碱基甲基化修饰的方法。

背景技术

目前已知RNA上有超过100种不同的化学修饰，其中N6-甲基腺嘌呤修饰是真核生物mRNA上含量最高的化学修饰，约占所有腺嘌呤的0.1％-0.4％。N6-甲基腺嘌呤修饰影响mRNA各个阶段的代谢过程，如LncRNA和microRNA的生物合成，影响包括神经发育、细胞命运、免疫应答、DNA损伤应答和肿瘤发生等多种生命活动过程。

由于N6-甲基腺嘌呤修饰的化学性质与正常的腺嘌呤非常相似，所以很难通过化学的方法将其鉴别出来。近年来发展起来的高灵敏度质谱-液相色谱联用(LC-MS/MS)和抗体印迹法(dot blot)被广泛应用于检测N6-甲基腺嘌呤修饰的整体含量。目前最常使用的全转录组范围的N6-甲基腺嘌呤修饰检测方法是基于商业化抗体的免疫沉淀测序法(MeRIP-seq)，即使用商业化的N6-甲基腺嘌呤修饰抗体将已片段化的mRNA片段进行富集，随后进行建库测序，通过生物信息学分析鉴定修饰位点存在的位置。但是这个方法的局限性在于只能确定修饰存在于约100个碱基长度的片段范围内，而不能确定单碱基的修饰位置。随后很多实验室在该方法的基础上进行改进，降低起始mRNA需求量，提高鉴定位点的分辨率，然而并没有更好的单碱基精度的方法。

基于抗体富集的方法不仅有分辨率较低的问题，还存在着重复率低、流程复杂、无法定量计算N6-甲基腺嘌呤修饰比例等问题。因此，急需一种方便简单、全转录组覆盖的单碱基精度的RNA甲基化修饰的检测方法。

发明内容

一方面，本发明提供了一种鉴定碱基修饰的方法，所述方法包括如下步骤：

I、提供待测核酸样本；

II、利用能够特异性的区分修饰和非修饰的待鉴定碱基的核酸酶对待测核酸样本进行酶切，获得至少一条经核酸酶酶切后的核酸序列；所述核酸酶的识别位点包含所述待鉴定碱基，所述核酸酶对识别位点进行切割后形成包含待鉴定碱基的第一末端和不包含待鉴定碱基位点的第二末端；

III、分析步骤II经核酸酶酶切后的核酸序列，根据经核酸酶酶切后的核酸序列的情形判断待测核酸样本中是否存在该待鉴定碱基的修饰位点。

在一个实施方式中，所述核酸酶能够酶切包含非修饰的待鉴定碱基的识别序列，但是不能酶切包含修饰的待鉴定碱基的识别序列；当所述经核酸酶酶切后的核酸序列的全部或部分序列包含非第一末端出现的所述核酸酶的识别位点时，则判断待测核酸样本中存在该待鉴定碱基的修饰位点。

所述非第一末端，可以是在酶切后的全部或部分序列的中间(不包含第一末端出现的识别位点)或第二末端。

在其他的实施方式中，所述核酸酶不能酶切包含非修饰的待鉴定碱基的识别序列，但是能够酶切包含修饰的待鉴定碱基的识别序列；当检测到所述核酸样本被所述核酸酶切割时，则判断待测核酸样本中存在该待鉴定碱基的修饰位点。例如，可以采用聚丙烯酰胺凝胶电泳确定核酸片段的切割情况。

进一步的，在步骤II获得至少一条经核酸酶酶切后的核酸序列后,还包括构建核酸文库以及测序的步骤；优选的，所述核酸文库为小核酸文库。

进一步的，还包括对测序数据进行分析的步骤，所述步骤如下：

(1)将构建的文库测序，获得测序数据；

(2)去除所述测序数据中的接头和/或测序引物，获得待分析测序序列；

(3)如果待分析测序序列的全部或部分序列包含在非第一末端出现的所述核酸酶的识别位点，则判断待测核酸样本中存在该待鉴定碱基的修饰位点。

所述非第一末端，可以是在测序序列的中间(不包含第一末端的识别位点)或另一末端出现的所述核酸酶的识别位点。

进一步的，步骤(2)在获得待分析测序序列后，还包括如下步骤：

计算待分析测序序列中所有出现所述核酸酶识别位点的测序序列数目，计为第一测序序列数；计算待分析测序序列中所有含有在非第一末端出现所述核酸酶识别位点的测序序列数目，计为第二测序序列数；第二测序序列数与第一测序序列数的第一比例即为待测核酸样本中该待鉴定碱基的修饰化的比例。

进一步的，所述每条待分析测序序列的碱基数量不小于m，所述m为大于或等于10的自然数，更优选，m为10、11、12、13、14、15、16、17、18、19或20。

进一步的，第二测序序列数中排除所述核酸酶的识别位点距离第一末端的碱基数量小于或等于m的测序序列，得到优化的第二测序序列数；如此优化可以降低第二测序序列数的假阳性；如果核酸酶识别位点距离第一末端碱基数量小于m，在建库过程中无法将这么短的片段全部成功建库，在序列比对的过程中存在比对错误，进而影响待鉴定碱基的修饰化的比例的计算结果，出现假阳性的修饰位点。

优选的，所述方法还包括对第二测序序列数进行校正的步骤，所述校正为排除第二测序序列数中形成二级结构的序列数，得到校正的第二测序序列数。

进一步的，还包括使用针对修饰的待鉴定碱基去修饰的试剂以及所述核酸酶对待测核酸样本进行处理得到负对照样本，并针对负对照样本进行文库的构建，得到负对照的文库；计算负对照的文库中所述第二测序序列数与第一测序序列数的比例，计为第二比例；如果第二比例小于第一比例，进一步确认待测核酸样本中存在该待鉴定碱基的修饰位点。

进一步的，第二比例相对于第一比例降低至少5％，则进一步确认待测核酸样本中存在该待鉴定碱基的修饰位点。优选的，第二比例相对于第一比例降低至少10％；更优选，至少11％、12％、13％、14％、15％、20％、25％、30％、40％、50％、60％、70％。

进一步的，本发明中的核酸酶可以通过以下方式进行筛选：合成具有固定碱基修饰位点的寡核苷酸序列；优选的，所述寡核苷酸序列的碱基数量为20-30个；利用体外酶切反应筛选能特异性区分修饰和非修饰的碱基的核酸酶。

核酸酶在对核酸序列进行切割时，通常会有特异的识别位点，在识别位点处对核酸序列进行切割，切割之后会形成两个末端，本发明中定义包含待鉴定碱基位点的末端为第一末端，不包含待鉴定碱基位点的为第二末端。

在优选的实施方式中，所述核酸酶可以为对N6-甲基腺嘌呤修饰敏感的RNA核酸内切酶，针对性地只对带有或不带有甲基化修饰的序列进行酶切；采用RNA核酸内切酶MazF，MazF酶可以酶切没有甲基化修饰的ACA序列，而不能够酶切带有甲基化修饰的ACA序列，该酶能够特异性识别ACA序列，并在ACA的5’端的方向上进行酶切，其中，识别序列ACA中5'端A即为待鉴定的甲基化修饰的A。以5'UUGGGGUAUGGACAUGUAUAUAGU 3'序列为例，经MazF酶切后会形成序列1：5'UUGGGGUAUGG3'和序列2：5'ACAUGUAUAUAGU 3'序列，序列1的3'端和序列2的5'端即为经MazF酶酶切后形成的两个末端，其中序列2的5'端包含了待鉴定的A，那么序列2的5'端即为第一末端，序列1的3'端即为第二末端。

再以其他的RNA核酸内切酶为例，假设某RNA内切酶可以酶切没有甲基化修饰的GAC序列，而不能够酶切带有甲基化修饰的GAC序列，该酶能够特异性识别GAC序列，并在GAC的3’端的方向上进行酶切。以5'UUGGGGUAUGGACAUGUAUAUAGU 3'序列为例，经酶切后会形成序列1：5'UUGGGGUAUGGAC3'和序列2：5'AUGUAUAUAGU 3'序列，序列1的3'端和序列2的5'端即为经酶切后形成的两个末端，其中序列1的3'端包含了待鉴定的A，那么序列1的3'端即为第一末端，序列2的5'端即为第二末端。

进一步的，在构建文库之前还包括对酶切后的核酸序列进行末端修复的步骤；优选的，所述末端修复包括使用T4多核苷酸激酶对核酸进行末端修复的步骤。

在一个实施方式中，所述待鉴定碱基位点为DNA或RNA碱基，更优选的，所述DNA或RNA碱基为DNA或RNA单碱基。

在一个实施方式中，所述碱基修饰选自甲基化、乙酰化、磷酸化、腺苷酸化、泛素化等中的一种或多种；更优选的，所述碱基修饰为单碱基甲基化修饰；更优选的，所述单碱基甲基化修饰选自N6-甲基腺嘌呤修饰、N1-甲基腺嘌呤修饰、5-甲基胞嘧啶修饰、7-甲基鸟嘌呤修饰，更优选N6-甲基腺嘌呤修饰。

针对N6-甲基腺嘌呤修饰，在优选的实施方式中，所述核酸酶能够区分N6-甲基腺嘌呤修饰和正常腺嘌呤；例如，核酸酶可以酶切无修饰的腺嘌呤，但是不能酶切N6-甲基腺嘌呤修饰。在优选的实施方式中，所述核酸酶选自MazF、ChpBK中的至少一种；所述MazF酶可以酶切没有甲基化修饰的ACA序列，而不能够酶切带有甲基化修饰的ACA序列，ChpBK只能酶切没有甲基化修饰的UAC序列，而不能够酶切带有甲基化修饰的UAC序列；所述MazF和ChpBK可以为野生型的酶，也可以不影响其特异性切割的突变型的酶；本发明的所需核酸酶可通过大肠杆菌表达纯化，也可直接从商业公司购买。MazF来源于宝日医生物技术(北京)有限公司，其货号为2415A，ChpBK蛋白序列来源于美国国立生物技术信息中心(NCBI)，其序列编号为NP_418646.1。

核酸酶通常会在特异性的识别位点处进行酶切，在优选的实施方式中，所述核酸酶的识别位点中包含待检测的碱基。

对待测核酸样本进行核酸酶酶切后，本发明构建的文库优选为小核酸文库，所述小核酸文库中核酸片段的大小为5～2K nt，优选30～600nt；优选的，所述核酸为RNA。

在一个实施方式中，针对修饰的待鉴定碱基位点去修饰的试剂选自酶；例如，针对甲基化、乙酰化、磷酸化、腺苷酸化、泛素化等可以分别选自去甲基化、去乙酰化、去磷酸化、去腺苷酸化、去泛素化等的酶；在优选的实施方式中，针对N6-甲基腺嘌呤修饰去甲基化的试剂优选去甲基化酶，更优选，针对N6-甲基腺嘌呤修饰去甲基化酶FTO。

优选的，针对小RNA文库的构建方式包括如下步骤：

(1)3’接头与底物变性，(2)3’接头连接，(3)多余3’接头封闭，(4)5’接头连接，(5)cDNA合成，(6)文库富集。

本发明提供了一种快速准确、全转录组范围、单碱基精度的RNA N6-甲基腺嘌呤修饰检测方法。该方法省去了繁琐的抗体富集步骤，使用特异性区分修饰的RNA核酸内切酶进酶切的方法定位修饰位点在mRNA上的具体位置。使用N6-甲基腺嘌呤去甲基化酶处理组作为负对照，极大地降低了所鉴定出的修饰位点的假阳性。使用RNA核酸内切酶进行酶切的方法在鉴定N6-甲基腺嘌呤修饰位点的同时，也能够对甲基化比例进行估算。

本发明采用对N6-甲基腺嘌呤敏感的RNA核酸内切酶，能够特异性地区分特定序列中的腺嘌呤是带有修饰还是不带有修饰的，并针对性地只对带有或不带有甲基化修饰的序列进行酶切。如本研究中使用的RNA核酸内切酶MazF，该酶能够特异性识别ACA序列，并在其5‘端进行酶切，而当ACA序列的第一个碱基为N6-甲基腺嘌呤修饰时，不能进行酶切。

使用这种对甲基化敏感的RNA核酸内切酶酶切mRNA之后，将得到的小片段RNA进行末端修复和纯化，进而使用小RNA建库策略进行高通量测序文库构建并进行测序，通过生物信息学分析鉴定出修饰位点。同时使用N6-甲基腺嘌呤修饰去甲基化酶对mRNA进行处理，使用相同的建库流程建库测序作为数据分析的负对照，用以降低鉴定位点的假阳性。

附图说明

此处所说明的附图用来提供对本申请的进一步理解，构成本申请的一部分，本申请的示意性实施例及其说明用于解释本申请，并不构成对本申请的不当限定。

图1.RNA核酸内切酶MazF对带有和不带有N6-甲基腺嘌呤修饰的RNA寡核苷酸序列进行酶切验证图。

图2.RNA核酸内切酶MazF对不同N6-甲基腺嘌呤修饰比例的RNA寡核苷酸序列进行酶切，其中，酶切的程度和其所含的甲基化比例成正比。

图3.RNA核酸内切酶ChpBK对带有和不带有N6-甲基腺嘌呤修饰的RNA寡核苷酸序列进行酶切。

图4.使用RNA核酸内切酶ChpBK对不同N6-甲基腺嘌呤修饰比例的RNA寡核苷酸序列进行酶切。酶切的程度和其所含的甲基化比例成正比。

图5.本发明建立的N6-甲基腺嘌呤修饰测序方法流程图。

图6.本发明获得测序数据后进行生物信息学分析流程图。

图7.HEK293T细胞系中的N6-甲基腺嘌呤修饰位点在转录本上的分布。

具体实施方案

为了能够更清楚地理解本申请的上述目的、特征和优点，下面结合附图和具体实施方式对本申请进行进一步的详细描述。需要说明的是，在不冲突的情况下，本申请的实施例及实施例中的特征可以相互组合。在下面的描述中阐述了很多具体细节以便于充分理解本申请，但是，本申请还可以采用其他不同于在此描述的其他方式来实施，因此，本申请的保护范围并不受下面公开的具体实施例的限制。

实施例1RNA内切酶MazF和ChpBK酶切RNA寡核苷酸

使用体外合成的RNA寡核苷酸序列进行验证，发现MazF只能酶切没有甲基化修饰的ACA序列，并在ACA的5’端进行切割，而不能够酶切带有甲基化修饰的ACA序列(图1)。我们将带有甲基和不带有甲基的RNA寡核苷酸序列进行混合，使其修饰位点的比例分别为0％,20％,40％,60％,80％,100％,用来模拟体内部分甲基化的情况，并使用MazF酶进行酶切，发现酶切的程度和其所含的甲基化比例成正比(图2)，表明可以使用该酶对N6-甲基腺嘌呤的比例进行估算。本发明的MazF来源于宝日医生物技术(北京)有限公司，其货号为2415A。RNA寡核苷酸序列酶切体系如下：

	总量或终浓度
		mRNA	10pmol
MazF酶	10U
		MazF酶缓冲液(5x)	1x
无酶水(RNase-free H<sub>2</sub>O)	To 50ul

37℃反应30分钟。使用15％Urea-TBE PAGE进行电泳检验。

其中，RNA寡核苷酸序列如下，在带下划线A位点分别合成带有和不带有N6-甲基腺嘌呤的碱基：5'UUUUUGGGGUAUGGACAUGUAUAUAGU 3'

使用体外合成的RNA寡核苷酸序列进行另一种RNA内切核酸酶ChpBK的验证，ChpBK同样具有区分RNA上N6-甲基腺嘌呤修饰的能力，ChpBK只能酶切没有甲基化修饰的UAC序列，并在UAC的A碱基5‘位置进行切割；而不能够酶切带有甲基化修饰的UAC序列(图3)。ChpBK蛋白序列来源于NCBI，序列编号NP_418646.1。我们将带有甲基和不带有甲基的RNA寡核苷酸序列进行混合，使其修饰的比例分别为0％,20％,40％,60％,80％,100％,用来模拟体内部分甲基化的情况，并使用ChpBK酶进行酶切，发现酶切的程度和其所含的甲基化比例成正比(图4)。

RNA寡核苷酸序列如下，在带下划线A位点分别合成带有和不带有N6-甲基腺嘌呤的碱基：5'GUUAGGAGAUAUACAUAUGGUGGUG 3'

实施例2小RNA文库建库流程

采用如图5的方式建立小RNA文库，具体操作如下：

1)去甲基化处理：使用N6-甲基腺嘌呤修饰去甲基化酶FTO对mRNA进行处理作为负对照。mRNA在进行反应之前须在PCR仪中使用85℃加热5分钟，随后立即插冰上2分钟，以去除mRNA的二级结构，去甲基化反应体系如下：

	终浓度或总量
		mRNA	～200ng
N6-甲基腺嘌呤修饰去甲基化酶FTO	2.5ug
		α-酮戊二酸(α-KG)	300uM
硫酸亚铁铵(Fe(NH4)2(SO4)2)	283uM
		抗坏血酸(L-ascorbic acid)	2mM
Tris-HCl缓冲液(pH7.5)	50mM
		RNA酶抑制剂(RNase inhibitor)	20U
无酶水(RNase-free H2O)	To 20ul

室温(25℃)反应3小时，加入1ul 40mM EDTA终止反应，或使用RNA纯化试剂盒进行纯化。

2)MazF酶切反应：在酶切反应之前，使用PCR仪将mRNA 85℃加热5分钟，随后立即插冰上2分钟，以去除mRNA的二级结构。MazF反应体系如下：

	总量或终浓度
		mRNA	～100ng
MazF酶	10U
		MazF酶缓冲液(5x)	1x
无酶水(RNase-free H2O)	To 50ul

37℃反应30分钟，使用RNA纯化试剂盒对该体系进行纯化。

3)末端修复：使用T4多核苷酸激酶(T4Polynucleotide Kinase,T4PNK)对酶切后的mRNA进行末端修复。体系如下：

37℃反应30分钟，使用RNA纯化试剂盒对该体系进行纯化。

4)使用小RNA建库策略进行建库。

使用购买的商用小RNA建库试剂盒(如NEBSmall RNA Library Prep Set)进行建库，建库步骤主要为：

(1)3’接头与底物变性，将酶切后的mRNA和3’接头混合，在PCR仪里加热70℃2分钟，立即拿出插在冰上，尽量去除RNA中的二级结构。

(2)3’接头连接，mRNA与3’接头进行连接反应。

(3)多余3’接头封闭，使用反转录引物对多余3’接头进行封闭。

(4)5’接头连接，mRNA与5’接头进行连接反应。

(5)cDNA合成，使用反转录酶对mRNA片段进行反转录合成cDNA。

(6)文库富集，使用引物对已合成的cDNA进行文库扩增和纯化。

将建好的文库进行高通量测序。

实施例3高通量测序数据分析

采用图6的流程对实施例2得到的小RNA文库进行测序分析，具体步骤如下：

首先对测序数据进行质量控制，去除测序接头，保留剩余片段大于15nt测序短序列(reads)；

使用Hisat2软件将测序数据比对回参考基因组，以得到其在基因组上的具体位置。

从比对结果中定位未被MazF酶切的ACA序列。具体方法为，如果一个ACA序列在测序reads的起始端，即为正常未甲基化的A，因为其是被MazF酶切断的位点；而当ACA序列出现在reads的中部时，即其并未被MazF酶切断，其第一个A即为甲基化位点。由于数据去接头时只保留15nt以上的reads，所以鉴定出的甲基化位点在reads上的位置必须距离reads端点大于15nt，如此可以降低数据的假阳性；

使用RNA二级结构预测软件对存在修饰位点的reads进行二级结构预测，去掉容易形成二级结构的修饰位点；

对每个修饰位点计算甲基化比例，即该位点测到存在于reads中间的数目，除以该位点测到的全部reads数目。对FTO处理组的测序结果进行同样的分析，已鉴定出的修饰位点只有在FTO处理组中甲基化比例下降，才证明其是一个正确的甲基化修饰位点；

通过这样的计算流程得到可靠的单碱基精度的N6-甲基腺嘌呤修饰位点信息。

实施例4对细胞系的mRNA进行N6-甲基腺嘌呤修饰鉴定

使用实施例1-3的方法对细胞系的mRNA进行N6-甲基腺嘌呤修饰鉴定，将鉴定出来的修饰位点在转录本上的位置进行作图，发现修饰位点主要在终止密码子附近富集(图7)，这与之前报道的基于MeRIP-seq的结果一致。

Claims

1.一种鉴定碱基修饰的方法，其特征在于，所述方法包括如下步骤：

I、提供待测核酸样本和待鉴定碱基；

II、利用能够特异性的区分修饰和非修饰的待鉴定碱基的核酸酶对待测核酸样本进行酶切，获得至少一条经核酸酶酶切后的核酸序列；所述核酸酶的识别位点包含待鉴定的碱基，所述核酸酶对识别位点进行切割后形成包含待鉴定碱基的第一末端和不包含待鉴定碱基的第二末端；

III、分析步骤II经核酸酶酶切后的核酸序列，根据经核酸酶酶切后的核酸序列的情形判断待测核酸样本中是否存在待鉴定的碱基修饰位点。

2.根据权利要求1所述的方法，其特征在于，所述核酸酶能够酶切包含非修饰的待鉴定碱基的识别序列，但是不能酶切包含修饰的待鉴定碱基的识别序列；当所述经核酸酶酶切后的核酸序列的全部序列或部分序列包含非第一末端出现的所述核酸酶的识别位点时，则判断待测核酸样本中存在该待鉴定碱基的修饰位点。

3.根据权利要求1所述的方法，其特征在于，所述核酸酶不能酶切包含非修饰的待鉴定碱基的识别序列，但是能够酶切包含修饰的待鉴定碱基的识别序列；当检测到所述核酸样本被所述核酸酶切割时，则判断待测核酸样本中存在该待鉴定碱基的修饰位点。

4.根据权利要求2所述的方法，其特征在于，在步骤II获得至少一条经核酸酶酶切后的核酸序列后,还包括构建核酸文库以及测序的步骤；优选的，所述核酸文库为小核酸文库。

5.根据权利要求4所述的方法，其特征在于，还包括对测序数据进行分析的步骤，所述步骤如下：

(1)将构建的文库进行测序，获得测序数据；

(3)如果待分析测序序列的全部序列或部分序列包含非第一末端出现的所述核酸酶的识别位点，则判断待测核酸样本中存在该待鉴定碱基的修饰位点。

6.根据权利要求5所述的方法，其特征在于，步骤(2)在获得待分析测序序列后，还包括如下步骤：

计算待分析测序序列中所有出现所述核酸酶识别位点的测序序列数目，计为第一测序序列数；

计算待分析测序序列中所有含有在非第一末端出现所述核酸酶识别位点的测序序列数目，计为第二测序序列数；

第二测序序列数与第一测序序列数的第一比例即为待测核酸样本中该待鉴定碱基的修饰化的比例。

7.根据权利要求6所述的方法，其特征在于，所述每条待分析测序序列的碱基数量不小于m，所述m为大于或等于10的自然数，更优选，m为10、11、12、13、14、15、16、17、18、19或20。

8.根据权利要求7所述的方法，其特征在于，第二测序序列数中排除所述核酸酶的识别位点距离第一末端的碱基数量小于或等于m的测序序列，得到优化的第二测序序列数；优选的，所述方法还包括对第二测序序列数进行校正的步骤，所述校正为排除第二测序序列数中形成二级结构的序列数，得到校正的第二测序序列数。

9.根据权利要求6-8任一所述的方法，其特征在于，还包括使用针对修饰的待鉴定碱基去修饰的试剂以及所述核酸酶对待测核酸样本进行处理得到负对照样本，并针对负对照样本进行文库的构建，得到负对照的文库；计算负对照的文库中所述第二测序序列数与第一测序序列数的比例，计为第二比例；如果第二比例小于第一比例，进一步确认待测核酸样本中存在该待鉴定碱基的修饰位点。

10.根据权利要求1-9任一所述的方法，其特征在于，所述待鉴定碱基为DNA或RNA碱基，更优选的，所述DNA或RNA碱基为DNA或RNA单碱基；更优选的，所述修饰选自甲基化、乙酰化、磷酸化、腺苷酸化、泛素化修饰中的一种或多种；更优选的，所述碱基修饰为单碱基甲基化修饰；更优选的，所述单碱基甲基化修饰为N6-甲基腺嘌呤修饰。