CN110938674B

CN110938674B - 甲基化测序dna文库的构建方法及其应用

Info

Publication number: CN110938674B
Application number: CN201911233926.4A
Authority: CN
Inventors: 黄晓强; 刘菲菲; 区小华; 陈禹欣; 杨娟; 赵薇薇; 于世辉
Original assignee: Guangzhou Kingmed Diagnostics Group Co ltd
Current assignee: Guangzhou Kingmed Diagnostics Group Co ltd
Priority date: 2019-12-05
Filing date: 2019-12-05
Publication date: 2024-03-19
Anticipated expiration: 2039-12-05
Also published as: CN110938674A

Abstract

本发明涉及一种甲基化测序DNA文库的构建方法，包括：a)使用一端带接头的随机引物和/或半随机引物扩增重亚硫酸盐处理后的单链DNA，得到同时具有所述接头和所述单链DNA互补链的中间体DNA；其中所述接头具有由衔接物连接在一起的两段测序接头序列，且所述衔接物具有AP位点；b)用单链DNA环化连接酶将所述中间体DNA的两端连接得到环化DNA；以及c)使用APE酶切割所述环化DNA中的AP位点以去环化。该方法构建的文库多样性好，且基本不影响后续的测序过程。

Description

甲基化测序DNA文库的构建方法及其应用

技术领域

本发明涉及分子生物学领域，具体而言，涉及一种甲基化测序DNA文库的构建方法及其应用。

背景技术

DNA甲基化是表观遗传学(Epigenetics)的重要组成部分，在维持正常细胞功能、遗传印记、胚胎发育以及人类肿瘤发生中起着重要作用，是目前新的研究热点之一。甲基化的主要形式有5-甲基胞嘧啶，N6-甲基腺嘌呤和7-甲基鸟嘌呤。原核生物中CCA/TGG和GATC常被甲基化，而真核生物中甲基化仅发生于胞嘧啶。DNA的甲基化是在DNA甲基化转移酶(DNMTs)的作用下使CpG二核苷酸5'端的胞嘧啶转变为5'甲基胞嘧啶(5’mC)。这种DNA修饰方式并没有改变基因序列，但是它调控了基因的表达。脊椎动物基因的甲基化状态有三种：持续的低甲基化状态，如管家基因；去甲基化状态，如发育阶段中的一些基因；高度甲基化状态，如女性的一条失活的X染色体。

最近研究表明，DNA甲基化水平和模式的改变是肿瘤发生的一个重要因素，包括抑癌基因或MMR基因的高甲基化和基因组DNA低甲基化状态。从而导致基因印记丢失，细胞过度增长，不合适的细胞特异性表达，基因组脆性增加，以及内寄生序列(endoparasiticsequence)的激活，最终也导致肿瘤发生。例如，hMLH1是重要的错配修复基因，MLH1启动子甲基化导致的表达缺失可能致使微卫星不稳定(MSI)，与散发性结直肠癌的发生、发展相关。所以甲基化可以作为肿瘤等早期诊断的生物标记物和预后评估指标，对肿瘤的筛查和风险评估、早期诊断、预后判断及治疗监测都具有重要的意义。

目前DNA甲基化检测技术包括焦磷酸测序法(Pyrosequencing)、定量甲基化位点特异性PCR法(Methylight、MS-HRM)等。二者均采用甲基化微点特异的引物扩增目的CpG，然后经过焦磷酸测序或荧光定量PCR方法检测目的位点。二者只能完成单一位点检测，效率低，通量低。DNA甲基化的功能单位不是单个CpG，而是整个基因启动子区域或染色体，乃至基因组水平的甲基化模式发生变化。因此焦磷酸测序法(Pyrosequencing)、定量甲基化位点特异性PCR法等低通量的甲基化检测技术已无法满足当前表观遗传学研究的要求。

发明内容

无论是焦磷酸测序法(Pyrosequencing)还是定量甲基化位点特异性PCR法(Methylight、MS-HRM)等均存在效率低，通量低等缺点。本发明提供一种新颖的甲基化DNA文库的构建方法，可以通过配合高通量测序全面地高效地检测基因组范围内的甲基化模式。

具体的，本发明涉及一种甲基化测序DNA文库的构建方法，包括：

a)使用一端带接头的随机引物和/或半随机引物扩增重亚硫酸盐处理后的单链DNA，得到同时具有所述接头和所述单链DNA互补链的中间体DNA；

其中所述接头具有由衔接物连接在一起的两段测序接头序列，且所述衔接物具有AP位点；

b)用单链DNA环化连接酶将所述中间体DNA的两端连接得到环化DNA；以及

c)使用APE酶切割所述环化DNA中的AP位点以去环化。

与现有技术相比，本发明的有益效果为：

本发明利用PCR扩增合成方法使单链DNA接上5’接头，并利用ssDNA环化连接酶使单链DNA的3’端接上接头，APE酶水解AP位点，即形成带双端接头的DNA文库。该方法构建的文库多样性好，且基本不影响后续的测序过程。

附图说明

为了更清楚地说明本发明具体实施方式或现有技术中的技术方案，下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施方式，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明一个实施例中亚硫酸氢盐处理后经EB染色的ssDNA的凝胶电泳图；

图2为本发明一个实施例中DNA甲基化文库质控分析结果；

图3为本发明一个实施例中DNA测序后的甲基化比对结果；

图4为非经典的DNA甲基化模式的非对称性甲基化修饰示意图。

具体实施方式

现将详细地提供本发明实施方式的参考，其一个或多个实例描述于下文。提供每一实例作为解释而非限制本发明。实际上，对本领域技术人员而言，显而易见的是，可以对本发明进行多种修改和变化而不背离本发明的范围或精神。例如，作为一个实施方式的部分而说明或描述的特征可以用于另一实施方式中，来产生更进一步的实施方式。

因此，旨在本发明覆盖落入所附权利要求的范围及其等同范围中的此类修改和变化。本发明的其它对象、特征和方面公开于以下详细描述中或从中是显而易见的。本领域普通技术人员应理解本讨论仅是示例性实施方式的描述，而非意在限制本发明更广阔的方面。

本发明涉及一种甲基化测序DNA文库的构建方法，包括：

c)使用APE酶切割所述环化DNA中的AP位点以去环化。

在一些实施方式中，步骤c)后还包括，在酶切后的DNA的至少一段添加标签序列(index/barcode)。

APE酶即脱嘌呤/脱嘧啶(AP)核酸内切酶，其家族共有4种类型的酶，在本发明中，APE酶可以为I型或II型APE，其只要能切开AP位点即可。Ⅰ型APE在AP位点的3'端通过β-消除作用切开核酸链，在AP位点处生成3'-OH以及带有5'-磷酸基团的正常核酸链；Ⅱ型APE在AP位点的5'端通过水解作用切开核酸链，在AP位点处生成5'-磷酸基团以及带有3'-OH的正常核酸链。由于APE1的活性较高，因而优选APE 1酶。

AP位点即缺嘌呤/缺嘧啶位点，也被称作是缺碱基位点、脱碱基位点、无碱基位点。在本发明中，AP位点也可以为dSpacer所表示，例如“abasic dSpacer furan”。

在一些实施方式中，所述半随机引物中G碱基的含量低于25％，例如低于23％、20％、17％、15％、13％。

在一些实施方式中，所述半随机引物中不含G碱基；

和/或；

在一些实施方式中，所述半随机引物中仅含有一个G碱基。

在一些实施方式中，当所述半随机引物中仅含有一个G碱基时，G碱基位于所述半随机引物的基本中段位置。

在一些实施方式中，所述半随机引物的长度为6nt～10nt，优选8nt。

在一个具体的实施方式中，所述半随机引物的序列为HHHHHHHH，H＝A/C/T中的任一种；

和/或；

在一个具体的实施方式中，所述半随机引物的序列为HHHHGHHH，H＝A/C/T中的任一种。

人基因组中的GC比例约为40％，而经过亚硫酸氢盐处理后，C碱基比例大大降低，造成一个不平衡碱基比例。本发明据此设计的半随机引物大大降低了随机引物的冗余度，能够有效提高其与重亚硫酸盐处理后的单链DNA的退火结合效率。

在哺乳动物中，经典CpG位点为对称性甲基化修饰，非经典的DNA甲基化模式(包括CHG与CHH)是非对称性甲基化修饰(如图4所示)。i)由于甲基化的C碱基基本不受亚硫酸氢盐处理影响，HHHHGHHH序列既可以特异性结合经典CpG位点的+链与-链，也可以匹配甲基化状态的CHG与CHH位点的+链；ii)HHHHHHHH序列特异性结合非甲基化状态的CHG与CHH位点的+链与-链。以此实现半随机引物对各类型甲基化位点的全面匹配，并有效提高引物对甲基化位点的匹配效率。

在一些实施方式中，所述衔接物完全由AP位点构成。

本发明优选的测序接头序列，二者经过随机引物所形成的序列能形成发夹结构，提高单链DNA的稳定性。

在一些实施方式中，所述单链DNA由基因组DNA及任选的外源DNA片段化得到，所述基因组DNA及所述外源DNA独立地选自植物或动物DNA。

在一些实施方式中，所述植物是拟南芥。

在一些实施方式中，所述动物是昆虫(例如秀丽线虫)、斑马鱼或哺乳动物。

在一些实施方式中，所述哺乳动物是人、大鼠或小鼠。

在一些实施方式中，所述基因组DNA为动物DNA，且其来源为血液、血浆、细胞培养上清、脑脊液、唾液、精液、羊水、绒毛、组织或细胞裂解液、骨骼或毛发。

在一些实施方式中，所述血液为外周血或骨髓血。

本文使用的“组织或细胞裂解物”也可与“裂解物”、“裂解的样品”、“组织或细胞提取物”等用语通用，表示包含裂解的组织或细胞的样品和/或生物样品材料，即其中组织或细胞的结构完整性已经被破坏。为了释放细胞或组织样品的内容物，通常用酶和/或化学试剂处理所述材料，以溶解、降解或破坏这样的组织或细胞的细胞壁和细胞膜。熟练的技术员非常熟悉用于得到裂解物的适当方法。该过程被术语“裂解”包括。

在一些实施方式中，重亚硫酸盐处理单链DNA之前或之后被片段化。

在一些实施方式中，所述片段化的方法为超声随机打断。片段化的对象可以为单链DNA，也可以为双链DNA(片段化后再处理为单联并进行重亚硫酸盐处理)。

在一些实施方式中，所述片段化后DNA的长度可以为20bp～5kb，例如20bp、30bp、40bp、50bp、100bp、200bp、300bp、400bp、500bp、600bp、700bp、800bp、900bp、1kb、1.1kb、1.2kb、1.3kb、1.4kb、1.5kb、1.6kb、1.7kb、1.8kb、1.9kb、2kb、3kb、4kb、5kb，或上述任意两个数值组成的范围值。其优选的长度为约200bp～600bp。

在一些实施方式中，所述外源DNA为是没有甲基化修饰的λDNA。

所述单链DNA优选与外源DNA(特别是没有甲基化修饰的λDNA)一起用重亚硫酸盐处理，如利用DNA Methylation-Gold^TMKit(ZYMO)使非甲基化胞嘧啶转换为尿嘧啶。外源基的作用是在重亚硫酸盐处理时与样品一起高效共处理，对微量的DNA片段起到保护作用，最大限度的降低重亚硫酸盐对微量DNA的破坏。

根据本发明的再一方面，本发明还涉及试剂盒，其包括如上任一项方法中所定义的：带接头的随机引物、APE酶以及单链DNA环化连接酶。

在一些实施方式中，其还包括重亚硫酸盐、DNA聚合酶、标签序列、dNTP、水、DNA提取体系以及没有甲基化修饰的λDNA中的一种或多种。

在一些实施方式中，所述水通常没有核酸及核酸酶，例如双蒸水或去离子水。水为蒸馏水(Distilled Water)、去离子水(Deionized Water)、反渗水(Reverse osmosisWater)。

在一些实施方式中，所述DNA聚合酶选自Taq、Bst、Vent、Phi29、Pfu、Tru、Tth、Tl1、Tac、Tne、Tma、Tih、Tf1、Pwo、Kod、Sac、Sso、Poc、Pab、Mth、Pho、ES4 DNA聚合酶、Klenow片段中的一种或多种。

在一些实施方式中，所述基因组DNA通过饱和苯酚-氯仿法、硅胶吸附柱法、树脂提取法或磁珠提取法提取；在一些实施方式中，所述DNA提取体系用于实现上述DNA提取方法。

如上所述方法或如上所述的试剂盒在甲基化测序中的应用。

在一些实施方式中，其中甲基化测序为是第二代测序。

下面将结合实施例对本发明的实施方案进行详细描述。

实施例1

(1)核酸纯化与片段化

本实施例检测的为外周血样本，采用核酸提取试剂盒(包括硅胶吸附柱法，磁珠法等)提取或纯化生物样本中的DNA，经分光光度仪或者Qubit法测定DNA浓度。

(2)亚硫酸氢盐处理

取200ng片段化后的DNA，采用DNA Methylation-Gold^TMKit(ZYMO Research)(或Epiject等其他市售试剂盒)进行亚硫酸氢盐处理，具体操作步骤详见说明书；在该过程中重亚硫酸盐使DNA中未发生5m甲基化的胞嘧啶脱氨基转变成尿嘧啶，而甲基化的胞嘧啶保持不变。在后续的文库构建中尿嘧啶会转变为胸腺嘧啶，并对文库进行测序，通过与参考基因组序列比对，判断是否CpG位点的甲基化状态。22μl无核酸酶水洗脱。取1μl洗脱液经EB染色凝胶电泳，如图1所示，观察到ssDNA的片段分布大概在200～600bp。

(3)ssDNA随机扩增与添加标签

设计合成两种带特定接头的8nt半随机引物，结构如下：i)5’P-GATCGGAAGAGCACACGTCTGAACTCCAGTC(A1)-θ-ACACTCTTTCCCTACACGACGCTCTTCCGATC(A2)-HHHHGHHH 3’；ii)5’P-A1-θ-A2-HHHHHHHH 3’。其中P是磷酸基团；A1与A2分别是特异性接头；θ是abasic dSpacer furan位点，可特异性地被APE 1酶剪切。下划线标注的序列表示8nt半随机序列，H＝T/A/C。

该扩增体系为：DNA Polymerase I,Large(Klenow)Fragment(Invitrogen^TM)1μl(0.5U)，上述ssDNA洗脱液22μl，0.5mM dNTP 1μl，100μM带标签的8nt随机引物1μl，无核酸酶水5μl。吹打混匀后，微离心，25℃孵育15min。使用60μl Ampure XP磁珠纯化，12μl无核酸酶水洗脱。

(4)第二链ssDNA环化

利用ssDNA Ligase(单链DNA环化连接酶)使上述单链DNA产物发生自身环化。首先，80℃孵育上述单链DNA产物10min，使之变性。然后配制以下体系：12μl Single-stranded DNA，2μL CircLigase II 10X Reaction Buffer，1μL 50mM MnCl₂，4μL 5MBetaine，1μL CircLigase II ssDNA Ligase(100U)。60℃孵育60min，80℃10min。

(5)环化ssDNA去环化

该步骤的作用是APE 1酶切断θ位点，重新形成单链DNA产物。同时在ssDNA的两端分别连接上A1、A2接头。该体系为：3μl 10x NEBuffer 4，1μl APE1酶(10U)，6μl无核酸酶水，20μl上述反应液。PCR程序为37℃孵育60min。使用45μl Ampure XP磁珠纯化，20μl无核酸酶水洗脱。

(6)文库扩增

该步骤的作用是采用含测序所需要的样本标签的引物扩增ssDNA。引物如下：

P1：5′-AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATC*T-3

P2：5-CAAGCAGAAGACGGCATACGAGATNNNNNNGTGACTGGAGTTCAGACGTGTGCTCTTCCGATC-s-T-3′；

其中NNNNNN为6nt唯一样本标签(N＝A/T/C/G)。该体系为：25μl 2x KAPA HiFiHotStart ReadyMix，5μl primer mix，20μl上述反应液。PCR程序为98℃孵育45s，10个循环：98℃15s，65℃30s，72℃30s；72℃孵育60s。使用45μl Ampure XP磁珠纯化，20μl无核酸酶水洗脱。使用Qubit3.0检测文库浓度，合格文库(>1ng/μL)放置于-20℃保存。DNA甲基化文库使用安捷伦Agilent 2100生物分析仪进行质控分析，如图2所示，观察到其文库片段分布在200bp～700bp之间。

(7)DNA测序

采用IlluminaNovaseq6000平台对上述DNA甲基化文库进行150bp配对末端测序。使用FastQC与Trim Galore软件对原始数据进行质量评估与低质量碱基序列剔除；使用Bismark软件(http://www.bioinformatics.babraham.ac.uk/projects/bismark/)将干净数据与人参考基因组进行比对，并识别甲基化C碱基。数据比对显示如图3所示。

实施例2

本实施例检测的为组织样本，采用核酸提取试剂盒(包括硅胶吸附柱法，磁珠法等)提取或纯化生物样本中的DNA，经分光光度仪或者Qubit法测定DNA浓度。使用超声打断等方法使所述DNA断裂为200bp～500bp长的片段。

步骤(2)～(7)与实施例1一致。

对比例

采用公开号CN110305946A，公开日为2019年10月08日，优先权日为2019年07月18日的发明专利中的实施例1作为对比例，其检测样本与实施例1相同，从其结果来看，由于其测序过程中需要引入大量的核苷酸同聚物序列以及其互补序列，会对后续的测序结果造成分辨失真，测序质量较差。

本发明利用PCR扩增合成方法使单链DNA接上5’接头，并利用ssDNA环化连接酶使单链DNA的3’端接上接头，APE酶水解AP位点，即形成带双端接头的DNA文库。该方法没有引入多余的甲基基团修饰位点，且接头是在重亚硫酸盐处理后加上的，不会由于亚硫酸氢盐处理导致更多的片段断裂；针对单联稳定性相对较差的问题，优选对接头序列进行优化；构建的文库多样性好，且基本不影响后续的测序过程。

以上所述实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本发明的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干变形和改进，这些都属于本发明的保护范围。因此，本发明专利的保护范围应以所附权利要求为准。

Claims

1.甲基化测序DNA文库的构建方法，包括：

a) 使用一端带接头的半随机引物扩增重亚硫酸盐处理后的单链DNA，得到同时具有所述接头和所述单链DNA互补链的中间体DNA；所述半随机引物的序列为HHHHHHHH和HHHHGHHH，且H=A/C/T；

其中所述接头具有由衔接物连接在一起的两段测序接头序列，且所述衔接物具有AP位点；所述单链DNA由基因组DNA及外源DNA片段化得到，所述外源DNA为没有甲基化修饰的λDNA，所述基因组DNA为哺乳动物DNA；

b) 用单链DNA环化连接酶将所述中间体DNA的两端连接得到环化DNA；以及

c) 使用APE酶切割所述环化DNA中的AP位点以去环化；

步骤c)后还包括，在酶切后的DNA的至少一段添加标签序列。

2.根据权利要求1所述的甲基化测序DNA文库的构建方法，所述衔接物完全由AP位点构成。

3.根据权利要求1~2任一项所述的甲基化测序DNA文库的构建方法，所述哺乳动物DNA的来源为血液、脑脊液、唾液、精液、羊水、绒毛、组织、骨骼或毛发。

4.根据权利要求1~2任一项所述的甲基化测序DNA文库的构建方法，所述哺乳动物DNA的来源为血浆。

5.根据权利要求1~2任一项所述的甲基化测序DNA文库的构建方法，所述哺乳动物DNA的来源为细胞培养上清或细胞裂解物。

6.根据权利要求1所述的甲基化测序DNA文库的构建方法，所述片段化的方法为超声随机打断。

7.一种哺乳动物甲基化测序DNA文库的构建试剂盒，其包括权利要求1~6任一项中所定义的：带接头的半随机引物、APE酶、标签序列、单链DNA环化连接酶以及没有甲基化修饰的λDNA。

8.权利要求1~6任一项所述的方法或权利要求7所述的试剂盒在哺乳动物甲基化测序中的应用，所述应用为非诊断目的的。

9.根据权利要求8所述的应用，其中甲基化测序为第二代测序。