CN110195095A

CN110195095A - 一种新的基因组甲基化文库的构建方法和应用

Info

Publication number: CN110195095A
Application number: CN201810162430.1A
Authority: CN
Inventors: 戴珩; 柴燕群; 章扬; 黄炳顶; 史耀舟; 张伟
Original assignee: Shanghai Whale Boat Gene Technology Co Ltd
Current assignee: Shanghai Whale Boat Gene Technology Co Ltd
Priority date: 2018-02-27
Filing date: 2018-02-27
Publication date: 2019-09-03

Abstract

本发明提供了一种甲基化测序文库的构建方法。具体地，本发明通过重亚硫酸盐处理构建文库，可同时检测经CT转化的原始链和未经CT转化的互补链序列，直接找出甲基化位点；本发明构建的文库保留了一半未经CT转化的碱基，可大大提高文库碱基平衡性，大幅提高测序质量。

Description

一种新的基因组甲基化文库的构建方法和应用

技术领域

本发明涉及基因检测领域，更具体地涉及一种新的基因组甲基化文库的构建方法和应用。

背景技术

DNA甲基化是指在DNA甲基化转移酶作用下，将甲基选择性地添加到胞嘧啶上形成5-胞嘧啶的生化过程。DNA甲基化是最早发现的一种可逆、可遗传的基因表观修饰方式之一，DNA甲基化通常抑制基因表达，去甲基化则诱导了基因的重新活化和表达。甲基化异常是癌症中一种常见的表观遗传学改变，大量研究表明甲基化异常与肿瘤的发生、发展、细胞癌变有着密切的联系。近年来全基因组甲基化的高通量测序分析让研究人员能够通过甲基化基因组的测序而鉴定和追踪甲基化模式。

DNA甲基化高通量测序的方法常见的有如下几种：

1.甲基化DNA免疫沉淀测序(MeDIP-Seq)

MeDIP-Seq法基于DNA免疫共沉淀技术，通过5'-甲基胞嘧啶抗体特异性富集基因组上发生甲基化的DNA片段，然后进行高通量测序。该方法可以在全基因组水平上进行高精度的CpG密集的高甲基化区域研究，但缺点是无法获得单碱基分辨率的信号。

2.全基因组甲基化测序(WGBS)

WGBS法基于全基因组重亚硫酸盐转化方法，和Illumina高通量测序平台相结合，是目前甲基化测序的金标准。基因组样品经重亚硫酸盐处理后，甲基化的胞嘧啶(C)保持不变，未发生甲基化的胞嘧啶(C)转换成尿嘧啶(U)，在PCR扩增后变成胸腺嘧啶(T)，与原本具有甲基化修饰的胞嘧啶(C)区分开来。再结合高通量测序，可绘制单碱基分辨率的全基因组DNA甲基化图谱。但要达到要求的测序深度，测序成本比较高。

3.简化基因组甲基化测序(RRBS)

RRBS法基于酶切原理，利用限制性内切酶MspI对基因组进行酶切富集CpG区域，再经重亚硫酸盐处理后进行高通量测序。该技术显著提高了CpG区域的测序深度，降低测序成本，但受内切酶位点限制，不能完全覆盖CpG区域。

基于重亚硫酸盐转化的甲基化测序，可将DNA修饰信息转化为碱基信息，但在BS转化过程中DNA经历极端环境处理，最终会造成较大的损伤，并且DNA以单链和双链的混合状态存在，如用传统WGBS的双链连接接头构建文库，BS转化过程导致～90％的DNA模板丢失,使得建库起始量高，有效数据量低。有优化建库流程可先BS转化再从单链DNA构建文库，这种策略可降低BS处理对预文库的损伤，提高模板利用率，降低建库起始量，一定程度上可增加有效测序数据。但BS转化后基因组中大多数的胞嘧啶(C)都会转变为胸腺嘧啶(T)，造成碱基不平衡，在生物信息学分析过程中大大降低含有非甲基化胞嘧啶的reads比对率，导致不能得到完整的全基因组甲基化图谱，限制了WGBS的实际应用。

因此，本领域迫切需要开发新的基因组甲基化文库的构建方法，以弥补WGBS文库构建流程中BS转化对DNA损伤和文库碱基不平衡的缺陷，拓宽甲基化研究的应用范围。

发明内容

本发明的目的在于提供一种新的基因组甲基化文库的构建方法和应用。

在本发明的第一方面，提供了一种甲基化测序文库的构建方法，所述方法包括步骤(图1)：

(a)提供一待测样本，将样本中的DNA打断，从而得到片段化DNA；

(b)将所述片段化DNA的5′-磷酸基团去除，从而得到5′去磷酸化DNA；

(c)对所述5′去磷酸化DNA进行补平反应，从而得到5′去磷酸化的平末端DNA；

(d)将所述平末端DNA与具有茎环结构的第一衔接子进行连接反应，从而得到第一连接产物；

(e)利用5-methyl-dCTP，以第一连接产物的一条单链为模板进行扩增反应，从而得到第一扩增产物；和

(f)利用所述的第一扩增产物得到甲基化测序文库；

其中，所述的第一扩增产物包含：

(i)具有从5′到3′的式A结构的第一扩增产物A，和

(ii)具有从5′到3′的式B结构的第一扩增产物B，

S_a-L-S_bm (A)

S_b-L-S_am (B)

式中，

各“-”独立地为键；

S_a为所述第一连接产物的一条单链；

S_b为所述第一连接产物的一条单链，且S_b的序列与S_a的序列反向互补；

S_am以S_b为模板合成，S_am为S_b的互补链，且S_am中的碱基C均为甲基化碱基C；

S_bm以S_a为模板合成，S_bm为S_a的互补链，且S_bm中的碱基C均为甲基化碱基C；

L为第一衔接子。

在另一优选例中，所述的第一衔接子具有从5′到3′的式C结构：

L₁-L₀-L₂ (C)

式中，

各“-”独立地为键；

L₁和L₂为核苷酸连接序列，且L₁和L₂互补；

L₀为长度为4-20bp的间隔序列。

在另一优选例中，所述的L₀与L₁和L₂均不互补。

在另一优选例中，所述的L₁中的碱基C均为未甲基化的碱基C，且L₂中的碱基C均为甲基化碱基C。

在另一优选例中，所述的第一衔接子的5′端有磷酸化修饰，且3′端没有磷酸化修饰。

在另一优选例中，所述的第一衔接子的序列如SEQ ID NO.:1所示。

在另一优选例中，所述的步骤(f)还包括步骤(图2)：

(1)利用重亚硫酸盐处理，将第一扩增产物中未甲基化的碱基C转换为碱基U，从而得到第一转换产物；和

(2)将第一转换产物与第二衔接子进行连接反应，从而得到甲基化测序文库，其中，所述的第二衔接子为Methyl-Seq DNA Library Kit(Swift30024)中提供的Adapter 1和Adapter 2。

在另一优选例中，所述的第一转换产物为单链DNA。

在另一优选例中，在步骤(1)中，所述的未甲基化的碱基C为S_a链和S_b链中未甲基化的碱基C。

在另一优选例中，在步骤(2)中，利用Methyl-Seq DNA Library Kit(Swift30024)的Adaptase^TM技术进行连接反应，得到双链DNA文库(图3)。

在另一优选例中，所述的连接反应包括步骤：

(A)将Adapter 1与第一转换产物连接，从而得到第二连接产物，较佳地，与第一转换产物的3′端连接；

(B)对第二连接产物进行延伸反应，从而得到互补双链；

(C)将Adapter 2与所述互补双链连接，从而得到双链连接产物，较佳地，与互补双链的5′端连接；和

(D)对所述的双链连接产物进行indexing PCR扩增，从而得到甲基化测序文库。

在另一优选例中，在步骤(D)中，利用引物P5TruSeq LT Adapter和P7TruSeq LTAdapter进行indexing PCR扩增。

在另一优选例中，所述的引物P5TruSeq LT Adapter的核苷酸序列如SEQ ID NO.3所示。

在另一优选例中，所述的引物P7TruSeq LT Adapter的核苷酸序列如SEQ ID NO.4所示。

在另一优选例中，所述的步骤(f)还包括步骤(图4)：

(I)将第一扩增产物与第三衔接子进行连接反应，从而得到第三连接产物，其中，所述的第三衔接子具有茎环结构，且环形结构中带有碱基U，较佳地所述的第三衔接子为NEBNext Methylated Adaptor，；

(II)利用重亚硫酸盐处理，将第三连接产物中未甲基化的碱基C转换为碱基U，从而得到第二转换产物；和

(III)对第二转换产物进行扩增反应，从而得到甲基化测序文库。

在另一优选例中，在步骤(I)中，在第一扩增产物的3′端加A，从而与第三衔接子进行TA连接反应。

在另一优选例中，所述的第三衔接子为甲基化衔接子。

在另一优选例中，在步骤(I)中，还包括用USER酶切除所述第三连接产物上的NEBNext Methylated Adaptor中碱基U的步骤。

在另一优选例中，切除第三衔接子环形结构中的碱基U，从而使得所述的第三连接产物一端为具有茎环结构的第一衔接子，另一端为具有Y型结构的第三衔接子。

在另一优选例中，在步骤(III)中，利用NEBNext Universal Primer和index(X)primer进行扩增反应。

在另一优选例中，在步骤(III)中，利用U不敏感的PCR扩增酶进行扩增反应。

在另一优选例中，所述的PCR扩增酶包括KAPA HiFi Uracil+(KAPA KK2801)

在另一优选例中，在步骤(III)中，所述的扩增反应的轮数为11～13轮。

在另一优选例中，所述片段化DNA的长度为150～180bp。

在另一优选例中，在步骤(a)中，利用超声波将样本中的DNA打断。

在另一优选例中，在步骤(a)中，利用超声波DNA破碎仪(covarisS220)将样本中的DNA打断。

在另一优选例中，在步骤(b)中，利用T4多聚核苷酸激酶将所述片段化DNA的5′-磷酸基团去除。

在另一优选例中，所述T4多聚核苷酸激酶的3′磷酸酶活性是缺失的。

在另一优选例中，所述的T4多聚核苷酸激酶包括2S Hyb DNALibrary Kit(Swift Biosciences 23096)中的RepairⅠ、和/或T4多聚核苷酸激酶(NEBM0236)，优选的是Swift的RepairⅠ。

在另一优选例中，在步骤(b)中，还包括对所述的5′去磷酸化DNA进行纯化反应的步骤。

在另一优选例中，所述的纯化反应利用Agencourt AMPure XP磁珠进行。

在另一优选例中，在步骤(c)中，利用T4DNA聚合酶进行补平反应。

在另一优选例中，在步骤(c)中，所述的补平反应包括补平所述5′去磷酸化DNA的5′突出端、和/或切除所述5′去磷酸化DNA的3′突出末端。

在另一优选例中，所述的T4DNA聚合酶具有5′→3′方向的合成活性和3′→5′方向的外切核酸酶活性。

在另一优选例中，所述的T4DNA聚合酶包括2S Hyb DNA LibraryKit(Swift Biosciences 23096)中的RepairⅡ、和/或T4DNA聚合酶(NEB M0203)，优选的是Swift的RepairⅡ。

在另一优选例中，在步骤(c)中，还包括对所述的平末端DNA进行纯化反应的步骤。

在另一优选例中，在步骤(d)中，所述的连接反应为平末端连接。

在另一优选例中，在步骤(d)中，所述平末端DNA的3′端与所述第一衔接子的5′端连接，且所述平末端DNA的5′端与所述第一衔接子的3′端未连接。

在另一优选例中，在步骤(d)中，利用T4DNA连接酶进行连接反应。

在另一优选例中，所述的T4DNA连接酶包括：Blunt/TA Ligase Master Mix(NEBM0367)、Quick Ligation^TMKit(NEB M2200)和T4DNA ligase(NEB M0202)，优选的用Blunt/TA Ligase Master Mix。

在另一优选例中，在步骤(d)中，所述连接反应的反应温度为22-28℃，且反应时间为10-30min。

在另一优选例中，在步骤(d)的连接反应中，所述第一衔接子和平末端DNA的摩尔比为(20-100):1，较佳地为50:1。

在另一优选例中，在步骤(d)中，还包括对所述的第一连接产物进行纯化反应的步骤。

在另一优选例中，在步骤(e)中，利用具有链置换特性的酶进行扩增反应。

在另一优选例中，所述的具有链置换特性的酶包括DNA聚合酶I(E.coli)，phi29DNA聚合酶和Bst DNA聚合酶，优选的是DNA聚合酶I(E.coli)。

在另一优选例中，在步骤(e)中，所述扩增反应的反应温度为15-37℃，且反应时间为20-60min。

在另一优选例中，在步骤(e)中，还包括对所述的第一扩增产物进行纯化反应的步骤。

在另一优选例中，在步骤(f)中，利用常规IDT xGen probe或Roche NimbleGenprobe，获得目标甲基化区域的捕获文库。

在本发明的第二方面，提供了一种甲基化测序文库，所述的测序文库是利用本发明第一方面所述的方法构建的。

在另一优选例中，所述的测序文库包含未经CT转化的碱基。

在另一优选例中，所述的测序文库可以用于甲基化测序。

在另一优选例中，所述的测序文库可以用常规探针进行检测。

应理解，在本发明范围内中，本发明的上述各技术特征和在下文(如实施例)中具体描述的各技术特征之间都可以互相组合，从而构成新的或优选的技术方案。限于篇幅，在此不再一一累述。

附图说明

图1显示了第一扩增产物形成的实验流程。

图2显示了利用第一扩增产物构建甲基化测序文库的一种实验流程。

图3显示了利用Adaptase^TM技术进行连接反应的实验流程。

图4显示了利用第一扩增产物构建甲基化测序文库的另一种实验流程。

图5显示了超声打断的细胞系DNA的2100检测图谱。

图6显示了超声打断的FFPE DNA的2100检测图谱。

图7显示了M-adapter与50ng的末端修复后DNA片段以摩尔比为2:1，用快速连接试剂盒进行连接的产物的2100检测图谱。

图8显示了M-adapter与50ng的末端修复后DNA片段以摩尔比为50:1，用快速连接试剂盒进行连接的产物的2100检测图谱。

图9显示了M-adapter与50ng的末端修复后DNA片段以摩尔比为100:1，用快速连接试剂盒进行连接的产物的2100检测图谱。

图10显示了M-adapter与50ng的末端修复后DNA片段以摩尔比为50:1，用平末端/TA连接酶预混液进行连接的产物的2100检测图谱。

图11显示了M-adapter与50ng的末端修复后DNA片段以摩尔比为100:1，用平末端/TA连接酶预混液进行连接的产物的2100检测图谱。

图12显示了M-adapter与500ng的末端修复后DNA片段以摩尔比为50:1，用平末端/TA连接酶预混液进行连接的产物的2100检测图谱。

图13显示了甲基化文库的2100检测图谱。

图14显示了本发明中甲基化比对的原理流程。

具体实施方式

本发明人经过广泛而深入地研究，首次意外地发现一种甲基化测序文库的构建方法。具体地，本发明通过重亚硫酸盐处理构建文库，可同时检测经CT转化的原始链和未经CT转化的互补链序列，可直接找出甲基化位点；本发明构建的文库保留了一半未经CT转化的碱基，可大大提高文库碱基平衡性，大幅提高测序质量。在此基础上完成了本发明。

甲基化文库的构建

本发明提供了一种甲基化文库的构建方法，具体如本发明第一方面所述。一种典型的甲基化文库的构建流程如下所示：

1.基因组DNA进行超声打断，得到片段化DNA，优选方式是covarisS220上打断为150～180bp；

2.利用T4多聚核苷酸激酶活性，除去片段化DNA的5’-磷酸基团，这类试剂有2S Hyb DNA Library Kit(Swift Biosciences 23096)中的RepairⅠ，和T4多聚核苷酸激酶(3′磷酸酶活性缺失)(NEB M0236)，优选的是Swift的RepairⅠ；随后用Agencourt AMPure XP磁珠纯化；

3.利用T4DNA聚合酶5′→3′方向的合成活性和3′→5′外切核酸酶的活性，对上一步DNA补平5′突出端或切除3′突出末端，形成5’-去磷酸化的平末端，这类试剂有2S Hyb DNA Library Kit(Swift Biosciences 23096)中的RepairⅡ，和T4DNA聚合酶(NEB M0203)，优选的是Swift的RepairⅡ；随后用Agencourt AMPure XP磁珠纯化；

4.设计合成接头M-Adapter，完整序列为：

5’P-GGCCAATTTTTTTTTTTTTTGGmCmC-3’(SEQ ID NO.:1)

其中5’P为5’磷酸化修饰，mC为甲基化修饰碱基。接头退火后形成茎环结构，退火优选方式是95℃反应2min，随后以0.1℃/sec降到25℃。

5.步骤3得到的末端修复片段与M-Adapter利用T4DNA Ligase进行平端连接，因5’端缺少磷酸基团而形成缺刻，这类试剂有Blunt/TALigaseMaster Mix(NEB M0367)，QuickLigation^TMKit(NEB M2200)和T4DNA ligase(NEB M0202)，连接条件优选的是用Blunt/TALigaseMaster Mix，25℃反应20min，接头和DNA片段的摩尔比为5:1，达到最大连接效率；随后用Agencourt AMPure XP磁珠纯化；

6.利用具有链置换特性的酶，以无缺刻的DNA链为模板，从缺刻位置开始合成互补链，并将dCTP替换成5-methyl-dCTP，互补链中的碱基C均为甲基化碱基，形成一条原始链一条全甲基化互补链的第一扩增产物，这类试剂有DNA聚合酶I(E.coli)，phi29DNA聚合酶和Bst DNA聚合酶，优选的是DNA聚合酶I(E.coli)，37℃反应30min；随后用Agencourt AMPureXP磁珠纯化；

7.利用bisulfite处理，将DNA中未甲基化的C转换为U，步骤6形成的产物中原始链上未甲基化的C转化为U，已甲基化的互补链不受影响，得到处理后第一转换产物。优选的试剂是EZ DNA Methylation Gold^TMkit(Zymo Research D5005)；

8.第一转换产物的一种构建文库方式如图2所示，处理后的第一转换产物为单链DNA，利用Methyl-Seq DNA Library Kit(Swift30024)的Adaptase^TM技术(图3)，连接接头，利用引物P5TruSeq LT Adapter和P7TruSeq LT Adapter进行indexing PCR，得到测序文库Ⅰ-LIB；

9.第一转换产物的另一构建文库方式如图4所示，在未加茎环接头的DNA片段末端加A尾，和甲基化接头NEBNext Methylated Adaptor进行TA连接反应，随后用USER酶切除NEBNext Methylated Adaptor上的碱基U，形成一端为茎环接头，另一端为Y型接头的第三连接产物；

10.同步骤7，将第三连接产物进行bisulfite处理，得到处理后第二转换产物；

11.以第二转换产物为模板，利用NEBNext Universal Primer和index(X)primer，进行PCR扩增，得到测序文库Ⅱ-LIB，优选的PCR扩增酶是对U不敏感的KAPA HiFi Uracil+(KAPA KK2801)，扩增轮数为11～13轮；

12.文库Ⅰ-LIB和Ⅱ-LIB保留了未经CT转化的序列信息，可利用根据目标甲基化区域定制的常规IDT xGen probe或RocheNimbleGenprobe，得到目标甲基化区域的捕获文库。

构建方法的应用

本发明提供了一种新的基因组甲基化文库构建方法，具有广泛应用，具体如下：

1.新的基因组甲基化测序方法，准确绘制基因组甲基化位点图谱。

2.简化甲基化文库捕获探针的设计，可用于研究疾病相关的甲基化水平，并开发相关试剂盒用于疾病诊断、用药指导等。

3.同时测两条链序列的甲基化测序方法，为无参基因组物种表观遗传研究提供有效方法。

本发明的主要优点包括：

(a)常规的甲基化测序文库，是将互补链全甲基化保护，本发明通过bisulfite处理构建文库，可同时检测经CT转化的原始链和未经CT转化的互补链序列，可直接找出甲基化位点；

(b)常规的WGBS或RRBS文库，因存在CT转化，造成文库碱基严重不平衡，本发明中的文库保留了一半未经CT转化的碱基，因此可大大提高文库碱基平衡性，测序质量得到大幅提高；

(c)本发明构建的甲基化文库因保留了未经CT转化的碱基信息，可应用于常规探针捕获，无须专门设计用于甲基化区域捕获的探针，为目标甲基化区域测序提供了低廉而有效的工具。

下面结合具体实施例，进一步阐述本发明。应理解，这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法，通常按照常规条件，或按照制造厂商所建议的条件。除非另外说明，否则百分比和份数按重量计算。

实施例1DNA打断实验

分别选取人正常细胞系的DNA和200ng FFPE DNA，用Nuclease-free water补齐至50μl，加到Covaris管中。

用Covaris S220进行超声打断，打断程序按照下表的参数进行，其中细胞系DNA打断360秒，FFPE DNA打断200秒：

Duty factor	10％
		Cycles per burst	200
Temperature(℃)	7
		PIP(W)	175

取1ng打断后DNA，利用Agilent 2100Bioanalyzer，用High sensitivity DNAChip进行检测。检测结果见图5-6，图5为打断后细胞系DNA，图6为打断后FFPE DNA。

结论：基因组DNA打断360秒，FFPE DNA打断200秒，可得到100～200bp左右的DNA。

实施例2M-adapter连接效率实验

M-adapter在1×Annealing buffer(10mM Tris-HCl,pH 7.5、1mM EDTA、100mMNaCl)中进行退火，退火程序为：95℃反应2分钟，以0.1℃/秒的速率降低至25℃，随后-20℃保存备用。

上述M-adapter序列如SEQ ID NO.1所示，5’端有磷酸化修饰，3’端的两个C为甲基化修饰碱基C。

取一段157bp的双链DNA片段50ng，用虾碱性磷酸酶(NEB M0371)去5’磷酸，37℃反应30分钟，65℃反应5分钟使酶失活，随后分别用快速连接试剂盒(NEB M2200)以2:1(图7)、50:1(图8)、100:1(图9)的接头：DNA摩尔比，用平末端/TA连接酶预混液(NEB M0367)以50:1(图10)、100:1(图11)的接头：DNA摩尔比，25℃反应20分钟，进行连接反应。用AgencourtAMPure XP磁珠纯化得到连接产物。图12为500ng DNA片段起始得到的连接产物。

上述双链DNA片段序列如SEQ ID NO.2所示。

检测结果见图7-12，173～176bp的片段为一端加上接头的连接产物，189-192bp的片段为两端均加上接头的连接产物，结果显示同样50ng的DNA，采用平末端/TA连接酶预混液以50:1的接头：DNA摩尔比的连接效果最好(图10)，而增加到500ng的DNA，双端均加上接头的连接产物比例提高(图12)。

结论：连接酶最佳采用平末端/TA连接酶预混液(NEB M0367)，接头：DNA的摩尔比最佳控制在50:1。

实施例3甲基化文库构建

取0.5μg已打断至150bp的DNA样本，进行甲基化文库构建。

用2S Hyb DNA Library Kit中的试剂对DNA进行末端修复，具体步骤如下：

(1)RepairⅠ：加入Buffer W1和Enzyme W2，37℃反应10分钟。

(2)RepairⅡ：加入Buffer G1，Reagent G2，Enzyme G3和Enzyme G4，20℃反应20分钟。

(3)用1.8倍体积的Agencourt AMPure XP磁珠纯化得到修复后产物。

DNA末端修复后，加平末端/TA连接酶预混液(NEB M0367)以50:1的接头：DNA摩尔比，25℃反应20分钟，与M-adapter进行连接反应，用1.8倍体积的Agencourt AMPure XP磁珠纯化得到连接产物。

连接产物中加入1×NEBuffer^TM2，5-Methyl-dCTP、dTTP、dGTP和dATP各100μΜ，5UDNA polymerase I(E.coli)进行甲基化第二链的合成，15℃反应60分钟。用1.8倍体积的Agencourt AMPure XP磁珠纯化得到扩增产物。

用EZ DNA Methylation Gold^TMkit对第一扩增产物进行Bisulfite处理，

加入CT Conversion Reagent，98℃解链10分钟，64℃反应2.5小时，随后在Zymo-Spin^TM IC Column中纯化得到bisulfite转化后DNA产物。

用Methyl-Seq DNA Library Kit的试剂对转化后DNA进行文库构建，具体步骤如下：

(1)bisulfite转化后DNA在95℃反应2分钟解链，随即置冰上2分钟。

(2)Adaptase：加入Buffer G1，Reagent G2，Reagent G3，Enzyme G4，Enzyme G5和Enzyme G5，37℃反应15分钟，95℃反应2分钟。

(3)Extension：上一步产物中加入Enzyme Y1和Enzyme Y2，98℃反应1分钟，62℃反应2分钟，65℃反应5分钟。用1.2倍体积的Agencourt AMPure XP磁珠纯化。

(4)Ligation：加入Buffer B1，Reagent B2和Enzyme B3，25℃反应15分钟。用1.0倍体积的Agencourt AMPure XP磁珠进行纯化，得到连接产物。

(5)Indexing PCR：利用P5TruSeq LT Adapter和P7TruSeq LT Adapter，加入Buffer R1，Reagent R2和Enzyme R3进行PCR反应：98℃预变性30秒，98℃变性10秒，60℃退火30秒，68℃延伸60秒，循环扩增4～6轮。用0.85倍体积的Agencourt AMPure XP磁珠进行纯化，最终得到甲基化测序文库Ⅰ。

上述P5TruSeq LT Adapter序列如SEQ ID NO.3所示。

上述P7TruSeq LT Adapter序列如SEQ ID NO.4所示，序列中的NNNNNN为6-8个标签序列碱基。

取1ng文库，使用Agilent 2100Bioanalyzer，用High sensitivity DNA Chip进行检测。图13显示富集得到的文库片段范围在200-600bp。

实施例4甲基化文库数据分析

如图14所示，一段原始的双链DNA序列，分top和bottom两条链，末端去5’磷酸和补平，经连接M-adapter，从缺刻处置换合成全甲基化的第二条链，再经重亚硫酸盐处理后，原始top和bottom链中未甲基化C转换成U，M-adapter的茎环结构打开，每条转化后的链同时带着没有转化的全甲基化序列信息，因此构建得到的文库测序数据中，不同于常规WGBS的数据需要转换后的基因组序列作为参考，经初步质控过滤后，read2可以直接作为read1的参考序列，read1中可与read2互补的碱基C即为甲基化位点。

在本发明提及的所有文献都在本申请中引用作为参考，就如同每一篇文献被单独引用作为参考那样。此外应理解，在阅读了本发明的上述讲授内容之后，本领域技术人员可以对本发明作各种改动或修改，这些等价形式同样落于本申请所附权利要求书所限定的范围。

序列表

<110> 上海鲸舟基因科技有限公司

<120> 一种新的基因组甲基化文库的构建方法和应用

<130> P2017-1633

<160> 4

<170> PatentIn version 3.5

<210> 1

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 1

ggccaatttt tttttttttt ggcc 24

<210> 2

<211> 157

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 2

cgcacgtagc tcaggcctca agaccttggg ctgggactgg ctgagcctgg cgggaggcgg 60

ggtccgagtc accgcctgcc gccgcgcccc cggtttctat aaattgagcc cgcagcctcc 120

cgcttcgctc tctgctcctc ctgttcgaca gtcagcc 157

<210> 3

<211> 58

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 3

aatgatacgg cgaccaccga gatctacact ctttccctac acgacgctct tccgatct 58

<210> 4

<211> 63

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221> misc_feature

<222> (34)..(39)

<223> n is a, c, g, or t

<400> 4

gatcggaaga gcacacgtct gaactccagt cacnnnnnna tctcgtatgc cgtcttctgc 60

ttg 63

Claims

1.一种甲基化测序文库的构建方法，其特征在于，所述方法包括步骤：

(f)利用所述的第一扩增产物得到甲基化测序文库；

其中，所述的第一扩增产物包含：

(i)具有从5′到3′的式A结构的第一扩增产物A，和

(ii)具有从5′到3′的式B结构的第一扩增产物B，

S_a-L-S_bm (A)

S_b-L-S_am (B)

式中，

各“-”独立地为键；

S_a为所述第一连接产物的一条单链；

L为第一衔接子。

2.如权利要求1所述的方法，其特征在于，所述的第一衔接子具有从5′到3′的式C结构：

L₁-L₀-L₂ (C)

式中，

各“-”独立地为键；

L₁和L₂为核苷酸连接序列，且L₁和L₂互补；

L₀为长度为4-20bp的间隔序列。

3.如权利要求2所述的方法，其特征在于，所述的L₁中的碱基C均为未甲基化的碱基C，且L₂中的碱基C均为甲基化碱基C；

较佳地，所述的第一衔接子的5′端有磷酸化修饰，且3′端没有磷酸化修饰；

更佳地，所述的第一衔接子的序列如SEQ ID NO.:1所示。

4.如权利要求1所述的方法，其特征在于，所述的步骤(f)还包括步骤：

5.如权利要求1所述的方法，其特征在于，所述的步骤(f)还包括步骤：

(I)将第一扩增产物与第三衔接子进行连接反应，从而得到第三连接产物，其中，所述的第三衔接子具有环形结构，且环形结构中带有碱基U，较佳地所述的第三衔接子为NEBNext Methylated Adaptor，；

6.如权利要求1所述的方法，其特征在于，所述片段化DNA的长度为150～180bp。

7.如权利要求1所述的方法，其特征在于，在步骤(d)中，所述平末端DNA的3′端与所述第一衔接子的5′端连接，且所述平末端DNA的5′端与所述第一衔接子的3′端未连接。

8.如权利要求1所述的方法，其特征在于，在步骤(e)中，利用具有链置换特性的酶进行扩增反应。

9.一种甲基化测序文库，其特征在于，所述的测序文库是利用权利要求1所述的方法构建的。

10.如权利要求9所述的测序文库，其特征在于，所述的测序文库包含未经CT转化的碱基。