CN107475779A

CN107475779A - 适用于单细胞rrbs测序的文库建立方法及其应用

Info

Publication number: CN107475779A
Application number: CN201710864035.3A
Authority: CN
Inventors: 李静; 陈昌岳; 王芳; 张祥林; 胡秋萍; 董东; 郑冠涛; 段彪
Original assignee: Shanghai Meiji Medical Inspection Co Ltd
Current assignee: Shanghai Meiji Medical Inspection Co Ltd
Priority date: 2017-09-22
Filing date: 2017-09-22
Publication date: 2017-12-15

Abstract

本发明涉及分子生物学技术领域，具体公开了一种适用于单细胞RRBS测序的文库建立方法及其应用。本发明公开的适用于单细胞RRBS测序的文库建立方法包括如下步骤：（1）对样本的基因组DNA依次进行酶切、末端补平和加A、加接头以及重亚硫酸盐转化；（2）对步骤（1）中转化后的基因组DNA进行线性扩增；（3）对步骤（2）中线性扩增的扩增子进行指数扩增，所述指数扩增的扩增子用作测序文库。该方法测序所需的DNA起始量低，可以对单个细胞的基因组进行甲基化测序；具有有效的文库片段控制步骤，通过线性扩增步骤控制最终产物的片段，避免繁复操作的同时提高覆盖率。

Description

适用于单细胞RRBS测序的文库建立方法及其应用

技术领域

本发明涉及分子生物学技术领域，特别是涉及一种适用于单细胞的代表性亚硫酸氢盐测序(Reduced Representation Bisulfite Sequencing，RRBS)测序的文库建立方法及其应用。

背景技术

DNA甲基化(DNA methylation)是指在DNA上的胞嘧啶(C)的第5个碳原子上被甲基共价修饰成为5’甲基胞嘧啶(5mC)。DNA甲基化是最早发现的表观遗传修饰途径之一，能引起染色质结构、DNA构象、DNA稳定性及DNA与蛋白质相互作用方式的改变，从而控制基因表达。它具有多种重要的生物学功能，包括X染色体失活、转座子沉默、基因印记等。DNA甲基化修饰绝大多数发生在CpG位点上。在哺乳动物中CpG以两种形式存在：一种是分散于DNA序列中；另一种呈现高度聚集状态，称之为CpG岛(CpG island)。CpG岛通常被定义为在200bp序列中，GC含量大于50％的区域。人类基因组序列草图分析结果表明，人类基因组CpG岛约为28890个，大部分染色体每1Mb就有5-15个CpG岛，平均值为每Mb含10.5个CpG岛。约50％以上的CpG岛位于启动子，而60％以上的基因启动子含有CpG岛，因此基因转录区CpG岛的甲基化状态的研究就显得十分重要。因此需要一种全面、快速检测CpG岛甲基化的方法。

传统检测DNA甲基化的方法，包括限制性酶切-PCR、甲基化特异性PCR，只能检测单个或少数位点。

基于高通量测序技术的DNA甲基化检测方法包括：1)全基因组重亚硫酸盐甲基化测序；2)DNA甲基化免疫共沉淀测序；3)限制性内切酶-重亚硫酸盐测序法。

全基因组甲基化测序是用重亚硫酸盐处理DNA，在单碱基分辨率上检测所有C的甲基化情况，这是对基因组覆盖度最广的实验方案。由于达到了全基因组覆盖度，需要约90G测序数据量，才能获得足够的测序深度。

DNA甲基化免疫共沉淀测序是采用抗体或重组甲基化CpG结合蛋白捕获甲基化DNA，随后进行高通量测序，这两种方法只能对DNA甲基化状态进行半定量检测，其分辨率为100bp左右，且不能达到单细胞水平。

限制性内切酶-重亚硫酸盐测序法，是用MspI(CCGG)等限制性内切酶对全基因组进行酶切富集后，再经重亚硫酸盐(Bisulfite，BS)处理后的甲基化测序方式。该方式是针对CpG岛的测序方案，在单细胞层面可覆盖约50％的CpG岛，能实现单碱基分辨率、单细胞实验，是一种经济、高效的针对CpG岛的甲基化方案。

现有的限制性内切酶-重亚硫酸盐测序法需要经过复杂的实验流程：MspI酶切、电泳、纯化步骤富集启动子及CpG岛区域，随后进行末端修复、加A、接头连接、重亚硫酸盐转化、纯化和PCR扩增、PAGE胶片段选择等步骤构建测序文库，需要大约5～6天时间。而且在加接头后进行重亚硫酸处理，药物对DNA会有随机打断的作用，会造成样品信息的极大丢失，尤其是在单细胞层面时输入样品量极低，只有极少的拷贝数。同时利用PAGE胶回收所需大小的文库，操作繁琐，容易造成样品间的交叉污染，受到回收效率的影响也会极大的损失有用的信息。

发明内容

鉴于以上所述现有技术的缺点，本发明的目的在于提供一种适用于单细胞RRBS测序的文库建立方法及其应用，以提高RRBS的效率以及提高RRBS测序的覆盖率和降低甲基化信息的丢失。

为实现上述目的及其他相关目的，第一方面，本发明提供了一种适用于单细胞RRBS测序的文库建立方法，包括如下步骤：(1)对样本的基因组DNA依次进行酶切、末端补平和加A、加接头以及重亚硫酸盐转化；(2)对步骤(1)中转化后的基因组DNA进行线性扩增；(3)对步骤(2)中线性扩增的扩增子进行指数扩增，所述指数扩增的扩增子用作测序文库。

于本发明的一个实施例中，所述样本基因组DNA由单细胞样本裂解获得或由多细胞样本抽提获得。

此外，可以是在进行步骤(1)之前，先对单细胞样本裂解或对多细胞样本抽提，从而获得所述样本基因组DNA。也可以采用由他人利用本领域所熟知的技术已经由单细胞样本裂解获得或由多细胞样本抽提获得的样本基因组DNA。

于本发明的一个实施例中，步骤(1)中，所述酶切采用的酶可以为AluI、TaqαI、SphI、MspI、BamHI、ApeKI、BanII、HpaII、HpyCH4V、BstNI、HaeIII、HpyCH4III、BglII、BssSI和KpnI中的任意一种或2种或几种的混合物，也可以为其他适用于CpG岛识别的限制性内切酶或组合。

于本发明的一个实施例中，步骤(1)中，所述接头为单链结构或双链结构；所述接头的第一链序列如SEQ ID NO：1所示，具体为：5’GCTCTTCCGATCT3’；所述接头的第二链序列如SEQ ID NO：2所示，具体为5’CGAGAAGGCTAG3’；所述SEQ ID NO：1所示序列和所述SEQ IDNO：2所示序列中的C为甲基化修饰碱基。

于本发明的一个实施例中，步骤(2)中，所述线性扩增包括第一线性扩增和第二线性扩增；所述第一线性扩增的引物为第一引物，所述第一引物为随机引物；所述第二线性扩增的引物为第二引物，所述第二引物为随机引物。

于本发明的一个实施例中，所述第一引物的结构为：5’-特异性识别所述接头的序列-随机序列-CpG岛识别序列-3’；所述第二引物的结构为：5’-特异性识别所述接头的序列-随机序列-CpG岛识别序列-3’；或者所述第一引物的结构为：5’-特异性识别所述接头的序列-分子标签-随机序列-CpG岛识别序列-3’；所述第二引物的结构为：5’-特异性识别所述接头的序列-分子标签-随机序列-CpG岛识别序列-3’。

于本发明的一个实施例中，所述第一引物中的特异性识别所述接头的序列如SEQID NO：3所示，具体为：5’CTACACGACGCTCTTCCGATCT3’；所述第二引物中的特异性识别所述接头的序列如SEQ ID NO：4所示，具体为：5’TGCTGAACCGCTCTTCCGATC3’。

于本发明的一个实施例中，所述第一引物选自以下序列中的一种或任意多种：

SEQ ID NO：7所示序列、SEQ ID NO：8所示序列、SEQ ID NO：9所示序列、SEQ IDNO：10所示序列；其中，SEQ ID NO：7所示序列具体为CTACACGACGCTCTTCCGATCTNNNNNNCRR，SEQ ID NO：8所示序列具体为CTACACGACGCTCTTCCGATCTNNNNNNGYY，SEQ ID NO：9所示序列具体为CTACACGACGCTCTTCCGATCTNNNNNNTRR，SEQ ID NO：10所示序列具体为CTACACGACGCTCTTCCGATCTNNNNNNAYY。

于本发明的一个实施例中，所述第二引物选自以下序列中的一种或任意多种：

SEQ ID NO：11所示序列、SEQ ID NO：12所示序列、SEQ ID NO：13所示序列、SEQ IDNO：14所示序列；SEQ ID NO：11所示序列具体为TGCTGAACCGCTCTTCCGATCNNNNNNCRR，SEQ IDNO：12所示序列具体为TGCTGAACCGCTCTTCCGATCNNNNNNGYY，SEQ ID NO：13所示序列具体为TGCTGAACCGCTCTTCCGATCNNNNNNTRR，SEQ ID NO：14所示序列具体为TGCTGAACCGCTCTTCCGATCNNNNNNAYY。

于本发明的一个实施例中，所述第一引物中的随机序列的长度为4～20nt，所述第二引物中的随机序列的长度为4～20nt。

于本发明的一个实施例中，所述第一引物中的随机序列的长度为4～14nt。

于本发明的一个实施例中，所述第一引物中的随机序列的长度为6～10nt。

于本发明的一个实施例中，所述第二引物中的随机序列的长度为4～14nt。

于本发明的一个实施例中，所述第二引物中的随机序列的长度为6～10nt。

于本发明的一个实施例中，步骤(2)中，所述线性扩增的DNA聚合酶为具有链置换活性的酶；其中，所述链置换活性的酶选自但不限于其中任意一种或几种：选自klenow片段(3′→5′exo-)、bst DNA聚合酶、klenow片段、vent DNA聚合酶(3′→5′exo-)、vent DNA聚合酶、Phi 29DNA聚合酶、deep vent DNA聚合酶(3′→5′exo-)、deep vent DNA聚合酶。

于本发明的一个实施例中，步骤(3)中，所述指数扩增的引物包括第三引物和第四引物；所述第三引物的序列如SEQ ID NO：5所示，具体为：

5’AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT 3’；

所述第四引物的序列如SEQ ID NO：6所示，具体为：

5’CAAGCAGAAGACGGCATACGAGATNNNNNNGAGATCGGTCTCGGCATTCCTGCTGAACCGCTCTTCCGATC3’，其中，NNNNNN为索引index序列。

第二方面，本发明还提供了一种如第一方面提供的文库建立方法用于单细胞样本或多细胞样本的基因组DNA甲基化测序及甲基化位点分析中的用途。

第三方面，本发明还提供了一种确定单细胞样本或多细胞样本中基因组DNA甲基化位点的方法，包括如下步骤：采用如第一方面提供的文库建立方法建立文库后，对所获得的文库进行测序，基于测序结果，对单细胞样本或多细胞样本的基因组DNA甲基化情况进行分析，确定甲基化位点。

第四方面，本发明还提供了一种适用于单细胞RRBS测序的文库构建试剂盒，包括：酶切反应物、末端补平和加A反应物、接头、重亚硫酸盐转化反应物、线性PCR反应物和指数PCR反应物。

进一步地，所述试剂盒还包括细胞裂解液。

于本发明的一个实施例中，所述酶切反应物可以包括AluI、TaqαI、SphI、MspI、BamHI、ApeKI、BanII、HpaII、HpyCH4V、BstNI、HaeIII、HpyCH4III、BglII、BssSI和KpnI中的任意一种或2种或几种的混合物，也可以包括其他适用于CpG岛识别的限制性内切酶或组合。

于本发明的一个实施例中，所述接头为单链结构或双链结构；所述接头的第一链序列如SEQ ID NO：1所示，具体为：5’GCTCTTCCGATCT3’；所述接头的第二链序列如SEQ IDNO：2所示，具体为5’CGAGAAGGCTAG3’；所述SEQ ID NO：1所示序列和所述SEQ ID NO：2所示序列中的C为甲基化修饰碱基。

于本发明的一个实施例中，线性PCR反应物包括第一引物、第二引物和具有链置换活性的酶；所述第一引物和第二引物为随机引物。

于本发明的一个实施例中，所述第一引物的结构为：：5’-特异性识别所述接头的序列-随机序列-CpG岛识别序列-3’；所述第二引物的结构为：5’-特异性识别所述接头的序列-随机序列-CpG岛识别序列-3’；或者所述第一引物的结构为：5’-特异性识别所述接头的序列-分子标签-随机序列-CpG岛识别序列-3’；所述第二引物的结构为：5’-特异性识别所述接头的序列-分子标签-随机序列-CpG岛识别序列-3’。

于本发明的一个实施例中，所述链置换活性的酶选自但不限于其中任意一种或几种：选自klenow片段(3′→5′exo-)、bst DNA聚合酶、klenow片段、vent DNA聚合酶(3′→5′exo-)、vent DNA聚合酶、Phi 29DNA聚合酶、deep vent DNA聚合酶(3′→5′exo-)、deepvent DNA聚合酶vent DNA聚合酶、Phi 29DNA聚合酶、deep vent DNA聚合酶中的任一种或多种。

于本发明的一个实施例中，指数PCR反应物包括第三引物和第四引物；

所述第三引物的序列如SEQ ID NO：5所示，具体为：

5’AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT 3’；

所述第四引物的序列如SEQ ID NO：6所示，具体为：

第五方面，本发明还提供了一种基因组甲基化测序产品，包括如第四方面所述的测序文库构建试剂盒。

与现有技术相比，本发明具有如下有益效果：

1、测序所需的DNA起始量低，可以对单个细胞的基因组进行甲基化测序；2、简化的实验步骤，通过在线性扩增步骤控制最终产物的片段，从而避免了传统的PAGE胶切胶回收或磁珠片段筛选的繁复操作；3、最大程度的保留CpG岛区域，通过特异性引物的线性扩增，锚定CpG岛的同时可扩增由于重亚硫酸盐处理而被打断的DNA，这部分DNA在传统的建库方案中无法得到扩增，而最大限度的保留文库的多样性；4、避免了由于胶回收而可能造成的交叉污染；5、提高样品利用率，由于无需进行跑胶片段筛选，而避免了胶回收过程中样品的损失。

附图说明

图1为本发明实施例提供的一种接头的结构图；

图2为本发明实施例提供的适用于单细胞RRBS测序的文库构建方法构建的测序文库的质检结果；

图3为本发明实施例提供的适用于单细胞RRBS测序的文库构建方法构建的测序文库的测序结果的原始数据碱基质量分布图；

图4为本发明实施例提供的适用于单细胞RRBS测序的文库构建方法构建的测序文库的测序结果的原始数据碱基分布图。

图5为本发明实施例提供的单细胞全基因甲基化测序方法的加入分子标签(UMI)与不加入分子标签(UMI)的拷贝数变异分析结果比较图。

具体实施方式

对于RRBS的建库方案一般是通过用MspI(CCGG)等限制性内切酶对全基因组进行酶切后，在同一反应管中进行末端补平、加A、加接头，再用重亚硫酸盐处理样品并进行回收，回收完的DNA经过PCR扩增后，进行PAGE胶的切胶回收目的片段，从而完成单细胞RRBS的文库构建，并进行测序。

另外还有针对甲基化的CpG岛进行建库测序的方案。该方案首先通过用重亚硫酸盐处理DNA样品，使DNA样品中的胞嘧啶转换为尿嘧啶，而5’甲基胞嘧啶不变，得到的片段通过特殊设计的DNA引物进行扩增后，该引物特异性的识别高C含量的位点进行扩增，通过后续的指数扩增获得所需的DNA并通过2％的琼脂糖切胶回收，最终的产物可直接进行测序。

现有技术中的RRBS测序方案通过都需要通过胶回收的方案回收所需的DNA文库，但胶回收方案有几个弊端：1.易污染：电泳上样过程中极易造成样品间交叉污染；2.有危害：传统的DNA显色染料EB对人体存在潜在致癌危害；3.易引起突变：紫外照射后待测样本DNA易引起DNA突变从而影响样本结果；4.信息丢失：目前的胶回收方案主要为琼脂糖或PAGE胶回收，需要经过切胶进行样本扩增产物DNA的片段筛选，会导致未获得筛选部分片段的有用信息丢失，某些酶切位点稀疏的长片段部分CpG岛信息不能得到有效的利用；5.操作繁琐耗时：胶回收本身需要2小时到2天的操作时间，操作繁琐；6：实验不稳定：胶的回收效率通常在5％-60％之间，回收效率不稳定，这对实验的稳定性及有用信息的保留都极为不利。

现有的RRBS建库实验中采用的是先加接头后转化的实验模式，而重亚硫酸盐的转化环境苛刻，会导致DNA的随机断裂，由于转化发生在PCR扩增之前，随机打断会造成DNA不可逆的损失，尤其是在起始样本量低的时候，每个位点的信息都是独一无二的，因此对后续有用信息的损失极大。

此外，现有的方案针对的样品为500pg-500ng的DNA样本，而不能对未经提取的DNA直接进行实验，也不能达到单细胞的水平。同时其富集的为甲基化的CpG岛，但是绝大部分的CpG岛是处于低甲基化状态的，因此所能富集的只有极小的一部分有用信息。

鉴于以上问题，本发明实施例提供了一种适用于单细胞RRBS测序的文库建立方法及其应用。可以无需进行凝胶回收就可以构建针对CpG岛的文库，进而对CpG岛进行测序。

在进一步描述本发明具体实施方式之前，应理解，本发明的保护范围不局限于下述特定的具体实施方案；还应当理解，本发明实施例中使用的术语是为了描述特定的具体实施方案，而不是为了限制本发明的保护范围；在本发明说明书和权利要求书中，除非文中另外明确指出，单数形式“一个”、“一”和“这个”包括复数形式。

当实施例给出数值范围时，应理解，除非本发明另有说明，每个数值范围的两个端点以及两个端点之间任何一个数值均可选用。除非另外定义，本发明中使用的所有技术和科学术语与本技术领域技术人员通常理解的意义相同。除实施例中使用的具体方法、设备、材料外，根据本技术领域的技术人员对现有技术的掌握及本发明的记载，还可以使用与本发明实施例中所述的方法、设备、材料相似或等同的现有技术的任何方法、设备和材料来实现本发明。

除非另外说明，本发明中所公开的实验方法、检测方法、制备方法均采用本技术领域常规的分子生物学、生物化学、染色质结构和分析、分析化学、细胞培养、重组DNA技术及相关领域的常规技术。这些技术在现有文献中已有完善说明，具体可参见Sambrook等MOLECULAR CLONING：A LABORATORY MANUAL，Second edition，Cold Spring HarborLaboratory Press，1989and Third edition，2001；Ausubel等，CURRENT PROTOCOLS INMOLECULAR BIOLOGY，John Wiley&Sons，New York，1987and periodic updates；theseries METHODS IN ENZYMOLOGY，Academic Press，San Diego；Wolffe，CHROMATINSTRUCTURE AND FUNCTION，Third edition，Academic Press，San Diego，1998；METHODS INENZYMOLOGY，Vol.304，Chromatin(P.M.Wassarman and A.P.Wolffe，eds.)，AcademicPress，San Diego，1999；和METHODS IN MOLECULAR BIOLOGY，Vol.119，ChromatinProtocols(P.B.Becker，ed.)Humana Press，Totowa，1999等。

本发明实施例提供了一种适用于单细胞RRBS测序的文库建立方法，包括如下步骤：(1)对样本的基因组DNA依次进行酶切、末端补平和加A、加接头以及重亚硫酸盐转化；(2)对步骤(1)中转化后的基因组DNA进行线性扩增；(3)对步骤(2)中线性扩增的扩增子进行指数扩增，所述指数扩增的扩增子用作测序文库。

本发明实施例提供的文库建立方法能够进行有效的文库片段控制。通过在线性扩增步骤控制最终产物的片段，从而避免了传统的PAGE胶切胶回收或磁珠片段筛选的繁复操作，同时可最大限度的保留文库的多样性。

在一个示例中，所述样本基因组DNA由单细胞样本裂解获得或由多细胞样本抽提获得。

本发明实施例提供的文库建立方法所需的样本基因组DNA量较低。单细胞的起始量(6pg)。比现有的中量(500pg)起始的实验方案降低2个数量级。对于细胞异质性的探索、珍惜样本的研究具有极其重要的意义。

本发明实施例提供的文库建立方法还可以进行严格的质量控制。单细胞的起始DNA量只有6pg极易丢失及引入污染。在本发明的实施例中通过加入阴性对照的方法，对每一步扩增都进行严格的质控，避免人为操作引入的污染。同时通过加入适量的λDNA(60fg或者为输入DNA的1/1000-1/10000的质量比)检测重亚硫酸盐的转化效率，剔除转化率低的样品而控制样品质量。

在一个示例中，步骤(1)中，所述酶切采用的酶为包含AluI、TaqαI、SphI、MspI、BamHI、ApeKI、BanII、HpaII、HpyCH4V、BstNI、HaeIII、HpyCH4III、BglII、BssSI和KpnI等中的任意一种或2种或几种的混合物。

在一个示例中，所述接头为单链结构或双链结构；所述接头的第一链序列如SEQID NO：1所示，具体为：5’GCTCTTCCGATCT3’；所述接头的第二链序列如SEQ ID NO：2所示，具体为5’CGAGAAGGCTAG3’；所述SEQ ID NO：1所示序列和所述SEQ ID NO：2所示序列中的C为甲基化修饰碱基。在一个示例中，步骤(1)中，所述接头的结构为如图1所示。

在一个示例中，步骤(2)中，所述线性扩增包括第一线性扩增和第二线性扩增；所述第一线性扩增的引物为第一引物，所述第一引物为随机引物；所述第二线性扩增的引物为第二引物，所述第二引物为随机引物。

本发明实施例可以在第一线性扩增后加入核酸外切酶I消化未反应的第一引物，防止在第二线性扩增中加入第二引物后发生引物自连、引物之间互为模板的现象，浪费资源的同时引入背景信息，增加测序成本的同时获得低的产出。

在一个示例中，所述第一引物的结构为：5’-特异性识别所述接头的序列-随机序列-CpG岛识别序列-3’；所述第二引物的结构为：5’-特异性识别所述接头的序列-随机序列-CpG岛识别序列-3’；或者所述第一引物的结构为：5’-特异性识别所述接头的序列-分子标签-随机序列-CpG岛识别序列-3’；所述第二引物的结构为：5’-特异性识别所述接头的序列-分子标签-随机序列-CpG岛识别序列-3’。

本发明实施例提供的文库建立方法具有更高的CpG岛的覆盖度。通过加接头后的线性扩增步骤，线性扩增所用的引物对前期接头具有特异性的识别，这样可特异性扩增CpG岛区域。同时线性扩增可以有效的覆盖由于药物处理而断裂的、无法得到扩增的DNA片段，从而提高对CpG岛的有效覆盖。

在一个示例中，所述第一引物中的特异性识别所述接头的序列如SEQ ID NO：3所示，具体为：5’CTACACGACGCTCTTCCGATCT3’；所述第二引物中的特异性识别所述接头的序列如SEQ ID NO：4所示，具体为：5’TGCTGAACCGCTCTTCCGATC3’。

在一个示例中，所述第一引物选自以下序列中的一种或任意多种：

在一个示例中，所述第二引物选自以下序列中的一种或任意多种：

在一个示例中，所述第一引物中的随机序列的长度为4～20nt，所述第二引物中的随机序列的长度为4～20nt。

在一个示例中，所述第一引物中的随机序列的长度为4～14nt。

在一个示例中，所述第一引物中的随机序列的长度为6～10nt。

在一个示例中，所述第二引物中的随机序列的长度为4～14nt。

在一个示例中，所述第二引物中的随机序列的长度为6～10nt。

在一个示例中，步骤(2)中，所述线性扩增的DNA聚合酶为具有链置换活性的酶；其中，所述链置换活性的酶选自包含但不限于其中任意一种或几种：选自klenow片段(3′→5′exo-)、bst DNA聚合酶、klenow片段、vent DNA聚合酶(3′→5′exo-)、vent DNA聚合酶、Phi29DNA聚合酶、deep vent DNA聚合酶(3′→5′exo-)、deep vent DNA聚合酶等中的任一种或多种的组合。所述线性扩增的DNA聚合酶也可以为其他一种或多种具有链置换活性酶的组合。本发明实施例仅对线性扩增的DNA聚合酶进行说明，不构成限定。

在一个示例中，步骤(3)中，所述指数扩增的引物包括第三引物和第四引物；所述第三引物的序列如SEQ ID NO：5所示，具体为：

5’AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT 3’；

所述第四引物的序列如SEQ ID NO：6所示，具体为：

5’CAAGCAGAAGACGGCATACGAGATNNNNNNGAGATCGGTCTCGGCATTCCTGCTGAACCGCTCTTCCGATC 3’，其中，NNNNNN为索引index序列。引物SEQ ID NO：5和SEQ ID NO：6的3’端也可加入3-20nt的随机或特定序列作为分子标签(UMI)，优选的分子标签的长度为4-12nt,更优选的分子标签的长度为6-9nt。加入分子标签的优点是可以在后续的分析过程中识别分子的来源，从而判断细胞中真实含有的甲基化位点和分子拷贝数，排除PCR扩增对分析的影响，增加校对的功能，加强分析的准确度。

本发明实施例还提供了一种如上文中所提供的文库建立方法用于单细胞样本或多细胞样本的基因组DNA甲基化测序及甲基化位点分析中的用途。

本发明实施例还提供了一种确定单细胞样本或多细胞样本中基因组DNA甲基化位点的方法，包括如下步骤：采用如上文中所提供的文库建立方法建立文库后，对所获得的文库进行测序，基于测序结果，对单细胞样本或多细胞样本的基因组DNA甲基化情况进行分析，确定甲基化位点。

本发明实施例还提供了一种适用于单细胞RRBS测序的文库构建试剂盒，包括：酶切反应物、末端补平和加A反应物、接头、重亚硫酸盐转化反应物、线性PCR反应物和指数PCR反应物。

进一步地，所述试剂盒还可以包括细胞裂解液。

在一个示例中，所述酶切反应物可以包括AluI、TaqαI、SphI、MspI、BamHI、ApeKI、BanII、HpaII、HpyCH4V、BstNI、HaeIII、HpyCH4III、BglII、BssSI和KpnI等中的任意一种或2种或几种的混合物，也可以包括其他适用于CpG岛识别的限制性内切酶或组合。在一个示例中，所述接头为单链结构或双链结构；所述接头的第一链序列如SEQ ID NO：1所示，具体为：5’GCTCTTCCGATCT3’；所述接头的第二链序列如SEQ ID NO：2所示，具体为5’CGAGAAGGCTAG3’；所述SEQ ID NO：1所示序列和所述SEQ ID NO：2所示序列中的C为甲基化修饰碱基。

在一个示例中，所述接头的结构如图1所示。在一个示例中，线性PCR反应物包括第一引物、第二引物和具有链置换活性的酶；所述第一引物和第二引物为随机引物。

在一个示例中，所述第一引物中的特异性识别所述接头的序列如SEQ ID NO：3所示，具体为：5’CTACACGACGCTCTTCCGATCT3’；所述第二引物中的特异性识别所述接头的序列如SEQ ID NO：4所示，具体为：5’TGCTGAACCGCTCTTCCGATC3”。

在一个示例中，所述链置换活性的酶选自包含但不限于其中任意一种或几种：klenow片段(3′→5′exo-)、klenow片段、bst DNA聚合酶、vent DNA聚合酶(3′→5′exo-)、vent DNA聚合酶、Phi 29DNA聚合酶、deep vent DNA聚合酶(3′→5′exo-)、deep vent DNA聚合酶等中的任一种或多种。

在一个示例中，指数PCR反应物包括第三引物和第四引物；

所述第三引物的序列如SEQ ID NO：5所示，具体为：

5’AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATC3’；

所述第四引物的序列如SEQ ID NO：6所示，具体为：

5’CAAGCAGAAGACGGCATACGAGATNNNNNNGAGATCGGTCTCGGCATTCCTGCTGAACCGCTCTTCCGATC 3’，其中，NNNNNN为索引index序列。在引物中也可加入3-20nt的随机或特定序列作为分子标签(UMI)，优选的分子标签优选的分子标签的长度为4-12nt,更优选的分子标签的长度为6-9nt。

本发明实施例还提供了一种基因组甲基化测序产品，包括本发明实施例提供的测序文库构建试剂盒。

下文以具体实施例1对本发明实施例的技术方案进行更具体地说明。

实施例1

可先对单细胞样本裂解或对多细胞样本抽提，从而获得样本基因组DNA。也可以采用由他人利用本领域所熟知的技术已经由单细胞样本裂解获得或由多细胞样本抽提获得的样本基因组DNA。

作为示例：本申请实施例中的样本基因组DNA可由如下步骤1和步骤2获得：

步骤1、单细胞分离。

可以利用口吸法、激光显微捕获、有限稀释法、流式细胞分选等细胞分离方法获得单细胞或多个细胞。包含细胞的缓冲液优选地为1×PBS，也可以是生理盐水、0.278mol/L蔗糖等细胞等渗溶液，体积为1-4μl。

步骤2、细胞裂解。

2a)按表1的体系建立裂解体系：

表1

成分	体积(ul)	终浓度
			Tris-EDTA(500m M Tris,50mM EDTA)	0.05	10mM Tris,1mM EDTA
1M KCl	0.05	10mM
			10％(vol/vol)Triton X-100	0.05	0.1％(vol/vol)
10mg/ml蛋白酶	0.25	0.5mg/ml
			无核酸水	补至4	—

2b)涡旋混匀裂解体系。

2c)6000g，4℃，离心1min。确保所有样品被收集在PCR管底部。

2d)将裂解体系转移到含有单细胞的PCR管中，共5ul。

2e)6000g，4℃，离心1min。

2f)PCR仪设置50℃，30分钟到过夜不等，可以根据样本的不同需要进行具体调整。裂解细胞；75℃，30min，4℃保温。

2g)6000g，4℃，离心1min。

2h)立即转移到冰上。即获得样本基因组DNA。

步骤3、MspI酶切

3a)按表2的体系建立酶切体系：

表2

成分	体积(ul)	终含量
			20U/μl MspI	1	20U
10×MspI buffer	0.8	1X
			未甲基化的λ-DNA(60fg/μl)	1	60fg
无核酸酶水	补至5	—

3b)涡旋混匀酶切体系。

3c)6000g，4℃，离心1min。确保所有样品被收集在PCR管底部。

3d)将酶切体系转移到裂解完的细胞的PCR管中，混匀。

3e)6000g，4℃，离心1min。

3f)PCR仪设置37℃，30min-16h不定，酶切基因组；75℃，15min，4℃保温。

3g)6000g，4℃，离心1min。

3h)立即转移到冰上，进行下一步实验。

4、末端补平与加A

4a)按表3的体系建立末端修复与加A体系：

表3

成分	体积(ul)	终含量
			5U/μl Klenow片段,exo–	1	5U
10×NEB buffer2	0.2	1X
			dNTP mix	0.8	各4μM

4b)涡旋混匀末端修复与加A体系。

4c)6000g，4℃，离心1min。确保所有样品被收集在PCR管底部。

4d)将末端修复与加A体系加入到完成酶切的体系中，混匀。

4e)PCR设置37℃，20min-2h不等，补平与加A；75℃，15min，4℃保温。

4f)6000g，4℃，离心1min。

4g)立即转移到冰上，进行下一步实验。

5、连接接头

5a)按表4体系建立接头连接体系：

表4

成分	体积(ul)	终含量
			400U/μl T4DNA连接酶	1	5U
10×T4buffer	0.5	1X
			10mM ATP	2.5	1mM
对应接头	1	0.5uM
			无核酸水	补至8	—

其中，所述接头的第一链序列如SEQ ID NO：1所示，具体为：5’GCTCTTCCGATCT3’；所述接头的第二链序列如SEQ ID NO：2所示，具体为5’GATCGGAAGAGC3’。更具体地，接头的结构如图1所示，其中所有的C都经过甲基化修饰。

5b)轻弹混匀接头连接体系。

5c)6000g，4℃，离心1min。确保所有样品被收集在PCR管底部。

5d)将接头连接体系加入到完成末端补平与加A的体系中，混匀。

5e)PCR仪设置25℃，1-8h不等，65℃，20min，4℃保温。

5f)6000g，4℃，离心1min。

5g)立即转移到冰上。

需要说明的是，上述接头仅为举例说明，本发明实施例可以采用其他长度的接头，例如，带有分子标签(UMI)的接头，也可以根据测序平台，如Ion Torrent，选择接头。

6、重亚硫酸盐转化

可以使用zymo research的试剂盒，也可以是其他具有类似功效的试剂盒或自己配置的试剂进行重亚硫酸盐转化。以下以zymo research的试剂盒进行具体举例说明。

6a)20ul加完接头的样品，瞬时离心以将样品收集于PCR管底部。

6b)加入130ul CT Conversion Reagent吹打混匀或轻弹混匀，瞬时离心。

6c)严格按照试剂盒的说明书进行后续操作

需要说明的是在转化后的回收过程中可以加入糖原、carrier RNA、重复序列DNA或不会影响后续扩增或分析的核酸及化学物质提高回收效率，也可以采用其他DNA回收试剂盒或其他DNA回收方案替换。

7、第一轮线性扩增

7a)按表5的体系建立第一线性扩增体系：

表5

试剂	体积
		DNA样品	25ul
dNTPs(2.5mM)	1ul
		第一引物(10uM)	1ul
无核酸水	17ul
		Blue buffer(10X)	5ul
总体积	49ul

所述第一引物的结构为：5’-特异性识别所述接头的序列-随机序列-3’，其中，特异性识别所述接头的序列如SEQ ID NO：3所示，具体为5’CTACACGACGCTCTTCCGATCT3’。所述第一引物选自以下序列中的一种或任意多种：SEQ ID NO：7所示序列、SEQ ID NO：8所示序列、SEQ ID NO：9所示序列、SEQ ID NO：10所示序列；其中，SEQ ID NO：7所示序列具体为CTACACGACGCTCTTCCGATCTNNNNNNCRR，SEQ ID NO：8所示序列具体为CTACACGACGCTCTTCCGATCTNNNNNNGYY，SEQ ID NO：9所示序列具体为CTACACGACGCTCTTCCGATCTNNNNNNTRR，SEQ ID NO：10所示序列具体为CTACACGACGCTCTTCCGATCTNNNNNNAYY；其中，NNNN为随机引物，长度可以为4～20nt，优选的长度为4～14nt更优选的长度为6～10nt；R：A或G，Y：C或T或U。

需要说明是在随机引物之前可以加入固定序列或2-20nt随机序列作为分子标签。

7b)瞬时离心，将样品收集到PCR管底部，95℃变性3分钟，迅速至于冰上。待样品冷却后加入1ul的具有链置换活性的酶(5U/ul)，瞬时离心后按表6中的程序进行PCR反应。具有链置换活性的酶可以为bst DNA聚合酶、vent DNA聚合酶(3′→5′exo-)、vent DNA聚合酶、Phi 29DNA聚合酶、deep vent DNA聚合酶(3′→5′exo-)、deep vent DNA聚合酶中的任一种，也可以为klenow片段(3′→5′exo-)、bst DNA聚合酶、vent DNA聚合酶(3′→5′exo-)、vent DNA聚合酶、Phi 29DNA聚合酶、deep vent DNA聚合酶(3′→5′exo-)、deep vent DNA聚合酶等中的任一两种或多种的混合物。

表6

7c)用PCR仪将样品95℃，45S，使双链打开迅速转移到冰上迅速降温使其维持单链状态。

7d)瞬时离心，加入具有链置换活性的酶(5U/μl)，0.5ul。

7e)瞬时离心，将样品收集到PCR管底部。按表6的程序进行PCR反应：

7f)重复步骤7c～7e，推荐但不限于0-20次，可根据样品情况进行调整。

8、单链引物及产物的消化及引物二聚体的去除

8a)加入2μl的核酸外切酶(Exonuclease)I和48μl的NF H₂O到样品中，并用PCR仪37℃消化1h，热盖温度为50℃。

8b)AMPure XP磁珠在室温平衡30min以上。

8c)将80ul平衡后的AMPure XP磁珠于100ul样品用枪吹打混匀。

8d)在室温孵育10min。

8e)将样品转移到磁力架上，待样品澄清后弃去上清。

8f)用200ul 80％(vol/vol)的乙醇，清洗磁珠。

8g)弃去上清。

8h)重复8f～8g一次。

8i)室温开盖等待，至乙醇充分挥发。

9、第二轮线性扩增

在二链扩增时，二链引物的引入可以采用线性扩增或接头连接、滚环扩增等方式进行，其中，优选的为线性扩增的方式。

下文以线性扩增为例对二链扩增进行具体说明。

9a)在8i的管中加入表7所示的反应物。

表7

试剂	体积
		DNA样品	25ul
dNTPs(2.5mM)	1ul
		第二引物(10uM)	1ul
无核酸水	17ul
		Blue buffer(10X)	5ul
总体积	49ul

所述第二引物的结构为：5’-特异性识别所述接头的序列-随机序列-3’。特异性识别所述接头的序列如SEQ ID NO：4所示，具体为，5’TGCTGAACCGCTCTTCCGATCT3’。所述第二引物选自以下序列中的一种或任意多种：SEQ ID NO：11所示序列、SEQ ID NO：12所示序列、SEQ ID NO：13所示序列、SEQ ID NO：14所示序列；SEQ ID NO：11所示序列具体为TGCTGAACCGCTCTTCCGATCNNNNNNCRR，SEQ ID NO：12所示序列具体为TGCTGAACCGCTCTTCCGATCNNNNNNGYY，SEQ ID NO：13所示序列具体为TGCTGAACCGCTCTTCCGATCNNNNNNTRR，SEQ ID NO：14所示序列具体为TGCTGAACCGCTCTTCCGATCNNNNNNAYY；其中R：A或G，Y：C或T或U，NNNN为随机引物，长度可以为4～20nt。

9b)瞬时离心，将样品收集到PCR管底部，95℃变性3分钟，迅速至于冰上。待样品冷却后加入1ul的具有链置换活性的酶(5U/ul)，瞬时离心后按表6的程序进行PCR反应：

9c)用PCR仪将样品95℃，45S，使双链打开迅速转移到冰上迅速降温使其维持单链状态。

9d)瞬时离心，加入具有链置换活性的酶(5U/μl)，0.5ul。

9e)瞬时离心，将样品收集到PCR管底部。按表6程序进行PCR反应。

9f)重复步骤9c～9e)，推荐但不限于0-20次，可根据样品情况进行调整。

10、线性扩增产物纯化

10a)AMPure XP磁珠在室温平衡30min以上。

10b)将80ul平衡后的AMPure XP磁珠于100ul样品用枪吹打混匀。

10c)在室温孵育10min。

10d)将样品转移到磁力架上，待样品澄清后弃去上清。

10e)用200ul 80％(vol/vol)的乙醇，清洗磁珠。

10f)弃去上清。

10g)重复10e～10f一次。

10h)室温开盖等待，至乙醇充分挥发。

11、指数扩增

11a)在纯化后的线性扩增子中加入表8所示的反应物。

表8

试剂	体积
		dNTPs(2.5mM)	4ul
第三引物(10uM)	1ul
		第四引物(10uM)	1ul
Buffer(5x)	10ul
		指数扩增酶	1U
无菌水	补齐至50ul

所述第三引物的序列如SEQ ID NO：5所示，具体为：

5’AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT 3’；

所述第四引物的序列如SEQ ID NO：6所示，具体为：

5’CAAGCAGAAGACGGCATACGAGATNNNNNNGAGATCGGTCTCGGCATTCCTGCTGAACCGCTCTTCCGATCT3’，其中，NNNNNN为索引index序列，具体可以为illumina通用index。引物SEQ ID NO：5和SEQ ID NO：6的3端也可加入3-20nt的随机或特定序列作为分子标签(UMI)，优选的分子标签的长度为4-12nt,更优选的分子标签的长度为6-9nt。通过加入分子标签的优点是可以在后续的分析过程中识别分子的来源，从而判断细胞中真实含有的甲基化位点和分子拷贝数，排除PCR扩增对分析的影响，增加校对的功能，加强分析的准确度。

可选地，指数扩增酶可以是High-Fidelity DNA Polymerase、High-Fidelity DNA Polymerase、PrimeSTAR HS DNA聚合酶、Ex Taq、ExFi Tusion DNA聚合酶、Vent DNA聚合酶、PfuDNA聚合酶、KAPA HiFi Hotstart polymerase等的任意一种或几种的组合。

可选地，在加入表8所示的反应物之前，可以加入无核酸水洗脱DNA，洗脱分离DNA后，按照表8配置PCR体系进行指数扩增。

也可以带着磁珠进行PCR扩增，优选进行带磁珠PCR。

11b)按照表9进行指数PCR扩增。

表9

其中的循环数可以根据具体实验进行相应的调整。

12、文库纯化

12a)AMPure XP磁珠在室温平衡30min以上。

12b)将80ul平衡后的AMPure XP磁珠的上清与50ul样品和50ul无菌水用枪吹打混匀。

12c)在室温孵育10min。

12d)将样品转移到磁力架上，待样品澄清后弃去上清。

12e)用200ul 80％(vol/vol)的乙醇，清洗磁珠。

12f)弃去上清。

12g)重复12e～12f)一次。

12h)弃去上清。

12i)室温开盖等待，至乙醇充分挥发。

12j)加入15ul的无菌水与磁珠充分混匀。

12k)室温孵育10min后，转到磁力架上，待溶液澄清后吸取上清至干净EP管中。

13、测序文库质检

使用安捷伦2100生物分析仪对测序文库进行质检，具体操作步骤如下：

取1ul步骤12k制备的样品至1ul体系，进行2100高灵敏芯片，操作步骤严格遵循2100操作手册。质检结果如图2所示，在进行指数扩增之后的片段大小为200bp-1000bp，主峰集中在400-600bp。

步骤14，测序及分析

使用illumina测序平台进行测序，并对测序结果进行分析。

测序结果中的原始数据碱基质量如图3所示，所述图3是由Fast QC软件制作，其中的线1表示其对应的reads碱基质量值的中位数。reads碱基质量值越高，说明测序错误率越低。图3表明，本发明实施例构建的测序文库的碱基质量良好。

测序结果中的原始数据碱基分布如图4所示，横坐标是reads碱基坐标，表示reads上从5’到3’端依次碱基的排列；纵坐标是所有reads在该测序位置A、C、G、T碱基分别占的百分比。序列的起始位置与测序的引物接头相连，因此A、C、G、T在起始端会有所波动，后面会趋于稳定。由于经过了重亚硫酸盐处理，C的含量会偏低。并且从图上可以看出该测序文库中的检测分别均匀，并且几乎看不到模糊碱基N，说明模糊碱基N数量少，测序文库受系统AT偏好影响小。

本发明实施例以一个mcf7活细胞的为样品，根据本发明实施例公开的RRBS测序的文库建立方法，得到R1文库。本发明实施例以另一个mcf7活细胞的为样品，根据本发明实施例公开的RRBS测序的文库建立方法，得到R2文库。对R1文库和R2文库进行测序，测序结果如表10所示。

表10

样本名称	样品来源	测序数据量(M)	转化率	Q30	CpG岛占比
						R1	1个mcf7活细胞	1,089.00	99.40％	53.04	34.8％
R2	1个mcf7活细胞	832.00	98.84％	59.64	42％

测序数据量(M)为测序所得的原始数据量。转化率：重亚硫酸盐对未甲基化的C转化为U的效率；Q30％：Phred数值大于30的碱基占总体碱基的百分比；CpG岛占比：为测序数据中覆盖到CpG岛区域所占数据的比例，理论上，CpG岛占全基因组的0.7％，我们的数据显示CpG岛可占我们测序数据的42％；极大的富集了CpG岛；极大的有效覆盖了CpG岛。

综上所述，本发明有效克服了现有技术中的种种缺点而具高度产业利用价值。

上述实施例仅例示性说明本发明的原理及其功效，而非用于限制本发明。任何熟悉此技术的人士皆可在不违背本发明的精神及范畴下，对上述实施例进行修饰或改变。因此，举凡所属技术领域中具有通常知识者在未脱离本发明所揭示的精神与技术思想下所完成的一切等效修饰或改变，仍应由本发明的权利要求所涵盖。

序列表

<110> 上海美吉医学检验有限公司

<120> 适用于单细胞RRBS测序的文库建立方法及其应用

<130> 173642

<160> 14

<170> SIPOSequenceListing 1.0

<210> 1

<211> 13

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 1

gctcttccga tct 13

<210> 2

<211> 12

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 2

cgagaaggct ag 12

<210> 3

<211> 22

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 3

ctacacgacg ctcttccgat ct 22

<210> 4

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 4

tgctgaaccg ctcttccgat c 21

<210> 5

<211> 58

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 5

aatgatacgg cgaccaccga gatctacact ctttccctac acgacgctct tccgatct 58

<210> 6

<211> 71

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 6

caagcagaag acggcatacg agatnnnnnn gagatcggtc tcggcattcc tgctgaaccg 60

ctcttccgat c 71

<210> 7

<211> 31

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 7

ctacacgacg ctcttccgat ctnnnnnncr r 31

<210> 8

<211> 31

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 8

ctacacgacg ctcttccgat ctnnnnnngy y 31

<210> 9

<211> 31

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 9

ctacacgacg ctcttccgat ctnnnnnntr r 31

<210> 10

<211> 31

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 10

ctacacgacg ctcttccgat ctnnnnnnay y 31

<210> 11

<211> 30

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 11

tgctgaaccg ctcttccgat cnnnnnncrr 30

<210> 12

<211> 30

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 12

tgctgaaccg ctcttccgat cnnnnnngyy 30

<210> 13

<211> 30

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 13

tgctgaaccg ctcttccgat cnnnnnntrr 30

<210> 14

<211> 30

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 14

tgctgaaccg ctcttccgat cnnnnnnayy 30

Claims

1.一种适用于单细胞RRBS测序的文库建立方法，其特征在于，包括如下步骤：

(1)对样本的基因组DNA依次进行酶切、末端补平和加A、加接头以及重亚硫酸盐转化；

(2)对步骤(1)中转化后的基因组DNA进行线性扩增；

(3)对步骤(2)中线性扩增的扩增子进行指数扩增，所述指数扩增的扩增子用作测序文库。

2.根据权利要求1所述的文库建立方法，其特征在于，所述样本基因组DNA由单细胞样本裂解获得或由多细胞样本抽提获得。

3.根据权利要求1所述的文库建立方法，其特征在于，步骤(1)中，所述酶切采用的酶包含但不限于其中任意一种或几种：AluI、TaqαI、SphI、MspI、BamHI、ApeKI、BanII、HpaII、HpyCH4V、BstNI、HaeIII、HpyCH4III、BglII、BssSI和KpnI。

4.根据权利要求1所述的文库建立方法，其特征在于，步骤(1)中，所述接头为单链结构或双链结构；

所述接头的第一链序列如SEQ ID NO：1所示，具体为：5’GCTCTTCCGATCT3’；所述接头的第二链序列如SEQ ID NO：2所示，具体为5’CGAGAAGGCTAG3’；

所述SEQ ID NO：1所示序列和所述SEQ ID NO：2所示序列中的C为甲基化修饰碱基。

5.根据权利要求1所述的文库建立方法，其特征在于，步骤(2)中，所述线性扩增包括第一线性扩增和第二线性扩增；

所述第一线性扩增的引物为第一引物，所述第一引物为随机引物；

所述第二线性扩增的引物为第二引物，所述第二引物为随机引物。

6.根据权利要求5所述的文库建立方法，其特征在于，所述第一引物的结构为：5’-特异性识别所述接头的序列-随机序列-CpG岛识别序列-3’，所述第二引物的结构为：5’-特异性识别所述接头的序列-随机序列-CpG岛识别序列-3’；或者所述第一引物的结构为：5’-特异性识别所述接头的序列-分子标签-随机序列-CpG岛识别序列-3’，所述第二引物的结构为：5’-特异性识别所述接头的序列-分子标签-随机序列-CpG岛识别序列-3’。

7.根据权利要求6所述的文库建立方法，其特征在于，所述第一引物中的特异性识别所述接头的序列如SEQ ID NO：3所示，具体为：5’CTACACGACGCTCTTCCGATCT3’；

所述第二引物中的特异性识别所述接头的序列如SEQ ID NO：4所示，具体为：5’TGCTGAACCGCTCTTCCGATC3’。

8.根据权利要求6所述的文库建立方法，其特征在于，所述第一引物中的随机序列的长度为4～20nt，所述第二引物中的随机序列的长度为4～20nt。

9.根据权利要求1所述的文库建立方法，其特征在于，步骤(2)中，所述线性扩增的DNA聚合酶为具有链置换活性的酶；其中，所述链置换活性的酶选自但不限于其中任意一种或几种：klenow片段(3′→5′exo-)、klenow片段、bst DNA聚合酶、vent DNA聚合酶(3′→5′exo-)、vent DNA聚合酶、Phi 29DNA聚合酶、deep vent DNA聚合酶(3′→5′exo-)、deepvent DNA聚合酶中的任一种或多种。

10.根据权利要求1所述的文库建立方法，其特征在于，步骤(3)中，所述指数扩增的引物包括第三引物和第四引物；所述第三引物的序列如SEQ ID NO：5所示，具体为：

5’AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT3’；所述第四引物的序列如SEQ ID NO：6所示，具体为：

11.如权利要求1-10任一项所述文库建立方法用于单细胞样本或多细胞样本的基因组DNA甲基化测序及甲基化位点分析中的用途。

12.一种确定单细胞样本或多细胞样本中基因组DNA甲基化位点的方法，其特征在于，包括如下步骤：采用如权利要求1-10任一项所述方法建立文库后，对所获得的文库进行测序，基于测序结果，对单细胞样本或多细胞样本的基因组DNA甲基化情况进行分析，确定甲基化位点。

13.一种适用于单细胞RRBS测序的文库构建试剂盒，其特征在于，包括：酶切反应物、末端补平和加A反应物、接头、重亚硫酸盐转化反应物、线性PCR反应物和指数PCR反应物。

14.根据权利要求13所述的文库构建试剂盒，其特征在于，所述酶切反应物的酶选择但不限于其中任意一种或几种：AluI、TaqαI、SphI、MspI、BamHI、ApeKI、BanII、HpaII、HpyCH4V、BstNI、HaeIII、HpyCH4III、BglII、BssSI和KpnI。

15.根据权利要求13所述的文库构建试剂盒，其特征在于，所述接头为单链结构或双链结构；所述接头的第一链序列如SEQ ID NO：1所示，具体为：5’GCTCTTCCGATCT3’；所述接头的第二链序列如SEQ ID NO：2所示，具体为5’CGAGAAGGCTAG3’；所述SEQ ID NO：1所示序列和所述SEQ ID NO：2所示序列中的C为甲基化修饰碱基。

16.根据权利要求13所述的文库构建试剂盒，其特征在于，线性PCR反应物包括第一引物、第二引物和具有链置换活性的酶；

所述第一引物和第二引物为随机引物。

17.根据权利要求16所述的文库构建试剂盒，其特征在于，所述第一引物的结构为：5’-特异性识别所述接头的序列-随机序列-CpG岛识别序列-3’，所述第二引物的结构为：5’-特异性识别所述接头的序列-随机序列-CpG岛识别序列-3’；或者所述第一引物的结构为：5’-特异性识别所述接头的序列-分子标签-随机序列-CpG岛识别序列-3’，所述第二引物的结构为：5’-特异性识别所述接头的序列-分子标签-随机序列-CpG岛识别序列-3’。

18.根据权利要求17所述的文库构建试剂盒，其特征在于，所述第一引物中的特异性识别所述接头的序列如SEQ ID NO：3所示，具体为：5’CTACACGACGCTCTTCCGATCT3’；

19.根据权利要求17所述的文库构建试剂盒，其特征在于，所述第一引物中的随机序列的长度为4～20nt，所述第二引物中的随机序列的长度为4～20nt；所述分子标签为固定序列或随机序列，随机序列的长度为2-20nt，优选的为4-10nt，更优选的为6-8nt。

20.根据权利要求16所述的文库构建试剂盒，其特征在于，所述链置换活性的酶选自但不限于其中任意一种或几种：klenow片段(3′→5′exo-)、klenow片段、bst DNA聚合酶、ventDNA聚合酶(3′→5′exo-)、vent DNA聚合酶、Phi 29DNA聚合酶、deep vent DNA聚合酶(3′→5′exo-)、deep vent DNA聚合酶。

21.根据权利要求13所述的文库构建试剂盒，其特征在于，指数PCR反应物包括第三引物和第四引物；

所述第三引物的序列如SEQ ID NO：5所示，具体为：

5’AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT

3’；所述第四引物的序列如SEQ ID NO：6所示，具体为：

22.一种基因组甲基化测序产品，其特征在于，包括如权利要求13-21任一项所述测序文库构建试剂盒。