CN107475779A - 适用于单细胞rrbs测序的文库建立方法及其应用 - Google Patents

适用于单细胞rrbs测序的文库建立方法及其应用 Download PDF

Info

Publication number
CN107475779A
CN107475779A CN201710864035.3A CN201710864035A CN107475779A CN 107475779 A CN107475779 A CN 107475779A CN 201710864035 A CN201710864035 A CN 201710864035A CN 107475779 A CN107475779 A CN 107475779A
Authority
CN
China
Prior art keywords
sequence
primer
seq
joint
specially
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710864035.3A
Other languages
English (en)
Inventor
李静
陈昌岳
王芳
张祥林
胡秋萍
董东
郑冠涛
段彪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Meiji Medical Inspection Co Ltd
Original Assignee
Shanghai Meiji Medical Inspection Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Meiji Medical Inspection Co Ltd filed Critical Shanghai Meiji Medical Inspection Co Ltd
Priority to CN201710864035.3A priority Critical patent/CN107475779A/zh
Publication of CN107475779A publication Critical patent/CN107475779A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B50/00Methods of creating libraries, e.g. combinatorial synthesis
    • C40B50/06Biochemical methods, e.g. using enzymes or whole viable microorganisms
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6858Allele-specific amplification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biochemistry (AREA)
  • Zoology (AREA)
  • Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Analytical Chemistry (AREA)
  • Biotechnology (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明涉及分子生物学技术领域,具体公开了一种适用于单细胞RRBS测序的文库建立方法及其应用。本发明公开的适用于单细胞RRBS测序的文库建立方法包括如下步骤:(1)对样本的基因组DNA依次进行酶切、末端补平和加A、加接头以及重亚硫酸盐转化;(2)对步骤(1)中转化后的基因组DNA进行线性扩增;(3)对步骤(2)中线性扩增的扩增子进行指数扩增,所述指数扩增的扩增子用作测序文库。该方法测序所需的DNA起始量低,可以对单个细胞的基因组进行甲基化测序;具有有效的文库片段控制步骤,通过线性扩增步骤控制最终产物的片段,避免繁复操作的同时提高覆盖率。

Description

适用于单细胞RRBS测序的文库建立方法及其应用
技术领域
本发明涉及分子生物学技术领域,特别是涉及一种适用于单细胞的代表性亚硫酸氢盐测序(Reduced Representation Bisulfite Sequencing,RRBS)测序的文库建立方法及其应用。
背景技术
DNA甲基化(DNA methylation)是指在DNA上的胞嘧啶(C)的第5个碳原子上被甲基共价修饰成为5’甲基胞嘧啶(5mC)。DNA甲基化是最早发现的表观遗传修饰途径之一,能引起染色质结构、DNA构象、DNA稳定性及DNA与蛋白质相互作用方式的改变,从而控制基因表达。它具有多种重要的生物学功能,包括X染色体失活、转座子沉默、基因印记等。DNA甲基化修饰绝大多数发生在CpG位点上。在哺乳动物中CpG以两种形式存在:一种是分散于DNA序列中;另一种呈现高度聚集状态,称之为CpG岛(CpG island)。CpG岛通常被定义为在200bp序列中,GC含量大于50%的区域。人类基因组序列草图分析结果表明,人类基因组CpG岛约为28890个,大部分染色体每1Mb就有5-15个CpG岛,平均值为每Mb含10.5个CpG岛。约50%以上的CpG岛位于启动子,而60%以上的基因启动子含有CpG岛,因此基因转录区CpG岛的甲基化状态的研究就显得十分重要。因此需要一种全面、快速检测CpG岛甲基化的方法。
传统检测DNA甲基化的方法,包括限制性酶切-PCR、甲基化特异性PCR,只能检测单个或少数位点。
基于高通量测序技术的DNA甲基化检测方法包括:1)全基因组重亚硫酸盐甲基化测序;2)DNA甲基化免疫共沉淀测序;3)限制性内切酶-重亚硫酸盐测序法。
全基因组甲基化测序是用重亚硫酸盐处理DNA,在单碱基分辨率上检测所有C的甲基化情况,这是对基因组覆盖度最广的实验方案。由于达到了全基因组覆盖度,需要约90G测序数据量,才能获得足够的测序深度。
DNA甲基化免疫共沉淀测序是采用抗体或重组甲基化CpG结合蛋白捕获甲基化DNA,随后进行高通量测序,这两种方法只能对DNA甲基化状态进行半定量检测,其分辨率为100bp左右,且不能达到单细胞水平。
限制性内切酶-重亚硫酸盐测序法,是用MspI(CCGG)等限制性内切酶对全基因组进行酶切富集后,再经重亚硫酸盐(Bisulfite,BS)处理后的甲基化测序方式。该方式是针对CpG岛的测序方案,在单细胞层面可覆盖约50%的CpG岛,能实现单碱基分辨率、单细胞实验,是一种经济、高效的针对CpG岛的甲基化方案。
现有的限制性内切酶-重亚硫酸盐测序法需要经过复杂的实验流程:MspI酶切、电泳、纯化步骤富集启动子及CpG岛区域,随后进行末端修复、加A、接头连接、重亚硫酸盐转化、纯化和PCR扩增、PAGE胶片段选择等步骤构建测序文库,需要大约5~6天时间。而且在加接头后进行重亚硫酸处理,药物对DNA会有随机打断的作用,会造成样品信息的极大丢失,尤其是在单细胞层面时输入样品量极低,只有极少的拷贝数。同时利用PAGE胶回收所需大小的文库,操作繁琐,容易造成样品间的交叉污染,受到回收效率的影响也会极大的损失有用的信息。
发明内容
鉴于以上所述现有技术的缺点,本发明的目的在于提供一种适用于单细胞RRBS测序的文库建立方法及其应用,以提高RRBS的效率以及提高RRBS测序的覆盖率和降低甲基化信息的丢失。
为实现上述目的及其他相关目的,第一方面,本发明提供了一种适用于单细胞RRBS测序的文库建立方法,包括如下步骤:(1)对样本的基因组DNA依次进行酶切、末端补平和加A、加接头以及重亚硫酸盐转化;(2)对步骤(1)中转化后的基因组DNA进行线性扩增;(3)对步骤(2)中线性扩增的扩增子进行指数扩增,所述指数扩增的扩增子用作测序文库。
于本发明的一个实施例中,所述样本基因组DNA由单细胞样本裂解获得或由多细胞样本抽提获得。
此外,可以是在进行步骤(1)之前,先对单细胞样本裂解或对多细胞样本抽提,从而获得所述样本基因组DNA。也可以采用由他人利用本领域所熟知的技术已经由单细胞样本裂解获得或由多细胞样本抽提获得的样本基因组DNA。
于本发明的一个实施例中,步骤(1)中,所述酶切采用的酶可以为AluI、TaqαI、SphI、MspI、BamHI、ApeKI、BanII、HpaII、HpyCH4V、BstNI、HaeIII、HpyCH4III、BglII、BssSI和KpnI中的任意一种或2种或几种的混合物,也可以为其他适用于CpG岛识别的限制性内切酶或组合。
于本发明的一个实施例中,步骤(1)中,所述接头为单链结构或双链结构;所述接头的第一链序列如SEQ ID NO:1所示,具体为:5’GCTCTTCCGATCT3’;所述接头的第二链序列如SEQ ID NO:2所示,具体为5’CGAGAAGGCTAG3’;所述SEQ ID NO:1所示序列和所述SEQ IDNO:2所示序列中的C为甲基化修饰碱基。
于本发明的一个实施例中,步骤(2)中,所述线性扩增包括第一线性扩增和第二线性扩增;所述第一线性扩增的引物为第一引物,所述第一引物为随机引物;所述第二线性扩增的引物为第二引物,所述第二引物为随机引物。
于本发明的一个实施例中,所述第一引物的结构为:5’-特异性识别所述接头的序列-随机序列-CpG岛识别序列-3’;所述第二引物的结构为:5’-特异性识别所述接头的序列-随机序列-CpG岛识别序列-3’;或者所述第一引物的结构为:5’-特异性识别所述接头的序列-分子标签-随机序列-CpG岛识别序列-3’;所述第二引物的结构为:5’-特异性识别所述接头的序列-分子标签-随机序列-CpG岛识别序列-3’。
于本发明的一个实施例中,所述第一引物中的特异性识别所述接头的序列如SEQID NO:3所示,具体为:5’CTACACGACGCTCTTCCGATCT3’;所述第二引物中的特异性识别所述接头的序列如SEQ ID NO:4所示,具体为:5’TGCTGAACCGCTCTTCCGATC3’。
于本发明的一个实施例中,所述第一引物选自以下序列中的一种或任意多种:
SEQ ID NO:7所示序列、SEQ ID NO:8所示序列、SEQ ID NO:9所示序列、SEQ IDNO:10所示序列;其中,SEQ ID NO:7所示序列具体为CTACACGACGCTCTTCCGATCTNNNNNNCRR,SEQ ID NO:8所示序列具体为CTACACGACGCTCTTCCGATCTNNNNNNGYY,SEQ ID NO:9所示序列具体为CTACACGACGCTCTTCCGATCTNNNNNNTRR,SEQ ID NO:10所示序列具体为CTACACGACGCTCTTCCGATCTNNNNNNAYY。
于本发明的一个实施例中,所述第二引物选自以下序列中的一种或任意多种:
SEQ ID NO:11所示序列、SEQ ID NO:12所示序列、SEQ ID NO:13所示序列、SEQ IDNO:14所示序列;SEQ ID NO:11所示序列具体为TGCTGAACCGCTCTTCCGATCNNNNNNCRR,SEQ IDNO:12所示序列具体为TGCTGAACCGCTCTTCCGATCNNNNNNGYY,SEQ ID NO:13所示序列具体为TGCTGAACCGCTCTTCCGATCNNNNNNTRR,SEQ ID NO:14所示序列具体为TGCTGAACCGCTCTTCCGATCNNNNNNAYY。
于本发明的一个实施例中,所述第一引物中的随机序列的长度为4~20nt,所述第二引物中的随机序列的长度为4~20nt。
于本发明的一个实施例中,所述第一引物中的随机序列的长度为4~14nt。
于本发明的一个实施例中,所述第一引物中的随机序列的长度为6~10nt。
于本发明的一个实施例中,所述第二引物中的随机序列的长度为4~14nt。
于本发明的一个实施例中,所述第二引物中的随机序列的长度为6~10nt。
于本发明的一个实施例中,步骤(2)中,所述线性扩增的DNA聚合酶为具有链置换活性的酶;其中,所述链置换活性的酶选自但不限于其中任意一种或几种:选自klenow片段(3′→5′exo-)、bst DNA聚合酶、klenow片段、vent DNA聚合酶(3′→5′exo-)、vent DNA聚合酶、Phi 29DNA聚合酶、deep vent DNA聚合酶(3′→5′exo-)、deep vent DNA聚合酶。
于本发明的一个实施例中,步骤(3)中,所述指数扩增的引物包括第三引物和第四引物;所述第三引物的序列如SEQ ID NO:5所示,具体为:
5’AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT 3’;
所述第四引物的序列如SEQ ID NO:6所示,具体为:
5’CAAGCAGAAGACGGCATACGAGATNNNNNNGAGATCGGTCTCGGCATTCCTGCTGAACCGCTCTTCCGATC3’,其中,NNNNNN为索引index序列。
第二方面,本发明还提供了一种如第一方面提供的文库建立方法用于单细胞样本或多细胞样本的基因组DNA甲基化测序及甲基化位点分析中的用途。
第三方面,本发明还提供了一种确定单细胞样本或多细胞样本中基因组DNA甲基化位点的方法,包括如下步骤:采用如第一方面提供的文库建立方法建立文库后,对所获得的文库进行测序,基于测序结果,对单细胞样本或多细胞样本的基因组DNA甲基化情况进行分析,确定甲基化位点。
第四方面,本发明还提供了一种适用于单细胞RRBS测序的文库构建试剂盒,包括:酶切反应物、末端补平和加A反应物、接头、重亚硫酸盐转化反应物、线性PCR反应物和指数PCR反应物。
进一步地,所述试剂盒还包括细胞裂解液。
于本发明的一个实施例中,所述酶切反应物可以包括AluI、TaqαI、SphI、MspI、BamHI、ApeKI、BanII、HpaII、HpyCH4V、BstNI、HaeIII、HpyCH4III、BglII、BssSI和KpnI中的任意一种或2种或几种的混合物,也可以包括其他适用于CpG岛识别的限制性内切酶或组合。
于本发明的一个实施例中,所述接头为单链结构或双链结构;所述接头的第一链序列如SEQ ID NO:1所示,具体为:5’GCTCTTCCGATCT3’;所述接头的第二链序列如SEQ IDNO:2所示,具体为5’CGAGAAGGCTAG3’;所述SEQ ID NO:1所示序列和所述SEQ ID NO:2所示序列中的C为甲基化修饰碱基。
于本发明的一个实施例中,线性PCR反应物包括第一引物、第二引物和具有链置换活性的酶;所述第一引物和第二引物为随机引物。
于本发明的一个实施例中,所述第一引物的结构为::5’-特异性识别所述接头的序列-随机序列-CpG岛识别序列-3’;所述第二引物的结构为:5’-特异性识别所述接头的序列-随机序列-CpG岛识别序列-3’;或者所述第一引物的结构为:5’-特异性识别所述接头的序列-分子标签-随机序列-CpG岛识别序列-3’;所述第二引物的结构为:5’-特异性识别所述接头的序列-分子标签-随机序列-CpG岛识别序列-3’。
于本发明的一个实施例中,所述第一引物中的特异性识别所述接头的序列如SEQID NO:3所示,具体为:5’CTACACGACGCTCTTCCGATCT3’;所述第二引物中的特异性识别所述接头的序列如SEQ ID NO:4所示,具体为:5’TGCTGAACCGCTCTTCCGATC3’。
于本发明的一个实施例中,所述第一引物选自以下序列中的一种或任意多种:
SEQ ID NO:7所示序列、SEQ ID NO:8所示序列、SEQ ID NO:9所示序列、SEQ IDNO:10所示序列;其中,SEQ ID NO:7所示序列具体为CTACACGACGCTCTTCCGATCTNNNNNNCRR,SEQ ID NO:8所示序列具体为CTACACGACGCTCTTCCGATCTNNNNNNGYY,SEQ ID NO:9所示序列具体为CTACACGACGCTCTTCCGATCTNNNNNNTRR,SEQ ID NO:10所示序列具体为CTACACGACGCTCTTCCGATCTNNNNNNAYY。
于本发明的一个实施例中,所述第二引物选自以下序列中的一种或任意多种:
SEQ ID NO:11所示序列、SEQ ID NO:12所示序列、SEQ ID NO:13所示序列、SEQ IDNO:14所示序列;SEQ ID NO:11所示序列具体为TGCTGAACCGCTCTTCCGATCNNNNNNCRR,SEQ IDNO:12所示序列具体为TGCTGAACCGCTCTTCCGATCNNNNNNGYY,SEQ ID NO:13所示序列具体为TGCTGAACCGCTCTTCCGATCNNNNNNTRR,SEQ ID NO:14所示序列具体为TGCTGAACCGCTCTTCCGATCNNNNNNAYY。
于本发明的一个实施例中,所述第一引物中的随机序列的长度为4~20nt,所述第二引物中的随机序列的长度为4~20nt。
于本发明的一个实施例中,所述第一引物中的随机序列的长度为4~14nt。
于本发明的一个实施例中,所述第一引物中的随机序列的长度为6~10nt。
于本发明的一个实施例中,所述第二引物中的随机序列的长度为4~14nt。
于本发明的一个实施例中,所述第二引物中的随机序列的长度为6~10nt。
于本发明的一个实施例中,所述链置换活性的酶选自但不限于其中任意一种或几种:选自klenow片段(3′→5′exo-)、bst DNA聚合酶、klenow片段、vent DNA聚合酶(3′→5′exo-)、vent DNA聚合酶、Phi 29DNA聚合酶、deep vent DNA聚合酶(3′→5′exo-)、deepvent DNA聚合酶vent DNA聚合酶、Phi 29DNA聚合酶、deep vent DNA聚合酶中的任一种或多种。
于本发明的一个实施例中,指数PCR反应物包括第三引物和第四引物;
所述第三引物的序列如SEQ ID NO:5所示,具体为:
5’AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT 3’;
所述第四引物的序列如SEQ ID NO:6所示,具体为:
5’CAAGCAGAAGACGGCATACGAGATNNNNNNGAGATCGGTCTCGGCATTCCTGCTGAACCGCTCTTCCGATC3’,其中,NNNNNN为索引index序列。
第五方面,本发明还提供了一种基因组甲基化测序产品,包括如第四方面所述的测序文库构建试剂盒。
与现有技术相比,本发明具有如下有益效果:
1、测序所需的DNA起始量低,可以对单个细胞的基因组进行甲基化测序;2、简化的实验步骤,通过在线性扩增步骤控制最终产物的片段,从而避免了传统的PAGE胶切胶回收或磁珠片段筛选的繁复操作;3、最大程度的保留CpG岛区域,通过特异性引物的线性扩增,锚定CpG岛的同时可扩增由于重亚硫酸盐处理而被打断的DNA,这部分DNA在传统的建库方案中无法得到扩增,而最大限度的保留文库的多样性;4、避免了由于胶回收而可能造成的交叉污染;5、提高样品利用率,由于无需进行跑胶片段筛选,而避免了胶回收过程中样品的损失。
附图说明
图1为本发明实施例提供的一种接头的结构图;
图2为本发明实施例提供的适用于单细胞RRBS测序的文库构建方法构建的测序文库的质检结果;
图3为本发明实施例提供的适用于单细胞RRBS测序的文库构建方法构建的测序文库的测序结果的原始数据碱基质量分布图;
图4为本发明实施例提供的适用于单细胞RRBS测序的文库构建方法构建的测序文库的测序结果的原始数据碱基分布图。
图5为本发明实施例提供的单细胞全基因甲基化测序方法的加入分子标签(UMI)与不加入分子标签(UMI)的拷贝数变异分析结果比较图。
具体实施方式
对于RRBS的建库方案一般是通过用MspI(CCGG)等限制性内切酶对全基因组进行酶切后,在同一反应管中进行末端补平、加A、加接头,再用重亚硫酸盐处理样品并进行回收,回收完的DNA经过PCR扩增后,进行PAGE胶的切胶回收目的片段,从而完成单细胞RRBS的文库构建,并进行测序。
另外还有针对甲基化的CpG岛进行建库测序的方案。该方案首先通过用重亚硫酸盐处理DNA样品,使DNA样品中的胞嘧啶转换为尿嘧啶,而5’甲基胞嘧啶不变,得到的片段通过特殊设计的DNA引物进行扩增后,该引物特异性的识别高C含量的位点进行扩增,通过后续的指数扩增获得所需的DNA并通过2%的琼脂糖切胶回收,最终的产物可直接进行测序。
现有技术中的RRBS测序方案通过都需要通过胶回收的方案回收所需的DNA文库,但胶回收方案有几个弊端:1.易污染:电泳上样过程中极易造成样品间交叉污染;2.有危害:传统的DNA显色染料EB对人体存在潜在致癌危害;3.易引起突变:紫外照射后待测样本DNA易引起DNA突变从而影响样本结果;4.信息丢失:目前的胶回收方案主要为琼脂糖或PAGE胶回收,需要经过切胶进行样本扩增产物DNA的片段筛选,会导致未获得筛选部分片段的有用信息丢失,某些酶切位点稀疏的长片段部分CpG岛信息不能得到有效的利用;5.操作繁琐耗时:胶回收本身需要2小时到2天的操作时间,操作繁琐;6:实验不稳定:胶的回收效率通常在5%-60%之间,回收效率不稳定,这对实验的稳定性及有用信息的保留都极为不利。
现有的RRBS建库实验中采用的是先加接头后转化的实验模式,而重亚硫酸盐的转化环境苛刻,会导致DNA的随机断裂,由于转化发生在PCR扩增之前,随机打断会造成DNA不可逆的损失,尤其是在起始样本量低的时候,每个位点的信息都是独一无二的,因此对后续有用信息的损失极大。
此外,现有的方案针对的样品为500pg-500ng的DNA样本,而不能对未经提取的DNA直接进行实验,也不能达到单细胞的水平。同时其富集的为甲基化的CpG岛,但是绝大部分的CpG岛是处于低甲基化状态的,因此所能富集的只有极小的一部分有用信息。
鉴于以上问题,本发明实施例提供了一种适用于单细胞RRBS测序的文库建立方法及其应用。可以无需进行凝胶回收就可以构建针对CpG岛的文库,进而对CpG岛进行测序。
在进一步描述本发明具体实施方式之前,应理解,本发明的保护范围不局限于下述特定的具体实施方案;还应当理解,本发明实施例中使用的术语是为了描述特定的具体实施方案,而不是为了限制本发明的保护范围;在本发明说明书和权利要求书中,除非文中另外明确指出,单数形式“一个”、“一”和“这个”包括复数形式。
当实施例给出数值范围时,应理解,除非本发明另有说明,每个数值范围的两个端点以及两个端点之间任何一个数值均可选用。除非另外定义,本发明中使用的所有技术和科学术语与本技术领域技术人员通常理解的意义相同。除实施例中使用的具体方法、设备、材料外,根据本技术领域的技术人员对现有技术的掌握及本发明的记载,还可以使用与本发明实施例中所述的方法、设备、材料相似或等同的现有技术的任何方法、设备和材料来实现本发明。
除非另外说明,本发明中所公开的实验方法、检测方法、制备方法均采用本技术领域常规的分子生物学、生物化学、染色质结构和分析、分析化学、细胞培养、重组DNA技术及相关领域的常规技术。这些技术在现有文献中已有完善说明,具体可参见Sambrook等MOLECULAR CLONING:A LABORATORY MANUAL,Second edition,Cold Spring HarborLaboratory Press,1989and Third edition,2001;Ausubel等,CURRENT PROTOCOLS INMOLECULAR BIOLOGY,John Wiley&Sons,New York,1987and periodic updates;theseries METHODS IN ENZYMOLOGY,Academic Press,San Diego;Wolffe,CHROMATINSTRUCTURE AND FUNCTION,Third edition,Academic Press,San Diego,1998;METHODS INENZYMOLOGY,Vol.304,Chromatin(P.M.Wassarman and A.P.Wolffe,eds.),AcademicPress,San Diego,1999;和METHODS IN MOLECULAR BIOLOGY,Vol.119,ChromatinProtocols(P.B.Becker,ed.)Humana Press,Totowa,1999等。
本发明实施例提供了一种适用于单细胞RRBS测序的文库建立方法,包括如下步骤:(1)对样本的基因组DNA依次进行酶切、末端补平和加A、加接头以及重亚硫酸盐转化;(2)对步骤(1)中转化后的基因组DNA进行线性扩增;(3)对步骤(2)中线性扩增的扩增子进行指数扩增,所述指数扩增的扩增子用作测序文库。
本发明实施例提供的文库建立方法能够进行有效的文库片段控制。通过在线性扩增步骤控制最终产物的片段,从而避免了传统的PAGE胶切胶回收或磁珠片段筛选的繁复操作,同时可最大限度的保留文库的多样性。
在一个示例中,所述样本基因组DNA由单细胞样本裂解获得或由多细胞样本抽提获得。
此外,可以是在进行步骤(1)之前,先对单细胞样本裂解或对多细胞样本抽提,从而获得所述样本基因组DNA。也可以采用由他人利用本领域所熟知的技术已经由单细胞样本裂解获得或由多细胞样本抽提获得的样本基因组DNA。
本发明实施例提供的文库建立方法所需的样本基因组DNA量较低。单细胞的起始量(6pg)。比现有的中量(500pg)起始的实验方案降低2个数量级。对于细胞异质性的探索、珍惜样本的研究具有极其重要的意义。
本发明实施例提供的文库建立方法还可以进行严格的质量控制。单细胞的起始DNA量只有6pg极易丢失及引入污染。在本发明的实施例中通过加入阴性对照的方法,对每一步扩增都进行严格的质控,避免人为操作引入的污染。同时通过加入适量的λDNA(60fg或者为输入DNA的1/1000-1/10000的质量比)检测重亚硫酸盐的转化效率,剔除转化率低的样品而控制样品质量。
在一个示例中,步骤(1)中,所述酶切采用的酶为包含AluI、TaqαI、SphI、MspI、BamHI、ApeKI、BanII、HpaII、HpyCH4V、BstNI、HaeIII、HpyCH4III、BglII、BssSI和KpnI等中的任意一种或2种或几种的混合物。
在一个示例中,所述接头为单链结构或双链结构;所述接头的第一链序列如SEQID NO:1所示,具体为:5’GCTCTTCCGATCT3’;所述接头的第二链序列如SEQ ID NO:2所示,具体为5’CGAGAAGGCTAG3’;所述SEQ ID NO:1所示序列和所述SEQ ID NO:2所示序列中的C为甲基化修饰碱基。在一个示例中,步骤(1)中,所述接头的结构为如图1所示。
在一个示例中,步骤(2)中,所述线性扩增包括第一线性扩增和第二线性扩增;所述第一线性扩增的引物为第一引物,所述第一引物为随机引物;所述第二线性扩增的引物为第二引物,所述第二引物为随机引物。
本发明实施例可以在第一线性扩增后加入核酸外切酶I消化未反应的第一引物,防止在第二线性扩增中加入第二引物后发生引物自连、引物之间互为模板的现象,浪费资源的同时引入背景信息,增加测序成本的同时获得低的产出。
在一个示例中,所述第一引物的结构为:5’-特异性识别所述接头的序列-随机序列-CpG岛识别序列-3’;所述第二引物的结构为:5’-特异性识别所述接头的序列-随机序列-CpG岛识别序列-3’;或者所述第一引物的结构为:5’-特异性识别所述接头的序列-分子标签-随机序列-CpG岛识别序列-3’;所述第二引物的结构为:5’-特异性识别所述接头的序列-分子标签-随机序列-CpG岛识别序列-3’。
本发明实施例提供的文库建立方法具有更高的CpG岛的覆盖度。通过加接头后的线性扩增步骤,线性扩增所用的引物对前期接头具有特异性的识别,这样可特异性扩增CpG岛区域。同时线性扩增可以有效的覆盖由于药物处理而断裂的、无法得到扩增的DNA片段,从而提高对CpG岛的有效覆盖。
在一个示例中,所述第一引物中的特异性识别所述接头的序列如SEQ ID NO:3所示,具体为:5’CTACACGACGCTCTTCCGATCT3’;所述第二引物中的特异性识别所述接头的序列如SEQ ID NO:4所示,具体为:5’TGCTGAACCGCTCTTCCGATC3’。
在一个示例中,所述第一引物选自以下序列中的一种或任意多种:
SEQ ID NO:7所示序列、SEQ ID NO:8所示序列、SEQ ID NO:9所示序列、SEQ IDNO:10所示序列;其中,SEQ ID NO:7所示序列具体为CTACACGACGCTCTTCCGATCTNNNNNNCRR,SEQ ID NO:8所示序列具体为CTACACGACGCTCTTCCGATCTNNNNNNGYY,SEQ ID NO:9所示序列具体为CTACACGACGCTCTTCCGATCTNNNNNNTRR,SEQ ID NO:10所示序列具体为CTACACGACGCTCTTCCGATCTNNNNNNAYY。
在一个示例中,所述第二引物选自以下序列中的一种或任意多种:
SEQ ID NO:11所示序列、SEQ ID NO:12所示序列、SEQ ID NO:13所示序列、SEQ IDNO:14所示序列;SEQ ID NO:11所示序列具体为TGCTGAACCGCTCTTCCGATCNNNNNNCRR,SEQ IDNO:12所示序列具体为TGCTGAACCGCTCTTCCGATCNNNNNNGYY,SEQ ID NO:13所示序列具体为TGCTGAACCGCTCTTCCGATCNNNNNNTRR,SEQ ID NO:14所示序列具体为TGCTGAACCGCTCTTCCGATCNNNNNNAYY。
在一个示例中,所述第一引物中的随机序列的长度为4~20nt,所述第二引物中的随机序列的长度为4~20nt。
在一个示例中,所述第一引物中的随机序列的长度为4~14nt。
在一个示例中,所述第一引物中的随机序列的长度为6~10nt。
在一个示例中,所述第二引物中的随机序列的长度为4~14nt。
在一个示例中,所述第二引物中的随机序列的长度为6~10nt。
在一个示例中,步骤(2)中,所述线性扩增的DNA聚合酶为具有链置换活性的酶;其中,所述链置换活性的酶选自包含但不限于其中任意一种或几种:选自klenow片段(3′→5′exo-)、bst DNA聚合酶、klenow片段、vent DNA聚合酶(3′→5′exo-)、vent DNA聚合酶、Phi29DNA聚合酶、deep vent DNA聚合酶(3′→5′exo-)、deep vent DNA聚合酶等中的任一种或多种的组合。所述线性扩增的DNA聚合酶也可以为其他一种或多种具有链置换活性酶的组合。本发明实施例仅对线性扩增的DNA聚合酶进行说明,不构成限定。
在一个示例中,步骤(3)中,所述指数扩增的引物包括第三引物和第四引物;所述第三引物的序列如SEQ ID NO:5所示,具体为:
5’AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT 3’;
所述第四引物的序列如SEQ ID NO:6所示,具体为:
5’CAAGCAGAAGACGGCATACGAGATNNNNNNGAGATCGGTCTCGGCATTCCTGCTGAACCGCTCTTCCGATC 3’,其中,NNNNNN为索引index序列。引物SEQ ID NO:5和SEQ ID NO:6的3’端也可加入3-20nt的随机或特定序列作为分子标签(UMI),优选的分子标签的长度为4-12nt,更优选的分子标签的长度为6-9nt。加入分子标签的优点是可以在后续的分析过程中识别分子的来源,从而判断细胞中真实含有的甲基化位点和分子拷贝数,排除PCR扩增对分析的影响,增加校对的功能,加强分析的准确度。
本发明实施例还提供了一种如上文中所提供的文库建立方法用于单细胞样本或多细胞样本的基因组DNA甲基化测序及甲基化位点分析中的用途。
本发明实施例还提供了一种确定单细胞样本或多细胞样本中基因组DNA甲基化位点的方法,包括如下步骤:采用如上文中所提供的文库建立方法建立文库后,对所获得的文库进行测序,基于测序结果,对单细胞样本或多细胞样本的基因组DNA甲基化情况进行分析,确定甲基化位点。
本发明实施例还提供了一种适用于单细胞RRBS测序的文库构建试剂盒,包括:酶切反应物、末端补平和加A反应物、接头、重亚硫酸盐转化反应物、线性PCR反应物和指数PCR反应物。
进一步地,所述试剂盒还可以包括细胞裂解液。
在一个示例中,所述酶切反应物可以包括AluI、TaqαI、SphI、MspI、BamHI、ApeKI、BanII、HpaII、HpyCH4V、BstNI、HaeIII、HpyCH4III、BglII、BssSI和KpnI等中的任意一种或2种或几种的混合物,也可以包括其他适用于CpG岛识别的限制性内切酶或组合。在一个示例中,所述接头为单链结构或双链结构;所述接头的第一链序列如SEQ ID NO:1所示,具体为:5’GCTCTTCCGATCT3’;所述接头的第二链序列如SEQ ID NO:2所示,具体为5’CGAGAAGGCTAG3’;所述SEQ ID NO:1所示序列和所述SEQ ID NO:2所示序列中的C为甲基化修饰碱基。
在一个示例中,所述接头的结构如图1所示。在一个示例中,线性PCR反应物包括第一引物、第二引物和具有链置换活性的酶;所述第一引物和第二引物为随机引物。
在一个示例中,所述第一引物的结构为:5’-特异性识别所述接头的序列-随机序列-CpG岛识别序列-3’;所述第二引物的结构为:5’-特异性识别所述接头的序列-随机序列-CpG岛识别序列-3’;或者所述第一引物的结构为:5’-特异性识别所述接头的序列-分子标签-随机序列-CpG岛识别序列-3’;所述第二引物的结构为:5’-特异性识别所述接头的序列-分子标签-随机序列-CpG岛识别序列-3’。
在一个示例中,所述第一引物中的特异性识别所述接头的序列如SEQ ID NO:3所示,具体为:5’CTACACGACGCTCTTCCGATCT3’;所述第二引物中的特异性识别所述接头的序列如SEQ ID NO:4所示,具体为:5’TGCTGAACCGCTCTTCCGATC3”。
在一个示例中,所述第一引物选自以下序列中的一种或任意多种:
SEQ ID NO:7所示序列、SEQ ID NO:8所示序列、SEQ ID NO:9所示序列、SEQ IDNO:10所示序列;其中,SEQ ID NO:7所示序列具体为CTACACGACGCTCTTCCGATCTNNNNNNCRR,SEQ ID NO:8所示序列具体为CTACACGACGCTCTTCCGATCTNNNNNNGYY,SEQ ID NO:9所示序列具体为CTACACGACGCTCTTCCGATCTNNNNNNTRR,SEQ ID NO:10所示序列具体为CTACACGACGCTCTTCCGATCTNNNNNNAYY。
在一个示例中,所述第二引物选自以下序列中的一种或任意多种:
SEQ ID NO:11所示序列、SEQ ID NO:12所示序列、SEQ ID NO:13所示序列、SEQ IDNO:14所示序列;SEQ ID NO:11所示序列具体为TGCTGAACCGCTCTTCCGATCNNNNNNCRR,SEQ IDNO:12所示序列具体为TGCTGAACCGCTCTTCCGATCNNNNNNGYY,SEQ ID NO:13所示序列具体为TGCTGAACCGCTCTTCCGATCNNNNNNTRR,SEQ ID NO:14所示序列具体为TGCTGAACCGCTCTTCCGATCNNNNNNAYY。
在一个示例中,所述第一引物中的随机序列的长度为4~20nt,所述第二引物中的随机序列的长度为4~20nt。
在一个示例中,所述第一引物中的随机序列的长度为4~14nt。
在一个示例中,所述第一引物中的随机序列的长度为6~10nt。
在一个示例中,所述第二引物中的随机序列的长度为4~14nt。
在一个示例中,所述第二引物中的随机序列的长度为6~10nt。
在一个示例中,所述链置换活性的酶选自包含但不限于其中任意一种或几种:klenow片段(3′→5′exo-)、klenow片段、bst DNA聚合酶、vent DNA聚合酶(3′→5′exo-)、vent DNA聚合酶、Phi 29DNA聚合酶、deep vent DNA聚合酶(3′→5′exo-)、deep vent DNA聚合酶等中的任一种或多种。
在一个示例中,指数PCR反应物包括第三引物和第四引物;
所述第三引物的序列如SEQ ID NO:5所示,具体为:
5’AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATC3’;
所述第四引物的序列如SEQ ID NO:6所示,具体为:
5’CAAGCAGAAGACGGCATACGAGATNNNNNNGAGATCGGTCTCGGCATTCCTGCTGAACCGCTCTTCCGATC 3’,其中,NNNNNN为索引index序列。在引物中也可加入3-20nt的随机或特定序列作为分子标签(UMI),优选的分子标签优选的分子标签的长度为4-12nt,更优选的分子标签的长度为6-9nt。
本发明实施例还提供了一种基因组甲基化测序产品,包括本发明实施例提供的测序文库构建试剂盒。
下文以具体实施例1对本发明实施例的技术方案进行更具体地说明。
实施例1
可先对单细胞样本裂解或对多细胞样本抽提,从而获得样本基因组DNA。也可以采用由他人利用本领域所熟知的技术已经由单细胞样本裂解获得或由多细胞样本抽提获得的样本基因组DNA。
作为示例:本申请实施例中的样本基因组DNA可由如下步骤1和步骤2获得:
步骤1、单细胞分离。
可以利用口吸法、激光显微捕获、有限稀释法、流式细胞分选等细胞分离方法获得单细胞或多个细胞。包含细胞的缓冲液优选地为1×PBS,也可以是生理盐水、0.278mol/L蔗糖等细胞等渗溶液,体积为1-4μl。
步骤2、细胞裂解。
2a)按表1的体系建立裂解体系:
表1
成分 体积(ul) 终浓度
Tris-EDTA(500m M Tris,50mM EDTA) 0.05 10mM Tris,1mM EDTA
1M KCl 0.05 10mM
10%(vol/vol)Triton X-100 0.05 0.1%(vol/vol)
10mg/ml蛋白酶 0.25 0.5mg/ml
无核酸水 补至4
2b)涡旋混匀裂解体系。
2c)6000g,4℃,离心1min。确保所有样品被收集在PCR管底部。
2d)将裂解体系转移到含有单细胞的PCR管中,共5ul。
2e)6000g,4℃,离心1min。
2f)PCR仪设置50℃,30分钟到过夜不等,可以根据样本的不同需要进行具体调整。裂解细胞;75℃,30min,4℃保温。
2g)6000g,4℃,离心1min。
2h)立即转移到冰上。即获得样本基因组DNA。
步骤3、MspI酶切
3a)按表2的体系建立酶切体系:
表2
成分 体积(ul) 终含量
20U/μl MspI 1 20U
10×MspI buffer 0.8 1X
未甲基化的λ-DNA(60fg/μl) 1 60fg
无核酸酶水 补至5
3b)涡旋混匀酶切体系。
3c)6000g,4℃,离心1min。确保所有样品被收集在PCR管底部。
3d)将酶切体系转移到裂解完的细胞的PCR管中,混匀。
3e)6000g,4℃,离心1min。
3f)PCR仪设置37℃,30min-16h不定,酶切基因组;75℃,15min,4℃保温。
3g)6000g,4℃,离心1min。
3h)立即转移到冰上,进行下一步实验。
4、末端补平与加A
4a)按表3的体系建立末端修复与加A体系:
表3
成分 体积(ul) 终含量
5U/μl Klenow片段,exo– 1 5U
10×NEB buffer2 0.2 1X
dNTP mix 0.8 各4μM
4b)涡旋混匀末端修复与加A体系。
4c)6000g,4℃,离心1min。确保所有样品被收集在PCR管底部。
4d)将末端修复与加A体系加入到完成酶切的体系中,混匀。
4e)PCR设置37℃,20min-2h不等,补平与加A;75℃,15min,4℃保温。
4f)6000g,4℃,离心1min。
4g)立即转移到冰上,进行下一步实验。
5、连接接头
5a)按表4体系建立接头连接体系:
表4
成分 体积(ul) 终含量
400U/μl T4DNA连接酶 1 5U
10×T4buffer 0.5 1X
10mM ATP 2.5 1mM
对应接头 1 0.5uM
无核酸水 补至8
其中,所述接头的第一链序列如SEQ ID NO:1所示,具体为:5’GCTCTTCCGATCT3’;所述接头的第二链序列如SEQ ID NO:2所示,具体为5’GATCGGAAGAGC3’。更具体地,接头的结构如图1所示,其中所有的C都经过甲基化修饰。
5b)轻弹混匀接头连接体系。
5c)6000g,4℃,离心1min。确保所有样品被收集在PCR管底部。
5d)将接头连接体系加入到完成末端补平与加A的体系中,混匀。
5e)PCR仪设置25℃,1-8h不等,65℃,20min,4℃保温。
5f)6000g,4℃,离心1min。
5g)立即转移到冰上。
需要说明的是,上述接头仅为举例说明,本发明实施例可以采用其他长度的接头,例如,带有分子标签(UMI)的接头,也可以根据测序平台,如Ion Torrent,选择接头。
6、重亚硫酸盐转化
可以使用zymo research的试剂盒,也可以是其他具有类似功效的试剂盒或自己配置的试剂进行重亚硫酸盐转化。以下以zymo research的试剂盒进行具体举例说明。
6a)20ul加完接头的样品,瞬时离心以将样品收集于PCR管底部。
6b)加入130ul CT Conversion Reagent吹打混匀或轻弹混匀,瞬时离心。
6c)严格按照试剂盒的说明书进行后续操作
需要说明的是在转化后的回收过程中可以加入糖原、carrier RNA、重复序列DNA或不会影响后续扩增或分析的核酸及化学物质提高回收效率,也可以采用其他DNA回收试剂盒或其他DNA回收方案替换。
7、第一轮线性扩增
7a)按表5的体系建立第一线性扩增体系:
表5
试剂 体积
DNA样品 25ul
dNTPs(2.5mM) 1ul
第一引物(10uM) 1ul
无核酸水 17ul
Blue buffer(10X) 5ul
总体积 49ul
所述第一引物的结构为:5’-特异性识别所述接头的序列-随机序列-3’,其中,特异性识别所述接头的序列如SEQ ID NO:3所示,具体为5’CTACACGACGCTCTTCCGATCT3’。所述第一引物选自以下序列中的一种或任意多种:SEQ ID NO:7所示序列、SEQ ID NO:8所示序列、SEQ ID NO:9所示序列、SEQ ID NO:10所示序列;其中,SEQ ID NO:7所示序列具体为CTACACGACGCTCTTCCGATCTNNNNNNCRR,SEQ ID NO:8所示序列具体为CTACACGACGCTCTTCCGATCTNNNNNNGYY,SEQ ID NO:9所示序列具体为CTACACGACGCTCTTCCGATCTNNNNNNTRR,SEQ ID NO:10所示序列具体为CTACACGACGCTCTTCCGATCTNNNNNNAYY;其中,NNNN为随机引物,长度可以为4~20nt,优选的长度为4~14nt更优选的长度为6~10nt;R:A或G,Y:C或T或U。
需要说明是在随机引物之前可以加入固定序列或2-20nt随机序列作为分子标签。
7b)瞬时离心,将样品收集到PCR管底部,95℃变性3分钟,迅速至于冰上。待样品冷却后加入1ul的具有链置换活性的酶(5U/ul),瞬时离心后按表6中的程序进行PCR反应。具有链置换活性的酶可以为bst DNA聚合酶、vent DNA聚合酶(3′→5′exo-)、vent DNA聚合酶、Phi 29DNA聚合酶、deep vent DNA聚合酶(3′→5′exo-)、deep vent DNA聚合酶中的任一种,也可以为klenow片段(3′→5′exo-)、bst DNA聚合酶、vent DNA聚合酶(3′→5′exo-)、vent DNA聚合酶、Phi 29DNA聚合酶、deep vent DNA聚合酶(3′→5′exo-)、deep vent DNA聚合酶等中的任一两种或多种的混合物。
表6
7c)用PCR仪将样品95℃,45S,使双链打开迅速转移到冰上迅速降温使其维持单链状态。
7d)瞬时离心,加入具有链置换活性的酶(5U/μl),0.5ul。
7e)瞬时离心,将样品收集到PCR管底部。按表6的程序进行PCR反应:
7f)重复步骤7c~7e,推荐但不限于0-20次,可根据样品情况进行调整。
8、单链引物及产物的消化及引物二聚体的去除
8a)加入2μl的核酸外切酶(Exonuclease)I和48μl的NF H2O到样品中,并用PCR仪37℃消化1h,热盖温度为50℃。
8b)AMPure XP磁珠在室温平衡30min以上。
8c)将80ul平衡后的AMPure XP磁珠于100ul样品用枪吹打混匀。
8d)在室温孵育10min。
8e)将样品转移到磁力架上,待样品澄清后弃去上清。
8f)用200ul 80%(vol/vol)的乙醇,清洗磁珠。
8g)弃去上清。
8h)重复8f~8g一次。
8i)室温开盖等待,至乙醇充分挥发。
9、第二轮线性扩增
在二链扩增时,二链引物的引入可以采用线性扩增或接头连接、滚环扩增等方式进行,其中,优选的为线性扩增的方式。
下文以线性扩增为例对二链扩增进行具体说明。
9a)在8i的管中加入表7所示的反应物。
表7
试剂 体积
DNA样品 25ul
dNTPs(2.5mM) 1ul
第二引物(10uM) 1ul
无核酸水 17ul
Blue buffer(10X) 5ul
总体积 49ul
所述第二引物的结构为:5’-特异性识别所述接头的序列-随机序列-3’。特异性识别所述接头的序列如SEQ ID NO:4所示,具体为,5’TGCTGAACCGCTCTTCCGATCT3’。所述第二引物选自以下序列中的一种或任意多种:SEQ ID NO:11所示序列、SEQ ID NO:12所示序列、SEQ ID NO:13所示序列、SEQ ID NO:14所示序列;SEQ ID NO:11所示序列具体为TGCTGAACCGCTCTTCCGATCNNNNNNCRR,SEQ ID NO:12所示序列具体为TGCTGAACCGCTCTTCCGATCNNNNNNGYY,SEQ ID NO:13所示序列具体为TGCTGAACCGCTCTTCCGATCNNNNNNTRR,SEQ ID NO:14所示序列具体为TGCTGAACCGCTCTTCCGATCNNNNNNAYY;其中R:A或G,Y:C或T或U,NNNN为随机引物,长度可以为4~20nt。
需要说明是在随机引物之前可以加入固定序列或2-20nt随机序列作为分子标签。
9b)瞬时离心,将样品收集到PCR管底部,95℃变性3分钟,迅速至于冰上。待样品冷却后加入1ul的具有链置换活性的酶(5U/ul),瞬时离心后按表6的程序进行PCR反应:
9c)用PCR仪将样品95℃,45S,使双链打开迅速转移到冰上迅速降温使其维持单链状态。
9d)瞬时离心,加入具有链置换活性的酶(5U/μl),0.5ul。
9e)瞬时离心,将样品收集到PCR管底部。按表6程序进行PCR反应。
9f)重复步骤9c~9e),推荐但不限于0-20次,可根据样品情况进行调整。
10、线性扩增产物纯化
10a)AMPure XP磁珠在室温平衡30min以上。
10b)将80ul平衡后的AMPure XP磁珠于100ul样品用枪吹打混匀。
10c)在室温孵育10min。
10d)将样品转移到磁力架上,待样品澄清后弃去上清。
10e)用200ul 80%(vol/vol)的乙醇,清洗磁珠。
10f)弃去上清。
10g)重复10e~10f一次。
10h)室温开盖等待,至乙醇充分挥发。
11、指数扩增
11a)在纯化后的线性扩增子中加入表8所示的反应物。
表8
试剂 体积
dNTPs(2.5mM) 4ul
第三引物(10uM) 1ul
第四引物(10uM) 1ul
Buffer(5x) 10ul
指数扩增酶 1U
无菌水 补齐至50ul
所述第三引物的序列如SEQ ID NO:5所示,具体为:
5’AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT 3’;
所述第四引物的序列如SEQ ID NO:6所示,具体为:
5’CAAGCAGAAGACGGCATACGAGATNNNNNNGAGATCGGTCTCGGCATTCCTGCTGAACCGCTCTTCCGATCT3’,其中,NNNNNN为索引index序列,具体可以为illumina通用index。引物SEQ ID NO:5和SEQ ID NO:6的3端也可加入3-20nt的随机或特定序列作为分子标签(UMI),优选的分子标签的长度为4-12nt,更优选的分子标签的长度为6-9nt。通过加入分子标签的优点是可以在后续的分析过程中识别分子的来源,从而判断细胞中真实含有的甲基化位点和分子拷贝数,排除PCR扩增对分析的影响,增加校对的功能,加强分析的准确度。
可选地,指数扩增酶可以是High-Fidelity DNA Polymerase、High-Fidelity DNA Polymerase、PrimeSTAR HS DNA聚合酶、Ex Taq、ExFi Tusion DNA聚合酶、Vent DNA聚合酶、PfuDNA聚合酶、KAPA HiFi Hotstart polymerase等的任意一种或几种的组合。
可选地,在加入表8所示的反应物之前,可以加入无核酸水洗脱DNA,洗脱分离DNA后,按照表8配置PCR体系进行指数扩增。
也可以带着磁珠进行PCR扩增,优选进行带磁珠PCR。
11b)按照表9进行指数PCR扩增。
表9
其中的循环数可以根据具体实验进行相应的调整。
12、文库纯化
12a)AMPure XP磁珠在室温平衡30min以上。
12b)将80ul平衡后的AMPure XP磁珠的上清与50ul样品和50ul无菌水用枪吹打混匀。
12c)在室温孵育10min。
12d)将样品转移到磁力架上,待样品澄清后弃去上清。
12e)用200ul 80%(vol/vol)的乙醇,清洗磁珠。
12f)弃去上清。
12g)重复12e~12f)一次。
12h)弃去上清。
12i)室温开盖等待,至乙醇充分挥发。
12j)加入15ul的无菌水与磁珠充分混匀。
12k)室温孵育10min后,转到磁力架上,待溶液澄清后吸取上清至干净EP管中。
13、测序文库质检
使用安捷伦2100生物分析仪对测序文库进行质检,具体操作步骤如下:
取1ul步骤12k制备的样品至1ul体系,进行2100高灵敏芯片,操作步骤严格遵循2100操作手册。质检结果如图2所示,在进行指数扩增之后的片段大小为200bp-1000bp,主峰集中在400-600bp。
步骤14,测序及分析
使用illumina测序平台进行测序,并对测序结果进行分析。
测序结果中的原始数据碱基质量如图3所示,所述图3是由Fast QC软件制作,其中的线1表示其对应的reads碱基质量值的中位数。reads碱基质量值越高,说明测序错误率越低。图3表明,本发明实施例构建的测序文库的碱基质量良好。
测序结果中的原始数据碱基分布如图4所示,横坐标是reads碱基坐标,表示reads上从5’到3’端依次碱基的排列;纵坐标是所有reads在该测序位置A、C、G、T碱基分别占的百分比。序列的起始位置与测序的引物接头相连,因此A、C、G、T在起始端会有所波动,后面会趋于稳定。由于经过了重亚硫酸盐处理,C的含量会偏低。并且从图上可以看出该测序文库中的检测分别均匀,并且几乎看不到模糊碱基N,说明模糊碱基N数量少,测序文库受系统AT偏好影响小。
本发明实施例以一个mcf7活细胞的为样品,根据本发明实施例公开的RRBS测序的文库建立方法,得到R1文库。本发明实施例以另一个mcf7活细胞的为样品,根据本发明实施例公开的RRBS测序的文库建立方法,得到R2文库。对R1文库和R2文库进行测序,测序结果如表10所示。
表10
样本名称 样品来源 测序数据量(M) 转化率 Q30 CpG岛占比
R1 1个mcf7活细胞 1,089.00 99.40% 53.04 34.8%
R2 1个mcf7活细胞 832.00 98.84% 59.64 42%
测序数据量(M)为测序所得的原始数据量。转化率:重亚硫酸盐对未甲基化的C转化为U的效率;Q30%:Phred数值大于30的碱基占总体碱基的百分比;CpG岛占比:为测序数据中覆盖到CpG岛区域所占数据的比例,理论上,CpG岛占全基因组的0.7%,我们的数据显示CpG岛可占我们测序数据的42%;极大的富集了CpG岛;极大的有效覆盖了CpG岛。
综上所述,本发明有效克服了现有技术中的种种缺点而具高度产业利用价值。
上述实施例仅例示性说明本发明的原理及其功效,而非用于限制本发明。任何熟悉此技术的人士皆可在不违背本发明的精神及范畴下,对上述实施例进行修饰或改变。因此,举凡所属技术领域中具有通常知识者在未脱离本发明所揭示的精神与技术思想下所完成的一切等效修饰或改变,仍应由本发明的权利要求所涵盖。
序列表
<110> 上海美吉医学检验有限公司
<120> 适用于单细胞RRBS测序的文库建立方法及其应用
<130> 173642
<160> 14
<170> SIPOSequenceListing 1.0
<210> 1
<211> 13
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 1
gctcttccga tct 13
<210> 2
<211> 12
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 2
cgagaaggct ag 12
<210> 3
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 3
ctacacgacg ctcttccgat ct 22
<210> 4
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 4
tgctgaaccg ctcttccgat c 21
<210> 5
<211> 58
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 5
aatgatacgg cgaccaccga gatctacact ctttccctac acgacgctct tccgatct 58
<210> 6
<211> 71
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 6
caagcagaag acggcatacg agatnnnnnn gagatcggtc tcggcattcc tgctgaaccg 60
ctcttccgat c 71
<210> 7
<211> 31
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 7
ctacacgacg ctcttccgat ctnnnnnncr r 31
<210> 8
<211> 31
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 8
ctacacgacg ctcttccgat ctnnnnnngy y 31
<210> 9
<211> 31
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 9
ctacacgacg ctcttccgat ctnnnnnntr r 31
<210> 10
<211> 31
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 10
ctacacgacg ctcttccgat ctnnnnnnay y 31
<210> 11
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 11
tgctgaaccg ctcttccgat cnnnnnncrr 30
<210> 12
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 12
tgctgaaccg ctcttccgat cnnnnnngyy 30
<210> 13
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 13
tgctgaaccg ctcttccgat cnnnnnntrr 30
<210> 14
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 14
tgctgaaccg ctcttccgat cnnnnnnayy 30

Claims (22)

1.一种适用于单细胞RRBS测序的文库建立方法,其特征在于,包括如下步骤:
(1)对样本的基因组DNA依次进行酶切、末端补平和加A、加接头以及重亚硫酸盐转化;
(2)对步骤(1)中转化后的基因组DNA进行线性扩增;
(3)对步骤(2)中线性扩增的扩增子进行指数扩增,所述指数扩增的扩增子用作测序文库。
2.根据权利要求1所述的文库建立方法,其特征在于,所述样本基因组DNA由单细胞样本裂解获得或由多细胞样本抽提获得。
3.根据权利要求1所述的文库建立方法,其特征在于,步骤(1)中,所述酶切采用的酶包含但不限于其中任意一种或几种:AluI、TaqαI、SphI、MspI、BamHI、ApeKI、BanII、HpaII、HpyCH4V、BstNI、HaeIII、HpyCH4III、BglII、BssSI和KpnI。
4.根据权利要求1所述的文库建立方法,其特征在于,步骤(1)中,所述接头为单链结构或双链结构;
所述接头的第一链序列如SEQ ID NO:1所示,具体为:5’GCTCTTCCGATCT3’;所述接头的第二链序列如SEQ ID NO:2所示,具体为5’CGAGAAGGCTAG3’;
所述SEQ ID NO:1所示序列和所述SEQ ID NO:2所示序列中的C为甲基化修饰碱基。
5.根据权利要求1所述的文库建立方法,其特征在于,步骤(2)中,所述线性扩增包括第一线性扩增和第二线性扩增;
所述第一线性扩增的引物为第一引物,所述第一引物为随机引物;
所述第二线性扩增的引物为第二引物,所述第二引物为随机引物。
6.根据权利要求5所述的文库建立方法,其特征在于,所述第一引物的结构为:5’-特异性识别所述接头的序列-随机序列-CpG岛识别序列-3’,所述第二引物的结构为:5’-特异性识别所述接头的序列-随机序列-CpG岛识别序列-3’;或者所述第一引物的结构为:5’-特异性识别所述接头的序列-分子标签-随机序列-CpG岛识别序列-3’,所述第二引物的结构为:5’-特异性识别所述接头的序列-分子标签-随机序列-CpG岛识别序列-3’。
7.根据权利要求6所述的文库建立方法,其特征在于,所述第一引物中的特异性识别所述接头的序列如SEQ ID NO:3所示,具体为:5’CTACACGACGCTCTTCCGATCT3’;
所述第二引物中的特异性识别所述接头的序列如SEQ ID NO:4所示,具体为:5’TGCTGAACCGCTCTTCCGATC3’。
8.根据权利要求6所述的文库建立方法,其特征在于,所述第一引物中的随机序列的长度为4~20nt,所述第二引物中的随机序列的长度为4~20nt。
9.根据权利要求1所述的文库建立方法,其特征在于,步骤(2)中,所述线性扩增的DNA聚合酶为具有链置换活性的酶;其中,所述链置换活性的酶选自但不限于其中任意一种或几种:klenow片段(3′→5′exo-)、klenow片段、bst DNA聚合酶、vent DNA聚合酶(3′→5′exo-)、vent DNA聚合酶、Phi 29DNA聚合酶、deep vent DNA聚合酶(3′→5′exo-)、deepvent DNA聚合酶中的任一种或多种。
10.根据权利要求1所述的文库建立方法,其特征在于,步骤(3)中,所述指数扩增的引物包括第三引物和第四引物;所述第三引物的序列如SEQ ID NO:5所示,具体为:
5’AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT3’;所述第四引物的序列如SEQ ID NO:6所示,具体为:
5’CAAGCAGAAGACGGCATACGAGATNNNNNNGAGATCGGTCTCGGCATTCCTGCTGAACCGCTCTTCCGATC3’,其中,NNNNNN为索引index序列。
11.如权利要求1-10任一项所述文库建立方法用于单细胞样本或多细胞样本的基因组DNA甲基化测序及甲基化位点分析中的用途。
12.一种确定单细胞样本或多细胞样本中基因组DNA甲基化位点的方法,其特征在于,包括如下步骤:采用如权利要求1-10任一项所述方法建立文库后,对所获得的文库进行测序,基于测序结果,对单细胞样本或多细胞样本的基因组DNA甲基化情况进行分析,确定甲基化位点。
13.一种适用于单细胞RRBS测序的文库构建试剂盒,其特征在于,包括:酶切反应物、末端补平和加A反应物、接头、重亚硫酸盐转化反应物、线性PCR反应物和指数PCR反应物。
14.根据权利要求13所述的文库构建试剂盒,其特征在于,所述酶切反应物的酶选择但不限于其中任意一种或几种:AluI、TaqαI、SphI、MspI、BamHI、ApeKI、BanII、HpaII、HpyCH4V、BstNI、HaeIII、HpyCH4III、BglII、BssSI和KpnI。
15.根据权利要求13所述的文库构建试剂盒,其特征在于,所述接头为单链结构或双链结构;所述接头的第一链序列如SEQ ID NO:1所示,具体为:5’GCTCTTCCGATCT3’;所述接头的第二链序列如SEQ ID NO:2所示,具体为5’CGAGAAGGCTAG3’;所述SEQ ID NO:1所示序列和所述SEQ ID NO:2所示序列中的C为甲基化修饰碱基。
16.根据权利要求13所述的文库构建试剂盒,其特征在于,线性PCR反应物包括第一引物、第二引物和具有链置换活性的酶;
所述第一引物和第二引物为随机引物。
17.根据权利要求16所述的文库构建试剂盒,其特征在于,所述第一引物的结构为:5’-特异性识别所述接头的序列-随机序列-CpG岛识别序列-3’,所述第二引物的结构为:5’-特异性识别所述接头的序列-随机序列-CpG岛识别序列-3’;或者所述第一引物的结构为:5’-特异性识别所述接头的序列-分子标签-随机序列-CpG岛识别序列-3’,所述第二引物的结构为:5’-特异性识别所述接头的序列-分子标签-随机序列-CpG岛识别序列-3’。
18.根据权利要求17所述的文库构建试剂盒,其特征在于,所述第一引物中的特异性识别所述接头的序列如SEQ ID NO:3所示,具体为:5’CTACACGACGCTCTTCCGATCT3’;
所述第二引物中的特异性识别所述接头的序列如SEQ ID NO:4所示,具体为:5’TGCTGAACCGCTCTTCCGATC3’。
19.根据权利要求17所述的文库构建试剂盒,其特征在于,所述第一引物中的随机序列的长度为4~20nt,所述第二引物中的随机序列的长度为4~20nt;所述分子标签为固定序列或随机序列,随机序列的长度为2-20nt,优选的为4-10nt,更优选的为6-8nt。
20.根据权利要求16所述的文库构建试剂盒,其特征在于,所述链置换活性的酶选自但不限于其中任意一种或几种:klenow片段(3′→5′exo-)、klenow片段、bst DNA聚合酶、ventDNA聚合酶(3′→5′exo-)、vent DNA聚合酶、Phi 29DNA聚合酶、deep vent DNA聚合酶(3′→5′exo-)、deep vent DNA聚合酶。
21.根据权利要求13所述的文库构建试剂盒,其特征在于,指数PCR反应物包括第三引物和第四引物;
所述第三引物的序列如SEQ ID NO:5所示,具体为:
5’AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT
3’;所述第四引物的序列如SEQ ID NO:6所示,具体为:
5’CAAGCAGAAGACGGCATACGAGATNNNNNNGAGATCGGTCTCGGCATTCCTGCTGAACCGCTCTTCCGATC3’,其中,NNNNNN为索引index序列。
22.一种基因组甲基化测序产品,其特征在于,包括如权利要求13-21任一项所述测序文库构建试剂盒。
CN201710864035.3A 2017-09-22 2017-09-22 适用于单细胞rrbs测序的文库建立方法及其应用 Pending CN107475779A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710864035.3A CN107475779A (zh) 2017-09-22 2017-09-22 适用于单细胞rrbs测序的文库建立方法及其应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710864035.3A CN107475779A (zh) 2017-09-22 2017-09-22 适用于单细胞rrbs测序的文库建立方法及其应用

Publications (1)

Publication Number Publication Date
CN107475779A true CN107475779A (zh) 2017-12-15

Family

ID=60586168

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710864035.3A Pending CN107475779A (zh) 2017-09-22 2017-09-22 适用于单细胞rrbs测序的文库建立方法及其应用

Country Status (1)

Country Link
CN (1) CN107475779A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107904667A (zh) * 2018-01-02 2018-04-13 上海美吉生物医药科技有限公司 一种新型甲基化建库试剂盒及其应用
CN108148830A (zh) * 2017-12-22 2018-06-12 上海美吉生物医药科技有限公司 一种简化代表性单细胞全基因组建库方法及其应用
CN108165610A (zh) * 2017-12-22 2018-06-15 上海美吉生物医药科技有限公司 一种单细胞全基因组扩增试剂盒
CN108949745A (zh) * 2018-07-19 2018-12-07 天津迈基生物科技有限公司 一种高通量单细胞测序文库构建方法
CN109295500A (zh) * 2018-09-26 2019-02-01 博奥生物集团有限公司 一种单细胞甲基化测序技术及其应用
WO2019028556A1 (en) * 2017-08-09 2019-02-14 Enrich Bioscience Inc. METHOD AND SYSTEM FOR ANALYZING DNA METHYLATION AND USE THEREOF FOR DETECTING CANCER
CN110872609A (zh) * 2018-09-04 2020-03-10 深圳华大基因科技服务有限公司 对小rna分子精准建库和测序的方法以及应用

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102796808A (zh) * 2011-05-23 2012-11-28 深圳华大基因科技有限公司 甲基化高通量检测方法
CN104963000A (zh) * 2014-12-15 2015-10-07 北京贝瑞和康生物技术有限公司 一种快速构建单细胞dna测序文库的方法和试剂盒
CN105200041A (zh) * 2015-10-22 2015-12-30 安诺优达基因科技(北京)有限公司 用于构建单细胞转录组测序文库的试剂盒及文库构建方法
CN105506109A (zh) * 2015-12-31 2016-04-20 安诺优达基因科技(北京)有限公司 一种单细胞简化代表性重亚硫酸氢盐测序的方法及试剂盒

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102796808A (zh) * 2011-05-23 2012-11-28 深圳华大基因科技有限公司 甲基化高通量检测方法
CN104963000A (zh) * 2014-12-15 2015-10-07 北京贝瑞和康生物技术有限公司 一种快速构建单细胞dna测序文库的方法和试剂盒
CN105200041A (zh) * 2015-10-22 2015-12-30 安诺优达基因科技(北京)有限公司 用于构建单细胞转录组测序文库的试剂盒及文库构建方法
CN105506109A (zh) * 2015-12-31 2016-04-20 安诺优达基因科技(北京)有限公司 一种单细胞简化代表性重亚硫酸氢盐测序的方法及试剂盒

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
STEPHEN J CLARK等: "Genome-wide base-resolution mapping of DNA methylation in single cells using single-cell bisulfite sequencing (scBS-seq)", 《NATURE PROTOCOLS》 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019028556A1 (en) * 2017-08-09 2019-02-14 Enrich Bioscience Inc. METHOD AND SYSTEM FOR ANALYZING DNA METHYLATION AND USE THEREOF FOR DETECTING CANCER
CN108148830A (zh) * 2017-12-22 2018-06-12 上海美吉生物医药科技有限公司 一种简化代表性单细胞全基因组建库方法及其应用
CN108165610A (zh) * 2017-12-22 2018-06-15 上海美吉生物医药科技有限公司 一种单细胞全基因组扩增试剂盒
CN107904667A (zh) * 2018-01-02 2018-04-13 上海美吉生物医药科技有限公司 一种新型甲基化建库试剂盒及其应用
CN108949745A (zh) * 2018-07-19 2018-12-07 天津迈基生物科技有限公司 一种高通量单细胞测序文库构建方法
CN110872609A (zh) * 2018-09-04 2020-03-10 深圳华大基因科技服务有限公司 对小rna分子精准建库和测序的方法以及应用
CN110872609B (zh) * 2018-09-04 2024-06-04 深圳华大基因科技服务有限公司 对小rna分子精准建库和测序的方法以及应用
CN109295500A (zh) * 2018-09-26 2019-02-01 博奥生物集团有限公司 一种单细胞甲基化测序技术及其应用

Similar Documents

Publication Publication Date Title
CN107475779A (zh) 适用于单细胞rrbs测序的文库建立方法及其应用
US20220316005A1 (en) Safe sequencing system
Garrett-Bakelman et al. Enhanced reduced representation bisulfite sequencing for assessment of DNA methylation at base pair resolution
Rodrigue et al. Whole genome amplification and de novo assembly of single bacterial cells
JP2024059651A (ja) Dnaプロファイリングのための方法および組成物
CN104963000B (zh) 一种快速构建单细胞dna测序文库的方法和试剂盒
US11649492B2 (en) Deep sequencing profiling of tumors
CN104250663B (zh) 甲基化CpG岛的高通量测序检测方法
CN102409042B (zh) 一种高通量基因组甲基化dna富集方法及其所使用标签和标签接头
CN107488725A (zh) 适用于单细胞基因组甲基化测序的文库建立方法及其应用
CN107557874A (zh) 适用于单细胞全基因组甲基化与转录组共测序的文库建立方法及其应用
JP2021521786A (ja) 核酸を結合、修飾、および切断する物質の基質選択性および部位のためのin vitroでの高感度アッセイ
CA2439098A1 (en) Mutation detection using muts and reca
Ahsanuddin et al. Assessment of REPLI-g multiple displacement whole genome amplification (WGA) techniques for metagenomic applications
CN109778321B (zh) 一种用于宏基因组测序的建库方法、试剂盒和测序方法
JP2023126945A (ja) 超並列シークエンシングのためのdnaライブラリー生成のための改良された方法及びキット
CN113249439A (zh) 一种简化dna甲基化文库及转录组共测序文库的构建方法
CN112251821A (zh) 一种快速高效的构建二代测序文库的试剂盒
WO2019085546A1 (zh) 微生物 16S rDNA 单分子水平测序文库的构建方法
CN104114703A (zh) 全基因组扩增方法及其应用
Weichenhan et al. Tagmentation-based library preparation for low DNA input whole genome bisulfite sequencing
Poulsen et al. RNA‐Seq for bacterial gene expression
CN108166069A (zh) 一种新型甲基化建库方法及其应用
Eché et al. A Bos taurus sequencing methods benchmark for assembly, haplotyping, and variant calling
CN105483262B (zh) 一种基于高通量测序的10个str位点的检测试剂盒

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20171215