CN114411266A - 一种基于启动子构建文库的方法及其文库 - Google Patents

一种基于启动子构建文库的方法及其文库 Download PDF

Info

Publication number
CN114411266A
CN114411266A CN202210161966.8A CN202210161966A CN114411266A CN 114411266 A CN114411266 A CN 114411266A CN 202210161966 A CN202210161966 A CN 202210161966A CN 114411266 A CN114411266 A CN 114411266A
Authority
CN
China
Prior art keywords
sample
promoter
tested
enzyme
dna
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210161966.8A
Other languages
English (en)
Inventor
王娟
唐冲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BGI Shenzhen Co Ltd
Original Assignee
BGI Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BGI Shenzhen Co Ltd filed Critical BGI Shenzhen Co Ltd
Priority to CN202210161966.8A priority Critical patent/CN114411266A/zh
Publication of CN114411266A publication Critical patent/CN114411266A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B50/00Methods of creating libraries, e.g. combinatorial synthesis
    • C40B50/06Biochemical methods, e.g. using enzymes or whole viable microorganisms
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B40/00Libraries per se, e.g. arrays, mixtures
    • C40B40/04Libraries containing only organic compounds
    • C40B40/06Libraries containing nucleotides or polynucleotides, or derivatives thereof

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Zoology (AREA)
  • Molecular Biology (AREA)
  • Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Analytical Chemistry (AREA)
  • Microbiology (AREA)
  • Medicinal Chemistry (AREA)
  • Biotechnology (AREA)
  • Immunology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • General Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

一种基于启动子构建文库的方法及其文库。该方法包括:打断步骤,包括对待测样本进行打断处理,获得打断后的待测样本;酶促甲基化转化步骤,包括对打断后的待测样本进行酶促甲基化转化;T7启动子连接步骤,包括将酶促甲基化转化处理后的待测样本与T7启动子退火,反应得到连接有T7启动子的待测样本;体外转录步骤,包括将连接有T7启动子的待测样本转录为RNA;反转录及扩增步骤,包括对RNA进行反转录、PCR扩增,获得文库。相比于现有技术中直接做PCR,本发明中T7的转录(针对富含尿嘧啶的DNA)更加均一,转录能获得较多的RNA作为下一步cDNA扩增的模板,极大地提升了甲基化的覆盖度。

Description

一种基于启动子构建文库的方法及其文库
技术领域
本发明涉及基因测序技术领域,具体涉及一种基于启动子构建文库的方法及其文库。
背景技术
近年来,单细胞测序技术的快速发展为复杂的生物系统提供了许多有价值的见解,例如,揭示复杂和罕见的细胞群体,跟踪不同细胞谱系的发展轨迹。目前有许多单细胞测序方法,其中最流行的是常规的单细胞RNA或DNA测序。除了RNA和DNA信息外,表观遗传修饰是指在不改变DNA序列本身的情况下,在遗传物质中引起可遗传表型的变化。在这些表观遗传修饰中,5-甲基胞嘧啶(5-methylcytosine,5mC)是脊椎动物中最丰富的修饰基,已成为调控胚胎发育、基因组印迹、X失活、细胞分化和增殖的重要研究课题。
目前主要针对5mC的单细胞测序技术,从策略上主要分为:1、传统的先建库后亚硫酸氢盐处理(Pre-BS);2、亚硫酸氢盐处理后再建库(post-bisulfite adaptor tagging,PBAT)。基于PBAT策略的技术,有以下几种:scBS-seq、scWGBS、snmC-seq(基于单细胞核的DNA甲基化测序研究)。其中Smallwood的scBS-seq技术检测到位点数最多,能检测到3700万个CpG位点。此外,最近的进展促进了高通量的单细胞甲基化测序。甲基化分析的单细胞组合索引(sci-MET)使用带索引的转座子标记单细胞,然后在亚硫酸氢盐转换后随机启动标记另一个接头。虽然这些方法提高了接头的连接效率,但在亚硫酸氢盐的严酷处理中,它们都存在DNA降解的问题。最近报道了一种温和的转化方法TAPS,利用高浓度的TET1将5mC转化为5CaC,再用碳酸氢盐将5CaC转化为尿嘧啶。然而,这种TET1并不适用于大多数实验室。综上所述,单细胞甲基化测序的覆盖率较低,仅达到20%的CpG,不到10%的基因组。这就需要提高单细胞的覆盖范围和准确性、读取长度。
发明内容
根据第一方面,在一实施例中,提供一种基于启动子构建文库的方法,包括:
打断步骤,包括对待测样本进行打断处理,获得打断后的待测样本;
酶促甲基化转化步骤,包括对打断后的待测样本进行酶促甲基化转化,使非甲基化的胞嘧啶转换为尿嘧啶;
T7启动子连接步骤,包括将酶促甲基化转化处理后的待测样本与T7启动子退火,反应得到连接有T7启动子的待测样本;
体外转录步骤,包括将所述连接有T7启动子的待测样本转录为RNA;
反转录及扩增步骤,包括对所述RNA进行反转录、PCR扩增,获得文库,即为可用于上机测序的文库。
根据第二方面,提供第一方面所述方法构建得到的文库。
根据第三方面,在一实施例中,提供由第二方面所述的文库上机测序所获得的测序数据。
依据上述实施例的一种基于启动子构建文库的方法及其文库,相比于现有技术中直接做PCR,本发明中T7的转录(针对富含尿嘧啶的DNA)更加均一,转录能获得较多的RNA作为下一步cDNA扩增的模板,更均一地获得了大量的DNA模板,极大地提升了甲基化的覆盖度。
附图说明
图1为实施例1的建库流程示意图。
图2为T7体外转录后的RNA片段测试结果图。
图3为PCR产物测试结果图。
图4为4号染色体的C/CG/CHG(100bp bin)覆盖度结果图。
图5为4号染色体6500000-7000000区域的GC覆盖度结果图。
图6为CGI覆盖度结果图。
图7为TEAM-seq(20pg/100pg)和WGBS(1μg)之间的甲基化状态一致性(甲基化/未甲基化)结果图。
图8为单细胞CpG/CHG/CHH覆盖度结果图。
图9为单细胞基因组覆盖度结果图。
具体实施方式
下面通过具体实施方式结合附图对本发明作进一步详细说明。其中不同实施方式中类似元件采用了相关联的类似的元件标号。在以下的实施方式中,很多细节描述是为了使得本申请能被更好的理解。然而,本领域技术人员可以毫不费力的认识到,其中部分特征在不同情况下是可以省略的,或者可以由其他元件、材料、方法所替代。在某些情况下,本申请相关的一些操作并没有在说明书中显示或者描述,这是为了避免本申请的核心部分被过多的描述所淹没,而对于本领域技术人员而言,详细描述这些相关操作并不是必要的,他们根据说明书中的描述以及本领域的一般技术知识即可完整了解相关操作。
另外,说明书中所描述的特点、操作或者特征可以以任意适当的方式结合形成各种实施方式。同时,方法描述中的各步骤或者动作也可以按照本领域技术人员所能显而易见的方式进行顺序调换或调整。因此,说明书和附图中的各种顺序只是为了清楚描述某一个实施例,并不意味着是必须的顺序,除非另有说明其中某个顺序是必须遵循的。
本文中为部件所编序号本身,例如“第一”、“第二”等,仅用于区分所描述的对象,不具有任何顺序或技术含义。而本申请所说“连接”、“联接,”如无特别说明,均包括直接和间接连接(联接)。
术语解释
scBS-seq:Single-Cell Bisulfite Sequencing,亚硫酸氢盐单细胞测序。
scPBAT:Single-Cell Post-Bisulfite Adaptor Tagging,单细胞-后亚硫酸氢盐适配器标签。
scWGBS:Single-Cell Whole Genome Bisulfite Sequencing,亚硫酸氢盐单细胞全基因组测序。
snmc-seq:single nucleus methylcytosine sequencing,单核甲基胞嘧啶测序。
sci-MET:single-cell combinatorial indexing for methylation analysis单细胞组合索引的甲基化分析。
TAPS:TET-assisted pyridine borane sequencing,tet辅助的吡啶硼烷测序。
TEAM-seq:T7-assisted enzymatic methyl-sequencing,T7聚合酶辅助的酶促甲基化测序。
基于WGBS(亚硫酸氢盐全基因组测序)的单细胞分析方法包括单细胞亚硫酸氢盐测序(scBS-seq)、单细胞PBAT(scPBAT)、单细胞WGBS(scWGBS)、单核甲基胞嘧啶测序(snmC-seq)2和单细胞组合甲基化分析索引(sci-MET)。这些方法通常也遵循PBAT的流程,但在细节上存在差异。
现有的测序技术及其覆盖度如表1所示。
表1
Figure BDA0003515179840000031
scPBAT方法与最初的PBAT方法几乎相同,除了它使用了一个包含随机四聚体(N4)和弱四聚体(A、T或U)(W4)的引物。但是,由于原PBAT方法没有扩增过程,对少量单细胞DN A的应用存在局限性。因此,scPBATs只能用于有限的应用,例如确定重复元素的甲基化。
scBS-seq方法的最新版本是基于PBAT的,但与PBAT不同的是,scBS-seq中的亚硫酸氢盐转化是直接在细胞裂解液中完成的。该方法使用的引物还包含一个随机六聚体(N6)而不是随机四聚体。PBAT在双股形成步骤中只进行退火和延伸。然而,在第一个DNA链合成步骤中,scBS-seq对亚硫酸氢盐转化的DNA进行了5个周期的扩增。第二链的合成只进行一次,就像在原始的PBAT中一样,不同的是,10~15个周期的扩增是使用存在于合成DNA两侧的适配器序列进行的。在这些过程中,省去了使用链霉亲和素珠的纯化过程,取而代之的是固相可逆固定化(SPRI)珠。
scWGBS使用一个包含随机六聚体的引物来合成第一个DNA链,类似于scBS-seq,但不进行多次循环。相反,末端标记发生在第一个链的合成过程中,第二链的合成使用标记的序列执行18个周期。
snmC-seq和改进的snmC-seq2表明反应是在细胞核内进行的,而不是以前使用的细胞裂解液。此外,通过引入使用适配酶的单链NGS制备方法,显示出较高的覆盖率。它与scWG BS的相似之处在于标记序列用于第二链合成。
sci-MET不仅通过提高细胞核的使用,而且通过转座酶和多组合索引的性能来提高其规模。在scWGBS和snmC-seq2中,标签序列是在第一链合成时添加的,而在sci-MET中,标签是在转座酶进行标记时提前插入的。
根据第一方面,在一实施例中,提供一种基于启动子构建文库的方法,包括:
打断步骤,包括对待测样本进行打断处理,获得打断后的待测样本;
酶促甲基化转化步骤,包括对打断后的待测样本进行酶促甲基化转化,使非甲基化的胞嘧啶转换为尿嘧啶;
T7启动子连接步骤,包括将酶促甲基化转化处理后的待测样本与T7启动子退火,反应得到连接有T7启动子的待测样本;
体外转录步骤,包括将所述连接有T7启动子的待测样本转录为RNA;
反转录及扩增步骤,包括对所述RNA进行反转录、PCR扩增,获得文库,即为可用于上机测序的文库。
在一实施例中,所述T7启动子连接步骤中,退火反应条件如下:95~98℃(包括但不限于95℃、96℃、97℃、98℃),1~3min(包括但不限于1min、1.5min、2min、2.5min、3min);55~65℃(包括但不限于55℃、56℃、57℃、58℃、59℃、60℃、61℃、62℃、63℃、64℃、65℃),1~3min(包括但不限于1min、1.5min、2min、2.5min、3min);25~40℃(包括但不限于25℃、26℃、27℃、28℃、29℃、30℃、31℃、32℃、33℃、34℃、35℃、36℃、37℃、38℃、39℃、40℃),1~5min(包括但不限于1min、2min、3min、4min、5min)。
在一实施例中,所述T7启动子连接步骤中,退火结束后,将退火后的待测样本与dNTP以及DNA聚合酶混合反应,得到反应后的待测样本。
在一实施例中,将退火后的待测样本与dNTP以及DNA聚合酶混合反应时,反应条件如下:30~37℃(包括但不限于30℃、31℃、32℃、33℃、34℃、35℃、36℃、37℃),15~25min(包括但不限于15min、16min、17min、18min、19min、20min、21min、22min、23min、24min、25min、);65~75℃(包括但不限于65℃、66℃、67℃、68℃、69℃、70℃、71℃、72℃、73℃、74℃、75℃),10~20min(包括但不限于10min、11min、12min、13min、14min、15min、16min、17min、18min、19min、20min)。
在一实施例中,T7启动子连接步骤结束后,不进行纯化,直接进行体外转录。
在一实施例中,打断步骤中,使用酶对待测样本进行打断。
在一实施例中,所述酶包括但不限于Tn5转座酶。
在一实施例中,所述酶包埋有生物素修饰的接头。
在一实施例中,打断步骤中,打断处理后,加入补平反应液,反应得到补平缺口后的待测样本。
在一实施例中,打断步骤中,补平缺口后,使用磁珠对待测样本进行纯化。
在一实施例中,酶促甲基化转化步骤中,使用加氧酶氧化待测样本中的DNA,然后使用脱氨酶进行脱氨,反应得到脱氨后的待测样本。
在一实施例中,所述加氧酶包括但不限于TET(ten-eleven translocation)酶。
在一实施例中,所述TET酶包括不限于TET1酶、TET2酶、TET3酶中的至少一种。
在一实施例中,所述脱氨酶包括但不限于APOBEC酶。
在一实施例中,体外转录步骤中,使用T7 RNA聚合酶将所述连接有T7启动子的待测样本转录为RNA。
在一实施例中,打断步骤中,所述待测样本包括但不限于基因组DNA样本、游离DNA样本中的至少一种。
在一实施例中,打断步骤中,所述待测样本的核酸分子中含有5-甲基胞嘧啶。
在一实施例中,打断步骤中,所述待测样本的起始量≤100pg。
在一实施例中,打断步骤中,所述待测样本的起始量为20~100pg。
根据第二方面,在一实施例中,提供第一方面所述方法构建得到的文库。
根据第三方面,在一实施例中,提供由第二方面所述的文库上机测序所获得的测序数据。
在一实施例中,所述测序数据的测序深度≤3×。测序深度包括但不限于3×、2.5×、2×、1.5×、1×、0.5×、0.1×等等。
在一实施例中,所述测序数据的测序深度≤2×。
现有技术存在的缺陷包括如下缺陷中的至少一种:
缺点1:现有技术中基于单细胞的方法基本都使用亚硫酸盐处理DNA,DNA损伤严重,片段变短;
缺点2:现有聚合酶的扩增不适合有大量U碱基(尿嘧啶)存在的DNA链,导致后面的扩增bias严重,覆盖度降低。
针对现有技术中亚硫酸盐处理DNA(C-U)造成DNA损伤的问题,在一实施例中,本发明不使用亚硫酸盐。
针对现有技术中甲基化处理后的富含尿嘧啶的DNA直接用聚合酶扩增,bias严重,覆盖度偏低的问题,在一实施例中,本发明对甲基化处理后的DNA首先使用T7RNA聚合酶进行体外转录,使富含尿嘧啶的DNA链的扩增更均匀,再进行PCR扩增和测序。
在一实施例中,本发明的原理如下:本发明用转座子与生物素适配器对单细胞基因组进行标记打断,生成中等大小的片段(500~2000bp)。然后对其进行酶促甲基化转化(APOBEC3A)。接着将富含尿嘧啶的单链DNA延伸到T7启动子寡核苷酸上,在DNA上生成T7启动子。用T7 RNA聚合酶转录经酶促甲基化转化后的DNA,最后进行反转录与PCR扩增。最终构建的文库通过nanopore进行测序。本文将此种方法命名为T7-assisted enzymaticmethyl-sequencing(TEAM-seq)方法,下文对该发明方法均简称为TEAM-seq。
在一实施例中,如图1所示,本发明的技术路线如下:
1)细胞核分离与分选(细胞样本);
2)核裂解(细胞样本);
3)Tn5打断基因组DNA;
4)酶促甲基化转化,使非甲基化的胞嘧啶转换为尿嘧啶;
5)生成T7启动子,体外转录;
6)反转录;
7)PCR扩增。
在一实施例中,本发明不使用亚硫酸盐,而使用基于APOBEC酶的方法处理DNA(商业化试剂盒,NEB E7125),更加温和地完成C碱基到U碱基的转化;最大程度地减少对DNA的损伤。
在一实施例中,本发明使用带有biotin修饰的接头,用链霉素磁珠纯化,进一步减少DNA纯化时的损失。
在一实施例中,本发明用T7 RNA聚合酶转录甲基化转化后的DNA,这种方法更均一地获得了大量的DNA模板。
在一实施例中,本发明提供了一种T7 RNA聚合酶辅助的甲基化建库新方法,该方法可以提升匹克pg级别乃至单细胞DNA甲基化文库测序覆盖度。
在一实施例中,本发明在低深度测序数据下(2X),极大地提升了甲基化的覆盖度(100pg为70%,20pg为35%)。
实施例1
图1为本实施例的建库流程示意图。
本实施例进行100pgDNA甲基化文库的构建。
具体步骤如下:
1、oligo(New Tn5-pho)与oligo(New bio-bottom)退火形成双链结构的接头,然后与转座酶Tn5包埋形成复合体。“oligo”是指寡核苷酸,“pho”是指磷酸基团,“bio-bottom”是指生物素(biotin)修饰的一条寡核苷酸。
本实施例使用的各核苷酸如表2所示。
表2
Figure BDA0003515179840000061
“N”表示随机碱基,为A、T、C、G中的任意一种。
2、Tn5打断基因组DNA
取100pg DNA,用包埋好接头的Tn5酶打断,打断反应体系为10μL,其中转座酶的使用量为0.5μL,5XtagH buffer使用量为2μL,在PCR仪上37℃反应30min;反应完后加1μL132mM EDTA,65℃反应20min,使Tn5转座酶失活;最后再加1μL 216mM MgCl2,室温孵育5min,中和EDTA。
3、补平缺口
DNA打断后的酶反应混合液中,加入补平反应液(即:10μL 5X Q5 buffer,1μL10mM dNTP和1μL Q5 DNA聚合酶)72℃孵育10min;然后与20μL M-280链霉素磁珠(InvitrogenTM 11205D)室温结合1h;反应完后纯化磁珠并用28μL纯水重悬磁珠。
4、酶促甲基化转化(NEB E7125S):
参照NEB EM-seq Conversion Module Kit试剂盒说明书进行处理,即TET2酶氧化DNA(50μL体系,37℃孵育30min,加1μL终止反应缓冲液);M280磁珠纯化;0.1N(即mol/L)NaOH变性DNA(20μL体系,50℃孵育10min),APOBEC酶脱氨(100μL体系,37℃孵育3h);脱氨反应完成后用1X倍体积(100μL)AMPure XP磁珠纯化上清,10μL纯水洗脱溶解DNA,下层M280磁珠纯化后用6μL纯水重悬,两者混合进行下一步反应。
5、T7启动子形成
酶促甲基化处理后的DNA与0.7μL T7 oligo(10μM)退火,反应条件为(95℃,1min;65℃,1min;40℃,1min),然后加入0.7μL 10mM dNTP和0.6μL phi29 DNA聚合酶,30℃反应20min,65℃反应10min。
6、体外转录
以上反应液不纯化,直接用HiScribeTM T7高效RNA合成试剂盒体外转录18小时(NEBE2040S):具体步骤参考试剂盒说明书;反应完成后,用1.8X RNA Clean XP纯化,12μL纯水溶解RNA。图2为Agilent 2100分析系统检测得到的T7体外转录后的RNA片段长度结果图,可见,片段长度在500~2000bp,是本实施例需要的合理范围。
7、反转录(Invitrogen 18090050)
取转录后的RNA 100ng加入1μL 10μM RT primer和1μL 10mM dNTP,65℃孵育5min后立即放冰上,然后加入7μL的反转录酶mix(包含4μL 5X SSIV buffer、1μL 0.1M DTT、1μLRNase inhibitor、1μL SSIV酶),制得共20μL总体系,进行反转录,反应条件为:55℃,15min;60℃,10min;65℃,12min;70℃,8min;75℃,5min;80℃,10min;4℃,∞。
8、PCR扩增(Roche KK2801)
反转录完成后,无需纯化,直接取7μL反应液进行PCR扩增,反应体系为:25μL 2XKAPA Uracil mix,0.6μL Long primerP5,0.6μL Long primerP7,1.5μL Short P5,1.5μLShort P7,13.8μL NF water。反应条件为:95℃,3min;98℃,20s,60℃20s,72℃,4min,共11个循环;72℃,10min;4℃,∞);PCR完成后,用0.6倍体积的Ampure XP磁珠纯化,图3为Agilent 2100分析系统检测得到的片段长度图,可见,DNA主峰范围与RNA模板一致,纯化结束后,上nanopore测序。
上机测序与结果:
结果一:
测序结果如表3所示。
表3测序结果统计表
Figure BDA0003515179840000071
Figure BDA0003515179840000081
从表3可见,与1μg样品的WGBS相比,使用100pg或20pg的基因组DNA构建的TEAM-seq文库覆盖度均较好或相当。
结果二:
图4为4号染色体的C/CG/CHG(100bp bin)覆盖度结果图。可见,TEAM-seq比scWGBS_25ng和WGBS_1μg在Chr4上表现出更加均匀的覆盖率。scWGBS_25ng显示了一些区域没有被覆盖。WGBS_1μg基因组的覆盖率均匀,但对特定区域的覆盖率存在严重偏倚。
图5为4号染色体6500000-7000000区域的GC覆盖度结果图。可见,TEAM-seq展示了对Chr4:6500000-7000000的均匀覆盖。
图6为CGI覆盖度图。可见,在CGI区域覆盖度方面,TEAM-seq_100pg、TEAM-seq_20pg接近于scWGBS_25ng,显著高于WGBS_1μg。
结果三:
图7为TEAM-seq(20pg/100pg)和WGBS(1μg)之间的甲基化状态一致性(甲基化/未甲基化)结果图。可见,TEAM-seq与金标准WGBS的结果具有高度的一致性和甲基化水平相关性。在TEAM-seq(100pg/20pg)中,超过93%的CpGs表现出与WGBS检测到的CpGs相匹配的修饰状态。
结果四:
我们用TEAM-seq方法分析了HeLa细胞和HEK293T细胞的混合样。
图8为单细胞CpG/CHG/CHH覆盖度结果图,可见,CpG的覆盖范围约为5%~20%。
图9为单细胞基因组覆盖度结果图。可见,基因组覆盖范围约为10%~30%。
在一实施例中,本发明使用的tn5包埋的接头带有biotin修饰,纯化使用链霉素磁珠,比常规XP磁珠纯化效率更高,可减少DNA的损失;更为重要的是,本发明基于APOBEC酶甲基化处理后的DNA,首先使用T7 RNA聚合酶进行体外转录,转录能获得较多的RNA做为下一步cDNA扩增的模板。相比于现有技术中直接做PCR,本发明中T7的转录(针对富含尿嘧啶的DNA)更加均一。
以上应用了具体个例对本发明进行阐述,只是用于帮助理解本发明,并不用以限制本发明。对于本发明所属技术领域的技术人员,依据本发明的思想,还可以做出若干简单推演、变形或替换。
SEQUENCE LISTING
<110> 深圳华大基因股份有限公司
<120> 一种基于启动子构建文库的方法及其文库
<130> 22I33362
<160> 8
<170> PatentIn version 3.3
<210> 1
<211> 44
<212> DNA
<213> 人工序列
<400> 1
catataatac gactcactat agggagatac aacctacaat cact 44
<210> 2
<211> 50
<212> DNA
<213> 人工序列
<400> 2
actagtaagc agtggtatca acgcagagta cagatgtgta taagagatag 50
<210> 3
<211> 52
<212> DNA
<213> 人工序列
<400> 3
aatgatacgg cgaccaccga gatctacacg ggagatacaa cctacaatca ct 52
<210> 4
<211> 49
<212> DNA
<213> 人工序列
<400> 4
caagcagaag acggcatacg agatgagtac agatgtgtat aagagatag 49
<210> 5
<211> 24
<212> DNA
<213> 人工序列
<400> 5
aatgatacgg cgaccaccga gatc 24
<210> 6
<211> 24
<212> DNA
<213> 人工序列
<400> 6
caagcagaag acggcatacg agat 24
<210> 7
<211> 19
<212> DNA
<213> 人工序列
<400> 7
ctgtctctta tacacatct 19
<210> 8
<211> 46
<212> DNA
<213> 人工序列
<220>
<221> misc_feature
<222> (18)..(27)
<223> n is a, c, g, or t
<400> 8
tacaacctac aatcactnnn nnnnnnnaga tgtgtataag agacag 46

Claims (10)

1.一种基于启动子构建文库的方法,包括:
打断步骤,包括对待测样本进行打断处理,获得打断后的待测样本;
酶促甲基化转化步骤,包括对打断后的待测样本进行酶促甲基化转化,使非甲基化的胞嘧啶转换为尿嘧啶;
T7启动子连接步骤,包括将酶促甲基化转化处理后的待测样本与T7启动子退火,反应得到连接有T7启动子的待测样本;
体外转录步骤,包括将所述连接有T7启动子的待测样本转录为RNA;
反转录及扩增步骤,包括对所述RNA进行反转录、PCR扩增,获得所述文库。
2.如权利要求1所述的方法,其特征在于,所述T7启动子连接步骤中,退火反应条件如下:95~98℃,1~3min;55~65℃,1~3min;25~40℃,1~5min。
3.如权利要求1所述的方法,其特征在于,所述T7启动子连接步骤中,退火结束后,将退火后的待测样本与dNTP以及DNA聚合酶混合反应,得到反应后的待测样本。
4.如权利要求3所述的方法,其特征在于,将退火后的待测样本与dNTP以及DNA聚合酶混合反应时,反应条件如下:30~37℃,15~25min;65~75℃,10~20min。
5.如权利要求1所述的方法,其特征在于,T7启动子连接步骤结束后,不进行纯化,直接进行体外转录。
6.如权利要求1所述的方法,其特征在于,打断步骤中,使用酶对待测样本进行打断;
优选地,所述酶包括Tn5转座酶;
优选地,所述酶包埋有生物素修饰的接头;
优选地,打断步骤中,打断处理后,加入补平反应液,反应得到补平缺口后的待测样本;
优选地,打断步骤中,补平缺口后,使用磁珠对待测样本进行纯化。
7.如权利要求1所述的方法,其特征在于,酶促甲基化转化步骤中,使用加氧酶氧化待测样本中的DNA,然后使用脱氨酶进行脱氨,反应得到脱氨后的待测样本;
优选地,所述加氧酶包括TET酶;
优选地,所述TET酶包括TET1酶、TET2酶、TET3酶中的至少一种;
优选地,所述脱氨酶包括APOBEC酶;
优选地,体外转录步骤中,使用T7 RNA聚合酶将所述连接有T7启动子的待测样本转录为RNA;
优选地,打断步骤中,所述待测样本包括基因组DNA样本、游离DNA样本中的至少一种;
优选地,打断步骤中,所述待测样本的核酸分子中含有5-甲基胞嘧啶;
优选地,打断步骤中,所述待测样本的起始量≤100pg;
优选地,打断步骤中,所述待测样本的起始量为20~100pg。
8.如权利要求1~7任意一项所述方法构建得到的文库。
9.由权利要求8所述的文库上机测序所获得的测序数据。
10.如权利要求9所述的测序数据,其特征在于,所述测序数据的测序深度≤3×;
优选地,所述测序数据的测序深度≤2×。
CN202210161966.8A 2022-02-22 2022-02-22 一种基于启动子构建文库的方法及其文库 Pending CN114411266A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210161966.8A CN114411266A (zh) 2022-02-22 2022-02-22 一种基于启动子构建文库的方法及其文库

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210161966.8A CN114411266A (zh) 2022-02-22 2022-02-22 一种基于启动子构建文库的方法及其文库

Publications (1)

Publication Number Publication Date
CN114411266A true CN114411266A (zh) 2022-04-29

Family

ID=81261587

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210161966.8A Pending CN114411266A (zh) 2022-02-22 2022-02-22 一种基于启动子构建文库的方法及其文库

Country Status (1)

Country Link
CN (1) CN114411266A (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107557874A (zh) * 2017-09-22 2018-01-09 上海美吉医学检验有限公司 适用于单细胞全基因组甲基化与转录组共测序的文库建立方法及其应用
CN107904669A (zh) * 2018-01-02 2018-04-13 华中农业大学 一种单细胞甲基化测序文库的构建方法及其应用
CN112375806A (zh) * 2020-11-06 2021-02-19 中山大学 一种合成无修饰rna文库及用来校准rna修饰检测的方法
CN113088562A (zh) * 2020-01-08 2021-07-09 深圳华大基因股份有限公司 一种新型的低起始量dna甲基化建库方法
CN113249439A (zh) * 2021-05-11 2021-08-13 杭州圣庭医疗科技有限公司 一种简化dna甲基化文库及转录组共测序文库的构建方法
CN113668068A (zh) * 2021-07-20 2021-11-19 广州滴纳生物科技有限公司 基因组甲基化文库及其制备方法和应用

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107557874A (zh) * 2017-09-22 2018-01-09 上海美吉医学检验有限公司 适用于单细胞全基因组甲基化与转录组共测序的文库建立方法及其应用
CN107904669A (zh) * 2018-01-02 2018-04-13 华中农业大学 一种单细胞甲基化测序文库的构建方法及其应用
CN113088562A (zh) * 2020-01-08 2021-07-09 深圳华大基因股份有限公司 一种新型的低起始量dna甲基化建库方法
CN112375806A (zh) * 2020-11-06 2021-02-19 中山大学 一种合成无修饰rna文库及用来校准rna修饰检测的方法
CN113249439A (zh) * 2021-05-11 2021-08-13 杭州圣庭医疗科技有限公司 一种简化dna甲基化文库及转录组共测序文库的构建方法
CN113668068A (zh) * 2021-07-20 2021-11-19 广州滴纳生物科技有限公司 基因组甲基化文库及其制备方法和应用

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
DANIEL A BARTLETT ET AL.,: ""High-throughput single-cell epigenomic profiling by targeted insertion of promoters"", 《J CELL BIOL》, vol. 220, no. 12, 6 November 2021 (2021-11-06), pages 9 - 12 *
JACOB MORRISON ET AL.,: ""Evaluation of whole-genome DNA methylation sequencing library preparation protocols"", 《EPIGENETICS & CHROMATIN》, vol. 14, no. 28, 19 June 2021 (2021-06-19), pages 1 *
SIMONE PICELLI ET AL.,: ""Tn5 transposase and tagmentation procedures for massively scaled sequencing projects"", 《GENOME RES》, vol. 24, no. 12, 30 November 2014 (2014-11-30), pages 2033 - 2040, XP055236186, DOI: 10.1101/gr.177881.114 *

Similar Documents

Publication Publication Date Title
US11149297B2 (en) Methods for depleting RNA from nucleic acid samples
EP2914745B1 (en) Barcoding nucleic acids
US20220033890A1 (en) Method for highly sensitive dna methylation analysis
JP7033602B2 (ja) ロングレンジ配列決定のためのバーコードを付けられたdna
US10138512B2 (en) Nucleic acid processing of a nucleic acid fragment with a triazole linkage
CN107109401A (zh) 使用crispr‑cas系统的多核苷酸富集
US11761037B1 (en) Probe and method of enriching target region applicable to high-throughput sequencing using the same
CN108611398A (zh) 通过新一代测序进行基因分型
EP3555305A1 (en) Method for increasing throughput of single molecule sequencing by concatenating short dna fragments
KR102398479B1 (ko) 카피수 보존 rna 분석 방법
JP2005515792A (ja) 核酸を操作するための方法および手段
US20230056763A1 (en) Methods of targeted sequencing
EP3674413A1 (en) Probe and method for high-throughput sequencing targeted capture target region used for detecting gene mutations as well as known and unknown gene fusion types
US20210214783A1 (en) Method for constructing sequencing library, obtained sequencing library and sequencing method
CN111549025B (zh) 链置换引物和细胞转录组文库构建方法
CN110923302A (zh) 一种多基因甲基化联合检测方法
CN112410403B (zh) 一种精准定量的ATAC-seq文库制备方法及试剂盒
EP3865584A1 (en) Method for constructing sequencing library
CN114411266A (zh) 一种基于启动子构建文库的方法及其文库
CN114391043A (zh) 哺乳动物dna的甲基化检测及分析
WO2020259303A1 (zh) 一种快速构建rna 3&#39;端基因表达文库的方法
EP3666904A1 (en) Nucleic acid amplification and identification method
CN113302301A (zh) 检测分析物的方法及其组合物
CN118302538A (zh) 一种用于检测剪接异构体的靶向高通量测序方法
WO2023116490A1 (zh) 小rna的新型检测方法及其应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40073899

Country of ref document: HK