CN113817804B - 一种测序文库自连接头消除的方法及应用 - Google Patents

一种测序文库自连接头消除的方法及应用 Download PDF

Info

Publication number
CN113817804B
CN113817804B CN202111112081.0A CN202111112081A CN113817804B CN 113817804 B CN113817804 B CN 113817804B CN 202111112081 A CN202111112081 A CN 202111112081A CN 113817804 B CN113817804 B CN 113817804B
Authority
CN
China
Prior art keywords
library
sequence
guide
sequencing
guide dna
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111112081.0A
Other languages
English (en)
Other versions
CN113817804A (zh
Inventor
曹德盼
李东东
赵翊婷
程珂燕
余盼
贾雪峰
蒋智
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Golden Key Medical Laboratory Co ltd
Original Assignee
Shanghai Golden Key Medical Laboratory Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Golden Key Medical Laboratory Co ltd filed Critical Shanghai Golden Key Medical Laboratory Co ltd
Priority to CN202111112081.0A priority Critical patent/CN113817804B/zh
Publication of CN113817804A publication Critical patent/CN113817804A/zh
Application granted granted Critical
Publication of CN113817804B publication Critical patent/CN113817804B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B50/00Methods of creating libraries, e.g. combinatorial synthesis
    • C40B50/06Biochemical methods, e.g. using enzymes or whole viable microorganisms

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Analytical Chemistry (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Immunology (AREA)
  • Physics & Mathematics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • General Chemical & Material Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本申请涉及一种测序文库自连接头消除方法及应用,所述方法以测序接头自连文库序列为靶序列,设计短序列guide DNA,结合Argonaute核酸内切酶实现dsDNA文库分子双链断裂,将自连接头从dsDNA文库分子上切除,从而阻止其在后续PCR反应中被扩增。该方法能够显著降低文库自连接头比例,增高测序clean reads,提高数据有效率。

Description

一种测序文库自连接头消除的方法及应用
技术领域
本申请涉及基因测序技术领域,具体涉及一种测序文库自连接头消除的方法及应用。
技术背景
在高通量测序技术中,文库的质量对于高通量测序产出的数据质量至关重要,低质量的文库,导致Clusters或多重模板太多,数据质量不高;数据读取量少,基因组覆盖率低,所以文库质量直接影响测序效果。测序文库的质量是获得高质量的核酸测序数据的关键。
低质量文库一般是指浓度低、有二聚体污染、小片段污染、大片段污染、峰图过宽的文库,会导致整条lane文库有效数据产出偏低,影响clean reads的比率。尤其接头含量高的文库,存在接头二聚体,在上机测序时,①接头二聚体会与Flowcell上面的锚定序列结合,通过桥式PCR扩增形成簇,从而降低测序的有效数据产量;②接头二聚体序列短,在长簇时优先扩增,且序列固定、碱基复杂度低、长度短,会降低测序的Q30,影响clean reads的过滤率,③随着接头含量的增高数据产出急剧下降,造成数据量损失。
目前针对接头二聚体含量高的文库通用的解决方法主要是:1.核酸级别,在建库过程中来处理:①适当减少建库过程中接头用量,②调整文库纯化时磁珠的用量。但减少接头含量和调整磁珠用量都会影响文库出库量,达不到上机要求,对于样本量极少的标本如果测序体现出接头二聚体高污染,意味着实验失败,造成标本损失。2.文库级别,用出库的文库:文库再扩增回收,在接头含量极高(>80%)的情况下,文库扩增效率低,目的片段占比仍然低,达不到测序要求,所以急需一种能进行文库级别有效消除接头二聚体的方法,在能降低接头含量的同时,还能满足检测需求。
有鉴于此,提出本申请。
发明内容
本申请要解决的核心问题是寻求一种在测序文库构建过程中,能降低接头含量的同时还能满足检测需求的消除接头二聚体的方法。
为解决上述问题,本申请提出如下技术方案:
本申请首先提供一种测序文库自连接头消除的方法,所述方法包括如下步骤:
1)设计针对测序文库的自连接头序列的guide DNA;
2)向待处理文库中添加guide DNA和Argonaute核酸内切酶,进行靶向酶切反应;
进一步的,还包括:
3)去除体系中的Argonaute核酸内切酶和guide DNA组分。
进一步的,所述步骤1)中设计针对测序文库的自连接头序列的guide DNA的方法为:
以自连接头序列为目标片段,针对接头间insert序列两端相邻的各7-15bp接头序列为靶序列,设计正反向的guide DNA。
进一步的,所述guide DNA设计包括如下任一或多个:
a、所述guide DNA进行5′-磷酸化;
b、所述guide DNA长度为15-30bp;
优选的,还包括:
c、所述guide DNA第1位碱基为T,
d、所述guide DNA第12位碱为腺苷;
e、所述guide DNA序列GC含量低。
进一步的,所述步骤2)中
Argonaute核酸内切酶为TtAgo、pfAgo、AaAgo、MjAgo或pAgo酶;优选的为TtAgo酶。
在一些实施方式中,所述TtAgo酶浓度:guide DNA浓度<1:3-10;
在一些实施方式中,所述向待处理文库中添加guide DNA和Argonaute核酸内切酶:将guide DNA和TtAgo酶混合在1×NEB Thermoporeaction缓冲液中,70-75℃下孵育5-10分钟。
在一些实施方式中,所述靶向酶切反应条件:70-80℃孵育30-40min,3-5℃冷却。
进一步的,所述步骤3)中去除采用2×磁珠回收处理。
本申请还提供一种测序文库构建方法,其特征在于,包括上述任一方法,并进一步包括:
4)文库扩增:回收产物进行通用引物扩增,回收文库。
进一步的,上述任一所述测序文库自连接头消除的方法,所述测序文库为二代测序、三代测序或四代测序文库;
在一些实施方式中,所述测序为二代测序文库;
在一些优选的实施方式中,所述测序为illumina二代测序文库。
本申请还提供一种测序文库自连接头消除试剂盒,所述试剂盒中包含针对自连接头序列的guide DNA、Argonaute蛋白核酸内切酶以及文库扩增通用引物;
在一些实施方式中,Argonaute核酸内切酶为TTtAgo、pfAgo、AaAgo、MjAgo或pAgo酶;优选的为TtAgo酶。
本申请还提供一种文库修复剂,所述文库修复剂包括针对自连接头序列的guideDNA和Argonaute蛋白核酸内切酶;
在一些实施方式中,所述Argonaute蛋白核酸内切酶为TtAgo。
在一些实施方式中,所述针对自连接头序列的guide DNA是以自连接头序列为目标片段,针对接头间insert序列两端相邻的各7-15bp接头序列为靶序列,设计正反向的guide DNA。
在一些实施方式中,所述guide DNA设计原则包括如下任一或多个:
a、所述guide DNA进行5′-磷酸化;
b、所述guide DNA长度为15-30bp;
c、所述guide DNA第1位碱基为T,
d、所述guide DNA第12位碱为腺苷;
e、所述guide DNA序列GC含量低。
在一些实施方式中,所述试剂盒或修复剂中TtAgo酶终浓度:guide DNA终浓度为1:3-5。
本申请还提供一种应用:包括针对自连接头序列的guide DNA和Argonaute核酸内切酶混合液在测序文库自连接头消除中的用途,
在一些实施方式中,Argonaute核酸内切酶为TtAgo、pfAgo、AaAgo、MjAgo或pAgo酶;优选的为TtAgo酶。
在一些实施方式中,针对自连接头序列的guide DNA是以自连接头序列为目标片段,针对接头间insert序列两端相邻的7-15bp接头序列为靶序列,设计正反向的guideDNA。
在一些实施方式中,所述guide DNA包括如下任一或多个:
a、所述guide DNA进行5′-磷酸化;
b、所述guide DNA长度为15-30bp;
优选的,还包括:
c、所述guide DNA第1位碱基为T,
d、所述guide DNA第12位碱为腺苷;
e、所述guide DNA序列GC含量低。
在一些实施方式中,所述TtAgo酶浓度:guide DNA浓度<1:3-10;
在一些实施方式中,所述guide DNA和TtAgo酶混合液通过如下方法制备:将guideDNA和TtAgo酶混合在1×NEB Thermoporeaction缓冲液中,70-75℃下孵育5-10分钟。
在一些实施方式中,所述靶向酶切反应条件:70-80℃孵育30-40min,3-5℃冷却。
本申请有益技术效果:
1、本申请通过设计自连接头的guide DNA,并结合Argonaute核酸内切酶,在不影响正常文库情况下,有效去除自连接头。该方法能够显著降低测序文库接头比例,增高clean reads,提高数据有效率。
2、本申请方法具有普适性:基于文库接头的通用性,可以预知本申请对所有的illumina平台的文库都适用,无论DNA文库还是RNA文库,无论PCR扩增文库还是PCR-free文库。
3、本申请方法有效性好,文库起始量低:文库使用量低,是以1ng≤m≤18ngillumina文库为模板,尤其使高接头含量(>90%)的文库效果更佳。
4、本申请操作简单:常规的酶切实验操作及PCR反应操作即可完成。
5、衡量文库质量体系:高质量的文库处理前后接头含量变化不大,细微变化由磁珠纯化引起,低质量的文库处理前后接头含量变化明显,接头含量会大幅减小。
附图说明
图1、本申请guide DNA序列设计示意图。
图2、起始量1ng文库不同比例酶:guide处理后的片段分析图:a未处理的2号(U68)对照文库,b酶:guide=1:3接头消除的2号(U68),c酶:guide=1:5接头消除的2号(U68),d酶:guide=1:10接头消除的2号(U68),e酶:guide=1:20接头消除的2号(U68)。
图3、起始量18ng文库不同比例酶:guide处理后的片段分析图:a未处理的2号(U68)对照文库,b酶:guide=1:3接头消除的2号(U68),c酶:guide=1:5接头消除的2号(U68),d酶:guide=1:10接头消除的2号(U68),e酶:guide=1:20接头消除的2号(U68)。
图4、酶和guide DNA浓度优化后,测序接头比例分析图。
图5、起始量1ng文库用Ttago处理前后的片段分析图:a未处理的1号(U13)对照文库,b接头消除的1号(U13)文库,c未处理的2号(U68)对照文库,d接头消除的2号(U68)对照文库。
图6、起始量18ng文库用Ttago处理前后的片段分析图:a未处理的1号(U13)对照文库,b接头消除的1号(U13)文库,c未处理的2号(U68)对照文库,d接头消除的2号(U68)对照文库。
图7、qPCR定量标准曲线图。
图8、测序接头比例综合分析图。
图9、U-13文库前10碱基序列序列分布图。
图10、U-68文库前10碱基序列序列分布图。
具体实施方式
下面将结合实施例对本申请的实施方案进行详细描述,但是本领域技术人员将会理解,下列实施例仅用于说明本申请,而不应视为限制本申请的范围。实施例中未注明具体条件者,按照常规条件或制造商建议的条件进行。所用试剂或仪器未注明生产厂商者,均为可以通过市场购买获得的常规产品。
部分术语定义
除非在下文中另有定义,本申请具体实施方式中所用的所有技术术语和科学术语的含义意图与本领域技术人员通常所理解的相同。虽然相信以下术语对于本领域技术人员很好理解,但仍然阐述以下定义以更好地解释本申请。
如本申请中所使用,术语“包括”、“包含”、“具有”、“含有”或“涉及”为包含性的(inclusive)或开放式的,且不排除其它未列举的元素或方法步骤。术语“由…组成”被认为是术语“包含”的优选实施方案。如果在下文中某一组被定义为包含至少一定数目的实施方案,这也应被理解为揭示了一个优选地仅由这些实施方案组成的组。
在提及单数形式名词时使用的不定冠词或定冠词例如“一个”或“一种”,“所述”,包括该名词的复数形式。
本申请中的术语“大约”表示本领域技术人员能够理解的仍可保证论及特征的技术效果的准确度区间。该术语通常表示偏离指示数值的±10%,优选±5%。
此外,说明书和权利要求书中的术语第一、第二、第三、(a)、(b)、(c)以及诸如此类,是用于区分相似的元素,不是描述顺序或时间次序必须的。应理解,如此应用的术语在适当的环境下可互换,并且本申请描述的实施方案能以不同于本申请描述或举例说明的其它顺序实施。
以下术语或定义仅仅是为了帮助理解本申请而提供。这些定义不应被理解为具有小于本领域技术人员所理解的范围。
本申请中所述的术语“核酸”、“多核苷酸”和“核苷酸序列”可互换地用于指任何长度核苷酸的聚合物形式,包括脱氧核糖核苷酸、核糖核苷酸、它们的组合、以及它们的类似物。“寡核苷酸”和“寡”可互换地用于指具有不超过约50个核苷酸的短多核苷酸。
本申请中所述的“文库自连接头”是指测序文库使用的接头在DNA聚合酶的作用下发生自连反应的产物,其通常为二聚体形式,像文中所述的“文库接头自连二聚体”。比如:illumina正常文库的结构为:接头F-TCTTCCGATCTGATCGGAAGAGCACA-目标片段的序列-接头R-TGTGCTCTTCCGATCAGATCGGAAGA;那么文库自连接头为接头在DNA聚合酶的作用下发生自连反应形成接头二聚体形式:F-TCTTCCGATCTGATCGGAAGAGCACA-TGTGCTCTTCCGATCAGATCGGAAGA。
本申请中所述的“接头自连文库序列”或“自连接头序列”表示相同意思,是指包含“文库自连接头”中的两个接头连续序列,其中每个接头至少包含5个碱基,其长度为15-30bp;其与guide DNA遵循碱基互补配对原则匹配。
本申请中所述的“引导DNA”或“guide DNA”可互换地用于本申请,指能够与本申请的Argonaute核酸内切酶形成复合物并与靶核酸(接头自连文库序列)互补杂交的单链寡核苷酸DNA。引导DNA编辑的长度大约15-30bp 5'磷酸化的核苷酸DNA分子。
本申请中所述的“Argonaute核酸内切酶”是指:来自Argonaute蛋白家族的核酸内切酶,包括诸如TtAgo、pfAgo、AaAgo、MjAgo或pAgo酶等。“Argonaute”和“Ago”可互换使用,并且指天然存在或工程化的蛋白质,其可经由单链寡核苷酸DNA(即引导DNA)引导来特异性识别包含引导DNA的互补序列的靶核酸。
本申请中所述的“TtAgo酶”是指:(TtAgo)是一种热嗜热菌的argonaute,可编辑DNA的内切酶,它需要一个短的5'磷酸化单链DNA引导到底物上的特定对应序列激活其活性。
本申请所述的“TtAgo/guide复合物”或“TtAgo/guide DNA复合物”表示相同意思,是指:TtAgo内切酶与Guide DNA的混合物。
本申请所述的方法大体是这样一种方法:以接头自连文库的序列作为靶序列,设计一段5’端磷酸化的短序列作为guide DNA,用Argonaute核酸内切酶靶向作用文库接头自连二聚体的序列,实现在dsDNA文库分子上形成双链断裂,把接头二聚体从dsDNA文库分子上切下,从而阻止接头自连二聚体在后续PCR反应中被扩增,保证只扩增dsDNA文库分子。
可以理解,该方法首先并不受限于测序平台,但凡文库构建过程中涉及接头自连的情况下都适用。因此,在一些实施方式中,本申请适用于包括但不限于二代测序、三代测序或四代测序;优选的,所述测序为二代测序文库;更优选的,所述测序为illumina二代测序文库。
至于本申请中具体的guide DNA设计,在已知本申请的设计思路基础上,本领域可以针对任意序列的自连接头进行guide DNA设计,通常情况下,以自连接头中两接头连接处两端相邻的7-15bp序列为靶序列,分别设计正、反向的guide DNA;在一些优选的实施方式中,所述guide DNA序列与自连接头序列互补。在一些实施方式中,b、所述guide DNA长度为15-30bp;为满足导向性,优选的,所述guide DNA通常进行5′-磷酸化;更优选的,所述guideDNA第1位碱基为T,所述guide DNA第12位碱为腺苷,所述guide DNA序列GC含量低。
根据本申请的一些方面,所述步骤2)中Argonaute核酸内切酶可经由单链寡核苷酸DNA(即引导DNA)引导来特异性识别包含引导DNA的互补序列,其可为TtAgo、pfAgo、AaAgo、MjAgo或pAgo酶;本申请优选的为TtAgo酶。在一些实施方式中,所述TtAgo酶浓度:guide DNA浓度<1:3-10;在一些优选的实施方式中,所述添加guide DNA和TtAgo酶为:将guide DNA和TtAgo酶混合在1×NEB Thermoporeaction缓冲液中,70-75℃下孵育5-10分钟;在一些更优选的实施方式中,,所述靶向酶切反应条件:70-80℃孵育30-40min,3-5℃冷却。
不做限制,本申请在把接头二聚体从dsDNA文库分子上切下后,可进一步包括去除体系中Argonaute核酸内切酶和guide DNA组分的步骤,所述去除包括但不限于采用磁珠回收等方式进行处理。
下面结合具体实施例来阐述本申请。
实施例1本申请设计优化
如本申请背景技术所述,现有测序文库尤其二代测序文库构建过程中存在接头干扰问题,不过在解决该问题是,本领域很难想到去针对接头进行单独处理,原因在于一般样本富裕的情况下,更多的是考虑重新提取建库,即使重新提取构建文库解决不了这个问题,大家也会认为样本质量有问题;或针对接头的问题,在二代测序技术流程常规的方法还是接头含量的调整和磁珠的纯化,或者切胶回收,不会思考从文库的维度进行处理,毕竟此种样本是少数的,尤其是科研样本中更少见,临床样本中可能会常见,但不会花费大量精力来研究它;对于珍贵的样本,多数情况下只够进行一次提取建库实验,能进行文库级处理,会很大的改善珍贵样本的使用率。
本申请依据本公司illumina测序平台分析原始文库及原始数据设计本申请:
本申请以illumina接头自连文库的序列作为靶序列,设计一段5’端磷酸化的短序列作为guide DNA,用TtAgo靶向作用文库接头自连二聚体的序列,TtAgo/guide复合物在DNA文库上搜索与靶标完全碱基配对的序列诱导核酸内切酶活性,使目标DNA在guide的对应碱基之间被切割,实现在dsDNA文库分子上形成双链断裂,把接头二聚体从dsDNA文库分子上切下。
具体的,如下以guide序列设计、Argonaute核酸内切酶及其使用浓度等方面诠释本申请的设计:
1)示例性的,本申请guide序列设计原理如图1所示。以接头自连序列为目标片段,0的位置是insert片段(通常,正常文库中该insert为目标序列,但在自连接头中因为是两个接头直接相连,因此该位置不含序列,标记为0),0两边都是接头序列位置,以insert序列相邻的9bp接头序列(前后各9bp,共18bp)设计正向的guide-F,以insert序列相邻的9bp接头互补序列(前后各9bp,共18bp)设计反向的guide-R。
经实验优化,Guide DNA设计可包括如下:①guide核苷酸序列中第一位碱基会影响TtAgo活性;用胸苷(T)开始TtAgo guide,guide的第一个碱基对于与目标序列的碱基配对并不重要,因此将guide位置1更改为T,即使它与目标位置1不互补,也可以提高总体反应性能;②guide核苷酸序列中第12位的碱基会影响TtAgo活性;避免在TtAgo guide的第12位使用腺苷;③TtAgo选择最佳的目标序列为低GC含量序列。
经过优化筛选获得多种可用guide DNA序列,示例性,以如下guide DNA序列为例:
guide-F:5’P-TTCCGATCTGATCGGAAG-3’(SEQ ID NO.1);
guide-R:5’P-TCTTCCGATCAGATCGGA-3’(SEQ ID NO.2)。
guide-F1:5’P-TTCCGATCTGATCGG-3’(SEQ ID NO.3);
guide-R1:5’P-TCTTCCGATCAGATC-3’(SEQ ID NO.4)。
guide-F2:5’P-TCTTCCGATCTGATCGGAAGAGCACA-3’(SEQ ID NO.5);
guide-R2:5’P-TGTGCTCTTCCGATCAGATCGGAAGA-3’(SEQ ID NO.6)。
本申请实施例优先选择guide-F&R(SEQ ID NO.1、2)组进行。
2)Argonaute核酸内切酶的选择
经前期实验证实,本申请可分别采用TtAgo、pfAgo、AaAgo、MjAgo或pAgo酶进行靶向实验;优先的,本申请选择TtAgo效果最优。
3)酶与guide DNA浓度的优化选择
调整TtAgo酶浓度:guide DNA浓度的比值,进行4个比值的测试,TtAgo酶浓度:guide DNA浓度=1:3、1:5、1:10和1:20,用43-U68的文库进行体系效果比较。自连接头消除选择1ng和18ng的文库加入到TtAgo和DNA guide按1:3、1:5、1:10和1:20的梯度配制的体系中进行验证,具体方法如下表。
下表位不同浓度体系的测序数据结果,图2-3为起始量1ng/18ng文库在不同比例酶:guide处理后的片段分析图,图4为测序接头比例分析。可见,原始文库的接头含量为88.54%,数据有效率为11.5%,文库经自连接头消除后,1ng起始量酶:guide=1:3时,接头含量比例为7.96%,接头占比降低了91%,数据有效率为86.97%,有效率提升了6.56倍;18ng起始量的酶:guide=1:5时接头含量为13.79%,接头占比降低了84.4%,数据有效率为76.94%,有效率提升了倍5.69倍。整体而言,不论是1ng还是18ng,在酶与guide DNA浓度比为1:3-10内,效果都较为显著。
最终,本申请经过全面优化(还包括浓度、时间、温度等参数),确定本申请的如下方法步骤:
1)设计针对测序文库的自连接头序列的5’端磷酸化的guide DNA:以自连接头序列为目标片段,针对接头间0序列两端相邻的7-15bp接头序列为靶序列,设计正反向的guide DNA。
2)向待处理文库中添加guide DNA和TtAgo酶混合液,进行靶向酶切反应:TtAgo酶浓度:guide DNA浓度<1:3-10;guide DNA和TtAgo酶混合液通过如下方法制备:将guideDNA和TtAgo酶混合在1×NEB Thermoporeaction缓冲液中,70-75℃下孵育5-10分钟(优选的,75℃下孵育10分钟);所述靶向酶切反应条件:70-80℃孵育30-40min,3-5℃冷却(优选的,80℃孵育40min,4℃冷却)。
3)去除体系中的Argonaute酶和guide DNA组分:用2×磁珠回收处理后的产物,除去体系中的酶与多余的oligo。
4)文库扩增:回收产物进行通用引物扩增,回收文库。
实施例2与未处理的文库数据进行效果比较
一、文库筛选
临床样本性状复杂,不同的样本提取分离的效率和基因组片段化程度和降解程度影响序列的回收率,部分质量差的样本构建的文库接头含量较高,测序有效数据率低,达不到数据分析的要求。
从illumina测序平台下机的数据中,选取1个核酸浓度正常,文库出库浓度正常,符合illumina平台上机标准,但产出数据效率低,接头比例高达95%的文库和1个核酸浓度偏低,文库出库浓度正常,符合illumina平台上机标准,但接头比例较高为88.5%的文库。
具体的:从illumina测序平台下机的数据中,选取1个核酸浓度正常为11.7ng/μL,建库起始量200ng文库出库浓度正常为0.95ng/μL,符合illumina平台上机标准,但产出数据效率只有0.88%,接头比例高达97%的文库和1个核酸浓度很低0.078ng/μL,文库出库浓度正常为3.04ng/μL,符合illumina平台上机标准,但数据有效率为11.5%,接头比例较高为88.5%的文库。
表1、筛选文库信息
Sample MBXD56754-1-U13 43-U68
核酸浓度(ng/μL) 11.7 0.078
建库类型 PCR-free PCR-8
文库浓度(ng/μL) 0.95 3.04
PCR定量(nM) 0.3 2.64
RawReads(#) 32,581,927 15,265,747
Adapter_ratio(%) 97.14 88.54
Duplication(%) 1.79 2.28
Clean_GC(%) 39.98 42.7
Clean_Q20 94.18 94.25
Clean_Q30 91.92 91.99
CleanReads 285,732 1,755,732
Effective(%) 0.88 11.5
AvgQuality 0.997364121 0.99751773
LowQuality(%) 0.08 0.23
TooShort(%) 97.07 85.83
PCR-8后浓度(ng/μL) 8.96 70.4
二、文库处理方法
1.由于文库量少体积小,所以对目标文库先用illumina通用引物扩增8cycles,达到实验所需的量后,分别用18ng和1ng文库进行下面的实验。
表2、文库处理信息
2.文库不做处理:1ng和18ng的文库,按表5的反应体系,按表5、6用illumina通用引物PCR扩增15cycles,加45μL磁珠文库回收,用30μL洗脱液洗脱文库作为对照组,每个文库做3次技术重复。
3.自连接头消除方法:1ng和18ng的文库与TtAgo和DNA guide按下表3的体系在80℃条件下进行靶向酶切反应,在反应之前不加文库先将guide和TtAgo酶混合在1×TtAgo缓冲液中,在75℃下孵育10分钟(提高酶切的特异性),再加待处理文库,按表4程序反应40min。加40μL磁珠回收除去酶和oligo,20μL洗脱处理后的产物,按表5、6用illumina通用引物PCR扩增15cycles,加45μL磁珠文库回收,用30μL洗脱液洗脱文库作为实验组,每个文库做2次技术重复。
表3、酶切反应体系
表4、反应程序
表5、扩增体系
表6、扩增反应程序
三、文库质检
1.Agilent 2100 Bioanalyzer进行文库片段分析
用Agilent 2100 Bioanalyzer片段分析仪进行对照组与实验组文库片段大小的分析,回收后的高浓度文库都统一稀释到3ng/μL左右,制胶、灌胶、点样1μL、仪器运行分析。
1)制胶:试剂室温平衡30min,15μL高灵敏度DNA染色溶液加到高灵敏度DNA胶混合物中,涡旋混匀,胶、染色液混合物全部转移至过滤管中,室温2240g(6000rpm)离心15min,弃过滤管,留胶备用。
2)装胶:按照说明书,往芯片的相应位置加9μL胶,注意不要产生气泡;压胶、继续向芯片对应位置加入胶。
3)加样:除了胶孔外的其它12个孔中加入5μL高灵敏度DNA Markers,每个样品孔不能空置,ladder的孔加入1μL DNA Ladder,其它11个孔中加入1μL样品,样品加到底,以防涡旋混合的时候飞溅出来。
4)打开仪器,安装芯片进行检测。
表7文库质检数据
2.用qPCR的方法进行对照组与实验组文库定量分析。
1)文库稀释:按照2+198稀释100倍,稀释2次共稀释10000倍。
2)按照下表配制反应体系:
3)按照此反应程序进行文库扩增质检:
4)标准曲线制备:S1,S2,S3,S4,S5;浓度分别为:20pmol,2pmol,0.2pmol,0.02pmol,0.002pmol,SYBR green体系,做标准曲线;
5)qPCR结果处理:计算待测样本的qPCR浓度;
四、结果分析
通过以下分析确立本申请优势。
1.文库接头占比分析
1.1分析比对处理前后文库2100片段大小与峰图接头占比;
1.2分析比对处理前后文库qPCR定量的结果变化;
1.3分析比对处理前后文库的有效数据率、clean reads、接头比例与检出等;
2.分析比对处理前后文库的序列信息。
具体结果如下:
1.文库接头占比分析
1.1 2100片段分析
在2100片段分析145bp左右为文库接头自连二聚体结构,横坐标为文库片段大小,纵坐标为荧光信号强度,反应核酸含量,同样上样量的文库经处理前后的结果显示(参见图5-6):文库经处理后接头二聚体的含量明显降低或去除了文库交联的大片段。相对而言,18ng的文库去接头二聚体的效果比1ng的文库更明显;18ng的文库经处理后效果显著,有目标序列的片段。
1.2 qPCR文库质量分析
表8 qPCR质检数据
qPCR定量标准曲线参见图7,qPCR质检数据见表8。标准曲线的R2=0.999,文库都在标准曲线检测范围之内质检合格,文库物质的量浓度都大于3nM满足上机分析要求,相同样本18ng起始量的文库物质的量浓度都大于18ng起始量的,此结果与2100片段分析的结果一致,以18ng文库起始量的去接头的效果好于1ng文库起始量。投入18ng相应的文库目标片段占比相对高一点,所以效果较好。可见,本申请方法有效性好,能够适于文库起始量较低(比如1ng≤m≤18ng)的情形。
1.3测序接头比例分析
表9测序数据
表9为测序数据,图5-6为起始量1ng/18ng文库经TtAgo酶处理后的片段分析图,图8为测序接头比例综合分析。可见,1-U13原始文库的接头含量高达97.14%,数据有效率为0.88%,文库经自连接头消除后,1ng起始量的接头含量为21.9%,接头占比降低了77%,数据有效率为12.9%,有效率提升了13.7倍;18ng起始量的接头含量为20.8%,接头占比降低了79%,数据有效率为23%,有效率提升了25.1倍。
43-U68原始文库的接头含量为88.54%,数据有效率为11.5%,文库经自连接头消除后,1ng起始量的接头含量为23.36%,接头占比降低了73.6%,数据有效率为74.5%,有效率提升了5.5倍;18ng起始量的接头含量为13.2%,接头占比降低了85%,数据有效率为66.67%,有效率提升了倍4.8倍。
此结果与2100片段分析的结果一致,以18ng文库起始量的去接头的效果好于1ng文库起始量;投入18ng相应的文库目标片段占比相对高一点,所以效果较好。
3.序列分析
Illumina平台测序结果用uniq软件分析文库序列的前10个碱基与接头序列完全匹配的序列条数的频数统计。从图9和10可知,文库自连接接头去除后,前10个碱基完全匹配接头序列的条数频数呈数量级下降。而且,首行为完全与接头序列匹配的序列条数,文库中接头序列还是占多数,但文库接头自连消除的方法是有效果的,其序列数呈数量级下降。
结论:综合2100片段分析、qPCR文库定量分析、测序数据结果分析及序列条数频数分析都显示illumina文库自连接头消除的方法是可行的,它能改善文库的质量,降低接头比例,提高数据有效率。
以上对本申请具体实施方式的描述并不限制本申请,本领域技术人员可以根据本申请作出各种改变或变形,只要不脱离本申请的精神,均应属于本申请所附权利要求的范围。
序列表
<110> 上海金匙医学检验实验室有限公司
<120> 一种测序文库自连接头消除的方法及应用
<160> 6
<170> SIPOSequenceListing 1.0
<210> 1
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 1
ttccgatctg atcggaag 18
<210> 2
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 2
tcttccgatc agatcgga 18
<210> 3
<211> 15
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 3
ttccgatctg atcgg 15
<210> 4
<211> 15
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 4
tcttccgatc agatc 15
<210> 5
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 5
tcttccgatc tgatcggaag agcaca 26
<210> 6
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 6
tgtgctcttc cgatcagatc ggaaga 26

Claims (4)

1.一种测序文库自连接头消除方法,其特征在于,所述方法包括如下步骤:
1)设计针对测序文库自连接头序列的guide DNA;
2)向待处理文库中添加guide DNA和Argonaute核酸内切酶,进行靶向酶切反应;
3)去除体系中Argonaute核酸内切酶和guide DNA组分;
所述步骤1)中设计针对测序文库的自连接头序列的guide DNA的方法为:
以自连接头中两接头连接处两端相邻的各7-15 bp序列为靶序列,设计正、反向guideDNA;
所述guide DNA序列与自连接头序列互补;
所述步骤2)中,所述Argonaute核酸内切酶为TtAgo;
所述TtAgo酶和guide DNA的浓度比为1:3-10;
所述靶向酶切反应条件为:70-80℃孵育30-40 min,3-5℃冷却;
所述guide DNA序列如SEQ ID NO.1-2所示。
2.权利要求1所述的测序文库自连接头消除的方法,其特征在于,所述步骤3)中去除采用磁珠回收处理。
3.一种测序文库构建方法,其特征在于,包括权利要求1所述方法,并进一步包括:
4)文库扩增:回收产物进行通用引物扩增,回收文库。
4.权利要求1所述的测序文库自连接头消除的方法,其特征在于,所述测序文库为二代测序、三代测序或四代测序文库。
CN202111112081.0A 2021-09-22 2021-09-22 一种测序文库自连接头消除的方法及应用 Active CN113817804B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111112081.0A CN113817804B (zh) 2021-09-22 2021-09-22 一种测序文库自连接头消除的方法及应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111112081.0A CN113817804B (zh) 2021-09-22 2021-09-22 一种测序文库自连接头消除的方法及应用

Publications (2)

Publication Number Publication Date
CN113817804A CN113817804A (zh) 2021-12-21
CN113817804B true CN113817804B (zh) 2024-03-08

Family

ID=78915155

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111112081.0A Active CN113817804B (zh) 2021-09-22 2021-09-22 一种测序文库自连接头消除的方法及应用

Country Status (1)

Country Link
CN (1) CN113817804B (zh)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105483118A (zh) * 2015-12-21 2016-04-13 浙江大学 以Argonaute核酸酶为核心的基因编辑技术
CN107058573A (zh) * 2016-06-13 2017-08-18 艾吉泰康生物科技(北京)有限公司 一种利用Cas9/gRNA系统构建扩增子文库的方法
CN107488655A (zh) * 2016-06-12 2017-12-19 中国科学院上海生命科学研究院 测序文库构建中5’和3’接头连接副产物的去除方法
CN108473985A (zh) * 2015-11-17 2018-08-31 柏尔科学公司 用于减少接头-二聚体形成的方法和试剂盒
CN108624666A (zh) * 2017-03-16 2018-10-09 深圳华大基因股份有限公司 用于构建测序文库的接头核酸分子
CN109790577A (zh) * 2016-08-01 2019-05-21 豪夫迈·罗氏有限公司 从核酸测序制备物除去衔接子二聚体的方法
CN110499362A (zh) * 2018-05-17 2019-11-26 武汉华大医学检验所有限公司 接头组合物及其应用
CN111849965A (zh) * 2019-04-26 2020-10-30 新英格兰生物实验室公司 用于减少偏向性的多核苷酸衔接子设计
WO2021052310A1 (zh) * 2019-09-17 2021-03-25 北京博昊云天科技有限公司 一种dna文库构建方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2614154B1 (en) * 2010-09-10 2014-12-17 New England Biolabs, Inc. Method for reducing adapter-dimer formation
US9102936B2 (en) * 2012-06-11 2015-08-11 Agilent Technologies, Inc. Method of adaptor-dimer subtraction using a CRISPR CAS6 protein

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108473985A (zh) * 2015-11-17 2018-08-31 柏尔科学公司 用于减少接头-二聚体形成的方法和试剂盒
CN105483118A (zh) * 2015-12-21 2016-04-13 浙江大学 以Argonaute核酸酶为核心的基因编辑技术
CN107488655A (zh) * 2016-06-12 2017-12-19 中国科学院上海生命科学研究院 测序文库构建中5’和3’接头连接副产物的去除方法
CN107058573A (zh) * 2016-06-13 2017-08-18 艾吉泰康生物科技(北京)有限公司 一种利用Cas9/gRNA系统构建扩增子文库的方法
CN109790577A (zh) * 2016-08-01 2019-05-21 豪夫迈·罗氏有限公司 从核酸测序制备物除去衔接子二聚体的方法
CN108624666A (zh) * 2017-03-16 2018-10-09 深圳华大基因股份有限公司 用于构建测序文库的接头核酸分子
CN110499362A (zh) * 2018-05-17 2019-11-26 武汉华大医学检验所有限公司 接头组合物及其应用
CN111849965A (zh) * 2019-04-26 2020-10-30 新英格兰生物实验室公司 用于减少偏向性的多核苷酸衔接子设计
WO2021052310A1 (zh) * 2019-09-17 2021-03-25 北京博昊云天科技有限公司 一种dna文库构建方法

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
CRISPR/Cas9-targeted removal of unwanted sequences from small-RNA sequencing libraries;Andrew A. Hardigan等;NUCLEIC ACIDS RESEARCH;第47卷(第14期);第e84页 *
DNA-guided DNA interference by a prokaryotic Argonaute;Daan C. Swarts等;Nature;第507卷(第7491期);第258-261页 *
DNA-guided genome editing using the Natronobacterium gregoryi Argonaute;Feng Gao等;Nat Biotechnol.;第34卷(第7期);第768-773页 *
NgAgo-based fabp11a gene knockdown causes eye developmental defects in zebrafish;Jialing Qi等;Cell Res.;第26卷(第12期);第1349-1352页 *
Profiling Thermus thermophilus Argonaute Guide DNA Sequence Preferences by Functional Screening;Eric A Hunt等;Front Mol Biosci.;第8卷;第670940页 *
原核生物Argonaute(pAgo)蛋白介导细菌基因组编辑及其机制研究;付磊;中国博士学位论文全文数据库 基础科学辑(第2021年第01期期);第A006-444页 *

Also Published As

Publication number Publication date
CN113817804A (zh) 2021-12-21

Similar Documents

Publication Publication Date Title
EP3394292B1 (en) Methods of library construction for polynucleotide sequencing
CN108138364B (zh) 一种核酸单链环状文库的构建方法和试剂
CN103088433A (zh) 全基因组甲基化高通量测序文库的构建方法及其应用
CN105986015B (zh) 一种基于高通量测序的多样本的一个或多个靶序列的检测方法和试剂盒
CN110734967B (zh) 一种接头组合物及其应用
CN110699426A (zh) 基因目标区域富集方法及试剂盒
CN107893109B (zh) 一种基于移除野生型序列的低丰度基因突变富集方法
CN107475779A (zh) 适用于单细胞rrbs测序的文库建立方法及其应用
CN113668068B (zh) 基因组甲基化文库及其制备方法和应用
CN112359093B (zh) 血液中游离miRNA文库制备和表达定量的方法及试剂盒
CN102839168A (zh) 核酸探针及其制备方法和应用
CN112251821A (zh) 一种快速高效的构建二代测序文库的试剂盒
WO2023202030A1 (zh) 一种小分子rna的高通量测序文库构建方法
CN112941635A (zh) 一种提高文库转化率的二代测序建库试剂盒及其方法
CN110872609B (zh) 对小rna分子精准建库和测序的方法以及应用
CN113337590B (zh) 一种二代测序方法和文库构建方法
CN110923302A (zh) 一种多基因甲基化联合检测方法
CN113817804B (zh) 一种测序文库自连接头消除的方法及应用
CN111989406B (zh) 一种测序文库的构建方法
CN111979353A (zh) 一种针对新型冠状病毒SARS-CoV-2全长基因组测序的文库构建方法
CN114277114B (zh) 一种扩增子测序添加唯一性标识符的方法及应用
CN114808148A (zh) 一种dna文库构建试剂盒、文库构建方法和应用
CN113943779A (zh) 一种高cg含量dna序列的富集方法及其应用
CN107904297B (zh) 用于微生物多样性研究的引物组、接头组和测序方法
CN112176045A (zh) 锁式探针和试剂盒及基因扩增方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant