CN116670340A

CN116670340A - 一种环化文库的快速构建方法及成环接头

Info

Publication number: CN116670340A
Application number: CN202080107392.5A
Authority: CN
Inventors: 于友钱; 傅书锦; 耿春雨; 梁鑫明
Original assignee: MGI Tech Co Ltd
Current assignee: MGI Tech Co Ltd
Priority date: 2020-12-29
Filing date: 2020-12-29
Publication date: 2023-08-29
Also published as: WO2022141061A1; EP4273307A1; US20240076657A1; EP4273307A4

Abstract

本发明属于生物技术领域，具体公开了一种环化文库构建方法及成环接头。所述方法包括：1)将DNA序列打断成片段；2)使所述打断的片段的两端形成3’端突出；3)利用成环接头将所述3’端突出的片段环化形成环状文库，所述成环接头为不完全配对且两端具有5’端突出的双链，所述成环接头的5’端突出与所述打断的片段的3’端突出互补。本发明通过对打断DNA片段的末修复和加A处理形成末端的A粘性末端，在与特别设计的接头T粘性末端互补形成环化结构，在连接酶的作用下完成缝隙处的连接。

Description

一种环化文库的快速构建方法及成环接头

技术领域

本发明属于生物技术领域，更具体而言，本发明提供了一种环化文库的快速构建方法及成环接头。

背景技术

现阶段基于下一代测序技术(NGS)高通量测序的成熟建库产品众多。但是，这些建库产品普遍是基于常规的建库流程。常规的文库构建流程主要包括如下步骤：将基因组核酸链通过物理或者酶切的方式打断成片段；对打断的片段利用外切酶进行去末端修复，并补平片段两端使得两端均为平末端，然后再利用聚合酶在DNA的3’端加A，从而生成单碱基粘性末端；在3’端加A的片段的两端加上同样的接头。接头为一条核酸长链和一条短链互补配对而成，通过AT连接互补配对后通过连接酶连接缝隙；以连接接头的片段为模板，加入与接头链互补配对的核酸单链引物作为引物进行聚合酶链式反应；通过变性使模板的两条单链分离，在引物结合至对应单链后，分别将对应单链延伸成完全互补配对、一端为A接头、一端为B接头的双链目的产物；连接产物使用磁珠纯化的方式纯化回收；纯化回收得到的DNA双链产物经过变性后，获得单链DNA，使用环化辅助核酸单链引物和DNA单链5’末端的磷酸基团的筛选，将目标DNA单链环化；通过外切酶等方法的处理，去掉不需要和剩余的未环化单链；环化后产物通过磁珠纯化的方式纯化回收；环化后的单链环状核酸产物进入后续的测序步骤；经过滚环复制后形成核酸纳米球(DNB)进行核酸序列信息读取。这其中涉及到多个转管和纯化步骤，在操作简便性和建库时间方面有改进空间。

NGS高通量测序中使用的接头本身是一段特殊设计的DNA序列，接头上的特性序列信息在测序的时候作为测序的起始位点的序列与测序引物配对，通过引物的延伸，然后完成对后续序列信息的测定。通过连接等方法将接头连接在DNA片段两端，为了实现这种有方向的连接，同时避免接头间的相互连接，通常采用粘性末端接头的连接方式。传统的建库需要保证DNA双链两端都连接接头，并且需要通过纯化的方式去掉多余的接头产物。

随着许多国家开始进行国家级大队列居民测序服务，现有技术中需要操作简单且耗时短的环化文库建库方法。

发明内容

为了解决现有技术中存在的问题，本发明提出了一种环化文库的快速构建方法及成环接头。

因此，在一方面，本发明提供了一种环化文库构建方法，所述方法包括：

1)将DNA序列打断成片段；

2)使所述打断的片段的两端3’端突出；

3)利用成环接头将所述3’端突出的片段环化形成环状文库，所述成环接头为不完全配对且两端具有5’端突出的双链，所述成环接头的5’端突出与所述打断的片段的3’端突出互补。

在一个实施方案中，在1)中，所述DNA序列经过超声或者酶切打断成随机片段。

在一个实施方案中，所述打断的片段的3’端突出和所述成环接头的5’端突出长度为1-5nt，例如3nt或2nt，优选1nt。

在一个实施方案中，所述打断的片段的3’端突出为A，所述成环接头的5’端突出为T。

在一个实施方案中，在2)中，将所述打断的片段经外切酶、聚合酶和T4多聚核苷酸激酶的处理成5’磷酸化且3’多出A脱氧核苷酸的粘性末端。

在一个实施方案中，在3)中，所述不完全配对的双链包括在一条链上有缺口或者所述双链间有非匹配区。

在一个实施方案中，在3)中，所述双链间包括两段非匹配区，所述两段非匹配区之间包括用于区分样本的条形码序列。

在一个实施方案中，在3)中，所述成环接头包括如下的成环接头(a)或成环接头(b)：

成环接头(a)包括一条长链和与所述长链两端配对的两条短链，所述长链5’端具有磷酸修饰,与所述长链3’端互补配对的短链的5’端具有磷酸修饰，互补形成的双链接头具有3’端T粘性末端，并包括8-12nt(例如10nt)的单链非互补区域，优选所述单链非互补区域包括用于区分样本的条形码序列；

成环接头(b)包括两条部分互补配对的双链，所述双链两端配对形成双链结构，所述双链结构具有5’端磷酸修饰和3’端T粘性末端，优选所述双链包括8-12nt(例如10nt)的互补部分，作为区分样本的条形码序列。

在一个实施方案中，在3)中，所述成环接头为成环接头(a)，所述连接后的产物经过核酸外切酶消化，消化后产物经过一步纯化后得到环状文库。

在一个实施方案中，在3)中，所述成环接头为成环接头(b)，所述连接后的产物经过变性得到环状文库。

在一个实施方案中，所述环化后的单链环状文库进入后续的测序步骤，即经过滚环复制后形成核酸纳米球(DNB)进行核酸序列信息读取。

在另一方面，本发明提供了一种环化文库构建的成环接头，所述成环接头为不完全配对且两端具有5’端突出的双链，所述成环接头的5’端突出与待环化片段的3’端突出互补。

在一个实施方案中，所述待环化片段的3’端突出和所述成环接头的5’端突出长度为1-5nt，例如3nt或2nt，优选1nt。

在一个实施方案中，所述待环化片段的3’端突出为A，所述成环接头的5’端突出为T。

在一个实施方案中，所述不完全配对的双链包括在一条链上有缺口或者所述双链间有非匹配区。

在一个实施方案中，所述双链间包括两段非匹配区，所述两段非匹配区之间包括用于区分样本的的条形码序列。

在一个实施方案中，所述成环接头包括如下的成环接头(a)或成环接头(b)：

本发明通过特别设计的接头实现了环化文库的一步成环。本发明通过对打断DNA片段的末修复和加A处理形成末端的A粘性末端，在与特别设计的接头T粘性末端互补形成环化结构，在连接酶的作用下完成缝隙处的连接。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对附图作简单地介绍。显而易见地，下面描述中的附图仅仅涉及本发明的一些实施例。

图1示出了成环接头(a)的示意图：A为文库最终成环结构的序列信息，上部分为插入片段信息，下部分为接头序列信息，下划线序列信息为条形码信息；B、C和D为建库流程示意图。

图2示出了成环接头(b)的示意图：A为文库最终成环结构的序列信息，上部分为插入片段信息，下部分为接头序列信息，下划线非斜体序列信息为条形码信息，下划线斜体序列为特别设计条形码信息互补序列，下划线序列信息形成回文序列；B、C和D为建库流程示意图。

图3示出了以成环接头(a)进行实验的GC覆盖度信息(A)，以成环接头(b)进行的实验的GC覆盖度信息(B)。

具体实施方式

下面对本发明进行清楚、完整地描述。显然，所描述的实施方案仅仅是本发明的一部分实施方案，而不是全部的实施方案。基于本发明中的实施方案，本领域普通技术人员可以获得的所有其他实施方案，并且它们都属于本发明保护的范围。除非另有定义，本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的，不旨在于限制本发明。

本发明解决了基于MGI传统建库方式(包括基因组DNA打断、打断DNB片段末修和末端加A、接头连接、PCR扩增、单链分离环化等步骤)中存在的建库时间长、操作简便性低和纯化损失的问题。针对现有技术中存在的问题，发明人从原理上进行改进，改变了通过常规加接头、扩增再进行环化的方式，设计了具有独特序列结构的连接接头，实现了接头连接和产物成环融合为一步反应，优化了反应体系和纯化步骤，大大缩短了构建环化文库的时间。

如图1所示，对于成环接头(a)，A示出了文库最终成环结构的序列信息，上部分示出插入片段，下部分示出接头序列，下划线的序列表示条形码(barcode)序列；B、C和D示意性示出了建库流程。成环接头(a)由一条核酸长链和两条核酸短链互补配对而成，这种结构使得在成环后可以对两条核酸短链所在的链进行消化。所述成环接头长度是84bp，两条核酸短序列之间的相隔10bp。核酸长链5’端和在接头端的短链的5’具有磷酸修饰，互补形成的双链DNA接头结构为3’多出T脱氧核苷酸的粘性末端，优选在接头中间有10bp为用于区分的单链条形码序列。双链DNA接头结构3’多出T脱氧核苷酸的粘性末端与打断DNA双链片段的3’多出A脱氧核苷酸的粘性末端互补配对后，可以通过连接酶进行连接。连接成环后，可以对所述连接产物进行消化产生单链文库或者直接进行DNB。

如图2所示，对于成环接头(b)，A为文库最终成环结构的序列信息，上部分为插入片段信息，下部分为接头序列信息，下划线非斜体序列信息为条形码信息，下划线斜体序列为特别设计条形码信息互补序列，下划线序列信息形成回文序列；B、C和D示意性示出了建库流程。成环接头(b)由两条核酸长链互补配对而成，5’端具有磷酸修饰，互补形成的双链DNA接头结构为3’多出T脱氧核苷酸的粘性末端且接头中间存在非互补序列而形成∞的结构。所述成环接头长度是93bp，中间存在非互补序列而形成∞的结构的作用是可以是形成的环状接头的正反义链均可以在测序中被测得，同时减少接头二聚体的形成。非互补序列的长度为34bp，双链DNA接头结构3’多出T脱氧核苷酸的粘性末端可以与打断DNA双链片段的3’多出A脱氧核苷酸的粘性末端互补配对后，通过连接酶进行连接。连接成环后，可以对所述连接产物变性产生单链文库进行DNB。

本发明的设计创新在于环化接头的设计构造，针对双链DNA完成文库的构建，利用AT连接，序列设计适配MGI测序仪器。相较于传统的建库序列，往往需要在片段的两端连接双接头，而本发明的连接接头可以同时连接到片段的两端从而实现利用连接反应进行一步成环。利用本发明的环化接头跳过了传统建库的PCR和环化反应，于此同时也省略了纯化步骤，因此大大降低了整个建库流程的操作时间。同时每一步的反应保证在同一管中连续进行，避免了转管的操作和过程中的损失，最后进行一步纯化后产出环化文库。

提供以下实施例是为了更好地理解本发明。下述实施例中的试验方法，如无特殊说明，均为常规方法。下述实施例中所用的试验材料，如无特殊说明，均为自常规化试剂商店购买所得。应注意，上文的发明内容部分以及下文的详细描述仅为具体阐释本发明之目的，无意于以任何方式对本发明进行限制。在不背离本发明的精神和主旨的情况下，本发明的范围由随附的权利要求书确定。

实施例

实施例中使用的成环接头的序列如下：

成环接头(a)

长链a：

5’-AGTCGGAGGCCAAGCGGTCTTAGGAAGACAAxxxxxxxxxxCAACTCCTTGGCTCACAGAACGACATGGCTACGATCCGACTT-3’，xxxxxxxxxx为条形码序列(SEQ ID NO.1)

短链1：5’-AGTCGGATCGTAGCCATGTCGTTCTGTGAGCCAAGGAGTTG-3’(SEQ ID NO.2)

短链2：5’-TTGTCTTCCTAAGACCGCTTGGCCTCCGACTT-3’(SEQ ID NO.3)成环接头(b)

长链b：

5’-AGTCGGAGGCCAAGCGGTCTTAGGAAGACAAxxxxxxxxxxYYYYYYYYYYCAACTCCTTGGCTCACAGAACGACATGGCTACGATCCGACTT-3’(SEQ ID NO.4)，xxxxxxxxxx为条形码序列,YYYYYYYYYY为条形码互补序列。

这里成环接头(b)的两条链都为长链b，即成环接头(b)的两端的匹配区和非匹配区互为镜像，中间的匹配区为回文序列。

接头退火操作：

订购后的接头使用TE回溶到100μM的浓度后，

对于成环接头(a)，按照以下配方稀释后室温静置30分钟。合成10μM成环接头(a)：

长链a(100μM)	10μL
短链1(100μM)	10μL
短链2(100μM)	10μL
5×STE buffer	20μL
水	50μL
总计	100μL

对于成环接头(b)，按照以下配方稀释后室温静置30分钟。合成10μM成环接头(b)：

长链b(100μM)	20μL
5×STE buffer	20μL

水	60μL
总计	100μL

来源：

1、基因组DNA打断：基因组DNA打断有多种方式，无论是物理超声法还是酶反应法，市场上有非常成熟的方案，本实施例采用的是物理超声打断法。

取96孔PCR板一块，加入一根聚四氟乙烯线，加入提取的基因组DNA 1μg，加入TE缓冲溶液或无酶水补齐80μl，将板封膜后至于E210超声打断仪上超声打断。

打断条件设置如下：

填充系数	20％
剧烈度	5
脉冲系数	200
打断时间	35×4次

2、打断片段选择：可以采用磁珠纯化法或凝胶回收法，本实施例采用磁珠纯化法。取打断后的DNA，加入80μl Ampure XP磁珠，混匀后放置7-15min；置入磁力架后收集上清，在上清中加入40μl Ampure XP磁珠，混匀后放置7-15min；置入磁力架吸去上清，用75％乙醇洗磁珠两次；晾干后加入50μl TE缓冲溶液或无酶水，混匀后放置7-15min溶解回收产物。

3、末端修复加A：取上步骤回收产物100ng，补充TE体积至40μL按下表配制体系：配制如下表所示的反应混合液：

试剂名称	体积
无核酸酶的水	2.1μL
10×PNK缓冲液	5μL
5:1 dATP:dNTP	0.6μL
Klenow片段	0.1μL
rTaq	0.2μL
T4 DNA聚合酶	2μL
总量	10μL

立即加入10μL末端修复反应液到40μl打断产物中，并进行以下反应。反应条件如下表所示：

处理条件	时间
37℃	30min
65℃	15min
4℃	∞

4、接头连接：反应结束，立即加入5μL成环接头(a)或成环接头(b)，接头浓度为10μM。同时配制接头连接混合液，如下表：

试剂名称	体积
10×PNK缓冲液	3μL
100mM ATP	0.8μL
无核酸酶的水	3.6μL
50％PEG8000	16μL
T4 DNA连接酶	1.6μL
总量	25μL

向末端修复产物加入适量接头之后，加入25μL接头连接混合液并进行以下反应。反应条件如下表所示：

处理条件	时间
23℃	30min
4℃	∞

5、反应结束采用2×磁珠纯化，最终回溶于20μL TE溶液中。

6、DNB的制备和测序：具体的操作步骤可以参考MGI测序试剂盒说明书。以双链文库制备DNB。初步上机分析测序结果如下，以成环接头(a)进行实验的GC覆盖度信息如图3中A所示，以成环接头(b)进行实验的GC覆盖度信息如图3中B所示。

成环接头(a)

样本名	成环接头a
过滤后读长数	1076236
过滤后碱基数(Mb)	161.44
过滤后比例(％)	52.62
比对率(％)	11.1

特异性比率(％)	98.26
重复数据率(％)	0.83
错配比例(％)	3.5

成环接头(b)

样本名	成环接头b
过滤后读长数	16709122
过滤后碱基数(Mb)	1754.46
过滤后比例(％)	38.24
比对率(％)	50.65
特异性比率(％)	98.1
重复数据率(％)	1.9
错配比例(％)	1.86

结果分析：所有成环接头从原理上实现了针对现有技术的问题，改变了通过常规加接头、扩增再进行环化的方式，实现了接头连接和产物成环融合为一步反应，大大缩短了构建环化文库的时间。建库后的产物为环化产物，经过DNB制备后，可以直接上级测序，测序结果分析后可以发现：所有接头均可以成功建库测序，测序后的结果虽然数据上表现不是最好，但是本实验目的为验证接头设计在实验中的可行性和提供一定的示范例。因此实验数据结果很好的证明了本发明的接头设计重复满足发明需求并具有一定的可实施性。

以上应用了具体实例对本发明进行阐述，只是用于帮助理解本发明，并不用以限制本发明。对于本发明所属技术领域的技术人员，依据本发明的思想，还可以做出若干简单推演、变形或替换。

Claims

一种环化文库构建方法，所述方法包括：

1)将DNA序列打断成片段；

2)使所述打断的片段的两端3’端突出；

3)利用成环接头将所述3’端突出的片段环化形成环状文库，所述成环接头为不完全配对且两端具有5’端突出的双链，所述成环接头的5’端突出与所述打断的片段的3’端突出互补。
根据权利要求1所述的方法，所述打断的片段的3’端突出为A，所述成环接头的5’端突出为T。
根据权利要求2所述的方法，在2)中，将所述打断的片段经外切酶、聚合酶和T4多聚核苷酸激酶的处理成5’磷酸化且3’多出A脱氧核苷酸的粘性末端。
根据权利要求1-3任一项所述的方法，在3)中，所述不完全配对的双链包括在一条链上有缺口或者所述双链间有非匹配区。
根据权利要求4所述的方法，在3)中，所述双链间包括两段非匹配区，所述两段非匹配区之间包括用于区分样本的条形码序列。
根据权利要求1-4任一项所述的方法，在3)中，所述成环接头包括如下的成环接头(a)或成环接头(b)：

成环接头(a)包括一条长链和与所述长链两端配对的两条短链，所述长链5’端具有磷酸修饰,与所述长链3’端互补配对的短链的5’端具有磷酸修饰，互补形成的双链接头具有3’端T粘性末端，并包括8-12nt(例如10nt)的单链非互补区域，优选所述单链非互补区域包括用于区分样本的条形码序列；

成环接头(b)包括两条部分互补配对的双链，所述双链两端配对形成双链结构，所述双链结构具有5’端磷酸修饰和3’端T粘性末端，优选所述双链包括8-12nt(例如10nt)的互补部分，作为区分样本的条形码序列。
根据权利要求6所述的方法，在3)中，所述成环接头为成环接头(a)，所述连接后的产物经过核酸外切酶消化，消化后产物经过一步纯化后得到环状文库；或者，所述成环接头为成环接头(b)，所述连接后的产物经过变性得到环状文库。
一种构建环化文库的成环接头，所述成环接头为不完全配对且两端具有5’端突出结构的双链，所述成环接头5’端突出与待环化片段的3’端突出互补。
根据权利要求8所述的成环接头，所述不完全配对的双链包括在一条链上有缺口或者所述双链间有非匹配区；优选地，所述双链间包括两段非匹配区，所述两段非匹配区之间包括用于区分样本的条形码序列。
根据权利要求8或9所述的成环接头，所述成环接头包括如下的成环接头(a)或成环接头(b)：

成环接头(a)包括一条长链和与所述长链两端配对的两条短链，所述长链5’端具有磷酸修饰,与所述长链3’端互补配对的短链的5’端具有磷酸修饰，互补形成的双链接头具有3’端T粘性末端，并包括8-12nt(例如10nt)的单链非互补区域，优选所述单链非互补区域包括用于区分样本的条形码序列；

成环接头(b)包括两条部分互补配对的双链，所述双链两端配对形成双链结构，所述双链结构具有5’端磷酸修饰和3’端T粘性末端，优选所述双链包括8-12nt(例如10nt)的互补部分，作为区分样本的条形码序列。