CN113502287A

CN113502287A - 分子标签接头及测序文库的构建方法

Info

Publication number: CN113502287A
Application number: CN202110721385.0A
Authority: CN
Inventors: 张核子; 巴颖; 程云阳; 卢晓萍; 操利超
Original assignee: Shenzhen Nuclear Gene Technology Co ltd
Current assignee: Shenzhen Nuclear Gene Technology Co ltd
Priority date: 2021-06-28
Filing date: 2021-06-28
Publication date: 2021-10-15

Abstract

本发明公开了分子标签接头和测序文库的构建方法。该分子标签接头包括第一接头和第二接头，第一接头包括：第一链，第一链包括从5′端依次的第一固定碱基序列、随机碱基序列和第一引物结合序列；第二链，第二链包括从5′端依次的第二固定碱基序列和碱基T；其中，第一链和第二链通过第一固定碱基序列和第二固定碱基序列的反向互补配对而结合；第二接头包括第二引物结合序列，第二引物结合序列与第一引物结合序列至少部分反向互补。采用该分子标签接头进行文库构建时，测序数据中没有互补链的聚簇的占比显著降低，有效聚簇的数量得到提高，达到了提高测序数据利用率、降低测序成本、提高检测灵敏度和测序深度的效果。

Description

分子标签接头及测序文库的构建方法

技术领域

本申请涉及测序技术领域，尤其是涉及分子标签接头及测序文库的构建方法。

背景技术

循环肿瘤DNA(circulating tumor DNA，ctDNA)是指坏死或凋亡的肿瘤细胞释放到外周血中的肿瘤DNA片段。由于ctDNA包含了肿瘤特异性的表观遗传信息，利用ctDNA来实时检测肿瘤状态以避免穿刺手术给患者带来的痛苦也就成为了一种可行的非侵入式检测方法。但是，肿瘤的异质性使得外周血中ctDNA的含量极少，其突变频率一般也在1％以下，属于低频突变。因此，ctDNA液体活检虽然是目前精准肿瘤学应用中的热点，但如何准确检测仍然是亟待解决的问题。

下一代基因测序技术(NGS)是目前应用最广的测序技术，具有测序深度高、通量大、准确率高、灵敏度好等优势，然而NGS应用于ctDNA低频突变检测同样存在一定的技术难点。一方面，NGS不可避免地存在测序误差，单碱基错误率一般在0.1～1％之间；而另一方面，测序文库构建一般使用高保真酶进行PCR扩增，也存在10^-6左右的复制错误率，并且随着PCR循环数增多而增大。这两方面的因素导致ctDNA低频突变测序分析时存在较大的背景噪音，特别是在0.1％及以下检测限的情况下，难以区分建库及测序过程中引入的错误与ctDNA本身的突变，容易出现假阳性结果。

目前，主要通过建库连接步骤，采用带有分子标签的接头，将待测核酸分子标记一个唯一可识别的序列编码，通过该唯一序列编码来区分真正的突变与建库及测序过程中引入的错误，实现低频突变的检测。带有分子标签的接头主要包括两类：一类是接头双链的随机碱基区域(用作分子标签)互补配对的，一类是接头双链的随机碱基区域不互补配对的。采用随机碱基区域互补配对的接头标记得到的最终测序数据，需要根据分子标签和起始位置进行互补双链的链间校正，随机碱基区域不互补配对的接头，同一模板DNA两条双链之间的分子标签没有对应关系，无法进行互补双链链间校正，而随机碱基区域互补配对的接头，可以进行链间校正。链间校正可以在链内校正的基础上进一步去除建库及测序过程引入的错误，识别原始模板携带极低频突变，提高ctDNA检测灵敏度。因而，选择能够进行链间校正的接头是提高检测准确性的有效方式。

链间校正时，需要来自同一原始DNA分子的两个聚簇同时存在，要求报证DNA双链同时被加上完整接头。然而现有的分子标签引入方法是在加接头时，直接连接上双链接头。因此，大量模板存在其中一条链连上完整接头、而另一条链没有完整接头的情况，这导致最终的测序数据中存在大量没有互补链聚簇的数据，占用了测序数据，影响了测序深度。

发明内容

本申请旨在至少解决现有技术中存在的技术问题之一。为此，本申请提出一种有效提高测序深度的分子标签接头。

本申请的第一方面，提供分子标签接头，该分子标签接头包括第一接头和第二接头，第一接头包括：

第一链，第一链包括从5′端依次的第一固定碱基序列、随机碱基序列和第一引物结合序列；

第二链，第二链包括从5′端依次的第二固定碱基序列和碱基T；

其中，第一链和第二链通过第一固定碱基序列和第二固定碱基序列的反向互补配对而结合；

第二接头包括第二引物结合序列，第二引物结合序列与第一引物结合序列至少部分反向互补。

根据本申请实施例的分子标签接头，至少具有如下有益效果：

采用该分子标签接头进行文库构建时，第一接头和第二接头必须报证连接上形成完整的接头才会开始第二轮的延伸与连接，而第一接头和第二接头的第一轮连接产物在第二轮连接失败时，其产物无法进入下一步扩增实验。从而使得测序数据中没有互补链的聚簇的占比显著降低，有效聚簇的数量得到提高，达到了提高测序数据利用率、降低测序成本、提高检测灵敏度和测序深度的效果。

在本申请的一些实施方式中，第一固定碱基序列和所述第二固定碱基序列的长度为6～12nt。

在本申请的一些实施方式中，第一固定碱基序列和所述第二固定碱基序列为任意碱基序列。其中，任意碱基序列是指对序列中碱基的种类和顺序无任何限定性要求。第一固定碱基序列和第二固定碱基序列作为任意碱基序列与随机碱基序列的区别在于，多个不同的分子标签接头的第一固定碱基序列和第二固定碱基序列为相同序列，而随机碱基序列作为分子标签在多个不同的分子标签接头中是不同的，从而在与DNA片段结合时，将不同的DNA片段区分开，使具有相同的随机碱基序列的归为同一聚簇。

在本申请的一些实施方式中，随机碱基序列的长度为8～16nt。

在本申请的一些实施方式中，第一引物结合序列包括从5′端依次的第三固定碱基序列和第四固定碱基序列。

在本申请的一些实施方式中，第二引物结合序列包括从5′端依次的第五固定碱基序列和第六固定碱基序列，第六固定碱基序列与第三固定碱基序列反向互补。

在本申请的一些实施方式中，第一引物结合序列为AGATCGGAAGAGCACACGTCTGAACTCCAGTCAC，第二引物结合序列为ACACTCTTTCCCTACACGACGCTCTTCCGATCT；或第一引物结合序列为AAGTCGGAGGCCAAGCGGTCTTAGGAAGACAA，第二引物结合序列为TTGTCTTCCTAAGGAACGACATGGCTACGATCCGACTT。

本申请的第二方面，提供试剂盒，该试剂盒包括上述的分子标签接头。该试剂盒包括但不限于建库试剂盒、检测试剂盒等。

本申请的第三方面，提供测序文库的构建方法，该构建方法包括以下步骤：

提供模板、前述的第一接头、第二接头和建库引物；

使第一接头和模板接触并相互连接，得到第一连接产物；

使第一连接产物与第二接头结合，并开始延伸反应，补齐随机碱基序列在第二链上的互补序列，形成第二连接产物；

使第二连接产物中的第二固定碱基序列变性脱落，继续延伸反应，补齐第一固定碱基序列在第二链上的互补序列，并与模板连接，形成第三连接产物；

使第三连接产物与建库引物接触，扩增得到测序文库。

在本申请的一些实施方式中，形成第二连接产物过程中的反应温度为10～30℃，形成第三连接产物过程中的反应温度为60～72℃。

本申请的第四方面，提供测序文库，该测序文库采用前述的构建方法构建得到。

本申请的第五方面，提供测序方法，该测序方法采用上述的测序文库进行测序。

本申请的第六方面，提供前述分子标签接头的制备方法，该制备方法包括合成第一接头的步骤，该步骤如下：

合成第一链和第二链；

将第一链和第二链退火，得到第一接头。

本申请的第七方面，提供前述分子标签接头在制备检测血浆中循环肿瘤DNA的试剂中的应用。

本申请的附加方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本申请的实践了解到。

附图说明

图1是本申请的一个实施例中的第一接头的示意图。

图2是本申请的一个实施例中的第二接头的示意图。

图3是本申请的一个实施例中的测序文库构建方法中第一连接产物的示意图。

图4是本申请的一个实施例中的测序文库构建方法中形成第二连接产物的过程示意图。

图5是本申请的一个实施例中的测序文库构建方法中形成第三连接产物的过程示意图。

具体实施方式

以下将结合实施例对本申请的构思及产生的技术效果进行清楚、完整地描述，以充分地理解本申请的目的、特征和效果。显然，所描述的实施例只是本申请的一部分实施例，而不是全部实施例，基于本申请的实施例，本领域的技术人员在不付出创造性劳动的前提下所获得的其他实施例，均属于本申请保护的范围。

下面详细描述本申请的实施例，描述的实施例是示例性的，仅用于解释本申请，而不能理解为对本申请的限制。

在本申请的描述中，若干的含义是一个以上，多个的含义是两个以上，大于、小于、超过等理解为不包括本数，以上、以下、以内等理解为包括本数。如果有描述到第一、第二只是用于区分技术特征为目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量或者隐含指明所指示的技术特征的先后关系。

本申请的描述中，参考术语“一个实施例”、“一些实施例”、“示意性实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不一定指的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

参考图1，示出了本申请一个实施例中分子标签接头的第一接头的第一链的示意图，第一链包括从5′端起依次的第一固定碱基序列A1、随机碱基序列A2和第一引物结合序列，第二链包括从5′端起依次的第二固定碱基序列B1和突出的碱基T。其中，第一固定碱基序列A1和第二固定碱基序列B1反向互补，从而使第一链和第二链相互结合。在其中一些具体的实施方式中，第一固定碱基序列和第二固定碱基序列的长度为6～12nt，而对于第一固定碱基序列和第二固定碱基序列的碱基种类和具体序列不做要求。在其中一些具体的实施方式中，随机碱基序列的长度为8～16nt，同样，不对其碱基种类和具体序列做特定要求。可以理解的是，在采用上述方案进行建库时，随机碱基序列在第一接头中作为分子标签使用，用于区分与分子标签接头连接的不同的DNA片段。在本申请的具体实施方式中，分子标签接头还包括第二接头，第二接头上包含第二引物结合序列，第二引物结合序列能够与第一引物结合序列至少部分反向互补从而结合。

在其中一些具体实施方式中，第一接头的制备过程包括合成第一链和第二链，然后使第一链和第二链发生退火从而形成双链接头。退火温度和退火反应体系可以根据本领域的常识获得。显然，相比于现有的接头按随机碱基序列不同和组合，逐一合成退火，该制备方法无需单独额外的退火引物，操作简单，成本较低；而相比于合成包含随机碱基区域、内切酶识别位点、固定碱基区域的单链，再用反向引物延申形成随机碱基区域互补的双链接头的方法仅需合成与退火两个步骤即可完成接头制备，操作简单，且可用于双轮(单链链内、互补双链链间)校正。

参考图2，为本申请的一些具体实施方式中的第二接头的示意图，结合图1，在其中一些具体实施方式中，第一引物结合序列包括从5′端起依次的第三固定碱基序列A3和第四固定碱基序列A4，第二引物结合序列包括从5′端起依次的第五固定碱基序列B4和第六固定碱基序列B3，第六固定碱基序列B3与第三固定碱基序列A3反向互补，从而可以使第一接头与第二接头相互连接。在其中一些具体实施方式中，第三固定碱基序列和第六固定碱基序列的长度为8～13nt，第四固定碱基序列的长度为21～24nt，而第五固定碱基序列的长度为20～30nt。第一引物结合序列和第二引物结合序列(或称为测序引物相关序列，readprimer site)根据不同的测序平台而有不同的要求。例如，对于Illumina平台而言，第三固定碱基序列可以是：AGATCGGAAGAGC，第四固定碱基序列可以是：ACACGTCTGAACTCCAGTCAC，即第一引物结合序列可以是AGATCGGAAGAGCACACGTCTGAACTCCAGTCAC；第五固定碱基序列可以是：ACACTCTTTCCCTACACGAC，第六固定碱基序列可以是：GCTCTTCCGATCT，即第二引物结合序列可以是ACACTCTTTCCCTACACGACGCTCTTCCGATCT。对于MGI平台而言，第三固定碱基序列可以是：AAGTCGGA，第四固定碱基序列可以是：GGCCAAGCGGTCTTAGGAAGACAA，即第一引物结合序列为AAGTCGGAGGCCAAGCGGTCTTAGGAAGACAA(SEQ ID No.3)；第五固定碱基序列可以是：TTGTCTTCCTAAGGAACGACATGGCTACGA，第六固定碱基序列可以是：TCCGACTT，即第二引物结合序列为TTGTCTTCCTAAGGAACGACATGGCTACGATCCGACTT(SEQ ID No.4)。但本申请实施例中的第一引物结合序列和第二引物结合序列不限于上述测序平台的序列，其它如ion torrent等也可以选择符合其要求的序列作为对应的引物结合序列参与上述分子标签接头以及测序文库的构建。

参考图3～图5，示出了使用该分子标签接头的建库方法，具体步骤为：

第一步连接反应：将模板DNA与第一接头连接，从而使模板DNA的两端都连接有第一接头，得到第一连接产物。

第二步连接反应：使第一连接产物与第二接头结合，并开始延伸反应，补齐随机碱基序列在第二链上的互补序列，形成第二连接产物；使第二连接产物中的第二固定碱基序列变性脱落，继续延伸反应，补齐第一固定碱基序列在第二链上的互补序列，并与模板连接，形成第三连接产物；

使第三连接产物与建库引物接触，扩增得到测序文库。

参考图3，为第一步连接反应得到的第一连接产物的示意图，在模板DNA的两端分别各连接有第一接头。可以理解的是，模板DNA与第一接头连接的反应需要提供相应的连接酶和合适的反应条件。其中，模板DNA可以是指从样本中直接或间接分离得到的DNA，并且在连接反应前，经过片段化、末端修复和加A等常规步骤处理。

参考图4，为第二步连接反应中形成第二连接产物的反应过程的示意图，第一连接产物和第二接头通过第三固定碱基序列A3与第六固定碱基序列B3的反向互补配对而结合，使第二接头进入到第二连接产物的第二链上，并开始延伸反应，补齐第一固定碱基序列A2在第二链上的互补序列，即在第二链上产生分子标签，形成第二连接产物。可以理解的是，第一连接产物与第二接头的结合和延伸反应需要提供相应的酶和合适的反应条件。

参考图5，为第二步连接反应中形成第三连接产物的反应过程的示意图，第二连接产物中的第二固定碱基序列B1变性脱落(如图5中的a)，随后继续延伸反应，补齐第一固定碱基序列A1在第二链上的互补序列(如图5中的b)，并与模板连接(如图5中的c)，形成第三连接产物。在其中一些具体实施方式中，第二接头通过反向互补配对进入到第二连接产物的第二链上，最终形成的第三连接产物上为Y字型的分子标签接头。

可以理解的是，第二固定碱基序列B1的变性脱落、延伸和连接反应需要提供相应的酶和合适的反应条件。

在其中一些具体实施方式中，形成第一连接产物以及形成第二连接产物过程中的反应温度为10～30℃，形成第三连接产物过程中的反应温度为60～72℃，以使第二固定碱基序列B1能够变性脱落并进一步延伸和连接。而所选择的连接酶、聚合酶等酶需要在上述温度范围内具有良好的反应活性。

在本申请的一些具体实施方式中，还提供一种测序文库，该测序文库采用上述方法构建得到。

在本申请的一些具体实施方式中，还提供一种测序方法，该测序方法采用上述的测序文库进行测序，得到相应的测序数据。在其中一些具体实施方式中，对测序数据采用本领域熟知的一些方法进行生物信息学分析，具体可以是：根据测序数据质量值，过滤掉低质量值的数据，得到高质量值的数据；与人的基因组序列进行比对，去掉比对不上和同时比对到人基因组两个以上位置的数据，得到唯一比对的数据；与探针杂交区域比对，得到目标区域数据。

在其中一些具体实施方式中，目标区域数据的校正方法为双重校正，具体步骤如下：

①根据测序序列的分子标签以及在染色体上的起始位置，将测序数据进行聚簇，分子标签、起始位置一致，测序方向一致，则来自同一原始DNA模板的同一条DNA单链，存在3条以上满足此条件的序列，归集为一个聚簇；

②一个聚簇内的测序数据，由于来源于同一条DNA单链，理论上序列完全一致，进行单链链内校正；

③分子标签、起始位置一致，且测序方向相反所对应的两个聚簇，为来自于同一原始DNA分子互补配对的两条不同DNA单链，理论上序列完全一致，测序方向相反，可进一步进行双链链间校正，以进一步去除建库及测序过程引入的错误，识别原始模板携带极低频突变，提高检测灵敏度；而进行两轮校正后的测序数据进行变异分析；对变异数据进行解读，从而得出样本中目标基因实际的突变情况。

而在采用本申请所提供的分子标签接头进行建库时，第一轮连接后，在第二步连接反应中，包括第一连接产物与第二接头结合延伸形成第二连接产物、进一步延伸形成第三连接产物两个步骤，只有在第一连接产物与第二接头连接形成互补链的情况下，才能进行第二部分的进一步延伸与连接。而没有连接第二接头形成完整的分子标签接头导致第二轮连接失败时，无法与建库引物发生扩增反应建库。从而可以使测序数据中，没有互补链的聚簇的占比显著降低，有效聚簇的数量得到提高，达到提高测序数据利用率、降低测序成本、提高检测灵敏度的效果。

实施例1

本实施例提供一种分子标签接头，该分子标签接头包括第一接头和第二接头，第一接头包括第一链和第二链，第一链、第二链和第二接头的序列如表1所示：

表1.分子标签接头序列

第一链中，CGTCGGA为第一固定碱基序列，NNNNNNNN为随机碱基序列，AGATCGGAAGAGC为第三固定碱基序列，ACACGTCTGAACTCCAGTCAC为第四固定碱基序列，5′Phos表示5′磷酸化修饰；3′端无羟基。

第二链中，TCCGACG为第二固定碱基序列，与第一固定碱基序列反向互补，3′端无羟基。

第二接头中，ACACTCTTTCCCTACACGAC为第五固定碱基序列，GCTCTTCCGATCT为第六固定碱基序列，第六固定碱基序列和第三固定碱基序列反向互补，3′端有羟基。

第一接头的制备方法如下：

按照表2配置接头退火反应体系，取配好的反应体系，按表3程序进行退火。

表2.接头退火反应体系

10mM Tris，50mM NaCl，1mM EDTA	20μl
		第一链(100μM)	15μl
第二链(100μM)	15μl
		H<sub>2</sub>O	50μl
总体积	100μl

表3.退火程序

序号	温度	时间	步骤
				1	95℃	2分钟	变性
2	每30秒下降0.5℃至20℃	60分钟	退火
				3	4℃	保持	暂存

实施例2

本实施例提供一种血浆DNA测序文库，该测序文库的构建方法如下：

1)血浆DNA提取

取3mL血浆，使用QIAamp Circulating Nucleic Acid Kit(货号：55114)提取血浆DNA，60μl洗脱，取3μl样本，使用Qubit^TM1X dsDNA HS Kit(货号：Q33230)进行定量。

2)末端修复和加A

取步骤1)中定量后的血浆DNA，按表4配制末端修复和加A的反应体系后，按表5中的程序进行末端修复和加A。

表4.末端修复和加A反应体系

血浆DNA	35μl
		10×TA Buffer	5μl
T4 DNA聚合酶	1μl
		Klenow酶	0.5μl
T4 DNA PNK	1μl
		Taq酶	1μl
10mM dNTP	1μl
		100mM dATP	1μl
H2O	4.5μl
		总体积	50μl

表5.末端修复和加‘A’程序

序号	温度	时间
			1	20℃	30分钟
2	65℃	30分钟
			3	4℃	保持

3)连接反应1

取步骤2)的反应产物以及实施例1中退火得到的第一接头，按照表6配制得到连接反应1体系后，按表7程序进行连接反应1，使得加A后的双链模板DNA的两端分别连接上第一接头，得到第一连接产物。

表6.连接反应1体系

表7.连接反应1程序

序号	温度	时间
			1	20℃	15分钟
2	4℃	保持

4)磁珠纯化

取步骤3)中的第一连接产物和AMPure XP(货号：A63882)50μl，进行磁珠纯化，洗脱至32μl，得到纯化后的第一连接产物。

5)连接反应2

取步骤5)中纯化后的第一连接产物和实施例1中的第二接头，按照表8配制连接反应2体系后，按表9程序进行连接反应2。其中，20℃条件下，第一连接产物与第二接头通过第三固定碱基序列和第六固定碱基的反向互补配对而结合，使第二接头位于第一连接产物的第二链上，在T4 DNA聚合酶作用下开始延伸反应，补齐第一链中随机碱基序列在第二链上的互补序列，形成第二连接产物。65℃条件下，第二连接产物中的第二链上的第二固定碱基序列变性脱落，在Kapa Hifi高保真酶的作用下，第二链进一步延伸，补齐第一固定碱基序列在所述第二链上的互补序列，同时，延伸完成后在Taq DNA连接酶的作用下与模板连接，形成第三连接产物。

表8.连接反应2体系

步骤4)纯化产物	30μl
		10×连接缓冲液	4μl
第二接头(10uM)	5μl
		T4 DNA聚合酶	1μl
Kapa Hifi高保真酶	1μl
		Taq DNA连接酶	3μl
总体积	40μl

表9.连接反应2程序

6)磁珠纯化

取步骤5)中的第三连接产物和AMPure XP(货号：A63882)50μl，进行磁珠纯化，洗脱至22μl，得到纯化后的第三连接产物。

7)PCR扩增

取步骤6)中纯化后的第三连接产物以及建库引物对、按照表10中配制PCR反应体系，并根据表11中的程序进行扩增得到扩增产物。

表10.PCR反应体系

步骤6)纯化产物	20μl
		2×Kapa Hifi Mix	25μl
建库上游引物(10μM)	2.5μl
		建库下游引物(10μM)	2.5μl
总体积	50μl

表11.PCR程序

建库上游引物和建库下游引物分别如下所示：

AATGATACGGCGACCACCGAGATCTACACNNNNNNNNACACTCTTTCCCTACACGAC(SEQ IDNo.4)；其中，3′端有羟基；NNNNNNNN为文库标签2(Index5)，用于数据拆分，区分不同文库；

CAAGCAGAAGACGGCATACGAGATNNNNNNNNGTGACTGGAGTTCAGACGTGT(SEQ ID No.5)；其中，3′端有羟基；NNNNNNNN为文库标签1(Index7)，用于数据拆分，区分不同文库。

8)纯化及定量

取步骤7)中的PCR扩增产物与AMPure XP(货号：A63882)50μl，进行磁珠纯化，洗脱至22μl，得到纯化后的扩增产物。

9)杂交捕获及测序

取步骤8)中纯化后的扩增产物，进行杂交捕获，进行二轮扩增后得到测序文库，测序文库经检测合格后使用Illumina高通量测序平台上机测序。

10)生信分析

将测序得到的数据，按照生物信息学分析流程进行分析。

对比实验

分别取实施例2和对比例1所提供的建库和测序方法进行实验，不同样本截取同等原始测序深度15000×，生信分析中，进行双向分子标签校准，统计双向分子标签平均深度。

其中，对比例1为KAPA HyperPrep试剂盒，是目前血浆DNA建库最好的商业化试剂盒，KAPA HyperPrep试剂盒建库严格按照说明书进行。

最终结果如表12所示：

表12.不同双向分子标签测序方法平均深度(DS Family)

血浆DNA投入量	5ng	10ng	20ng
				实施例2	387	768	865
对比例1	356	521	456

由表12中的结果可知，本申请实施例所提供的方案可显著提高双向分子标签平均深度，并且受血浆DNA投入量的影响。在15000×原始测序深度下，在投入量为5ng时，数据量饱和，相对于对比例1，本发明方案提高DS Family不明显；在投入量为10ng时，实施例2的方案可明显提高DS Family；在投入量为20ng时，由于数据量不够，对比例1建库相对10ng时反而降低了DS Family，而实施例2的方案依旧可以进一步提高DS Family。所以，本申请所提供的分子标签接头和建库方法可以显著改善数据利用率，提高检测灵敏度。

上面结合实施例对本申请作了详细说明，但是本申请不限于上述实施例，在所属技术领域普通技术人员所具备的知识范围内，还可以在不脱离本申请宗旨的前提下作出各种变化。此外，在不冲突的情况下，本申请的实施例及实施例中的特征可以相互组合。

SEQUENCE LISTING

<110> 深圳市核子基因科技有限公司

<120> 分子标签接头及测序文库的构建方法

<130> 1

<160> 4

<170> PatentIn version 3.5

<210> 1

<211> 49

<212> DNA

<213> 人工序列

<220>

<221> misc_feature

<222> (8)..(15)

<223> n =a或g或c或t

<400> 1

cgtcggannn nnnnnagatc ggaagagcac acgtctgaac tccagtcac 49

<210> 2

<211> 33

<212> DNA

<213> 人工序列

<400> 2

acactctttc cctacacgac gctcttccga tct 33

<210> 3

<211> 32

<212> DNA

<213> 人工序列

<400> 3

aagtcggagg ccaagcggtc ttaggaagac aa 32

<210> 4

<211> 38

<212> DNA

<213> 人工序列

<400> 4

ttgtcttcct aaggaacgac atggctacga tccgactt 38

Claims

1.分子标签接头，其特征在于，包括第一接头和第二接头，所述第一接头包括：

第一链，所述第一链包括从5′端依次的第一固定碱基序列、随机碱基序列和第一引物结合序列；

第二链，所述第二链包括从5′端依次的第二固定碱基序列和碱基T；

其中，所述第一链和所述第二链通过所述第一固定碱基序列和所述第二固定碱基序列的反向互补配对而结合；

所述第二接头包括第二引物结合序列，所述第二引物结合序列与所述第一引物结合序列至少部分反向互补；

优选的，所述第一固定碱基序列和所述第二固定碱基序列的长度为6～12nt；

优选的，所述第一固定碱基序列和所述第二固定碱基序列为任意碱基序列；

优选的，所述随机碱基序列的长度为8～16nt。

2.根据权利要求1所述的分子标签接头，其特征在于，所述第一引物结合序列包括从5′端依次的第三固定碱基序列和第四固定碱基序列。

3.根据权利要求2所述的分子标签接头，其特征在于，所述第二引物结合序列包括从5′端依次的第五固定碱基序列和第六固定碱基序列，所述第六固定碱基序列与所述第三固定碱基序列反向互补。

4.根据权利要求3所述的分子标签接头，其特征在于，所述第一引物结合序列为AGATCGGAAGAGCACACGTCTGAACTCCAGTCAC，所述第二引物结合序列为ACACTCTTTCCCTACACGACGCTCTTCCGATCT；或所述第一引物结合序列为AAGTCGGAGGCCAAGCGGTCTTAGGAAGACAA，所述第二引物结合序列为TTGTCTTCCTAAGGAACGACATGGCTACGATCCGACTT。

5.试剂盒，其特征在于，包括权利要求1至4任一项所述的分子标签接头。

6.测序文库的构建方法，其特征在于，包括以下步骤：

提供模板、建库引物和权利要求3或4所述的分子标签接头；

使第一接头和所述模板接触并相互连接，得到第一连接产物；

使所述第一连接产物与第二接头结合，并开始延伸反应，补齐随机碱基序列在第二链上的互补序列，形成第二连接产物；

使所述第二连接产物中的第二固定碱基序列变性脱落，继续延伸反应，补齐第一固定碱基序列在所述第二链上的互补序列，并与所述模板连接，形成第三连接产物；

使所述第三连接产物与建库引物接触，扩增得到测序文库；

优选的，形成所述第二连接产物过程中的反应温度为10～30℃，形成所述第三连接产物过程中的反应温度为60～72℃。

7.测序文库，其特征在于，采用权利要求6所述的构建方法构建得到。

8.测序方法，其特征在于，采用权利要求7所述的测序文库进行测序。

9.权利要求1所述分子标签接头的制备方法，其特征在于，包括合成第一接头的步骤，所述步骤如下：

合成第一链和第二链；

将所述第一链和所述第二链退火，得到所述第一接头。

10.权利要求1至4任一项所述的分子标签接头在制备检测血浆中循环肿瘤DNA的试剂中的应用。