CN111005075A

CN111005075A - 用于双样本共建测序文库的y型接头和双样本共建测序文库的方法

Info

Publication number: CN111005075A
Application number: CN201911329765.9A
Authority: CN
Inventors: 刘运超; 赵静波; 方楠; 王晓璐; 伍启熹; 王建伟; 刘倩; 唐宇
Original assignee: Beijing Usci Biotechnology Co ltd
Current assignee: Beijing Usci Biotechnology Co ltd
Priority date: 2019-12-20
Filing date: 2019-12-20
Publication date: 2020-04-14
Anticipated expiration: 2039-12-20
Also published as: CN111005075B

Abstract

本发明公开了一种用于双样本共建测序文库的Y型接头和双样本共建测序文库的方法。其中，第一Y型接头包括：第一序列包括依次连接的P5、i5、SP1和N1序列；第二序列包括依次连接的L1和N1c序列；第二Y型接头包括：第三序列包括依次连接的P7、i7、SP2和N2序列；第四序列包括依次连接的L2和N2c序列；L1、L2、N1、N1c、N2和N2c均与illumina接头序列及人基因组序列不同且不互补；N1与N1c互补，N2与N2c互补，且N1与N2和N2c不同且不互补；L1的3’端和L2的5’端序具有互补区域。应用本发明的技术方案，可以使两个单独建库的样本连接到一起形成一个文库并正常测序。

Description

用于双样本共建测序文库的Y型接头和双样本共建测序文库的方法

技术领域

本发明涉及生物医学技术领域，具体而言，涉及一种用于双样本共建测序文库的Y型接头和双样本共建测序文库的方法。

背景技术

作为基因检测临床转化最为成熟的项目，无创产前检测的方法多种多样：如NGS(Next Generation Sequencing)法、多重PCR法、探针法、数字PCR法和芯片法等等，其中多重PCR 法、探针法、数字PCR法和芯片法等方法具有成本低、周期短、灵敏度高等优点，尤其是多重PCR法、芯片法和数字PCR法近年来在检测通量上有了很大提高，但仍无法达到NGS法检测的通量。目前关于这些方法的研究文章较多，也有一些专利文献，但尚未大规模应用。实际临床应用中，普遍采用的还是NGS法。

其中，NGS法检测主要包含两个部分：文库构建和高通量测序。

文库构建包括：对无创产前检测样本的游离DNA(cfDNA)进行末端修复得到末端被修复的cfDNA，再通过加A反应在双链DNA的3’端添加一个碱基A用于后续连接反应；接着对修复加A后的cfDNA进行接头的连接，这一过程是为了将测序平台对应的接头添加到cfDNA片段的两端便于后续测序；最后，再对连接产物进行扩增富集来达到检测量的需求。目前，对该常规建库流程的改进方法较多，主要集中于对单个样本建库方式(如接头方案、环化扩增等)的改进，目的是为了提高建库效率。

高通量测序方面，无创产前样本目前主要采取的是SE35、SE50或SE75策略，即单端35bp、 50bp或75bp读长测序，数据量一般为5M Reads，平均测序深度约为0.1×。然而，从测序成本方面考虑，单端测序的成本一般高于双端测序，且样本通量不高。以NextSeq 500为例，单次检测样本数量最高只有96个，在样本检测需求量大的应用场景中局限性较大。如果无创产前检测在较高通量的测序平台上(如illumina HiSeq X-ten或NovaSeq 6000)使用双端测序(PE 测序)，检测样本数量可以提高，单位数据量的成本也可以得到一定的降低，但同时由于分析只需要单端测序数据，造成了另一端数据的浪费。

发明内容

本发明旨在提供一种用于双样本共建测序文库的Y型接头和双样本共建测序文库的方法，以提高测序数据的利用率。

为了实现上述目的，根据本发明的一个方面，提供了一种用于双样本共建测序文库的Y 型接头。该Y型接头包括：第一Y型接头和第二Y型接头，其中，第一Y型接头包括：第一序列，包括依次连接的P5、i5、SP1和N1序列，其中，依次连接的P5、i5和SP1即为illumina Y型接头中包含P5的单链核苷酸序列；第二序列，包括依次连接的L1和N1c序列；第二Y 型接头包括：第三序列，包括依次连接的P7、i7、SP2和N2序列，其中，依次连接的P7、i7 和SP2即为illumina Y型接头中包含P7的单链核苷酸序列；第四序列，包括依次连接的L2 和N2c序列；其中，L1、L2、N1、N1c、N2和N2c均与illumina接头序列及人基因组序列不同且不互补；N1与N1c互补，N2与N2c互补，且N1与N2和N2c不同且不互补；L1的3’ 端和L2的5’端序具有互补区域。

进一步地，L1的3’端和L2的5’端序具有15～25bp的互补区域。

进一步地，N1、N1c、N2和N2c的长度为10～20bp。

进一步地，L1的3’端和L2的5’端序具有20bp的互补区域。

进一步地，第一序列和第四序列的3’末端添加碱基T和硫代修饰，第二序列和第三序列的5’末端做磷酸化修饰。

进一步地，第一序列具有如SEQ ID NO：1所示的核苷酸序列，第二序列具有如SEQID NO：2所示的核苷酸序列，第三序列具有如SEQ ID NO：3所示的核苷酸序列，以及第四序列具有如SEQ ID NO：4所示的核苷酸序列。

根据本发明的另一个方面，提供一种双样本共建测序文库的方法。该方法包括以下步骤：分别采用不同的接头对两个待测样本进行单样本建库，得到第一测序文库和第二测序文库，其中，用于第一测序文库和第二测序文库构建的接头中具有能够通过PCR扩增将第一测序文库和第二测序文库连接在一起的序列；将第一测序文库和第二测序文库混合，通过PCR扩增将第一测序文库和第二测序文库连接在一起得到双样本测序文库。

进一步地，用于第一测序文库和第二测序文库构建的接头中具有互补序列，通过重叠延伸PCR法将第一测序文库和第二测序文库连接在一起。

进一步地，采用上述任一种用于双样本共建测序文库的Y型接头进行双样本共建测序文库。

进一步地，方法包括：S1，分别采用第一Y型接头和第二Y型接头对两个待测样本进行单样本建库，得到第一测序文库和第二测序文库；S2，将第一测序文库和第二测序文库混合，通过重叠延伸PCR法将第一测序文库和第二测序文库连接在一起得到双样本测序文库。

进一步地，S1包括：接头连接步骤，对其中一个待测样本连接第一Y型接头，对另一个待测样本连接第二Y型接头；以及扩增步骤，采用具有P5和L1序列的引物对对连接有第一 Y型接头的待测样本进行扩增，得到第一测序文库，采用具有P7和L2序列的引物对对连接有第二Y型接头的待测样本进行扩增，得到第二测序文库。

进一步地，具有P5序列的引物具有如SEQ ID NO：5所示的核苷酸序列，具有L1序列的引物具有如SEQ ID NO：6所示的核苷酸序列，具有P7序列的引物具有如SEQ ID NO：7 所示的核苷酸序列，具有L2序列的引物具有如SEQ ID NO：8所示的核苷酸序列。

应用本发明的技术方案，可以构建一种双样本测序文库，使两个单独建库的样本连接到一起形成一个文库并正常测序，这样基于双端测序策略(如PE50、PE75、PE100等)的原理，合理利用双端测序数据，在相对较低的测序成本下，能够有效提高样本检测通量、进一步降低单个样本双端测序的成本，可应用于更为广泛的测序场景中。

附图说明

构成本申请的一部分的说明书附图用来提供对本发明的进一步理解，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。在附图中：

图1中的A示出了illuminaY型接头，图1中的B和C示出了根据本发明一典型实施方式的用于双样本共建测序文库的Y型接头结构示意图；

图2A和图2B示出了根据本发明一典型实施方式的采用本发明的用于双样本共建测序文库的Y型接头进行双样本分别构建测序文库的流程示意图；

图3示出了根据本发明一典型实施方式的采用本发明的用于双样本共建测序文库的Y型接头进行双样本共建测序文库的流程示意图；

图4A和图4B示出了在本发明另一典型实施方式的用于双样本单建测序文库的接头结构示意图及建库流程示意图；

图5示出了实施例1中Y5接头单建库片段大小分布结果示意图；

图6示出了实施例1中Y7接头单建库片段大小分布结果示意图；以及

图7示出了实施例1中Y5和Y7接头共建库片段大小分布结果示意图。

具体实施方式

需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。

正如本发明背景技术中记载的，现有NIPT建库和测序技术存在成本较高且浪费测序数据和未能有效利用双端测序的数据的技术问题。为了解决这些技术问题，本发明提出了下列技术方案。

根据本发明一种典型的实施方式，提供一种双样本共建测序文库的方法。该方法包括以下步骤：分别采用不同的接头对两个待测样本进行单样本建库，得到第一测序文库和第二测序文库，其中，用于第一测序文库和第二测序文库构建的接头中具有能够通过PCR扩增将第一测序文库和第二测序文库连接在一起的序列；将第一测序文库和第二测序文库混合，通过 PCR扩增将第一测序文库和第二测序文库连接在一起得到双样本测序文库。

将两个样本的文库连接到一起，使之可以在illumina二代测序平台正常测序和分析，而将两个片段连接到一起的方案有很多种，比如直接连接法、PCR连接法和重组置换连接法等。优选的，用于第一测序文库和第二测序文库构建的接头中具有互补序列，通过重叠延伸PCR 法将第一测序文库和第二测序文库连接在一起。通过重叠延伸PCR的方法来连接两个样本的文库，该方法具有操作简便、成本低等优点。

典型的，本发明可以通过设计一种新的Y型接头序列，作为桥梁来连接两个样本的测序文库，该接头需不影响文库的产量，不影响illumina二代测序平台的测序过程，不影响测序结果的分析过程。优选的，如图1所示(图1中第一个接头(A示出的接头)为illuminaY型接头，第二、三个接头(B和C示出的接头)则分别为本发明的第一Y型接头和第二Y型接头)，根据本发明一种典型的实施方式，提供一种用于双样本共建测序文库的Y型接头。该Y型接头包括第一Y型接头和第二Y型接头，其中，第一Y型接头包括第一序列和第二序列，第一序列包括依次连接的P5、i5、SP1和N1序列，其中，依次连接的P5、i5和SP1即为illumina Y型接头中包含P5的单链核苷酸序列；第二序列包括依次连接的L1和N1c序列；第二Y型接头包括第三序列和第四序列，第三序列包括依次连接的P7、i7、SP2和N2序列，其中，依次连接的P7、i7和SP2即为illumina Y型接头中包含P7的单链核苷酸序列；第四序列包括依次连接的L2和N2c序列；其中，L1、L2、N1、N1c、N2和N2c均与illumina接头序列及人基因组序列不同且不互补；N1与N1c互补，N2与N2c互补，且N1与N2和N2c不同且不互补；L1的3’端和L2的5’端序具有互补区域。

上述方案的目的是将两个无创产前检测样本分别建库，使之分别带有P5和P7端的barcode，再连接到一起进行双端测序。这种使用双端barcode建库并结合上述双样本共建库的方法，可以有效利用双端测序的特点，使第一测序文库和第二测序文库的数据都能被用于无创产前检测的分析，增加一倍的可用数据；另外，使用双端barcode建库并结合上述双样本共建库的方法，可以将双端barcode分别标记两个样本，达到增加样本检测数量和节省barcode 的目的。

在上述技术方案中，为了实现P5端和P7端分别连接到不同样本的需求，本发明设计了两条新的序列：第二序列和第四序列。分别与第一序列(P5端接头序列)和第三序列(P7端接头序列)退火，形成“P5&L1”和“P7&L2”两种新的Y型接头，为了后续描述方便，我们将退火后形成的新的Y型接头简称为Y5和Y7接头(具体结构示意图见图1中B和C)，采用该接头分别建库和共建库原理见图2A、图2B和图3。

L1、L2、N1、N1c、N2和N2c均与illumina接头序列及人基因组序列不同且不互补，防止了共建库时造成非特异连接及对测序结果造成影响；L1的3’端和L2的5’端序列有15～25bp (优选20bp)的互补区域，用于两个样本文库的连接；N1和N2序列长度为10～20bp，N1与N1c互补，N2与N2c互补，且N1与N2和N2c不同且不互补，防止共建库时造成非特异连接。

第一序列和第四序列的3’末端添加碱基T和硫代修饰，用来与加A后的DNA片段配对连接，第二序列和第三序列的5’末端做磷酸化修饰，用来提高连接效率。

根据本发明一种典型的实施方式，优选地，第一序列具有如SEQ ID NO：1 (5’-aatgatacggcgaccaccgagatctacacccttgtagacactctttccctacacgacgctcttccgatctcataaatcaac*t-3’)所示的核苷酸序列，第二序列具有如SEQ ID NO：2(5’Phos -gttgatttatgagatgcaggccaagcggtcttagtctgacagc-3’)所示的核苷酸序列，第三序列具有如SEQ ID NO：3(5’Phos-caagcagaagacggcatacgagatccttggaagtgactggagttcagacgtgtgctcttccgatctccttggctcac -3’)所示的核苷酸序列，以及第四序列具有如SEQ ID NO：4(5’ -gtgagccaaggagctgtcagactaagaccgcttggcctgcatc*t-3’)所示的核苷酸序列。

在本发明一实施例中，具体的，S1包括：接头连接步骤，对其中一个待测样本连接第一 Y型接头，对另一个待测样本连接第二Y型接头；以及扩增步骤，采用具有P5和L1序列的引物对对连接有第一Y型接头的待测样本进行扩增，得到第一测序文库，采用具有P7和L2 序列的引物对对连接有第二Y型接头的待测样本进行扩增，得到第二测序文库。

优选地，具有P5序列的引物具有如SEQ ID NO：5(5’-aatgatacggcgaccacc-3’)所示的核苷酸序列，具有L1序列的引物具有如SEQ ID NO：6(5’-caagcagaagacggcata-3’)所示的核苷酸序列，具有P7序列的引物具有如SEQ ID NO：7(5’-gctgtcagactaagaccg-3’)所示的核苷酸序列，具有L2序列的引物具有如SEQ ID NO：8(5-gtgagccaaggagctgtc-3’)所示的核苷酸序列。

典型的，用于第一测序文库和第二测序文库构建的接头中具有互补序列，通过重叠延伸 PCR法将第一测序文库和第二测序文库连接在一起。优选的，采用上述任一种用于双样本共建测序文库的Y型接头进行双样本共建测序文库。在本发明一实施例中，双样本共建测序文库的方法包括：S1，分别采用第一Y型接头和第二Y型接头对两个待测样本进行单样本建库，得到第一测序文库和第二测序文库；S2，将第一测序文库和第二测序文库混合，通过重叠延伸PCR法将第一测序文库和第二测序文库连接在一起得到双样本测序文库。

根据本发明一种典型的实施方式，将Y型接头的两条单链分别用无核酸酶水稀释到100 μM，按照如下表1所示比例配制退火反应液：

表1

试剂	体积
		单链引物1	5μL
单链引物2	5μL
		STE缓冲液(品牌：Solarbio货号：T1110))	15μL
总计	25μL

配制好的退火反应液涡旋10s，瞬时离心3s，置于PCR仪上，按照如下表2所示退火程序运行：

表2

温度	时间	降温速率
			95℃	10min	5％
70℃	10min	5％
			65℃	10min	5％
55℃	10min	5％
			50℃	10min	5％
25℃	10min

退火后产物涡旋10s，瞬时离心3s，冻存于-20℃备用。

·工作浓度

退火后的接头母液为20μM，需稀释50倍后用于连接反应。

本发明中用于实现单建库的接头采用了Y型接头，Y型接头的优势在于所有连接产物都可以被用来扩增富集；此Y型接头也可以采用完全互补的两种双链接头代替，但是其连接产物中有效产物的量只有50％。

典型的，在单建库时，每一个文库都需要使用两种序列完全互补的接头，如：完全互补的双链P5接头+完全互补的L1接头可以替代Y5接头；完全互补的双链L2接头+完全互补的P7接头可以替代Y7接头(见图4A和图4B)。

下面将结合实施例进一步说明本发明的有益效果，以下实施例中如果有没有明确描述的步骤或试剂，均可采用本领域的常规技术手段或常规试剂实现。

实施例1

1.两个样本分别单独建库(单建库)：

为了实现双样本共建库，首先需要对两个样本(具体无创产前检测样本，即孕妇血浆游离DNA)，建库Y型接头(Y5接头：第一序列具有如SEQ ID NO：1所示的核苷酸序列，第二序列具有如SEQ ID NO：2所示的核苷酸序列；Y7接头：第三序列具有如SEQ ID NO：3 所示的核苷酸序列，第四序列具有如SEQ ID NO：4所示的核苷酸序列)进行单独建库，本实施例中单独建库使用的是KAPA Hyper Prep Kit，流程如下：

(1)末端修复&加A反应

将末端修复缓冲液置于室温融化彻底后，涡旋10s，瞬时离心3s；按照下表3配制末端修复反应液：

表3

试剂	体积
		DNA sample(DNA样本)	50μL
End-repair&A-tailing buffer(末端修复&加A缓冲液)	7μL
		End-repair&A-tailing Enzyme Mix(末端修复&加A酶混合液)	3μL
总计	60μL

配好末端修复反应液后，涡旋10s，瞬时离心3s，放入PCR仪，按照下表4程序进行末端修复反应(PCR仪器热盖温度70℃)；

表4

(2)接头连接

末端修复反应结束后，从PCR仪中拿出样本，按紧PCR管盖，涡旋10s，瞬时离心3s；

按下表5配制连接反应液：

表5

配制好的连接反应液涡旋10s,瞬时离心3s，置于PCR仪上，20℃温浴30min；

注意：

对于将要进行共建库的两个样本，分别使用Y5和Y7接头进行连接，Y5和Y7接头的barcode应选取一个UDI接头中对应的两种barcodes；

(3)连接产物纯化

a.连接反应结束后，将连接产物转移到1.5mL的离心管中，加入0.8倍体积(88μL)的室温平衡30min的AMPure XP磁珠，涡旋5s，室温放置5min；

b.短时离心，将离心管置于磁力架上，静置3min直至溶液变澄清；

c.小心吸取离心管中的上清并丢弃，枪头避免碰触磁珠；

d.保持离心管在磁力架上，加入200μL 80％乙醇；

e.静置30s待磁珠沉降后，吸除乙醇；

f.重复步骤d-e一次；

g.室温晾干，直至离心管中残留的乙醇完全挥发；

注意：磁珠不要过于干裂，否则易造成回收效率降低；

h.加入22μL Nuclease-free Water，votex混匀5s，室温放置5min；

i.短时离心，将管子放在磁力架上，静置约2min至溶液变澄清；

j.吸取20μL上清到一个新的PCR管中。

(4)PCR扩增和纯化

在上一步的PCR管中，按下表6配制PCR反应液：

表6

配好后涡旋10s，瞬时离心3s，放入PCR仪，按照下表7中的程序进行扩增：

表7

PCR反应结束后，按下述方案对PCR产物进行纯化：

a.将PCR产物转移到1.5mL的离心管中，加入1倍体积(50μL)的室温平衡30min的AMPure XP磁珠，涡旋5s，室温放置5min；

c.小心吸取离心管中的上清并丢弃，枪头避免碰触磁珠；

d.保持离心管在磁力架上，加入200μL 80％乙醇；

e.静置30s待磁珠沉降后，吸除乙醇；

f.重复步骤d-e一次；

g.室温晾干，直至离心管中残留的乙醇完全挥发；

注意：磁珠不要过于干裂，否则易造成回收效率降低；

h.加入22μL Nuclease-free Water，votex混匀5s，室温放置5min；

j.吸取20μL上清到一个新的离心管中，标记好名称(Y5/Y7端，barcode编号等)。

(5)单建库结果质检

取1μL单建库结果用Qubit 3.0进行浓度测定，浓度大于等于5ng/μL视为建库合格，否则需重新建库；

取适量文库用Agilent 2100或相似片段分析仪器进行文库大小质检，文库主峰应该在 280-320bp左右。

2.两个样本文库的连接(共建库)

(1)PCR连接&扩增

取准备共建库的两个单建库样本文库各50ng，建库Y型接头(Y5接头：第一序列具有如 SEQ ID NO：1所示的核苷酸序列，第二序列具有如SEQ ID NO：2所示的核苷酸序列；Y7接头：第三序列具有如SEQ ID NO：3所示的核苷酸序列，第四序列具有如SEQ ID NO：4所示的核苷酸序列)，按照下表8配制共建库反应液：

表8

试剂	体积
		2×KAPA HiFi Hotstart ReadyMix	25μL
KAPA Primer Mix	5μL
		单文库1	50ng
单文库2	50ng
		无核酸酶水	To 50μL
总计	50μL

配好后涡旋10s，瞬时离心3s，放入PCR仪，按照下表9中的程序进行扩增：

表9

(2)扩增产物纯化

PCR反应结束后，按下述方案对PCR产物进行纯化：

a.将PCR产物转移到1.5mL的离心管中，加入0.7倍体积(35μL)的室温平衡30min的AMPure XP磁珠，涡旋5s，室温放置5min；

c.小心吸取离心管中的上清并丢弃，枪头避免碰触磁珠；

d.保持离心管在磁力架上，加入200μL 80％乙醇；

e.静置30s待磁珠沉降后，吸除乙醇；

f.重复步骤d-e一次；

g.室温晾干，直至离心管中残留的乙醇完全挥发；

注意：磁珠不要过于干裂，否则易造成回收效率降低；

h.加入22μL Nuclease-free Water，votex混匀5s，室温放置5min；

j.吸取20μL上清到一个新的离心管中，标记好共建库信息。

本实施例中的两个样本分别使用Y5和Y7接头进行单建库和共建库，上机测序，对测序结果的R1和R2数据(NGS双端测序数据包括两部分，分别是R1(reads1)端数据和R2(reads2) 端数据)分别分析并计算Z值。

单建库结果见表10，图5和图6：

表10

样本编号	起始量	接头	PCR循环数	文库产量
					T1	5ng	Y5	8	432ng
T2	5ng	Y7	8	386ng

共建库结果见表11和图7：

表11

样本编号	起始量	PCR循环数	文库产量
				T1&T2	各50ng	7	1880ng

分析结果见表12和13：

表12

样本数据	Q30	GC％
			R1(T1)	94.6％	40.79％
R2(T2)	93.8％	41.19％

R1和R2数据均可以正常拆分，且质控(Q30和GC％)合格，计算Z值也正常。

表13

从以上的描述中，可以看出，本发明上述的实施例实现了如下技术效果：

1)设计了一种新的成对的接头Y5和Y7，可以分别用于两个样本的单文库构建，同时建好的文库可以用过Y5和Y7接头中的L1和L2序列进行连接，形成双样本文库；

2)建立了一种通过PCR连接两个文库的方法，实验操作简便，成本较低；

3)双样本共建库后，每个样本对应标记了双端barcode中的一种barcode，可以有效利用双端测序的优势，使测序结果中R1和R2的reads都可以被有效利用，节省了测序成本；

4)NovaSeq 6000等高通量测序平台单条lane数据产量约为800-10000G，如将来获批用于检测无创产前样本这种数据需求较小(约1-3G)的文库，barcode数量可能不够，本发明将用于一个样本的双端barcode(UDI)分别标记两个样本，在增加样本检测数量的同时，提高了barcode的利用率。

以上所述仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

序列表

<110> 北京科迅生物技术有限公司

<120> 用于双样本共建测序文库的Y型接头和双样本共建测序文库的方法

<130> PN115044YXYX

<160> 8

<170> SIPOSequenceListing 1.0

<210> 1

<211> 82

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221> primer_bind

<222> (1)..(82)

<223> 第一序列

<220>

<221> modified_base

<222> (82)..(82)

<223> 硫代修饰

<400> 1

aatgatacgg cgaccaccga gatctacacc cttgtagaca ctctttccct acacgacgct 60

cttccgatct cataaatcaa ct 82

<210> 2

<211> 43

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221> primer_bind

<222> (1)..(43)

<223> 第二序列

<220>

<221> modified_base

<222> (1)..(1)

<223> 磷酸化修饰

<400> 2

gttgatttat gagatgcagg ccaagcggtc ttagtctgac agc 43

<210> 3

<211> 77

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221> primer_bind

<222> (1)..(77)

<223> 第三序列

<220>

<221> modified_base

<222> (1)..(1)

<223> 磷酸化修饰

<400> 3

caagcagaag acggcatacg agatccttgg aagtgactgg agttcagacg tgtgctcttc 60

cgatctcctt ggctcac 77

<210> 4

<211> 44

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221> primer_bind

<222> (1)..(44)

<223> 第四序列

<220>

<221> modified_base

<222> (44)..(44)

<223> 硫代修饰

<400> 4

gtgagccaag gagctgtcag actaagaccg cttggcctgc atct 44

<210> 5

<211> 18

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221> primer_bind

<222> (1)..(18)

<223> 具有P5序列的引物

<400> 5

aatgatacgg cgaccacc 18

<210> 6

<211> 18

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221> primer_bind

<222> (1)..(18)

<223> 具有L1序列的引物

<400> 6

caagcagaag acggcata 18

<210> 7

<211> 18

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221> primer_bind

<222> (1)..(18)

<223> 具有P7序列的引物

<400> 7

gctgtcagac taagaccg 18

<210> 8

<211> 18

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221> primer_bind

<222> (1)..(18)

<223> 具有L2序列的引物

<400> 8

gtgagccaag gagctgtc 18

Claims

1.一种用于双样本共建测序文库的Y型接头，其特征在于，包括：第一Y型接头和第二Y型接头，其中，所述第一Y型接头包括：

第一序列，包括依次连接的P5、i5、SP1和N1序列，其中，依次连接的所述P5、所述i5和所述SP1即为illumina Y型接头中包含P5的单链核苷酸序列；

第二序列，包括依次连接的L1和N1c序列；

所述第二Y型接头包括：

第三序列，包括依次连接的P7、i7、SP2和N2序列，其中，依次连接的所述P7、所述i7和所述SP2即为illumina Y型接头中包含P7的单链核苷酸序列；

第四序列，包括依次连接的L2和N2c序列；

其中，所述L1、所述L2、所述N1、所述N1c、所述N2和所述N2c均与illumina接头序列及人基因组序列不同且不互补；所述N1与所述N1c互补，所述N2与所述N2c互补，且所述N1与所述N2和所述N2c不同且不互补；所述L1的3’端和所述L2的5’端序具有互补区域。

2.根据权利要求1所述的Y型接头，其特征在于，所述L1的3’端和所述L2的5’端序具有15～25bp的互补区域。

3.根据权利要求1所述的Y型接头，其特征在于，所述N1、所述N1c、所述N2和所述N2c的长度为10～20bp。

4.根据权利要求2所述的Y型接头，其特征在于，所述L1的3’端和所述L2的5’端序具有20bp的互补区域。

5.根据权利要求1所述的Y型接头，其特征在于，所述第一序列和所述第四序列的3’末端添加碱基T和硫代修饰，所述第二序列和所述第三序列的5’末端做磷酸化修饰。

6.根据权利要求1所述的Y型接头，其特征在于，所述第一序列具有如SEQ ID NO：1所示的核苷酸序列，所述第二序列具有如SEQ ID NO：2所示的核苷酸序列，所述第三序列具有如SEQ ID NO：3所示的核苷酸序列，以及所述第四序列具有如SEQ ID NO：4所示的核苷酸序列。

7.一种双样本共建测序文库的方法，其特征在于，包括以下步骤：

分别采用不同的接头对两个待测样本进行单样本建库，得到第一测序文库和第二测序文库，其中，用于所述第一测序文库和所述第二测序文库构建的接头中具有能够通过PCR扩增将所述第一测序文库和所述第二测序文库连接在一起的序列；

将所述第一测序文库和所述第二测序文库混合，通过PCR扩增将所述第一测序文库和所述第二测序文库连接在一起得到双样本测序文库。

8.根据权利要求7所述的方法，其特征在于，用于所述第一测序文库和所述第二测序文库构建的接头中具有互补序列，通过重叠延伸PCR法将所述第一测序文库和所述第二测序文库连接在一起。

9.根据权利要求8所述的方法，其特征在于，采用如权利要求1至6中任一项所述的用于双样本共建测序文库的Y型接头进行双样本共建测序文库。

10.根据权利要求9所述的方法，其特征在于，所述方法包括：

S1，分别采用第一Y型接头和第二Y型接头对两个待测样本进行单样本建库，得到第一测序文库和第二测序文库；

S2，将第一测序文库和第二测序文库混合，通过重叠延伸PCR法将所述第一测序文库和所述第二测序文库连接在一起得到双样本测序文库。

11.根据权利要求10所述的方法，其特征在于，所述S1包括：

接头连接步骤，对其中一个待测样本连接所述第一Y型接头，对另一个待测样本连接所述第二Y型接头；以及

扩增步骤，采用具有P5和L1序列的引物对对连接有第一Y型接头的待测样本进行扩增，得到第一测序文库，采用具有P7和L2序列的引物对对连接有第二Y型接头的待测样本进行扩增，得到第二测序文库。

12.根据权利要求11所述的方法，其特征在于，所述具有P5序列的引物具有如SEQ IDNO：5所示的核苷酸序列，所述具有L1序列的引物具有如SEQ ID NO：6所示的核苷酸序列，所述具有P7序列的引物具有如SEQ ID NO：7所示的核苷酸序列，所述具有L2序列的引物具有如SEQ ID NO：8所示的核苷酸序列。