CN112795990B

CN112795990B - 一种灵活多变的降低污染及pcr偏倚的多标签二代测序文库接头

Info

Publication number: CN112795990B
Application number: CN201911112475.9A
Authority: CN
Inventors: 李英镇; 徐祖元; 吴红龙
Original assignee: Shenzhen Huada Medical Laboratory; Bgi Guangzhou Medical Laboratory Co ltd; BGI Shenzhen Co Ltd
Current assignee: Shenzhen Huada Medical Laboratory; Bgi Guangzhou Medical Laboratory Co ltd; BGI Shenzhen Co Ltd
Priority date: 2019-11-14
Filing date: 2019-11-14
Publication date: 2024-03-22
Anticipated expiration: 2039-11-14
Also published as: CN112795990A

Abstract

本发明公开了一种灵活多变的降低污染及PCR偏倚的多标签二代测序文库接头。本发明提供了接头，由DNA单链A(5’端到3’端依次为前导区、随机标签、固定区、标签1和引物1结合区)和DNA单链B(5’端到3’端依次为固定区1、引物2结合区、固定区2、标签2和前导区)退火形成。本发明能为二代测序的DNA文库加入多个标签序列，大大提高样本间的分辨率。同时能为每个插入片段加入唯一序列，可识别原始插入片段及PCR复制子。因此本发明能解决病原微生物筛查中由于单标签污染导致的假阳性以及突变检测中的由于PCR扩增导致的突变比例偏移。所有本发明在病原微生物检测、肿瘤基因检测、单基因病检测等领域均具有较大的应用价值。

Description

一种灵活多变的降低污染及PCR偏倚的多标签二代测序文库接头

技术领域

本发明涉及高通量测序领域，具体涉及一种灵活多变的降低污染及PCR偏倚的多标签二代测序文库接头。

背景技术

目前两大测序平台生产商华大智造及illumina在文库接头构造上均使用单标签的构造形式，里面包含特定的通用序列和1个标签序列。该构造形式无法区分原始文库及PCR扩增带入的重复子，另外受限于接头合成工艺，接头间存在1⁰/₀₀₀左右的污染，因此单标签在病原微生物及基因突变检测应用上会出现假阳性的问题。

如illumina公司的Y字型接头，经过PCR后文库在一端接头靠外区域带有一个标签(如图1所示)。再如现有的双标签接头，在illumina Y字型接头的基础上再加入一个标签2，经过PCR后文库在一端接头靠外区域保留标签1外插入片段两端均增加了一个标签2(如图2所示)。再如华大智造公司的半弧形接头，经过PCR后文库在一端接头靠外区域带有一个标签(如图3所示)。这些接头均存在弊端，具体如下：图1和图3所示接头均只有单个标签，不能区分原始插入片段与PCR扩增子，不能有效降低由于合成工艺导致的假阳性；图2所示接头能有效降低合成工艺导致的假阳性，但不能区分原始插入片段与PCR扩增子；另外，这些接头种类少。

发明内容

针对上述技术问题，本发明旨在提供一种接头，使其能区分原始插入片段与PCR扩增子、解决由合成工艺导致的接头污染、提高接头种类。

第一方面，本发明要求保护一种接头。

本发明所要求保护的接头由DNA单链A和DNA单链B退火形成；

所述DNA单链A由5’端到3’端依次由前导区A、随机标签、固定区、标签1和引物1结合区组成；

所述DNA单链B由5’端到3’端依次由固定区1、引物2结合区、固定区2、标签2和前导区B组成；

所述DNA单链B中的所述固定区1和所述固定区2分别能够与所述DNA单链A中的所述固定区靠近3’端和靠近5’端的部分反向互补；所述DNA单链B中的所述引物2结合区与所述DNA单链A中的所述固定区不匹配(形成半弧形)；

所述DNA单链B中的所述前导区B与所述DNA单链A中的所述前导区A反向互补，且所述前导区A的5’末端核苷酸经磷酸化修饰，所述前导区B的3’末端多出一个游离的核苷酸T。

进一步地，所述随机标签为若干个连续的N组成的寡核苷酸，每个N均为A、T、C或G。所述标签1、所述标签2、所述前导区A和所述前导区B为核苷酸序列可变的区域，可根据自己的需求设计不同的序列。

前导区的作用有三个，一是为接头与双链结构的插入片段提供双链与双链连接的结构，二是前导区相同的A链和B链可以任意组合形成标签1和标签2不同的多种组合。三是不同的前导区可以丰富测序检测过程中碱基的平衡性，提高测序质量。

在实际操作中，由于所述DNA单链B中的所述标签2为特定序列，所述DNA单链A中的所述随机标签为随机序列，因此两者匹配的概率较低(匹配上的概率为0.25^6＝0.0244％)，但不排除能匹配上。所述DNA单链B中的所述标签2与所述DNA单链A中的所述随机标签是否匹配上对本发明无影响。

更进一步地，在所述DNA单链A中，所述前导区A的长度可为6-9nt；所述随机标签的长度可为6-10nt；所述固定区的长度可为27-37nt；所述标签1的长度可为6-10nt；所述引物1结合区的长度可为15-23nt。

更进一步地，在所述DNA单链B中，所述固定区1的长度可为10-18nt；所述引物2结合区的长度可为15-23nt；所述固定区2的长度可为5-12nt；所述标签2的长度可为6-10nt；所述前导区B的长度可为6-10nt。

更加具体地，在所述DNA单链A中，所述前导区A的长度具体可为7nt；所述随机标签的长度具体可为6nt；所述固定区的长度具体可为32nt；所述标签1的长度具体可为10nt；所述引物1结合区的长度具体可为17nt。

更加具体地，在所述DNA单链B中，所述固定区1的长度具体可为13nt；所述引物2结合区的长度具体可为17nt；所述固定区2的长度具体可为8nt；所述标签2的长度具体可为6nt；所述前导区B的长度具体可为8nt。

在本发明的具体实施方式中，所述引物1结合区的核苷酸序列如SEQ ID No.1所示；所述引物结合区2的核苷酸序列如SEQ ID No.2所示；所述固定区的核苷酸序列如SEQID No.3所示。

在本发明的具体实施方式中，所述固定区1的核苷酸序列为SEQ ID No.3的第20-32位的反向互补序列；所述固定区2的核苷酸序列为SEQ ID No.3的第1-8位的反向互补序列。

所述DNA单链A的结构示意图如图4所示；所述DNA单链B的结构示意图如图5所示；所述接头的结构示意图如图6所示。

在前导区互补的情况下所述DNA单链A和所述DNA单链B可以随机组合，因此n种标签1和m种标签2可以组合成n×m种接头。

第二方面，本发明要求保护接头前体。

本发明所要求保护的接头前体具体为由未经退火的前文所述DNA单链A和所述DNA单链B组成。

第三方面，本发明要求保护二代测序DNA文库的构建方法。

本发明所要求保护的二代测序DNA文库的构建方法，可包括如下步骤：将前文所述接头与末端加A的若干待测序插入片段连接，然后以连接产物为模板，利用引物1和引物2进行PCR扩增，得到所述二代测序DNA文库(三标签文库)，两端的接头一端带有所述标签2，另外一端带有所述标签1和所述随机标签，如图7所示。

所述引物1与前文所述引物1结合区反向互补；所述引物2的序列与前文所述引物2的序列一致。

由本发明构建的文库，适用于华大自主的测序平台(如利用深圳华大智造科技有限公司生产的“BGISEQ-500RS高通量测序试剂盒(PE100)”或“MGISEQ-2000RS高通量测序试剂盒(PE100)”完成)，将文库变性后使用与引物1和引物2结合区互补的单链将文库环化，然后按正常的测序流程进行测序即可。

第四方面，本发明要求保护二代测序方法。

本发明所要求保护的二代测序方法，可包括如下步骤：

(B1)按照前文第三方面所述方法构建得到二代测序DNA文库；

(B2)将所述二代测序DNA文库变性后进行环化(如图8所示)；

(B3)使用测序引物1进行一链测序，从5’到3’端依次为所述标签2，所述前导区B和所述插入片段；完成一链测序后使用测序引物2进行二链测序，从5’到3’端依次为所述随机标签，所述前导区A和所述插入片段的反向互补序列；最后使用标签1测序引物对所述标签1进行测序。

进一步地，步骤(B3)可使用深圳华大智造科技有限公司生产的“BGISEQ-500RS高通量测序试剂盒(PE100)”或“MGISEQ-2000RS高通量测序试剂盒(PE100)”进行。

第五方面，本发明要求保护对利用前文第四方面所述二代测序方法所得下机数据进行分析的方法。

本发明所要求保护的对利用前文第四方面所述二代测序方法所得下机数据进行分析的方法，可包括如下步骤：下机数据先根据所述标签1进行拆分，reads1从5’端到3’端依次包含所述标签2、所述前导区B和所述插入序列，reads2从5’端到3’端依次包含所述随机标签、所述前导区A和所述插入片段的反向互补序列；然后通过所述标签2对下机reads进行归类以降低单标签由于合成工艺或标签跳转导致的假阳性；通过所述随机标签对下机reads进行归类以区分原始插入片段与PCR扩增子。

接头的双链DNA由合成商合成两条单链通过退火制备而成。根据行业的标准合成商合成单链最高的纯度大于99％(HPLC)，另外合成商在生产的过程中往往会多个单链同时生产，因此存在交叉污染的情况：例如标签A1链污染了标签A2链后使用A1链退火生产的接头会带有A2链的信息标签(即A1接头里污染了A2接头)，当使用A1和A2接头分别对样本B1和B2进行标记时B1样本会带有A1和A2的接头，最终导致样本B1的信息被划分到B2样本中导致B2样本的假阳性。根据发明人测试的结果由于合成工艺问题导致的单标签污染率约为千分之一到万分之一不等。若引入双标签即可以将这个污染率降低到十万分之一到百万分之一。标签跳转(index hopping)发生在文库PCR环节，由于PCR嵌合体导致的标签错配，前期的研究数据发现大约为1-6％，双标签的设置能将标签跳转率降低到万分之一以下。

随机标签N10(NNNNNNNNNN)种类大概有4¹⁰种，出现同一种序列的概率较低。由于DNA是半保留复制，所以随机标签一致的reads为PCR扩增出来的重复子，随机标签不一致的reads为原始插入片段。

第六方面，本发明要求保护如下任一应用：

(C1)前文所述接头在作为测序文库接头中的应用；

(C2)前文所述接头在作为二代测序文库接头中的应用；

(C3)前文所述接头前体在制备前文所述接头中的应用；

(C4)前文所述接头前体在制备测序文库接头中的应用；

(C5)前文所述接头前体在制备二代测序文库接头中的应用；

(C6)前文所述接头或所述接头前体在构建测序文库中的应用；

(C7)前文所述接头或所述接头前体在构建二代测序文库中的应用；

(C8)前文所述接头或所述接头前体或所述二代测序DNA文库的构建方法在进行二代测序中的应用；

(C9)前文所述接头或所述接头前体或所述二代测序DNA文库的构建方法或所述二代测序方法或对下机数据的分析方法在解决病原微生物筛查中由于单标签污染导致的假阳性和/或突变检测中的由于PCR扩增导致的突变比例偏移问题中的应用；

(C10)前文所述接头或所述接头前体或所述二代测序DNA文库的构建方法或所述二代测序方法或对下机数据的分析方法在病原微生物检测、肿瘤基因检测或单基因病检测中的应用。

在本发明的一个具体实施方式中，所述接头为接头DB1、接头DB2、接头DB3、接头DB4、接头DB5或接头DB6；

所述接头DB1由DNA单链一01和DNA单链二01-1退火形成；

所述接头DB2由DNA单链一01和DNA单链二01-2退火形成；

所述接头DB3由DNA单链一02和DNA单链二01-1退火形成；

所述接头DB4由DNA单链一02和DNA单链二01-2退火形成；

所述接头DB5由DNA单链一03和DNA单链二03退火形成；

所述接头DB6由DNA单链一04和DNA单链二04退火形成；

所述DNA单链一01的核苷酸序列如SEQ ID No.4所示，且5’末端核苷酸经磷酸化修饰；

所述DNA单链一02的核苷酸序列如SEQ ID No.5所示，且5’末端核苷酸经磷酸化修饰；

所述DNA单链一03的核苷酸序列如SEQ ID No.6所示，且5’末端核苷酸经磷酸化修饰；

所述DNA单链一04的核苷酸序列如SEQ ID No.7所示，且5’末端核苷酸经磷酸化修饰；

所述DNA单链二01-1的核苷酸序列如SEQ ID No.8所示；

所述DNA单链二01-2的核苷酸序列如SEQ ID No.9所示；

所述DNA单链二03的核苷酸序列如SEQ ID No.10所示；

所述DNA单链二04的核苷酸序列如SEQ ID No.11所示。

本发明能为二代测序的DNA文库加入多个标签序列，大大提高样本间的分辨率。同时能为每个插入片段加入唯一的序列，可以识别原始插入片段及PCR扩增引入的复制子。因此本发明能解决病原微生物筛查中由于单标签污染导致的假阳性以及突变检测中的由于PCR扩增导致的突变比例偏移。所以本发明在病原微生物检测、肿瘤基因检测、单基因病检测等领域均具有较大的应用价值。

附图说明

图1为illumina公司的Y字型接头及工作示意图。

图2为Y字型双标签接头及工作示意图。

图3为华大智造公司半弧形接头及工作示意图。

图4为组成接头的DNA单链A(链一)的结构示意图。

图5为组成接头的DNA单链B(链二)的结构示意图。

图6为本发明接头的结构示意图。

图7为本发明接头的工作示意图。

图8为本发明构建文库环化后结构示意图。

图9为标准实验流程PCR纯化后产物Agilent 2100Bioanalyzer检测结果合格文库的示意图。

图10为对照组和实验组分析流程图。

具体实施方式

下述实施例中所使用的实验方法如无特殊说明，均为常规方法。

下述实施例中所用的材料、试剂等，如无特殊说明，均可从商业途径得到。

实施例1、本发明多标签二代测序文库接头的应用实例

一、供试样本及分组情况

本实施例共使用了6组样本，分别为大肠杆菌、金色葡萄球菌、Hela细胞、10％突变的katG 315突变结核核酸、50％突变的inhA-15突变结核核酸、100％突变的rpoB 531突变结核核酸(可以通过国家标准品中心或者广东省微生物菌种保藏中心购买获得)，如下表1所示。6组样本使用本发明接头标记为实验组、使用华大基因自主平台常规接头标记为对照组，进行建库及NGS检测分析各个样本的结果。

表1实施例组别

组别	大肠杆菌	金色葡萄球菌	Hela细胞	10％katG 315	50％inhA-15	100％rpoB 531
							对照组	1	2	3	4	5	6
实验组	1	2	3	4	5	6

二、接头合成

华大基因自主平台常规接头来源于华大基因，如下：

链一(5’-3’)：

1：AGTCGGAGGCCAAGCGGTCTTAGGAAGACAATAGGTCCGATCAACTCCTTGGCTCACA

2：AGTCGGAGGCCAAGCGGTCTTAGGAAGACAAGGACGGAATCCAACTCCTTGGCTCACA

3：AGTCGGAGGCCAAGCGGTCTTAGGAAGACAACTTACTGCCGCAACTCCTTGGCTCACA

4：AGTCGGAGGCCAAGCGGTCTTAGGAAGACAAACCTAATTGACAACTCCTTGGCTCACA

5：AGTCGGAGGCCAAGCGGTCTTAGGAAGACAATTCGTATCCGCAACTCCTTGGCTCACA

6：AGTCGGAGGCCAAGCGGTCTTAGGAAGACAAGGTAACGAGCCAACTCCTTGGCTCACA

链二(5’-3’)：

TTGTCTTCCTAAGGAACGACATGGCTACGATCCGACTT

本发明接头委托第三方引物合成商合成本发明序列链一和链二，如下表2所示：

表2合成序列

注：表中的N表示A或T或C或G。

三、接头退火

根据合成商提供的摩尔浓度，使用TE缓冲液将链一和链二各分别稀释到100μM。按下表3将链一和链二进行1:1体积比混合，室温静置30min退火成50μM的接头。使用TE缓冲液将对应的接头稀释成5μM后使用。

表3接头退火

接头号

链一

链二

标签1

标签2

随机标签

前导区

DB1

01

01-1

TAGGTCCGAT

AGTGTA

NNNNNN

TACATCGT

DB2

01

01-2

TAGGTCCGAT

GCATGA

NNNNNN

TACATCGT

DB3

02

01-1

GGACGGAATC

AGTGTA

NNNNNN

TACATCGT

DB4

02

01-2

GGACGGAATC

GCATGA

NNNNNN

TACATCGT

DB5

03

CTTACTGCCG

CGGCAC

NNNNNN

GCACTGTT

DB6

04

ACCTAATTGA

TAGTGA

NNNNNN

CATTGGCT

四、酶切打断

1、取出Segmentase(LC)(片段化酶；厂家/货号MGI/01E008LL)，震荡混匀5s，瞬时离心后置于冰上待用。Segmentase(LC)的混匀与否关系到打断效果及均一性，需确保充分混匀。

2、根据DNA浓度，取5ng待打断基因组DNA于新的0.2mL PCR管中，体积应≤10μL，不足10μL部分用TE buffer补足。

3、在冰上配制酶切打断反应液(见表4)：

表4酶切打断反应液的配制

组分	体积
		10×Segmentase Buffer	2μL
Segmentase(LC)(0.4U/μL)	2μL
		Nuclease-free Water	6μL
Total	10μL

4、用移液器吸取10μL配制好的酶切打断反应液加入步骤2的PCR管中，涡旋震荡3次，每次3s，瞬时离心将反应液收集至管底。

5、将步骤4所述PCR管置于PCR仪上，按照表5中的条件进行反应：

表5酶切打断反应条件

温度	时间
		热盖	On
37℃	30min
		65℃	15min
4℃	Hold

6、加入20μL TE Buffer至总体积40μL。

五、末端修复

1、在冰上配制末端修复反应液(见表6)：

表6末端修复反应&添加dA尾反应液的配制

组分	体积
		10×PNK Buffer	5.0μL
T4 PNK(10U/μL)	0.6μL
		rTaq DNA Polymerase(2U/μL)	0.2μL
T4 DNA Polymerase(3U/μL)	2.0μL
		Klenow Fragment(5U/μL)	0.1μL
25mM dNTP Solution Mix	0.27μL
		100mM dATP Solution	0.33μL
Nuclease-free Water	1.5μL
		Total	10μL

2、用移液器吸取10μL配制好的末端修复反应液加入步骤四-6的PCR管中，涡旋震荡3次，每次3s，瞬时离心将反应液收集至管底。

3、将步骤2所述PCR管置于PCR仪上，按照表7中的条件进行反应：

表7末端修复反应条件

温度	时间
		热盖	On
37℃	30min
		65℃	15min
4℃	Hold

4、瞬时离心将反应液收集至管底。

六、接头连接

1、参照MGIEasy DNA Adapters(10pmol/μl)说明书使用规则，在步骤五-4的PCR管中加入5μL对应的MGIEasy DNA Adapters(实验组接头或者对照组接头)，涡旋震荡3次，每次3s，瞬时离心将反应液收集至管底。

2、在冰上配制接头连接反应液(见表8)：

表8接头连接反应液的配制

组分	体积
		10×PNK Buffer	3.0μL
50％PEG8000	16μL
		100mM ATP(LK)	0.8μL
T4 DNA Ligase(600U/μL)	1.6μL
		Nuclease-free Water	3.6μL
Total	25μL

3、用移液器缓慢吸取25μL配制好的接头连接反应液加入步骤1的PCR管中，涡旋震荡6次，每次3s，瞬时离心将反应液收集至管底。

4、将步骤3所述PCR管置于PCR仪上，按照表9中的条件进行反应：

表9接头连接反应条件

温度	时间
		热盖	On
23℃	30min
		4℃	Hold

5、瞬时离心将反应液收集至管底。

6、加入20μL TE Buffer至总体系100μL，全部转移到新的1.5mL EP管中。

七、连接产物纯化

1、提前30min取出DNA Clean Beads置于室温，使用前充分震荡混匀。

2、用移液器吸取50μL DNAClean Beads至步骤六-6中的接头连接产物中，并轻轻吹打至少10次至完全混匀，最后一次应确保将吸头中所有液体及磁珠都打入EP管中。

3、室温孵育5min。

4、瞬时离心，将EP管置于磁力架，静置2-5min至液体澄清，用移液器小心吸取并丢弃上清。

5、保持EP管置于磁力架上，加入200μL新鲜配制的80％乙醇漂洗磁珠及管壁，静置30s后小心吸取并丢弃上清。

6、重复步骤5，尽量吸干管内液体，有少量残留在管壁时可将EP管瞬时离心，在磁力架上分离后，用小量程的移液器将管底液体吸干。

7、保持EP管固定于磁力架上，打开EP管管盖，室温干燥，直至磁珠表面无反光、无开裂。

8、将EP管从磁力架上取下，加入21μL TE Buffer进行DNA洗脱，用移液器轻轻吹打至少10次至完全混匀。

9、室温下孵育5min。

10、瞬时离心，将EP管置于磁力架上，静置2-5min至液体澄清，将19μL上清液转移到新的0.2mL PCR管中。

八、PCR扩增

1、在冰上配制PCR反应液(见表10)：

表10PCR扩增反应液的配制

组分	体积
		Alpha HiFidelity PCR ReadyMix(2×)	25μL
20μM Ad153_PCR2_1	3μL
		20μM Ad153_PCR2_2	3μL
Total	31μL

其中，PCR引物Ad153_PCR2_1：5’-TGTGAGCCAAGGAGTTG-3’；

PCR引物Ad153_PCR2_2：5’-GAACGACATGGCTACGA-3’。

常规接头和本发明接头均使用该PCR引物。

Alpha HiFidelity PCR ReadyMix厂家/货号：kapa/KK2602。

2、用移液器吸取31μL配制好的PCR反应液加入步骤七-10的PCR管中，涡旋震荡3次，每次3s，瞬时离心将反应液收集至管底。

3、将步骤2所述PCR管置于PCR仪上，按照表11的条件进行PCR反应：

表11PCR扩增反应条件

4、瞬时离心将反应液收集至管底。

5、吸取全部反应液转移到新的1.5mL EP管中。

九、PCR产物磁珠片段筛选

1、提前30min取出DNAClean Beads置于室温，使用前充分震荡混匀。

2、吸取30μL DNAClean Beads至步骤八-5的50μL PCR产物中，用移液器轻轻吹打至少10次至完全混匀，最后一次应确保将吸头中所有液体及磁珠都打入EP管中。

3、室温孵育5min。

4、瞬时离心，将EP管置于磁力架上，静置2-5min至液体澄清，用移液器小心吸取上清至新的1.5mL EP管中。

5、用移液器吸取10μL DNAClean beads至步骤8.6.4的80μL上清中，轻轻吹打至少10次至完全混匀，最后一次应确保将吸头中所有液体及磁珠都打入EP管中。

6、室温孵育5min。

7、瞬时离心，将EP管置于磁力架，静置2-5min至液体澄清，用移液器小心吸取并丢弃上清。

8、保持EP管置于磁力架上，加入200μL新鲜配制的80％乙醇漂洗磁珠及管壁，静置30s后小心吸取并丢弃上清。

9、重复步骤8，尽量吸干管内液体，有少量残留在管壁时可将EP管瞬时离心，在磁力架上分离后，用小量程的移液器将管底液体吸干。

10、保持EP管固定于磁力架上，打开EP管管盖，室温干燥，直至磁珠表面无反光、无开裂。

11、将EP管从磁力架上取下，加入22μL TE Buffer进行DNA洗脱，用移液器轻轻吹打至少10次至完全混匀。

12、室温下孵育5min。

13、瞬时离心，将EP管置于磁力架上，静置2-5min至液体澄清，将20μL上清液转移到新的1.5mL EP管中。

十、PCR产物质检

1、使用dsDNA HS Assay Kit荧光定量试剂盒，按照定量试剂盒的操作说明对PCR磁珠双选纯化后产物进行定量。要求最终PCR产物的摩尔产量≥1pmol，不同片段大小的PCR产物对应的产量请参考表12。如需将多个样本混合测序，建议根据MGIEasy DNAAdapters说明书使用规则设计混合方案，在定量后进行不同Adapters样本混合，混合后总量为1pmol，总体积≤48μL。

表12不同片段大小PCR产物1pmol对应产量

注：产物大小通过Agilent Technologies检测测定，Agilent Technologies操作的步骤请见该仪器的说明书，在此不做详细说明。

2、通过Tapestation(Agilent Technologies)PCR纯化后产物进行片段分布检测。图9为合格文库的示意图。

十一、变性

1、根据PCR产物的主片段分布，取1pmol PCR产物至新的0.2mL PCR管中，用TEBuffer补充至总体积48μL。

2、将步骤1所述PCR管置于PCR仪上，按照表13的条件进行反应：

表13变性反应条件

温度	时间
		热盖	On
95℃	3min

3、反应结束后，立即将PCR管转移到冰上，静置2min后瞬时离心。

十二、单链环化

1、在冰上配制单链环化反应液(见表14)：

表14单链环化反应液的配制

注：Splint Oligo为测序试剂配套的试剂；厂家/货号：MGI/1000002873。

2、用移液器吸取12.1μL配制好的单链环化反应液加入步骤十一-3的PCR管中，涡旋震荡3次，每次3s，瞬时离心将反应液收集至管底。

3、将PCR管置于PCR仪上，按照表15的条件进行反应：

表15单链环化反应条件

温度	时间
		热盖	On
37℃	30min
		4℃	Hold

4、反应结束后，瞬时离心，将PCR管转移到冰上，立即进入下步反应。

十三、酶切消化

1、在步骤十二-3反应时，提前在冰上配制酶切消化反应液(见表16)：

表16酶切消化反应液的配制

组分	体积
		10×TA Buffer	0.4μL
Exonuclease I(20U/μL)	1.95μL
		Exonuclease III(100U/μL)	0.65μL
Nuclease-free Water	1.0μL
		Total	4.0μL

2、用移液器吸取4μL配制好的酶切消化反应液加入步骤十二-4的PCR管中，涡旋震荡3次，每次3s，瞬时离心将反应液收集至管底。

3、将步骤2所述PCR管置于PCR仪上，按照表17的条件进行反应：

表17酶切消化反应条件

温度	时间
		热盖	On
37℃	30min

4、瞬时离心将反应液收集至管底。

5、向PCR管中加入3μL 0.5M EDTA，4.5μL Nuclease-free Water，涡旋震荡3次，每次3s，瞬时离心将反应液收集至管底，吸取全部反应液转移到新的1.5mL EP管中。

十四、酶切消化产物纯化

2、吸取170μL DNAClean Beads至步骤十三-5的71.6μL酶切消化产物中，用移液器轻轻吹打至少10次至完全混匀，最后一次应确保将吸头中所有液体及磁珠都打入EP管中。

3、室温孵育10min。

5、保持EP管置于磁力架上，加入500μL新鲜配制的80％乙醇漂洗磁珠及管壁，静置30s后小心吸取并丢弃上清。

8、将EP管从磁力架上取下，加入22μL TE Buffer进行DNA洗脱，用移液器轻轻吹打至少10次至完全混匀。

9、室温下孵育10min。

10、瞬时离心，将EP管置于磁力架上，静置2-5min至液体澄清，将20μL上清液转移到新的1.5mL EP管中。

十五、酶切消化产物质检

使用ssDNA Assay Kit荧光定量试剂盒，按照定量试剂盒的操作说明对酶切消化纯化后产物进行定量。最终产物要求摩尔产量≥80fmol(足够两次上机测序)，可参考表18进行计算。

表18不同PCR产物片段大小对应80fmol单链环产量

插入片段主片段大小(bp)	PCR产物主片段大小(bp)	80fmol对应产量(ng)
			220	304	8.03
320	404	10.67

注：产物大小通过Agilent Technologies检测测定。

十六、DNA测序反应

使用深圳华大智造科技有限公司生产的“BGISEQ-500RS高通量测序试剂盒(PE100)”或“MGISEQ-2000RS高通量测序试剂盒(PE100)(厂家/货号:MGI/1000002873)”进行DNA序列分析，严格按照说明书操作。

十七、数据分析

对照组下机数据经过标签1进行拆分，获得不同组别的100nt插入片段序列；实验组经过标签1进行拆分后，Reads1从5’端至3’端分别含有6nt标签2序列、8nt前导区序列、86nt插入片段序列。Reads2从5’端至3’端含有6nt随机标签序列、8nt前导区序列、86nt插入片段序列。实验组根据标签2和随机标签分类获得不同组别的86nt的插入片段序列。根据随机标签序列区分原始的插入片段和PCR复制子，从而降低PCR偏倚。分析流程如下图10所示。

十八、结果总结

各个样本的检测reads数及比例如下表19所示。根据计算公式污染率＝非靶标reads除以靶标reads，对照组1污染对照组2的比例为78/930239＝0.0084％，对照组2污染对照组1的比例为61/930239＝0.006％。通过统计所有样本1至3的污染率，对照组接头平均污染率为0.0149％，显著高于试验组平均污染率为0％。根据PCR偏倚率计算公式偏倚率＝100％-理论比例除以实际比例，如对照组4的偏倚率为100％-6.8％/10％＝32％，实验组4的偏倚率为100％-9.34％/10％＝6.6％，通过统计所有样本4至6的偏倚率，对照组平均偏倚率14.17％显著高于试验组的平均偏倚率2.37％。2种链一和2种链二可以组合成4种接头。

表19检测结果

/>

序列表

<110> 广州华大基因医学检验所有限公司；深圳华大基因股份有限公司；深圳华大临床检验中心

<120> 一种灵活多变的降低污染及PCR偏倚的多标签二代测序文库接头

<130> GNCLN192097

<141> 2019-11-14

<160> 11

<170> SIPOSequenceListing 1.0

<210> 1

<211> 17

<212> DNA

<213> Artificial sequence

<400> 1

caactccttg gctcaca 17

<210> 2

<211> 17

<212> DNA

<213> Artificial sequence

<400> 2

gaacgacatg gctacga 17

<210> 3

<211> 32

<212> DNA

<213> Artificial sequence

<400> 3

aagtcggagg ccaagcggtc ttaggaagac aa 32

<210> 4

<211> 72

<212> DNA

<213> Artificial sequence

<220>

<221> misc_feature

<222> (8)..(13)

<223> n is a or t or c or g

<400> 4

cgatgtannn nnnaagtcgg aggccaagcg gtcttaggaa gacaataggt ccgatcaact 60

ccttggctca ca 72

<210> 5

<211> 72

<212> DNA

<213> Artificial sequence

<220>

<221> misc_feature

<222> (8)..(13)

<223> n is a or t or c or g

<400> 5

cgatgtannn nnnaagtcgg aggccaagcg gtcttaggaa gacaaggacg gaatccaact 60

ccttggctca ca 72

<210> 6

<211> 72

<212> DNA

<213> Artificial sequence

<220>

<221> misc_feature

<222> (8)..(13)

<223> n is a or t or c or g

<400> 6

acagtgcnnn nnnaagtcgg aggccaagcg gtcttaggaa gacaacttac tgccgcaact 60

ccttggctca ca 72

<210> 7

<211> 72

<212> DNA

<213> Artificial sequence

<220>

<221> misc_feature

<222> (8)..(13)

<223> n is a or t or c or g

<400> 7

gccaatgnnn nnnaagtcgg aggccaagcg gtcttaggaa gacaaaccta attgacaact 60

ccttggctca ca 72

<210> 8

<211> 52

<212> DNA

<213> Artificial sequence

<400> 8

ttgtcttcct aaggaacgac atggctacga tccgacttag tgtatacatc gt 52

<210> 9

<211> 52

<212> DNA

<213> Artificial sequence

<400> 9

ttgtcttcct aaggaacgac atggctacga tccgacttgc atgatacatc gt 52

<210> 10

<211> 52

<212> DNA

<213> Artificial sequence

<400> 10

ttgtcttcct aaggaacgac atggctacga tccgacttcg gcacgcactg tt 52

<210> 11

<211> 52

<212> DNA

<213> Artificial sequence

<400> 11

ttgtcttcct aaggaacgac atggctacga tccgacttta gtgacattgg ct 52

Claims

1.接头，由DNA单链A和DNA单链B退火形成；

所述DNA单链B中的所述固定区1和所述固定区2分别能够与所述DNA单链A中的所述固定区靠近3’端和靠近5’端的部分反向互补；所述DNA单链B中的所述引物2结合区与所述DNA单链A中的所述固定区不匹配；

所述DNA单链B中的所述前导区B与所述DNA单链A中的所述前导区A反向互补，且所述前导区A的5’末端核苷酸经磷酸化修饰，所述前导区B的3’末端多出一个游离的核苷酸T；

所述随机标签为若干个连续的N组成的寡核苷酸，每个N均为A、T、C或G；

在所述DNA单链A中，所述前导区A的长度为6-9nt；所述随机标签的长度为6-10nt；所述固定区的长度为27-37nt；所述标签1的长度为6-10nt；所述引物1结合区的长度为15-23nt；

在所述DNA单链B中，所述固定区1的长度为10-18nt；所述引物2结合区的长度为15-23nt；所述固定区2的长度为5-12nt；所述标签2的长度为6-10nt；所述前导区B的长度为6-10nt。

2.根据权利要求1所述的接头，其特征在于：所述标签1、所述标签2、所述前导区A和所述前导区B为核苷酸序列可变的区域。

3.根据权利要求1所述的接头，其特征在于：在所述DNA单链A中，所述前导区A的长度为7nt；和/或所述随机标签的长度为6nt；和/或所述固定区的长度为32nt；和/或所述标签1的长度为10nt；和/或所述引物1结合区的长度为17nt。

4.根据权利要求1所述的接头，其特征在于：在所述DNA单链B中，所述固定区1的长度为13nt；和/或所述引物2结合区的长度为17nt；和/或所述固定区2的长度为8nt；和/或所述标签2的长度为6nt；和/或所述前导区B的长度为8nt。

5.根据权利要求1-4中任一所述的接头，其特征在于：所述引物1结合区的核苷酸序列如SEQ ID No.1所示；所述引物结合区2的核苷酸序列如SEQ ID No.2所示；所述固定区的核苷酸序列如SEQ ID No.3所示。

6.根据权利要求1-4中任一所述的接头，其特征在于：所述固定区1的核苷酸序列为SEQID No.3的第20-32位的反向互补序列；所述固定区2的核苷酸序列为SEQ IDNo.3的第1-8位的反向互补序列。

7.接头前体，由未经退火的权利要求1-6任一中所述DNA单链A和所述DNA单链B组成。

8.二代测序DNA文库的构建方法，包括如下步骤：将权利要求1-6中任一所述接头与末端加A的若干待测序插入片段连接，然后以连接产物为模板，利用引物1和引物2进行PCR扩增，得到所述二代测序DNA文库；

所述引物1与权利要求1-6任一中所述引物1结合区反向互补；所述引物2的序列与权利要求1-6任一中所述引物2的序列一致。

9.二代测序方法，包括如下步骤：

(B1)按照权利要求8所述方法构建得到二代测序DNA文库；

(B2)将所述二代测序DNA文库变性后进行环化；

10.一种对利用权利要求9所述二代测序方法所得下机数据进行分析的方法，包括如下步骤：下机数据先根据所述标签1进行拆分，reads1从5’端到3’端依次包含所述标签2、所述前导区B和所述插入序列，reads2从5’端到3’端依次包含所述随机标签、所述前导区A和所述插入片段的反向互补序列；然后通过所述标签2对下机reads进行归类以降低单标签由于合成工艺或标签跳转导致的假阳性；通过所述随机标签对下机reads进行归类以区分原始插入片段与PCR扩增子。

11.如下任一应用：

(C1)权利要求1-6中任一所述接头在作为测序文库接头中的应用；

(C2)权利要求1-6中任一所述接头在作为二代测序文库接头中的应用；

(C3)权利要求7所述的接头前体在制备权利要求1-6中任一所述接头中的应用；

(C4)权利要求7所述的接头前体在制备测序文库接头中的应用；

(C5)权利要求7所述的接头前体在制备二代测序文库接头中的应用；

(C6)权利要求1-6中任一所述接头或权利要求7所述的接头前体在构建测序文库中的应用；

(C7)权利要求1-6中任一所述接头或权利要求7所述的接头前体在构建二代测序文库中的应用；

(C8)权利要求1-6中任一所述接头或权利要求7所述的接头前体或权利要求8所述的二代测序DNA文库的构建方法在进行二代测序中的应用；

(C9)权利要求1-6中任一所述接头或权利要求7所述的接头前体或权利要求8所述的二代测序DNA文库的构建方法或权利要求9所述的二代测序方法或权利要求10所述的方法在解决病原微生物筛查中由于单标签污染导致的假阳性和/或突变检测中的由于PCR扩增导致的突变比例偏移问题中的应用。