CN114317696A

CN114317696A - 一种试剂盒及其文库构建方法与污染检测方法

Info

Publication number: CN114317696A
Application number: CN202111599745.0A
Authority: CN
Inventors: 严海生; 李淼; 于源; 吴东方; 高志博
Original assignee: Shenzhen Yukang Medical Laboratory
Current assignee: Shenzhen Yukang Medical Laboratory
Priority date: 2021-12-24
Filing date: 2021-12-24
Publication date: 2022-04-12
Anticipated expiration: 2041-12-24

Abstract

一种试剂盒及其文库构建方法与污染检测方法，试剂盒包括：第一轮扩增引物、第二轮扩增引物；第一轮扩增引物包含第一上游引物、第一下游引物，第一上游引物含有与靶标序列部分相同的核苷酸序列，第一下游引物含有可与靶标序列的部分核苷酸序列反向互补的核苷酸序列以及用于与靶标序列串联连接的部分接头序列；第二轮扩增引物包含第二上游引物，第二上游引物包含与靶标碱基序列相同的核苷酸序列以及部分接头序列。本发明相比于pane l NGS测序技术，检测周期短，检测周期约是其1/8的时间，并显著降低成本，检测成本约是其1/10。即成本低，周期短，检测精度高。

Description

一种试剂盒及其文库构建方法与污染检测方法

技术领域

本发明涉及分子生物学领域，具体涉及一种试剂盒及其文库构建方法与污染检测方法。

背景技术

实验室污染一直是分子实验室面临的难题。污染的出现，主要在样本收集、实验室处理两个环节。其中样本收集造成的污染，可以通过分批次提取进行排查区分，而实验室处理造成的污染，可能由于提取、打断、建库造成，目前很难排查。

目前排查污染的技术主要有：基于SNP的QPCR技术、基于Panel捕获的SNP分型、串联质谱SNP分型、基于基于多重PCR扩增子建库技术。

基于SNP的QPCR技术是采用taqman探针的方法，对设计的SNP位点进行检测，通过多重荧光信号曲线分析，判断位点污染情况。此技术检测较快速，但存在SNP位点数少、受试剂和检测平台(信号通道)影响大、检测结果无法进行进一步原因分析的缺点。

基于Panel捕获的SNP分型技术是采用经设计的覆盖一定SNP数目的panel，对检测的样本进行杂交捕获、扩增及测序，通过分析判断污染情况。此技术需要设计捕获探针，且需要进行杂交捕获等操作，故存在成本高、周期长的缺陷，对临床排查不太适用。

串联质谱SNP分型技术是基于串联质谱技术，对DNA的SNP进行检测，从而判断污染情况。此技术的SNP位点很容易丢失，还存在检测准确度受限等问题。

基于多重PCR扩增子建库技术(见图1)是采用多重PCR引物进行扩增，然后对PCR产物进行末端修复、加接头、PCR扩增等操作，形成文库，然后再上机测序。此技术操作复杂，需要进行多步骤操作及纯化，且建库成本较高。

发明内容

根据第一方面，在一实施例中，提供一种试剂盒，所述试剂盒包括：第一轮扩增引物、第二轮扩增引物；

所述第一轮扩增引物包含第一上游引物、第一下游引物，所述第一上游引物含有与靶标序列部分相同的核苷酸序列，所述第一下游引物含有可与所述靶标序列的部分核苷酸序列反向互补的核苷酸序列以及用于与所述靶标序列串联连接的部分接头序列；

所述第二轮扩增引物包含第二上游引物，所述第二上游引物包含与靶标碱基序列相同的核苷酸序列以及部分接头序列。

根据第二方面，在一实施例中，提供一种防污染的文库构建方法，包括：

第一轮扩增步骤，包括使用第一方面所述试剂盒中的第一上游引物、第一下游引物对靶标序列进行第一轮PCR扩增，获得第一轮扩增产物；

第二轮扩增步骤，包括使用第一方面所述试剂盒中的第二上游引物、第三上游引物、第二下游引物对第一轮扩增产物进行扩增，获得第二轮扩增产物，即为所述文库。

根据第三方面，在一实施例中，提供一种污染检测方法，包括：从第二方面所述文库上机测序后得到的测序数据中筛查，预测是否存在污染。

依据上述实施例的一种试剂盒及其文库构建方法与污染筛查方法，本发明的SNP位点数更多，且可以根据需求增加，且增加的数目不受检测平台限制，可从检测结果中分析碱基占比，可进一步进行原因分析。

在一实施例中，相比于panel NGS测序技术，本发明检测周期短，检测周期约是其1/8的时间，并显著降低成本，检测成本约是其1/10。即成本低，周期短，检测精度高。

附图说明

图1为现有的基于多重PCR扩增子建库方法原理示意图。

图2为一种实施例的文库构建流程示意图。

图3为实施例1中的片段分布图。

具体实施方式

下面通过具体实施方式结合附图对本发明作进一步详细说明。其中不同实施方式中类似元件采用了相关联的类似的元件标号。在以下的实施方式中，很多细节描述是为了使得本申请能被更好的理解。然而，本领域技术人员可以毫不费力的认识到，其中部分特征在不同情况下是可以省略的，或者可以由其他元件、材料、方法所替代。在某些情况下，本申请相关的一些操作并没有在说明书中显示或者描述，这是为了避免本申请的核心部分被过多的描述所淹没，而对于本领域技术人员而言，详细描述这些相关操作并不是必要的，他们根据说明书中的描述以及本领域的一般技术知识即可完整了解相关操作。

另外，说明书中所描述的特点、操作或者特征可以以任意适当的方式结合形成各种实施方式。同时，方法描述中的各步骤或者动作也可以按照本领域技术人员所能显而易见的方式进行顺序调换或调整。因此，说明书和附图中的各种顺序只是为了清楚描述某一个实施例，并不意味着是必须的顺序，除非另有说明其中某个顺序是必须遵循的。

本文中为部件所编序号本身，例如“第一”、“第二”等，仅用于区分所描述的对象，不具有任何顺序或技术含义。而本申请所说“连接”、“联接，”如无特别说明，均包括直接和间接连接(联接)。

鉴于现有技术存在的缺陷，亟需一种检测快速、操作流程简单、成本低廉、准确性高的污染排查检测方法。

各引物可以分装于不同的溶剂中，然后与PCR扩增所需的试剂成套包装，形成试剂盒产品。

在一实施例中，本发明提供基于SNP的多重PCR防污染方法，采用半巢式PCR原理设计，只需进行2步PCR，约3小时，即可形成文库。覆盖21个SNP位点，且位点深度超高，可以达到50000X以上，大大提高了位点的可信度。每例文库实验成本约30元，建库成本较低。

在一实施例中，SNP位点不受限制，可以使用其他的SNP位点进行多重PCR建库。

在一实施例中，所述靶标序列包含单核苷酸多态性位点(SNP)。

在一实施例中，所述单核苷酸多态性位点的数量为至少一个，优选为10～50个。

在一实施例中，所述单核苷酸多态性位点的数量为21个。

在一实施例中，每个单核苷酸多态性位点对应一组第一上游引物、第一下游引物、第二上游引物。

在一实施例中，所述第一上游引物的长度为20～30nt。

在一实施例中，所述第一下游引物的长度为35～80nt。

在一实施例中，所述第二上游引物中，与靶标序列相同的核苷酸序列长度为10～30nt。

在一实施例中，所述第二上游引物中，部分接头序列的核苷酸序列长度为10～45nt。

在一实施例中，所述所述第一下游引物中，与所述靶标序列反向互补的核苷酸序列的5’端串联至所述部分接头序列的3’端。

在一实施例中，所述第二上游引物中，与靶标碱基序列相同的核苷酸序列的5’端串联至所述部分接头序列的3’端。

在一实施例中，所述第一下游引物所含有的部分接头序列不同于所述第二上游引物所含有的部分接头序列。

在一实施例中，所述第一下游引物中，所述部分接头序列含有如下碱基序列：

CCTAAGACCGCTTGGCCTCCGACTT。

在一实施例中，所述第二上游引物中，所述部分接头序列含有如下碱基序列：

GAACGACATGGCTACGATCCGACTT。

在一实施例中，所述第一上游引物含有表1中奇数编号所示序列中的至少一种。

在一实施例中，所述第一上游引物含有表1中奇数编号所示序列中的全部。

在一实施例中，所述第一下游引物含有表1中偶数编号所示序列中的至少一种。

在一实施例中，所述第一下游引物含有表1中偶数编号所示序列中的全部。

在一实施例中，所述第二上游引物含有SEQ ID No.43～63所示序列中的至少一种。

在一实施例中，所述第二上游引物含有SEQ ID No.43～63所示序列中的全部。

在一实施例中，所述试剂盒还包含PCR扩增所需的其他试剂，如热稳定性聚合酶等，其他试剂通常可以从市场上购买得到。

在一实施例中，所述接头序列是指测序接头。

在一实施例中，所述试剂盒还包含第三上游引物、第二下游引物。

在一实施例中，所述第三上游引物、第二下游引物中均含有分子标签(barcode)。

在一实施例中，第三上游引物、第二下游引物为含MGI文库接头的序列，第二下游引物中的部分序列与第一下游引物中的部分接头序列相同，具体可参见图2所示的原理图。

在一实施例中，第三上游引物、第二下游引物可从市场上购买得到。

在一实施例中，第三上游引物、第二下游引物具体可以为纳昂达

M-IndexPri mer Mix(MDI)中的引物。

根据第二方面，在一实施例中，提供一种文库构建方法，包括：

第二轮扩增步骤，包括使用第一方面所述试剂盒中的第二上游引物、第三上游引物、第二下游引物对第一轮扩增产物进行扩增，获得第二轮扩增产物，即为所述文库。该文库可用于上机测序。

在一实施例中，第一轮扩增步骤中，还包括对第一轮扩增产物进行纯化，得到纯化后的第一轮扩增产物，然后进行第二轮扩增。

在一实施例中，第二轮扩增步骤中，还包括对第二轮扩增产物进行纯化，得到纯化后的第二轮扩增产物，即为所述文库。

在一实施例中，所述纯化包括但不限于磁珠纯化。

在一实施例中，第一轮扩增步骤中，所述靶标序列未经过末端修复、加接头反应。

根据第三方面，在一实施例中，提供一种污染检测方法，包括：从第二方面所述文库构建方法构建得到的文库上机测序后得到的测序数据中筛查，预测是否存在污染。

在一实施例中，包括计算污染比例区间，具体是根据测序数据，统计每个待测样本所有纯合位点上的最小等位基因频率，取平均值，将该值作为污染范围的下限值，将下限值乘以2所得的数值作为污染范围的上限值，该下限值与上限值形成的范围即为待测样本的污染比例区间。

在一实施例中，根据上限值与阈值的大小关系，预测待测样本是否存在污染。在一实施例中，如果所述上限值＜阈值，则预测待测样本不存在污染。

在一实施例中，如果所述下限值＞阈值，则预测待测样本存在污染。

在一实施例中，所述阈值可以为2％。

在一实施例中，本发明提供的基于SNP的多重PCR防污染方法克服了背景技术提及的4种现有方法的缺点，可以实现简单、快速、低成本、高准确性的检测，是一种污染排查的有效方法。

在一实施例中，如图2所示，本发明提供一种DNA污染的排查方法，包括以下步骤：

(a)根据SNP区域设计引物对，其中该引物对含第一上游引物F1和第一下游引物R1；其中，第一上游引物F1为一段与目标区域内靶标碱基相同的短核苷酸序列，长度为10～30nt；第一下游引物R1为一段含目标区域互补序列和部分接头序列的引物，长度为35～80nt；

(b)根据上游引物序列设计一段带部分接头序列的引物(F2n)，长度为20～80nt；

(c)根据上游和下游序列，再设计一对含接头序列的长链引物，该长链引物含接头序列信息；

(d)根据(a)中设计的引物，进行第一轮PCR，经纯化回收等操作，得到扩增子DNA，进一步地，该扩增子DNA右端含接头序列；

(e)根据步骤(b)、(c)中设计的引物，进行第二轮PCR，经纯化回收等操作，得到测序文库。

在一实施例中，本发明提供一种用于DNA污染检测的引物，包括两轮PCR的引物，具体包括以下引物：

(a)第一轮PCR引物，包括第一上游引物F1、第一下游引物R1，第一上游引物F1为一段与目标区域内靶标碱基相同的短核苷酸序列，其长度为10～30nt；第一下游引物R1分成两段，其中一段是与靶标序列碱基互补的短核苷酸序列，其长度为10～30nt。另一段是一部分接头序列，进一步地，该序列是测序接头的一部分，其长度为10～45nt；

(b)第二轮PCR引物，包括第二上游引物F2、第三上游引物U1、第二下游引物U2，方向均是5’到3’。第二上游引物F2的组成分为2段，其中一段是与靶标序列相同的短核苷酸序列，其长度为10～30nt，另一段是一部分接头序列，进一步地，该序列是测序接头的一部分，其长度为10～45nt，进一步地，该接头序列与(a)中第一下游引物所含有的测序接头序列不同。第三上游引物U1和第二下游引物U2是纳昂达

M-Index Primer Mix(MDI)中的引物，具体详见NadPrep建库说明书。

在一实施例中，相比QPCR技术，本发明SNP位点数更多，且可以根据需求增加，且增加的数目不受检测平台限制，检测结果可用于分析碱基占比，可进一步进行原因分析。

在一实施例中，相比于panel NGS测序技术，本发明检测周期短，约是其1/8的时间，且成本远低于panel NGS测序技术，约是其1/10。

在一实施例中，本发明的引物及检测方法成本更低，周期更短。

在一实施例中，本发明的引物及检测方法检测精度高。

在一实施例中，从文库构建开始到制备完成的时间，本发明只需3h(第一轮1.5h，第二轮1.5h)，现有的panel文库构建方法则需要24h(前体文库3h+杂交捕获洗脱21h)。因此，本发明的检测周期显著短于现有技术。

在一实施例中，本发明试剂成本约30元，现有的panel文库构建方法的试剂成本约300元。因此，本发明的检测成本远低于现有技术。

在一实施例中，相比于串联质谱技术，本发明SNP位点不会发生丢失现象，检测精度更高。

在一实施例中，相比于多重PCR扩增子建库技术，本发明流程只需3步，省去了末端修复、加接头等步骤，使得操作简便，快捷。

在一实施例中，本发明提供了一种检测快速、操作流程简单、成本低廉、准确性高的污染排查检测方法。

下述实施例中所使用的实验方法如无特殊说明，均为常规方法。下述实施例中所用的材料、试剂等，如无特殊说明，均可从商业途径得到。

下述实施例中引物合成于北京擎科生物技术有限公司；磁珠购自纳昂达(南京)生物科技有限公司；KAPA HiFi Hotstart ReadyMix，购自Kapa Biosystems；无核酸酶水，自AMBI ON公司的nuclear free water；qubit HS试剂为INVITROGEN的Qubit dsDNA HSAssay kit。片段分析试剂购自安捷伦的适合于4150TapeStation系统的D1000试剂。

样本在本发明的具体实施方式中，所述待测DNA样本为疑似污染的患者样本。

以下实施例中，“80％乙醇”是指体积百分比为80％的乙醇水溶液。

实施例1

本实施例提供一种基于SNP的多重PCR防污染方法。

本实施例还提供基于SNP的多重PCR引物。

本实施例所提供的引物，包括两轮PCR的引物，包括：

1.第一轮PCR引物，包括第一上游引物F1、第一下游引物R1，第一上游引物F1为一段与目标区域内靶标碱基相同的短核苷酸序列，其长度为10～30nt；下游引物分成两段，其中一段是与靶标序碱基互补的短核苷酸序列，其长度为10～30nt。另一段是一部分接头序列，该序列是测序接头的一部分，其长度10～45nt。第一上游引物F1、第一下游引物R1的碱基序列结构如下：

F1：XXXXXXXXXXXXXX；

R1：CCTAAGACCGCTTGGCCTCCGACTTXXXXXXXXXXXXXX。

其中，F1中的X是指与靶标序列相同的碱基序列，即基因特异区域引物，长度不固定。

R1中的X是指与靶标序列反向互补的碱基序列，下划线部分为接头序列。

本实施例的第一上游引物F1和第一下游引物R1所有序列如下表所示。本实施例选择与NGS panel里相同的SNP位点设计引物，便于比对。

表1

2.第二轮PCR引物，包括第二上游引物F2、第三上游引物U1、第二下游引物U2，方向均是5’到3’。第二上游引物F2的组成分为2段，其中一段是与靶标序列相同的短核苷酸序列，其长度为10～30nt，另一段是一部分接头序列，进一步地，该序列是测序接头的一部分，其长度10～45nt，进一步地，该接头序列与第一轮PCR引物中的接头序列不同。另一条上游引物(即第三上游引物U1)和下游引物(第二下游引物U2)为纳昂达

M-IndexPrimer Mix(MDI)中的引物，具体详见NadPrep建库说明书，说明书具体为纳昂达(南京)生物科技有限公司提供的

血浆游离DNA双端分子标签文库构建试剂盒(for MGI)使用说明书V1.0》。具体信息如下：

F2：GAACGACATGGCTACGATCCGACTTXXXXXXXXXXXXXX。

其中，X序列与F1序列相同，为基因特异区域引物，双下划线标示的序列为部分接头序列。

本实施例中，F2引物所有序列如下表所示。

表2

本实施例分别采用20ng基因组DNA、1ng prePCR产物进行测试。

本实施例对同一个人的gDNA(含不同提取批次)进行定量，并对相应的prePCR产物进行定量(qubit HS)。

1.第一轮PCR(F-PCR)

将KAPA HiFi Hotstart ReadyMix及引物试剂从-20℃冰箱取出，按下表所示反应体系进行预混液配制。

表3 F-PCR试剂配制表

试剂名称	用量(μL)
		DNA	1
KAPA HiFi Hotstart ReadyMix	12.5
		MIX I	2
无核酸酶水	9.5
		总体积	25

反应体系均在冰盒上或冰上操作，下文操作相同。

用漩涡混匀仪(其林贝尔，VORTEX-KB3)充分混匀所配Mix后，放置到掌式离心机上瞬时离心，放到PCR仪上进行反应。PCR程序如下表所示。

表4 F-PCR反应程序表

“-”表示无相关信息。

2.PCR产物纯化

2.1从PCR仪中取出上一步反应产物，瞬间离心后放置在96孔板架上，打开管盖，每个反应补25μL 1X TE(Tris EDTA buffer，Invitrogen)缓冲液，盖上盖子，用漩涡混匀仪充分混匀后放置到掌式离心机上瞬时离心。再打开盖子，继续往里加42.5μL

SPBeads磁珠，盖上盖子，用漩涡混匀仪充分混匀后，放置到掌式离心机上瞬时离心，室温静置5mi n。

2.2上磁力架2min，至液体澄清，用移液器转移到新的1.5mL离心管中，核对每管样本信息是否与管壁上信息一致。

2.3加入40μL

SP Beads磁珠，盖上盖子，用漩涡混匀仪充分混匀后放置到掌式离心机上瞬时离心，室温静置5min。

2.4上磁力架2min，至液体澄清，用移液器吸弃液体。

2.5加入200μL 80％乙醇(当天配制)，磁力架旋转2圈后，用移液器吸弃液体。

2.6重复步骤2.5一次。即清洗2次。

2.7短暂离心后，上磁力架，用移液器吸弃液体，并室温开盖晾干至磁珠表面哑光。

2.8加入21μL无核酸酶水，重悬磁珠，室温静止5min。

2.9短暂离心后，上磁力架，至液体澄清时，转移20μL至另一新的0.2mL离心管中，待进行下一步反应。

3.第二轮PCR(R-PCR)

将KAPA HiFi Hotstart ReadyMix及引物试剂从-20℃冰箱取出，按下表所示反应体系进行预混液配制：

表5 R-PCR试剂配制表

试剂名称	用量(μL)
		上一步PCR产物	20
KAPA HiFi Hotstart ReadyMix	25
		引物F2n MIX(10μM)	1
Index primer(U1+U2)	2
		无核酸酶水	2
总体积	50

Index primer(U1+U2)在试剂盒说明书中的原始名称为

M-IndexPrimer Mix(MDI)。

用漩涡混匀仪充分混匀所配预混液后，放置到掌式离心机上瞬时离心，放到PCR仪上进行反应。PCR程序如下表所示。

表6 F-PCR反应程序表

3.1 PCR产物纯化

3.2将上一步反应产物从PCR仪中拿出，瞬间离心后放置在96孔板架上，往里加15μL

对于prePCR文库，此步骤加入40μL

SP Beads磁珠。

3.3上磁力架2min，至液体澄清，用移液器转移到新的1.5mL离心管中，核对每管样本信息是否与管壁上信息一致。

3.4加入25μL

对于prePCR文库，加入35μL

SP Beads磁珠。

3.5上磁力架2min，至液体澄清，用移液器吸弃液体。

3.6加入200μL 80％乙醇(当天配制)，磁力架旋转2圈后，用移液器吸弃液体。

3.7重复步骤3.6一次。即清洗2次。

3.8短暂离心后，上磁力架，用移液器吸弃液体，并室温开盖晾干至磁珠表面哑光。

3.9加入21μL无核酸酶水，重悬磁珠，室温静止5min。

3.10短暂离心后，上磁力架，用移液器吸取1μL进行Qubit定量。

质量控制

a.Qubit浓度≥2ng/μL。

b.片段分布检测：图3所示为片段分布图，插入主片段分布在200～400bp之间，主峰在320bp左右。

同时满足以上两点要求，则文库质控合格，进行上机测序。

环化上机

文库使用Qubit浓度按上机数据量进行均一化(pooling)，gDNA的每例文库要求0.5Gb，prePCR产物的每例文库要求4Gb，进行上机测序。

4.分析结果

污染范围计算方法：统计每个样本所有纯合位点上的最小等位基因频率，该最小等位基因即为污染源导致的结果。考虑到污染源在该位点可能为纯合或杂合，污染比例可能为最小等位基因频率(若污染源为纯合)或最小等位基因频率*2(若污染源为杂合)。对样本所有纯合位点按此方法计算并取平均值，即为该样本预测的污染比例区间。

由于实验室污染来源主要为DNA提取、打断、建库造成的污染，故针对相同患者来源的提取产物、打断产物、prePCR文库、临床文库进行结果对比分析，确定污染引物环节。

各SNP位点的基因型、深度、碱基占比如表7所示。

表7

检测得到的污染范围如表8所示。

表8

如果产物污染范围的上限值小于2％，则预测为样本无污染；如果产物污染范围的下限值大于2％，则预测为样本有污染。

可见，基于不同提取gDNA、打断产物、prePCR产物进行多重PCR排查分析，结果显示，样本是一致的基因型，重提取样本(gDNA提取产物1)不存在污染，而gDNA提取产物2、打断产物gDNA(产物2)、prePCR产物(产物2)存在污染。gDNA提取产物1、gDNA提取产物2为不同批次的样本，鉴于gDNA提取产物1的检测结果显示不存在污染，说明gDNA提取产物2在提取过程中即出现了污染，打断产物gDNA(产物2)、prePCR产物(产物2)的检测结果显示均存在污染，进一步证实了提取产物2gDNA在提取过程中出现了污染，进而造成后续的过程产物均存在污染。另外，相比临检方法，本实施例检测的位点数更齐全，深度更高，能检出低频污染。

以上应用了具体个例对本发明进行阐述，只是用于帮助理解本发明，并不用以限制本发明。对于本发明所属技术领域的技术人员，依据本发明的思想，还可以做出若干简单推演、变形或替换。

SEQUENCE LISTING

<110> 深圳裕康医学检验实验室

<120> 一种试剂盒及其文库构建方法与污染检测方法

<130> 21I32720

<160> 63

<170> PatentIn version 3.3

<210> 1

<211> 19

<212> DNA

<213> 人工序列

<400> 1

ctccctgagc atggttcaa 19

<210> 2

<211> 44

<212> DNA

<213> 人工序列

<400> 2

cctaagaccg cttggcctcc gacttgtggt ccagtgtggg taaa 44

<210> 3

<211> 20

<212> DNA

<213> 人工序列

<400> 3

aagcgagctg taacccgttt 20

<210> 4

<211> 45

<212> DNA

<213> 人工序列

<400> 4

cctaagaccg cttggcctcc gacttagtgc cctccgacat tgttt 45

<210> 5

<211> 22

<212> DNA

<213> 人工序列

<400> 5

gctgtacctt ccttggaaag ag 22

<210> 6

<211> 45

<212> DNA

<213> 人工序列

<400> 6

cctaagaccg cttggcctcc gacttgggca catctatcaa ccaac 45

<210> 7

<211> 20

<212> DNA

<213> 人工序列

<400> 7

gactggtgct tctcacctct 20

<210> 8

<211> 45

<212> DNA

<213> 人工序列

<400> 8

cctaagaccg cttggcctcc gacttctacc acaccactgg cttac 45

<210> 9

<211> 25

<212> DNA

<213> 人工序列

<400> 9

atgccatccc atgtaagaat gtgtt 25

<210> 10

<211> 49

<212> DNA

<213> 人工序列

<400> 10

cctaagaccg cttggcctcc gacttgctaa gcctgagaaa tgagtgaca 49

<210> 11

<211> 20

<212> DNA

<213> 人工序列

<400> 11

aggtgccacg gaactgtatt 20

<210> 12

<211> 45

<212> DNA

<213> 人工序列

<400> 12

cctaagaccg cttggcctcc gacttttaca ccaaccgcag aagtc 45

<210> 13

<211> 18

<212> DNA

<213> 人工序列

<400> 13

gggccgtgag actcataa 18

<210> 14

<211> 43

<212> DNA

<213> 人工序列

<400> 14

cctaagaccg cttggcctcc gacttgaccc atcgctccac ttt 43

<210> 15

<211> 20

<212> DNA

<213> 人工序列

<400> 15

gcctcatggc ccaatcatac 20

<210> 16

<211> 45

<212> DNA

<213> 人工序列

<400> 16

cctaagaccg cttggcctcc gacttccacc cagacctact gaact 45

<210> 17

<211> 22

<212> DNA

<213> 人工序列

<400> 17

cctcctgcac attcttctga ct 22

<210> 18

<211> 47

<212> DNA

<213> 人工序列

<400> 18

cctaagaccg cttggcctcc gacttgccaa gccttctgtc attactg 47

<210> 19

<211> 20

<212> DNA

<213> 人工序列

<400> 19

cgcactccag ttgataccat 20

<210> 20

<211> 45

<212> DNA

<213> 人工序列

<400> 20

cctaagaccg cttggcctcc gactttctcc accaaagacc aagac 45

<210> 21

<211> 20

<212> DNA

<213> 人工序列

<400> 21

agctgcttgc tgatctctga 20

<210> 22

<211> 45

<212> DNA

<213> 人工序列

<400> 22

cctaagaccg cttggcctcc gacttcaacg tccaggatag agtga 45

<210> 23

<211> 20

<212> DNA

<213> 人工序列

<400> 23

tagcggcagt ccttatctgg 20

<210> 24

<211> 45

<212> DNA

<213> 人工序列

<400> 24

cctaagaccg cttggcctcc gacttgtgct cttctgcctg agtga 45

<210> 25

<211> 21

<212> DNA

<213> 人工序列

<400> 25

catgggcaat ggttccatca t 21

<210> 26

<211> 46

<212> DNA

<213> 人工序列

<400> 26

cctaagaccg cttggcctcc gacttgaagc agccagagaa cgagat 46

<210> 27

<211> 18

<212> DNA

<213> 人工序列

<400> 27

acgctgaacc aaagagga 18

<210> 28

<211> 43

<212> DNA

<213> 人工序列

<400> 28

cctaagaccg cttggcctcc gacttagaga aatggcgaac gag 43

<210> 29

<211> 22

<212> DNA

<213> 人工序列

<400> 29

gctaaccatt gttgcctcca tc 22

<210> 30

<211> 46

<212> DNA

<213> 人工序列

<400> 30

cctaagaccg cttggcctcc gacttcatct tcaggagacg ctcgta 46

<210> 31

<211> 18

<212> DNA

<213> 人工序列

<400> 31

gcagggatga cctttagt 18

<210> 32

<211> 43

<212> DNA

<213> 人工序列

<400> 32

cctaagaccg cttggcctcc gacttctgca catgccatga atg 43

<210> 33

<211> 20

<212> DNA

<213> 人工序列

<400> 33

tgaccaagga gtgcctggta 20

<210> 34

<211> 45

<212> DNA

<213> 人工序列

<400> 34

cctaagaccg cttggcctcc gacttgttag agtgaccagg ttagc 45

<210> 35

<211> 20

<212> DNA

<213> 人工序列

<400> 35

ctctgctggt gacaggacaa 20

<210> 36

<211> 45

<212> DNA

<213> 人工序列

<400> 36

cctaagaccg cttggcctcc gacttttgag gcagccagct tctct 45

<210> 37

<211> 20

<212> DNA

<213> 人工序列

<400> 37

ccttgctcat gactcagaac 20

<210> 38

<211> 45

<212> DNA

<213> 人工序列

<400> 38

cctaagaccg cttggcctcc gacttgccat gaagccacaa cacta 45

<210> 39

<211> 22

<212> DNA

<213> 人工序列

<400> 39

ggtcgtccca gagtaaatca ac 22

<210> 40

<211> 47

<212> DNA

<213> 人工序列

<400> 40

cctaagaccg cttggcctcc gacttttgcg tgatggaatc aagactt 47

<210> 41

<211> 22

<212> DNA

<213> 人工序列

<400> 41

cgctactgtc acctgaatga at 22

<210> 42

<211> 47

<212> DNA

<213> 人工序列

<400> 42

cctaagaccg cttggcctcc gacttcattg ctgaggatct ggtatgc 47

<210> 43

<211> 44

<212> DNA

<213> 人工序列

<400> 43

gaacgacatg gctacgatcc gacttctccc tgagcatggt tcaa 44

<210> 44

<211> 45

<212> DNA

<213> 人工序列

<400> 44

gaacgacatg gctacgatcc gacttaagcg agctgtaacc cgttt 45

<210> 45

<211> 47

<212> DNA

<213> 人工序列

<400> 45

gaacgacatg gctacgatcc gacttgctgt accttccttg gaaagag 47

<210> 46

<211> 45

<212> DNA

<213> 人工序列

<400> 46

gaacgacatg gctacgatcc gacttgactg gtgcttctca cctct 45

<210> 47

<211> 50

<212> DNA

<213> 人工序列

<400> 47

gaacgacatg gctacgatcc gacttatgcc atcccatgta agaatgtgtt 50

<210> 48

<211> 45

<212> DNA

<213> 人工序列

<400> 48

gaacgacatg gctacgatcc gacttaggtg ccacggaact gtatt 45

<210> 49

<211> 43

<212> DNA

<213> 人工序列

<400> 49

gaacgacatg gctacgatcc gacttgggcc gtgagactca taa 43

<210> 50

<211> 45

<212> DNA

<213> 人工序列

<400> 50

gaacgacatg gctacgatcc gacttgcctc atggcccaat catac 45

<210> 51

<211> 47

<212> DNA

<213> 人工序列

<400> 51

gaacgacatg gctacgatcc gacttcctcc tgcacattct tctgact 47

<210> 52

<211> 45

<212> DNA

<213> 人工序列

<400> 52

gaacgacatg gctacgatcc gacttcgcac tccagttgat accat 45

<210> 53

<211> 45

<212> DNA

<213> 人工序列

<400> 53

gaacgacatg gctacgatcc gacttagctg cttgctgatc tctga 45

<210> 54

<211> 45

<212> DNA

<213> 人工序列

<400> 54

gaacgacatg gctacgatcc gactttagcg gcagtcctta tctgg 45

<210> 55

<211> 46

<212> DNA

<213> 人工序列

<400> 55

gaacgacatg gctacgatcc gacttcatgg gcaatggttc catcat 46

<210> 56

<211> 43

<212> DNA

<213> 人工序列

<400> 56

gaacgacatg gctacgatcc gacttacgct gaaccaaaga gga 43

<210> 57

<211> 47

<212> DNA

<213> 人工序列

<400> 57

gaacgacatg gctacgatcc gacttgctaa ccattgttgc ctccatc 47

<210> 58

<211> 43

<212> DNA

<213> 人工序列

<400> 58

gaacgacatg gctacgatcc gacttgcagg gatgaccttt agt 43

<210> 59

<211> 45

<212> DNA

<213> 人工序列

<400> 59

gaacgacatg gctacgatcc gactttgacc aaggagtgcc tggta 45

<210> 60

<211> 45

<212> DNA

<213> 人工序列

<400> 60

gaacgacatg gctacgatcc gacttctctg ctggtgacag gacaa 45

<210> 61

<211> 45

<212> DNA

<213> 人工序列

<400> 61

gaacgacatg gctacgatcc gacttccttg ctcatgactc agaac 45

<210> 62

<211> 47

<212> DNA

<213> 人工序列

<400> 62

gaacgacatg gctacgatcc gacttggtcg tcccagagta aatcaac 47

<210> 63

<211> 47

<212> DNA

<213> 人工序列

<400> 63

gaacgacatg gctacgatcc gacttcgcta ctgtcacctg aatgaat 47

Claims

1.一种试剂盒，其特征在于，所述试剂盒包括：第一轮扩增引物、第二轮扩增引物；

2.如权利要求1所述的试剂盒，其特征在于，所述靶标序列包含单核苷酸多态性位点；

所述单核苷酸多态性位点的数量为至少一个，优选为10～50个，更优选为21个；

每个单核苷酸多态性位点对应一组第一上游引物、第一下游引物、第二上游引物。

3.如权利要求1所述的试剂盒，其特征在于，所述第一上游引物的长度为20～30nt；

所述第一下游引物的长度为35～80nt；

所述第二上游引物中，所述与靶标序列相同的核苷酸序列长度为10～30nt；

所述第二上游引物中，所述部分接头序列的核苷酸序列长度为10～45nt。

4.如权利要求1所述的试剂盒，其特征在于，所述所述第一下游引物中，与所述靶标序列反向互补的核苷酸序列的5’端串联至所述部分接头序列的3’端；

所述第二上游引物中，与靶标碱基序列相同的核苷酸序列的5’端串联至所述部分接头序列的3’端；

所述第一下游引物所含有的部分接头序列不同于所述第二上游引物所含有的部分接头序列；

所述第一下游引物中，所述部分接头序列含有如下碱基序列：

CCTAAGACCGCTTGGCCTCCGACTT；

所述第二上游引物中，所述部分接头序列含有如下碱基序列：

GAACGACATGGCTACGATCCGACTT。

5.如权利要求1所述的试剂盒，其特征在于，所述第一上游引物含有表1中奇数编号所示序列中的至少一种；

所述第一下游引物含有表1中偶数编号所示序列中的至少一种。

6.如权利要求1所述的试剂盒，其特征在于，所述第一上游引物含有表1中奇数编号所示序列中的全部；

所述第一下游引物含有表1中偶数编号所示序列中的全部；

所述第二上游引物含有SEQ ID No.43～63所示序列中的至少一种；

优选地，所述第二上游引物含有SEQ ID No.43～63所示序列中的全部；

所述接头序列是指测序接头；

所述试剂盒还包含第三上游引物、第二下游引物；

所述第三上游引物、第二下游引物中均含有分子标签。

7.一种防污染的文库构建方法，其特征在于，包括：

第一轮扩增步骤，包括使用权利要求1～6任意一项所述试剂盒中的第一上游引物、第一下游引物对靶标序列进行第一轮PCR扩增，获得第一轮扩增产物；

第二轮扩增步骤，包括使用权利要求1～6任意一项所述试剂盒中的第二上游引物、第三上游引物、第二下游引物对第一轮扩增产物进行扩增，获得第二轮扩增产物，即为所述文库。该文库可用于上机测序。

8.如权利要求7所述的文库构建方法，其特征在于，第一轮扩增步骤中，还包括对第一轮扩增产物进行纯化，得到纯化后的第一轮扩增产物，然后进行第二轮扩增；

第二轮扩增步骤中，还包括对第二轮扩增产物进行纯化，得到纯化后的第二轮扩增产物，即为所述文库；

所述纯化包括磁珠纯化；

第一轮扩增步骤中，所述靶标序列未经过末端修复、加接头反应。

9.一种污染检测方法，其特征在于，包括：从权利要求7或8所述文库构建方法构建得到的文库上机测序后得到的测序数据中筛查，预测是否存在污染。

10.如权利要求9所述的污染检测方法，其特征在于，包括计算污染比例区间，具体是根据测序数据，统计每个待测样本所有纯合位点上的最小等位基因频率，取平均值，将该值作为污染范围的下限值，将下限值乘以2所得的数值作为污染范围的上限值，该下限值与上限值形成的范围即为待测样本的污染比例区间；

根据上限值与阈值的大小关系，预测待测样本是否存在污染；

如果所述上限值＜阈值，则预测待测样本不存在污染；

如果所述下限值＞阈值，则预测待测样本存在污染；

所述阈值为2％。