CN115247281A

CN115247281A - 一种扩增子文库的制备方法及其应用

Info

Publication number: CN115247281A
Application number: CN202110451861.1A
Authority: CN
Inventors: 吕天琦; 郑建萍
Original assignee: Ningbo Institute of Material Technology and Engineering of CAS; Cixi Institute of Biomedical Engineering CNITECH of CAS
Current assignee: Ningbo Institute of Material Technology and Engineering of CAS; Cixi Institute of Biomedical Engineering CNITECH of CAS
Priority date: 2021-04-25
Filing date: 2021-04-25
Publication date: 2022-10-28

Abstract

本发明公开了一种扩增子文库的制备方法及其应用。所述制备方法包括：根据目标扩增子设计并合成融合引物和通用引物，所述融合引物包括第一测序接头、标签序列、测序引物和根据目标扩增子设计的特异性引物；将融合引物和通用引物按照0.1～10:1的摩尔比混合，形成混合引物；以目标样本的DNA为模板，采用该混合引物对目标样本的DNA进行多重PCR扩增反应，获得目标扩增子文库。本发明的制备方法采用两组引物进行一步多重PCR扩增，大大简化了文库制备的操作步骤，使文库制备过程更加简单、便捷，大幅度降低时间和试剂成本，并且通过使用双标签序列标记避免不同样本文库之间的交叉污染，并能使测序读长增加并提高检测的灵敏度。

Description

一种扩增子文库的制备方法及其应用

技术领域

本发明涉及一种扩增子文库的制备方法及其应用，属于生物检测技术领域。

背景技术

近年来，下一代基因测序技术(Next Generation Sequencing，NGS)作为精准医学领域研究的精尖武器，被称为未来十大改变人类的科技之一。NGS具有高通量、高敏感性、低成本、测序时间短等诸多优势，因此也被称为“高通量测序技术”。目前，高通量测序技术已广泛的应用于动植物以及微生物的基因组、转录组、表观遗传组、蛋白组、代谢组等方面的研究。随着 NGS技术的快速发展也加速了该技术在精准医疗领域的应用，运用NGS技术能够实现对已知或未知致病基因位点进行检测并对肿瘤基因进行精准分型，将有助于更加完整且真实的还原肿瘤等疾病变异的全景，目前NGS技术已被用于癌症基因检测、遗传病和代谢疾病基因筛查与检测等临床应用中。各大测序平台在测序之前都必须通过繁琐的操作步骤使待测样品转换成适合测序平台检测的测序样本，这一转换过程即为文库制备。文库的质量决定了测序数据的准确性，因此文库制备过程是高通量测序中至关重要的一步。以Illumina平台的传统文库制备过程为例，该文库制备过程包括核酸序列片段化或PCR扩增获得扩增子、末端修复、片段筛选、加 A尾、连接测序接头、PCR富集等步骤，人工操作步骤多，需多次纯化以去除非目标片段，文库损失率高，多步操作易导致样品之间的交叉污染，耗时长约6小时，且文库制备成本高，约 400-1000元/例。

发明内容

本发明的主要目的在于提供一种快速、低成本、便捷的扩增子文库的制备方法，以克服现有技术的不足。

本发明的另一目的在于提供一种测序方法。

为实现前述发明目的，本发明采用的技术方案包括：

本发明实施例提供了一种扩增子文库的制备方法，其包括：

根据目标扩增子设计并合成融合引物和通用引物，所述融合引物包括第一测序接头、标签序列、测序引物和根据目标扩增子设计的特异性引物，所述通用引物的序列从5’端至3’端依次由第二测序接头组成，所述通用引物的序列能够实现对融合引物扩增子片段第二测序接头的连接；

将所述融合引物和通用引物按照0.1～10∶1的摩尔比混合，形成混合引物；

以目标样本的DNA为模板，采用所述混合引物对目标样本的DNA进行多重PCR扩增反应，获得目标扩增子文库。

在一些实施例中，所述融合引物的序列从5’端至3’端依次由第一测序接头、标签序列、测序引物和根据目标扩增子设计的特异性引物组成，所述融合引物能够实现对目标序列的特异性扩增并连接样本标签、测序引物和第一测序接头。

在一些实施例中，所述融合引物包括上游融合引物和下游融合引物。

进一步地，所述上游融合引物的序列从5’端至3’端依次包括第一上游测序接头序列、上游标签序列、上游测序引物序列和根据目标扩增子设计的特异性上游引物序列，其中，所述第一上游测序接头序列如SEQ ID NO：1所示，所述上游标签序列如SEQ ID NO：2所示，所述上游测序引物序列如SEQ ID NO：3所示。

进一步地，所述下游融合引物的序列从5’端至3’端依次包括第一下游测序接头序列、下游标签序列、下游测序引物序列和根据目标扩增子设计的特异性下游引物序列，其中，所述第一下游测序接头序列如SEQ ID NO：4所示，所述下游标签序列如SEQ ID NO：5所示，所述下游测序引物序列如SEQ ID NO：6所示。

在一些实施例中，所述通用引物的序列从5’端至3’端依次由第二测序接头组成，所述通用引物的序列能够实现对融合引物扩增子片段第二测序接头的连接。

进一步地，所述多重PCR扩增反应包括一轮多重PCR扩增。

本发明实施例还提供了一种测序方法，其包括：采用前述方法制备的扩增子文库，之后进行测序分析。

较之现有技术，本发明的有益效果在于：

本发明提供的扩增子文库的制备方法采用两组引物进行一步多重PCR扩增，在制备过程中避免使用低效率的连接酶、消化酶等，大大简化了文库制备的操作步骤，使文库制备过程更加简单、便捷，大幅度降低时间和试剂成本，仅需约3小时即可完成文库制备，每例成本约 20～50元；且只需一步简单的纯化步骤，大大降低了因多步纯化导致的文库损失；使用连接有第一测序接头的较长的融合引物实现对目标区域的靶向扩增；使用较短的通用引物实现对目标扩增子的进一步富集，并使目标扩增子连接完整的测序接头，该引物组合的设计使得非目标扩增片段因不含完整测序接头而不会造成测序数据的浪费；通过使用双标签序列标记避免不同样本文库之间的交叉污染，并能使测序读长增加并提高检测的灵敏度。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明中记载的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明一典型实施例中的最终扩增子文库纯化后进行Agilent 4150的检测结果图。

具体实施方式

鉴于现有技术的不足，本案发明人经长期研究和大量实践，得以提出本发明的技术方案，主要是提供一种扩增子文库的制备方法，能够实现目标扩增子文库的简单、快速、高效的制备。如下将对该技术方案、其实施过程及原理等作进一步的解释说明。

本发明实施例的一个方面提供的一种扩增子文库的制备方法，其包括：

在一些实施例中，所述测序文库的制备方法包括：设计并合成融合引物序列和通用引物序列，将融合引物和通用引物按照0.1～10∶1的摩尔比例混合，即可得到多重PCR扩增用的混合引物，以DNA为模板，经过一轮多重PCR扩增获得目标扩增子的测序文库。

在一些实施例中，根据目标扩增子设计融合引物，所述融合引物的序列从5’端至3’端依次由第一测序接头、标签序列、测序引物序列和根据目标扩增子设计的特异性引物序列组成，所述融合引物序列较长，能够实现对目标序列的特异性扩增并连接样本标签、测序引物和第一测序接头；所述测序接头为测序平台兼容接头。

在一些实施例中，所述特异性引物包括特异性上游引物序列和特异性下游引物序列。

在一些更为优选的实施案例之中，所述上游融合引物(PF)的序列从5’端至3’端依次包括第一上游测序接头序列、上游标签序列、上游测序引物序列和根据目标扩增子设计的特异性上游引物序列。其中，所述第一上游测序接头序列具体为：CGACCACCGAGATCTACAC，即如 SEQ ID NO：1所示，所述上游标签序列具体为：TAGATCGC，即如SEQ ID NO：2所示，所述上游测序引物序列具体为：TCGTCGGCAGCGTC，即如SEQ ID NO：3所示。

在一些更为优选的实施案例之中，所述下游融合引物(PR)的序列从5’端至3’端依次包括第一下游测序接头序列、下游标签序列、下游测序引物序列和根据目标扩增子设计的特异性下游引物序列。其中，所述第一下游测序接头序列具体为：CGGCATACGAGAT，即如SEQ ID NO：4所示，所述下游标签序列具体为：TCGCCTTA，即如SEQ ID NO：5所示，所述下游测序引物序列具体为：GTCTCGTGGGCTCGGCATC，即如SEQ ID NO：6所示。

在一些实施例中，当目标扩增子为多种时，所述融合引物序列为多条，并构成融合引物组合。亦即，当目标扩增子为多条时对应多条融合引物，并组成融合引物组合。

在一些实施例中，所述通用引物的序列从5’端至3’端依次由第二测序接头组成，所述通用引物的序列较短，能够实现对融合引物扩增子片段第二测序接头的连接。

在一些实施例中，所述通用引物包括上游通用引物序列和下游通用引物序列。

在一些实施例中，所述上游通用引物序列5’端至3’端为第二上游测序接头序列，所述下游通用引物序列5’端至3’端为第二下游测序接头序列。

在一些优选实施方案中，所述通用引物序列的设计，通用引物的3’端是8-15个碱基与融合引物5’端序列相同。可选的，上游通用引物的序列具体为：AATGATACGGCGACCACC，即如 SEQ ID NO：7所示；下游通用引物的序列具体为：CAAGCAGAAGACGGCATAC，即如SEQ IDNO：8所示。

在一些实施例中，所述测序接头为测序平台兼容的接头引物序列。

在一些实施例中，所述融合引物的第一测序接头序列为全长测序接头的3’端1/2～2/3部分的序列。

在一些实施例中，所述通用引物的第二测序接头序列为全长测序接头的5’端1/2～2/3部分的序列。

进一步地，所述第二测序接头序列的3’端与第一测序接头序列的5’端有8～15个碱基重叠。

在一些实施例中，本发明设计的融合引物和通用引物使得只有目标扩增子才含有完整测序接头，而非目标扩增片段因不含完整测序接头而不会造成测序数据的浪费。

在一些实施例中，所述多重PCR扩增反应仅包括一轮多重PCR扩增，即可得到目标扩增子文库。

在一些优选实施方案中，所述标签序列包括含6～10个碱基的序列，且上游融合引物的标签序列与下游融合引物的标签序列不同。

在一些优选实施方案中，用于构建同一目标样品的多个扩增子文库的融合引物组合中，所选的上游融合引物组合的标签序列相同，下游融合引物组合的标签序列相同。

在一些优选实施方案中，用于构建不同目标样品的扩增子文库的融合引物组合中，所选的上游融合引物组合的标签序列不同，且下游融合引物组合的标签序列不同。

在一些优选实施方案中，所述目标样本的DNA包括外周血游离DNA、新鲜组织的基因组 DNA、福尔马林包埋样本的DNA、经机械打断或酶切片段化的DNA等，但不限于此。

其中，在一些更为优选的实施方案中，本发明提供的一种快速、低成本、便捷的扩增子文库的制备方法，具体包括以下步骤：

(1)根据目标扩增子设计得到特异性上游引物序列与特异性下游引物序列；

(2)根据目标扩增子设计得到融合引物，上游融合引物序列从5’端至3’端依次包括第一上游测序接头序列、上游标签序列、上游测序引物序列和根据目标扩增子设计的特异性上游引物序列；下游融合引物序列从5’端至3’端依次包括第一下游测序接头序列、下游标签序列、下游测序引物序列和根据目标扩增子设计的特异性下游引物序列。当目标扩增子为多条时对应多条融合引物，构成融合引物组合。

(3)设计得到通用引物，上游通用引物序列5’端至3’端是第二上游测序接头序列，下游通用引物序列5’端至3’端是第二下游测序接头序列。

(4)上述测序接头为与测序平台兼容的接头引物，且所述的融合引物的第一测序接头序列为全长测序接头的3’端1/2～2/3部分的序列。

(5)上述通用引物的第二测序接头序列为全长测序接头的5’端1/2～2/3部分的序列。

(6)上述融合引物组合的序列较长，能够实现对目标序列的特异性扩增并连接样本标签、测序引物和第一测序接头；通用引物序列较短，实现对融合引物扩增子片段第二测序接头的连接。

(7)上述融合引物中的标签序列为6-10个碱基的序列，且上游融合引物的标签序列与下游融合引物标签序列不同。用于构建同一个样品的多个扩增子文库的融合引物组合中，所选的上游融合引物组合的标签序列相同，下游融合引物组合的标签序列相同。用于构建不同样品的扩增子文库的融合引物组合中，所选的上游融合引物组合的标签序列不同，且下游融合引物组合的标签序列不同。

(8)上述用于扩增的目标样本的DNA来自外周血游离DNA、新鲜组织的基因组DNA、福尔马林包埋样本的DNA、经机械打断或酶切片段化的DNA。

(9)将上述融合引物和通用引物按照摩尔比为0.1～10∶1的比例进行混合，通过一轮PCR 对目标样本的DNA进行多重PCR扩增，并对扩增子产物进行纯化和质检，即可制得目标扩增子文库。

在一些优选实施方案中，所述目标扩增子的片段大小在150～170bp范围内，且特异引物的 TM值在55-65℃之间。

进一步地，所述多重PCR扩增反应的条件包括：先于94～99℃反应2～5min，使DNA模板变性；进入扩增循环时，先于94～99℃反应10～90s，之后分别于65～70℃、60～65℃、55～60℃、50～55℃各反应2min，完成一个循环，重复循环反应步骤18～28个循环，最后于70～72℃反应2～7min。

在一些优选实施方案中，所述目标扩增子包括但不限于以下20种目标扩增子的任意一种或两种以上的组合：

TP53基因的Chr17：扩增子位置7575064～7675229；

TP53基因的Chr17：扩增子位置7674870～7675029；

TP53基因的Chr17：扩增子位置7673732～7673893；

CCND1基因的Chr11：扩增子位置69648056～69648215；

CCND1基因的Chr11：扩增子位置69651112～69651270；

SOX2基因的Chr3：扩增子位置181712354～181712514；

SOX2基因的Chr3：扩增子位置181712927～181713086；

TP63基因的Chr3：扩增子位置189894206～189894367；

TP63基因的Chr3：扩增子位置189868583～189868746；

EGFR基因的Chr7：扩增子位置55174694～55174853；

EGFR基因的Chr7：扩增子位置55191723～55191886；

NOTCH1基因的Chr9：扩增子位置136503171～136503333；

NOTCH1基因的Chr9：扩增子位置136496063～136496224；

ZNF750基因的Chr17：扩增子位置82832224～82832384；

ZNF750基因的Chr17：扩增子位置82830792～82830951；

ZNF750基因的Chr17：扩增子位置82831667～82831824；

ZNF750基因的Chr17：扩增子位置82831503～82831666；

ZNF750基因的Chr17：扩增子位置48362774～48362941；

RB1基因的Chr13：扩增子位置48362774～48362941；

RB1基因的Chr13：扩增子位置48452974～48453139。

在一些优选实施方案中，根据TP53基因的Chr17：7575064～7675229扩增子设计并合成的特异性上游引物序列如SEQ ID NO：9所示(具体序列为TGCCCTCAACAAGATGTTT)，特异性下游引物序列如SEQ ID NO：10所示(具体序列为GAGCAGCGCTCATGGTG)。

进一步地，根据TP53基因的Chr17：7674870～7675029扩增子设计并合成的特异性上游引物序列如SEQ ID NO：11所示(具体序列为ACGACAGGGCTGGTTGC)，特异性下游引物序列如SEQ ID NO：12所示(具体序列为ATAGGGCACCACCACACTATG)。

进一步地，根据TP53基因的Chr17：7673732～7673893扩增子设计并合成的特异性上游引物序列如SEQ ID NO：13所示(具体序列为CAGGTAGGACCTGATTTCCTTACT)，特异性下游引物序列如SEQ ID NO：14所示(具体序列为GTGAGGCTCCCCTTTCTTG)。

进一步地，根据CCND1基因的Chr11：69648056～69648215扩增子设计并合成的特异性上游引物序列如SEQ ID NO：15所示(具体序列为CAAGGCCTGAACCTGAGGA)，特异性下游引物序列如SEQ ID NO：16所示(具体序列为GGCATTTCCGTGGCACTAG)。

进一步地，根据CCND1基因的Chr11：69651112～69651270扩增子设计并合成的特异性上游引物序列如SEQ ID NO：17所示(具体序列为TCTCAGGACTGCCTCCGG)，特异性下游引物序列如SEQ ID NO：18所示(具体序列为GTCCCGCACGTCGGTG)。

进一步地，根据SOX2基因的Chr3：181712354～181712514扩增子设计并合成的特异性上游引物序列如SEQ ID NO：19所示(具体序列为CGCCCGCATGTACAACAT)，特异性下游引物序列如SEQ ID NO：20所示(具体序列为ACCACACCATGAAGGCATTCA)。

进一步地，根据SOX2基因的Chr3：181712927～181713086扩增子设计并合成的特异性上游引物序列如SEQ ID NO：21所示(具体序列为CGGCGCAGCGCAGAT)，特异性下游引物序列如SEQ ID NO：22所示(具体序列为CGAACCCATGGAGCCAA)。

进一步地，根据TP63基因的Chr3：189894206～189894367扩增子设计并合成的特异性上游引物序列如SEQ ID NO：23所示(具体序列为GATCTGGCAAGTCTGAAAATCC)，特异性下游引物序列如SEQ ID NO：24所示(具体序列为CTCACCCCGGGTCTCACT)。

进一步地，根据TP63基因的Chr3：189868583～189868746扩增子设计并合成的特异性上游引物序列如SEQ ID NO：25所示(具体序列为TTAGTGCTTTAGAAGTGTTCCCA)，特异性下游引物序列如SEQ ID NO：26所示(具体序列为GCAACCATGAACACCCAAG)。

进一步地，根据EGFR基因的Chr7：55174694～55174853扩增子设计并合成的特异性上游引物序列如SEQ ID NO：27所示(具体序列为TAACGTCTTCCTTCTCTCTCTGTCA)，特异性下游引物序列如SEQ ID NO：28所示(具体序列为CATGGACCCCCACACAGC)。

进一步地，根据EGFR基因的Chr7：55191723～55191886扩增子设计并合成的特异性上游引物序列如SEQ ID NO：29所示(具体序列为TGAACTACTTGGAGGACCGTC)，特异性下游引物序列如SEQ ID NO：30所示(具体序列为CCACCTCCTTACTTTGCCTC)。

进一步地，根据NOTCH1基因的Chr9：136503171～136503333扩增子设计并合成的特异性上游引物序列如SEQ ID NO：31所示(具体序列为CAGCTCCATCGTCTACCTGG)，特异性下游引物序列如SEQ ID NO：32所示(具体序列为GCCACACTTACTCTGCACGG)。

进一步地，根据NOTCH1基因的Chr9：136496063～136496224扩增子设计并合成的特异性上游引物序列如SEQ ID NO：33所示(具体序列为TGAGCACCCCTTCCTCAC)，特异性下游引物序列如SEQ ID NO：34所示(具体序列为CGCGCCGTTTACTTGAAG)。

进一步地，根据ZNF750基因的Chr17：82832224～82832384扩增子设计并合成的特异性上游引物序列如SEQ ID NO：35所示(具体序列为AGTATAAATGTTTCCAATGTCCCTT)，特异性下游引物序列如SEQ ID NO：36所示(具体序列为GTTGGTTTGCTTGGGGTC)。

进一步地，根据ZNF750基因的Chr17：82830792～82830951扩增子设计并合成的特异性上游引物序列如SEQ ID NO：37所示(具体序列为CCTTCCAGTCCGGACGAC)，特异性下游引物序列如SEQ ID NO：38所示(具体序列为CCGAGAGATTGAGTGGAAGGTC)。

进一步地，根据ZNF750基因的Chr17：82831667～82831824扩增子设计并合成的特异性上游引物序列如SEQ ID NO：39所示(具体序列为TCACCTTTCCTTCCACCAGA)，特异性下游引物序列如SEQ ID NO：40所示(具体序列为CCAGCCAGCAGGTAAGGC)。

进一步地，根据ZNF750基因的Chr17：82831503～82831666扩增子设计并合成的特异性上游引物序列如SEQ ID NO：41所示(具体序列为GAGCTCGCCTGAGTGTGAC)，特异性下游引物序列如SEQ ID NO：42所示(具体序列为GAATCGGCAGGTTAGAGGGA)。

进一步地，根据ZNF750基因的Chr17：48362774～48362941扩增子设计并合成的特异性上游引物序列如SEQ ID NO：43所示(具体序列为TGGATGTACAATTGTTCTTATCTAA)，特异性下游引物序列如SEQ ID NO：44所示(具体序列为TCATGTTCTTTACAGAGAACTTCA A)。

进一步地，根据RB1基因的Chr13：48362774～48362941扩增子设计并合成的特异性上游引物序列如SEQ ID NO：45所示(具体序列为GTCAGTGACTTTTTTCTTTCAAGGT)，特异性下游引物序列如SEQ ID NO：46所示(具体序列为GCAAATCAATCAAATATACCATGTG)。

进一步地，根据RB1基因的Chr13：48452974～48453139扩增子设计并合成的特异性上游引物序列如SEQ ID NO：47所示(具体序列为TTCATCATGTTTCATATAGGATTCA)，特异性下游引物序列如SEQ ID NO：48所示(具体序列为TGGTCAACATAACATATATTTTGCT)。

在一些优选实施方案中，根据20种目标扩增子设计的上游、下游融合引物序列分别如下：

进一步地，根据TP53基因的Chr17：7575064～7675229扩增子设计并合成的上游融合引物 (PF-1)序列如SEQ ID NO：49所示(具体序列为CGACCACCGAGATCTACACTAGATCGCT CGTCGGCAGCGTCTGCCCTCAACAAGATGTTTT)，下游融合引物(PR-1)序列如SEQ ID NO：69所示(具体序列为CGGCATACGAGATTCGCCTTAGTCTCGTGGGCTCGGCATCGAGC AGCGCTCATGGTG)。

进一步地，根据TP53基因的Chr17：7674870～7675029扩增子设计并合成的上游融合引物 (PF-2)序列如SEQ ID NO：50所示(具体序列为CGACCACCGAGATCTACACTAGATCGCTCGTCGGCAGCGTCACGACAGGGCTGGTTGC)，下游融合引物(PR-2)序列如SEQ ID NO： 70所示(具体序列为CGGCATACGAGATTCGCCTTAGTCTCGTGGGCTCGGCATCATAGGGC ACCACCACACTATG)。

进一步地，根据TP53基因的Chr17：7673732～7673893扩增子设计并合成的上游融合引物 (PF-3)序列如SEQ ID NO：51所示(具体序列为CGACCACCGAGATCTACACTAGATCGCT CGTCGGCAGCGTCCAGGTAGGACCTGATTTCCTTACT)，下游融合引物(PR-3)序列如SE Q ID NO：71所示(具体序列为CGGCATACGAGATTCGCCTTAGTCTCGTGGGCTCGGCATCG TGAGGCTCCCCTTTCTTG)。

进一步地，根据CCND1基因的Chr11：69648056～69648215扩增子设计并合成的上游融合引物(PF-4)序列如SEQ ID NO：52所示(具体序列为CGACCACCGAGATCTACACTAGATCGCTCGTCGGCAGCGTCCAAGGCCTGAACCTGAGGA)，下游融合引物(PR-4)序列如SEQ ID NO：72所示(具体序列为CGGCATACGAGATTCGCCTTAGTCTCGTGGGCTCGGCATCGG CATTTCCGTGGCACTAG)。

进一步地，根据CCND1基因的Chr11：69651112～69651270扩增子设计并合成的上游融合引物(PF-5)序列如SEQ ID NO：53所示(具体序列为CGACCACCGAGATCTACACTAGATCGCTCGTCGGCAGCGTCTCTCAGGACTGCCTCCGG)，下游融合引物(PR-5)序列如SEQ I D NO：73所示(具体序列为CGGCATACGAGATTCGCCTTAGTCTCGTGGGCTCGGCATCGTC CCGCACGTCGGTG)。

进一步地，根据SOX2基因的Chr3：181712354～181712514扩增子设计并合成的上游融合引物(PF-6)序列如SEQ ID NO：54所示(具体序列为CGACCACCGAGATCTACACTAGATCGCTCGTCGGCAGCGTCCGCCCGCATGTACAACAT)，下游融合引物(PR-6)序列如SEQ I D NO：74所示(具体序列为CGGCATACGAGATTCGCCTTAGTCTCGTGGGCTCGGCATCACC ACACCATGAAGGCATTCA)。

进一步地，根据SOX2基因的Chr3：181712927～181713086扩增子设计并合成的上游融合引物(PF-7)序列如SEQ ID NO：55所示(具体序列为CGACCACCGAGATCTACACTAGATCGCTCGTCGGCAGCGTCCGGCGCAGCGCAGAT)，下游融合引物(PR-7)序列如SEQ ID NO： 75所示(具体序列为CGGCATACGAGATTCGCCTTAGTCTCGTGGGCTCGGCATCCGAACCC ATGGAGCCAA)。

进一步地，根据TP63基因的Chr3：189894206～189894367扩增子设计并合成的上游融合引物(PF-8)序列如SEQ ID NO：56所示(具体序列为CGACCACCGAGATCTACACTAGATCGCTCGTCGGCAGCGTCGATCTGGCAAGTCTGAAAATCC)，下游融合引物(PR-8)序列如 SEQ ID NO：76所示(具体序列为CGGCATACGAGATTCGCCTTAGTCTCGTGGGCTCGGCAT CCTCACCCCGGGTCTCACT)。

进一步地，根据TP63基因的Chr3：189868583～189868746扩增子设计并合成的上游融合引物(PF-9)序列如SEQ ID NO：57所示(具体序列为CGACCACCGAGATCTACACTAGATCGCTCGTCGGCAGCGTCTTAGTGCTTTAGAAGTGTTCCCA)，下游融合引物(PR-9)序列如 SEQ ID NO：77所示(具体序列为CGGCATACGAGATTCGCCTTAGTCTCGTGGGCTCGGCATCGCAACCATGAACACCCAAG)。

进一步地，根据EGFR基因的Chr7：55174694～55174853扩增子设计并合成的上游融合引物(PF-10)序列如SEQ ID NO：58所示(具体序列为CGACCACCGAGATCTACACTAGATCGCTCGTCGGCAGCGTCTAACGTCTTCCTTCTCTCTCTGTCA)，下游融合引物(PR-10)序列如SEQ IDNO：78所示(具体序列为CGGCATACGAGATTCGCCTTAGTCTCGTGGGCTCGGCATCCATGGACCCCCACACAGC)。

进一步地，根据EGFR基因的Chr7：55191723～55191886扩增子设计并合成的上游融合引物(PF-11)序列如SEQ ID NO：59所示(具体序列为CGACCACCGAGATCTACACTAGATCGCTCGTCGGCAGCGTCTGAACTACTTGGAGGACCGTC)，下游融合引物(PR-11)序列如SE Q ID NO：79所示(具体序列为CGGCATACGAGATTCGCCTTAGTCTCGTGGGCTCGGCATCCCACCTCCTTACTTTGCCTC)。

进一步地，根据NOTCH1基因的Chr9：136503171～136503333扩增子设计并合成的上游融合引物(PF-12)序列如SEQ ID NO：60所示(具体序列为CGACCACCGAGATCTACACTAGATCGCTCGTCGGCAGCGTCCAGCTCCATCGTCTACCTGG)，下游融合引物(PR-12)序列如 SEQ ID NO：80所示(具体序列为CGGCATACGAGATTCGCCTTAGTCTCGTGGGCTCGGCATCGCCACACTTACTCTGCACGG)。

进一步地，根据NOTCH1基因的Chr9：136496063～136496224扩增子设计并合成的上游融合引物(PF-13)序列如SEQ ID NO：61所示(具体序列为CGACCACCGAGATCTACACTAGATCGCTCGTCGGCAGCGTCTGAGCACCCCTTCCTCAC)，下游融合引物(PR-13)序列如SE Q ID NO：81所示(具体序列为CGGCATACGAGATTCGCCTTAGTCTCGTGGGCTCGGCATCC GCGCCGTTTACTTGAAG)。

进一步地，根据ZNF750基因的Chr17：82832224～82832384扩增子设计并合成的上游融合引物(PF-14)序列如SEQ ID NO：62所示(具体序列为CGACCACCGAGATCTACACTAGATCGCTCGTCGGCAGCGTCAGTATAAATGTTTCCAATGTCCCTT)，下游融合引物(PR-14)序列如SEQ IDNO：82所示(具体序列为CGGCATACGAGATTCGCCTTAGTCTCGTGGGCTCGGCATCGTTGGTTTGCTTGGGGTC)。

进一步地，根据ZNF750基因的Chr17：82830792～82830951扩增子设计并合成的上游融合引物(PF-15)序列如SEQ ID NO：63所示(具体序列为CGACCACCGAGATCTACACTAGATCGCTCGTCGGCAGCGTCCCTTCCAGTCCGGACGAC)，下游融合引物(PR-15)序列如SEQ I D NO：83所示(具体序列为CGGCATACGAGATTCGCCTTAGTCTCGTGGGCTCGGCATCCCGAGAGATTGAGTGGAAGGTC)。

进一步地，根据ZNF750基因的Chr17：82831667～82831824扩增子设计并合成的上游融合引物(PF-16)序列如SEQ ID NO：64所示(具体序列为CGACCACCGAGATCTACACTAGATCGCTCGTCGGCAGCGTCTCACCTTTCCTTCCACCAGA)，下游融合引物(PR-16)序列如SE Q ID NO：84所示(具体序列为CGGCATACGAGATTCGCCTTAGTCTCGTGGGCTCGGCATCC CAGCCAGCAGGTAAGGC)。

进一步地，根据ZNF750基因的Chr17：82831503～82831666扩增子设计并合成的上游融合引物(PF-17)序列如SEQ ID NO：65所示(具体序列为CGACCACCGAGATCTACACTAGATCGCTCGTCGGCAGCGTCGAGCTCGCCTGAGTGTGAC)，下游融合引物(PR-17)序列如SE Q ID NO：85所示(具体序列为CGGCATACGAGATTCGCCTTAGTCTCGTGGGCTCGGCATCG AATCGGCAGGTTAGAGGGA)。

进一步地，根据ZNF750基因的Chr17：48362774～48362941扩增子设计并合成的上游融合引物(PF-18)序列如SEQ ID NO：66所示(具体序列为CGACCACCGAGATCTACACTAGATCGCTCGTCGGCAGCGTCTGGATGTACAATTGTTCTTATCTAA)，下游融合引物(PR-18)序列如SEQ IDNO：86所示(具体序列为CGGCATACGAGATTCGCCTTAGTCTCGTGGGCTCGGCATCTCATGTTCTTTACAGAGAACTTCAA)。

进一步地，根据RB1基因的Chr13：48362774～48362941扩增子设计并合成的上游融合引物(PF-19)序列如SEQ ID NO：67所示(具体序列为CGACCACCGAGATCTACACTAGATCGCTCGTCGGCAGCGTCGTCAGTGACTTTTTTCTTTCAAGGT)，下游融合引物(PR-19)序列如SEQ IDNO：87所示(具体序列为CGGCATACGAGATTCGCCTTAGTCTCGTGGGCTCGGCATCGCAAATCAATCAAATATACCATGTG)。

进一步地，根据RB1基因的Chr13：48452974～48453139扩增子设计并合成的上游融合引物(PF-20)序列如SEQ ID NO：68所示(具体序列为CGACCACCGAGATCTACACTAGATCGCTCGTCGGCAGCGTCTTCATCATGTTTCATATAGGATTCA)，下游融合引物(PR-20)序列如SEQ IDNO：88所示(具体序列为CGGCATACGAGATTCGCCTTAGTCTCGTGGGCTCGGCATCTGGTCAACATAACATATATTTTGCT)。

本发明实施例的另一个方面还提供了一种测序方法，其包括：采用前述方法构建扩增子文库，之后进行测序分析。

藉由上述技术方案，本发明提供的扩增子文库的制备方法采用两组引物进行一步多重PCR 扩增，在制备过程中避免使用低效率的连接酶、消化酶等，大大简化了文库制备的操作步骤，使文库制备过程更加简单、便捷，大幅度降低时间和试剂成本，仅需约3小时即可完成文库制备，每例成本约20～50元；且只需一步简单的纯化步骤，大大降低了因多步纯化导致的文库损失；使用连接有第一测序接头的较长的融合引物实现对目标区域的靶向扩增；使用较短的通用引物实现对目标扩增子的进一步富集，并使目标扩增子连接完整的测序接头，该引物组合的设计使得非目标扩增片段因不含完整测序接头而不会造成测序数据的浪费；通过使用双标签序列标记避免不同样本文库之间的交叉污染，并能使测序读长增加并提高检测的灵敏度。

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及若干较佳实施例对本发明的技术方案做进一步详细说明，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本发明保护的范围。下列实施例中未注明具体条件的试验方法，实施例中的试验方法均按照常规条件进行。此外，下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。

实施例1

本实施例的一种扩增子文库的制备方法，具体步骤如下：

(1)样本基因组DNA提取：所用样本为肿瘤组织的福尔马林包埋样本，使用IonAmpliSeq^TM Direct DNA Kit试剂盒提取样本的基因组DNA，具体实验操作步骤按照说明书进行，使用Nano Drop检测所提基因组DNA的质量，使用Qubit 4.0检测样品基因组DNA的浓度，随后稀释至10ng/μl待用。

(2)来自9个肿瘤易感基因的20种目标扩增子的特异性上游引物序列和特异性下游引物序列的设计，目标扩增子的片段大小在150-170bp范围内，且特异引物的TM值在55-65℃之间。所选目标扩增子的基因信息、染色体定位、上下游特异性引物序列如表1所示。

表1.来自肿瘤9个易感基因的20种扩增子的信息及特异性引物序列

(3)根据目标扩增子设计融合引物，融合引物序列从5’端至3’端依次包括第一测序接头序列、标签序列、测序引物序列和根据目标扩增子设计的特异性引物序列(表2)。上游融合引物(PF)从5’端至3’端的序列依次包括第一上游测序接头序列为：CGACCACCGAGATCTA CAC(如SEQ ID NO：1所示)，上游标签序列为：TAGATCGC(如SEQ ID NO：2所示)，上游测序引物序列为：TCGTCGGCAGCGTC(如SEQ ID NO：3所示)；下游融合引物(PR)从 5’端至3’端的序列依次包括第一下游测序接头序列：CGGCATACGAGAT(如SEQ ID NO：4所示)；下游标签序列：TCGCCTTA(如SEQ ID NO：5所示)；下游测序引物序列：GTCTCGTGGGCTCGGCATC(如SEQ ID NO：6所不)；

表2.根据20种目标扩增子设计的上游融合引物序列、下游融合引物序列

(4)通用引物序列的设计，通用引物的3’端是8-15个碱基与融合引物5’端序列相同。可选的，上游通用引物的序列为：AATGATACGGCGACCACC；下游通用引物的序列为：CAAGCAGAAGACGGCATAC。

(5)将上述融合引物组合和通用引物按照摩尔比为0.1～10∶1的比例进行混合后得到混合引物，并对目标样本的DNA进行多重PCR反应扩增，PCR反应体系如下：

按照如上体系进行PCR反应体系的加样，加样过程在PCR操作柜中进行，之后在Applied Biosystems的Veriti^TM Dx PCR仪上按照如下程序进行PCR扩增。PCR反应程序如下：

(6)扩增产物的纯化

对步骤(5)中获得的PCR扩增子产物使用Agencourt AMPure XP Kit试剂盒进行纯化，整个操作步骤均在PCR操作柜中进行，具体步骤按照如下进行：

1)提前30min将磁珠从4℃取出静置于室温；

2)磁珠涡旋震荡混匀后取25μl于PCR扩增子产物中，涡旋震荡混匀后置于室温孵育5mi n：

3)将PCR管置于磁力架上，静置5min直至溶液澄清，小心转移清液且不碰触磁珠；

4)保持PCR管始终在磁力架上，加入200μl现配置的80％乙醇漂洗磁珠，静置5min后小心转移上清液；

5)重复步骤4)一次；

6)从磁力架上取下PCR管，经短暂离心后再次置于磁力架上，并吸取多余的乙醇，后取下PCR管打开盖子使乙醇挥发，注意不可使磁珠过度干裂；

7)取20μl ddH₂O₂加入PCR管中，涡旋震荡混匀，室温静置5min；

8)将PCR管置于磁力架上，静置5min直至溶液澄清，小心吸取上清液于新的无菌的1.5mL离心管中待用。

(7)纯化产物的质检

取步骤(6)中纯化后的扩增子文库产物2μl使用Naro Drop进行纯度的测定，结果显示合格样品的紫外吸收峰值A260/A280比值在1.8-2.0之间，A260/A230的比值为2.0以上。随后取 1ul的纯化后的扩增子文库产物，在Agilent 4150 Tape Station Systems检测扩增子文库片段的分布，结果如图1显示经多重PCR扩增后得到的扩增子片段大小在260-300bp范围之间，说明本发明实施例成功实现了肿瘤组织样本DNA的目标扩增子文库的制备。

尽管已参考说明性实施例描述了本发明，但所属领域的技术人员将理解，在不背离本发明的精神及范围的情况下可做出各种其它改变、省略及/或添加且可用实质等效物替代所述实施例的元件。另外，可在不背离本发明的范围的情况下做出许多修改以使特定情形或材料适应本发明的教示。因此，本文并不打算将本发明限制于用于执行本发明的所揭示特定实施例，而是打算使本发明将包含归属于所附权利要求书的范围内的所有实施例。

序列表

<110> 中国科学院宁波材料技术与工程研究所慈溪生物医学工程研究所、中国科学院宁波材料技术与工程研究所

<120> 一种扩增子文库的制备方法及其应用

<160> 88

<170> SIPOSequenceListing 1.0

<210> 1

<211> 19

<212> DNA

<213> 人工序列(人工序列)

<400> 1

cgaccaccga gatctacac 19

<210> 2

<211> 8

<212> DNA

<213> 人工序列(人工序列)

<400> 2

tagatcgc 8

<210> 3

<211> 14

<212> DNA

<213> 人工序列(人工序列)

<400> 3

tcgtcggcag cgtc 14

<210> 4

<211> 13

<212> DNA

<213> 人工序列(人工序列)

<400> 4

cggcatacga gat 13

<210> 5

<211> 8

<212> DNA

<213> 人工序列(人工序列)

<400> 5

tcgcctta 8

<210> 6

<211> 19

<212> DNA

<213> 人工序列(人工序列)

<400> 6

gtctcgtggg ctcggcatc 19

<210> 7

<211> 18

<212> DNA

<213> 人工序列(人工序列)

<400> 7

aatgatacgg cgaccacc 18

<210> 8

<211> 19

<212> DNA

<213> 人工序列(人工序列)

<400> 8

caagcagaag acggcatac 19

<210> 9

<211> 19

<212> DNA

<213> 人工序列(人工序列)

<400> 9

tgccctcaac aagatgttt 19

<210> 10

<211> 17

<212> DNA

<213> 人工序列(人工序列)

<400> 10

gagcagcgct catggtg 17

<210> 11

<211> 17

<212> DNA

<213> 人工序列(人工序列)

<400> 11

acgacagggc tggttgc 17

<210> 12

<211> 21

<212> DNA

<213> 人工序列(人工序列)

<400> 12

atagggcacc accacactat g 21

<210> 13

<211> 24

<212> DNA

<213> 人工序列(人工序列)

<400> 13

caggtaggac ctgatttcct tact 24

<210> 14

<211> 19

<212> DNA

<213> 人工序列(人工序列)

<400> 14

gtgaggctcc cctttcttg 19

<210> 15

<211> 19

<212> DNA

<213> 人工序列(人工序列)

<400> 15

caaggcctga acctgagga 19

<210> 16

<211> 19

<212> DNA

<213> 人工序列(人工序列)

<400> 16

ggcatttccg tggcactag 19

<210> 17

<211> 18

<212> DNA

<213> 人工序列(人工序列)

<400> 17

tctcaggact gcctccgg 18

<210> 18

<211> 18

<212> DNA

<213> 人工序列(人工序列)

<400> 18

tctcaggact gcctccgg 18

<210> 19

<211> 18

<212> DNA

<213> 人工序列(人工序列)

<400> 19

cgcccgcatg tacaacat 18

<210> 20

<211> 21

<212> DNA

<213> 人工序列(人工序列)

<400> 20

accacaccat gaaggcattc a 21

<210> 21

<211> 15

<212> DNA

<213> 人工序列(人工序列)

<400> 21

cggcgcagcg cagat 15

<210> 22

<211> 17

<212> DNA

<213> 人工序列(人工序列)

<400> 22

cgaacccatg gagccaa 17

<210> 23

<211> 22

<212> DNA

<213> 人工序列(人工序列)

<400> 23

gatctggcaa gtctgaaaat cc 22

<210> 24

<211> 18

<212> DNA

<213> 人工序列(人工序列)

<400> 24

ctcaccccgg gtctcact 18

<210> 25

<211> 23

<212> DNA

<213> 人工序列(人工序列)

<400> 25

ttagtgcttt agaagtgttc cca 23

<210> 26

<211> 19

<212> DNA

<213> 人工序列(人工序列)

<400> 26

gcaaccatga acacccaag 19

<210> 27

<211> 25

<212> DNA

<213> 人工序列(人工序列)

<400> 27

taacgtcttc cttctctctc tgtca 25

<210> 28

<211> 18

<212> DNA

<213> 人工序列(人工序列)

<400> 28

catggacccc cacacagc 18

<210> 29

<211> 21

<212> DNA

<213> 人工序列(人工序列)

<400> 29

tgaactactt ggaggaccgt c 21

<210> 30

<211> 20

<212> DNA

<213> 人工序列(人工序列)

<400> 30

ccacctcctt actttgcctc 20

<210> 31

<211> 20

<212> DNA

<213> 人工序列(人工序列)

<400> 31

cagctccatc gtctacctgg 20

<210> 32

<211> 20

<212> DNA

<213> 人工序列(人工序列)

<400> 32

gccacactta ctctgcacgg 20

<210> 33

<211> 18

<212> DNA

<213> 人工序列(人工序列)

<400> 33

tgagcacccc ttcctcac 18

<210> 34

<211> 18

<212> DNA

<213> 人工序列(人工序列)

<400> 34

cgcgccgttt acttgaag 18

<210> 35

<211> 25

<212> DNA

<213> 人工序列(人工序列)

<400> 35

agtataaatg tttccaatgt ccctt 25

<210> 36

<211> 18

<212> DNA

<213> 人工序列(人工序列)

<400> 36

gttggtttgc ttggggtc 18

<210> 37

<211> 18

<212> DNA

<213> 人工序列(人工序列)

<400> 37

ccttccagtc cggacgac 18

<210> 38

<211> 22

<212> DNA

<213> 人工序列(人工序列)

<400> 38

ccgagagatt gagtggaagg tc 22

<210> 39

<211> 20

<212> DNA

<213> 人工序列(人工序列)

<400> 39

tcacctttcc ttccaccaga 20

<210> 40

<211> 18

<212> DNA

<213> 人工序列(人工序列)

<400> 40

ccagccagca ggtaaggc 18

<210> 41

<211> 19

<212> DNA

<213> 人工序列(人工序列)

<400> 41

gagctcgcct gagtgtgac 19

<210> 42

<211> 20

<212> DNA

<213> 人工序列(人工序列)

<400> 42

gaatcggcag gttagaggga 20

<210> 43

<211> 25

<212> DNA

<213> 人工序列(人工序列)

<400> 43

tggatgtaca attgttctta tctaa 25

<210> 44

<211> 25

<212> DNA

<213> 人工序列(人工序列)

<400> 44

tcatgttctt tacagagaac ttcaa 25

<210> 45

<211> 25

<212> DNA

<213> 人工序列(人工序列)

<400> 45

gtcagtgact tttttctttc aaggt 25

<210> 46

<211> 25

<212> DNA

<213> 人工序列(人工序列)

<400> 46

gcaaatcaat caaatatacc atgtg 25

<210> 47

<211> 25

<212> DNA

<213> 人工序列(人工序列)

<400> 47

ttcatcatgt ttcatatagg attca 25

<210> 48

<211> 25

<212> DNA

<213> 人工序列(人工序列)

<400> 48

tggtcaacat aacatatatt ttgct 25

<210> 49

<211> 61

<212> DNA

<213> 人工序列(人工序列)

<400> 49

cgaccaccga gatctacact agatcgctcg tcggcagcgt ctgccctcaa caagatgttt 60

t 61

<210> 50

<211> 58

<212> DNA

<213> 人工序列(人工序列)

<400> 50

cgaccaccga gatctacact agatcgctcg tcggcagcgt cacgacaggg ctggttgc 58

<210> 51

<211> 65

<212> DNA

<213> 人工序列(人工序列)

<400> 51

cgaccaccga gatctacact agatcgctcg tcggcagcgt ccaggtagga cctgatttcc 60

ttact 65

<210> 52

<211> 60

<212> DNA

<213> 人工序列(人工序列)

<400> 52

cgaccaccga gatctacact agatcgctcg tcggcagcgt ccaaggcctg aacctgagga 60

<210> 53

<211> 59

<212> DNA

<213> 人工序列(人工序列)

<400> 53

cgaccaccga gatctacact agatcgctcg tcggcagcgt ctctcaggac tgcctccgg 59

<210> 54

<211> 59

<212> DNA

<213> 人工序列(人工序列)

<400> 54

cgaccaccga gatctacact agatcgctcg tcggcagcgt ccgcccgcat gtacaacat 59

<210> 55

<211> 56

<212> DNA

<213> 人工序列(人工序列)

<400> 55

cgaccaccga gatctacact agatcgctcg tcggcagcgt ccggcgcagc gcagat 56

<210> 56

<211> 63

<212> DNA

<213> 人工序列(人工序列)

<400> 56

cgaccaccga gatctacact agatcgctcg tcggcagcgt cgatctggca agtctgaaaa 60

tcc 63

<210> 57

<211> 64

<212> DNA

<213> 人工序列(人工序列)

<400> 57

cgaccaccga gatctacact agatcgctcg tcggcagcgt cttagtgctt tagaagtgtt 60

ccca 64

<210> 58

<211> 66

<212> DNA

<213> 人工序列(人工序列)

<400> 58

cgaccaccga gatctacact agatcgctcg tcggcagcgt ctaacgtctt ccttctctct 60

ctgtca 66

<210> 59

<211> 62

<212> DNA

<213> 人工序列(人工序列)

<400> 59

cgaccaccga gatctacact agatcgctcg tcggcagcgt ctgaactact tggaggaccg 60

tc 62

<210> 60

<211> 61

<212> DNA

<213> 人工序列(人工序列)

<400> 60

cgaccaccga gatctacact agatcgctcg tcggcagcgt ccagctccat cgtctacctg 60

g 61

<210> 61

<211> 59

<212> DNA

<213> 人工序列(人工序列)

<400> 61

cgaccaccga gatctacact agatcgctcg tcggcagcgt ctgagcaccc cttcctcac 59

<210> 62

<211> 66

<212> DNA

<213> 人工序列(人工序列)

<400> 62

cgaccaccga gatctacact agatcgctcg tcggcagcgt cagtataaat gtttccaatg 60

tccctt 66

<210> 63

<211> 59

<212> DNA

<213> 人工序列(人工序列)

<400> 63

cgaccaccga gatctacact agatcgctcg tcggcagcgt cccttccagt ccggacgac 59

<210> 64

<211> 61

<212> DNA

<213> 人工序列(人工序列)

<400> 64

cgaccaccga gatctacact agatcgctcg tcggcagcgt ctcacctttc cttccaccag 60

a 61

<210> 65

<211> 60

<212> DNA

<213> 人工序列(人工序列)

<400> 65

cgaccaccga gatctacact agatcgctcg tcggcagcgt cgagctcgcc tgagtgtgac 60

<210> 66

<211> 66

<212> DNA

<213> 人工序列(人工序列)

<400> 66

cgaccaccga gatctacact agatcgctcg tcggcagcgt ctggatgtac aattgttctt 60

atctaa 66

<210> 67

<211> 66

<212> DNA

<213> 人工序列(人工序列)

<400> 67

cgaccaccga gatctacact agatcgctcg tcggcagcgt cgtcagtgac ttttttcttt 60

caaggt 66

<210> 68

<211> 66

<212> DNA

<213> 人工序列(人工序列)

<400> 68

cgaccaccga gatctacact agatcgctcg tcggcagcgt cttcatcatg tttcatatag 60

gattca 66

<210> 69

<211> 57

<212> DNA

<213> 人工序列(人工序列)

<400> 69

cggcatacga gattcgcctt agtctcgtgg gctcggcatc gagcagcgct catggtg 57

<210> 70

<211> 61

<212> DNA

<213> 人工序列(人工序列)

<400> 70

cggcatacga gattcgcctt agtctcgtgg gctcggcatc atagggcacc accacactat 60

g 61

<210> 71

<211> 59

<212> DNA

<213> 人工序列(人工序列)

<400> 71

cggcatacga gattcgcctt agtctcgtgg gctcggcatc gtgaggctcc cctttcttg 59

<210> 72

<211> 59

<212> DNA

<213> 人工序列(人工序列)

<400> 72

cggcatacga gattcgcctt agtctcgtgg gctcggcatc ggcatttccg tggcactag 59

<210> 73

<211> 56

<212> DNA

<213> 人工序列(人工序列)

<400> 73

cggcatacga gattcgcctt agtctcgtgg gctcggcatc gtcccgcacg tcggtg 56

<210> 74

<211> 61

<212> DNA

<213> 人工序列(人工序列)

<400> 74

cggcatacga gattcgcctt agtctcgtgg gctcggcatc accacaccat gaaggcattc 60

a 61

<210> 75

<211> 57

<212> DNA

<213> 人工序列(人工序列)

<400> 75

cggcatacga gattcgcctt agtctcgtgg gctcggcatc cgaacccatg gagccaa 57

<210> 76

<211> 58

<212> DNA

<213> 人工序列(人工序列)

<400> 76

cggcatacga gattcgcctt agtctcgtgg gctcggcatc ctcaccccgg gtctcact 58

<210> 77

<211> 59

<212> DNA

<213> 人工序列(人工序列)

<400> 77

cggcatacga gattcgcctt agtctcgtgg gctcggcatc gcaaccatga acacccaag 59

<210> 78

<211> 58

<212> DNA

<213> 人工序列(人工序列)

<400> 78

cggcatacga gattcgcctt agtctcgtgg gctcggcatc catggacccc cacacagc 58

<210> 79

<211> 60

<212> DNA

<213> 人工序列(人工序列)

<400> 79

cggcatacga gattcgcctt agtctcgtgg gctcggcatc ccacctcctt actttgcctc 60

<210> 80

<211> 60

<212> DNA

<213> 人工序列(人工序列)

<400> 80

cggcatacga gattcgcctt agtctcgtgg gctcggcatc gccacactta ctctgcacgg 60

<210> 81

<211> 58

<212> DNA

<213> 人工序列(人工序列)

<400> 81

cggcatacga gattcgcctt agtctcgtgg gctcggcatc cgcgccgttt acttgaag 58

<210> 82

<211> 58

<212> DNA

<213> 人工序列(人工序列)

<400> 82

cggcatacga gattcgcctt agtctcgtgg gctcggcatc gttggtttgc ttggggtc 58

<210> 83

<211> 62

<212> DNA

<213> 人工序列(人工序列)

<400> 83

cggcatacga gattcgcctt agtctcgtgg gctcggcatc ccgagagatt gagtggaagg 60

tc 62

<210> 84

<211> 58

<212> DNA

<213> 人工序列(人工序列)

<400> 84

cggcatacga gattcgcctt agtctcgtgg gctcggcatc ccagccagca ggtaaggc 58

<210> 85

<211> 60

<212> DNA

<213> 人工序列(人工序列)

<400> 85

cggcatacga gattcgcctt agtctcgtgg gctcggcatc gaatcggcag gttagaggga 60

<210> 86

<211> 65

<212> DNA

<213> 人工序列(人工序列)

<400> 86

cggcatacga gattcgcctt agtctcgtgg gctcggcatc tcatgttctt tacagagaac 60

ttcaa 65

<210> 87

<211> 65

<212> DNA

<213> 人工序列(人工序列)

<400> 87

cggcatacga gattcgcctt agtctcgtgg gctcggcatc gcaaatcaat caaatatacc 60

atgtg 65

<210> 88

<211> 65

<212> DNA

<213> 人工序列(人工序列)

<400> 88

cggcatacga gattcgcctt agtctcgtgg gctcggcatc tggtcaacat aacatatatt 60

ttgct 65

Claims

1.一种扩增子文库的制备方法，其特征在于包括：

将所述融合引物和通用引物按照0.1～10:1的摩尔比混合，形成混合引物；

2.根据权利要求1所述的制备方法，其特征在于：所述融合引物的序列从5’端至3’端依次由第一测序接头、标签序列、测序引物和根据目标扩增子设计的特异性引物组成，所述融合引物能够实现对目标序列的特异性扩增并连接样本标签、测序引物和第一测序接头；

和/或，所述特异性引物包括特异性上游引物序列和特异性下游引物序列。

3.根据权利要求2所述的制备方法，其特征在于：所述融合引物包括上游融合引物和下游融合引物，所述上游融合引物的序列从5’端至3’端依次包括第一上游测序接头序列、上游标签序列、上游测序引物序列和根据目标扩增子设计的特异性上游引物序列，其中，所述第一上游测序接头序列如SEQ ID NO:1所示，所述上游标签序列如SEQ ID NO:2所示，所述上游测序引物序列如SEQ ID NO:3所示；

所述下游融合引物的序列从5’端至3’端依次包括第一下游测序接头序列、下游标签序列、下游测序引物序列和根据目标扩增子设计的特异性下游引物序列，其中，所述第一下游测序接头序列如SEQ ID NO:4所示，所述下游标签序列如SEQ ID NO:5所示，所述下游测序引物序列如SEQ ID NO:6所示；

和/或，当目标扩增子为多种时，所述融合引物序列为多条，并构成融合引物组合。

4.根据权利要求2所述的制备方法，其特征在于：所述通用引物包括上游通用引物序列和下游通用引物序列，所述上游通用引物序列5’端至3’端为第二上游测序接头序列，所述下游通用引物序列5’端至3’端为第二下游测序接头序列。

5.根据权利要求4所述的制备方法，其特征在于：所述上游通用引物序列如SEQ ID NO:7所示，所述下游通用引物序列如SEQ ID NO:8所示。

6.根据权利要求2所述的制备方法，其特征在于：所述第一测序接头为测序平台兼容的接头引物序列；和/或，所述融合引物的第一测序接头序列为全长测序接头的3’端1/2～2/3部分的序列；和/或，所述通用引物的第二测序接头序列为全长测序接头的5’端1/2～2/3部分的序列；和/或，所述第二测序接头序列的3’端与第一测序接头序列的5’端有8～15个碱基重叠。

7.根据权利要求3所述的制备方法，其特征在于：所述标签序列包括含6～10个碱基的序列，且上游融合引物的标签序列与下游融合引物的标签序列不同；

和/或，用于构建同一目标样品的多个扩增子文库的融合引物组合中，所选的上游融合引物组合的标签序列相同，下游融合引物组合的标签序列相同；

和/或，用于构建不同目标样品的扩增子文库的融合引物组合中，所选的上游融合引物组合的标签序列不同，且下游融合引物组合的标签序列不同。

8.根据权利要求1所述的制备方法，其特征在于：所述多重PCR扩增反应包括一轮多重PCR扩增；

和/或，所述目标样本的DNA包括外周血游离DNA、新鲜组织的基因组DNA、福尔马林包埋样本的DNA、经机械打断或酶切片段化的DNA。

9.根据权利要求1所述的制备方法，其特征在于，所述多重PCR扩增反应的条件包括：先于94～99℃反应2～5min，使DNA模板变性；进入扩增循环时，先于94～99℃反应10～90s，之后分别于65～70℃、60～65℃、55～60℃、50～55℃各反应2min，完成一个循环，重复循环反应步骤18～28个循环，最后于70～72℃反应2～7min。

10.一种测序方法，其特征在于包括：采用权利要求1-9中任一项所述的方法制备扩增子文库，之后进行测序分析。