WO2024119481A1

WO2024119481A1 - 一种快速制备多重pcr测序文库的方法及其应用

Info

Publication number: WO2024119481A1
Application number: PCT/CN2022/137939
Authority: WO
Inventors: 杨林; 张艳艳; 刘锋; 夏军; 陈芳
Original assignee: 深圳华大智造科技股份有限公司
Priority date: 2022-12-09
Filing date: 2022-12-09
Publication date: 2024-06-13

Abstract

一种快速制备多重PCR测序文库的方法及其应用。该寡核酸组合，包含：特异性寡核酸和通用引物；通过将特异性寡核酸的3'端定为通用序列，5'端定为特异性序列，并且位于特异性寡核酸的3端的通用序列与通用引物的3'端互补，通用引物的3'端在聚合酶的作用下的延伸，得到5'端含有通用序列，3'端含有特异性序列的产物，该产物3'端可以和待测目标区域互补，在聚合酶的作用下对目标区域进行扩增，扩增得到含有通用序列和待测目标序列的产物；由于3'端是单一的固定序列，能够有效避免互补结构的形成和二聚体的产生。

Description

一种快速制备多重PCR测序文库的方法及其应用

技术领域

本发明属于多重PCR扩增技术领域，具体涉及一种快速制备多重PCR测序文库的方法及其应用。

背景技术

随着测序技术的发展，对基因组候选区段的重测序需求日益增加，人们对序列的关注超过了少数的SNP，候选区段的范围可能在5kb～10M之间。使用传统sanger法或全基因组测序价格昂贵，使用目标区域捕获测序很好地解决了这一难题。相对于全基因组测序，目标捕获测序技术在大样本量筛查的同时极大地降低成本。目标区域捕获技术可大致分为两种：一种基于杂交的捕获测序技术，另外一种基于多重PCR的捕获技术。两者通过多重探针或者引物对感兴趣的基因区域一次性捕获，结合高通量测序技术，多样本同时测序，得到目标区域的序列信息。但前者的实验流程繁琐，探针成本较高，限制了其在临床上的应用，后者实验操作简单，灵活性强，适用于孟德尔遗传性疾病的筛查和诊断、GWAS候选区段重测序、QTL定位区段重测序、精准医疗研究与应用。

高通量SNP检测服务结合多重PCR和高通量测序技术，对需要检测的位点设计特异性引物，在单管内进行多重PCR扩增，不同的样本以不同的标签(barcode)引物区分。混合样本后，在测序平台上，对扩增子进行测序，测序结果使用生物信息学方法，区分不同样本，最终获得每个位点的SNP信息。该方法适用于不同目的遗传学研究，例如疾病基因组研究、肿瘤基因组研究、疾病与基因的关联研究、临床分子诊断等，在植物基因组研究中，可用于QTL定位及分子育种，非常适合大规模样本的SNP分析。

虽然多重PCR实验操作简单、单个检测成本很低，但其在实验前期需要对多对引物进行反复测试优化，费时费力。特别是在超高重的PCR中，引物序列的复杂性使得引物很容易形成引物二聚体。引物二聚体的形成会急剧消耗PCR反应体系中的原料，导致PCR很快达到平台期；形成的引物二聚体在后续的测序中也会被测序，形成无效数据，影响数据的利用效率。最严重的是那些容易形成引物二聚体的引物，会严重影响该引物对应的目标扩增区域的扩增效率，导致该目标测序深度低，最终影响整个扩增体系的均一性，此外，引物的特异性也极大地影响了多重扩增的性能。

在多重扩增中随着引物对数的增加，引物3'端多样性增加，提高了引物之间形成互补结构的可能性，在聚合酶的作用下形成二聚体。很多公司通过额外的酶处理对过多的引物二聚体进行消除，如Life公司的Ampliseq技术，先采用一步特异性扩增，然后通过酶消化掉引物二聚体和扩增子中的特异性引物序列，最后对产物进行文库制备，整个过程繁琐。后来Paragon公司发明了Clean Plex二聚体消除技术，采用特定的酶只消除多重PCR过程中的引物二聚体，同样解决了引物二聚体生成的问题。得到的产物再采用通用引物进行通用扩增，完成文库的制备，但是整个过程操作步骤还是过多。

发明内容

本发明第一方面的目的，在于提供寡核酸组合。

本发明第二方面的目的，在于提供一种用于多重PCR测序文库制备的试剂盒。

本发明第三方面的目的，在于提供一种测序试剂套装。

本发明第四方面的目的，在于提供一种测序系统。

本发明第五方面的目的，在于提供一种多重PCR扩增方法。

本发明第六方面的目的，在于提供一种制备多重PCR测序文库的方法。

本发明第七方面的目的，在于提供一种测序方法。

本发明第八方面的目的，在于提供一种对目标区域基因位点检测的方法。

本发明第九方面的目的，在于提供第一方面的寡核酸组合、第二方面的试剂盒、第三方面的测序试剂套装或第四方面的测序系统的应用。

为了实现上述目的，本发明所采取的技术方案是：

本发明的第一个方面，提供寡核酸组合。

一、寡核酸组合，包含：特异性寡核酸和通用引物；

所述通用引物包含：第一通用引物和第二通用引物；

所述特异性寡核酸包含：上游特异性寡核酸和下游特异性寡核酸；

所述特异性寡核酸包含：特异性序列和通用序列；

所述上游特异性寡核酸包含：上游特异性序列和第一通用序列，其中，所述上游特异性序列位于所述上游特异性寡核酸的5'端，所述第一通用序列位于所述上游特异性寡核酸的3'端；

所述下游特异性寡核酸包含：下游特异性序列和第二通用序列，其中，所述下游特异性序列位于所述下游特异性寡核酸的5'端，所述第二通用序列位于所述下游特异性寡核酸的3'端；

1)所述第一通用引物的3'端序列与所述上游特异性寡核酸的第一通用序列的部分序列或全部序列互补，所述第二通用引物的3'端序列与所述下游特异性寡核酸的第二通用序列的部分序列或全部序列互补；或

2)所述第二通用引物的3'端序列与所述上游特异性寡核酸的第一通用序列的部分序列或全部序列互补，所述第一通用引物的3'端序列与所述下游特异性寡核酸的第二通用序列的部分序列或全部序列互补。

二、寡核酸组合，包含：特异性寡核酸、第二引物和通用引物；

所述通用引物包含：第一通用引物；

所述特异性寡核酸包含：特异性序列和通用序列，其中，所述特异性序列位于所述特异性寡核酸的5'端，所述通用序列位于所述特异性寡核酸的3'端；

所述特异性序列为第一特异性序列，所述通用序列为第一通用序列；

所述第二引物包含：第二特异性序列和第二通用序列，其中，所述第二特异性序列位于所述第二引物的3'端，所述第二通用序列位于所述第二引物的5'端；

所述第一通用引物的3'端序列与所述特异性寡核酸的第一通用序列的部分序列或全部序列互补。

针对上述第二点的寡核酸组合(即“二、寡核酸组合”)，所述寡核酸组合包含或不包含第二通用引物：

(一)所述寡核酸组合不包含第二通用引物时：

优选地，所述第二引物还包含功能核酸序列。

优选地，所述第二引物包含测序引物序列或测序引物互补序列。

优选地，所述第二引物还包含第三标签序列。

优选地，所述第三标签序列位于所述测序引物序列或测序引物互补序列的中间。

(二)所述寡核酸组合包含第二通用引物时：

优选地，所述通用引物进一步包含：第二通用引物；所述第二通用引物的3'端与所述第二引物的第二通用序列的部分序列或全部序列相同。

本发明的一个实施例，所述第一特异性序列为上游特异性序列，所述第二特异性序列为下游特异性序列；

本发明的另一个实施例，所述第一特异性序列为下游特异性序列，所述第二特异性序列为上游特异性序列。

针对上述第一点的寡核酸组合(即“一、寡核酸组合”)和第二点中包含第二通用引物的寡核酸组合(即“二、寡核酸组合--(二)所述寡核酸组合包含第二通用引物”)：

优选地，所述第二通用引物包含功能核酸序列。

优选地，所述第二通用引物包含测序引物序列或测序引物互补序列。

优选地，所述第二通用引物还包含第二标签序列。

优选地，所述第二标签序列位于所述测序引物序列或测序引物互补序列的中间。

针对上述第一点和第二点的寡核酸组合(即“一、寡核酸组合”和“二、寡核酸组合”)：

优选地，所述第一通用引物包含功能核酸序列。

优选地，所述第一通用引物包含测序引物序列或测序引物互补序列。

优选地，所述第一通用引物包含一段或多段测序引物序列或测序引物互补序列。

优选地，所述第一通用引物还包含第一标签序列。

优选地，所述第一标签序列位于所述测序引物序列或测序引物互补序列的中间。

优选地，所述第一通用序列与所述第二通用序列相同或不同；进一步优选地，所述第一通用序列与所述第二通用序列不同。

优选地，所述特异性寡核酸的通用序列的3'端进行阻断修饰。

优选地，所述阻断修饰包含：磷酸化修饰、间臂修饰、氨基修饰中的至少一种；进一步优选地，所述阻断修饰包含：磷酸化修饰。

优选地，所述特异性寡核酸中的特异性序列的设计遵循常规的引物设计原则，但是和常规的引物序列反向互补，比如：上游特异性序列与待测目标区域上游负链序列相同或正链互补，下游特异性序列与待测目标区域的下游正链序列相同或负链序列互补。

优选地，所述第二引物的第二特异性序列的设计遵循常规的引物设计原则，与常规的引物序列相同。

优选地，所述特异性寡核酸包含多组靶向不同的待测目标区域的多条特异性寡核酸。

优选地，所述第二引物包含多组靶向不同的待测目标区域的多条第二引物。

优选地，所述第一标签序列、第二标签序列和第三标签序列可以是相同也可以是不同。

优选地，1)所述第一通用引物的5'端含有磷酸基团，通过第一通用引物可以使得扩增的产物的5'端带有磷酸基团，从而避免专门进行磷酸化的过高成本；或

所述第二通用引物的5'端含有磷酸基团，通过第二通用引物可以使得扩增的产物的5'端带有磷酸基团，从而避免专门进行磷酸化的过高成本。

针对上述第二点中不包含第二通用引物的寡核酸组合(即“二、寡核酸组合--(一)所述寡核酸组合不包含第二通用引物”)：

优选地，所述第一通用引物的5'端含有磷酸基团，通过第一通用引物可以使得扩增的产物的5'端带有磷酸基团，从而避免专门进行磷酸化的过高成本。

本发明的第二个方面，提供用于多重PCR测序文库制备的试剂盒，包含：本发明第一个方面的多组寡核酸组合。

其中，所述多组至少为两组，优选两组以上。

优选地，所述试剂盒还包含：DNA聚合酶、Mg ²⁺、PCR缓冲液、dNTPs中的至少一种。

优选地，所述试剂盒包含：核酸提取试剂，其中所述核酸提取试剂为：裂解试剂。

优选地，所述试剂盒包含核酸提取试剂组合，选自以下任意一种方法的核酸提取试剂组合：碱裂解法、酚氯仿抽提法、螯合树脂法、离心柱膜吸附法以及磁珠法。

本发明的第三个方面，提供一种测序试剂套装，包含：采用本发明第一个方面的寡核酸组合和/或本发明第二个方面的试剂盒。

优选地，所述测序试剂套装还包含：测序试剂盒。

本发明的第四个方面，提供一种测序系统，包含：a1)至a3)中至少一种和测序仪：

a1)本发明第一个方面的寡核酸组合；

a2)本发明第二个方面的试剂盒；

a3)本发明第三个方面的测序试剂套装。

本发明的第五个方面，提供一种多重PCR扩增方法，包含采用本发明第一个方面的多组寡核酸组合的步骤。

优选地，所述多重PCR扩增方法包括如下步骤：获得生物样本，利用本发明第一个方面的多组寡核酸组合对生物样本进行扩增反应，其中所述扩增反应在同一体系中进行。

其中，所述多组至少为两组，优选两组以上。

优选地，所述同一体系具体为不进行洗脱和/或纯化处理。

优选地，所述生物样本是：细胞、组织、体液、微生物、唾液、尿液、痰液、粪便、咽拭子、鼻拭子、核酸中的至少一种。

优选地，所述生物样本为核酸时，所述多重PCR扩增方法不包含裂解反应，仅进行扩增反应。

优选地，所述生物样本是：细胞、组织、体液、微生物、唾液、尿液、痰液、粪便、咽拭子、鼻拭子中的至少一种时，所述多重PCR扩增方法还可以包含裂解反应。

优选地，所述裂解反应和所述扩增反应在同一体系中进行。

优选地，所述裂解反应后、扩增反应前不包含提取纯化步骤。

优选地，所述裂解反应后、扩增反应前还包含提取纯化步骤。

优选地，所述提取纯化进一步包含：沉淀核酸或吸附核酸。

优选地，所述提取纯化后还包含：洗脱或溶解核酸。

优选地，所述裂解的方法包含：物理方式、化学方式、生物方式中的至少一种。

本发明的第六个方面，提供一种制备多重PCR测序文库的方法，包含本发明第五个方面的多重PCR扩增方法的步骤，得到测序文库。

优选地，得到测序文库前还可以包括环化反应，即对扩增得到的线性文库进行环化。

优选地，所述方法还包括如下步骤：对测序文库进行纯化。

优选地，所述纯化采用磁珠进行。

本发明的第七个方面，提供一种测序方法，包含b1)至b2)中任一种：

b1)本发明第五个方面的多重PCR扩增方法的步骤；

b2)本发明第六个方面的制备多重PCR测序文库的方法的步骤。

优选地，所述测序方法包括如下步骤：制备文库，测序；

所述制备文库的方法为本发明第六个方面的制备多重PCR测序文库的方法。

优选地，所述测序前还包括如下步骤：文库质检。

本发明的第八个方面，提供一种对目标区域基因位点检测的方法，包含b1)至b3)中任一种：

b1)本发明第五个方面的多重PCR扩增方法的步骤；

b2)本发明第六个方面的制备多重PCR测序文库的方法的步骤；

b3)本发明第七个方面的测序方法。

优选地，所述对目标区域基因位点检测的方法包括如下步骤：获得目标区域的测序文库；获得测序数据；确定目标区域基因位点；

所述获得目标区域的测序文库的方法包含b1)或b2)：

b1)本发明第五个方面的多重PCR扩增方法的步骤；

b2)本发明第六个方面的制备多重PCR测序文库的方法的步骤。

优选地，所述对目标区域基因位点检测的方法包括如下步骤：获得测序数据；确定目标区域基因位点；

所述测序的方法为本发明第七个方面的测序方法。

优选地，所述确定目标区域基因位点的方法包含：将获得的测序数据与参考基因组进行比对，确定目标区域基因位点的碱基。

本发明第九个方面，提供本发明第一个方面的寡核酸组合、第二个方面的试剂盒、第三个方面的测序试剂套装或第四个方面的测序系统的应用。

本发明第一个方面的寡核酸组合和/或本发明第二个方面的试剂盒在c1)至c8)任一项中的应用；

c1)制备多重PCR测序文库；

c2)制备用于多重PCR测序文库制备的产品；

c3)测序；

c4)制备用于测序的产品；

c5)对目标区域基因位点检测；

c6)制备对目标区域基因位点检测的产品；

c7)多重PCR扩增；

c8)制备多重PCR扩增的产品。

本发明第三个方面的测序试剂套装和/或本发明第四个方面的测序系统在c3)至c6)任一项中的应用；

c3)测序；

c4)制备用于测序的产品；

c5)对目标区域基因位点检测；

c6)制备对目标区域基因位点检测的产品。

本发明的有益效果是：

本发明提供了一种寡核酸组合，包含：特异性寡核酸和通用引物；通过将特异性寡核酸的3'端定为通用序列，5'端定为特异性序列，并且位于特异性寡核酸的3'端的通用序列与通用引物的3'端互补，通用引物的3'端在聚合酶的作用下的延伸，得到5'端含有通用序列，3'端含有特异性序列的产物，该产物3'端可以和待测目标区域互补，在聚合酶的作用下对目标区域进行扩增，扩增得到含有通用序列和待测目标序列的产物；由于3'端是单一的固定序列，能够有效避免互补结构的形成和二聚体的产生，解决了传统的多重PCR引物容易产生非特异性扩增和二聚体的问题，同时，能够实现一管中快速完成整个扩增和建库的过程；产物可直接进行后续的测序、克隆等应用。

附图说明

图1是目标特异性寡核酸设计示意图。

图2是目标特异性寡核酸和通用引物反应示意图。

图3是本发明文库制备方法的引物扩增示意图。

图4是实施例1的目标扩增测序文库的制备流程图。

图5是实施例2的目标扩增测序文库的制备流程图。

具体实施方式

在本发明的描述中，术语“第一”、“第二”、“第三”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”、“第三”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中，“多个”的含义是至少两个，例如两个，三个等，除非另有明确具体的限定。

本发明的第一个方面，提供寡核酸组合。

一、寡核酸组合，包含：特异性寡核酸和通用引物；

所述通用引物包含：第一通用引物和第二通用引物；

所述特异性寡核酸包含：特异性序列和通用序列；

优选地，所述第一通用引物的3'端序列与所述上游特异性寡核酸的第一通用序列的部分序列或全部序列互补，所述第二通用引物的3'端序列与所述下游特异性寡核酸的第二通用序列的部分序列或全部序列互补。

所述通用引物包含：第一通用引物；

在制备多重PCR测序文库过程中，传统的引物(比如：第二引物)的5'端为通用序列，3'端为特异性序列，3'端的特异性序列与目标模板互补并延伸，其容易产生非特异性扩增和二聚体；而本申请的特异性寡核酸的3'端为通用序列，5'端为特异性序列，并且位于特异性寡核酸的3'端的通用序列与通用引物的3'端互补，通用引物的3'端在聚合酶的作用下的延伸，得到5'端含有通用序列，3'端含有特异性序列的产物，该产物3'端可以和待测目标区域互补，在聚合酶的作用下对目标区域进行扩增，扩增得到含有通用序列和待测目标序列的产物；并且由于本申请中的3'端为通用序列，5'端为特异性序列的特异性寡核酸的3'端为单一固定序列，在PCR扩增过程中不易形成二聚体，从而实现一步法多重扩增的目的。

(一)所述寡核酸组合不包含第二通用引物时：

优选地，所述第二引物还包含功能核酸序列。

优选地，所述第二引物的5'端还包含功能核酸序列，即在第二引物的第二通用序列的5'端还包含功能核酸序列。

优选地，所述第二引物的5'端包含测序引物序列或测序引物互补序列。

优选地，所述第二引物包含一段或多段测序引物序列或测序引物互补序列；进一步优选地，所述第二引物包含两段或两段以上测序引物序列或测序引物互补序列。

优选地，所述第二引物的5'端包含一段或多段测序引物序列或测序引物互补序列；进一步优选地，所述第二引物的5'端包含两段或两段以上测序引物序列或测序引物互补序列。

优选地，所述第二引物还包含第三标签序列，用于区分不同样本，以便后续的多样本混合测序。例如可以是barcode序列或index序列。

优选地，所述第二引物的5'端还包含第三标签序列，用于区分不同样本，以便后续的多样本混合测序。例如可以是barcode序列或index序列。

优选地，所述第三标签序列可以为唯一分子标签(UMI)，用于统计样本中核酸分子的拷贝数。

优选地，所述第三标签序列的长度为5至20bp。

优选地，所述第三标签序列位于所述测序引物序列或测序引物互补序列的中间；进一步优选地，所述第三标签序列位于两段所述测序引物序列或测序引物互补序列的中间。

(二)所述寡核酸组合包含第二通用引物时：

优选地，所述第二通用引物的3'端与所述第二引物的第二通用序列的部分序列或全部序列相同。

优选地，所述第二通用引物包含功能核酸序列。

优选地，所述第二通用引物的5'端包含功能核酸序列。

优选地，所述第二通用引物的5'端包含测序引物序列或测序引物互补序列。

优选地，所述第二通用引物包含一段或多段测序引物序列或测序引物互补序列；进一步优选地，所述第二通用引物包含两段或两段以上测序引物序列或测序引物互补序列。

优选地，所述第二通用引物的5'端包含一段或多段测序引物序列或测序引物互补序列；进一步优选地，所述第二通用引物的5'端包含两段或两段以上测序引物序列或测序引物互补序列。

优选地，所述第二通用引物还包含第二标签序列，用于区分不同样本，以便后续的多样本混合测序。例如可以是barcode序列或index序列。

优选地，所述第二通用引物的5'端还包含第二标签序列，用于区分不同样本，以便后续的多样本混合测序。例如可以是barcode序列或index序列。

优选地，所述第二标签序列可以为唯一分子标签(UMI)，用于统计样本中核酸分子的拷贝数。

优选地，所述第二标签序列的长度为5至20bp。

优选地，所述第二标签序列位于所述测序引物序列或测序引物互补序列的中间；进一步优选地，所述第二标签序列位于两段所述测序引物序列或测序引物互补序列的中间。

优选地，所述第一通用引物包含功能核酸序列。

优选地，所述第一通用引物的5'端包含功能核酸序列。

优选地，所述第一通用引物的5'端包含测序引物序列或测序引物互补序列。

优选地，所述第一通用引物包含一段或多段测序引物序列或测序引物互补序列；进一步优选地，所述第一通用引物包含两段或两段以上测序引物序列或测序引物互补序列。

优选地，所述第一通用引物的5'端包含一段或多段测序引物序列或测序引物互补序列；进一步优选地，所述第一通用引物的5'端包含两段或两段以上测序引物序列或测序引物互补序列。

优选地，所述第一通用引物还包含第一标签序列，用于区分不同样本，以便后续的多样本混合测序。例如可以是barcode序列或index序列。

优选地，所述第一通用引物的5'端还包含第一标签序列，用于区分不同样本，以便后续的多样本混合测序。例如可以是barcode序列或index序列。

优选地，所述第一标签序列可以为唯一分子标签(UMI)，用于统计样本中核酸分子的拷贝数。

优选地，所述第一标签序列的长度为5至20bp。

优选地，所述第一标签序列位于所述测序引物序列或测序引物互补序列的中间；进一步优选地，所述第一标签序列位于两段所述测序引物序列或测序引物互补序列的中间。

优选地，所述通用序列选自部分测序接头序列、全部测序接头序列、测序引物结合序列或任意固定序列(比如包含酶切位点)。

优选地，所述第一通用序列、第二通用序列各自独立选自部分测序接头序列、全部测序接头序列、测序引物结合序列或任意固定序列(比如包含酶切位点)。

优选地，所述测序接头序列可以是任何一种测序平台的任何一种测序接头。

优选地，所述特异性寡核酸的通用序列的3'端进行阻断修饰，从而防止在3'端进行延伸。

优选地，所述特异性寡核酸中的特异性序列的设计遵循常规的引物设计原则，但是和常规的引物序列反向互补，比如：上游特异性序列与待测目标区域上游负链序列相同或正链反向互补，下游特异性序列与待测目标区域的下游正链序列相同或负链序列反向互补。

优选地，所述上游特异性寡核酸的上游特异性序列与待测目标区域的上游负链序列相同或正链序列互补。

优选地，所述下游特异性寡核酸的下游特异性序列与待测目标区域的下游正链序列相同或负链序列互补。

优选地，所述特异性寡核酸的第一特异性序列为下游特异性序列时，所述特异性寡核酸的第一特异性序列与待测目标区域的下游正链序列相同或负链序列互补。

优选地，所述特异性寡核酸的第一特异性序列为上游特异性序列时，所述特异性寡核酸的第一特异性序列与待测目标区域的上游负链序列相同或正链序列互补。

优选地，所述第二引物的第二特异性序列为上游特异性序列时，所述第二引物的第二特异性序列与待测目标区域上游负链序列互补或正链序列相同。

优选地，所述第二引物的第二特异性序列为下游特异性序列时，所述第二引物的第二特异性序列与待测目标区域下游正链序列互补或负链序列相同。

优选地，所述第三标签序列与第一标签序列不同。

优选地，所述第二标签序列与第一标签序列不同。

优选的，所述多个标签可以做为标签组合设置于同一条引物中。

针对上述第二点中不包含第二通用引物的寡核酸组合：

优选地，检测EGFR基因的寡核酸组合，包含：特异性寡核酸和通用引物；

所述通用引物包含：第一通用引物和第二通用引物；

所述上游特异性寡核酸的序列如SEQ ID NO.19至SEQ ID NO.26所示，所述下游特异性寡核酸的序列如SEQ ID NO.27至SEQ ID NO.34所示；

所述第一通用引物的序列如SEQ ID NO.43至50所示，所述第二通用引物的序列如SEQ ID NO.18所示。

优选地，检测EGFR基因的寡核酸组合，包含：特异性寡核酸、第二引物和通用引物；

所述通用引物包含：第一通用引物；

所述第二引物的序列如SEQ ID NO.1至SEQ ID NO.8所示，所述特异性寡核酸的序列如SEQ ID NO.9至SEQ ID NO.16所示；

所述第一通用引物的序列如SEQ ID NO.43至50所示。

优选地，序列如SEQ ID NO.9至16、19至34所示的特异性寡核酸的3'端进行阻断修饰。

优选地，所述第二通用引物的5'端含有磷酸基团，通过第二通用引物可以使得扩增的产物的5'端带有磷酸基团，从而避免专门进行磷酸化的过高成本。

其中，所述多组至少为两组，优选两组以上。

优选地，所述试剂盒还包含：DNA聚合酶、Mg ²⁺、PCR缓冲液、dNTPs中的至少一种；进一步优选地，所述试剂盒还包含：DNA聚合酶、Mg ²⁺、PCR缓冲液和dNTPs；。

优选地，所述试剂盒还包含核酸提取试剂组合，具体是用于选自以下任意一种方法的核酸提取试剂组合：碱裂解法、酚氯仿抽提法、螯合树脂法、离心柱膜吸附法以及磁珠法。

优选地，所述核酸提取试剂组合包含：裂解液、洗涤液、洗脱液、核酸吸附物中的至少一种；进一步优选地，所述核酸提取试剂组合包含：裂解液、洗涤液、洗脱液和核酸吸附物。

优选地，所述核酸吸附物包含磁珠、吸附膜中的至少一种。

优选地，所述测序试剂套装还包含：测序试剂盒。

a1)本发明第一个方面的寡核酸组合；

a2)本发明第二个方面的试剂盒；

a3)本发明第三个方面的测序试剂套装。

其中，所述多组至少为两组，优选两组以上。

优选地，所述同一体系具体为不进行洗脱和/或纯化处理。

优选地，所述生物样本是：细胞、组织、体液、微生物、唾液、尿液、痰液、粪便、咽拭子、鼻拭子、核酸中的至少一种；进一步是：细胞、组织、体液、微生物、唾液、尿液、痰液、粪便、咽拭子、鼻拭子或核酸。

优选地，所述核酸可以是通过裂解所述生物样本A得到的核酸，所述生物样本A是：细胞、组织、体液、微生物、唾液、尿液、痰液、粪便、咽拭子、鼻拭子中的至少一种；进一步是：细胞、组织、体液、微生物、唾液、尿液、痰液、粪便、咽拭子或鼻拭子。

优选地，所述体液包含组织液、淋巴液、血液、脑脊液中的至少一种。

优选地，所述微生物包含细菌、病毒、真菌、放线菌、立克次氏体、支原体、衣原体、螺旋体中的至少一种。

优选地，所述裂解反应在所述扩增反应之前。

优选地，所述裂解反应和所述扩增反应在同一体系中进行。

优选地，所述同一体系具体为同一反应容器。

优选地，所述裂解反应后和所述扩增反应前不包含提取纯化步骤。

优选地，所述裂解反应后和所述扩增反应前还包含提取纯化步骤，去除盐类，有机剂等杂质。

优选地，所述提取纯化进一步包含：沉淀核酸或吸附核酸。

优选地，所述提取纯化后还包含：洗脱或溶解核酸。

优选地，所述裂解反应和所述扩增反应在不同体系中进行。

优选地，所述裂解反应后还包含提取纯化步骤，去除盐类，有机剂等杂质。

优选地，所述提取纯化进一步包含：沉淀核酸或吸附核酸。

优选地，所述提取纯化后还包含：洗脱或溶解核酸。

优选地，所述物理方式包含：煮沸法、玻璃珠法、超声波法、研磨法、冻融法、匀浆法中的至少一种。

优选地，所述化学方式包含：表面活性剂法(SDS法)、碱裂解法中的至少一种。

优选地，所述生物方式包含酶法，比如通过溶菌酶、蛋白酶K等酶裂解。

优选地，所述扩增的循环数为20至30；进一步为23至27。

优选地，所述扩增的体系还包含：DNA聚合酶、Mg ²⁺、PCR缓冲液、dNTPs中的至少一种；进一步优选地，所述扩增的体系还包含：DNA聚合酶、Mg ²⁺、PCR缓冲液和dNTPs；

优选地，所述方法还包括如下步骤：对扩增产物进行纯化。

优选地，所述纯化采用磁珠进行。

b1)本发明第五个方面的多重PCR扩增方法的步骤；

b2)本发明第六个方面的制备多重PCR测序文库的方法的步骤。

优选地，所述测序方法包括如下步骤：制备文库；测序；

优选地，所述测序前还包括如下步骤：文库质检。

本发明第八个方面，提供一种对目标区域基因位点检测的方法，包含b1)至b3)中任一种：

b1)本发明第五个方面的多重PCR扩增方法的步骤；

b2)本发明第六个方面的制备多重PCR测序文库的方法的步骤；

b3)本发明第七个方面的测序方法。

所述获得目标区域的测序文库的方法包含b1)或b2)：

b1)本发明第五个方面的多重PCR扩增方法的步骤；

b2)本发明第六个方面的制备多重PCR测序文库的方法的步骤。

所述测序的方法为本发明第七个方面的测序方法。

一种EGFR基因位点的检测方法，包括如下步骤：获得目标区域的测序文库；获得测序数据；确定目标区域基因位点；

所述获得目标区域的测序文库的方法包含b1)或b2)：

b1)本发明第五个方面的多重PCR扩增方法的步骤；

b2)本发明第六个方面的制备多重PCR测序文库的方法的步骤；

所述寡核酸组合为本发明第一个方面的检测EGFR基因的寡核酸组合。

所述测序的方法为本发明第七个方面的测序方法；

c1)制备多重PCR测序文库；

c2)制备用于多重PCR测序文库制备的产品；

c3)测序；

c4)制备用于测序的产品；

c5)对目标区域基因位点检测；

c6)制备对目标区域基因位点检测的产品；

c7)多重PCR扩增；

c8)制备多重PCR扩增的产品。

c3)测序；

c4)制备用于测序的产品；

c5)对目标区域基因位点检测；

c6)制备对目标区域基因位点检测的产品。

以下通过具体的实施例对本发明的内容作进一步详细的说明。

应理解，这些实施例仅用于说明本发明而不用于限制本发明的范围。

下列实施例中未注明具体条件的实验方法，通常按照常规条件，或按照制造厂商所建议的条件。本实施例中所使用的材料、试剂等，如无特别说明，为从商业途径得到的试剂和材料。

实施例1 EGFR基因肿瘤热点基因的文库制备方法

EGFR基因肿瘤热点基因的文库制备方法，示意图如图4所示，包括如下步骤：

(1)设计EGFR基因肿瘤热点基因捕获panel以及通用引物，该panel包含8对特异性寡核酸(EX1-EGFR_1R至EX1-EGFR_8R)/引物(EX1-EGFR_1F至EX1-EGFR_8F)，扩增子大小为100至200bp，特异性寡核酸/引物序列如表1所示；通用引物包含通用引物R，通用引物R的核苷酸序列为：

(双下划线部分为SEQ ID NO.17，加粗部分为SEQ ID NO.51，NNNNNNNNNNN为标签序列，可以是随机的，也可以是提前设定的，N独立选自A、T、C、G)；(通用引物R具体如表13所示)，下划线部分和特异性寡核酸3'端序列(通用序列)互补。

(2)PCR反应

在PCR管中按照表2所示反应体系配置PCR体系，进行PCR反应，反应程序如下：94℃1min；94℃30s，58℃2min，72℃30s，25cycles；72℃5min；12℃∞，反应完后用1.5X AMPure(贝克曼公司)磁珠进行纯化，最后将纯化产物溶于22μL洗脱缓冲液，得到文库。

表1特异性寡核酸/引物序列

注：上述特异性寡核酸/引物按照每条特异性寡核酸/引物2μM浓度进行混合，得到总浓度为2μM的特异性寡核酸/引物池；引物序列为常规设计，即5'到3'端依次为：通用序列和特异性序列；特异性寡核酸序列为本发明设计，即5'到3'端依次为：特异性序列和通用序列，下划线部分和与通用引物R的3'端互补的序列。

表2 PCR反应体系

实施例2 EGFR基因肿瘤热点基因的文库制备方法

EGFR基因肿瘤热点基因的文库制备方法，示意图如图5所示，包括如下步骤：

(1)设计EGFR基因肿瘤热点基因捕获panel以及通用引物，该panel包含8对特异性寡核酸序列，扩增子大小为100至200bp，特异性寡核酸序列设计序列如表3所示；通用引物包含通用引物F和通用引物R，通用引物R的核苷酸序列为：

(双下划线部分为SEQ ID NO.17，加粗部分为SEQ ID NO.51，NNNNNNNNNNN为标签序列，可以是随机的，也可以是提前设定的，N独立选自A、T、C、G)；(通用引物R具体如表13所示)，下划线部分和上游特异性寡核酸3'端序列(通用序列)互补；通用引物F的核苷酸序列为：P-GAAC G ACATGGCTACGATCCGACTT(SEQ ID NO.18)，P为磷酸化修饰，下划线部分和下游特异性寡核酸3'端序列互补。

(2)PCR反应

在PCR管中按照表4所示反应体系配置PCR体系(将表1所示特异性寡核酸/引物池(2μM)替换为表3所示特异性寡核酸池)，进行PCR反应，反应程序如下：94℃1min；94℃30s，58℃2min，72℃30s，25cycles；72℃5min；12℃∞，反应完后用1.5X AMPure(贝克曼公司)磁珠进行纯化，最后将纯化产物溶于22μL洗脱缓冲液，得到文库。

表3特异性寡核酸序列

注：上述特异性寡核酸按照每条特异性寡核酸2μM浓度进行混合，得到总浓度为2μM的特异性寡核酸池；上游特异性寡核酸序列为本发明设计，即5'到3'端依次为：特异性序列和通用序列，其中下划线部分和通用引物R的3'端互补；下游特异性引物序列为本发明设计，即5'到3'端依次为：特异性序列和通用序列，其中下划线部分与通用引物F的3'端互补。

表4 PCR反应体系

实施例3免提取血液样本EGFR基因肿瘤热点基因的文库制备方法

(双下划线为SEQ ID NO.17，加粗部分为SEQ ID NO.51，NNNNNNNNNNN为标签序列，可以是随机的，也可以是提前设定的，N独立选自A、T、C、G)；(通用引物R具体如表13所示)，下划线部分和上游特异性寡核酸3'端序列(通用序列)互补；通用引物F的核苷酸序列为：P-GAAC GA CATGGCTACGATCCGACTT(SEQ ID NO.18)，P为磷酸化修饰，下划线部分和下游特异性寡核酸3'端序列互补。

(2)血液样本裂解

1μL血液样本加入25uL含有TE的溶液中，95℃裂解10分钟，10000g离心5分钟，取20μL上清液用于后续PCR反应。

对比例1 EGFR基因肿瘤热点基因的文库制备方法

EGFR基因肿瘤热点基因的文库制备方法，包括如下步骤：

(1)设计EGFR基因肿瘤热点基因捕获panel以及通用引物，该panel包含8对引物，扩增子大小为100至200bp，引物设计序列如表5所示；通用引物包含通用引物F和通用引物R，通用引物R的核苷酸序列为：

(双下划线为SEQ ID NO.17，加粗部分为SEQ ID NO.51，NNNNNNNNNNN为标签序列，可以是随机的，也可以是提前设定的，N独立选自A、T、C、G)；(通用引物R具体如表13所示)，下划线部分和常规下游特异性引物5'端序列(通用序列)相同；通用引物F的核苷酸序列为：P- GAACGACATGGCTACGATCCGA CTT(SEQ ID NO.18)，P为磷酸化修饰，下划线部分和常规上游特异性扩增引物5'端序列相同。

(2)第一轮PCR

在PCR管中按照表6所示反应体系配置PCR体系，进行PCR反应，反应程序如下：94℃1min；94℃30s，58℃2min，72℃30s，10cycles；72℃5min；12℃∞，反应完后用1.5X AMPure(贝克曼公司)磁珠进行纯化，最后将纯化产物溶于22μL洗脱缓冲液，得到产物。

(3)第二轮PCR

在PCR管中按照表7所示反应体系配置PCR体系，进行PCR反应，反应程序如下：94℃1min；94℃30s，58℃2min，72℃30s，15cycles；72℃5min；12℃∞，反应完后用1.5X AMPure(贝克曼公司)磁珠进行纯化，最后将纯化产物溶于22μL洗脱缓冲液，得到文库。

表5常规设计的特异性扩增引物

注：上述引物按照每条引物10μM浓度进行混合，得到各引物浓度均为10μM的引物池；上游特异性引物序列为常规设计，即5'到3'端依次为：通用序列和特异性序列，其中下划线部分和通用引物F的3'端相同；下游特异性引物序列为常规设计，即5'到3'端依次为：通用序列和特异性序列，下划线部分和与通用引物R的3'端相同。

表6第一轮PCR反应体系

表7第二轮PCR反应体系

效果实施例EGFR基因肿瘤热点基因的高通量测序方法

下述效果实施例是基于华大基因的测序仪MGISEQ-2000平台；使用的试剂均来源于该测序仪配套使用的建库试剂盒以及双端测序试剂盒(以下简称PE100试剂盒)，下述效果实施例中采用的是PE100的测序读长；过程中用到的测序仪、试剂操作等过程参照该平台的使用方法，最后进行数据分析，包括数据利用率、二聚体比例、比对比例、目标区域数据比例、均一性等性能(分析方法参考文献：Campbell,Nathan R.,Stephanie A.Harmon,and Shawn R.Narum."Genotyping‐in‐Thousands by sequencing(GT‐seq):A cost effective SNP genotyping method based on custom amplicon sequencing."Molecular ecology resources 15.4(2015):855-867.)，具体如下：

1)文库制备：实施例1、2、3或对比例1的文库制备方法；

2)文库质检：得到的产物进行定量和条带大小质检；

3)上机测序：得到的文库在华大智造MGISEQ-2000平台上进行上机测序，上机类型PE100；

4)数据分析：得到的下机数据采用BWA软件比对到人参考基因组(hg19)，使用samtools对比对率、特异性、均一性进行统计，最后采用GATK软件进行突变分析。

实施例1、对比例1得到的文库的测序数据统计如表8所示、实施例1的突变检测统计数据如表9所示：实施例1、对比例1得到的文库的测序数据中的唯一比对比例、目标区域数据比例相当，并且实施例1中的数据利用率高于对比例1、二聚体比例低于对比例1，并且实施例1的方法的操作步骤只有一步；实施例1的突变频率的检测值与理论值相当。

实施例2、对比例1的得到的文库的测序数据统计如表10所示、突变检测统计数据如表11所示：实施例2、对比例1得到的文库的测序数据中的唯一比对比例、目标区域数据比例相当，并且实施例2中的数据利用率高于对比例1、二聚体比例低于对比例1，并且实施例2的方法的操作步骤只有一步；实施例2的突变频率的检测值与理论值相当。

实施例3、对比例1的得到的文库的测序数据统计如表12所示：实施例3、对比例1得到的文库的测序数据中的唯一比对比例、目标区域数据比例相当，并且实施例3中的数据利用率高于对比例1、二聚体比例低于对比例1，并且实施例3的方法的操作步骤只有一步；同时，实施例3得到的文库的测序数据中的唯一比对比例、目标区域数据比例、数据利用率、二聚体比例相当与实施例2相当，可见，将裂解反应和扩增反应在同一体系中进行并不会影响其性能。

表8实施例1、对比例1得到的文库的测序数据统计

表9突变检测统计

表10实施例1、对比例1得到的文库的测序数据统计

表11突变检测统计

表12实施例3、对比例1得到的文库的测序数据统计

表13通用引物R序列

上述实施例为本发明较佳的实施方式，但本发明的实施方式并不受上述实施例的限制，其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化，均应为等效的置换方式，都包含在本发明的保护范围之内。

Claims

寡核酸组合，包含：特异性寡核酸和通用引物；

所述通用引物包含：第一通用引物和第二通用引物；

所述特异性寡核酸包含：上游特异性寡核酸和下游特异性寡核酸；

所述特异性寡核酸包含：特异性序列和通用序列；

所述上游特异性寡核酸包含：上游特异性序列和第一通用序列，其中，所述上游特异性序列位于所述上游特异性寡核酸的5'端，所述第一通用序列位于所述上游特异性寡核酸的3'端；

所述下游特异性寡核酸包含：下游特异性序列和第二通用序列，其中，所述下游特异性序列位于所述下游特异性寡核酸的5'端，所述第二通用序列位于所述下游特异性寡核酸的3'端；

1)所述第一通用引物的3'端序列与所述上游特异性寡核酸的第一通用序列的部分序列或全部序列互补，所述第二通用引物的3'端序列与所述下游特异性寡核酸的第二通用序列的部分序列或全部序列互补；或

2)所述第二通用引物的3'端序列与所述上游特异性寡核酸的第一通用序列的部分序列或全部序列互补，所述第一通用引物的3'端序列与所述下游特异性寡核酸的第二通用序列的部分序列或全部序列互补。
寡核酸组合，包含：特异性寡核酸、第二引物和通用引物；

所述通用引物包含：第一通用引物；

所述特异性寡核酸包含：特异性序列和通用序列，其中，所述特异性序列位于所述特异性寡核酸的5'端，所述通用序列位于所述特异性寡核酸的3'端；

所述特异性序列为第一特异性序列，所述通用序列为第一通用序列；

所述第二引物包含：第二特异性序列和第二通用序列，其中，所述第二特异性序列位于所述第二引物的3'端，所述第二通用序列位于所述第二引物的5'端；

所述第一通用引物的3'端序列与所述特异性寡核酸的第一通用序列的部分序列或全部序列互补。
根据权利要求2所述的寡核酸组合，其特征在于：

所述通用引物进一步包含：第二通用引物；所述第二通用引物的3'端与所述第二引物的第二通用序列的部分序列或全部序列相同。
根据权利要求1或3所述的寡核酸组合，其特征在于：所述第二通用引物包含功能核酸序列；

优选地，所述第二通用引物包含测序引物序列或测序引物互补序列；

优选地，所述第二通用引物还包含第二标签序列；

优选地，所述第二标签序列位于所述测序引物序列或测序引物互补序列的中间。
根据权利要求2所述的寡核酸组合，其特征在于：

所述第二引物还包含功能核酸序列；

优选地，所述第二引物包含测序引物序列或测序引物互补序列；

优选地，所述第二引物还包含第三标签序列；

优选地，所述第三标签序列位于所述测序引物序列或测序引物互补序列的中间。
根据权利要求1或2所述的寡核酸组合，其特征在于：

所述第一通用引物包含功能核酸序列；

优选地，所述第一通用引物包含测序引物序列或测序引物互补序列；

优选地，所述第一通用引物还包含第一标签序列；

优选地，所述第一标签序列位于所述测序引物序列或测序引物互补序列的中间。
根据权利要求1或2所述的寡核酸组合，其特征在于：

所述特异性寡核酸的通用序列的3'端进行阻断修饰；

优选地，所述阻断修饰包含：磷酸化修饰、间臂修饰、氨基修饰中的至少一种。
根据权利要求1或2所述的寡核酸组合，其特征在于：

所述第一通用序列和第二通用序列相同或者不同。
根据权利要求2所述的寡核酸组合，其特征在于：

1)所述第一特异性序列为上游特异性序列，所述第二特异性序列为下游特异性序列；或

2)所述第一特异性序列为下游特异性序列，所述第二特异性序列为上游特异性序列。
根据权利要求4-6中任一项所述的寡核酸组合，其特征在于：所述第一标签序列、第二标签序列和第三标签序列可以相同也可以不同。
一种试剂盒，包含权利要求1或2所述的寡核酸组合。
根据权利要求11所述的试剂盒，其特征在于：

所述试剂盒还包含：DNA聚合酶、Mg2+、PCR缓冲液、dNTPs中的至少一种；

优选地，所述试剂盒包含：核酸提取试剂，其中所述核酸提取试剂为：裂解试剂；

优选地，所述试剂盒包含：核酸提取试剂组合。
一种测序试剂套装，包含：测序试剂盒和权利要求11所述的试剂盒。
一种多重PCR扩增方法，包括如下步骤：获得生物样本，利用权利要求1或2所述的多组寡核酸组合对生物样本进行扩增反应，其中所述多重扩增反应在同一体系中进行，其中所述多组最少为两组或两组以上。
根据权利要求14所述的多重PCR扩增方法，其特征在于：所述同一体系具体为不进行洗脱和/或纯化处理。
根据权利要求14所述的多重PCR扩增方法，其特征在于：所述生物样本是：细胞、组织、体液、微生物、唾液、尿液、痰液、粪便、咽拭子、鼻拭子、核酸中的至少一种；

优选地，所述生物样本是：细胞、组织、体液、微生物、唾液、尿液、痰液、粪便、咽拭子、鼻拭子中的至少一种时，所述多重PCR扩增方法还包含裂解反应；

优选地，所述裂解反应和所述扩增反应在同一体系中进行。
根据权利要求16所述的多重PCR扩增方法，其特征在于：所述裂解反应后、扩增反应前还包含提取纯化步骤；

优选地，所述裂解的方法包含：物理方式、化学方式、生物方式中的至少一种；

优选地，所述提取纯化进一步包含：沉淀核酸或吸附核酸；

优选地，所述提取纯化后还包含：洗脱或溶解核酸。
一种制备多重PCR测序文库的方法，包含权利要求14所述的多重PCR扩增方法的步骤，得到测序文库。
根据权利要求18所述的方法，其特征在于：

所述方法还包括如下步骤：对扩增产物进行纯化；

优选地，所述纯化采用磁珠进行。
一种对目标区域基因位点检测的方法，包括如下步骤：获得目标区域的测序文库；获得测序数据；确定目标区域基因位点；

所述获得目标区域的测序文库的方法包含b1)或b2)：

b1)权利要求14所述的多重PCR扩增方法的步骤；

b2)权利要求18所述的制备多重PCR测序文库的方法的步骤。
根据权利要求20所述的方法，其特征在于：

所述确定目标区域基因位点的方法包含：将获得的测序数据与参考基因组进行比对，确定目标区域基因位点的碱基。