CN116497087A

CN116497087A - 选择性扩增目标序列的方法及其应用

Info

Publication number: CN116497087A
Application number: CN202310359585.5A
Authority: CN
Inventors: 金方园; 梁加龙; 冉帅; 屈武斌; 蔡万世; 王瑞超
Original assignee: Igenetech Biotech Beijing Co ltd
Current assignee: Igenetech Biotech Beijing Co ltd
Priority date: 2023-04-06
Filing date: 2023-04-06
Publication date: 2023-07-28

Abstract

本发明公开了一种设计用于选择性扩增目标序列的引物的方法，利用该方法可获得用于选择性扩增PKD1真基因的引物组，使用该引物组对PKD1真基因进行扩增，结合高通量测序技术，实现了对PKD1基因突变的低成本检测，并且特异性高达100％。

Description

选择性扩增目标序列的方法及其应用

技术领域

本发明属于生物技术领域，具体涉及选择性扩增目标序列的方法及其应用。

背景技术

PKD1基因结构复杂，包含46个外显子，其中1-33号外显子在基因组上存在6个高度同源的假基因，相似度达97.7％，普通的PCR扩增和测序根本无法区分真假基因。以往大多通过巢式PCR解决该问题，该方法首先需要通过特异性引物将真基因超长链扩增出，切胶纯化后，再进行目的片段的巢式PCR扩增。该方法的缺点为：超长链产物不易扩增出，有时需要补充扩增；两轮及以上PCR的操作较繁琐，且实验周期较长，不适用于临床的时效性。目前有一些机构采用多重长链扩增法进行二代测序检测，但这些方法普遍存在以下缺点：①一对引物的设计只考虑了一个特异性位点，对于真基因扩增特异性较差；②引物之间的退火温度差距较大，导致反应体系和扩增程序繁琐，不易操作；③目标序列产物间长度差距较大，PCR反应偏好性大，不利于多重扩增反应均一性的调整；④目标序列仅有一对引物可以覆盖，易脱靶，漏检风险较大。

因此，本领域亟需选择性扩增PKD1真基因的引物组。

发明内容

如前所述，本领域亟需选择性扩增PKD1真基因的引物组。

本发明开发了一种利用生物信息学设计用于选择性扩增目标序列的引物的方法，使用该引物结合多重长链扩增反应可以选择性扩增目标序列。由此，实现了本发明。

在第一方面，本发明提供了设计用于选择性扩增目标序列的引物的方法，所述方法包括以下步骤：

1)获取目标序列和待区分序列的集合，所述待区分序列的集合包含任意多个不同于所述目标序列的序列；

2)将所述目标序列与所述待区分序列的集合中的一条序列进行对齐，根据需要在所述目标序列中引入空位，获得对齐后的目标序列，将所述对齐后的目标序列作为新的目标序列；重复前述过程，遍历所述待区分序列的集合中的所有序列；

3)将步骤2)的所述新的目标序列与所述待区分序列比对，获得所述新的目标序列与所述待区分序列的差异核苷酸；

4)利用步骤3)的所述差异核苷酸设计用于选择性扩增目标序列的引物，所述引物覆盖至少2个所述差异核苷酸。

在第二方面，本发明提供了选择性扩增目标序列的方法，所述方法包括利用根据第一方面所述的方法设计的引物进行扩增的步骤。

在第三方面，本发明提供了使用第一方面所述的方法获得用于选择性扩增PKD1真基因的引物组，所述目标序列为PKD1真基因，所述待区分序列的集合为PKD1假基因，包括PKD1P1、PKD1P2、PKD1P3、PKD1P4、PKD1P5、PKD1P6，所述引物组包括以下引物对：

用于扩增PKD1基因5’UTR至外显子1的引物，其正向引物和反向引物分别为TACTGACTCGGGLCCGCG(SEQ ID NO:1)和CLCCGCCCCCTACAGCCAT(SEQ ID NO:2)；

用于扩增PKD1基因外显子2至外显子4的引物，其正向引物和反向引物分别为CGCCATGCCCGGCTAA(SEQ ID NO:3)和CCCACdICCCCCACAT(SEQ ID NO:4)；

用于扩增PKD1基因外显子5下游至外显子9的引物，其正向引物和反向引物分别为GACCUCTGGCCTCTGGC(SEQ ID NO:5)和A CCACCCACCACCCAC(SEQ ID NO:6)；

用于扩增PKD1基因外显子10至外显子12的引物，其正向引物和反向引物分别为AGCAAGGCCAGGATTGCT(SEQ ID NO:7)和T CCCGGCGCTCTTGC(SEQ ID NO:8)；

用于扩增PKD1基因外显子13至外显子15上游的引物，其正向引物和反向引物分别为TGGGCUCACTGACGCCT(SEQ ID NO:9)和CAGGCGGCGGGTTCAA(SEQ ID NO:10)；

用于扩增PKD1基因外显子15中游的引物，其正向引物和反向引物分别为GAAGCCGLCCCCCACC(SEQ ID NO:11)和CCGCGGCC ACGGG(SEQ ID NO:12)；

用于扩增PKD1基因外显子15下游至外显子21的引物，其正向引物和反向引物分别为ATCACAGCGCAACTACTTGGA(SEQ ID N O:13)和TTCACACAGGACAGAACGGC(SEQ ID NO:14)；

用于扩增PKD1基因外显子23至外显子24的引物，其正向引物和反向引物分别为CCGCCCCGTGCGG(SEQ ID NO:15)和CAGGG AAGGGGTAGCGGA(SEQ ID NO:16)；

用于扩增PKD1基因外显子27至外显子30的引物，其正向引物和反向引物分别为TTATCTCTGTGCTGCTTTCCTCT(SEQ ID NO:17)和TTTAGATGGAGTCTCGCTGTCA(SEQ ID NO:18)；

用于扩增PKD1基因外显子31至外显子34的引物，其正向引物和反向引物分别为GCATTCTAGGACATTCTGTCAGATG(SEQ ID N O:19)和AACAATGAGAAGCACTCAAAGGAA(SEQ ID NO:20)；用于扩增PKD1基因外显子35至外显子39的引物，其正向引物和反向引物分别为GCCCAGGTTAACATGGGCT(SEQ ID NO:21)和GGTCACACAGCTAGGGAGC(SEQ ID NO:22)；

用于扩增PKD1基因外显子40至外显子45上游的引物，其正向引物和反向引物分别为TGGCCAGCAGGAAACACTC(SEQ ID NO:23)和ACCTTGCTGAGGCCCATC(SEQ ID NO:24)；

用于扩增PKD1基因外显子46至3’UTR的引物，其正向引物和反向引物分别为GTTCCGCCACAAAGTCCG(SEQ ID NO:25)和GA GGCAGCCACTGAACCAAA(SEQ ID NO:26)；

用于扩增PKD1基因外显子2至外显子7的引物，其正向引物和反向引物分别为TCGCCGTTTCACCCAGG(SEQ ID NO:27)和ACA CCTCCGGGCTGCA(SEQ ID NO:28)；

用于扩增PKD1基因外显子8下游至外显子11上游的引物，其正向引物和反向引物分别为ALCCGCCTCTGGCACAGC(SEQ ID NO:29)和CACCALCCCACGTCCACCA(SEQ ID NO:30)；

用于扩增PKD1基因外显子12至外显子15上游的引物，其正向引物和反向引物分别为CATTCCACUGTCTCATTTCACAAAATGA(S EQ ID NO:31)和GAGGGCAGCGGGTGC(SEQ ID NO:32)；

用于扩增PKD1基因外显子15中游的引物，其正向引物和反向引物分别为GCCCdIGAGGCAACAGT(SEQ ID NO:33)和CACCTCGG GGUTGGCC(SEQ ID NO:34)；

用于扩增PKD1基因外显子15下游至外显子16的引物，其正向引物和反向引物分别为GGCGACTCGCTGdITCA(SEQ ID NO:35)和GGGATGCGTGTGAGAAGAGA(SEQ ID NO:36)；

用于扩增PKD1基因外显子17至外显子22的引物，其正向引物和反向引物分别为CCTTCCGCCGTCCAAGTT(SEQ ID NO:37)和G GGTAGAGAAAAGAGAAGGGAGAAG(SEQ ID NO:38)；

用于扩增PKD1基因外显子23至外显子26的引物，其正向引物和反向引物分别为TCAGCdIGGGCCCTGGCC(SEQ ID NO:39)和C CGGGCTAATTTTTTTGTACTTTTTATTAGA(SEQ ID NO:40)；用于扩增PKD1基因外显子27至外显子34的引物，其正向引物和反向引物分别为GCTCCTTGAGTGCGCACA(SEQ ID NO:41)和G AGAGCCGGACACTCACAG(SEQ ID NO:42)；

用于扩增PKD1基因外显子38至外显子42的引物，其正向引物和反向引物分别为TAAGCACCACTGCAGTGGC(SEQ ID NO:43)和CCTGTGCCAAGTACGGGC(SEQ ID NO:44)；

用于扩增PKD1基因外显子45下游至3’UTR的引物，其正向引物和反向引物分别为TGCGTGGAGAGCTGTACC(SEQ ID NO:45)和AGAGCGGTTGCCACGC(SEQ ID NO:46)。

在第四方面，本发明提供了用于选择性扩增PKD1真基因的扩增体系，所述扩增体系包含第三方面所述的引物组。

在第五方面，本发明提供了用于选择性扩增PKD1真基因的试剂盒，所述试剂盒包含第三方面所述的引物组。

在第六方面，本发明提供了一种检测PKD1基因突变的方法，所述方法包括以下步骤：

1)使用第三方面所述的引物组、第四方面所述的扩增体系、或第五方面所述的试剂盒扩增PKD1基因；

2)对步骤1)获得的扩增产物进行高通量测序；

3)将步骤2)获得的测序结果与PKD1基因参考序列比对，确定突变位点。

在第七方面，本发明提供了第三方面所述的引物组、第四方面所述的扩增体系、或第五方面所述的试剂盒的应用，所述应用包括但不限于：检测PKD1基因的变异、多囊肾发病原因的判断、治疗方案的选择、和/或指导优生优育。

本发明的有益效果是：使用本发明的方法可以快速设计选择性扩增目标序列的引物；用于PKD1基因突变检测的引物及方法成本低、灵敏度高、特异性强、操作简单、均一性好、漏检风险低。

附图说明

为了更清楚地说明本发明具体实施方式中的技术方案，下面将对具体实施方式中的附图作简单地介绍。

图1示出了实施例1中使用本发明的方法对PKD1真基因与6个假基因比对的结果。

图2示出了实施例1中使用本发明的方法对PKD1真基因与6个假基因比对的代码。

图3示出了实施例1中使用本发明的方法获得的PKD1真基因特异性碱基的位置。

图4示出了实施例1中获得PKD1真基因特异性碱基位置的代码。

图5示出了实施例1中使用两种方法对PKD1真基因与6个假基因比对的结果，其中图A为使用Clustal，图B为使用本发明的方法。

图6示出了实施例2中两组引物的组间、组内关系。

图7示出了实施例4中PKD1真基因序列扩增的凝胶电泳图，其中M1为λDNA/HindIII，M2为100bp Ladder。

图8示出了实施例5中PKD1真基因建库的毛细管电泳图。

图9示出了实施例5中PKD1真基因测序数据的IGV可视化结果。

具体实施方式

在下文中，将结合附图对本发明进行详细的描述。需理解，以下描述仅以示例方式来对本发明进行说明，而无意于对本发明的范围进行限制，本发明的保护范围以随附权利要求为准。并且，本领域技术人员理解，在不背离本发明的精神和主旨的情况下，可以对本发明的技术方案进行修改。若并未特别指明，实施例中所用的技术手段为本领域技术人员所熟知的常规手段。

除非另外定义，否则本文所使用的所有技术和科学术语具有与本发明所述主题所属领域的普通技术人员通常理解的相同含义。在对本发明进行详细描述之前，提供以下定义以更好地理解本发明。

在本发明的上下文中，很多实施方案使用表述“包含”、“包括”或者“基本/主要由……组成”。表述“包含”、“包括”或“基本/主要由……组成”通常情况下可以理解为开放式表述，表示不仅包括该表述后面具体列出的各元素、组分、组件、方法步骤等外，还包括其他的元素、组分、组件、方法步骤。另外，在本文中，表述“包含”、“包括”或者“基本/主要由……组成”在某些情况下也可以理解为封闭式表述，表示仅包括该表述后面具体列出的各元素、组分、组件、方法步骤，而不包括任何其他的元素、组分、组件、方法步骤。此时，该表述等同于表述“由……组成”。

在本文中，术语“对齐”，其英文为“alignment”，指一条查询序列与参考序列之间的对应结果，一条查询序列可以同时具有多个对齐结果。对齐过程可以通过Clustal、BLAST、DANMAN、EBI-MSA、EBI-PSA等实现。例如，对齐过程可以如下所示：

在本文中，术语“覆盖率”，其英文为“coverage ratio”，也称作覆盖比率、基因组覆盖率，是指被测序到的碱基占全基因组大小的比率。

在本文中，术语“测序深度”(通常为数字后跟“×”)是指测序得到的碱基总量与目标基因组大小的比值。

在本文中，术语“indel”是指插入(insertion)或缺失(deletion)，其具体是指全基因组中的差异，相对标准对照而言，个体的基因组中有一定数量的核苷酸插入或缺失。

在本文中，术语“引物”是指一段分离的核酸分子，其通过核酸杂交，退火结合到互补的目标DNA链上，在引物和目标DNA链之间形成杂合体，然后在聚合酶(例如DNA聚合酶)的作用下，沿目标DNA链延伸。本发明的引物对涉及其在目标核酸序列扩增中的应用，例如，通过聚合酶链式反应(PCR)或其他常规的核酸扩增方法。

在本文中，碱基使用本领域公知的单字母来表示，例如，腺嘌呤用A表示，鸟嘌呤用G表示，胞嘧啶用C表示，胸腺嘧啶用T表示，尿嘧啶用U表示。此外，本发明还涉及修饰核苷酸，例如，dI表示脱氧次黄嘌呤(deoxylnosine)，当dI与其它碱基结合时会比其它碱基错配相对更稳定；锁核酸是一种含有双糖环的核苷酸衍生物，通过2’氧原子和4’碳原子之间的亚甲基桥键，将糖环锁定成为一个双环的分子模式，从而能很好地限制糖环的灵活性，锁核酸对DNA、RNA有很好识别能力和强大亲和力，热稳定性高。

还需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。

如前所述，本发明旨在提供选择性扩增PKD1真基因的引物组。

因此，在第一方面，本发明提供了设计用于选择性扩增目标序列的引物的方法，所述方法包括以下步骤：

2)将所述目标序列与所述待区分序列的集合中的一条序列进行对齐，根据需要在所述目标序列中引入空位(gap)，获得对齐后的目标序列，将所述对齐后的目标序列作为新的目标序列；重复前述过程，遍历所述待区分序列的集合中的所有序列；

具体地，在步骤2)中，所述目标序列(A)与所述待区分序列的集合中的一条序列进行对齐，获得对齐后的目标序列(B)，序列A与序列B可能相同，亦可能不同，例如，序列A为ATACATGCGCT，对齐后获得序列B为AT-ACAT-GC-GC-T(其中“-”表示gap)。

在一个实施方案中，步骤4)的所述设计引物的规则如下：

引物3’端末位4个核苷酸不变；

若2个所述差异核苷酸相隔大于3个核苷酸，则将引物中差异核苷酸位置处的G替换为dI(脱氧次黄嘌呤)、T替换为U、C增加锁核酸修饰(表示为LC)。

本发明的第一方面所述的方法不仅可用于后文所述的设计扩增PKD1真基因的引物，还可用于其他涉及假基因干扰的扩增引物设计中。

在第三方面，本发明提供了使用第一方面所述的方法获得用于选择性扩增PKD1真基因的引物组，所述目标序列为PKD1真基因(也称PKD1基因)，所述待区分序列的集合为PKD1假基因，包括PKD1P1、PKD1P2、PKD1P3、PKD1P4、PKD1P5、PKD1P6，所述引物组包括以下引物对：

用于扩增PKD1基因5’UTR至外显子1的引物，其正向引物和反向引物分别为TACTGACTCGGGLCCGCG(SEQ ID NO:1)和CLC CGCCCCCTACAGCCAT(SEQ ID NO:2)；

用于扩增PKD1基因外显子2至外显子4的引物，其正向引物和反向引物分别为CGCCATGCCCGGCTAA(SEQ ID NO:3)和CCCA CdICCCCCACAT(SEQ ID NO:4)；

在一个实施方案中，所述扩增体系包括两个反应池，其中如SEQ ID NO:1-SEQ IDNO:26所示的引物组位于第一反应池，如SEQ ID NO:27-SEQ ID NO:46所示的引物组位于第二反应池。如果扩增体系只有一个反应池，将产生较多的引物二聚体且不能很好覆盖目标序列的基因组，容易漏检。上述两组引物组内不重叠，组间互相补充，降低漏检风险，提高检测覆盖率和准确度。

在一个进一步的实施方案中，所述第一反应池和第二反应池的产物比例为1:2，该比例可以使得后续建库均一性较优。

在一个实施方案中，所述试剂盒还包括用于从样品中提取基因组DNA的试剂、利用所述引物组进行长片段PCR反应的试剂、处理扩增产物用于高通量测序技术的试剂、用于对处理后的扩增产物进行高通量测序的试剂。

其中，利用所述引物组进行长片段PCR反应的试剂包括DNA聚合酶、缓冲液混合物。在一个优选的实施方案中，所述DNA聚合酶是Long Chain Multiplex PCR Enzyme。在另一个优选的实施方案中，所述缓冲液混合物包含dNTP、KCl、DMSO、MgCl₂、Trisl-HCL、PEG8000，DMSO可以提高GC含量高的模板的扩增效率，PEG8000可以提高扩增的均一性。应理解，其他DNA聚合酶(如Pfu DNA聚合酶、Vent DNA聚合酶、KOD DNA聚合酶、PrimerSTAR HS DNA聚合酶等)、缓冲液也可适用于本发明。

处理扩增产物用于高通量测序技术的试剂包括末端修复酶、末端修复缓冲液、接头连接酶、接头连接缓冲液、接头。在一个优选的实施方案中，所述末端修复酶是5×ER/A-Tailing Enzyme Mix。在另一个优选的实施方案中，所述末端修复缓冲液是10×ERABuffer。在又一个优选的实施方案中，所述接头连接酶是T4 DNALigase。在又一个优选的实施方案中，所述接头连接缓冲液是5×Rapid Ligation Buffer。应理解，其他末端修复酶、末端修复缓冲液、接头连接酶、接头连接缓冲液也可适用于本发明。

2)对步骤1)获得的扩增产物进行高通量测序；

在一个优选的实施方案中，步骤1)的所述扩增过程中的退火温度为60℃，时间为10min，该条件下的扩增效果稳定、产量高。

实施例

应注意，本发明的说明书中所使用的术语只是为了描述具体的实施例的目的，而并非旨在限制本发明。上文的发明内容部分以及下文的详细描述仅为具体阐释本发明之目的，无意于以任何方式对本发明进行限制。在不背离本发明的精神和主旨的情况下，本发明的范围由随附的权利要求书确定。

以下实施例详细说明了利用本发明提供的方法设计用于选择性扩增PKD1真基因的引物组、应用引物组的过程。实施例中所使用的实验方法如无特殊说明，均为常规方法，所用的材料、试剂等，如无特殊说明，均可从商业途径得到。

实施例1：PKD1真基因序列与6个PKD1假基因序列比对

在NCBI数据库中获取人类PKD1真基因、PKD1假基因(PKD1P1、PKD1P2、PKD1P3、PKD1P4、PKD1P5、PKD1P6)的序列。

结合生物信息学方法，将PKD1真基因与假基因PKD1P1进行比对，获得带有gap的PKD1真基因的比对结果；将带有gap的PKD1真基因序列与假基因PKD1P2进行比对，再次获得带有gap的PKD1真基因的比对结果；将带有gap的PKD1真基因序列与假基因PKD1P3进行比对，再次获得带有gap的PKD1真基因的比对结果；将带有gap的PKD1真基因序列与假基因PKD1P4进行比对，再次获得带有gap的PKD1真基因的比对结果；将带有gap的PKD1真基因序列与假基因PKD1P5进行比对，再次获得带有gap的PKD1真基因的比对结果；将带有gap的PKD1真基因序列与假基因PKD1P6进行比对，最终获得带有gap的PKD1真基因的比对结果。将带有gap的PKD1真基因序列与6个PKD1假基因进行比对，比对结果的格式如图1所示(仅展示部分结果)，实现该过程使用的代码如图2所示。

利用上述比对结果，找出相同位置上PKD1真基因完全不同于6个PKD1假基因的特异性碱基(标“*”)，结果的格式如图3所示(仅展示部分结果)，实现该过程使用的代码如图4所示。

上述方法以PKD1真基因为参比序列，全面考虑到所有序列的indel情况，使相似性序列比对更准确；而传统的Clustal多序列比对的计算不够精准，错过了很多可以比对上的序列，导致产生过多的非特异位点，后续设计引物，准确性极低，极容易扩增出假基因。利用这两种方法对PKD1真基因与6个PKD1假基因进行比对的结果如图5所示(仅展示部分结果)，其中图A对应Clustal方法，图B对应本发明的方法。

本实施例使用CLUSTAL 2.0.12、Python2.7、Biopython1.57、Pip19.2.3、PyCharm2020.2.1x64等完成上述分析过程。

实施例2：设计选择性扩增PKD1真基因的引物

利用实施例1中获得的PKD1真基因特异性碱基信息设计引物，具体如下：引物3’端末位4个碱基不变，每个引物覆盖至少2个特异性位点，若2个特异性位点相隔不大于3个碱基，无需进行碱基修饰；若2个特异性位点相隔大于3个碱基，则将引物中特异性碱基位置处的G替换为dI、T替换为U、C增加锁核酸修饰(表示为LC)。例如，PKD1真基因的某一位置处为C，PKD1假基因这一位置处为A，则特异性扩增PKD1真基因的引物该位置处应为G，但如果引物中2个特异性位点相隔大于3个碱基，则将引物中该位置处的G替换为dI，dI与PKD1真基因中的C互补而不与PKD1假基因的A互补，从而实现特异性扩增PKD1真基因。

获得的选择性扩增PKD1真基因的引物包括扩增上游/下游引物对，其核苷酸序列如表1所示(加粗标记为PKD1真基因特异性碱基位置)。这些引物覆盖PKD1真基因序列的所有外显子，且3’端的4个碱基与PKD1真基因序列特异性结合。

表1：选择性扩增PKD1真基因的引物信息

上述引物的退火温度均在60℃左右，获得的扩增产物在2000bp左右。将上述引物分为两组，分别命名为Primer T1和Primer T2，做多重PCR扩增富集，其中Primer T1包括如SEQ ID NO:1-SEQ ID NO:26所示的引物组(共13对引物)，Primer T2包括如SEQ ID NO:27–SEQ ID NO:46所示的引物组(共10对引物)。两组引物组内不重叠，组间互相补充，降低漏检风险，提高检测覆盖率和准确度。上述两组引物的组间、组内关系如图6所示。

实施例3：PKD1真基因长链多重扩增

获取人类基因组中的DNA，利用实施例2中的引物组对PKD1真基因进行长链多重PCR扩增，PCR扩增体系和扩增程序如表2、表3所示，其中扩增体系分为2个反应池(T1和T2)。

表2：PCR扩增体系

表3：PCR扩增程序

长链多重扩增缓冲液包含dNTP(5mM each)、KCl(50mM)、DMSO(10％)、MgCl₂(4mM)、Trisl-HCL(pH9.0，120mM)、PEG8000(10％)，其中DMSO可以提高GC含量高的模板的扩增效率，PEG8000可以提高扩增的均一性。

采用上述扩增体系和扩增程序使得扩增效果更稳定，产量更高。

实施例4：PKD1真基因打断建库

将实施例3中的2个反应池的产物按照1:2混合后，进行打断处理，结果如图7所示。将打断后的产物进行末端修复加A尾并连接接头序列，末端修复PCR体系和程序如表4、表5所示，接头连接PCR体系和程序如表6、表7所示。

表4：末端修复PCR体系

表5：末端修复程序

表6：接头连接PCR体系

表7：接头连接程序

将产物按照A3磁珠说明书进行纯化，其中A3磁珠为0.9X比例。然后PCR连接UDI标签，加标签PCR反应体系和程序如表8、表9所示。将建好的文库进行质检，质检合格后送Illumina平台测序，测序数据量为0.3G。

表8：加标签PCR体系

表9：加标签PCR程序

实施例5：数据分析

建库质量分析：将文库产物进行Qubit定量，结果为151ng/μL，浓度较高。将文库稀释到1ng/μL进行毛细管电泳，条带大小在376bp左右，且无非特异性产物峰和引物峰干扰，文库质量很好(图8)。

覆盖率和均一性分析：文库数据分析结果如表10所示，在100X覆盖率可达100％，在20％X覆盖率接近100％，个别外显子在50％X覆盖率也可达100％。图9为上述文库数据在IGV中的可视化结果，显示该文库均一性好，覆盖率高。

表10：文库数据分析结果

/>

特异性分析：利用上述数据获得的变异位点共26个，如表11所示。其中，1个变异位点位于3’UTR上，经分析，此处为高度重复序列区域，变异不可靠；21个变异位点位于intronic上，不计入分析范围；4个变异位点位于exonic上，rs9935526、rs71385734、rs40433、rs35842位点在千人基因组数据库中的突变率分别为0.216454、0.221645、0.979233、0.979233，本实施例检测所得突变率分别为0.1713、0.1862、0.9985、0.8856，两者相符合，且其中三个为同义突变，经ACMG计算，以上四个位点均为良性突变，无诊断学意义。rs71385734位点所得变异符合假基因PKD1P2和PKD1P5序列，疑似为非特异性扩增，但该变异为同义突变，且为良性突变，无诊断学意义。由此可见，利用本发明的引物组扩增建库所得到的结果特异性极强，假基因检测率几乎为0。

表11：变异位点信息

/>

综上所述，本发明中的序列比对方法使得多序列比对结果更加准确。利用本发明的方法设计的用于选择性扩增PKD1真基因的引物组具有较高的特异性，使用该引物组获得的文库具有很好的均一性、覆盖率，解决了扩增PKD1真基因过程中假基因干扰的问题。本发明的方法及其应用具有很高的创新性和商业价值。

以上对本发明所提供的方法及其应用进行了详细介绍，本文中应用了具体实施例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

Claims

1.设计用于选择性扩增目标序列的引物的方法，其特征在于，所述方法包括以下步骤：

2.根据权利要求1所述的方法，其特征在于，步骤4)的所述设计引物的规则如下：

引物3’端末位4个核苷酸不变；

若2个所述差异核苷酸相隔大于3个核苷酸，则将引物中差异核苷酸位置处的G替换为dI、T替换为U、C增加锁核酸修饰。

3.选择性扩增目标序列的方法，其特征在于，所述方法包括利用根据权利要求1或2所述的方法设计的引物进行扩增的步骤。

4.使用权利要求1或2所述的方法获得用于选择性扩增PKD1真基因的引物组，所述目标序列为PKD1真基因，所述待区分序列的集合为PKD1假基因，包括PKD1P1、PKD1P2、PKD1P3、PKD1P4、PKD1P5、PKD1P6，其特征在于，所述引物组包括以下引物对：

用于扩增PKD1基因外显子2至外显子4的引物，其正向引物和反向引物分别为CGCCATGCCCGGCTAA(SEQ ID NO:3)和CCCACdICCCCCACAT(SEQ ID NO:4)；用于扩增PKD1基因外显子5下游至外显子9的引物，其正向引物和反向引物分别为GACCUCTGGCCTCTGGC(SEQ IDNO:5)和ACCACCCACCACCCAC(SEQ ID NO:6)；

用于扩增PKD1基因外显子10至外显子12的引物，其正向引物和反向引物分别为AGCAAGGCCAGGATTGCT(SEQ ID NO:7)和TCCCGGCGCTCTTGC(SEQ ID NO:8)；

用于扩增PKD1基因外显子13至外显子15上游的引物，其正向引物和反向引物分别为TGGGCUCACTGACGCCT(SEQ ID NO:9)和CAGGCGGCGGGTTCAA(SEQ ID NO:10)；用于扩增PKD1基因外显子15中游的引物，其正向引物和反向引物分别为GAAGCCGLCCCCCACC(SEQ ID NO:11)和CCGCGGCCACGGG(SEQ ID NO:12)；

用于扩增PKD1基因外显子15下游至外显子21的引物，其正向引物和反向引物分别为ATCACAGCGCAACTACTTGGA(SEQ ID NO:13)和TTCACACAGGACAGAACGGC(SEQ ID NO:14)；

用于扩增PKD1基因外显子23至外显子24的引物，其正向引物和反向引物分别为CCGCCCCGTGCGG(SEQ ID NO:15)和CAGGGAAGGGGTAGCGGA(SEQ ID NO:16)；

用于扩增PKD1基因外显子31至外显子34的引物，其正向引物和反向引物分别为GCATTCTAGGACATTCTGTCAGATG(SEQ ID NO:19)和AACAATGAGAAGCACTCAAAGGAA(SEQ ID NO:20)；

用于扩增PKD1基因外显子35至外显子39的引物，其正向引物和反向引物分别为GCCCAGGTTAACATGGGCT(SEQ ID NO:21)和GGTCACACAGCTAGGGAGC(SEQ ID NO:22)；用于扩增PKD1基因外显子40至外显子45上游的引物，其正向引物和反向引物分别为TGGCCAGCAGGAAACACTC(SE Q ID NO:23)和ACCTTGCTGAGGCCCATC(SEQ ID NO:24)；

用于扩增PKD1基因外显子46至3’UTR的引物，其正向引物和反向引物分别为GTTCCGCCACAAAGTCCG(SEQ ID NO:25)和GAGGCAGCCACTGAACCAAA(SEQ ID NO:26)；用于扩增PKD1基因外显子2至外显子7的引物，其正向引物和反向引物分别为TCGCCGTTTCACCCAGG(SEQ ID NO:27)和ACACCTCCGGGCTGCA(SEQ ID NO:28)；

用于扩增PKD1基因外显子12至外显子15上游的引物，其正向引物和反向引物分别为CATTCCACUGTCTCATTTCACAA AATGA(SEQ ID NO:31)和GAGGGCAGCGGGTGC(SEQ ID NO:32)；

用于扩增PKD1基因外显子15中游的引物，其正向引物和反向引物分别为GCCCdIGAGGCAACAGT(SEQ ID NO:33)和CACCTCGGGGUTGGCC(SEQ ID NO:34)；

用于扩增PKD1基因外显子15下游至外显子16的引物，其正向引物和反向引物分别为GGCGACTCGCTGdITCA(SEQ ID NO:35)和GGGATGCGTGTGAGAAGAGA(SEQ ID NO:36)；用于扩增PKD1基因外显子17至外显子22的引物，其正向引物和反向引物分别为CCTTCCGCCGTCCAAGTT(SEQ ID NO:37)和GGGTAGAGAAAAGAGAAGGGAGAAG(SEQ ID NO:38)；

用于扩增PKD1基因外显子23至外显子26的引物，其正向引物和反向引物分别为TCAGCdIGGGCCCTGGCC(SEQ ID NO:39)和CCGGGCTAATTTTTTTGTACTTTTTATTAGA(SE Q ID NO:40)；

用于扩增PKD1基因外显子27至外显子34的引物，其正向引物和反向引物分别为GCTCCTTGAGTGCGCACA(SEQ ID NO:41)和GAGAGCCGGACACTCACAG(SEQ ID NO:42)；用于扩增PKD1基因外显子38至外显子42的引物，其正向引物和反向引物分别为TAAGCACCACTGCAGTGGC(SEQ ID NO:43)和CCTGTGCCAAGTACGGGC(SEQ ID NO:44)；用于扩增PKD1基因外显子45下游至3’UTR的引物，其正向引物和反向引物分别为TGCGTGGAGAGCTGTACC(SEQID NO:45)和AGAGCGGTTGCCACGC(SEQ ID NO:46)。

5.用于选择性扩增PKD1真基因的扩增体系，其特征在于，所述扩增体系包含权利要求4所述的引物组。

6.根据权利要求5所述的扩增体系，其特征在于，所述扩增体系包括两个反应池，其中如SEQ ID NO:1-SEQ ID NO:26所示的引物组位于第一反应池，如SEQ ID NO:27-SEQ IDNO:46所示的引物组位于第二反应池。

7.根据权利要求6所述的扩增体系，其特征在于，所述第一反应池和第二反应池的产物比例为1:2。

8.用于选择性扩增PKD1真基因的试剂盒，其特征在于，所述试剂盒包含权利要求4所述的引物组。

9.根据权利要求8所述的试剂盒，其特征在于，所述试剂盒还包括用于从样品中提取基因组DNA的试剂、利用所述引物组进行长片段PCR反应的试剂、处理扩增产物用于高通量测序技术的试剂、用于对处理后的扩增产物进行高通量测序的试剂。

10.根据权利要求9所述的试剂盒，其特征在于，利用所述引物组进行长片段PCR反应的试剂包括DNA聚合酶、缓冲液混合物；优选地，所述DNA聚合酶是Long Chain Multiplex PCR

Enzyme；优选地，所述缓冲液混合物包含dNTP、KCl、DMSO、MgCl₂、Trisl-HCL、PEG8000。

11.根据权利要求9或10所述的试剂盒，其特征在于，处理扩增产物用于高通量测序技术的试剂包括末端修复酶、末端修复缓冲液、接头连接酶、接头连接缓冲液、接头；优选地，所述末端修复酶是5×ER/A-Tailing Enzyme Mix；优选地，所述末端修复缓冲液是10×ERABuffer；优选地，所述接头连接酶是T4DNA Ligase；优选地，所述接头连接缓冲液是5×Rapid LigationBuffer。

12.一种检测PKD1基因突变的方法，其特征在于，所述方法包括以下步骤：

1)使用权利要求4所述的引物组、权利要求5-7中任一项所述的扩增体系、或权利要求8-11中任一项所述的试剂盒扩增PKD1基因；优选地，所述扩增过程中的退火温度为60℃，时间为10min；

2)对步骤1)获得的扩增产物进行高通量测序；

13.权利要求4所述的引物组、权利要求5-7中任一项所述的扩增体系、或权利要求8-11中任一项所述的试剂盒的应用，其特征在于，所述应用包括但不限于：检测PKD1基因的变异、多囊肾发病原因的判断、治疗方案的选择、和/或指导优生优育。