CN117757912A

CN117757912A - Pkd1和pkd2基因的引物组合物、试剂盒及测序方法

Info

Publication number: CN117757912A
Application number: CN202211163279.6A
Authority: CN
Inventors: 潘世让; 王洋; 吴婷婷; 汪德鹏
Original assignee: Grandomics Biosciences Co ltd
Current assignee: Grandomics Biosciences Co ltd
Priority date: 2022-09-23
Filing date: 2022-09-23
Publication date: 2024-03-26

Abstract

本发明提供了PKD1和PKD2基因的引物组合物、试剂盒及测序方法，该引物组合物具有以下特征：1)所述引物组合物用于检测PKD1和PKD2基因，且检测的PKD1和PKD2基因长度不低于2kb；2)包含多个引物，所述多个引物均匀覆盖PKD1和PKD2基因，且每两个相邻引物在与所述PKD1和PKD2基因结合时，覆盖位点平均具有不多于10bp的重叠区域，或者平均间隔为1bp～4kb；3)所述引物组合物覆盖PKD1和PKD2基因全长；4)所述引物组合物中的引物的核酸序列与PKD1和PKD2基因互补配对。该引物组合物、试剂盒及测序方法能够覆盖全部变异类型，快捷方便且经济实用，实现了对常染色体显性多囊肾基因PKD1和PKD2基因的快速检测。

Description

PKD1和PKD2基因的引物组合物、试剂盒及测序方法

技术领域

本发明涉及生物技术领域，具体而言，涉及PKD1和PKD2基因的引物组合物、试剂盒及测序方法。

背景技术

多囊肾是累及双侧肾脏的遗传性疾病，肾脏上充满液体的囊群，称为囊肿，肾囊肿的体积大小和数量随着个体年龄增加而缓慢地增加，严重干扰了肾脏过滤血液中废物的能力。囊肿的生长会导致肾脏不断变大，甚至导致肾衰竭，是人体中最常见的先天性遗传囊性肾病。常染色体显性遗传多囊肾(ADPKD)病发病率约为1/500～1/1000人。统计数据显示，我国约有150-300万先天性多囊肾病人。

ADPKD患者约85％是由PKD1基因突变所导致的，约15％是由PKD2基因突变所导致的；已知的PKD1基因突变没有明显热点突变，广泛分布，PKD1基因组区域复杂，1-33号外显子区域有6个假基因(PKD1P1-P6)，同源性高达97.7％，且个别区域GC含量极高，给常规基因检测带来了很大的困难。

以往围绕多囊肾基因突变检测有LR-PCR一代测序、长读长PCR(Long Read-PCR，简称LR-PCR)结合NGS测序、全外显子测序(Whole Exome Sequencing，简称WES测序)等多种检测方法，然而现有方法均有缺陷，检测灵敏度、特异性都有待提高。一代测序操作费时费力，且个别区段区分不了PKD1真假基因；捕获测序虽然变异类型覆盖全，但是面临着探针合成昂贵、实验操作步骤繁琐、实验周期长以及在GC含量极高的区域捕获效果差的问题，因此在多囊肾基因突变临床检测上并未得到大规模推广应用。

LR-PCR结合NGS测序借助LR-PCR开展长片段PCR扩增，虽然可以区分真假基因，但是LR-PCR都是在目的区段的上下游设计一对正、反向扩增引物，当扩增区域发生SV结构变异之后，往往导致无法扩增。比如当扩增区域内发生倒位后，将导致正、反向引物变成同方向引物，无法扩增；或者当扩增区域内发生异位后，将导致正、反向引物相距太远，也无法扩增；或者当扩增区域发生大的缺失变异，导致正、反向引物结合位点缺失之后，也将导致无法扩增。因此，LR-PCR检测方法不能覆盖全部变异类型。

临床上迫切需要克服现有的检测技术缺陷，提升多囊肾基因突变检测灵敏度、特异性的方法。

发明内容

有鉴于此，本发明的目的是提供PKD1和PKD2基因的引物组合物、试剂盒及测序方法，该引物组合物、试剂盒及测序方法能够覆盖全部变异类型，快捷方便且经济实用，实现了对多囊肾基因PKD1和PKD2基因的快速检测。

基于上述目的，本发明的第一个方面提供了一种引物组合物，其中，

1)所述引物组合物用于检测PKD1和PKD2基因，且检测的PKD1和PKD2基因长度不低于2kb；

2)包含多个引物，所述多个引物均匀覆盖PKD1和PKD2基因，且每两个相邻引物在与所述PKD1和PKD2基因结合时，覆盖位点平均具有不多于10bp的重叠区域，或者平均间隔为1bp～4kb；优选地，每两个相邻引物所覆盖位点的平均间隔为1kb～3kb；更优选地，每两个相邻引物所覆盖位点的平均间隔为1900～2100bp；

3)所述引物组合物覆盖PKD1和PKD2基因全长；

4)所述引物组合物中的引物的核酸序列与PKD1和PKD2基因互补配对；

优选地，所述PKD1和PKD2基因的种属来源于动物；

更优选地，所述PKD1和PKD2基因的种属来源于灵长类动物；

进一步优选地，所述PKD1和PKD2基因的种属来源于人。

在本发明的优选的实施方案中，其中，所述引物组合物包括Pool A引物组和PoolB引物组；其中所述Pool A引物组具有SEQ ID NO:1-SEQ ID NO:61的序列，所述Pool B引物组具有SEQ ID NO:62-SEQ ID NO:122的序列。

本发明的第二个方面提供了一种PKD1和PKD2基因的测序方法，其包括以下步骤：

I)将待测样品中的基因组DNA打断为多个核酸片段；

II)使用上述引物组合物对所述核酸片段中的PKD1和PKD2基因进行扩增；

III)对所述PKD1和PKD2基因进行测序；

所述测序方法用于非疾病诊断或治疗目的。

在本发明的优选的实施方案中，所述步骤I)还包括将所述核酸片段进行末端修复后连接接头序列；

优选地，所述核酸片段的长度为2～10kb；

更优选地，所述核酸片段的长度为4～6kb。

在本发明的优选的实施方案中，所述扩增包括以下步骤：

a)以步骤I)得到的核酸片段为模板，使用Pool A引物组进行扩增，得到第一扩增产物；

b)以第一扩增产物为模板，使用通用引物Primer LA+Primer R进行扩增，得到第二扩增产物；

c)以第二扩增产物为模板，使用Pool B引物组进行扩增，得到第三扩增产物；

d)以第三扩增产物为模板，使用通用引物Primer LB+Primer R进行扩增，得到扩增终产物；

其中，所述Primer LA的序列如SEQ ID NO:123所示，所述Primer R的序列如SEQID NO:124所示，所述Primer LB的序列如SEQ ID NO:125所示。

在本发明的优选的实施方案中，所述扩增还包括对第一扩增产物、第二扩增产物、第三扩增产物和扩增终产物进行纯化。

在本发明的优选的实施方案中，所述测序为三代测序；

优选地，所述三代测序采用PacBio Sequel、PromethION、MinION、GridION平台进行。

本发明的第三个方面提供了一种用于PKD1和PKD2基因测序的试剂盒，其包括上述引物组合物；

优选地，所述试剂盒还包括接头序列、通用引物、DNA提取体系、PCR反应缓冲液、无核酸酶的水、DNA聚合酶、分子量marker、末端修复酶、末端修复缓冲液、DNA连接酶中的一种或多种；

优选地，所述通用引物为Primer LA、Primer R和Primer LB，所述Primer LA的序列如SEQ ID NO:123所示，所述Primer R的序列如SEQ ID NO:124所示，所述Primer LB的序列如SEQ ID NO:125所示。

本发明的第四个方面提供了上述引物组合物或上述试剂盒在检测PKD1和PKD2基因变异中的应用；

优选地，所述PKD1和PKD2基因变异包括插入、缺失、复制、倒位、易位或SNP。

本发明的第五个方面提供了上述引物组合物或上述试剂盒在制备常染色体显性多囊肾疾病诊断试剂中的应用。

本发明的有益效果为：

(1)成功检测出常规方法难以检测的结构变异，提升了常染色体显性多囊肾检测的灵敏度，为发现新的致病突变提供分子生物学依据。

(2)本发明实验操作简单，实验周期短、成本临床可及，具有显著的临床推广应用价值。

附图说明

图1为本发明一个实施例中对不同间隔的目的基因单方向多重引物覆盖均一性分析结果。

图2为本发明一个实施例中不同间隔的目的基因单方向多重引物的扩增片段终产物长度。

图3为本发明一个实施例中Agilent 2100 Bioanalyzer检测结果图。

具体实施方式

需要说明的是，除非另外定义，本申请使用的技术术语或者科学术语应当为所属领域的技术人员所理解的通常意义。

下述实施例中的实验方法，如无特殊说明，均为常规方法。下述实施例中所用的药材原料、试剂材料等，如无特殊说明，均为市售产品。

如本文所使用的，“读长”是指测序反应所能测得序列的长度，如果DNA序列长度高于读长，那么必须把DNA序列分割成长度在读长以内的短序列才能测序。一代测序双脱氧链终止法(Sanger法)的读长是1000bp，二代测序较低为50bp-300bp，三代测序可以达到5000bp以上，最长读长甚至能达到20kb，较长的读长也正是三代测序最大的优势所在。

如本文所使用的，“覆盖位点”是指引物与PKD1和PKD2基因结合的区域。

如本文所使用的，“多个”是指两个或两个以上。

本发明所述的“互补配对”是指所述引物能够在严格条件下与上述位点所代表的序列杂交。本发明中使用的“严格条件”是指在DNA扩增反应中仅允许引物对目标核酸序列发生杂交的条件。

本文使用的“组织裂解液”表示包含裂解的组织的样品和/或生物样品材料，即其中组织的结构完整性已经被破坏。为了释放组织样品的内容物，通常用酶和/或化学试剂处理所述材料，以溶解、降解或破坏这样的组织的细胞壁和细胞膜。熟练的技术员非常熟悉用于得到组织裂解液的适当方法。

本发明提供了一种引物组合物，其中，

2)包含多个引物，所述多个引物均匀覆盖PKD1和PKD2基因，且每两个相邻引物在与所述PKD1和PKD2基因结合时，覆盖位点平均具有不多于10bp的重叠区域，或者平均间隔为1bp～4kb；

3)所述引物组合物覆盖PKD1和PKD2基因全长；

优选地，所述PKD1和PKD2基因的种属来源于动物；

更优选地，所述PKD1和PKD2基因的种属来源于灵长类动物；

进一步优选地，所述PKD1和PKD2基因的种属来源于人。

在本发明中，每两个相邻引物与PKD1和PKD2基因结合时可以有重叠的覆盖位点，但是要求平均具有不多于10bp的重叠区域，这样既能保证检测效果，又可以降低使用的引物数量，从而降低成本。或者，每两个相邻引物与PKD1和PKD2基因结合时具有一定的平均间隔，例如为1bp～4kb，优选地，每两个相邻引物所覆盖位点的平均间隔为1kb～3kb；更优选地，每两个相邻引物所覆盖位点的平均间隔为1900～2100bp。多个引物的平均间隔与基因组片段化平均长度有关，例如，使用如下公式计算多个引物的平均间隔范围：

N＝(L+2)×300-100；

其中：

N：引物平均间隔，单位bp；

L：基因组片段化平均长度，单位kb，取整数；

例如，基因组片段化平均长度为5kb，根据上述公式计算出引物平均间隔范围为：2000bp。在实际应用中，可以选择该范围内的数值作为引物的平均间隔，并可进一步优化引物的平均间隔，在实施例1中，本发明进一步优化多个引物之间的平均间隔，最终确定多个引物的平均间隔在2kb时兼具相对较少的引物数目和相对较好的覆盖均一性。

Pool A引物组和Pool B引物组的序列如表1和表2所示。

表1

表2

上述引物组合物可以与三代测序联用以达到更好的技术效果。因此，本发明提供了一种PKD1和PKD2基因的测序方法，其包括以下步骤：

I)将待测样品中的基因组DNA打断为多个核酸片段；

III)对所述PKD1和PKD2基因进行测序。

所述测序方法用于非疾病诊断或治疗目的。

在一些实施方案中，所述待检测样品为体液，例如血液(全血)、血清、血浆、细胞培养上清、唾液、精液、组织或组织裂解液。

在一些实施方案中，所述待检测样品来自组织或组织裂解液，组织可以选择例如羊水、绒毛、骨骼、肌肉或毛发等。

如前所述，三代测序具有较长的读长，因此，打断的核酸片段在读长以内的短序列均能够被测序。因此，在一些实施方案中，所述核酸片段的长度为2～10kb；还可以选择3k、4k、5k、6k、7k、8k或9k，优选4～6kb。

三代测序使用一种被称为SMRTbell的模板，这是一个通过将发夹接头序列连接到目标双链DNA分子两端而形成的单链环状DNA分子，两端的发夹接头序列为引物结合提供位点。因此，本发明测序方法的步骤I)还包括将所述核酸片段进行末端修复后连接接头序列。

在本发明的优选的实施方案中，所述扩增包括以下步骤：

其中，所述Primer LA的序列如SEQ ID NO:123所示，所述Primer R的序列如SEQID NO:124所示，所述Primer LB的序列如SEQ ID NO:125所示，具体如下：

Primer LA：5'-CACACTGGTAGAGTGACCATTG-3'；

Primer R：5'-GAGATGAGAGTCCAACACGAGAT-3'；

Primer LB：5'-CCATGAGAGAACTGGTGTGGT-3'。

在本发明的优选的实施方案中，所述测序为三代测序；

本方法借助三代测序长读长、无GC偏好性能够更好的区分真假基因的优势，通过巧妙设计的两组带有通用序列的目的基因单方向多重引物的前后两轮联合使用，有效克服了引物潜在的非特异扩增问题，大幅提升了扩增终产物中的目的基因序列的占比，实现了基因突变快速检测。不仅可以检测常规SNV/Indel，还可以检测各种SV变异，真正实现了变异类型的全覆盖检测。克服了一代Sanger测序或二代高通量基因测序不能区分变异来源真基因或假基因的问题，以及普通LR-PCR技术变异类型覆盖不全的问题。

本发明提供了一种用于PKD1和PKD2基因测序的试剂盒，其包括上述引物组合物；

本发明对试剂盒中的接头序列、DNA提取体系等不作限制，具体的可参照实施例。

在一些实施方案中，所述水为无核酸酶的水，例如双蒸水或去离子水。

在一些实施方案中，所述DNA聚合酶选自Taq、Bst、Vent、Phi29、Pfu、Tru、Tth、Tl1、Tac、Tne、Tma、Tih、Tf1、Pwo、Kod、Sac、Sso、Poc、Pab、Mth、Pho、ES4 DNA聚合酶、Klenow片段中的任一种。

本发明的试剂盒可以与三代测序联用以达到更好的技术效果。

本发明所提供的引物组合物、试剂盒可结合三代测序方法，有效对PKD1和PKD2基因进行测序，并对其中的突变进行分析。因此，本发明提供了上述引物组合物或上述试剂盒在检测PKD1和PKD2基因变异中的应用；

在一些实施方案中，所述PKD1和PKD2基因变异位于PKD1和PKD2基因的内含子区和/或外显子区。

该应用可以是非诊断目的的，例如遗传学研究、人种分布、人类进化学等领域的研究中进行应用(典型的如SNP的应用)，或者是PKD1和PKD2基因相关疾病的细胞和动物模型(如果同源性与人很高)的鉴定。

本发明还提供了上述引物组合物或上述试剂盒在制备常染色体显性多囊肾疾病诊断试剂中的应用。

下面将结合实施例对本发明的实施方案进行详细描述，但是本领域技术人员将会理解，下列实施例仅用于说明本发明，而不应视为限制本发明的范围。实施例中未注明具体条件者，按照常规条件或制造商建议的条件进行。所用试剂或仪器未注明生产厂商者，均为可以通过市购获得的常规产品。

实施例1目的基因单方向多重引物间隔与扩增片段大小及覆盖均一性测试

目的基因单方向多重引物间隔越小，相邻引物扩增可替代作用越强，覆盖均一性越好，但也意味着所需要的引物数量就越多，且扩增片段终产物平均长度越小；反之，目的基因单方向多重引物间隔越大，所需要的引物数量就越少，扩增片段终产物平均长度越大，但是片段越长扩增越困难，且个别引物扩增不理想将导致相邻引物无法发挥替代作用，导致个别区域扩增不理想。

为充分发挥三代长读长测序的优势，需要探索目的基因单方向多重引物的合理间隔。为此，评估了目的基因单方向多重引物平均间隔250bp、500bp、1K、2K、3K、4K的设计的引物对靶区域的覆盖均一性。

0.5X平均覆盖深度的序列所占百分比，是一种比较常见评估覆盖均一性的参数，用于考察低覆盖深度带来的局限性。0.5X代表50％的平均覆盖深度，例如某目的区域的捕获，具体到序列位点，有的位点200X(即某个位点被测了200次)、有的位点150X、有的位点100X，统计出来的目的区域整体平均150X(即平均每个位点被测了150次)，0.5X平均覆盖深度即视为0.5×150＝75X以及以上的占比；如果90％以上的目的区域呈现超过0.5X的平均覆盖深度，则目的区域的覆盖均一性相对较好。

如图1所示，多重引物越密集0.5X平均覆盖深度的序列所占百分比越高，平均间隔2K及以内设计的多重引物覆盖均一性明显优于平均间隔大于2K设计的，并且平均间隔2K设计的多重引物与平均间隔小于2K设计的在覆盖均一性方面比较接近，即0.5X平均覆盖深度的序列所占百分比趋近饱和。

如图2所示，多重引物越密集扩增片段终产物平均长度越小，平均间隔2K及以上设计的多重引物扩增片段终产物平均长度明显长于平均间隔小于2K设计的，并且平均间隔2K设计的多重引物与平均间隔大于2K设计的在扩增片段终产物平均长度方面比较接近。因此，平均间隔2K设计的多重引物拥有最佳的性价比。

实施例2制备PKD1和PKD2基因的单方向多重引物

针对PKD1和PKD2基因全长序列，每间隔1K～3K设计一条引物，优选的每平均间隔2K设计一条引物。三代测序仪测序读长长，比如，Pacbio公司的sequel或Oxford Nanopore公司的PromethION测序长度可达几十K，待测样品中的基因组DNA被打断成5K左右的大小片段，每间隔2K设计一条引物，平均每个DNA片段可以结合2条引物，足以对目的片段开展有效的扩增。设计好的引物的模板结合区域碱基个数在20～30bp之间，进一步添加通用引物Primer LA或Primer LB后引物的碱基个数在30～50bp之间，GC含量值适中、无发夹结构，并进一步与NCBI等数据库进行Blast比对，并确保引物避开基因组上的重复区域，通过这些参数以确保引物的特异性。设计得到的引物序列如表1和表2中的Pool A引物组和Pool B引物组所示。

实施例3构建DNA文库

3.1制备工作接头

工作接头AP由接头A1序列与A2序列组合成，A1序列为：

5'-pGGAAAGCAATCTGTACTAGX-3'，如SEQ ID NO:126所示；

A2序列为：

5'-GAGATGAGAGTCCAACACGAGATNNNNNNNNNNNNNNNNCTAGTACAGATTGCTTTCCT-3'，如SEQ ID NO:127所示；

上述序列中的p代表磷酸化修饰；N代表A/G/C/T四种碱基的任意一种；X代表生物素(Biotin)修饰、氨基修饰、FAM荧光染料修饰或者其它任何可抑制3'端序列延伸的修饰；A2序列NNNNNNNNNNNNNNNN用于识别不同样品构建的文库。

进一步的，由上述接头A1序列与A2序列制备成工作接头的具体操作为：

1)用1XTE溶液(pH 8.0)溶解接头A1序列与A2序列，溶解终浓度10μM；

2)在PCR管中等体积混合A1和A2；

3)使用PCR程序：95℃，3分钟；1小时缓慢降温至25℃，0.05℃/s下降温度；即得到工作接头。

3.2样品基因组DNA提取及质量评估

取待检测样品外周血0.5～1mL，采用Blood Genomic DNA Mini Kit(北京康为世纪生物科技有限公司，外周血)进行基因组DNA提取。通过琼脂糖凝胶电泳检测基因组的完整性，用Qubit(Life Technologies，美国)对基因组进行浓度测定。选取基因组相对完整无严重降解且浓度≥25ng/μl的DNA样品进行文库构建。

3.3 DNA文库的构建

3.3.1基因组DNA打断

使用Covaris g-Tube打断管离心打断基因组DNA，离心参数设置如下：离心力2000g、时间2min。使用0.4倍体积的Beckman XP磁珠进行纯化，制得片段化基因组DNA。

3.3.2样本末端修复、加接头

3.3.2.1末端修复，加“A”

使用NEB Next Ultra End Repair/dA-Tailing Module试剂盒。

体系为：

表3

反应条件为：

表4

3.3.2.2接头连接

使用NEB Next Ultra II Ligation Module试剂盒。

体系为：

表5

于PCR仪中，20℃反应15min。随后，使用0.4倍体积的Beckman XP磁珠进行纯化，获得文库溶液。

3.3.3文库的第一次扩增

反应体系为：

表6

其中，Primer Pool A如上表1所示。

反应条件为：

表7

反应结束后，使用0.4倍体积的XP磁珠进行纯化，最后使用TE溶液洗脱磁珠，转移至新的离心管内，进入下一步操作，或者放在-80℃中备用。

3.3.4文库的第二次扩增

反应体系为：

表8

其中，Primer LA(如SEQ ID NO:123所示)和Primer R(如SEQ ID NO:124所示)为文库第二次扩增的引物。

反应条件为：

表9

3.3.5文库的第三次扩增

反应体系为：

表10

其中，Primer Pool B如上表2所示。

反应条件为：

表11

3.3.6文库的第四次扩增

反应体系为：

表12

其中，Primer LB(如SEQ ID NO:125所示)和Primer R(如SEQ ID NO:124所示)为文库第四次扩增的引物。

反应条件为：

表13

3.4文库质检

本领域技术人员通常认为：Qubit检测浓度，计算总量1μg以上，Agilent2100检测大小，主峰在1K～8K之间，即可视为文库合格。上步骤3.3制备的文库进行Qubit检测及Agilent 2100 Bioanalyzer检测，主峰约3014bp，扩增产物片段大小符合预期(如图3所示)，检测合格文库进行下一步三代测序文库构建。

实施例4三代测序文库构建及测序

4.1使用Pacbio sequel测序

4.1.1使用建库试剂盒进行建库

4.1.1.1将混好的文库进行修复

修复溶液配制：

表14

混匀，离心，放入PCR热循环仪中，进行修复反应，具体条件如下：

表15

4.1.1.2纯化

使用0.45倍样品体积的PB磁珠进行纯化，最后使用双蒸水洗脱磁珠，-20℃冰箱保存。

4.1.1.3接头连接

连接溶液体系如下：

表16

混匀，离心，于PCR热循环仪中进行连接反应，具体条件如下：

表17

4.1.1.4纯化

4.1.2引物退火及Binding反应

按照Pacbio官方网页(https://www.pacb.com/products-and-services/consumables/binding-and-cleanup-kits/)给出标准操作方式进行。

4.1.3三代测序

按照Pacbio sequel仪器标准操作规范(https://www.pacb.com/products-and-services/consumables/smrt-cells-sequencing-reagent-kits-and-accessories/)进行测序。

4.2使用Oxford Nanopore PromethION测序

4.2.1样本末端修复

取DNA，置于冰上，加入NEB末端修复/加A尾试剂，混匀。20℃孵育40分钟，65℃孵育20分钟。

4.2.2 DNA纯化

将0.4×AMPure beads加入DNA中，室温孵育15min，室温磁力架吸附5min，吸弃上清。

加入80％乙醇，磁力架吸附，弃上清，重复一次。室温晾干。

添加Ultra Pure Water，37℃下吹打洗脱。

磁力架上静置5min，吸取上清，即为纯化后的DNA。

4.2.3接头连接

加入NEB T4 DNA快速连接buffer、NEB T4 DNA快速连接酶和接头，混匀，20℃孵育20min。

4.2.4 DNA纯化

将0.4×AMPure beads加入PCR产物中，室温孵育5min，室温磁力架吸附2min，吸弃上清。加入200ul LFB吹打混匀，磁力架吸附，弃上清，重复一次。添加EB 15ul，吹打洗脱。磁力架上静置5min，吸取上清，即为纯化后的DNA。

4.2.5Priming及Loading操作

按照Oxford Nanopore PromethION官方网页(https://store.nanoporetech.com/sample-prep.html)给出标准操作方式进行。

4.2.6三代测序

按照Oxford Nanopore PromethION仪器标准操作规范(https://store.nanoporetech.com/promethion-advanced-training.html)进行测序。

实施例5生物信息学分析

5.1拆分各样品数据

若下机数据为多样品混测，根据各样品的标签序列拆分出每个样品的数据。

5.2数据过滤

根据各平台数据特点，生成高质量数据。

ONT平台过滤掉质量值较低的数据。Pacbio平台采用官方软件生成高质量的一致性序列。

5.3数据评估

将高质量的数据比对到人类全基因组参考序列，采取唯一比对(即单条序列只能唯一比对到基因组的一个位置)。统计目标区域的序列覆盖深度。

若数据不合格(合格的标准是：靶区域的测序覆盖度，要求30X覆盖度不低于95％)，根据情况进行补测数据。

5.4变异检测

检测目标区域的单核苷酸位点变异、小片段插入与缺失、染色体结构变异(SNV/InDel、SV)等；并对变异进行各数据库的注释，以筛选致病性变异位点。

5.5变异位点的验证。

将筛选出的致病性变异位点进行LR-PCR结合NGS测序对照方法验证，结果如表18所示，LR-PCR结合NGS对照方法有3例样本未检出。针对这3例不一致的临床样本，依据变异位点序列信息，进一步开展一代Sanger测序验证，结果表明一代Sanger测序结果与本发明三代测序方法一致。上述验证结果表明，本发明三代测序方法优于对照LR-PCR结合NGS测序方法。对收集的临床样本，经观测临床表型，对多囊肾发病情况进行了确认。该过程中，实验人员、数据分析人员均不知道样本的基因型及临床表型，以确保结果的可信性。

表18变异位点的验证结果

Claims

1.一种引物组合物，其中，

3)所述引物组合物覆盖PKD1和PKD2基因全长；

4)所述引物组合物中的引物的核酸序列与PKD1和PKD2基因互补配对。

2.根据权利要求1所述的引物组合物，其中，所述所述引物组合物包括PoolA引物组和PoolB引物组；其中所述PoolA引物组具有SEQ ID NO:1-SEQ ID NO:61的序列，所述Pool B引物组具有SEQ ID NO:62-SEQ ID NO:122的序列。

3.一种PKD1和PKD2基因的测序方法，其包括以下步骤：

I)将待测样品中的基因组DNA打断为多个核酸片段；

II)使用权利要求1或2所述的引物组合物对所述核酸片段中的PKD1和PKD2基因进行扩增；

III)对所述PKD1和PKD2基因进行测序；

所述测序方法用于非疾病诊断或治疗目的。

4.根据权利要求3所述的测序方法，其中，所述步骤I)还包括将所述核酸片段进行末端修复后连接接头序列；

优选地，所述核酸片段的长度为2～10kb；

更优选地，所述核酸片段的长度为4～6kb。

5.根据权利要求3或4所述的测序方法，其中，所述扩增包括以下步骤：

a)以步骤I)得到的核酸片段为模板，使用PoolA引物组进行扩增，得到第一扩增产物；

其中，所述Primer LA的序列如SEQ ID NO:123所示，所述Primer R的序列如SEQ IDNO:124所示，所述Primer LB的序列如SEQ ID NO:125所示。

6.根据权利要求5所述的测序方法，其中，所述扩增还包括对第一扩增产物、第二扩增产物、第三扩增产物和扩增终产物进行纯化。

7.根据权利要求3或4所述的测序方法，其中，所述测序为三代测序；

8.一种用于PKD1和PKD2基因测序的试剂盒，其包括权利要求1或2所述的引物组合物。

9.权利要求1或2所述的引物组合物或权利要求8所述的试剂盒在检测PKD1和PKD2基因变异中的应用。

10.权利要求1或2所述的引物组合物或权利要求8所述的试剂盒在制备常染色体显性多囊肾疾病诊断试剂中的应用。