CN117757912A - Pkd1和pkd2基因的引物组合物、试剂盒及测序方法 - Google Patents
Pkd1和pkd2基因的引物组合物、试剂盒及测序方法 Download PDFInfo
- Publication number
- CN117757912A CN117757912A CN202211163279.6A CN202211163279A CN117757912A CN 117757912 A CN117757912 A CN 117757912A CN 202211163279 A CN202211163279 A CN 202211163279A CN 117757912 A CN117757912 A CN 117757912A
- Authority
- CN
- China
- Prior art keywords
- primer
- pkd1
- sequencing
- pkd2
- primer composition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 102100037310 Serine/threonine-protein kinase D1 Human genes 0.000 title claims abstract description 65
- 101001074439 Homo sapiens Polycystin-2 Proteins 0.000 title claims abstract description 58
- 101001026882 Homo sapiens Serine/threonine-protein kinase D2 Proteins 0.000 title claims abstract description 58
- 238000012163 sequencing technique Methods 0.000 title claims abstract description 55
- 239000000203 mixture Substances 0.000 title claims abstract description 41
- 150000007523 nucleic acids Chemical group 0.000 claims abstract description 23
- 208000010061 Autosomal Dominant Polycystic Kidney Diseases 0.000 claims abstract description 5
- 230000003321 amplification Effects 0.000 claims description 51
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 51
- 239000000047 product Substances 0.000 claims description 33
- 238000000034 method Methods 0.000 claims description 16
- 238000007671 third-generation sequencing Methods 0.000 claims description 10
- 239000007795 chemical reaction product Substances 0.000 claims description 8
- 101100029888 Homo sapiens PKD1 gene Proteins 0.000 claims description 6
- 101150056230 PKD1 gene Proteins 0.000 claims description 6
- 239000003153 chemical reaction reagent Substances 0.000 claims description 6
- 201000010099 disease Diseases 0.000 claims description 5
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 5
- 101150112863 pkd2 gene Proteins 0.000 claims description 5
- 238000002360 preparation method Methods 0.000 claims description 5
- 239000012467 final product Substances 0.000 claims description 4
- 230000007614 genetic variation Effects 0.000 claims description 4
- 208000022185 autosomal dominant polycystic kidney disease Diseases 0.000 claims description 3
- 230000001225 therapeutic effect Effects 0.000 claims description 3
- 102100036142 Polycystin-2 Human genes 0.000 claims 1
- 238000001514 detection method Methods 0.000 abstract description 17
- 230000035772 mutation Effects 0.000 abstract description 16
- 101100029891 Caenorhabditis elegans pkd-2 gene Proteins 0.000 abstract description 2
- 101001074444 Homo sapiens Polycystin-1 Proteins 0.000 description 43
- 239000011324 bead Substances 0.000 description 24
- 108020004414 DNA Proteins 0.000 description 21
- 239000000523 sample Substances 0.000 description 20
- 238000006243 chemical reaction Methods 0.000 description 18
- 108090000623 proteins and genes Proteins 0.000 description 17
- 239000012634 fragment Substances 0.000 description 15
- 238000000746 purification Methods 0.000 description 12
- 210000001519 tissue Anatomy 0.000 description 11
- 238000010276 construction Methods 0.000 description 8
- 208000030761 polycystic kidney disease Diseases 0.000 description 8
- 239000000243 solution Substances 0.000 description 8
- 208000026372 Congenital cystic kidney disease Diseases 0.000 description 7
- 238000009739 binding Methods 0.000 description 7
- 206010064571 Gene mutation Diseases 0.000 description 6
- 241000894007 species Species 0.000 description 6
- 239000006228 supernatant Substances 0.000 description 6
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 6
- 230000000694 effects Effects 0.000 description 5
- 238000002156 mixing Methods 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 238000007481 next generation sequencing Methods 0.000 description 5
- 238000007400 DNA extraction Methods 0.000 description 4
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 4
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 4
- 102000004190 Enzymes Human genes 0.000 description 4
- 108090000790 Enzymes Proteins 0.000 description 4
- 210000004369 blood Anatomy 0.000 description 4
- 239000008280 blood Substances 0.000 description 4
- 238000012217 deletion Methods 0.000 description 4
- 230000037430 deletion Effects 0.000 description 4
- 239000006166 lysate Substances 0.000 description 4
- 230000002441 reversible effect Effects 0.000 description 4
- 238000012795 verification Methods 0.000 description 4
- 108091028043 Nucleic acid sequence Proteins 0.000 description 3
- 102100037312 Serine/threonine-protein kinase D2 Human genes 0.000 description 3
- 239000000872 buffer Substances 0.000 description 3
- 208000031513 cyst Diseases 0.000 description 3
- 239000012154 double-distilled water Substances 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000003780 insertion Methods 0.000 description 3
- 230000037431 insertion Effects 0.000 description 3
- 210000003734 kidney Anatomy 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 230000001717 pathogenic effect Effects 0.000 description 3
- 239000002096 quantum dot Substances 0.000 description 3
- 238000007480 sanger sequencing Methods 0.000 description 3
- 230000035945 sensitivity Effects 0.000 description 3
- 206010010356 Congenital anomaly Diseases 0.000 description 2
- 102000053602 DNA Human genes 0.000 description 2
- 102000012410 DNA Ligases Human genes 0.000 description 2
- 108010061982 DNA Ligases Proteins 0.000 description 2
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 2
- 241000288906 Primates Species 0.000 description 2
- 238000005119 centrifugation Methods 0.000 description 2
- 230000000295 complement effect Effects 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000013467 fragmentation Methods 0.000 description 2
- 238000006062 fragmentation reaction Methods 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 239000003550 marker Substances 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 210000005259 peripheral blood Anatomy 0.000 description 2
- 239000011886 peripheral blood Substances 0.000 description 2
- 238000012797 qualification Methods 0.000 description 2
- 239000011535 reaction buffer Substances 0.000 description 2
- 230000010076 replication Effects 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 230000005945 translocation Effects 0.000 description 2
- LLIANSAISVOLHR-GBCQHVBFSA-N 5-[(3as,4s,6ar)-2-oxidanylidene-1,3,3a,4,6,6a-hexahydrothieno[3,4-d]imidazol-4-yl]pentanoic acid Chemical group N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21.N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 LLIANSAISVOLHR-GBCQHVBFSA-N 0.000 description 1
- 108020004638 Circular DNA Proteins 0.000 description 1
- 108091035707 Consensus sequence Proteins 0.000 description 1
- 102000004594 DNA Polymerase I Human genes 0.000 description 1
- 108010017826 DNA Polymerase I Proteins 0.000 description 1
- 230000004544 DNA amplification Effects 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 208000026350 Inborn Genetic disease Diseases 0.000 description 1
- 101710163270 Nuclease Proteins 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 108091008109 Pseudogenes Proteins 0.000 description 1
- 102000057361 Pseudogenes Human genes 0.000 description 1
- 208000001647 Renal Insufficiency Diseases 0.000 description 1
- 238000000246 agarose gel electrophoresis Methods 0.000 description 1
- 210000004381 amniotic fluid Anatomy 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000010171 animal model Methods 0.000 description 1
- 238000000137 annealing Methods 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000002146 bilateral effect Effects 0.000 description 1
- 238000003766 bioinformatics method Methods 0.000 description 1
- 239000012472 biological sample Substances 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000007664 blowing Methods 0.000 description 1
- 210000001124 body fluid Anatomy 0.000 description 1
- 210000000988 bone and bone Anatomy 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 210000004027 cell Anatomy 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 210000000170 cell membrane Anatomy 0.000 description 1
- 210000002421 cell wall Anatomy 0.000 description 1
- 239000013043 chemical agent Substances 0.000 description 1
- 210000001726 chromosome structure Anatomy 0.000 description 1
- 230000001010 compromised effect Effects 0.000 description 1
- 238000001816 cooling Methods 0.000 description 1
- 239000012228 culture supernatant Substances 0.000 description 1
- 238000011157 data evaluation Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 239000008367 deionised water Substances 0.000 description 1
- 229910021641 deionized water Inorganic materials 0.000 description 1
- 238000010828 elution Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 208000022343 familial cystic renal disease Diseases 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 239000012530 fluid Substances 0.000 description 1
- 239000007850 fluorescent dye Substances 0.000 description 1
- 102000054767 gene variant Human genes 0.000 description 1
- 208000016361 genetic disease Diseases 0.000 description 1
- 210000004209 hair Anatomy 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 201000006370 kidney failure Diseases 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 238000011068 loading method Methods 0.000 description 1
- 210000003205 muscle Anatomy 0.000 description 1
- 239000002773 nucleotide Substances 0.000 description 1
- 125000003729 nucleotide group Chemical group 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 210000002381 plasma Anatomy 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 238000007639 printing Methods 0.000 description 1
- 238000001303 quality assessment method Methods 0.000 description 1
- 239000002994 raw material Substances 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 210000003296 saliva Anatomy 0.000 description 1
- 210000000582 semen Anatomy 0.000 description 1
- 210000002966 serum Anatomy 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 229910021642 ultra pure water Inorganic materials 0.000 description 1
- 239000012498 ultrapure water Substances 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
- 238000007482 whole exome sequencing Methods 0.000 description 1
Landscapes
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明提供了PKD1和PKD2基因的引物组合物、试剂盒及测序方法,该引物组合物具有以下特征:1)所述引物组合物用于检测PKD1和PKD2基因,且检测的PKD1和PKD2基因长度不低于2kb;2)包含多个引物,所述多个引物均匀覆盖PKD1和PKD2基因,且每两个相邻引物在与所述PKD1和PKD2基因结合时,覆盖位点平均具有不多于10bp的重叠区域,或者平均间隔为1bp~4kb;3)所述引物组合物覆盖PKD1和PKD2基因全长;4)所述引物组合物中的引物的核酸序列与PKD1和PKD2基因互补配对。该引物组合物、试剂盒及测序方法能够覆盖全部变异类型,快捷方便且经济实用,实现了对常染色体显性多囊肾基因PKD1和PKD2基因的快速检测。
Description
技术领域
本发明涉及生物技术领域,具体而言,涉及PKD1和PKD2基因的引物组合物、试剂盒及测序方法。
背景技术
多囊肾是累及双侧肾脏的遗传性疾病,肾脏上充满液体的囊群,称为囊肿,肾囊肿的体积大小和数量随着个体年龄增加而缓慢地增加,严重干扰了肾脏过滤血液中废物的能力。囊肿的生长会导致肾脏不断变大,甚至导致肾衰竭,是人体中最常见的先天性遗传囊性肾病。常染色体显性遗传多囊肾(ADPKD)病发病率约为1/500~1/1000人。统计数据显示,我国约有150-300万先天性多囊肾病人。
ADPKD患者约85%是由PKD1基因突变所导致的,约15%是由PKD2基因突变所导致的;已知的PKD1基因突变没有明显热点突变,广泛分布,PKD1基因组区域复杂,1-33号外显子区域有6个假基因(PKD1P1-P6),同源性高达97.7%,且个别区域GC含量极高,给常规基因检测带来了很大的困难。
以往围绕多囊肾基因突变检测有LR-PCR一代测序、长读长PCR(Long Read-PCR,简称LR-PCR)结合NGS测序、全外显子测序(Whole Exome Sequencing,简称WES测序)等多种检测方法,然而现有方法均有缺陷,检测灵敏度、特异性都有待提高。一代测序操作费时费力,且个别区段区分不了PKD1真假基因;捕获测序虽然变异类型覆盖全,但是面临着探针合成昂贵、实验操作步骤繁琐、实验周期长以及在GC含量极高的区域捕获效果差的问题,因此在多囊肾基因突变临床检测上并未得到大规模推广应用。
LR-PCR结合NGS测序借助LR-PCR开展长片段PCR扩增,虽然可以区分真假基因,但是LR-PCR都是在目的区段的上下游设计一对正、反向扩增引物,当扩增区域发生SV结构变异之后,往往导致无法扩增。比如当扩增区域内发生倒位后,将导致正、反向引物变成同方向引物,无法扩增;或者当扩增区域内发生异位后,将导致正、反向引物相距太远,也无法扩增;或者当扩增区域发生大的缺失变异,导致正、反向引物结合位点缺失之后,也将导致无法扩增。因此,LR-PCR检测方法不能覆盖全部变异类型。
临床上迫切需要克服现有的检测技术缺陷,提升多囊肾基因突变检测灵敏度、特异性的方法。
发明内容
有鉴于此,本发明的目的是提供PKD1和PKD2基因的引物组合物、试剂盒及测序方法,该引物组合物、试剂盒及测序方法能够覆盖全部变异类型,快捷方便且经济实用,实现了对多囊肾基因PKD1和PKD2基因的快速检测。
基于上述目的,本发明的第一个方面提供了一种引物组合物,其中,
1)所述引物组合物用于检测PKD1和PKD2基因,且检测的PKD1和PKD2基因长度不低于2kb;
2)包含多个引物,所述多个引物均匀覆盖PKD1和PKD2基因,且每两个相邻引物在与所述PKD1和PKD2基因结合时,覆盖位点平均具有不多于10bp的重叠区域,或者平均间隔为1bp~4kb;优选地,每两个相邻引物所覆盖位点的平均间隔为1kb~3kb;更优选地,每两个相邻引物所覆盖位点的平均间隔为1900~2100bp;
3)所述引物组合物覆盖PKD1和PKD2基因全长;
4)所述引物组合物中的引物的核酸序列与PKD1和PKD2基因互补配对;
优选地,所述PKD1和PKD2基因的种属来源于动物;
更优选地,所述PKD1和PKD2基因的种属来源于灵长类动物;
进一步优选地,所述PKD1和PKD2基因的种属来源于人。
在本发明的优选的实施方案中,其中,所述引物组合物包括Pool A引物组和PoolB引物组;其中所述Pool A引物组具有SEQ ID NO:1-SEQ ID NO:61的序列,所述Pool B引物组具有SEQ ID NO:62-SEQ ID NO:122的序列。
本发明的第二个方面提供了一种PKD1和PKD2基因的测序方法,其包括以下步骤:
I)将待测样品中的基因组DNA打断为多个核酸片段;
II)使用上述引物组合物对所述核酸片段中的PKD1和PKD2基因进行扩增;
III)对所述PKD1和PKD2基因进行测序;
所述测序方法用于非疾病诊断或治疗目的。
在本发明的优选的实施方案中,所述步骤I)还包括将所述核酸片段进行末端修复后连接接头序列;
优选地,所述核酸片段的长度为2~10kb;
更优选地,所述核酸片段的长度为4~6kb。
在本发明的优选的实施方案中,所述扩增包括以下步骤:
a)以步骤I)得到的核酸片段为模板,使用Pool A引物组进行扩增,得到第一扩增产物;
b)以第一扩增产物为模板,使用通用引物Primer LA+Primer R进行扩增,得到第二扩增产物;
c)以第二扩增产物为模板,使用Pool B引物组进行扩增,得到第三扩增产物;
d)以第三扩增产物为模板,使用通用引物Primer LB+Primer R进行扩增,得到扩增终产物;
其中,所述Primer LA的序列如SEQ ID NO:123所示,所述Primer R的序列如SEQID NO:124所示,所述Primer LB的序列如SEQ ID NO:125所示。
在本发明的优选的实施方案中,所述扩增还包括对第一扩增产物、第二扩增产物、第三扩增产物和扩增终产物进行纯化。
在本发明的优选的实施方案中,所述测序为三代测序;
优选地,所述三代测序采用PacBio Sequel、PromethION、MinION、GridION平台进行。
本发明的第三个方面提供了一种用于PKD1和PKD2基因测序的试剂盒,其包括上述引物组合物;
优选地,所述试剂盒还包括接头序列、通用引物、DNA提取体系、PCR反应缓冲液、无核酸酶的水、DNA聚合酶、分子量marker、末端修复酶、末端修复缓冲液、DNA连接酶中的一种或多种;
优选地,所述通用引物为Primer LA、Primer R和Primer LB,所述Primer LA的序列如SEQ ID NO:123所示,所述Primer R的序列如SEQ ID NO:124所示,所述Primer LB的序列如SEQ ID NO:125所示。
本发明的第四个方面提供了上述引物组合物或上述试剂盒在检测PKD1和PKD2基因变异中的应用;
优选地,所述PKD1和PKD2基因变异包括插入、缺失、复制、倒位、易位或SNP。
本发明的第五个方面提供了上述引物组合物或上述试剂盒在制备常染色体显性多囊肾疾病诊断试剂中的应用。
本发明的有益效果为:
(1)成功检测出常规方法难以检测的结构变异,提升了常染色体显性多囊肾检测的灵敏度,为发现新的致病突变提供分子生物学依据。
(2)本发明实验操作简单,实验周期短、成本临床可及,具有显著的临床推广应用价值。
附图说明
图1为本发明一个实施例中对不同间隔的目的基因单方向多重引物覆盖均一性分析结果。
图2为本发明一个实施例中不同间隔的目的基因单方向多重引物的扩增片段终产物长度。
图3为本发明一个实施例中Agilent 2100 Bioanalyzer检测结果图。
具体实施方式
需要说明的是,除非另外定义,本申请使用的技术术语或者科学术语应当为所属领域的技术人员所理解的通常意义。
下述实施例中的实验方法,如无特殊说明,均为常规方法。下述实施例中所用的药材原料、试剂材料等,如无特殊说明,均为市售产品。
如本文所使用的,“读长”是指测序反应所能测得序列的长度,如果DNA序列长度高于读长,那么必须把DNA序列分割成长度在读长以内的短序列才能测序。一代测序双脱氧链终止法(Sanger法)的读长是1000bp,二代测序较低为50bp-300bp,三代测序可以达到5000bp以上,最长读长甚至能达到20kb,较长的读长也正是三代测序最大的优势所在。
如本文所使用的,“覆盖位点”是指引物与PKD1和PKD2基因结合的区域。
如本文所使用的,“多个”是指两个或两个以上。
本发明所述的“互补配对”是指所述引物能够在严格条件下与上述位点所代表的序列杂交。本发明中使用的“严格条件”是指在DNA扩增反应中仅允许引物对目标核酸序列发生杂交的条件。
本文使用的“组织裂解液”表示包含裂解的组织的样品和/或生物样品材料,即其中组织的结构完整性已经被破坏。为了释放组织样品的内容物,通常用酶和/或化学试剂处理所述材料,以溶解、降解或破坏这样的组织的细胞壁和细胞膜。熟练的技术员非常熟悉用于得到组织裂解液的适当方法。
本发明提供了一种引物组合物,其中,
1)所述引物组合物用于检测PKD1和PKD2基因,且检测的PKD1和PKD2基因长度不低于2kb;
2)包含多个引物,所述多个引物均匀覆盖PKD1和PKD2基因,且每两个相邻引物在与所述PKD1和PKD2基因结合时,覆盖位点平均具有不多于10bp的重叠区域,或者平均间隔为1bp~4kb;
3)所述引物组合物覆盖PKD1和PKD2基因全长;
4)所述引物组合物中的引物的核酸序列与PKD1和PKD2基因互补配对;
优选地,所述PKD1和PKD2基因的种属来源于动物;
更优选地,所述PKD1和PKD2基因的种属来源于灵长类动物;
进一步优选地,所述PKD1和PKD2基因的种属来源于人。
在本发明中,每两个相邻引物与PKD1和PKD2基因结合时可以有重叠的覆盖位点,但是要求平均具有不多于10bp的重叠区域,这样既能保证检测效果,又可以降低使用的引物数量,从而降低成本。或者,每两个相邻引物与PKD1和PKD2基因结合时具有一定的平均间隔,例如为1bp~4kb,优选地,每两个相邻引物所覆盖位点的平均间隔为1kb~3kb;更优选地,每两个相邻引物所覆盖位点的平均间隔为1900~2100bp。多个引物的平均间隔与基因组片段化平均长度有关,例如,使用如下公式计算多个引物的平均间隔范围:
N=(L+2)×300-100;
其中:
N:引物平均间隔,单位bp;
L:基因组片段化平均长度,单位kb,取整数;
例如,基因组片段化平均长度为5kb,根据上述公式计算出引物平均间隔范围为:2000bp。在实际应用中,可以选择该范围内的数值作为引物的平均间隔,并可进一步优化引物的平均间隔,在实施例1中,本发明进一步优化多个引物之间的平均间隔,最终确定多个引物的平均间隔在2kb时兼具相对较少的引物数目和相对较好的覆盖均一性。
在本发明的优选的实施方案中,其中,所述引物组合物包括Pool A引物组和PoolB引物组;其中所述Pool A引物组具有SEQ ID NO:1-SEQ ID NO:61的序列,所述Pool B引物组具有SEQ ID NO:62-SEQ ID NO:122的序列。
Pool A引物组和Pool B引物组的序列如表1和表2所示。
表1
表2
上述引物组合物可以与三代测序联用以达到更好的技术效果。因此,本发明提供了一种PKD1和PKD2基因的测序方法,其包括以下步骤:
I)将待测样品中的基因组DNA打断为多个核酸片段;
II)使用上述引物组合物对所述核酸片段中的PKD1和PKD2基因进行扩增;
III)对所述PKD1和PKD2基因进行测序。
所述测序方法用于非疾病诊断或治疗目的。
在一些实施方案中,所述待检测样品为体液,例如血液(全血)、血清、血浆、细胞培养上清、唾液、精液、组织或组织裂解液。
在一些实施方案中,所述待检测样品来自组织或组织裂解液,组织可以选择例如羊水、绒毛、骨骼、肌肉或毛发等。
如前所述,三代测序具有较长的读长,因此,打断的核酸片段在读长以内的短序列均能够被测序。因此,在一些实施方案中,所述核酸片段的长度为2~10kb;还可以选择3k、4k、5k、6k、7k、8k或9k,优选4~6kb。
三代测序使用一种被称为SMRTbell的模板,这是一个通过将发夹接头序列连接到目标双链DNA分子两端而形成的单链环状DNA分子,两端的发夹接头序列为引物结合提供位点。因此,本发明测序方法的步骤I)还包括将所述核酸片段进行末端修复后连接接头序列。
在本发明的优选的实施方案中,所述扩增包括以下步骤:
a)以步骤I)得到的核酸片段为模板,使用Pool A引物组进行扩增,得到第一扩增产物;
b)以第一扩增产物为模板,使用通用引物Primer LA+Primer R进行扩增,得到第二扩增产物;
c)以第二扩增产物为模板,使用Pool B引物组进行扩增,得到第三扩增产物;
d)以第三扩增产物为模板,使用通用引物Primer LB+Primer R进行扩增,得到扩增终产物;
其中,所述Primer LA的序列如SEQ ID NO:123所示,所述Primer R的序列如SEQID NO:124所示,所述Primer LB的序列如SEQ ID NO:125所示,具体如下:
Primer LA:5'-CACACTGGTAGAGTGACCATTG-3';
Primer R:5'-GAGATGAGAGTCCAACACGAGAT-3';
Primer LB:5'-CCATGAGAGAACTGGTGTGGT-3'。
在本发明的优选的实施方案中,所述扩增还包括对第一扩增产物、第二扩增产物、第三扩增产物和扩增终产物进行纯化。
在本发明的优选的实施方案中,所述测序为三代测序;
优选地,所述三代测序采用PacBio Sequel、PromethION、MinION、GridION平台进行。
本方法借助三代测序长读长、无GC偏好性能够更好的区分真假基因的优势,通过巧妙设计的两组带有通用序列的目的基因单方向多重引物的前后两轮联合使用,有效克服了引物潜在的非特异扩增问题,大幅提升了扩增终产物中的目的基因序列的占比,实现了基因突变快速检测。不仅可以检测常规SNV/Indel,还可以检测各种SV变异,真正实现了变异类型的全覆盖检测。克服了一代Sanger测序或二代高通量基因测序不能区分变异来源真基因或假基因的问题,以及普通LR-PCR技术变异类型覆盖不全的问题。
本发明提供了一种用于PKD1和PKD2基因测序的试剂盒,其包括上述引物组合物;
优选地,所述试剂盒还包括接头序列、通用引物、DNA提取体系、PCR反应缓冲液、无核酸酶的水、DNA聚合酶、分子量marker、末端修复酶、末端修复缓冲液、DNA连接酶中的一种或多种;
优选地,所述通用引物为Primer LA、Primer R和Primer LB,所述Primer LA的序列如SEQ ID NO:123所示,所述Primer R的序列如SEQ ID NO:124所示,所述Primer LB的序列如SEQ ID NO:125所示。
本发明对试剂盒中的接头序列、DNA提取体系等不作限制,具体的可参照实施例。
在一些实施方案中,所述水为无核酸酶的水,例如双蒸水或去离子水。
在一些实施方案中,所述DNA聚合酶选自Taq、Bst、Vent、Phi29、Pfu、Tru、Tth、Tl1、Tac、Tne、Tma、Tih、Tf1、Pwo、Kod、Sac、Sso、Poc、Pab、Mth、Pho、ES4 DNA聚合酶、Klenow片段中的任一种。
本发明的试剂盒可以与三代测序联用以达到更好的技术效果。
本发明所提供的引物组合物、试剂盒可结合三代测序方法,有效对PKD1和PKD2基因进行测序,并对其中的突变进行分析。因此,本发明提供了上述引物组合物或上述试剂盒在检测PKD1和PKD2基因变异中的应用;
优选地,所述PKD1和PKD2基因变异包括插入、缺失、复制、倒位、易位或SNP。
在一些实施方案中,所述PKD1和PKD2基因变异位于PKD1和PKD2基因的内含子区和/或外显子区。
该应用可以是非诊断目的的,例如遗传学研究、人种分布、人类进化学等领域的研究中进行应用(典型的如SNP的应用),或者是PKD1和PKD2基因相关疾病的细胞和动物模型(如果同源性与人很高)的鉴定。
本发明还提供了上述引物组合物或上述试剂盒在制备常染色体显性多囊肾疾病诊断试剂中的应用。
下面将结合实施例对本发明的实施方案进行详细描述,但是本领域技术人员将会理解,下列实施例仅用于说明本发明,而不应视为限制本发明的范围。实施例中未注明具体条件者,按照常规条件或制造商建议的条件进行。所用试剂或仪器未注明生产厂商者,均为可以通过市购获得的常规产品。
实施例1目的基因单方向多重引物间隔与扩增片段大小及覆盖均一性测试
目的基因单方向多重引物间隔越小,相邻引物扩增可替代作用越强,覆盖均一性越好,但也意味着所需要的引物数量就越多,且扩增片段终产物平均长度越小;反之,目的基因单方向多重引物间隔越大,所需要的引物数量就越少,扩增片段终产物平均长度越大,但是片段越长扩增越困难,且个别引物扩增不理想将导致相邻引物无法发挥替代作用,导致个别区域扩增不理想。
为充分发挥三代长读长测序的优势,需要探索目的基因单方向多重引物的合理间隔。为此,评估了目的基因单方向多重引物平均间隔250bp、500bp、1K、2K、3K、4K的设计的引物对靶区域的覆盖均一性。
0.5X平均覆盖深度的序列所占百分比,是一种比较常见评估覆盖均一性的参数,用于考察低覆盖深度带来的局限性。0.5X代表50%的平均覆盖深度,例如某目的区域的捕获,具体到序列位点,有的位点200X(即某个位点被测了200次)、有的位点150X、有的位点100X,统计出来的目的区域整体平均150X(即平均每个位点被测了150次),0.5X平均覆盖深度即视为0.5×150=75X以及以上的占比;如果90%以上的目的区域呈现超过0.5X的平均覆盖深度,则目的区域的覆盖均一性相对较好。
如图1所示,多重引物越密集0.5X平均覆盖深度的序列所占百分比越高,平均间隔2K及以内设计的多重引物覆盖均一性明显优于平均间隔大于2K设计的,并且平均间隔2K设计的多重引物与平均间隔小于2K设计的在覆盖均一性方面比较接近,即0.5X平均覆盖深度的序列所占百分比趋近饱和。
如图2所示,多重引物越密集扩增片段终产物平均长度越小,平均间隔2K及以上设计的多重引物扩增片段终产物平均长度明显长于平均间隔小于2K设计的,并且平均间隔2K设计的多重引物与平均间隔大于2K设计的在扩增片段终产物平均长度方面比较接近。因此,平均间隔2K设计的多重引物拥有最佳的性价比。
实施例2制备PKD1和PKD2基因的单方向多重引物
针对PKD1和PKD2基因全长序列,每间隔1K~3K设计一条引物,优选的每平均间隔2K设计一条引物。三代测序仪测序读长长,比如,Pacbio公司的sequel或Oxford Nanopore公司的PromethION测序长度可达几十K,待测样品中的基因组DNA被打断成5K左右的大小片段,每间隔2K设计一条引物,平均每个DNA片段可以结合2条引物,足以对目的片段开展有效的扩增。设计好的引物的模板结合区域碱基个数在20~30bp之间,进一步添加通用引物Primer LA或Primer LB后引物的碱基个数在30~50bp之间,GC含量值适中、无发夹结构,并进一步与NCBI等数据库进行Blast比对,并确保引物避开基因组上的重复区域,通过这些参数以确保引物的特异性。设计得到的引物序列如表1和表2中的Pool A引物组和Pool B引物组所示。
实施例3构建DNA文库
3.1制备工作接头
工作接头AP由接头A1序列与A2序列组合成,A1序列为:
5'-pGGAAAGCAATCTGTACTAGX-3',如SEQ ID NO:126所示;
A2序列为:
5'-GAGATGAGAGTCCAACACGAGATNNNNNNNNNNNNNNNNCTAGTACAGATTGCTTTCCT-3',如SEQ ID NO:127所示;
上述序列中的p代表磷酸化修饰;N代表A/G/C/T四种碱基的任意一种;X代表生物素(Biotin)修饰、氨基修饰、FAM荧光染料修饰或者其它任何可抑制3'端序列延伸的修饰;A2序列NNNNNNNNNNNNNNNN用于识别不同样品构建的文库。
进一步的,由上述接头A1序列与A2序列制备成工作接头的具体操作为:
1)用1XTE溶液(pH 8.0)溶解接头A1序列与A2序列,溶解终浓度10μM;
2)在PCR管中等体积混合A1和A2;
3)使用PCR程序:95℃,3分钟;1小时缓慢降温至25℃,0.05℃/s下降温度;即得到工作接头。
3.2样品基因组DNA提取及质量评估
取待检测样品外周血0.5~1mL,采用Blood Genomic DNA Mini Kit(北京康为世纪生物科技有限公司,外周血)进行基因组DNA提取。通过琼脂糖凝胶电泳检测基因组的完整性,用Qubit(Life Technologies,美国)对基因组进行浓度测定。选取基因组相对完整无严重降解且浓度≥25ng/μl的DNA样品进行文库构建。
3.3 DNA文库的构建
3.3.1基因组DNA打断
使用Covaris g-Tube打断管离心打断基因组DNA,离心参数设置如下:离心力2000g、时间2min。使用0.4倍体积的Beckman XP磁珠进行纯化,制得片段化基因组DNA。
3.3.2样本末端修复、加接头
3.3.2.1末端修复,加“A”
使用NEB Next Ultra End Repair/dA-Tailing Module试剂盒。
体系为:
表3
反应条件为:
表4
3.3.2.2接头连接
使用NEB Next Ultra II Ligation Module试剂盒。
体系为:
表5
于PCR仪中,20℃反应15min。随后,使用0.4倍体积的Beckman XP磁珠进行纯化,获得文库溶液。
3.3.3文库的第一次扩增
反应体系为:
表6
其中,Primer Pool A如上表1所示。
反应条件为:
表7
反应结束后,使用0.4倍体积的XP磁珠进行纯化,最后使用TE溶液洗脱磁珠,转移至新的离心管内,进入下一步操作,或者放在-80℃中备用。
3.3.4文库的第二次扩增
反应体系为:
表8
其中,Primer LA(如SEQ ID NO:123所示)和Primer R(如SEQ ID NO:124所示)为文库第二次扩增的引物。
反应条件为:
表9
反应结束后,使用0.4倍体积的XP磁珠进行纯化,最后使用TE溶液洗脱磁珠,转移至新的离心管内,进入下一步操作,或者放在-80℃中备用。
3.3.5文库的第三次扩增
反应体系为:
表10
其中,Primer Pool B如上表2所示。
反应条件为:
表11
反应结束后,使用0.4倍体积的XP磁珠进行纯化,最后使用TE溶液洗脱磁珠,转移至新的离心管内,进入下一步操作,或者放在-80℃中备用。
3.3.6文库的第四次扩增
反应体系为:
表12
其中,Primer LB(如SEQ ID NO:125所示)和Primer R(如SEQ ID NO:124所示)为文库第四次扩增的引物。
反应条件为:
表13
反应结束后,使用0.4倍体积的XP磁珠进行纯化,最后使用TE溶液洗脱磁珠,转移至新的离心管内,进入下一步操作,或者放在-80℃中备用。
3.4文库质检
本领域技术人员通常认为:Qubit检测浓度,计算总量1μg以上,Agilent2100检测大小,主峰在1K~8K之间,即可视为文库合格。上步骤3.3制备的文库进行Qubit检测及Agilent 2100 Bioanalyzer检测,主峰约3014bp,扩增产物片段大小符合预期(如图3所示),检测合格文库进行下一步三代测序文库构建。
实施例4三代测序文库构建及测序
4.1使用Pacbio sequel测序
4.1.1使用建库试剂盒进行建库
4.1.1.1将混好的文库进行修复
修复溶液配制:
表14
混匀,离心,放入PCR热循环仪中,进行修复反应,具体条件如下:
表15
4.1.1.2纯化
使用0.45倍样品体积的PB磁珠进行纯化,最后使用双蒸水洗脱磁珠,-20℃冰箱保存。
4.1.1.3接头连接
连接溶液体系如下:
表16
混匀,离心,于PCR热循环仪中进行连接反应,具体条件如下:
表17
4.1.1.4纯化
使用0.45倍样品体积的PB磁珠进行纯化,最后使用双蒸水洗脱磁珠,-20℃冰箱保存。
4.1.2引物退火及Binding反应
按照Pacbio官方网页(https://www.pacb.com/products-and-services/consumables/binding-and-cleanup-kits/)给出标准操作方式进行。
4.1.3三代测序
按照Pacbio sequel仪器标准操作规范(https://www.pacb.com/products-and-services/consumables/smrt-cells-sequencing-reagent-kits-and-accessories/)进行测序。
4.2使用Oxford Nanopore PromethION测序
4.2.1样本末端修复
取DNA,置于冰上,加入NEB末端修复/加A尾试剂,混匀。20℃孵育40分钟,65℃孵育20分钟。
4.2.2 DNA纯化
将0.4×AMPure beads加入DNA中,室温孵育15min,室温磁力架吸附5min,吸弃上清。
加入80%乙醇,磁力架吸附,弃上清,重复一次。室温晾干。
添加Ultra Pure Water,37℃下吹打洗脱。
磁力架上静置5min,吸取上清,即为纯化后的DNA。
4.2.3接头连接
加入NEB T4 DNA快速连接buffer、NEB T4 DNA快速连接酶和接头,混匀,20℃孵育20min。
4.2.4 DNA纯化
将0.4×AMPure beads加入PCR产物中,室温孵育5min,室温磁力架吸附2min,吸弃上清。加入200ul LFB吹打混匀,磁力架吸附,弃上清,重复一次。添加EB 15ul,吹打洗脱。磁力架上静置5min,吸取上清,即为纯化后的DNA。
4.2.5Priming及Loading操作
按照Oxford Nanopore PromethION官方网页(https://store.nanoporetech.com/sample-prep.html)给出标准操作方式进行。
4.2.6三代测序
按照Oxford Nanopore PromethION仪器标准操作规范(https://store.nanoporetech.com/promethion-advanced-training.html)进行测序。
实施例5生物信息学分析
5.1拆分各样品数据
若下机数据为多样品混测,根据各样品的标签序列拆分出每个样品的数据。
5.2数据过滤
根据各平台数据特点,生成高质量数据。
ONT平台过滤掉质量值较低的数据。Pacbio平台采用官方软件生成高质量的一致性序列。
5.3数据评估
将高质量的数据比对到人类全基因组参考序列,采取唯一比对(即单条序列只能唯一比对到基因组的一个位置)。统计目标区域的序列覆盖深度。
若数据不合格(合格的标准是:靶区域的测序覆盖度,要求30X覆盖度不低于95%),根据情况进行补测数据。
5.4变异检测
检测目标区域的单核苷酸位点变异、小片段插入与缺失、染色体结构变异(SNV/InDel、SV)等;并对变异进行各数据库的注释,以筛选致病性变异位点。
5.5变异位点的验证。
将筛选出的致病性变异位点进行LR-PCR结合NGS测序对照方法验证,结果如表18所示,LR-PCR结合NGS对照方法有3例样本未检出。针对这3例不一致的临床样本,依据变异位点序列信息,进一步开展一代Sanger测序验证,结果表明一代Sanger测序结果与本发明三代测序方法一致。上述验证结果表明,本发明三代测序方法优于对照LR-PCR结合NGS测序方法。对收集的临床样本,经观测临床表型,对多囊肾发病情况进行了确认。该过程中,实验人员、数据分析人员均不知道样本的基因型及临床表型,以确保结果的可信性。
表18变异位点的验证结果
Claims (10)
1.一种引物组合物,其中,
1)所述引物组合物用于检测PKD1和PKD2基因,且检测的PKD1和PKD2基因长度不低于2kb;
2)包含多个引物,所述多个引物均匀覆盖PKD1和PKD2基因,且每两个相邻引物在与所述PKD1和PKD2基因结合时,覆盖位点平均具有不多于10bp的重叠区域,或者平均间隔为1bp~4kb;
3)所述引物组合物覆盖PKD1和PKD2基因全长;
4)所述引物组合物中的引物的核酸序列与PKD1和PKD2基因互补配对。
2.根据权利要求1所述的引物组合物,其中,所述所述引物组合物包括PoolA引物组和PoolB引物组;其中所述PoolA引物组具有SEQ ID NO:1-SEQ ID NO:61的序列,所述Pool B引物组具有SEQ ID NO:62-SEQ ID NO:122的序列。
3.一种PKD1和PKD2基因的测序方法,其包括以下步骤:
I)将待测样品中的基因组DNA打断为多个核酸片段;
II)使用权利要求1或2所述的引物组合物对所述核酸片段中的PKD1和PKD2基因进行扩增;
III)对所述PKD1和PKD2基因进行测序;
所述测序方法用于非疾病诊断或治疗目的。
4.根据权利要求3所述的测序方法,其中,所述步骤I)还包括将所述核酸片段进行末端修复后连接接头序列;
优选地,所述核酸片段的长度为2~10kb;
更优选地,所述核酸片段的长度为4~6kb。
5.根据权利要求3或4所述的测序方法,其中,所述扩增包括以下步骤:
a)以步骤I)得到的核酸片段为模板,使用PoolA引物组进行扩增,得到第一扩增产物;
b)以第一扩增产物为模板,使用通用引物Primer LA+Primer R进行扩增,得到第二扩增产物;
c)以第二扩增产物为模板,使用Pool B引物组进行扩增,得到第三扩增产物;
d)以第三扩增产物为模板,使用通用引物Primer LB+Primer R进行扩增,得到扩增终产物;
其中,所述Primer LA的序列如SEQ ID NO:123所示,所述Primer R的序列如SEQ IDNO:124所示,所述Primer LB的序列如SEQ ID NO:125所示。
6.根据权利要求5所述的测序方法,其中,所述扩增还包括对第一扩增产物、第二扩增产物、第三扩增产物和扩增终产物进行纯化。
7.根据权利要求3或4所述的测序方法,其中,所述测序为三代测序;
优选地,所述三代测序采用PacBio Sequel、PromethION、MinION、GridION平台进行。
8.一种用于PKD1和PKD2基因测序的试剂盒,其包括权利要求1或2所述的引物组合物。
9.权利要求1或2所述的引物组合物或权利要求8所述的试剂盒在检测PKD1和PKD2基因变异中的应用。
10.权利要求1或2所述的引物组合物或权利要求8所述的试剂盒在制备常染色体显性多囊肾疾病诊断试剂中的应用。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211163279.6A CN117757912A (zh) | 2022-09-23 | 2022-09-23 | Pkd1和pkd2基因的引物组合物、试剂盒及测序方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211163279.6A CN117757912A (zh) | 2022-09-23 | 2022-09-23 | Pkd1和pkd2基因的引物组合物、试剂盒及测序方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117757912A true CN117757912A (zh) | 2024-03-26 |
Family
ID=90313009
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211163279.6A Pending CN117757912A (zh) | 2022-09-23 | 2022-09-23 | Pkd1和pkd2基因的引物组合物、试剂盒及测序方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117757912A (zh) |
-
2022
- 2022-09-23 CN CN202211163279.6A patent/CN117757912A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Rapley et al. | Molecular biology and biotechnology | |
CN106591441B (zh) | 基于全基因捕获测序的α和/或β-地中海贫血突变的检测探针、方法、芯片及应用 | |
EP3218522B1 (en) | Detection methods based on sequencing | |
US11649492B2 (en) | Deep sequencing profiling of tumors | |
WO2018195217A1 (en) | Compositions and methods for library construction and sequence analysis | |
CN113278611B (zh) | 捕获测序探针及其用途 | |
WO2012068919A1 (zh) | DNA文库及其制备方法、以及检测SNPs的方法和装置 | |
CN110331193B (zh) | 一种人类杀伤细胞免疫球蛋白受体kir3dl2基因分型的pcr-sbt方法及试剂 | |
EP2832863A1 (en) | Microarray for detection of mutations in -globin genes and detection method thereof | |
KR20190116989A (ko) | Hla 유전자를 위한 pcr 프라이머 세트, 및 이를 이용한 서열 분석 방법 | |
CN107236037B (zh) | 一种突变的msh6蛋白及其编码基因、应用 | |
CN111378732B (zh) | 一种线粒体基因组测序引物、试剂盒及方法 | |
WO2022007863A1 (zh) | 一种靶基因区域快速富集方法 | |
CN114032287A (zh) | Dna甲基化测序文库及其构建方法和检测方法 | |
CN112442530B (zh) | 检测cah相关真假基因的方法 | |
CN110819710A (zh) | 髓系肿瘤的高通量测序检测 | |
CN111808937A (zh) | 一种类孟买血型FUT1 508dupT等位基因及其检测方法和应用 | |
CN114807302B (zh) | 扩增子文库构建方法及用于地中海贫血突变型与缺失型基因检测的试剂盒 | |
CN117757912A (zh) | Pkd1和pkd2基因的引物组合物、试剂盒及测序方法 | |
CN113186291B (zh) | 基于多重pcr的引物组和试剂盒 | |
Wang | Next-generation sequencing (NGS) | |
CN112813200B (zh) | 核酸极短pcr扩增的方法、检测方法及应用 | |
CN114854737A (zh) | 基于三代测序平台的i类hla基因扩增引物、试剂盒及分型方法 | |
CN114561460B (zh) | 一种检测断裂位点未明的罕见β地中海贫血基因大片段缺失的引物组、试剂盒及测序文库 | |
CN111718981A (zh) | Ace基因检测引物组、检测试剂盒及检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |