一种PKU基因检测试剂盒
技术领域
本发明属于生物体外诊断技术领域,具体涉及一种用于检测苯丙酮尿症(简称PKU)的决定基因(PAH)基因型的试剂盒。
背景技术
苯丙酮尿症(简称PKU)是一种氨基酸代谢异常引起的遗传性疾病,由于基因突变使体内苯丙氨酸羟化酶活性降低,从而导致苯丙氨酸代谢受阻,患儿血液和组织中苯丙氨酸浓度增高,尿液中如苯丙酮酸、苯乙酸和苯乳酸等异常代谢产物显著增加。PKU是常染色体隐性遗传病,我国PKU发病率有较明显的地区差异,呈现北高南低的规律,一般南部省份的发病率多在1:1-3万左右,而北方诸省多在1:6000-9000。目前北京市的苯丙酮尿症发病率约为1:9000。
PKU患儿出生时大多表现正常,新生儿期多无明显临床症状,或出现湿疹、吐奶等非特异性症状。若不及时治疗,会逐渐出现典型症状:毛发颜色由黑变黄,皮肤白,顽固的湿疹,汗液和尿液有特殊的鼠尿味,并伴有智力、运动能力发育落后。随着年龄增长,PKU患儿智力低下会越来越明显,呈现中到重度的智力残疾,说话、走路均较同龄儿童晚,年长儿出现学习困难,严重者甚至生活不能自理,终生需要他人护理。除智力障碍外,还会出现一些精神行为方面的异常,如:烦躁易怒、攻击行为等。部分患儿合并癫痫,常在18个月以前出现,可表现为婴儿痉挛性发作,点头样发作或其他形式,常规的抗癫痫治疗难以控制。
PKU患儿通过早期诊断并采用饮食控制或药物治疗方法可有效阻断病程发展,有希望像正常孩子一样成长,因此对于PKU患儿的早期检出和治疗是非常必要的。
现有检测PAH基因多态性的方法主要有基因芯片法、限制性片段长度多态性(PCR-RFLP)和单链构象多态性(PCR-SSCP)。PCR-RFLP是利用多种限制性内切酶对扩增产物酶切,不同的片段会产生不同的电泳图谱,这种方法缺点是只能检测单一位点,且这个位点要可以酶切,具有一定的局限性。PCR-SSCP是依据单链DNA分子在中性的聚丙烯酰胺凝胶中电泳时会根据不同的立体构象而形成不同的脉动速率,产生不一样的条带来判断突变是否存在。缺点是只能检测基因突变的存在,而不能确定突变位点和突变内容。
发明内容
鉴于目前市面上检测单基因遗传病的主要技术存在低准确性、高成本、操作复杂等缺点,本发明旨在提供一种高准确性、低成本、高通量的检测试剂盒,以实现对苯丙酮尿症的筛查与诊断,帮助PKU患儿的早期检出和治疗,为家庭的幸福、中国人口的素质提升、社会的发展做出一份贡献。
本发明选择的多态性位点涵盖了中国人群PAH基因上的热点突变位点,通过PAH基因在中国人群中多态性地调查以及现有资料的查找,确定了在中国人群中突变率最高的7个位点。本发明所选的多态性位点包含:R111X、Y204C、R243Q、R252Q、R261Q、Y356X、R413P,涵盖了中国人群中突变率较高的位点。
本发明所采取的技术方案是:
一种PKU基因检测试剂盒,其含有:用于特异性扩增PAH基因上7个多态性位点的引物对、用于检测各多态性位点的探针、标签探针和标签连接反应模板;所述7个多态性位点为:R111X、Y204C、R243Q、R252Q、R261Q、Y356X、R413P;所述用于检测各多态性位点的探针包括共用探针、分型识别探针;所述分型识别探针包括野生型特异探针和突变型特异探针。
所述7个PAH基因多态性位点对应的引物对如下表所示:
所述共用探针包括外挂区和靶序列特异接合区,所述外挂区的作用是与标签连接反应模板右侧特异性结合;所述分型识别探针包括分型识别区和长度调节区,所述长度调节区是通过不同的序列长度来指示不同位点的不同基因型。
所述分型识别探针包括外挂区、长度调整区和分型识别区,所述外挂区的作用是与标签连接反应模板右侧特异性结合,所述长度调节区是通过不同的序列长度来指示不同位点的不同基因型;所述共用探针包括靶序列特异接合区。
所述分型识别探针靠近检测位点端第2-5个碱基可引入突变,或者将检测位点端进行锁核酸(LNA)或者肽核酸(PNA)的修饰,提高连接酶识别的特异性。
所述用于检测各多态性位点的探针如下表所示:
F代表上游共用探针,W代表野生型特异探针,M代表突变型特异探针。
所述共用探针和分型探针进行5’磷酸化处理。
所述标签连接反应模板是由两段人工序列组成的寡核苷酸序列,左侧部分作用是与标签探针特异结合,右侧部分是与共用探针或分型识别探针的外挂序列特异结合;所述标签探针是指用荧光染料标记的一段寡核苷酸序列,其作用是与标签连接反应模板中的左侧特异结合;所述荧光染料可以是FAM色、HEX色、TAMRA色、ROX色、Cy3色、JOE色的标记。
所述标签探针的序列如下所示:AGTGCCAGCAAGATCCAATCTCA;所述标签连接反应模板序列如下所示:TCCAACCCTTAGGGAACCCTGAGATTGGATCTTGCTGGCACT。
所述试剂盒中还含有PCR复合扩增体系和连接反应体系。
本发明的有益效果是:
本发明根据流行病学研究成果,选取中国人群PAH基因突变率最高的7个多态性位点,组成一个复合检测系统。本发明利用连接酶来识别多态性位点能够准确判断基因型,具有检测多个位点的优点,相比较之前的技术方法具有低成本、准确性高、高通量的优点。结合多重荧光毛细管电泳检测技术可以同时检测4-5个人的基因型。本发明方法具有以下优点:
(1)基于连接酶检测,提高了SNP检测的准确性。
(2)引用标签探针,不同样本检测利用不同的荧光标签探针,一次电泳最多可以同时检测5个样本的基因型,高效、节约。
(3)可以省去DNA抽提步骤,唾液卡、FTA卡、血滤纸可以直接扩增,减少了操作步骤,简化了其操作流程。
(4)本发明能够准确判断杂合突变、纯合突变及正常样本的基因型。
附图说明
图1是PKU基因检测试剂盒位点排布图;
图2是PKU基因检测试剂盒探针杂交示意图:a分型识别区在下游的示意图,b是分型识别区在下游的示意图;
图3是探针、标签探针、标签连接反应模板反应示意图;
图4是PKU基因检测试剂盒反应流程示意图;
图5是PKU基因检测试剂盒野生型样本7个位点检测图谱;
图6是PKU基因检测试剂盒突变型样本7个位点检测图谱;
图7是PKU基因检测试剂盒R111X位点单位点突变样本的检测图谱;
图8是本发明实施例未检测出PAH基因突变的样本结果示例,被测试基因型均为野生型;
图9是本发明实施例检测出单一PAH基因纯合突变的样本结果示例,其突变基因型为Y204CM/M;
图10是本发明实施例检测出PAH基因单一位点杂合突变的样本结果示例,其突变基因型为R243QW/M。
图11是人为引入单碱基错配的示意图(a是下游分型识别区引入单碱基错配示意图,b是上游分型识别区引入单碱基错配示意图);
图12是以R111X位点为实施例,检测探针引入单碱基错配前后的毛细管电泳结果图(a是未引入错配示意图,b是引入错配示意图);
图13是PKU基因检测试剂盒检测Y204C位点,探针引入单碱基错配前后的分型对比图(a是未引入错配示意图,b是引入错配示意图);
图14是PKU基因检测试剂盒检测R243Q位点,探针引入单碱基错配前后的分型对比图(a是未引入错配示意图,b是引入错配示意图)。
具体实施方式
下面结合实施例对本发明作进一步的说明,但并不局限于此。
实施例1
一、本发明所针对的PAH基因上7个多态性位点的信息如下:
本发明所选的PAH基因多态性位点包含:R111X(C→T)、Y204C(A→G)、R243Q(G→A)、R252Q(G→A)、R261Q(G→A)、Y356X(C→A)、R413P(G→C)。各位点的排布如图1所示。
二、检测试剂盒的主要成分:
1、针对7个多态性位点(R111X、Y204C、R243Q、R252Q、R261Q、Y356X、R413P)的扩增引物:
上述引物中,F为上游引物,R为下游引物。R243Q、R252Q、R261Q为相邻多态性位点,一对扩增引物即可扩增出包含这三个多态性位点的DNA片段。
2、针对多态性位点的探针:
上述探针中,F代表共用上游共用探针,W代表野生型下游探针,M代表突变型下游探针。小写字母序列为探针外挂序列,作用是与标签连接反应模板右侧特异性结合。其中上游探针为共用探针,包括探针外挂、上游特异结合区;下游探针包括分型识别区和长度调整区。
以上探针还可以设计成:上游探针包括探针外挂、长度调整区和分型识别区;下游探针为共用探针。
共用探针和分型识别探针探针进行5’磷酸化处理。
为了进一步增加连接的特异性,可在下游探针5’第2-5个碱基上引入错配(在5’第3位引入单碱基错配为例),引入的错配遵循以下原则:若5’端为中等错配(A-A,C-C,G-G,T-T),则需引入中等错配;若5’端是强错配(G-A,T-C)则引入弱错配(G-T,A-C);若5’端为弱错配(G-T,A-C),则引入强错配(G-A,T-C)。
3、标签探针和标签连接反应模板,其序列如下:
标签探针是指用荧光染料标记的一段寡核苷酸序列,其作用是与标签连接反应模板中的左侧特异结合;标签连接反应模板是由两段人工序列组成的寡核苷酸序列,左侧部分作用是与上述标签探针特异结合,右侧部分是与上游探针外挂序列特异结合。标签探针经过5’端荧光修饰,可分别标记FAM色、HEX色、TAMRA色、ROX色、Cy3色、JOE色的标记等。
4、复合扩增体系:
5、连接反应体系:
三、本发明试剂盒的具体实施步骤:
1、样本DNA的提取
根据样本的实际情况,选择合适的方法提取样本DNA,常见的方法有:磁珠法、碱裂解法、阴离子交换树脂法等等。若样本是以血滤纸、FTA卡、唾液卡等,可简化步骤,直接扩增。
2、大片段复合扩增体系
通过设计扩增包含单个或邻近的多个多态性位点大片段引物,通过电泳测试各个引物的特异性及效率,并将各个位点的扩增引物组成复合扩增体系,其体系如下:
扩增程序如下:
3、以PCR产物为模板,在反应体系中加入探针(包括针对多态性位点的探针和标签探针)、标签连接反应模板、荧光标签、Taq连接酶、10×连接缓冲液及超纯水进行连接反应。
连接体系如下:
反应程序:
4、遗传分析仪荧光电泳检测
12μL去离子甲酰胺与0.5μL分子量内标(AGCUMarkerSIZ-500)混合。再加入1μL连接产物,涡旋混匀2000r/min离心2min,注意不要产生气泡,用遗传分析仪ABI3100进行检测分析。
实施例2
1、标准图谱的建立
利用实施1的试剂盒和方法对已知PKU基因野生型样本7个位点进行检测,检测图谱见图5。利用实施3的方法对已知PKU基因突变型样本7个位点进行检测,检测图谱见图6。
2、实际应用例
利用实施例3的方法对样品1-4进行检测,检测结果分别见图7-10。由检测结果可知,样品1为R111X位点单位点突变;样品2的7个多态性位点均为野生型;样品3的突变基因型为Y204CM/M;样品4的突变基因型为R243QW/M。以上检测结果均与序列测序结果相一致,表明本发明的试剂盒及检测方法具有准确性高、高通量的优点。
实施例3
为了提高连接酶连接的特异性,本发明在探针的5’端第三个碱基处人为引入了错配,增加了探针连接的特异性。引入错配的原则是:若5’端为中等错配(A-A,C-C,G-G,T-T),则需引入中等错配,若5’端是强错配(G-A,T-C)则引入弱错配(G-T,A-C);若5’端为弱错配(G-T,A-C),则引入强错配(G-A,T-C)。
本发明在探针的5’端人为引入了错配,使得连接特异性大幅度提升。以R111X位点为实施例,在探针在5’端不引入错配(图11中a)及引入错配(图11中b)的差异。
运用多重连接检测技术检测SNP过程中,连接的特异性对检测结果的准确性尤为重要。为了提高分型的准确性,我们通常采取的策略是在下游探针5’端第2-5位人为引入错配。如果不引入错配,则容易分型错误。
R111X位点正常探针序列如下:
R111X位点野生型、突变型识别区探针第三位点引入错配如下:
表示引入突变的位点。
对于正常样本的检测,正确的分型是单一的野生峰型,但是如图12中a所示,不人为引入错配的下游探针进行连接测试得到的结果为双峰,即突变探针也与上游探针发生了连接作用,导致分型错误。
本发明在下游探针5’第三位引入错配,提高了分型的准确性。结果如图12中b显示。
Y204C位点正常探针序列如下:
Y204C位点野生型、突变型识别区探针第三位点引入错配如下:
表示引入突变的位点。
检测结果如图13所示。
R243Q位点正常探针序列如下:
R243Q位点野生型、突变型识别区探针第三位点引入错配如下:
表示引入突变的位点。
检测结果如图14所示。
以上实施例表明,本发明方法相比较之前的技术方法具有低成本、准确性高、高通量的优点。
以上实施例仅为介绍本发明的优选案例,对于本领域技术人员来说,在不背离本发明精神的范围内所进行的任何显而易见的变化和改进,都应被视为本发明的一部分。
<110> 广东华美众源生物科技有限公司;无锡中德美联生物技术有限公司
<120> 一种PKU基因检测试剂盒
<130>
<160> 42
<170> PatentIn version 3.5
<210> 1
<211> 19
<212> DNA
<213> 人工序列
<400> 1
gactgtctcc tcaccctcc 19
<210> 2
<211> 18
<212> DNA
<213> 人工序列
<400> 2
tccaaggcat tatttcca 18
<210> 3
<211> 22
<212> DNA
<213> 人工序列
<400> 3
ctgctaacct aacctgcgtt ct 22
<210> 4
<211> 18
<212> DNA
<213> 人工序列
<400> 4
gggccattga ccctgatg 18
<210> 5
<211> 20
<212> DNA
<213> 人工序列
<400> 5
ttgcactggt ttccgcctcc 20
<210> 6
<211> 25
<212> DNA
<213> 人工序列
<400> 6
ctgccacttg ttcctgttct cattt 25
<210> 7
<211> 19
<212> DNA
<213> 人工序列
<400> 7
cctttctccc ttggctgta 19
<210> 8
<211> 20
<212> DNA
<213> 人工序列
<400> 8
cacctttgtc accacctcac 20
<210> 9
<211> 22
<212> DNA
<213> 人工序列
<400> 9
atgataggag tttgtggctt ta 22
<210> 10
<211> 18
<212> DNA
<213> 人工序列
<400> 10
cctttgggtg tatgggtc 18
<210> 11
<211> 43
<212> DNA
<213> 人工序列
<400> 11
gggttcccta agggttggag gtgccactgt ccatgagctt tca 43
<210> 12
<211> 27
<212> DNA
<213> 人工序列
<400> 12
cgagataaga agaaagacac aggtctc 27
<210> 13
<211> 30
<212> DNA
<213> 人工序列
<400> 13
tgagataaga agaaagacac aggtctcaca 30
<210> 14
<211> 44
<212> DNA
<213> 人工序列
<400> 14
gggttcccta agggttggat ccttgtataa aacccatgct tgct 44
<210> 15
<211> 33
<212> DNA
<213> 人工序列
<400> 15
atgagtacaa tcacattttt ccctctcaca tta 33
<210> 16
<211> 36
<212> DNA
<213> 人工序列
<400> 16
gtgagtacaa tcacattttt ccctctcaca ttaatt 36
<210> 17
<211> 43
<212> DNA
<213> 人工序列
<400> 17
gggttcccta agggttggac agcttgcact ggtttccgcc tcc 43
<210> 18
<211> 38
<212> DNA
<213> 人工序列
<400> 18
gacctgtggc tggcctgctt tccctcacat taattgcg 38
<210> 19
<211> 41
<212> DNA
<213> 人工序列
<400> 19
aacctgtggc tggcctgctt tccctcacat taattgcgtt g 41
<210> 20
<211> 43
<212> DNA
<213> 人工序列
<400> 20
gggttcccta agggttggac tgtggctggc ctgctttcct ctc 43
<210> 21
<211> 44
<212> DNA
<213> 人工序列
<400> 21
ggaatttctt gggtggcctg gctcacatta attgcgttgc gctc 44
<210> 22
<211> 47
<212> DNA
<213> 人工序列
<400> 22
agaatttctt gggtggcctg gctcacatta attgcgttgc gctcact 47
<210> 23
<211> 42
<212> DNA
<213> 人工序列
<400> 23
gggttcccta agggttggat ttcttgggtg gcctggcctt cc 42
<210> 24
<211> 51
<212> DNA
<213> 人工序列
<400> 24
gaatcttcca ctgcacacag tctcacatta attgcgttgc gctcactgcc c 51
<210> 25
<211> 54
<212> DNA
<213> 人工序列
<400> 25
aaatcttcca ctgcacacag tctcacatta attgcgttgc gctcactgcc cgct 54
<210> 26
<211> 43
<212> DNA
<213> 人工序列
<400> 26
gggttcccta agggttggaa cttttcactt ggggcctaca gta 43
<210> 27
<211> 56
<212> DNA
<213> 人工序列
<400> 27
cttcttatca gagaagccaa actcacatta attgcgttgc gctcactgcc cgcttt 56
<210> 28
<211> 59
<212> DNA
<213> 人工序列
<400> 28
attcttatca gagaagccaa actcacatta attgcgttgc gctcactgcc cgctttcca 59
<210> 29
<211> 43
<212> DNA
<213> 人工序列
<400> 29
gggttcccta agggttggac aatacctcgg cccttctcag ttc 43
<210> 30
<211> 62
<212> DNA
<213> 人工序列
<400> 30
gccacgaccc atacacccaa ctcacattaa ttgcgttgcg ctcactgccc gctttccagt 60
cg 62
<210> 31
<211> 65
<212> DNA
<213> 人工序列
<400> 31
cccacgaccc atacacccaa ctcacattaa ttgcgttgcg ctcactgccc gctttccagt 60
cggga 65
<210> 32
<211> 23
<212> DNA
<213> 人工序列
<400> 32
agtgccagca agatccaatc tca 23
<210> 33
<211> 42
<212> DNA
<213> 人工序列
<400> 33
tccaaccctt agggaaccct gagattggat cttgctggca ct 42
<210> 34
<211> 43
<212> DNA
<213> 人工序列
<400> 34
gggttcccta agggttggag gtgccactgt ccatgagctt tca 43
<210> 35
<211> 27
<212> DNA
<213> 人工序列
<400> 35
cgcgataaga agaaagacac aggtctc 27
<210> 36
<211> 30
<212> DNA
<213> 人工序列
<400> 36
tgcgataaga agaaagacac aggtctcaca 30
<210> 37
<211> 44
<212> DNA
<213> 人工序列
<400> 37
gggttcccta agggttggat ccttgtataa aacccatgct tgct 44
<210> 38
<211> 33
<212> DNA
<213> 人工序列
<400> 38
attagtacaa tcacattttt ccctctcaca tta 33
<210> 39
<211> 36
<212> DNA
<213> 人工序列
<400> 39
gttagtacaa tcacattttt ccctctcaca ttaatt 36
<210> 40
<211> 43
<212> DNA
<213> 人工序列
<400> 40
gggttcccta agggttggac agcttgcact ggtttccgcc tcc 43
<210> 41
<211> 38
<212> DNA
<213> 人工序列
<400> 41
gaactgtggc tggcctgctt tccctcacat taattgcg 38
<210> 42
<211> 41
<212> DNA
<213> 人工序列
<400> 42
aaactgtggc tggcctgctt tccctcacat taattgcgtt g 41