一种G6PD缺乏症基因检测试剂盒
技术领域
本发明属于生物体外诊断技术领域,具体涉及一种G6PD缺乏症基因检测试剂盒。
背景技术
葡萄糖-6-磷酸脱氢酶(glucose-6-phosphate dehydroge-nase,G6PD)缺乏症是全球最常见的一种遗传性X连锁不完全显性酶缺乏症。全球约4亿人罹患此病。G6PD基因位于X染色体,基因长约18Kb,有13个外显子和12个内含子,由515个氨基酸组成。我国是G6PD缺乏症高发区之一,呈南高北低的分布特点,患病率为0.2-44.8%。主要分布在长江以南各省,以海南、广东、广西、云南、贵州、四川等省为高。迄今全球已发现G6PD基因突变型126种,在我国发现过其中15种:1376G>T、1388G>A、95A>G、1311C>T、392G>T、1024C>T、592C>T、1004C>T、493A>G、487G>A、1360C>T、835A>T、1381G>A、1387G>T、871G>A。本发明选取了其中7种高致病型位点(1388G>A、1376G>T、1024C>T、1004C>T、871G>A、95A>G以及392G>T)进行检测。
G6PD缺乏症发病原因是由于G6PD基因突变,导致G6PD酶活性降低,红细胞不能抵抗氧化损伤而遭受破坏,引起溶血性贫血。其临床表现与一般溶血性贫血大致相同。分新生儿黄疸、蚕豆病、药物性溶血、感染性溶血、非球形细胞溶血性贫血等临床类型。本病临床表现的轻重程度不同,多数患者,特别是女性杂合子,平时不发病,无自觉症状,部分患者可表现为慢性溶血性贫血症状。G6PD缺乏症同时也是新生儿病理性黄疸的主要原因。据中山医大的一项统计表明,患G6PD缺乏症的新生儿中,约50%的患儿会出现新生儿黄疸,其中约12%可发展为核黄疸,导致脑部损害,引起智力低下。
G6PD基因定位于X染色体长臂2区8带(Xq28),一旦发生突变,男性患者均表现为G6PD严重缺乏;女性患者拥有2条X染色体,若两条染色体都有G6PD基因缺陷,也表现为G6PD严重缺乏;若只有一条染色体G6PD基因缺陷,则临床表现变化很大,G6PD酶的活性可能从正常到完全缺乏,这将给检测带来极大的难度。
多年来,G6PD缺乏症的检测方法在不断更新,目前主要有:四氮唑蓝纸片定性法、变性珠蛋白小体生成试验、高铁血红蛋白还原试验(MHb-RT)、荧光斑点法(FST)、G6PD活性测定等检测方法。这些方法操作简便、价格低廉,但是准确性不高,极易产生假阳性或假阴性,尤其在测试女性杂合子时,很容易发生漏诊。
发明内容
鉴于目前市面上G6PD缺乏症的检测方法普遍存在准确性低、高成本、操作复杂等缺点,本发明旨在提供一种准确性高、低成本、操作简便的检测试剂盒,以弥补现有检测方法容易漏诊女性杂合子的情况,帮助检出G6PD缺乏症携带者并对他们进行及时地治疗,为优生优育、提高国民身体素质做出一份贡献。
本发明所采取的技术方案是:
一种G6PD缺乏症基因检测试剂盒,其含有:用于特异性扩增G6PD基因上7个多态性位点的引物对、用于检测各多态性位点的探针、标签探针和标签连接反应模板;所述7个多态性位点为:1388、1376、1024、1004、871、95、392;所述用于检测各多态性位点的探针包括:共用探针、分型识别探针;所述分型识别探针包括野生型特异探针和突变型特异探针。
G6PD基因上7个多态性位点对应的引物对如下表所示:
所述分型探针从5’至3’端依次为多态性位点特异结合区、长度调整区,所述长度调节区是通过不同的序列长度来指示不同位点的不同基因型;所述共用探针从5’至3’端依次为外挂区、共用识别区,所述外挂区的作用是与标签连接反应模板右侧特异性结合。
所述分型探针从5’至3’端依次为:外挂区、长度调整区、多态性位点特异结合区,所述外挂区的作用是与标签连接反应模板右侧特异性结合,所述长度调节区是通过不同的序列长度来指示不同位点的不同基因型;所述共用探针包括靶序列特异接合区。
所述分型探针5’端第2-5位可以引入单碱基突变,或者是在探针序列中加入锁核酸(LNA)或肽核酸(PNA)修饰,以提高连接酶识别的特异性。
所述用于检测各多态性位点的探针如下表所示:
F代表上游共用探针,W代表野生型特异探针,M代表突变型特异探针。
所述共用探针和分型识别探针进行5’磷酸化处理。
所述标签连接反应模板是由两段人工序列组成的寡核苷酸序列,左侧部分作用是与标签探针特异结合,右侧部分是与共用探针或分型识别探针的外挂序列特异结合;所述标签探针是指用荧光染料标记的一段寡核苷酸序列,其作用是与标签连接反应模板中的左侧特异结合,所述荧光染料可以是FAM、HEX、TAMARA、ROX、Siz或vig。
所述标签探针的序列如下所示:AGTGCCAGCAAGATCCAATCTCA;所述标签连接反应模板序列如下所示:tccaacccttagggaacccTGAGATTGGATCTTGCTGGCACT。
所述试剂盒中还含有PCR复合扩增体系和连接反应体系。
本发明的有益效果是:
(1)本发明能够准确判别受检人员的基因型,明确他们是杂合突变或纯合突变。可降低漏诊杂合突变携带者的概率。
(2)本发明中的PCR扩增体系,可以免除提取DNA的步骤,直接从血滤纸、FTA卡、唾液卡等检材上扩增出待测片段,省时省力。
(3)基于高效特异多重连接反应进行的SNP检测准确性得到显著提高。
(4)为了提高连接酶连接的特异性,本发明在特异探针的5’端第2至4个碱基处人为引入单碱基错配(如图3a所示)。人为引入单碱基错配的原则是:若5’端为中等错配(A-A,C-C,G-G,T-T),则需引入中等错配,若5’端是强错配(G-A,T-C)则引入弱错配(G-T,A-C);若5’端为弱错配,则引入强错配。同理,特异探针的3’端第2至4个碱基处也可以按照引入单碱基错配原则进行修饰(如图3b所示),以提高连接酶连接的特异性。
(5)多种荧光标签探针与毛细管电泳结合使用,一次电泳可以同时检测5位受检人员,检测效率高。
附图说明
图1是一种G6PD缺乏症基因检测试剂盒检测位点的排布图;
图2是探针结构原理示意图,其中a是待测SNP位点位于共用探针5’末端时的原理示意图;b是待测SNP位点位于特异探针3’末端时的原理示意图;
图3是人为引入单碱基突变的示意图,其中a是共用探针引入单碱基突变示意图,b是特异探针引入单碱基突变示意图;
图4是95A>G的毛细管电泳结果图,其中a是未引入单碱基突变时的电泳结果;b是引入单碱基突变后的电泳结果;
图5是高效特异多重连接反应检测SNP原理示意图;
图6是本发明实施例检测G6PD基因野生型的样本结果示例,被测试基因型均为W/W,被测试者患病概率与人群中患病概率一致,患病可能性很小;
图7是本发明实施例是人工构建的G6PD基因突变的样本结果示例,被测试基因型均为M/M,为阳性参照品;
图8是本发明实施例检测出单一G6PD基因杂合突变的样本结果示例,其突变基因型为871W/M,被测试者是携带者,需要进一步检测确定是否患病;
图9是本发明实施例检测出双G6PD基因杂合突变的样本结果示例,其突变基因型为95W/M,1388W/M;,被测试者是患病者;
图10是本发明实施例检测出单一G6PD基因纯合突变的样本结果示例,其突变基因型为1024M/M,被测试者是患病者。
具体实施方式
下面结合实施例对本发明作进一步的说明,但并不局限于此。
实施例
一、本发明所针对的G6PD基因上7个多态性位点的信息如下:
本发明所选的G6PD基因多态性位点包括:1388G→A、1376G→T、1024C→T、1004C→T、871G→A、95A→G、392G→T。各位点的排布如图1所示。这7个检测位点涵盖了致病因素的86%以上。
二、检测试剂盒的主要成分:
1、针对7个多态性位点的扩增引物:
F表示上游引物;R表示下游引物。其中1388和1376位点相距较近,可在同一个扩增片段上检测;1024、1004、871也可以在同一个扩增片段上检测,所以它们共用片段扩增引物。
2、针对多态性位点的探针:
F表示共用探针,以待测SNP位点位于特异探针5’末端为例,共用探针由外挂区(可与标签连接反应模板的左侧外挂探针结合区碱基互补的一段外源序列,已用小写字母标记)和共用识别区构成。
分型识别探针,以待测SNP位点位于其5’末端为例,包括特异野生型探针(W)和特异突变型探针(M),探针中的长度调整区已用小写字母标记,以区别检测条带的大小,每组的M均比W大3bp。
共用探针和分型识别探针探针进行5’磷酸化处理。
为了进一步增加连接的特异性,可在下游探针5’第2-5个碱基上引入错配(在5’第3位引入单碱基错配为例),引入的错配遵循以下原则:若5’端为中等错配(A-A,C-C,G-G,T-T),则需引入中等错配;若5’端是强错配(G-A,T-C)则引入弱错配(G-T,A-C);若5’端为弱错配(G-T,A-C),则引入强错配(G-A,T-C)。
3、标签连接反应模板和标签探针
标签连接模板中用小写字母表示的是外挂结合区,大写字母部分是标签探针结合区;标签探针5’端被不同的荧光基团(*表示荧光基团)所修饰。
4、复合扩增体系
5、连接体系:
三、本发明试剂盒的具体实施步骤:
1、样本DNA的提取
根据样本的实际情况,选择合适的方法提取样本DNA,常见的方法有:磁珠法、碱裂解法、阴离子交换树脂法等等。若是样本是以血滤纸、FTA卡、唾液卡等形式存在时,可简化步骤,取适量检材直接扩增。需要注意的是,不论是提取DNA样本或是直接扩增检材,当用于片段复合扩增时,需保证每个反应中DNA含量达到0.1-2.0ng。
2、片段复合扩增
分别在待测SNP位点上下游200至300bp处设计合适的片段扩增引物,通过琼脂糖电泳测试各个引物的特异性及扩增效率;将通过检测的片段扩增引物组合成复合扩增引物。按照下表在200μL PCR管中配置复合扩增体系反应液。配置完成后,将PCR管在涡旋震荡器上震荡混匀,并瞬时离心。
复合扩增体系:
按下表设定扩增程序,最后将反应体系体积设定为25μL,启动程序。
扩增程序:
3、高效特异多重连接反应
按下表配置反应所需的各种组分。体系中的probes指的是5’磷酸化处理的左侧和共用探针,在一个反应中,两者分别加入0.2μL,总计0.4μL。按下表在200μL PCR管中配置高效特异多重连接反应体系。配置完成后,将PCR管震荡混匀,并瞬时离心。
连接体系:
将PCR管放入PCR仪,设定连接程序,最后将反应体系体积设定为10μL,启动程序,进行高效特异多重连接反应。
连接程序:
如图4实施例所示未引入单碱基错配时,G6PD-95-M-R引物由于结合效率较高,所以当待测人员是W纯合子时,会出现代表SNP突变的M峰,容易产生诊断错误;引入单碱基错配后,降低了G6PD-95-M-R的结合效率,提高了诊断的准确性。具体引物序列如下(共用探针序列中的小写字母表示外挂区,特异探针序列中的小写字母表示长度调整区):
表示引入突变的位点。
4、电泳检测
12.0μL去离子甲酰胺与0.5μL分子量内标混合。再加入1.0μL连接产物,涡旋混匀2000r/min离心1min,除去溶液内的气泡,用遗传分析仪进行电泳检测。
结果检测时,也可以不局限于毛细管荧光电泳,根据实际情况选择合适的电泳方法即可,如PEAG胶电泳等。
实施例2
1、标准图谱的建立
利用实施1的试剂盒和方法对已知G6PD基因野生型样本7个位点进行检测,检测图谱见图6。利用实施3的方法对已知PKU基因突变型样本7个位点进行检测,检测图谱见图7。
2、实际应用例
利用实施例3的方法对样品1-3进行检测,检测结果分别见图8-10。由检测结果可知,样品1突变基因型为871W/M;样品2突变基因型为95W/M,1388W/M;样品31024M/M。以上检测结果均与序列测序结果相一致,表明本发明的试剂盒及检测方法具有准确性高、高通量的优点。
以上实施例仅为介绍本发明的优选案例,对于本领域技术人员来说,在不背离本发明精神的范围内所进行的任何显而易见的变化和改进,都应被视为本发明的一部分。
<110> 广东华美众源生物科技有限公司;无锡中德美联生物技术有限公司
<120> 一种G6PD缺乏症基因检测试剂盒
<130>
<160> 34
<170> PatentIn version 3.5
<210> 1
<211> 20
<212> DNA
<213> 人工序列
<400> 1
tggagcccag agccagcagt
20
<210> 2
<211> 20
<212> DNA
<213> 人工序列
<400> 2
tagcaggagc gggaggagga
20
<210> 3
<211> 22
<212> DNA
<213> 人工序列
<400> 3
caggcagtgg catcagcaag
ac
22
<210> 4
<211> 23
<212> DNA
<213> 人工序列
<400> 4
aggtgccctc atactggaaa
ccc
23
<210> 5
<211> 23
<212> DNA
<213> 人工序列
<400> 5
ctcaacaccc aaggagccca
ttc
23
<210> 6
<211> 23
<212> DNA
<213> 人工序列
<400> 6
aaggcatcac ctaccatccc
acc
23
<210> 7
<211> 20
<212> DNA
<213> 人工序列
<400> 7
ggcagaacac acacggactc
20
<210> 8
<211> 20
<212> DNA
<213> 人工序列
<400> 8
aacaccgcct ttccgctctg
20
<210> 9
<211> 43
<212> DNA
<213> 人工序列
<400> 9
gggttcccta agggttggaa
tgccttccat cagtcggata cac
43
<210> 10
<211> 45
<212> DNA
<213> 人工序列
<400> 10
acctattcat catcatgggt
gcatctcaca ttaattgcgt tgcgc
45
<210> 11
<211> 48
<212> DNA
<213> 人工序列
<400> 11
gcctattcat catcatgggt
gcatctcaca ttaattgcgt tgcgctca
48
<210> 12
<211> 43
<212> DNA
<213> 人工序列
<400> 12
gggttcccta agggttggac
ccttggcttt ctctcaggtc aag
43
<210> 13
<211> 51
<212> DNA
<213> 人工序列
<400> 13
gtgttgaaat gcatctcaga
ggtgctcaca ttaattgcgt tgcgctcact g
51
<210> 14
<211> 54
<212> DNA
<213> 人工序列
<400> 14
atgttgaaat gcatctcaga
ggtgctcaca ttaattgcgt tgcgctcact gccc 54
<210> 15
<211> 43
<212> DNA
<213> 人工序列
<400> 15
gggttcccta agggttggac
cgggcatgtt cttcaacccc
gag 43
<210> 16
<211> 57
<212> DNA
<213> 人工序列
<400> 16
gagtcggagc tggacctgac
ctacctcaca ttaattgcgt tgcgctcact gcccgct 57
<210> 17
<211> 60
<212> DNA
<213> 人工序列
<400> 17
tagtcggagc tggacctgac
ctacctcaca ttaattgcgt tgcgctcact gcccgctttc 60
<210> 18
<211> 43
<212> DNA
<213> 人工序列
<400> 18
gggttcccta agggttggac
ggtgccccgc gggtccacca ccg
43
<210> 19
<211> 63
<212> DNA
<213> 人工序列
<400> 19
ccacttttgc agccgtcgtc
ctctctcaca ttaattgcgt tgcgctcact gcccgctttc 60
cag
63
<210> 20
<211> 66
<212> DNA
<213> 人工序列
<400> 20
tcacttttgc agccgtcgtc
ctctctcaca ttaattgcgt tgcgctcact gcccgctttc 60
cagtcg 66
<210> 21
<211> 43
<212> DNA
<213> 人工序列
<400> 21
gggttcccta agggttggat
tcaaccccga ggagtcggag ctg
43
<210> 22
<211> 69
<212> DNA
<213> 人工序列
<400> 22
gacctgacct acggcaacag
atacctcaca ttaattgcgt tgcgctcact gcccgctttc 60
cagtcggga
69
<210> 23
<211> 72
<212> DNA
<213> 人工序列
<400> 23
aacctgacct acggcaacag
atacctcaca ttaattgcgt tgcgctcact gcccgctttc 60
cagtcgggaa ac
72
<210> 24
<211> 43
<212> DNA
<213> 人工序列
<400> 24
gggttcccta agggttggaa
ccgccacttt tgcagccgtc gtc
43
<210> 25
<211> 75
<212> DNA
<213> 人工序列
<400> 25
ctctatgtgg agaatgagag
gtggctcaca ttaattgcgt tgcgctcact gcccgctttc 60
cagtcgggaa acctg
75
<210> 26
<211> 78
<212> DNA
<213> 人工序列
<400> 26
ttctatgtgg agaatgagag
gtggctcaca ttaattgcgt tgcgctcact gcccgctttc 60
cagtcgggaa acctgtcg
78
<210> 27
<211> 43
<212> DNA
<213> 人工序列
<400> 27
gggttcccta agggttggag
ccacatgaat gccctccacc tgg 43
<210> 28
<211> 81
<212> DNA
<213> 人工序列
<400> 28
ggtcacaggc caaccgcctc
ttctctcaca ttaattgcgt tgcgctcact gcccgctttc 60
cagtcgggaa acctgtcgtg
c
81
<210> 29
<211> 84
<212> DNA
<213> 人工序列
<400> 29
tgtcacaggc caaccgcctc
ttctctcaca ttaattgcgt tgcgctcact gcccgctttc 60
cagtcgggaa acctgtcgtg
ccag
84
<210> 30
<211> 42
<212> DNA
<213> 人工序列
<400> 30
tccaaccctt agggaaccct
gagattggat cttgctggca ct
42
<210> 31
<211> 23
<212> DNA
<213> 人工序列
<400> 31
agtgccagca agatccaatc
tca
23
<210> 32
<211> 43
<212> DNA
<213> 人工序列
<400> 32
gggttcccta agggttggaa
tgccttccat cagtcggata cac
43
<210> 33
<211> 45
<212> DNA
<213> 人工序列
<400> 33
acctattcat catcatgggt
gcatctcaca ttaattgcgt tgcgc
45
<210> 34
<211> 48
<212> DNA
<213> 人工序列
<400> 34
gcctattcat catcatgggt
gcatctcaca ttaattgcgt tgcgctca
48