用于检测短串联重复序列的引物、试剂盒及方法
技术领域
本发明涉及基因工程技术领域,具体涉及用于检测短串联重复序列的引物、试剂盒及方法。
背景技术
短串联重复序列(short tandem repeats,STR)是一类广泛存在于人类基因组中、核心序列为2~6个碱基的DNA串联重复序列。短串联重复序列在不同个体间具有极高的识别率,据统计,无关个体间12个STR位点完全相同的概率为10-14,同胞之间完全相同的概率为10-4,是识别不同个体DNA的有力指标,且这种差异在遗传过程中遵循孟德尔遗传规律。因此,STR扩增检测技术被广泛用于个体识别、亲缘鉴定、群体遗传学研究和嵌合率检测等方面。
随着毛细管电泳设备的高度自动化,大量的STR位点被各大人类身份认定的标准所定义(欧洲STR标准ESS,国际刑警组织采用的DNA标准基因座ISSOL,美国联邦调查局的联合DNA索引系统CODIS等),越来越多的研究学者投入该领域对其进行开发性研究。
目前,国内在进行STR检测时多依赖于进口的STR试剂盒。大量的研究报道,短串联重复序列基因座的遗传多态性在种族之间存在一定的差异。有鉴于此,迫切需要研发出更多适用于中国人群并能够与现代普遍使用的检测仪器相适应的STR检测方法和试剂盒。
发明内容
本发明针对现有技术中存在的上述缺陷,针对中国人群遗传多态性高的基因座,重新设计了适于检测中国人群短串联重复序列的引物以及检测方法。本发明的检测方法快速、简便、准确、直观,且实验成本低。
为此,本发明一方面提供了一种用于检测短串联重复序列的引物组合,其由序列1-36所示的引物组成,分别针对基因座THO1、D21S11、D2S1338、PentaE、D5S818、D13S317、D7S820、D16S539、CSF1PO、Amelogenin、vWA、D8S1179、TPOX、FGA、D6S1043、D12S391、D10S1248、PentaD进行检测。
本发明检测的短串联重复序列除了包含了人类遗传多态性高的基因座之外,还包含了中国人群遗传多态性高的基因座D2S1338、D12S391、D6S1043和D10S1248。这几个基因座均属于中国人群中高鉴别、高杂合度、高信息量的基因座。因此,本发明所设计的检测方法更适用于中国人群,有利于该技术的推广与应用。除此之外,本发明选择的STR基因座的串联重复单位为四个、五个或六个,能够有效降低滑移峰比例,获得的检测结果准确性更高。
在本发明优选的实施方案中,该引物组合进一步由第1-4组引物组成,其中第1组由序列1-8所示的引物组成,针对基因座THO1、D21S11、D2S1338、PentaE进行检测,第2组由序列9-18所示的引物组成,针对基因座D5S818、D13S317、D7S820、D16S539、CSF1PO进行检测,第3组由序列19-28所示的引物组成,针对基因座Amelogenin、vWA、D8S1179、TPOX、FGA进行检测,第4组由序列29-36所示的引物组成,针对基因座D6S1043、D12S391、D10S1248、PentaD进行检测。
在本发明进一步优选的实施方案中,检测每个基因座的引物对中有一条引物进行荧光染料标记,以用于毛细管电泳检测,进而得出其等位基因型别和大小。同时,上述4组引物分别采用4种不同颜色的荧光染料进行标记,分别标记于引物的5’端。在本发明更加优选的实施方案中,第1组引物采用蓝色荧光染料标记,荧光标记物为6-FAM,第2组引物采用绿色荧光染料标记,荧光标记物为HEX,第3组引物采用黄色荧光染料标记,荧光标记物为TAMRA,第4组引物采用红色荧光染料标记,荧光标记物为ROX,同时选用橙色荧光标记作为内标,荧光标记物为SIZ。由此,每组扩增后的产物和橙色荧光标记的内标混合后即可在同一毛细管中进行电泳,实现了对18个STR基因座同时进行检测分析。
采用6-FAM、HEX、TAMRA、ROX和SIZ五种荧光标记物进行荧光标记,荧光素标记技术成熟,成本低。但是,本发明采用的荧光标记物并不限于此,本领域技术人员可以根据实际情况选择其他可替换的荧光标记物。
在本发明提供的检测方法中,18个STR基因座采用的特异性扩增引物序列信息如表1所示。
表1、本发明检测短串联重复序列的引物情况表
在本发明提供的检测方法中,可以将18个基因座的所有引物混合在一起,在一个PCR反应中完成这18个基因座等位基因的复合扩增。因此,该复合扩增体系操作简单、效率高,成本低,更有利于该方法的推广与应用。
此外,在本发明优选的实施方案中,每个引物的浓度为0.05-0.4μmol/L,更加优选为0.06-0.2μmol/L。在一些具体的实施方式中,该18个基因座的引物浓度如表2所示。
表2、本发明检测短串联重复序列的引物浓度表
本发明另一方面提供了一种用于检测短串联重复序列的试剂盒,其包含本发明所述的引物组合。
本发明另一方面提供了本发明所述的引物组合在制备用于检测短串联重复序列的试剂盒中的应用。
本发明再一方面提供了本发明所述的引物组合,或者本发明所述的试剂盒在检测短串联重复序列中的应用。
本发明最后一方面提供了一种检测短串联重复序列的方法,其包含以下步骤:
1、获取待测样品DNA。
2、采用本发明所述的引物组合,或采用本发明所述的试剂盒,以步骤1中获取的DNA为模板,进行PCR扩增,优选采用荧光标记复合扩增系统进行扩增。
3、对步骤2中获取的PCR扩增产物进行检测和分型分析,获得待测样品各基因座的型别,其中优选采用毛细管电泳检测。
在本发明提供的检测方法中,扩增所采用的PCR扩增体系包括缓冲体系。该缓冲体系包括:KCl,Tris-HCl,MgCl2、dNTP、甘油和吐温20,其中dNTP为四种脱氧核糖核苷酸(dATP、dTTP、dCTP和dGTP)等摩尔混合物。该扩增方法中所用的DNA聚合酶为Taq DNA聚合酶,可选择热启动DNA聚合酶、抗体封闭修饰和/或化学修饰的DNA聚合酶。
在本发明进一步提供的实施例中,本发明扩增所用的PCR扩增体系包括如下含量的各成分:50mmol/L KCl,20mmol/L Tris-HCl,2.5mmol/L MgCl2、0.3mmol/L dNTP(每种脱氧核糖核苷酸的浓度均为0.3mmol/L)、3.2%甘油和0.07%吐温20、100units/mL Taq DNA聚合酶、0.05μmol/L-0.4μmol/L的引物。扩增体积为10μL-50μL,优选为10μL-25μL。
在本发明提供的检测方法中,PCR扩增所采用的程序分为三个步骤:第一步:95℃,2min-5min;第二步:95℃,20s;58℃-60℃,20s-2min30s;68℃-72℃,30s-2min;25-30个循环;第三步:68℃-72℃,25min-45min。在本发明进一步优选的实施方案中,本发明PCR扩增所用的程序具体为:第一步:95℃,5min;第二步:95℃,20s;60℃,2min;68℃,1min;25个循环;第三步:68℃,25min。
在本发明提供的检测方法中,当采用带有荧光标记的引物进行扩增时,扩增获得的产物也带有荧光标记物。在毛细管电泳过程中,所带有的荧光标记物可以在激光激发下发出荧光信号,该荧光信号可被测序仪(如3730、3730XL等)或遗传分析仪(如3130等)识别,并收集,可以应用于现代普遍使用的检测仪器中。
由上述描述可知,与现有技术相比,本发明具备如下优点。
1、本发明提供的检测方法所针对的短串联重复序列包含了18个基因座,其选取了中国人群遗传多态性高的基因座,该检测方法更适用于中国人群,有利于该技术的推广与应用。
2、本发明选择的STR基因座的串联重复单位为四个、五个或六个,能够有效降低滑移峰比例,获得的检测结果准确性更高。
3、本发明提供的检测方法可采用荧光标记复合扩增系统进行扩增,获得的扩增产物可在同一毛细管中进行电泳,实现了对18个STR基因座同时进行检测分析,该复合扩增体系操作简单、效率高,成本低,更有利于该方法的推广与应用。
4、本发明提供的检测方法可采用FAM、HEX、TAMRA、ROX和SIZ荧光标记物进行荧光标记,荧光素标记技术成熟,成本低。
5、实验结果表明,本发明提供的检测方法特异性好,可用于个体识别、亲缘鉴定、群体遗传学研究等定性分析,也可用于造血干细胞移植后嵌合率检测等定性分析。
综上所述,本发明的发明人通过大量的创造性劳动确定了检测方法中采用的18个STR基因座对应的引物,并且对其进行分组和组合,以满足同时检测一个样本中18个STR基因座信息。同时,本发明的发明人经过大量的探索确定了最佳的引物配比、扩增体系和扩增条件,获得的检测方法特异性好、分型结果准确,可用于定性和定量分析。
附图说明
图1:实施例1中第一组引物扩增检测结果图。
图2:实施例1中第二组引物扩增检测结果图。
图3:实施例1中第三组引物扩增检测结果图。
图4:实施例1中第四组引物扩增检测结果图。
图5:实施例2中第一组引物扩增检测结果图。
图6:实施例2中第二组引物扩增检测结果图。
图7:实施例2中第三组引物扩增检测结果图。
图8:实施例2中第四组引物扩增检测结果图。
具体实施方式
下面通过实施例对本发明作进一步的详细说明,旨在用于说明本发明而非限定本发明。应当指出,对于本领域技术人员而言,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也同样落入本发明的保护范围之内。
本发明提供的短串联重复序列的检测方法及其试剂盒中所用到的引物和原料均可由市场购买获得。
为使本领域技术人员能够更好地理解本发明的技术方案,下面结合实施例,进一步阐述本发明如下。
实施例1:人基因组DNA样本18个STR基因座检测1
本实施例采用磁珠法提取DNA,获得人基因组DNA样本;对获得的DNA样本进行PCR扩增,其中采用的引物荧光标记分别为6-FAM、HEX、TAMRA和ROX;将所得PCR扩增产物进行毛细管电泳检测;分型分析。同时,联合Life公司的STR检测试剂盒和Sanger测序方法确定所得人基因组DNA样本中18个STR基因座的型别。具体如下。
1、引物组合物存储液的配置
按照表3所示的配方配置四组5×引物储存液。
表3、四组5×引物储存液的配方表
2、PCR扩增
PCR扩增时,一个DNA样本分四个扩增反应体系进行扩增,四个反应体系分别扩增四组不同引物储存液所对应的STR基因座,这四个扩增反应体系除了所用引物不同之外,其他完全相同。PCR扩增体系如表4所示。
表4、PCR扩增反应体系具体成分表
组分 |
含量 |
人基因组DNA |
2ng |
5×引物储存液 |
2μL |
5×缓冲液 |
2μL |
Taq DNA聚合酶 |
1U |
水 |
补足至10μL |
其中5×缓冲液中包含如下含量的各个组分:250mmol/L KCl,100mmol/L Tris-HCl,12.5mmol/L MgCl2、1.5mmol/L dNTP(每种脱氧核糖核苷酸的浓度均为1.5mmol/L)、16%甘油和0.35%吐温20。
PCR扩增程序分为三个步骤:第一步:95℃,5min;第二步:95℃,20s;60℃,30s;68℃,45s;27个循环;第三步:68℃,25min,4℃保存。
3、毛细管电泳
将步骤2所得扩增产物按照第一组引物扩增产物、第二组引物扩增产物、第三组引物扩增产物和第四组引物扩增产物等比混合得扩增产物混合物。将所得扩增产物混合物与甲酰胺、SIZ标记的分子量内标按照1μL:8.8μL:0.2μL进行混合加样于96孔板中,于95℃变性3min,冰浴3min之后,进行毛细管电泳,所使用的仪器为ABI 3730XL DNA测序仪,收集数据。
4、分型分析
用片段分析软件GeneMapper分析步骤3中所收集到的实验数据,得到检测样本的分型数据。
结果如说明书附图1-4所示,其中附图1为第一组引物扩增检测结果,峰1和峰2为THO1基因座的等位基因扩增峰,峰3和峰4为D21S11基因座的等位基因扩增峰,峰5为D2S1338基因座的等位基因扩增峰,峰6和峰7为PentaE基因座的等位基因扩增峰。附图2为第二组引物扩增检测结果,其中峰8和峰9为D5S818基因座的等位基因扩增峰,峰10和峰11为D13S317基因座的等位基因扩增峰,峰12和峰13为D7S820基因座的等位基因扩增峰,峰14和峰15为D16S539基因座的等位基因扩增峰,峰16为CSF1PO基因座的等位基因扩增峰。附图3为第三组引物扩增检测结果,其中峰17为Amelogenin基因座的等位基因扩增峰,峰18和峰19为vWA基因座的等位基因扩增峰,峰20和峰21为D8S1179基因座的等位基因扩增峰,峰22和峰23为TPOX基因座的等位基因扩增峰,峰24和峰25为FGA基因座的等位基因扩增峰。附图4为第四组引物扩增检测结果,其中峰26和峰27为D6S1043基因座的等位基因扩增峰,峰28和峰29为D12S391基因座的等位基因扩增峰,峰30和峰31为D10S1248基因座的等位基因扩增峰,峰32和峰33为PentaD基因座的等位基因扩增峰。
从附图1-4中可知,本实施例提供的检测方法可特异性扩增出18个STR基因座所对应的等位基因,在目的片段区域没有非特异性条带,说明本发明提供的检测方法特异性好。根据该检测结果,获得该DNA样本的各个STR基因座的等位基因的扩增片段大小,进而可获得各个STR基因座的等位基因型别,将所得等位基因型别与实际等位基因型别对比,两者一致,说明本发明提供的检测结果准确性良好。
实施例2:人基因组DNA样本18个STR基因座检测2
本实施例采用磁珠法提取DNA,获得人基因组DNA样本;对获得的DNA样本进行PCR扩增,其中采用的引物荧光标记分别为6-FAM、HEX、TAMRA和ROX;将所得PCR扩增产物进行毛细管电泳检测;分型分析。同时,联合Life公司的STR检测试剂盒和Sanger测序方法确定所得人基因组DNA样本中18个STR基因座的型别。具体如下。
1、引物组合物存储液的配置
按照表5所示的配方配置5×引物储存液。
表5、5×引物储存液的配方表
2、PCR扩增
PCR扩增时,一个DNA样本的18个STR位点在一个扩增体系进行扩增,其扩增体系如表6所示。
表6、PCR扩增反应体系具体成分表
组分 |
含量 |
人基因组DNA |
4ng |
5×引物储存液 |
4μL |
5×缓冲液 |
4μL |
Taq DNA聚合酶 |
2U |
水 |
补足至20μL |
其中5×缓冲液中包含如下含量的各个组分:250mmol/L KCl,100mmol/L Tris-HCl,12.5mmol/L MgCl2、1.5mmol/L dNTP(每种脱氧核糖核苷酸的浓度均为1.5mmol/L)、16%甘油和0.35%吐温20。
PCR扩增程序分为三个步骤:第一步:95℃,5min;第二步:95℃,20s;60℃,2min;68℃,1min;27个循环;第三步:68℃,25min,4℃保存。
3、毛细管电泳
将步骤2所得扩增产物与甲酰胺、SIZ标记的分子量内标按照1μL:8.8μL:0.2μL进行混合加样于96孔板中,于95℃变性3min,冰浴3min之后,进行毛细管电泳,所使用的仪器为ABI 3730XL DNA测序仪,收集数据。
4、分型分析
用片段分析软件GeneMapper分析步骤3中所收集到的实验数据,得到检测样本的分型数据。
结果如说明书附图5-8所示,其中附图5为第一组引物扩增检测结果,其中峰1为THO1基因座的等位基因扩增峰,峰2和峰3为D21S11基因座的等位基因扩增峰,峰4和峰5为D2S1338基因座的等位基因扩增峰,峰6和峰7为PentaE基因座的等位基因扩增峰;附图6为第二组引物引物扩增检测结果,其中峰8和峰9为D5S818基因座的等位基因扩增峰,峰10为D13S317基因座的等位基因扩增峰,峰11为D7S820基因座的等位基因扩增峰,峰12和峰13为D16S539基因座的等位基因扩增峰,峰14和峰15为CSF1PO基因座的等位基因扩增峰;附图7为第三组引物扩增检测结果,其中峰16为Amelogenin基因座的等位基因扩增峰,峰17和峰18为vWA基因座的等位基因扩增峰,峰19和峰20为D8S1179基因座的等位基因扩增峰,峰21和峰22为TPOX基因座的等位基因扩增峰,峰23和峰24为FGA基因座的等位基因扩增峰;附图8为第四组引物扩增检测结果,其中峰25和峰26为D6S1043基因座的等位基因扩增峰,峰27为D12S391基因座的等位基因扩增峰,峰28为D10S1248基因座的等位基因扩增峰,峰29为PentaD基因座的等位基因扩增峰。
从附图5-8中可知,本实施例提供的检测方法可特异性扩增出18个STR基因座所对应的等位基因,在目的片段区域没有非特异性条带,说明本发明提供的检测方法特异性好。根据该检测结果,获得该DNA样本的各个STR基因座的等位基因的扩增片段大小,进而可获得各个STR基因座的等位基因型别,将所得等位基因型别与实际等位基因型别对比,两者一致,说明本发明提供的检测结果准确性良好。并且本实施例提供的检测方法实现了18个基因座的复合扩增,操作简便,成本低,效率高,适用于应用与推广。
序列表
<110> 上海荻硕贝肯生物科技有限公司
<120> 用于检测短串联重复序列的引物、试剂盒及方法
<160> 36
<170> PatentIn version 3.3
<210> 1
<211> 21
<212> DNA
<213> 人工序列
<400> 1
gtgattccca ttggcctgtt c 21
<210> 2
<211> 22
<212> DNA
<213> 人工序列
<400> 2
attcctgtgg gctgaaaagc tc 22
<210> 3
<211> 22
<212> DNA
<213> 人工序列
<400> 3
atatgtgagt caattcccca ag 22
<210> 4
<211> 26
<212> DNA
<213> 人工序列
<400> 4
tgtattagtc aatgttctcc agagac 26
<210> 5
<211> 20
<212> DNA
<213> 人工序列
<400> 5
tcctactggc ccataatcca 20
<210> 6
<211> 20
<212> DNA
<213> 人工序列
<400> 6
tccctgtctc accccttttc 20
<210> 7
<211> 26
<212> DNA
<213> 人工序列
<400> 7
attaccaaca tgaaagggta ccaata 26
<210> 8
<211> 33
<212> DNA
<213> 人工序列
<400> 8
tgggttatta attgagaaaa ctccttacaa ttt 33
<210> 9
<211> 23
<212> DNA
<213> 人工序列
<400> 9
ggtgattttc ctctttggta tcc 23
<210> 10
<211> 26
<212> DNA
<213> 人工序列
<400> 10
agccacagtt tacaacattt gtatct 26
<210> 11
<211> 26
<212> DNA
<213> 人工序列
<400> 11
attacagaag tctgggatgt ggagga 26
<210> 12
<211> 19
<212> DNA
<213> 人工序列
<400> 1
ggcagcccaa aaagacaga 19
<210> 13
<211> 21
<212> DNA
<213> 人工序列
<400> 13
atgttggtca ggctgactat g 21
<210> 14
<211> 24
<212> DNA
<213> 人工序列
<400> 14
gattccacat ttatcctcat tgac 24
<210> 15
<211> 24
<212> DNA
<213> 人工序列
<400> 15
gggggtctaa gagcttgtaa aaag 24
<210> 16
<211> 29
<212> DNA
<213> 人工序列
<400> 16
gtttgtgtgt gcatctgtaa gcatgtatc 29
<210> 17
<211> 24
<212> DNA
<213> 人工序列
<400> 17
ccggaggtaa aggtgtctta aagt 24
<210> 18
<211> 22
<212> DNA
<213> 人工序列
<400> 18
atttcctgtg tcagaccctg tt 22
<210> 19
<211> 24
<212> DNA
<213> 人工序列
<400> 19
gccctgggct ctgtaaagaa tagt 24
<210> 20
<211> 24
<212> DNA
<213> 人工序列
<400> 20
atcagagctt aaactgggaa gctg 24
<210> 21
<211> 33
<212> DNA
<213> 人工序列
<400> 21
gccctagtgg atgataagaa taatcagtat gtg 33
<210> 22
<211> 30
<212> DNA
<213> 人工序列
<400> 22
ggacagatga taaatacata ggatggatgg 30
<210> 23
<211> 32
<212> DNA
<213> 人工序列
<400> 23
attgcaactt atatgtattt ttgtatttca tg 32
<210> 24
<211> 28
<212> DNA
<213> 人工序列
<400> 24
accaaattgt gttcatgagt atagtttc 28
<210> 25
<211> 20
<212> DNA
<213> 人工序列
<400> 25
gcacagaaca ggcacttagg 20
<210> 26
<211> 18
<212> DNA
<213> 人工序列
<400> 26
cgctcaaacg tgaggttg 18
<210> 27
<211> 20
<212> DNA
<213> 人工序列
<400> 27
ggctgcaggg cataacatta 20
<210> 28
<211> 24
<212> DNA
<213> 人工序列
<400> 28
attctatgac tttgcgcttc agga 24
<210> 29
<211> 20
<212> DNA
<213> 人工序列
<400> 29
caaggatggg tggatcaata 20
<210> 30
<211> 20
<212> DNA
<213> 人工序列
<400> 30
ttgtatgagc cacttcccat 20
<210> 31
<211> 20
<212> DNA
<213> 人工序列
<400> 31
aacaggatca atggatgcat 20
<210> 32
<211> 20
<212> DNA
<213> 人工序列
<400> 32
tggcttttag acctggactg 20
<210> 33
<211> 20
<212> DNA
<213> 人工序列
<400> 33
actcactgcc ttgaacataa 20
<210> 34
<211> 22
<212> DNA
<213> 人工序列
<400> 34
tgctaaaacc tctgtatccc ac 22
<210> 35
<211> 19
<212> DNA
<213> 人工序列
<400> 35
gaaggtcgaa gctgaagtg 19
<210> 36
<211> 26
<212> DNA
<213> 人工序列
<400> 36
attagaattc tttaatctgg acacag 26