CN103646193A - 一种用于近缘物种鉴别的pcr引物设计方法 - Google Patents

一种用于近缘物种鉴别的pcr引物设计方法 Download PDF

Info

Publication number
CN103646193A
CN103646193A CN201310723968.2A CN201310723968A CN103646193A CN 103646193 A CN103646193 A CN 103646193A CN 201310723968 A CN201310723968 A CN 201310723968A CN 103646193 A CN103646193 A CN 103646193A
Authority
CN
China
Prior art keywords
primer
primer pair
specificity
susceptibility
gene order
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201310723968.2A
Other languages
English (en)
Other versions
CN103646193B (zh
Inventor
艾海新
刘宏生
张力
赵健
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Liaoning University
Original Assignee
Liaoning University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Liaoning University filed Critical Liaoning University
Priority to CN201310723968.2A priority Critical patent/CN103646193B/zh
Publication of CN103646193A publication Critical patent/CN103646193A/zh
Application granted granted Critical
Publication of CN103646193B publication Critical patent/CN103646193B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明公开一种用于近缘物种鉴别的PCR引物设计方法。本发明方法包括:获得目标种系和非目标种系同一基因的多条DNA序列,并进行多序列比对,获得多序列比对文件;按照常规引物设计方法设计出多个上游引物和下游引物,并排除敏感性和特异性低于设定阈值的单向引物;剩余的上游引物和下游引物互相配对,产生引物对,排除不合理的及敏感性和特异性较低的引物对;计算剩余各引物对的P值,进行聚类分析,取出每类中P值最小的引物对作为设计得到的PCR引物。本发明提供的用于近缘物种鉴别的PCR引物设计方法,能快速设计出对目标种系具有高度特异性且敏感性高的PCR引物,降低了种系特异性PCR引物设计的难度。

Description

一种用于近缘物种鉴别的PCR引物设计方法
技术领域
本发明涉及一种特异性引物的设计方法,尤其涉及一种用于鉴别近缘物种的PCR引物的设计方法。
背景技术
对于亲缘关系接近的物种的鉴别一直是环境监测、水产品种类鉴别、动植物品种鉴别、病害诊断、进出口检验检疫等领域的一项重要工作。而传统的以形态学为基础的分类鉴别方法具有很多缺陷,例如:多数近缘物种形态差异极小,难以鉴别;有些物种在不同生长时期或不同生长环境中形态差异较大,进一步增加了鉴别难度;作为原料加工后会失去其原有的形态特征,导致形态上难以区分;另外,参与鉴别的人员需要具有较深厚的形态分类学专业知识和经验。这些缺陷对分类鉴别过程造成很大的困难,导致鉴别效率低、准确率低,不能适应快速鉴定、实际需求等问题。
随着分子生物学技术的发展,以及越来越多物种基因组、rDNA、叶绿体基因、线粒体基因测序的完成,以DNA片段作为鉴别物种的分子标记的各类方法不断发展出来。这些技术具有特异性强、准确率高、可重复性强、时间短等特点,已经广泛应用于各类致病微生物、环境微生物、经济作物等的分析鉴定中。而这些技术都依赖于一对或几对针对特定种系(可以包括多个种、属)高度特异性的PCR引物。
由于以下两个原因导致设计这样高度特异性的PCR引物存在困难:一、待鉴别的不同种系亲缘关系接近,他们的基因序列也相似,因此引物必须设计在不同种系基因序列差异较大的位置,这种位置一般位于基因的高变区;二、为了保证引物可以检测到待鉴别种系所有更小的分类单元或个体,引物需要设计在种系内基因差异较小的位置,而这种位置一般位于基因的保守区。对于亲缘关系较近的不同种系,基因的保守区和高变区一般不会发生变化。因此设计出的引物会出现特异性差(引物位于保守区,不能有效区分两个种系,出现假阳性)或敏感性差(引物位于高变区,只能鉴别种系内部分物种,出现假阴性)的问题。因此,设计出符合要求的PCR引物存在一定的难度。
发明内容
本发明的目的是提供一种用于近缘物种鉴别的PCR引物设计方法,本发明解决了特异性引物设计中的技术问题,该方法能快速设计出高特异性高敏感性的用于鉴定某一种系生物的PCR引物,该引物也可以用于鉴别目的种系以及与目的种系亲缘关系较近的种系。
本发明提供的一种用于近缘物种鉴别的PCR引物设计方法,方法包括以下步骤:
1)获得近缘物种中,目标种系和非目标种系同一基因的序列,并进行多序列比对,获得多序列比对文件。
2)以步骤1)中获得的目标种系基因序列之一作为模板序列,确定模板序列中的高度保守区。
确定模板序列中的高度保守区,具体步骤如下:①统计多序列比对文件中每一位中碱基A、T、G、C和空位的百分比,确定模板序列的每个碱基在多序列比对文件中的保守性,以百分比表示;②设定保守性阈值为60%-80%,把模板序列分为保守区域和非保守区域;保守性大于60%-80%的定为保守区域;③在保守区域,对于碱基持续长度小于2×(最小引物长度﹣3’端不允许发生错配区)的保守区域,重新划分为非保守区域;④在保守区域,对于碱基持续长度大于或等于2×(最小引物长度﹣3’端不允许发生错配区)的保守区域,在其两端分别减去(最小引物长度﹣3’端不允许发生错配区)长度的碱基,即为高度保守区;
所述的最小引物长度是碱基数为15-18bp,所述3’端不允许发生错配区碱基数为0-6bp。
3)以步骤2)中作为模板序列的目标种系基因序列,排除步骤2)中确定的高度保守区,按照常规引物设计方法(可使用Primer3),设计出多个上游引物和多个下游引物,然后计算各引物的敏感性和特异性,排除敏感性和特异性低于设定的的敏感性阈值和特异性阈值(敏感性和特异性的阈值分别为0.5-0.9和0.5-0.9)的上游引物和下游引物。
各引物的敏感性和特异性的计算方法包括以下步骤:①根据单向引物在模板序列上的匹配位置,确定其在多序列比对文件中的每个序列上的结合位置,计算各上游引物和下游引物能否与多序列比对中各序列匹配,其计算方法包括以下步骤:如果引物与多序列比对中序列在3’端不允许发生错配区(通常为3’端0-6bp)发生错配,记为不匹配;如果引物与多序列比对中序列发生错配的碱基数大于最大允许错配碱基数(通常为0-6bp),记为不匹配;其余情况记为匹配;②对于所有引物计算其敏感性和特异性,引物的敏感性=引物能匹配的目标种系基因序列的个数/目标种系基因序列的总个数;引物的特异性=引物能匹配的目标种系基因序列的个数/引物能匹配的目标种系基因序列和非目标种系基因序列的总个数。
4)将剩余的上游引物和下游引物互相配对,产生引物对;然后,①排除产物大小为负或长度范围不在200-2000bp的引物对;②计算各引物的敏感性和特异性,排除敏感性和特异性低于设定的敏感性阈值和特异性阈值(敏感性和特异性的阈值分别为0.5-0.9和0.5-0.9)的引物对;③排除不能通过常规引物设计软件检验的引物对;
各引物对的敏感性和特异性的计算方法包括以下步骤:①根据引物对在模板序列上的匹配位置,确定其在多序列比对文件中的每个序列上的结合位置,计算各引物对能否与多序列比对中各序列匹配,其计算方法包括以下步骤:如果引物对中上游引物或下游引物之一与多序列比对中序列在3’端不允许发生错配区发生错配,此引物对记为不匹配;如果引物对中上游引物或下游引物之一与多序列比对中序列发生错配的碱基数大于最大允许错配碱基数0-6bp,此引物对记为不匹配;其余情况记为匹配;②对于所有引物对计算敏感性和特异性,引物对的敏感性=引物对能匹配的目标种系基因序列的个数/目标种系基因序列的总个数;引物对的特异性=引物对能匹配的目标种系基因序列的个数/引物能匹配的目标种系基因序列和非目标种系基因序列的总个数。
5)计算步骤4)中获得的剩余引物对中每个引物对的P值,P值的计算方法为fisher精确检验,计算公式为:
P=(C!×D!×(A+B)!×(C+D-A-B)!)/(A!×B!×(C-A)!×(D-B)!×(C+D)!);
其中,
A=引物能匹配的目标种系基因序列的个数;
B=引物能匹配的非目标种系基因序列的个数;
C=目标种系基因序列的总个数;
D=非目标种系基因序列的总个数;
然后,对步骤4)中获得的剩余引物对中的每个引物对进行聚类分析,把与模板序列结合位置相差小于10个碱基的引物对聚为一类,最后取出每类中P值最小的引物对作为用于近缘物种鉴别的PCR引物。
上述的一种用于近缘物种鉴别的PCR引物设计方法,步骤1)中对于目标种系和非目标种系,所选取的基因是rDNA、线粒体DNA、叶绿体DNA、基因组DNA或它们中的一部分。
上述的一种用于近缘物种鉴别的PCR引物设计方法,步骤1)中所述的目标种系和非目标种系的基因序列数目均不小于两条。
本发明的有益效果是:本发明提供的用于近缘物种鉴别的PCR引物设计方法,利用目标种系和非目标种系的某一基因的多个序列进行多序列比对,获得多序列比对文件,根据多序列比对文件计算模板序列高度保守区,并屏蔽此区域,然后使用常规引物设计方法设计出多个上游和下游引物,计算每个引物的特异性和敏感性,并以此排除一些特异性和敏感性低的引物,然后将剩余的上游引物和下游引物互相配对生成引物对,排除不符合筛选条件的引物对,使用fisher精确检验方法计算每个引物对的P值,用P值综合评价引物的敏感性和特异性,然后根据P值排序、聚类,最终选择出对目标种系高度特异且敏感性高的引物。本发明提供的用于近缘物种鉴别的PCR引物设计方法能快速设计出对目标种系具有高度特异性且敏感性高的PCR引物,设计出的引物在PCR试验中可以特异地区分属于目标种系和非目标种系的样品,此方法解决了基于DNA片段分子标记作为鉴别物种的PCR技术方法中的关键特异性引物设计问题,有益于PCR方法大规模应用于生产实际中,在环境监测、水产品种类鉴别、动植物品种鉴别、病害诊断、出入境检验检疫等领域具有重要意义。
附图说明
图1是本发明提供的一种用于近缘物种鉴别的PCR引物设计方法的流程图。
具体实施方式
下面的实施例将对本发明予以进一步的说明,但并不因此而限制本发明。
实施例1:一种用于近缘物种大黄鱼和小黄鱼鉴别的PCR引物设计方法
设计用于鉴别目标种系大黄鱼和非目标种系小黄鱼的PCR引物,可以设计两对特异性引物,一对特异性识别大黄鱼线粒体DNA,另一对特异性识别小黄鱼线粒体DNA;也可以只设计一对特异性识别大黄鱼线粒体DNA的PCR引物。
(一)特异性识别大黄鱼引物设计
1.获得近缘物种中,目标种系和非目标种系同一基因的序列,并进行多序列比对,获得多序列比对文件
大黄鱼和小黄鱼属于亲缘关系非常接近的鱼类,线粒体DNA有较快的进化速度,比较适宜鉴别大黄鱼和小黄鱼,因此引物设计的目标基因选择为线粒体基因。在NCBI的GenBank数据库中(http://www.ncbi.nlm.nih.gov/)搜索所有大黄鱼和小黄鱼的线粒体DNA序列,共搜索到两条大黄鱼的线粒体DNA序列(编号:EU339149和FJ595214)和两条小黄鱼的线粒体DNA序列(编号:FJ618559和GU586227)。然后把这四条序列合并为一个FASTA文件,使用ClustalX2.1软件进行多序列比对,各参数保持默认,比对结果保存为FASTA格式。
2.以大黄鱼的EU339149基因序列为模板序列,确定模板序列中的高度保守区
选择大黄鱼线粒体DNA序列EU339149作为常规引物设计的模板序列。确定最小引物长度的碱基数为18bp,3’端不允许发生错配区碱基数为3bp,然后采用如下步骤计算EU339149中的高度保守区:
①统计多序列比文件对中每一位中碱基A、T、C、G和空位的百分比;计算模板序列的每个碱基在多序列比对中的保守性,以百分比表示;
②设定保守性阈值为80%,把模板序列分为保守区域和非保守区域,保守性大于80%的定为保守区;
③在保守区域,对于碱基持续长度小于30bp(=2×(最小引物长度(18bp)﹣3’端不允许发生错配区(3bp)))的保守区域,重新划分为非保守区域;
④在保守区域,对于碱基持续长度大于或等于30bp的保守区域,在其两端分别减去15bp(=最小引物长度(18bp)﹣3’端不允许发生错配区(3bp))长度的碱基,即为高度保守区;
⑤大黄鱼线粒体DNA序列EU339149,经上述计算,可知高度保守区为:132-135,182-183,230-240,295-352,491-510,589-645,736-775,1231-1251,1316-1428,1376-1413,1459-1495,1578-1585,1833-1890,2065-2199,2325-2339,2430-2440,2494-2602,2649-2660,4141-4148,5113-5147,5258-5262,5348-5354,7093-7109,7207-7216,7906-7936,8113-8115,8790-8825,8883-8886,9103-9110,9196-9197,10029-10038,11821-11829,11903-11952,15546-15560,15607-15631。
3.按照常规引物设计方法设计出多个上游引物和下游引物,排除敏感性和特异性低于阈值的单向引物
3.1以常规引物设计方法设计出多个上游引物和下游引物,步骤如下:
以步骤1中获得的目标种系大黄鱼线粒体DNA序列EU339149基因序列作为模板序列,排除步骤2中确定的高度保守区,使用开源常规引物设计软件Primer3,按照常规引物设计方法,生成上游引物500条和下游引物500条。运行Primer3时使用如下参数:引物设计不允许序列为上述高度保守区,最小引物长度为18bp,最适引物长度为20bp,最大引物长度为25bp,产物大小范围为200-500bp,最大TM值为23.0,最小TM值为57.0,最大GC含量为60.0%,最小GC含量为40.0%,MAX_END_STABILITY为9.0,MAX_SELF_ANY_TH为45.0,MAX_SELF_END_TH为35.0,MAX_HAIRPIN_TH为24.0。
3.2计算各引物的敏感性和特异性,步骤如下:
①根据单向引物在模板序列上的匹配位置,确定其在多序列比对文件中的每个序列上的匹配位置,计算每个上游引物和下游引物能否与多序列比对中各序列匹配,其计算方法包括以下步骤:如果引物与多序列比对中序列在3’端不允许发生错配区(3’端最后3个碱基)发生错配,记为不匹配;如果引物与多序列比对中序列发生错配的碱基数大于最大允许错配碱基数(在本实施例中设定为3个碱基),记为不匹配;其余情况记为匹配;这里计算是否匹配时允许少量碱基的不配对是因为在PCR试验中引物5’末端可以存在几个不配对的碱基而对PCR效果影响较小,而3’末端的不匹配碱基会造成引物不能匹配的结果。
②对各引物分别计算其敏感性和特异性,公式如下:
引物敏感性=引物能匹配的大黄鱼线粒体DNA序列的个数/大黄鱼线粒体DNA序列的总个数
引物的特异性=引物能匹配的大黄鱼线粒体DNA序列的个数/引物能匹配的大黄鱼和小黄鱼线粒体DNA序列的总个数
所述的引物能匹配的大黄鱼和小黄鱼线粒体DNA序列的总个数是指引物能匹配的大黄鱼EU339149序列和FJ595214序列,及小黄鱼FJ618559序列和GU586227序列的个数的总和。
3.3排除敏感性和特异性低于阈值的单向引物,步骤如下:
设定敏感性阈值为0.5,特异性阈值为0.5,根据计算得到的500条上游引物和500条下游引物的敏感性和特异性,排除敏感性小于0.5和特异性小于0.5的单向引物。最终剩余符合条件的是182条上游引物和175条下游引物。
4.上游引物和下游引物互相配对,产生引物对,排除产物大小为负或不在指定范围内的,或敏感性和特异性低于阈值的,或不能通过常规引物设计软件检验的引物对
4.1把符合条件的182条上游引物和175条下游引物两两配对,产生31850个引物对。
4.2排除产物大小为负或不在指定范围内(即产物大小不在200-500bp范围内)的引物对,剩余650个引物对;
4.3排除敏感性和特异性低于阈值的引物对
计算650个引物对的敏感性和特异性,计算方法包括以下步骤:
①根据引物对在模板序列上的匹配位置,确定其在多序列比对文件中的每个序列上的结合位置,计算各引物对能否与多序列比对中各序列匹配,其计算方法包括以下步骤:如果引物对中上游引物或下游引物之一与序列在3’端不允许发生错配区(3’端最后3个碱基)发生错配,此引物对记为不匹配;如果引物对中上游引物或下游引物之一与序列发生错配的碱基数大于最大允许错配碱基(在本实施例中设定为3个碱基),此引物对记为不匹配;其余情况记为匹配;
②对于匹配的引物对计算敏感性和特异性,公式如下:
引物对敏感性=引物对能匹配的大黄鱼线粒体DNA序列的个数/大黄鱼线粒体DNA序列的总个数
引物对的特异性=引物对能匹配的大黄鱼线粒体DNA序列的个数/引物能匹配的大黄鱼和小黄鱼线粒体DNA序列的总个数
所述的引物对能匹配的大黄鱼和小黄鱼线粒体DNA序列的总个数是指引物能匹配的大黄鱼EU339149序列和FJ595214序列,及小黄鱼FJ618559序列和GU586227序列的碱基个数的总和。
③设定敏感性阈值为0.6,特异性阈值为0.8,根据计算得到的650对引物对的敏感性和特异性,删除掉敏感性小于0.6和特异性小于0.8的引物对。
4.4使用Primer3软件验证步骤4.3中剩余的引物对是否符合引物对参数条件,删除不符合条件的引物对。引物对的验证参数为:引物对最大TM差值为3.0,PAIR_MAX_COMPL_ANY_TH为45.0,PAIR_MAX_COMPL_END_TH为35.0。最终剩余645个引物对。
5.计算每个引物对的P值,进行聚类分析,取出每类中P值最小的引物对作为设计得到的特异性识别大黄鱼的PCR引物
计算公式为:
P=(C!×D!×(A+B)!×(C+D-A-B)!)/(A!×B!×(C-A)!×(D-B)!×(C+D)!);
其中,
A=引物能匹配的目标种系基因序列的个数;
B=引物能匹配的非目标种系基因序列的个数;
C=目标种系基因序列的总个数;
D=非目标种系基因序列的总个数;
通过fisher精确检验计算645个引物对的P值,此P值可以综合评价引物对的敏感性和特异性,P值越小的引物对鉴别大黄鱼和小黄鱼的能力越强。然后使用P值为引物对排序,并对引物对进行聚类分析,把与模板序列匹配位置相差小于10个碱基的引物对聚为一类。最终645个引物对聚为216类。取出每类中P值最小的引物对作为候选引物,最终共有符合条件的216个引物对。
(二)特异性识别小黄鱼引物设计
1.获得近缘物种中,目标种系和非目标种系同一基因的序列,并进行多序列比对,获得多序列比对文件
方法同(一)
2.以小黄鱼的基因序列FJ618559为模板序列,确定模板序列中的高度保守区;
方法同(一),不同点在于选择小黄鱼线粒体DNA序列FJ618559作为常规引物设计的模板序列。经计算,可知高度保守区为37-73,132-135,182-183,230-240,295-339,491-510,589-645,738-777,888-900,982-989,1040-1089,1235-1255,1320-1332,1379-1499,1583-1590,18401897,2074-2207,2333-2347,2439-2449,2503-2611,2658-2669,4146-4153,5118-5152,5353-5359,7097-7096,7211-7221,7910-7940,8117-8119,8794-8808,8887-8890,9107-9114,9200-9201,11825-11833,11906-11965,15546-15560,15607-15613。
3.按照常规引物设计方法设计出多个上游引物和下游引物,排除敏感性和特异性低于阈值的单向引物
方法同(一),不同点在于,以步骤1中获得的非目标种系小黄鱼线粒体DNA序列FJ618559基因序列作为模板序列,排除步骤2中确定的高度保守区,按照常规引物设计方法,生成上游引物500条和下游引物500条。排除敏感性小于0.5和特异性小于0.5的单向引物。最终剩余符合条件的是193条上游引物和179条下游引物。
4.上游引物和下游引物互相配对,产生引物对,排除产物大小为负或不在指定范围内的,或敏感性和特异性低于阈值的,或不能通过常规引物设计软件检验的引物对
方法同(一),最终剩余680个引物对。
5.计算每个引物对的P值,进行聚类分析,取出每类中P值最小的引物对作为设计得到的特异性识别小黄鱼的PCR引物
方法同(一),最终680个引物对聚为242类。取出每类中P值最小的引物对作为候选引物,最终共有符合条件的242个引物对。
(三)可用于鉴别大黄鱼和小黄鱼的部分PCR引物
根据(一)和(二)中的设计结果,用于鉴别大黄鱼和小黄鱼的部分PCR引物列于表1。
表1设计出的可用于鉴别大黄鱼和小黄鱼的部分PCR引物
(四)结果验证
合成表1中大黄鱼特异性引物(编号5)和小黄鱼特异性引物(编号6),即:上游引物P1:5'-TTCGGCCATCCTGAGGTCTA-3',下游引物P2:5'-AATCCCGGTTAGTCCTCCCA-3';上游引物P3:5'-ACAGCCTGAATGACGAGCAA-3',下游引物P4:5'-AGGAGGTGGCTAGGAGAGTG-3',合成引物的浓度为0.2mM。
采用常规蛋白酶K法提取已知为大黄鱼和已知为小黄鱼的基因组DNA,用无菌超纯水溶解DNA,作为模板。PCR扩增的反应体系为:5μL10×PCR buffer,4μL浓度为2.5mM的dNTP,0.4μL浓度为5U/μL的Taq DNA聚合酶,引物P1-P4各2μL,1μL样品DNA,无菌超纯水补齐到50μL。PCR反应条件为:95℃预变性5min;94℃变性45sec,60℃退火30sec,72℃延伸1min,共30个循环;72℃延伸7min。
PCR反应结束后,取PCR产物进行1%琼脂糖凝胶电泳检测。大黄鱼的琼脂糖凝胶电泳显示,出现大小为357bp左右的条带;小黄鱼的琼脂糖凝胶电泳显示,出现大小为210bp左右的条带。由表1可见,与设计的大黄鱼特异性引物(编号5)和小黄鱼特异性引物(编号6)的产物大小相同,验证本发明方法设计的特异性引物正确。在实际应用中,可以选择表1中的任意特异性引物对,对待测品种进行检测,根据是否出现特异性大小的扩增条带,鉴定样品是大黄鱼或小黄鱼。如采用编号为5的引物对,琼脂糖凝胶电泳显示出现大小为357bp左右的条带即说明所检测样品为大黄鱼;采用编号为6的引物对,琼脂糖凝胶电泳显示出现大小为210bp左右的条带说明所检测样品为小黄鱼。
实施例2:设计用于鉴别环境样品中芽孢杆菌属细菌的PCR引物
(一)特异性识别芽孢杆菌属细菌引物设计
1.获得近缘物种中,目标种系和非目标种系同一基因的序列,并进行多序列比对,获得多序列比对文件
采用的多序列比对文件中目标种系芽孢杆菌属细菌的基因序列是其16S rDNA。非目标种系的基因序列是除了芽孢杆菌属细菌外的芽孢杆菌科的其他细菌的16S rDNA序列。这些基因序列从RDP数据库(http://rdp.cme.msu.edu/)中下载,下载时对序列质量做了一些限制,包括:序列来源菌株必须是标准菌株;序列来源菌株为分离株;序列长度必须大于或等于1200bp;序列质量经RDP数据库判定为“好”。经过这些限制,共下载到芽孢杆菌属细菌的基因序列143条,非目标种系基因序列162条。由于序列数目过多,本实施例采用MAFFT7.012软件开展多序列比对,同样生成FASTA格式的多序列比对文件。
2.以芽孢杆菌属细菌的基因序列为模板序列,确定模板序列中的高度保守区;
选择芽孢杆菌属细菌的基因序列DQ374637作为常规引物设计的模板序列。确定最小引物长度的碱基数为18bp,3’端不允许发生错配区碱基数为3bp,然后采用如下步骤计算序列DQ374637中的高度保守区:
①统计多序列比文件对中每一位中碱基A、T、C、G和空位的百分比;计算模板序列的每个碱基在多序列比对中的保守性,以百分比表示;
②设定保守性阈值为80%,把模板序列分为保守区域和非保守区域,保守性大于80%的定为保守区域;
③在保守区域,对于碱基持续长度小于30bp(=2×(最小引物长度(18bp)﹣3’端不允许发生错配区(3bp)))的保守区域,重新划分为非保守区域;
④在保守区域,对于碱基持续长度大于或等于30bp的保守区域,在其两端分别减去15bp(=最小引物长度(18bp)﹣3’端不允许发生错配区(3bp))长度的碱基,即为高度保守区;
⑤芽孢杆菌属细菌的基因序列DQ374637,经上述计算,可知高度保守区为287-370,950-963,1051-1078,1192-1205,1352-1384。
3.按照常规引物设计方法设计出多个上游引物和下游引物,排除敏感性和特异性低于阈值的单向引物
3.1以常规引物设计方法设计出多个上游引物和下游引物,步骤如下:
以步骤1中获得的目标种系芽孢杆菌属细菌的基因序列DQ374637基因序列作为模板序列,排除步骤2中确定的高度保守区,使用开源常规引物设计软件Primer3,按照常规引物设计方法,生成上游引物2000条和下游引物2000条。运行Primer3时使用如下参数:引物设计不允许序列为上述高度保守区,最小引物长度为18bp,最适引物长度为20bp,最大引物长度为25bp,产物大小范围为200-500bp,最大TM值为23.0,最小TM值为57.0,最大GC含量为60.0%,最小GC含量为40.0%,MAX_END_STABILITY为9.0,MAX_SELF_ANY_TH为45.0,MAX_SELF_END_TH为35.0,MAX_HAIRPIN_TH为24.0。
3.2计算各引物的敏感性和特异性,步骤如下:
①根据单向引物在模板序列上的匹配位置,确定其在多序列比对文件中的每个序列上的匹配位置,计算每个上游引物和下游引物能否与多序列比对中各序列匹配,其计算方法包括以下步骤:如果引物与多序列比对中序列在3’端不允许发生错配区(3’端最后3个碱基)发生错配,记为不匹配;如果引物与多序列比对中序列发生错配的碱基数大于最大允许错配碱基数(在本实施例中设定为3个碱基),记为不匹配;其余情况记为匹配;这里计算是否匹配时允许少量碱基的不配对是因为在PCR试验中引物5’末端可以存在几个不配对的碱基而对PCR效果影响较小,而3’末端的不匹配碱基会造成引物不能匹配的结果。
②对于各引物分别计算其敏感性和特异性,公式如下:
引物敏感性=引物能匹配的芽孢杆菌属细菌的16S rDNA基因序列的个数/芽孢杆菌属细菌的16S rDNA基因序列的总个数
引物的特异性=引物能匹配的芽孢杆菌属细菌的16S rDNA基因序列的个数/引物能匹配的芽孢杆菌属细菌和除了芽孢杆菌属细菌外的芽孢杆菌科的其他细菌的16S rDNA基因序列的总个数
3.3设定敏感性阈值为0.5,特异性阈值为0.5,根据计算得到的2000条上游引物和2000条下游引物的敏感性和特异性,排除敏感性小于0.5和特异性小于0.5的单向引物。最终剩余符合条件的是219条上游引物和337条下游引物。
4.上游引物和下游引物互相配对,产生引物对,排除产物大小为负或不在指定范围内的,或敏感性和特异性低于阈值的,或不能通过常规引物设计软件检验的引物对
4.1把这219条上游引物和337条下游引物两两配对,产生72792个引物对。
4.2排除产物大小为负或不在指定范围内(即,产物大小不在600-1500bp范围内)的引物对,剩余12040个引物对;
4.3排除敏感性和特异性低于阈值的引物对
计算12040个引物对的敏感性和特异性,计算方法包括以下步骤:
①根据引物对在模板序列上的匹配位置,确定其在多序列比对文件中的每个序列上的结合位置,计算各引物对能否与多序列比对中各序列匹配,其计算方法包括以下步骤:如果引物对中上游引物或下游引物之一与序列在3’端不允许发生错配区(3’端最后3个碱基)发生错配,此引物对记为不匹配;如果引物对中上游引物或下游引物之一与序列发生错配的碱基数大于最大允许错配碱基数(在本实施例中设定为3个碱基),此引物对记为不匹配;其余情况记为匹配;
②对于各引物对计算敏感性和特异性,公式如下:
引物对敏感性=引物对能匹配的芽孢杆菌属细菌16S rDNA基因序列的个数/芽孢杆菌属细菌16S rDNA基因序列的总个数
引物对的特异性=引物对能匹配的芽孢杆菌属细菌16S rDNA基因序列的个数/引物能匹配的芽孢杆菌属细菌和除了芽孢杆菌属细菌外的芽孢杆菌科的其他细菌16S rDNA基因序列的总个数
③设定敏感性阈值为0.6,特异性阈值为0.8,根据计算得到的12040对引物对的敏感性和特异性,删除掉敏感性小于0.6和特异性小于0.8的引物对。
4.4使用Primer3软件验证步骤4.3剩余的引物对是否符合引物对参数条件,删除不符合条件的引物对。引物对的验证参数为:引物对最大TM差值为3.0,PAIR_MAX_COMPL_ANY_TH为45.0,PAIR_MAX_COMPL_END_TH为35.0。最终剩余234个引物对。
5.计算每个引物对的P值,进行聚类分析,取出每类中P值最小的引物对作为设计得到的特异性识别芽孢杆菌属细菌的PCR引物
计算公式为:
P=(C!×D!×(A+B)!×(C+D-A-B)!)/(A!×B!×(C-A)!×(D-B)!×(C+D)!);
其中,
A=引物能匹配的目标种系基因序列的个数;
B=引物能匹配的非目标种系基因序列的个数;
C=目标种系基因序列的总个数;
D=非目标种系基因序列的总个数;
通过fisher精确检验计算234个引物对的P值,此P值可以综合评价引物对的敏感性和特异性,P值越小的引物对鉴别芽孢杆菌属细菌的能力越强。然后使用P值为引物对排序,并对引物对进行聚类分析,把与模板序列匹配位置相差小于10个碱基的引物对聚为一类。最终234个引物对聚为9类。取出每类中P值最小的引物对作为候选引物,共有9个引物对。
表2中列出了使用本专利设计出的用于鉴别环境样品中芽孢杆菌属细菌的全部PCR引物。
表2用于鉴别环境样品中芽孢杆菌属细菌的全部PCR引物
Figure BDA0000445030780000131
Figure BDA0000445030780000141
(二)验证试验
合成表2中编号为1的引物,即:上游引物:5'-GTACCTAACCAGAAAGCCACG-3',下游引物:5'-ACCTTCCTCCGGTTTGTCAC-3',合成引物的浓度为0.2mM。
采用常规蛋白酶K法提取已知为芽孢杆菌属枯草芽孢杆菌和糖球菌属嗜热糖球菌的基因组DNA,用无菌超纯水溶解DNA,作为模板。
采用合成好的PCR引物对模板DNA进行PCR扩增,PCR扩增的反应体系为:5μL10×PCRbuffer,4μL浓度为2.5mM的dNTP,0.4μL浓度为5U/μL的Taq DNA聚合酶,引物各2μL,1μL样品DNA,无菌超纯水补齐到50μL。PCR反应条件为:95℃预变性5min;94℃变性45sec,59℃退火30sec,72℃延伸1min,共30个循环;72℃延伸7min。
PCR反应结束后,取PCR产物进行1%琼脂糖凝胶电泳检测。芽孢杆菌属枯草芽孢杆菌的琼脂糖凝胶电泳结果显示,出现大小为698bp左右的条带;与表2所示的编号1引物的产物大小相同,可见采用本发明的方法设计的特异性引物可以用于鉴别近缘物种。在实际应用中,可以选择表2中的任意引物对,对待测样品进行检测,根据琼脂糖凝胶电泳结果是否出现特异性大小扩增条带,鉴定所检测细菌是否为芽孢杆菌属的细菌:如采用编号为1的引物对,琼脂糖凝胶电泳结果出现大小为698bp左右的条带说明所检测的细菌为芽孢杆菌属的细菌,否则不是芽孢杆菌属的细菌。

Claims (8)

1.一种用于近缘物种鉴别的PCR引物设计方法,其特征在于,方法包括以下步骤:
1)获得近缘物种中,目标种系和非目标种系同一基因的序列,并进行多序列比对,获得多序列比对文件;
2)以步骤1)中获得的目标种系基因序列之一作为模板序列,确定模板序列中的高度保守区;
3)以步骤2)中作为模板序列的目标种系基因序列,排除步骤2)中确定的高度保守区,按照常规引物设计方法,设计出多个上游引物和多个下游引物,然后,计算各引物的敏感性和特异性,排除敏感性和特异性低于设定的敏感性阈值和特异性阈值的上游引物和下游引物; 
4)将剩余的上游引物和下游引物互相配对,产生引物对;然后,① 排除产物大小为负或产物长度范围不在200-2000bp的引物对;② 计算各引物对的敏感性和特异性,排除敏感性和特异性低于设定的敏感性阈值和特异性阈值的引物对;③ 排除不能通过常规引物设计软件检验的引物对;
5)计算步骤4)中获得的剩余引物对中每个引物对的P值,计算公式为:
P=(C!×D!×(A+B)!×(C+D-A-B)!)/(A!×B!×(C-A)!×(D-B)!×(C+D)!);
其中,
A=引物能匹配的目标种系基因序列的个数;
B=引物能匹配的非目标种系基因序列的个数;
C=目标种系基因序列的总个数;
D=非目标种系基因序列的总个数;
然后对步骤4)中获得的剩余引物对中的每个引物对进行聚类分析,把与模板序列结合位置相差小于10个碱基的引物对聚为一类,最后取出每类中P值最小的引物对作为用于近缘物种鉴别的PCR引物。
2.如权利要求1所述的一种用于近缘物种鉴别的PCR引物设计方法,其特征在于:步骤3)和步骤4)中所述的敏感性阈值是0.5-0.9,所述的特异性阈值是0.5-0.9。
3.如权利要求1所述的一种用于近缘物种鉴别的PCR引物设计方法,其特征在于:步骤2)确定模板序列中的高度保守区,具体步骤如下:① 统计多序列比对文件中每一位中碱基A、T、G、C和空位的百分比,确定模板序列的每个碱基在多序列比对文件中的保守性,以百分比表示;② 设定保守性阈值为60%-80%,把模板序列分为保守区域和非保守区域;保守性大于60%-80%的定为保守区域;③ 在保守区域,对于碱基持续长度小于2×(最小引物长度﹣3’端不允许发生错配区)的保守区域,重新划分为非保守区域;④ 在保守区域,对于碱基持续长度大于或等于2×(最小引物长度﹣3’端不允许发生错配区)的保守区域,在其两端分别减去(最小引物长度﹣3’端不允许发生错配区)长度的碱基,即为高度保守区。
4.如权利要求3所述的一种用于近缘物种鉴别的PCR引物设计方法,其特征在于:所述的最小引物长度是碱基数为15-18bp,所述3’端不允许发生错配区碱基数为0-6bp。
5.如权利要求1所述的一种用于近缘物种鉴别的PCR引物设计方法,其特征在于:步骤3)中各引物的敏感性和特异性的计算方法包括以下步骤:① 根据单向引物在模板序列上的匹配位置,确定其在多序列比对文件中的每个序列上的结合位置,计算各上游引物和下游引物能否与多序列比对中各序列匹配,其计算方法包括以下步骤:如果引物与多序列比对中的序列在3’端不允许发生错配区发生错配,记为不匹配;如果引物与多序列比对中的序列发生错配的碱基数大于最大允许错配碱基数0-6bp,记为不匹配;其余情况记为匹配;② 对于所有引物计算其敏感性和特异性,引物的敏感性=引物能匹配的目标种系基因序列的个数/目标种系基因序列的总个数;引物的特异性=引物能匹配的目标种系基因序列的个数/引物能匹配的目标种系基因序列和非目标种系基因序列的总个数。
6.如权利要求1所述的一种用于近缘物种鉴别的PCR引物设计方法,其特征在于:步骤4)中各引物对的敏感性和特异性的计算方法包括以下步骤:① 根据引物对在模板序列上的匹配位置,确定其在多序列比对文件中的每个序列上的结合位置,计算各引物对能否与多序列比对中各序列匹配,其计算方法包括以下步骤:如果引物对中上游引物或下游引物之一与多序列比对中的序列在3’端不允许发生错配区发生错配,此引物对记为不匹配;如果引物对中上游引物或下游引物之一与多序列比对中的序列发生错配的碱基数大于最大允许错配碱基数0-6bp,此引物对记为不匹配;其余情况记为匹配;② 对于所有引物对计算敏感性和特异性,引物对的敏感性=引物对能匹配的目标种系基因序列的个数/目标种系基因序列的总个数;引物对的特异性=引物对能匹配的目标种系基因序列的个数/引物能匹配的目标种系基因序列和非目标种系基因序列的总个数。
7.如权利要求1所述的一种用于近缘物种鉴别的PCR引物设计方法,其特征在于:步骤1)中对于目标种系和非目标种系,所选取的基因是rDNA、线粒体DNA、叶绿体DNA、基因组DNA或它们中的一部分。
8.如权利要求1所述的一种用于近缘物种鉴别的PCR引物设计方法,其特征在于:步骤1)中所述的目标种系和非目标种系的基因序列数目均不小于两条。
CN201310723968.2A 2013-12-24 2013-12-24 一种用于近缘物种鉴别的pcr引物设计方法 Active CN103646193B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310723968.2A CN103646193B (zh) 2013-12-24 2013-12-24 一种用于近缘物种鉴别的pcr引物设计方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310723968.2A CN103646193B (zh) 2013-12-24 2013-12-24 一种用于近缘物种鉴别的pcr引物设计方法

Publications (2)

Publication Number Publication Date
CN103646193A true CN103646193A (zh) 2014-03-19
CN103646193B CN103646193B (zh) 2016-07-06

Family

ID=50251406

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310723968.2A Active CN103646193B (zh) 2013-12-24 2013-12-24 一种用于近缘物种鉴别的pcr引物设计方法

Country Status (1)

Country Link
CN (1) CN103646193B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105975808A (zh) * 2016-06-03 2016-09-28 西安交通大学 一种批量设计融合pcr引物的方法
CN106222249A (zh) * 2016-07-14 2016-12-14 哈尔滨工业大学(威海) 测定微生物群落中已知基因组信息物种的种特异性引物的设计方法及测定菌种含量的方法
CN107429302A (zh) * 2014-11-21 2017-12-01 南托米克斯有限责任公司 用于病毒感染的鉴定和区分的系统和方法
CN109266768A (zh) * 2018-11-19 2019-01-25 南京工业大学 一种用于鉴别近缘微生物的核苷酸片段的筛选方法
CN110004238A (zh) * 2018-11-19 2019-07-12 南京信息工程大学 一种用于鉴定Arthrobacter sp.2菌株的引物及其应用
CN110684850A (zh) * 2019-09-04 2020-01-14 浙江海洋大学 一种快速鉴定大、小黄鱼的引物序列及方法
CN112634990A (zh) * 2020-12-21 2021-04-09 广州市金域转化医学研究院有限公司 一种pcr引物设计模板筛选的方法及应用
CN113571123A (zh) * 2020-04-29 2021-10-29 广州华大基因医学检验所有限公司 用于选择性全基因组扩增的引物设计方法、装置及应用

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007074894A1 (ja) * 2005-12-28 2007-07-05 School Corporation, Azabu Veterinary Medicine Educational Institution 標的配列の特異的高感度増幅法
CN101478870A (zh) * 2006-06-29 2009-07-08 孟德尔生物科技有限公司 改善的转基因植物产量和胁迫耐受性
CN102392015A (zh) * 2011-10-28 2012-03-28 复旦大学 一种针对序列未知基因进行pcr引物设计的方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007074894A1 (ja) * 2005-12-28 2007-07-05 School Corporation, Azabu Veterinary Medicine Educational Institution 標的配列の特異的高感度増幅法
CN101478870A (zh) * 2006-06-29 2009-07-08 孟德尔生物科技有限公司 改善的转基因植物产量和胁迫耐受性
CN102392015A (zh) * 2011-10-28 2012-03-28 复旦大学 一种针对序列未知基因进行pcr引物设计的方法

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107429302A (zh) * 2014-11-21 2017-12-01 南托米克斯有限责任公司 用于病毒感染的鉴定和区分的系统和方法
CN105975808A (zh) * 2016-06-03 2016-09-28 西安交通大学 一种批量设计融合pcr引物的方法
CN105975808B (zh) * 2016-06-03 2018-07-17 西安交通大学 一种批量设计融合pcr引物的方法
CN106222249A (zh) * 2016-07-14 2016-12-14 哈尔滨工业大学(威海) 测定微生物群落中已知基因组信息物种的种特异性引物的设计方法及测定菌种含量的方法
CN109266768A (zh) * 2018-11-19 2019-01-25 南京工业大学 一种用于鉴别近缘微生物的核苷酸片段的筛选方法
CN110004238A (zh) * 2018-11-19 2019-07-12 南京信息工程大学 一种用于鉴定Arthrobacter sp.2菌株的引物及其应用
CN110684850A (zh) * 2019-09-04 2020-01-14 浙江海洋大学 一种快速鉴定大、小黄鱼的引物序列及方法
CN113571123A (zh) * 2020-04-29 2021-10-29 广州华大基因医学检验所有限公司 用于选择性全基因组扩增的引物设计方法、装置及应用
CN113571123B (zh) * 2020-04-29 2023-07-25 广州华大基因医学检验所有限公司 用于选择性全基因组扩增的引物设计方法、装置及应用
CN112634990A (zh) * 2020-12-21 2021-04-09 广州市金域转化医学研究院有限公司 一种pcr引物设计模板筛选的方法及应用
CN112634990B (zh) * 2020-12-21 2021-10-12 广州市金域转化医学研究院有限公司 一种pcr引物设计模板筛选的方法及应用

Also Published As

Publication number Publication date
CN103646193B (zh) 2016-07-06

Similar Documents

Publication Publication Date Title
CN103646193B (zh) 一种用于近缘物种鉴别的pcr引物设计方法
Ranjbar et al. Enterobacterial repetitive intergenic consensus polymerase chain reaction (ERIC-PCR) genotyping of Escherichia coli strains isolated from different animal stool specimens
Steven et al. Targeted and shotgun metagenomic approaches provide different descriptions of dryland soil microbial communities in a manipulated field study
CN102146466B (zh) 检测布鲁氏菌的试剂及复合探针荧光定量pcr检测布鲁氏菌的方法
Maguire et al. Precision long-read metagenomics sequencing for food safety by detection and assembly of Shiga toxin-producing Escherichia coli in irrigation water
US11085075B2 (en) DNA barcoding primer for identifying cephalopoda and use thereof
CN103421898B (zh) 耐甲氧西林金黄色葡萄球菌三重实时荧光pcr检测引物、探针、检测试剂盒和检测方法
CN101503735B (zh) 基于dna随机改组技术的扩增内标制备方法
CN105063035B (zh) 水稻黄单胞杆菌的分子标记及其应用
CN108588249B (zh) 一种用于检测甘薯茎腐病菌的引物对及其检测方法
CN104313173B (zh) 单核细胞增生李斯特氏菌实时浊度lamp检测方法
CN104212901A (zh) 用于金黄色葡萄球菌耐药性检测的组合物
CN111154900B (zh) 铜绿假单胞菌特异性新分子靶标及其快速检测方法
CN103667525A (zh) 草莓镶脉病毒的快速检测试剂盒及方法
CN102676664B (zh) 同时检测多种水产品致病菌的荧光定量pcr引物和探针及检测方法
CN102329858A (zh) 甘蔗黑穗病菌巢式pcr快速检测方法
CN113151516B (zh) 人类高风险性人畜共患型的猪链球菌特异性序列及检测引物和应用
CN114842909A (zh) 基于三代靶向测序数据的多靶标病原微生物分析方法
CN104404132B (zh) 一种猪链球菌2型的ss2-lamp检测试剂盒及应用
CN108048586A (zh) 一种牛种布氏菌弱毒疫苗株s19的检测方法
CN103451298B (zh) 一种甘蓝枯萎病菌1号和2号生理小种检测的试剂盒及其检测方法
CN106011265B (zh) 两种水稻纵卷叶螟幼虫的分子生物学区分方法
CN103740839B (zh) 荧光定量pcr检测肉毒杆菌的通用型试剂盒及非诊断性检测方法
CN114360646A (zh) 类似sars冠状病毒溯源和评估致病力的方法及装置
CN103031381A (zh) 香蕉穿孔线虫lamp特异性检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant