具体实施方式
本发明提供了一种雪茄烟草鉴定用SSR引物的筛选方法,包括以下步骤:以烟草基因组DNA作为模板DNA;以已公布的公共SSR标记为待筛选引物,将待筛选引物与模板DNA进行PCR扩增,得PCR产物;对得到的PCR产物进行检测,能观察到目标片段的作为鉴定雪茄烟草用SSR引物;所述目标片段长度为190~220bp。
本发明的所述筛选方法以烟草基因组DNA为模板DNA。本发明对所述基因组DNA的提取方法并没有特殊限定,优选采用CTAB法提取。本发明提取基因组DNA后优选的去除RNA污染,具体包括:TE溶解基因组DNA,加入RNA酶水浴30min。本发明所述模板DNA浓度优选为40~80ng/μL,更优选为45~60ng/μL,最优选为50ng/μL。
得到模板DNA后,本发明以已公布的公共SSR标记为待筛选引物,将待筛选引物与模板DNA进行PCR扩增,得PCR产物。本发明所述公共SSR标记优选为已开发的烟草SSR标记,本发明实施例中选择998对公共SSR标记的引物对。本发明对所述公共SSR标记的引物对来源并没有特殊限定,优选的来源于公司合成。本发明所述PCR扩增的体系优选包括:Dreamtaq Mix 10μL,模板DNA 1μL,引物对的上、下游引物各1μL,双蒸水补至20μL。本发明所述PCR扩增的程序优选为:95℃预变性5min;95℃变性45s,退火温度60℃延伸30s,72℃延伸45s,共35个循环;最后72℃延伸10min,10℃恒温冷却。
本发明对得到的PCR产物进行检测,能观察到目标片段的作为鉴定雪茄烟草用SSR引物。本发明对所述检测的方法并没有特殊限定,优选采用8%非变性聚丙烯酰胺凝胶电泳。本发明所述目标片段的长度优选为190~220bp。
本发明还提供了一种用于雪茄烟草鉴定的试剂盒,包括Dreamtaq Mix和利用上述技术方案所述筛选方法筛选得到的鉴定雪茄烟草用SSR引物对。本发明对所述DreamtaqMix的来源及浓度并没有特殊限定。本发明所述筛选得到的鉴定雪茄烟草用SSR引物对优选包括如SEQ ID NO.1~96所示引物对中的一对或多对,具体如表1所示:
表1.筛选得到的雪茄烟草SSR引物对名称及序列
本发明还提供了一种上述试剂盒在雪茄烟草品种鉴定中的应用。
优选的,所述雪茄烟草品种鉴定包括以下步骤:以上述试剂盒对待测样品的基因组DNA进行PCR扩增,将获得的多态性扩增条带与已有的雪茄烟品种条带进行比对,若SSR标记引物存在两对及两对以上多态性扩增差异,则判定待测样品为新雪茄烟品种资源;若存在两对以下多态性扩增差异,则判定所述待测样品为已有雪茄烟品种资源,品种鉴定不合格。
更优选的,所述PCR扩增的程序为:95℃预变性5min;95℃变性45s,退火温度60℃延伸30s,72℃延伸45s,共35个循环;最后72℃延伸10min,10℃恒温冷却。
本发明还提供了一种上述试剂盒在雪茄烟草遗传学分析中的应用。
优选的,所述雪茄烟草遗传学分析包括以下步骤:以上述试剂盒对待测样品的基因组DNA进行PCR扩增,将得到的PCR产物进行8%非变性聚丙烯酰胺凝胶电泳;选择带型清晰的PCR扩增条带进行人工读带,有条带记为“1”,无条带记为“0”,建立“0/1”矩阵,使用DataFormater软件进行矩阵的转换。
用Popgene32软件计算:观察等位基因数No(observed number of alleles),有效等位基因Ne(effective number of alleles),Nei’s基因多样性指数H(Nei’s genediversity),Shannon’s多态信息指数I(Shannon’s information index)以及品种间成对Nei’s遗传距离(Nei’s genetic distance)。
通过对不同样品量或引物数处理得到Nei’s遗传距离,使用统计软件NTSYS-PCver2.1分析供试样品间遗传相似系数,采用非加权配对算术平均数法(UPGMA,unweightedpair group method with arithmetic mean)进行聚类分析,绘制聚类分析树状图。
下面结合实施例对本发明提供的雪茄烟草鉴定的引物对和试剂盒及应用进行详细的说明,但是不能把它们理解为对本发明保护范围的限定。
实施例1
利用由中国农业科学院烟草研究所国家种质资源中期库和海南雪茄研究所提供的,雪茄烟生产国常用5个栽培品种:H211(中国)、Beinhart 1000-1(美国)、Little Dutch(美国)、Havana 10(古巴)、H382(印度尼西亚)和Hicks(SSR标记阳性对照)以及20份不同地理来源的雪茄烟资源(如表2所示)进行雪茄烟草SSR引物对的筛选:
表2.雪茄烟资源名称及来源地
在供试样品资源5片真叶期时随机选取10株混合取样,采用CTAB法提取基因组DNA,TE溶解DNA,加入RNA酶水浴30min。经核酸测定仪(NanoProp 2000 Thermoscientific)测定DNA的质量与浓度,将DNA浓度统一稀释到50ng/μL,在-20℃低温下长期保存;
委托六合华大(北京)基因科技有限公司合成998对已公布的公共SSR标记;
配制扩增体系:在PCR反应管中依次加入Dreamtaq Mix 10μL、模板DNA 1μL、上游引物1μL、下游引物1μL,最后用双蒸水将反应体系补至20μL;
PCR扩增:反应程序为95℃预变性5min;95℃变性45s,退火温度60℃延伸30s,72℃延伸45s,共35个循环;最后72℃延伸10min,10℃恒温冷却。
取出PCR反应管,对扩增产物进行8%非变性聚丙烯酰胺凝胶电泳检测。
利用6份雪茄烟资源对998对公共SSR标记进行初步筛选,雪茄烟各染色体引物多态率如表3所示:
表3.雪茄烟各染色体引物多态率
由上述可知,初步筛选得到的多态性引物共有437对,占总数的43.79%,表明烟草公共标记在5份雪茄烟资源中多态率较高;第13号染色体多态率最高,达78.95%;通过筛选得到96对多态性高、稳定性好、扩增方便、各染色体分布均匀的SSR,占引物总数的9.6%;随后利用20份雪茄烟资源进行进一步筛选,共得到48对如表1所示的雪茄烟草SSR引物,占总引物的4.80%,各引物对的染色体位置如表4所示:
表4.筛选得到的雪茄烟草SSR引物的染色体位置
最终确定的48对筛选得到的雪茄烟草SSR引物分布在24条染色体上,每条染色体各2对引物。
实施例2
选择带型清晰的PCR扩增条带进行人工读带,有条带记为“1”,无条带记为“0”,建立“0/1”矩阵,使用DataFormater软件进行矩阵的转换。用Popgene32软件计算:观察等位基因数Na(observed number of alleles),有效等位基因Ne(effective number ofalleles),Nei’s基因多样性指数H(Nei's gene diversity),Shannon’s多态信息指数I(Shannon’s information index)以及品种间成对Nei’s遗传距离(Nei’s geneticdistance),结果如表5所示:
表5.雪茄烟草SSR引物在供试雪茄烟资源中的多态性信息
结果显示:48对SSR标记在20份雪茄烟资源遗传多样性结果显示观测等位基因数在2~9之间,平均值为4.02,引物PT52689等位基因数最多为7个。有效等位基因数在1.02~6.45之间,平均值为2.85,引物PT52689有效等位基因数最多为6.45,引物PT51059有效等位基因数最少为1.02。Shannon信息指数在0.10~2.01之间,平均值为1.09。多样性指数在0.06~0.85之间,平均值为0.58。
试验例
1、利用筛选得到的雪茄烟草SSR引物对20个供试雪茄烟资源进行引物的有效性验证:
具体的PCR扩增体系及扩增程序与实施例相同,其中一对引物具体结果如图1所示,在20个供试雪茄烟资源中都能检测到雪茄烟草SSR引物PT30163的多态性扩增条带。
2、利用软件NTSYS-PCver 2.1分析20个供试雪茄烟资源间遗传相似系数,采用非加权配对算术平均数法(UPGMA,unweighted pair grooup method with arithmeticmean)进行聚类分析,绘制聚类分析树状图,研究不同来源雪茄烟资源间的亲缘关系,验证筛选得到的雪茄烟草SSR引物的有效性和应用性:
根据表4所示的遗传多样性分析结果进行统计分析,绘制0/1二维矩阵,使用NTSYS-pc(2.10e)计算20个供试雪茄烟资源之间的遗传相似性系数和遗传距离指数。结果表明,各晒烟资源间的遗传相似性系数在0.149~1.000之间。
为研究筛选得到的雪茄烟草SSR引物的有效性和应用性,对明确不同地理来源的供试雪茄烟资源进行亲缘关系分析,利用48对雪茄烟草SSR引物按照非加权组平均法(UPGMA)进行聚类分析结果如图2。在相似性系数0.299可将雪茄烟资源分为两个类群,Havana10(17)、H211(18)、Criollo Salteno 11(19)和Havana IIc(20)3个古巴资源加一个中国雪茄烟资源为一个小类群,推测H211(18)可能为中国从古巴引种资源,H211(18)与Criollo Salteno 11(19)亲缘关系很近,可能为姊妹系资源。古引3号(9)、古引4号(10)和古引5号(11)亲缘关系一致,根据来源地和名称可以认定这三个资源为同一份雪茄烟资源,田间表型也印证了分子鉴定结果。同样的,巴西1号(14)、巴西2号(15)和巴西5号(16)亲缘关系极为相近,认定为同一份资源或者姊妹系资源。
综上所述,本发明获得的雪茄烟草SSR引物具有多态性高、稳定性好、易于操作推广、分布均匀等优点。筛选出的48对雪茄烟SSR引物可以直接利用,改变了通常使用SSR引物时耗时、费力、费钱的难点,大大提高了筛选效率,为以后雪茄烟资源遗传多样性分析、亲缘关系鉴定和育种工作提供有力技术支撑,对雪茄烟研究工作有重要意义。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
序列表
<110> 中国农业科学院烟草研究所
中国烟草总公司海南省公司海口雪茄研究所
<120> 一种用于雪茄烟草鉴定的引物对和试剂盒及应用
<160> 96
<170> SIPOSequenceListing 1.0
<210> 1
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 1
acccatttaa ttgccacgtc 20
<210> 2
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 2
tattccggca ggagtttgac 20
<210> 3
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 3
gaaccaatcc aagagccaga 20
<210> 4
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 4
tcagccaaat atgtagcagg tg 22
<210> 5
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 5
tccaaactct tatccctgat cc 22
<210> 6
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 6
cacctaccct gtcgctgttt 20
<210> 7
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 7
acatgcgtca gccaaataaa 20
<210> 8
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 8
tgtgactcgg aaagcatgac 20
<210> 9
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 9
atgcaaatgc aagatggtca 20
<210> 10
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 10
ccgttcaact tggctttacc 20
<210> 11
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 11
ctacgcagaa tccaattcca 20
<210> 12
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 12
cattaggcca tagccatcca 20
<210> 13
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 13
ttcctaccaa gcatgtaaag c 21
<210> 14
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 14
tttattcgtg tccgcatgtc 20
<210> 15
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 15
tggtctttgt tcaccaccaa 20
<210> 16
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 16
gctggttcca tcaattccat 20
<210> 17
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 17
caacacacac gctcatcaga 20
<210> 18
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 18
tcctcatcca tcggtaaagg 20
<210> 19
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 19
gctcagtcgt gaagaaacag aa 22
<210> 21
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 21
agggaatcct tggttggttt 20
<210> 21
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 21
gtgcccatac cagattgtga 20
<210> 22
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 22
attcttccaa cattcgcacc 20
<210> 23
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 23
ttggcatggt tgtgtaagga 20
<210> 24
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 24
gccacaagtt ataatttaaa gctacca 27
<210> 25
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 25
tgtgattcga acttgtgatc ct 22
<210> 26
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 26
catcagtgga aagcgactca 20
<210> 27
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 27
tcttagccgt ccatctctgc 20
<210> 28
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 28
cacaggacaa tttgttgcag tt 22
<210> 29
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 29
aacaacagcg gatcacattg 20
<210> 30
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 30
tgtatgcaac ccacagaaca a 21
<210> 31
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 31
catctcaact cgcctgacaa 20
<210> 32
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 32
gcggcagggt tctatgatta 20
<210> 33
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 33
caggagactc cataaattca ctctt 25
<210> 34
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 34
agcatggttg ctattggctg 20
<210> 35
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 35
ttgcataaga gtacccatct cg 22
<210> 36
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 36
tgtgtgtgtg aagcttgaag aa 22
<210> 37
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 37
accgacaaca cacgattgta 20
<210> 38
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 38
gcttgtcgct tagcttaacc at 22
<210> 39
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 39
cccttcgttc tacgaaccct 20
<210> 40
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 40
gggtgccacc tcactttct 19
<210> 41
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 41
agtttaatgt gggagcga 18
<210> 42
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 42
tcggtcggta ttagtggt 18
<210> 43
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 43
ggatctgctc atttcctatg g 21
<210> 44
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 44
caaggcagct aagcctaaca a 21
<210> 45
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 45
tttgcaatct ctaagcacca aa 22
<210> 46
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 46
aaagttacct cccttccacg a 21
<210> 47
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 47
ccaaagggtc agtctaggaa a 21
<210> 48
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 48
gttgggtttg agaagggaag 20
<210> 49
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 49
ccttggactc acaataccat ca 22
<210> 50
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 50
cctgttagcc aaagggtaat tc 22
<210> 51
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 51
gcaccaggtg aagtaaagac aa 22
<210> 52
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 52
tgaaatgcat gtaaaggaaa gg 22
<210> 53
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 53
gctctttagt ctttagggag ttgg 24
<210> 54
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 54
tgaattgagc tccttccagg 20
<210> 55
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 55
aatttgcact ctgcggactc 20
<210> 56
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 56
ccctgggagt ttccatttct 20
<210> 57
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 57
aaacctggaa agcaacatca 20
<210> 58
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 58
gaccacgttg tgtagttgta ttctt 25
<210> 59
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 59
gaacctaacc tcgctccaca 20
<210> 60
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 60
aaatggtagc tgcgaggaga 20
<210> 61
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 61
cgccattacg aacactagca 20
<210> 62
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 62
aagtttagtc cggtccggtt 20
<210> 63
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 63
tttgtaaatt gtgtgtatag aggagag 27
<210> 64
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 64
gcactggatc tcctgcattt 20
<210> 65
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 65
ttgtgaaccg aacagaaacg 20
<210> 66
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 66
ttcggttaga tttgatagga ggtt 24
<210> 67
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 67
atgtcgggaa gattccacag 20
<210> 68
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 68
acaaccagct aaatgtgccc 20
<210> 69
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 69
caaaccagcg catctgtcta 20
<210> 70
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 70
caccagaacc cgctagtctc 20
<210> 71
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 71
atcccaagca agttggtgtc 20
<210> 72
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 72
aacgagcatt atgggattgc 20
<210> 73
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 73
aattggaccc aaccactctg 20
<210> 74
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 74
tagcagggaa gccgaaagta 20
<210> 75
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 75
gggtctaaat aatcgcaatt gaa 23
<210> 76
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 76
cgcaggtgga cttaaagaat c 21
<210> 77
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 77
gcagaggcaa caatgcatac 20
<210> 78
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 78
agctcgttgc tgtttcatca 20
<210> 79
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 79
gggcaatgga gcaatagaaa 20
<210> 80
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 80
tgcttaaaga tttccactcg tt 22
<210> 81
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 81
tgattcccta acctgcgaac 20
<210> 82
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 82
ccattcttga gcttcgttct tt 22
<210> 83
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 83
gagttgtggc caagtagcct 20
<210> 84
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 84
ggctttagcc aaacgctcta 20
<210> 85
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 85
ttcataaatc aaccttaagt ggagc 25
<210> 86
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 86
tttggagctt gaaagcaaag a 21
<210> 87
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 87
cagagggtag tgaagtattc aattt 25
<210> 88
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 88
gttatcaatg ccctgccct 19
<210> 89
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 89
tcaacccata aagctgctcc 20
<210> 90
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 90
aaagagacaa agcaggcaca a 21
<210> 91
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 91
tgagaattca tataaccgac cca 23
<210> 92
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 92
tgccttcttt catactgcca 20
<210> 93
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 93
ccaagtagcg acgaggagaa 20
<210> 94
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 94
ttatccacgc gtcaccatta 20
<210> 95
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 95
tgggaagagt gctaccttag taca 24
<210> 96
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 96
gcgatgtact cctaaagatg tcaa 24