CN108192893A

CN108192893A - 基于转录组测序开发艾纳香ssr引物的方法

Info

Publication number: CN108192893A
Application number: CN201710774670.2A
Authority: CN
Inventors: 官玲亮; 庞玉新; 陈振夏; 于福来; 王凯; 谢小丽; 江芊
Original assignee: Tropical Crops Genetic Resources Institute CATAS
Current assignee: Tropical Crops Genetic Resources Institute CATAS
Priority date: 2017-08-31
Filing date: 2017-08-31
Publication date: 2018-06-22
Anticipated expiration: 2037-08-31
Also published as: CN108192893B

Abstract

本发明提供一种基于转录组测序开发艾纳香SSR引物的方法：获得艾纳香基因组转录的集合，形成序列数据库；用Trinity将测序序列拼接成一个转录组，取每条基因中最长的转录本作为Unigene；Unigene序列生物信息学分析；采用MISA1.0对Unigene进行SSR检测；用Primer3进行SSR引物设计，进行SSR引物多态性鉴定。本发明成功设计17979对SSR引物，筛选与活性成分代谢途径相关的30对引物，对不同来源地的9份艾纳香DNA进行验证，其中多态性引物共有27对，利用这27对SSR引物可以区分不同地理来源的艾纳香植物材料。本发明为艾纳香SSR引物开发提供了新思路。

Description

基于转录组测序开发艾纳香SSR引物的方法

技术领域

本发明涉及分子生物学及生物信息学，具体的说，涉及一种艾纳香SSR引物对、一种艾纳香SSR引物组、以及基于转录组测序开发艾纳香SSR引物的方法。

背景技术

艾纳香(Blumea balsamifera(L.)DC.)又名大风艾，为菊科多年生草本植物，在我国广泛分布于海南、贵州、广西、于南等省区。艾纳香叶片除含挥发油(主要为左旋龙脑，l-borneol)，用作精制天然冰片(艾片)外，还含有其它多种活性成分，如黄酮类(主要为艾纳香素和二氢黄酮类等)、倍半萜等。具有抑菌、杀虫、抗氧化、抗酪氨酸酶及抗肿瘤等多种药理活性。艾纳香油(挥发油类)已被成功应用于“金喉健喷雾剂”、“咽立爽滴丸”等中成药品种。艾纳香作为传统民间草药，在我国黎族和苗族地区以及东南亚各国被用作创伤修复、妇女产后洗液等。以艾纳香提取物为功效成分的艾纳香系列药妆品已在海南、贵州等地开发上市。因此，艾纳香在医药、化妆品等行业的应用极为广泛。

艾纳香地上部分生物量较大，亩产约4000公斤。但由于药用成分含量偏低，如鲜叶提取艾粉的产量不足10mg/g。如何提高和稳定药材有效成分含量成为艾纳香产业健康发展的技术瓶颈。药用植物化学成分的合成与积累受遗传、生态环境以及加工炮制工艺等多种因素影响，其中，优良的遗传基因是优质药材形成的内在基础。通过药用植物优良品种选育，从遗传基础上进行药材质量改良，是提高人工栽培药材质量的根本有效措施。但目前艾纳香栽培产区种质混杂，所产药材中药用成分含量差异悬殊，使药材质量难于控制。而通过优良品种选育能从遗传上对种质进行改良，培育经济性状整齐、遗传稳定，纯度一致的优良品种，这对于提高和稳定艾纳香药材质量具有重要意义。然而目前关于分子标记辅助育种在艾纳香中的应用尚未见报道。

分子标记是以个体间遗传物质内核苷酸序列变异为基础的遗传标记，能在DNA水平上反映植物遗传基础的差异，是DNA水平遗传多态性的直接体现。简单重复序列(SSR)广泛分布于各类真核生物基因组的不同位置，由于SSR的重复次数不同和重复程度不同，时期呈现高度的多态性。SSR标记可分为基因组SSR(gSSR)和表达序列标签SSR(EST-SSR)，EST-SSR标记源于基因的转录区，与gSSR标记相比，其多态性可能与基因功能直接相关，因此比gSSR标记具有更高通用性，更经济，更高效率。利用第二代测序技术可以对全基因组范围内的转录本进行大规模的高通量测序，并能产生较之EST测序更为海量的转录组数据，这位功能基因组SSR标记的开发提供了更丰富和极有价值的可利用资源。

目前艾纳香尚无全基因序列信息，艾纳香SSR引物数量较少。对于无参考基因组的转录组分析，可先将测序所得的序列拼接成转录本，以转录本为参考序列，进行后续分析。利用第二代高通量测序技术获得艾纳香的转录组序列信息，批量开发SSR引物的技术成熟，将会对艾纳香重要性状基因的定位、克隆及分子标记辅助选择育种和比较基因组学研究等起到重要推动作用。

发明内容

本发明的目的在于克服现有技术中的不足，提供一种艾纳香SSR引物对、一种艾纳香SSR引物组、以及一种基于转录组测序开发艾纳香SSR引物的方法。

本发明的第一个方面是提供一种艾纳香SSR引物对，所述艾纳香SSR引物对的序列如SEQ ID No.1-2所示、如SEQ ID No.3-4所示、如SEQ ID No.5-6所示、如SEQ ID No.7-8所示、如SEQ ID No.9-10所示、如SEQ ID No.11-12所示、如SEQ ID No.13-14所示、如SEQ IDNo.15-16所示、如SEQ ID No.17-18所示、如SEQ ID No.19-20所示、如SEQ ID No.21-22所示、如SEQ ID No.23-24所示、如SEQ ID No.25-26所示、如SEQ ID No.27-28所示、如SEQ IDNo.29-30所示、如SEQ ID No.31-32所示、如SEQ ID No.33-34所示、如SEQ ID No.35-36所示、如SEQ ID No.37-38所示、如SEQ ID No.39-40所示、如SEQ ID No.41-42所示、如SEQ IDNo.43-44所示、如SEQ ID No.45-46所示、如SEQ ID No.47-48所示、如SEQ ID No.49-50所示、如SEQ ID No.51-52所示、或如SEQ ID No.53-54所示。

本发明的第二个方面是提供一种艾纳香SSR引物组，所述艾纳香SSR引物组由以下引物对中的两种或两种以上组成：如SEQ ID No.1-2所述引物对、如SEQ ID No.3-4所述引物对、如SEQ ID No.5-6所述引物对、如SEQ ID No.7-8所述引物对、如SEQ ID No.9-10所述引物对、如SEQ ID No.11-12所述引物对、如SEQ ID No.13-14所述引物对、如SEQ IDNo.15-16所述引物对、如SEQ ID No.17-18所述引物对、如SEQ ID No.19-20所述引物对、如SEQ ID No.21-22所述引物对、如SEQ ID No.23-24所述引物对、如SEQ ID No.25-26所述引物对、如SEQ ID No.27-28所述引物对、如SEQ ID No.29-30所述引物对、如SEQ ID No.31-32所述引物对、如SEQ ID No.33-34所述引物对、如SEQ ID No.35-36所述引物对、如SEQ IDNo.37-38所述引物对、如SEQ ID No.39-40所述引物对、如SEQ ID No.41-42所述引物对、如SEQ ID No.43-44所述引物对、如SEQ ID No.45-46所述引物对、如SEQ ID No.47-48所述引物对、如SEQ ID No.49-50所述引物对、如SEQ ID No.51-52所述引物对、和如SEQ IDNo.53-54所述引物对。

优选地，所述艾纳香SSR引物组由以下引物对组成：如SEQ ID No.1-2所述引物对、如SEQ ID No.3-4所述引物对、如SEQ ID No.5-6所述引物对、如SEQ ID No.7-8所述引物对、如SEQ ID No.9-10所述引物对、如SEQ ID No.11-12所述引物对、如SEQ ID No.13-14所述引物对、如SEQ ID No.15-16所述引物对、如SEQ ID No.17-18所述引物对、如SEQ IDNo.19-20所述引物对、如SEQ ID No.21-22所述引物对、如SEQ ID No.23-24所述引物对、如SEQ ID No.25-26所述引物对、如SEQ ID No.27-28所述引物对、如SEQ ID No.29-30所述引物对、如SEQ ID No.31-32所述引物对、如SEQ ID No.33-34所述引物对、如SEQ ID No.35-36所述引物对、如SEQ ID No.37-38所述引物对、如SEQ ID No.39-40所述引物对、如SEQ IDNo.41-42所述引物对、如SEQ ID No.43-44所述引物对、如SEQ ID No.45-46所述引物对、如SEQ ID No.47-48所述引物对、如SEQ ID No.49-50所述引物对、如SEQ ID No.51-52所述引物对、和如SEQ ID No.53-54所述引物对。

本发明的第三个方面是提供如本发明第一个方面所述艾纳香SSR引物对、或者如本发明第二个方面所述的艾纳香SSR引物组在区分不同地理来源的艾纳香植物材料中的应用。

本发明的第四个方面是提供如本发明第一个方面所述艾纳香SSR引物对、或者如本发明第二个方面所述的艾纳香SSR引物组在艾纳香分子标记辅助育种中的应用。

本发明的第五个方面是提供一种基于转录组测序开发艾纳香SSR引物对的方法，包括以下步骤：

(1)提取艾纳香的总RNA，分离出3’端带有polyA的mRNA，随机打断mRNA，回收200-700bp片段，反转录并合成双链cDAN；(2)对(1)获得的序列进行测序；(3)将测序结果进行拼接与组装成一个完整的转录组，取每条基因中最长的转录本作为Unigene，并对Unigene序列进行生物信息学分析；(4)采用软件MISA1.0对上述Unigene进行SSR检测；(5)采用软件Primer3进行SSR引物设计，并鉴定SSR引物的多态性。

其中，步骤(3)中所述生物信息学分析包括但不限于基因注释、CDS预测和差异表达基因筛选。

其中，所述基因注释包括基因表达量注释和/或基因功能注释。

其中，所述差异表达基因筛选包括GO功能显著性富集分析和/或PathwayZ显著性富集分析。

其中，步骤(5)中进行SSR引物设计使用的参数为：引物长度18-22bp，T_m55-65℃，产物大小100-300bp。

在一个具体的实施方式中，基于转录组序列开发艾纳香SSR引物的方法，包括如下步骤：

(1)转录组数据的获得

提取艾纳香总RNA，以5ug total RNA起始量建库；磁珠法分离mRNA后，离子打断mRNA(Truseq^TM RNA sample prep Kit)；回收200-700bp片段，反转录并双链cDNA合成、补平、3’端加A、连接index接头(Truseq^TM RNA sample prep Kit)；文库富集，PCR扩增15个cycles；2％琼脂糖胶回收目的条带(Certified Low Range Ultra Agarose)；TBS380(Picogreen)定量，按数据比例混合上机；cBot上进行桥式PCR扩增，生成clusters；Hiseq2000测序平台，进行2*100bp测序。

(2)原始数据处理及生物信息学分析

Illumina Hiseq 2000测序得到的原始图像数据经过Base Calling转化为序列数据，结果文件以FASTQ文件格式来存储。得到原始测序数据后，先对测序结果进行统计和评估，再根据接头信息去除那些有接头污染的序列。得到原始的FASTQ数据后，对其进行质控得到高质量的测序结果(clean data)。将质控后得到的高质量序列进行de novo拼接。

转录本的丰度体现基因的表达水平，转录本丰度越高，则基因表达水平越高。在RNA-seq分析中，将测序得到的reads与前面所得的拼接结果进行比对(mapping)。通过对定位到基因组区域的测序序列(clean reads)的数量来估计基因的表达水平，使用Trinity软件对拼接结果进行ORF预测。采用GO数据库和COG数据库对基因的功能进行分类，基于KEGG数据库，运用BLAST算法(blastx/blastp 2.2.24+)将所有基因与KEGG的基因数据库(GENES)进行比对，根据比对得到的KO编号去查找具体的生物学通路，提供所分析基因可能参与的所有生物学通路。

(3)SSR序列的识别

首先安装Perl语言，从http://pgrc.Lpk-gatersleben.de/misa网站下载est-trimmer.pl，去除转录组序列中过短的序列和过长的序列；从http://www.bioinformatics,org/cd-hit/中下载CD-HIT软件，去除冗余序列。

从http:pgrc.lpk-gatersleben.de/misa网站下载使用MISA软件以识别和定位序列中SSR，参数设置如下：单核苷酸、二核苷酸、三核苷酸、四核苷酸、五核苷酸和六核苷酸的重复次数至少为10、6、5、3、3、3。

(4)SSR引物的设计

使用Primer3批量设计SSR引物，网址：http://sourceforge.net/projects/primer3/files/primer3/1.1.4/primer3-1.1.4-WINXP.zip/download,引物设计参数为引物长度18-22bp,Tm55-65℃。其中前后引物Tm值相差4℃，产物大小为100-300bp.

(5)SSR引物对来源于不同地方的9份艾纳香DNA的多态性鉴定

从所开发的17979对SSR引物中随机选取30对引物进行PCR扩增，采用8％非变性聚丙烯酰胺凝胶电泳检测。

本发明成功设计了17979对SSR引物，从中筛选出30对引物对来源地不同的艾纳香材料DNA进行验证，其在100-300bp检测到清晰条带，表明引物设计成功率高，其中多态的引物共有27对，利用者27对SSR引物可以区分不同地理来源的艾纳香植物材料。本发明方法方便、快捷、准确且成本低廉，为艾纳香SSR引物开发提供了新思路。

附图说明

图1为本发明建库测序流程示意图。

图2为本发明RNA-seq数据分析流程示意图。

图3为本发明得到的Unigene长度分布图：横坐标表示拼接好的isogene长度范围，纵坐标表示对应该长度范围的isogene数量。

图4为本发明中部分SSR重复基元类型和数量：该图展示了每一种SSR的数量，图中阴影条表示长度大于或等于15bp的SSR，空白条表示小于15bp的SSR数量，每一个柱条表示一种类型的SSR。

图5为本发明中利用部分SSR引物对来源于不同地区的9份艾纳香DNA进行多态性验证的结果。

图中，A为贵州材料，B为海南材料；C为贵州材料；D为海南材料；E为水，对照，M为marker。

具体实施方式

以下实施例用于说明本发明，但不用来限制本发明的范围。若未特别指明，实施例均按照常规实施条件进行。以下实施例中所用的试验材料，如无特殊说明，均从常规生化试剂厂商购买得到。

试剂仪器表

表1所使用的试剂和仪器表

实施例1 RNA-seq分析及SSR引物的设计

1.RNA-seq分析样品处理及测序流程见图1。具体方法如下：

艾纳香总RNA的提取，真核生物以5ug total RNA起始量建库；

磁珠法分离mRNA后，离子打断mRNA(Truseq^TM RNA sample prep Kit)；

回收200-700bp片段，反转录并双链cDNA合成、补平、3’端加A、连接index接头(Truseq^TM RNA sample prep Kit)；

文库富集，PCR扩增15个cycles；

2％琼脂糖胶回收目的条带(Certified Low Range Ultra Agarose)；

TBS380(Picogreen)定量，按数据比例混合上机；

cBot上进行桥式PCR扩增，生成clusters；

Hiseq2000测序平台，进行2*100bp测序。

2.数据分析

数据分析流程图见图2。

(1)原始测序数据统计

Illumina Hiseq 2000测序得到的原始图像数据经过Base Calling转化为序列数据，结果文件以FASTQ文件格式来存储。FASTQ格式文件包含测序reads的序列信息以及reads的测序质量信息。测序数据随机截取结果如下所示：

@HWI-ST531R:144:D11RDACXX:4:1101:1212:1946 1:N:0:ATTCCT

ATNATGACTCAAGCGCTTCCTCAGTTTAATGAAGCTAACTTCAATGCTGAGATCGTTGA

+HWI-ST531R:144:D11RDACXX:4:1101:1212:1946 1:N:0:ATTCCT

？A#AFFDFFHGFFHJJGIJJJIICHIIIIJJGGHIIJJIIJIIJIHGI@FEHIIJBFFHGJJIIHHHDFFFFDCC

每条read包含4行信息，其中第一行和第三行分别由文件识别标志和读段名(ID)组成(第一行以“@”开头而第三行以“+”开头；第三行中ID可以省略，但“+”不能省略)，第二行为碱基序列，第四行是第二行中每个碱基所对应的测序质量值。

(2)原始测序数据质控

Illumina测序属于第二代测序技术，单次运行能产生数十亿级的reads，如此海量的数据无法逐个展示每条read的质量情况；生物信息分析运用统计学的方法，对所有测序reads的每个circle进行碱基分布和质量波动的统计，可以从宏观上直观地反映出样本的测序质量和文库构建质量。

得到原始测序数据后，先对测序结果进行统计和评估，再根据接头信息去除那些有接头污染的序列。

(3)原始数据去杂

得到原始的FASTQ数据后，对其进行质控得到高质量的测序结果(clean data)。质控步骤如下：首先去除reads中的adaptor序列；接着去除测序质量较低的reads(质量值小于20)；然后去除含N较多的reads；最后去除经过以上步骤后长度小于20nt的小片段。

使用软件：SeqPrep(https://github.com/jstjohn/SeqPrep)

Sickle(https://github.com/najoshi/sickle)

(4)拼接及拼接结果统计

将质控后得到的高质量序列进行de novo拼接。使用软件：Trinity(http://trinityrnaseq.sourceforge.net/)

(5)与拼接结果比对

转录本的丰度体现基因的表达水平，转录本丰度越高，则基因表达水平越高。在分析中，将测序得到的reads与前面所得的拼接结果进行比对(mapping)。

使用软件：bowtie(http://bowtie-bio.sourceforge.net/index.shtml)

(6)表达量统计及表达差异分析

转录本的丰度体现基因的表达水平，转录本丰度越高，则基因表达水平越高。在RNA-seq分析中，通过对定位到基因组区域的测序序列(clean reads)的数量来估计基因的表达水平。依据所有样本不参考基因组比对的结果，计算每个基因/转录本在样本中的FPKM值，以该值作为基因/转录本在样本中的表达量。最终对所有基因/转录本在各组样本中的表达进行差异显著性分析，找出相对差异表达的基因/转录本，并对其进行可视化分析。显著差异表达基因/转录本筛选条件：FDR<0.05&&|log2FC|>＝2。

使用软件：RSEM(http://deweylab.biostat.wisc.edu/rsem/)

edgeR(http://www.bioconductor.org/packages/release/bioc/html/edgeR.html)

(7)拼接结果注释：

基因预测：对拼接结果进行ORF预测。使用软件：Trinity(http://trinityrnaseq.sourceforge.net/analysis/extract_proteins_from_trinity_transcripts.html)

功能注释：将预测出ORF的蛋白序列与未预测出ORF的核苷酸序列分别注释，将预测出ORF的蛋白序列使用blastp分别与NR、string、gene数据库进行比对，剩余未预测出ORF的序列使用blastx分别与NR、string、gene数据库比对。使用软件：BLAST(BLAST Version2.2.25)，BLAST比对参数设置期望值E value为1e-5。

(8)基因功能分类

GO分类：GO(Gene Ontology,http://www.geneontology.org/)是基因本体论联合会建立的数据库，标准化不同数据库中的关于基因和基因产物的生物学术语，对基因和蛋白功能进行限定和描述。利用GO数据库，可以按照基因参与的生物学过程、构成细胞的组分、实现的分子功能等进行分类。因此GO注释有劣于我们理解基因背后所代表的生物学意义。GO注释包括3方面：

细胞成分(Cellular component)(GO:0005575)：细胞的一部分或者其细胞外环境(the parts of a cell or its extracellular environment)，例如细胞核(such asnucleus)(GO:0005634),核糖体(ribosome)(GO:0005840)；

分子功能(Molecular function)(GO:0003674)：基因产物在分子水平上的基本活动(the elemental activities of a gene product at the molecular level)，如结合(such as binding)(GO:0005488)，催化(catalysis)(GO:0043364)；

生物过程(Biological process)(GO:0008150)：具有明确的开始和结束的、与完整的生命单元的功能有关的分子事件活动或集合：细胞、组织、器官和有机体(operationsor sets of molecular events with a defined beginning and end,pertinent to thefunctioning of integrated living units:cells,tissues,organs,and organisms)，如细胞生理过程(such as cellular physiological process)(GO:0009987)，信号转导(signal transduction)(GO:0007165)。

使用软件：blast2go(http://www.blast2go.com/b2ghome)

COG分类：COG(同源蛋白质簇，Clusters of Orthologous Groups of proteins，http://www.ncbi.nlm.nih.gov/COG/)为蛋白直系同源簇数据库，是选取66株已完成的基因组的蛋白质序列，根据系统进化关系分类构建而成。与COG数据库比对可以进行功能注释、归类以及蛋白进化分析。通过采用blastp与string数据库比对，得到基因对应的COGnumber，幵根据COG number进行功能归类，分析所用软件及数据库如下：使用软件：blastx2.2.24+

比对数据库：STRING 9.0(http://string-db.org/)

代谢通路分析

在生物体内，基因产物并不是孤立存在地作用的，不同基因产物之间通过有序的相互协调来行使其具体的生物学功能。因此，KEGG数据库中丰富的通路信息将有助于我们从系统水平去了解基因的生物学功能，例如代谢途径、遗传信息传递以及细胞过程等一些复杂的生物功能，这大大提高了该数据库在实际生产和应用中的价值。基于KEGG数据库，运用BLAST算法(blastx/blastp 2.2.24+)将所有基因与KEGG的基因数据库(GENES)进行比对，根据比对得到的KO编号去查找具体的生物学通路，提供所分析基因可能参与的所有生物学通路。

使用软件：blastx/blastp 2.2.24+

比对数据库：genes(http://www.genome.jp/kegg/genes.html)

RNA-seq分析结果

通过RNA-seq技术获得了艾纳香苗期和花期的cDNA序列信息，共得到了48197273个序列信息，100341条Unigene；包含RNA-seq名称、序列长度及表达数、COG预测、COG功能注释、KEGG注释、KEGG-pathway、GO注释的共60477条信息；以及包括对获得的序列信息进行CDS核酸序列预测的蛋白功能注释共37283条信息。

实施例2艾纳香高通量SSR位点的发掘

SSR位点的识别

首先安装Perl语言，从http://pgrc.Lpk-gatersleben.de/misa网站下载est-trimmer.pl，去除转录组序列中过短的序列和过长的序列；从http://www.bioinformatics，org/cd-hit/中下载CD-HIT软件，去除冗余序列。

SSR引物的设计

使用Primer3批量设计SSR引物，网址：http://sourceforge.net/projects/primer3/files/primer3/1.1.4/primer3-1.1.4-WINXP.zip/download,引物设计参数为引物长度18-22bp，T_m55-65℃。其中前后引物Tm值相差4℃，产物大小为100-300bp。应用本方法成功设计了17979对SSR引物，SSR密度分布出现频率最高的单碱基微卫星，所占比例最高是A/T，其次是四核苷酸，如图4所示。

实施例3利用SSR引物对来源于不同地方的艾纳香DNA进行多态性鉴定

提取9份艾纳香DNA，用0.8％琼脂糖凝胶电泳法去检测质量，将DNA浓度稀释至50ng/ul，置于-20℃保存备用。利用引物开发所用材料的DAN进行引物设计成功率PCR鉴定。PCR反应总体积为25μl，1.5mmol/L MgCl₂，4种dNTP各100μmol/L，引物各80ng，1.5U Taqplus DNA polymerase(高保真)，50ng DNA。反应程序为：95℃预变性5min,95℃变性30s，51-60℃退火45s，72℃延伸45s，进行32-35个循环，最后72℃延伸5min。反应结束后，产物加入2ul加样缓冲液，以100bp DNA ladder为DNA分子量标准，采用8％的非变性聚丙烯酰胺凝胶进行电泳，电泳缓冲液位0.5 x TBE，200V稳压电泳2-2.5h，至加样缓冲液移到凝胶底部时电泳结束。电泳结束后，采用银染法染色，最后将凝胶至于凝胶系统上拍照。所有数据重复两次。

选取的30对引物对9份艾纳香材料DNA进行验证，其中一份材料的电泳图如图5所示。结果表明，具有多态性条带的引物共有27对(表2)，表明这27对引物可以用来区分不同地理来源的艾纳香材料。其余8份材料DNA验证，也同样可以区分不同地理来源的艾纳香材料。表明利用此艾纳香转录组开发SSR引物的方法，适用于艾纳香SSR引物开发。

序列说明：

27对SSR引物的名称，序列、退火温度及扩增产物大小如表2所示。

表2所筛选到的SSR引物序列、重复基元、重复次数及退火温度。

以上对本发明的具体实施例进行了详细描述，但其只是作为范例，本发明并不限制于以上描述的具体实施例。对于本领域技术人员而言，任何对本发明进行的等同修改和替代也都在本发明的范畴之中。因此，在不脱离本发明的精神和范围下所作的均等变换和修改，都应涵盖在本发明的范围内。

Claims

1.一种艾纳香SSR引物对，其特征在于，所述艾纳香SSR引物对的序列如SEQ ID No.1-2所示、如SEQ ID No.3-4所示、如SEQ ID No.5-6所示、如SEQ ID No.7-8所示、如SEQ IDNo.9-10所示、如SEQ ID No.11-12所示、如SEQ ID No.13-14所示、如SEQ ID No.15-16所示、如SEQ ID No.17-18所示、如SEQ ID No.19-20所示、如SEQ ID No.21-22所示、如SEQ IDNo.23-24所示、如SEQ ID No.25-26所示、如SEQ ID No.27-28所示、如SEQ ID No.29-30所示、如SEQ ID No.31-32所示、如SEQ ID No.33-34所示、如SEQ ID No.35-36所示、如SEQ IDNo.37-38所示、如SEQ ID No.39-40所示、如SEQ ID No.41-42所示、如SEQ ID No.43-44所示、如SEQ ID No.45-46所示、如SEQ ID No.47-48所示、如SEQ ID No.49-50所示、如SEQ IDNo.51-52所示、或如SEQ ID No.53-54所示。

2.一种艾纳香SSR引物组，其特征在于，所述艾纳香SSR引物组由以下引物对中的两种或两种以上组成：如SEQ ID No.1-2所述引物对、如SEQ ID No.3-4所述引物对、如SEQ IDNo.5-6所述引物对、如SEQ ID No.7-8所述引物对、如SEQ ID No.9-10所述引物对、如SEQID No.11-12所述引物对、如SEQ ID No.13-14所述引物对、如SEQ ID No.15-16所述引物对、如SEQ ID No.17-18所述引物对、如SEQ ID No.19-20所述引物对、如SEQ ID No.21-22所述引物对、如SEQ ID No.23-24所述引物对、如SEQ ID No.25-26所述引物对、如SEQ IDNo.27-28所述引物对、如SEQ ID No.29-30所述引物对、如SEQ ID No.31-32所述引物对、如SEQ ID No.33-34所述引物对、如SEQ ID No.35-36所述引物对、如SEQ ID No.37-38所述引物对、如SEQ ID No.39-40所述引物对、如SEQ ID No.41-42所述引物对、如SEQ ID No.43-44所述引物对、如SEQ ID No.45-46所述引物对、如SEQ ID No.47-48所述引物对、如SEQ IDNo.49-50所述引物对、如SEQ ID No.51-52所述引物对、和如SEQ ID No.53-54所述引物对。

3.根据权利要求2所述的艾纳香SSR引物组，其特征在于，所述艾纳香SSR引物组由以下引物对组成：如SEQ ID No.1-2所述引物对、如SEQ ID No.3-4所述引物对、如SEQ ID No.5-6所述引物对、如SEQ ID No.7-8所述引物对、如SEQ ID No.9-10所述引物对、如SEQ IDNo.11-12所述引物对、如SEQ ID No.13-14所述引物对、如SEQ ID No.15-16所述引物对、如SEQ ID No.17-18所述引物对、如SEQ ID No.19-20所述引物对、如SEQ ID No.21-22所述引物对、如SEQ ID No.23-24所述引物对、如SEQ ID No.25-26所述引物对、如SEQ ID No.27-28所述引物对、如SEQ ID No.29-30所述引物对、如SEQ ID No.31-32所述引物对、如SEQ IDNo.33-34所述引物对、如SEQ ID No.35-36所述引物对、如SEQ ID No.37-38所述引物对、如SEQ ID No.39-40所述引物对、如SEQ ID No.41-42所述引物对、如SEQ ID No.43-44所述引物对、如SEQ ID No.45-46所述引物对、如SEQ ID No.47-48所述引物对、如SEQ ID No.49-50所述引物对、如SEQ ID No.51-52所述引物对、和如SEQ ID No.53-54所述引物对。

4.如权利要求1所述艾纳香SSR引物对、或者如权利要求2或3所述的艾纳香SSR引物组在区分不同地理来源的艾纳香植物材料中的应用。

5.如权利要求1所述艾纳香SSR引物对、或者如权利要求2或3所述的艾纳香SSR引物组在艾纳香分子标记辅助育种中的应用。

6.一种基于转录组测序开发艾纳香SSR引物对的方法，其特征在于，包括以下步骤：

(1)提取艾纳香的总RNA，分离出3’端带有polyA的mRNA，随机打断mRNA，回收200-700bp片段，反转录并合成双链cDAN；

(2)对(1)获得的序列进行测序；

(3)将测序结果进行拼接与组装成一个完整的转录组，取每条基因中最长的转录本作为Unigene，并对Unigene序列进行生物信息学分析；

(4)采用软件MISA1.0对上述Unigene进行SSR检测；

(5)采用软件Primer3进行SSR引物设计，并鉴定SSR引物的多态性。

7.根据权利要求6所述的方法，其特征在于，步骤(3)中所述生物信息学分析包括基因注释、CDS预测和差异表达基因筛选。

8.根据权利要求7所述的方法，其特征在于，所述基因注释包括基因表达量注释和/或基因功能注释；所述差异表达基因筛选包括GO功能显著性富集分析和/或PathwayZ显著性富集分析。

9.根据权利要求6所述的方法，其特征在于，步骤(5)中进行SSR引物设计使用的参数为：引物长度18-22bp，T_m55-65℃，产物大小100-300bp。