CN108192893B - 基于转录组测序开发艾纳香ssr引物的方法 - Google Patents

基于转录组测序开发艾纳香ssr引物的方法 Download PDF

Info

Publication number
CN108192893B
CN108192893B CN201710774670.2A CN201710774670A CN108192893B CN 108192893 B CN108192893 B CN 108192893B CN 201710774670 A CN201710774670 A CN 201710774670A CN 108192893 B CN108192893 B CN 108192893B
Authority
CN
China
Prior art keywords
ssr
blumea balsamifera
seq
primers
nos
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710774670.2A
Other languages
English (en)
Other versions
CN108192893A (zh
Inventor
官玲亮
庞玉新
陈振夏
于福来
王凯
谢小丽
江芊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tropical Crops Genetic Resources Institute CATAS
Original Assignee
Tropical Crops Genetic Resources Institute CATAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tropical Crops Genetic Resources Institute CATAS filed Critical Tropical Crops Genetic Resources Institute CATAS
Priority to CN201710774670.2A priority Critical patent/CN108192893B/zh
Publication of CN108192893A publication Critical patent/CN108192893A/zh
Application granted granted Critical
Publication of CN108192893B publication Critical patent/CN108192893B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • C12Q1/6895Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for plants, fungi or algae
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Botany (AREA)
  • Mycology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明提供一种基于转录组测序开发艾纳香SSR引物的方法:获得艾纳香基因组转录的集合,形成序列数据库;用Trinity将测序序列拼接成一个转录组,取每条基因中最长的转录本作为Unigene;Unigene序列生物信息学分析;采用MISA1.0对Unigene进行SSR检测;用Primer3进行SSR引物设计,进行SSR引物多态性鉴定。本发明成功设计17979对SSR引物,筛选与活性成分代谢途径相关的30对引物,对不同来源地的9份艾纳香DNA进行验证,其中多态性引物共有27对,利用这27对SSR引物可以区分不同地理来源的艾纳香植物材料。本发明为艾纳香SSR引物开发提供了新思路。

Description

基于转录组测序开发艾纳香SSR引物的方法
技术领域
本发明涉及分子生物学及生物信息学,具体的说,涉及一种艾纳香SSR引物对、一种艾纳香SSR引物组、以及基于转录组测序开发艾纳香SSR引物的方法。
背景技术
艾纳香(Blumea balsamifera(L.)DC.)又名大风艾,为菊科多年生草本植物,在我国广泛分布于海南、贵州、广西、于南等省区。艾纳香叶片除含挥发油(主要为左旋龙脑,l-borneol),用作精制天然冰片(艾片)外,还含有其它多种活性成分,如黄酮类(主要为艾纳香素和二氢黄酮类等)、倍半萜等。具有抑菌、杀虫、抗氧化、抗酪氨酸酶及抗肿瘤等多种药理活性。艾纳香油(挥发油类)已被成功应用于“金喉健喷雾剂”、“咽立爽滴丸”等中成药品种。艾纳香作为传统民间草药,在我国黎族和苗族地区以及东南亚各国被用作创伤修复、妇女产后洗液等。以艾纳香提取物为功效成分的艾纳香系列药妆品已在海南、贵州等地开发上市。因此,艾纳香在医药、化妆品等行业的应用极为广泛。
艾纳香地上部分生物量较大,亩产约4000公斤。但由于药用成分含量偏低,如鲜叶提取艾粉的产量不足10mg/g。如何提高和稳定药材有效成分含量成为艾纳香产业健康发展的技术瓶颈。药用植物化学成分的合成与积累受遗传、生态环境以及加工炮制工艺等多种因素影响,其中,优良的遗传基因是优质药材形成的内在基础。通过药用植物优良品种选育,从遗传基础上进行药材质量改良,是提高人工栽培药材质量的根本有效措施。但目前艾纳香栽培产区种质混杂,所产药材中药用成分含量差异悬殊,使药材质量难于控制。而通过优良品种选育能从遗传上对种质进行改良,培育经济性状整齐、遗传稳定,纯度一致的优良品种,这对于提高和稳定艾纳香药材质量具有重要意义。然而目前关于分子标记辅助育种在艾纳香中的应用尚未见报道。
分子标记是以个体间遗传物质内核苷酸序列变异为基础的遗传标记,能在DNA水平上反映植物遗传基础的差异,是DNA水平遗传多态性的直接体现。简单重复序列(SSR)广泛分布于各类真核生物基因组的不同位置,由于SSR的重复次数不同和重复程度不同,时期呈现高度的多态性。SSR标记可分为基因组SSR(gSSR)和表达序列标签SSR(EST-SSR),EST-SSR标记源于基因的转录区,与gSSR标记相比,其多态性可能与基因功能直接相关,因此比gSSR标记具有更高通用性,更经济,更高效率。利用第二代测序技术可以对全基因组范围内的转录本进行大规模的高通量测序,并能产生较之EST测序更为海量的转录组数据,这位功能基因组SSR标记的开发提供了更丰富和极有价值的可利用资源。
目前艾纳香尚无全基因序列信息,艾纳香SSR引物数量较少。对于无参考基因组的转录组分析,可先将测序所得的序列拼接成转录本,以转录本为参考序列,进行后续分析。利用第二代高通量测序技术获得艾纳香的转录组序列信息,批量开发SSR引物的技术成熟,将会对艾纳香重要性状基因的定位、克隆及分子标记辅助选择育种和比较基因组学研究等起到重要推动作用。
发明内容
本发明的目的在于克服现有技术中的不足,提供一种艾纳香SSR引物对、一种艾纳香SSR引物组、以及一种基于转录组测序开发艾纳香SSR引物的方法。
本发明的第一个方面是提供一种艾纳香SSR引物对,所述艾纳香SSR引物对的序列如SEQ ID No.1-2所示、如SEQ ID No.3-4所示、如SEQ ID No.5-6所示、如SEQ ID No.7-8所示、如SEQ ID No.9-10所示、如SEQ ID No.11-12所示、如SEQ ID No.13-14所示、如SEQ IDNo.15-16所示、如SEQ ID No.17-18所示、如SEQ ID No.19-20所示、如SEQ ID No.21-22所示、如SEQ ID No.23-24所示、如SEQ ID No.25-26所示、如SEQ ID No.27-28所示、如SEQ IDNo.29-30所示、如SEQ ID No.31-32所示、如SEQ ID No.33-34所示、如SEQ ID No.35-36所示、如SEQ ID No.37-38所示、如SEQ ID No.39-40所示、如SEQ ID No.41-42所示、如SEQ IDNo.43-44所示、如SEQ ID No.45-46所示、如SEQ ID No.47-48所示、如SEQ ID No.49-50所示、如SEQ ID No.51-52所示、或如SEQ ID No.53-54所示。
本发明的第二个方面是提供一种艾纳香SSR引物组,所述艾纳香SSR引物组由以下引物对中的两种或两种以上组成:如SEQ ID No.1-2所述引物对、如SEQ ID No.3-4所述引物对、如SEQ ID No.5-6所述引物对、如SEQ ID No.7-8所述引物对、如SEQ ID No.9-10所述引物对、如SEQ ID No.11-12所述引物对、如SEQ ID No.13-14所述引物对、如SEQ IDNo.15-16所述引物对、如SEQ ID No.17-18所述引物对、如SEQ ID No.19-20所述引物对、如SEQ ID No.21-22所述引物对、如SEQ ID No.23-24所述引物对、如SEQ ID No.25-26所述引物对、如SEQ ID No.27-28所述引物对、如SEQ ID No.29-30所述引物对、如SEQ ID No.31-32所述引物对、如SEQ ID No.33-34所述引物对、如SEQ ID No.35-36所述引物对、如SEQ IDNo.37-38所述引物对、如SEQ ID No.39-40所述引物对、如SEQ ID No.41-42所述引物对、如SEQ ID No.43-44所述引物对、如SEQ ID No.45-46所述引物对、如SEQ ID No.47-48所述引物对、如SEQ ID No.49-50所述引物对、如SEQ ID No.51-52所述引物对、和如SEQ IDNo.53-54所述引物对。
优选地,所述艾纳香SSR引物组由以下引物对组成:如SEQ ID No.1-2所述引物对、如SEQ ID No.3-4所述引物对、如SEQ ID No.5-6所述引物对、如SEQ ID No.7-8所述引物对、如SEQ ID No.9-10所述引物对、如SEQ ID No.11-12所述引物对、如SEQ ID No.13-14所述引物对、如SEQ ID No.15-16所述引物对、如SEQ ID No.17-18所述引物对、如SEQ IDNo.19-20所述引物对、如SEQ ID No.21-22所述引物对、如SEQ ID No.23-24所述引物对、如SEQ ID No.25-26所述引物对、如SEQ ID No.27-28所述引物对、如SEQ ID No.29-30所述引物对、如SEQ ID No.31-32所述引物对、如SEQ ID No.33-34所述引物对、如SEQ ID No.35-36所述引物对、如SEQ ID No.37-38所述引物对、如SEQ ID No.39-40所述引物对、如SEQ IDNo.41-42所述引物对、如SEQ ID No.43-44所述引物对、如SEQ ID No.45-46所述引物对、如SEQ ID No.47-48所述引物对、如SEQ ID No.49-50所述引物对、如SEQ ID No.51-52所述引物对、和如SEQ ID No.53-54所述引物对。
本发明的第三个方面是提供如本发明第一个方面所述艾纳香SSR引物对、或者如本发明第二个方面所述的艾纳香SSR引物组在区分不同地理来源的艾纳香植物材料中的应用。
本发明的第四个方面是提供如本发明第一个方面所述艾纳香SSR引物对、或者如本发明第二个方面所述的艾纳香SSR引物组在艾纳香分子标记辅助育种中的应用。
本发明的第五个方面是提供一种基于转录组测序开发艾纳香SSR引物对的方法,包括以下步骤:
(1)提取艾纳香的总RNA,分离出3’端带有polyA的mRNA,随机打断mRNA,回收200-700bp片段,反转录并合成双链cDAN;(2)对(1)获得的序列进行测序;(3)将测序结果进行拼接与组装成一个完整的转录组,取每条基因中最长的转录本作为Unigene,并对Unigene序列进行生物信息学分析;(4)采用软件MISA1.0对上述Unigene进行SSR检测;(5)采用软件Primer3进行SSR引物设计,并鉴定SSR引物的多态性。
其中,步骤(3)中所述生物信息学分析包括但不限于基因注释、CDS预测和差异表达基因筛选。
其中,所述基因注释包括基因表达量注释和/或基因功能注释。
其中,所述差异表达基因筛选包括GO功能显著性富集分析和/或PathwayZ显著性富集分析。
其中,步骤(5)中进行SSR引物设计使用的参数为:引物长度18-22bp,Tm55-65℃,产物大小100-300bp。
在一个具体的实施方式中,基于转录组序列开发艾纳香SSR引物的方法,包括如下步骤:
(1)转录组数据的获得
提取艾纳香总RNA,以5ug total RNA起始量建库;磁珠法分离mRNA后,离子打断mRNA(TruseqTM RNA sample prep Kit);回收200-700bp片段,反转录并双链cDNA合成、补平、3’端加A、连接index接头(TruseqTM RNA sample prep Kit);文库富集,PCR扩增15个cycles;2%琼脂糖胶回收目的条带(Certified Low Range Ultra Agarose);TBS380(Picogreen)定量,按数据比例混合上机;cBot上进行桥式PCR扩增,生成clusters;Hiseq2000测序平台,进行2*100bp测序。
(2)原始数据处理及生物信息学分析
Illumina Hiseq 2000测序得到的原始图像数据经过Base Calling转化为序列数据,结果文件以FASTQ文件格式来存储。得到原始测序数据后,先对测序结果进行统计和评估,再根据接头信息去除那些有接头污染的序列。得到原始的FASTQ数据后,对其进行质控得到高质量的测序结果(clean data)。将质控后得到的高质量序列进行de novo拼接。
转录本的丰度体现基因的表达水平,转录本丰度越高,则基因表达水平越高。在RNA-seq分析中,将测序得到的reads与前面所得的拼接结果进行比对(mapping)。通过对定位到基因组区域的测序序列(clean reads)的数量来估计基因的表达水平,使用Trinity软件对拼接结果进行ORF预测。采用GO数据库和COG数据库对基因的功能进行分类,基于KEGG数据库,运用BLAST算法(blastx/blastp 2.2.24+)将所有基因与KEGG的基因数据库(GENES)进行比对,根据比对得到的KO编号去查找具体的生物学通路,提供所分析基因可能参与的所有生物学通路。
(3)SSR序列的识别
首先安装Perl语言,从http://pgrc.Lpk-gatersleben.de/misa网站下载est-trimmer.pl,去除转录组序列中过短的序列和过长的序列;从http://www.bioinformatics,org/cd-hit/中下载CD-HIT软件,去除冗余序列。
从http:pgrc.lpk-gatersleben.de/misa网站下载使用MISA软件以识别和定位序列中SSR,参数设置如下:单核苷酸、二核苷酸、三核苷酸、四核苷酸、五核苷酸和六核苷酸的重复次数至少为10、6、5、3、3、3。
(4)SSR引物的设计
使用Primer3批量设计SSR引物,网址:http://sourceforge.net/projects/primer3/files/primer3/1.1.4/primer3-1.1.4-WINXP.zip/download,引物设计参数为引物长度18-22bp,Tm55-65℃。其中前后引物Tm值相差4℃,产物大小为100-300bp.
(5)SSR引物对来源于不同地方的9份艾纳香DNA的多态性鉴定
从所开发的17979对SSR引物中随机选取30对引物进行PCR扩增,采用8%非变性聚丙烯酰胺凝胶电泳检测。
本发明成功设计了17979对SSR引物,从中筛选出30对引物对来源地不同的艾纳香材料DNA进行验证,其在100-300bp检测到清晰条带,表明引物设计成功率高,其中多态的引物共有27对,利用者27对SSR引物可以区分不同地理来源的艾纳香植物材料。本发明方法方便、快捷、准确且成本低廉,为艾纳香SSR引物开发提供了新思路。
附图说明
图1为本发明建库测序流程示意图。
图2为本发明RNA-seq数据分析流程示意图。
图3为本发明得到的Unigene长度分布图:横坐标表示拼接好的isogene长度范围,纵坐标表示对应该长度范围的isogene数量。
图4为本发明中部分SSR重复基元类型和数量:该图展示了每一种SSR的数量,图中阴影条表示长度大于或等于15bp的SSR,空白条表示小于15bp的SSR数量,每一个柱条表示一种类型的SSR。
图5为本发明中利用部分SSR引物对来源于不同地区的9份艾纳香DNA进行多态性验证的结果。
图中,A为贵州材料,B为海南材料;C为贵州材料;D为海南材料;E为水,对照,M为marker。
具体实施方式
以下实施例用于说明本发明,但不用来限制本发明的范围。若未特别指明,实施例均按照常规实施条件进行。以下实施例中所用的试验材料,如无特殊说明,均从常规生化试剂厂商购买得到。
试剂仪器表
表1所使用的试剂和仪器表
Figure BDA0001395686980000061
实施例1 RNA-seq分析及SSR引物的设计
1.RNA-seq分析样品处理及测序流程见图1。具体方法如下:
艾纳香总RNA的提取,真核生物以5ug total RNA起始量建库;
磁珠法分离mRNA后,离子打断mRNA(TruseqTM RNA sample prep Kit);
回收200-700bp片段,反转录并双链cDNA合成、补平、3’端加A、连接index接头(TruseqTM RNA sample prep Kit);
文库富集,PCR扩增15个cycles;
2%琼脂糖胶回收目的条带(Certified Low Range Ultra Agarose);
TBS380(Picogreen)定量,按数据比例混合上机;
cBot上进行桥式PCR扩增,生成clusters;
Hiseq2000测序平台,进行2*100bp测序。
2.数据分析
数据分析流程图见图2。
(1)原始测序数据统计
Illumina Hiseq 2000测序得到的原始图像数据经过Base Calling转化为序列数据,结果文件以FASTQ文件格式来存储。FASTQ格式文件包含测序reads的序列信息以及reads的测序质量信息。测序数据随机截取结果如下所示:
@HWI-ST531R:144:D11RDACXX:4:1101:1212:1946 1:N:0:ATTCCT
ATNATGACTCAAGCGCTTCCTCAGTTTAATGAAGCTAACTTCAATGCTGAGATCGTTGA
+HWI-ST531R:144:D11RDACXX:4:1101:1212:1946 1:N:0:ATTCCT
?A#AFFDFFHGFFHJJGIJJJIICHIIIIJJGGHIIJJIIJIIJIHGI@FEHIIJBFFHGJJIIHHHDFFFFDCC
每条read包含4行信息,其中第一行和第三行分别由文件识别标志和读段名(ID)组成(第一行以“@”开头而第三行以“+”开头;第三行中ID可以省略,但“+”不能省略),第二行为碱基序列,第四行是第二行中每个碱基所对应的测序质量值。
(2)原始测序数据质控
Illumina测序属于第二代测序技术,单次运行能产生数十亿级的reads,如此海量的数据无法逐个展示每条read的质量情况;生物信息分析运用统计学的方法,对所有测序reads的每个circle进行碱基分布和质量波动的统计,可以从宏观上直观地反映出样本的测序质量和文库构建质量。
得到原始测序数据后,先对测序结果进行统计和评估,再根据接头信息去除那些有接头污染的序列。
(3)原始数据去杂
得到原始的FASTQ数据后,对其进行质控得到高质量的测序结果(clean data)。质控步骤如下:首先去除reads中的adaptor序列;接着去除测序质量较低的reads(质量值小于20);然后去除含N较多的reads;最后去除经过以上步骤后长度小于20nt的小片段。
使用软件:SeqPrep(https://github.com/jstjohn/SeqPrep)
Sickle(https://github.com/najoshi/sickle)
(4)拼接及拼接结果统计
将质控后得到的高质量序列进行de novo拼接。使用软件:Trinity(http://trinityrnaseq.sourceforge.net/)
(5)与拼接结果比对
转录本的丰度体现基因的表达水平,转录本丰度越高,则基因表达水平越高。在分析中,将测序得到的reads与前面所得的拼接结果进行比对(mapping)。
使用软件:bowtie(http://bowtie-bio.sourceforge.net/index.shtml)
(6)表达量统计及表达差异分析
转录本的丰度体现基因的表达水平,转录本丰度越高,则基因表达水平越高。在RNA-seq分析中,通过对定位到基因组区域的测序序列(clean reads)的数量来估计基因的表达水平。依据所有样本不参考基因组比对的结果,计算每个基因/转录本在样本中的FPKM值,以该值作为基因/转录本在样本中的表达量。最终对所有基因/转录本在各组样本中的表达进行差异显著性分析,找出相对差异表达的基因/转录本,并对其进行可视化分析。显著差异表达基因/转录本筛选条件:FDR<0.05&&|log2FC|>=2。
使用软件:RSEM(http://deweylab.biostat.wisc.edu/rsem/)
edgeR(http://www.bioconductor.org/packages/release/bioc/html/edgeR.html)
(7)拼接结果注释:
基因预测:对拼接结果进行ORF预测。使用软件:Trinity(http://trinityrnaseq.sourceforge.net/analysis/extract_proteins_from_trinity_transcripts.html)
功能注释:将预测出ORF的蛋白序列与未预测出ORF的核苷酸序列分别注释,将预测出ORF的蛋白序列使用blastp分别与NR、string、gene数据库进行比对,剩余未预测出ORF的序列使用blastx分别与NR、string、gene数据库比对。使用软件:BLAST(BLAST Version2.2.25),BLAST比对参数设置期望值E value为1e-5。
(8)基因功能分类
GO分类:GO(Gene Ontology,http://www.geneontology.org/)是基因本体论联合会建立的数据库,标准化不同数据库中的关于基因和基因产物的生物学术语,对基因和蛋白功能进行限定和描述。利用GO数据库,可以按照基因参与的生物学过程、构成细胞的组分、实现的分子功能等进行分类。因此GO注释有劣于我们理解基因背后所代表的生物学意义。GO注释包括3方面:
细胞成分(Cellular component)(GO:0005575):细胞的一部分或者其细胞外环境(the parts of a cell or its extracellular environment),例如细胞核(such asnucleus)(GO:0005634),核糖体(ribosome)(GO:0005840);
分子功能(Molecular function)(GO:0003674):基因产物在分子水平上的基本活动(the elemental activities of a gene product at the molecular level),如结合(such as binding)(GO:0005488),催化(catalysis)(GO:0043364);
生物过程(Biological process)(GO:0008150):具有明确的开始和结束的、与完整的生命单元的功能有关的分子事件活动或集合:细胞、组织、器官和有机体(operationsor sets of molecular events with a defined beginning and end,pertinent to thefunctioning of integrated living units:cells,tissues,organs,and organisms),如细胞生理过程(such as cellular physiological process)(GO:0009987),信号转导(signal transduction)(GO:0007165)。
使用软件:blast2go(http://www.blast2go.com/b2ghome)
COG分类:COG(同源蛋白质簇,Clusters of Orthologous Groups of proteins,http://www.ncbi.nlm.nih.gov/COG/)为蛋白直系同源簇数据库,是选取66株已完成的基因组的蛋白质序列,根据系统进化关系分类构建而成。与COG数据库比对可以进行功能注释、归类以及蛋白进化分析。通过采用blastp与string数据库比对,得到基因对应的COGnumber,幵根据COG number进行功能归类,分析所用软件及数据库如下:使用软件:blastx2.2.24+
比对数据库:STRING 9.0(http://string-db.org/)
代谢通路分析
在生物体内,基因产物并不是孤立存在地作用的,不同基因产物之间通过有序的相互协调来行使其具体的生物学功能。因此,KEGG数据库中丰富的通路信息将有助于我们从系统水平去了解基因的生物学功能,例如代谢途径、遗传信息传递以及细胞过程等一些复杂的生物功能,这大大提高了该数据库在实际生产和应用中的价值。基于KEGG数据库,运用BLAST算法(blastx/blastp 2.2.24+)将所有基因与KEGG的基因数据库(GENES)进行比对,根据比对得到的KO编号去查找具体的生物学通路,提供所分析基因可能参与的所有生物学通路。
使用软件:blastx/blastp 2.2.24+
比对数据库:genes(http://www.genome.jp/kegg/genes.html)
RNA-seq分析结果
通过RNA-seq技术获得了艾纳香苗期和花期的cDNA序列信息,共得到了48197273个序列信息,100341条Unigene;包含RNA-seq名称、序列长度及表达数、COG预测、COG功能注释、KEGG注释、KEGG-pathway、GO注释的共60477条信息;以及包括对获得的序列信息进行CDS核酸序列预测的蛋白功能注释共37283条信息。
实施例2艾纳香高通量SSR位点的发掘
SSR位点的识别
首先安装Perl语言,从http://pgrc.Lpk-gatersleben.de/misa网站下载est-trimmer.pl,去除转录组序列中过短的序列和过长的序列;从http://www.bioinformatics,org/cd-hit/中下载CD-HIT软件,去除冗余序列。
从http:pgrc.lpk-gatersleben.de/misa网站下载使用MISA软件以识别和定位序列中SSR,参数设置如下:单核苷酸、二核苷酸、三核苷酸、四核苷酸、五核苷酸和六核苷酸的重复次数至少为10、6、5、3、3、3。
SSR引物的设计
使用Primer3批量设计SSR引物,网址:http://sourceforge.net/projects/primer3/files/primer3/1.1.4/primer3-1.1.4-WINXP.zip/download,引物设计参数为引物长度18-22bp,Tm55-65℃。其中前后引物Tm值相差4℃,产物大小为100-300bp。应用本方法成功设计了17979对SSR引物,SSR密度分布出现频率最高的单碱基微卫星,所占比例最高是A/T,其次是四核苷酸,如图4所示。
实施例3利用SSR引物对来源于不同地方的艾纳香DNA进行多态性鉴定
提取9份艾纳香DNA,用0.8%琼脂糖凝胶电泳法去检测质量,将DNA浓度稀释至50ng/ul,置于-20℃保存备用。利用引物开发所用材料的DAN进行引物设计成功率PCR鉴定。PCR反应总体积为25μl,1.5mmol/L MgCl2,4种dNTP各100μmol/L,引物各80ng,1.5U Taqplus DNA polymerase(高保真),50ng DNA。反应程序为:95℃预变性5min,95℃变性30s,51-60℃退火45s,72℃延伸45s,进行32-35个循环,最后72℃延伸5min。反应结束后,产物加入2ul加样缓冲液,以100bp DNA ladder为DNA分子量标准,采用8%的非变性聚丙烯酰胺凝胶进行电泳,电泳缓冲液位0.5 x TBE,200V稳压电泳2-2.5h,至加样缓冲液移到凝胶底部时电泳结束。电泳结束后,采用银染法染色,最后将凝胶至于凝胶系统上拍照。所有数据重复两次。
选取的30对引物对9份艾纳香材料DNA进行验证,其中一份材料的电泳图如图5所示。结果表明,具有多态性条带的引物共有27对(表2),表明这27对引物可以用来区分不同地理来源的艾纳香材料。其余8份材料DNA验证,也同样可以区分不同地理来源的艾纳香材料。表明利用此艾纳香转录组开发SSR引物的方法,适用于艾纳香SSR引物开发。
序列说明:
27对SSR引物的名称,序列、退火温度及扩增产物大小如表2所示。
表2所筛选到的SSR引物序列、重复基元、重复次数及退火温度。
Figure BDA0001395686980000111
Figure BDA0001395686980000121
以上对本发明的具体实施例进行了详细描述,但其只是作为范例,本发明并不限制于以上描述的具体实施例。对于本领域技术人员而言,任何对本发明进行的等同修改和替代也都在本发明的范畴之中。因此,在不脱离本发明的精神和范围下所作的均等变换和修改,都应涵盖在本发明的范围内。

Claims (1)

1.艾纳香SSR引物组在区分贵州来源的艾纳香植物材料和海南来源的艾纳香植物材料中的应用,所述艾纳香SSR引物组由以下引物对组成:如5’-AACCCGTCTGGCCTCTTAC-3’和5’-CCATCTTAACCGTTCCGGC-3’所述引物对、如5’-TCCAACTTCCGGCTTCCTC-3’和5’-GTCTCAGGAGCTTCGGTGG-3’所述引物对、如5’-GGTGGGTCGAGTGTCTTCC-3’和5’-TTCTCCGACCACCAAGCC-3’所述引物对、如5’-TCTCCACCGCAATTTCTTCC-3’和5’-ACATGAGACGCCTCTGGAC-3’所述引物对、如5’-AGAACGCACACTCTTGCTG-3’和5’-TCAGCCACATGCGATCTTG-3’所述引物对、如5’-GAGCAACTTCCTGCTGTGG-3’和5’-ACGGCATCGAGCCATCAAG-3’所述引物对、如5’-ATGTGGATCAGTGCCAGGG-3’和5’-TGACACGTTGATACAACTCAATCC-3’所述引物对、如5’-CTTCTCTTATCCAACTCCAAATAAGG-3’和5’-TTCTGCCGCATTGTTGACC-3’所述引物对、如5’-AGTGACGGTTATGGTTTAAAGTC-3’和5’-TGCCAAATGGGCTTGATCC-3’所述引物对、如5’-GGATCACGAATGGGAGGTTG-3’和5’-TTGAAGGGATAGGCCTCGG-3’所述引物对、如5’-TGGCAGTTTGCTTAGGTGC-3’和5’-CAACCGAATGAGAGGGTTGC-3’所述引物对、如5’-TCCAGAGTCTTATATGATAGGCGG和5’-ATGCTATGGAGGTGCCGAG-3’所述引物对、如5’-GCGAGTGTGGTACAGCAAG-3’和5’-AACGGGTCCAGAGGATGAC-3’所述引物对、如5’-ACCACAAGCCCTACTTCCG-3’和5’-TTCAGATCGTTGTTGCGCC-3’所述引物对、5’-TGTTTCGGGCTTGAGCTTTG-3’和5’-CTAGATCCGTTGCCTTGGTC-3’所述引物对、如5’-GCAAGGCGTCAACCATTTC-3’和5’-TGGAACCAAACCAGTTACACC-3’所述引物对、如5’-AGTCAACCGTTCTCCAGGC-3’和5’-TCTCTTGAATCTCTGGGCAC-3’所述引物对、如5’-GAGATGAAGCCCGATGTGC-3’和5’-GTTTGGTTGCAAGAACACTGC-3’所述引物对、如5’-CTCCCTTGGTTCCCAGGAC-3’和5’-GCTTAGTATATGAAGGCACGGC-3’所述引物对、如5’-CCACCAGATAGAGGCTCGG-3’和5’-CATCAGTTAATGACCTGTACATCTG-3’所述引物对、如5’-ACATAGTGCTTAAGGCTGCG-3’和5’-TCCTACACCCAACACCTTTG-3’所述引物对、如5’-ACGCCGTAACTCCGCTG-3’和5’-TCCTGGAGGAGTGCTTTGG-3’所述引物对、如5’-GTTGTTTGTGGCAGGTCCC-3’和5’-GGTGCATACCAGTTGATTATTGC-3’所述引物对、如5’-TGTTCCTTCTTCAGCCACC-3’和5’-CGTTCCTGCAACAGGCTTC-3’所述引物对、如5’-CCAAGACCCAGCGAAACCC-3’和5’-CACGAAACTGCTGGCATCG-3’所述引物对、如5’-CCGAGTTCAGGTGGGTAGC-3’和5’-TGCATGTACGTGATTGTAAGTTC-3’所述引物对、以及如5’-CTGGGCAATCTCAATGGCG-3’和5’-CAGGACTTGAAGGATGCTACG-3’所述引物对。
CN201710774670.2A 2017-08-31 2017-08-31 基于转录组测序开发艾纳香ssr引物的方法 Active CN108192893B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710774670.2A CN108192893B (zh) 2017-08-31 2017-08-31 基于转录组测序开发艾纳香ssr引物的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710774670.2A CN108192893B (zh) 2017-08-31 2017-08-31 基于转录组测序开发艾纳香ssr引物的方法

Publications (2)

Publication Number Publication Date
CN108192893A CN108192893A (zh) 2018-06-22
CN108192893B true CN108192893B (zh) 2021-06-04

Family

ID=62572732

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710774670.2A Active CN108192893B (zh) 2017-08-31 2017-08-31 基于转录组测序开发艾纳香ssr引物的方法

Country Status (1)

Country Link
CN (1) CN108192893B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108753994A (zh) * 2018-06-27 2018-11-06 四川农业大学 一种基于转录组的准确高效的真核生物基因鉴定方法
CN108754018B (zh) * 2018-07-27 2022-03-04 大连民族大学 一种刺五加目的基因ssr分子标记的筛选方法及应用
CN110172525A (zh) * 2019-06-26 2019-08-27 广西壮族自治区林业科学研究院 林木差异表达基因ssr引物组及多态性ssr标记开发方法
CN114333994B (zh) * 2020-09-30 2023-07-07 天津现代创新中药科技有限公司 基于无参转录组测序来确定差异基因通路的方法及系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102277351A (zh) * 2010-06-10 2011-12-14 中国科学院上海生命科学研究院 从无基因组参考序列物种获得基因信息及功能基因的方法
CN103642912A (zh) * 2013-11-29 2014-03-19 中国农业科学院作物科学研究所 基于转录组测序开发绿豆ssr引物的方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102277351A (zh) * 2010-06-10 2011-12-14 中国科学院上海生命科学研究院 从无基因组参考序列物种获得基因信息及功能基因的方法
CN103642912A (zh) * 2013-11-29 2014-03-19 中国农业科学院作物科学研究所 基于转录组测序开发绿豆ssr引物的方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Genetic diversity of the Chinese traditional herb Blumea balsamifera (Asteraceae) based on AFLP markers;Pang Y.X., 等;《Genetics and Molecular Research》;20140414;第13卷(第2期);第2718-2726页 *
蒙药冷蒿转录组SSR信息分析;岳春江等;《中国农业科技导报》;20161231;第18卷(第6期);第31-43页 *

Also Published As

Publication number Publication date
CN108192893A (zh) 2018-06-22

Similar Documents

Publication Publication Date Title
Albert et al. Genetics of trans-regulatory variation in gene expression
Macas et al. In depth characterization of repetitive DNA in 23 plant genomes reveals sources of genome size variation in the legume tribe Fabeae
Zhebentyayeva et al. Genetic characterization of worldwide Prunus domestica (plum) germplasm using sequence-based genotyping
Townsley et al. BrAD-seq: Breath Adapter Directional sequencing: a streamlined, ultra-simple and fast library preparation protocol for strand specific mRNA library construction
CN105696088B (zh) 一种双酶切简化基因组二代测序文库构建方法及配套试剂盒
Ridout et al. Use of AFLP in cereals research
CN108192893B (zh) 基于转录组测序开发艾纳香ssr引物的方法
Blanca et al. Melon transcriptome characterization: Simple sequence repeats and single nucleotide polymorphisms discovery for high throughput genotyping across the species
Sucher et al. DNA fingerprinting, DNA barcoding, and next generation sequencing technology in plants
CN109468405B (zh) 基于转录组测序开发的云锦杜鹃ssr引物对及筛选方法与应用
EP3289105B1 (en) Compositions and methods for constructing strand specific cdna libraries
CN108715902A (zh) 梅花垂枝性状snp分子标记及其应用
Ma et al. RNA-seq-mediated transcriptome analysis of a fiberless mutant cotton and its possible origin based on SNP markers
Chotewutmontri et al. Ribosome profiling in maize
Long et al. De novo assembly of transcriptome sequencing in Caragana korshinskii Kom. and characterization of EST-SSR markers
Bilgen et al. A software program combining sequence motif searches with keywords for finding repeats containing DNA sequences
CN113463202B (zh) 一种新的rna高通量测序的方法、引物组和试剂盒及其应用
CN107475449A (zh) 一种适用于矮缩病毒科和双生病毒科病毒基因组拼接的转录组测序方法
CN110894542A (zh) 一种鉴别水稻gs5基因和glw7基因类型的引物及其应用
CN110951911B (zh) 基于转录组的椴树属est-ssr引物及其筛选方法和应用
Nguyen et al. Tools for Chrysanthemum genetic research and breeding: Is genotyping-by-sequencing (GBS) the best approach?
CN108517368B (zh) 利用上位性解析毛白杨LncRNA Pto-CRTG及其靶基因Pto-CAD5互作关系的方法及系统
CN108998553A (zh) 一种快速筛选多态性微卫星位点目标引物的方法及引物
Menon et al. Bioinformatics tools and methods to analyze single-cell RNA sequencing data
CN111979341B (zh) 一种基于罗氏沼虾转录组序列开发的引物组及其应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant