CN113160893A - 从二代测序数据挖掘植物ITSs序列并用于鉴别品种家系 - Google Patents

从二代测序数据挖掘植物ITSs序列并用于鉴别品种家系 Download PDF

Info

Publication number
CN113160893A
CN113160893A CN202110640825.XA CN202110640825A CN113160893A CN 113160893 A CN113160893 A CN 113160893A CN 202110640825 A CN202110640825 A CN 202110640825A CN 113160893 A CN113160893 A CN 113160893A
Authority
CN
China
Prior art keywords
rosa
seq
rose
sequence
dna
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110640825.XA
Other languages
English (en)
Other versions
CN113160893B (zh
Inventor
胡金勇
崔卫华
蒋晓东
仲米财
董雪
方伟
锁志全
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kunming Institute of Botany of CAS
Original Assignee
Kunming Institute of Botany of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kunming Institute of Botany of CAS filed Critical Kunming Institute of Botany of CAS
Priority to CN202110640825.XA priority Critical patent/CN113160893B/zh
Publication of CN113160893A publication Critical patent/CN113160893A/zh
Application granted granted Critical
Publication of CN113160893B publication Critical patent/CN113160893B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • C12Q1/6895Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for plants, fungi or algae
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/20Sequence assembly
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/20Supervised data analysis
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Analytical Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Biophysics (AREA)
  • Theoretical Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Evolutionary Biology (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Data Mining & Analysis (AREA)
  • Mycology (AREA)
  • Bioethics (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Botany (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Genetics & Genomics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Databases & Information Systems (AREA)
  • Epidemiology (AREA)
  • Evolutionary Computation (AREA)
  • Public Health (AREA)
  • Software Systems (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明提供了一种通过二代测序数据准确组装个体内ITS不同单倍型的方法,包含以下步骤:1)制备待测样本总DNA的二代测序文库;2)将所述二代测序文库进行测序,得到测序数据;3)将所述测序数据分别进行ITS1、ITS2序列拼接和注释。本发明还公开了该方法组装得到的ITSs序列。本发明还提供了进一步的应用,包括使用该ITSs序列及对应的叶绿体基因组序列作为指纹鉴别样本的家系。对食用玫瑰,本专利能够直观的判断食用玫瑰品种的双亲来源及食用玫瑰品种之间的遗传关系,不仅能够准确快速鉴定品种及家系,还能为待测品种的育种途径和可能的改良方向提供重要的指导信息。

Description

从二代测序数据挖掘植物ITSs序列并用于鉴别品种家系
技术领域
本发明涉及一种使用二代测序数据挖掘ITSs序列并用于分析鉴别品种家系的方法。
背景技术
食用玫瑰属于蔷薇科蔷薇属(Rosa L.)植物,是一类以鲜花入食的蔷薇属植物的统称。在我国主要以新鲜或者干燥花瓣用于食品加工,以作为色素、香味、维生素等的来源。在国内主要产品形式有干燥玫瑰花蕾、玫瑰酱、玫瑰糖、玫瑰酒、玫瑰饼、玫瑰露等。国家食品安全标准与监测评估司发布的《关于批准DHA藻油、棉籽低聚糖等7种物品为新资源食品及其他相关规定的公告(2010年第3号)》,文件明确玫瑰花(‘重瓣红玫瑰’Rosa rugosa‘Plena’)作为普通食品生产经营。然而这一规定仅明确了‘重瓣红玫瑰’一个品种的食用合法性。根据文献调查和实地调查,国内各地引种栽培的油用玫瑰品种开拓应用范围到食用领域,这些品种包含国际精油用‘大马士革’、山东平阴玫瑰研究所培育的‘紫枝玫瑰’和‘丰花玫瑰’、甘肃的‘苦水玫瑰’等。到底哪些是符合国家新食品资源标准的品种,可以被合法的用于食品加工,而其他种类的食用是否存在一定的风险,都是亟待解决的问题。
在植物学种的概念上,根据植物志记载,我国野生的玫瑰为蔷薇科蔷薇属的一个物种(Rosa rugosa Thunb.)。‘重瓣红玫瑰’被认为是野生玫瑰的重瓣栽培品种。然而这一关系并没有遗传方面的证据。
蔷薇属栽培品种由于杂交频繁,形态相似度高,传统基于形态学进行品种区分难度较大。国内目前主要使用的食用玫瑰品种有约20种,然而这些被用作食用玫瑰的品种缺乏背景资料记载,不同栽培区相互引种,且常出现同物异名的现象,对食用玫瑰品种的选择、新品种培育及整个食用玫瑰产业的健康发展极为不利。而近些年来,被称为玫瑰的品种越来越多,这些被称为玫瑰的品种与野生种玫瑰以及‘重瓣红玫瑰’的关系尚不清楚。理清玫瑰的家系对于玫瑰品种的选择利用、新品种培育以及玫瑰市场的健康发展至关重要。国内对于玫瑰品种的区分和鉴别做了一些尝试,然而并没有提供一个清晰的玫瑰家系,不同玫瑰的来源和遗传背景仍然不清楚,市场上玫瑰品种依旧很混乱。
以往发表的区分物种或者品种的方法,基于限制性片段多态性或者扩增片段多态性的实验重复性差,且获取的关系往往不够直接;基于少量叶绿体片段的,信息量太少,鉴别能力有限,且只能提供母系遗传的信息;基于少量单拷贝核基因片段的,由于多数单拷贝核基因在物种内的变异度较大,需要较多的居群采样,才能代表一个物种,且单拷贝核基因在基因组内的只有一个拷贝,引物设计和扩增难度较大,失败率高。
核糖体基因在植物单个细胞内的拷贝数很多,成百上千。核糖体基因(rDNA)转录间隔区(internal transcribed spacers,ITS)序列在植物种属关系研究中得到广泛的使用,然而一般认为ITS序列在个体内会经历同质性进化,从而实现个体内不同拷贝的ITS序列保持高度一致,因此ITS的应用一般停留在野生植物属下种间的关系研究上。对于植物内ITS序列多样性及其应用的报道较少见。一些研究蔷薇属栽培品种起源的研究,尝试了ITS序列的适用性,然而克隆测序实验繁琐且价格昂贵,而由于采用传统通过PCR测序获取ITS序列的方法不能得到同一个体内的不同单倍型,未能得到理想的效果。以往利用叶绿体基因组单个基因片段或者数个基因联合片段作为种间关系研究的尝试也只能得到较低的分辨率,并且由于母系遗传,叶绿体基因或叶绿体基因组对于同一母本种下的品种没有区分能力。
发明内容
本发明开发了一种通过二代测序数据准确组装个体内ITS不同单倍型的方法,通过一次浅层的二代测序,同时获取代表母系信息的叶绿体基因组和代表双亲信息的高拷贝的核糖体基因转录间隔区ITS序列,通过序列比对和系统发育关系分析,能够直观的判断食用玫瑰品种的双亲来源及食用玫瑰品种之间的遗传关系,不仅能够准确快速鉴定品种及家系,还能为待测品种的育种途径和可能的改良方向提供重要的指导信息。
本发明的目的通过以下技术方案予以实现:
第一方面,本发明提供一种使用二代测序数据组装植物样本ITSs序列的方法,所述方法包含以下步骤:
1)制备待测样本总DNA的二代测序文库;
2)将所述二代测序文库进行测序,得到测序数据;
3)将所述测序数据分别进行ITS1、ITS2序列拼接和注释,所述ITS1、ITS2序列拼接和注释可包括:以任一近缘类群品种的核糖体DNA为rDNA参考序列,将所述测序数据回贴(map)到所述rDNA参考序列上富集ITS1和ITS2区的读序(reads),标记每一个多样性位点的覆盖度和碱基组成;利用富集到的reads进行从头组装,选择保留变异信息,得到重叠群(contigs),然后将得到的contigs重新回贴到rDNA参考序列,查找ITS1和ITS2区的重叠群,依据读序回贴标记的所述多样性位点的信息提取出重叠群(覆盖度可≥5%),作为可靠的ITS1和ITS2序列组成本发明的ITSs。
任选地,步骤2)所述测序的单条读序的读长≥100碱基(bp),如为≥150bp。
任选地,步骤2)所述测序为双端测序。
任选地,步骤2)所得测序数据为浅层测序数据,其数据量可≥1Gb,如≥2Gb。
任选地,待测样本来自蔷薇科,优选为蔷薇属。
更具体的,其中:
步骤1)所述待鉴别样本总DNA的提取方法为:改良的CTAB法,优选试剂公司生产的植物总DNA提取试剂盒提取;
其中,步骤1)所述二代测序文库的制备:参照Illumina文库构建流程,将所述总DNA构建为片段大小为400-600bp的双末端高通量测序文库;
第二方面,本发明对应提供了种系鉴别用ITSs序列,各品种ITSs序列如下表所示:
表1
学名 中文名 ITS1各单倍型序列号 ITS2各单倍型序列号
Rosa rugosa'Plena' ‘重瓣红玫瑰’ SEQ ID NO.1-2 SEQ ID NO.3-4
Rosa×centifolia L. ‘千叶玫瑰’ SEQ ID NO.5-7 SEQ ID NO.8-11
Rosa×damascenaHerrm. ‘大马士革’ SEQ ID NO.12-14 SEQ ID NO.15-18
Rosa'Bajie Meigui' ‘八街玫瑰’ SEQ ID NO.19-21 SEQ ID NO.22-24
Rosa'Dianhong' ‘滇红玫瑰’ SEQ ID NO.25-27 SEQ ID NO.28-30
Rosa'Dingtao Meigui' ‘定陶玫瑰’ SEQ ID NO.31-33 SEQ ID NO.34-36
Rosa'Jinbian' ‘金边玫瑰’ SEQ ID NO.37-40 SEQ ID NO.41-43
Rosa'Kushui' ‘苦水玫瑰’ SEQ ID NO.44-45 SEQ ID NO.46-47
Rosa'Ruoshuiming' ‘若水茗’ SEQ ID NO.48-50 SEQ ID NO.51-54
Rosa'Shangshui Meigui' ‘商水玫瑰’ SEQ ID NO.55-57 SEQ ID NO.58-60
Rosa'Tuwei' ‘荼薇花’ SEQ ID NO.61-63 SEQ ID NO.64-68
Rosa'Crimson Glory' ‘墨红玫瑰’ SEQ ID NO.69-70 SEQ ID NO.71-72
Rosa'Fenghua' ‘丰花玫瑰’ SEQ ID NO.73-74 SEQ ID NO.75-76
Rosa'Guo Meigui' ‘果玫瑰’ SEQ ID NO.77-78 SEQ ID NO.79-80
Rosa'Miaofengshan' ‘妙峰山玫瑰’ SEQ ID NO.81-82 SEQ ID NO.83-84
Rosa'Zizhi' ‘紫枝玫瑰’ SEQ ID NO.85 SEQ ID NO.86-89
比如,‘重瓣红玫瑰’ITS1包括SEQ ID NO.1-2所示序列,ITS2包括SEQ ID NO.3-4所示序列。第三方面,本发明对应提供了植物种系鉴别用指纹库,该指纹库含有至少一种品种的上述ITSs序列及该品种的叶绿体基因组序列。
基于上述方面,本发明进而提供了其于种系、家系鉴别的应用,以蔷薇为例,该应用包括:0)根据在先权利要求所述方法组装出至少一种蔷薇属植物的ITSs序列,汇总该ITSs序列信息及所属物种的叶绿体基因组序列,得到蔷薇属样本指纹库;
1)根据在先权利要求所述方法组装出待鉴别样本X的ITS1s、ITS2s序列,并获得该样本X的叶绿体基因组序列;
2)进行样本X与所述指纹库物种的叶绿体基因组、ITS1、ITS2序列比对,以鉴别样本X与该指纹库中物种的家系关系。
本专利家系泛指起源、亲缘关系,所述序列比对结果为序列(指叶绿体基因组、ITS1s、ITS2s3组序列)一致时,则可以判断该待测样品与该已知玫瑰品种同属于一个家系,遗传关系密切;如不一致,为获悉更精确的家系关系,可与指纹库中另1蔷薇属植物进行比对(第2比对),如第2比对的结果仍为不一致,为获悉更精确的家系关系,可进一步分析,比如进化树构建及相关分析,可包括:
a)基于叶绿体基因组构建的进化树上,与样本X聚在一枝且分支枝长接近甚至为0的野生种被认定为该样本的母系祖先,与样本X聚在一枝且分支枝长接近甚至为0的蔷薇品种被认定为与该样本X来自于共同的母系祖先;
b)基于ITS1和ITS2构建的进化树上,与样本X聚在一枝且分支枝长接近甚至为0的野生种被认定为该样本X的母系和/或父系祖先,与样本X聚在一枝且分支枝长接近甚至为0的蔷薇品种被认定为与该样本X来自共同的母系或父系祖先;
c)基于ITS1和ITS2构建的进化树认定的祖先,同时也是基于叶绿体基因组构建的进化树认定的母系祖先时,确定该祖先为母系祖先,而基于ITS1和ITS2构建的进化树认定的其余的祖先被认定为父系祖先。
任选地,所述指纹库还使用分类学上蔷薇族其他属的种作为外类群,所述外类群含有的物种的种类可≥2,如为2-5种。
任选地,所述蔷薇属植物包括但不限于以下品种:‘滇红玫瑰’(Rosa'Dianhong')、‘金边玫瑰’(Rosa'Jinbian')、‘八街玫瑰’(Rosa'Bajie Meigui')、‘墨红玫瑰’(Rosa'Crimson Glory')、‘大马士革’(Rosa×damascena)、‘千叶玫瑰’(Rosa×centifolia)、‘若水茗’(Rosa'Ruoshuiming')、‘商水玫瑰’(Rosa'Shangshui Meigui')、‘定陶玫瑰’(Rosa'Dingtao Meigui')、‘紫枝玫瑰’(Rosa'Zizhi')、‘重瓣红玫瑰’(Rosa rugosa'Plena')、‘丰花玫瑰’(Rosa'Fenghua')、‘妙峰山玫瑰’(Rosa'Miaofengshan')、‘果玫瑰’(Rosa'GuoMeigui')、‘苦水玫瑰’(Rosa'Kushui')、‘荼薇花’(Rosa'Tuwei')、Rosa banksiaeRosaBr.,Rosa brunonii Lindl.,Rosa canina L.,Rosa chinensis f.mutabilis(Correvon)Rehder,Rosa chinensis'Old Blush',Rosa chinensis var.spontanea(Rehder&E.H.Wilson)T.T.Yu&T.C.Ku,Rosa davurica Pall.,Rosa fedtschenkoanaRegel,Rosa gallica L.,Rosa helenae Rehder&E.H.Wilson,Rosa kweichownensisvar.sterilis,Rosa laevigata Michx.,Rosa lichiangensis T.T.Yu&T.C.Ku,Rosalongicuspis Bertol.,Rosa majalis Herrm.,Rosa moschata Herrm.,Rosa multiflorainermis(Hisauti)Sugim.,Rosa multiflora Thunb.,Rosa odorata'Glandular Sepal',Rosa odorata'Pink Blush',Rosa odorata var.erubescens(Focke)T.T.Yu&T.C.Ku,Rosaodorata var.gigantea(Collett ex Cr,p.)Rehder&E.H.Wilson,Rosa odoratavar.pseudindica(Lindl.)Rehder,Rosa roxburghii f.normalis Rehder&E.H.Wilson,Rosa roxburghii Tratt.,Rosa rugosa Thunb.,Rosa taiwanensis Nakai,Rosawichuraiana'Basye's Thornless',Rosa wichuraiana Crép,Rosa xanthina Lindl.
任选地,所述序列比对方法包括:优选Geneious软件中的MAFFT插件进行序列比对,比对好的序列去除两端的不平序列,将比对好的矩阵输出为fasta文件。
任选地,以最大似然法构建进化树,方法可包括:将所述矩阵文件导入软件1计算最佳碱基替代模型,所述矩阵文件导入软件2构建进化树,设置最佳碱基替代模型,进化树迭代次数(bootstrap)设为1000次。
优选地,所述软件1为jModelTest。
优选地,所述最佳碱基替代模型为GTRGAMMAI。
优选地,所述软件2为RAxML 8.2.11。
附图说明
图1为‘大马士革’(Rosa×damascena L1)ITS1单倍型序列组装模型图。a:为测序原始数据回帖到ITS1区域后,每个可能的多样性位点的不同碱基及其组成比例,每个位点的总覆盖度记录在位点下面的括号内。该数据可以通过Geneious软件逐位点查看并人工记录,用于验证图中c所识别组装的ITS1单倍型在该区域测序数据中的比例。b:为测序原始数据回帖到ITS1区域时,支持不同类型ITS单倍型的reads的分布及其可能的规律。每条灰线代表一条read,灰线上的碱基代表该位点相对参考序列和其他reads的差异碱基。c:依照b识别的不同类型的reads按照无错配连接得到的不同ITS1单倍型。每条单倍型序列上的碱基所在位点与b中reads及参考序列的位点一一对应,黑色箭头所指的碱基为对应单倍型序列的特异碱基,每条单倍型序列的比例为该单倍型各特异碱基的比例的平均值。
图2.Rosa×damascena L1 ITS克隆测序得到的4条序列对比,图中显示每种序列类型在多样性位点对应的碱基类型,序列的相同部分未展示。
图3.Rosa×damascena L1 ITS克隆测序结果与基于二代测序数据组装ITSs序列的对应关系,克隆测序的序列类型后面括号内为得到的同一类型序列的单克隆数目。
具体实施方式
下面结合具体实施例进一步说明本发明方法。下述实施例和附图仅用于示例性说明,不能理解为对本发明的限制。除非特别说明,下述实施例中使用的试剂为常规市购或商业途径获得的生化试剂,除非特别说明,下述实施例中使用的方法和设备为本领域常规使用的方法和设备。
实施例1
从8个主要食用玫瑰产区搜集16个食用玫瑰品种共23个材料,另外采集了蔷薇属野生种或品种26种(均见表2)。采集不同来源各个品种和种的健康幼叶,标记好,由测序公司完成总DNA提取、二代测序文库构建、上机测序和质控。DNA提取采用改良的CTAB法(Doyle和Doyle 1987)。DNA建库和测序实验流程按照Illumina公司提供的标准protocol执行,包括样品质量检测、文库构建、文库质量检测和文库测序等流程,测序平台为Illumina Xten,采取双端测序技术,测序读长为双末端150bp。最终得到双端Clean reads各700,000-1,000,000条,每样品的总数据量2-3Gb。
叶绿体基因组组装:将上述双端clean reads依照GetOrganelle组装流程,采用SPAdes 3.12.0进行叶绿体组装,然后用Bandage 0.8.1检查组装结果,选择组装出来的叶绿体contigs导出到Geneious 9.1.4软件中,参考已发表的无刺光叶蔷薇(Rosawichuraiana'Basye's Thornless')的叶绿体基因组(GenBank accession number:MN689790)进行叶绿体基因组注释。
ITS1、ITS2序列组装:在Geneious 9.1.4软件中,以‘大马士革’的rDNA为参考,将上述步骤所得测序数据map到rDNA上富集ITS1和ITS2区的reads(reads mapping),同时查看ITS区不同reads组分,记录单个多样性位点的碱基组成和覆盖度。利用富集到的reads进行从头组装,选择保留contigs的变异信息。然后再将得到的contigs重新map到rDNA参考序列,查找ITS1和ITS2区的contigs,依据reads mapping结果提取覆盖度大于5%的contigs,作为可靠的ITS1和ITS2序列,并依据获得的ITS1和ITS2序列单倍型数目,将ITS1、ITS2单倍型按覆盖度从多到少依次标记为a、b、c、d、e等。ITS1和ITS2组装示例见图1。组装出的各食用玫瑰的ITSs序列列在序列表,‘重瓣红玫瑰’的ITS1a为SEQ ID NO.1,其ITS1b如SEQ IDNO.2所示序列,ITS2a、ITS2b亦依次如SEQ ID NO.3、SEQ ID NO.4所示。
为了确保ITS1和ITS2序列组装结果的准确性和个体内所有ITS单倍型的全覆盖,依照传统的ITS序列PCR扩增测序方法,随机对10个品种的ITS序列进行了扩增和Sanger测序,通过对测序结果仔细观察并与组装的ITS1s和ITS2s序列比对矩阵进行对比,发现PCR扩增产物为杂合序列,而直接测序的杂合位点完全与通过二代测序组装得到的单个样本内的ITS序列之间的变异位点重合,且杂合位点的碱基组成与变异位点的碱基组成一致。证明了通过二代测序组装ITS序列的方法准确可靠。
为了进一步证明二代测序组装的每个ITS单倍型序列的真实性,选取一个ITS成分复杂的样本‘大马士革’,对其PCR扩增产物进行克隆测序,挑取了16个单克隆进行Sanger测序,每个单克隆测序的结果均没有发现杂合位点,表明单克隆实验成功,而测序得到的16条序列经比对,共发现4种序列,代表3种ITS1单倍型和4种ITS2单倍型(图2),且完全与通过二代测序组装的ITS1和ITS2单倍型序列一致。测序的ITS序列与组装的ITS1和ITS2单倍型序列的对应关系见图3。表明根据二代测序数据组装的ITS序列真实可靠。
为了充分获知所采集的食用玫瑰品种的家系,从GenBank下载蔷薇属更多物种的叶绿体基因组和原始二代测序序列用于组装ITS1、ITS2序列,并用于序列比对和进化树构建。本案例共得到了88个蔷薇属材料的叶绿体基因组和60个样本的ITS1、ITS2序列。为了使进化树体现的进化关系更可靠,在GenBank下载与蔷薇属同科同族(蔷薇族)的其他属物种5个作为外类群。具体样本情况见表2。
将上述食用玫瑰材料和其他所有材料的叶绿体基因组、ITS1、ITS2序列载入Geneious 9.1.4软件中,分别对叶绿体基因组、ITS1、ITS2序列用MAFFT插件进行序列比对,比对好的序列去除两端的不平序列,将比对好的矩阵输出为fasta文件。
将上述fasta文件分别作为输入文件,使用RAxML 8.2.11构建最大似然进化树,以GTRGAMMAI为模型,bootstrap设为1000次。分别得到三个矩阵的树文件。使用Figtree软件查看并编辑树文件,输出pdf文件,再用Illustrator软件编辑为易识别的图片。
根据得到的基于叶绿体基因组、ITS1、ITS2序列的三棵进化树,判断食用玫瑰品种的家系。
依据基于叶绿体基因组的进化树判断,从母系来源上:
‘千叶玫瑰’(Rosa×centifolia)、‘大马士革’(Rosa×damascena)、‘若水茗’(Rosa'Ruoshuiming')和‘金边玫瑰’(Rosa'Jinbian')具有共同的母本祖先:麝香蔷薇(Rosa moschata Herrm.)。
‘商水玫瑰’、‘滇红玫瑰’、‘八街玫瑰’、‘定陶玫瑰’四个食用玫瑰品种与‘月月粉’拥有共同的母本野生祖先:单瓣月季花(Rosa chinensis var.spontanea(Rehder&E.H.Wilson)T.T.Yu&T.C.Ku)。
‘墨红玫瑰’的母本野生祖先:可能是具有相同叶绿体基因组序列的花蝴蝶(Rosachinensis f.mutabilis(Correvon)Rehder)或者‘腺萼香水月季’(Rosa odorata'Glandular Sepal')。
‘荼薇花’的母本野生祖先为法国蔷薇(Rosa gallica L.)。
‘重瓣红玫瑰’、‘紫枝玫瑰’、‘丰花玫瑰’、‘妙峰山玫瑰’、‘果玫瑰’的共同母本野生祖先为中国原产的野生玫瑰(Rosa rugosa Thunb.)。
‘苦水玫瑰’的野生母本祖先与其他食用玫瑰均不同,自成一系。
结合基于ITS1、ITS2序列的进化树,可以推测出多数食用玫瑰品种为杂交品种,具有复杂的亲本来源。
母本祖先均为麝香蔷薇的四个品种中,‘金边玫瑰’具有独特的父本-‘杏花春雨’和父本祖先光叶蔷薇(Rosa wichuraiana Crép),而其他三个品种的父母本来源相同,都属于大马士革系。母本祖先均为单瓣月季花的四个品种均表现出与‘月月粉’的关系密切,父本方面除‘商水玫瑰’有麝香蔷薇成分外,其他三个品种的父本均有法国蔷薇成分。而其中的麝香蔷薇成分和法国蔷薇成分均在大马士革中有包含。因此这几个食用玫瑰品种同属于单瓣月季花家系,且可能来自相同的杂交组合:‘月月粉’ב大马士革’。
‘墨红玫瑰’自成一系,母本祖先为花蝴蝶(Rosa chinensis f.mutabilis(Correvon)Rehder)或者‘腺萼香水月季’(Rosa odorata'Glandular Sepal'),父本祖先为法国蔷薇。
‘荼薇花’自成一系:母本为法国蔷薇,父本为中国野生玫瑰(Rosa rugosaThunb.)。
以野生玫瑰为母本的五个食用玫瑰同为玫瑰系,但依据父本的差别,‘紫枝玫瑰’为驯化自野生玫瑰的品种,而其他包括‘重瓣红玫瑰’在内的四个品种均为玫瑰与山刺玫(Rosa davurica Pall.)的杂交后代。
‘苦水玫瑰’自成一系,其母本与所有其他食用玫瑰品种均不同,而父本为中国野生玫瑰。
表2材料表
Figure BDA0003108636690000061
Figure BDA0003108636690000071
Figure BDA0003108636690000081
*表示序列从GenBank下载。
-表示信息缺乏。
序列表
<110> 中国科学院昆明植物研究所
<120> 从二代测序数据挖掘植物ITSs序列并用于鉴别品种家系
<160> 89
<170> SIPOSequenceListing 1.0
<210> 1
<211> 259
<212> DNA
<213> Rosa rugosa 'Plena'
<400> 1
tcgaaacctg cctagcagaa cgacccgaga acatgtttca acgcttgggg gcggagggtc 60
ttgcggctct gcgccccctt atcctaggag gcaagtgtct tgcgcgttgc atttcggtgc 120
ttgcgcttga ccgaccctcc cgggcgtact gaacaccggc gtgaattgcg ccaaggaact 180
tgaatgaaag agcgtttccc ccgccgtccc ggagacggtg ctcgtgcggg tggtttcgtc 240
gtcttcaata tgtctaaac 259
<210> 2
<211> 259
<212> DNA
<213> Rosa rugosa 'Plena'
<400> 2
tcgaaacctg cctagcagaa cgacccgaga acatgtttca acgcttgggg gcggagggtc 60
ttgcggctct gcgccccctc atcctaggag gcaagtgtct tgcgcgttgc atttcggtgc 120
ttgcgcttga ccgaccctcc cgggcgtact gaacaccggc gtgaattgcg ccaaggaact 180
tgaatgaaag agcgtttccc ccgccgtccc ggagacggtg ctcgtgcggg tggtttcgtc 240
gtcttcaata tgtctaaac 259
<210> 3
<211> 232
<212> DNA
<213> Rosa rugosa 'Plena'
<400> 3
gtcgttgccc cccccaaccc cctcgggagt tggatgggac ggatgatggc ctcccgtgtg 60
ctcagtcacg cggttggcat aaataccaag tcctcggcga ccaacgccac gacaatcggt 120
ggttgtcaaa cctcggtttc ctgtcgtgcg cgcgtgttga tcgagtgctt tcttaaacaa 180
tgcgtgtcga tctgtcgatg ctttcaacgc gaccccaggt caggcggggt ta 232
<210> 4
<211> 235
<212> DNA
<213> Rosa rugosa 'Plena'
<400> 4
gtcgttgccc ccccccaacc ccccctcggg agttggatgg gacggatgat ggcctcccgt 60
gtgctcagtc acgcggttgg cataaatacc aagtcctcgg cgaccaacgc cacgacaatc 120
ggtggttgtc aaacctcggt ttcctgtcgt gcgcgcgtgt tgatcgagtg ctttcttaaa 180
caatgcgtgt cgatccgtcg atgctttcaa cgcgacccca ggtcaggcgg ggtta 235
<210> 5
<211> 258
<212> DNA
<213> Rosa X centifolia L.
<400> 5
tcgaaacctg cctagcagaa cgacccgaga acatgtttca acgctggggg gcggagggtc 60
ttgcggctct gcgccccctt atcctaggag gcaagtgtct tgcgtgttgc atttcggtgc 120
ttgcgcttga tcgaccctcc caggcgtacc gaacaccggc gtgaattgcg ccaaggaact 180
tgaatgaaag agcgttcccc cgccgtcccg gagacggtgc tcgtgcgggt ggtttcgtcg 240
tcttcaatat gtctaaac 258
<210> 6
<211> 259
<212> DNA
<213> Rosa X centifolia L.
<400> 6
tcgaaacctg cctagcagaa cgacccgaga acatgtttca acgcttgggg gcggagggtc 60
ttgcggctct gcgccccctt atcctaggag gcaagtgtct tgcgcgttgc atttcggtgc 120
ttgcgcttga ccgaccctcc cgggcgtact gaacaccggc gtgaattgcg ccaaggaact 180
tgaatgaaag agcgtttccc ccgccgtccc ggagacggtg ctcgtgcggg tggtttcgtc 240
gtcttcaata tgtctaaac 259
<210> 7
<211> 258
<212> DNA
<213> Rosa X centifolia L.
<400> 7
tcgaaacctg cctagcagaa cgacccgaga acatgtttca acgcttgggg gcgtagggtc 60
ttacggctct gtgccccctt atcctaggag gcaagtgtct tgcgtgttgc atttcggtgc 120
tttcgcttga tcgaccctcc taggcgtact gaacaccggc gtgaattgcg ccaaggaact 180
tgaatgaaag agcgttcccc cgccgtcccg gagacggtgc tcgtgcgggt ggtttcgtcg 240
tcttcaatat gtctaaac 258
<210> 8
<211> 232
<212> DNA
<213> Rosa X centifolia L.
<400> 8
gtcgttgccc cccccaaccc cctcgggagt tggatgggac ggatgatggc ctcccgtgtg 60
ctcagtcacg cggttggcat aaataccaag tcctcggcga ccaacgccac gacaatcggt 120
ggttgtcaaa cctcggtttc ctgtcgtgcg cgcgtgttga tcgagtgctt tcttaaacaa 180
tgcgtgtcga tccgtcgatg ctttcaacgc gaccccaggt caggcggggt ta 232
<210> 9
<211> 231
<212> DNA
<213> Rosa X centifolia L.
<400> 9
gtcgttgccc cccccaaccc ctcgggagtt ggatgggacg gatgatggcc tcccgtgtgc 60
tcagtcacgc ggttggcata aataccaagt cctcggcgac caacgccacg acaatcggtg 120
gttgtcaaac ctcggtttcc tgtcgtgcgc gtctgttgat cgagtgcttt cttaaacaat 180
gtgtgtcgat ccgtcgatgc tctcaacgcg accccaggtc aggcggggtt a 231
<210> 10
<211> 229
<212> DNA
<213> Rosa X centifolia L.
<400> 10
gtcgttgccc ccctaacccc ctcgggagtt ggatgggacg gatgatggcc tcccgtgtgc 60
tcagtcacgc ggttggcata aacaccaagt cctcggcgac caacgccacg acaatcggtg 120
gttgtcaaac ctcggtttcc tgtcgcgcgc gtgttgatcg agtgctttct taaacaatgc 180
gtgtcgattc gtcgatgctt acaacgcgac cccaggtcag gcggggtta 229
<210> 11
<211> 229
<212> DNA
<213> Rosa X centifolia L.
<400> 11
gtcgttgccc ccccaacccc ctcgggagtt ggatgggacg gatgatggcc tcccgtgtgc 60
tcagtcacgc ggttggcata aacaccaagt cctcggcgac caacgccacg acaatcggtg 120
gttgtcaaac ctcggtttcc tgtcgcgcgc gtgttgatcg agtgctttct taaacaatgc 180
gtgtcgattc gtcgatgctt acaacgcgac cccaggtcag gcggggtta 229
<210> 12
<211> 258
<212> DNA
<213> Rosa X damascena Herrm.
<400> 12
tcgaaacctg cctagcagaa cgacccgaga acatgtttca acgctggggg gcggagggtc 60
ttgcggctct gcgccccctt atcctaggag gcaagtgtct tgcgtgttgc atttcggtgc 120
ttgcgcttga tcgaccctcc caggcgtacc gaacaccggc gtgaattgcg ccaaggaact 180
tgaatgaaag agcgttcccc cgccgtcccg gagacggtgc tcgtgcgggt ggtttcgtcg 240
tcttcaatat gtctaaac 258
<210> 13
<211> 259
<212> DNA
<213> Rosa X damascena Herrm.
<400> 13
tcgaaacctg cctagcagaa cgacccgaga acatgtttca acgcttgggg gcggagggtc 60
ttgcggctct gcgccccctt atcctaggag gcaagtgtct tgcgcgttgc atttcggtgc 120
ttgcgcttga ccgaccctcc cgggcgtact gaacaccggc gtgaattgcg ccaaggaact 180
tgaatgaaag agcgtttccc ccgccgtccc ggagacggtg ctcgtgcggg tggtttcgtc 240
gtcttcaata tgtctaaac 259
<210> 14
<211> 258
<212> DNA
<213> Rosa X damascena Herrm.
<400> 14
tcgaaacctg cctagcagaa cgacccgaga acatgtttca acgcttgggg gcgtagggtc 60
ttacggctct gtgccccctt atcctaggag gcaagtgtct tgcgtgttgc atttcggtgc 120
tttcgcttga tcgaccctcc taggcgtact gaacaccggc gtgaattgcg ccaaggaact 180
tgaatgaaag agcgttcccc cgccgtcccg gagacggtgc tcgtgcgggt ggtttcgtcg 240
tcttcaatat gtctaaac 258
<210> 15
<211> 232
<212> DNA
<213> Rosa X damascena Herrm.
<400> 15
gtcgttgccc cccccaaccc cctcgggagt tggatgggac ggatgatggc ctcccgtgtg 60
ctcagtcacg cggttggcat aaataccaag tcctcggcga ccaacgccac gacaatcggt 120
ggttgtcaaa cctcggtttc ctgtcgtgcg cgcgtgttga tcgagtgctt tcttaaacaa 180
tgcgtgtcga tccgtcgatg ctttcaacgc gaccccaggt caggcggggt ta 232
<210> 16
<211> 231
<212> DNA
<213> Rosa X damascena Herrm.
<400> 16
gtcgttgccc cccccaaccc ctcgggagtt ggatgggacg gatgatggcc tcccgtgtgc 60
tcagtcacgc ggttggcata aataccaagt cctcggcgac caacgccacg acaatcggtg 120
gttgtcaaac ctcggtttcc tgtcgtgcgc gtctgttgat cgagtgcttt cttaaacaat 180
gtgtgtcgat ccgtcgatgc tctcaacgcg accccaggtc aggcggggtt a 231
<210> 17
<211> 229
<212> DNA
<213> Rosa X damascena Herrm.
<400> 17
gtcgttgccc ccctaacccc ctcgggagtt ggatgggacg gatgatggcc tcccgtgtgc 60
tcagtcacgc ggttggcata aacaccaagt cctcggcgac caacgccacg acaatcggtg 120
gttgtcaaac ctcggtttcc tgtcgcgcgc gtgttgatcg agtgctttct taaacaatgc 180
gtgtcgattc gtcgatgctt acaacgcgac cccaggtcag gcggggtta 229
<210> 18
<211> 229
<212> DNA
<213> Rosa X damascena Herrm.
<400> 18
gtcgttgccc ccccaacccc ctcgggagtt ggatgggacg gatgatggcc tcccgtgtgc 60
tcagtcacgc ggttggcata aacaccaagt cctcggcgac caacgccacg acaatcggtg 120
gttgtcaaac ctcggtttcc tgtcgcgcgc gtgttgatcg agtgctttct taaacaatgc 180
gtgtcgattc gtcgatgctt acaacgcgac cccaggtcag gcggggtta 229
<210> 19
<211> 258
<212> DNA
<213> Rosa 'Bajie Meigui'
<400> 19
tcgaaacctg cctagcagaa cgacccgaga acatgtttca acgcttgggg gcggagggtc 60
ttgcggctct gcgccccctt atcctaggag gcaagtgtct tgcgtgttgc atttcggtgc 120
ttccgcttga tcgaccctcc caggcgtact gaacaccggc gtgaattgcg ccaaggaact 180
tgaatgaaag agcgttcccc cgccgtcccg gagacggtgc tcgtgcgggt ggtttcgtcg 240
tcttcaatat gtctaaac 258
<210> 20
<211> 258
<212> DNA
<213> Rosa 'Bajie Meigui'
<400> 20
tcgaaacctg cctagcagaa cgacccgaga acatgtttca acgcttgggg gcggagggtc 60
tttcggcttt gcgccccctt atcctaggag gcaagtgtct tgtgtgttgc atttcggtgc 120
tttcacttga ccgaccctcc caggcgtact gaacaccggc gtgaattgcg ccaaggaact 180
tgaatgaaag agcgttcccc cgccgtcccg gagacggtgc tcgtgcgggt ggtttcgtcg 240
tcttcaatat gtctaaac 258
<210> 21
<211> 258
<212> DNA
<213> Rosa 'Bajie Meigui'
<400> 21
tcgaaacctg cctagcagaa cgacccgaga acatgtttca acgctggggg gcggagggtc 60
ttgcggctct gcgccccctt atcctaggag gcaagtgtct tgcgtgttgc atttcggtgc 120
ttgcgcttga tcgaccctcc caggcgtacc gaacaccggc gtgaattgcg ccaaggaact 180
tgaatgaaag agcgttcccc cgccgtcccg gagacggtgc tcgtgcgggt ggtttcgtcg 240
tcttcaatat gtctaaac 258
<210> 22
<211> 231
<212> DNA
<213> Rosa 'Bajie Meigui'
<400> 22
gtcgttgccc cccccaaccc ctcgggagtt ggatgggacg gatgatggcc tcccgtgtgc 60
tcagtcacgc ggttggcata aataccaagt cctcggcgac caacgccacg acaatcggtg 120
gttgtcaaac ctcggtttcc tgtcgtgcgc gcgtgttgat cgagtgcttt cttaaacaat 180
gcgtgtcgat cagtcgatgc ttacaacgcg accccaggtc aggcggggtt a 231
<210> 23
<211> 233
<212> DNA
<213> Rosa 'Bajie Meigui'
<400> 23
gtcgttgccc cccccaaccc cctcgggagt tggatggggc ggatgatggc ctcccgtgtg 60
ctcagtcacg cggttggcat taaataccaa gtcctcggcg accaacgcca cgacaatcgg 120
tggttgtcaa acctcggttt cctgtcgtgc gcgcgtgttg atcgagtgct ttcttaaaca 180
atgcgtgtcg atccgtcgat gcttacaacg cgaccccagg tcaggcgggg tta 233
<210> 24
<211> 229
<212> DNA
<213> Rosa 'Bajie Meigui'
<400> 24
gtcgttgccc ccctaacccc ctcgggagtt ggatgggacg gatgatggcc tcccgtgtgc 60
tcagtcacgc ggttggcata aacaccaagt cctcggcgac caacgccacg acaatcggtg 120
gttgtcaaac ctcggtttcc tgtcgcgcgc gtgttgatcg agtgctttct taaacaatgc 180
gtgtcgattc gtcgatgctt acaacgcgac cccaggtcag gcggggtta 229
<210> 25
<211> 258
<212> DNA
<213> Rosa 'Dianhong'
<400> 25
tcgaaacctg cctagcagaa cgacccgaga acatgtttca acgcttgggg gcggagggtc 60
ttgcggctct gcgccccctt atcctaggag gcaagtgtct tgcgtgttgc atttcggtgc 120
ttccgcttga tcgaccctcc caggcgtact gaacaccggc gtgaattgcg ccaaggaact 180
tgaatgaaag agcgttcccc cgccgtcccg gagacggtgc tcgtgcgggt ggtttcgtcg 240
tcttcaatat gtctaaac 258
<210> 26
<211> 258
<212> DNA
<213> Rosa 'Dianhong'
<400> 26
tcgaaacctg cctagcagaa cgacccgaga acatgtttca acgcttgggg gcggagggtc 60
tttcggcttt gcgccccctt atcctaggag gcaagtgtct tgtgtgttgc atttcggtgc 120
tttcacttga ccgaccctcc caggcgtact gaacaccggc gtgaattgcg ccaaggaact 180
tgaatgaaag agcgttcccc cgccgtcccg gagacggtgc tcgtgcgggt ggtttcgtcg 240
tcttcaatat gtctaaac 258
<210> 27
<211> 258
<212> DNA
<213> Rosa 'Dianhong'
<400> 27
tcgaaacctg cctagcagaa cgacccgaga acatgtttca acgctggggg gcggagggtc 60
ttgcggctct gcgccccctt atcctaggag gcaagtgtct tgcgtgttgc atttcggtgc 120
ttgcgcttga tcgaccctcc caggcgtacc gaacaccggc gtgaattgcg ccaaggaact 180
tgaatgaaag agcgttcccc cgccgtcccg gagacggtgc tcgtgcgggt ggtttcgtcg 240
tcttcaatat gtctaaac 258
<210> 28
<211> 231
<212> DNA
<213> Rosa 'Dianhong'
<400> 28
gtcgttgccc cccccaaccc ctcgggagtt ggatgggacg gatgatggcc tcccgtgtgc 60
tcagtcacgc ggttggcata aataccaagt cctcggcgac caacgccacg acaatcggtg 120
gttgtcaaac ctcggtttcc tgtcgtgcgc gcgtgttgat cgagtgcttt cttaaacaat 180
gcgtgtcgat cagtcgatgc ttacaacgcg accccaggtc aggcggggtt a 231
<210> 29
<211> 233
<212> DNA
<213> Rosa 'Dianhong'
<400> 29
gtcgttgccc cccccaaccc cctcgggagt tggatggggc ggatgatggc ctcccgtgtg 60
ctcagtcacg cggttggcat taaataccaa gtcctcggcg accaacgcca cgacaatcgg 120
tggttgtcaa acctcggttt cctgtcgtgc gcgcgtgttg atcgagtgct ttcttaaaca 180
atgcgtgtcg atccgtcgat gcttacaacg cgaccccagg tcaggcgggg tta 233
<210> 30
<211> 229
<212> DNA
<213> Rosa 'Dianhong'
<400> 30
gtcgttgccc ccctaacccc ctcgggagtt ggatgggacg gatgatggcc tcccgtgtgc 60
tcagtcacgc ggttggcata aacaccaagt cctcggcgac caacgccacg acaatcggtg 120
gttgtcaaac ctcggtttcc tgtcgcgcgc gtgttgatcg agtgctttct taaacaatgc 180
gtgtcgattc gtcgatgctt acaacgcgac cccaggtcag gcggggtta 229
<210> 31
<211> 258
<212> DNA
<213> Rosa 'Dingtao Meigui'
<400> 31
tcgaaacctg cctagcagaa cgacccgaga acatgtttca acgcttgggg gcggagggtc 60
ttgcggctct gcgccccctt atcctaggag gcaagtgtct tgcgtgttgc atttcggtgc 120
ttccgcttga tcgaccctcc caggcgtact gaacaccggc gtgaattgcg ccaaggaact 180
tgaatgaaag agcgttcccc cgccgtcccg gagacggtgc tcgtgcgggt ggtttcgtcg 240
tcttcaatat gtctaaac 258
<210> 32
<211> 258
<212> DNA
<213> Rosa 'Dingtao Meigui'
<400> 32
tcgaaacctg cctagcagaa cgacccgaga acatgtttca acgcttgggg gcggagggtc 60
tttcggcttt gcgccccctt atcctaggag gcaagtgtct tgtgtgttgc atttcggtgc 120
tttcacttga ccgaccctcc caggcgtact gaacaccggc gtgaattgcg ccaaggaact 180
tgaatgaaag agcgttcccc cgccgtcccg gagacggtgc tcgtgcgggt ggtttcgtcg 240
tcttcaatat gtctaaac 258
<210> 33
<211> 258
<212> DNA
<213> Rosa 'Dingtao Meigui'
<400> 33
tcgaaacctg cctagcagaa cgacccgaga acatgtttca acgctggggg gcggagggtc 60
ttgcggctct gcgccccctt atcctaggag gcaagtgtct tgcgtgttgc atttcggtgc 120
ttgcgcttga tcgaccctcc caggcgtacc gaacaccggc gtgaattgcg ccaaggaact 180
tgaatgaaag agcgttcccc cgccgtcccg gagacggtgc tcgtgcgggt ggtttcgtcg 240
tcttcaatat gtctaaac 258
<210> 34
<211> 231
<212> DNA
<213> Rosa 'Dingtao Meigui'
<400> 34
gtcgttgccc cccccaaccc ctcgggagtt ggatgggacg gatgatggcc tcccgtgtgc 60
tcagtcacgc ggttggcata aataccaagt cctcggcgac caacgccacg acaatcggtg 120
gttgtcaaac ctcggtttcc tgtcgtgcgc gcgtgttgat cgagtgcttt cttaaacaat 180
gcgtgtcgat cagtcgatgc ttacaacgcg accccaggtc aggcggggtt a 231
<210> 35
<211> 233
<212> DNA
<213> Rosa 'Dingtao Meigui'
<400> 35
gtcgttgccc cccccaaccc cctcgggagt tggatggggc ggatgatggc ctcccgtgtg 60
ctcagtcacg cggttggcat taaataccaa gtcctcggcg accaacgcca cgacaatcgg 120
tggttgtcaa acctcggttt cctgtcgtgc gcgcgtgttg atcgagtgct ttcttaaaca 180
atgcgtgtcg atccgtcgat gcttacaacg cgaccccagg tcaggcgggg tta 233
<210> 36
<211> 229
<212> DNA
<213> Rosa 'Dingtao Meigui'
<400> 36
gtcgttgccc ccctaacccc ctcgggagtt ggatgggacg gatgatggcc tcccgtgtgc 60
tcagtcacgc ggttggcata aacaccaagt cctcggcgac caacgccacg acaatcggtg 120
gttgtcaaac ctcggtttcc tgtcgcgcgc gtgttgatcg agtgctttct taaacaatgc 180
gtgtcgattc gtcgatgctt acaacgcgac cccaggtcag gcggggtta 229
<210> 37
<211> 258
<212> DNA
<213> Rosa 'Jinbian'
<400> 37
tcgaaacctg cctagcagaa cgacccgaga acatgtttca acgcttgggg gcggagggtc 60
ttgcggctct gcgccccctt atcctaggag gcaagtgtct tgcgtgttgc atttcggtgc 120
ttccgcttga tcgaccctcc caggcgtact gaacaccggc gtgaattgcg ccaaggaact 180
tgaatgaaag agcgttcccc cgccgtcccg gagacggtgc tcgtgcgggt ggtttcgtcg 240
tcttcaatat gtctaaac 258
<210> 38
<211> 258
<212> DNA
<213> Rosa 'Jinbian'
<400> 38
tcgaaacctg cctagcagaa cgacccgaga acatgtttca acgcttgggg gcggagggtc 60
ttgcggctct gcgccccctt atcctaggag gcaagggtct tgcgtgttgc atttcggtgc 120
tttcgcttga tcgaccctcc caggcgtact gaacaccggc gtgaattgcg ccaaggaact 180
tgaatgaaag agcgttcccc cgccgtcccg gagacggtgc tcgtgcgggt ggtttcgtcg 240
tcttcaatat gtctaaac 258
<210> 39
<211> 258
<212> DNA
<213> Rosa 'Jinbian'
<400> 39
tcgaaacctg cctagcagaa cgacccgaga acatgtttca acgcttgggg gcggagggtc 60
tttcggcttt gcgccccctt atcctaggag gcaagtgtct tgtgtgttgc atttcggtgc 120
tttcacttga ccgaccctcc caggcgtact gaacaccggc gtgaattgcg ccaaggaact 180
tgaatgaaag agcgttcccc cgccgtcccg gagacggtgc tcgtgcgggt ggtttcgtcg 240
tcttcaatat gtctaaac 258
<210> 40
<211> 258
<212> DNA
<213> Rosa 'Jinbian'
<400> 40
tcgaaacctg cctagcagaa cgacccgaga acatgtttca acgcttgggg gcggagggtc 60
ttgcggctct gcgccccctt atcctaggag gcaagtgtct tgcgtgttgc atttcggtgc 120
tttcgcttga tcgaccctcc caggcgtact gaacaccggc gtgaattgcg ccaaggaact 180
tgaatgaaag agcgttcccc cgccgtcccg gagacggtgc tcgtgcgggt ggtttcgtcg 240
tcttcaatat gtctaaac 258
<210> 41
<211> 231
<212> DNA
<213> Rosa 'Jinbian'
<400> 41
gtcgttgccc cccccaaccc ctcgggagtt ggatgggacg gatgatggcc tcccgtgtgc 60
tcagtcacgc ggttggcata aataccaagt cctcggcgac caacgccacg acaatcggtg 120
gttgtcaaac ctcggtttcc tgtcgtgcgc gcgtgttgat cgagtgcttt cttaaacaat 180
gcgtgtcgat cagtcgatgc ttacaacgcg accccaggtc aggcggggtt a 231
<210> 42
<211> 232
<212> DNA
<213> Rosa 'Jinbian'
<400> 42
gtcgttgccc cccccaaccc cctcgggagt tggatgggac ggatgatggc ctcccgtgtg 60
ctcagtcacg cggttggcat aaataccaag tcctcggcga ccaacgccac gacaatcggt 120
ggttgtcaaa cctcggtttc ctgtcgtgcg cgtctgttga tcgagtgctt tcttaaacaa 180
tgcgtgtcga tccgtcgatg ctttcaacgc gaccccaggt caggcggggt ta 232
<210> 43
<211> 233
<212> DNA
<213> Rosa 'Jinbian'
<400> 43
gtcgttgccc cccccaaccc cctcgggagt tggatggggc ggatgatggc ctcccgtgtg 60
ctcagtcacg cggttggcat taaataccaa gtcctcggcg accaacgcca cgacaatcgg 120
tggttgtcaa acctcggttt cctgtcgtgc gcgcgtgttg atcgagtgct ttcttaaaca 180
atgcgtgtcg atccgtcgat gcttacaacg cgaccccagg tcaggcgggg tta 233
<210> 44
<211> 259
<212> DNA
<213> Rosa 'Kushui'
<400> 44
tcgaaacctg cctagcagaa cgacccgaga acatgtttca acgcttgggg gcggagggtc 60
ttgcggctct gcgccccctc atcctaggag gcaagtgtct tgcgcgttgc atttcggtgc 120
ttgcgcttga ccgaccctcc cgggcgtact gaacaccggc gtgaattgcg ccaaggaact 180
tgaatgaaag agcgtttccc ccgccgtccc ggagacggtg ctcgtgcggg tggtttcgtc 240
gtcttcaata tgtctaaac 259
<210> 45
<211> 258
<212> DNA
<213> Rosa 'Kushui'
<400> 45
tcgaaacctg cctagcagaa cgacccgaga acatgtttca acgctcgggg gcggagggtc 60
ttgcggctct gcgccccctt atcctaggag gcaagtgtct tgcgtgttgc atttcggtgc 120
ttgcgcttga tcgaccctcc caggcgtact gaacaccggc gtgaattgcg ccaaggaact 180
tgaatgaaag agcgttcccc cgccgtcccg gagacggtgc tcgtgcgggt ggtttcgtcg 240
tcttcaatat gtctaaac 258
<210> 46
<211> 235
<212> DNA
<213> Rosa 'Kushui'
<400> 46
gtcgttgccc ccccccaacc ccccctcggg agttggatgg gacggatgat ggcctcccgt 60
gtgctcagtc acgcggttgg cataaatacc aagtcctcgg cgaccaacgc cacgacaatc 120
ggtggttgtc aaacctcggt ttcctgtcgt gcgcgcgtgt tgatcgagtg ctttcttaaa 180
caatgcgtgt cgatccgtcg atgctttcaa cgcgacccca ggtcaggcgg ggtta 235
<210> 47
<211> 231
<212> DNA
<213> Rosa 'Kushui'
<400> 47
gtcgttgccc ccccaacccc ctcgggagtt ggatgggacg gatgatggcc tcccgtgtgc 60
tcagtcacgc ggttggcata aataccaagt cctcggcgac caacgccacg acaatcggtg 120
gttgtcaaac ctcggtttcc tgtcgtgcgc gcgtgttgat cgagtgcttt cttaaacaat 180
gcgtgtcgat ccgtcgatgc tttcaacgcg accccaggtc aggcggggtt a 231
<210> 48
<211> 258
<212> DNA
<213> Rosa 'Ruoshuiming'
<400> 48
tcgaaacctg cctagcagaa cgacccgaga acatgtttca acgctggggg gcggagggtc 60
ttgcggctct gcgccccctt atcctaggag gcaagtgtct tgcgtgttgc atttcggtgc 120
ttgcgcttga tcgaccctcc caggcgtacc gaacaccggc gtgaattgcg ccaaggaact 180
tgaatgaaag agcgttcccc cgccgtcccg gagacggtgc tcgtgcgggt ggtttcgtcg 240
tcttcaatat gtctaaac 258
<210> 49
<211> 258
<212> DNA
<213> Rosa 'Ruoshuiming'
<400> 49
tcgaaacctg cctagcagaa cgacccgaga acatgtttca acgcttgggg gcgtagggtc 60
ttacggctct gtgccccctt atcctaggag gcaagtgtct tgcgtgttgc atttcggtgc 120
tttcgcttga tcgaccctcc taggcgtact gaacaccggc gtgaattgcg ccaaggaact 180
tgaatgaaag agcgttcccc cgccgtcccg gagacggtgc tcgtgcgggt ggtttcgtcg 240
tcttcaatat gtctaaac 258
<210> 50
<211> 259
<212> DNA
<213> Rosa 'Ruoshuiming'
<400> 50
tcgaaacctg cctagcagaa cgacccgaga acatgtttca acgcttgggg gcggagggtc 60
ttgcggctct gcgccccctt atcctaggag gcaagtgtct tgcgcgttgc atttcggtgc 120
ttgcgcttga ccgaccctcc cgggcgtact gaacaccggc gtgaattgcg ccaaggaact 180
tgaatgaaag agcgtttccc ccgccgtccc ggagacggtg ctcgtgcggg tggtttcgtc 240
gtcttcaata tgtctaaac 259
<210> 51
<211> 232
<212> DNA
<213> Rosa 'Ruoshuiming'
<400> 51
gtcgttgccc cccccaaccc cctcgggagt tggatgggac ggatgatggc ctcccgtgtg 60
ctcagtcacg cggttggcat aaataccaag tcctcggcga ccaacgccac gacaatcggt 120
ggttgtcaaa cctcggtttc ctgtcgtgcg cgcgtgttga tcgagtgctt tcttaaacaa 180
tgcgtgtcga tccgtcgatg ctttcaacgc gaccccaggt caggcggggt ta 232
<210> 52
<211> 231
<212> DNA
<213> Rosa 'Ruoshuiming'
<400> 52
gtcgttgccc cccccaaccc ctcgggagtt ggatgggacg gatgatggcc tcccgtgtgc 60
tcagtcacgc ggttggcata aataccaagt cctcggcgac caacgccacg acaatcggtg 120
gttgtcaaac ctcggtttcc tgtcgtgcgc gtctgttgat cgagtgcttt cttaaacaat 180
gtgtgtcgat ccgtcgatgc tctcaacgcg accccaggtc aggcggggtt a 231
<210> 53
<211> 229
<212> DNA
<213> Rosa 'Ruoshuiming'
<400> 53
gtcgttgccc ccccaacccc ctcgggagtt ggatgggacg gatgatggcc tcccgtgtgc 60
tcagtcacgc ggttggcata aacaccaagt cctcggcgac caacgccacg acaatcggtg 120
gttgtcaaac ctcggtttcc tgtcgcgcgc gtgttgatcg agtgctttct taaacaatgc 180
gtgtcgattc gtcgatgctt acaacgcgac cccaggtcag gcggggtta 229
<210> 54
<211> 229
<212> DNA
<213> Rosa 'Ruoshuiming'
<400> 54
gtcgttgccc ccctaacccc ctcgggagtt ggatgggacg gatgatggcc tcccgtgtgc 60
tcagtcacgc ggttggcata aacaccaagt cctcggcgac caacgccacg acaatcggtg 120
gttgtcaaac ctcggtttcc tgtcgcgcgc gtgttgatcg agtgctttct taaacaatgc 180
gtgtcgattc gtcgatgctt acaacgcgac cccaggtcag gcggggtta 229
<210> 55
<211> 258
<212> DNA
<213> Rosa 'Shangshui Meigui'
<400> 55
tcgaaacctg cctagcagaa cgacccgaga acatgtttca acgcttgggg gcggagggtc 60
ttgcggctct gcgccccctt atcctaggag gcaagtgtct tgcgtgttgc atttcggtgc 120
ttccgcttga tcgaccctcc caggcgtact gaacaccggc gtgaattgcg ccaaggaact 180
tgaatgaaag agcgttcccc cgccgtcccg gagacggtgc tcgtgcgggt ggtttcgtcg 240
tcttcaatat gtctaaac 258
<210> 56
<211> 258
<212> DNA
<213> Rosa 'Shangshui Meigui'
<400> 56
tcgaaacctg cctagcagaa cgacccgaga acatgtttca acgcttgggg gcggagggtc 60
tttcggcttt gcgccccctt atcctaggag gcaagtgtct tgtgtgttgc atttcggtgc 120
tttcacttga ccgaccctcc caggcgtact gaacaccggc gtgaattgcg ccaaggaact 180
tgaatgaaag agcgttcccc cgccgtcccg gagacggtgc tcgtgcgggt ggtttcgtcg 240
tcttcaatat gtctaaac 258
<210> 57
<211> 258
<212> DNA
<213> Rosa 'Shangshui Meigui'
<400> 57
tcgaaacctg cctagcagaa cgacccgaga acatgtttca acgcttgggg gcgtagggtc 60
ttacggctct gtgccccctt atcctaggag gcaagtgtct tgcgtgttgc atttcggtgc 120
tttcgcttga tcgaccctcc taggcgtact gaacaccggc gtgaattgcg ccaaggaact 180
tgaatgaaag agcgttcccc cgccgtcccg gagacggtgc tcgtgcgggt ggtttcgtcg 240
tcttcaatat gtctaaac 258
<210> 58
<211> 231
<212> DNA
<213> Rosa 'Shangshui Meigui'
<400> 58
gtcgttgccc cccccaaccc ctcgggagtt ggatgggacg gatgatggcc tcccgtgtgc 60
tcagtcacgc ggttggcata aataccaagt cctcggcgac caacgccacg acaatcggtg 120
gttgtcaaac ctcggtttcc tgtcgtgcgc gcgtgttgat cgagtgcttt cttaaacaat 180
gcgtgtcgat cagtcgatgc ttacaacgcg accccaggtc aggcggggtt a 231
<210> 59
<211> 233
<212> DNA
<213> Rosa 'Shangshui Meigui'
<400> 59
gtcgttgccc cccccaaccc cctcgggagt tggatggggc ggatgatggc ctcccgtgtg 60
ctcagtcacg cggttggcat taaataccaa gtcctcggcg accaacgcca cgacaatcgg 120
tggttgtcaa acctcggttt cctgtcgtgc gcgcgtgttg atcgagtgct ttcttaaaca 180
atgcgtgtcg atccgtcgat gcttacaacg cgaccccagg tcaggcgggg tta 233
<210> 60
<211> 231
<212> DNA
<213> Rosa 'Shangshui Meigui'
<400> 60
gtcgttgccc cccccaaccc ctcgggagtt ggatgggacg gatgatggcc tcccgtgtgc 60
tcagtcacgc ggttggcata aataccaagt cctcggcgac caacgccacg acaatcggtg 120
gttgtcaaac ctcggtttcc tgtcgtgcgc gtctgttgat cgagtgcttt cttaaacaat 180
gtgtgtcgat ccgtcgatgc tctcaacgcg accccaggtc aggcggggtt a 231
<210> 61
<211> 258
<212> DNA
<213> Rosa 'Tuwei'
<400> 61
tcgaaacctg cctagcagaa cgacccgaga acatgtttca acgctggggg gcggagggtc 60
ttgcggctct gcgccccctt atcctaggag gcaagtgtct tgcgtgttgc atttcggtgc 120
ttgcgcttga tcgaccctcc caggcgtacc gaacaccggc gtgaattgcg ccaaggaact 180
tgaatgaaag agcgttcccc cgccgtcccg gagacggtgc tcgtgcgggt ggtttcgtcg 240
tcttcaatat gtctaaac 258
<210> 62
<211> 259
<212> DNA
<213> Rosa 'Tuwei'
<400> 62
tcgaaacctg cctagcagaa cgacccgaga acatgtttca acgcttgggg gcggagggtc 60
ttgcggctct gcgccccctc atcctaggag gcaagtgtct tgcgcgttgc atttcggtgc 120
ttgcgcttga ccgaccctcc cgggcgtact gaacaccggc gtgaattgcg ccaaggaact 180
tgaatgaaag agcgtttccc ccgccgtccc ggagacggtg ctcgtgcggg tggtttcgtc 240
gtcttcaata tgtctaaac 259
<210> 63
<211> 258
<212> DNA
<213> Rosa 'Tuwei'
<400> 63
tcgaaacctg cctagcagaa cgacccgaga acatgtttca aggcttgggg gcggagggtc 60
ttgcggctct gcgccccctt atcctaggag gcaagtgtct tgcgtgttgc atttcggtgc 120
ttgtgcttga ccgaccctcc taggcgtact gaacaccggc gtgaattgcg ccaaggaact 180
tgaatgaaag agcgttcccc cgccgtcccg gagacggtgc tcgtgcgggt ggtttcgtcg 240
tcttcaatat gtctaaac 258
<210> 64
<211> 229
<212> DNA
<213> Rosa 'Tuwei'
<400> 64
gtcgttgccc ccccaacccc ctcgggagtt ggatgggacg gatgatggcc tcccgtgtgc 60
tcagtcacgc ggttggcata aacaccaagt cctcggcgac caacgccacg acaatcggtg 120
gttgtcaaac ctcggtttcc tgtcgcgcgc gtgttgatcg agtgctttct taaacaatgc 180
gtgtcgattc gtcgatgctt acaacgcgac cccaggtcag gcggggtta 229
<210> 65
<211> 235
<212> DNA
<213> Rosa 'Tuwei'
<400> 65
gtcgttgccc ccccccaacc ccccctcggg agttggatgg gacggatgat ggcctcccgt 60
gtgctcagtc acgcggttgg cataaatacc aagtcctcgg cgaccaacgc cacgacaatc 120
ggtggttgtc aaacctcggt ttcctgtcgt gcgcgcgtgt tgatcgagtg ctttcttaaa 180
caatgcgtgt cgatccgtcg atgctttcaa cgcgacccca ggtcaggcgg ggtta 235
<210> 66
<211> 229
<212> DNA
<213> Rosa 'Tuwei'
<400> 66
gtcgttgccc ccctaacccc ctcgggagtt ggatgggacg gatgatggcc tcccgtgtgc 60
tcagtcacgc ggttggcata aacaccaagt cctcggcgac caacgccacg acaatcggtg 120
gttgtcaaac ctcggtttcc tgtcgcgcgc gtgttgatcg agtgctttct taaacaatgc 180
gtgtcgattc gtcgatgctt acaacgcgac cccaggtcag gcggggtta 229
<210> 67
<211> 231
<212> DNA
<213> Rosa 'Tuwei'
<400> 67
gtcgttgccc ccccaacccc ctcgggagtt ggatgggacg gatgatggcc tcccgtgtgc 60
tcagtcacgc ggttggcata aataccaagt cctcggcgac caacgccacg acaatcggtg 120
gttgtcaaac ctcggtttcc tgtcgtgcgc gcgtgttgat cgagtgcttt cttaaacaat 180
gcgtgtcgat ccgtcgatgc tttcaacgcg accccaggtc aggcggggtt a 231
<210> 68
<211> 234
<212> DNA
<213> Rosa 'Tuwei'
<400> 68
gtcgttgccc cccccaaccc cccctcggga gttggatggg acggatgatg gcctcccgtg 60
tgctcagtca cgcggttggc ataaatacca agtcctcggc gaccaacgcc acgacaatcg 120
gtggttgtca aacctcggtt tcctgtcgtg cgcgcgtgtt gatcgagtgc tttcttaaac 180
aatgcgtgtc gatccgtcga tgctttcaac gcgaccccag gtcaggcggg gtta 234
<210> 69
<211> 258
<212> DNA
<213> Rosa 'Crimson Glory'
<400> 69
tcgaaacctg cctagcagaa cgacccgaga acatgtttca acgctggggg gcggagggtc 60
ttgcggctct gcgccccctt atcctaggag gcaagtgtct tgcgtgttgc atttcggtgc 120
ttgcgcttga tcgaccctcc caggcgtacc gaacaccggc gtgaattgcg ccaaggaact 180
tgaatgaaag agcgttcccc cgccgtcccg gagacggtgc tcgtgcgggt ggtttcgtcg 240
tcttcaatat gtctaaac 258
<210> 70
<211> 258
<212> DNA
<213> Rosa 'Crimson Glory'
<400> 70
tcgaaacctg cctagcagaa cgacccgaga acatgtttca acgcttgggg gcggagggtc 60
ttgcggctct gcgccccctt atcctaggag gcaagtgtct tgcgtgttgc atttcggtgc 120
ttccgcttga tcgaccctcc caggcgtact gaacaccggc gtgaattgcg ccaaggaact 180
tgaatgaaag agcgttcccc cgccgtcccg gagacggtgc tcgtgcgggt ggtttcgtcg 240
tcttcaatat gtctaaac 258
<210> 71
<211> 229
<212> DNA
<213> Rosa 'Crimson Glory'
<400> 71
gtcgttgccc ccctaacccc ctcgggagtt ggatgggacg gatgatggcc tcccgtgtgc 60
tcagtcacgc ggttggcata aacaccaagt cctcggcgac caacgccacg acaatcggtg 120
gttgtcaaac ctcggtttcc tgtcgcgcgc gtgttgatcg agtgctttct taaacaatgc 180
gtgtcgattc gtcgatgctt acaacgcgac cccaggtcag gcggggtta 229
<210> 72
<211> 231
<212> DNA
<213> Rosa 'Crimson Glory'
<400> 72
gtcgttgccc cccccaaccc ctcgggagtt ggatgggacg gatgatggcc tcccgtgtgc 60
tcagtcacgc ggttggcata aataccaagt cctcggcgac caacgccacg acaatcggtg 120
gttgtcaaac ctcggtttcc tgtcgtgcgc gcgtgttgat cgagtgcttt cttaaacaat 180
gcgtgtcgat cagtcgatgc ttacaacgcg accccaggtc aggcggggtt a 231
<210> 73
<211> 259
<212> DNA
<213> Rosa 'Fenghua'
<400> 73
tcgaaacctg cctagcagaa cgacccgaga acatgtttca acgcttgggg gcggagggtc 60
ttgcggctct gcgccccctt atcctaggag gcaagtgtct tgcgcgttgc atttcggtgc 120
ttgcgcttga ccgaccctcc cgggcgtact gaacaccggc gtgaattgcg ccaaggaact 180
tgaatgaaag agcgtttccc ccgccgtccc ggagacggtg ctcgtgcggg tggtttcgtc 240
gtcttcaata tgtctaaac 259
<210> 74
<211> 259
<212> DNA
<213> Rosa 'Fenghua'
<400> 74
tcgaaacctg cctagcagaa cgacccgaga acatgtttca acgcttgggg gcggagggtc 60
ttgcggctct gcgccccctc atcctaggag gcaagtgtct tgcgcgttgc atttcggtgc 120
ttgcgcttga ccgaccctcc cgggcgtact gaacaccggc gtgaattgcg ccaaggaact 180
tgaatgaaag agcgtttccc ccgccgtccc ggagacggtg ctcgtgcggg tggtttcgtc 240
gtcttcaata tgtctaaac 259
<210> 75
<211> 232
<212> DNA
<213> Rosa 'Fenghua'
<400> 75
gtcgttgccc cccccaaccc cctcgggagt tggatgggac ggatgatggc ctcccgtgtg 60
ctcagtcacg cggttggcat aaataccaag tcctcggcga ccaacgccac gacaatcggt 120
ggttgtcaaa cctcggtttc ctgtcgtgcg cgcgtgttga tcgagtgctt tcttaaacaa 180
tgcgtgtcga tctgtcgatg ctttcaacgc gaccccaggt caggcggggt ta 232
<210> 76
<211> 235
<212> DNA
<213> Rosa 'Fenghua'
<400> 76
gtcgttgccc ccccccaacc ccccctcggg agttggatgg gacggatgat ggcctcccgt 60
gtgctcagtc acgcggttgg cataaatacc aagtcctcgg cgaccaacgc cacgacaatc 120
ggtggttgtc aaacctcggt ttcctgtcgt gcgcgcgtgt tgatcgagtg ctttcttaaa 180
caatgcgtgt cgatccgtcg atgctttcaa cgcgacccca ggtcaggcgg ggtta 235
<210> 77
<211> 259
<212> DNA
<213> Rosa 'Guo Meigui'
<400> 77
tcgaaacctg cctagcagaa cgacccgaga acatgtttca acgcttgggg gcggagggtc 60
ttgcggctct gcgccccctt atcctaggag gcaagtgtct tgcgcgttgc atttcggtgc 120
ttgcgcttga ccgaccctcc cgggcgtact gaacaccggc gtgaattgcg ccaaggaact 180
tgaatgaaag agcgtttccc ccgccgtccc ggagacggtg ctcgtgcggg tggtttcgtc 240
gtcttcaata tgtctaaac 259
<210> 78
<211> 259
<212> DNA
<213> Rosa 'Guo Meigui'
<400> 78
tcgaaacctg cctagcagaa cgacccgaga acatgtttca acgcttgggg gcggagggtc 60
ttgcggctct gcgccccctc atcctaggag gcaagtgtct tgcgcgttgc atttcggtgc 120
ttgcgcttga ccgaccctcc cgggcgtact gaacaccggc gtgaattgcg ccaaggaact 180
tgaatgaaag agcgtttccc ccgccgtccc ggagacggtg ctcgtgcggg tggtttcgtc 240
gtcttcaata tgtctaaac 259
<210> 79
<211> 232
<212> DNA
<213> Rosa 'Guo Meigui'
<400> 79
gtcgttgccc cccccaaccc cctcgggagt tggatgggac ggatgatggc ctcccgtgtg 60
ctcagtcacg cggttggcat aaataccaag tcctcggcga ccaacgccac gacaatcggt 120
ggttgtcaaa cctcggtttc ctgtcgtgcg cgcgtgttga tcgagtgctt tcttaaacaa 180
tgcgtgtcga tctgtcgatg ctttcaacgc gaccccaggt caggcggggt ta 232
<210> 80
<211> 235
<212> DNA
<213> Rosa 'Guo Meigui'
<400> 80
gtcgttgccc ccccccaacc ccccctcggg agttggatgg gacggatgat ggcctcccgt 60
gtgctcagtc acgcggttgg cataaatacc aagtcctcgg cgaccaacgc cacgacaatc 120
ggtggttgtc aaacctcggt ttcctgtcgt gcgcgcgtgt tgatcgagtg ctttcttaaa 180
caatgcgtgt cgatccgtcg atgctttcaa cgcgacccca ggtcaggcgg ggtta 235
<210> 81
<211> 259
<212> DNA
<213> Rosa 'Miaofengshan'
<400> 81
tcgaaacctg cctagcagaa cgacccgaga acatgtttca acgcttgggg gcggagggtc 60
ttgcggctct gcgccccctt atcctaggag gcaagtgtct tgcgcgttgc atttcggtgc 120
ttgcgcttga ccgaccctcc cgggcgtact gaacaccggc gtgaattgcg ccaaggaact 180
tgaatgaaag agcgtttccc ccgccgtccc ggagacggtg ctcgtgcggg tggtttcgtc 240
gtcttcaata tgtctaaac 259
<210> 82
<211> 259
<212> DNA
<213> Rosa 'Miaofengshan'
<400> 82
tcgaaacctg cctagcagaa cgacccgaga acatgtttca acgcttgggg gcggagggtc 60
ttgcggctct gcgccccctc atcctaggag gcaagtgtct tgcgcgttgc atttcggtgc 120
ttgcgcttga ccgaccctcc cgggcgtact gaacaccggc gtgaattgcg ccaaggaact 180
tgaatgaaag agcgtttccc ccgccgtccc ggagacggtg ctcgtgcggg tggtttcgtc 240
gtcttcaata tgtctaaac 259
<210> 83
<211> 232
<212> DNA
<213> Rosa 'Miaofengshan'
<400> 83
gtcgttgccc cccccaaccc cctcgggagt tggatgggac ggatgatggc ctcccgtgtg 60
ctcagtcacg cggttggcat aaataccaag tcctcggcga ccaacgccac gacaatcggt 120
ggttgtcaaa cctcggtttc ctgtcgtgcg cgcgtgttga tcgagtgctt tcttaaacaa 180
tgcgtgtcga tctgtcgatg ctttcaacgc gaccccaggt caggcggggt ta 232
<210> 84
<211> 235
<212> DNA
<213> Rosa 'Miaofengshan'
<400> 84
gtcgttgccc ccccccaacc ccccctcggg agttggatgg gacggatgat ggcctcccgt 60
gtgctcagtc acgcggttgg cataaatacc aagtcctcgg cgaccaacgc cacgacaatc 120
ggtggttgtc aaacctcggt ttcctgtcgt gcgcgcgtgt tgatcgagtg ctttcttaaa 180
caatgcgtgt cgatccgtcg atgctttcaa cgcgacccca ggtcaggcgg ggtta 235
<210> 85
<211> 259
<212> DNA
<213> Rosa 'Zizhi'
<400> 85
tcgaaacctg cctagcagaa cgacccgaga acatgtttca acgcttgggg gcggagggtc 60
ttgcggctct gcgccccctc atcctaggag gcaagtgtct tgcgcgttgc atttcggtgc 120
ttgcgcttga ccgaccctcc cgggcgtact gaacaccggc gtgaattgcg ccaaggaact 180
tgaatgaaag agcgtttccc ccgccgtccc ggagacggtg ctcgtgcggg tggtttcgtc 240
gtcttcaata tgtctaaac 259
<210> 86
<211> 232
<212> DNA
<213> Rosa 'Zizhi'
<400> 86
gtcgttgccc cccccaaccc cctcgggagt tggatgggac ggatgatggc ctcccgtgtg 60
ctcagtcacg cggttggcat aaataccaag tcctcggcga ccaacgccac gacaatcggt 120
ggttgtcaaa cctcggtttc ctgtcgtgcg cgcgtgttga tcgagtgctt tcttaaacaa 180
tgcgtgtcga tccgtcgatg ctttcaacgc gaccccaggt caggcggggt ta 232
<210> 87
<211> 235
<212> DNA
<213> Rosa 'Zizhi'
<400> 87
gtcgttgccc ccccccaacc ccccctcggg agttggatgg gacggatgat ggcctcccgt 60
gtgctcagtc acgcggttgg cataaatacc aagtcctcgg cgaccaacgc cacgacaatc 120
ggtggttgtc aaacctcggt ttcctgtcgt gcgcgcgtgt tgatcgagtg ctttcttaaa 180
caatgcgtgt cgatccgtcg atgctttcaa cgcgacccca ggtcaggcgg ggtta 235
<210> 88
<211> 232
<212> DNA
<213> Rosa 'Zizhi'
<400> 88
gtcgttgccc cccccaaccc cctcaggagt tggatgggac ggatgatggc ctcccgtgtg 60
ctcagtcacg cggttggcat aaataccaag tcctcggcga ccaacgccac gacaatcggt 120
ggttgtcaaa cctcggtttc ctgtcgtgcg cgcgtgttga tcgagtgctc tcttaaacaa 180
tgtgtgtcga tccgtcgatg ctttcaacgc gaccccaggt caggcggggt ta 232
<210> 89
<211> 232
<212> DNA
<213> Rosa 'Zizhi'
<400> 89
gtcgttgccc cccccaaccc cctcaggagt tggatgggac ggatgatggc ctcccgtgtg 60
ctcagtcacg cggttggcat aaataccaag tcctcggcga ccaacgccac gacaatcggt 120
ggttgtcaaa cctcggtttc ctgtcgtgcg cgcgtgttga tcgagtgctc tcttaaacaa 180
tgcgtgtcga tccgtcgatg ctttcaacgc gaccccaggt caggcggggt ta 232

Claims (9)

1.组装蔷薇科样本ITSs序列的方法,所述方法包含以下步骤
1)制备待测样本的总DNA的二代测序文库;
2)将所述二代测序文库进行测序,得到测序数据;
3)将所述测序数据分别进行ITS1、ITS2序列拼接和注释,所述ITS1、ITS2序列拼接和注释包括:以任一蔷薇科品种的核糖体DNA为rDNA参考序列,将所述测序数据回贴到所述rDNA参考序列上富集ITS1和ITS2区的读序,标记每一个多样性位点的覆盖度和碱基组成;利用富集到的读序进行从头组装,选择保留变异信息,得到重叠群,然后将得到的重叠群重新回贴到rDNA参考序列,查找ITS1和ITS2区的重叠群,依据读序回贴标记的所述多样性位点的信息提取出重叠群,作为可靠的ITS1和ITS2序列。
2.如权利要求1所述的方法,其特征是,提取出的所述重叠群的覆盖度≥5%。
3.如权利要求1所述的方法,其特征是,步骤2)所述测序的单条读序的读长≥100碱基,如为≥150碱基。
4.如权利要求1所述的方法,其特征是,步骤2)所得测序数据为浅层测序数据,其数据量可≥1Gb,如≥2Gb。
5.任一在先权利要求所述方法在鉴别蔷薇属样本家系中的应用,该应用包括:
0)根据在先权利要求所述方法组装出至少一种蔷薇属植物的ITSs序列,汇总该ITSs序列信息及所属物种的叶绿体基因组序列,得到蔷薇属样本指纹库;
1)根据在先权利要求所述方法组装出待鉴别样本X的ITSs序列,并获得该样本X的叶绿体基因组序列;
2)进行样本X与所述指纹库物种的叶绿体基因组、ITS1、ITS2序列比对,以鉴别样本X与该指纹库中物种的家系关系。
6.如权利要求5所述的应用,其特征是,步骤2)鉴别家系关系的操作中,当样本X与所述指纹库中第1种和第2种蔷薇属植物进行所述序列比对的结果均为序列不一致时,步骤2)还包括进化树构建及家系关系推测。
7.ITSs序列,其选自下表所示任一品种的ITSs序列:
学名 中文名 ITS1各单倍型序列号 ITS2各单倍型序列号 Rosa rugosa'Plena' ‘重瓣红玫瑰’ SEQ ID NO.1-2 SEQ ID NO.3-4 Rosa×centifolia L. ‘千叶玫瑰’ SEQ ID NO.5-7 SEQ ID NO.8-11 Rosa×damascenaHerrm. ‘大马士革’ SEQ ID NO.12-14 SEQ ID NO.15-18 Rosa'Bajie Meigui' ‘八街玫瑰’ SEQ ID NO.19-21 SEQ ID NO.22-24 Rosa'Dianhong' ‘滇红玫瑰’ SEQ ID NO.25-27 SEQ ID NO.28-30 Rosa'Dingtao Meigui' ‘定陶玫瑰’ SEQ ID NO.31-33 SEQ ID NO.34-36 Rosa'Jinbian' ‘金边玫瑰’ SEQ ID NO.37-40 SEQ ID NO.41-43 Rosa'Kushui' ‘苦水玫瑰’ SEQ ID NO.44-45 SEQ ID NO.46-47 Rosa'Ruoshuiming' ‘若水茗’ SEQ ID NO.48-50 SEQ ID NO.51-54 Rosa'Shangshui Meigui' ‘商水玫瑰’ SEQ ID NO.55-57 SEQ ID NO.58-60 Rosa'Tuwei' ‘荼薇花’ SEQ ID NO.61-63 SEQ ID NO.64-68 Rosa'Crimson Glory' ‘墨红玫瑰’ SEQ ID NO.69-70 SEQ ID NO.71-72 Rosa'Fenghua' ‘丰花玫瑰’ SEQ ID NO.73-74 SEQ ID NO.75-76 Rosa'Guo Meigui' ‘果玫瑰’ SEQ ID NO.77-78 SEQ ID NO.79-80 Rosa'Miaofengshan' ‘妙峰山玫瑰’ SEQ ID NO.81-82 SEQ ID NO.83-84 Rosa'Zizhi' ‘紫枝玫瑰’ SEQ ID NO.85 SEQ ID NO.86-89
8.含前一权利要求所述ITSs序列的鉴别用指纹库,该指纹库还含有所含玫瑰品种的叶绿体基因组序列。
9.如前一权利要求所述的鉴别用指纹库,该指纹库所含玫瑰品种有‘重瓣红玫瑰’,优选还含有权利要求7表格中的其他1-15种玫瑰品种。
CN202110640825.XA 2021-06-09 2021-06-09 从二代测序数据挖掘植物ITSs序列并用于鉴别品种家系 Active CN113160893B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110640825.XA CN113160893B (zh) 2021-06-09 2021-06-09 从二代测序数据挖掘植物ITSs序列并用于鉴别品种家系

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110640825.XA CN113160893B (zh) 2021-06-09 2021-06-09 从二代测序数据挖掘植物ITSs序列并用于鉴别品种家系

Publications (2)

Publication Number Publication Date
CN113160893A true CN113160893A (zh) 2021-07-23
CN113160893B CN113160893B (zh) 2022-08-19

Family

ID=76875877

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110640825.XA Active CN113160893B (zh) 2021-06-09 2021-06-09 从二代测序数据挖掘植物ITSs序列并用于鉴别品种家系

Country Status (1)

Country Link
CN (1) CN113160893B (zh)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102191318A (zh) * 2011-03-04 2011-09-21 广州中医药大学 rDNA ITS-D3区核苷酸序列在建立药用植物DNA条形码鉴别系统中的应用
CN106636433A (zh) * 2017-01-24 2017-05-10 华南农业大学 桑葚病原菌高通量鉴定及种属分类方法及其应用
CN107400723A (zh) * 2017-09-15 2017-11-28 山东大学 种子植物物种的鉴定方法和用途
CN107590362A (zh) * 2017-08-21 2018-01-16 武汉菲沙基因信息有限公司 一种基于长读序测序判断重叠组装正误的方法
CN109762919A (zh) * 2018-12-29 2019-05-17 浙江医药高等专科学校 一种快速鉴别覆盆子及其多种混淆品的方法
CN110438215A (zh) * 2019-06-28 2019-11-12 西安医学院 一种利用its2序列鉴别鼠曲草属植物品种的方法
CN110656196A (zh) * 2019-09-30 2020-01-07 宁波城市职业技术学院 能够准确测定浙闽樱its的碱基序列的引物组、合成与快速分子鉴定
CN112080557A (zh) * 2020-08-25 2020-12-15 扬州大学 一种基于dna条形码的冬虫夏草产地鉴定方法
CN112322634A (zh) * 2020-11-16 2021-02-05 北京农业生物技术研究中心 一种用于百合属植物鉴定的dna条形码及其应用
CN112349350A (zh) * 2020-11-09 2021-02-09 山西大学 基于一种杜氏藻核心基因组序列进行品系鉴定的方法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102191318A (zh) * 2011-03-04 2011-09-21 广州中医药大学 rDNA ITS-D3区核苷酸序列在建立药用植物DNA条形码鉴别系统中的应用
CN106636433A (zh) * 2017-01-24 2017-05-10 华南农业大学 桑葚病原菌高通量鉴定及种属分类方法及其应用
CN107590362A (zh) * 2017-08-21 2018-01-16 武汉菲沙基因信息有限公司 一种基于长读序测序判断重叠组装正误的方法
CN107400723A (zh) * 2017-09-15 2017-11-28 山东大学 种子植物物种的鉴定方法和用途
CN109762919A (zh) * 2018-12-29 2019-05-17 浙江医药高等专科学校 一种快速鉴别覆盆子及其多种混淆品的方法
CN110438215A (zh) * 2019-06-28 2019-11-12 西安医学院 一种利用its2序列鉴别鼠曲草属植物品种的方法
CN110656196A (zh) * 2019-09-30 2020-01-07 宁波城市职业技术学院 能够准确测定浙闽樱its的碱基序列的引物组、合成与快速分子鉴定
CN112080557A (zh) * 2020-08-25 2020-12-15 扬州大学 一种基于dna条形码的冬虫夏草产地鉴定方法
CN112349350A (zh) * 2020-11-09 2021-02-09 山西大学 基于一种杜氏藻核心基因组序列进行品系鉴定的方法
CN112322634A (zh) * 2020-11-16 2021-02-05 北京农业生物技术研究中心 一种用于百合属植物鉴定的dna条形码及其应用

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
蒲星宇 等: "密脉鹅掌柴居群的ITS1和ITS2分子鉴定研究", 《时珍国医国药》 *

Also Published As

Publication number Publication date
CN113160893B (zh) 2022-08-19

Similar Documents

Publication Publication Date Title
Şakiroğlu et al. Inferring population structure and genetic diversity of broad range of wild diploid alfalfa (Medicago sativa L.) accessions using SSR markers
Solomon et al. Genetic diversity and population structure of Ethiopian Capsicum germplasms
Li et al. Genetic divergence and population structure in weedy and cultivated broomcorn millets (Panicum miliaceum L.) revealed by specific-locus amplified fragment sequencing (SLAF-Seq)
CN114875169A (zh) 基于黄连全基因组开发的ssr分子标记引物组及其应用
KR101493982B1 (ko) 품종인식 코드화 시스템 및 이를 이용한 코드화 방법
Abera et al. Back to the roots: defining the core microbiome of Sorghum bicolor in agricultural field soils from the centre of origin
Güler et al. Diversity and association mapping assessment of an untouched native grapevine genetic resource by iPBS retrotransposon markers
Hasing et al. Extensive phenotypic diversity in the cultivated Florist’s Gloxinia, Sinningia speciosa (Lodd.) Hiern, is derived from the domestication of a single founder population
CN113160893B (zh) 从二代测序数据挖掘植物ITSs序列并用于鉴别品种家系
Slonecki et al. Genetic diversity, population structure, and selection of breeder germplasm subsets from the USDA sweetpotato (Ipomoea batatas) collection
KR102108751B1 (ko) 오이 순도검정 및 품종판별을 위한 단일염기다형성 탐침
Zhang et al. Genetic diversity study on geographical populations of the multipurpose species Elsholtzia stauntonii using transferable microsatellite markers
Matsuda et al. Tight species cohesion among sympatric insular wild gingers (Asarum spp. Aristolochiaceae) on continental islands: Highly differentiated floral characteristics versus undifferentiated genotypes
Auvira et al. Genetic variability analysis of terrestrial Spathoglottis plicata orchid variants based on RAPD marker
Osman et al. Genetic diversity among four Eucalyptus species (myrtaceae) based on random amplified polymorphic DNA (RAPD) analysis
CN112322634A (zh) 一种用于百合属植物鉴定的dna条形码及其应用
Wang et al. Morphology and SSR markers-based genetic diversity analysis of sesame (Sesamum indicum L.) cultivars released in China
Shitta et al. Genetic diversity and population structure of an African yam bean (Sphenostylis stenocarpa) collection from IITA GenBank
Wang et al. Develop a preliminary core germplasm with the novel polymorphism EST-SSRs derived from three transcriptomes of colored calla lily (Zantedeschia hybrida)
Acquadro et al. Retrotransposon-based S-SAP as a platform for the analysis of genetic variation and linkage in globe artichoke
Sekridova et al. Molecular Genetic Analysis of Autochthonous Grape Varieties (Vitis Vinifera L.) from Different Ecological and Geographical Proles
Natsume et al. Whole genome sequencing of a wild yam species Dioscorea tokoro reveals a genomic region associated with sex
Korpelainen et al. Insights into historic and genetic relationships of diverse common lilac (Syringa vulgaris) genotypes based on whole-genome profiling
Hajari et al. Sequence-related amplified polymorphism markers-a tool for litchi breeders in Africa
Razvi et al. Molecular diversity and gene pool structure in common bean (Phaseolus vulgaris L.): a review

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant