CN116072229B - 一种用于油橄榄品种鉴定的种质资源数据库及其构建方法和应用 - Google Patents

一种用于油橄榄品种鉴定的种质资源数据库及其构建方法和应用 Download PDF

Info

Publication number
CN116072229B
CN116072229B CN202211132152.8A CN202211132152A CN116072229B CN 116072229 B CN116072229 B CN 116072229B CN 202211132152 A CN202211132152 A CN 202211132152A CN 116072229 B CN116072229 B CN 116072229B
Authority
CN
China
Prior art keywords
olive
variety
pairs
primers
varieties
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202211132152.8A
Other languages
English (en)
Other versions
CN116072229A (zh
Inventor
曾艳飞
黄兰
张建国
闫鹏程
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Research Institute of Forestry of Chinese Academy of Forestry
Original Assignee
Research Institute of Forestry of Chinese Academy of Forestry
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Research Institute of Forestry of Chinese Academy of Forestry filed Critical Research Institute of Forestry of Chinese Academy of Forestry
Priority to CN202211132152.8A priority Critical patent/CN116072229B/zh
Publication of CN116072229A publication Critical patent/CN116072229A/zh
Application granted granted Critical
Publication of CN116072229B publication Critical patent/CN116072229B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • G16B50/30Data warehousing; Computing architectures
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6858Allele-specific amplification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • C12Q1/6895Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for plants, fungi or algae
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/20Polymerase chain reaction [PCR]; Primer or probe design; Probe optimisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • General Health & Medical Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Theoretical Computer Science (AREA)
  • Medical Informatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Zoology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Evolutionary Biology (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Bioethics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Databases & Information Systems (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Botany (AREA)
  • Mycology (AREA)
  • Software Systems (AREA)
  • Public Health (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Epidemiology (AREA)
  • Data Mining & Analysis (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明公开一种用于油橄榄品种鉴定的种质资源数据库及其构建方法和应用,属于生物技术领域。本发明提供的用于油橄榄品种鉴定的种质资源数据库包括52个油橄榄品种的针对每一个油橄榄品种的至少90个多态位点的核苷酸序列数据,可用于区分国内所有常见、近缘的油橄榄品种,能够用于高准确度和高可靠性鉴定油橄榄品种,并且本发明可使得油橄榄品种鉴定流程简单、价格实惠。

Description

一种用于油橄榄品种鉴定的种质资源数据库及其构建方法和 应用
技术领域
本发明属于生物技术领域,具体涉及一种用于油橄榄品种鉴定的种质资源数据库及其构建方法和应用。
背景技术
油橄榄(Olea europaea subsp.europaea var.europaea L.)为木犀科(Oleaceae)木犀榄属(Olea L.)常绿乔木,是世界著名木本油料兼果用作物。新鲜油橄榄果实直接冷榨而成的特级初榨橄榄油,没有经过加热和化学处理保留最原始的风味,含有85%左右的不饱和脂肪酸,天然抗氧化剂如酚类、胡萝卜素、角鲨烷等丰富,具有预防心血管疾病,促进骨骼和神经系统发育功能,是食用油脂中最有益于人体健康的植物油,被誉为‘液体黄金’。
我国自20世纪60年大规模引种油橄榄,近年来油橄榄种植面积逐年增长。但由于油橄榄栽培品种本身存在同名异物和异名同物,加上历经多次引种和砍伐,导致我国油橄榄品种混乱、种质资源不清楚。厘清国内现有油橄榄品种,构建完整的油橄榄种质资源库,对我国油橄榄引种栽培和本土育种有着重要意义。
多年来,人们开发了不同类型的分子标记,如RAPD、AFLP、SRAP、SSR和SNP等对油橄榄进行品种鉴定。其中,SSR标记应用最广,且常用来构建品种遗传数据库。但是,由于机器和人为误差的存在,SSR基因型判读容易出错,造成鉴定偏差。基于SNP信息鉴定品种更准确,但是少量SNP位点的难以分辨近缘品种;位点太多则检测费用高昂、数据分析复杂。
发明内容
针对现有技术中存在的一个或多个问题,本发明一个方面提供一种用于油橄榄品种鉴定的种质资源数据库,其包括利用序列表中SEQ ID NO:1-200所示的100对引物中的至少90对引物分别对52个油橄榄品种的DNA进行PCR扩增所获得的针对每一个油橄榄品种的至少90个位点的核苷酸序列数据;
其中所述52个油橄榄品种为:‘米提尼(Adramittini)’、‘阿托斯(Agiou Orous)’、‘阿戈尔(Amyglalolia)’、‘豆果(Arbequina)’、‘阿尔波萨娜(Arbosana)’、‘阿斯(Ascolana)’、‘巴尼亚(Barnea)’、‘贝拉(Berat)’、‘边克利拉(Biancolila)’、‘栾桂塔(Blanquette de Guelma)’、‘巴利奥(Borriol de Castellón)’、‘城固32号(Chenggu32)’‘城固53号(Chenggu53)’、‘德里达(Dritto)’、‘爱桑(Elbasan)’、‘安皮特(Empeltre)’、‘鄂植8号(Ezhi8)’、‘佛奥(Frantoio)’、‘科新佛奥(Frantoio de Corsini)’、‘果大尔(GordalSevillana)’、戈达尔(Gordal del Somontano)’、‘格洛桑(Gorossanne)’、‘格里昂(Grignan)’、‘贺吉(Hojiblanca)’、‘华欧9(Huaou9)’、‘卡拉蒙(Kalamon)’、‘孔色(Konservolia)’、‘科罗莱卡(Koroneiki)’、‘卡林(Kalinjot)’、‘拉多利亚优选1号(Ladolia Patron SI)’、‘拉多利亚优选2号(Ladolia Patron SII)’、‘莱星(Leccino)’、‘莱钦塞(Lechín de Sevilla)’、‘马拉凯(Manaki)’、‘小苹果(Manzanilla de Sevilla)’、‘拉巴塔小苹果(Manzanilla de labata)’、‘米扎(Mixaj)’、‘莫拉约罗(Moraiolo)’、‘莫里斯卡(Morisca)’、‘尼肖特(Nisiot)’、‘诺切阿纳(Nociara)’、‘奥托卡(Ottobratica)’、‘配多灵(Pendolino)’、‘皮削利(Picholine)’、‘皮瓜尔(Picual)’、‘皮苦多(Picudo)’、‘沙龙奎(Salonenque)’、“瓦拉(Valanolia)”、“胡耶特(Verdale del Hérault)”、‘玉蝉44(Yuchan44)’、‘云台14(Yuntai14)’和‘云杂(Yunza)’。
在一些实施方式中,所述用于油橄榄品种鉴定的种质资源数据库包括利用序列表中SEQ ID NO:1-200所示的100对引物中的至少95对引物分别对52个油橄榄品种的DNA进行PCR扩增所获得的针对每一个油橄榄品种的至少95个位点的核苷酸序列数据。
在一些实施方式中,所述用于油橄榄品种鉴定的种质资源数据库包括利用序列表中SEQ ID NO:1-200所示的100对引物分别对52个油橄榄品种的DNA进行PCR扩增所获得的针对每一个油橄榄品种的100个位点的核苷酸序列数据。
本发明另一方面提供一种用于油橄榄品种鉴定的种质资源数据库的构建方法,其包括以下步骤:
1)利用序列表中SEQ ID NO:1-200所示的100对引物中的至少90对引物分别对52个油橄榄品种的DNA分别进行PCR扩增,得到若干PCR产物;
2)对步骤1)得到的若干PCR产物进行测序,得到针对每一个油橄榄品种的至少90个位点的核苷酸序列数据;
3)将步骤2)得到的针对每一个油橄榄品种的核苷酸序列数据合并到一个fasta格式文件中,得到分别对应52个油橄榄品种的fasta格式文件,将这些fasta格式文件作为用于油橄榄品种鉴定的种质资源数据库。
在一些实施方式中,在步骤1)中,所述PCR扩增的反应程序为:95℃4分钟预变性;98℃变性10秒,60℃退火15秒,72℃延伸45秒,以后每个循环温度降低0.5℃,共20个循环至退火温度降落到50℃;接着95℃4分钟预变性;98℃变性10秒,50℃退火15秒,72℃延伸45秒,循环12次,最后72℃延伸6分钟。
本发明另一方面还提供一种用于构建用于油橄榄品种鉴定的种质资源数据库的引物组合,其包括序列表中SEQ ID NO:1-200所示的100对引物中的至少90对引物,优选至少95对引物,优选序列表中SEQ ID NO:1-200所示的100对引物。
本发明另一方面还提供了上述的用于油橄榄品种鉴定的种质资源数据库,或引物组合在鉴定油橄榄品种中的应用。
本发明再一方面提供一种鉴定油橄榄品种的方法,其包括以下步骤:
S1)提取待鉴定油橄榄品种的总DNA;
S2)以步骤S1)提取获得的总DNA为模板,利用序列表中SEQ ID NO:1-200所示的100对引物中的至少90对引物进行PCR扩增,得到若干PCR产物,其中所述至少90对引物与上述的用于油橄榄品种鉴定的种质资源数据库中使用的引物相同;
S3)对步骤S2)得到的若干PCR产物进行测序,得到针对所述待鉴定油橄榄品种的至少90个位点的核苷酸序列数据;
S4)将步骤S3)得到的所述待鉴定油橄榄品种的核苷酸序列数据作为query序列,并与上述的用于油橄榄品种鉴定的种质资源数据库中的针对52个油橄榄品种的核苷酸序列数据分别进行比对分析,保留所述种质资源数据库中与query序列的序列一致性为100%、且比对长度相同的序列,作为所述种质资源数据库中某一已知油橄榄品种的筛选后序列,若所述筛选后序列的总数占query序列的总数的比例不低于90%,则认为所述待鉴定油橄榄品种与该已知油橄榄品种是同一个油橄榄品种。
基于以上技术方案提供的用于油橄榄品种鉴定的种质资源数据库包括52个油橄榄品种、且针对每一个油橄榄品种有至少90个位点的核苷酸序列数据,因此本发明提供的种质资源数据库覆盖有较多的油橄榄品种位点信息,可区分基本上所有常见、甚至近缘橄榄品种的遗传位点信息,并且在鉴定油橄榄品种过程中还可通过计算机进行序列比对并对比对结果进行统计分析,因此效率高且可不受人为主观判断的影响,可用于快速、高准确度和高可靠性鉴定油橄榄品种,尤其可用于鉴定遗传差异不大的油橄榄品种;在本发明的指导下,油橄榄品种鉴定流程简单,效率高,价格实惠。
具体实施方式
以下结合具体的实施例对本发明进行进一步的说明。
下述实施例中所用方法如无特别说明均为常规方法。实施例中描述到的各种生物材料的取得途径仅是提供一种实验获取的途径以达到具体公开的目的,不应成为对本发明生物材料来源的限制。事实上,所用到的生物材料的来源是广泛的,任何不违反法律和道德伦理能够获取的生物材料都可以按照实施例中的提示替换使用。
实施例在以本发明技术方案为前提下进行实施,给出了详细的实施方式和具体的操作过程,实施例将有助于理解本发明,但不应作为对本发明内容的限制。
以下实施例中涉及的引物均可通过已有技术合成。
实施例1:引物的设计和单拷贝核基因序列的确定
该实施例基于多个油橄榄品种设计用于扩增油橄榄单拷贝核基因序列中含有多态位点的序列的引物,并从这些引物中筛选确定可用于对油橄榄品种进行鉴定的引物对组合,以及由这些引物对组合扩增得到的携带有油橄榄品种信息的核苷酸序列组合。具体包括以下步骤:
(1.1)从https://denovo.cnag.cat/olive下载油橄榄品种‘佛奥’(Oleaeuropaea var.europaea cv.又称为‘Frantoio’)基因组的蛋白质序列;从NCBI数据库下载野生油橄榄(Olea europaea var.sylvestris,BioProject:PRJNA350614)和欧洲白蜡(Fraxinus excelsior,BioProject:PRJEB4958)基因组的蛋白质序列。利用Orthofinder软件分析以上三个基因组的蛋白质序列文件,根据分析结果文件Orthogroups_SingleCopyOrthologues.txt中单拷贝直系同源基因列表,调出Orthogroups.txt文件中油橄榄品种‘佛奥’基因组中对应的单拷贝基因列表。同时将油橄榄品种‘佛奥’基因组的蛋白质序列与BUSCO库进行比较,筛选油橄榄品种‘佛奥’基因组直系同源单拷贝基因序列。Orthofinder软件分析和BUSCO库比对均根据手册操作按照默认参数进行。
(1.2)从欧洲核苷酸数据库下载以下10个油橄榄品种的核基因组重测序数据:‘Arbequina’(ERR3685174-ERR3685177)、‘Beladi’(ERR3685178-ERR368518)、‘Sorani’(ERR3685182-ERR3685184)、‘Koroneiki’(SRR9860523)、‘Manzanilla de Sevillana’(SRR9860524)、‘Uslu’(SRR9860525)、‘Lechin de Sevilla’(SRR9860526)、‘Abou Kanani’(SRR9860528)、‘Leccino’(SRR9860534)和‘Zarza’(SRR9860539),另外还下载了‘佛奥’(SRR9860541)的核基因组重测序数据作为参考基因组。以上数据去掉接头和低质量序列后,用BWA软件根据手册操作将以上10个油橄榄品种的核基因组逐一比对到油橄榄品种‘佛奥’参考基因组,用samtools软件根据手册操作获取这些个体的基因组直系同源单拷贝基因序列中的变异位点。
(1.3)根据上述10个油橄榄品种在所筛选的直系同源单拷贝核基因组序列中的变异情况,选择单拷贝核基因中至少具有50个多态位点且长度不小于400bp的外显子序列,并基于这些序列利用primer5软件设计引物,并使得设计的引物扩增产物长度在300-450bp之间,引物长度为20-22bp。该步骤中还根据设计的所有引物在油橄榄参考基因组染色体所在位置,最终从23条染色体上手动筛选基因组上距离长于500Kb的引物462对,这些引物由北京擎科生物科技有限公司合成。
(1.4)引物初筛
(1.4.1)收集油橄榄品种‘佛奥’的嫩叶片,提取总DNA;利用上述步骤(1.3)人工合成的462对引物,逐一扩增油橄榄品种‘佛奥’的总DNA。PCR扩增均使用20μL反应体系,包括:20ng DNA模板、1×PCR扩增缓冲液(金牌mix,北京擎科生物科技有限公司)、正向引物和反向引物各0.2μM。PCR扩增在ABI 96U Thermo cycler PCR仪上用以下反应程序进行:95℃预变性4分钟;32个循环的95℃变性20秒,50℃退火30秒,和72℃延伸20秒;最后72℃延伸8分钟。
(1.4.2)PCR产物经琼脂糖凝胶电泳确定条带后,送至北京擎科生物科技有限公司,利用Sanger测序技术获取序列信息。
(1.4.3)Sanger测序结果返回后,用BioEdit软件将序列首末端和测序质量低的区域去掉,并查找呈现双峰的简并碱基,确定为SNP位点。从测序分析结果中,最终筛选得到测序质量较好,具有1-3个SNP位点,扩增产物长度在350-450之间的282个位点及其扩增引物对。
(1.5)二次筛选
(1.5.1)针对上述步骤(1.4)初步筛选的282个位点的引物,采用多重PCR的方式扩增‘佛奥’DNA,扩增体系为50μl,其中包括模板DNA约100ng,F端和R端引物混合液各11μl,每条引物的终浓度约为8nM,2X的PrimeSTAR MaxDNA聚合酶混合物25μl(Mg2+浓度为2mM,dNTP浓度各0.4mM)(日本Takara公司)。PCR反应程序为:95℃4分钟预变性;98℃变性10秒,60℃退火15秒,72℃延伸45秒,以后每个循环温度降低0.5℃,共20个循环至退火温度降落到50℃;接着95℃4分钟预变性;98℃变性10秒,50℃退火15秒,72℃延伸45秒,循环12次,最后72℃延伸6分钟。
(1.5.2)将步骤(1.5.1)的多重PCR扩增结果送诺禾致源生物技术有限公司采用免扩增(PCR-free)的方式建库后,在Illumina NovaSeq 6000 platform平台上进行双端250bp(PE250)测序,测序数据量为1Gb。
(1.5.3)将步骤(1.5.2)测序得到的原始数据,经Trimmomatic-0.39软件按照手册操作进行质控后,在服务器上用OBItools3软件按照手册操作分型,得到油橄榄品种‘佛奥’基因组的282个位点的多条序列。同一个位点存在两条以上不同序列的,删掉测序深度(即“count”数)低于该位点总测序深度20%的序列。
(1.5.4)从上述步骤(1.5.3)的测序分析结果中,最终共得到测序质量好,且同一位点仅有两条以内序列的100个位点,基于此最终确定用于对油橄榄品种进行鉴定的引物对为扩增以上确定的100个位点的100对引物,其核苷酸序列如下表1所示,根据油橄榄品种间序列差异统计信息,不存在两个或两个以上的油橄榄品种在这100个位点上的核苷酸序列信息均一致的情况,甚至当针对所有油橄榄品种缺失这100个位点中的任意相同的1-10个位点的核苷酸序列信息的情况下,也不会出现两个或两个以上的油橄榄品种的核苷酸序列信息一致的情况。
表1:二次筛选的用于扩增油橄榄DNA的100个位点的引物序列信息
实施例2:用于油橄榄品种鉴定的种质资源库的构建
该实施例利用上述实施例1确定的100对引物分别对52个油橄榄品种的DNA进行扩增检测,以构建用于油橄榄品种鉴定的种质资源库,具体包括以下步骤:
(2.1)100引物序列重合成:全部重新合成实施例1中确定的100对引物,并在所有F和R端引物的5’端加上一段特定的8碱基序列作为区分个体的标签。为保证携带不同标签的扩增产物可以多个组合(例如9个组合)混合,F端引物和R端引物上添加的标签均选择不同的三种,如下表2所示。
表2:引物标签序列信息
标签名 序列 所加引物端
Tag1 ACATGCGT F端引物
Tag2 AGCCTTAG F端引物
Tag3 TTAGGCAC F端引物
Tag4 TAGCTTCA R端引物
Tag5 CAGATCTG R端引物
Tag6 GGCTACAA R端引物
(2.2)选取52个油橄榄品种(这些油橄榄品种均为现有已知的油橄榄品种),如下表3所示,分别采集嫩绿叶片,提取各个油橄榄品种的叶片DNA;用上述添加标签的100对引物对个52个油橄榄品种DNA分别进行PCR扩增。其中为了方便扩增操作,针对同一油橄榄品种DNA的扩增,在一个PCR管中采用多重PCR的方式(使用携带同一组标签的所有F端和R端引物对)进行扩增,扩增体系为50μl,其中包括模板DNA约200ng,携带同一组标签的所有F端和R端引物混合液各11μl,每条引物的终浓度约为0.01μM,2X的PrimeSTAR MaxDNA聚合酶混合物25ul(Mg2+浓度为2mM,dNTP浓度各0.4mM)(日本Takara公司)。PCR扩增采用降落PCR反应程序:95℃4分钟预变性;98℃变性10秒,60℃退火15秒,72℃延伸45秒,以后每个循环温度降低0.5℃,共20个循环至退火温度降落到50℃;接着95℃4分钟预变性;98℃变性10秒,50℃退火15秒,72℃延伸45秒,循环12次,最后72℃延伸6分钟。
表3:52个油橄榄品种
(2.3)上述步骤(2.2)的PCR扩增产物用琼脂糖凝胶电泳检测后,将带有不同标签的9个个体的扩增产物进行混合,得到9个混合产物(即采用多重PCR方式对单个油橄榄品种的DNA进行扩增后,再按照不同标签的组合方式混合9个油橄榄品种的多重PCR扩增产物)。混合产物送至诺禾致源生物技术有限公司采用免扩增(PCR-free)的方式建库后,在Illumina NovaSeq 6000platform平台上进行双端250bp(PE250)测序,测序总数据量根据混合个体而定,保证每个个体平均数据量大小不低于100M。
(2.4)测序得到的原始数据,经Trimmomatic-0.39软件进行质控后,在服务器上用OBItools3软件分型。OBItools3软件参数设置如下:使用obi alignpairedend将测序所得F端和R端数据拼接成完整的序列,计算序列的平均比对得分(stats-a score_norm,相当于F和R端重叠序列之间的相似度)并保留具有高得分重叠序列(sequence['score_norm']>0.6);在统计测序深度(counts)后,仅保留深度大于或等于5的序列(sequence['COUNT']>=5),并且序列长度大于200bp的序列(len(sequence)>=200)。最后,以默认参数(clean-r0.05)清除从PCR和测序错误中带来的错误序列。针对同一个体同一位点出现多条序列的情况,仅保留count数(即测序深度)不低于总count数20%的序列;最终得到针对每一个油橄榄品种的100个位点的核苷酸序列数据。
(2.5)将所测每个油橄榄品种的100个位点的序列合并成一个fasta格式文件,每条序列按照品种+引物的方式命名,共计得到针对52个油橄榄品种的52个fasta格式文件,并以该52个fasta文件合并为一个总的fasta文件建立用于油橄榄品种鉴定的核苷酸数据库,即为用于油橄榄品种鉴定的种质资源数据库。
分别利用该实施例建立的用于油橄榄品种鉴定的核苷酸数据库中的52个油橄榄品种之一的约100个位点核苷酸序列作为query序列,与核苷酸数据库中的另外51个油橄榄品种的相应位点核苷酸序列数据分别进行Blast比对分析,并对比对结果进行统计分析和筛选(具体方法如以下实施例3中所述,即保留种质资源数据库中与query序列的序列一致性为100%、且比对长度相同的序列,作为种质资源数据库中某一油橄榄品种的筛选后序列)。结果表明,针对任意一个油橄榄品种,其相对于另外51个油橄榄品种统计所得的筛选后序列的总数占对应query序列的总数的比例均不超过75%。因此,即便在构建的用于油橄榄品种鉴定的种质资源数据库中仅包括利用上表1所示的100对引物中的90对引物分别对52个油橄榄品种的DNA进行PCR扩增所获得的针对每一个油橄榄品种的90个位点的核苷酸序列数据的情况下,针对任意一个油橄榄品种,其相对于另外51个油橄榄品种统计所得的筛选后序列的总数占对应query序列的总数的比例最高也不会超过84%。因此,当某一待鉴定油橄榄品种相对于本发明构建的种质资源数据库中某一已知油橄榄品种统计所得的筛选后序列的总数占query序列的总数的比例不低于90%(优选为100%或接近100%)时,即可认为该待鉴定油橄榄品种与该已知油橄榄品种为相同的油橄榄品种,且本发明构建获得的用于油橄榄品种鉴定的种质资源数据库中可仅包括利用上表1所示的100对引物中的至少90对引物分别对52个油橄榄品种的DNA进行PCR扩增所获得的针对每一个油橄榄品种的至少90个位点的核苷酸序列数据。
实施例3:油橄榄品种的鉴定
该实施例利用上述实施例2构建的用于油橄榄品种鉴定的种质资源数据库分别对油橄榄品种‘佛奥’和‘果大尔’进行鉴定,具体包括以下操作:
(3.1)按照上述实施例2中步骤(2.2)-(2.4)的操作分别对油橄榄品种‘佛奥’和‘果大尔’进行DNA提取、PCR扩增和测序操作,最终获得油橄榄品种‘佛奥’的96个位点的核苷酸序列信息,以及获得油橄榄品种‘果大尔’的99个位点的核苷酸序列信息;
(3.2)将步骤(3.1)获得的油橄榄品种‘佛奥’的96个位点的核苷酸序列或油橄榄品种‘果大尔’的99个位点的核苷酸序列分别作为query序列,与实施例2构建的包括52个油橄榄品种的种质资源数据库(其中针对品种‘佛奥’使用对应的96个位点的核苷酸序列信息,针对品种‘果大尔’使用对应的99个位点的核苷酸序列)中的序列用Blast软件分别进行比对,比对结果输出以下参数:outfmt“6 qseqid sseqid pident length qlen slenmismatch gapopen qstart qend sstart send evalue bitscore”;
(3.3)可人工对上述比对结果进行统计分析,统计标准为1:保留pident(一致性)为100%的序列;2:保留length(比对长度)和qlen(query序列的长度)相同的序列,作为种质资源数据库中某一已知油橄榄品种的筛选后序列,但为了快速方便,也可利用perl脚本(如下所示)对比对结果进行统计分析。最终统计经历上述标准1、2后种质资源数据库中52个油橄榄品种各自所对应的筛选后序列的总数,如果某一已知油橄榄品种的筛选后序列的总数占query序列的总数的比例不低于90%,则鉴定为该已知油橄榄品种(理论上该比例应为100%,但在PCR扩增过程中和/或对PCR产物进行测序时,可能会导致个别核苷酸序列中个别碱基的错误或缺失、或额外碱基的插入等问题(通常不超过8条核苷酸序列,严格条件下不超过3条核苷酸序列,甚至不会出现这种问题),因此在实际鉴别检测中可能出现该比例不为100%的情况,因此在本发明中确定以该比例不低于90%为对统计结果进行判定的标准)。对油橄榄品种‘佛奥’和‘果大尔’进行鉴定的结果分别如下表4和表5所示(其中仅列出筛选后序列的总数占query序列的总数的比例大于60%的品种),可见对两个油橄榄品种的鉴定结果均正确。
表4:对油橄榄品种‘佛奥’进行鉴定的结果
表5:对油橄榄品种‘果大尔’进行鉴定的结果
其中所使用的perl脚本为:
/>
/>
最后应说明的是:以上所述仅为本发明的优选实施例,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种用于油橄榄品种鉴定的种质资源数据库,其包括利用序列表中SEQ ID NO:1-200所示的100对引物中的至少90对引物分别对52个油橄榄品种的DNA进行PCR扩增所获得的针对每一个油橄榄品种的至少90个位点的核苷酸序列数据;
其中所述52个油橄榄品种为:‘米提尼(Adramittini)’、‘阿托斯(Agiou Orous)’、‘阿戈尔(Amyglalolia)’、‘豆果(Arbequina)’、‘阿尔波萨娜(Arbosana)’、‘阿斯(Ascolana)’、‘巴尼亚(Barnea)’、‘贝拉(Berat)’、‘边克利拉(Biancolila)’、‘栾桂塔(Blanquette deGuelma)’、‘巴利奥(Borriol de Castellón)’、‘城固32号(Chenggu32)’‘城固53号(Chenggu53)’、 ‘德里达(Dritto)’、‘爱桑(Elbasan)’、‘安皮特(Empeltre)’、‘鄂植8号(Ezhi8)’、‘佛奥(Frantoio)’、‘科新佛奥(Frantoio de Corsini)’、‘果大尔(GordalSevillana)’、戈达尔(Gordal del Somontano)’、‘格洛桑(Gorossanne)’、‘格里昂(Grignan)’、‘贺吉(Hojiblanca)’、‘华欧9(Huaou9)’、 ‘卡拉蒙(Kalamon)’、‘孔色(Konservolia)’、‘科罗莱卡(Koroneiki)’、‘卡林(Kalinjot)’、‘拉多利亚优选1号(Ladolia Patron SI)’、‘拉多利亚优选2号(Ladolia Patron SII)’、‘莱星(Leccino)’、‘莱钦塞(Lechín de Sevilla)’、‘马拉凯(Manaki)’、‘小苹果(Manzanilla de Sevilla)’、‘拉巴塔小苹果(Manzanilla de labata)’、‘米扎(Mixaj)’、‘莫拉约罗(Moraiolo)’、‘莫里斯卡(Morisca)’、 ‘尼肖特(Nisiot)’、‘诺切阿纳(Nociara)’、‘奥托卡(Ottobratica )’、‘配多灵(Pendolino)’、‘皮削利(Picholine)’、‘皮瓜尔(Picual)’、‘皮苦多(Picudo)’、‘沙龙奎(Salonenque)’、“瓦拉(Valanolia)”、“胡耶特(Verdale del Hérault)”、‘玉蝉44(Yuchan44)’、‘云台14(Yuntai14)’和‘云杂(Yunza)’。
2. 根据权利要求1所述的用于油橄榄品种鉴定的种质资源数据库,其包括利用序列表中SEQ ID NO:1-200所示的100对引物中的至少95对引物分别对52个油橄榄品种的DNA进行PCR扩增所获得的针对每一个油橄榄品种的至少95个位点的核苷酸序列数据。
3. 根据权利要求1或2所述的用于油橄榄品种鉴定的种质资源数据库,其包括利用序列表中SEQ ID NO:1-200所示的100对引物分别对52个油橄榄品种的DNA进行PCR扩增所获得的针对每一个油橄榄品种的100个位点的核苷酸序列数据。
4.根据权利要求1-3中任一项所述的用于油橄榄品种鉴定的种质资源数据库的构建方法,其包括以下步骤:
1)利用序列表中SEQ ID NO:1-200所示的100对引物中的至少90对引物分别对52个油橄榄品种的DNA进行PCR扩增,得到若干PCR产物;
2)对步骤1)得到的若干PCR产物进行测序,得到针对每一个油橄榄品种的至少90个位点的核苷酸序列数据;
3)将步骤2)得到的针对每一个油橄榄品种的核苷酸序列数据合并到一个fasta格式文件中,得到分别对应52个油橄榄品种的fasta格式文件,将这些fasta格式文件作为用于油橄榄品种鉴定的种质资源数据库。
5. 根据权利要求4所述的构建方法,其中在步骤1)中,所述PCR扩增的反应程序为:95℃ 4分钟预变性;98℃变性10秒,60℃退火15秒,72℃延伸45秒,以后每个循环温度降低0.5℃,共20个循环至退火温度降落到50℃;接着95℃ 4分钟预变性;98℃变性10秒, 50℃退火15秒,72℃延伸45秒,循环12次,最后72℃延伸6分钟。
6. 一种用于权利要求4或5所述的构建方法的引物组合,其包括序列表中SEQ ID NO:1-200所示的100对引物中的至少90对引物。
7. 根据权利要求6所述的引物组合,其包括序列表中SEQ ID NO:1-200所示的100对引物中的至少95对引物。
8. 根据权利要求7所述的引物组合,其包括序列表中SEQ ID NO:1-200所示的100对引物。
9.权利要求1-3中任一项所述的用于油橄榄品种鉴定的种质资源数据库,或权利要求6-8中任一项所述的引物组合在鉴定油橄榄品种中的应用。
10.一种鉴定油橄榄品种的方法,其包括以下步骤:
S1)提取待鉴定油橄榄品种的总DNA;
S2)以步骤S1)提取获得的总DNA为模板,利用序列表中SEQ ID NO:1-200所示的100对引物中的至少90对引物进行PCR扩增,得到若干PCR产物,其中所述至少90对引物与权利要求1-3中任一项所述的用于油橄榄品种鉴定的种质资源数据库中使用的引物相同;
S3)对步骤S2)得到的若干PCR产物进行测序,得到针对所述待鉴定油橄榄品种的至少90个位点的核苷酸序列数据;
S4)将步骤S3)得到的所述待鉴定油橄榄品种的核苷酸序列数据作为query序列,并与权利要求1-3中任一项所述的用于油橄榄品种鉴定的种质资源数据库中的针对52个油橄榄品种的核苷酸序列数据分别进行比对分析,保留所述种质资源数据库中与query序列的序列一致性为100%、且比对长度相同的序列,作为所述种质资源数据库中某一已知油橄榄品种的筛选后序列,若所述筛选后序列的总数占query序列的总数的比例不低于90%,则认为所述待鉴定油橄榄品种与该已知油橄榄品种是同一个油橄榄品种。
CN202211132152.8A 2022-09-16 2022-09-16 一种用于油橄榄品种鉴定的种质资源数据库及其构建方法和应用 Active CN116072229B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211132152.8A CN116072229B (zh) 2022-09-16 2022-09-16 一种用于油橄榄品种鉴定的种质资源数据库及其构建方法和应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211132152.8A CN116072229B (zh) 2022-09-16 2022-09-16 一种用于油橄榄品种鉴定的种质资源数据库及其构建方法和应用

Publications (2)

Publication Number Publication Date
CN116072229A CN116072229A (zh) 2023-05-05
CN116072229B true CN116072229B (zh) 2023-10-20

Family

ID=86175796

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211132152.8A Active CN116072229B (zh) 2022-09-16 2022-09-16 一种用于油橄榄品种鉴定的种质资源数据库及其构建方法和应用

Country Status (1)

Country Link
CN (1) CN116072229B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116769962B (zh) * 2023-08-17 2023-10-17 中国林业科学研究院林业研究所 一种鉴别区分油橄榄、尖叶木樨榄及其杂交后代的方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109554501A (zh) * 2018-12-30 2019-04-02 中国林业科学研究院林业研究所 基于snp位点的油橄榄品种鉴定的扩增引物、筛选方法及鉴定方法
CN112226433A (zh) * 2020-07-31 2021-01-15 中国林业科学研究院林业研究所 一种鉴定白皮松种质资源的snp位点引物组合及应用
CN114807413A (zh) * 2022-04-02 2022-07-29 广东省农业科学院果树研究所 一种橄榄issr-pcr分子标记组合及其应用

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109554501A (zh) * 2018-12-30 2019-04-02 中国林业科学研究院林业研究所 基于snp位点的油橄榄品种鉴定的扩增引物、筛选方法及鉴定方法
CN112226433A (zh) * 2020-07-31 2021-01-15 中国林业科学研究院林业研究所 一种鉴定白皮松种质资源的snp位点引物组合及应用
CN114807413A (zh) * 2022-04-02 2022-07-29 广东省农业科学院果树研究所 一种橄榄issr-pcr分子标记组合及其应用

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Annalisa Marchese et al..The first high-density sequence characterized SNP-based linkage map of olive (Olea europaea L. subsp. europaea) developed using genotyping by sequencing .《AJCS》.2016,857-863. *
Li Wang et al..High-Quality Genome Assembly of Olea europaea subsp. cuspidata Provides Insights Into Its Resistance to Fungal Diseases in the Summer Rain Belt in East Asia.《Front. Plant Sci.》.2022,1-16. *
朱申龙 等.油橄榄(Olea europaea L.)核心SNP位点筛选与评价.《分子植物育种》.2020,1548-1557. *

Also Published As

Publication number Publication date
CN116072229A (zh) 2023-05-05

Similar Documents

Publication Publication Date Title
CN107760789B (zh) 一种用于牦牛亲子鉴定和个体识别的基因分型检测试剂盒
CN107794304B (zh) 用于牦牛个体识别和亲子鉴定的基因分型检测试剂盒
KR102077917B1 (ko) 넙치 친자 식별용 유전자 마커 및 이를 이용한 친자 확인방법
US20160362752A1 (en) Genotyping method for use in cattle traceability and means thereof
KR102062452B1 (ko) 터봇 친자 식별용 유전자 마커 및 이를 이용한 친자 확인방법
CN116072229B (zh) 一种用于油橄榄品种鉴定的种质资源数据库及其构建方法和应用
Cmejlova et al. A new one-tube reaction kit for the SSR genotyping of apple (Malus× domestica Borkh.)
CN113430279A (zh) 用于肉制品中动物种源成分筛查的dna宏条形码检测靶标序列、检测试剂盒及检测方法
CN117965781A (zh) 一种花生40K液相SNP芯片“PeanutGBTS40K”及其应用
KR102332688B1 (ko) 인삼 '선향' 품종을 구별하기 위한 핵 게놈 서열 기반 분자마커 및 이의 용도
CN115058523A (zh) 一种基于微卫星位点鉴定荔枝尖细蛾的特异性引物及检测方法
WO2021207992A1 (zh) 一种与德州驴多胸椎数性状相关的snp位点检测试剂盒及其使用方法
CN110305974B (zh) 基于检测五个snp位点区分常见小鼠近交系的pcr分析引物及其分析方法
CN112599200A (zh) 一种基于宏条形码的家畜采食组成校正模型的构建方法
CN117701722B (zh) 一种牛高原适应育种10k液相芯片及应用
CN109182504A (zh) 奶牛乳腺炎关键SNPs位点rs20438858及2b-RAD基因分型和分析方法
CN117587159B (zh) 一种辣椒snp分子标记组合、snp芯片及其应用
CN116676400B (zh) 猪肌内脂肪性状关联的分子标记、引物、试剂盒、方法及应用
CN116590435B (zh) 一种与猪背膘厚相关的因果候选基因及其鉴定方法和应用
KR20120100095A (ko) 양파 품종식별용 초위성체 프라이머 세트
KR101376277B1 (ko) 한우 근내지방도 연관 분자표지를 이용한 한우 육질 진단 방법
KR102613521B1 (ko) 시나노골드 사과와 이의 아조변이 품종 판별용 분자마커 및 이의 용도
Ledesma et al. Detecting strawberry cultivar misidentification in the Philippines using single nucleotide polymorphism markers from the anthocyanin reductase gene
CN117821633A (zh) 用于甘薯种质鉴定的kasp标记引物组合及其应用
CN118147322A (zh) 山羊esrra基因中与产羔数关联的分子标记及其应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant