CN108368555B - 用于预测实验油棕榈植物的棕榈油产量的方法 - Google Patents

用于预测实验油棕榈植物的棕榈油产量的方法 Download PDF

Info

Publication number
CN108368555B
CN108368555B CN201680063501.1A CN201680063501A CN108368555B CN 108368555 B CN108368555 B CN 108368555B CN 201680063501 A CN201680063501 A CN 201680063501A CN 108368555 B CN108368555 B CN 108368555B
Authority
CN
China
Prior art keywords
oil
snp
palm
oil palm
chromosome
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201680063501.1A
Other languages
English (en)
Other versions
CN108368555A (zh
Inventor
A·L·龙
Q·B·克翁
C·K·特
M·穆罕默德
F·T·周
D·R·阿普尔顿
H·库拉维拉辛加姆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sime Darby Plantation Bhd
Original Assignee
Sime Darby Plantation Bhd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sime Darby Plantation Bhd filed Critical Sime Darby Plantation Bhd
Publication of CN108368555A publication Critical patent/CN108368555A/zh
Application granted granted Critical
Publication of CN108368555B publication Critical patent/CN108368555B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • C12Q1/6895Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for plants, fungi or algae
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/13Plant traits
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Genetics & Genomics (AREA)
  • Microbiology (AREA)
  • General Engineering & Computer Science (AREA)
  • Immunology (AREA)
  • Biochemistry (AREA)
  • Botany (AREA)
  • Mycology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

公开了用于预测实验油棕榈植物的棕榈油产量的方法。所述方法包括:从群体的实验油棕榈植物的样品确定至少第一SNP基因型,所述第一SNP基因型对应于第一SNP标记,所述第一SNP标记位于用于高产油量性状的第一QTL中,并且在分层和亲缘关系校正之后,以所述群体中至少7.0的全基因组‑log10(p值)与所述高产油量性状相关联,或者相对于与所述第一SNP标记连锁的第一其他SNP标记具有至少0.2的连锁不平衡r2值,所述第一其他SNP标记在分层和亲缘关系校正之后,以所述群体中至少7.0的全基因组‑log10(p值)与所述高产油量性状相关联。所述方法还包括将所述第一SNP基因型与相应的第一参考SNP基因型进行比较,并基于SNP基因型的匹配程度预测所述实验植物的棕榈油产量。

Description

用于预测实验油棕榈植物的棕榈油产量的方法
技术领域
本申请涉及用于预测实验油棕榈植物的棕榈油产量的方法,并且更具体地,涉及用于预测实验油棕榈植物的棕榈油产量的方法,该方法包括从油棕榈植物的群体的实验油棕榈植物的样品中确定该实验油棕榈植物的至少第一单核苷酸多态性(也称为SNP)基因型,该第一SNP基因型对应于第一SNP标记,将实验油棕榈植物的第一SNP基因型与在与群体相同遗传背景下指示高产油量性状的相应的第一参考SNP基因型进行比较,并且基于实验油棕榈植物的第一SNP基因型与相应的第一参考SNP基因型的匹配程度来预测该实验油棕榈植物的棕榈油产量。
背景技术
非洲油棕榈Elaeis guineensis Jacq.是重要的食品油料作物。油棕榈植物是雌雄同株的,即单株植物产生雄花和雌花两者,其特征是交替系列的雄花序和雌花序。雄花序由许多小穗组成,并且可以开出远超出100,000朵花。油棕榈通过昆虫和风自然异花授粉。雌花序是肉穗花序,其包含生于荆棘的小穗上的数千朵花。一串结有500至4,000个果实。油棕榈果实是无柄核果,其形状为球形至卵形或细长的,并且由外果皮、含有棕榈油的中果皮和围绕核的内果皮构成。
油棕榈的重要性是由于其高产量以及其高的油质量。就产量而言,油棕榈是产油量最高的食品油料作物,近期每年平均产量为3.67公吨/公顷,并且其中最好的后代已知每年产量约为10公吨/公顷。油棕榈也是最有效率的植物,以利用阳光的能量来生产油而著称。就质量而言,栽培油棕榈以获得果皮中产生的棕榈油和核中产生的棕榈仁油两者。棕榈油是尤其平衡的油,具有几乎相等比例的饱和脂肪酸(≈55%,包括45%的棕榈酸)和不饱和脂肪酸(≈45%),并且它包括β胡萝卜素。棕榈仁油比中果皮油更饱和.两者都具有低含量的游离脂肪酸。目前棕榈油和棕榈仁油的总产量约为每年5000万公吨,并且随着全球人口和人均油脂消耗量的增加,预计未来的需求将大幅增加。
虽然油棕榈是产油量最高的食品油料作物,但目前的油棕榈作物产量远低于其理论最高值,表明通过改进高产油棕榈植物的选择和鉴定来提高棕榈油的产量的潜力。但是,在杂交中用于产生具有较高产量的后代以及用于商业生产棕榈油的用于鉴定潜在的高产油棕榈的常规方法,需要在多年的过程中栽培油棕榈并测量棕榈油的产量,这是耗费时间和高劳动强度的。此外,常规方法基于直接测量取样果实的棕榈油含量,从而导致取样果实的破坏。另外,用于生产棕榈油的油棕榈繁殖的常规育种技术也是耗费时间和高劳动强度的,尤其是由于最有生产力的,从而有商业价值的油棕榈基于关于被称作SHELL的基因的杂合性(即具有SHELL的一个野生型等位基因(sh+)和SHELL的一个突变等位基因(sh-))表现出关于果实类型的杂交表型,这使得通过直接杂交来对其进行繁殖是不切实际的。
如,例如Billotte等人,Theoretical&Applied Genetics 120:1673-1687(2010)教导了基于连锁分析的数量性状基因座(也称为QTL)标记程序已经实施于油棕榈,目的是改进常规育种技术。但是,连锁分析基于最近几代内的家系中观察到的重组,并且经常较差地鉴定复杂表型的定位的QTL,因此需要大家系来更好地检测和确认QTL,限制了该方法用于油棕榈的实用性。
如,例如Ong等人关于植物高度所讨论的(WO2014/129885),基于用于鉴定候选基因的目的的关联分析的QTL标记程序也可能用于油棕榈。但是鉴定候选基因的重点在由多种基因(尤其是关于性状表现出低外显率的基因)确定的性状的背景下具有有限的益处。
如Hirota等人,Nature Genetics 44:1222-1226(2012)和Huang等人,NatureGenetics 42:961-967(2010)分别教导了基于全基因组关联研究的QTL标记程序已经实施于人和水稻以等。但是,将这种方法应用于油棕榈是不切实际的,因为商业油棕榈倾向于由遗传上狭窄育种材料产生。
如Singh等人,WO2013/142187和Singh等人,WO2015/010008所教导的,在确定油棕榈植物的基因型的基础上预测个体油棕榈植物是否将表现出关于SHELL基因的杂交表型方面近来已取得进展。为了商业生产棕榈油的目的,这可以允许减少在栽培将不会表现出杂交表型的油棕榈植物中花费的资源,但是不会被预期为表达杂交表型的油棕榈植物本身中增加棕榈油产量提供基础。
如Singh等人,WO2015/010131所教导的,在酵母双杂交系统中SHELL基因产物与来自水稻(Oryza sativa)的SEPALLATA(SEP)直系同源物的结合的基础上,鉴定SHELL基因产物的结合配偶体,以及鉴定油棕榈中编码潜在的SEP样蛋白的许多基因方面近来也已经取得进展。但是,SEP样蛋白在调节油棕榈果实的形态和/或棕榈油产量中是否起作用和在多大程度上起作用仍然有待确定。
因此,需要通过改进的用于预实验油棕榈植物的棕榈油产量的方法来改进油棕榈。
发明内容
公开了一种用于预测实验油棕榈植物的棕榈油产量的方法。该方法包括步骤(i)从油棕榈植物群体的实验油棕榈植物的样品中确定该实验油棕榈植物的至少第一单核苷酸多态性(SNP)基因型。第一SNP基因型对应于第一SNP标记。第一SNP标记位于用于高产油量性状的第一数量性状基因座(QTL)中。第一SNP标记,在分层和亲缘关系校正之后,还以群体中至少7.0的全基因组-log10(p值)与高产油量性状相关联,或者相对于与该第一SNP标记连锁的第一其他SNP标记而言,具有至少0.2的连锁不平衡r2值,所述第一其他SNP标记在分层和亲缘关系校正之后,以群体中至少7.0的全基因组-log10(p值)与高产油量性状相关联。该方法还包括步骤(ii)将实验油棕榈植物的第一SNP基因型与在与群体相同遗传背景下指示高产油量性状的相应的第一参考SNP基因型进行比较。该方法还包括步骤(iii)基于实验油棕榈植物的第一SNP基因型与相应的第一参考SNP基因型的匹配程度来预测该实验油棕榈植物的棕榈油产量。该第一QTL是对应于以下中的一个的油棕榈基因组的区域:
(1)QTL区域1,从染色体2的核苷酸1516571延伸至4215826;
(2)QTL区域2,从染色体2的核苷酸4858549延伸至5594262;
(3)QTL区域3,从染色体2的核苷酸33949264延伸至34110104;
(4)QTL区域4,从染色体3的核苷酸43405853延伸至43834266;
(5)QTL区域5,从染色体3的核苷酸44126148延伸至44193097;
(6)QTL区域6,从染色体4的核苷酸30702027延伸至31148630;
(7)QTL区域7,从染色体4的核苷酸33166529延伸至33451554;
(8)QTL区域8,从染色体7的核苷酸35906266延伸至36257708;
(9)QTL区域9,从染色体10的核苷酸29233675延伸至29612202;
(10)QTL区域10,从染色体11的核苷酸13470988延伸至13734716;
(11)QTL区域11,从染色体13的核苷酸24620951延伸至24989005;或
(12)QTL区域12,从染色体15的核苷酸6941783延伸至7160542。
附图说明
图1示出了对于(A)壳与果实比和(B)中果皮与果实比,在如下讨论的27个油棕榈来源中,基于压缩混合线性模型(也称为MLM),针对GWAS观察到的-log10(p值)与预期的-log10(p值)的四分位数-四分位数(Q-Q)图。
图2示出了对于(A)壳与果实比(也称为S/F)和(B)中果皮与果实比(也称为M/F),在如下讨论的27个油棕榈来源中,基于压缩混合线性模型(也称为MLM)的曼哈顿图。
图3是用于根据至少0.2的连锁不平衡r2值作为阈值来定义QTL区域的范围的方法的图示,其中突出显示的范围(即SNP A至SNP D,如开放矩形所包围的)是根据预测实验油棕榈植物的棕榈油产量的方法所选择的QTL区域。
图4是对于壳与果实比(也称为S/F)在如下面讨论的27个油棕榈来源中的预测准确度(y轴)与分析表示的QTL数目(x轴)的图。
图5是对于中果皮与果实比(也称为M/F)在如下面讨论的27个油棕榈来源中的预测准确度(y轴)与分析表示的QTL数目(x轴)的图。
具体实施方式
本申请涉及用于预测实验油棕榈植物的棕榈油产量的方法。该方法包括以下步骤:(i)从油棕榈植物群体的实验油棕榈植物的样品中确定该实验油棕榈植物的至少第一单核苷酸多态性(SNP)基因型,(ii)将该实验油棕榈植物的第一SNP基因型与在与群体相同遗传背景下指示高产油量性状的相应的第一参考SNP基因型进行比较,以及(iii)基于实验油棕榈植物的第一SNP基因型与相应的第一参考SNP基因型的匹配程度来预测实验油棕榈植物的棕榈油产量。第一SNP基因组对应于第一SNP标记。第一SNP标记位于用于高产油量性状的第一数量性状基因座(QTL)中。第一SNP标记,在分层和亲缘关系校正之后,还以群体中至少7.0的全基因组-log10(p值)与高产油量性状相关联,或者相对于与该第一SNP标记连锁的第一其他SNP标记具有至少0.2的连锁不平衡r2值,所述第一其他SNP标记在分层和亲缘关系校正之后,以群体中至少7.0的全基因组-log10(p值)与高产油量性状相关联。如下面更详细描述的,第一QTL是对应于如下面更详细描述的QTL区域1至12中的一个的油棕榈基因组的区域。
通过对27个油棕榈来源(包括有商业价值的Ulu Remis dura x AVROS pisifera群体和有商业价值的Banting dura x AVROS pisifera群体等等)的4,623株油棕榈植物进行基因组重新测序和全基因组关联研究,并且通过包括应用分层和亲缘关系校正,已经确定了位于油棕榈基因组的12个QTL区域中并且在分层和亲缘关系校正之后与高产油量性状相关联的SNP标记,就壳与果实比和中果皮与果实比的高产油量性状而言,可以分别实现例如0.32和0.30的相关性准确度。
不希望受到理论的约束,认为12个QTL区域以及其中的在分层和亲缘关系校正之后,与高产油量性状相关联的SNP标记的鉴定将能够更快速和有效地从27个油棕榈来源等中选择候选农业生产棕榈和候选育种棕榈。分层和亲缘关系校正减少了由于实验油棕榈植物从中取样的油棕榈植物群体中小群体个体的最近共同祖先导致的假阳性信号,从而使得基于关联的用于预测实验油棕榈植物的棕榈油产量的方法具有实用性。该方法将能够鉴定潜在的高产棕榈,用于杂交以产生具有更高产量且用于棕榈油的商业生产的后代,而不需要栽培棕榈至成熟,因此无需时间和劳动密集的栽培和测量、对果实的破坏性取样,以及作为常规方法特征的直接杂交的不实用性。例如,在能够完成通过实验油棕榈植物直接测量棕榈油产量的很早之前,该方法可以用于选择油棕榈植物以用于发芽、苗圃栽培、栽培用于商业生产棕榈油、栽培用于进一步繁殖等。还例如,该方法可以比通过直接测量棕榈油产量更高的效率和/或更小的变异性实现棕榈油产量的预测。考虑到大规模的商业栽培,基于百分比看起来很小的棕榈油产量的改善仍然可以对总体棕榈油产量产生重大的影响,就甚至单一SNP而言,该方法的使用也是有利的。考虑到累加效应和/或协同作用,就两个或更多个SNP的组合,例如,第一SNP基因型和第二SNP基因型,或者第一SNP基因型至第十二SNP基因型而言,该方法的使用也是有利的。
关于本文公开的方法使用的术语“高产油量性状”、“高产量”、“高产”和“油产量”是指油棕榈植物的果实的中果皮组织中棕榈油的产量。
除非上下文另有明确指出,单数形式的“一个(a)”、“一个(an)”和“所述”也旨在包括复数形式。
如上所述,公开了一种用于预测实验油棕榈植物的棕榈油产量的方法。该方法包括步骤(i)从油棕榈植物群体的实验油棕榈植物的样品中确定实验油棕榈植物的至少第一SNP基因型。
实验油棕榈植物的SNP基因型对应于在实验油棕榈植物的基因组中出现基因座的每个染色体上的特定基因座或位置处的SNP等位基因的构成。SNP是就染色体上这样的基因座处出现的单个核苷酸而言的多态性变异。SNP等位基因是存在于染色体上的基因座处的特定核苷酸。对于二倍体并且因而遗传一组母本衍生的染色体和一组父本衍生的染色体的油棕榈植物,SNP基因型对应于两个SNP等位基因,一个在母本衍生的染色体上的特定基因座处,并且另一个在父本衍生的染色体上的特定基因座处。每个SNP等位基因可以基于等位基因频率分为例如主要等位基因(A)或次要等位基因(a)。因此,例如,SNP基因型可以对应于两个主要等位基因(A/A),一个主要等位基因和一个次要等位基因(A/a)或两个次要等位基因(a/a)。
实验油棕榈植物可以是对应于重要的食品油料作物的油棕榈植物。例如,实验油棕榈植物可以对应于非洲油棕榈Elaeis guineensis。
实验油棕榈植物可以是任何合适形式的油棕榈植物。例如,实验油棕榈植物可以是种子、幼苗、苗圃期植物、未成熟期植物、细胞培养植物、合子胚培养植物或体细胞组织培养植物。还例如,实验油棕榈植物可以是生产期植物、成熟棕榈、成熟母本棕榈或成熟花粉供体。
种子、幼苗、苗圃期植物、未成熟期植物、细胞培养植物、合子胚培养植物或体细胞组织培养植物形式的实验油棕榈植物是尚未成熟的形式,因而如果生产的话,还未以商业生产典型的量生产棕榈油。因此,应用于这种形式的实验油棕榈植物的方法可以用来在实验油棕榈植物已经足够成熟以允许在商业生产期间通过直接测量实验油棕榈植物的棕榈油产量之前,预测实验油棕榈植物的棕榈油产量。
生产期植物、成熟棕榈、成熟母本棕榈或成熟花粉供体形式的实验油棕榈植物是成熟的形式。因此,应用于这种形式的实验油棕榈植物的方法可作为直接测量油棕榈产量的替换方法用于预测实验油棕榈的棕榈油产量。
实验油棕榈植物从其取样的实验油棕榈植物的群体可以包括任何合适的油棕榈植物群体。可以依据产生群体的育种材料的果实类型和/或身份来指示群体。
就此而言,果实类型是油棕榈中的单基因性状,其对于育种和商业生产是重要的。具有两种不同果实类型中的一种的油棕榈通常用于通过杂交进行育种和种子生产,以产生用于商业生产棕榈油的棕榈,其也称为商业种植材料或农业生产植物。第一果实类型是dura(基因型:sh+sh+),其特征在于相当于果实重量的28%至35%的厚壳(也称为种皮),在果实的核周围没有黑色纤维环。对于dura果实,中果皮与果实的比例为50%至60%,其中可提取油含量与串重的比例为18%至24%。第二果实类型是pisifera(基因型:sh-sh-),其特征在于没有壳,其痕迹是围绕小核的纤维环。因此,对于pisifera果实,中果皮与果实的比例为90%至100%。中果皮油与串的比例与dura相当,为16%至28%。然而,pisifera通常是雌性不育的,因为大部分串在早期发育阶段中止。
将dura和pisifera杂交产生具有第三果实类型,tenera(基因型:sh+sh-)的棕榈。tenera果实通常具有相当于果实重量8%至10%的薄壳,相当于0.5mm至4mm的厚度,其周围是特征性黑色纤维环。对于tenera果实,中果皮与果实的比例相对较高,通常在60%至80%范围内。商用tenera一般比dura产生更多的果实串,但是平均串重较低。中果皮油与串的比例在20%至30%的范围内,是三种果实类型中最高的,因此,通常用作商业种植材料。
育种材料的身份可以基于育种材料的来源和育种历史。在东南亚使用的dura棕榈育群体体包括Serdang Avenue、Ulu Remis(其中包括一些Serdang Avenue材料)、Banting、Johor Labis和Elmina estate(包括Deli Dumpy),所有这些都源自Deli dura。用于种子生产的pisifera育群体体通常分为Yangambi、AVROS、Binga和URT。在非洲和南美洲使用其他dura和pisifera群体。
东南亚的油棕榈种植/育种计划正在使用Deli dura来源,该Deli dura来源起源于1848年在茂物市的四株著名的dura棕榈。Deli dura材料随后被分配到整个地区的几个研究站。每个站侧重于几代中的不同选择偏好,导致亚群之间存在一些差异,称为限制性来源的育群体体(也称为BPRO)。源自Deli dura的限制性来源的重要的育群体体是Ulu Remis(也称为UR)和Johor Labis(也称为JL)。在苏门答腊的Marihat Baris,Ulu Remis来源被选择用于高串数和高性别比(定义为雌花序与总花序的比率)。苏门答腊的Socfindo已开发Johor Labis来源用于较大的串(高串重)和较薄的外壳,而不是串数。
20世纪60年代以前,Dura棕榈在东南亚被商业种植。Banting dura(也称为BD)是在1958年在Dusun Durian Estate种植的Deli dura中发现的。该材料被选择用于良好的串性状和数量。Banting dura已成为重要的母源。
非洲dura材料次于Deli dura。为了提高油产量,非洲的主要种植材料是tenera(dura x pisifera)。这为发现优异的花粉源(即AVROS pisifera)提供了机会。该材料来源于知名的Djongo棕榈,该Djongo棕榈被种植在扎伊尔(现在是刚果民主共和国)的Yangambi的Eala植物园中。然后该材料在Dusun Durian Estate的Kelanang Bharu Division被进一步选择并产生BM119。AVROS pisifera赋予Deli x AVROS后代(tenera)在生长均匀性、一般组合能力、早熟和中果皮油产量方面的优势。因此,自20世纪60年代以来,Deli dura xBM119 AVROS pisifera在该地区的引进使得每公顷的油增加30%。
油棕榈育种的主要目的是选择改良的亲本dura和pisifera育种母株棕榈,用于生产优质tenera商业种植材料。这种材料大部分是种子的形式,但是组织培养用于克隆繁殖的用于在继续开发。一般地,通过在选定的dura棕榈之间杂交产生亲本dura育群体体。基于果实类型的单基因遗传,得到的棕榈100%将是dura。经过数年的对串和果实特征的产量记录和确认,根据表型选择dura用于育种。相比之下,pisifera棕榈通常是雌性不育的,因此其育群体体必须通过选定的tenera之间杂交或通过将选定的tenera与选定的pisifera杂交来产生。tenera x tenera杂交将产生25%的dura、50%的tenera和25%的pisifera。tenera x pisifera杂交将产生50%的tenera和50%的pisifera。然后通过用精英dura进行后代测试,即通过杂交dura和pisifera来产生tenera,然后随着时间的推移确定tenera的果实的产量表型,来间接确定pisifera的产量潜力。由此,基于它们的tenera后代的表现来选择具有良好的一般组合能力的pisifera。也进行选定的亲本之间的互交,其中后代接着进行下一育种周期。这允许将新基因引入育种程序以增加遗传变异性。
用于商业生产棕榈油的油棕榈栽培可以通过使用优质的tenera商业种植材料来改善。优先选择对象包括,从高新鲜果实串产量(也称为FFB)和高油串比(也称为O/B)(薄壳,厚中果皮)、高早期产量(早熟)和良好油质等性状方面的角度来说,每单位面积的高油产量。后代植物可以通过常规方法等栽培,例如幼苗可以在苗圃前设置和苗圃设置中的聚乙烯袋中栽培,培育约12个月,然后种植为幼苗,其中选择已知或预测展现高产量的后代用于进一步栽培等其他方法。
如上文提到的,通过对27个油棕榈来源的4,623株油棕榈植物进行基因组重新测序和全基因组关联研究,包括应用分层和亲缘关系校正,已经确定了位于油棕榈基因组的12个QTL区域中并且在分层和亲缘关系校正之后与高产油量性状相关联的SNP标记,就壳与果实比和中果皮与果实比的高产油量性状而言,可以用来分别实现例如0.32和0.30的相关性准确度。该27个油棕榈来源包括以下:(1)(Banting dura(也称为BD)x NigerianInstitute for Oil Palm Research(也称为NIFOR))x Jenderata、(2)Deli x AlgemeneVereniglng van Rubberplanters ter Oostkust van Sumatra(也称为AVROS)、(3)Deli xEkona、(4)(Elaeis guineensis x Elaeis oleifera)杂交体x AVROS、(5)Ekona x AVROS、(6)Gunung Melayu(也称为GM)x Dumpy AVROS(也称为DA)、(7)Johor Labis(也称为JL)xAVROS、(8)JL x DA、(9)JL x Highland Research Unit(也称为HRU)、(10)JL x Institutpour Research sur les Huiles et Oléagineux(也称为IRHO)、(11)(JL x HRU)x AVROS、(12)NIFOR x AVROS、(13)(NIFOR x DA)1、(14)(NIFOR x DA)2、(15)NIFOR x IRHO、(16)Nigerian x AVROS、(17)Serdang Avenue x AVROS、(18)Ulu Remis(也称为UR)x AVROS、(19)UR x DA、(20)UR x IRHO、(21)UR x Lobe、(22)(UR x NIFOR)1、(23)(UR x NIFOR)2、(24)(UR x NIFOR)3、(25)UR x Serdang AVROS、(26)UR x Serdang pisifera和(27)BD xAVROS。因此,在一些实例中油棕榈植物群体包括:(1)(BD x NIFOR)x Jenderata、(2)Delix AVROS、(3)Deli x Ekona、(4)(Elaeis guineensis x Elaeis oleifera)杂交x AVROS、(5)Ekona x AVROS、(6)GM)x DA、(7)JL x AVROS、(8)JL x DA、(9)JL x HRU、(10)JL xIRHO、(11)(JL x HRU)x AVROS、(12)NIFOR x AVROS、(13)(NIFOR x DA)1、(14)(NIFOR xDA)2、(15)NIFOR x IRHO、(16)Nigerian x AVROS、(17)Serdang Avenue x AVROS、(18)URx AVROS、(19)UR x DA、(20)UR x IRHO、(21)UR x Lobe、(22)(UR x NIFOR)1、(23)(UR xNIFOR)2、(24)(UR x NIFOR)3、(25)UR x Serdang AVROS、(26)UR x Serdang pisifera或(27)BD x AVROS或其组合。
实验油棕榈植物的样品可以包括实验油棕榈植物的任何器官、组织、细胞或其他部分,其包括实验油棕榈植物的足够的基因组DNA,以允许确定实验油棕榈植物的一种或多种SNP基因型,例如第一SNP基因型。例如,样品可以包括叶组织,以及其他器官、组织、细胞或其它部分。如普通技术人员将理解的,从实验油棕榈植物的样品确定实验油棕榈植物的一种或多种SNP基因型必然是样品的转换。例如,不能仅仅基于样品的外观来确定一个或多个SNP基因型.相反,确定实验油棕榈植物的一个或多个SNP基因型需要从实验油棕榈植物中分离样品和/或从样品中分离基因组DNA。
可以通过任何适合的技术来进行至少第一SNP基因型的确定,该适合的技术包括,例如,用SNP调用(SNP calling)的全基因组重新测序、基于杂交的方法、基于酶的方法或其他扩增后方法等。
第一SNP基因型对应于第一SNP标记。SNP标记是可用于基因定位的SNP。
第一SNP标记位于用于高产油量性状的第一数量性状基因座(也称为QTL)中。QTL是沿着染色体的一部分延伸的基因座,其有助于确定连续特征的表型,在这种情况下即高产油量性状。
高产油量性状涉及实验油棕榈植物在以下情况时生产棕榈油的性状,达到成熟状态(例如,达到生产期),且在适合于生产高量的棕榈油的条件下栽培(例如,对于实验油棕榈植物从其取样的油棕榈植物群体,商业栽培,高于平均值的量),还有达到成熟状态,且在适合于生产高量的棕榈油的条件下栽培.
如上文讨论的,就作为tenera油棕榈植物的测试油植物而言,高产油量性状可以对应于例如每年每公顷大于3.67公吨棕榈油的棕榈油产量,即,高于用于商业生产的典型的油棕榈植物(其也是tenera油棕榈植物)的近期平均产量。高产油量性状也可以对应于例如大于每年每公顷10公吨棕榈油的棕榈油产量,即,高于目前用于商业生产的最佳后代油棕榈植物的近期平均产量。高产油量性状也可以对应于例如大于每年每公顷4、5、6、7、8或9公吨棕榈油的棕榈油产量,即高于在上述近期平均产量之间的中间值的产量。就作为dura油棕榈植物或pisifera油棕榈植物的实验油棕榈植物而言,与dura和pisifera油棕榈植物相对于tenera油棕榈植物获得的较低的平均产量相一致,高产油量性状可能对应于相应的较低量的棕榈油产量。
在tenera油棕榈植物中,高产油量性状可以包括减小的壳与果实比(也称为S/F)、增加的中果皮与果实比(也称为M/F)或其组合。壳厚度和中果皮厚度可以是棕榈油产量的指标。更特别地,对于获得高产油的油棕榈植物而言,种植前选择将产生包括具有较薄的壳和较厚的中果皮的果实的油棕榈植物的油棕榈种子材料是优选的。
关于壳与果实比,如上文所讨论的,tenera果实通常具有果实重量8%至10%的薄壳,即S/F为8%至10%(壳重量/果实重量)。此外,已经观察到棕榈油产量倾向于随着tenera油棕榈植物的壳与果实比减小而增加。另外,壳与果实比一般也是高度可遗传的。以S/F(%)测量的壳厚度与以M/F(%)测量的中果皮厚度呈负相关。因此,育种者热衷于选择和生产具有壳较薄的果实的tenera油棕榈植物,使得果实具有相对较多的中果皮以获得较高的油产量。因此,相对低的S/F是tenera油棕榈植物的棕榈油产量相对高的指标。
关于中果皮与果实比,也如上文讨论的,对于tenera果实,中果皮与果实的比率通常相对较高,在60%至80%的范围内,即M/F为60%至80%(中果皮重量/果实重量)。此外,已经观察到棕榈油产量倾向于随着tenera油棕榈植物的中果皮与果实比增加而增加。另外,中果皮与果实比也是高度可遗传的。中果皮与果实比有助于根据以下公式结合其他串性状确定棕榈油产量:棕榈油产量/年=(串数/年)×(平均串重)×(小果实/串)×(中果皮与果实的比率)×(干中果皮与湿中果皮的比率)×(油与干中果皮的比率)。因此,育种者也热衷于选择和生产具有中果皮较厚的果实的tenera油棕榈植物,同样使得果实具有相对较多的中果皮以获得较高的油产量。因此,相对高的M/F也是tenera油棕榈植物的棕榈油产量相对高的指标。
因此,在一些实例中,在tenera油棕榈植物中高产油量性状包括减小的壳与果实比。而且,在一些实例中,在tenera油棕榈植物中高产油量性状包括增加的中果皮与果实比。而且,在一些实例中,在tenera油棕榈植物中高产油量性状包括减小的壳与果实比和增加的中果皮与果实比。
第一SNP标记在分层和亲缘关系校正之后以群体中至少7.0的全基因组-log10(p值),与高产油量性状相关联,或者相对于与该第一SNP标记连锁的第一其他SNP标记而言,具有至少0.2的连锁不平衡r2值,所述第一其他SNP标记在分层和亲缘关系校正之后,以群体中至少7.0的全基因组-log10(p值)与高产油量性状相关联。
在分层和亲缘关系校正之后,第一SNP标记以群体中至少7.0的全基因组-log10(p值)与性状相关联表明第一SNP标记与该性状相关联的可能性较高。
p值是观察到检验统计量的概率,在涉及SNP标记,例如,第一SNP标记或第一其他SNP标记与高产油量性状相关的这种情况下,如果零假设为真,因此没有关联,则等于或大于实际观察到的检验统计量,例如,如Bush&Moore,第11章:Genome-Wide AssociationStudies,PLOS Computational Biology 8(12):e 1002822,1-11(2012)所讨论的。还如Bush&Moore(2012年)所讨论的,为了方便起见,全基因组-log10(p值)对应于以对数刻度表示的p值,且该p值基于针对关于相应特定群体的整个基因组进行的关联的多次测试而被校正以把已经进行的统计测试的有效数量考虑在内。因此,相对高的全基因组-log10(p值)表明观察到的涉及关联相关性的检验统计量在没有关联时被观察到的可能性极低。
在确定关联相关性时,要把分层和亲缘关系校正考虑在内。如上文提到的,分层和亲缘关系校正减少了由于实验油棕榈植物从其取样的油棕榈植物群体中小群体个体的最近共同祖先导致的假阳性信号,从而使得基于关联的用于预测实验油棕榈植物的棕榈油产量的方法具有实用性。
更具体地考虑上文提到的27个油棕榈来源的4,623株油棕榈植物的基因组重新测序和全基因组关联研究,使用具有先前确定的群体参数(P3D)的压缩混合线性模型(也称为MLM)进行全基因组关联研究(也称为GWAS),以解决使用群体亲缘关系矩阵的基因组膨胀的问题。如图1所示,27个油棕榈来源中的Q-Q图示出观察到的统计数据与零期望值的偏差显著延迟。如图2所示,27个油棕榈来源所得的SNP的染色体分布可以在曼哈顿图中显现。基于这种方法,在排除27个油棕榈来源中重叠的标记后,鉴定了68个提供关于S/F、M/F或两者的信息的SNP。
对于其他油棕榈群体,也可以类似地应用分层和亲缘关系校正。
因此,例如,位于用于高产油量性状的第一QTL中,并且在分层和亲缘关系校正之后以群体中至少7.0的全基因组-log10(p值)与高产油量性状相关联的第一SNP标记,可以是这样的SNP标记:对于该SNP标记,与高产油量性状的关联(i)已经基于不是朴素模型的模型被确认和/或(ii)将基于不是朴素模型的模型被确认。还例如,位于用于高产油量性状的第一QTL中,并且在分层和亲缘关系校正之后以群体中至少4.0的全基因组-log10(p值)与高产油量性状相关联的第一SNP标记,可以是这样的SNP标记:对于该SNP标记,与高产油量性状的关联(i)已经用先前确定的群体参数基于压缩混合线性模型(其使用主成分分析和群体亲缘关系矩阵进行)被确认,和/或(ii)将用先前确定的群体参数基于压缩混合线性模型(其使用主成分分析和群体亲缘关系矩阵进行)被确认。
相对于与该第一SNP标记连锁,并且在分层和亲缘关系校正之后,以群体中至少7.0的全基因组-log10(p值)与高产油量性状相关联的第一其他SNP,具有至少0.2的连锁不平衡r2值的第一SNP标记表明以下内容.首先,很可能存在第一SNP标记的等位基因和第一其他SNP标记的等位基因为连锁不平衡。第二,很可能存在第一其他SNP标记和性状相关联。在这方面,连锁不平衡r2值涉及将两个基因座处于连锁不平衡的可能性测量为平均成对相关系数。
因此,在一些实例中,在分层和亲缘关系校正之后,第一SNP标记以群体中至少7.0的全基因组-log10(p值)与高产油量性状相关联。而且,在一些实例中,第一SNP标记相对于与该第一SNP标记连锁的第一其它SNP标记具有至少0.2的连锁不平衡r2值,所述第一其他SNP标记在分层和亲缘关系校正之后,以群体中至少7.0的全基因组-log10(p值)与高产油量性状相关联。而且,在一些示例中两者都适用。
第一QTL可以是对应于以下中的一个的油棕榈基因组的区域:
(1)QTL区域1,从染色体2的核苷酸1516571延伸至4215826;
(2)QTL区域2,从染色体2的核苷酸4858549延伸至5594262;
(3)QTL区域3,从染色体2的核苷酸33949264延伸至34110104;
(4)QTL区域4,从染色体3的核苷酸43405853延伸至43834266;
(5)QTL区域5,从染色体3的核苷酸44126148延伸至44193097;
(6)QTL区域6,从染色体4的核苷酸30702027延伸至31148630;
(7)QTL区域7,从染色体4的核苷酸33166529延伸至33451554;
(8)QTL区域8,从染色体7的核苷酸35906266延伸至36257708;
(9)QTL区域9,从染色体10的核苷酸29233675延伸至29612202;
(10)QTL区域10,从染色体11的核苷酸13470988延伸至13734716;
(11)QTL区域11,从染色体13的核苷酸24620951延伸至24989005;或
(12)QTL区域12,从染色体15的核苷酸6941783延伸至7160542。
染色体的编号(也称为连锁基团)及其核苷酸符合Singh等人Nature 500:335-339(2013年)和其中记录的补充信息所描述的非洲油棕榈E.guineenesis的18亿碱基基因组序列,表明E.guineenesis BioProject在http://genomsawit.mpob.gov.my中可供下载,并已登记在BioProject的PRJNA192219入口下的NCBI中,并且全基因组霰弹项目已经存入ASJS00000000入口下的DDBJ/EMBL/GenBank处。
为了参考,QTL区域1对应于从SEQ ID NO:1的5′端延伸至SEQ ID NO:2的3′端的油棕榈基因组的染色体2的区域。类似地,QTL区域2对应于从SEQ ID NO:3的5′端延伸至SEQID NO:4的3′端的染色体2的区域。QTL区域3对应于从SEQ ID NO:5的5′端延伸至SEQ IDNO:6的3′端的染色体2的区域。QTL区域4对应于从SEQ ID NO:7的5′端延伸至SEQ ID NO:8的3′端的染色体3的区域。QTL区域5对应于从SEQ ID NO:9的5′端延伸至SEQ ID NO:10的3′端的染色体1的区域。QTL区6对应于从SEQ ID NO:11的5′端延伸至SEQ ID NO:12的3′端的染色体4的区域。QTL区域7对应于从SEQ ID NO:13的5′端延伸至SEQ ID NO:14的3′端的染色体4的区域。QTL区域8对应于从SEQ ID NO:15的5′端延伸至SEQ ID NO:16的3′端的染色体7的区域。QTL区域9对应于从SEQ ID NO:17的5′端延伸至SEQ ID NO:18的3′端的染色体10的区域。QTL区域10对应于从SEQ ID NO:19的5′端延伸至SEQ ID NO:20的3′端的染色体11的区域。QTL区域11对应于从SEQ ID NO:21的5′端延伸至SEQ ID NO:22的3′端的染色体13的区域。QTL区域12对应于从SEQ ID NO:23的5′端延伸至SEQ ID NO:24的3′端的染色体15的区域。
该方法还包括步骤(ii):将实验油棕榈植物的第一SNP基因型与在与群体相同遗传背景下指示高产油量性状的相应的第一参考SNP基因型进行比较。与群体相同的遗传背景可以例如对应于基于与用于产生实验油棕榈植物从其取样的群体相同类型的杂交油棕榈植物的群体。因此,例如,与群体相同的遗传背景可以对应于上述27个油棕榈来源中的一个或多个,即对应于(1)(BD x NIFOR)x Jenderata、(2)Deli x AVROS、(3)Deli x Ekona、(4)(Elaeis guineensis x Elaeis oleifera)杂交x AVROS、(5)Ekona x AVROS、(6)GM)xDA、(7)JL x AVROS、(8)JL x DA、(9)JL x HRU、(10)JL x IRHO、(11)(JL x HRU)x AVROS、(12)NIFOR x AVROS、(13)(NIFOR x DA)1、(14)(NIFOR x DA)2、(15)NIFOR x IRHO、(16)Nigerian x AVROS、(17)Serdang Avenue x AVROS、(18)UR x AVROS、(19)UR x DA、(20)URx IRHO、(21)UR x Lobe、(22)(UR x NIFOR)1、(23)(UR x NIFOR)2、(24)(UR x NIFOR)3、(25)UR x Serdang AVROS、(26)UR x Serdang pisiifera或(27)BD x AVROS或其组合。与群体相同的遗传背景也可以例如对应于基于将用于产生实验油棕榈植物从其取样的群体的相同个体油棕榈植物进行杂交的群体。与群体相同的遗传背景也可以例如对应于实验油棕榈植物从其取样的相同实际群体。
在与群体相同遗传背景下指示高产油量性状的第一参考SNP基因型可以对应于与第一SNP基因型相同的SNP,即两者可以都对应于在特定染色体的特定基因座处发生的关于单个核苷酸相同的多态性变异。第一参考SNP基因型可以包括一个或多个SNP等位基因,其单独或一起表明与缺乏一个或多个SNP等位基因的相同群体的油棕榈植物相比,其实验油棕榈植物(如果成熟)表现出或(在达到成熟时)将表现出高产油量性状的较高可能性。
该方法还包括步骤(iii)基于实验油棕榈植物的第一SNP基因型与相应的第一参考SNP基因型的匹配程度预测实验油棕榈植物的棕榈油产量。基于两个SNP基因型至少共享在与群体相同遗传背景下指示高产油量性状的第一SNP等位基因,实验油棕榈植物的第一SNP基因型可以匹配相应的第一参考SNP基因型。在一些实例中,针对指示高产油量性状的第一等位基因,第一SNP基因型和第一参考SNP基因型是杂合的,即两者都仅具有一个拷贝的SNP等位基因。而且,在一些实例中,针对指示高产油量性状的第一等位基因,第一SNP基因型和第一参考SNP基因型是纯合的,即两者都具有两个拷贝的SNP等位基因。而且,在一些实例中,第一SNP基因型对于指示高产油量性状的笫一等位基因是杂合的,并且第一参考SNP基因型对于指示高产油量性状的第一等位基因是纯合的。而且,在一些实例中,第一SNP基因型对于指示高产油量性状的第一等位基因是纯合的,并且第一参考SNP基因型对于指示高产油量性状的第一等位基因是杂合的.
预测实验油棕榈植物的棕榈油产量的步骤可以进一步包括应用模型,比如基因型模型、显性模型或隐性模型等,以便于预测。基因型模型测试性状,例如高产油量性状与SNP等位基因,主要等位基因(A)或次要等位基因(a)的存在的关联。显性模型测试性状,例如高产油量性状与SNP等位基因作为纯合基因型或杂合基因型,例如,主要等位基因作为纯合基因型(例如A/A)或杂合基因型(例如A/a)存在的关联。隐性模型测试性状(例如高产油量性状)与SNP等位基因作为纯合基因型(例如,次要等位基因作为纯合基因型(a/a))的存在的关联。因此,在一些实例中,实验油棕榈植物的棕榈油产量的预测进一步包括应用基因型模型.而且在一些实例中,实验油棕榈植物的棕榈油产量的预测进一步包括应用显性模型。而且在一些实例中,实验油棕榈植物的棕榈油产量的预测进一步包括应用隐性模型。
QTL区域1至12中的SNP标记的特定SNP基因型可用于预测实验油棕榈植物的棕榈油产量的程度可能取决于用来产生实验油棕榈从其取样的群体的育种材料的来源和育种历史,例如包括用来产生该群体的育种材料和/或其来源的QTL区域1至12中出现了导致棕榈油产量增加的一个或多个高产量变体等位基因的程度,以及该一个或多个高产量变体等位基因与SNP的接近度,以及由于高产量变体等位基因的出现,SNP和高产量变体等位基因之间发生重组的程度。比如促进高产油量性状的高产量变体等位基因与SNP等位基因之间的接近度、低代数(由于高产量变体等位基因出现)以及高产量变体等位基因对棕榈油产量的强阳性作用的因素,可能倾向于增加特定SNP可以提供信息的程度.这些因素可以例如取决于高产量变体等位基因是显性的还是隐性的,因而基因型模型、显性模型或隐性模型是否可以适当地应用于相应的SNP等位基因而变化。这些因素也可以例如在由不同个体棕榈植物的杂交产生的不同群体之间变化。
预测实验油棕榈植物的棕榈油产量的步骤不仅可以有利地用来预测实验油棕榈植物本身的棕榈油产量,而且可以用来预测其后代的棕榈油产量。在这方面,油棕榈育种者可以使用适用于作为母本棕榈或花粉供体的实验油棕榈植物的方法,来确定通过将实验油棕榈植物与另一种油棕榈植物杂交而产生的后代的可能的SNP基因型,并且此外,可以选择特定的棕榈,即实验油棕榈植物和另一种具有类似特征的特定的油棕榈植物,以在此基础上进行杂交。
就源自特定育种材料的实验油棕榈植物而言,用于预测实验油棕榈植物的棕榈油产量的方法可以通过集中在特定QTL或其组合上来使用。
例如,在一些实例中,第一QTL对应于QTL区域1、2、3、4、5、6、7或10中的一个,高产油量性状包括减小的壳与果实比,并且步骤(iii)进一步包括应用基因型模型,由此预测实验油棕榈植物的棕榈油产量。
而且,在一些实例中,第一QTL对应于QTL区域1、8、9、11或12中的一个,高产油量性状包括增加的中果皮与果实比,并且步骤(iii)进一步包括应用基因型模型,由此预测实验油棕榈植物的棕榈油产量。
而且,在一些实例中,第一QTL对应于QTL区域1,高产油量性状包括减小的壳与果实比和增加的中果皮与果实比,并且步骤(iii)进一步包括应用基因型模型,由此预测所述实验油棕榈植物的棕榈油产量。
而且,在一些实例中,第一QTL对应于QTL区域1,高产油量性状包括减小的壳与果实比,并且步骤(iii)进一步包括应用显性模型,由此预测所述实验油棕榈植物的棕榈油产量。
而且,在一些实例中,第一QTL对应于QTL区域1,高产油量性状包括减小的壳与果实比;并且步骤(iii)进一步包括应用隐性模型,由此预测实验油棕榈植物的棕榈油产量。
而且,在一些实例中,第一QTL对应于QTL区域1,高产油量性状包括增加的中果皮与果实比,并且步骤(iii)进一步包括应用隐性模型,由此预测实验油棕榈植物的棕榈油产量。
而且,在一些实例中,第一QTL对应于QTL区域1,高产油量性状包括减小的壳与果实比和增加的中果皮与果实比,并且步骤(iii)进一步包括应用隐性模型,由此预测实验油棕榈植物的棕榈油产量。
如上文提到的,杂交dura和pisifera产生具有第三种果实类型,tenera的棕榈.还如提到的,tenera通常用作商业种植材料。因此,在一些实例中,实验油棕榈植物是tenera候选农业生产植物。在一些实例中,油棕榈植物群体包括有商业价值的Ulu Remis dura xAVROS pisifera群体,并且实验油棕榈植物是tenera候选农业生产植物。而且,在一些实例中,油棕榈植物群体包括有商业价值的Banting dura x AVROS pisifera群体,并且实验油棕榈植物是tenera候选农业生产植物。
还如上文提到的,油棕榈育种主要是为了选择改良的亲本dura和pisifera育种母株棕榈,用于生产优质tenera商业种植材料。还如所述的,通过在选定的dura棕榈之间杂交产生亲本dura育群体体,然而pisifera通常是雌性不育的,因此其育群体体必须通过在选定的tenera之间杂交或通过将选定的tenera与选定的pisifera杂交来产生。因此,在一些实例中,实验油棕榈植物是用于母本棕榈选择和繁殖的植物、用于基因渗入的母本棕榈选择和繁殖的植物、或用于花粉供体选择和繁殖的植物。在一些实例中,油棕榈植物群体包括Ulu Remis dura x Ulu Remis dura群体,并且实验油棕榈植物是用于母本选择和繁殖的植物。而且在一些实例中,油棕榈植物群体包括Ulu Remis dura x Ulu Remis dura群体,并且实验油棕榈植物是用于基因渗入的母本棕榈选择和繁殖的植物。而且在一些实例中,油棕榈植物群体包括Ulu Remis dura x Banting dura群体,并且实验油棕榈植物是用于母本棕榈选择和繁殖的植物。而且在一些实例中,油棕榈植物群体包括Banting dura xBanting dura群体,并且实验油棕榈植物是用于母本棕榈选择和繁殖的植物。而且在一些实例中,油棕榈植物群体包括Banting dura x Banting dura群体,并且实验油棕榈植物是用于基因渗入的母本棕榈选择和繁殖的植物。而且在一些实例中,油棕榈植物群体包括AVROS pisifera x AVROS tenera群体,并且实验油棕榈植物是用于花粉供体选择和繁殖的植物。而且在一些实例中,油棕榈植物群体包括AVROS tenera x AVROS tenera群体,并且实验油棕榈植物是用于花粉供体选择和繁殖的植物。
用于预测实验油棕榈植物的棕榈油产量的方法也可以通过如下进行:确定额外的SNP基因型,将该额外的SNP基因型与指示高产油量性状的相应参考基因型进行比较,并且基于额外的SNP基因型与相应参考SNP基因型的匹配程度来进一步预测实验油棕榈植物的棕榈油产量。这是因为每个SNP基因型可以反映高产量变体等位基因,其关于其他方面累积地和/或协同地有助于高产油量性状。
因此,在一些实例中,步骤(i)进一步包括从实验油棕榈植物的样品中确定实验油棕榈植物的至少第二SNP基因型,该第二SNP基因型对应于第二SNP标记,该第二SNP标记(a)位于用于高产油量性状的第二QTL中,并且(b)在分层和亲缘关系校正之后,以群体中至少7.0的全基因组-log10(p值)与高产油量性状相关联,或者相对于与该第二SNP标记连锁的第二其他SNP标记具有至少0.2的连锁不平衡r2值,所述第二其他SNP标记在分层和亲缘关系校正之后,以群体中至少7.0的全基因组-log10(p值)与高产油量性状相关联。此外,在这些实例中,步骤(ii)进一步包括将实验油棕榈植物的第二SNP基因型与在与群体相同遗传背景下指示高产油量性状的相应的第二参考SNP基因型进行比较。此外,在这些实例中,第二QTL对应于QTL区域1至12中的一个,条件是第一QTL和第二QTL对应于不同的QTL区域。在这些实例中的一些实例中,步骤(iii)进一步包括基于实验油棕榈植物的第二SNP基因型与相应的第二参考SNP基因型的匹配程度来预测实验油棕榈植物的棕榈油产量。而且,如上文讨论的,在这些实例中的一些中,在tenera油棕榈植物中,高产油量性状可以包括减小的壳与果实比(也称为S/F)、增加的中果皮与果实比(也称为M/F)或其组合。
而且在一些实例中,步骤(i)进一步包括从实验油棕榈植物的样品中确定实验油棕榈植物的至少第三SNP基因型至第十二SNP基因型,该第三SNP基因型至该第十二SNP基因型分别对应于第三SNP标记至第十二SNP标记,该第三SNP标记至该第十二SNP标记(a)分别位于用于高产油量性状的第三QTL至第十二QTL中,并且(b)在分层和亲缘关系校正之后,以群体中至少7.0的全基因组-log10(p值)与高产油量性状相关联,或者分别相对于与该第一SNP标记连锁的第三其他SNP标记至第十二其他SNP标记具有至少0.2的连锁不平衡r2值,所述第三QTL至第十二QTL在分层和亲缘关系校正之后,以群体中至少7.0的全基因组-log10(p值)与高产油量性状相关联。此外,在这些实例中,步骤(ii)进一步包括将实验油棕榈植物的第三SNP基因型至第十二SNP基因型分别与在与该群体相同遗传背景下指示高产油量性状的相应的第三参考SNP基因型至相应的第十二参考SNP基因型进行比较。此外,在这些实例中,第三QTL至第十二QTL各自对应于QTL区域1至12中的一个,条件是第一QTL至第十二QTL各自对应于不同的QTL区域。在这些实例中的一些实例中,步骤(iii)进一步包括基于实验油棕榈植物的第三SNP基因型至第十二SNP基因型分别与相应的第三参考SNP基因型至相应的第十二参考SNP基因型相的匹配程度来预测实验油棕榈植物的棕榈油产量。而且,如上文讨论的,在这些实例中的一些中,在tenera油棕榈植物中,高产油量性状可以包括减小的壳与果实比(也称为S/F)、增加的中果皮与果实比(也称为M/F)或其组合
还提供了一种选择高产棕榈油的油棕榈植物用于农业生产棕榈油的方法。该方法包括步骤(a)预测实验油棕榈植物的棕榈油产量。该步骤可以根据上述方法进行,即包括以下步骤:(i)从油棕榈植物群体的实验油棕榈植物的样品中确定实验油棕榈植物的至少第一单核苷酸多态性(SNP)基因型,(ii)将实验油棕榈植物的第一SNP基因型与在与群体相同遗传背景下指示高产油量性状的相应的第一参考SNP基因型进行比较,以及(iii)基于实验油棕榈植物的第一SNP基因型与相应的第一参考SNP基因型的匹配程度来预测实验油棕榈植物的棕榈油产量,其中,如上所述,第一QTL是对应于QTL区域1至12中的一个的油棕榈基因组的区域。该方法还包括以下步骤:(b)如果基于步骤(a)预测实验油棕榈植物的棕榈油产量高于群体的平均值,则田间种植实验油棕榈植物用于农业生产棕榈油。
还提供了一种选择高产棕榈油的油棕榈植物用于在细胞培养物中培养的方法。该方法包括步骤(a):预测实验油棕榈植物的棕榈油产量。同样,该步骤可以根据上述方法进行,即包括以下步骤:(i)从油棕榈植物群体的实验油棕榈植物的样品中确定至少第一单核苷酸多态性(SNP)基因型,(ii)将实验油棕榈植物的第一SNP基因型与在与群体相同遗传背景下指示高产油量性状的相应的第一参考SNP基因型进行比较,以及(iii)基于实验油棕榈植物的第一SNP基因型与相应的第一参考SNP基因型的匹配程度来预测实验油棕榈植物的棕榈油产量,其中,如上所述,第一QTL是对应于QTL区域1至12中的一个的油棕榈基因组的区域。该方法还包括步骤(b):如果基于步骤(a)预测实验油棕榈植物的棕榈油产量比群体的平均值高,则使实验油棕榈植物的至少一个细胞在细胞培养物中培养。
还提供了一种选择亲本油棕榈植物用于育种以获得农业生产植物或改良的亲本油棕榈植物的方法。如上文提到的,油棕榈育种者可以使用适用于作为母本棕榈或花粉供体的实验油棕榈植物的方法,来确定通过将实验油棕榈植物与另一种油棕榈植物杂交而产生的后代的可能的SNP基因型,并且此外,可以选择特定的棕榈,即实验油棕榈植物和另一种具有类似特征的特定的油棕榈植物,以在此基础上进行杂交。该方法包括步骤(a):预测实验油棕榈植物的棕榈油产量。同样,该步骤可以根据上述方法进行,即包括以下步骤:(i)从油棕榈植物群体的实验油棕榈植物的样品中确定至少第一单核苷酸多态性(SNP)基因型,步骤(ii)将实验油棕榈植物的第一SNP基因型与在与群体相同遗传背景下指示高产油量性状的相应的第一参考SNP基因型进行比较,以及(iii)基于实验油棕榈植物的第一SNP基因型与相应的第一参考SNP基因型的匹配程度来预测实验油棕榈植物的棕榈油产量,其中,如上所述,第一QTL是对应于QTL区域1至12中的一个的油棕榈基因组的区域。该方法还包括步骤(b):如果基于步骤(a)预测实验油棕榈植物的tenera后代的棕榈油产量比群体平均值高,则选择该实验油棕榈植物用于育种。
以下实施例是为了说明的目的,并不意图限制权利要求的范围。
实施例
取样和DNA制备
对表示源自27个油棕榈来源(包括有商业价值的Ulu Remis dura x AVROSpisifera群体和有商业价值的Banting dura x AVROS pisifera群体等等)的全基因组关联研究(也称为GWAS)定位群体的4,623株油棕榈植物进行取样。该27个油棕榈来源包括以下:(1)(BD x NIFOR)x Jenderata、(2)Deli x AVROS、(3)Deli x Ekona、(4)(Elaeisguineensis x Elaeis oleifera)杂交x AVROS、(5)Ekona x AVROS、(6)GM)x DA、(7)JL xAVROS、(8)JL x DA、(9)JL x HRU、(10)JL x IRHO、(11)(JL x HRU)x AVROS、(12)NIFOR xAVROS、(13)(NIFOR x DA)1、(14)(NIFOR x DA)2、(15)NIFOR x IRHO、(16)Nigerian xAVROS、(17)Serdang Avenue x AVROS、(18)UR x AVROS、(19)UR x DA、(20)UR x IRHO、(21)UR x Lobe、(22)(UR x NIFOR)1、(23)(UR x NIFOR)2、(24)(UR x NIFOR)3、(25)UR xSerdang AVROS、(26)UR x Serdang pisifera和(27)BD x AVROS。样品选择基于壳与果实比(也称为S/F)(%)和中果皮与果实比(也称为M/F)(%)变体的良好代表和相应育种者记录的系谱。使用DNAeasy(R)Plant Mini Kit(荷兰林堡Qiagen公司)从没有展开的嫩叶中分离总基因组DNA。
全基因组重新测序
基于来自每个样品的相等摩尔浓度的DNA集合样品以形成测序DNA池。使用HiSeq2000(TM)测序系统(加利福尼亚州圣地亚哥Illumina公司)制备重新测序的文库,以产生100bp双端读数至35x基因组覆盖,得到1,015,758,056个原始读数。使用BWA Mapper(如Li&Durbin,Bioinformatics 26:589-595(201O)发表),用默认参数,对该双端读数整理、过滤并与已发表的油棕榈基因组(如Singh等人,Nature 500:335-339(2013年)所述)比对。然后使用SAMtools(Li等人,Bioinformatics 25:2078-2079(2009)发表)调用并过滤共计6,846,197个假定的SNP,具有如下参数:SNP的最小定位质量分数为25,最小深度为3x,与间隙的最小SNP距离为2bp。在假定的SNP中,去除了从Elaeis oleifera产生的1,085,204个SNP。基于覆盖(最小17或最大53)、最小分数为8的基因型质量和/或最小等位基因频率(也称为MAF)<0.05),还去除了746,092个SNP。根据Illumina的技术要求,进行其他筛选步骤,以去除5,274,000个SNP,包括去除距离小于60bp和模糊核苷酸的SNP对。这产生了664,136个质量SNP.根据连锁不平衡,将r2截止值设定为0.3,其中将共计200K的SNP(平均密度为每11Kb一个SNP)提交给Illumina,使用Illumina的用于Infinium的测定设计工具(Illumina)进行设计分数计算.
SNP基因分型
使用OP100K Infinium阵列(Illumina)来测定GWAS定位群体(
Figure BPA0000257487940000201
DNA/样品)。然后通过不需要凝胶电泳的受控的酶法将过夜扩增的DNA样品片段化。在相应的毛细管流通室中培育过夜后,将重新悬浮的DNA样品与BeadChips(Illumina)杂交。等位基因特异性杂交被荧光标记并通过BeadArray Reader(Illumina)检测。然后使用GenomeStudio数据分析软件(Illumina)分析原始读数,用于自动化基因分型调用和质量控制。为了产生用于GWAS的基因型数据集,仅接受具有>0.01的最小等位基因频率和>90%的调用率(callrate)的SNP。随后,根据Endelman,Plant Genome 4:250-255(2011年),基于每个标记的平均值输入那些SNP的缺失基因型。
基因分层和群体分析
研究中的个体首先根据基于其各自的背景分成不同的群体,这解决了群体结构效应。在每个群体中,使用个体之间的关系矩阵进行亲缘关系矫正,这解决了隐蔽相关性。
表型数据汇编和GWAS
S/F对应于每个果实的壳(也称为种皮),通常基于重量/重量百分比(也称为%)表示。
M/F对应于每个果实的中果皮,也通常基于重量/重量百分比(也称为%)表示。
额外的测量包括以下。油/株棕榈(也称为O/P)被测量为新鲜果实串(也称为FFB)x油/串(也称为O/B)。FFB对应于每株棕榈每年产生的串的总重量。通常在串收获期间在田间进行FFB的测量。O/B对应于每串的油含量。根据如Blaak等人,“Methods of bunchanalysis”,Breeding and Inheritance in the Oil Palm(Elaeis guineensis Jacq.)第二部分,第4卷:146-155(J.W.Afr.Ins.Oil Palm Res.,1963)所描述的行业实践,以及如Rao等人,“A Critical Reexamination of the Method of Bunch Analysis in Oil PalmBreeding”,Palm Oil Research Institute Malaysia Occ Paper 9:1-28(1983)所描述的修改进行S/F、M/F和O/B的测量。
基于Zhang等人,Nature Genetics 42:355-360(2010)的压缩混合线性模型(也称为MLM)与P3D分析,在根据Endelman(2011)的rrBLUP程序中,分别对27个油棕榈来源的4,623株油棕榈植物进行关联分析。常见SNP总数为92,057个SNP,其中最小等位基因频率>0.01。根据VanRaden,Journal of Dairy Science 91:4414-4423(2008),通过包括亲缘关系矩阵来解释由隐蔽相关性导致的遗传子结构,作为压缩MLM方法中的随机作用。对于27个群体,由于S/F性状和M/F性状的复杂性质,全基因组显著性-log10(p值)截止值固定在≥7。然后使用R包qqman(根据Turner,qqman:An R package for visualizing GWAS resultsusing Q-Q and Manhattan plots,其可从http://biorxiv.org/content/early/2014/05/14/005165获得(最后访问时间2014年11月15日))构建四分位数-四分位数(Q-Q)图和曼哈顿图。根据Aulchenko等人(2007),还根据R包GenABEL中估计的基因组膨胀因子(GIF),对两种方法的膨胀假阳性信号进行评价。
SNP作用和统计学分析
进一步分析了根据-log10(p值)≥7.0的显著SNP对于S/F性状和M/F性状的基于基因型模型的SNP作用。该作用通过分别导致高S/F和M/F值相对于低S/F和M/F值的基因型的平均性状值的差来确定。同一分析方法被扩展,以通过显性模型(A/A+A/a,a/a)和隐性模型(A/A,A/a+a/a)来确定S/F和M/F与一个SNP等位基因(主要等位基因(A)或次要等位基因(a))的存在的关联。
基因组选择
对于基因组选择,SNP标记基于其与S/F性状和/或M/F性状的关联性评分进行分类。选择独特的SNP标记来限定范围。针对基于其与S/F性状和/或M/F性状的关联性评分从高关联性至低关联性分类的SNP标记进行分析。还针对与基于其与S/F性状和/或M/F性状的关联性评分从高关联性至低关联性分类的SNP标记连锁不平衡的SNP标记进行分析。对于连锁不平衡的情况,基于每个连锁不平衡区域的一个随机SNP产生图,其中对于交叉验证每次共1,000次循环。
结果
在表1中提供了表示源自27个油棕榈来源的GWAS定位群体的4,623株油棕榈植物的油产量表型数据,表示为S/F(%)和M/F(%)。可以看出,4,623株油棕榈植物表现出10.977%的平均S/F(%)和79.799%的平均M/F(%)。
如表2所示,与图3中的详细阐述一起,鉴定了表示源自27个油棕榈来源的GWAS定位群体的4,623株油棕榈植物的S/F性状和M/F性状的十二个QTL区域。染色体及其核苷酸的编号符合如上文讨论的Singh等人,Nature 500:335-339(2013年)以及其中记录的补充信息中描述的非洲油棕榈E.guineensis的18亿碱基基因组序列。12个QTL区域跨度为6,403,329个核苷酸,相当于大约0.36%的油棕榈基因组。
如表3、表4、表5和表6所示,鉴定了提供关于表示源自27个油棕榈来源的GWAS定位群体的4,623株油棕榈植物的S/F和/或M/F信息的且位于12个QTL内的六十八个SNP标记。SNP鉴定信息和位置信息在表3中提供。主要等位基因、次要等位基因、最小等位基因频率、最小壳与果实比(%)的基因型、最大壳与果实比(%)的基因型和关于基因型模型、显性模型和隐性模型的减小的壳与果实比(%)的全基因组-log10(p值)在表4中提供。主要等位基因、次要等位基因、最小等位基因频率、最小中果皮与果实比(%)的基因型、最大中果皮与果实比(%)的基因型和关于基因型模型、显性模型和隐性模型的减小的中果皮与果实比(%)的全基因组-log10(p值)在表5中提供。包括与高产油量性状关联的SNP等位基因的油棕榈植物相对于缺乏该SNP等位基因的油棕榈植物的平均壳与果实比(%)和平均中果皮与果实比(%)的差在表6中提供。
从表4和表5中可以看出,关于基因型模型、显性模型或隐性模型中的至少一个,关于S/F或M/F中的至少一个,每个SNP标记产生至少7.0的全基因组范围-log10(p值)。事实上,许多SNP标记对S/F和M/F两者和/或关于多于一个模型,产生至少7.0的全基因组范围-log10(p值)。而且,从表6可以看出,对于检测到次要SNP等位基因的每个SNP标记,包括与高产油量性状相关联的SNP等位基因(关于S/F称为Min且关于M/F称为Max)的油棕榈植物与缺乏SNP等位基因(关于S/F称为Max且关于M/F称为Min)的油棕榈植物在平均百分比S/F和M/F上的差,关于特定的基因型模型,对于S/F(%)在9.52%至22.4%范围内,并且对于M/F(%)在68.20%至82.70%范围内。各种SNP标记提供了关于S/F和M/F两者的信息。
可以以各种组合使用68个SNP标记,以获得对于S/F和M/F两者的提高的预测准确度。例如,如表7和图4所示,S/F(%)的预测精度可以从在使用一个SNP标记(对应于QTL区域1的SNP编号39(SD_SNP_000035300))的基础上得到的0.094660024%提高到在使用四个SNP标记(对应于QTL区域1的SNP编号39(SD_SNP_000035300)、QTL区域4的SNP编号59(SD_SNP_000038060)、QTL区域6的SNP编号63(SD_SNP_000033505)以及QTL区域3的SNP编号57(SD_SNP_000042902))的基础上得到的0.309159861%。而且例如,如表8和图5所示,M/F(%)的预测精度可以从在使用1个SNP标记(QTL区域1的SNP编号40(SD_SNP_000015816))的基础上得到的0.079364949%提高到在使用四个SNP标记(QTL区域1的SNP编号40(SD_SNP_000015816)、QTL区域12的SNP编号68(SD_SNP_000044156)、QTL区域9的SNP编号66(SD_SNP_000006564)以及QTL区域11的SNP编号62(SD_SNP_000010805))的基础上得到的0.301288282%。这些结果表明与组合使用SNP标记关联的累加效应。通过组合使用额外的SNP标记可以进一步提高预测准确度。
表1.表示源自27个油棕榈来源的GWAS定位群体的4,623株油棕榈植物的壳与果实比(%)和中果皮与果实比(%)。
Figure BPA0000257487940000221
Figure BPA0000257487940000231
表2.QTL区域1至12:染色体和核苷酸位置信息。
Figure BPA0000257487940000232
表3.QTL区域1至12中的SNP标记:SNP鉴定信息和位置信息。
Figure BPA0000257487940000233
Figure BPA0000257487940000241
表4.QTL区域1至12中的SNP标记:主要等位基因、次要等位基因、最小等位基因频率、最小壳与果实比(%)的基因型、最大壳与果实比(%)的基因型和关于基因型模型、显性模型和隐性模型的减小的壳与果实比(%)的全基因组-log10(p值)。SNP编号与表3是一致的。
Figure BPA0000257487940000242
Figure BPA0000257487940000251
Figure BPA0000257487940000261
表5.QTL区域1至12中的SNP标记:主要等位基因、次要等位基因、最小等位基因频率、最小中果皮与果实比(%)的基因型、最大中果皮与果实比(%)的基因型和关于基因型模型、显性模型和隐性模型的增加的中果皮与果实比(%)的全基因组-log10(p值).SNP编号与表3是一致的。
Figure BPA0000257487940000262
Figure BPA0000257487940000271
表6.QTL区域1至12中的SNP标记:关于基因型,包括与高产油量性状相关联的SNP等位基因的油棕榈植物(称为Max)相比于缺乏SNP等位基因的油棕榈植物(称为Min)在平均壳与果实比(%)和平均中果皮与果实比(%)上的差(称为δ)。SNP编号与表3是一致的。
Figure BPA0000257487940000272
Figure BPA0000257487940000281
Figure BPA0000257487940000291
表7.对应于所指示的SNP编号、SNP ID和QTL区域,使用来自一个SNP标记至八个SNP标记对S/F(%)的相关性准确度的额外作用。
Figure BPA0000257487940000292
表8.对应于所指示的SNP编号、SNP ID和QTL区域,使用来自一个SNP标记至五个SNP标记对M/F(%)的相关性准确度的额外作用。
Figure BPA0000257487940000293
工业应用
本文公开的方法可用于预测实验油棕榈植物的油产量,从而用于改进棕榈油的商业生产。
Figure IPA0000257487890000011
Figure IPA0000257487890000021
Figure IPA0000257487890000031
Figure IPA0000257487890000041
Figure IPA0000257487890000051
Figure IPA0000257487890000061
Figure IPA0000257487890000071

Claims (6)

1.一种用于预测实验油棕榈植物的棕榈油产量的方法,所述方法包括以下步骤:
(i)从油棕榈植物群体的实验油棕榈植物的样品确定所述实验油棕榈植物的SNP基因型,所述SNP基因型对应于SNP标记,所述SNP标记(a)位于用于高产油量性状的QTL中,并且(b)在分层和亲缘关系校正之后,以所述群体中至少7.0的全基因组-log10(p值)与所述高产油量性状相关联,或者相对于与所述SNP标记连锁的其他SNP标记具有至少0.2的连锁不平衡r2值,并且所述其他SNP标记在分层和亲缘关系校正之后,以所述群体中至少7.0的全基因组-log10(p值)与所述高产油量性状相关联;
(ii)将所述实验油棕榈植物的所述SNP基因型与在与所述群体相同遗传背景下指示所述高产油量性状的相应的参考SNP基因型进行比较;以及
(iii)基于所述实验油棕榈植物的所述SNP基因型与所述相应的参考SNP基因型的匹配程度来预测所述实验油棕榈植物的棕榈油产量,
其中所述QTL是对应于以下中的油棕榈基因组的区域:
(1)QTL区域1,从染色体2的核苷酸1516571延伸至4215826;
(2)QTL区域2,从染色体2的核苷酸4858549延伸至5594262;
(3)QTL区域3,从染色体2的核苷酸33949264延伸至34110104;
(4)QTL区域4,从染色体3的核苷酸43405853延伸至43834266;
(5)QTL区域5,从染色体3的核苷酸44126148延伸至44193097;
(6)QTL区域6,从染色体4的核苷酸30702027延伸至31148630;
(7)QTL区域7,从染色体4的核苷酸33166529延伸至33451554;
(8)QTL区域8,从染色体7的核苷酸35906266延伸至36257708;
(9)QTL区域9,从染色体10的核苷酸29233675延伸至29612202;
(10)QTL区域10,从染色体11的核苷酸13470988延伸至13734716;
(11)QTL区域11,从染色体13的核苷酸24620951延伸至24989005;
(12)QTL区域12,从染色体15的核苷酸6941783延伸至7160542;
其中所述高产油量性状为在tenera油棕榈植物中减小的壳与果实比、增加的中果皮与果实比或其组合,并且
其中QTL区域1至12中SNP标记的位置信息如下:
Figure FDA0003335714640000011
Figure FDA0003335714640000021
Figure FDA0003335714640000031
2.如权利要求1所述的方法,其中所述实验油棕榈植物是tenera候选农业生产植物。
3.如权利要求1所述的方法,其中所述SNP标记为用于所述高产油量性状的tenera油棕榈植物中减小的壳与果实比的SNP标记,并且主要等位基因、次要等位基因、次要等位基因频率、最小壳与果实比的基因型、最大壳与果实比的基因型和关于基因型模型、显性模型和隐性模型的减小的壳与果实比的全基因组-log10(p值)如下:
Figure FDA0003335714640000032
Figure FDA0003335714640000041
Figure FDA0003335714640000051
4.如权利要求1所述的方法,其中所述SNP标记为用于所述高产油量性状的tenera油棕榈植物中增加的中果皮与果实比的SNP标记,并且主要等位基因、次要等位基因、次要等位基因频率、最小中果皮与果实比的基因型、最大中果皮与果实比的基因型和关于基因型模型、显性模型和隐性模型的增加的中果皮与果实比的全基因组-log10(p值)如下:
Figure FDA0003335714640000052
Figure FDA0003335714640000061
Figure FDA0003335714640000071
5.如权利要求1所述的方法,其中用于基因型模型的QTL区域1至12中的SNP标记,称为最大的包括高产油量性状相关联的SNP等位基因的油棕榈植物相比于称为最小的缺乏SNP等位基因的油棕榈植物的平均壳与果实比和平均中果皮与果实比的差如下:
Figure FDA0003335714640000072
Figure FDA0003335714640000081
6.一种选择高产棕榈油的油棕榈植物用于农业生产棕榈油的方法,所述方法包括以下步骤:
(a)预测实验油棕榈植物的棕榈油产量,包括(i)从油棕榈植物群体的实验油棕榈植物的样品确定所述实验油棕榈植物的SNP基因型,所述SNP基因型对应于SNP标记,所述SNP标记(a)位于用于高产油量性状的QTL中,并且(b)在分层和亲缘关系校正之后,以所述群体中至少7.0的全基因组-log10(p值)与所述高产油量性状相关联,或者相对于与所述SNP基因型连锁的其他SNP标记具有至少0.2的连锁不平衡r2值,并且所述其他SNP标记在分层和亲缘关系校正之后,以所述群体中至少7.0的全基因组-log10(p值)与所述高产油量性状相关联;
(ii)将所述实验油棕榈植物的所述SNP基因型与在与所述群体相同遗传背景下指示所述高产油量性状的相应的参考SNP基因型进行比较;和
(iii)基于所述实验油棕榈植物的所述SNP基因型与所述相应的参考SNP基因型的匹配程度来预测所述实验油棕榈植物的棕榈油产量,
其中所述QTL是对应于以下中的油棕榈基因组的区域:
(1)QTL区域1,从染色体2的核苷酸1516571延伸至4215826;
(2)QTL区域2,从染色体2的核苷酸4858549延伸至5594262;
(3)QTL区域3,从染色体2的核苷酸33949264延伸至34110104;
(4)QTL区域4,从染色体3的核苷酸43405853延伸至43834266;
(5)QTL区域5,从染色体3的核苷酸44126148延伸至44193097;
(6)QTL区域6,从染色体4的核苷酸30702027延伸至31148630;
(7)QTL区域7,从染色体4的核苷酸33166529延伸至33451554;
(8)QTL区域8,从染色体7的核苷酸35906266延伸至36257708;
(9)QTL区域9,从染色体10的核苷酸29233675延伸至29612202;
(10)QTL区域10,从染色体11的核苷酸13470988延伸至13734716;
(11)QTL区域11,从染色体13的核苷酸24620951延伸至24989005;
(12)QTL区域12,从染色体15的核苷酸6941783延伸至7160542;
(b)如果基于步骤(a)预测所述实验油棕榈植物的所述棕榈油产量高于所述群体的平均值,则田间种植所述实验油棕榈植物用于农业生产棕榈油;
其中所述高产油量性状为在tenera油棕榈植物中减小的壳与果实比、增加的中果皮与果实比或其组合,并且
其中QTL区域1至12中SNP标记的位置信息如下:
Figure FDA0003335714640000091
Figure FDA0003335714640000101
Figure FDA0003335714640000111
CN201680063501.1A 2015-12-30 2016-11-09 用于预测实验油棕榈植物的棕榈油产量的方法 Active CN108368555B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
MYPI2015003079A MY186767A (en) 2015-12-30 2015-12-30 Methods for predicting palm oil yield of a test oil palm plant
MYPI2015003079 2015-12-30
PCT/MY2016/000076 WO2017116224A1 (en) 2015-12-30 2016-11-09 Methods for predicting palm oil yield of a test oil palm plant

Publications (2)

Publication Number Publication Date
CN108368555A CN108368555A (zh) 2018-08-03
CN108368555B true CN108368555B (zh) 2022-03-01

Family

ID=58054475

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201680063501.1A Active CN108368555B (zh) 2015-12-30 2016-11-09 用于预测实验油棕榈植物的棕榈油产量的方法

Country Status (7)

Country Link
US (1) US20180274016A1 (zh)
EP (1) EP3397776A1 (zh)
CN (1) CN108368555B (zh)
HK (1) HK1257418A1 (zh)
MY (1) MY186767A (zh)
SG (1) SG11201802844UA (zh)
WO (1) WO2017116224A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109741789B (zh) * 2019-01-22 2021-02-02 隆平农业发展股份有限公司 一种基于rrblup的全基因组预测方法和装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101688238A (zh) * 2007-03-19 2010-03-31 苏玛塔拉生物科学股份有限公司 单倍体油棕和双单倍体油棕的生产方法
WO2014129885A1 (en) * 2013-02-21 2014-08-28 Malaysian Palm Oil Board Method for identification of molecular markers linked to height increment

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US1085204A (en) 1912-07-18 1914-01-27 Raymond Grinde Shovel attachment for tobacco cultivation.
MY178218A (en) * 2011-09-13 2020-10-07 Sime Darby Malaysia Berhad Methods for obtaining high-yielding oil palm plants
WO2013142187A1 (en) 2012-03-19 2013-09-26 Malaysian Palm Oil Board Gene controlling shell phenotype in palm
SG11201502998UA (en) * 2012-10-10 2015-06-29 Sime Darby Malaysia Berhad Methods and kits for increasing or predicting oil yield
MY156871A (en) 2013-07-18 2016-04-07 Malaysian Palm Oil Board Detection methods for oil palm shell alleles
US20150024388A1 (en) 2013-07-19 2015-01-22 Malaysian Palm Oil Board Expression of SEP-like Genes for Identifying and Controlling Palm Plant Shell Phenotypes
MY183021A (en) * 2014-05-14 2021-02-05 Acgt Sdn Bhd Method of predicting or determining plant phenotypes
MY187907A (en) * 2015-02-18 2021-10-28 Sime Darby Plantation Berhad Methods and snp detection kits for predicting palm oil yield of a test oil palm plant

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101688238A (zh) * 2007-03-19 2010-03-31 苏玛塔拉生物科学股份有限公司 单倍体油棕和双单倍体油棕的生产方法
WO2014129885A1 (en) * 2013-02-21 2014-08-28 Malaysian Palm Oil Board Method for identification of molecular markers linked to height increment

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
The oil palm Shell gene controls oil yield and encodes a homologue of SEEDSTICK;Rajinder Singh等;《Nature》;20130724;第500卷(第7462期);摘要,第2、8页 *
油棕QTL定位的研究进展;石鹏等;《热带农业科学》;20140331;第34卷(第3期);第49-54页 *

Also Published As

Publication number Publication date
WO2017116224A1 (en) 2017-07-06
CN108368555A (zh) 2018-08-03
MY186767A (en) 2021-08-18
EP3397776A1 (en) 2018-11-07
HK1257418A1 (zh) 2019-10-18
SG11201802844UA (en) 2018-05-30
US20180274016A1 (en) 2018-09-27

Similar Documents

Publication Publication Date Title
Meyer et al. Evolution of crop species: genetics of domestication and diversification
Bai et al. Genome-wide identification of markers for selecting higher oil content in oil palm
CN107580631B (zh) 预测实验油棕榈植物棕榈油产量的方法和snp检测试剂盒
US20180305775A1 (en) Methods for predicting palm oil yield of a test oil palm plant
CN114071993A (zh) 栽培马铃薯的自交亲和性
CN113980996B (zh) 蛋白gen1及其相关生物材料在调控玉米产量中的应用
CN108368555B (zh) 用于预测实验油棕榈植物的棕榈油产量的方法
US20230212601A1 (en) Mutant gene conferring a compact growth phenotype in watermelon
Fan et al. Effect of indica pedigree on eating and cooking quality in rice backcross inbred lines of indica and japonica crosses
Basaki et al. Evaluation of Iranian pomegranate collection using simple sequence repeat and morphological traits
US11395470B1 (en) Sesame with high oil content and/or high yield
Van et al. Molecular evidence for soybean domestication
Nieves‐Orduña et al. Geographic distribution, conservation, and genomic resources of cacao Theobroma cacao L
Low et al. Oil Palm Genome: Strategies and Applications
Huh et al. Allozyme variation and population structure of Pyrola japonica in Korea
WO2023157671A1 (ja) チップバーン抵抗性レタス植物、チップバーン抵抗性レタス植物の製造方法、及びレタス植物へのチップバーン抵抗性の付与方法
US20180230553A1 (en) Methods for predicting palm oil yield of a test oil palm plant
US20220361429A1 (en) Torradovirus resistance gene
VanBuren Genomic relationships, diversity, and domestication of Ananas taxa
Landis et al. Natural selection drives emergent genetic homogeneity in a century-scale experiment with barley
Zhou High-throughput Arabidopsis platform for SHGD screening
JP2005229849A (ja) 休眠性に関与する遺伝子座に連鎖する遺伝マーカーおよびその利用
Oliveira Conson et al. High-resolution genetic map and QTL analysis of growth-related traits of Hevea brasiliensis cultivated under suboptimal temperature and humidity conditions
KR20230023711A (ko) 개선된 총채벌레 저항성을 갖는 캅시쿰 아누움 식물
JP2005229848A (ja) 穂軸節間長に関与する遺伝子座に連鎖する遺伝マーカーおよびその利用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1257418

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant