CN107580631A - 预测实验油棕榈植物棕榈油产量的方法和snp 检测试剂盒 - Google Patents
预测实验油棕榈植物棕榈油产量的方法和snp 检测试剂盒 Download PDFInfo
- Publication number
- CN107580631A CN107580631A CN201580078934.XA CN201580078934A CN107580631A CN 107580631 A CN107580631 A CN 107580631A CN 201580078934 A CN201580078934 A CN 201580078934A CN 107580631 A CN107580631 A CN 107580631A
- Authority
- CN
- China
- Prior art keywords
- oil
- snp
- qtl
- plant
- chromosome
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 235000019482 Palm oil Nutrition 0.000 title claims abstract description 106
- 239000002540 palm oil Substances 0.000 title claims abstract description 106
- 238000000034 method Methods 0.000 title claims abstract description 93
- 238000001514 detection method Methods 0.000 title claims description 13
- 240000003133 Elaeis guineensis Species 0.000 title abstract description 103
- 238000012360 testing method Methods 0.000 title abstract description 44
- 241000196324 Embryophyta Species 0.000 claims abstract description 222
- 239000003921 oil Substances 0.000 claims abstract description 123
- 239000003550 marker Substances 0.000 claims abstract description 82
- 235000019198 oils Nutrition 0.000 claims abstract description 47
- 238000012937 correction Methods 0.000 claims abstract description 32
- 238000004519 manufacturing process Methods 0.000 claims abstract description 30
- 235000001950 Elaeis guineensis Nutrition 0.000 claims description 312
- 238000002474 experimental method Methods 0.000 claims description 135
- 210000000349 chromosome Anatomy 0.000 claims description 119
- 239000002773 nucleotide Substances 0.000 claims description 93
- 125000003729 nucleotide group Chemical group 0.000 claims description 93
- 241001269524 Dura Species 0.000 claims description 73
- 241001133760 Acoelorraphe Species 0.000 claims description 44
- 238000009395 breeding Methods 0.000 claims description 39
- 230000001488 breeding effect Effects 0.000 claims description 37
- 108090000623 proteins and genes Proteins 0.000 claims description 33
- 239000000523 sample Substances 0.000 claims description 29
- 230000002068 genetic effect Effects 0.000 claims description 16
- 230000008774 maternal effect Effects 0.000 claims description 12
- 238000012271 agricultural production Methods 0.000 claims description 11
- 108020004707 nucleic acids Proteins 0.000 claims description 8
- 102000039446 nucleic acids Human genes 0.000 claims description 8
- 150000007523 nucleic acids Chemical class 0.000 claims description 8
- 210000001519 tissue Anatomy 0.000 claims description 8
- 238000004113 cell culture Methods 0.000 claims description 7
- 210000004027 cell Anatomy 0.000 claims description 5
- 239000007787 solid Substances 0.000 claims description 5
- 239000002253 acid Substances 0.000 claims description 4
- 230000006872 improvement Effects 0.000 claims description 4
- 239000013074 reference sample Substances 0.000 claims description 4
- 210000001161 mammalian embryo Anatomy 0.000 claims description 3
- 239000000758 substrate Substances 0.000 claims description 3
- 108091034117 Oligonucleotide Proteins 0.000 claims description 2
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 claims description 2
- 241000512897 Elaeis Species 0.000 claims 55
- 230000018199 S phase Effects 0.000 claims 1
- 241000218636 Thuja Species 0.000 claims 1
- 210000001082 somatic cell Anatomy 0.000 claims 1
- 238000013517 stratification Methods 0.000 abstract 2
- 244000127993 Elaeis melanococca Species 0.000 description 220
- 108020004414 DNA Proteins 0.000 description 51
- 108700028369 Alleles Proteins 0.000 description 45
- 235000013399 edible fruits Nutrition 0.000 description 30
- IPCSVZSSVZVIGE-UHFFFAOYSA-N hexadecanoic acid Chemical compound CCCCCCCCCCCCCCCC(O)=O IPCSVZSSVZVIGE-UHFFFAOYSA-N 0.000 description 16
- 239000000463 material Substances 0.000 description 15
- 238000005259 measurement Methods 0.000 description 11
- 235000021314 Palmitic acid Nutrition 0.000 description 8
- WQEPLUUGTLDZJY-UHFFFAOYSA-N n-Pentadecanoic acid Natural products CCCCCCCCCCCCCCC(O)=O WQEPLUUGTLDZJY-UHFFFAOYSA-N 0.000 description 8
- 238000009396 hybridization Methods 0.000 description 7
- 241000233788 Arecaceae Species 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 5
- 230000006835 compression Effects 0.000 description 5
- 238000007906 compression Methods 0.000 description 5
- 239000011159 matrix material Substances 0.000 description 5
- 238000007689 inspection Methods 0.000 description 4
- 238000005070 sampling Methods 0.000 description 4
- -1 ccording Species 0.000 description 3
- 239000003795 chemical substances by application Substances 0.000 description 3
- 238000007796 conventional method Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 239000000835 fiber Substances 0.000 description 3
- 235000013305 food Nutrition 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 239000003346 palm kernel oil Substances 0.000 description 3
- 235000019865 palm kernel oil Nutrition 0.000 description 3
- 238000000513 principal component analysis Methods 0.000 description 3
- 238000012163 sequencing technique Methods 0.000 description 3
- 108090000790 Enzymes Proteins 0.000 description 2
- 102000004190 Enzymes Human genes 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000035800 maturation Effects 0.000 description 2
- 210000000056 organ Anatomy 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 241001269238 Data Species 0.000 description 1
- 235000018060 Elaeis melanococca Nutrition 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 244000131316 Panax pseudoginseng Species 0.000 description 1
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 1
- 235000003140 Panax quinquefolius Nutrition 0.000 description 1
- 241001092459 Rubus Species 0.000 description 1
- 235000017848 Rubus fruticosus Nutrition 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 125000001931 aliphatic group Chemical group 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 238000000540 analysis of variance Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000012098 association analyses Methods 0.000 description 1
- 230000036621 balding Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 230000010154 cross-pollination Effects 0.000 description 1
- 235000013365 dairy product Nutrition 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000001066 destructive effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 235000021038 drupes Nutrition 0.000 description 1
- 238000004043 dyeing Methods 0.000 description 1
- 210000005069 ears Anatomy 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000013467 fragmentation Methods 0.000 description 1
- 238000006062 fragmentation reaction Methods 0.000 description 1
- 235000021022 fresh fruits Nutrition 0.000 description 1
- 238000001502 gel electrophoresis Methods 0.000 description 1
- 238000003205 genotyping method Methods 0.000 description 1
- 235000008434 ginseng Nutrition 0.000 description 1
- 235000003642 hunger Nutrition 0.000 description 1
- 230000008595 infiltration Effects 0.000 description 1
- 238000001764 infiltration Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 208000028284 monogenic inheritance Diseases 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 238000009400 out breeding Methods 0.000 description 1
- 230000032696 parturition Effects 0.000 description 1
- 229920000573 polyethylene Polymers 0.000 description 1
- 108091033319 polynucleotide Proteins 0.000 description 1
- 102000040430 polynucleotide Human genes 0.000 description 1
- 239000002157 polynucleotide Substances 0.000 description 1
- 230000008092 positive effect Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000003908 quality control method Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- 150000004671 saturated fatty acids Chemical class 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 230000000392 somatic effect Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000000528 statistical test Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6888—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
- C12Q1/6895—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for plants, fungi or algae
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/13—Plant traits
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/156—Polymorphic or mutational markers
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Analytical Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Health & Medical Sciences (AREA)
- Biotechnology (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Immunology (AREA)
- Mycology (AREA)
- Microbiology (AREA)
- Molecular Biology (AREA)
- Botany (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Biochemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
公开了用于预测实验油棕榈植物的棕榈油产量的方法。所述方法包括:从群体的实验油棕榈植物的样品确定至少第一SNP基因型,所述第一SNP基因型对应于第一SNP标记,所述第一SNP标记位于用于高产油量性状的第一QTL中,并且在分层和亲缘关系校正之后,以所述群体中至少4.0的全基因组‑log10(p值)与高产油量性状相关联,或者相对于与所述第一SNP标记连锁的第一其他SNP标记具有至少0.2的连锁不平衡r2值,所述第一其他SNP标记在分层和亲缘关系校正之后,以所述群体中至少4.0的全基因组‑log10(p值)与高产油量性状相关联。所述方法还包括将所述第一SNP基因型与相应的第一参考SNP基因型进行比较,并基于SNP基因型的匹配程度预测所述实验植物的棕榈油产量。
Description
技术领域
本申请涉及用于预测实验油棕榈植物的棕榈油产量的方法,并且更具体地,涉及用于预测实验油棕榈植物的棕榈油产量的方法以及根据这种方法预测实验油棕榈植物的棕榈油产量的SNP检测试剂盒,该方法包括从油棕榈植物的群体的实验油棕榈植物的样品中确定该实验油棕榈植物的至少第一单核苷酸多态性(SNP)基因型,该第一SNP基因型对应于第一SNP标记,将实验油棕榈植物的第一SNP基因型与在与群体相同遗传背景下指示高产油量性状的相应的第一参考SNP基因型进行比较,并且基于实验油棕榈植物的第一SNP基因型与相应的第一参考SNP基因型的匹配程度来预测该实验油棕榈植物的棕榈油产量。
背景技术
非洲油棕榈Elaeis guineensis Jacq.是重要的食品油料作物。油棕榈植物是雌雄同株的,即单株植物产生雄花和雌花两者,其特征是交替系列的雄花序和雌花序。雄花序由许多小穗组成,并且可以开出远超出100,000朵花。油棕榈通过昆虫和风自然异花授粉。雌花序是肉穗花序,其包含生于荆棘的小穗上的数千朵花。一串结有500至4,000个果实。油棕榈果实是无柄核果,其形状为球形至卵形或细长的,并且由外果皮、含有棕榈油的中果皮和围绕核的内果皮构成。
油棕榈的重要性是由于其高产量以及其高的油质量。就产量而言,油棕榈是产油量最高的食品油料作物,近期每年平均产量为3.67公吨/公顷,并且其中最好的后代已知每年产量约为10公吨/公顷。油棕榈也是最有效率的植物,以利用阳光的能量来生产油而著称。就质量而言,栽培油棕榈以获得果皮中产生的棕榈油和核中产生的棕榈仁油两者。棕榈油是尤其平衡的油,具有几乎相等比例的饱和脂肪酸(≈55%,包括45%的棕榈酸)和不饱和脂肪酸(≈45%),并且它包括β胡萝卜素。棕榈仁油比中果皮油更饱和。两者都具有低含量的游离脂肪酸。目前棕榈油和棕榈仁油的总产量约为每年5000万公吨,并且随着全球人口和人均油脂消耗量的增加,预计未来的需求将大幅增加。
虽然油棕榈是产油量最高的食品油料作物,但目前的油棕榈作物产量远低于其理论最高值,表明通过改进高产油棕榈植物的选择和鉴定来提高棕榈油的产量的潜力。但是,在杂交中用于产生具有较高产量的后代以及用于商业生产棕榈油的用于鉴定潜在的高产棕榈的常规方法,需要在多年的过程中栽培棕榈并测量油的产量,这是耗费时间和高劳动强度的。此外,常规方法基于直接测量取样果实的油含量,从而导致取样果实的破坏。另外,用于生产油的油棕榈繁殖的常规育种技术也是耗费时间和高劳动强度的,尤其是由于最有生产力的,从而有商业价值的棕榈表现出杂交表型,这使得通过直接杂交来对其进行繁殖是不切实际的。如,例如Billotte等人,Theoretical&Applied Genetics 120:1673-1687(2010)教导了基于连锁分析的数量性状基因座(也称为QTL)标记程序已经实施于油棕榈,目的是改进常规育种技术。但是,连锁分析基于最近几代内的家系中观察到的重组,并且经常较差地鉴定复杂表型的定位的QTL,因此需要大家系来更好地检测和确认QTL,限制了该方法用于油棕榈的实用性。如,例如Ong等人关于植物高度所讨论的(WO2014/129885),基于用于鉴定候选基因的目的的关联分析的QTL标记程序也可能用于油棕榈。但是鉴定候选基因的重点在由多种基因(尤其是关于性状表现出低外显率的基因)确定的性状的背景下具有有限的益处。如Hirota等人,Nature Genetics 44:1222-1226(2012)和Huang等人,Nature Genetics 42:961-967(2010)分别教导了基于全基因组关联研究的QTL标记程序已经实施于人和水稻以等。但是,将这种方法应用于油棕榈是不切实际的,因为商业棕榈倾向于由遗传上狭窄育种材料产生。因此,需要通过改进的用于预实验油棕榈植物的棕榈油产量的方法来改进油棕榈。
发明内容
在一个示例实施方式中,公开了一种用于预测实验油棕榈植物的棕榈油产量的方法。该方法包括步骤(i)从油棕榈植物群体的实验油棕榈植物的样品中确定该实验油棕榈植物的至少第一单核苷酸多态性(SNP)基因型。第一SNP基因型对应于第一SNP标记。第一SNP标记位于用于高产油量性状的第一数量性状基因座(QTL)中。第一SNP标记,在分层和亲缘关系校正之后,还以群体中至少4.0的全基因组-log10(p值)与高产油量性状相关联,或者相对于与该第一SNP标记连锁的第一其他SNP标记而言,具有至少0.2的连锁不平衡r2值,所述第一其他SNP标记在分层和亲缘关系校正之后,以群体中至少4.0的全基因组-log10(p值)与高产油量性状相关联。该方法还包括步骤(ii)将实验油棕榈植物的第一SNP基因型与在与群体相同遗传背景下指示高产油量性状的相应的第一参考SNP基因型进行比较。该方法还包括步骤(iii)基于实验油棕榈植物的第一SNP基因型与相应的第一参考SNP基因型的匹配程度来预测该实验油棕榈植物的棕榈油产量。该第一QTL是对应于以下中的一个的油棕榈基因组的区域:
(1)QTL区域1,从染色体1的核苷酸66542323延伸至66776312;
(2)QTL区域2,从染色体1的核苷酸66807385延伸至67299617;
(3)QTL区域3,从染色体2的核苷酸62277032延伸至62355782;
(4)QTL区域4,从染色体4的核苷酸31132787延伸至31173962;
(5)QTL区域5,从染色体5的核苷酸32863621延伸至32964104;
(6)QTL区域6,从染色体5的核苷酸33355931延伸至33509217;
(7)QTL区域7,从染色体5的核苷酸33658904延伸至34233352;
(8)QTL区域8,从染色体5的核苷酸34358119延伸至34997228;
(9)QTL区域9,从染色体5的核苷酸35004388延伸至35125743;
(10)QTL区域10,从染色体5的核苷酸35191678延伸至35193677;
(11)QTL区域11,从染色体5的核苷酸36108847延伸至36272808;
(12)QTL区域12,从染色体5的核苷酸39210662延伸至39225076;
(13)QTL区域13,从染色体5的核苷酸39518005延伸至40469897;
(14)QTL区域14,从染色体5的核苷酸40535309延伸至40690150;
(15)QTL区域15,从染色体5的核苷酸40789706延伸至40983955;
(16)QTL区域16,从染色体5的核苷酸41001085延伸至41302446;
(17)QTL区域17,从染色体8的核苷酸3050807延伸至3241977;
(18)QTL区域18,从染色体8的核苷酸5354764延伸至5445890;
(19)QTL区域19,从染色体9的核苷酸29488933延伸至29602300;
(20)QTL区域20,从染色体11的核苷酸4797284延伸至5717606;或
(21)QTL区域21,从染色体15的核苷酸8611715延伸至8857914。
在另一示例实施方式中,公开了用于预测实验油棕榈植物的棕榈油产量的SNP检测试剂盒。该试剂盒包括(i)至少21个核苷酸分子的组,其适用于从油棕榈植物的群体的实验油棕榈植物的样品中分别确定该实验油棕榈植物的第一SNP基因型至第二十一SNP基因型,该第一SNP基因型至该第二十一SNP基因型分别对应于第一SNP标记至第二十一SNP标记,该第一SNP标记至该第二十一SNP标记(a)分别位于用于该群体中高产油量性状的第一QTL至第二十一QTL中,并且(b)在分层和亲缘关系校正之后,以群体中至少4.0的全基因组-log10(p值)与高产油量性状相关联,或者分别相对于与该第一SNP标记至该第二十一SNP标记连锁的第一其他SNP标记至第二十一其他SNP标记具有至少0.2的连锁不平衡r2值,所述第一其他SNP标记至第二十一其他SNP标记在分层和亲缘关系校正之后,以群体中至少4.0的全基因组-log10(p值)与高产油量性状相关联。该试剂盒还包括(ii)该群体的参考高产油的油棕榈植物的参考样品。该第一QTL至该第二十一QTL为分别对应于上述QTL区域1至21的油棕榈染色体的区域。
附图说明
图1显示了基于Deli dura x AVROS pisifera群体和(b)Nigerian dura x AVROSpisifera群体中的朴素模型的全基因组关联研究(也称为GWAS)观察到的-log10(p值)相对于预期的-log10(p值)的四分位数-四分位数(Q-Q)图。
图2示出了(a,c)Deli dura x AVROS pisifera群体和(b,d)Nigerian dura xAVROS pisifera群体中针对GWAS观察到的-log10(p值)相对于预期的-log10(p值)的(a,b)Q-Q图,以及(c,d)曼哈顿图,其全部基于压缩混合线性模型(也称为MLM)。
图3是根据至少0.2的连锁不平衡r2值作为阈值来定义QTL区域的范围的方法的图示,其中突出显示的范围是根据预测实验油棕榈植物的棕榈油产量的方法所选择的QTL区域。
图4是显示如在Deli dura x AVROS pisifera群体和Nigerian dura x AVROSpisifera群体中确定的示例性SNP,SD_SNP_000019529的SNP作用的图。
具体实施方式
本申请涉及用于预测实验油棕榈植物的棕榈油产量的方法和SNP检测试剂盒。该方法包括以下步骤:(i)从油棕榈植物群体的实验油棕榈植物的样品中确定该实验油棕榈植物的至少第一单核苷酸多态性(SNP)基因型,(ii)将该实验油棕榈植物的第一SNP基因型与在与群体相同遗传背景下指示高产油量性状的相应的第一参考SNP基因型进行比较,以及(iii)基于实验油棕榈植物的第一SNP基因型与相应的第一参考SNP基因型的匹配程度来预测实验油棕榈植物的棕榈油产量。第一SNP基因组对应于第一SNP标记。第一SNP标记位于用于高产油量性状的第一数量性状基因座(QTL)中。第一SNP标记,在分层和亲缘关系校正之后,还以群体中至少4.0的全基因组-log10(p值)与高产油量性状相关联,或者相对于与该第一SNP标记连锁的第一其他SNP标记具有至少0.2的连锁不平衡r2值,所述第一其他SNP标记在分层和亲缘关系校正之后,以群体中至少4.0的全基因组-log10(p值)与高产油量性状相关联。如下面更详细描述的,第一QTL是对应于QTL区域1至21中的一个的油棕榈基因组的区域。类似地,SNP检测试剂盒包括(i)至少21个核苷酸分子的组,其适合于从油棕榈植物群体的实验油棕榈植物的样品中分别确定上述第一SNP基因型至第二十一SNP基因型,以及(ii)该群体的参考高产油量的油棕榈植物的参考样品。
通过对来自半野生油棕榈群体和有商业价值的油棕榈群体的油棕榈植物进行基因组重新测序和全基因组关联研究,包括分层和亲缘关系校正的应用,已经确定了位于油棕榈基因组的21个QTL区域中,并且在分层和亲缘关系校正之后与高产油量性状相关联的SNP标记,可以分别用来在两个群体中实现50%的准确度相关性和30%的准确度相关性。不希望受到理论的约束,认为21个QTL区域以及其中的在分层和亲缘关系校正之后,与高产油量性状相关联的SNP标记的鉴定将能够更快速和有效地从半野生和有商业价值的油棕榈群体中等选择候选农业生产棕榈和候选育种棕榈。分层和亲缘关系校正减少了由于实验油棕榈植物从中取样的油棕榈植物群体中小群体个体的最近共同祖先导致的假阳性信号,从而使得基于关联的用于预测实验油棕榈植物的棕榈油产量的方法具有实用性。该方法和SNP检测试剂盒将能够鉴定潜在的高产棕榈,用于杂交以产生具有更高产量且用于棕榈油的商业生产的后代,而不需要栽培棕榈至成熟,因此无需时间和劳动密集的栽培和测量、对果实的破坏性取样,以及作为常规方法特征的直接杂交的不实用性。例如,在能够完成通过实验油棕榈植物直接测量棕榈油产量的很早之前,该方法和SNP检测试剂盒可以用于选择油棕榈植物以用于发芽、苗圃栽培、栽培用于商业生产棕榈油、栽培用于进一步繁殖等。还例如,该方法和SNP检测试剂盒可以比通过直接测量棕榈油产量更高的效率和/或更小的变异性实现棕榈油产量的预测。考虑到大规模的商业栽培,基于百分比看起来很小的油棕榈产量的改善仍然可以对总体棕榈油产量产生重大的影响,就甚至单一SNP而言,该方法和SNP检测试剂盒的使用也是有利的。考虑到累加效应和/或协同作用,就两个或更多个SNP的组合,例如,第一SNP基因型和第二SNP基因型,或者第一SNP基因型至第二十一SNP基因型而言,该方法和SNP检测试剂盒的使用也是有利的。
关于本文公开的方法和试剂盒使用的术语“高产油量性状”、“高产量”、“高产”和“油产量”是指棕榈油植物的果实的中果皮组织中棕榈油的产量。
除非上下文另有明确指出,单数形式的“一(a)”、“一(an)”和“所述”也旨在包括复数形式。
如上所述,公开了一种用于预测实验油棕榈植物的棕榈油产量的方法。该方法包括步骤(i)从油棕榈植物群体的实验油棕榈植物的样品中确定实验油棕榈植物的至少第一单核苷酸多态性(也称为SNP)基因型。
实验油棕榈植物的SNP基因型对应于在实验油棕榈植物的基因组中出现基因座的每个染色体上的特定基因座或位置处的SNP等位基因的构成。SNP是就染色体上这样的基因座处出现的单个核苷酸而言的多态性变异。SNP等位基因是存在于染色体上的基因座处的特定核苷酸。对于二倍体并且因而遗传一组母本衍生的染色体和一组父本衍生的染色体的油棕榈植物,SNP基因型对应于两个SNP等位基因,一个在母本衍生的染色体上的特定基因座处,并且另一个在父本衍生的染色体上的特定基因座处。每个SNP等位基因可以基于等位基因频率分为例如主要等位基因(A)或次要等位基因(a)。因此,例如,SNP基因型可以对应于两个主要等位基因(A/A),一个主要等位基因和一个次要等位基因(A/a)或两个次要等位基因(a/a)。
实验油棕榈植物可以是任何合适形式的油棕榈植物。例如,实验油棕榈植物可以是种子、幼苗、苗圃期植物、未成熟期植物、细胞培养植物、合子胚培养植物或体细胞组织培养植物。还例如,实验油棕榈植物可以是生产期植物、成熟棕榈、成熟母本棕榈或成熟花粉供体。
种子、幼苗、苗圃期植物、未成熟期植物、细胞培养植物、合子胚培养植物或体细胞组织培养植物形式的实验油棕榈植物是尚未成熟的形式,因而如果生产的话,还未以商业生产典型的量生产棕榈油。因此,应用于这种形式的实验油棕榈植物的方法可以用来在实验油棕榈植物已经足够成熟以允许在商业生产期间通过直接测量实验油棕榈植物的棕榈油产量之前,预测实验油棕榈植物的棕榈油产量。
生产期植物、成熟棕榈、成熟母本棕榈或成熟花粉供体形式的实验油棕榈植物是成熟的形式。因此,应用于这种形式的实验油棕榈植物的方法可作为直接测量油棕榈产量的替换方法用于预测实验油棕榈的棕榈油产量。
实验油棕榈植物从其取样的实验油棕榈植物的群体可以包括任何合适的油棕榈植物群体。可以依据产生群体的育种材料的果实类型和/或身份来指示群体。
就此而言,果实类型是油棕榈中的单基因性状,其对于育种和商业生产是重要的。具有两种不同果实类型中的一种的油棕榈通常用于通过杂交进行育种和种子生产,以产生用于商业生产棕榈油的棕榈,其也称为商业种植材料或农业生产植物。第一果实类型是dura(基因型:sh+sh+),其特征在于相当于果实重量的28%至35%的厚壳,在果实的核周围没有黑色纤维环。对于dura果实,中果皮与果实的比例为50%至60%,其中可提取油含量与串重的比例为18%至24%。第二果实类型是pisifera(基因型:sh-sh-),其特征在于没有壳,其痕迹是围绕小核的纤维环。因此,对于pisifera果实,中果皮与果实的比例为90%至100%。中果皮油与串的比例与dura相当,为16%至28%。然而,pisifera通常是雌性不育的,因为大部分串在早期发育阶段中止。
将dura和pisifera杂交产生具有第三果实类型,tenera(基因型:sh+sh-)的棕榈。tenera果实具有果实重量8%至10%的薄壳,相当于0.5mm至4mm的厚度,其周围是特征性黑色纤维环。对于tenera果实,中果皮与果实的比例相对较高,范围是60%至80%。商用tenera一般比dura产生更多的果实串,但是平均串重较低。中果皮油与串的比例在20%至30%的范围内,是三种果实类型中最高的,因此,通常用作商业种植材料。
育种材料的身份可以基于育种材料的来源和育种历史。在东南亚使用的dura棕榈育种群体包括Serdang Avenue、Ulu Remis(其中包括一些Serdang Avenue材料)、JohorLabis和Elmina estate(包括Deli Dumpy),所有这些都源自Deli dura。用于种子生产的pisifera育种群体通常分为Yangambi、AVROS、Binga和URT。在非洲和南美洲使用其他dura和pisifera群体。
油棕榈育种的主要目的是选择改良的亲本dura和pisifera育种母株棕榈,用于生产优质tenera商业种植材料。这种材料大部分是种子的形式,但是组织培养用于克隆繁殖的用于在继续开发。一般地,通过在选定的dura棕榈之间杂交产生亲本dura育种群体。基于果实类型的单基因遗传,得到的棕榈100%将是dura。经过数年的对串和果实特征的产量记录和确认,根据表型选择dura用于育种。相比之下,pisifera棕榈通常是雌性不育的,因此其育种群体必须通过选定的tenera之间杂交或通过将选定的tenera与选定的pisifera杂交来产生。tenera x tenera杂交将产生25%的dura、50%的tenera和25%的pisifera。tenera x pisifera杂交将产生50%的tenera和50%的pisifera。然后通过用精英dura进行后代测试,即通过杂交dura和pisifera来产生tenera,然后随着时间的推移确定tenera的果实的产量表型,来间接确定pisifera的产量潜力。由此,基于它们的tenera后代的表现来选择具有良好的一般组合能力的pisifera。也进行选定的亲本之间的互交,其中后代接着进行下一育种周期。这允许将新基因引入育种程序以增加遗传变异性。
用于商业生产棕榈油的油棕榈栽培可以通过使用优质的tenera商业种植材料来改善。优先选择对象包括,从高新鲜果实串产量和高油串比(薄壳,厚中果皮)、高早期产量(早熟)和良好油质等性状方面的角度,每单位面积的高油产量。后代植物可以通过常规方法等栽培,例如幼苗可以在苗圃前设置和苗圃设置中的聚乙烯袋中栽培,培育约12个月,然后种植为幼苗,其中选择已知或预测展现高产量的后代用于进一步栽培。
因此,在一些实例中,油棕榈植物的群体可以包括Nigerian dura x AVROSpisifera群体、Deli dura x AVROS pisifera群体或其组合。并且在一些实例中,油棕榈植物群体包括Nigerian dura x Nigerian dura群体、Nigerian dura x Deli dura群体、Deli dura x Deli dura群体、AVROS pisifera x AVROS tenera群体、AVROS tenera xAVROS tenera群体或其组合。
实验油棕榈植物的样品可以包括实验油棕榈植物的任何器官、组织、细胞或其他部分,其包括实验油棕榈植物的足够的基因组DNA,以允许确定实验油棕榈植物的一种或多种SNP基因型,例如第一SNP基因型。例如,样品可以包括叶组织,以及其他器官、组织、细胞或其它部分。如普通技术人员将理解的,从实验油棕榈植物的样品确定实验油棕榈植物的一种或多种SNP基因型必然是样品的转换。例如,不能仅仅基于样品的外观来确定一个或多个SNP基因型。相反,确定实验油棕榈植物的一个或多个SNP基因型需要从实验油棕榈植物中分离样品和/或从样品中分离基因组DNA。
可以通过任何适合的技术来进行至少第一SNP基因型的确定,该适合的技术包括,例如,用SNP调用(SNP calling)的全基因组重新测序、基于杂交的方法、基于酶的方法或其他扩增后方法等。
第一SNP基因型对应于第一SNP标记。SNP标记是可用于基因定位的SNP。
第一SNP标记位于用于高产油量性状的第一数量性状基因座(也称为QTL)中。QTL是沿着染色体的一部分延伸的基因座,其有助于确定连续特征的表型,在这种情况下即高产油量性状。
高产油量性状涉及实验油棕榈植物在以下情况时生产棕榈油的性状,达到成熟状态(例如,达到生产期),且在适合于生产高量的棕榈油的条件下栽培(例如,对于实验油棕榈植物从其取样的油棕榈植物群体,商业栽培,高于平均值的量),还有达到成熟状态,且在适合于生产高量的棕榈油的条件下栽培。
如上文讨论的,就作为tenera油棕榈植物的测试油植物而言,高产油量性状可以对应于例如每年每公顷大于3.67公吨棕榈油的棕榈油产量,即,高于用于商业生产的典型的油棕榈植物(其也是tenera油棕榈植物)的近期平均产量。高产油量性状也可以对应于例如大于每年每公顷10公吨棕榈油的棕榈油产量,即,高于目前用于商业生产的最佳后代油棕榈植物的近期平均产量。高产油量性状也可以对应于例如大于每年每公顷4、5、6、7、8或9公吨棕榈油的棕榈油产量,即高于在上述近期平均产量之间的中间值的产量。就作为dura油棕榈植物或pisifera油棕榈植物的实验油棕榈植物而言,与dura和pisifera油棕榈植物相对于tenera油棕榈植物获得的较低的平均产量相一致,高产油量性状可能对应于相应的较低量的棕榈油产量。
高产油量性状可以包括增加的油-干中果皮比(也称为O/DM)。如上文提到的,棕榈油在油棕榈果实的中果皮中产生。O/DM是棕榈油产量的测量。因此,相对高的O/DM是棕榈油相对高产量的指标。
第一SNP标记在分层和亲缘关系校正之后以群体中至少4.0的全基因组-log10(p值),与高产油量性状相关联,或者相对于与该第一SNP标记连锁的第一其他SNP标记而言,具有至少0.2的连锁不平衡r2值,所述第一其他SNP标记在分层和亲缘关系校正之后,以群体中至少4.0的全基因组-log10(p值)与高产油量性状相关联。
在分层和亲缘关系校正之后,以群体中至少4.0的全基因组-log10(p值)与性状相关联的第一SNP标记表明第一SNP标记和该性状存在较高可能性的相关性。
p值是观察到检验统计量的概率,在涉及SNP标记,例如,第一SNP标记或第一其他SNP标记与高产油量性状相关的这种情况下,如果零假设为真,因此没有关联,则等于或大于实际观察到的检验统计量,例如,如Bush&Moore,第11章:Genome-Wide AssociationStudies,PLOS Computational Biology 8(12):e 1002822,1-11(2012)所讨论的。还如Bush&Moore(2012年)所讨论的,为了方便起见,全基因组-log10(p值)对应于以对数刻度表示的p值,且该p值基于针对关于相应特定群体的整个基因组进行的关联的多次测试而被校正以把已经进行的统计测试的有效数量考虑在内。因此,相对高的全基因组-log10(p值)表明观察到的涉及关联相关性的检验统计量在没有关联时被观察到的可能性极低。
在确定关联相关性时,要把分层和亲缘关系校正考虑在内。如上文提到的,分层和亲缘关系校正减少了由于实验油棕榈植物从其取样的油棕榈植物群体中小群体个体的最近共同祖先导致的假阳性信号,从而使得基于关联的用于预测实验油棕榈植物的棕榈油产量的方法具有实用性。
与此相关,分别使用朴素模型对Deli x AVROS和Nigerian x AVROS实施全基因组关联研究(也称为GWAS)。该方法仅测量标记与感兴趣的性状之间的关联,而不管定位群体的群体结构或家系。观察到四分位数-四分位数(Q-Q)图和基因组膨胀因子(GIF)估计值,观察到了非常膨胀的-log10(p值),具体表明4017和24760个SNP与O/DM相关联。如图1所示,GIF=3.66的Deli x AVROS,GIF=11.9的Nigerian x AVROS分别表明观察到的-log10(p值)与零期望(y=x)的早期偏差。这些大多数指示SNP仅解释起源作用,而不是性状变体,因而是假阳性信号。这种朴素模式未能解释小群体个体的最近共同祖先(根据Astle&Balding,Statistical Science 24:451-471(2009年),其被定义为隐蔽相关性),根据Devlin&Roeder,Biometrics 55:997-1004(1999),这里提出了对GWAS造成比群体结构更严重的混杂问题。
基于具有先前确定的群体参数(P3D)的压缩混合线性模型(也称为MLM)进行后续GWAS,以解决使用主成分分析和群体亲缘关系矩阵的基因组膨胀问题。这种方法大大减少了假阳性,具体地在Deli x AVROS和Nigerian x AVROS中分别得到70和18个O/DM关联的SNP。具体地,如图2所示,两个群体的Q-Q图都示出了观察到的统计值与零期望值的偏差显著延迟。此外,Deli x AVROS和Nigerian x AVROS的GIF也下降到1.1和1.9(接近理想的GIF=1.0)。还如图2所示,对于两个群体,得到的SNP的染色体分布都可以在曼哈顿图中看到。基于这种方法,在排除了在两个群体中重叠的标记之后,总共鉴定了82个O/DM关联的SNP。
因此,例如,位于用于高产油量性状的第一QTL中,并且在分层和亲缘关系校正之后以群体中至少4.0的全基因组-log10(p值)与高产油量性状相关联的第一SNP标记,可以是这样的SNP标记:对于该SNP标记,与高产油量性状的关联(i)已经基于不是朴素模型的模型被确认和/或(ii)将基于不是朴素模型的模型被确认。还例如,位于用于高产油量性状的第一QTL中,并且在分层和亲缘关系校正之后以群体中至少4.0的全基因组-log10(p值)与高产油量性状相关联的第一SNP标记,可以是这样的SNP标记:对于该SNP标记,与高产油量性状的关联(i)已经用先前确定的群体参数基于压缩混合线性模型(其使用主成分分析和群体亲缘关系矩阵进行)被确认,和或和/或(ii)将用先前确定的群体参数基于压缩混合线性模型(其使用主成分分析和群体亲缘关系矩阵进行)被确认。
相对于与该第一SNP标记连锁,并且在分层和亲缘关系校正之后,以群体中至少4.0的全基因组-log10(p值)与高产油量性状相关联的第一其他SNP,具有至少0.2的连锁不平衡r2值的第一SNP标记表明以下内容。首先,很可能存在第一SNP标记的等位基因和第一其他SNP标记的等位基因为连锁不平衡。第二,很可能存在第一其他SNP标记和性状相关联。在这方面,连锁不平衡r2值涉及将两个基因座处于连锁不平衡的可能性测量为平均成对相关系数。
因此,在一些实例中,在分层和亲缘关系校正之后,第一SNP标记以群体中至少4.0的全基因组-log10(p值)与高产油量性状相关联。而且,在一些实例中,第一SNP标记相对于与该第一SNP标记连锁的第一其它SNP标记具有至少0.2的连锁不平衡r2值,所述第一其他SNP标记在分层和亲缘关系校正之后,以群体中至少4.0的全基因组-log10(p值)与高产油量性状相关联。而且,在一些示例中两者都适用。
第一QTL可以是对应于以下中的一个的油棕榈基因组的区域:
(1)QTL区域1,从染色体1的核苷酸66542323延伸至66776312;
(2)QTL区域2,从染色体1的核苷酸66807385延伸至67299617;
(3)QTL区域3,从染色体2的核苷酸62277032延伸至62355782;
(4)QTL区域4,从染色体4的核苷酸31132787延伸至31173962;
(5)QTL区域5,从染色体5的核苷酸32863621延伸至32964104;
(6)QTL区域6,从染色体5的核苷酸33355931延伸至33509217;
(7)QTL区域7,从染色体5的核苷酸33658904延伸至34233352;
(8)QTL区域8,从染色体5的核苷酸34358119延伸至34997228;
(9)QTL区域9,从染色体5的核苷酸35004388延伸至35125743;
(10)QTL区域10,从染色体5的核苷酸35191678延伸至35193677;
(11)QTL区域11,从染色体5的核苷酸36108847延伸至36272808;
(12)QTL区域12,从染色体5的核苷酸39210662延伸至39225076;
(13)QTL区域13,从染色体5的核苷酸39518005延伸至40469897;
(14)QTL区域14,从染色体5的核苷酸40535309延伸至40690150;
(15)QTL区域15,从染色体5的核苷酸40789706延伸至40983955;
(16)QTL区域16,从染色体5的核苷酸41001085延伸至41302446;
(17)QTL区域17,从染色体8的核苷酸3050807延伸至3241977;
(18)QTL区域18,从染色体8的核苷酸5354764延伸至5445890;
(19)QTL区域19,从染色体9的核苷酸29488933延伸至29602300;
(20)QTL区域20,从染色体11的核苷酸4797284延伸至5717606;或
(21)QTL区域21,从染色体15的核苷酸8611715延伸至8857914。
染色体的编号(也称为连锁基团)及其核苷酸符合Singh等人Nature 500:335-339(2013年)和其中记录的补充信息所描述的非洲油棕榈E.guineenesis的1.8gigabase基因组序列,表明E.guineenesis BioProject在http://genomsawit.mpob.gov.my中可供下载,并已在BioBiPro条目PRJNA 192219下的记录在NCBI中,并且全基因组霰弹项目已经存入ASJS00000000入口下的DDBJ/EMBL/GenBank处。
作为参考,QTL区域1对应于从SEQ ID NO:1的5'端延伸至SEQ ID NO:2的3'端的油棕榈基因组的染色体1的区域。类似地,QTL区域2对应于从SEQ ID NO:3的5'端延伸至SEQID NO:4的3'端的染色体1的区域。QTL区域3对应于从SEQ ID NO:5的5'端延伸至SEQ IDNO:6的3'端的染色体2的区域。QTL区域4对应于从SEQ ID NO:7的5'端延伸至SEQ ID NO:8的3'端的染色体4的区域。QTL区域5对应于从SEQ ID NO:9的5'端延伸至SEQ ID NO:10的3'端的染色体5的区域。QTL区6对应于从SEQ ID NO:11的5'端延伸至SEQ ID NO:12的3'端的染色体5的区域。QTL区域7对应于从SEQ ID NO:13的5'端延伸至SEQ ID NO:14的3'端的染色体5的区域。QTL区域8对应于从SEQ ID NO:15的5'端延伸至SEQ ID NO:16的3'端的染色体5的区域。QTL区域9对应于从SEQ ID NO:17的5'端延伸至SEQ ID NO:18的3'端的染色体5的区域。QTL区域10对应于从SEQ ID NO:19的5'端延伸至SEQ ID NO:20的3'端的染色体5的区域。QTL区域11对应于从SEQ ID NO:21的5'端延伸至SEQ ID NO:22的3'端的染色体5的区域。QTL区域12对应于从SEQ ID NO:23的5'端延伸至SEQ ID NO:24的3'端的染色体5的区域。QTL区域13对应于从SEQ ID NO:25的5'端延伸至SEQ ID NO:26的3'端的染色体5的区域。QTL区域14对应于从SEQ ID NO:27的5'端延伸至SEQ ID NO:28的3'端的染色体5的区域。QTL区域15对应于从SEQ ID NO:29的5'端延伸至SEQ ID NO:30的3'端的染色体5的区域。QTL区域16对应于从SEQ ID NO:31的5'端延伸至SEQ ID NO:32的3'端的染色体5的区域。QTL区17对应于从SEQ ID NO:33的5'端延伸至SEQ ID NO:34的3'端的染色体8的区域。QTL区域18对应于从SEQ ID NO:35的5'端延伸至SEQ ID NO:36的3'端的染色体8的区域。QTL区域19对应于从SEQ ID NO:37的5'端延伸至SEQ ID NO:38的3'端的染色体9的区域。QTL区域20对应于从SEQ ID NO:39的5'端延伸至SEQ ID NO:40的3'端的染色体11的区域。QTL区域21对应于从SEQ ID NO:41的5'端延伸至SEQ ID NO:42的3'端的染色体15的区域。
该方法还包括步骤(ii)将实验油棕榈植物的第一SNP基因型与在与群体相同遗传背景下指示高产油量性状的相应的第一参考SNP基因型进行比较。与群体相同的遗传背景可以例如对应于基于与用于产生实验油棕榈植物从其取样的群体,例如,Nigerian dura xAVROS pisifera群体、Deli duraAVROS pisifera群体或其组合,或者Nigerian dura xNigerian dura群体、Nigerian dura x Deli dura群体、Deli dura x Deli dura群体、AVROS pisifera x AVROS tenera群体、AVROS tenera x AVROS tenera群体或其组合的相同类型的杂交油棕榈植物的群体。与群体相同的遗传背景也可以例如对应于基于将用于产生实验油棕榈植物从其取样的群体的相同个体油棕榈植物进行杂交的群体。与群体相同的遗传背景也可以例如对应于实验油棕榈植物从其取样的相同实际群体。
在与群体相同遗传背景下指示高产油量性状的第一参考SNP基因型可以对应于与第一SNP基因型相同的SNP,即两者可以都对应于在特定染色体的特定基因座处发生的关于单个核苷酸相同的多态性变异。第一参考SNP基因型可以包括一个或多个SNP等位基因,其单独或一起表明与缺乏一个或多个SNP等位基因的相同群体的油棕榈植物相比,其实验油棕榈植物(如果成熟)表现出或(在达到成熟时)将表现出高产油量性状的较高可能性。
该方法还包括步骤(iii)基于实验油棕榈植物的第一SNP基因型与相应的第一参考SNP基因型的匹配程度预测实验油棕榈植物的棕榈油产量。基于两个SNP基因型至少共享在与群体相同遗传背景下指示高产油量性状的第一SNP等位基因,实验油棕榈植物的第一SNP基因型可以匹配相应的第一参考SNP基因型。在一些实例中,针对指示高产油量性状的第一等位基因,第一SNP基因型和第一参考SNP基因型是杂合的,即两者都仅具有一个拷贝SNP等位基因。而且,在一些实例中,针对指示高产油量性状的第一等位基因,第一SNP基因型和第一参考SNP基因型是纯合的,即两者都具有两个拷贝SNP等位基因。而且,在一些实例中,第一SNP基因型对于指示高产油量性状的第一等位基因是杂合的,并且第一参考SNP基因型对于指示高产油量性状的第一等位基因是纯合的。而且,在一些实例中,第一SNP基因型对于指示高产油量性状的第一等位基因是纯合的,并且第一参考SNP基因型对于表示高产油量性状的第一等位基因是杂合的。
预测实验油棕榈植物的棕榈油产量的步骤还可以包括应用模型,比如基因型模型、显性模型或隐性模型等,以便于预测。基因型模型测试性状,例如高产油量性状与SNP等位基因,主要等位基因(A)或次要等位基因(a)的存在的关联。显性模型测试性状,例如高产油量性状与SNP等位基因作为纯合基因型或杂合基因型,例如,主要等位基因作为纯合基因型(例如A/A)或杂合基因型(例如A/a)存在的关联。隐性模型测试性状,例如高产油量性状与SNP等位基因作为纯合基因型,例如,主要等位基因作为纯合基因型(A/A)存在的关联。因此,在一些实例中,实验油棕榈植物的棕榈油产量的预测进一步包括应用基因型模型。而且在一些实例中,实验油棕榈植物的棕榈油产量的预测进一步包括应用显性模型。而且在一些实例中,实验油棕榈植物的棕榈油产量的预测进一步包括应用隐性模型。
QTL区域1至21中的SNP标记的特定SNP基因型可用于预测实验油棕榈植物的棕榈油产量的程度可能取决于用来产生实验油棕榈从其取样的群体的育种材料的来源和育种历史,例如包括用来产生该群体的育种材料和/或其来源的QTL区域1至21中出现了导致棕榈油产量增加的一个或多个高产量变体等位基因的程度,以及该一个或多个高产量变体等位基因与SNP的接近度,以及由于高产量变体等位基因的出现,SNP和高产量变体等位基因之间发生重组的程度。比如促进高产油量性状的高产量变体等位基因与SNP等位基因之间的接近度、低代数(由于高产量变体等位基因出现)以及高产量变体等位基因对棕榈油产量的强阳性作用的因素,可能倾向于增加特定SNP可以提供信息的程度。这些因素可以例如取决于高产量变体等位基因是显性的还是隐性的,因而基因型模型、显性模型或隐性模型是否可以适当地应用于相应的SNP等位基因而变化。这些因素也可以例如在由不同个体棕榈植物的杂交产生的不同群体之间变化。
预测实验油棕榈植物的棕榈油产量的步骤不仅可以有利地用来预测实验油棕榈植物本身的棕榈油产量,而且可以用来预测其后代的棕榈油产量。在这方面,油棕榈育种者可以使用适用于作为母本棕榈或花粉供体的实验油棕榈植物的方法,来确定通过将实验油棕榈植物与另一种油棕榈植物杂交而产生的后代的可能的SNP基因型,并且此外,可以选择特定的棕榈,即实验油棕榈植物和另一种具有类似特征的特定的油棕榈植物,以在此基础上进行杂交。
就源自特定育种材料的实验油棕榈植物而言,用于预测实验油棕榈植物的棕榈油产量的方法可以通过集中在特定QTL或其组合上来使用。
例如,在一些实例中,油棕榈植物群体包括Nigerian dura x AVROS pisifera群体,第一QTL对应于QTL区域2、3、8、10、13、14、16、17或18中的一个,并且步骤(iii)进一步包括应用基因型模型,由此预测实验油棕榈植物的棕榈油产量。
而且,在一些实例中,油棕榈植物群体包括Nigerian dura x AVROS pisifera群体,第一QTL对应于QTL区域3、8、10、13、15、16、17或18中的一个,并且步骤(iii)进一步包括应用显性模型,由此预测实验油棕榈植物的棕榈油产量。
而且在一些实例中,油棕榈植物群体包括Nigerian dura x AVROS pisifera群体,第一QTL对应于QTL区域3、4、6、7、8、9、10、11、12、13、14、16、20或21中的一个,并且步骤(iii)进一步包括应用隐性模型,由此预测实验油棕榈植物的棕榈油产量。
而且,在一些实例中,油棕榈植物的群体包括Deli dura x AVROS pisifera群体,第一QTL对应于QTL区域1、2、4、5、6、7、8、9、11、12、13、15、16、19、20或21中的一个,并且步骤(iii)进一步包括应用基因型模型,由此预测实验油棕榈植物的棕榈油产量。
而且,在一些实例中,油棕榈植物的群体包括Deli dura x AVROS pisifera群体,第一QTL对应于QTL区域8、10或13中的一个,并且步骤(iii)进一步包括应用显性模型,由此预测实验油棕榈植物的棕榈油产量。
而且,在一些实例中,油棕榈植物群体包括Deli dura x AVROS pisifera群体,第一QTL对应于QTL区域1、2、4、5、6、7、8、9、11、12、13、15、16、19、20或21中的一个,并且步骤(iii)进一步包括应用隐性模型,由此预测实验油棕榈植物的棕榈油产量。
如上文提到的,杂交dura和pisifera产生具有第三种果实类型,tenera的棕榈。还如提到的,tenera通常用作商业种植材料。因此,在一些实例中,实验油棕榈植物是tenera候选农业生产植物。在一些实例中,油棕榈植物群体包括Nigerian dura x AVROSpisifera群体,并且实验油棕榈植物是tenera候选农业生产植物。而且,在一些实例中,油棕榈植物群体包括Deli dura x AVROS pisifera群体,并且实验油棕榈植物是tenera候选农业生产植物。
还如上文提到的,油棕榈育种主要是为了选择改良的亲本dura和pisifera育种母株棕榈,用于生产优质tenera商业种植材料。还如所述的,通过在选定的dura棕榈之间杂交产生亲本dura育种群体,然而pisifera通常是雌性不育的,因此其育种群体必须通过在选定的tenera之间杂交或通过将选定的tenera与选定的pisifera杂交来产生。因此,在一些实例中,实验油棕榈植物是用于母本棕榈选择和繁殖的植物、用于基因渗入的母本棕榈选择和繁殖的植物、或用于花粉供体选择和繁殖的植物。在一些实例中,油棕榈植物群体包括Nigerian dura x Nigerian dura群体,并且实验油棕榈植物是用于母本选择和繁殖的植物。而且在一些实例中,油棕榈植物群体包括Nigerian dura x Nigerian dura群体,并且实验油棕榈植物是用于渗入的母本棕榈选择和繁殖的植物。而且在一些实例中,油棕榈植物群体包括Deli dura x Deli dura群体,并且实验油棕榈植物是用于母本棕榈选择和繁殖的植物。而且在一些实例中,油棕榈植物群体包括AVROS pisifera x AVROS tenera群体,并且实验油棕榈植物是用于花粉供体选择和繁殖的植物。而且在一些实例中,油棕榈植物群体包括AVROS tenera x AVROS tenera群体,并且实验油棕榈植物是用于花粉供体选择和繁殖的植物。
用于预测实验油棕榈植物的棕榈油产量的方法也可以通过如下进行:确定额外的SNP基因型,将该额外的SNP基因型与指示高产油量性状的相应参考基因型进行比较,并且基于额外的SNP基因型与相应参考SNP基因型的匹配程度来进一步预测实验油棕榈植物的棕榈油产量。这是因为每个SNP基因型可以反映高产量变体等位基因,其关于其他方面累积地和/或协同地有助于高产油量性状。
因此,在一些实例中,步骤(i)进一步包括从实验油棕榈植物的样品中确定实验油棕榈植物的至少第二SNP基因型,该第二SNP基因型对应于第二SNP标记,该第二SNP标记(a)位于用于高产油量性状的第二QTL中,并且(b)在分层和亲缘关系校正之后,以群体中至少4.0的全基因组-log10(p值)与高产油量性状相关联,或者相对于与该第二SNP标记连锁的第二其他SNP标记具有至少0.2的连锁不平衡r2值,所述第二其他SNP标记在分层和亲缘关系校正之后,以群体中至少4.0的全基因组-log10(p值)与高产油量性状相关联。此外,在这些实例中,步骤(ii)进一步包括将实验油棕榈植物的第二SNP基因型与在与群体相同遗传背景下指示高产油量性状的相应的第二参考SNP基因型进行比较。此外,在这些实例中,第二QTL对应于QTL区域1至21中的一个,条件是第一QTL和第二QTL对应于不同的QTL区域。在这些实例中的一些实例中,步骤(iii)进一步包括基于实验油棕榈植物的第二SNP基因型与相应的第二参考SNP基因型的匹配程度来预测实验油棕榈植物的棕榈油产量。
而且在一些实例中,步骤(i)进一步包括从实验油棕榈植物的样品中确定实验油棕榈植物的至少第三SNP基因型至第二十一SNP基因型,该第三SNP基因型至该第二十一SNP基因型分别对应于第三SNP标记至第二十一SNP标记,该第三SNP标记至该第二十一SNP标记(a)分别位于用于高产油量形状的第三QTL至第二十一QTL中,并且(b)在分层和亲缘关系校正之后,以群体中至少4.0的全基因组-log10(p值)与高产油量性状相关联,或者分别相对于与该第一SNP标记连锁的第三其他SNP标记至第二十一其他SNP标记具有至少0.2的连锁不平衡r2值,所述第三QTL至第二十一QTL在分层和亲缘关系校正之后,以群体中至少4.0的全基因组-log10(p值)与高产油量性状相关联。此外,在这些实例中,步骤(ii)进一步包括将实验油棕榈植物的第三SNP基因型至第二十一SNP基因型分别与在与该群体相同遗传背景下指示高产油量性状的相应的第三参考SNP基因型至相应的第二十一参考SNP基因型进行比较。此外,在这些实例中,第三QTL至第二十一QTL各自对应于QTL区域1至21中的一个,条件是第一QTL至第二十一QTL各自对应于不同的QTL区域。在这些实例中的一些实例中,步骤(iii)进一步包括基于实验油棕榈植物的第三SNP基因型至第二十一SNP基因型分别与相应的第三参考SNP基因型至相应的第二十一参考SNP基因型相的匹配程度来预测实验油棕榈植物的棕榈油产量。
还提供了一种选择高产棕榈油的油棕榈植物用于农业生产棕榈油的方法。该方法包括步骤(a)预测实验油棕榈植物的棕榈油产量。该步骤可以根据上述方法进行,即包括以下步骤:(i)从油棕榈植物群体的实验油棕榈植物的样品中确定实验油棕榈植物的至少第一单核苷酸多态性(SNP)基因型,(ii)将实验油棕榈植物的第一SNP基因型与在与群体相同遗传背景下指示高产油量性状的相应的第一参考SNP基因型进行比较,以及(iii)基于实验油棕榈植物的第一SNP基因型与相应的第一参考SNP基因型的匹配程度来预测实验油棕榈植物的棕榈油产量,其中,如上所述,第一QTL是对应于QTL区域1至21中的一个的油棕榈基因组的区域。该方法还包括以下步骤:(b)如果基于步骤(a)预测实验油棕榈植物的棕榈油产量高于群体的平均值,则田间种植实验油棕榈植物用于农业生产棕榈油。
还提供了一种选择高产棕榈油的油棕榈植物用于在细胞培养物中培养的方法。该方法包括步骤(a):预测实验油棕榈植物的棕榈油产量。同样,该步骤可以根据上述方法进行,即包括以下步骤:(i)从油棕榈植物群体的实验油棕榈植物的样品中确定至少第一单核苷酸多态性(SNP)基因型,(ii)将实验油棕榈植物的第一SNP基因型与在与群体相同遗传背景下指示高产油量性状的相应的第一参考SNP基因型进行比较,以及(iii)基于实验油棕榈植物的第一SNP基因型与相应的第一参考SNP基因型的匹配程度来预测实验油棕榈植物的棕榈油产量,其中,如上所述,第一QTL是对应于QTL区域1至21中的一个的油棕榈基因组的区域。该方法还包括步骤(b):如果基于步骤(a)预测实验油棕榈植物的棕榈油产量比群体的平均值高,则使实验油棕榈植物的至少一个细胞在细胞培养物中培养。
还提供了一种选择亲本油棕榈植物用于育种以获得农业生产植物或改良的亲本油棕榈植物的方法。如上文提到的,油棕榈育种者可以使用适用于作为母本棕榈或花粉供体的实验油棕榈植物的方法,来确定通过将实验油棕榈植物与另一种油棕榈植物杂交而产生的后代的可能的SNP基因型,并且此外,可以选择特定的棕榈,即实验油棕榈植物和另一种具有类似特征的特定的油棕榈植物,以在此基础上进行杂交。该方法包括步骤(a):预测实验油棕榈植物的棕榈油产量。同样,该步骤可以根据上述方法进行,即包括以下步骤:(i)从油棕榈植物群体的实验油棕榈植物的样品中确定至少第一单核苷酸多态性(SNP)基因型,步骤(ii)将实验油棕榈植物的第一SNP基因型与在与群体相同遗传背景下指示高产油量性状的相应的第一参考SNP基因型进行比较,以及(iii)基于实验油棕榈植物的第一SNP基因型与相应的第一参考SNP基因型的匹配程度来预测实验油棕榈植物的棕榈油产量,其中,如上所述,第一QTL是对应于QTL区域1至21中的一个的油棕榈基因组的区域。该方法还包括步骤(b):如果基于步骤(a)预测实验油棕榈植物的tenera后代的棕榈油产量比群体平均值高,则选择该实验油棕榈植物用于育种。
而且如上文提到的,公开了一种用于预测实验油棕榈植物的棕榈油产量的SNP检测试剂盒。该试剂盒包括(i)至少21个核苷酸分子的组,用于从油棕榈植物的群体的实验油棕榈植物的样品中分别确定实验油棕榈植物的第一SNP基因型至第二十一SNP基因型。该第一SNP基因型至该第二十一SNP基因型分别对应于第一SNP标记至第二十一SNP标记。该第一SNP标记至该第二十一SNP标记分别位于用于该群体中高产油量性状的第一QTL至第二十一QTL中。该第一QTL至该第二十一QTL为分别对应于QTL区域1至21的油棕榈基因组的区域。该第一SNP标记至该第二十一SNP标记也在分层和亲缘关系校正之后,以群体中至少4.0的全基因组-log10(p值)与高产油量性状相关联,或者分别相对于与该第一SNP标记至该第二十一SNP标记连锁的第一其他SNP标记至第二十一其他SNP标记具有至少0.2的连锁不平衡r2值,所述第一SNP标记至第二十一SNP标记在分层和亲缘关系校正之后,以群体中至少4.0的全基因组-log10(p值)与高产油量性状相关联。试剂盒还包括(ii)该群体的高产油的油棕榈植物的参考样品。
在一些实例中,SNP检测试剂盒进一步包含固体基板,核苷酸分子附接到固体基板。同样在一些实例中,该核苷酸分子是寡核苷酸或多核苷酸。
以下实施例是为了说明的目的,并不意图限制权利要求的范围。
实施例
取样和DNA制备
对于重新测序,对马来西亚Sime Darby Plantation研发中心保存的属于59个来源的132个棕榈进行取样。取样被扩展到源自Deli dura x AVROS pisifera育种群体(1,045个棕榈)和Nigerian dura AVROS pisifera渗入系群体(586个棕榈)的全基因组关联研究(也称为GWAS)定位群体。样品选择基于油-干中果皮比(也称为O/DM)变体的良好代表和相应育种者记录的系谱。使用DNAeasy(R)Plant Mini Kit(荷兰林堡Qiagen公司)从没有展开的嫩叶中分离总基因组DNA。
全基因组重新测序
基于来自每个样品的相等摩尔浓度的DNA集合132个样品以形成测序DNA池。使用HiSeq 2000(TM)测序系统(加利福尼亚州圣地亚哥Illumina公司)制备重新测序的文库,以产生100bp双端读数至35x基因组覆盖,得到924,271,650个原始读数。使用BWA Mapper(如Li&Durbin,Bioinformatics 26:589-595(2010年)发表),用默认参数,对该双端读数整理、过滤并与已发表的油棕榈基因组(如Singh等人,Nature 500:335-339(2013年)所述)比对。然后使用SAMtools(Li等人,Bioinformatics 25:2078-2079(2009年)发表)检出并过滤共计7,755,949个假定的SNP,具有如下参数:SNP的最小定位质量分数为25,最小深度为3x,与间隙的最小SNP距离为2bp。在假定的SNP中,去除了从Elaeis oleifera产生的1,085,204个SNP。基于覆盖(最小17或最大53)、最小分数为8的基因型质量和/或最小等位基因频率(MAF<0.05),还去除了802,449个SNP。根据Illumina的技术要求,进行其他筛选步骤,以去除5,274,408个SNP,包括去除距离小于60bp和模糊核苷酸的SNP对。这产生了593,888个质量SNP。根据连锁不平衡,将r2截止值设定为0.3,其中将共计100,000的SNP(平均密度为每16Kb一个SNP)提交给Illumina,使用Illumina的用于Infinium的测定设计工具(Illumina)进行设计分数计算。
SNP基因型
使用OP100K Infinium阵列(Illumina)来测定GWAS定位群体(250ng DNA/样品)。然后通过不需要凝胶电泳的受控的酶法将过夜扩增的DNA样品片段化。在相应的毛细管流通室中培育过夜后,将重新悬浮的DNA样品与BeadChips(Illumina)杂交。等位基因特异性杂交被荧光标记并通过BeadArray Reader(Illumina)检测。然后使用GenomeStudio数据分析软件(Illumina)分析原始读数,用于自动化基因分型调用和质量控制。为了产生用于GWAS的基因型数据集,仅接受具有>0.01的最小等位基因频率(也称为MAF)和>90%的检出率(call rate)的SNP。随后,根据Endelman,Plant Genome 4:250-255(2011年),基于每个标记的平均值输入那些SNP的缺失基因型。
遗传分层和群体分析
使用邻接(也称为NJ)树来推断GWAS定位群体的遗传分层。计算所有SNP位点的成对Hamming距离矩阵以绘制NJ树。在Deli x AVROS和Nigerian x AVROS中的全基因组连锁不平衡(也称为LD)衰减速率对于预期GWAS的SNP的适合的定位分辨率的要求是重要的。该速率定义为平均成对相关系数(r2)下降到其最大值的一半时的染色体距离。在本研究中,根据Zheng等人,Bioinformatics 28:3326-3328(2012年),基于R包SNPrelate的复合方法来计算1-Kb窗口中的所有SNP的成对r2并在整个基因组内对其求平均数。
表型数据汇编和GWAS
O/DM是使用溶剂对提取自干中果皮组织的粗棕榈油(CPO)进行的直接测量。为了测量O/DM,从每个棕榈最少三串(在田间种植棕榈后≥4年)中,每串随机取样大约30克的可育果实,得到可靠的平均O/DM。通过Student-t检验来检验Deli x AVROS和Nigerian xAVROS群体之间的O/DM差异的显著性。随后,根据Aulchenko等人,Bioinformatics 23:1294-1296(2007年),基于R包GenABEL中的朴素模型,以及根据Zhang等人,NatureGenetics 42:355-360(2010年)的压缩混合线性模型(也称为MLM)与P3D分析,在根据Endelman(2011年)的rrBLUP程序中,分别对1,459个Deli x AVROS和586个Nigerian AVROS进行关联分析。普通SNP总数为55,054个SNP,其中MAF>0.01。根据VanRaden,Journal ofDairy Science 91:4414-4423(2008),通过包括亲缘关系矩阵来解释由隐蔽相关性导致的遗传子结构,作为压缩MLM方法中的随机作用。基于Bonferroni校正方法,全基因组显著性-log10(p值)截止值固定在≥4.0和≥7.0。然后使用R包qqman(根据Turner,qqman:An Rpackage for visualizing GWAS results using Q-Q and Manhattan plots,其可从http://biorxiv.org/content/early/2014/05/14/005165获得(最后访问时间2014年11月15日))构建四分位数-四分位数(Q-Q)图和曼哈顿图。根据Aulchenko等人(2007年),还根据R包GenABEL中估计的基因组膨胀因子(GIF),对两种方法的膨胀假阳性信号进行评价。
SNP作用和统计学分析
针对O/DM性状的基于基因型模型的SNP作用,进一步分析了根据-log10(p值)≥4.0的显著SNP,在箱形图中图示说明,随后进行使用Minitab 14的多重比较的单向ANOVA检验(根据Du Feu等人,ΜIΝΙΤΑB14,Teaching Statistics 27:30-32(2005年)。同一分析方法被扩展,以通过显性模型(A/A+A/a,a/a)和隐性模型(A/A,A/a+a/a)来确定O/DM与一个SNP等位基因(主要等位基因(A)或次要等位基因(a))的存在的关联。
结果
表1中提供了Deli x AVROS群体和Nigerian x AVROS群体的O/DM表型数据,以百分比O/DM表示。可以看出,Nigerian x AVROS群体展现了平均百分比O/DM为75.67%,Delix AVROS群体展现了平均百分比O/DM为76.87%。
如表2所示,与图3中的详细阐述,鉴定了Nigerian x AVROS群体和Deli x AVROS群体中O/DM表型的21个QTL区域。染色体及其核苷酸的编号符合如上文讨论的Singh等人,Nature 500:335-339(2013年)以及其中记录的补充信息中描述的非洲油棕榈E.guineensis的1.8gigabase基因组序列。21个QTL区域跨度为5,779,750个核苷酸,相当于大约0.3%的油棕榈基因组。
如表3、表4、表5、表6和图4所示,鉴定了提供关于Nigerian x AVROS群体和/或Deli×AVROS群体的O/DM信息的且位于21个QTL内的82个SNP标记。SNP鉴定信息和位置信息在表3中提供。从表4和表5中可以看出,在Nigerian x AVROS群体和/或Deli x AVROS群体中的至少一个中,对于基因型模型、显性模型或隐性模型中的至少一个,每个SNP标记产生至少4.0的全基因组范围-log10(p值)。事实上,许多SNP标记在两个群体中和/或对于多于一个模型,产生至少4.0的全基因组范围-log10(p值)。而且,从表6可以看出,对于在给定群体中检测到次要SNP等位基因的每个SNP标记,包括与高产油量性状相关联的SNP等位基因(称为Max)的给定群体的油棕榈植物相比于缺乏SNP等位基因的给定群体的油棕榈植物(称为Min)的平均百分比O/DM的差(称为δ),关于特定的基因型模型,对于Nigerian x AVROS群体在0.14%至4.09%范围内,对于Deli x AVROS群体在0.32%至7.40%范围内。如图4中更详细地示出的,各种SNP标记提供关于两个群体的信息。
表1.对于Deli x AVROS群体和Nigerian x AVROS群体的油-干中果皮比,以百分比表示。
表2.QTL区域1至21:染色体和核苷酸位置信息。
表3.QTL区域1至21中的SNP标记:SNP鉴定信息和位置信息。
表4.QTL区域1至21中的SNP标记:关于基因型模型、显性模型和隐性模型,Nigerian x AVROS群体主要等位基因、次要等位基因、最小等位基因频率和全基因组-log10(p值)。SNP编号与表3是一致的。
表5.QTL区域1至21中的SNP标记:关于基因型模型、显性模型和隐性模型,Deli xAVROS群体主要等位基因、次要等位基因、最小等位基因频率和全基因组-log10(p值)。SNP编号与表3一致。
表6.在QTL区域1至21中的SNP标记:关于针对Nigerian x AVROS群体和Deli xAVROS群体的基因型模型,包括与高产油量性状相关联的SNP等位基因(称为Max)的油棕榈植物相比于缺乏SNP等位基因的油棕榈植物(称为Min)的平均百分比O/DM的差(称为δ)。SNP编号与表3一致。
工业应用
本文公开的方法可用于预测实验油棕榈植物的油产量,因而用于改进棕榈油的商业生产。
序列表
<110> 森达美种植有限公司(Sime Darby Plantation Berhad)
<120> 获得高产油Elaeis guineensis榈植物的方法
<130> IP40-170658
<141> 2017-10-17
<150> PI2015700516
<151> 2015-02-18
<160> 42
<170> SIPOSequenceListing 1.0
<210> 1
<211> 500
<212> DNA
<213> Elaeis guineensis
<220>
<221> misc_feature
<222> (1)..(500)
<223> Elaeis guineensis连锁组LG1 66542323至66542822
<400> 1
gagaagagga agcgtgcagg acggagtatg cgtgttgaaa tttcgtgcag cccaacaggt 60
ccgagtctcc aatactccta ctctctaggc tggtggtaag caaagtttgg gccctaccag 120
accctaccgg actaatcagc attacctgcc tctccttggt accaagcata cctattcact 180
accttccgct gcgacaaaca agcaagtaaa tcatcactgg cgccatactt gatccgccat 240
tgttattgtt aactatcgcc atcatcacta atggccacac atattggcca tgacactggg 300
ccctccggag cttcatgtgc attaatgggt tggcttgaat tagaatggta gttatcatag 360
taaatatggc ataatctgtg gtcaccctca agatctggat gtctgcgtcc aaaatctcac 420
gaggtctgag gattggaaca aaacaaccaa gtcagattgg gttatcccca tatttataag 480
aactcaaaaa gttattggag 500
<210> 2
<211> 500
<212> DNA
<213> Elaeis guineensis
<220>
<221> misc_feature
<222> (1)..(500)
<223> Elaeis guineensis连锁组LG1 66775813至66776312
<400> 2
acacacacac ttgggctaat taaaatacaa attctataac tccaagaaat atattgaatg 60
aaatattttc ttgatttagt tagttaaata cacaatgtct tacataagtt agttgtgcct 120
aggctggatc aaatttgatc agactaaccc aagtttgtcc atcaggttac attagacaat 180
gcccatttaa cacccaccaa tttcagtagt ttaagatcaa agcaattcag caagagtcaa 240
tccaaacctg gcataaccaa agcctggcca taaaacccta atttgacaca aactatacat 300
gaagtcctct tctctatttt ttgggaagaa aaaaagaaaa gaaaagaaaa gggaatgcta 360
ggatcatgta gctaaattta atttagcaga attattttta tttcaattta taggtaatgc 420
ttgatggtaa ccttctgcta gacttctctt tgtgacgaga gcaatggaat gatctaggat 480
tagattaaga ctcttttagt 500
<210> 3
<211> 500
<212> DNA
<213> Elaeis guineensis
<220>
<221> misc_feature
<222> (1)..(500)
<223> Elaeis guineensis连锁组LG1 66807385至66807884
<400> 3
tggaaaacct tatacaacta gtctgatctt tgaccatcat agataaattt gctatacctc 60
ttcacatttc ttaggttgtt gttctcacta ttacttgctt ctccacttcc tgctcatcat 120
actaatttca aacagatttc tccaagtaga gaactgataa tatgtgcagt tgttgtaggc 180
tattctagct gcatcatcta agtgaaatat caaacccttc tataattagt atgtaatttt 240
gttttctctt tcaacttata gttttacagg acatcttatt ttagacccat ggctgttgat 300
gtaatgtgag agtgactgta agtgccgcat gggacactat tttaggcacc atatggtatg 360
tgcataagaa aataaagttg aaagtagatg ccttctctta agcagaaggt taatgagcta 420
atagttccgt actaaattta tttcatatat tattataatt tttgtagagg aatatttgtc 480
ttaaccatca gatagcaatt 500
<210> 4
<211> 500
<212> DNA
<213> Elaeis guineensis
<220>
<221> misc_feature
<222> (1)..(500)
<223> Elaeis guineensis连锁组LG1 67299118至67299617
<400> 4
aaagaatcga aaaacttttt ctagtccaca taattttctt gctaacattg aatgtcatct 60
tcttcccgtg cccaccatat tctgtctgtc agtttttgat caccgacatg atccaccaga 120
gacttcaaag tggcacaaat agttaccaag agaattagta aagttctttc tcagtccaca 180
agactccctc taagattgta cgtctcctcc tcctatttcc atcacattct atcagtttcc 240
gatgacacaa tctaccggga tatttggtaa tatcgtatat agttataaga agatagtaaa 300
acttccttct ataaatacat gcaggttgtt gctaagattg gttgtcgcct ttttttccca 360
tgatcatcaa cacaatctac cgtgatcttt gaggatagtt ctcaatccat ttgaaaatgc 420
tgtttacatt tattattgta cgttgcccgc ctttagttga ctagctattc aatcatgtgc 480
tgctacaact ctgatccttg 500
<210> 5
<211> 500
<212> DNA
<213> Elaeis guineensis
<220>
<221> misc_feature
<222> (1)..(500)
<223> Elaeis guineensis连锁组LG2 62277032至62277531
<400> 5
atttgatcct ggtcatgtaa aggtgcgact gtcttcacaa ggtgtagagc agaatacctt 60
gattccaagt ttatagatcg agacgtttat caattattgt atttgagtca attactgata 120
gagataaagg ttcttggaca caaataccga catatatatt tatttttgta ttgtatgatt 180
tggtttctca tgattgatat ttatttataa ttgccgacat gattagttat atattttgta 240
acatatattt gtacaaaatt tcgatggttt ttgaatggtt tggattatga tttgagagtt 300
tttgaaaaga acataatatg atacattatt tttctggcat aattaaaatt taataaattg 360
atgatcaaga aaaggggttt ggtatagtct tgctcaactg ggaataccct catcatagat 420
agaaacgtga taccgagaat agtctgccat ggatagatac atgatactga gaataatctg 480
ccatcgatag atatatgata 500
<210> 6
<211> 500
<212> DNA
<213> Elaeis guineensis
<220>
<221> misc_feature
<222> (1)..(500)
<223> Elaeis guineensis连锁组LG2 62355283至62355782
<400> 6
aatgaatata atttaaacca aagattcgac ccatgatcag ctctaaccat gccatggttg 60
caccagaagc ctccctcgtt gctccaccca catctatgat catggtgttc caacatttcc 120
ctacaaattt atcatgtgga cccccctcca cctaagagcc agcaagcata cttactaacc 180
ttggagtggc aagcaatcgt tttttcacct cttactcaac catctattat tgctctctac 240
tctattatgc caaactacac atattttatg tatgattttt gctggataat ctcagatgag 300
gagcccgata caactgtttg gcatcactct ttataaagct tcttctaact cacattaaag 360
taaacttcat tttttacaat tactaggtat tttccttcat cagggtggtt gattaaaaaa 420
gggtccaaag agtggtaaaa taaactcgag cagcacttca gtcattagtt tggcatcttt 480
ttctgttact aaaagctatc 500
<210> 7
<211> 500
<212> DNA
<213> Elaeis guineensis
<220>
<221> misc_feature
<222> (1)..(500)
<223> Elaeis guineensis连锁组LG4 31132787至31133286
<400> 7
atatggagtc ttagcagcag cttataaatc tgtaagaaca ttgactgttc tttttttctt 60
gttctttttt tttttgcttt tcttctcata ctttctctca ttgttctaag attttaattt 120
taattcaaaa atgttgtttc ttttatccag gactcagaaa aagaaagcat ttttcacaaa 180
atagactggt acagagtggt actggatgaa gcacacataa tcaaatcttc aaaaaccaga 240
gttgctcaat cagcctttgc attaacctca cactgtaggt ggtgcctaac aggtacccct 300
cttcaggtca gtttcttcat tttttgctag atcactttac caaatcacgt tggctgatct 360
acactttaca tgctgcaaat agaaacaggg tggacctcca cctttttccc caagataaaa 420
aaggatggcc gacccttaag aattattttt atgtaattga ttcaagcagt actatataag 480
ttttcagtta gatctccaaa 500
<210> 8
<211> 500
<212> DNA
<213> Elaeis guineensis
<220>
<221> misc_feature
<222> (1)..(500)
<223> Elaeis guineensis连锁组LG4 31173463至31173962
<400> 8
actttgaacc taagtcacag gcttgaaata aattcataga taagccagaa gttactctgg 60
ctccatgaag ctcagaaata ctaatatgat ataaattata tgtatgcaag tttataagca 120
aaacactgga tctaatctaa tggttggtat agctttgatt tggataatga aagtattatt 180
aaagaacctt aaaccccaaa ctcctagctc tttgaatcaa ttataactta attcaagctt 240
gatacaagat caaatttatt tcatcttgat ttgagataat gaagttgaca aactagttct 300
ttcaaaaata agcttgatca aagcataaat atttcaaact tgagctcaaa attcatgata 360
aaaaataatt tcaaggtaag cttgtctaga ctcaggcttc accaagctca acttgattac 420
aaccctagta atgatcaggg gccaaaattg tttcagacat actttcctcc atttctttca 480
ttaaggtgat agtctgcaca 500
<210> 9
<211> 500
<212> DNA
<213> Elaeis guineensis
<220>
<221> misc_feature
<222> (1)..(500)
<223> Elaeis guineensis连锁组LG5 32863621至32864120
<400> 9
atctcttttt tcacagaatc cagtatataa ttatgaagag aaaaaattat gagtaaacat 60
tttgaagaga tgatcgatag atcataatga tggacgatca caccattcta atatggatac 120
aatcaaaaaa atcagaatgc aaatattctg tgggtttgtg ggcaaacatc atatcagatc 180
caatctttta tatacttgat aataaaagat acaatccaat ttatcatgct atttatcttt 240
taagagatat aacaaataga tatcgcaata aaatggtgaa gaaactttca atacgctgaa 300
acatattagg tgacctatag aagtggatcc accatatgca caacggacaa aggacagcga 360
acccaatctt atcacgtaga aactatatta gcttgatgca caggaaatgg tctcctgtca 420
tcaattagaa acttgccatc caatgatccg gctaaaagga caaaagccac caaccgatct 480
tatcacgtag aaactatatt 500
<210> 10
<211> 500
<212> DNA
<213> Elaeis guineensis
<220>
<221> misc_feature
<222> (1)..(500)
<223> Elaeis guineensis连锁组LG5 32963605至32964104
<400> 10
tatgttaggt aatgaaatct agaatttctc ttgcctgata agatttccta aacaacagag 60
gatggttgct taaagataaa gatggagata acacatgccc tgatttttaa aaacaaatat 120
gaggggagag aaggaaagag aagagggtcc acctagataa gcatgatgga agggagataa 180
acacagaagg agcaagatta gatacaagag ggagaaggag gtcgaggatt aggaccacac 240
acatacacat acagagagag aggactggca ggttgggggg tttggagaca aaaggacagc 300
tattaggaaa atcataatgg gtattttatc atatttgtaa caacaactgt gcaatagatt 360
tcttaataag acatatccaa caaacactga tggtaactta ggaactaaat tgatggaccc 420
aaaaattcaa tctaagatct tttcatatag cataggtata gtttcaaccg gatgtgcctt 480
ttactaatgg atttcttgag 500
<210> 11
<211> 500
<212> DNA
<213> Elaeis guineensis
<220>
<221> misc_feature
<222> (1)..(500)
<223> Elaeis guineensis连锁组LG5 33355931至33356430
<400> 11
cagcatcata acaaaaccat ggattctaca gtagtagaaa tagagacctc atgctctgat 60
tcctttactc attaattgct caggtgatca tagcccaaag gcagctcggt caaacacaca 120
caaagtagga gttaaaagta atggaaatat agaaatgagc atgggggagg ttgcaatgat 180
agtatacatg tgataatctc agacaatcaa taacttgtac aagtacagta agtgaagttt 240
ccaacttatg taacaacatt acaccaataa gaaacttatg aagaaaatat tattgcacaa 300
ggaggtattc agcctttcag gtgaggaatt aagagacccc tcgggaatga atacgtagca 360
gtgcacccat ggtgccattt gcgagggacc accccaccca cctttgaccc agggatggga 420
gatcttgagg ccgccggacg aaggcgtgca cggggcccgg cgcgcgtgcc ggaccggtgt 480
cagagcccgc aatcatgcgt 500
<210> 12
<211> 500
<212> DNA
<213> Elaeis guineensis
<220>
<221> misc_feature
<222> (1)..(500)
<223> Elaeis guineensis连锁组LG5 33508718至33509217
<400> 12
tgctttctaa cttcgaggtt tagatcttat catgcttaga aaaattagtt tgttgtttaa 60
aaaattataa tcttctgctg tttcacactg aagctcacat caggctttcc ccaccagcat 120
catagctgca actgcatcct aataagactt tctttctacc caaagctact agtatgtcca 180
ccaaaaattg caaatattta acttactata aatcataaat ttacatgatc ttatccaaaa 240
aaataaaaga accacattcc agcatattct atacaagtat aaggatgtgc cagaaaaact 300
tgcctccatg tgacgagaag gataagatgg tatatttcct atactgttcc cacttgataa 360
tgtttgtgat gaactactcg aggagggcca tgacaatctt gagaaaaatg atgttacaat 420
gtctggaaac tgcacaatgt acaaatactc agttgtcata tggaggagga agatcttgcc 480
ccacaataaa aagagacata 500
<210> 13
<211> 500
<212> DNA
<213> Elaeis guineensis
<220>
<221> misc_feature
<222> (1)..(500)
<223> Elaeis guineensis连锁组LG5 33658904至33659403
<400> 13
tgaacctggt ggttcatact gtatcgtgat aaagtggtca agaaccagaa tggcttgggc 60
agccggtcag ttcagccctt taaattctcc caatcccccc gcttggcccc ctcgagcccc 120
atttcgggtc ctctctccct ccctctctcc ctctctcatc ttgatcgctc tctctccatg 180
gattccataa cgacttatac gatcacacga ggccaagcaa ctccatcaat ccctagctcc 240
ttcccctgcc atgcttccaa ttccattgaa attcataaaa caaggatgcg cccaatccac 300
gatccccaga ccttctctac tgtccacgac ctcctccacc attagatcca tgctccccaa 360
gccttctcca tcatccacag cctcctccac caccaaatcc atgctcctat agcctcctcc 420
actgccagat ccacactcct catgcctcca tcgtctacgg cctcctccat catccacaac 480
ctcctctgcc accaaatcca 500
<210> 14
<211> 500
<212> DNA
<213> Elaeis guineensis
<220>
<221> misc_feature
<222> (1)..(500)
<223> Elaeis guineensis连锁组LG5 34232853至34233352
<400> 14
ttcattggag ttcttaaatg cttctacagc caaacgtcca acttccatga ctcgctcgtt 60
agccttctcg acctcagcta cgcttgagac catctcccac cgcaactctt gctcggaggt 120
ctccaccttt ctcagggcct ctgtagcaac tttcaccttt tccttcacct cgattgcctg 180
agatttggtc ttctataact cttctttacg agtgagagcg gagtctgatc tacctaatga 240
ctccttcagg cacccaactt ctgcctccac cgtctctgct cgggcacgga cttattctgt 300
ttcgtccgca cgatttgata actcgacaag aaggtgaaac atctacccag aaactatgta 360
agaaagagga gaagagagga atcagaaaat caaagcatca tcacagtacc tcatggagag 420
aggctacggt gcgcttctat aggctgacaa agctttgcct cctaaacttt ccttcctcta 480
aaggaataag tatcccttcc 500
<210> 15
<211> 500
<212> DNA
<213> Elaeis guineensis
<220>
<221> misc_feature
<222> (1)..(500)
<223> Elaeis guineensis连锁组LG5 34358119至34358618
<400> 15
agctataagt atccacctaa caatgctgtt tccttaaaaa atattccggc ggatgtggaa 60
aagcatcaag tcgttgaggc aacatatcgt gcggaagagt tccaagcttc ttcttcttct 120
tttttttttt tttttttttt tgaagcgaac cagttgaaag ctatgttttg caatgagtat 180
ttctaattaa atataaaaaa tatttggttg gaaagagtaa agatctgaaa ttagaatcag 240
aatggatgac tcccattcca tccgtttagt tgggaggagt cccattccga tttcgatttc 300
gggatggaat gaaaatgagt caatctatat agaactcaat ctctactctc ttttatagat 360
tcaatttttc atttcaattt tgattttgat tctgatttcg atcacaaacc aaacattttg 420
gaggatttag ccatttcgat tttgattcca aaccattccg atttttattt tcattctgat 480
ttcgattaca aaccaaacat 500
<210> 16
<211> 500
<212> DNA
<213> Elaeis guineensis
<220>
<221> misc_feature
<222> (1)..(500)
<223> Elaeis guineensis连锁组LG5 34996729至34997228
<400> 16
ccaaagactg agaggagatt tttggatatt tattaaattg cacggcatgt ttcaaaaaaa 60
aatatcttgt tacatattat tgttatatgg taaactgaga ggagattttt ggatatttat 120
taaattgcat ggcatgtttc aaaaaaaaat atcttgttac atattattgt tatatggtta 180
tctttctgat aattagttat gcttcagaga tgttggtaat ttactgagtc cataaaactc 240
atatattttt ttattttttt agatacagaa gaattttatt ggacttggga tcgaacagtg 300
aggtgcatag caggcctgtc atattcttta gaatcttgtc ttaagaagta tgcagccatt 360
acatgtccga tctgaatgtt ggatttgaga cgtgacagta ataaataata aaatgttatc 420
aagttattca attttttttt tactaggtga atatgtgaaa ttgaaatgag gaagccattt 480
ggttttagtg gtccgtgagt 500
<210> 17
<211> 500
<212> DNA
<213> Elaeis guineensis
<220>
<221> misc_feature
<222> (1)..(500)
<223> Elaeis guineensis连锁组LG5 35004388至35004887
<400> 17
gaagacctga tttatagccc tgatgtattt ttttgatatc tgtactgctg cccagacctg 60
gaccagaacc gatctttgga tgtgtgggtc ctgatttttg gattagtaag gttggcaaaa 120
tttaaaccca aatccccact tacagttctg ggtcaagatg gaagtacctg aacccgacct 180
gacctaatat cacccctaat cgcgaaacac cacaattaat gtgaagatgc aatttatttc 240
ttcacacatt gcgacagttg aagacaatct aacttctgat cactcttagc ttttaaccta 300
cgtggccttc cttgttgatc tggcatatat ttgtcattat ctttgtctac aaaatgcaat 360
tgtttattga aaaaaagatt tactcgtgga tattaagtag gggagaatga agctacctta 420
ttggaagatt tgagcttttg ctctttaacc ttctttttct actgtcttaa ggcttgcatt 480
agttgacgaa taggcatgtg 500
<210> 18
<211> 500
<212> DNA
<213> Elaeis guineensis
<220>
<221> misc_feature
<222> (1)..(500)
<223> Elaeis guineensis连锁组LG5 35125244至35125743
<400> 18
ctttggtggt gttgggactc tgccgggttg ttgctccaac acccaaggtt attgctcaca 60
gccttcaggt caactttgcc tttcttttga atcttttctt ctttcttcta aaatcttcta 120
tcttctttag agtaattctc atggctaggg cttctccttc tcgaaaagat cgatcggaga 180
atccgactga tgagtcccaa tcgagtccag atgtggagtc ctcttcactt tcggaaccga 240
atgttgaacg gctccgagag cagttttgta tcccggggca gttttaactt ttcgcctccg 300
gagccgatgg tcgggtgaat aacccacttt cggactaggt ggccttctat gtcgaagatc 360
ttcggatgga tcttcgattt tcgattccga agtttgtccg aaatattttg gattattacg 420
gactttgccc ggcttagctg gcaccgaact ctgtccaact gataattagc tttgccttgc 480
tgcgtcggat gttgccgacc 500
<210> 19
<211> 500
<212> DNA
<213> Elaeis guineensis
<220>
<221> misc_feature
<222> (1)..(500)
<223> Elaeis guineensis连锁组LG5 35191678至35192177
<400> 19
ttttgtggtg taagatattg taaggtatca agcatgacat tggtatatga tgtcagaagg 60
ccattaatac agtttgtttt ggtaatgaaa tgttgtgcct tgttaggaag atttgactat 120
tataattttc aggtaaaatt attgctatga tatttttata gccttactaa tattctaaat 180
attcataatt tgtgtataat ttcaattctc atagaaggca gcaccatttc taaacattta 240
actaaattgt agacttgctg ttgaaacatg ctaagaatat gttctttcaa ttggtttgat 300
gatcgctcgg cataaccctt agaataggtt acaaaaggta cgatatagac ctttcatgca 360
tagcatgtaa tattcggcct tgctaggata ggttacagaa agtaggatat agacctttca 420
tgcatagcag gtaacattct gccttgtttt ttttgtgata gttcgaccct aagtcctgga 480
gagaatttac cggatggagg 500
<210> 20
<211> 500
<212> DNA
<213> Elaeis guineensis
<220>
<221> misc_feature
<222> (1)..(500)
<223> Elaeis guineensis连锁组LG5 35193178至35193677
<400> 20
gccatgagtg attcatgaaa atttaattaa tatatatttt gtggcatgct atgtgattgt 60
taatcatggt caaagggagt aattacctct gctcataatc gaaagagcat tatttttgag 120
attccttttt aagggaaaga aacccaactt tccgttgtta tttgctcata atctgttgtc 180
tggattcaca ctaccttcat tatcagtcag ttctctacca tttagactct ttttttgcat 240
gagttactta tctttattct tactttaagc acttgctgaa gagtttactg atggttcatg 300
taaattgttt caggctttgc attttccctt ttaaactttc cagcctcata tagatacggc 360
aaaacaatca aattctttgt caatggttgc aagagagatc tagtggcaca aacttggtgt 420
catatggggc ctgtcattga tcccattttg ttggaaggtt ggatctaatt agacatgtat 480
ctaaataagg atcttaggat 500
<210> 21
<211> 500
<212> DNA
<213> Elaeis guineensis
<220>
<221> misc_feature
<222> (1)..(500)
<223> Elaeis guineensis连锁组LG5 36108847至36109346
<400> 21
gtgaaggggc aatattcagg tttcgactat cgaatcggaa cctacagtta ggagaaatga 60
agatcccact ccgatcgtca agcctgcgat ttccttgcca gcgatcgtgg gggtcgcact 120
cgaggagaac ccatcaaaga aaatattgat ggagcaagca cagagagagg atgcgagcaa 180
ccacccatca ggagcttctg caaaggagat acgagtggag agcacgatcg atctcctcga 240
agggatgctg gaagcgggca tggagactga tgagtcccaa gagctggtga tggctgcccg 300
atgtacccct atggctatcc tccatgtggg tcccttgcag tcggcgtctt ctgctccctc 360
agtgatagag gatctccaag ccatggcaag actcctgagg gattttcttc ctccattcaa 420
gaggcagcct ttggatggac gaggagtgca gcagtaaatg ttgggcgccc ttagatatct 480
catccaggtt taaggtctcc 500
<210> 22
<211> 500
<212> DNA
<213> Elaeis guineensis
<220>
<221> misc_feature
<222> (1)..(500)
<223> Elaeis guineensis连锁组LG5 36272309至36272808
<400> 22
gagacttcta aggctttaga aggtgtttta taaacttgat agttttctat ccatatttaa 60
ccagagtgag ttaattttta taaaaactaa caatagtggc tgatttgaat gttaccttaa 120
aattatagtg actattatag aacaaaagaa aaaggtttct aacctgtaat ttctaaaaag 180
gtataatgat tgtcctgcaa aaaaaatcct tctaaatact ttctgcctcc gaaaatagct 240
caaaagcatc ctgccaatac cccaattcca attttaacta aataaaagat cattaagaga 300
agcttacaaa ctaaaatgca aatgattgct ccatgtcgaa ccttcttttt tcttctaaaa 360
gattcctatt agatattaaa caaaataaag gagaagatgg ttcagtgaat taggattttt 420
gttatttgtt ataatatatt taatgtttat aacaagtagt tagttgttgg aatcttgtga 480
atagtggata gctgacaggc 500
<210> 23
<211> 500
<212> DNA
<213> Elaeis guineensis
<220>
<221> misc_feature
<222> (1)..(500)
<223> Elaeis guineensis连锁组LG5 39210662至39211161
<400> 23
cggtgggttg ttgatgcact cctccatgaa cgccagcaag tcatcatgat ccttactagt 60
gtaatcctta acccgcttgt ccttccattc accagatcga gccaaagatt gcgcttccat 120
gtttgatgat gttttcttct tggaggagag aactagcaac ctagcttgat catcaaggta 180
ctcagattgc atgttggctt gttcttcaat atggtttgaa ctgtcaagca gtgctcgtac 240
tcgcttgttg gtgaccgtat cctgttgtaa accattgatt tctctcaagc actttgtatc 300
atcatgaact atagaatgag atgttgattc agttgcttgg tcctcatata tagctccacc 360
atcttttgta ttcttttctc tattgttcaa gtaaacttta caaataaccc atgtatcaag 420
ctgccaaaag atgtgagata agagaactaa attatgatgt aattcatgac tataagatat 480
tagatgtgat tatttggatg 500
<210> 24
<211> 500
<212> DNA
<213> Elaeis guineensis
<220>
<221> misc_feature
<222> (1)..(500)
<223> Elaeis guineensis连锁组LG5 39224577至39225076
<400> 24
aatgtgaccc attgttttag cgaaacaagc taaattttac attgatttga tttgcccatt 60
tttctgattt gcaaccaagt gagggctgaa cctcactagc caaacctagg attttaaatg 120
aatcctctaa ttcatatcat gcccaaaaca agtatttggg tcagcttgct tatgtgtttg 180
gttttgcccg ggccattcgt gttctaatta aataattgca taaagtttcc gacctaagcc 240
tggccttgag ctccattttc ttcatcttgg tcgatcataa aatatctaga tggatcatgt 300
cacacgaccc atttgcacct ttatagccac aatcatgaaa ttgatgtaca actatagctc 360
tattttacca tcaccccatg tgaatagcac caagcatctc caatctgctt caatcattaa 420
tgtatttttc ctaaaattta aggagacatg caacaacagt ccttttgagc aagacttgga 480
attaaaatcc ccaatttttc 500
<210> 25
<211> 500
<212> DNA
<213> Elaeis guineensis
<220>
<221> misc_feature
<222> (1)..(500)
<223> Elaeis guineensis连锁组LG5 39518005至39518504
<400> 25
gagtagtaag aagcaaatat gtatagcatt atccataatg gaagctgaat ttgtagcttg 60
ttcagcagta gtacaggaag ccatctggtt gaaaagattt cttaagcatt tgggattctt 120
gagcatggag aagctttgtg aacagaaccc caccgatctt gcttttctgt ctgaaatcta 180
ctcatctagt gccagtgcac gtaactctat tcccttagga aagcaggtca gcaagtggga 240
ttttaggtaa aaaagattcg ttctatctgg actctttcta tagggtgtaa cattcattcc 300
tggactatga aaatgtaaat cctgaaagcg ggcatcattg catgccttcc aggtctcgta 360
aaagatcaaa cgagtaagac cttattcttc ttaaatggat ccatcctaac cgaaatcatt 420
gaattcggat ccgactaaac tagacttatt gcttcgtctt ttgcatgctt ttgctatctg 480
tctttccatc cagctttgct 500
<210> 26
<211> 500
<212> DNA
<213> Elaeis guineensis
<220>
<221> misc_feature
<222> (1)..(500)
<223> Elaeis guineensis连锁组LG5 40469398至40469897
<400> 26
ggtagggata ggtagggaag tgttgacatt gacaccttta tcttgaagaa acttgtctaa 60
taaggaaatg tcttgcttct aacttacaag aggggttagt ggaaactggt aaaaccttag 120
cagcatgaaa ctcctaccta ggttcccacc tctactttgg gatctttcag gaaacaagct 180
catgcaaccc tttcccaagc acttcacttt ctccttttct tttaaccttt tttcttgaga 240
gaaggagatc cacttcgttg cacctgttct gctcctgctc taggtaacaa agagaagttc 300
taagatcctt attcattttg attatggatg attataccta gagtgctctt aagcaattaa 360
tttcatacag tagtattgca tttcaaataa aggaaccaaa aagtatgatg gaagcataag 420
aaagaaaata cctttcagtt ccatgtgatt cttagtctct tcaccaagtt gcttccacaa 480
acctgtcaaa attgcacttg 500
<210> 27
<211> 500
<212> DNA
<213> Elaeis guineensis
<220>
<221> misc_feature
<222> (1)..(500)
<223> Elaeis guineensis连锁组LG5 40535309至40535808
<400> 27
atacaaacct gggactaata atggcagagt tcaacccaac ccaaatccga acccacaaaa 60
atatatacta tatatattag atacaatttc atcttccaag atcttactat gttacttgaa 120
attgggttcc acgtatattc acatgttgcc attcctagcg caatttgttt tatttttaga 180
tataattcat atgacggggg aatttacacg tggctttttg gtgacccaag ccaattttta 240
ttggggtggg tcaggttggt ttgggccaat tagattagtt taaccaagtc acatgaggtc 300
aaaaattgag gtcaggttgg gttctggttg tgaaacttgg gttaaagatc gtgttgggtt 360
ttaggcctag gtctcgaggt gtcaggttag gtctaagctg gcctccagcc caatccatct 420
tgccccacct aatttccact cttagccaaa aatgggctgg aaccagccta aaattggatt 480
ggtacgactc tacaagattg 500
<210> 28
<211> 500
<212> DNA
<213> Elaeis guineensis
<220>
<221> misc_feature
<222> (1)..(500)
<223> Elaeis guineensis连锁组LG5 40689651至40690150
<400> 28
gaggaaggca aaggtaaagg tgtcagtggg gaagggagag cagcaaatgt cttgcatctg 60
ctggtagaca tggatggctt cttggggata acaacccaaa gaatagtttc ttataagatt 120
gttccatatt ctcatgccag tttcattgat gtggtagcga tggagagcgg tggtgaggag 180
ttgggagtgc acctggattg atgggtgcct cctggtttga tgtttgagga gaagagagag 240
gagggcgtgc tcatgggttg ggtgtggtgg gaggagatga tgactcaggg ttgatagctt 300
ttggtgtaga atgacaaggg agagggagga gtcataggaa gttgttctca gggggaaggg 360
cgatctggtt aacaattgca ttgactggag ggtgaatcaa tcactcaccg ttggctgtgg 420
gttggcttcc ttttgaatga atggtaggtg attacatggg ggagggatgt ggcaagggag 480
tgagtgcaat gggagagggc 500
<210> 29
<211> 500
<212> DNA
<213> Elaeis guineensis
<220>
<221> misc_feature
<222> (1)..(500)
<223> Elaeis guineensis连锁组LG5 40789706至40790205
<400> 29
acgtatgaaa ccaaaatgat gcacctacac ttggaattct agccggccat ttacaacatc 60
tcatatattc ctatttgcat gcgacttaaa aatgtaatca cacattaaag attgagttct 120
gcaaacgatt tcatttccct ttttattaga tattttataa tcccaaattt tcattcccaa 180
ctagttctac gtaatagttt ttatgcatgt catgttataa tcatgttgtg aggtgtaaaa 240
aaatttccta atcttgagaa attgctatac atgtgtttta ctaaagagac tgcacgtgtg 300
catcgtatac tttgctgttg gtgtcgaagc tagctggcca tattgtcatg ttgatacgta 360
tctcttgttg ctatgtgtac gtggctaaac gtaacccata taaaacattg acttccaagt 420
gtttgaccca ttccactacc tgctatgcca agggtttatg atggcaacct ttcactcttg 480
atccactccc atgcatgatt 500
<210> 30
<211> 500
<212> DNA
<213> Elaeis guineensis
<220>
<221> misc_feature
<222> (1)..(500)
<223> Elaeis guineensis连锁组LG5 40983456至40983955
<400> 30
gaatcaggac ttttagtcta taaataaggt cttctggcca acgttgtaat caatttattg 60
gagttattga aaaaaaaaat ccaaagaaga gagtttcttc cctttatcgt ttttctttgt 120
ttcatgcatc ttcaacctct ctttccttag aaatgtggcc ctagactgca tcagttggta 180
tcagagtgta gcagatctgt gagcgaagat tcttccctgc agtctggatg acgggtagtg 240
gtcgcaagaa aaaccaacct gcgaatcagg cgacggcagc tcatgatgaa atcacgcaat 300
gggaacggaa cctgatgttg gagtgtgaag attggaggag acaggtggcg gatttgattg 360
cgcgtcttat gcagttggaa acccgactgg caagctttga ggtgaatcca gaagatcgca 420
gatcaaagga tgaagcttca gattttgaga atcctttcca taggattgct cccacacact 480
ggcttaaagg atgaggtgat 500
<210> 31
<211> 500
<212> DNA
<213> Elaeis guineensis
<220>
<221> misc_feature
<222> (1)..(500)
<223> Elaeis guineensis连锁组LG5 41001085至41001584
<400> 31
ctgtcatgga tcataaatat tgtaaattgc acatcatatg ttgtcctatt ggtggcatca 60
tttcagcaac aaaattcatg aggacaactt gaagaaaatc ttgataaata gataccatta 120
atcttttctt acttttgtag agtgaaaaac ttcaaaaatc ttgattacgt tatgaaacta 180
caacactata gatcataaat attataaatc aaaccatcct gtttcatgtt agctgactta 240
agcttggggc ctctaagcgc ccactttcag aagtcatgac atgattcaag atgattacaa 300
gatctgctgt ggataagttt ggccatttta agtagatctg gatgaggttt cagagcaaga 360
tctgccccat ccaagattaa attatgtaga gtaaggatac aactttctta tatgatatcc 420
attttcagca tcgtgagaac caaaataaaa tgatagagca gtaatataag agtgagatca 480
tccccaaaag attcgccgaa 500
<210> 32
<211> 500
<212> DNA
<213> Elaeis guineensis
<220>
<221> misc_feature
<222> (1)..(500)
<223> Elaeis guineensis连锁组LG5 41301947至41302446
<400> 32
gaatgacttc caggtttaaa agtcgttgtc gagttatcat ttcagctaaa gattttccaa 60
gttacaaatt tgaagatagc aagaaagaaa gaagaaaagg gcaaatatac caagaatgct 120
ctccaatatt agatttgatt atgagttgaa gagacccaag ggatcgccgg aaagcgcccg 180
ccatccgtgt gcacttttct cctcctcctc ctctgatcca atcagtagaa aggaaagcaa 240
acaggggtta aatattatgg aagaaggggg aagatttcaa gccctattcc tcttcgctgt 300
tctactcccc ttaaaaccta atcctccgcg gccggcgtcc ccgtgcctct gtccttctcc 360
gattccagac cccaaccacc ggataccttc gaattctaag gccggtggtg cgagggggca 420
agcggcggtg gtggcggtgc tccagcgccc gcagaggagg gacggcgggt tgcgttcagt 480
gcttggaaag gggaaagtcg 500
<210> 33
<211> 500
<212> DNA
<213> Elaeis guineensis
<220>
<221> misc_feature
<222> (1)..(500)
<223> Elaeis guineensis连锁组LG8 3050807至3051306
<400> 33
gaaaatcgag agagaagact cctaactgaa gtcctgttct ttctcttgac tcacatgcac 60
aatgcatgac ttgttttttt tctttttgtt cttctggaca ggttattaca ataatacaac 120
aaaatatcaa gcaatttttt taaattattt ttttttaaac atgcggagga agtgagaaat 180
ttctccaaga attttgttaa ataaaaagat tatcgaagaa tttacaaggg agtaatgtta 240
catggaaaga gagcaaagtc tatggtctcg tggacaatgg aagaaactgg tgccttacta 300
attacttatt tattatagta aacaaatttt agttattaaa cggtcgaatt agtatcatat 360
gtagcatata agtgattgat ttttagttat tatatttact gatagaaaga gacaatcaca 420
gcagatttca gtggactagt ctttgcactt gcgttggaga cttggcactt tctattttgc 480
gaaattattc accctcaagg 500
<210> 34
<211> 500
<212> DNA
<213> Elaeis guineensis
<220>
<221> misc_feature
<222> (1)..(500)
<223> Elaeis guineensis连锁组LG8 3241478至3241977
<400> 34
caaaaaaagc aaaatagttt ggtgcaggaa caactgacta aaccatattc ataaaagcaa 60
aaggggaggg agagagagag agcgggggac gggaaaatta aaaaagaagt ttaccatgac 120
accaaaaccg atgccggtga tgacgaggtt ctcaatgccg acggcggcca gctcaagggt 180
gcctacgtgg ccgatcagtg tctgcgtcac cgagcccagc gagaactgga acagcgacgt 240
taggatcgcc ggcccggcga tgtaccacac caacctcaac tcccgccacg tgtcctccca 300
ccaaggccgc cttcccttct cttcctcctc ctcgttcctc ctcctcgtga gcagaggcag 360
agaaggatcc gccgtcggcg gcgccattcg tttttgtcgg cggtggcgca actccgaaga 420
ctctctcttc ccaagaaaga atgagaataa ataaaggatt cttaaaagaa taaataaagg 480
gtttttttaa catgcgcccc 500
<210> 35
<211> 500
<212> DNA
<213> Elaeis guineensis
<220>
<221> misc_feature
<222> (1)..(500)
<223> Elaeis guineensis连锁组LG8 5354764至5355263
<400> 35
gaaaaattga tcccttatgg ggagatcggt tcgtccccag gttggaggat taaaggaaga 60
ttgatcgctc tatctccaat taggattgat ctagctcgaa gtggatcgac tctggtgcaa 120
agcctctcag gtccgtccgc agtacatata gatgcaagat tctatacttt gatagataaa 180
agctaataaa ccccactttt tatcagaaat tttttgtttt agaagattgg ttaggggcta 240
cggtcctaat atgtggtatc agggagagat tgttggctat attctagtgc acacccttcg 300
aggtctcatg ttagatttat gtggctggtg atgtggcaac aattctcaga agatcgatcc 360
cttataggag gtcggctctg tagcgaaaat tttgtgcagg ggcaaaatag taattttaaa 420
actttttcaa aattactatt ttacagcgga attattaatt aatctcatta attaatatta 480
attaacccta cactatgatc 500
<210> 36
<211> 500
<212> DNA
<213> Elaeis guineensis
<220>
<221> misc_feature
<222> (1)..(500)
<223> Elaeis guineensis连锁组LG8 5445391至5445890
<400> 36
ctgttctaca gggttatagg cttatagctt agattccttc tttttaagtg caaaagcgtg 60
catattttaa ctattaatat taattttctt tttctttaag gtcctttgcc gaagaagatg 120
ttggaaagca cagtgttggt gtgcaatcag tagcaggtgc tgcaaatgca agcaaaggtt 180
tagaagttgc agttgcaaat cttcaagact actgtaatgg tattcctcac acgattactc 240
tctctactat tttctgaact cacatttata gtaaatttta atatgtctat ctatttcaga 300
attggagaat aggttgttgg ctcgctttga tatagcgtcg caaaggcgag atttaagacc 360
aatggcagaa tgtgctaaaa ttttatctca ggtgcaaaaa ttttatgttt tatcaatata 420
gttaatggca tttcccatct aaaagaaaga attgctggaa aaagctagga tgaaagtgaa 480
aaggaagagg aagaaacaat 500
<210> 37
<211> 500
<212> DNA
<213> Elaeis guineensis
<220>
<221> misc_feature
<222> (1)..(500)
<223> Elaeis guineensis连锁组LG9 29488933至29489432
<400> 37
acatgcttct tcaggatttt tttttttcaa taaatacaat gctgtgacat atggcatgta 60
atgcattttt gttttattac ttctaatcat ctccaaaagc atatataacc tgtttaaaat 120
tttttcatgt agctataagc tgaaaagaag cagatcaaca attcatcatc ccgttcatgt 180
atctcataca tgactgggtt gcatattgtg attactatta tttattcccc ctctgtattg 240
atttatgttg gccattctaa tttccatttg gtattctagt gttcctgatg agcagttgtt 300
tcattgtaaa aagcatataa tgatttgtgc aggtgactgt aaatatgtgc atcgatgctt 360
aacttaccat gtaaacgtgc ggttttttcc tgtggtgaca tataattaaa catcattgct 420
tcaaggcggg catgattttt gcttgtatca tgtcatactt ctttgcactg tgggatatta 480
aacaatgtgt tcttgcagca 500
<210> 38
<211> 500
<212> DNA
<213> Elaeis guineensis
<220>
<221> misc_feature
<222> (1)..(500)
<223> Elaeis guineensis连锁组LG9 29601801至29602300
<400> 38
ttcagagact attaaatcac atctcttcat ataaaaatcc aatataaaag tctcttgaat 60
aacgtgtcag gggcttgcca catgatgatg tcccaattcc tttcatataa atcacttctc 120
gcatgatcaa acaaaaacct catttcatat aaaaagttta ttgttacata atccaagaag 180
gagatactag taagcatcaa tatcatcttc aaattaatga agcataattg cagggaccca 240
tgggtactcc cctcggaggt tgaccacaac caaacccact caattaagtc accacaagca 300
attgcccggc aaatctaatg atccgaagaa tctaatgcca agacaaattc ttaggattaa 360
ctccaattat aattctctct tatcaacaac cccatccacc catccacact ctgccaggtc 420
tttgtactaa atccgccgta cagtgacgcg acgagatgcc aggatccttc catccctaac 480
cgtaattact ttccttcccg 500
<210> 39
<211> 500
<212> DNA
<213> Elaeis guineensis
<220>
<221> misc_feature
<222> (1)..(500)
<223> Elaeis guineensis连锁组LG11 4797284至4797783
<400> 39
agacatgtca cccatcctgc aaccccttca tatcaagtgt acccatctcc tttactttct 60
cttcaatagg agctttcctc ttattaattc atcaactcta tattatatat ataaatttag 120
tcatagtaat tcattaaatt gaattacatc tccaatgttt atggtctaaa ataaatgtct 180
ttagtgcaac ccatttcttt atttaagcca aaaaacaatg gaatattttg gttacaaact 240
cttctatatt tttatcttga aactgccatc atagacacca attctctttg cacaatctta 300
tcaagacctc ttgccttgat tgtagtctat ctatccctgt tgagctacca tcttctggtt 360
cgatctacca gcccgggatt ctcctctcca tgatgcctgc tccctgtgcg gagtagcctg 420
tatgatcttg gtcccccaac ccctccctct tttgcttgca aaacaacatc tactagaaca 480
tggtagcaca tatgcacata 500
<210> 40
<211> 500
<212> DNA
<213> Elaeis guineensis
<220>
<221> misc_feature
<222> (1)..(500)
<223> Elaeis guineensis连锁组LG11 5717107至5717606
<400> 40
atacaattat tcaaattatg aaaaaaaaac caatgtcaac aaaatcaatt tggagccaac 60
cttgtctccc tccgtcgcat aagatactct ggaagcattt gtcttgttgc caaccagtac 120
tgctttctca gtctcatgat atgcatgtaa tgaatggttt atgtatgcaa cagtgtgggg 180
atcaagatag gttctttttc atgataggct actgaaaaca cagattttat ctcatgtata 240
tatctatctt tacatcaaca gcattcacag tagtccacct ttgatcatcc atatcctcca 300
aacccaacga accttgtgtt cagatgagga tttcatgggt gtcaagtaaa cacaagaaag 360
aaaaaaaaaa agaaaaaaga ggaaatgaca caaagtgtaa tcatgttata ctaccttatc 420
caggcacagt gattagaaaa gcagcttaca accagttcac aaagaagagg gcattgtgct 480
agaagagtcg tgctgccagg 500
<210> 41
<211> 500
<212> DNA
<213> Elaeis guineensis
<220>
<221> misc_feature
<222> (1)..(500)
<223> Elaeis guineensis连锁组LG15 8611715至8612214
<400> 41
tgtcgttggc tttgtggatg gccaccggga agtcggagag cgaaagggcc tcctcttctt 60
cctccaaggt cacccatttc tcctgctgtt cttgggccat ggtctgggtg acttctttca 120
cctctttggg ggaagttgga tgggagattt ataagggggg aggtggggga tttggaaggg 180
gggacaggtg gagccttgga gggaaggaaa gcaaagggtg caggcttgcc atgttctttt 240
agactcggac attcctgtgg gcctgtgggc cggccctttc atgctcctct ttaggctgtt 300
cacattagcc ttattttatt aagggtcggc tatgacccag gttgggttaa atagtaggag 360
aaccaaccat aataatctat ggaactctat gaaagtattc aaatatatat agatgaggag 420
gttggttagg ttagttgatg acagaaaact cttatgatgt tgtttattat taggaaaagt 480
gataggttat gtagacattg 500
<210> 42
<211> 500
<212> DNA
<213> Elaeis guineensis
<220>
<221> misc_feature
<222> (1)..(500)
<223> Elaeis guineensis连锁组LG15 8857415至8857914
<400> 42
aaggggcatc ccgaaatatt tttattaatg ccctgaaatt atttgttata aactctttta 60
ctctctaagg agattatatt tattaatctc tattgaattc ttatgaggca aaattactca 120
aataatatta gaggtggcca gaagccatat accactctta tcttgcctct ttttatctcc 180
acctagataa tttggagtaa ccacacaatc caacaccatg tgaatctcat cctttctctc 240
aaacgtaagt ctaaacttcg gtgctctcat cacacttgca aggcactaca atgtactaac 300
ataaatatca taaatatcat ttttatttct tttctcttat aagagaaggg ttatctaact 360
ctaaaatcca acatgtatgg aaacaggaac aactttggag tggtcctctt attaggtgga 420
ccggatctac tgtgctccta ggttgaaatc atcataggtg gattcatttt attcgagaat 480
gaaattattc ggtgaattcg 500
Claims (24)
1.一种用于预测实验油棕榈植物的棕榈油产量的方法,所述方法包括以下步骤:
(i)从油棕榈植物群体的实验油棕榈植物的样品确定所述实验油棕榈植物的至少第一单核苷酸多态性(SNP)基因型,所述第一SNP基因型对应于第一SNP标记,所述第一SNP标记(a)位于用于高产油量性状的第一数量性状基因座(QTL)中,并且(b)在分层和亲缘关系校正之后,以所述群体中至少4.0的全基因组-log10(p值)与所述高产油量性状相关联,或者相对于与所述第一SNP标记连锁的第一其他SNP标记具有至少0.2的连锁不平衡r2值,所述第一其他SNP标记在分层和亲缘关系校正之后,以所述群体中至少4.0的全基因组-log10(p值)与所述高产油量性状相关联;
(ii)将所述实验油棕榈植物的所述第一SNP基因型与在与所述群体相同遗传背景下指示所述高产油量性状的相应的第一参考SNP基因型进行比较;以及
(iii)基于所述实验油棕榈植物的所述第一SNP基因型与所述相应的第一参考SNP基因型的匹配程度来预测所述实验油棕榈植物的棕榈油产量,
其中所述第一QTL是对应于以下中的一个的油棕榈基因组的区域:
(1)QTL区域1,从染色体1的核苷酸66542323延伸至66776312;
(2)QTL区域2,从染色体1的核苷酸66807385延伸至67299617;
(3)QTL区域3,从染色体2的核苷酸62277032延伸至62355782;
(4)QTL区域4,从染色体4的核苷酸31132787延伸至31173962;
(5)QTL区域5,从染色体5的核苷酸32863621延伸至32964104;
(6)QTL区域6,从染色体5的核苷酸33355931延伸至33509217;
(7)QTL区域7,从染色体5的核苷酸33658904延伸至34233352;
(8)QTL区域8,从染色体5的核苷酸34358119延伸至34997228;
(9)QTL区域9,从染色体5的核苷酸35004388延伸至35125743;
(10)QTL区域10,从染色体5的核苷酸35191678延伸至35193677;
(11)QTL区域11,从染色体5的核苷酸36108847延伸至36272808;
(12)QTL区域12,从染色体5的核苷酸39210662延伸至39225076;
(13)QTL区域13,从染色体5的核苷酸39518005延伸至40469897;
(14)QTL区域14,从染色体5的核苷酸40535309延伸至40690150;
(15)QTL区域15,从染色体5的核苷酸40789706延伸至40983955;
(16)QTL区域16,从染色体5的核苷酸41001085延伸至41302446;
(17)QTL区域17,从染色体8的核苷酸3050807延伸至3241977;
(18)QTL区域18,从染色体8的核苷酸5354764延伸至5445890;
(19)QTL区域19,从染色体9的核苷酸29488933延伸至29602300;
(20)QTL区域20,从染色体11的核苷酸4797284延伸至5717606;或
(21)QTL区域21,从染色体15的核苷酸8611715延伸至8857914。
2.如权利要求1所述的方法,其中所述高产油量性状包括增加的油-干中果皮比。
3.如权利要求1或2所述的方法,其中所述油棕榈植物群体包括Nigerian dura xAVROS pisifera群体、Deli dura x AVROS pisifera群体或其组合。
4.如权利要求1、2或3所述的方法,其中:
所述油棕榈植物群体包括Nigerian dura x AVROS pisifera群体;
所述第一QTL对应于QTL区域2、3、8、10、13、14、16、17或18中的一个;并且
步骤(iii)进一步包括应用基因型模型,由此预测所述实验油棕榈植物的棕榈油产量。
5.如权利要求1、2或3所述的方法,其中:
所述油棕榈植物群体包括Nigerian dura x AVROS pisifera群体;
所述第一QTL对应于QTL区域3、8、10、13、15、16、17或18中的一个;并且
步骤(iii)进一步包括应用显性模型,由此预测所述实验油棕榈植物的所述棕榈油产量。
6.如权利要求1、2或3所述的方法,其中:
所述油棕榈植物群体包括Nigerian dura x AVROS pisifera群体;
所述第一QTL对应于QTL区域3、4、6、7、8、9、10、11、12、13、14、16、20或21中的一个;并且
步骤(iii)进一步包括应用隐性模型,由此预测所述实验油棕榈植物的所述棕榈油产量。
7.如权利要求1、2或3所述的方法,其中:
所述油棕榈植物群体包括Deli dura x AVROS pisifera群体;
所述第一QTL对应于QTL区域1、2、4、5、6、7、8、9、11、12、13、15、16、19、20或21中的一个;并且
步骤(iii)进一步包括应用基因型模型,由此预测所述实验油棕榈植物的所述棕榈油产量。
8.如权利要求1、2或3所述的方法,其中:
所述油棕榈植物群体包括Deli dura x AVROS pisifera群体;
所述第一QTL对应于QTL区域8、10或13中的一个;并且
步骤(iii)进一步包括应用显性模型,由此预测所述实验油棕榈植物的所述棕榈油产量。
9.如权利要求1、2或3所述的方法,其中:
所述油棕榈植物群体包括Deli dura x AVROS pisifera群体;
所述第一QTL对应于QTL区域1、2、4、5、6、7、8、9、11、12、13、15、16、19、20或21中的一个;并且
步骤(iii)进一步包括应用隐性模型,由此预测所述实验油棕榈植物的所述棕榈油产量。
10.如权利要求1-9中任一项所述的方法,其中所述实验油棕榈植物是tenera候选农业生产植物。
11.如权利要求1或2所述的方法,其中所述油棕榈植物群体包括Nigerian dura xNigerian dura群体、Nigerian dura x Deli dura群体、Deli dura x Deli dura群体、AVROS pisifera x AVROS tenera群体、AVROS tenera x AVROS tenera群体或其组合。
12.如权利要求1、2或11所述的方法,其中所述实验油棕榈植物是用于母本棕榈选择和繁殖的植物、用于基因渗入的母本棕榈选择和繁殖的植物、或用于花粉供体选择和繁殖的植物。
13.如权利要求1-12中任一项所述的方法,其中所述实验油棕榈植物是种子、幼苗、苗圃期植物、未成熟期植物、细胞培养植物、合子胚培养植物或体细胞组织培养植物。
14.如权利要求1-12中任一项所述的方法,其中所述实验油棕榈植物是生产期植物、成熟棕榈、成熟母本棕榈或成熟花粉供体。
15.如权利要求1-14中任一项所述的方法,其中:
步骤(i)进一步包括从所述实验油棕榈植物的所述样品确定所述实验油棕榈植物的至少第二SNP基因型,所述第二SNP基因型对应于第二SNP标记,所述第二SNP标记(a)位于用于所述高产油量性状的第二QTL中,并且(b)在分层和亲缘关系校正之后,以所述群体中至少4.0的全基因组-log10(p值)与所述高产油量性状相关联,或者相对于与所述第二SNP标记连锁的第二其他SNP标记具有至少0.2的连锁不平衡r2值,所述第二其他SNP标记在分层和亲缘关系校正之后,以所述群体中至少4.0的全基因组-log10(p值)与所述高产油量性状相关联;以及
步骤(ii)进一步包括将所述实验油棕榈植物的所述第二SNP基因型与在与所述群体相同遗传背景下指示所述高产油量性状的相应的第二参考SNP基因型进行比较,
其中所述第二QTL对应于QTL区域1至21中的一个,条件是所述第一QTL和所述第二QTL对应于不同的QTL区域。
16.如权利要求15所述的方法,其中步骤(iii)进一步包括基于所述实验油棕榈植物的第二SNP基因型与所述相应的第二参考SNP基因型的匹配程度来预测所述实验油棕榈植物的棕榈油产量。
17.如权利要求15或16所述的方法,其中:
步骤(i)进一步包括从所述实验油棕榈植物的样品确定所述实验油棕榈植物的至少第三SNP基因型至第二十一SNP基因型,所述第三SNP基因型至所述第二十一SNP基因型分别对应于第三SNP标记至第二十一SNP标记,所述第三SNP标记至所述第二十一SNP标记(a)分别位于用于所述高产油量形状的第三QTL至第二十一QTL中,并且(b)在分层和亲缘关系校正之后,以所述群体中至少4.0的全基因组-log10(p值)与所述高产油量性状相关联,或者分别相对于与所述第三SNP基因型至所述第二十一SNP基因型连锁的第三其他SNP标记至第二十一其他SNP标记具有至少0.2的连锁不平衡r2值,所述第三其他SNP标记至第二十一其他SNP标记在分层和亲缘关系校正之后,以所述群体中至少4.0的全基因组-log10(p值)与高产油量性状相关联;并且
步骤(ii)进一步包括将所述实验油棕榈植物的所述第三SNP基因型至所述第二十一SNP基因型分别与在与所述群体相同遗传背景下指示所述高产油量性状的相应的第三参考SNP基因型至相应的第二十一参考SNP基因型进行比较,
其中所述第三QTL至所述第二十一QTL各自对应于QTL区域1至21中的一个,条件是所述第一QTL至所述第二十一QTL各自对应于不同的QTL区域。
18.如权利要求17所述的方法,其中步骤(iii)进一步包括基于所述实验油棕榈植物的所述第三SNP基因型至所述第二十一SNP基因型分别与所述相应的第三参考SNP基因型至所述相应的第二十一参考SNP基因型的匹配程度来预测所述实验油棕榈植物的棕榈油产量。
19.一种选择高产棕榈油的油棕榈植物用于农业生产棕榈油的方法,所述方法包括以下步骤:
(a)根据权利要求1-18中任一项所述的方法预测实验油棕榈植物的棕榈油产量;以及
(b)如果基于步骤(a)预测所述实验油棕榈植物的所述棕榈油产量高于所述群体的平均值,则田间种植所述实验油棕榈植物用于农业生产棕榈油。
20.一种选择高产棕榈油的油棕榈植物用于在细胞培养物中培养的方法,所述方法包括以下步骤:
(a)根据权利要求1-18中任一项所述的方法来预测实验油棕榈植物的棕榈油产量;以及
(b)如果基于步骤(a)预测所述实验油棕榈植物的棕榈油产量高于所述群体的平均值,则使所述实验油棕榈植物的至少一个细胞在所述细胞培养物中培养。
21.一种选择亲本油棕榈植物用于育种以获得农业生产植物或改良的亲本油棕榈植物的方法,所述方法包括以下步骤:
(a)根据权利要求1-18中任一项所述的方法预测实验油棕榈植物的棕榈油产量;以及
(b)如果根据步骤(a)预测所述实验油棕榈植物的tenera后代的棕榈油产量比群体的平均值高,则选择所述实验油棕榈植物用于育种。
22.一种用于预测实验油棕榈植物的棕榈油产量的SNP检测试剂盒,所述试剂盒包括:
(i)至少21个核苷酸分子的组,其适用于从油棕榈植物的群体的实验油棕榈植物的样品中分别确定所述实验油棕榈植物的第一SNP基因型至第二十一SNP基因型,所述第一SNP基因型至所述第二十一SNP基因型分别对应于第一SNP标记至第二十一SNP标记,所述第一SNP标记至所述第二十一SNP标记(a)分别位于用于所述群体中高产油量性状的第一QTL至第二十一QTL中,并且(b)在分层和亲缘关系校正之后,以所述群体中至少4.0的全基因组-log10(p值)与所述高产油量性状相关联,或者分别相对于与所述第一SNP标记至所述第二十一SNP标记连锁的第一其他SNP标记至第二十一其他SNP标记具有至少0.2的连锁不平衡r2值,所述第一其他SNP标记至所述第二十一其他SNP标记在分层和亲缘关系校正之后,以所述群体中至少4.0的全基因组-log10(p值)与所述高产油量性状相关联;以及
(ii)所述群体的参考高产油的油棕榈植物的参考样品,
其中所述第一QTL至所述第二十一QTL为分别对应于以下的油棕榈染色体的区域:
(1)QTL区域1,从染色体1的核苷酸66542323延伸至66776312;
(2)QTL区域2,从染色体1的核苷酸66807385延伸至67299617;
(3)QTL区域3,从染色体2的核苷酸62277032延伸至62355782;
(4)QTL区域4,从染色体4的核苷酸31132787延伸至31173962;
(5)QTL区域5,从染色体5的核苷酸32863621延伸至32964104;
(6)QTL区域6,从染色体5的核苷酸33355931延伸至33509217;
(7)QTL区域7,从染色体5的核苷酸33658904延伸至34233352;
(8)QTL区域8,从染色体5的核苷酸34358119延伸至34997228;
(9)QTL区域9,从染色体5的核苷酸35004388延伸至35125743;
(10)QTL区域10,从染色体5的核苷酸35191678延伸至35193677;
(11)QTL区域11,从染色体5的核苷酸36108847延伸至36272808;
(12)QTL区域12,从染色体5的核苷酸39210662延伸至39225076;
(13)QTL区域13,从染色体5的核苷酸39518005延伸至40469897;
(14)QTL区域14,从染色体5的核苷酸40535309延伸至40690150;
(15)QTL区域15,从染色体5的核苷酸40789706延伸至40983955;
(16)QTL区域16,从染色体5的核苷酸41001085延伸至41302446;
(17)QTL区域17,从染色体8的核苷酸3050807延伸至3241977;
(18)QTL区域18,从染色体8的核苷酸5354764延伸至5445890;
(19)QTL区域19,从染色体9的核苷酸29488933延伸至29602300;
(20)QTL区域20,从染色体11的核苷酸4797284延伸至5717606;或
(21)QTL区域21,从染色体15的核苷酸8611715延伸至8857914。
23.如权利要求22所述的SNP检测试剂盒,进一步包括固体基板,所述核苷酸分子附接到所述固体基板。
24.如权利要求22或23所述的SNP检测试剂盒,其中所述核苷酸分子是寡核苷酸或多核苷酸。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
MYPI2015700516A MY187907A (en) | 2015-02-18 | 2015-02-18 | Methods and snp detection kits for predicting palm oil yield of a test oil palm plant |
MYPI2015700516 | 2015-02-18 | ||
PCT/MY2015/000061 WO2016133380A1 (en) | 2015-02-18 | 2015-07-16 | Methods and snp detection kits for predicting palm oil yield of a test oil palm plant |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107580631A true CN107580631A (zh) | 2018-01-12 |
CN107580631B CN107580631B (zh) | 2021-10-26 |
Family
ID=54186254
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201580078934.XA Active CN107580631B (zh) | 2015-02-18 | 2015-07-16 | 预测实验油棕榈植物棕榈油产量的方法和snp检测试剂盒 |
Country Status (6)
Country | Link |
---|---|
US (1) | US20180346997A1 (zh) |
EP (1) | EP3259367A1 (zh) |
CN (1) | CN107580631B (zh) |
MY (1) | MY187907A (zh) |
SG (1) | SG11201706773YA (zh) |
WO (1) | WO2016133380A1 (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108796095A (zh) * | 2018-07-03 | 2018-11-13 | 中国水产科学研究院黑龙江水产研究所 | 一种提高鲤饲料转化效率的选育方法 |
CN111986731A (zh) * | 2020-08-05 | 2020-11-24 | 广西大学 | 一种提高gwas致因突变定位效率的方法 |
CN113430297A (zh) * | 2021-07-23 | 2021-09-24 | 中国林业科学研究院亚热带林业研究所 | 与油茶种子油中软脂酸含量相关的dna片段、其紧密连锁的snp分子标记及其应用 |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
MY180695A (en) * | 2015-08-06 | 2020-12-07 | Sime Darby Plantation Intellectual Property Sdn Bhd | Methods for predicting palm oil yield of a test oil palm plant |
US20180305775A1 (en) * | 2015-10-23 | 2018-10-25 | Sime Darby Plantation Intellectual Property Sdn. Bhd. | Methods for predicting palm oil yield of a test oil palm plant |
MY186767A (en) * | 2015-12-30 | 2021-08-18 | Sime Darby Plantation Intellectual Property Sdn Bhd | Methods for predicting palm oil yield of a test oil palm plant |
CN117660687A (zh) * | 2023-12-13 | 2024-03-08 | 石家庄博瑞迪生物技术有限公司 | 高油花生全基因组分子标记组合、探针、基因芯片及应用 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015010008A1 (en) * | 2013-07-18 | 2015-01-22 | Malaysian Palm Oil Board | Detection methods for oil palm shell alleles |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
MY188470A (en) | 2013-02-21 | 2021-12-10 | Malaysian Palm Oil Board | Method for identification of molecular markers linked to height increment |
MY183021A (en) * | 2014-05-14 | 2021-02-05 | Acgt Sdn Bhd | Method of predicting or determining plant phenotypes |
-
2015
- 2015-02-18 MY MYPI2015700516A patent/MY187907A/en unknown
- 2015-07-16 EP EP15767604.0A patent/EP3259367A1/en not_active Withdrawn
- 2015-07-16 WO PCT/MY2015/000061 patent/WO2016133380A1/en active Application Filing
- 2015-07-16 SG SG11201706773YA patent/SG11201706773YA/en unknown
- 2015-07-16 US US15/552,190 patent/US20180346997A1/en not_active Abandoned
- 2015-07-16 CN CN201580078934.XA patent/CN107580631B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015010008A1 (en) * | 2013-07-18 | 2015-01-22 | Malaysian Palm Oil Board | Detection methods for oil palm shell alleles |
Non-Patent Citations (10)
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108796095A (zh) * | 2018-07-03 | 2018-11-13 | 中国水产科学研究院黑龙江水产研究所 | 一种提高鲤饲料转化效率的选育方法 |
CN111986731A (zh) * | 2020-08-05 | 2020-11-24 | 广西大学 | 一种提高gwas致因突变定位效率的方法 |
CN111986731B (zh) * | 2020-08-05 | 2023-08-11 | 广西大学 | 一种提高gwas致因突变定位效率的方法 |
CN113430297A (zh) * | 2021-07-23 | 2021-09-24 | 中国林业科学研究院亚热带林业研究所 | 与油茶种子油中软脂酸含量相关的dna片段、其紧密连锁的snp分子标记及其应用 |
CN113430297B (zh) * | 2021-07-23 | 2022-03-08 | 中国林业科学研究院亚热带林业研究所 | 与油茶种子油中软脂酸含量相关的dna片段、其紧密连锁的snp分子标记及其应用 |
Also Published As
Publication number | Publication date |
---|---|
SG11201706773YA (en) | 2017-09-28 |
MY187907A (en) | 2021-10-28 |
US20180346997A1 (en) | 2018-12-06 |
EP3259367A1 (en) | 2017-12-27 |
WO2016133380A1 (en) | 2016-08-25 |
CN107580631B (zh) | 2021-10-26 |
WO2016133380A8 (en) | 2016-11-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107580631A (zh) | 预测实验油棕榈植物棕榈油产量的方法和snp 检测试剂盒 | |
EP3561079B1 (en) | Soybean anti-pod-shattering major qtlqpd08-1, and mapping method and application thereof | |
CN109762921B (zh) | 用于检测黄瓜果肉颜色的snp标记及其应用 | |
CN112725462B (zh) | 基于全基因组测序筛选的与龙胜凤鸡体重、体尺相关的snp分子标记组合及应用 | |
CN111394508B (zh) | 一种与辣椒小果基因连锁的分子标记及应用 | |
CN115852032A (zh) | 与豇豆豆荚颜色相关的基因、kasp标记及其应用 | |
CN113736910B (zh) | 花生单株荚果数主效QTL位点qPN7的连锁分子标记及其应用 | |
CN108291265A (zh) | 用于预测实验油棕榈植物的棕榈油产量的方法 | |
CN113046462B (zh) | 与玉米穗长主效qtl紧密连锁的分子标记、引物及应用 | |
CN108004236B (zh) | 玉米茎腐病抗病分子育种方法及其应用 | |
CN112609017B (zh) | 检测水稻籽粒小粒形的分子标记及对应的基因和应用 | |
CN1474875A (zh) | 用于鉴定控制基因转录物和产物水平的调节基因座的基于作图的基因组开采方法 | |
CN106086007B (zh) | 与番茄紫黑色果实基因atv紧密连锁的分子标记及其应用 | |
CN113774043B (zh) | 一种控制水稻颖壳色彩性状的相关蛋白及其编码基因 | |
CN116121440A (zh) | 一种与芝麻金黄色籽粒主效qtl位点紧密连锁的分子标记及其应用 | |
CN110199871B (zh) | 一种高赖氨酸玉米自交系的选育方法 | |
CN112322756A (zh) | 一种与红鳍东方鲀生长性状相连锁的snp位点 | |
CN107177665A (zh) | 功能连锁标记0707-1及其在玉米种质改良中的应用 | |
CN108368555B (zh) | 用于预测实验油棕榈植物的棕榈油产量的方法 | |
CN113151573B (zh) | 芝麻籽粒圆度主效qtl位点、与qtl位点紧密连锁的分子标记、分子标记引物、应用 | |
Bessho-Uehara et al. | Exploring the Loci Responsible for Awn Development in Rice through Comparative Analysis of All AA Genome Species. Plants 2021, 10, 725 | |
JP3928044B2 (ja) | 麦類植物の受粉性の識別方法とその利用による麦類植物の改良方法 | |
Chen | Genetic Diversity and Adaptability Analysis of Wild Rice Germplasm Resources | |
West | Geography and genetics of ecological speciation in pea aphids | |
JP2005229850A (ja) | 千粒重に関与する遺伝子座に連鎖する遺伝マーカーおよびその利用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |