CN114606338A - 用于控制棕榈壳表型的mads-box域的等位基因 - Google Patents

用于控制棕榈壳表型的mads-box域的等位基因 Download PDF

Info

Publication number
CN114606338A
CN114606338A CN202210308694.XA CN202210308694A CN114606338A CN 114606338 A CN114606338 A CN 114606338A CN 202210308694 A CN202210308694 A CN 202210308694A CN 114606338 A CN114606338 A CN 114606338A
Authority
CN
China
Prior art keywords
shell
exon
nucleotide
allele
gene
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210308694.XA
Other languages
English (en)
Inventor
贾里德·奥德韦
拉金德·辛格
莱斯利·露·英格·狄
莱斯利·欧亿·成·李
梅丽娜·恩格·阿布杜拉
拉加耐度·诺凯亚
拉维葛德伟·撒班森姆尔什
安德鲁·范布伦特
穆罕默德·A·布迪曼
史蒂文·W·史密斯
南森·D·莱基
罗伯·马坦森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Palm Oil Research and Development Board
Original Assignee
Palm Oil Research and Development Board
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Palm Oil Research and Development Board filed Critical Palm Oil Research and Development Board
Publication of CN114606338A publication Critical patent/CN114606338A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H1/00Processes for modifying genotypes ; Plants characterised by associated natural traits
    • A01H1/04Processes of selection involving genotypic or phenotypic markers; Methods of using phenotypic markers for selection
    • A01H1/045Processes of selection involving genotypic or phenotypic markers; Methods of using phenotypic markers for selection using molecular markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • C12Q1/6895Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for plants, fungi or algae
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H5/00Angiosperms, i.e. flowering plants, characterised by their plant parts; Angiosperms characterised otherwise than by their botanic taxonomy
    • A01H5/08Fruits
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H5/00Angiosperms, i.e. flowering plants, characterised by their plant parts; Angiosperms characterised otherwise than by their botanic taxonomy
    • A01H5/10Seeds
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/415Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/13Plant traits
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A40/00Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
    • Y02A40/10Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture
    • Y02A40/146Genetically Modified [GMO] plants, e.g. transgenic plants

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Botany (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Analytical Chemistry (AREA)
  • Biophysics (AREA)
  • Biochemistry (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Environmental Sciences (AREA)
  • Developmental Biology & Embryology (AREA)
  • Microbiology (AREA)
  • Biomedical Technology (AREA)
  • Physiology (AREA)
  • Mycology (AREA)
  • Medicinal Chemistry (AREA)
  • Immunology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Cell Biology (AREA)
  • Plant Pathology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Measurement And Recording Of Electrical Phenomena And Electrical Characteristics Of The Living Body (AREA)
  • Peptides Or Proteins (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Electrical Control Of Ignition Timing (AREA)

Abstract

本发明公开了用于预测和控制棕榈的壳表型的核苷酸和多肽的序列。

Description

用于控制棕榈壳表型的MADS-BOX域的等位基因
本申请为申请号2016800475385、申请日2016年6月14日、发明名称“用于控制棕榈壳表型的MADS-BOX域的等位基因”的分案申请。
本申请要求于2015年6月15日提交的美国临时申请号62/180,042的优先权,由于各种目的其内容在此通过援引全部并入本文。
背景技术
油棕(非洲油棕和美洲油棕)根据其果实特性可分为不同的组,并且具有3种天然存在的果实类型,其壳厚度和油产量有所不同。Dura类型的棕榈是壳基因的野生型等位基因的纯合体(sh+/sh+),具有厚种皮或壳(2-8mm)并且每年每公顷生成约5.3吨油。Tenera类型的棕榈是壳基因的野生型和突变型等位基因的杂合体(sh+/sh-),具有由明显的纤维环包围的相对薄的壳,并且每年每公顷生成约7.4吨油。最后,pisifera类型的棕榈是壳基因的突变型等位基因的纯合体(sh-/sh-),没有种皮或壳,并且通常是雌性不育(Hartley,1988)(表1)。因此,控制壳表型的单基因的遗传机制是对棕榈油产量的主要影响因素。
Tenera棕榈是dura棕榈和pisifera棕榈之间的杂合体。Whitmore(1973)根据不同类的油棕描述了各种果实形式。但是,Latiff(2000)认同Purseglove(1972)由Whitmore(1973)提议的种类或栽培品种,在该物种中不具有严格意义。因此,Latiff(2000)提出术语“种类(race)”来区分dura、pisifera和tenera。种类被认为是反映稳定的小种的适当术语,其中不同的种类彼此能够交换基因,这已经在油棕的不同果实形式中得到充分证实(Latiff,2000)。事实上,这三种不同种类的特性证明是被单个基因的遗传机制简单控制。遗传研究表明壳基因显示共显性单基因遗传机制,这可用于育种项目(Beirnaert andVanderweyen,1941)。
在20世纪40年代比属刚果首次报道了负责该表型的壳(shell)基因(Beirnaert和Venderweyan,1941)。然而,在此之前非洲已经认识并充分利用了tenera果实形式(Devuyst,1953;Godding,1930;Sousa等人,2011)。鉴于壳基因所起的核心作用,使用北卡罗来纳州模型1玉米育种设计的母本(dura)和父本(pisifera)库利用相互轮回选拔法进行油棕育种(Rajanaidu等人,2000)。Deli dura种群,是种植在印度尼西亚茂物帕多瓦植物园(Bogor Botanical Garden)的四株原非洲棕榈的直系后代(1848),与AVROS(AlgemeneVereniging van Rubberplanters ter Oostkust van Sumatra)和其他pisifera父本棕榈具有良好的配合力。AVROS pisifera棕榈源自刚果著名的“Djongo”棕榈,但目前dura和pisifera的若干不同的新增品系也是源自非洲(Rajanaidu等人,2000)。
Tenera果实类型具有较高的中果皮/果实比例,这直接转化为比dura和pisifera棕榈明显更高的油产率(如表1所示)。
表1:Dura、tenera和pisifera果实形式的比较
Figure BDA0003564264360000021
*通常为雌性不育,花束过早腐烂
**纤维环存在于中果皮中并且通常用作区分dura和tenera棕榈的诊断工具。
(来源:Hardon等人,1985;Hartley,1988)
由于油棕育种项目的关键是生产具有较高油产量的种植原料,而tenera棕榈是商业种植的优先选择。出于这个原因,商业种子生产商在杂交种生产中投入大量资源来进行选自dura和pisifera棕榈的杂交。尽管在杂交油棕种子的生产中已经取得许多进展,但在种子生产过程中仍然存在两个重要问题。首先,产生高油产量的tenera棕榈的成批的tenera种子,往往被dura种子污染(Donough and Law,1995)。现今,据估计tenera种子中的dura污染可达到约5%的比例(由于质量控制措施改进的结果,从二十世纪90年代初高达20-30%下降)。种子污染的部分原因是,由于在开放的种植条件下,工人用梯子对高大树木进行人工授粉,并且其中一束指定的棕榈花的成熟需经历一段时间,使得难以在单个人工授粉事件中给花束中的所有花授粉,因此难以生产纯tenera种子。花束中的一些花可能在人工授粉之前已经成熟,因此可能有机会通过未知的树进行风媒授粉,从而在花束中产生污染的种子。或者在人工授粉时花束中可能存在未成熟的花,并且该未成熟的花可能在授粉发生后成熟,使得其可以通过未知的树进行风媒授粉,从而在花束中产生污染的种子。在描述本发明之前,不可能识别由种子产生的指定种子或指定植物的果实类型,除非其成熟到足以产生第一批果实,这通常在萌芽后耗费大约六年的时间。值得注意的是,在从发芽到果实生产的四到五年的间隔中,大量的土地、劳动力、资金和能源资源投入到被认为是tenera树的种植中,其中一些将最终成为不想要的低产量、污染的果实类型。等到识别这些不优选的树,将其从田中除去并用tenera树替换是不切实际的,因此在污染树的25-30年的生产寿命中获得较低的棕榈油产率。因此,批量的tenera种子被dura或pisifera种子污染的问题是油棕种植的难题,强调需要一种以高准确度预测种子和育苗的果实类型的方法。
种子生产过程中的第二个问题是种子生产商在维持dura或pisifera品系,以及在杂交种子生产过程中产生的其他费用的投资。通常,没有已知的生产具有最优壳表型的树的方法:当具有最优壳表型的树与其本身杂交或与另一具有最优壳表型的树杂交时会产生(将只产生)最优壳表型的种子。因此,为了最优壳表型有必要改造树的基因从一代到下一代繁殖纯种。还需要在杂交生成过程中,从所生产的任何污染的dura和/或pisifera植物来分离所预测的tenera植物(例如种子或仔苗)。同样地,需要从pisifera和/或tenera植物中分离所预测的tenera植物并根据dura和/或tenera植物预测pisifera植物以维持用于杂交生产的育种库。
Mayes等人最初试图攻克SHELL基因的遗传图谱(1997)。在巴西,使用群体分离分析法(BSA)和遗传图谱的结合的第二组,报道了两个随机扩增多态性DNA(RAPD)标记位于壳位点之侧(Moretzsohn等人,2000)。最近,Billotte等人(2005)报道了基于简单重复序列(SSR)的油棕的高密度连锁图谱,包括薄壳非洲油棕(tenera)棕榈和厚壳非洲油棕(dura)棕榈之间的杂交。马来西亚棕榈油委员会(MPOB)提交的专利申请描述了使用限制性片段技术的标记的识别,尤其是连接至用于植株识别和育种目的的壳基因的限制性片段长度多态性(RFLP)标记(RAJINDER SINGH,LESLIE OOI CHENG-LI,RAHIMAH A.RAHMAN AND LESLIELOW ENG TI.2008,用于连接至油棕的壳基因的分子标记的识别的方法,专利号PI20084563,专利于2008年11月13日提交)。通过产生或构建用于tenera果实类型棕榈的遗传图谱识别RFLP标记(SFB 83)。由MPOB提交的专利申请公开US 2013/024729和US 2015/0037793描述了SHELL基因的两个等位基因(shAVROS和shMPOB)的识别和通过检测SHELL基因的野生型和pisifera等位基因来预测果实形式表型的方法。
发明内容
本文描述了用于不同果实形式表型的SHELL基因的新型等位基因的识别和用于预测或测定棕榈植物(包括但不限于整株棕榈植物或棕榈种子)的壳表型的方法。所述SHELL基因是基本上类似于Arabidopsis SEEDSTICK(STK)的油棕MADS-box基因(也被称作AGAMOUS-like 11(AGL11))和Arabidopsis SHATTERPROOF(SHP1)(也被称作AGAMOUS-like1(AGL1))。
当在油棕中存在一个复制突变的等位基因和一个野生型等位基因时,之前已经识别出两个SHELL等位基因shMPOB和shAVROS任选一个可产生优选的tenera果实型。例如,包括野生型SHELL等位基因ShDeliDura的杂合油棕,在一个染色体和两个突变的SHELL等位基因之一上对另一染色体表现出tenera表型。
本文描述了在SHELL基因的外显子一处的9个额外突变体,称作SHELL等位基因三(3)、四(4)、五(5)、六(6)、七(7)、八(8)、九(9)、十(10)和十一(11)。由等位基因3-11产生的氨基酸序列分别如SEQ ID NOs:3-11所示。用于等位基因3-11的SHELL基因的外显子1的核苷酸序列分别如SEQ ID NOs:13-21所示。由于具有shMPOB和shAVRO等位基因,当与野生型等位基因或pisifera表型杂合时,当与另一非功能SHELL等位基因纯合或杂合时,这些存在的SHELL等位基因可产生tenera表型。
参看野生型SHELL(ShDeliDura)基因,等位基因3多态性是SHELL基因的外显子1的核苷酸位置67处由腺苷酸到胞嘧啶(A→C)的突变。等位基因3在SHELL的保守型MADS box域内产生由赖氨酸到谷氨酰胺的替代。如图1所示,SHELL的整个MADS box域由SHELL基因的外显子1编码。不同的氨基酸出现6个氨基酸的N-端对源自shMPOB等位基因的氨基酸替代,8个氨基酸的N-端对源自shAVROS等位基因的氨基酸替代,以及在外显子1的23位的翻译开放阅读框(图2和图3)。
同样地,等位基因4多态性是在SHELL基因的外显子1的核苷酸122位置处由胞嘧啶到腺苷酸(C→A)的突变。等位基因4在SHELL的保守型MADS box域内产生由丙氨酸到天冬氨酸的替代。在外显子1的翻译开放阅读框的41位置处出现不同氨基酸(图2和图3)。
等位基因5多态性是在SHELL基因的外显子1的核苷酸位置69处的由腺苷酸到胸腺嘧啶(A→T)的突变。等位基因5导致在外显子1的翻译开放阅读框的位置23处由赖氨酸到天冬酰胺的突变(图2和图3)。等位基因6多样性是SHELL基因的外显子1的位置34处由鸟苷到胞嘧啶(G→C)的突变。等位基因6导致在外显子1的翻译开放阅读框的位置12处由谷氨酸到谷氨酰胺的突变(图2和图3)。等位基因7多样性是SHELL基因的外显子1的位置23-37处缺失15个核苷酸(或者核苷酸22-36,因为缺口的对齐是模糊不清的)。等位基因7在外显子1的翻译开放阅读框的位置8-12处产生5个氨基酸的框架缺失(图2和图3)。SHELL基因的氨基酸位置8-12处由核苷酸22-36编码。等位基因8多样性是SHELL基因的外显子1的位置71处由鸟苷到腺苷(G→A)的突变。等位基因8导致在外显子1的翻译开放阅读框的位置24处由精氨酸到组氨酸的突变(图2和图3)。
等位基因9多样性是在SHELL基因的外显子1的位置70处由胞嘧啶到鸟苷(C→G)的突变。等位基因9在外显子1的反应开放阅读框的位置24处发生精氨酸到甘氨酸的突变。等位基因10多样性是在SHELL基因的外显子1的位置110处由胸腺嘧啶到腺苷(T→A)的突变。等位基因10导致在外显子1的翻译开放阅读框的位置37处由缬氨酸到天冬氨酸的突变(图2和图3)。
等位基因11多样性是在SHELL基因的外显子1的位置114处由胸腺嘧啶到胞嘧啶(T→C)的突变。等位基因11是其中不会影响产生SHELL基因产物的氨基酸序列的沉默突变(图2和图3)。可检测该突变来证实或预测存在或不存在野生型SHELL基因产物,并因此当棕榈植物中的纯合体或杂合体具有另一野生型等位基因时预测dura表型,并当杂合体具有不活跃的SHELL等位基因时预测tenera表型。或者,在一些实施方案中,该突变可影响SHELL基因的基因表达和/或转录或翻译规则。根据这些实施方案,当在棕榈植物中纯合体或杂合体具有不活跃的SHELL等位基因时可用pisifera关联突变,或者当杂合体具有野生型等位基因时用tenera关联突变。
本文还描述了已发现在具有等位基因3突变的油棕植物的子集中的SHELL基因的内含子1的突变。在本文中该突变被称作等位基因12并如SEQ ID NO:12所示。该突变导致在野生型SHELL(ShDeliDura)基因的内含子1的位置43-46处的四个核苷酸的缺失。该突变是因为其本身对存在或不存在的SHELL果实形式表型(例如dura、tenera或pisifera)的贡献可能是沉默的。然而,由于在内含子1突变和外显子1之间密切的物理距离(即遗传连锁),已知父本种质对在外显子1和内含子1标记内具有特定SHELL等位基因(野生型或突变体)的贡献通过检测等位基因12突变而不是突变的外显子1可追踪后代具有高度置信度。此外,在一些情况下,内含子1的突变可能与外显子1连接不均衡或者是其一部分。或者,等位基因12可能改变转录调控或剪接,因此当纯合体或tenera表型、杂合体具有野生型SHELL等位基因时表现出pisiferaSHELL表型。
核蛋白,例如转录因子,必需积极地转录并保留在待功能化的核内。核定位机理包括在核蛋白中将核定位蛋白信号结合至细胞质中的输入蛋白α和输入蛋白β的子单位。输入蛋白α结合至核定位信号(NLS),而输入蛋白B与输入蛋白α以及核孔相互作用。在植物MADSbox蛋白中,突出的NLS氨基酸基序是KR[K或R]X4KK(SEQ ID NO:29),其中X可以是任何氨基酸(Gramzow和Theissen,2010)。SHELL MADS box域包括在氨基酸23-31处的这种基序(KRRNGLLKK;SEQ ID NO:30)。MADS box蛋白可能还具有包括附加上游氨基酸的二分NLS。一个实例是矮牵牛属FLORAL BINDINGPROTEIN 11(FBP 11)的二分NLS,其包括序列
Figure BDA0003564264360000051
该二分NLS由NLS氨基酸(下划线)以及保守型碱性氨基酸(斜体)组成,所有这些有助于核定位机理(Immink等人,2002)。
SHELL MADS box域包括非常类似的二分NLS,该二分NLS包括氨基酸3、5,9-10和21-31
Figure BDA0003564264360000052
(图2和图3)。值得注意的是,十个序列变化导致本文报道的氨基酸取代或缺失(shAVROS,shMPOB,和等位基因3-10),六个替代,这些高保守型NLS氨基酸(shAVROS,shMPOB,等位基因3、等位基因5、等位基因7、等位基因8和等位基因9)中的一个或多个在突出的NLS内的可变位置处引入脯氨酸取代,这可预期显著改变NLS域内的蛋白质的二级结构(图2和图3)。这些发现表明赋予pisifera(当纯合体或杂合体具有另一非功能性SHELL等位基因时)或tenera(当杂合体具有野生型SHELL等位基因时)表型的普通机理可能降低或预防SHELL蛋白与其他MADS box转录因子的非功能性SHELL蛋白或二聚体的核定位。因此,很可能任一个保守型NLS氨基酸(图2和图3的框内),或者破坏SHELL NLS功能的任何突变可能与pisifera或tenera表型有关。
因此一方面,提供用于测定或预测棕榈(例如油棕)植物(包括但不限于整株棕榈植物或棕榈种子)的壳表型的方法。在一些实施方案中,所述方法包括,提供来自植物或种子的样品;和测定样品的SHELL基因的外显子1位置处的多态标记的基因型,所述SHELL基因选自以下核苷酸:
(i)7、8、9、13、14、15、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、87、88、89、90、91、92、109、110、111、114、121、122和123;
(ii)23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、67、69、70、71、110、114和122;或者
(iii)7-9、13-15、25-30、61-75和88-92。在一些情况下,用于pisifera和dura等位基因的一个或多个多态标记的杂合度预测tenera壳表型的存在。在一些情况下,用于一个或多个多态标记所预测的pisifera等位基因的基因型的杂合度预测pisifera壳表型的存在。在一些情况下,多态标记的基因型可包括如SEQ ID NOs:13-21所示的一个或多个所预测的pisifera等位基因的基因型。
在一些情况下,当野生型SHELL(ShDeliDura)基因的纯合体或杂合体具有不同突变时,对于在一个或多个核苷酸位置处导致氨基酸替代(例如非保守型替代)、缺失、插入或移码的野生型SHELL(ShDeliDura)基因的突变可预测pisifera壳表型,当杂合体具有野生型等位基因时可预测tenera表型。例如,当杂合体具有产生非功能性SHELL基因的不同突变时,在一个或多个核苷酸位置处导致氨基酸替代(例如非保守型替代)、缺失、插入或移码的野生型SHELL(ShDeliDura)基因的突变可预测pisifera表型,例如导致不同取代的突变(例如非保守型取代)、缺失、插入或移码。
在一些实施方案中,多态标记的基因型包括一个或多个核苷酸的缺失或突变,所述核苷酸是选自以下的核苷酸:(i)SHELL基因的外显子1的22、23、24、25、26、27、28、29、30、31、32、33、34、35、36和37;(ii)22、23、24、25、26、27、28、29、30、31、32、33、34、35和36;或(iii)23、24、25、26、27、28、29、30、31、32、33、34、35、36和37。在一些实施方案中,所述多态标记的基因型包括SHELL基因的外显子1的一个或多个、或者所有核苷酸23-37(或者22-36)的缺失。在一些实施方案中,多态标记的基因型包括SHELL基因的外显子1的核苷酸34的突变(例如相对于ShDeliDura的突变)。在一些实施方案中,所述突变包括错义(如非保守性替换)、无义、插入、缺失或移码突变。在一些实施方案中,多态标记的基因型包括SHELL基因的外显子1的核苷酸34处的胞嘧啶(C)。
在一些实施方案中,多态标记的基因型包括SHELL基因的外显子1的核苷酸67的突变(例如相对于ShDeliDura的突变)。在一些实施方案中,所述突变包括错义(如非保守性替代)、无义、插入、缺失或移码突变。在一些实施方案中,多态标记的基因型包括SHELL基因的外显子1的核苷酸67处的胞嘧啶(C)。在一些实施方案中,多态标记的基因型包括SHELL基因的外显子1的核苷酸69的突变(例如相对于ShDeliDura的突变)。在一些实施方案中,所述突变包括错义(如非保守性替代)、无义、插入、缺失或移码突变。在一些实施方案中,多态标记的基因型包括SHELL基因的外显子1的核苷酸69处的胸腺嘧啶(T)。
在一些实施方案中,多态标记的基因型包括SHELL基因的外显子1的核苷酸70的突变(例如相对于ShDeliDura的突变)。在一些实施方案中,所述突变包括错义(如非保守性替代)、无义、插入、缺失或移码突变。在一些实施方案中,多态标记的基因型包括SHELL基因的外显子1的核苷酸70处的鸟苷(G)。在一些实施方案中,多态标记的基因型包括SHELL基因的外显子1的核苷酸71的突变(例如相对于ShDeliDura的突变)。在一些实施方案中,所述突变包括错义(如非保守性替代)、无义、插入、缺失或移码突变。在一些实施方案中,多态标记的基因型包括SHELL基因的外显子1的核苷酸71处的腺苷(A)。在一些实施方案中,多态标记的基因型包括SHELL基因的外显子1的核苷酸110的突变(例如相对于ShDeliDura的突变)。在一些实施方案中,所述突变包括错义(如非保守性替代)、无义、插入、缺失或移码突变。在一些实施方案中,多态标记的基因型包括SHELL基因的外显子1的核苷酸110处的腺苷(A)。
在一些实施方案中,多态标记的基因型包括SHELL基因的外显子1的核苷酸114的突变(例如相对于ShDeliDura的突变)。在一些实施方案中,所述突变包括错义(如非保守性替代)、无义、插入、缺失或移码突变。在一些实施方案中,多态标记的基因型包括SHELL基因的外显子1的核苷酸114处的胞嘧啶(C)。在一些实施方案中,多态标记的基因型包括SHELL基因的外显子1的核苷酸122的突变(例如相对于ShDeliDura的突变)。在一些实施方案中,所述突变包括错义(如非保守性替代)、无义、插入、缺失或移码突变。在一些实施方案中,多态标记的基因型包括SHELL基因的外显子1的核苷酸122处的腺苷(A)。
在前述任一个实施方案中,所述方法可包括,提供来自植物或种子的样品;和测定样品的SHELL基因的外显子1位置处的多态标记的基因型,所述SHELL基因选自以下核苷酸:
(i)22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、87、88、89、90、91、92、110、114和122;
(ii)23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、67、69、70、71、110、114和122;或者
(iii)67、69、70和71。在一些情况下,用于pisifera和dura等位基因的一个或多个多态标记的杂合度预测tenera壳表型的存在。在一些情况下,用于一个或多个多态标记所预测的pisifera等位基因的基因型的杂合度预测pisifera壳表型的存在。在一些情况下,用于首先预测一种或多种多态标记的pisifera等位基因的基因型和再次预测一种或多种多态标记的pisifera等位基因的杂合度来预测pisifera壳表型的存在。在一些情况下,多态标记的基因型可包括如SEQ ID NOs:13、15、17、18和19所示的一个或多个所预测的pisifera等位基因的基因型。
在一些实施方案中,所述方法包括,提供来自植物或种子的样品;和测定样品的SHELL基因的内含子1位置处的多态标记的基因型,所述SHELL基因选自核苷酸43、44、45和46。在一些情况下,用于pisifera和dura等位基因的一个或多个多态标记的杂合度预测tenera壳表型的存在。在一些情况下,用于一个或多个多态标记所预测的pisifera等位基因的基因型的杂合度预测pisifera壳表型的存在。在一些情况下,用于首先预测一种或多种多态标记的pisifera等位基因的基因型和再次预测一种或多种多态标记的pisifera等位基因的杂合度来预测pisifera壳表型的存在。在一些情况下,多态标记的基因型可包括如SEQ ID NO:12所示的内含子1的核苷酸的一个或多个,或全部缺失。
在一些实施方案中,所述方法包括,提供来自植物或种子的样品;和检测样品的编码SHELL基因产物中的一个或多个氨基酸位置处突变的多态标记的基因型,所述氨基酸位置选自3、5、8、9、10、11、12、21、22、23、24、25、26、27、28、30、37和41,选自氨基酸位置3、5、8、9、10、11、12、21、22、23、24、25、26、27、28、30、31、37和41,选自氨基酸位置8、9、10、11、12、23、24、37和41,或者选自氨基酸位置8、9、10、11、12、23、24、31、37和41。在一些情况下,多态标记的基因型包括野生型SHELL基因产物的氨基酸位置8-12处的一个或多个,或者全部缺失。在一些情况下,用于pisifera和dura等位基因的一个或多个多态标记的杂合度预测tenera壳表型的存在。在一些情况下,用于一个或多个多态标记所预测的pisifera等位基因的基因型的杂合度预测pisifera壳表型的存在。在一些情况下,用于一种或多种多态标记首先预测的pisifera等位基因的基因型和用于一种或多种多态标记再次预测的pisifera等位基因的杂合度来预测pisifera壳表型的存在。在一些情况下,多态标记的基因型可包括如SEQ ID NOs:3-10所示的一种或多种所预测的pisifera等位基因SHELL基因产物,或者如SEQ ID NOs:3、5、7、8和9所示的一种或多种所预测的pisifera等位基因SHELL基因产物。
在一些实施方案中,多态标记的基因型包括与野生型SHELL基因产物相比较的氨基酸位置23处的突变。在一些情况下,所述突变包括杂氨基酸位置23处赖氨酸到谷氨酰胺的突变或者赖氨酸到天冬氨酸的突变。在一些实施方案中,多态标记的基因型包括与野生型SHELL基因产物相比较的氨基酸位置24处的突变。在一些情况下,所述突变包括在氨基酸24处的精氨酸到组氨酸的突变或者精氨酸到甘氨酸的突变。在一些实施方案中,多态标记的基因型包括野生型SHELL基因产物的氨基酸位置37处的突变。在一些情况下,所述突变包括氨基酸37的缬氨酸到天冬氨酸的突变。在一些实施方案中,多态标记的基因型包括野生型SHELL基因产物的氨基酸位置41处的突变。在一些情况下,所述突变包括氨基酸41的丙氨酸到天冬氨酸的突变。
在一些实施方案中,所述方法包括,提供植物或种子样品;和检测样品中编码SHELL基因产物的核定位信号(NLS)位置处的SHELL基因产物突变的多态标记的基因型,其中NLS位置处的突变包括选自SHELL基因产物的氨基酸位置3、5、9、10、21、22、23、24、25、26、27、28和30;或氨基酸位置23、24、25、26、27、28和30的氨基酸位置突变。在一些情况下,所述突变位于选自SHELL基因产物的氨基酸位置23和24处的氨基酸位置。在一些情况下,位于氨基酸位置23处的突变包括赖氨酸到谷氨酰胺的突变。在一些情况下,位于氨基酸位置23处的突变包括赖氨酸到天冬氨酸的突变。在一些情况下,位于氨基酸位置24处的突变包括精氨酸到组氨酸的突变。在一些情况下,位于氨基酸位置24处的突变包括精氨酸到甘氨酸的突变。
在一些实施方案中,所述植物或种子产自:i)具有dura壳表型的植物和具有pisifera壳表型的植物之间的杂交,ii)tenera棕榈自交,iii)具有tenera壳表型的两个植物之间的杂交,iv)具有dura壳表型的植物和具有tenera壳表型的植物之间的杂交,或者v)具有tenera壳表型的植物和具有pisifera壳表型的植物之间的杂交。在一些实施方案中,所述植物的年龄小于5年。在一些实施方案中,所述植物的年龄小于1年。在一些实施方案中,多态标记预测,或者预测至少86%、88%、90%、92%、94%、96%、97%、98%或99%的tenera表型。
在一些实施方案中,如果所述植物是用于多态标记的杂合体(例如用于预测tenera表型的dura和pisifera标记的杂合体),则所述方法还包括选择所述种子或植物用于栽培。在一些实施方案中,如果所述植物是用于多态标记的纯合体(例如表示dura或pisifera表型),则所述方法还包括选择种子或植物用于栽培。在一些实施方案中,如果所述植物或种子不具有所预测的tenera壳表型的基因型,例如如果所述植物或种子具有所预测的pisifera表型的基因型或具有所预测的dura表型的基因型,则将该植物或种子丢弃、储存(例如与tenera植物或种子分别储存)或栽培(例如与tenera植物或种子分别栽培)。
还提供一种基于所预测的壳表型将多个棕榈(例如油棕)植物分类成不同类别的方法。在一些实施方案中,所述方法包括,提供来自植物或种子的样品;和测定样品的SHELL基因的外显子1位置处的至少一个多态标记的基因型,所述SHELL基因选自:(i)核苷酸7、8、9、13、14、15、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、87、88、89、90、91、92、109、110、111、114、121、122和123;(ii)核苷酸23、24、25、26、27、28、29、30、31、32、33、34、35、36和37;(iii)核苷酸34;(iv)核苷酸67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、87、88、89、90、91和92;(v)核苷酸67、69、70和71;(vi)核苷酸67;(vii)核苷酸69;(viii)核苷酸70;(ix)核苷酸71;(x)核苷酸110;(xi)核苷酸114;或者(xii)核苷酸122;并基于多态标记的基因型将所述植物分组,其中所述组对应预测具有tenera壳表型的植物、预测具有dura壳表型的植物,以及预测具有pisifera壳表型的植物。
还提供用于测定棕榈种子或植物的壳表型的试剂盒。在一些实施方案中,所述试剂盒包括,一条或多条寡核苷酸引物或探针,所述寡核苷酸引物或探针独立地包括:
SEQ ID NO:27的至少如6、7、8、9、10、11、12、13、14、15、16、17或18(或者20、22、24、30或更多)个连续核苷酸;或者
与SEQ ID NO:27100%互补的至少如6、7、8、9、10、11、12、13、14、15、16、17或18(或者20、22、24、30或更多)个连续核苷酸,
其中一条或多条引物或探针独立地与选自在以下SHELL基因的外显子1位置内或位置内约5,000;2,500;1,000;750;500;250;200;150;100;75;50;25或1bp杂交:
(i)核苷酸7、8、9、13、14、15、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、87、88、89、90、91、92、109、110、111、114、121、122和123;
(ii)核苷酸23、24、25、26、27、28、29、30、31、32、33、34、35、36和37;
(iii)核苷酸34;
(iv)核苷酸67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、87、88、89、90、91和92;
(v)核苷酸67、69、70和71;
(vi)核苷酸67;
(vi)核苷酸69;
(vi)核苷酸70;
(ix)核苷酸71;
(x)核苷酸110;
(xi)核苷酸114;或者
(xii)核苷酸122。
在一些实施方案中,所述一条或多条引物或探针独立地与邻接、或含有,选自前述核苷酸(i)-(xii)中的一种或多种的SHELL基因的外显子1位置的序列杂交。
在一些实施方案中,所述一条或多条引物或探针与棕榈植物的DNA或RNA特定杂交。
在一些实施方案中,可检测的标签连接(例如共价连接)寡核苷酸。在一些实施方案中,可检测标签是荧光。
在一些实施方案中,所述试剂盒还包括编码多肽的多聚核苷酸,所述多肽包括与SEQ ID NOs:13、14、15、16、17、18、19、20或21的至少9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50连续核苷酸基本上相同(例如至少80%、85%、90%、95%、97%、98%、99%)或相同的序列,其中所述多聚核苷酸包括如SEQ ID NOs:13、14、15、16、17、18、19、20或21所示的相对于野生型shAVROS或shMPOBSHELL的突变。
还提供一种分离核苷酸,其包括编码多肽的多聚核苷酸,所述多肽包括与SEQ IDNOs:3、4、5、6、7、8、9、10或11的至少3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50连续氨基酸基本上相同(例如至少80%、85%、90%、95%、97%、98%、99%)或相同的序列,其中所述多聚核苷酸包括如SEQ ID NOs:13、14、15、16、17、18、19、20或21所示的相对于野生型shAVROS或shMPOBSHELL的突变。
还提供一种细胞或种子或植物,其包括异源表达盒,所述表达盒包括操作性连接编码多肽的多聚核苷酸的异源启动子,所述多肽包括与SEQ ID NOs:3、4、5、6、7、8、9、10或11基本上相同(例如至少80%、85%、90%、95%、97%、98%、99%)或相同的序列,其中所述多聚核苷酸包括如SEQ ID NO:13、14、15、16、17、18、19或20所示的相对于野生型shAVROS和shMPOB的SHELL突变。在一些实施方案中,所述种子或植物是棕榈(例如油棕)种子或棕榈(例如油棕)植物。在一些实施方案中,所述多肽包括氨基酸序列SEQ ID NOs:3、4、5、6、7、8、9、10或11。在一些实施方案中,所述异源启动子产生的编码种子或植物中的多肽的表达水平低于、等于或超过种子或植物中的内源性SHELL RNA的表达。在一些实施方案中,所述种子或植物包括内源性SHELL基因的两种dura等位基因。在一些实施方案中,所述种子或植物所产生的果实的成熟壳平均小于2mm厚,小于3mm厚,或介于0.5-3mm厚。
还提供一种细胞、种子或植物,其包括异源性表达盒,所述表达盒包括操作性连接多聚核苷酸的启动子,所述多聚核苷酸具有SEQ ID NOs:13、14、15、16、17、18、19、20或21的至少15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50连续核苷酸,或其互补,当在种子或植物中表达时,其中所述多聚核苷酸降低种子或植物中的内源性SHELL多肽的表达(相对于没有表达盒的对照植物),其中SHELL多肽的降低表达导致由改植物产生的其他种子的壳厚度的降低。在一些实施方案中,所述多聚核苷酸编码siRNA、反义多聚核苷酸、微RNA,或者正义抑制核酸,从而抑制内源性SHELL基因的表达。在一些实施方案中,所述种子或植物使成熟壳平均小于2mm厚,小于约3mm厚,或介于0.5-3mm厚。
还提供一种制造如上所述或本文所述的植物的方法,其包括将表达盒导入植物中。
还提供一种栽培如本文所述的植物的方法。
通过阅读本公开内容的其他内容显然可获得本发明的其他实施方案。
定义
“壳表型”是指三种果实形式非洲油棕(E.guineensis)-dura、tenera和pisifera。Dura(野生型)果实形式示例为所存在的壳厚度平均为至少2-8mm并且通常在具有纯合的野生型SHELL基因型的棕榈植物中发现。pisifera果实形式示例为没有壳并且通常在没有功能SHELL基因的棕榈植物中发现。例如,pisifera棕榈植物可具有两个非功能SHELL基因(例如用于非功能SHELL基因型的纯合体或用于两个不同非功能SHELL基因型的杂合体)。Tenera果实形式示例为存在的薄壳平均厚度小于约3mm(例如约0.5-3mm)并且通常在棕榈植物中发现,所述棕榈植物是用于功能和非功能SHELL基因的杂合体。过表达或低表达SHELL基因或基因产物或部分地或完全干涉内源性SHELL基因产物的活性的异源棕榈植物还可表现出dura、tenera或pisifera果实形式表型。
“多态标记”是指区别两种等位基因的遗传标记。多态标记可以是核苷酸替换、插入、缺失或重排,或它们的组合。
在本文中,“检测基因型”是指:(i)通过进行测序、杂交、聚合,或者序列特异性内切酶消化反应,或者通过检测核酸或其部分的质量来分析核酸以测定基因型;或者(ii)通过进行测序、检测(例如ELISA),或者序列特异性内切酶消化反应,或者通过检测多肽或其部分的质量,分析由核酸编码的多肽或其部分。
在本文中,术语“核酸”、“多聚核苷酸”以及“寡聚核苷酸”是指核酸区域、核酸片段、引物、探针、扩增子和低聚物片段。该术语不限于其长度,并且一般是多脱氧核糖核苷酸(含有2-脱氧-D-核糖)、多核糖核苷酸(含有D-核糖)的线性聚合物,以及嘌呤或嘧啶碱,或者改性嘌呤或嘧啶碱的任何其他N-糖苷。这些术语包括双链DNA和单链DNA,以及双链RNA和单链RNA。
核酸、多聚核苷酸或寡核苷酸可包括,例如磷酸二酯键或修饰的键,包括但不限于磷酸三酯,氨基磷酸酯,硅氧烷,碳酸酯,羧甲基酯,乙酰胺酸,氨基甲酸酯,硫醚,桥接的氨基磷酸酯,桥接的亚甲基膦酸酯,硫代磷酸酯,甲基膦酸酯,二硫代磷酸酯,桥接的硫代磷酸酯或砜键,以及这些键的组合。
核酸、多聚核苷酸或寡核苷酸可包括五种生物学上存在的碱基(腺嘌呤、鸟嘌呤、胸腺嘧啶、胞嘧啶和尿嘧啶)和/或除了这五种生物学上存在的碱基之外的碱基。
可通过Smith和Waterman Add.APL.Math.2:482(1981)的局部同源性算法,通过Needle man和Wunsch J.Mol.Biol.48:443(1970)的同源比对算法,通过Pearson和LipmanProc.Natl.Acad.Sci.(U.S.A.)85:2444(1988)的搜索相似性方法,通过这些算法(GAP,BESTFIT,BLAST,FASTA,and TFASTA in the Wisconsin Genetics Software Package,Genetics Computer Group(GCG),575Science Dr.,Madison,WI)的计算机运行或通过目测对比比较各序列进行最优比对。
“序列一致性百分比”是通过比较窗口比较两条最优比对序列来确定,其中在两条序列的最优比对中,相对于参考序列(其不包含插入或缺失),在比较窗口中的多聚核苷酸序列的部分可以包含插入或缺失(即间隙)。通过确定在相同的核酸碱基或氨基酸残基出现在两条序列中的位置数以获得匹配的位置数,将匹配的位置数除以在比较窗口中的位置总数并将结果乘以100,以得出序列一致性百分比。
多肽序列的术语“基本一致”是指包括具有至少75%序列一致性的序列的多肽。或者,百分比一致性可以是从75%到100%的任意整数。使用本文描述的程序与参照序列对比,优选使用如下文描述的标准或缺省参数的BLAST,示例性的实施方案包括至少:75%、80%、85%、90%、95%或99%。本领域技术人员承认这些值可适当调整,通过考虑密码子简并性、氨基酸相似性、阅读框位置等来测定由两条核苷酸序列编码的蛋白质的相对应的一致性。除了不一致的残基位置可能因保守性氨基酸变化而不同,“基本上相似”的多肽共享如上文所述的序列。保守性氨基酸替换是指具有相似侧链的残基的可互换性。例如,具有脂肪族侧链的氨基酸为甘氨酸、丙氨酸、缬氨酸、亮氨酸和异亮氨酸;具有脂肪族-羟基侧链的氨基酸为丝氨酸和苏氨酸;具有含酰胺侧链的氨基酸为天冬氨酸和谷氨酰胺;具有芳族侧链的氨基酸为苯丙氨酸、酪氨酸和色氨酸;具有碱基侧链的氨基酸为赖氨酸、精氨酸和组氨酸;具有酸性侧链的氨基酸为天冬酰胺和谷氨基酸;和具有含硫侧链的氨基酸为半胱氨酸和甲硫氨酸。优选的保守性氨基酸替代为:缬氨酸-亮氨酸-异亮氨酸,苯丙氨酸-酪氨酸,赖氨酸-精氨酸,丙氨酸-缬氨酸,天冬氨酸-谷氨酸,和天冬酰胺-谷氨酰胺。
核苷酸序列基本上一致的一个迹象是,两个分子在严格条件下是否彼此杂交,或与第三条核酸杂交。严格条件依赖于序列并且在不同情况下不同。通常,严格条件选定为在指定的离子强度和pH下比特异序列的热熔点(Tm)低约5℃。Tm是50%的靶序列与完全匹配的探针杂交时的温度(在指定离子强度和pH下)。通常,严格条件是那些其中在pH 7和温度为至少约60℃下的盐浓度为约0.02摩尔的条件。
术语“启动子”或“调节元件”是指位于转录起始上游或下游并涉及RNA聚合酶和其他蛋白质的识别和结合以启动转录的区域或序列决定因子。启动子不必是植物来源的,例如可以使用源自植物病毒的启动子,例如CaMV35S启动子。
术语“植物”包括整株植物,枝条,营养器官/结构(例如叶子、茎和块茎),根,花和花器官/结构(例如苞片、萼片、花瓣、雄蕊、心皮、花药和胚珠),种子(包括胚、胚乳和种皮)和果实(成熟的子房),植物组织(例如维管组织、种子组织、基本组织等)和细胞(例如保卫细胞、卵细胞、毛状体等)及其后代。可在本发明的方法中使用的植物的种类通常是指可广泛适合于转化技术的高等和低等植物种类,包括被子植物(单子叶植物和双子叶植物),裸子植物、蕨类植物和多细胞植物。包括各种倍体数的植物,包括非整倍体、多倍体、二倍体、单倍体和半合子。在一个示例性实施方案中,所述植物是油棕植物(非洲油棕或美洲油棕或其杂交种)。在一些情况下,所述植物是非洲油棕。
“表达盒”是指核酸构建体,当将其导入宿主细胞时,分别导致RNA或多肽的转录和/或翻译。没有或不能翻译的反义构建体或正义构建体被明确地包含在这个定义中。表达盒可含有异源启动子。
术语“可操作性连接”是指核酸表达控制序列(例如启动子,或转录因子结合位点的阵列)和第二核酸序列之间的功能性连接,其中所述表达控制序列指导对应第二序列的核酸的转录。
如果多聚核苷酸序列或氨基酸序列来自外来物种,或者如果来自相同物种,是从其原始形式改性的,则该多聚核苷酸序列或氨基酸序列对生物体或第二多聚核苷酸序列是“异源的”。例如,可操作性连接到编码序列的异源启动子是指来自与衍生编码序列不同的物种的启动子,或者如果来自相同物种,是与任何天然存在的等位基因变体不同的启动子。
在本文中,术语“核苷酸位置”等,在语境SHELL基因的外显子1的核苷酸位置是指相对于野生型SHELL基因起始因子(例如氨基端基)蛋氨酸三联密码子(“ATG”)的腺苷的核苷酸位置。因此,例如核苷酸位置1是指野生型SHELL基因的ATG起始因子蛋氨酸三联密码子的腺苷;和位置2是指下一个核苷酸(即ATG起始因子蛋氨酸三联密码子的“T”),诸如此类。同样地,在语境SHELL基因的内含子1的核苷酸位置,术语“核苷酸位置”等是指相对于野生型SHELL基因的内含子1的第一个核苷酸的核苷酸位置。因此,SHELL基因的内含子1的第一个核苷酸位于位置1,第二位于位置2,诸如此类。
同样地,在语境SHELL基因的特定氨基酸、或氨基酸组中的术语“氨基酸位置”是指相对于SHELL基因的起始因子(即氨基端基)蛋氨酸的氨基酸位置。因此,例如氨基酸位置1是指氨基端基蛋氨酸,氨基酸位置2是指野生型SHELL的邻接甘氨酸,或者在相同位置发现的突变SHELL等位基因的替换氨基酸或缺失。需要注意的是,这些位置独立于任何N-端基降解或共轭或其他翻译后加工。例如,在SHELL多肽中,其中N-端基蛋氨酸氨基酸翻译后被除去,位置2仍然是指之前的邻接甘氨酸氨基酸,和位置3是指野生型SHELL的邻接精氨酸氨基酸或者在相同位置发现的突变SHELL等位基因的替换氨基酸或缺失。
附图说明
图1为SHELL基因模型。外显子(盒)和内含子(水平线)通过RNA-seq验证。基因图下提供了由指定外显子编码的蛋白域图。表明为SHELL蛋白的MADS box、I、K和C域。
图2为SHELL基因的核苷酸变体。编码SHELL(SEQ ID NO:25)的MADS box域的野生型(ShDeliDura)外显子1的DNA序列如DNA序列比对的首行。示出了与dura序列比对的AVROS、MPOB、等位基因3、等位基因4、等位基因5、等位基因6、等位基因7、等位基因8、等位基因9、等位基因10和等位基因11(分别是SEQ ID NOs:22、23、13-21)的等位基因的序列。单核苷酸变体由盒表示。缺失碱基(等位基因7)由破折号表示。
图3为SHELL基因的氨基酸变体。在多肽对齐的首行示出了野生型(ShDeliDura)MADSbox域的多肽序列(SEQ ID NO:24)。示出了与dura多肽序列比对的AVROS、MPOB、等位基因3、等位基因4、等位基因5、等位基因6、等位基因7、等位基因8、等位基因9、等位基因10和等位基因11(分别是SEQ ID NO:1-11)多肽的序列。由错义单核苷酸变体产生的变体氨基酸由合适的单字符氨基酸代码表示。缺失氨基酸(等位基因7)由星号表示。相对于dura多肽序列未变化的氨基酸用破折号表示。
具体实施方式
I.导入
本公开内容描述了SHELL基因的等位基因3-10的发现,预测所述等位基因来调节棕榈(例如油棕)植物的果实形式表型。同样地,由于它们紧密地物理键合至等位基因3-10多态型,预测任一个等位基因11(如SEQ ID NOs:11和21所示)和12(如SEQ ID NO:12所示),来直接调节果实形式表型,或者可用于推断SHELL基因的基因型。紧密地键合至SHELL基因的多态标记,或者鉴别在油棕植物中存在或没有的等位基因3-11的副本数量,可被种子制造商作为质量控制工具用于i)降低或消除tenera种子或树苗的dura或pisifera污染,ii)降低或消除pisifera种子或树苗的dura或tenera污染,iii)降低或消除dura种子或树苗的pisifera或tenera污染,iv)积极识别tenera种子或树苗,然后选择它们作为用于商业棕榈生产的合适的种植材料,v)积极识别dura种子或树苗,然后选择它们作为用于商业生产的dura种质的合适的种植材料,或者vi)积极识别pisifera种子或树苗,然后选择它们作为用于商业生产的pisifera种质的合适的种植材料。
识别SHELL基因或通常键合至壳性状的标记在育种计划中也很重要。对所述性状负责的基因的标记或等位基因可用于分离苗圃中的dura、tenera和pisifera植物;其优势是可基于壳果实形式表型将它们分别种植。由于pisifera棕榈通常显示非常有利的植物生长,这一点非常有趣,因此在包括所有三种类型的试验中,由于杂交竞争可能存在结果失真。此外,分离出pisifera棕榈并鼓励将它们以高密度种植父本开花,这有利于用于育种计划的花粉生产(Jack等人,1998)。因此,在检测到所存在或没有的SHELL基因型后,预测dura、pisifera或tenera表型的结果,或者连接标记,如下文所述,另一步骤:(1)降低或消除tenera种子或树苗的dura或pisifera污染,(2)积极识别tenera种子或树苗,然后选择它们作为用于商业棕榈油生产的合适的种植材料,或者(3)可实现将dura、tenera和pisifera植物分成两组或多组(例如预测一组为tenera的植物,和预测第二组为dura或pisifera的植物;预测一组为dura的植物和预测第二组为tenera和pisifera的植物,预测一组为pisifera的植物和预测第二组为dura或tenera的植物,或者分成三组:dura、pisifera和tenera)。
在杂交的亲本dura树和pisifera树之间存在的任何标记是多态性的并且连接至具有潜在用作分子信号的壳位点以识别杂交的tenera树。例如,如果在接近壳位点的既定SNP位置为纯合子“T”(即T/T)的dura树与在该相同SNP位置为纯合子“A”(即A/A)的pisifera树杂交,则可在SNP位置对杂交种子或从杂交种子产生的树苗进行基因分型,来追踪和识别污染种子或树苗。在SNP位置测定为杂合体的种子(例如A/T)非常可能是tenera,除非进行基因分型的个体在该标记和壳基因之间发生重组。类似地,在SNP位置为“A”或“T”的纯合体的种子(即A/A或T/T)分别为pisifera或dura污染树,并且当若干年后这些树性成熟时,会产生不达标的果实类型。此外,在SNP位置具有“C”或“G”的种子或树苗,其中任何一个都存在于杂交的亲本棕榈中,可能是由与杂交的预期花粉供体不同的花粉供体产生的树,并因此可以作为污染的种子或树苗丢弃。较接近SHELL位点的标记比远离壳位点的标记具有较高的预测准确性,因为标记越接近壳基因,越不可能发生重组,从而打断标记和壳基因之间的连锁。因此,预期壳基因自身内的多态标记具有最强的预测能力,并分析紧密连接至或在壳基因内的多种标记可能是有利的。
II.基于核酸检测确定壳表型
鉴于SHELL基因型分为tenera/pisifera/dura壳表型的发现,在SHELL位点或邻近的基因组区域对植物或种子进行基因分型可用于预测棕榈植物的壳表型。
SEQ ID NO:24代表在dura果实类型(ShDeliDura)的油棕中表达的蛋白质的N-端181个氨基酸的预测氨基酸序列。该内源性蛋白质包括另外不包含在SEQ ID NO:24中的C-端氨基酸。在dura果实类型的油棕中,源自该基因的两个等位基因的蛋白质包括:(i)分别位于8-12位的异亮氨酸(I),赖氨酸(K),精氨酸(R),异亮氨酸(I)和谷氨酸(E),它们在预测等位基因7中缺失;(ii)位置12的谷氨酸(E),其在所预测的等位基因6中突变为谷氨酰胺(Q);(iii)在所预测的等位基因3中的位置23赖氨酸(K)突变为谷氨酰胺(Q),和在所预测的等位基因5中的位置23赖氨酸(K)突变为天冬酰胺(N);(iv)在所预测的等位基因8中精氨酸(R)突变为组氨酸(H)和在所预测的等位基因9中精氨酸(R)突变为甘氨酸(G);(v)在等位基因shMPOB的位置29处亮氨酸(L)突变为脯氨酸;(vi)在等位基因shAVROS的位置31赖氨酸(K)突变为天冬酰胺;(vii)在所预测的等位基因10的位置37缬氨酸(V)突变为天冬氨酸(D);和(viii)在所预测的等位基因4的位置41丙氨酸(A)突变为天冬氨酸(D)。
SEQ ID NO:1代表在源自扎伊尔品系(shAVROS)的pisifera果实类型的油棕中表达的蛋白质的N-端181个氨基酸的预测氨基酸序列。该内源性蛋白质包括不包含在SEQ IDNO:1中的另外的C-端氨基酸。该多肽包括在第31个氨基酸位置的天冬氨酸(N)。编码shAVROS等位基因的外显子1的核苷酸序列如SEQ ID NO:22所示。
SEQ ID NO:2代表在源自尼日利亚品系(shMPOB)的pisifera果实类型的油棕中表达的蛋白质的N-端181个氨基酸的预测氨基酸序列。该内源性蛋白质包括未包括在本文的其他C-端氨基酸。该多肽包括在第29氨基酸位置的脯氨酸(P)氨基酸。编码shMPOB等位基因的外显子1的核苷酸序列如SEQ ID NO:23所示。
SEQ ID NO:3代表在所预测的pisifera果实类型SHELL等位基因3的油棕中表达的蛋白质的N-端181个氨基酸的预测氨基酸序列。该内源性蛋白质包括未包括在本文的其他C-端氨基酸。该多肽包括在第23氨基酸位置的谷氨酰胺(Q)氨基酸。编码等位基因3的外显子1的核苷酸序列如SEQ ID NO:13所示。
SEQ ID NO:4代表在所预测的pisifera果实类型SHELL等位基因4的油棕中表达的蛋白质的N-端181个氨基酸的预测氨基酸序列。该内源性蛋白质包括未包括在本文的其他C-端氨基酸。该多肽包括在第41氨基酸位置的天冬氨酸(D)氨基酸。编码等位基因4的外显子l的核苷酸序列如SEQ ID NO:14所示。
SEQ ID NO:5代表在所预测的pisifera果实类型SHELL等位基因5的油棕中表达的蛋白质的N-端181个氨基酸的预测氨基酸序列。该内源性蛋白质包括未包括在本文的其他C-端氨基酸。该多肽包括在第23氨基酸位置的天冬酰胺(N)。编码等位基因5的外显子1的核苷酸序列如SEQ ID NO:15所示。
SEQ ID NO:6代表在所预测的pisifera果实类型SHELL等位基因6的油棕中表达的蛋白质的N-端181个氨基酸的预测氨基酸序列。该内源性蛋白质包括未包括在本文的其他C-端氨基酸。该多肽包括在第12氨基酸位置的谷氨酰胺(E)氨基酸。编码等位基因6的外显子1的核苷酸序列如SEQ ID NO:16所示。
SEQ ID NO:7代表在所预测的pisifera果实类型SHELL等位基因7的油棕中表达的蛋白质的N-端181个氨基酸的预测氨基酸序列。该内源性蛋白质包括未包括在本文的其他C-端氨基酸。该多肽在相对于野生型等位基因ShDeliDura的位置8-12处分别具有氨基酸赖氨酸(K)、精氨酸(R)、异亮氨酸(I)和谷氨酸(E)的缺失。编码等位基因7的外显子1的核苷酸序列如SEQ ID NO:17所示。
SEQ ID NO:8代表在所预测的pisifera果实类型SHELL等位基因8的油棕中表达的蛋白质的N-端181个氨基酸的预测氨基酸序列。该内源性蛋白质包括未包括在本文的其他C-端氨基酸。该多肽包括在第24氨基酸位置的组氨酸(H)氨基酸。编码等位基因8的外显子1的核苷酸序列如SEQ ID NO:18所示。
SEQ ID NO:9代表在所预测的pisifera果实类型SHELL等位基因9的油棕中表达的蛋白质的N-端181个氨基酸的预测氨基酸序列。该内源性蛋白质包括未包括在本文的其他C-端氨基酸。该多肽包括在第24氨基酸位置的甘氨酸(G)氨基酸。编码等位基因9的外显子1的核苷酸序列如SEQ ID NO:19所示。
SEQ ID NO:10代表在所预测的pisifera果实类型SHELL等位基因10的油棕中表达的蛋白质的N-端181个氨基酸的预测氨基酸序列。该内源性蛋白质包括未包括在本文的其他C-端氨基酸。该多肽包括在第37氨基酸位置的天冬氨酸(D)氨基酸。编码等位基因10的外显子1的核苷酸序列如SEQ ID NO:20所示。
SEQ ID NO:11代表在所预测的pisifera果实类型SHELL等位基因11的油棕中表达的蛋白质的N-端181个氨基酸的预测氨基酸序列。该内源性蛋白质包括未包括在本文的其他C-端氨基酸。相对于野生型SHELL基因(ShDeliDura),等位基因编码沉默突变。编码等位基因11的外显子1的核苷酸序列如SEQ ID NO:21所示。如本文所述,该沉默突变可影响转录或翻译规则并因此提供编码用于野生型蛋白序列的pisifera表型。或者,编码该沉默突变的核苷酸序列可用于推测存在或没有一种或多种前述的多态性核苷酸(例如相对于如SEQ IDNos:13-20、13-20和23、13-20和22、或13-20和22-23示例的野生型的一种或多种多态标记)上存在或没有的基因型或氨基酸标记(例如相对于如SEQ ID Nos:3-10、2-10、1和3-10或1-10示例的一种或多种多态标记)。
SEQ ID NO:12代表SHELL等位基因12的内含子1的第一个有56个核苷酸的核苷酸序列,其中核苷酸43、44、45和46相对于野生型SHELL等位基因(ShDeliDura)缺失。当该多态性在SHELL基因的非编码区域内时,其是沉默突变。如本文所述,该沉默突变可能影响转录或翻译规则,或者拼接,并因此提供pisifera表型。或者,存在或没有的等位基因12可用于推测在前述的一种或多种多态性核苷酸(例如相对于野生型如SEQ ID Nos:13-20、13-21、13-20和22、13-20和23或13-23示例的一种或多种多态标记)上存在或没有的基因型或氨基酸标记(例如相对于野生型如SEQ ID Nos:3-10、3-11、2-10、2-11、1-10、1和3-10、1和3-11或1-11所示的一种或多种多态标记)。
Pisifera果实类型的油棕树是至少四种可能性之一的结果:i)具有编码下列蛋白序列SEQ ID NOs:3-10之一的核苷酸序列的两个纯合SHELL等位基因;ii)具有独立地编码下列蛋白序列SEQ ID NOs:3-10之一的两个不同核苷酸序列的两个杂合SHELL等位基因,或者iii)编码ShAVROS或ShMPOB蛋白序列的一个SHELL等位基因和编码相对于野生型如一个或多个以下蛋白质序列SEQ ID NOs:3-10所示的突变的另一等位基因。在一些情况下,核苷酸序列包括SEQ ID NO:12和/或21并且类似于所预测的pisifera等位基因。在这些情况下,pisifera果实类型可产生SEQ ID NO:12或21的植物纯合体或者SEQ ID NO:12或21的植物杂合体,并且不同等位基因选自SEQ ID NOs:13-23中的任一个(例如SEQ ID NOs:13-20中的任一个)或者编码SEQ ID NOs:1-10中的任一个(例如SEQ ID NOs:3-10中的任一个)。
Tenera果实类型的油棕树是编码本文所述的一个或多个pisifera等位基因的一个等位基因和编码野生型(ShDeliDura)SHELL蛋白的一个等位基因的结果,。值得注意的是,SEQ ID NOs:1-11和24为代表序列并且不同的棕榈个体可具有相对于SEQ ID NOS:1-11和24例如由于自然变异的一个、两个、三个、四个或更多个氨基酸变化的氨基酸序列。类似地,SEQ ID NOs:12-23和25为代表序列并且不同的棕榈个体可能具有相对于SEQ ID NOs:12-23和25由于例如自然变异的一个、两个、三个、四个或更多个核苷酸变化的核苷酸序列。
pisifera和dura SHELL等位基因之间的一个或多个多态性可用于确定棕榈或其他植物的壳表型。例如,当该多态性为共显性时(可不依赖于其他等位基因检测),那么:
仅存在dura SHELL等位基因表示该植物具有或会具有dura壳表型;
仅存在pisifera SHELL等位基因表示该植物具有或会具有pisifera壳表型;和
存在pisiferaSHELL等位基因和dura SHELL等位基因表示该植物具有tenera壳表型。
然而,紧邻SHELL基因的基因组区域也可用于确定棕榈植物是否可能会表现出特殊的壳表型。由于SHELL基因遗传连锁,邻近SHELL位点的多态性仍预测为壳表型,虽然准确度随与SHELL位点的距离增加而下降。SEQ ID NO:27提供包括SHELL基因的棕榈基因组的约3.4MB的基因组区域。美国专利申请公布号No.2013/0247249的表A公开了在SEQ ID NO:27内识别的8217个SNP。选择这些SNP相对于SHELL位点进行遗传作图。U.S.2013/0247249的表A还描述了这些SNP的估算的预测值。因此,作为例子,在U.S.2013/0247249表1的行1列出SNP具有83次估算预测成功,表示准确预测壳表型83%次的SNP。也就是说,通过试验SNP作为遗传标记,100次中有83次可以正确地预测棕榈植物的壳表型。因此,即使物理距离明显远离棕榈染色体上的SHELL位点,多态标记仍可相对准确预测植物的壳表型。在一些实施例中,该多态标记在SHELL基因的1、10、20、50、100、200、500、1000kb(例如对应SEQ ID NO:28的基因)。
因此,提供检测对应SEQ ID NO:27的棕榈基因组区域内的一个或多个多态标记的方法。例如,该方法可用于预测棕榈植物的壳表型。U.S.2013/0247249提供了超过8200个特定的多态性,但是应当意识到,所表示的多态性仅为对应SEQ ID NO:27的基因组区域内的多态性的实例。根据需要可识别另外的多态性并可将其用于预测棕榈植物的壳表型。该另外的多态性预期包含于本文所述方法中。此外,应当意识到,SEQ ID NO:27为代表序列并且不同的棕榈个体可具有相对于SEQ ID NO:27由于例如自然变异的一个或多个核苷酸变化。然而,如本文其他地方所述,识别对应SEQ ID NO:27的基因组区域可由对齐程序等轻易地确定。
本文提供的核酸序列通过核苷酸测序产生,并且间或包括一个或多个连续的“N”。这些连续的N表示在估计尺寸的序列组装中的间隙。序列中N的精确数是估值(例如100个N可仅表示30个碱基)。N可以是任何碱基,并且在基因组中可能是重复序列。
检测特定的多糖标记可通过本领域已知的用于在多位点检测序列的方法来完成。例如,可使用对SNP和/或微卫星标记的存在进行基因分型的标准技术,比如基于荧光的技术(Chen,X.等人,Genome Res.9(5):492-98(1999)),利用PCR、LCR、巢式PCR和用于核酸扩增的其他技术。可用于SNP基因分型的特定的商业方法包括但不限于,TaqManTM基因型分析和SNPlex平台(Applied Biosystems),凝胶电泳(Applied Biosystems),质谱分析(例如来自Sequenom的MassARRAY系统),微测序方法,实时PCR,Bio-Plex系统(BioRad),CEQ和SNPstream系统(Beckman),阵列杂交技术(例如Affymetrix GeneChip;Perlegen),BeadArray技术(例如Illumina GoldenGate和Infinium分析),阵列标签技术(例如Parallele),以及基于核酸内切酶的荧光杂交技术(Invader;Third Wave)。一些可用的阵列平台,包括Affymetrix SNP Array 6.0和Illumina CNV370-Duo以及1M BeadChips,包括以某些拷贝数变异为标签的SNP。
在一些实施方案中,通过测序技术检测多态标记。获得的关于植物个体的序列信号识别在序列范围中的特定核苷酸。对于SNP,关于单个独特的序列位点的序列信息足以识别在该特定SNP处的等位基因。对于包括超过一个核苷酸的标记,关于个体的核苷酸的序列信息识别该个体的具体位点的等位基因。
本领域技术人员知晓用于获得核酸序列的各种方法,并且所有这些方法可用于实践本发明。桑格测序是众所周知的用于产生核酸序列信息的方法。已经研发了用于获得大量序列数据的最新方法,并且根据需要也可考虑将这些方法用于获得植物的序列信息。这些方法包括但不限于,焦磷酸测序技术(Ronaghi,M.等人,Anal Biochem 267:65-71(1999);Ronaghi,等人,Biotechniques 25:876-878(1998)),例如454焦磷酸测序(Nyren,P.,等人,Anal Biochem 208:171-175(1993)),Illumina/Solexa测序技术(www.illumina.com;还参看Strausberg,R L等人Drug Disc Today 13:569-577(2008)),支持寡核酸连接和检测的平台(SOLiD)技术(Applied Biosystems,www.appliedbiosystems.com);Strausberg,R L,等人,Drug Disc Today 13:569-577(2008),单分子实时测序(Pacific Biosciences),以及IonTorrent技术(ThermoFisher)。
可在来自含有核酸(例如DNA、RNA)的植物的任何类型的生物样品上执行多态性检测方法。该方法的一个优点是在田中栽培前可预测幼小的植物的壳表型。在一些实施方案中,从已经发芽小于1、2、4、6个月或者小于1、2、3、4或5年的植物获得样品。在一些实施方案中,从i)dura和pisfera棕榈之间杂交,ii)tenera棕榈自交,iii)具有tenera壳表型的两株植物之间杂交,iv)dura和tenera棕榈之间杂交,和v)tenera和pisfera棕榈之间杂交产生植物。由于这些杂交不是100%有效,所以这些杂交导致一些比例的种子或植物不会在将来产生具有tenera壳表型的种子或植物(假设i)并且观察到tenera棕榈的观察值不符合预期的孟德尔分离定律(ii,iii&iv)。通过测试由试图杂交产生的种子或植物,可以减少或消除来自为栽培而种植的材料的非tenera污染种子或植物(任选的丢弃那些预测为dura和/或pisifera的植物)。或者,基于其预测的壳基因型,
可识别并分离植物,从而根据需要例如为了以后育种的目的,选择并在田间栽培纯pisifera和/或dura树。
III.转基因植物
根据上述讨论,已经发现用棕榈的SHELL基因来控制壳表型。因此在一些实施方案中,提供已经调节SHELL多肽的表达的植物。随着dura和pisifera等位基因之间的杂合体,自然产生更多所需的壳表型(tenera,具有小于2mm厚的壳)。
已经发现pisifera SHELL等位基因在编码蛋白质的MADS box域(起着转录调节的作用)的基因的部分中含有错义突变。因此,假设tenera表型可能由涉及蛋白质的机理造成:SHELL蛋白质的非DNA结合pisifera类型与SHELL(二聚体)的完全功能类型或其他MADS-box家族成员(异二聚体)的蛋白质相互作用。因此,在一些实施方案中,提供具有功能M、I和K域和非功能C-(MADsbox)域的异源表达SHELL多肽的植物。M、I、K和C域在例如Gramzow和Theissen,2010Genome Biology 11:214-224中有描述,并且可在本文描述的棕榈序列中识别相应域。通过这种具有活性蛋白质的蛋白质的表达:蛋白质相互作用域而不是非功能DNA结合域,与修饰SHELL蛋白质相互作用的蛋白质会通过生物作用除去,从而导致壳厚度下降。因此,例如在植物(例如棕榈植物,例如dura背景)中的异源启动子的控制下,可表达本文描述的任何pisifera等位基因,从而导致壳厚度下降。
同样地,已经发现许多pisiferaSHELL等位基因在该SHELL蛋白质的MADS box域内的核定位信号(NLS)中含有突变。因此,假设tenera表型可能由涉及蛋白质的机理产生:缺乏NLS的一种或多种pisifera SHELL等位基因的蛋白质和一种或多种完全功能型SHELL(二聚体)或其他MADS-box家族成员(异二聚体)之间蛋白质相互作用。通过这种具有活性蛋白质的蛋白质的表达:蛋白质相互作用域而不是非功能性NLS,与修改SHELL蛋白质相互作用的蛋白质可通过进入细胞核被抑制(例如阻止)或通过细胞核除去,从而降低生物活性SHELL蛋白质与其在细胞核中相互作用的蛋白质(例如结合伴侣)的数量,并导致壳厚度的下降。因此,例如在植物(例如棕榈至,例如dura背景)的异源启动子的控制下,可表达含有如本文所述的NLS突变的任何pisifera等位基因,或者在NLS的任何(例如保守型)氨基酸处突变的编码SHELL蛋白质的SHELL基因,从而导致壳厚度的下降。
B.使用本发明的核酸来增强基因表达
编码SHELL多肽(包括但不限于与SEQ ID NOs:1-10(例如任何一条SEQ ID NOs:3-10),具有功能M、I和K域以及非功能C域的SHELL多肽,或者具有非功能NLS的SHELL多肽,当其表达时控制壳厚度)全长或活性部分的核酸序列可用于制备增强或提高SHELL基因表达的表达盒。当需要基因表达时,可使用来自不同物种的所需要的SHELL基因来降低潜在的正义抑制效果。
本领域众所周知的许多种方法中的任何已知可用于提高植物的SHELL活性。可以以任何器官作为目标,例如枝条、营养器官/结构(例如叶子、茎和块茎)、根、花和花器官/结构(例如苞片、萼片、花瓣、雄蕊、心皮、花药和胚珠),种子(包括胚、胚乳和种皮)以及果实。或者,可以组成型地表达SHELL基因(例如使用CaMV 35S启动子)。
技术人员将认识到,如同其他蛋白质,由本发明的基因编码的多肽具有进行不同功能的不同域。因此,只要表达该蛋白质的所需功能域,该基因序列不必是全长的。
III.制备重组载体
在一些实施方案中,为了在上述技术中使用分离的序列,制备适合用于植物细胞转化的重组DNA载体。用于转化多种高等植物物种的技术是众所周知的并且在科技文献中有描述。参看例如Weising等人Ann.Rev.Genet.22:421-477(1988)。编码用于所需多肽的DNA序列,例如编码全长蛋白质的cDNA序列,优选与转录和翻译起始调节序列结合,该起始调节序列指导转化植物的目标组织中的基因序列的转录。
例如,对于过表达,可以采用植物启动子片段引导基因在再生植物中的所有组织中表达。这些启动子在本文中被称作“组成型”启动子,并且在大多数环境条件下以及发育或细胞分化状态下是活性的。组成型启动子的例子包括花椰菜花叶病毒(CaMV)35S转录起始区域,来自Agrobacterium tumefaciens的T-DNA的1′-或2′-启动子,以及来自技术人员已知的各种植物基因的其他转录起始区域。
或者,该植物启动子可指导本发明的多聚核苷酸在特异组织(组织特异启动子)中或可在更严格的环境控制下(诱导型启动子)的表达。在发育控制下的组织特异性启动子的例子包括仅在特异组织,例如果实、种子或花中起始转录的启动子。可影响诱导型启动子转录的环境条件的实例包括缺氧条件、高温或光照的存在。
如果需要合适的多肽表达,应包括在编码区域的3′-端的多腺苷酸区域。该多腺苷酸区域可来自天然基因、来自各种其他植物基因,或者来自T-DNA。
含有来自本发明的基因的序列(例如启动子或编码区域)的载体可能任选地包含在植物细胞中具有可选择的表型的标记基因。例如,该标记可编码抗微生物剂抗性,特别是抗生素抗性,比如卡那霉素、G418、博来霉素、潮霉素或潮霉素抗性,例如绿黄隆(chlorosluforon)或Basta抗性。
提供可操作性连接启动子的SHELL核酸,在一些实施方案中,能够驱动植物中的SHELL编码序列的转录。该启动子可以是,例如来自植物或病毒。该启动子可以是,例如组成型活性,诱导型或组织特异性。在构建本发明的重组表达盒、载体、转基因时,可选择不同的启动子,并用于差异性指导基因表达,例如在植物或动物的一些或全部组织中。在一些实施方案中,如上文讨论的,通过分析与本文描述的SHELL基因对应的基因组克隆的5′序列以识别所需的启动子。
V.转基因植物的生产
本发明的DNA构建体可通过各种常规技术导入到所需的植物宿主中。例如,使用如电穿孔和植物细胞原生质的显微注射,可将DNA构建体直接导入植物细胞的基因组DNA中,或者使用轰击法、如DNA微粒轰击,可将DNA构建体直接导入植物组织中。或者,DNA构建体可与合适的T-DNA旁侧区域结合并导入常规的Agrobacterium tumefaciens宿主载体中。当细胞受到细菌感染时,Agrobacterium tumefaciens宿主的侵入功能将指导构建体和相邻标记插入到植物细胞DNA中。
已经描述了各种棕榈转化方法。参看例如Masani and Parveez,ElectronicJournal of Biotechnology Vol.11No.3,July 15,2008;Chowdury等人,Plant CellReports,Volume 16,Number 5,277-281(1997)。
显微注射技术是本领域熟知的并且在科技文献中有很好的描述。Paszkowski等人EMBOJ.3:2717-2722(1984)描述了使用聚乙二醇沉淀导入DNA构建体。Fromm等人Proc.Natl.Acad.Sci.USA 82:5824(1985)描述了电穿孔技术。Klein等人Nature327:70-73(1987)描述了轰击转化技术。
科学文献详细描述了Agrobacterium tumefaciens-介导的转化技术,包括解毒和使用二元载体。参看例如Horsch等人Science 233:496-498(1984),和Fraley等人Proc.Natl.Acad.Sci.USA 80:4803(1983)。
可栽培由任何转化技术获得的转化的植物细胞,以使再生成为具有转化的基因型的整株植物,并因此获得所需的表型。这种再生技术依赖于组织培养生长培养基中的特定植物激素的控制,任选地依赖于所需核苷酸序列一起导入的抗微生物剂和/或除草剂标记。从培养的原生质体再生的植物描述于Evans等人,Protoplasts Isolation and Culture,Handbook of Plant Cell Culture,pp.124-176,MacMillilan Publishing Company,NewYork,1983;和Binding,Regeneration of Plants,Plant Protoplasts,pp.21-73,CRCPress,Boca Raton,1985中。再生还可由植物愈伤组织、外植体、器官或其一部分获得。这些再生技术一般描述于Klee等人Ann.Rev.of Plant Phys.38:467-486(1987)中。
本发明的核酸可用于使基本上任何植物具有所需的性状。因此,本发明使用了大量植物,包括以下属的物种:天门冬属、颠茄属、燕麦属、芸苔属、柑桔属、西瓜属、辣椒属、黄瓜属、南瓜属、胡萝卜属、草莓属、大豆属、棉花属、向日葵属、萱草属、大麦属、天仙子属、莴苣属、亚麻属、黑麦草属、番茄属、苹果属、木薯属、墨角兰属、苜蓿属、烟草属、稻属、黍属、狼尾草属、鳄梨属、豌豆属、犁属、李属、萝卜属、黑麦属、千里光属、白芥属、茄属、高粱属、葫芦巴属、小麦属、葡萄属、豇豆属和玉蜀黍属。具有壳的植物,以及在本发明中使用的那些植物包括但不限于双子叶植物和单子叶植物,包括但不限于棕榈。
实施例
以下提供的实施例用于示例说明,但并不限制所要求保护的本发明。
实施例1.识别等位基因3-11,对应核苷酸序列SEQ ID NOs:12-21和多肽SEQ IDNOs:3-11
我们之前报道了纯合体(例如AVROS/AVROS,MPOB/MPOB或AVROS/MPOB)和tenera油棕果实表型,杂合体与一种野生型dura等位基因(例如AVROS/dura或MPOB/dura),SHELL基因的外显子1的AVROS和MPOB突变负责pisifera油棕果实表型。而tenera油棕是优选的用于商业油棕生产的表型,但很难完全阻止商业种群中的野生型dura棕榈的出现。为了评估在商业油棕种群内的dura污染程度,并寻找产生pisifera/tenera表型的SHELL基因的新等位基因,我们对每个等位基因(dura、shAVROS和shMPOB)使用等位基因-特异PCR试验法,测试了马来西亚6个不同小种植园主的5,158株油棕树存在的AVROS和/或MPOB等位基因。如预期,大多数棕榈是shAVROS或shMPOB等位基因的杂合体(表2)。
然而,被预测为纯合体的504株棕榈的ShDeliDura等位基因位于SNP位置。对在这504株棕榈的每株中的编码整个MADS box域的SHELL基因的外显子1进行测序。通过PCR使用引物旁侧外显子1对扩增子扩增进行测序。在标准条件下进行PCR。纯化扩增子并使用PCR扩增引物内的引物朝一个方向桑格测序。在DONSED内个别分析序列阅读以确定序列与外显子1内的每个核苷酸位置的结合性。如表2所示,确定13株棕榈为shAVROS等位基因(来自位点1的2,来自位点2的4,来自位点3的2,来自位点4的3和来自位点5的2)杂合体,表明这些棕榈确实是基因型tenera棕榈。确定三株棕榈为shMPOB等位基因(来自位点2的1,来自位点4的1和来自位点5的1)的杂合体,表明这些也是基因型tenera棕榈。然而,其余488株棕榈在SNP位点均为ShDeliDura等位基因的纯合体,表明这些树是基因型dura,或者它们携带之前未识别的SHELL基因的突变等位基因。
在为杂合体的68株棕榈中发现等位基因3(SEQ ID NO:3和13)(表2),在为杂合体的66株棕榈中发现等位基因4(SEQ ID NO:4和14)和在为杂合体的1株棕榈中发现等位基因5。这些135株棕榈的每株彼此独立。在SHELL的NLS内存在由等位基因3和5编码的氨基酸,因为AVROS和MPOB突变(图3)。由等位基因4编码的氨基酸位于由shAVROS等位基因突变的氨基酸C端的10个氨基酸。
表2确定来自小种植园主的棕榈样本的SHELL外显子1基因型
Figure BDA0003564264360000211
a通过等位基因特异性PCR试验测试AVROS和MPOB突变的独立的棕榈数量
b通过对SHELL基因的外显子1DNA测序进一步分析独立的棕榈数量
接下来,我们测试了整个马来西亚的七个油棕苗圃位点的3952株棕榈的基因型(表3)。再一次,大多数是shAVROS或shMPOB等位基因的杂合体,表明它们是基因型tenera棕榈。然而,被预测为纯合体的536株棕榈的ShDeliDura等位基因位于SNP位置。如上文所述,对在这536株棕榈的每株中的编码整个MADS box域的SHELL基因的外显子1进行测序。
如表3所示,确定6株棕榈为shAVROS等位基因的杂合体,表明这些棕榈确实是基因型tenera棕榈。确定一株棕榈为shMPOB等位基因的杂合体。然而,确定其余529株棕榈在SNP位点为ShDeliDura等位基因的纯合体,表明这些树是基因型dura,或者它们携带之前未识别的SHELL基因的突变等位基因。在36株棕榈中发现为杂合体的等位基因3(SEQ ID NO:3和13),并在2株棕榈中发现为杂合体的等位基因4(SEQ ID NO:4和14)。这38株棕榈的每株彼此独立。
表3确定来自油棕苗圃的棕榈样本的SHELL外显子1基因型
Figure BDA0003564264360000212
a通过等位特异性PCR试验测试的AVROS和MPOB突变的独立的棕榈数量
b通过对SHELL基因的外显子1DNA测序进一步分析独立的棕榈数量
为了进一步识别SHELL外显子1变体,我们对从不同地理区域(来自安哥拉的64个,来自加纳的28个,来自尼日利亚的27个,来自坦桑尼亚的27个和来自几内亚的2个)收集的种质收集物的148株棕榈中的SHELL基因的外显子1进行测序。种群中的shAVROS等位基因最常被预期为tenera表型(50株安哥拉,10株加纳,6株尼日利亚和22株尼日利亚棕榈),然而在5株安哥拉、5株加纳和19株尼日利亚棕榈中检测为shMPOB等位基因(表4)。检测在1株加纳和2株几内亚棕榈中的等位基因4(也在小种植园主和苗圃中检测)。
此外,检测6个新型的SHELL等位基因。检测4株坦桑尼亚棕榈的等位基因6并相对于dura在氨基酸位置12编码天冬氨酸变为谷氨酰胺氨基酸(图2和3)。在1株棕榈中检测到相对于dura的框内缺失除去5个氨基酸的等位基因7。等位基因8和9改变相对于dura的相同氨基酸。在等位基因8中保守型精氨酸在氨基酸位置24处变化为组氨酸并在等位基因9中变为甘氨酸(图2和3)。在一株加纳棕榈中检测等位基因10,并且其相对于dura在氨基酸位置37处编码缬氨酸对谷氨酸氨基酸替换。最后,在两株安哥拉棕榈中检测等位基因11,并且其编码同义单核苷酸多态性(图2)。值得注意的是,与shAVROS和shMPOB突变一样,等位基因3、5、7、8和9全部影响SHELL蛋白质的高保守性NLS的一部分氨基酸。
表4确定种质收集物中的SHELL外显子1基因型
Figure BDA0003564264360000221
对棕榈中的一部分种质收集物测序,肉眼看到有32种油棕果实类型(dura、tenera或pisifera)的表型。在作为tenera的三株安哥拉棕榈中,两株是shAVROS等位基因的杂合体并且在外显子l内的所有其他外显子1核苷酸位置处是野生型(dura)。在作为dura的两株安哥拉棕榈表型中,两株均为等位基因11变体(等位基因11/ShDeliDura)的杂合体并且在所有其他外显子1的核苷酸位置是野生型(dura),与预期不直接参与tenera/pisifera表型的同义变化一致。作为tenera的一株安哥拉棕榈在所有外显子1核苷酸位置处是野生型(dura)。在本次研究中没有一株安哥拉棕榈是pisifera表型。
在10株为tenera的加纳棕榈中,1株为等位基因4(等位基因4/ShDeliDura)的杂合体并且在所有其他外显子1核苷酸位置处是野生型(dura),4株是等位基因8(等位基因8/ShDeliDura)的杂合体并且在所有其他外显子1核苷酸位置是野生型(dura),4株是等位基因9(等位基因9/ShDeliDura)的杂合体并且在所有其他外显子1核苷酸位置处是野生型(dura),和1株是等位基因10(等位基因10/ShDeliDura)的杂合体并且在所有其他外显子1核苷酸位置处是野生型(dura)。在本次研究中没有一株加纳棕榈是dura表型。
在为tenera的8株尼日利亚棕榈中,3株是shAVROS等位基因(shAVROS/ShDeliDura)杂合体并且在所有其他核苷酸位置处是野生型(dura),3株是shMPOB等位基因(shMPOB/ShDeliDura)的杂合体并且在所有其他外显子1核苷酸位置处是野生型(dura),和1株是等位基因(等位基因7/ShDeliDura)的杂合体并且在所有其他外显子1核苷酸位置处是野生型(dura)。作为tenera的一株尼日利亚棕榈在所有外显子1核苷酸位置处是野生型(dura)。在为pisifera的两株尼日利亚棕榈中,1株是shAVROS等位基因的纯合体并且在所有其他外显子1核苷酸位置处是野生型(dura),而其他是shAVROS等位基因(shAVROS/ShDeliDura)的杂合体并且在所有其他外显子1核苷酸位置处是野生型(dura)。在本次研究中没有一株尼日利亚棕榈是dura表型。
在为tenera的2株坦桑尼亚棕榈表型中,1株是shAVROS等位基因(shAVROS/ShDeliDura)的杂合体并且在所有其他外显子1核苷酸位置处是野生型(dura),而其他是对一个染色体和等位基因6对其他染色体(shAVROS/等位基因6)的具有shAVROS等位基因的化合物杂合子并且在所有其他外显子1核苷酸位置处是野生型(dura)。此外,为dura的3株坦桑尼亚棕榈中的3株是等位基因6的杂合体。这表明尽管等位基因6可能不会对tenera表型有助,但紧密连接等位基因的标记对表型有助。在本次研究中没有坦桑尼亚棕榈是pisifera表型。
在为tenera的两种几内亚棕榈中,1株是等位基因4(等位基因4/ShDeliDura)的杂合体并且在所有其他外显子1核苷酸位置处是野生型(dura)。另一株是等位基因4的纯合体并且在所有其他外显子1核苷酸位置处是野生型(dura)。在本次研究中没有一株几内亚棕榈是dura或pisifera表型。
参考文献
Beirnaert,A.and Vanderweyen,R.1941.Contribution a l’etude genetiqueet biometrique des varieties d’Elaeis guineensis Jacq.Publs.INEAC,SeriesSer.Sci.(27):101.
Bhasker,S.&Mohankumar,C.Association of lignifying enzymes in shellsynthesis of oil palm fruit(Elaeis guineensis--dura variety).2001.Indian JExp Bioll 39:160-4.
Billotte,N.,Marseillac,N.,Risterucci,A.M.,Adon,B.,Brotteir,P.,Baurens,F.C.,Singh,R.,Herran,A.,Asmady,H.,Billot,C.,Amblard,P Durrand-Gasselin,T.,Courtois,B.,Asmono,D.,Cheah,S.C.,Rohde,W and Charrier,A.2005.Microsatellite-based high densitylinkage map in oil palm(Elaeisguineensis Jacq.).Theoretical and Applied Genetics 110:754-765.
Birchler,J.A.,Auger,D.L.&Riddle,N.C.2003.In search of the molecularbasis of heterosis.Plant Cell 15:2236-9.
Cheah,S.C.1996.Restriction Fragment Length Polymorphism(RFLP)in OilPalm.Project Completion Report No.0011/95,4th July 1996,Malaysian Palm OilBoard(MPOB),Bangi,Malaysia.
Cheah,S.C.and Raj inder,S.1998.Gene expression during flowerdevelopment in the oil palm.Project Completion Report No.0057/98,16th July1999.Palm Oil Research Institute of Malaysia(PORIM),Bangi,Malaysia.
Corley,R.H.V.and Tinker,P.B.2003.Care and maintenance of oil palms.InThe Oil Palm(4thedition),pp:287-326.Oxford:Blackwell Science.
Danielsen,F.et al.2009.Biofuel plantations on forested lands:doublejeopardy for biodiversity and climate.Conserv Biol 23:348-58.
Devuyst,A.1953.Selection of the oil palm(Elaeis guineensis)inAfrica.Nature 172:685-686.Dinneny,J.R.and Yanofsky,M.F.2005.Drawing lines andborders:how the dehiscent fruit of Arabidopsis is patterned.Bioessays 27:42-9.
Donough,C.R.and Law,I.H.1995.Breeding and selection for seedproduction at Pamol Plantations Sdn Bhd and early performance of Pamol D xP.Planter 71:513-530.
Doyle,J.J.and Doyle,J.L.1990.Isolation of plant DNA from freshtissue.FOCUS 12:13-15.
Ferrandiz,C.,Liljegren,S.J.&Yanofsky,M.F.2000.Negative regulation ofthe SHATTERPROOF genes by FRUITFULL during Arabidopsis fruitdevelopment.Scienee 289:436-8.
Godding,R.1930.Observation de la production de palmiers selectionnesa Mongana(Equateur).BullArig.Congo belge 21:1263.
Gschwend,M.et al.1996.A locus for Fanconi anemia on 16q determined byhomozygosity mapping.Am JHum Genet 59:377-84.
Gu,Q.,Ferrandiz,C.,Yanofsky,M.F.&Martienssen,R.1998.The FRUITFULLMADS-box gene mediates cell differentiation during Arabidopsis fruitdevelopment.Development 125:1509-17.
Gramzow,L.and Theissen,G.2010.A hitchhiker’s guide to the MADS worldof plants.Genome Biology 11:214-225.
Hardon,J.J.,Rao,V.,and Rajanaidu,N.1985.A review of oil palmbreeding.In Progress in Plant Breeding,ed G.E.Rusell,pp139-163,Butterworths,UK.
Hartley,C.W.S.1988.The botany of oil palm.In The oilpalm(3rdedition),pp:47-94,Longman,London.
Huang,H.,Tudor,M.,Su,T.,Zhang,Y.,Hu,Y.,and Ma,H.1996.DNA bindingproperties of two Arabidopsis MADS domain proteins:Binding Consensus andDimer Formation.The Plant Cell 8:81-94.
Immink,R.G.,Gadella,T.W.J.,Ferrario,S.,Busscher,M.,and Angenent,G.2002.Proc.Natl.Acad.Sci.99:2416-2421.
Immink,R.G.,Kaufmann,K.&Angenent,G.C.2010.The′ABC′of MADS domainprotein behaviour and interactions.Semin Cell Dev Biol 21:87-93.
Jack,P.L.,James,C.,Price,Z.,Rance,K.,Groves,L.,CorleY,R.H.V.,Nelson,Sand Rao,V.1998.Application of DNA markers in oil palm breeding.In:1998International Oil Palm Congress-Commodity of the past,today and future,September 23-25,1998,Bali,Indonesia.
Krieger,U.,Lippman,Z.B.&Zamir,D.2010.The flowering gene SINGLE FLOWERTRUSS drives heterosis for yield in tomato.Nat Genet 42:459-63.
Lander,E.S.and Botstein,D.1987.Homozygosity mapping:a way to maphuman recessive traits with the DNA of inbred children.Science 236:1567-70.
Latiff,A.2000.The Biology of the Genus Elaeis.In:Advances in OilPalmResearch,Volume 1,ed.Y.Basiron,B.S.Jalani,and K.W.Chan,pp:19-38,MalaysianPalm Oil Board(MPOB).
Liljegren,S.J.,Ditta,G.S.,Eshed,Y.,Savidge,B.,Bowman,J.L.,Yanofsky,M.F.2000.SHATTERPROOF MADS-box genes control seed dispersal inArabidopsis.Nature 404:766-770.
Maria,M.,Clyde,M.M.and Cheah,S.C.1995.Cytologicalanalysis of Elaeisguineensis(tenera)chromosomes.Elaeis 7:122-134.
Mayes,S.,Jack,P.L.,Marshall,D.F.and Corley,R.H.V.1997.Construetion ofa RFLP genetic linkage map for oil palm(Elaeis guineensis Jacq.).Genome 40:116-122.
Moretzsohn,M.C.,Nunes,C.D.M.,Ferreira,M.E.and Grattapaglia,D.2000.RAPD linkage mapping of the shell thickness locus in oil palm(Elaeisguineensis Jacq.).Theoretical and Applied Genetics 100:63-70.
Ooijen,J.W.V.2006.JoinMap 4.0:Software for calculation of geneticlinkage maps.In experimental populations.Kyazma B.V.,Wageningen,Netherlands
Pinyopich,A.et al.2003.Assessing the redundancy of MADS-box genesduring carpel and ovule development.Nature 424:85-8.
Purseglove,J.W.1972.Tropical Crops.Monocotyledons.Longman,London.pp:607.
Rajanaidu,N.,Rao,V.,AbdulHalim,H.&A.S.H.,O.1989.Genetic resources:Newdevelopments in Oil Palm breeding.Elaeis 1:1-10.
Rajanaidu,N.1990.Major developments in oil palm(Elaeis guineensis)breeding.In Proceedings of the 12th Plenary Meeting of AETFAT,pp:39-52.Hamburg,Germany.
Rajanaidu,N.et al.2000.in Advances in OilPalm Research(eds.Basiron,Y.,Jalani,B.S.&Chan,K.W.)171-237(Malaysian Palm Oil Board(MPOB),Bangi,Selangor).
Sambrook,J.,Fritsch,E.F.and Maniatis,T.1989.Molecular cloning:ALaboratory manual,(2nd edition).Cold Spring Harbor Laboratory Press,ColdSpring Harbor,N.Y.
Singh R,Tan SG,Panandam JM,Rahman RA,Ooi LCL,Low ETL,Sharma M,JansenJ and Cheah SC.2009.Mapping quantitative trait loci(QTLs)for fatty acidcomposition in an interspecific cross of oil palm.BMC Plant Biology 9:114.
Sousa,J.,Barata,A.V.,Sousa,C.,Casanova,C.C.and Vicente,L.2011.Chimpanzee oil-palmuse in southern Cantanhez National Park,Guinea-Bissau.Am JPrimatol 73:485-97.
Tani,E.,Polidoros,A.N.&Tsaftaris,A.S.Characterization and expressionanalysis of FRUITFULL-and SHATTERPROOF-like genes frompeach(Prunus persica)and their role in split-pit formation.2007.Tree Physiol 27:649-59.
Vrebalov,J.,Pan,I.L.,Arroyo,A.J.M.,McQuinn,R.,Chung,M.,Poole,M.,Rose,J.,Seymour,G.,Grandillo,S.,Giovannoni,J.,and Irish,V.F.2009.Fleshy fruitexpansion and ripening are regulated by the tomato SHATTERPROOF geneTAGL1.The Plant Cell 21:3041-3062.
Whitmore,T.C.1973.The Palms of Malaya.Longmans,Malaysia,pp:56-58.
术语“一”或“一个”旨在意指“一个或多个”。术语“包括”及其变体例如“包含”和“含有”,当在引用步骤或元件之前时,旨在意指任选的并且不排除增加其他步骤或元件。在本说明书中引用的所有专利、专利申请和其他出版参考资料在此通过援引全部并入本文。
示例性序列的非正式清单
SEQ ID NO:1为SHELL预测蛋白质序列,下划线、斜体和粗体突变
[pisifera,扎伊尔等位基因;shAVROS]
Figure BDA0003564264360000261
SEQ ID NO:2为SHELL预测蛋白质序列,下划线、斜体和粗体突变
[pisifera,尼日利亚等位基因;shMPOB]
Figure BDA0003564264360000262
SEQ ID NO:3为SHELL预测蛋白质序列,下划线、斜体和粗体突变
[预测pisifera,等位基因3]
Figure BDA0003564264360000263
SEQ ID NO:4为SHELL预测蛋白质序列,下划线、斜体和粗体突变
[预测pisifera,等位基因4]
Figure BDA0003564264360000264
SEQ ID NO:5为SHELL预测蛋白质序列,下划线、斜体和粗体突变
[预测pisifera,等位基因5]
Figure BDA0003564264360000265
Figure BDA0003564264360000267
Figure BDA0003564264360000266
Figure BDA0003564264360000268
SEQ ID NO:6为SHELL预测蛋白质序列,下划线、斜体和粗体突变
[预测pisifera,等位基因6]
Figure BDA0003564264360000271
SEQ ID NO:7为SHELL预测蛋白序列,缺失氨基酸由破折号(“-”)表示
[预测pisifera,等位基因7]
MGRGKIE-----NTTSRQVTFCKRRNGLLKKAYELSVLCDAEVALIVFSSRGRLYEYANNSIRSTIDRYKKACANSSNSGATIEINSQYYQQESAKLRHQIQILQNANRHLMGEALSTLTVKELKQLENRLERGITRIRSKKHELLFAEIEYMQKREVELQNDNMYLRAKIAENERAQQAA
SEQ ID NO:8为SHELL预测蛋白质序列,下划线、斜体和粗体突变
[预测pisifera,等位基因8]
Figure BDA0003564264360000272
SEQ ID NO:9为SHELL预测蛋白质序列,下划线、斜体和粗体突变
[预测pisifera,等位基因9]
Figure BDA0003564264360000273
SEQ ID NO:10为SHELL预测蛋白质序列,下划线、斜体和粗体突变
[预测pisifera,等位基因10]
Figure BDA0003564264360000274
SEQ ID NO:11为SHELL预测蛋白质序列,沉默突变产生野生型氨基酸序列
[预测pisifera,等位基因11]
MGRGKIEIKRIENTTSRQVTFCKRRNGLLKKAYELSVLCDAEVALIVFSSRGRLYEYANNSIRSTIDRYKKACANSSNSGATIEINSQYYQQESAKLRHQIQILQNANRHLMGEALSTLTVKELKQLENRLERGITRIRSKKHELLFAEIEYMQKREVELQNDNMYLRAKIAENERAQQAA
SEQ ID NO:12为在SHELL基因的内含子1中的缺失,关于野生型的缺失核苷酸用破折号(“-”)表示
GTATGCTTTGATGACGCCTTCTCTTCCTTCGCTCATATCAAG----TTTTATGGCTTCA T
SEQ ID NO:13为等位基因3的外显子1序列,下划线、斜体和粗体突变
Figure BDA0003564264360000281
SEQ ID NO:14为等位基因4的外显子1序列,下划线、斜体和粗体突变
Figure BDA0003564264360000282
SEQ ID NO:15为等位基因5的外显子1序列,下划线、斜体和粗体突变
Figure BDA0003564264360000283
Figure BDA0003564264360000284
SEQ ID NO:16为等位基因6的外显子1序列,下划线、斜体和粗体突变
Figure BDA0003564264360000285
SEQ ID NO:17为等位基因7的外显子1序列,关于野生型的缺失核苷酸用破折号(“-”)表示
ATGGGTAGAGGAAAGATTGAGA---------------ACACCACAAGCCGGCAGGTCACTTTCTGCAAACGCCGAAATGGACTGCTGAAGAAAGCTTATGAGTTGTCTGTCCTTTGTGATGCTGAGGTTGCCCTTATTGTCTTCTCCAGCCGGGGCCGCCTCTATGAGTACGCCAATAACAG
SEQ ID NO:18为等位基因8的外显子1序列,下划线、斜体和粗体突变
Figure BDA0003564264360000286
SEQ ID NO:19为等位基因9的外显子1序列,下划线、斜体和粗体突变
Figure BDA0003564264360000287
SEQ ID NO:20为等位基因10的外显子1序列,下划线、斜体和粗体突变
Figure BDA0003564264360000288
SEQ ID NO:21为等位基因11的外显子1序列,下划线、斜体和粗体突变
Figure BDA0003564264360000291
SEQ ID NO:22为shAVROS等位基因的外显子1序列,下划线、斜体和粗体突变
Figure BDA0003564264360000292
SEQ ID NO:23为shMPOB等位基因的外显子1序列,下划线、斜体和粗体突变
Figure BDA0003564264360000293
SEQ ID NO:24为野生型SHELL(ShDeliDura)预测蛋白质序列在shAVROS,shMPOB和等位基因3-6以及8-10中突变的氨基酸用下划线、斜体和粗体表示。在等位基因7中突变的氨基酸用下划线表示。
[dura,ShDeliDura]
Figure BDA0003564264360000294
SEQ ID NO:25为野生型(ShDeliDura)外显子1序列,在shAVROS,shMPOB和等位基因3-6以及8-11中突变的核苷酸用下划线、斜体和粗体表示。在等位基因7中缺失的核苷酸用下划线表示。
Figure BDA0003564264360000295
SEQ ID NO:26为与内含子1的核苷酸1-119合并的野生型SHELL(ShDeliDura)外显子1ATGGGTAGAGGAAAGATTGAGATCAAGAGGATCGAGAACACCACAAGCCGGCAGGTCACTTTCTGCAAACGCCGAAATGGACTGCTGAAGAAAGCTTATGAGTTGTCTGTCCTTTGTGATGCTGAGGTTGCCCTTATTGTCTTCTCCAGCCGGGGCCGCCTCTATGAGTACGCCAATAACAGGTATGCTTTGATGACGCCTTCTCTTCCTTCGCTCATATCAAGTTAATTTTATGGCTTCATTTGTTCTATGGCCAAGCCAAATTCTTTTTAAAGTTCTAGAATGTTAATGATGGTAGTTT

Claims (22)

1.一种棕榈科植物或种子的壳表型基因多态标记的基因型检测方法,其特征在于,所述方法包括:检测如下对应的多态标记的基因型:
(i)SHELL基因的外显子1的核苷酸67;或者
(ii)SHELL基因的外显子1的核苷酸69;或者
(iii)SHELL基因的外显子1的核苷酸70;或者
(iv)SHELL基因的外显子1的核苷酸71;或者
(v)SHELL基因的外显子1的核苷酸110;或者
(vi)SHELL基因的外显子1的核苷酸122;或者
(vii)SHELL基因的外显子1的核苷酸23-37;或者
(viii)SHELL基因的外显子1的核苷酸34;或者
(ix)SHELL基因的外显子1的核苷酸114;
并且,其中测出的多态标记的基因型能表明pisifera或dura等位基因的存在、不存在或数量。
2.根据权利要求1所述的方法,其特征在于,
(i)检测对应SHELL基因的外显子1的核苷酸67的多态标记的A→C突变,表明存在pisifera等位基因;或者
(ii)检测对应SHELL基因的外显子1的核苷酸69的多态标记的A→T突变,表明存在pisifera等位基因;或者
(iii)检测对应SHELL基因的外显子1的核苷酸70的多态标记的C→G突变,表明存在pisifera等位基因;或者
(iv)检测对应SHELL基因的外显子1的核苷酸71的多态标记的G→A突变,表明存在pisifera等位基因;或者
(v)检测对应SHELL基因的外显子1的核苷酸110的多态标记的T→A突变,表明存在pisifera等位基因;或者
(vi)检测对应SHELL基因的外显子1的核苷酸122的多态标记的C→A突变,表明存在pisifera等位基因;或者
(vii)检测对应SHELL基因的外显子1的核苷酸位置23-37的多态标记的15个核苷酸缺失,导致在外显子1的翻译开放阅读框的位置8-12处产生5个氨基酸的框架缺失,表明存在pisifera等位基因;或者
(viii)检测对应SHELL基因的外显子1的核苷酸34的多态标记的G→C突变,表明存在pisifera等位基因;或者
(ix)检测对应SHELL基因的外显子1的核苷酸114的多态标记的T→C突变,表明存在pisifera等位基因。
3.根据权利要求2所述的方法,其特征在于,还包括基于所述pisifera或dura等位基因的存在、不存在或数量来预测棕榈科植物或种子的壳表型。
4.根据权利要求2或3所述的方法,其特征在于,通过检测SEQ ID NOs:13、14、15、16、17、18、19、20或21来确定所述pisifera等位基因的存在。
5.根据权利要求1-4中任一项所述的方法,其特征在于,还包括基于多态标记的基因型将所述棕榈植物或种子分组,
其中至少一组仅含有一株(i)预测具有tenera壳表型的植物或种子,或者(ii)预测具有dura壳表型的植物或种子,或者(iii)预测具有posifera壳表型的植物或种子;
其中将存在一种被预测的pisifera等位基因和一种被预测的dura等位基因预测为tenera壳表型;
其中posifera壳表型包括突变的等位基因在所述核苷酸上的的杂合度;或者
其中dura壳表型包括野生型等位基因在所述核苷酸上的的杂合度。
6.根据权利要求1-5中任一项所述的方法,其特征在于,,所述植物或种子产自:(i)具有dura壳表型的植物与具有pisifera壳表型的植物之间尝试杂交,(ii)tenera棕榈的自交,(iii)具有tenera壳表型的两株植物之间的杂交,(iv)dura棕榈和tenera棕榈之间的杂交,或者(v)tenera棕榈和pisifera棕榈之间的杂交。
7.根据权利要求1-6任一项所述的方法,其特征在于,所述棕榈植物的年龄小于5年。
8.根据权利要求1-7任一项所述的方法,其特征在于,如果所述棕榈植物或种子不具有预测为tenera壳表型的基因型,丢弃所述棕榈植物或种子。
9.根据权利要求1-8任一项所述的方法,其特征在于,如果所述棕榈植物或种子具有预测为tenera壳表型的基因型,选择所述棕榈植物或种子。
10.根据权利要求1-8任一项所述的方法,其特征在于,如果所述棕榈植物或种子具有预测为dura壳表型的基因型,选择所述棕榈植物或种子。
11.根据权利要求1-10任一项所述的方法,其特征在于,如果所述棕榈植物或种子具有预测为pisifera壳表型的基因型,选择所述棕榈植物或种子。
12.根据权利要求1-11任一项所述的方法,其特征在于,检测多态标记的基因型还包括测序。
13.根据权利要求1-12任一项所述的方法,其特征在于,所述多态标记为SHELL基因的外显子1的核苷酸122。
14.根据权利要求1-12任一项所述的方法,其特征在于,所述多态标记为SHELL基因的外显子1的核苷酸34。
15.根据权利要求1-12任一项所述的方法,其特征在于,所述多态标记为SHELL基因的外显子1的核苷酸67。
16.根据权利要求1-12任一项所述的方法,其特征在于,所述多态标记为SHELL基因的外显子1的核苷酸69。
17.根据权利要求1-12任一项所述的方法,其特征在于,所述多态标记为SHELL基因的外显子1的核苷酸70。
18.根据权利要求1-12任一项所述的方法,其特征在于,所述多态标记为SHELL基因的外显子1的核苷酸71。
19.根据权利要求1-12任一项所述的方法,其特征在于,所述多态标记为SHELL基因的外显子1的核苷酸110。
20.根据权利要求1-12任一项所述的方法,其特征在于,所述多态标记为SHELL基因的外显子1的核苷酸122。
21.根据权利要求1-12任一项所述的方法,其特征在于,所述多态标记为SHELL基因的外显子1的核苷酸23-37。
22.根据权利要求1-12任一项所述的方法,其特征在于,所述方法减少了植物或种子被非tenera的污染。
CN202210308694.XA 2015-06-15 2016-06-14 用于控制棕榈壳表型的mads-box域的等位基因 Pending CN114606338A (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US201562180042P 2015-06-15 2015-06-15
US62/180,042 2015-06-15
PCT/US2016/037429 WO2016205240A2 (en) 2015-06-15 2016-06-14 Mads-box domain alleles for controlling shell phenotype in palm
CN201680047538.5A CN109311952B (zh) 2015-06-15 2016-06-14 用于控制棕榈壳表型的mads-box域的等位基因

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201680047538.5A Division CN109311952B (zh) 2015-06-15 2016-06-14 用于控制棕榈壳表型的mads-box域的等位基因

Publications (1)

Publication Number Publication Date
CN114606338A true CN114606338A (zh) 2022-06-10

Family

ID=57546171

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202210308694.XA Pending CN114606338A (zh) 2015-06-15 2016-06-14 用于控制棕榈壳表型的mads-box域的等位基因
CN201680047538.5A Active CN109311952B (zh) 2015-06-15 2016-06-14 用于控制棕榈壳表型的mads-box域的等位基因

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN201680047538.5A Active CN109311952B (zh) 2015-06-15 2016-06-14 用于控制棕榈壳表型的mads-box域的等位基因

Country Status (8)

Country Link
US (2) US10905061B2 (zh)
EP (1) EP3307763B1 (zh)
CN (2) CN114606338A (zh)
BR (1) BR112017027201A2 (zh)
CO (1) CO2018000194A2 (zh)
CR (1) CR20180032A (zh)
SG (1) SG10201912026YA (zh)
WO (1) WO2016205240A2 (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BR112017027201A2 (pt) * 2015-06-15 2018-10-30 Malaysian Palm Oil Board alelos de domínio mads-box para controlar o fenótipo de casca em palmeira
CN108441546A (zh) * 2018-04-10 2018-08-24 中国热带农业科学院椰子研究所 一种油棕种壳厚度的分子标记早期鉴定方法
CN109536506B (zh) * 2018-12-10 2022-03-22 潍坊科技学院 一种调控日本沼虾生长发育的类胰岛素受体基因及其应用
CN112341529B (zh) * 2020-11-17 2022-04-12 西南大学 蜡梅CpFPA基因及其编码的蛋白与应用
CN113584203B (zh) * 2021-07-23 2023-06-23 中国林业科学研究院亚热带林业研究所 与油茶单果质量相关的dna片段、其紧密连锁的snp分子标记及其应用
CN114058630B (zh) * 2021-11-25 2022-06-07 仲恺农业工程学院 荔枝MADS-box转录因子LcMADS1及其在抑制植物器官脱落中的应用
CN115011600B (zh) * 2022-06-17 2023-08-22 哈尔滨师范大学 一种响应缺铁胁迫的诱导型启动子GmbHLH47启动子及其应用

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100286068A1 (en) * 2000-12-20 2010-11-11 Malaysian Palm Oil Board Molecular markers of plant embryogenesis
WO2015010008A1 (en) * 2013-07-18 2015-01-22 Malaysian Palm Oil Board Detection methods for oil palm shell alleles
CN104486940A (zh) * 2012-03-19 2015-04-01 马来西亚棕榈油协会 控制棕榈壳表型的基因

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8793535B2 (en) 2011-07-21 2014-07-29 Microsoft Corporation Optimizing system usage when running quality tests in a virtual machine environment
US20150024388A1 (en) * 2013-07-19 2015-01-22 Malaysian Palm Oil Board Expression of SEP-like Genes for Identifying and Controlling Palm Plant Shell Phenotypes
BR112017027201A2 (pt) * 2015-06-15 2018-10-30 Malaysian Palm Oil Board alelos de domínio mads-box para controlar o fenótipo de casca em palmeira

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100286068A1 (en) * 2000-12-20 2010-11-11 Malaysian Palm Oil Board Molecular markers of plant embryogenesis
CN104486940A (zh) * 2012-03-19 2015-04-01 马来西亚棕榈油协会 控制棕榈壳表型的基因
WO2015010008A1 (en) * 2013-07-18 2015-01-22 Malaysian Palm Oil Board Detection methods for oil palm shell alleles

Also Published As

Publication number Publication date
CR20180032A (es) 2018-07-31
EP3307763A4 (en) 2018-12-05
SG10201912026YA (en) 2020-02-27
CN109311952A (zh) 2019-02-05
CO2018000194A2 (es) 2018-03-28
EP3307763B1 (en) 2021-08-04
US20180160639A1 (en) 2018-06-14
BR112017027201A2 (pt) 2018-10-30
EP3307763A2 (en) 2018-04-18
CN109311952B (zh) 2022-03-18
WO2016205240A3 (en) 2017-04-27
US10905061B2 (en) 2021-02-02
WO2016205240A2 (en) 2016-12-22
US20210105961A1 (en) 2021-04-15

Similar Documents

Publication Publication Date Title
US11371104B2 (en) Gene controlling shell phenotype in palm
CN109311952B (zh) 用于控制棕榈壳表型的mads-box域的等位基因
CN112351679B (zh) 鉴定、选择和产生南方玉米锈病抗性作物的方法
US11560601B2 (en) Gene controlling fruit color phenotype in palm
US20220154202A1 (en) Gene Regulating Seed Weight in Improving Seed Yield in Soybean
EP2621943B1 (en) Modulation of solanaceae fruit ripening
CN112521471B (zh) 一个控制玉米籽粒含水量的基因和分子标记及其应用
EP2683832A1 (en) Tyclv resistance
JP5769341B2 (ja) 植物の開花性/閉花性を支配する遺伝子およびその利用
US20110277183A1 (en) Alteration of plant architecture characteristics in plants
CN114269934A (zh) 鉴定、选择和产生炭疽茎腐病抗性作物的方法
US9702014B1 (en) Compositions and methods for the detection of the shrunken2-R mutation in maize
US20170303486A1 (en) Genetic loci associated with culture and transformation in maize
CN117998982A (zh) 用于灰叶斑病抗性的组合物和方法
CA3110863A1 (en) Genetic regions & genes associated with increased yield in plants

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination