CN108368518A - 制备单倍体和随后的双单倍体植物的方法 - Google Patents

制备单倍体和随后的双单倍体植物的方法 Download PDF

Info

Publication number
CN108368518A
CN108368518A CN201680070676.5A CN201680070676A CN108368518A CN 108368518 A CN108368518 A CN 108368518A CN 201680070676 A CN201680070676 A CN 201680070676A CN 108368518 A CN108368518 A CN 108368518A
Authority
CN
China
Prior art keywords
plant
msi2
albumen
nucleic acid
endogenous
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201680070676.5A
Other languages
English (en)
Other versions
CN108368518B (zh
Inventor
R·H·M·奥普德恩坎普
P·J·范戴克
A·加勒德
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Main Gene Co Ltd
Original Assignee
Main Gene Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Main Gene Co Ltd filed Critical Main Gene Co Ltd
Publication of CN108368518A publication Critical patent/CN108368518A/zh
Application granted granted Critical
Publication of CN108368518B publication Critical patent/CN108368518B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H1/00Processes for modifying genotypes ; Plants characterised by associated natural traits
    • A01H1/06Processes for producing mutations, e.g. treatment with chemicals or with radiation
    • A01H1/08Methods for producing changes in chromosome number
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/415Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells
    • C12N15/8218Antisense, co-suppression, viral induced gene silencing [VIGS], post-transcriptional induced gene silencing [PTGS]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • C12N15/8287Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for fertility modification, e.g. apomixis
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A40/00Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
    • Y02A40/10Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture
    • Y02A40/146Genetically Modified [GMO] plants, e.g. transgenic plants

Landscapes

  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Molecular Biology (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Cell Biology (AREA)
  • Botany (AREA)
  • Developmental Biology & Embryology (AREA)
  • Environmental Sciences (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Medicinal Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Virology (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Peptides Or Proteins (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

据发现由于导致在Msi2蛋白中引入过早的终止密码子的核苷酸多态性而具有功能丧失性Msi2蛋白的植物能够在与包含功能性Msi2蛋白的野生型植物杂交之后诱导单倍体后代。本发明涉及单倍体和双单倍体植物的产生。

Description

制备单倍体和随后的双单倍体植物的方法
发明领域
本公开涉及农业领域。特别地,本公开涉及制备单倍体和随后的双单倍体植物。
发明背景
育种材料中的高度杂合性可以使对有益性状的植物育种和选择成为非常耗时的过程。即使用最新的分子育种工具,大量的群体筛选也是费力和昂贵的。
产生单倍体植物然后化学或自发基因组加倍是解决高杂合性问题的有效方式。这类双单倍体避开至少7代自交,否则需要降低杂合性至可接受的水平。可以通过小孢子培养在一些作物中产生单倍体植物。但是,这是昂贵和耗时的。更重要的是,在许多作物中,小孢子培养方法不可行。在一些作物物种中,可以通过卵细胞的孤雌生殖或通过消除亲代基因组之一获得(双)单倍体植物。但是,这些方法也局限于一些选定的作物,并且双单倍体植物的产率很低。
WO2011/044132公开了制备单倍体植物的方法。采用的方法之一是失活或敲除CenH3蛋白。这通过添加N-末端GFP至CenH3蛋白进行,从而产生GFP-CenH3。这也称作“尾部交换”。在与没有这样修饰的N-末端部分的CenH3蛋白的植物杂交时尾部交换足以诱导单亲基因组消除。单亲基因组消除导致产生单倍体植物。到目前为止这种方法仅在模式植物拟南芥(Arabidopsis thaliana)中证实,并未在作物中证实。此外,当将由不同转基因修饰的N-末端部分的CenH3蛋白组成的另一人工构建体引入具有没有内源性CenH3的遗传背景的植物时,看来这并未导致单亲基因组消除以及随后产生单倍体植物(WO 2014/110274)。因此难以捉摸CenH3蛋白的哪个修饰对于单亲基因组消除是足够的。
因此,本领域需要允许高效产生随后可以加倍的单倍体植物的方法,以便产生双单倍体植物。用双单倍体制备系统,在一代中实现纯合性。
发明概述
本发明人现在已发现由于番茄(Solanum lycopersicum)Msi2蛋白中位置126处导致K至STOP密码子氨基酸修饰的独特单核苷酸多态性而具有功能丧失性Msi2蛋白的番茄植物能够在与包含功能性Msi2蛋白的野生型植物杂交之后诱导单倍体后代。通过计算方法发现Msi2蛋白中导致K至M氨基酸修饰的单核苷酸多态性是非破化性的(SIFT,Kumar P,Henikoff S,Ng PC.(2009)Predicting the effects of coding non-synonymousvariants on protein function using the SIFT algorithm.Nat Protoc;4(7):1073-81)。与这些模型一致,后一氨基酸修饰在与Msi2蛋白中没有该特定K至M氨基酸修饰的野生型植物杂交之后不诱导单倍体后代。与不改变氨基酸序列的同义单核苷酸多态性(Msi2D337D)相互对照杂交不产生任何单倍体后代。
在第一方面,本发明涉及包含功能丧失性突变的植物来源的Msi2蛋白。
所述突变可以存在于WD40重复和/或CAF1C结构域中。
所述Msi2蛋白可以由具有功能丧失性突变的植物Msi2蛋白编码多核苷酸编码,当存在于没有其内源性Msi2蛋白的植物中时,当所述植物与野生型植物杂交时,所述蛋白允许产生一些单倍体子代或具有异常倍性的子代。
所述Msi2蛋白可以源自包含SEQ ID NO:1或10的氨基酸序列或其变体的多肽,所述变体与SEQ ID NO:1或10的氨基酸序列具有至少70%,更优选至少80%,甚至更优选至少90%,甚至更优选至少95%,最优选至少98%或99%序列相同性,所述蛋白由具有功能丧失性突变的植物Msi2蛋白编码多核苷酸编码,当存在于没有其内源性Msi2蛋白的植物中时,当所述植物与野生型植物杂交时,所述蛋白允许产生一些单倍体子代或具有异常倍性的子代。
所述Msi2蛋白可以源自包含SEQ ID NO:2或3的氨基酸序列或其变体的多肽,所述变体与SEQ ID NO:2或3的氨基酸序列具有至少70%,更优选至少80%,甚至更优选至少90%,甚至更优选至少95%,最优选至少98%或99%序列相同性,所述蛋白由具有功能丧失性突变的植物Msi2蛋白编码多核苷酸编码,当存在于没有其内源性Msi2蛋白的植物中时,当所述植物与野生型植物杂交时,所述蛋白允许产生一些单倍体子代或具有异常倍性的子代。例如,所产生的子代的至少0.1、0.5、1或5%是单倍体,或者具有异常倍性,或者是双单倍体。
功能丧失性突变可以引入引起所述蛋白截短的过早的终止密码子。例如,所述蛋白可以在SEQ ID NO:2、3或10中位置125处的氨基酸残基之后截短,或者在SEQ ID NO:1中位置123处的氨基酸残基之后截短。
在实施方案中,Msi2蛋白包含SEQ ID NO:6的氨基酸序列或由SEQ ID NO:6的氨基序列组成。
在实施方案中,Msi2蛋白可以由包含SEQ ID NO:4或9的核酸序列的核酸分子编码。
Msi2蛋白可以由包含功能丧失性突变的多核苷酸编码,所述多核苷酸利用靶向核苷酸交换或通过应用内切核酸酶衍生自编码内源性Msi2蛋白的多核苷酸。
在另一方面,本发明提供编码本文教导的Msi2蛋白的核酸分子。
本发明还提供包含SEQ ID NO:5、7或8的核酸序列或其变体的核酸分子,所述变体与SEQ ID NO:5、7或8的核酸序列具有至少70%,更优选至少80%,甚至更优选至少90%,甚至更优选至少95%,最优选至少98%或99%序列相同性,其中将SEQ ID NO:5、7或8的核酸序列的一个或多个核苷酸修饰,从而核酸分子编码包含功能丧失性突变的Msi2蛋白。
本发明还提供包含SEQ ID NO:5、7或8的核酸序列或其变体的核酸分子,所述变体与SEQ ID NO:5、7或8的核酸序列具有至少70%,更优选至少80%,甚至更优选至少90%,甚至更优选至少95%,最优选至少98%或99%序列相同性,其中将一个或多个核苷酸修饰,从而引入过早的终止密码子并且核酸分子编码截短的Msi2蛋白。
在实施方案中,将在SEQ ID NO:5或7的核酸序列的位置376、377和/或378处的一个或多个核苷酸,或者在SEQ ID NO:8的核酸序列的位置685、686和/或687处的一个或多个核苷酸修饰,从而引入终止密码子,并且核酸分子编码包含在对应于SEQ ID NO:2或3中位置125的氨基酸残基之后截短的氨基酸序列的多肽。
还教导包含SEQ ID NO:4或9的核酸序列的核酸分子。
本文教导的核酸分子可以是分离的核酸、基因组核酸或cDNA。
本发明进一步提供包含本文教导的核酸分子的嵌合基因,以及包含本文教导的核酸分子或本文教导的嵌合基因的载体。
本发明进一步涉及包含本文教导的核酸分子、本文教导的嵌合基因或本文教导的载体的宿主细胞。
所述宿主细胞可以是植物细胞,包括原生质体,优选番茄植物细胞。
还公开了包含如本文教导的核酸分子、如本文教导的嵌合基因或如本文教导的载体的植物、种子或植物细胞。
在实施方案中,内源性Msi2蛋白在所述植物、种子或植物细胞中不表达。
本发明还涉及植物、种子或植物细胞,其中内源性Msi2蛋白不表达,例如,其中将内源性Msi2基因敲除。在实施方案中,所述植物、种子或植物细胞不是拟南芥植物、种子或植物细胞。
所述植物、种子或植物细胞可以是茄属植物、种子或植物细胞,优选番茄植物、种子或植物细胞。
本发明进一步涉及一种制备如本文教导的植物、种子或植物细胞的方法,所述方法包括以下步骤:
a)修饰植物细胞内的内源性Msi2基因以获得编码如本文教导的Msi2蛋白的突变的Msi2基因,或者修饰植物细胞内的内源性Msi2基因以敲除植物细胞内的内源性Msi2蛋白表达;
b)选择包含突变的Msi2基因的植物细胞,或者其中敲除所述内源性Msi2蛋白表达的植物细胞;以及
c)任选地,从所述植物细胞再生植物。
本发明还涉及一种制备如本文教导的植物、种子或植物细胞的方法,所述方法包括以下步骤:
a)用如本文教导的核酸分子、如本文教导的嵌合基因或如本文教导的载体转化植物细胞,或者用核酸分子转化植物细胞以敲除内源性Msi2蛋白表达;
b)任选地,额外地修饰植物细胞内的内源性Msi2基因以敲除所述植物细胞内的内源性Msi2蛋白表达;
c)选择包含如本文教导的核酸分子、如本文教导的嵌合基因或如本文教导的载体的植物细胞,和/或其中敲除内源性Msi2蛋白表达的植物细胞;以及
d)任选地,从所述植物细胞再生植物。
在另一方面,本发明提供一种产生单倍体植物、具有异常倍性的植物或双单倍体植物的方法,所述方法包括以下步骤:
a)将表达内源性Msi2蛋白的植物与如本文教导的植物杂交,其中如本文教导的植物至少在其生殖部分和/或在胚发育期间没有内源性Msi2蛋白表达;
b)收获种子;
c)从所述种子种植至少一个幼苗、小植物或植物;以及
d)选择单倍体幼苗、小植物或植物,具有异常倍性的幼苗、小植物或植物,或者双单倍体幼苗、小植物或植物。
本发明还涉及一种产生双单倍体植物的方法,所述方法包括以下步骤:
a)将表达内源性Msi2蛋白的植物与如本文教导的植物杂交,其中如本文教导的植物至少在其生殖部分和/或在胚发育期间没有内源性Msi2蛋白表达;
b)选择单倍体植物;以及
c)将所述单倍体植物转化为双单倍体植物。
步骤c)中的转化可以通过用秋水仙碱处理进行。
表达内源性Msi2蛋白的植物可以是F1植物。
表达内源性Msi2蛋白的植物可以是杂交的花粉亲本,或者可以是杂交的胚珠亲本。
杂交可以在约24℃-约30℃范围中的温度下进行,优选在约26℃-约28℃的范围中。
本发明进一步涉及如本文教导的核酸分子在制备单倍体诱导系中的用途。
本发明还涉及包含如本文教导的核酸分子、如本文教导的嵌合基因或如本文教导的载体的番茄植物、种子或植物细胞。
此外,本文教导包含编码多肽的核酸分子的番茄植物、种子或植物细胞,所述多肽包含SEQ ID NO:6的氨基酸序列。
本文还教导包含SEQ ID NO:4或9的核酸分子的番茄植物、种子或植物细胞。
在另一方面,提供包含编码如本文教导的Msi2蛋白的核酸分子的番茄植物、种子或植物细胞。
本文还教导没有功能性Msi2蛋白表达的番茄植物、种子或植物细胞;任选地,其中表达包含功能丧失性突变的Msi2蛋白。
如本文教导的番茄植物可以用于产生单倍体番茄植物,和/或用于产生双单倍体番茄植物。
本文教导的番茄植物可能至少在其生殖部分和/或在胚发育期间没有内源性Msi2蛋白表达。
在最后一方面,本发明涉及一种产生单倍体或双单倍体植物的方法,所述方法包括鉴定表达内源性Msi2蛋白的植物和如本文教导的植物的步骤,其中如本文教导的植物至少在其生殖部分和/或在胚发育期间没有内源性Msi2蛋白表达。
如本文教导的杂交方法不包括有性杂交所述植物的整个基因组。
定义
术语“Msi2”是指Musashi RNA-结合蛋白2。其是包含WD-40重复的蛋白。WD-40重复(也称作WD或β-转导蛋白重复)是短的~40氨基酸的基序,常以Trp-Asp(W-D)二肽终止。WD40重复通常呈现7-8叶的β-螺旋桨折叠(7-8bladed beta-propeller fold),但是已发现蛋白具有4-16个重复单元,其也形成环形(circularized)β-螺旋桨结构。WD-重复蛋白是在所有真核生物中发现的巨大家族,并且牵涉各种功能,范围从信号转导和转录调节至细胞周期控制和凋亡。重复的WD40基序充当蛋白-蛋白相互作用的位点,并且已知包含WD40重复的蛋白用作蛋白复合物组装的平台或其他蛋白间瞬时相互作用的中介物。通过它们本身的重复外的序列确定蛋白的特异性。据认为Msi2是在翻译水平调节靶mRNA表达的RNA结合蛋白。在拟南芥属物种(Arabidopsis spp.)中,几种包含WD40的蛋白充当植物特异性发育事件的关键调节物。据报道拟南芥Msi2(At2g16780)T-DNA插入突变体和Msi2过量表达转基因植物具有与野生型相同的表型。野生型中Msi2基因的表达不可以通过干旱、盐、高温、低温、甘露醇、ABA、GA、水杨酸和茉莉酸诱导。在35S启动子控制下利用由全长Msi2cDNA和GFP组成的融合蛋白的定位研究显示在胞质和核中均检测到荧光。Msi2在植物中的确切作用仍是未知的。
“突变”是生物体的基因组、病毒或染色体外DNA或其他遗传元件的核苷酸序列的永久改变。突变由未修复的DNA损伤或RNA基因组损伤(通常由辐射或化学诱变剂引起)、复制过程中的错误所致,或者由通过可动遗传元件插入或缺失DNA片段所致。突变可以在生物体的可观察的特征(表型)中产生或不产生可辨别的变化。突变可以导致几种不同类型的序列改变。基因中的突变可以没有效果,改变基因产物,或者防止基因正常或完全发挥功能。突变还可以发生在非基因区中。
在本发明的上下文中蛋白中的“功能丧失性突变”是指引起蛋白功能丧失的蛋白中的突变。多核苷酸中的“功能丧失性突变”是指编码蛋白的多核苷酸中的突变,其引起所述蛋白的功能丧失。蛋白可以仍产生自包含功能丧失性突变的多核苷酸,但是蛋白不再可以发挥其功能或不可以有效发挥其功能。
“表达丧失突变”导致突变基因的表达丧失或所述突变基因编码的产物丧失。
“功能丧失的Msi2蛋白”是包含功能丧失性突变的Msi2蛋白。当存在于没有其内源性Msi2蛋白的植物中时,当所述植物与野生型植物杂交时,优选相同物种的野生型植物,所述功能丧失的Msi2蛋白允许产生一些单倍体子代或具有异常倍性的子代。通过利用该蛋白的抑制剂,功能丧失的Msi2蛋白还可以变为非功能性的或较少功能的,如特异性结合Msi2蛋白的抗体,或者其他Msi2抑制剂,例如阻断、防止或减少内源性Msi2蛋白活性的蛋白,或者化学抑制剂如离子,或金属,或辅因子的清除。例如,特异性结合Msi2蛋白的抗体可以与所述Msi2蛋白同时表达,从而减少其特异性活性。Msi2蛋白功能可以受损,或者Msi2蛋白可以功能比内源性Msi2蛋白少。
“功能丧失的Msi2蛋白编码多核苷酸”是指编码包含功能丧失性突变的Msi2蛋白的非内源性的、突变的Msi2蛋白编码多核苷酸,当存在于没有其内源性Msi2蛋白编码多核苷酸的植物中时,当所述植物与野生型植物杂交时,优选相同物种的野生型植物,其允许产生一些单倍体子代或具有异常倍性的子代。功能丧失性突变包括移码突变。
如本发明的上下文中使用的术语“内源性”与蛋白、基因或多核苷酸组合表示所述蛋白、基因或多核苷酸源自其中仍包含它的植物。通常内源性基因存在于其植物中的正常遗传背景中。
如本文所用的术语“基因”是指包含区域(转录区)的DNA序列,所述区域在细胞中转录为RNA分子(例如mRNA),可操作地连接至合适的调节区(例如启动子)。因此基因可以包含几个可操作地连接的序列,如启动子、包含例如参与翻译起始的序列的5’前导序列、(蛋白)编码区(cDNA或基因组DNA)以及包含例如转录终止位点的3’非翻译序列。
本公开的上下文中使用的术语“单倍体诱导系”是指与非诱导系的不同之处在于至少一个单核苷酸多态性的植物系。当单倍体诱导系用作雌性或花粉供体杂交时,其导致单倍体诱导系基因组的单亲基因组消除。
如本文所用的术语“单亲基因组消除”是指不考虑杂交方向的杂交之后一个亲本丢失所有遗传信息(意味着所有染色体)的效果。这以这样的方式发生,这样的杂交的后代仅包含未消除的亲本基因组的染色体。消除的基因组通常具有单倍体诱导亲本中的来源。
“双单倍体”是在单倍体细胞经历染色体加倍时形成的基因型。其可以通过诱导或自发的染色体加倍从单倍体细胞产生。对于单倍体植物,单倍体细胞是单倍的,并且术语“双单倍”也可以用于双单倍体。
“移码突变”(也称作框架错误或读框移位)是由核苷酸序列中不能被3整除的许多核苷酸插入缺失(插入或缺失)引起的遗传突变。由于基因表达通过密码子的三重性,插入或缺失可以改变读框(密码子的分组),导致模板完全不同的翻译。缺失或插入在序列中发生越早,蛋白产物改变越多。移码突变一般会导致将突变后密码子的读为不同氨基酸的编码,但是可能有遗传密码冗余性所致的例外。此外,原始序列中的终止密码子不会阅读,并且替代终止密码子可能导致较早或较晚的终止位点。蛋白产物可能是异常短的或异常长的。
术语“多核苷酸”、“核酸分子”和“核酸”在本文中可交换使用。
“嵌合基因”(或重组基因)是指任何基因,其在自然界中通常不存在于一个物种中,特别是其中存在自然界中互相不相关的核酸序列的一个或多个部分的基因。例如启动子在自然界中与部分或全部的转录区或者与另一调节区不相关。术语“嵌合基因”理解为包括表达构建体,其中将启动子或转录调节序列可操作地连接至一个或多个编码序列或者连接至反义(正义链的反向补体)或反向重复序列(正义和反义,从而RNA转录物在转录时形成双链RNA)。
“序列相同性”和“序列相似性”可以通过利用全局或局部比对算法比对两个肽或两个核苷酸序列确定。然后当它们(当通过例如程序GAP或BESTFIT利用缺省参数最佳比对时)享有至少某个最小百分比的序列相同性时(如下文定义),序列可以称作“基本上相同”或“基本上相似”。GAP使用Needleman和Wunsch全局比对算法以在它们的整个长度比对两个序列,最大化匹配的数量并最小化缺口的数量。一般来说,使用GAP缺省参数,空位形成罚分=50(核苷酸)/8(蛋白),而空位延伸罚分=3(核苷酸)/2(蛋白)。对于核苷酸,使用的缺省评分矩阵是nwsgapdna,而对于蛋白,缺省评分矩阵是Blosum62(Henikoff&Henikoff,1992,PNAS 89,915-919)。百分比序列相同性的序列比对和评分可以利用计算机程序确定,如GCGWisconsin Package,10.3版,可获得自Accelrys Inc.,9685 Scranton Road,San Diego,CA 92121-3752 USA,或者EmbossWin 2.10.0版(使用程序“needle”)。或者百分比相似性或相同性可以通过利用算法如FASTA、BLAST等搜索数据库确定。
术语“宿主细胞”或“重组宿主细胞”或“转化的细胞”是指因为引入至少一个核酸分子,特别是包含编码期望蛋白的嵌合基因而产生的新单个细胞(或生物体)。宿主细胞优选植物细胞或细菌细胞。宿主细胞可以包含核酸分子或嵌合基因作为染色体外(游离)复制分子,或者更优选地,包含整合在宿主细胞的核或质体基因组中的核酸分子或嵌合基因。
如本文所用,术语“植物”包括植物细胞,植物组织或器官,植物原生质体,由其可以再生植物的植物细胞组织培养物,植物愈伤组织,植物细胞团块,以及在植物中完整的植物细胞,或者植物的部分,如胚、花粉、胚珠、果实(例如收获的番茄)、花、叶、种子、根、根尖等。
在这个文件及其权利要求书中,动词“包含”及其变化形式以其非限制性的意义使用,表示包括单词之后的项目,但是不排除未具体提到的项目。其涵盖动词“基本上由…组成”和“由…组成”。
此外,通过不定冠词“一个(a)”或“一个(an)”引用元素不排除存在一个以上元素的可能性,除非上下文清楚要求有一个和仅一个元素。因此不定冠词“一个(a)”或“一个(an)”通常表示“至少一个”。进一步理解,当在本文中提到“序列”时,一般是指具有一定序列的亚基(例如氨基酸)的实际物理分子。
发明详述
发明的作用模式
据信其中功能性Msi2蛋白的表达受损和/或Msi2蛋白的功能性受损的植物,导致功能性Msi2蛋白不存在或存在减少,给予这类植物单倍体诱导表型。当所述植物与性相容的野生型植物杂交时,优选相同物种的野生型植物,以相对高的频率诱导产生一些单倍体子代或具有异常倍性的子代。利用这类植物产生的单倍体子代或具有异常倍性的子代的百分比可以是例如至少0.1、0.5、1、5、10、20%或更多。
受损的功能性Msi2蛋白表达可以表示Msi2基因的表达受损,和/或Msi2基因的表达正常,但是转录mRNA的翻译受到抑制或阻止(例如通过RNA干扰)。
在转录水平受损的功能性Msi2蛋白表达可以是在转录调节序列引入一个或多个突变的结果,包括启动子、增强子或者起始、终止或内含子剪接序列。这些序列一般位于编码Msi2蛋白的基因的5’或3’或编码序列内。可选地或额外地,受损的功能性Msi2蛋白表达还可以通过内源性Msi2基因的编码区中核苷酸的缺失、取代、重排或插入实现。例如,在编码区中,可以将核苷酸取代、插入或缺失,导致引入1、2或3个提取终止密码子。而且,插入、缺失、重排或取代可以导致编码的氨基酸序列中的修饰,从而提供受损的功能性Msi2蛋白表达。可以去除大部分的Msi2基因,例如,可以从植物中存在的DNA去除10%、20%、30%、40%、50%、60%、70%、80%、90%或甚至100%的Msi2基因(的编码区),从而损害功能性Msi2蛋白表达。
或者,可以将1、2、3或更多个核苷酸引入Msi2基因,导致例如移码,或者将额外的氨基酸引入Msi2蛋白,或者引入不编码氨基酸的核酸序列,或者引入大插入物(例如,T-DNA插入),从而损害功能性Msi2蛋白的提供/表达。
在翻译水平受损可以通过引入过早的终止密码子实现,或者通过影响蛋白加工机制(如剪接)的其他RNA或翻译后修饰影响,例如,蛋白折叠或细胞运输。
在蛋白水平受损或功能丧失可以通过截短提供,或者通过修饰对活性、底物结合、辅因子结合、折叠、蛋白-蛋白相互作用等重要的氨基酸残基。
功能性Msi2蛋白的表达受损还可以通过基因沉默完成,例如,利用CRISP、RNAi、VIGS等。
此外,功能性Msi2蛋白的表达受损可以通过利用Msi2蛋白的抑制剂实现,如特异性结合Msi2蛋白的抗体,或者其他Msi2抑制剂,例如阻断、防止或减少内源性Msi2蛋白活性的蛋白,或者化学抑制剂如离子,或金属,或辅因子的清除。例如,特异性结合Msi2蛋白的抗体可以与所述Msi2蛋白同时表达,从而减少其特异性活性。
包含功能丧失性突变的Msi2蛋白
本发明提供Msi2蛋白,优选植物来源的,包含一个或多个功能丧失性突变。当表达包含一个或多个功能丧失性突变的这类Msi2蛋白且没有内源性Msi2蛋白表达或具有受到抑制的Msi2蛋白表达的植物与表达内源性Msi2蛋白的野生型植物杂交时,以相对高的频率形成单倍体植物。以大于正常的频率形成单倍体植物,如至少0.1、0.5、1、5、10、20%或更多。包含一个或多个功能丧失性突变的Msi2蛋白可以通过技术人员已知的各种方法产生。这些包括但不限于随机诱变、单或多氨基酸靶向诱变、产生完整或部分蛋白结构域缺失、与异源氨基酸序列融合等。通常,将编码内源性Msi2蛋白的多核苷酸敲除或失活以产生没有内源性Msi2蛋白表达的植物。
包含一个或多个功能丧失性突变的Msi2蛋白可以这样测试,例如,在没有内源性Msi2蛋白表达的植物中重组表达包含一个或多个功能丧失性突变的Msi2蛋白,将转基因植物与表达内源性Msi2蛋白的植物杂交,然后筛选单倍体子代的产生。
可以将任何数量的突变引入内源性Msi2蛋白以产生包含一个或多个功能丧失性突变的Msi2蛋白。例如,包含一个或多个功能丧失性突变的Msi2蛋白可以与内源性Msi2蛋白相同,除了1、2、3、4、5、6、7、8或更多个氨基酸。
Msi2蛋白优选植物Msi2蛋白。所述植物可以是任何植物,但是优选属于茄科,更优选属于茄属,甚至更优选属于物种番茄。
在实施方案中,在如SEQ ID NO:1、10、2或3中任一个示出的氨基酸序列所示的内源性Msi2蛋白中产生一个或多个功能丧失性突变。作为一种选择或额外地,在如SEQ IDNO:1、10、2或3中任一个或其变体示出的氨基酸序列所示的内源性Msi2蛋白中产生一个或多个功能丧失性突变,所述变体与SEQ ID NO:1、10、2或3中任一个的氨基酸序列具有至少70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多如100%氨基酸序列相同性,优选在整个长度中。利用Needleman和Wunsch算法以及如上文定义的GAP缺省参数通过成对比对确定氨基酸序列相同性。
包含一个或多个功能丧失性突变的Msi2蛋白内的一个或多个功能丧失性突变可以位于整个蛋白。在实施方案中,功能丧失性突变位于如SEQ ID NO:1、10、2或3中任一个示出的氨基酸序列所示的内源性Msi2蛋白或者其如本文教导的变体的WD40重复或CAF1C结构域中。
本文教导的Msi2蛋白可以由具有功能丧失性突变的植物Msi2蛋白编码多核苷酸编码。当存在于没有其内源性Msi2蛋白的植物中时,当所述植物与野生型植物杂交时,所述蛋白允许产生一些单倍体子代或具有异常倍性的子代,不影响所述植物的生存力。
本文教导的Msi2蛋白可以源自包含SEQ ID NO:1或10的氨基酸序列或其变体的多肽,所述变体与SEQ ID NO:1或10的氨基酸序列具有至少70%,更优选至少80%,甚至更优选至少90%,甚至更优选至少95%,最优选至少98%或99%序列相同性,所述蛋白由具有功能丧失性突变的植物Msi2蛋白编码多核苷酸编码,当存在于没有其内源性Msi2蛋白的植物中时,当所述植物与野生型植物杂交时,所述蛋白允许产生一些单倍体子代或具有异常倍性的子代。
本文教导的Msi2蛋白可以源自包含SEQ ID NO:2或3的氨基酸序列或其变体的多肽,所述变体其与SEQ ID NO:2的氨基酸序列具有至少70%,更优选至少80%,甚至更优选至少90%,甚至更优选至少95%,最优选至少98%或99%序列相同性,所述多肽由具有功能丧失性突变的植物Msi2蛋白编码多核苷酸编码,当存在于没有其内源性Msi2蛋白的植物中时,当所述植物与野生型植物杂交时,所述多肽允许产生一些单倍体子代或具有异常倍性的子代。
本文教导的Msi2蛋白可以源自包含SEQ ID NO:3的氨基酸序列或其变体的多肽,所述变体与SEQ ID NO:3的氨基酸序列具有至少70%,更优选至少80%,甚至更优选至少90%,甚至更优选至少95%,最优选至少98%或99%序列相同性,所述多肽由具有功能丧失性突变的植物Msi2蛋白编码多核苷酸编码,当存在于没有其内源性Msi2蛋白的植物中时,当所述植物与野生型植物杂交时,其允许产生一些单倍体子代或具有异常倍性的子代。
合适地,当如本文教导的植物与野生型植物杂交时,所产生的子代的至少0.1、0.5、1或5%是单倍体,或者具有异常倍性,或者是双单倍体。
在实施方案中,一个或多个功能丧失性突变引入引起蛋白截短的过早的终止密码子。
在实施方案中,蛋白在SEQ ID NO:2或3中位置125处的氨基酸残基之后截短。
在实施方案中,本文教导的Msi2蛋白由包含SEQ ID NO:4或9的核酸序列的核酸分子编码。
编码包含一个或多个功能丧失性突变的Msi2蛋白的多核苷酸、嵌合基因、载体、宿 主细胞
还提供具有编码任何上述蛋白的核酸序列的多核苷酸,如cDNA、基因组DNA和RNA分子。由于遗传密码的简并性,各种核酸序列可以编码相同的氨基酸序列。编码Msi2蛋白或其变体的任何多核苷酸在本文中均称作“Msi2蛋白编码多核苷酸”。提供的多核苷酸包括天然存在的、人工的或合成的核酸序列。应当理解当序列示出为DNA序列同时提到RNA时,RNA分子的实际碱基序列是相同的,差异是胸腺嘧啶(T)被尿嘧啶(U)代替。
本发明进一步涉及编码如本文教导的包含一个或多个功能丧失性突变的Msi2蛋白的多核苷酸。所述多核苷酸可以是合成的、重组的和/或分离的多核苷酸。在实施方案中,所述多核苷酸源自内源性Msi2蛋白编码多核苷酸,例如,Msi2基因,其包含SEQ ID NO:5、7或8的核酸序列或其变体,所述变体与SEQ ID NO:5、7或8的核酸序列具有至少70%,优选至少75%,如80%、85%、90%、95%,更优选至少97%、98%或99%序列相同性,优选全长,并且其享有包含SEQ ID NO:5、7或8的氨基酸序列的多肽的内源性Msi2活性。相比之下,本文教导的包含一个或多个功能丧失性突变的Msi2蛋白编码多核苷酸包含一个或多个突变,所述突变减少或消除内源性Msi2活性至少于内源性Msi2蛋白的Msi2活性的90、80、70、60、50、40、30、20、10%。优选地,当存在于没有内源性Msi2蛋白编码多核苷酸的植物中时,当所述植物与野生型植物杂交时,本文教导的Msi2蛋白允许产生一些单倍体子代或具有异常倍性的子代。
如本文教导的核酸分子可以用于产生单倍体诱导系。
在本发明的实施方案中,如上文所述的编码Msi2蛋白(包括包含一个或多个功能丧失性突变的Msi2蛋白,或者其变体或片段)的核酸序列用来制备嵌合基因和/或载体,用于将Msi2蛋白编码多核苷酸转入宿主细胞中并在宿主细胞中产生Msi2蛋白,如源自转化细胞的细胞、组织、器官或生物体。在植物细胞中产生如本文教导的Msi2蛋白(或者其蛋白片段或变体)的载体在本文中称作“表达载体”。
表达Msi2蛋白的合适的宿主细胞包括原核细胞、酵母或高等真核细胞。用于细菌、真菌、酵母或哺乳动物细胞宿主的适当的克隆和表达载体例如在Pouwels et al.,Cloningvectors:A Laboratory Manual,Elsevier,N.Y.,(1985)中描述。不含细胞的翻译系统也可以用来利用源自本文公开的核酸序列的RNA制备本发明的蛋白。
合适的原核宿主细胞包括革兰氏阴性和革兰氏阳性生物体,例如,埃希氏杆菌或芽孢杆菌。另一合适的原核宿主细胞是农杆菌,特别是根癌农杆菌(Agrobacteriumtumefaciens)。
如本文教导的Msi2蛋白还可以在酵母宿主细胞中表达,例如来自酵母属(例如,酿酒酵母(Saccharomyces cerevisiae))。还可以采用其他酵母属如毕赤酵母或克鲁维酵母。
或者,如本文教导的Msi2蛋白可以在高等真核宿主细胞中表达,包括植物细胞、真菌细胞、昆虫细胞和哺乳动物(任选地非人)细胞。
本发明的一个实施方案是修饰以包含如本文教导的多核苷酸的非人生物体。可以通过本领域已知用于基因转移的任何方法修饰非人生物体和/或宿主细胞,包括例如使用递送装置如脂质和病毒载体、裸DNA、电穿孔、化学方法和颗粒介导的基因转移。在有利的实施方案中,非人生物体是植物。
任何植物细胞可以是合适的宿主细胞。如本文所用的术语“植物细胞”包括原生质体。合适的植物细胞包括来自单子叶植物或双子叶植物的那些细胞。例如,植物可以属于茄属(包括番茄属(Lycopersicon))、烟草属、辣椒属、矮牵牛属和其他属。以下宿主物种可以合适地使用:烟草(烟草物种,例如本氏烟草(N.benthamiana)、皱叶烟草(N.plumbaginifolia)、红花烟草(N.tabacum)等),蔬菜物种,如番茄(番茄(L.esculentum),同义番茄(Solanum lycopersicum))如樱桃番茄,变种cerasiforme或醋栗番茄,变种pimpinellifolium)或树番茄(树番茄(S.betaceum),同义Cyphomandrabetaceae),马铃薯(马铃薯(Solanum tuberosum)),茄子(茄子(Solanum melongena)),茄瓜(人参果(Solanum muricatum)),可可娜(Solanum sessiliflorum)和奎东茄(Solanumquitoense),辣椒(辣椒(Capsicum annuum)、小米椒(Capsicum frutescens)、风铃辣椒(Capsicum baccatum)),观赏植物物种(例如矮牵牛(Petunia hybrida)、Petuniaaxillaries、P.integrifolia),咖啡(咖啡属)。
或者,植物可以属于任何其他科,如葫芦科或禾本科。合适的宿主植物包括例如玉米(玉米属物种),小麦(小麦属物种),大麦(例如大麦(Hordeum vulgare)),燕麦(例如燕麦(Avena sativa)),高粱(高粱(Sorghum bicolor)),黑麦(黑麦(Secale cereale)),大豆(大豆属,例如大豆(G.max)),棉花(棉属物种,例如陆地棉(G.hirsutum)、海岛棉(G.barbadense)),芸苔属物种(例如甘蓝型油菜(B.napus)、芥菜型油菜(B.juncea)、甘蓝(B.oleracea)、芸苔(B.rapa)等),向日葵(向日葵(Helianthus annus)),红花,薯蓣,木薯,苜蓿(紫花苜蓿(Medicago sativa)),水稻(稻属物种,例如水稻(O.sativa)灿稻栽培种群或粳稻栽培种群),禾本科牧草,珍珠栗(狼尾草属物种,例如珍珠栗(P.glaucum)),树物种(松树、杨树、冷杉、大蕉(plantain)等),茶,咖啡,油棕,椰子,蔬菜物种,如豌豆,西葫芦(zucchini),豆类(例如菜豆属物种),黄瓜,朝鲜蓟,芦笋,西兰花,大蒜,韭葱,莴苣,洋葱,萝卜,芜菁,抱子甘蓝,胡萝卜,花椰菜,菊苣,芹菜,菠菜,苦苣,茴香,甜菜,结肉果的植物(葡萄、桃、李子、草莓、芒果、苹果、李子、樱桃、杏、香蕉、黑莓、蓝莓、柑桔、奇异果、无花果、柠檬、酸橙、油桃、树莓、西瓜、橙、葡萄柚等),观赏植物物种(例如玫瑰、矮牵牛、菊花、百合花、非洲菊属物种),香草(薄荷、欧芹、罗勒、百里香等),木本树木(例如杨属、柳属、栎属、桉树属的物种),纤维物种例如亚麻(亚麻(Linum usitatissimum))和大麻(大麻(Cannabissativa)),或者模式生物体,如拟南芥。
优选的宿主细胞源自“作物”或“栽培植物”,即由人培养和育种的植物物种。作物可以为了食物或饲料目的栽培(例如大田作物),或者为了观赏目的栽培(例如产生花用于插枝,草用于草坪等)。如本文定义的作物还包括由其收获非食物产品的植物,如用于燃料的油、可塑的聚合物、药物产品、软木(cork)、纤维(如棉花)等。
用于将如本文教导的Msi2蛋白编码核酸序列引入,优选稳定地引入,宿主细胞基因组的嵌合基因和载体的构建是本领域公知的。为了产生嵌合基因,利用标准分子生物学技术,将编码如本文教导的Msi2蛋白的核酸序列可操作地连接至适合在宿主细胞中表达的启动子序列。启动子序列可以已存在于载体中,因此将Msi2蛋白编码核酸序列简单地插入载体位于启动子序列下游。然后载体可以用来转化宿主细胞,可以将嵌合基因插入核基因组或者插入质体、线粒体或叶绿体基因组并利用合适的启动子表达(例如,Mc Bride etal.,1995 Bio/Technology 13,362;US 5,693,507)。在实施方案中,如本文教导的嵌合基因包含用于在植物细胞或微生物细胞(例如细菌)中表达的合适启动子,可操作地连接至编码如本文教导的Msi2蛋白的核酸序列,任选地随后是3’非翻译核酸序列。细菌随后可以用于植物转化(农杆菌介导的植物转化)。
本发明还涉及植物,特别是作物,更特别是属于茄科的植物,更特别是属于茄属,更特别是属于物种番茄,其没有功能性Msi2蛋白表达,这是由于:1)例如,通过敲除Msi2基因防止或减少Msi2基因表达;2)防止或减少转录自Msi2基因的mRNA的翻译;或者3)非功能性Msi2蛋白的表达。
表达包含一个或多个功能丧失性突变的Msi2多肽的植物
本发明提供表达如本文教导的包含一个或多个功能丧失性突变的Msi2多肽的植物、种子或植物细胞。本发明还提供包含如本文教导的多核苷酸、如本文教导的嵌合基因或如本文教导的载体的植物、种子或植物细胞。所述植物、种子或植物细胞优选属于茄科,更优选属于茄属,甚至更优选属于物种番茄。
所述植物、种子或植物细胞优选不表达内源性Msi2蛋白,或者以降低的水平(例如,少于野生型水平的90、80、70、60、50、40、30、20、10%)表达内源性Msi2蛋白。例如,可以在内源性Msi2蛋白中产生突变,其减少或消除内源性Msi2蛋白活性或表达,或者可以产生内源性Msi2蛋白的敲除。在这种情况下,可以产生基因敲除或突变杂合的植物并将表达如本文教导的包含一个或多个功能丧失性突变的Msi2蛋白的表达载体引入植物中。然后可以选择来自杂合子的子代,其是突变或敲除纯合的,但是包含Msi2蛋白,所述Msi2蛋白包含一个或多个功能丧失性突变。
因此,在本文教导的植物、种子或植物细胞中,优选将一个或两个内源性Msi2等位基因敲除或突变,从而所述植物或植物细胞显著或基本上完全没有内源性Msi2活性。据发现这类植物是可活的。在具有一组以上二倍体染色体组的植物中,可以将所有内源性Msi2等位基因失活、突变或敲除。或者,可以通过本领域已知的任何方式将内源性Msi2蛋白表达沉默,例如通过引入减少或消除内源性Msi2蛋白表达的siRNA或microRNA。
在实施方案中,本发明涉及包含如本文教导的核酸分子的番茄植物、种子或植物细胞。
在实施方案中,本发明涉及包含编码如本文教导的Msi2蛋白的核酸分子的番茄植物、种子或植物细胞。
在实施方案中,所述番茄植物、种子或植物细胞包含编码多肽的核酸分子,所述多肽包含SEQ ID NO:6的氨基酸序列。
在实施方案中,所述番茄植物、种子或植物细胞包含SEQ ID NO:4或9的核酸分子。
所述番茄植物、种子或植物细胞可以用于产生单倍体番茄植物,和/或用于产生双单倍体番茄植物。
在实施方案中,所述番茄植物、种子或植物细胞至少在胚发育期间没有内源性Msi2蛋白表达。
产生植物的方法
本发明的实施方案是利用靶向诱变方法(也称作靶向核苷酸交换(TNE)或寡定向诱变(ODM))修饰内源性Msi2基因。靶向诱变方法包括但不限于那些采用锌指核酸酶,Cas9样,Cas9/crRNA/tracrRNA或Cas9/gRNA CRISPR系统,或者采用诱变寡核苷酸的靶向诱变,可能包含与Msi2基因具有序列互补性的化学修饰的核苷酸用于增强诱变,进入植物原生质体(例如,Key或TALENs)。
或者,诱变系统如TILLING(定向诱导基因组局部突变技术;McCallum et al.,2000,Nat Biotech 18:455,和McCallum et al.2000,Plant Physiol.123,439-442,两者援引加入本文)可以用来产生植物系,其包含编码Msi2蛋白的Msi2基因,所述Msi2蛋白包含一个或多个功能丧失性突变。TILLING使用传统的化学诱变(例如EMS诱变)然后高通量筛选突变。因此,可以获得包含具有期望突变的Msi2基因的植物、种子和组织。
所述方法可以包括以下步骤:诱变植物种子(例如EMS诱变),汇集植物个体或DNA,PCR扩增所关注的区域,异源双链形成和高通量检测,鉴定突变植物,突变PCR产物测序。应当理解其他诱变和选择方法同样可以用来产生这类修饰的植物。例如,可以将种子辐射或化学处理,并且可以筛选植物的修饰的表型。
修饰的植物可以通过分子方法如DNA中存在的突变,以及通过修饰的表型特征与未修饰的植物(即野生型植物)区分。修饰的植物对于突变可以是纯合的或杂合的。
因此,提供一种制备如本文教导的植物的方法,所述方法包括以下步骤:
a)修饰植物细胞内编码内源性Msi2蛋白的核酸分子以获得编码如本文教导的Msi2蛋白的突变的核酸分子,或者修饰植物内编码内源性Msi2蛋白的核酸分子以防止植物细胞内所述内源性Msi2蛋白的表达或敲除植物细胞内所述内源性Msi2蛋白的表达;
b)选择包含突变的核酸分子的植物细胞,或者其中防止或敲除所述内源性Msi2蛋白表达的植物细胞;以及
c)任选地,从所述植物细胞再生植物。
本发明进一步提高一种制备如本文教导的植物的方法,所述方法包括以下步骤:
a)用如本文教导的核酸分子、如本文教导的嵌合基因或如本文教导的载体转化植物细胞,或者用核酸分子转化植物细胞以防止内源性Msi2蛋白的表达或敲除内源性Msi2蛋白的表达;
b)任选地,在所述植物细胞中额外地修饰编码内源性Msi2蛋白的核酸分子以防止内源性Msi2蛋白的表达或敲除内源性Msi2蛋白的表达;
c)选择包含如本文教导的核酸分子、如本文教导的嵌合基因或如本文教导的载体的植物细胞,或者其中防止或敲除内源性Msi2蛋白表达的植物细胞;以及
d)任选地,从所述植物细胞再生植物。
本发明还提供一种制备如本文教导的植物的方法,所述方法包括以下步骤:i)用如本文教导的多核苷酸、如本文教导的嵌合基因或如本文教导的载体转化植物细胞;ii)选择包含所述多核苷酸的植物细胞;以及iii)任选地,从所述植物细胞再生植物。
制备如本文教导的植物的方法可以进一步包括修饰所述植物细胞内的内源性植物Msi2蛋白编码多核苷酸以防止内源性Msi2蛋白表达的步骤。
可以将如本文教导的Msi2蛋白编码多核苷酸,优选Msi2蛋白编码嵌合基因以常规方式稳定地插入单植物细胞的核基因组,并且这样转化的植物细胞可以以常规方式用来产生转化的植物,由于在一定时间的某些细胞中存在如本文教导的Msi2蛋白,其具有改变的表型。在这方面,根癌农杆菌中的包含如本文教导的Msi2蛋白编码多核苷酸的T-DNA载体可以用来转化植物细胞,此后,可以利用例如EP 0 116 718、EP 0 270 822、PCT公开WO84/02913和公开的欧洲专利申请EP 0 242 246以及Gould et al.(1991,Plant Physiol.95,426-434)中描述的方法从转化的植物细胞再生转化的植物。用于农杆菌介导的植物转化的T-DNA载体的构建是本领域公知的。T-DNA载体可以是如EP 0 120 561和EP 0 120 515中描述的二元载体,或者如EP 0 116 718中描述的共整合载体,可以通过同源重组将其整合至农杆菌Ti-质粒中。
同样地,从转化的植物细胞选择和再生转化的植物是本领域公知的。显然,对于不同物种,甚至对于单一物种的不同品种或栽培种,方案特别适用于以高频率再生转化子。
所得的转化植物可以用于常规植物育种方案以产生单倍体植物,其随后可以变为双单倍体植物。
产生单倍体植物和/或双单倍体植物的方法
本发明还涉及一种产生单倍体植物、具有异常倍性的植物或双单倍体植物的方法,所述方法包括以下步骤:
a)将表达内源性Msi2蛋白的植物与如本文教导的修饰的植物杂交,其中如本文教导的修饰的植物至少在胚发育期间没有内源性Msi2蛋白表达;
b)收获种子;
c)从所述种子种植至少一个幼苗、小植物或植物;以及
d)选择单倍体幼苗、小植物或植物,具有异常倍性的幼苗、小植物或植物,或者双单倍体幼苗、小植物或植物。
所述表达内源性Msi2蛋白的植物可以是F1植物。
表达内源性Msi2蛋白的植物可以是杂交的花粉亲本,或者可以是杂交的胚珠亲本。
将如本文教导的修饰的植物(没有内源性Msi2蛋白表达)于野生型植物杂交会导致至少一些子代,其是单倍体,并且仅包含来自表达内源性Msi2蛋白的植物的染色体。因此,本发明允许通过杂交所关注的植物与没有功能性Msi2蛋白表达的植物产生单倍体植物,其全部染色体均来自所关注的植物,并且收集所得的单倍体种子。
因此,基因组消除可以用精确的分子变化进行工程化,不依赖亲本基因型。Msi2蛋白存在于任何植物物种中。这允许在单倍体植物制备的常规方法如单倍体细胞的组织培养和远缘杂交不成功的物种中制备单倍体植物。
如本文教导的没有功能性Msi2蛋白表达的植物可以作为父本或母本杂交。本文教导的方法允许将父本染色体转移至母本细胞质中。因此,其可以一步产生具有期望基因型的细胞质雄性不育系。
本发明进一步涉及一种产生双单倍体植物的方法,所述方法包括以下步骤:
a)将表达内源性Msi2蛋白的植物与如本文教导的修饰的植物杂交,其中如本文教导的修饰的植物至少在胚发育期间没有内源性Msi2蛋白表达;
b)选择单倍体植物;以及
c)将所述单倍体植物转化为双单倍体植物。
因此,一旦产生,单倍体植物可以用于产生双单倍体植物,其包含染色体的精确复制拷贝。已知各种方法用于从单倍体生物体产生双单倍体生物体。例如,化学品如秋水仙碱可以用来将单倍体植物转化为双单倍体植物。或者,倍性可以在胚发育期间或在植物的后期发育阶段自发加倍。
双单倍体植物可以进一步与其他植物杂交以产生具有期望性状的植物的F1、F2或随后的世代。
可以获得双单倍体植物,其不含转基因或诱变的基因。此外,双单倍体植物可以快速地从杂种F1产生纯合的F2。
本发明还涉及一种产生单倍体或双单倍体植物的方法,所述方法包括鉴定表达内源性Msi2蛋白的植物和如本文教导的植物的步骤,其中如本文教导的植物至少在其生殖部分和/或在胚发育期间没有内源性Msi2蛋白表达。
在实施方案中,杂交不包括有性杂交植物的整个基因组。而是,消除一组染色体。
附图说明
图1示出Msi2-K126-终止突变体的四分体。箭头显示微核。
序列表
SEQ ID NO:1:植物Msi2共有蛋白序列
SEQ ID NO:2:茄属共有Msi2蛋白序列
SEQ ID NO:3:番茄Msi2蛋白序列
SEQ ID NO:4:番茄Msi2_K126*编码序列
SEQ ID NO:5:番茄Msi2编码序列
SEQ ID NO:6:番茄Msi2_K126*截短的蛋白序列
SEQ ID NO:7:茄属共有Msi2编码序列
SEQ ID NO:8:番茄Msi2基因组DNA序列
SEQ ID NO:9:番茄Msi2_K126*基因组DNA序列
SEQ ID NO:10:茄科共有Msi2蛋白序列
实施例
实施例1:番茄中的单亲基因组消除
材料和方法
植物材料
使用三种番茄栽培种,即“MoneyBergTMV+”、“MicroTom”和“RZ52201”。按照WO2007/037678和WO2009/041810中描述的方法,从番茄RZ52201突变群体选择基因Msi2中的2个体细胞非同义突变体,即Msi2_K126-STOP和Msi2_K126M,两者均在氨基酸位置126处突变。将所选的突变植物自花授粉,并且在后代中选择植物,所选择的植物对于突变的基因座是纯合的。按照WO 2007/037678和WO2009/041810中描述的方法,从番茄MoneyBerg TMV+突变群体选择基因Msi2中的体细胞同义突变体,即Msi2_D337D,其在氨基酸位置337处突变(C至T)。将所选的突变植物自花授粉,并且在后代中选择对于突变的基因座是纯合的植物。
方法
单亲基因组消除和导致的单倍体植物产生是由所谓的单倍体诱导系与另一非单倍体诱导系如育种品系之间进行杂交引起的。在相对高的温度(26-28℃)进行用于单亲基因组消除的番茄品系杂交,因为已知升高的温度可以(但是仅在某些情况下)对单亲基因组消除的发生具有积极影响(Sanei et al.PNAS 108.33(2011):E498-E505)。
结果
Msi2_K126-STOP突变体中A至T的非同义突变导致引入过早的终止密码子,从而产生截短的蛋白(SEQ ID NO:6)。Msi2_K126M突变体中A至T的非同义突变导致赖氨酸至甲硫氨酸的氨基酸修饰。此外,对Msi2蛋白进行SIFT分析,并且在位置126处赖氨酸至甲硫氨酸的突变通过这个分析评估为中性(Kumar et al.Nat Protoc.2009;4(7):1073-81)。Msi2_D337D突变体中C至T的同义突变未导致氨基酸修饰。在相对高温(26-28℃)下杂交中,对于Msi2_K126-STOP、Msi2_K126M或Msi2_D337D突变而言纯合的3种突变植物中的每种用作花粉供体和用作雌性,分别利用未突变的野生型MicroTom植物作为雌性或花粉供体。表1列出所有进行的杂交的概览以及对MicroTom表型评价的播种的种子。
表1.进行的杂交的列表;使用的亲本的遗传背景,测试的后代植物的数量以及表现出MicroTom矮小表型的后代植物的数量。
将源自表1中列出的杂交的种子播种,并且通过流式细胞术评价植物的DNA含量。流式细胞术分析导致对所有所测试的植物确定仅正常的二倍体倍性水平,与野生型番茄栽培种如MoneyBergTMV+相似。栽培种MicroTom具有矮小表型,已知其是隐性的(Marti etal,J Exp Bot,Vol.57,No.9,pp.2037–2047,2006)。MicroTom与例如MoneyBergTMV+或RZ52201野生型栽培种杂交之后,仅发现分别具有MoneyBergTMV+或RZ52201野生型栽培种的不确定的非矮小表型的后代。对与Msi2_D337D同义突变体和MicroTom的杂交发现了相同现象;MicroTom和Msi2_D337D突变体杂交的所有后代均表现出MoneyBerg TMV+亲本的不确定的非矮小表型。MicroTom和Msi2_K126M突变体的相互杂交不导致具有MicroTom表型的后代。利用Msi2_K126-STOP突变体作为父本或母本,发现总计10株植物表现出MicroTom表型。这表明RZ52201亲本遗传物质不是所得到的后代的部分,并且这表明这10株后代植物是单倍体MicroTom来源的。据发现后10株植物的所有植物的倍性是二倍体,这表明发生了自发加倍,一种已描述对于番茄具有异常高出现频率的现象(Report of the Tomato GeneticsCooperative Number 62-December 2012)。
为了确定单亲基因组消除是否已发生和发生至什么程度,对2014后代的总计44个位置进行单核苷酸多态性(SNP)测定,跨越12条番茄染色体中的每条(染色体1、2、3、4、5、6、11和12上的4个SNP;染色体8和10上的3个SNP;染色体9上的2个SNP)。现在在22个位置上对2015后代进行相同分析(染色体1、2、3、4、5、6、7、8、10和12上的2个SNP;染色体9和11上的1个SNP)。所选单核苷酸多态性对于MicroTom亲本的一个碱基对是纯合的,并且对于RZ52201亲本中的除了MicroTom碱基对的所有碱基对是纯合的。野生型MicroTom栽培种和RZ52201栽培种之间的规律杂交会导致杂合的单核苷酸多态性评分。但是,当单亲基因组消除过程发生时,预期丢失单倍体诱导系基因组。单核苷酸多态性测试导致对还表现出MicroTom表型的5株后代植物中的每株从MicroTom亲本仅召唤(calling)纯合碱基对评分,未召唤RZ52201亲本。基于单核苷酸多态性评分得出结论,Msi2_K126-STOP突变体的整个基因组不再存在于后代中。因此,可以得出结论,Msi2_K126-STOP突变体具有高效单倍体诱导系的功能。在其中Msi2_K126-STOP突变体用作母本的杂交中,可以排除MicroTom的自交。鉴于非常少量的后代表现出MicroTom表型(89个中仅2个种子和325中仅1个种子),并且仅评分纯合碱基对,在利用MicroTom作为母本的实验中极不可能发生自交。
检查Msi2-K126-stop突变体和RZ52201对照植物的花粉四分体的异常发生。从4个不同花桁架至少采两朵花并将花药压扁以观察花粉四分体。对于Msi2-K126-stop突变体,在来自5朵单独花的全部10个所观察的花药中均观察到微核(见图1)。在每个所观察的花药中发现微核的几个实例,但是花药中不超过1%的花粉四分体表现出异常。对于RZ52201对照,很少花药观察到包含具有微核的花粉四分体。发现2个花药,其中可以观察到总计仅2或3个微核的实例。在第二轮实验中,将微核计数;对于Msi2-K126-stop突变体,以1.94%的频率观察到微核(n=1)。对于RZ52201对照植物花,以0.58±0.36%的平均频率观察到微核(n=5)。得出结论,与对照相比,因为Msi2-K126-stop突变,减数分裂期间染色体的分离相当频繁地受到干扰。异常有丝分裂,例如微核的观察,常用作作物中种间、种内杂交中染色体消除和单倍体产生的直接证据。例如,在玉米DH-诱导系的研究中发现了异常有丝分裂以及异常减数分裂,例如微核(Qiu,Fazhan,et al.Current Plant Biology 1(2014):83-90)。Msi2-K126-stop突变体中减数分裂微核的观察表明在有丝分裂期间发生了相似过程。可能在野生型和Msi2-K126-stop合子融合之后第一有丝分裂期间单亲基因组消除过程发生,并且这导致观察到单倍体诱导。
实施例2:拟南芥中的单亲基因组消除
材料和方法
植物材料
使用以下拟南芥NASC储备中心的登记物(accession):Columbia(背景系,Col-0,N1092),Col-5(N1644),拟南芥Msi2基因(At2g16780)T-DNA插入系(N720344和N501214,Col-0背景),以及,因为不知道Msi2和Msi3基因是否是功能冗余基因,拟南芥Msi3基因(At4g35050)T-DNA插入突变体(N309860、N309863和N564092,Col-0背景)。通过PCR扩增随后测序推定的T-DNA插入基因座评价T-DNA插入系,以便确定拟南芥Msi2和Msi3基因中的确切插入。基于插入位于Msi2或Msi3基因的外显子中的发现得出结论,这些T-DNA插入系对于Msi2或Msi3基因是真实敲除的。起始密码子下游以碱基数计数的确切位置是:N720344(位置429,外显子2)、N501214(位置111,外显子1)、N309863/N309860(均在位置559,外显子2)和N564092(位置1237,外显子6)。通过在两个插入系之间进行杂交并选择Msi2和Msi3基因中的纯合T-DNA插入,产生了两个新的双T-DNA插入系;N720344+N309860和N309863+N501214。
方法
单亲基因组消除和导致的单倍体植物产生是由所谓的单倍体诱导系与另一非单倍体诱导系如Columbia背景(Col-0)对照系之间进行杂交引起的。
结果
Msi2的单T-DNA插入系(N720344和N501214)、Msi3 T-DNA插入系(N309863和N564092)、两个新产生的Msi2/Msi3双T-DNA插入系(N720344+N309860和N309863+N501214)或Col-0背景植物在杂交中用作花粉供体和雌性,分别利用Col-5作为雌性或花粉供体。表2列出了可以进行的典型杂交的实例以及评价后代的Col-5表型的实例。与T-DNA插入系和Col-0相比,Col-5具有明显不同的隐性表现,即没有表皮毛的(trichomeless)叶。
表2.可以进行的杂交列表;所有插入系的遗传背景是Col-0,以及测试的后代植物的数量。
Col-5登记物包含gl1-1/gl1-1基因座,给予它没有表皮毛的表型,已知是隐性的(Kuppu et al.PLoS Genet 11.9 2015 e1005494)。Col-5与例如Col-0野生型栽培种杂交之后,仅发现来自显性Col-0等位基因的具有毛状体的后代。利用Msi2单一、Msi3单一或Msi2/Msi3双T-DNA插入系作为父本或母本,发现总计几株植物表现出没有表皮毛的表型。这表明Col-0亲本遗传物质不是所获得的后代的部分,并且这表明这些后代植物是单倍体Col-5来源的。
基于进行杂交的后代中的单Col-5表型个体,得出结论,Col-0背景中的各T-DNA插入系的完整基因组不再存在于后代中。因此,得出结论,T-DNA插入系“N720344、N501214、N309863、N564092、N720344+N309860(双插入系)和N309863+N501214(双插入系)的功能是高效(双)单倍体诱导系。
序列表
<110> 主基因有限公司
<120> 制备单倍体和随后的双单倍体植物的方法
<130> P6069722PCT
<150> NL2015549
<151> 2015-10-02
<160> 10
<170> PatentIn version 3.5
<210> 1
<211> 396
<212> PRT
<213> plant
<220>
<221> misc_feature
<222> (7)..(7)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (12)..(12)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (27)..(27)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (91)..(91)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (153)..(153)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (193)..(193)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (256)..(256)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (362)..(362)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (396)..(396)
<223> Xaa can be any naturally occurring amino acid
<400> 1
Met Ala Glu Glu Gly Gly Xaa Glu Thr Gly Met Xaa Gln Val Glu Glu
1 5 10 15
Glu Phe Ser Val Trp Lys Lys Asn Thr Pro Xaa Leu Tyr Asp Leu Val
20 25 30
Ile Ser His Pro Leu Glu Trp Pro Ser Leu Thr Val Gln Trp Leu Pro
35 40 45
Ser Pro Ser Thr Asp Pro Ser Ala Phe Arg Val His Lys Leu Val Leu
50 55 60
Gly Thr His Thr Ser Asp Glu Ala Pro Asn Phe Leu Met Val Ala Asp
65 70 75 80
Ala Val Leu Pro Pro Pro Arg Ala Ala Ala Xaa Leu Ala Ala Gly Gly
85 90 95
Ala Val Pro Ile Pro Lys Val Glu Ile Ser Gln Lys Ile His Val Asp
100 105 110
Gly Glu Val Asn Arg Ala Arg Cys Met Pro Gln Arg Pro Tyr Thr Val
115 120 125
Ala Ala Lys Thr Cys Gly Asp Glu Val His Val Phe Asp Leu Gly Lys
130 135 140
Gly Gln Gly Ser Cys Gly Pro Asp Xaa Arg Leu Arg Gly His Asp Lys
145 150 155 160
Glu Gly Tyr Gly Leu Ser Trp Ser Pro Phe Lys Glu Gly Tyr Leu Leu
165 170 175
Ser Gly Ser Tyr Asp Lys Lys Ile Cys Leu Trp Asp Val Ser Ala Gly
180 185 190
Xaa Gln Asp Lys Val Leu Asp Ala Met His Val Tyr Glu Ala His Glu
195 200 205
Asp Val Val Glu Asp Val Ala Trp His Leu Lys Asn Glu Asn Leu Phe
210 215 220
Gly Ser Val Gly Asp Asp Cys Lys Leu Met Ile Trp Asp Leu Arg Thr
225 230 235 240
Asn Lys Pro Gln Gln Ser Val Lys Ala His Glu Lys Glu Val Asn Xaa
245 250 255
Leu Ser Phe Asn Pro Phe Asn Glu Trp Ile Leu Ala Thr Ala Ser Ser
260 265 270
Asp Ser Thr Val Lys Leu Phe Asp Leu Arg Lys Leu Ser Arg Pro Leu
275 280 285
His Val Phe Ser Ser His Glu Gly Glu Val Phe Gln Val Glu Trp Asp
290 295 300
Pro Asn His Glu Thr Val Leu Ala Ser Ser Ala Ala Asp Arg Arg Leu
305 310 315 320
Met Val Trp Asp Leu Asn Arg Ile Gly Asp Glu Gln Leu Glu Glu Asp
325 330 335
Ala Glu Asp Gly Pro Pro Glu Leu Leu Phe Ser His Gly Gly His Lys
340 345 350
Ala Lys Ile Ser Asp Phe Ser Trp Asn Xaa Asn Glu Pro Trp Val Ile
355 360 365
Ala Ser Val Ala Glu Asp Asn Ile Leu Gln Val Trp Gln Met Ala Glu
370 375 380
Ser Ile Tyr Arg Asp Asp Asp Asp Asn Ala Asp Xaa
385 390 395
<210> 2
<211> 403
<212> PRT
<213> Solanum
<400> 2
Met Ala Glu Glu Glu Leu Glu Ala Ala Gly Glu Thr Glu Gln Asp Val
1 5 10 15
Glu Glu Glu Phe Ala Val Trp Lys Lys Asn Thr Pro Leu Leu Tyr Asp
20 25 30
Leu Val Val Cys His Ala Leu Glu Trp Pro Ser Leu Thr Val Gln Trp
35 40 45
Leu Pro Ser Pro Thr Thr Asp Asp Gly Ala Phe Ala Val His Lys Leu
50 55 60
Ile Leu Gly Thr His Thr Ser Asp Asp Cys Pro Asn Phe Leu Met Val
65 70 75 80
Ala Lys Val His Leu Pro Arg Asn Pro Ala Ser Gly Leu Glu His Asn
85 90 95
Leu Met Asn Pro Gln Ile Pro Lys Val Glu Ile Val Gln Lys Ile His
100 105 110
Val Asp Gly Glu Val Asn Arg Ala Arg Cys Met Pro Gln Lys Pro Ala
115 120 125
Val Val Ala Ala Lys Thr Ser Ser Ser Glu Val Tyr Val Phe Asp Ser
130 135 140
Ala Lys Gln Pro Leu Asp His Glu Gly Gly Ser Cys Asn Pro Asp Val
145 150 155 160
Arg Leu Arg Gly His Asp Lys Glu Gly Tyr Gly Leu Ser Trp Ser Pro
165 170 175
Phe Lys Glu Gly Phe Leu Leu Ser Gly Ser Asn Asp Gln Lys Ile Cys
180 185 190
Leu Trp Asp Ile Ser Ala Leu Pro Gln Asp Lys Val Leu Met Ala His
195 200 205
His Thr Tyr Glu Glu His Glu Asp Val Val Glu Asp Val Ser Trp His
210 215 220
Pro Lys Asn Glu Asn Leu Phe Gly Ser Val Gly Asp Asp Cys Arg Leu
225 230 235 240
Ile Ile Trp Asp Phe Arg Thr Asn Lys Ala Gln His Ser Val Leu Val
245 250 255
His Glu Lys Glu Val Asn Tyr Leu Ser Phe Asn Ser Tyr Thr Glu Trp
260 265 270
Val Leu Ala Thr Ala Ser Ser Asp Ser Thr Val Gly Leu Phe Asp Met
275 280 285
Arg Lys Leu Ser Ser Pro Leu His Val Phe Gly Ser His Thr Asp Glu
290 295 300
Val Phe Gln Val Glu Trp Asp Pro Asn His Glu Thr Val Leu Ala Ser
305 310 315 320
Ser Gly Gly Asp Arg Arg Leu Met Val Trp Asp Leu Asn Arg Ile Gly
325 330 335
Asp Glu Gln Leu Glu Gly Glu Ala Glu Asp Gly Pro Ser Glu Leu Leu
340 345 350
Phe Ser His Gly Gly His Lys Ala Lys Ile Ser Asp Phe Ser Trp Asn
355 360 365
Lys Asn Glu Pro Trp Val Ile Ser Ser Val Ala Glu Asp Asn Cys Val
370 375 380
Gln Val Trp Gln Met Ala Glu Ser Ile Tyr Arg Glu Asp Asn Asp Asn
385 390 395 400
Gly Asn Cys
<210> 3
<211> 403
<212> PRT
<213> Solanum lycopersicum
<400> 3
Met Ala Glu Glu Glu Leu Glu Ala Ala Gly Glu Thr Glu Gln Asp Val
1 5 10 15
Glu Glu Glu Phe Ala Val Trp Lys Lys Asn Thr Pro Leu Leu Tyr Asp
20 25 30
Leu Val Val Cys His Ala Leu Glu Trp Pro Ser Leu Thr Val Gln Trp
35 40 45
Leu Pro Ser Pro Thr Thr Asp Asp Gly Ala Phe Ala Val His Lys Leu
50 55 60
Ile Leu Gly Thr His Thr Ser Asp Asp Cys Pro Asn Phe Leu Met Val
65 70 75 80
Ala Lys Val His Leu Pro Arg Asn Pro Ala Ser Gly Leu Glu His Asn
85 90 95
Leu Met Asn Pro Gln Ile Pro Lys Val Glu Ile Val Gln Lys Ile His
100 105 110
Val Asp Gly Glu Val Asn Arg Ala Arg Cys Met Pro Gln Lys Pro Ala
115 120 125
Val Val Ala Ala Lys Thr Ser Ser Ser Glu Val Tyr Val Phe Asp Ser
130 135 140
Ala Lys Gln Pro Leu Asp His Glu Gly Gly Ser Cys Asn Pro Asp Val
145 150 155 160
Arg Leu Arg Gly His Asp Lys Glu Gly Tyr Gly Leu Ser Trp Ser Pro
165 170 175
Phe Lys Glu Gly Phe Leu Leu Ser Gly Ser Asn Asp Gln Lys Ile Cys
180 185 190
Leu Trp Asp Ile Ser Ala Leu Pro Gln Asp Lys Val Leu Met Ala His
195 200 205
His Thr Tyr Glu Glu His Glu Asp Val Val Glu Asp Val Ser Trp His
210 215 220
Pro Lys Asn Glu Asn Leu Phe Gly Ser Val Gly Asp Asp Cys Arg Leu
225 230 235 240
Ile Ile Trp Asp Phe Arg Thr Asn Lys Ala Gln His Ser Val Leu Val
245 250 255
His Glu Lys Glu Val Asn Tyr Leu Ser Phe Asn Ser Tyr Thr Glu Trp
260 265 270
Val Leu Ala Thr Ala Ser Ser Asp Ser Thr Val Gly Leu Phe Asp Met
275 280 285
Arg Lys Leu Ser Ser Pro Leu His Val Phe Gly Ser His Thr Asp Glu
290 295 300
Val Phe Gln Val Glu Trp Asp Pro Asn His Glu Thr Val Leu Ala Ser
305 310 315 320
Ser Gly Gly Asp Arg Arg Leu Met Val Trp Asp Leu Asn Arg Ile Gly
325 330 335
Asp Glu Gln Leu Glu Gly Glu Ala Glu Asp Gly Pro Ser Glu Leu Leu
340 345 350
Phe Ser His Gly Gly His Lys Ala Lys Ile Ser Asp Phe Ser Trp Asn
355 360 365
Lys Asn Glu Pro Trp Val Ile Ser Ser Val Ala Glu Asp Asn Cys Val
370 375 380
Gln Val Trp Gln Met Ala Glu Ser Ile Tyr Arg Glu Asp Asn Asp Asn
385 390 395 400
Gly Asn Cys
<210> 4
<211> 1212
<212> DNA
<213> Solanum lycopersicum
<400> 4
atggctgaag aagaattgga ggcggcggga gaaaccgaac aagatgtaga agaggagttc 60
gccgtttgga agaagaacac gccgttgctc tacgatcttg tcgtttgtca tgcccttgaa 120
tggccttctc tcaccgttca atggcttccg tctccaacca ccgacgacgg tgcttttgct 180
gtacacaagc tcattctcgg aactcacacc tccgacgatt gccccaactt cctcatggtc 240
gcaaaggttc atctccctcg gaatcctgct tcaggacttg aacacaatct catgaatcct 300
caaatcccta aggtagagat agtacaaaag attcatgttg acggagaagt gaatagagcg 360
agatgtatgc cacagtagcc agctgtagtt gcagctaaga ctagtagctc tgaagtttat 420
gtctttgact cagctaaaca gccccttgat catgaaggtg ggtcttgtaa ccctgatgtt 480
cgacttcgtg ggcatgataa agaaggttat ggcttgtcgt ggagcccgtt taaagagggt 540
tttcttttga gtggttcaaa tgatcagaag atttgtttgt gggatatatc tgcattgcct 600
caagataaag ttcttatggc tcatcatact tatgaggagc atgaagatgt agttgaggat 660
gtgtcatggc atccaaagaa tgagaaccta tttggttctg tcggagatga ttgtcgtctg 720
atcatttggg acttccggac aaacaaagcc caacactcgg ttttagtgca tgagaaagag 780
gtgaattatt tatctttcaa ctcatatact gaatgggttc ttgctacagc atcgtcagat 840
agtactgttg gtctgttcga catgcgaaag cttagctctc cattgcacgt gtttggcagt 900
catacggatg aggtgttcca ggtagaatgg gatcctaatc atgagactgt actggcatct 960
tcaggtggtg atagaaggtt gatggtctgg gatcttaaca ggattggtga cgagcaattg 1020
gaaggggaag ctgaagacgg accgtcagaa cttcttttct ctcatggcgg tcacaaagca 1080
aagatatctg atttttcatg gaacaagaac gagccatggg tcatttcaag tgtggcagaa 1140
gacaactgtg tccaagtctg gcagatggct gagagcatct accgtgagga caatgacaat 1200
ggcaactgct ga 1212
<210> 5
<211> 1212
<212> DNA
<213> Solanum lycopersicum
<400> 5
atggctgaag aagaattgga ggcggcggga gaaaccgaac aagatgtaga agaggagttc 60
gccgtttgga agaagaacac gccgttgctc tacgatcttg tcgtttgtca tgcccttgaa 120
tggccttctc tcaccgttca atggcttccg tctccaacca ccgacgacgg tgcttttgct 180
gtacacaagc tcattctcgg aactcacacc tccgacgatt gccccaactt cctcatggtc 240
gcaaaggttc atctccctcg gaatcctgct tcaggacttg aacacaatct catgaatcct 300
caaatcccta aggtagagat agtacaaaag attcatgttg acggagaagt gaatagagcg 360
agatgtatgc cacagaagcc agctgtagtt gcagctaaga ctagtagctc tgaagtttat 420
gtctttgact cagctaaaca gccccttgat catgaaggtg ggtcttgtaa ccctgatgtt 480
cgacttcgtg ggcatgataa agaaggttat ggcttgtcgt ggagcccgtt taaagagggt 540
tttcttttga gtggttcaaa tgatcagaag atttgtttgt gggatatatc tgcattgcct 600
caagataaag ttcttatggc tcatcatact tatgaggagc atgaagatgt agttgaggat 660
gtgtcatggc atccaaagaa tgagaaccta tttggttctg tcggagatga ttgtcgtctg 720
atcatttggg acttccggac aaacaaagcc caacactcgg ttttagtgca tgagaaagag 780
gtgaattatt tatctttcaa ctcatatact gaatgggttc ttgctacagc atcgtcagat 840
agtactgttg gtctgttcga catgcgaaag cttagctctc cattgcacgt gtttggcagt 900
catacggatg aggtgttcca ggtagaatgg gatcctaatc atgagactgt actggcatct 960
tcaggtggtg atagaaggtt gatggtctgg gatcttaaca ggattggtga cgagcaattg 1020
gaaggggaag ctgaagacgg accgtcagaa cttcttttct ctcatggcgg tcacaaagca 1080
aagatatctg atttttcatg gaacaagaac gagccatggg tcatttcaag tgtggcagaa 1140
gacaactgtg tccaagtctg gcagatggct gagagcatct accgtgagga caatgacaat 1200
ggcaactgct ga 1212
<210> 6
<211> 125
<212> PRT
<213> Solanum lycopersicum
<400> 6
Met Ala Glu Glu Glu Leu Glu Ala Ala Gly Glu Thr Glu Gln Asp Val
1 5 10 15
Glu Glu Glu Phe Ala Val Trp Lys Lys Asn Thr Pro Leu Leu Tyr Asp
20 25 30
Leu Val Val Cys His Ala Leu Glu Trp Pro Ser Leu Thr Val Gln Trp
35 40 45
Leu Pro Ser Pro Thr Thr Asp Asp Gly Ala Phe Ala Val His Lys Leu
50 55 60
Ile Leu Gly Thr His Thr Ser Asp Asp Cys Pro Asn Phe Leu Met Val
65 70 75 80
Ala Lys Val His Leu Pro Arg Asn Pro Ala Ser Gly Leu Glu His Asn
85 90 95
Leu Met Asn Pro Gln Ile Pro Lys Val Glu Ile Val Gln Lys Ile His
100 105 110
Val Asp Gly Glu Val Asn Arg Ala Arg Cys Met Pro Gln
115 120 125
<210> 7
<211> 1212
<212> DNA
<213> Solanum
<400> 7
atggcwgaag aagaahtgga ggcggcggga gaaaccgmrc magakgtwga agargagttc 60
gccgtttgga agaagaacac gccgttgctc tacgatcttg tcgtytgtca tgcccttgaa 120
tggccktckc tcacygttca atggcttccr tcyccmacca ccgacgacgg tgcttttgyt 180
gtacacaagm tcatyctcgg mactcacacc tccgaygatt gccccaactt cctcatggtc 240
gcaaakgtys atctccckcg daatcctgct tcrggactyg aacacaatct cakgaatcct 300
caaatcccta aggtagagat agtrcaaaag attcatgttg ayggagaagt gaatagrgcg 360
agatgtatgc cacagaarcc agctgtagtt gcagchaaga ctagtagckc tgargtttat 420
rtctttgact cagctaaaca rcccyttgat caygaaggtg ggtcttgtaa ccctgatgtt 480
mgacttcgwg ggcaygataa agaaggttat ggcttgtcst ggagccyrtt taargagggt 540
tttcttytga gtggttcaaa ygatcagaag atytgtttst ggratrtatc tgcattgcct 600
cragataaag tkcttatggc ycaycatact tatgaggagc atgaagatgt agttgaggay 660
gtktcatggc ayccaawgaa tgagaaccta tttggytcyg tcggagatga ttgtcgtctg 720
atcatttggg acttvcggac raacaaagcc caacastcdg ttttagygca tgagaaagag 780
gtgaattatt tatctttcaa ytcatatact gartgggtts ttgctacagc atcrtcwgat 840
agtactgttg gtctrttyga catgcgwaag cttagctctc cattgcaygt gtttggcagt 900
catacggatg aggtrttcca ggtagaatgg gatcctaatc atgaracygt actggcatct 960
tcrggtggtg atagaaggtt gatggtctgg gatcttaaca ggattggtga cgagcaattg 1020
gaaggggaag ctgaagaygg rccbtcmgaa cttcttttct ctcatggcgg tcacaaagca 1080
aaratawctg atttttcrtg gracawkaay gagscatggg tcatytcaag tgtggcagaa 1140
gacaaytgtg tccaagtctg gcagatggct gagagcatct accgygarga caatgrcaat 1200
ggcaamtsct ga 1212
<210> 8
<211> 2650
<212> DNA
<213> Solanum lycopersicum
<400> 8
atggctgaag aagaattgga ggcggcggga gaaaccgaac aagatgtaga agaggagttc 60
gccgtttgga agaagaacac gccgttgctc tacgatcttg tcgtttgtca tgcccttgaa 120
tggccttctc tcaccgttca atggcttccg tctccaacca ccgacgacgg tgcttttgct 180
gtacacaagc tcattctcgg aactcacacc tccgacgatt gccccaactt cctcatggtc 240
gcaaaggttc atctccctcg gaatcctgct tcaggacttg aacacaatct catgaatcct 300
caaatcccta aggtctgtaa ctccttacaa tcggttaaac tacactaata tttgaaaaaa 360
ttccctatct gttaaaatgc gctaatagtg taaaaattag ttacatattt ctatattcgt 420
gatgagtgat ccatatgtgt acatatatga actgtttgat aaaatatcca aatgaagaaa 480
gttctttgtt aatgaatcaa tttatgaata tgtggtgcct atcggtgttt ctatgaagga 540
agtttaatct ggaagtattt tttttcctag tgttaaaacc tgtgaataaa ttggtcaatt 600
aagtttttct agtgtacaca ggtagagata gtacaaaaga ttcatgttga cggagaagtg 660
aatagagcga gatgtatgcc acagaagcca gctgtagttg cagctaagac tagtagctct 720
gaagtttatg tctttgactc agctaaacag ccccttgatc atgaaggtgg gtcttgtaac 780
cctgatgttc gacttcgtgg gcatgataaa gaaggttatg gcttgtcgtg gagcccgttt 840
aaagagggtt ttcttttgag tggttcaaat gatcagaaga tttgtttgtg ggatatatct 900
gcattgcctc aagataaagt tcttatggct catcatactt atgaggtaat gtgatctgtc 960
ctttcaccca atgtgctgat tcaactgagt ttcttttgtt gattccgtag ttgaatatca 1020
ctatggcaga tatgaattta attctggtat ttttgtatag gagcatgaag atgtagttga 1080
ggatgtgtca tggcatccaa agaatgagaa cctatttggt tctgtcggag atgattgtcg 1140
tctgatcatt tgggacttcc ggacaaacaa agcccaacac tcggttttag tgcatgagaa 1200
agaggtcagt gtcttcaaat tccatcttgt ttaatatttt accacgcact gttttatctg 1260
tatcattgag attaatctct actatgcttg tctaatcgtt caatgatata acccatagat 1320
catgcactag gcacccaata tggtattaaa gaaaaacata tgaaactatt ggataggact 1380
gttgagatgt catatgagtc tttgaataat gggacctcca acaatggtta tccttcgtac 1440
attgtactgg tcttattttt atctgtttga gaggttaatc ctgtcacctg tttcacatgc 1500
attaatgaaa tgcgaattca gaaagttaat agcatgtgca ccggctgaac aaacttttct 1560
caatagttat cctgaggcag tcttgctgat cttgtttttc ttcctctctg caggtgaatt 1620
atttatcttt caactcatat actgaatggg ttcttgctac agcatcgtca gatagtactg 1680
ttggtctgtt cgacatgcga aagcttagct ctccattgca cgtgtttggc agtcatacgt 1740
atgtccttca gcttatttca agtcttcaaa tttgttgtgg tcaatctttt acgtcactcc 1800
attattttat tggcttggtg actatcgaaa tcacagttta ctgatgttcg tctccagtga 1860
tgattgactt gtcaatattt ggatccctta gtatgctata cagagctcct tttgaaacaa 1920
aaaacttatg aaaactaaaa gtatctgtca aatctactta tcgtggtgca tttctttcat 1980
cattgttgaa ttattttgcc tgtgtatgca cacagaaatt ggtcaaatct gctgttgctt 2040
ttgagccctg cttatgctct tactcagcca attcctggtt ttagatgaca ttgctgtagg 2100
aattctcatg cattcttcta aatgtgacaa ctcttctacc ttttgtttct accaatgata 2160
cgatttttgt cattaaacct ttttgcaggg atgaggtgtt ccaggtagaa tgggatccta 2220
atcatgagac tgtactggca tcttcaggtg gtgatagaag gttgatggtc tgggatctta 2280
acaggtacat catgcatgaa atgaattcca caacacgaaa acgatggtgg tggattatca 2340
gttatcactt aaatttaata cgagataatg gtgatactaa ccaaagaaag agttgtatgg 2400
tttacctttt ttgtcttaca acaagattgt tgtcttcagg attggtgacg agcaattgga 2460
aggggaagct gaagacggac cgtcagaact tcttttctct catggcggtc acaaagcaaa 2520
gatatctgat ttttcatgga acaagaacga gccatgggtc atttcaagtg tggcagaaga 2580
caactgtgtc caagtctggc agatggctga gagcatctac cgtgaggaca atgacaatgg 2640
caactgctga 2650
<210> 9
<211> 2650
<212> DNA
<213> Solanum lycopersicum
<400> 9
atggctgaag aagaattgga ggcggcggga gaaaccgaac aagatgtaga agaggagttc 60
gccgtttgga agaagaacac gccgttgctc tacgatcttg tcgtttgtca tgcccttgaa 120
tggccttctc tcaccgttca atggcttccg tctccaacca ccgacgacgg tgcttttgct 180
gtacacaagc tcattctcgg aactcacacc tccgacgatt gccccaactt cctcatggtc 240
gcaaaggttc atctccctcg gaatcctgct tcaggacttg aacacaatct catgaatcct 300
caaatcccta aggtctgtaa ctccttacaa tcggttaaac tacactaata tttgaaaaaa 360
ttccctatct gttaaaatgc gctaatagtg taaaaattag ttacatattt ctatattcgt 420
gatgagtgat ccatatgtgt acatatatga actgtttgat aaaatatcca aatgaagaaa 480
gttctttgtt aatgaatcaa tttatgaata tgtggtgcct atcggtgttt ctatgaagga 540
agtttaatct ggaagtattt tttttcctag tgttaaaacc tgtgaataaa ttggtcaatt 600
aagtttttct agtgtacaca ggtagagata gtacaaaaga ttcatgttga cggagaagtg 660
aatagagcga gatgtatgcc acagtagcca gctgtagttg cagctaagac tagtagctct 720
gaagtttatg tctttgactc agctaaacag ccccttgatc atgaaggtgg gtcttgtaac 780
cctgatgttc gacttcgtgg gcatgataaa gaaggttatg gcttgtcgtg gagcccgttt 840
aaagagggtt ttcttttgag tggttcaaat gatcagaaga tttgtttgtg ggatatatct 900
gcattgcctc aagataaagt tcttatggct catcatactt atgaggtaat gtgatctgtc 960
ctttcaccca atgtgctgat tcaactgagt ttcttttgtt gattccgtag ttgaatatca 1020
ctatggcaga tatgaattta attctggtat ttttgtatag gagcatgaag atgtagttga 1080
ggatgtgtca tggcatccaa agaatgagaa cctatttggt tctgtcggag atgattgtcg 1140
tctgatcatt tgggacttcc ggacaaacaa agcccaacac tcggttttag tgcatgagaa 1200
agaggtcagt gtcttcaaat tccatcttgt ttaatatttt accacgcact gttttatctg 1260
tatcattgag attaatctct actatgcttg tctaatcgtt caatgatata acccatagat 1320
catgcactag gcacccaata tggtattaaa gaaaaacata tgaaactatt ggataggact 1380
gttgagatgt catatgagtc tttgaataat gggacctcca acaatggtta tccttcgtac 1440
attgtactgg tcttattttt atctgtttga gaggttaatc ctgtcacctg tttcacatgc 1500
attaatgaaa tgcgaattca gaaagttaat agcatgtgca ccggctgaac aaacttttct 1560
caatagttat cctgaggcag tcttgctgat cttgtttttc ttcctctctg caggtgaatt 1620
atttatcttt caactcatat actgaatggg ttcttgctac agcatcgtca gatagtactg 1680
ttggtctgtt cgacatgcga aagcttagct ctccattgca cgtgtttggc agtcatacgt 1740
atgtccttca gcttatttca agtcttcaaa tttgttgtgg tcaatctttt acgtcactcc 1800
attattttat tggcttggtg actatcgaaa tcacagttta ctgatgttcg tctccagtga 1860
tgattgactt gtcaatattt ggatccctta gtatgctata cagagctcct tttgaaacaa 1920
aaaacttatg aaaactaaaa gtatctgtca aatctactta tcgtggtgca tttctttcat 1980
cattgttgaa ttattttgcc tgtgtatgca cacagaaatt ggtcaaatct gctgttgctt 2040
ttgagccctg cttatgctct tactcagcca attcctggtt ttagatgaca ttgctgtagg 2100
aattctcatg cattcttcta aatgtgacaa ctcttctacc ttttgtttct accaatgata 2160
cgatttttgt cattaaacct ttttgcaggg atgaggtgtt ccaggtagaa tgggatccta 2220
atcatgagac tgtactggca tcttcaggtg gtgatagaag gttgatggtc tgggatctta 2280
acaggtacat catgcatgaa atgaattcca caacacgaaa acgatggtgg tggattatca 2340
gttatcactt aaatttaata cgagataatg gtgatactaa ccaaagaaag agttgtatgg 2400
tttacctttt ttgtcttaca acaagattgt tgtcttcagg attggtgacg agcaattgga 2460
aggggaagct gaagacggac cgtcagaact tcttttctct catggcggtc acaaagcaaa 2520
gatatctgat ttttcatgga acaagaacga gccatgggtc atttcaagtg tggcagaaga 2580
caactgtgtc caagtctggc agatggctga gagcatctac cgtgaggaca atgacaatgg 2640
caactgctga 2650
<210> 10
<211> 403
<212> PRT
<213> Solanaceae
<220>
<221> misc_feature
<222> (35)..(35)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (54)..(54)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (58)..(58)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (74)..(74)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (189)..(189)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (199)..(199)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (270)..(270)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (398)..(398)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (402)..(402)
<223> Xaa can be any naturally occurring amino acid
<400> 10
Met Ala Glu Glu Glu Met Glu Ala Ala Gly Glu Thr Glu Gln Glu Val
1 5 10 15
Glu Glu Glu Phe Ala Val Trp Lys Lys Asn Thr Pro Leu Leu Tyr Asp
20 25 30
Leu Val Xaa Cys His Ala Leu Glu Trp Pro Ser Leu Thr Val Gln Trp
35 40 45
Leu Pro Ser Pro Thr Xaa Asp Asp Gly Xaa Phe Ala Val His Lys Leu
50 55 60
Ile Leu Gly Thr His Thr Ser Asp Asp Xaa Pro Asn Phe Leu Met Val
65 70 75 80
Ala Asn Val His Leu Pro Arg Asn Pro Ala Ser Gly Leu Glu His Asn
85 90 95
Leu Met Asn Pro Gln Ile Pro Lys Val Glu Ile Val Gln Lys Ile His
100 105 110
Val Asp Gly Glu Val Asn Arg Ala Arg Cys Met Pro Gln Lys Pro Ala
115 120 125
Val Val Ala Ala Lys Thr Ser Ser Ser Glu Val Tyr Val Phe Asp Ser
130 135 140
Ala Lys Gln Pro Leu Asp His Glu Gly Gly Ser Cys Asn Pro Asp Val
145 150 155 160
Arg Leu Arg Gly His Asp Lys Glu Gly Tyr Gly Leu Ser Trp Ser Pro
165 170 175
Phe Lys Glu Gly Phe Leu Leu Ser Gly Ser Asn Asp Xaa Lys Ile Cys
180 185 190
Leu Trp Asp Val Ser Ala Xaa Pro Gln Asp Lys Val Leu Met Ala His
195 200 205
His Thr Tyr Glu Glu His Glu Asp Val Val Glu Asp Val Ser Trp His
210 215 220
Pro Lys Asn Glu Asn Leu Phe Gly Ser Val Gly Asp Asp Cys Arg Leu
225 230 235 240
Ile Ile Trp Asp Leu Arg Thr Asn Lys Ser Gln His Ser Val Leu Val
245 250 255
His Glu Lys Glu Val Asn Tyr Leu Ser Phe Asn Ser Tyr Xaa Glu Trp
260 265 270
Val Leu Ala Thr Ala Ser Ser Asp Ser Thr Val Gly Leu Phe Asp Met
275 280 285
Arg Lys Leu Ser Ser Pro Leu His Val Phe Gly Ser His Thr Asp Glu
290 295 300
Val Phe Gln Val Glu Trp Asp Pro Asn His Glu Thr Val Leu Ala Ser
305 310 315 320
Ser Gly Gly Asp Arg Arg Leu Met Val Trp Asp Leu Asn Arg Ile Gly
325 330 335
Asp Glu Gln Leu Glu Gly Glu Ala Glu Asp Gly Pro Ser Glu Leu Leu
340 345 350
Phe Ser His Gly Gly His Lys Ala Lys Ile Ser Asp Phe Ser Trp Asn
355 360 365
Lys Asn Glu Pro Trp Val Ile Ser Ser Val Ala Glu Asp Asn Cys Val
370 375 380
Gln Val Trp Gln Met Ala Glu Ser Ile Tyr Arg Glu Asp Xaa Asp Asn
385 390 395 400
Gly Xaa Cys

Claims (47)

1.包含功能丧失性突变的植物来源的Msi2蛋白。
2.权利要求1的Msi2蛋白,其中所述突变存在于WD40重复和/或CAF1C结构域中。
3.权利要求1或2中任一项的Msi2蛋白,其由具有功能丧失性突变的植物Msi2蛋白编码多核苷酸编码,当存在于没有其内源性Msi2蛋白的植物中时,当所述植物与野生型植物杂交时,所述蛋白允许产生一些单倍体子代或具有异常倍性的子代。
4.前述权利要求中任一项的Msi2蛋白,其源自包含SEQ ID NO:1或10的氨基酸序列或其变体的多肽,所述变体与SEQ ID NO:1或10的氨基酸序列具有至少70%,更优选至少80%,甚至更优选至少90%,甚至更优选至少95%,最优选至少98%或99%序列相同性,所述蛋白由具有功能丧失性突变的植物Msi2蛋白编码多核苷酸编码,当存在于没有其内源性Msi2蛋白的植物中时,当所述植物与野生型植物杂交时,所述蛋白允许产生一些单倍体子代或具有异常倍性的子代。
5.前述权利要求中任一项的Msi2蛋白,其源自包含SEQ ID NO:2或3的氨基酸序列或其变体的多肽,所述变体与SEQ ID NO:2或3的氨基酸序列具有至少70%,更优选至少80%,甚至更优选至少90%,甚至更优选至少95%,最优选至少98%或99%序列相同性,所述蛋白由具有功能丧失性突变的植物Msi2蛋白编码多核苷酸编码,当存在于没有其内源性Msi2蛋白的植物中时,当所述植物与野生型植物杂交时,所述蛋白允许产生一些单倍体子代或具有异常倍性的子代。
6.权利要求4-5中任一项的Msi2蛋白,其中所产生的子代的至少0.1、0.5、1或5%是单倍体,或者具有异常倍性,或者是双单倍体。
7.前述权利要求中任一项的Msi2蛋白,其中所述功能丧失性突变引入导致蛋白截短的过早的终止密码子。
8.权利要求7的Msi2蛋白,其中所述蛋白在SEQ ID NO:2、3或10中的位置125处的氨基酸残基之后截短,或者在SEQ ID NO:1中的位置123处的氨基酸残基之后截短。
9.由SEQ ID NO:6的氨基酸序列组成的Msi2蛋白。
10.权利要求8-9中任一项的Msi2蛋白,其由包含SEQ ID NO:4或9的核酸序列的核酸分子编码。
11.前述权利要求中任一项的Msi2蛋白,其由包含功能丧失性突变的多核苷酸编码,所述多核苷酸利用靶向核苷酸交换或通过应用内切核酸酶衍生自编码内源性Msi2蛋白的多核苷酸。
12.编码前述权利要求中任一项的Msi2蛋白的核酸分子。
13.包含SEQ ID NO:5、7或8的核酸序列或其变体的核酸分子,所述变体与SEQ ID NO:5、7或8的核酸序列具有至少70%,更优选至少80%,甚至更优选至少90%,甚至更优选至少95%,最优选至少98%或99%序列相同性,其中将SEQ ID NO:5、7或8的核酸序列的一个或多个核苷酸修饰,从而核酸分子编码包含功能丧失性突变的Msi2蛋白。
14.包含SEQ ID NO:5、7或8的核酸序列或其变体的核酸分子,所述变体与SEQ ID NO:5、7或8的核酸序列具有至少70%,更优选至少80%,甚至更优选至少90%,甚至更优选至少95%,最优选至少98%或99%序列相同性,其中将一个或多个核苷酸修饰,从而引入过早的终止密码子并且核酸分子编码截短的Msi2蛋白。
15.权利要求14的核酸分子,其中将在SEQ ID NO:5或7的核酸序列的位置376、377和/或378处的一个或多个核苷酸,或者在SEQ ID NO:8的核酸序列的位置685、686和/或687处的一个或多个核苷酸修饰,从而引入终止密码子,并且核酸分子编码包含在对应于SEQ IDNO:2或3中位置125的氨基酸残基之后截短的氨基酸序列的多肽。
16.包含SEQ ID NO:4或9的核酸序列的核酸分子。
17.权利要求12-16中任一项的核酸分子,其是分离的核酸、基因组核酸或cDNA。
18.包含权利要求12-17中任一项的核酸分子的嵌合基因。
19.包含权利要求12-17中任一项的核酸分子或权利要求18的嵌合基因的载体。
20.包含权利要求12-17中任一项的核酸分子、权利要求18的嵌合基因或权利要求19的载体的宿主细胞。
21.权利要求20的宿主细胞,其是植物细胞,优选番茄植物细胞。
22.包含权利要求12-17中任一项的核酸分子、权利要求18的嵌合基因或权利要求19的载体的植物、种子或植物细胞。
23.权利要求22的植物、种子或植物细胞,其中内源性Msi2蛋白不表达。
24.植物、种子或植物细胞,其中内源性Msi2蛋白不表达,其中所述植物不是拟南芥植物、种子或植物细胞。
25.权利要求24的植物、种子或植物细胞,其中将内源性Msi2基因敲除。
26.权利要求22-25中任一项的植物、种子或植物细胞,其是茄属植物、种子或植物细胞,优选番茄(Solanum lycopersicum)植物、种子或植物细胞。
27.制备权利要求22-26中任一项的植物、种子或植物细胞的方法,所述方法包括以下步骤:
a)修饰植物细胞内的内源性Msi2基因以获得编码权利要求1-11中任一项的Msi2蛋白的突变的Msi2基因,或者修饰植物细胞内的内源性Msi2基因以敲除植物细胞内的内源性Msi2蛋白表达;
b)选择包含突变的Msi2基因的植物细胞,或者其中敲除所述内源性Msi2蛋白表达的植物细胞;以及
c)任选地,从所述植物细胞再生植物。
28.一种制备权利要求22-26中任一项的植物、种子或植物细胞的方法,所述方法包括以下步骤:
a)用权利要求12-17中任一项的核酸分子、权利要求18的嵌合基因或权利要求19的载体转化植物细胞,或者用核酸分子转化植物细胞以敲除内源性Msi2蛋白表达;
b)任选地,额外地修饰植物细胞内的内源性Msi2基因以敲除所述植物细胞内的内源性Msi2蛋白表达;
c)选择包含权利要求12-17中任一项的核酸分子、权利要求18的嵌合基因或权利要求19的载体的植物细胞,和/或其中敲除内源性Msi2蛋白表达的植物细胞;以及
d)任选地,从所述植物细胞再生植物。
29.一种产生单倍体植物、具有异常倍性的植物或双单倍体植物的方法,所述方法包括以下步骤:
a)将表达内源性Msi2蛋白的植物与权利要求22-26中任一项的植物杂交,其中权利要求22-26的植物至少在其生殖部分和/或在胚发育期间没有内源性Msi2蛋白表达;
b)收获种子;
c)从所述种子种植至少一个幼苗、小植物或植物;以及
d)选择单倍体幼苗、小植物或植物,具有异常倍性的幼苗、小植物或植物,或者双单倍体幼苗、小植物或植物。
30.一种产生双单倍体植物的方法,所述方法包括以下步骤:
a)将表达内源性Msi2蛋白的植物与权利要求22-26中任一项的植物杂交,其中权利要求22-26的植物至少在其生殖部分和/或在胚发育期间没有内源性Msi2蛋白表达;
b)选择单倍体植物;以及
c)将所述单倍体植物转化为双单倍体植物。
31.权利要求30的方法,其中步骤c)中的转化通过用秋水仙碱处理进行。
32.权利要求29-31中任一项的方法,其中表达内源性Msi2蛋白的植物是F1植物。
33.权利要求29-32中任一项的方法,其中表达内源性Msi2蛋白的植物是杂交的花粉亲本。
34.权利要求29-32中任一项的方法,其中表达内源性Msi2蛋白的植物是杂交的胚珠亲本。
35.权利要求29-34中任一项的方法,其中所述杂交在约24℃-约30℃的温度范围下进行,优选在约26℃-约28℃的范围中。
36.权利要求12-17中任一项的核酸分子在制备单倍体诱导系中的用途。
37.包含权利要求12-17中任一项的核酸分子、权利要求18的嵌合基因或权利要求19的载体的番茄植物、种子或植物细胞。
38.包含编码多肽的核酸分子的番茄植物、种子或植物细胞,所述多肽包含SEQ ID NO:6的氨基酸序列或由SEQ ID NO:6的氨基酸序列组成。
39.包含SEQ ID NO:4或9的核酸分子的番茄植物、种子或植物细胞。
40.包含编码权利要求1-11中任一项的Msi2蛋白的核酸分子的番茄植物、种子或植物细胞。
41.没有功能性Msi2蛋白表达的番茄植物、种子或植物细胞;任选地,其中表达包含功能丧失性突变的Msi2蛋白。
42.权利要求41的番茄植物、种子或植物细胞,其中所述Msi2蛋白是截短的或不存在。
43.权利要求37-42中任一项的番茄植物、种子或植物细胞在制备单倍体番茄植物、种子或植物细胞中的用途。
44.权利要求37-42中任一项的番茄植物、种子或植物细胞在制备双单倍体番茄植物、种子或植物细胞中的用途。
45.权利要求43-44中任一项的用途,其中所述番茄植物至少在其生殖部分和/或在胚发育期间没有内源性Msi2蛋白表达。
46.一种产生单倍体或双单倍体植物的方法,所述方法包括鉴定表达内源性Msi2蛋白的植物和权利要求22-26中任一项的植物的步骤,其中权利要求22-26的植物至少在其生殖部分和/或在胚发育期间没有内源性Msi2蛋白表达。
47.权利要求29-35或46中任一项的方法,其不包括有性杂交所述植物的整个基因组。
CN201680070676.5A 2015-10-02 2016-10-03 制备单倍体和随后的双单倍体植物的方法 Active CN108368518B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
NL2015549 2015-10-02
NL2015549 2015-10-02
PCT/NL2016/050683 WO2017058023A1 (en) 2015-10-02 2016-10-03 Method for the production of haploid and subsequent doubled haploid plants

Publications (2)

Publication Number Publication Date
CN108368518A true CN108368518A (zh) 2018-08-03
CN108368518B CN108368518B (zh) 2023-12-05

Family

ID=55178276

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201680070676.5A Active CN108368518B (zh) 2015-10-02 2016-10-03 制备单倍体和随后的双单倍体植物的方法

Country Status (10)

Country Link
US (2) US10849289B2 (zh)
EP (1) EP3356536A1 (zh)
JP (2) JP2018530323A (zh)
CN (1) CN108368518B (zh)
AU (1) AU2016331021B2 (zh)
BR (1) BR112018006573A2 (zh)
CA (1) CA3000133A1 (zh)
IL (1) IL258484A (zh)
MX (1) MX2018003973A (zh)
WO (1) WO2017058023A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113631715A (zh) * 2018-10-12 2021-11-09 先正达农作物保护股份公司 新的小麦cenh3等位基因

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
MX2018003973A (es) * 2015-10-02 2018-09-06 Keygene Nv Metodo para la produccion de plantas haploides y doble haploides posteriores.
BR112019004850A2 (pt) 2016-09-14 2019-06-11 Monsanto Technology Llc métodos e composições para edição de genoma por meio de indução de haploides
CN114525300A (zh) * 2022-01-28 2022-05-24 中国农业科学院深圳农业基因组研究所 多核苷酸和蛋白质的应用及其单倍体诱导系
CN116491415B (zh) * 2023-03-07 2024-05-28 海南大学三亚南繁研究院 优化温度提高cenh3介导的母本单倍体诱导效率的方法

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20010051335A1 (en) * 1998-04-21 2001-12-13 Raghunath V. Lalgudi Polynucleotides and polypeptides derived from corn tassel
CN1954071A (zh) * 2003-12-30 2007-04-25 阿博根有限公司 细胞周期基因和相关使用方法
CN101156545A (zh) * 2007-11-29 2008-04-09 中国农业大学 一种利用高油型诱导系诱导玉米单倍体和多胚体的方法
WO2008097791A2 (en) * 2007-02-02 2008-08-14 Pioneer Hi-Bred International, Inc. Selective ablation of diploid embryos
CN101377481A (zh) * 2008-10-06 2009-03-04 中国农业大学 鉴别玉米孤雌生殖单倍体的方法
CN101379080A (zh) * 2005-12-09 2009-03-04 科学与工业研究会 用于产生胚中具有母体基因组的全二倍体组的种子的核酸和方法
CN101805721A (zh) * 2010-04-01 2010-08-18 中国农业大学 玉米单倍体胚芽鞘节组织培养的方法及其专用培养基
US20110083202A1 (en) * 2009-10-06 2011-04-07 Regents Of The University Of California Generation of haploid plants and improved plant breeding
CN102177846A (zh) * 2011-03-11 2011-09-14 中国农业大学 一种玉米单倍体加倍管理方法
WO2014110274A2 (en) * 2013-01-09 2014-07-17 Regents Of The University Of California A California Corporation Generation of haploid plants

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0290799B9 (en) 1983-01-13 2004-09-01 Max-Planck-Gesellschaft zur Förderung der Wissenschaften e.V. Transgenic dicotyledonous plant cells and plants
JPH0714349B2 (ja) 1983-01-17 1995-02-22 モンサント カンパニ− 植物細胞での発現に適したキメラ遺伝子
DE3464841D1 (en) 1983-01-27 1987-08-27 Gen Foods Corp Water-agglomeration method for depeptide sweetened products
NL8300699A (nl) 1983-02-24 1984-09-17 Univ Leiden Werkwijze voor het inbouwen van vreemd dna in het genoom van tweezaadlobbige planten; werkwijze voor het produceren van agrobacterium tumefaciens bacterien; stabiele cointegraat plasmiden; planten en plantecellen met gewijzigde genetische eigenschappen; werkwijze voor het bereiden van chemische en/of farmaceutische produkten.
DE3765449D1 (de) 1986-03-11 1990-11-15 Plant Genetic Systems Nv Durch gentechnologie erhaltene und gegen glutaminsynthetase-inhibitoren resistente pflanzenzellen.
EP0265556A1 (en) 1986-10-31 1988-05-04 Max-Planck-Gesellschaft zur Förderung der Wissenschaften e.V. Stable binary agrobacterium vectors and their use
US5693507A (en) 1988-09-26 1997-12-02 Auburn University Genetic engineering of plant chloroplasts
ATE453728T1 (de) 2005-09-29 2010-01-15 Keygene Nv Screening mutagenisierter populationen mit hohem durchsatz
JP5791897B2 (ja) 2007-09-24 2015-10-07 キージーン ナムローゼ フェンノートシャップ 特異的突然変異を有する植物を選択する方法
MX2018003973A (es) * 2015-10-02 2018-09-06 Keygene Nv Metodo para la produccion de plantas haploides y doble haploides posteriores.

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20010051335A1 (en) * 1998-04-21 2001-12-13 Raghunath V. Lalgudi Polynucleotides and polypeptides derived from corn tassel
CN1954071A (zh) * 2003-12-30 2007-04-25 阿博根有限公司 细胞周期基因和相关使用方法
CN101379080A (zh) * 2005-12-09 2009-03-04 科学与工业研究会 用于产生胚中具有母体基因组的全二倍体组的种子的核酸和方法
WO2008097791A2 (en) * 2007-02-02 2008-08-14 Pioneer Hi-Bred International, Inc. Selective ablation of diploid embryos
CN101156545A (zh) * 2007-11-29 2008-04-09 中国农业大学 一种利用高油型诱导系诱导玉米单倍体和多胚体的方法
CN101377481A (zh) * 2008-10-06 2009-03-04 中国农业大学 鉴别玉米孤雌生殖单倍体的方法
US20110083202A1 (en) * 2009-10-06 2011-04-07 Regents Of The University Of California Generation of haploid plants and improved plant breeding
CN101805721A (zh) * 2010-04-01 2010-08-18 中国农业大学 玉米单倍体胚芽鞘节组织培养的方法及其专用培养基
CN102177846A (zh) * 2011-03-11 2011-09-14 中国农业大学 一种玉米单倍体加倍管理方法
WO2014110274A2 (en) * 2013-01-09 2014-07-17 Regents Of The University Of California A California Corporation Generation of haploid plants

Non-Patent Citations (9)

* Cited by examiner, † Cited by third party
Title
ANNE-ELISABETH GUITTON 等: "Identification of new members of Fertilisation Independent Seed Polycomb Group pathway involved in the control of seed development in Arabidopsis thaliana", 《DEVELOPMENT》 *
JESSIE M. SUTHERLAND 等: "Developmental Expression of Musashi-1 and Musashi-2 RNA-Binding Proteins During Spermatogenesis: Analysis of the Deleterious Effects of Dysregulated Expression", 《BIOLOGY OF REPRODUCTION》 *
MARUTHACHALAM RAVI 等: "A haploid genetics toolbox for Arabidopsis thaliana", 《NATURE COMMUNICATIONS》 *
MARUTHACHALAM RAVI 等: "Haploid plants produced by centromere-mediated genome elimination", 《NATURE》 *
NCBI: "PREDICTED: WD-40 repeat-containing protein MSI2-like [Solanum lycopersicum]", 《GENBANK DATABASE》 *
NCBI: "WD-40 repeat-containing protein MSI2 [Arabidopsis thaliana]", 《GENBANK DATABASE》 *
ZOHAR BEN-SIMHON 等: "A pomegranate (Punica granatum L.) WD40-repeat gene is a functional homologue of Arabidopsis TTG1 and is involved in the regulation of anthocyanin biosynthesis during pomegranate fruit development", 《PLANTA》 *
李頔 等: "番茄MSI2-like基因的克隆及功能初探", 《四川大学学报(自然科学版)》 *
杨一平 等: "杨树划分发育途径及某些因素的影响", 《林业科学》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113631715A (zh) * 2018-10-12 2021-11-09 先正达农作物保护股份公司 新的小麦cenh3等位基因

Also Published As

Publication number Publication date
EP3356536A1 (en) 2018-08-08
IL258484A (en) 2018-05-31
BR112018006573A2 (pt) 2018-10-09
US11576318B2 (en) 2023-02-14
CA3000133A1 (en) 2017-04-06
CN108368518B (zh) 2023-12-05
AU2016331021A1 (en) 2018-04-19
AU2016331021B2 (en) 2022-10-27
US20210076584A1 (en) 2021-03-18
US20190029202A1 (en) 2019-01-31
US10849289B2 (en) 2020-12-01
JP2022023066A (ja) 2022-02-07
JP2018530323A (ja) 2018-10-18
MX2018003973A (es) 2018-09-06
WO2017058023A1 (en) 2017-04-06

Similar Documents

Publication Publication Date Title
WO2015171894A1 (en) Methods for selecting plants after genome editing
CN106164272A (zh) 修饰的植物
EP3978613A1 (en) Parthenogenetic haploid induction gene dmp and application thereof
EP3557980A1 (en) Genome editing-based crop engineering and production of brachytic plants
CN108368518A (zh) 制备单倍体和随后的双单倍体植物的方法
US20120284813A1 (en) Identification and use of krp mutants in wheat
AU2021206832B2 (en) Method for the production of haploid and subsequent doubled haploid plants
CN108291234A (zh) 倍数孢子体形成基因
US20190248843A1 (en) Compositions and methods for improving crop yields through trait stacking
CA2992799A1 (en) Modified plants
JP5259717B2 (ja) トマトの収穫量を増加させるためのプロモーター配列および遺伝子構築物
US20190225657A1 (en) Method for the production of haploid and subsequent doubled haploid plants
CN103172714B (zh) 水稻叶片卷曲相关蛋白OsMYB103L及其编码基因与应用
EP3689135A1 (en) Haploid inducers
CN106987569B (zh) 大豆磷酸酶GmWIN2及其编码基因在调控植物种子产量中的应用
CN109082436A (zh) 利用bcs1l基因和向导rna/cas核酸内切酶体系改良植物农艺性状的方法
AU2022378960A1 (en) Methods of increasing root endosymbiosis
CN115667529A (zh) 黄瓜植物习性

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant