CN108290934A - 制备单倍体和随后的双单倍体植物的方法 - Google Patents

制备单倍体和随后的双单倍体植物的方法 Download PDF

Info

Publication number
CN108290934A
CN108290934A CN201680070035.XA CN201680070035A CN108290934A CN 108290934 A CN108290934 A CN 108290934A CN 201680070035 A CN201680070035 A CN 201680070035A CN 108290934 A CN108290934 A CN 108290934A
Authority
CN
China
Prior art keywords
ser
amino acid
leu
plant
glu
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201680070035.XA
Other languages
English (en)
Inventor
R·H·M·奥普德恩坎普
P·J·范戴克
A·加勒德
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Main Gene Co Ltd
Keygene NV
Original Assignee
Main Gene Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Main Gene Co Ltd filed Critical Main Gene Co Ltd
Publication of CN108290934A publication Critical patent/CN108290934A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • C12N15/8287Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for fertility modification, e.g. apomixis
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H1/00Processes for modifying genotypes ; Plants characterised by associated natural traits
    • A01H1/06Processes for producing mutations, e.g. treatment with chemicals or with radiation
    • A01H1/08Methods for producing changes in chromosome number
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/415Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8201Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A40/00Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
    • Y02A40/10Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture
    • Y02A40/146Genetically Modified [GMO] plants, e.g. transgenic plants

Landscapes

  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Cell Biology (AREA)
  • Plant Pathology (AREA)
  • Botany (AREA)
  • Medicinal Chemistry (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Developmental Biology & Embryology (AREA)
  • Environmental Sciences (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Peptides Or Proteins (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

据发现包含修饰的CENPC蛋白(包含一个或多个活性突变,其影响CENPC蛋白发挥功能但仍允许表达所述修饰的CENPC蛋白的植物存活)的植物能够在与包含内源性CENPC蛋白的野生型植物杂交之后诱导单倍体后代。本发明涉及单倍体和双单倍体植物的产生。

Description

制备单倍体和随后的双单倍体植物的方法
发明领域
本公开涉及农业领域。特别地,本公开涉及制备单倍体和随后的双单倍体植物。
发明背景
育种材料中的高度杂合性可以使对有益性状的植物育种和选择成为非常耗时的过程。即使用最新的分子育种工具,大量的群体筛选也是费力和昂贵的。
产生单倍体植物然后化学或自发基因组加倍是解决高杂合性问题的有效方式。这类双单倍体避开至少7代自交,否则需要降低杂合性至可接受的水平。可以通过小孢子培养在一些作物中产生单倍体植物。但是,这是昂贵和耗时的。更重要的是,在许多作物中,小孢子培养方法不可行。在一些作物物种中,可以通过卵细胞的孤雌生殖或通过消除亲代基因组之一获得(双)单倍体植物。但是,这些方法也局限于一些选定的作物,并且双单倍体植物的产率低。
WO2011/044132公开了制备单倍体植物的方法。采用的方法之一是失活或敲除CenH3蛋白。这通过添加N-末端GFP至CenH3蛋白进行,从而产生GFP-CenH3。这也称作“尾部交换”。在与没有这样修饰的N-末端部分的CenH3蛋白的植物杂交时尾部交换足以诱导单亲基因组消除。单亲基因组消除导致产生单倍体植物。到目前为止这种方法仅在模式植物拟南芥(Arabidopsis thaliana)中证实,并未在作物中证实。此外,当将由不同转基因修饰的N-末端部分的CenH3蛋白组成的另一人工构建体引入具有缺少内源性CenH3的遗传背景的植物时,看来这并未导致单亲基因组消除以及随后产生单倍体植物(WO 2014/110274)。因此难以捉摸CenH3蛋白的哪个修饰对于单亲基因组消除是足够的。
因此,本领域需要允许高效产生随后可以加倍的单倍体植物的方法,以便产生双单倍体植物。用双单倍体制备系统,在一代中实现纯和性。
发明概述
本发明人现在已发现由于独特的单核苷酸多态性,具有修饰的CENPC蛋白的植物在与缺少这些特定的独特的单核苷酸多态性的野生型植物杂交时能够诱导单倍体后代。一种多态性包含单一植物中的4个核苷酸改变,导致:(1)CENPC基因组DNA序列的剪接受体位点的G至T核苷酸修饰,导致在CENPC蛋白中插入H氨基酸,(2)CENPC蛋白中的D至K氨基酸修饰,以及(3)CENPC蛋白中的N至Y氨基酸修饰。另一独特的单核苷酸多态性导致CENPC蛋白中的M-V氨基酸修饰。用对照植物相互杂交,从未产生任何单倍体后代。
本发明涉及包含一个或多个活性突变的植物来源的CENPC蛋白。所述一个或多个活性突变可以存在于包含SEQ ID NO:2、3、4或15-19中任一个的氨基酸序列的蛋白中。可以在蛋白中产生所述一个或多个活性突变,所述蛋白包含SEQ ID NO:2、3、4或15-19中任一个或其变体的氨基酸序列,所述变体与SEQ ID NO:2、3、4或15-19中任一个的氨基酸序列具有至少70%,更优选至少80%,甚至更优选至少90%,甚至更优选至少95%,最优选至少98%或99%序列相同性。
在实施方案中,所述一个或多个活性突变存在于如SEQ ID NO:5或6中任一个所示的氨基酸序列表示的双单倍体诱导结构域中。
所述一个或多个活性突变可以选自:在SEQ ID NO:3或4中任一个的氨基酸序列中,位置552和553的氨基酸残基之间的突变,位置554的氨基酸残基的突变,位置555的氨基酸残基的突变以及位置556的氨基酸残基的突变,或者它们的任何组合;或者在SEQ ID NO:2的氨基酸序列中,位置555和556的氨基酸残基之间的突变,位置557的氨基酸残基的突变,位置558的氨基酸残基的突变以及位置559的氨基酸残基的突变,或者它们的任何组合。
在实施方案中,在SEQ ID NO:3或4中任一个的氨基酸序列的位置554或者在SEQID NO:2的氨基酸序列中的位置557被突变的氨基酸是天冬氨酸和/或在SEQ ID NO:3或4中任一个的氨基酸序列的位置555或者在SEQ ID NO:2的氨基酸序列中的位置558被改变的氨基酸是天冬酰胺和/或在SEQ ID NO:3或4中任一个的氨基酸序列的位置556或者在SEQ IDNO:2的氨基酸序列中的位置559被改变的氨基酸是甲硫氨酸。
在实施方案中,在SEQ ID NO:3或4中任一个的氨基酸序列的位置554或者在SEQID NO:2的氨基酸序列中的位置557的氨基酸变为带正电荷的氨基酸残基,优选赖氨酸,和/或在SEQ ID NO:3或4中任一个的氨基酸序列的位置555或者在SEQ ID NO:2的氨基酸序列中的位置558的氨基酸变为酪氨酸,和/或在SEQ ID NO:3或4中任一个的氨基酸序列的位置556或者在SEQ ID NO:2的氨基酸序列中的位置557的氨基酸变为缬氨酸,和/或其中将带正电荷的残基,优选组氨酸插入SEQ ID NO:3或4中任一个的氨基酸序列的氨基酸残基552和553之间或者SEQ ID NO:2的氨基酸序列中氨基酸残基555和556之间。
在实施方案中,将组氨酸插入SEQ ID NO:3或4中任一个的氨基酸序列的氨基酸残基552和553之间或者SEQ ID NO:2的氨基酸序列中氨基酸残基555和556之间,和/或将在SEQ ID NO:3或4中任一个的氨基酸序列的位置554或者在SEQ ID NO:2的氨基酸序列中的位置557的天冬氨酸变为赖氨酸,和/或将在SEQ ID NO:3或4中任一个的氨基酸序列的位置555或者在SEQ ID NO:2的氨基酸序列中的位置558的天冬酰胺变为酪氨酸。
在实施方案中,所述蛋白包含SEQ ID NO:8或SEQ ID NO:10的氨基酸序列。
所述蛋白可以由包含SEQ ID NO:7或12中任一个的核酸序列的多核苷酸编码,或是所述蛋白可以由包含SEQ ID NO:9或13中任一个的核酸序列的多核苷酸编码。
在一实施方案中,所述蛋白由具有活性突变的CENPC蛋白编码多核苷酸编码,当存在于没有其内源性CENPC蛋白编码多核苷酸和/或内源性CENPC蛋白的植物中时,其允许所述植物存活,并且当所述植物与野生型植物杂交时,允许产生一些单倍体子代,或者具有异常倍性的子代。
优选地,所产生的子代的至少0.1、0.5、1或5%是单倍体或具有异常倍性。
所述蛋白可以通过利用靶向核苷酸交换或应用内切核酸酶在编码所述内源性CENPC蛋白的多核苷酸中引入突变衍生自内源性CENPC蛋白。
在实施方案中,所述一个或多个活性突变不存在于包含SEQ ID NO:1中示出的氨基酸序列的蛋白结构域中。
在另一方面,本发明涉及编码如本文教导的CENPC蛋白的多核苷酸。
本发明还涉及包含SEQ ID NO:11或14中任一个或其变体的核酸序列的多核苷酸,所述变体与SEQ ID NO:11或14中任一个的氨基酸序列具有至少70%,更优选至少80%,甚至更优选至少90%,甚至更优选至少95%,最优选至少98%或99%序列相同性,但是其中在SEQ ID NO:11的核酸序列的位置2449-2450和/或2454-2462或者在SEQ ID NO:14的位置1660-1668的一个或多个核苷酸经修饰,从而所述核酸编码CENPC蛋白,其中SEQ ID NO:3的氨基酸序列在位置554和/或在位置555和/或在位置556具有改变的残基,和/或在SEQ IDNO:3的氨基酸序列的氨基酸残基552和553之间具有氨基酸残基如组氨酸的插入。
此外,本文教导包含SEQ ID NO:7或12中任一个的核酸序列的多核苷酸。
本文还教导包含SEQ ID NO:9或13中任一个的核酸序列的多核苷酸。
本文教导的多核苷酸可以是分离的。
本发明进一步涉及包含如本文教导的多核苷酸的嵌合基因,包含如本文教导的多核苷酸或嵌合基因的载体,以及包含如本文教导的多核苷酸、如本文教导的嵌合基因或如本文教导的载体的宿主细胞。所述宿主细胞可以是植物细胞,优选番茄植物细胞。
本发明还提供包含如本文教导的多核苷酸、如本文教导的嵌合基因或如本文教导的载体的植物。
在实施方案中,内源性CENPC蛋白在所述植物中不表达。
所述植物可以是茄属(Solanum)植物,优选番茄(Solanum lycopersicum)植物。
本发明进一步涉及制备如本文教导的植物的方法,所述方法包括以下步骤:
a)修饰植物细胞内的内源性植物CENPC蛋白编码多核苷酸以获得具有活性突变的植物CENPC蛋白编码多核苷酸;
b)选择包含具有活性突变的植物CENPC蛋白编码多核苷酸的植物细胞;以及
c)任选地,从所述植物细胞再生植物。
而且,本发明涉及制备如本文教导的植物的方法,所述方法包括以下步骤:
a)用如本文教导的多核苷酸、如本文教导的嵌合基因或如本文教导的载体转化植物细胞;
b)选择包含所述多核苷酸、嵌合基因或载体的植物细胞;以及
c)任选地,从所述植物细胞再生植物。
所述方法可以进一步包括修饰所述植物细胞以防止内源性CENPC蛋白表达的步骤。
可以修饰所述植物细胞内的内源性植物CENPC蛋白编码多核苷酸以防止内源性CENPC蛋白的表达。
本发明进一步涉及产生单倍体植物或具有异常倍性的植物的方法,所述方法包括以下步骤:
a)将表达内源性植物CENPC蛋白的植物与如本文教导的植物杂交,其中如本文教导的植物至少在其生殖部分和/或在胚发育期间不表达内源性CENPC蛋白;
b)收获种子;
c)从所述种子种植至少一个幼苗、小植物或植物生长;以及
d)选择单倍体幼苗、小植物或植物;具有异常倍性的幼苗、小植物或植物;或者双单倍体幼苗、小植物或植物。
本公开进一步教导产生双单倍体植物的方法,所述方法包括将步骤d)中获得的单倍体植物转化为双单倍体植物的步骤。
所述转化可以通过用秋水仙碱处理进行。
在实施方案中,所述表达内源性植物CENPC蛋白的植物是F1植物。
表达内源性CENPC蛋白的植物可以是杂交的花粉亲本,或者可以是杂交的胚珠亲本。
在实施方案中,在约24-约30℃范围中的温度下进行杂交。
在实施方案中,本文教导的方法不包括有性杂交所述植物的整个基因组。
本文教导的多核苷酸可以用于产生单倍体诱导系。
还提供包含如本文教导的多核苷酸、如本文教导的嵌合基因或如本文教导的载体的番茄植物。
此外,提供包含多核苷酸的番茄植物,所述多核苷酸编码包含SEQ ID NO:8或10中任一个的氨基酸序列的蛋白。
进一步,本文教导包含多核苷酸的番茄植物,所述多核苷酸包含SEQ ID NO:7、12、9或13中任一个的核酸序列。
本发明进一步提供包含编码如本文教导的CENPC蛋白的多核苷酸的番茄植物。
还提供在包含SEQ ID NO:4的氨基酸序列的多肽中包含一个或多个活性突变的番茄植物。
如本文教导的番茄植物可以用于产生单倍体番茄植物,和/或用于产生双单倍体番茄植物。
在实施方案中,如本文教导的番茄植物至少在其生殖部分和/或在胚发育期间不表达内源性CENPC蛋白。
在最后一方面,本发明涉及产生单倍体或双单倍体植物的方法,所述方法包括鉴定表达内源性CENPC蛋白的植物和如本文教导的植物,其中如本文教导的植物不表达内源性CENPC蛋白。
在实施方案中,所述方法不包括有性杂交所述植物的整个基因组。
定义
缩写“CENPC”或“CENP-C”表示着丝粒蛋白C。着丝粒蛋白C的特征在于CENPC基序,其是定义来自任何来源的CENPC蛋白的蛋白序列。CENPC基序在动物、酵母和植物中是高度保守的(Talbert et al 2004 Journal of biology 3(4),18)。来自人、小鼠、牛、鸡、秀丽隐杆线虫(Caenorhabditis elegans)、芽殖酵母、粟酒裂殖酵母(Schizosaccharomycespombe)、小立碗藓(Physcomitrella patens)、玉米、水稻、拟南芥、毛果杨、大豆和番茄的共有CENPC基序提供为SEQ ID NO:1。
“突变”是生物体、病毒的基因组或染色体外DNA或其他遗传元素的核苷酸序列的永久改变。突变由未修复的DNA损伤或RNA基因组损伤(通常由辐射或化学诱变剂引起)、复制过程中的错误所致,或者由通过可动遗传因子插入或缺失DNA片段所致。突变可以在生物体的可观察的特征(表型)中产生或不产生可辨别的变化。突变可以导致几种不同类型的序列改变。基因中的突变可以没有效果,改变基因产物,或者妨碍基因正常或完全发挥功能。突变还可以发生在非基因区中。
“具有活性突变的CENPC编码多核苷酸”是指编码具有活性突变的CENPC蛋白的非内源性的、突变的CENPC编码多核苷酸,当存在于没有其内源性CENPC编码多核苷酸和/或内源性CENPC蛋白的植物中时,其允许所述植物存活,并且当所述植物与野生型植物,优选相同物种的野生型植物,杂交时,允许产生一些单倍体子代,或者具有异常倍性的子代。包含具有活性突变的CENPC编码多核苷酸的植物可以称作“修饰的植物”。在与野生型植物杂交时产生的单倍体子代或具有异常倍性的子代的百分比可以是例如至少0.1、0.5、1、5、10、20%或更多。引起从内源性CENPC编码多核苷酸转变为具有活性突变的CENPC编码多核苷酸的突变在本文中称作“活性突变”。CENPC蛋白背景中的活性突变可以导致减少的着丝粒装载、功能较差的CENPC蛋白和/或在细胞分裂期间染色体分离的功能性减少。可以通过技术人员公知的若干方法中的任一种将活性突变引入CENPC编码多核苷酸,例如,通过随机诱变,如通过用化学品或辐射处理种子或植物细胞诱导,靶向诱变,应用内切核酸酶,通过产生部分或完全蛋白结构域缺失,或者通过与异源序列融合进行。或者,这些技术中的几种可以用来引入一个或多个活性突变。
“具有活性突变的CENPC蛋白”由具有活性突变的CENPC编码多核苷酸编码。内源性CENPC编码多核苷酸编码内源性CENPC蛋白。
可以通过敲除或失活所述内源性CENPC编码多核苷酸使植物缺少内源性CENPC编码多核苷酸。或者,可以修饰所述内源性CENPC编码多核苷酸以编码失活或非功能性的CENPC蛋白。
本文教导的包含具有活性突变的CENPC编码多核苷酸的修饰的植物可以作为花粉亲本或胚珠亲本与野生型植物杂交。在实施方案中,相对于内源性CENPC蛋白,具有活性突变的CENPC蛋白可以包含1、2、3、4、5、6、7、8、9、10、12、15、20或更多个氨基酸改变。在实施方案中,具有活性突变的CENPC编码多核苷酸与内源性CENPC编码多核苷酸,优选在全长中,具有70、75、80、85、90、95、96、97、98、99、99.5%序列相同性。
技术人员会容易地确定如本文教导的修饰的植物是否包含活性突变。例如,技术人员可以使用预测工具如SIFT(Kumar P,Henikoff S,Ng PC.(2009)Predicting theeffects of coding non-synonymous variants on protein function using the SIFTalgorithm.Nat Protoc;4(7):1073-81.doi:10.1038/nprot.2009.86)以提出这样的活性突变。然后可以在植物中产生活性突变,并且所述植物中内源性CENPC蛋白的表达应当敲除。当与野生型植物杂交时产生的单倍体子代或具有异常倍性的子代的百分比为至少0.1、0.5、1、5、10、20%或更多时,可以认为植物包含活性突变。
将作为花粉或作为胚珠亲本的缺少内源性CENPC编码多核苷酸或缺少内源性CENPC蛋白表达或表达具有活性突变的CENPC蛋白的植物与表达内源性CENPC蛋白的植物杂交导致某些百分比(例如至少0.1、0.5、1、5、10、20%或更多)的单倍体或表现出异常倍性的子代。这样的植物仅包含表达内源性CENPC蛋白的亲本的染色体,并且不含表达具有活性突变的CENPC蛋白的植物的染色体。
杂交的两个植物必须是有性相容的。它们可以是相同属或相同物种的。
如本发明的上下文中使用的术语“内源性”与蛋白或基因组合表示所述蛋白或基因源自其中仍包含它的植物。通常内源性基因存在于其植物中的正常遗传背景中。
本公开的上下文中使用的术语“单倍体诱导系”是指与非诱导系的不同之处在于至少一个单核苷酸多态性的植物系。当单倍体诱导系用作雌性或花粉供体杂交时,其导致单倍体诱导系基因组的单亲基因组消除。
如本文所用的术语“单亲基因组消除”是指不考虑杂交方向的杂交之后一个亲本丢失所有遗传信息(意味着所有染色体)的效果。这以这样的方式发生,这样的杂交的后代仅包含未消除的亲本基因组的染色体。消除的基因组通常具有单倍体诱导亲本中的来源。
“双单倍体”是在单倍体细胞经历染色体加倍时形成的基因型。其可以通过诱导或自发的染色体加倍从单倍体细胞产生。对于单倍体植物,单倍体细胞是单倍的,并且术语“双单倍”也可以用于双单倍体。
“茄科植物CENPC DH-诱导结构域蛋白序列”定义来自属于茄科植物科的物种的CENPC蛋白的特定区域,其在茄科植物物种中高度保守。其代表番茄、烟草(Nicotianatabacum)、茸毛烟草(Nicotiana tomentosiformis)、辣椒(Capsicum annuum)、马铃薯(Solanum tuberosum)和Solanum frutescence的CENPC DH-诱导结构域的共有蛋白序列,并且其氨基酸序列在SEQ ID NO:5中示出。
“茄属CENPC DH-诱导结构域单倍序列”定义来自属于茄属植物的物种的CENPC蛋白特定区域。其在茄属物种中高度保守。番茄、醋栗番茄(Solanum pimpinellifolium)、秘鲁番茄(Solanum peruvianum)、Solanum chiemliewskii、Solanum cheesmaniae、Solanumneorickii、Solanum Arcanum、秘鲁番茄、Solanum huaylasense、智利番茄(Solanumchilense)、多毛番茄(Solanum habrochaites)、潘那利番茄(Solanum pennellii)、Solanum galapagense和马铃薯的CENPC DH-诱导结构域的共有蛋白序列的氨基酸序列如SEQ ID NO:6所示。
如本文所用的术语“不确定的”是指番茄植物的生活习性类型,其通常分类为确定的和不确定的。这种分类优选取决于茎轴系统(shoot system)连续合轴生长的能力。该术语以它们公知的含义使用。
术语“多核苷酸”和“核酸”在本文中可交换使用。
“嵌合基因”(或重组基因)是指在自然界中通常不存在于一个物种中的任何基因,特别是其中存在自然界中互相不相关的一个或多个核酸序列部分的基因。例如启动子在自然界中与部分或全部的转录区或者与另一调节区不相关。术语“嵌合基因”理解为包括表达构建体,其中将启动子或转录调节序列可操作地连接至一个或多个编码序列或者连接至反义(正义链的反向补体)或反向重复序列(正义和反义,从而RNA转录物在转录时形成双链RNA)。
“序列相同性”和“序列相似性”可以通过利用全局或局部比对算法比对两个肽或两个核苷酸序列确定。然后当它们(当通过例如程序GAP或BESTFIT利用缺省参数最佳比对时)享有至少某个最小百分比的序列相同性时(如下文定义),序列可以称作“基本上相同”或“基本上相似”。GAP使用Needleman和Wunsch全局比对算法以在它们的整个长度比对两个序列,最大化匹配的数量并最小化缺口的数量。一般来说,使用GAP缺省参数,缺口形成罚分=50(核苷酸)/8(蛋白),而缺口延伸罚分=3(核苷酸)/2(蛋白)。对于核苷酸,使用的缺省评分矩阵是nwsgapdna,而对于蛋白,缺省评分矩阵是Blosum62(Henikoff&Henikoff,1992,PNAS 89,915-919)。百分比序列相同性的序列比对和评分可以利用计算机程序确定,如GCGWisconsin Package,10.3版,可获得自Accelrys Inc.,9685Scranton Road,San Diego,CA92121-3752USA,或者EmbossWin 2.10.0版(使用程序“needle”)。或者百分比相似性或相同性可以通过利用算法如FASTA、BLAST等搜索数据库确定。
“宿主细胞”或“重组宿主细胞”或“转化的细胞”是指因为引入至少一个核酸分子,特别是包含编码期望蛋白的嵌合基因而产生的新的单个细胞(或生物体)。宿主细胞优选植物细胞或细菌细胞。宿主细胞可以包含核酸分子或嵌合基因作为染色体外(游离)复制分子,或者更优选地,包含整合在宿主细胞的核或质体基因组中的核酸分子或嵌合基因。
如本文所用,术语“植物”包括植物细胞,植物组织或器官,植物原生质体,由其可以再生植物的植物细胞组织培养物,植物愈伤组织,植物细胞团块,以及在植物中完整的植物细胞,或者植物的部分,如胚、花粉、胚珠、果实(例如收获的番茄)、花、叶、种子、根、根尖等。
在这个文件及其权利要求书中,动词“包含”及其变化形式以其非限制性的意义使用,表示包括单词之后的项目,但是不排除未具体提到的项目。其涵盖动词“基本上由…组成”和“由…组成”。
此外,通过不定冠词“一个(a)”或“一个(an)”引用元素不排除存在一个以上元素的可能性,除非上下文清楚要求有一个和仅一个元素。因此不定冠词“一个(a)”或“一个(an)”通常表示“至少一个”。进一步理解,当在本文中提到“序列”时,一般是指具有一定序列的亚基(例如氨基酸)的实际物理分子。
发明详述
本发明人发现在植物中消除内源性CENPC表达与具有活性突变的非内源性CENPC蛋白表达组合导致具有可用于育种的特性的植物。据发现这样的植物可以作为单倍体诱导系发挥功能。当将这样的单倍体诱导系与具有内源性CENPC蛋白的植物杂交时,一部分所产生的子代缺少源自单倍体诱导系的染色体,从而允许产生单倍体子代或具有异常倍性的子代。单倍体植物可用于改进育种。
有丝分裂中DNA的平均分布需要组装一个大蛋白质集合至着丝粒DNA,称作动粒。动粒是多亚基复合物,其组装在着丝粒上以结合纺锤体微管并促进细胞分裂期间忠实的染色体分离。称作组成型着丝粒相关网络(CCAN)的16-亚基复合物产生着丝粒-动粒界面。CCAN亚基CENPC对于动粒组装至关重要,因为其连接着丝粒与动粒的微管结合界面。CENPC在CCAN结构(organization)中的确切作用尚未完全理解,但是某些数据指出CENPC作为动粒组装的蓝图。当CENPC耗尽时,着丝粒和动粒的正确形成受到阻止。
具有活性突变的CENPC蛋白
本发明提供具有活性突变的CENPC蛋白。具有活性突变的这类CENPC蛋白包含一个或多个活性突变。当表达具有活性突变的这类CENPC蛋白且缺少内源性CENPC蛋白表达或具有受到抑制的CENPC蛋白表达的植物与表达内源性CENPC蛋白的野生型植物杂交时,以相对高的频率形成单倍体植物。具有活性突变的CENPC蛋白可以通过技术人员已知的各种方法产生。这些包括但不限于随机诱变、单或多氨基酸靶向诱变、产生完整或部分蛋白结构域缺失、与异源氨基酸序列融合等。通常,会将编码内源性CENPC蛋白的多核苷酸敲除或失活。单倍体植物以大于正常的频率形成,如至少0.1、0.5、1、5、10、20%或更多。具有活性突变的CENPC蛋白可以通过,例如,如下方式测试,在缺少内源性CENPC蛋白的植物中具有活性突变的CENPC蛋白的重组表达,将转基因植物与表达内源性CENPC蛋白的植物杂交,然后筛选单倍体子代的产生。
可以将任何数量的突变引入内源性CENPC蛋白以产生具有活性突变的CENPC蛋白。例如,具有活性突变的CENPC蛋白可以与内源性CENPC蛋白相同,除了1、2、3、4、5、6、7、8或更多个氨基酸。
活性突变优选不存在于CENPC基序中。
CENPC蛋白优选植物CENPC蛋白。所述植物可以是任何植物,但是优选属于茄科,更优选属于茄属,甚至更优选属于物种番茄。
在实施方案中,如SEQ ID NO:2、3、4或15-19中任一个示出的氨基酸序列所示在内源性CENPC蛋白或其变体中产生一个或多个活性突变,所述变体与SEQ ID NO:2、3、4或15-19中任一个的氨基酸序列,优选在整个长度中,具有至少70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多如100%氨基酸序列相同性。利用Needleman和Wunsch算法以及如上文定义的GAP缺省参数通过成对比对确定氨基酸序列相同性。
具有活性突变的CENPC蛋白内的活性突变可以位于整个蛋白。在实施方案中,活性突变位于如SEQ ID NO:3或4中任一个示出的氨基酸序列所示的内源性CENPC蛋白或者具有如本文教导的SEQ ID NO:3或4中示出的氨基酸序列的CENPC蛋白的变体的氨基酸残基Glu548和Pro562之间。
具有活性突变的CENPC蛋白的活性突变可以位于SEQ ID NO:2或者具有如本文教导的SEQ ID NO:2中示出的氨基酸序列的CENPC蛋白的变体的氨基酸残基Glu551和His565之间。
在实施方案中,将对应于内源性番茄CENPC蛋白(其氨基酸序列在SEQ ID NO:4中示出)的氨基酸残基552、553、554、555或556的位置上的一个或多个氨基酸残基突变。例如,可以将SEQ ID NO:4或者具有如本文教导的SEQ ID NO:4中示出的氨基酸序列的CENPC蛋白的变体的位置554上的天冬氨酸、位置555上的天冬酰胺或位置556上的甲硫氨酸突变,或者可以将SEQ ID NO:2或3中任一个中的相应氨基酸残基突变。
在如本文教导的SEQ ID NO:2或其变体中,Asp557对应于SEQ ID NO:4的氨基酸序列中的Asp554,Asn 558对应于SEQ ID NO:4的氨基酸序列中的Asn555,并且Met559对应于SEQ ID NO:4的氨基酸序列中的Met556。在如本文教导的SEQ ID NO:3或其变体中,Asp554对应于SEQ ID NO:4的氨基酸序列中的Asp554,Asn 555对应于SEQ ID NO:4的氨基酸序列中的Asn555,并且Met556对应于SEQ ID NO:4的氨基酸序列中的Met556。
SEQ ID NO:4或其变体的氨基酸序列的位置554上的氨基酸残基,或者对应于SEQID NO:2或3中任一个或者其如本文教导的变体中的这个氨基酸残基的氨基酸残基,例如天冬氨酸,可以突变为,例如,带正电荷的氨基酸残基如组氨酸、赖氨酸或精氨酸,优选突变为赖氨酸。SEQ ID NO:4或其变体的氨基酸序列的位置555上的氨基酸残基,或者对应于SEQID NO:2或3中任一个或者其如本文教导的变体中的这个氨基酸残基的氨基酸残基,例如天冬酰胺,可以突变为,例如,芳香氨基酸残基如苯丙氨酸、色氨酸或酪氨酸,优选突变为酪氨酸。SEQ ID NO:4或其变体的氨基酸序列的位置556上的氨基酸残基,或者对应于SEQ IDNO:2或3中任一个或者其如本文教导的变体中的这个氨基酸残基的氨基酸残基,例如甲硫氨酸,可以突变为,例如,具有小侧链的氨基酸残基如甘氨酸、丝氨酸、半胱氨酸、丙氨酸、苏氨酸或缬氨酸,优选突变为缬氨酸。
在实施方案中,可以将氨基酸残基插入如本文教导的SEQ ID NO:3或4中任一个示出的氨基酸序列所示的内源性CENPC蛋白或者其变体的氨基酸残基Glu548和Pro562之间的结构域中,特别是氨基酸残基552和553之间,或者插入如本文教导的SEQ ID NO:2示出的氨基酸序列所示的CENPC蛋白或者其变体的氨基酸残基Glu561和Pro565之间。
例如,可以将带正电荷的残基如His残基插入如本文教导的SEQ ID NO:3或4所示的氨基酸序列或者其变体的氨基酸残基552和553之间,或者插入如本文教导的SEQ ID NO:2中示出的氨基酸序列或其变体的氨基酸残基555和556之间。
在实施方案中,插入如SEQ ID NO:4所示的氨基酸序列的氨基酸残基552和553之间的氨基酸残基不是谷氨酰胺残基。
在实施方案中,在具有SEQ ID NO:3或4中任一个的氨基酸序列的内源性CENPC蛋白或者其变体中产生(以获得具有活性突变的CENPC蛋白)的活性突变选自氨基酸残基552和553之间的His插入(552_553insH),以及突变D554K、N555Y、M556V,或者它们的任何组合,如552_553insH/D554K/N555Y/M556V、552_553insH/554K/N555Y、552_553insH/D554K/M556V、552_553insH/N555Y/M556V、552_553insH/D554K、552_553insH/N555Y、552_553insH/M556V、D554K/N555Y、D554K/M556V和N555Y/M556V,或者SEQ ID NO:2或其变体中的相应突变(D557K、N558Y、M559V和555_556insH)。
具有活性突变的CENPC编码多核苷酸、嵌合基因、载体、宿主细胞
还提供编码任何上述蛋白的具有核酸序列的多核苷酸,如cDNA、基因组DNA和RNA分子。由于遗传密码的简并性,各种核酸序列可以编码相同的氨基酸序列。编码CENPC蛋白或其变体的任何多核苷酸在本文中均称作“CENPC编码多核苷酸”。提供的多核苷酸包括天然存在的、人工的或合成的核酸序列。应当理解当序列示出为DNA序列同时提到RNA时,RNA分子的实际碱基序列是相同的,差异是胸腺嘧啶(T)被尿嘧啶(U)代替。
本发明进一步涉及编码如本文教导的具有活性突变的CENPC蛋白的多核苷酸。所述多核苷酸可以是合成的、重组的和/或分离的多核苷酸。在实施方案中,所述多核苷酸源自内源性CENPC编码多核苷酸,其包含SEQ ID NO:11或14或者其变体的核酸序列,所述变体与SEQ ID NO:11或14的核酸序列,优选全长,具有至少70%,优选至少75%,如80%、85%、90%、95%,更优选至少97%、98%或99%序列相同性,并且其分享包含SEQ ID NO:4的氨基酸序列的多肽的内源性CENPC活性。相比之下,本文教导的具有活性突变的CENPC编码多核苷酸包含一个或多个活性突变,所述突变减少或消除内源性CENPC活性至其来源的内源性CENPC蛋白的CENPC活性的少于90、80、70、60、50、40、30、20、10%。CENPC活性可以在体外通过测量染色体分离期间的着丝粒定位来测量,例如,利用GFP融合,其中荧光水平是CENPC活性的度量。或者,可以在体外利用与CENPC蛋白相互作用的所有已知蛋白和/或着丝粒DNA测量酵母双杂交相互作用。如果相互作用受损,则CENPC的功能性受损。
在实施方案中,包含SEQ ID NO:14的核酸序列的多核苷酸的位置1660-1668处的一个或多个核苷酸经修饰,从而多核苷酸编码CENPC蛋白,其中SEQ ID NO:4的氨基酸序列在位置554和/或位置555和/或位置556处具有改变的氨基酸残基。
在实施方案中,包含SEQ ID NO:11的核酸序列的多核苷酸的位置2449-2450和/或2454-2462处的一个或多个核苷酸经修饰,从而多核苷酸编码CENPC蛋白,其中SEQ ID NO:4的氨基酸序列具有插入在残基552和553之间的氨基酸残基,和/或在位置554和/或位置555和/或位置556处具有改变的氨基酸残基。
例如,可以将如本文教导的SEQ ID NO:4或者具有SEQ ID NO:4中示出的氨基酸序列的CENPC蛋白的变体的任一个的位置554上的天冬氨酸、位置555上的天冬酰胺或位置556上的甲硫氨酸突变,或者可以将如本文教导的SEQ ID NO:2或3中任一个或者其变体中的相应氨基酸残基突变。SEQ ID NO:4或其变体的氨基酸序列的位置554上的氨基酸残基,或者对应于如本文教导的SEQ ID NO:2或3中任一个或者其变体中的这个氨基酸残基的氨基酸残基,例如天冬氨酸,可以突变为,例如,带正电荷的氨基酸残基如组氨酸、赖氨酸或精氨酸,优选突变为赖氨酸。SEQ ID NO:4或其变体的氨基酸序列的位置555上的氨基酸残基,或者对应于如本文教导的SEQ ID NO:2或3中任一个或者其变体中的这个氨基酸残基的氨基酸残基,例如天冬酰胺,可以突变为,例如,芳香氨基酸残基如苯丙氨酸、色氨酸或酪氨酸,优选突变为酪氨酸。SEQ ID NO:4或其变体的氨基酸序列的位置556上的氨基酸残基,或者如本文教导的对应于SEQ ID NO:2或3中任一个或者其变体中的这个氨基酸残基的氨基酸残基,例如甲硫氨酸,可以突变为,例如,具有小侧链的氨基酸残基如甘氨酸、丝氨酸、半胱氨酸、丙氨酸、苏氨酸或缬氨酸,优选突变为缬氨酸。
在实施方案中,在内源性CENPC蛋白中产生(以获得活性突变的CENPC蛋白)的活性突变选自552_553insH、D554K、N555Y、M556V,或者它们如本文教导的任何组合。
在某些实施方案中,所述多核苷酸包含SEQ ID NO:7、9、12或13中任一个的核酸序列。
在本发明的一个实施方案中,如上文所述的编码CENPC蛋白(包括具有活性突变的CENPC蛋白,或者其变体或片段)的核酸序列用来制备嵌合基因和/或载体,用于将CENPC蛋白编码多核苷酸转入宿主细胞中并在宿主细胞中产生CENPC蛋白,如源自转化细胞的细胞、组织、器官或生物体。在植物细胞中产生如本文教导的CENPC蛋白(或者其蛋白片段或变体)的载体在本文中称作“表达载体”。
表达CENPC蛋白的合适的宿主细胞包括原核细胞、酵母或高等真核细胞。用于细菌、真菌、酵母或哺乳动物细胞宿主的适当的克隆和表达载体例如在Pouwels et al.,Cloning vectors:A Laboratory Manual,Elsevier,N.Y.,(1985)中描述。不含细胞的翻译系统也可以用来利用源自本文公开的核酸序列的RNA制备本发明的蛋白。
合适的原核宿主细胞包括革兰氏阴性和革兰氏阳性生物体,例如,大肠杆菌(Escherichia coli)或杆菌。另一合适的真核宿主细胞是农杆菌,特别是根癌农杆菌(Agrobacterium tumefaciens)。
如本文教导的CENPC蛋白还可以在酵母宿主细胞中表达,例如来自酵母属(例如,酿酒酵母(Saccharomyces cerevisiae))。还可以采用其他酵母属如毕赤酵母或克鲁维酵母。
或者,如本文教导的CENPC蛋白可以在高等真核宿主细胞中表达,包括植物细胞、真菌细胞、昆虫细胞和哺乳动物(任选地非人)细胞。
本发明的一个实施方案是经修饰以包含如本文教导的多核苷酸的非人生物体。可以通过本领域已知用于基因转移的任何方法修饰非人生物体和/或宿主细胞,包括例如使用递送装置如脂质和病毒载体、裸DNA、电穿孔、化学方法和颗粒介导的基因转移。在有利的实施方案中,非人生物体是植物。
任何植物细胞可以是合适的宿主细胞。合适的植物细胞包括来自单子叶植物或双子叶植物的那些。例如,植物可以属于茄属(包括番茄)、烟草属、辣椒属、矮牵牛属和其他属。以下宿主物种可以合适地使用:烟草(烟草物种,例如本氏烟草(N.benthamiana)、皱叶烟草(N.plumbaginifolia)、红花烟草(N.tabacum)等),蔬菜物种,如番茄(番茄(L.esculentum),同义番茄(Solanum lycopersicum))如樱桃番茄,变种cerasiforme或醋栗番茄,变种pimpinellifolium)或树番茄(树番茄(S.betaceum),同义Cyphomandrabetaceae),马铃薯(马铃薯(Solanum tuberosum)),茄子(茄子(Solanum melongena)),茄瓜(人参果(Solanum muricatum)),可可娜(Solanum sessiliflorum)和奎东茄(Solanumquitoense),辣椒(辣椒(Capsicum annuum)、小米椒(Capsicum frutescens)、风铃辣椒(Capsicum baccatum)),观赏植物物种(例如矮牵牛(Petunia hybrida)、Petuniaaxillaries、P.integrifolia),咖啡(咖啡属)。
或者,植物可以属于任何其他科,如葫芦科或禾本科。合适的宿主植物包括例如玉米(玉米属物种),小麦(小麦属物种),大麦(例如大麦(Hordeum vulgare)),燕麦(例如燕麦(Avena sativa)),高粱(高粱(Sorghum bicolor)),黑麦(黑麦(Secale cereale)),大豆(大豆属,例如大豆(G.max)),棉花(棉属物种,例如陆地棉(G.hirsutum)、海岛棉(G.barbadense)),芸苔属物种(例如甘蓝型油菜(B.napus)、芥菜型油菜(B.juncea)、甘蓝(B.oleracea)、芸苔(B.rapa)等),向日葵(向日葵(Helianthus annus)),红花,薯蓣,木薯,苜蓿(紫花苜蓿(Medicago sativa)),水稻(稻属物种,例如水稻(O.sativa)灿稻栽培种群或粳稻栽培种群),禾本科牧草,珍珠栗(狼尾草属物种,例如珍珠栗(P.glaucum)),树物种(松树、杨树、冷杉、大蕉(plantain)等),茶,咖啡,油棕,椰子,蔬菜物种,如豌豆,西葫芦(zucchini),豆类(例如菜豆属物种),黄瓜,朝鲜蓟,芦笋,西兰花,大蒜,韭葱,莴苣,洋葱,萝卜,芜菁,抱子甘蓝,胡萝卜,花椰菜,菊苣,芹菜,菠菜,苦苣,茴香,甜菜,结肉果的植物(葡萄、桃、李子、草莓、芒果、苹果、李子、樱桃、杏、香蕉、黑莓、蓝莓、柑桔、奇异果、无花果、柠檬、酸橙、油桃、树莓、西瓜、橙、葡萄柚等),观赏植物物种(例如玫瑰、矮牵牛、菊花、百合花、非洲菊属物种),香草(薄荷、欧芹、罗勒、百里香等),木本树木(例如杨属、柳属、栎属、桉树属的物种),纤维物种例如亚麻(亚麻(Linum usitatissimum))和大麻(大麻(Cannabissativa)),或者模式生物体,如拟南芥。
优选的宿主细胞源自“作物”或“栽培植物”,即由人培养和育种的植物物种。作物可以为了食物或饲料目的栽培(例如大田作物),或者为了观赏目的栽培(例如产生花用于插枝,草用于草坪等)。如本文定义的作物还包括由其收获非食物产品的植物,如用于燃料的油、可塑的聚合物、药物产品、软木(cork)、纤维(如棉花)等。
用于将如本文教导的CENPC蛋白编码核酸序列引入,优选稳定地引入,宿主细胞基因组的嵌合基因和载体的构建是本领域公知的。为了产生嵌合基因,利用标准分子生物学技术,将编码如本文教导的CENPC蛋白的核酸序列可操作地连接至适合在宿主细胞中表达的启动子序列。启动子序列可以已存在于载体中,因此将CENPC蛋白编码核酸序列简单地插入载体位于启动子序列下游。然后载体可以用来转化宿主细胞,可以将嵌合基因插入核基因组或者插入质体、线粒体或叶绿体基因组并利用合适的启动子表达(例如,Mc Bride etal.,1995Bio/Technology 13,362;US 5,693,507)。在实施方案中,如本文教导的嵌合基因包含用于在植物细胞或微生物细胞(例如细菌)中表达的合适启动子,可操作地连接至编码如本文教导的CENPC蛋白的核酸序列,任选地随后是3’非翻译核酸序列。细菌随后可以用于植物转化(农杆菌介导的植物转化)。
表达具有活性突变的CENPC多肽的植物
本发明提供表达如本文教导的具有活性突变的CENPC多肽的植物或植物细胞。本发明还提供包含如本文教导的多核苷酸、如本文教导的嵌合基因或如本文教导的载体的植物。所述植物优选属于茄科,更优选属于茄属,甚至更优选属于物种番茄。
所述植物或植物细胞优选不表达内源性CENPC蛋白,或者以降低的水平(例如,少于野生型水平的90、80、70、60、50、40、30、20、10%)表达内源性CENPC蛋白。例如,可以在内源性CENPC蛋白中产生突变,其减少或消除内源性CENPC蛋白活性或表达,或者可以产生内源性CENPC蛋白的敲除。在这种情况下,可以产生基因敲除或突变杂合的植物并将表达具有活性突变的CENPC蛋白的表达载体引入植物中。然后可以选择来自杂合子的子代,其是突变或敲除杂合的,但是包含具有活性突变的CENPC蛋白。
因此,在本文教导的植物或植物细胞中,将一个内源性CENPC等位基因敲除或突变,或将两个内源性CENPC等位基因都敲除或突变,从而所述植物或植物细胞显著或基本上完全缺少内源性CENPC活性,即在没有如本文教导的具有活性突变的CENPC蛋白的互补表达下足以诱导胚致死。在具有一组以上二倍体染色体组的植物中,可以将所有内源性CENPC等位基因失活、突变或敲除。或者,可以通过本领域已知的任何方式将内源性CENPC蛋白表达沉默,例如通过引入减少或消除内源性CENPC蛋白表达的siRNA或microRNA。理想情况下,选择沉默剂以沉默内源性CENPC蛋白而不是具有活性突变的CENPC蛋白。
产生植物的方法
本发明的实施方案是利用靶向诱变方法(也称作靶向核苷酸交换(TNE)或寡定向诱变(ODM))修饰内源性CENPC基因。靶向诱变方法包括但不限于那些采用锌指核酸酶,Cas9样,Cas9/crRNA/tracrRNA或Cas9/gRNA CRISPR系统,或者采用诱变寡核苷酸的靶向诱变,可能包含与CENPC基因具有序列互补性的化学修饰的核苷酸用于增强诱变,进入植物原生质体(例如,或TALENs)。
或者诱变系统如TILLING(定向诱导基因组局部突变技术;McCallum et al.,2000,Nat Biotech 18:455,和McCallum et al.2000,Plant Physiol.123,439-442,两者援引加入本文)可以用来产生植物系,其包含编码具有活性突变的CENPC蛋白的CENPC基因。TILLING使用传统的化学诱变(例如EMS诱变)然后高通量筛选突变。因此,可以获得包含具有期望突变的CENPC基因的植物、种子和组织。
所述方法可以包括以下步骤:诱变植物种子(例如EMS诱变),汇集植物个体或DNA,PCR扩增所关注的区域,异源双链形成和高通量检测,鉴定突变植物,突变PCR产物测序。应当理解其他诱变和选择方法同样可以用来产生这类修饰的植物。例如,可以将种子辐射或化学处理,并且可以筛选植物的修饰的表型。
修饰的植物可以通过分子方法如DNA中存在的突变,以及通过修饰的表型特征与未修饰的植物(即野生型植物)区分。修饰的植物对于突变可以是纯合的或杂合的。
因此,提供制备如本文教导的植物的方法,所述方法包括以下步骤:i)修饰植物细胞内的内源性植物CENPC编码多核苷酸以获得具有活性突变的植物CENPC编码多核苷酸;ii)选择包含具有活性突变的植物CENPC编码多核苷酸的植物细胞;以及iii)任选地,从所述植物细胞再生植物。
本发明还提供制备如本文教导的植物的方法,所述方法包括以下步骤:i)用如本文教导的多核苷酸、如本文教导的嵌合基因或如本文教导的载体转化植物细胞;ii)选择包含所述多核苷酸的植物细胞;以及iii)任选地,从所述植物细胞再生植物。
制备如本文教导的植物的方法可以进一步包括以下步骤:修饰内源性植物CENPC蛋白编码多核苷酸或参与所述植物细胞内所述多核苷酸表达的任何其他内源性植物多核苷酸以防止内源性CENPC蛋白表达。
可以将如本文教导的CENPC蛋白编码多核苷酸,优选CENPC蛋白编码嵌合基因以常规方式稳定地插入单植物细胞的核基因组,并且这样转化的植物细胞可以以常规方式用来产生转化的植物,由于在一定时间的某些细胞中存在如本文教导的CENPC蛋白,其具有改变的表型。在这方面,根癌农杆菌中包含如本文教导的CENPC蛋白编码多核苷酸的T-DNA载体可以用来转化植物细胞,此后,可以利用例如EP 0 116 718、EP 0 270 822、PCT公开WO84/02913和公开的欧洲专利申请EP 0 242 246以及Gould et al.(1991,Plant Physiol.95,426-434)中描述的方法从转化的植物细胞再生转化的植物。用于农杆菌介导的植物转化的T-DNA载体的构建是本领域公知的。T-DNA载体可以是如EP 0 120 561和EP 0 120 515中描述的二元载体,或者如EP 0 116 718中描述的共整合载体,可以通过同源重组将其整合至农杆菌Ti-质粒中。
同样地,从转化的植物细胞选择和再生转化的植物是本领域公知的。显然,对于不同物种,甚至对于单一物种的不同品种或栽培种,方案特别适用于以高频率再生转化子。
所得的转化植物可以用于常规植物育种方案以产生单倍体植物,其随后可以变为双单倍体植物。
产生单倍体植物和/或双单倍体植物的方法
本发明还涉及产生单倍体植物、具有异常倍性的植物或双单倍体植物的方法,所述方法包括以下步骤:
将表达内源性CENPC蛋白的植物与如本文教导的植物杂交;以及选择单倍体植物、具有异常倍性的植物或双单倍体植物。
技术人员能够选择单倍体植物。示例性技术包括流式细胞术或通过特异性SNP调用验证。
所述表达内源性CENPC蛋白的植物可以是F1植物。
表达内源性CENPC蛋白的植物可以是杂交的花粉亲本,或者可以是杂交的胚珠亲本。
将如本文教导的植物(缺少内源性CENPC蛋白表达参与动粒复合物并表达如本文教导的具有活性突变的CENPC)与野生型植物杂交会导致至少一些子代是单倍体,并且仅包含来自表达内源性CENPC蛋白的植物的染色体。因此,通过将感兴趣的植物与表达如本文教导的具有活性突变的CENPC蛋白的植物产生单倍体植物杂交,本发明允许产生其全部染色体均来自感兴趣的植物,并且收集所得的单倍体种子。
因此,基因组消除可以用精确的分子变化来设计,独立于亲本基因型。CENPC蛋白存在于任何植物物种中。这允许在单倍体植物制备的常规方法如单倍体细胞的组织培养和远缘杂交不成功的物种中制备单倍体植物。
表达如本文教导的具有活性突变的CENPC蛋白的植物可以作为父本或母本杂交。本文教导的方法允许将父本染色体转移至母本细胞质中。因此,其可以一步产生具有期望基因型的细胞质雄性不育系。
此外,本公开教导产生双单倍体植物的方法,所述方法包括以下步骤:
将表达内源性CENPC蛋白的植物与如本文教导的修饰的植物杂交;选择单倍体植物;以及将所述单倍体植物转化为双单倍体植物。
因此,一旦产生,单倍体可以用于产生双单倍体植物,其包含染色体的精确复制拷贝。已知各种方法用于从单倍体生物体产生双单倍体生物体。例如,化学品如秋水仙碱可以用来将单倍体植物转化为双单倍体植物。或者,倍性可以在胚发育期间或在植物的后期发育阶段自发加倍。
在实施方案中,如本文教导的产生单倍体植物、具有异常倍性的植物和/或双单倍体植物的方法不包括有性杂交所述植物的整个基因组。反而,在杂交期间消除一组染色体。
双单倍体植物可以进一步与其他植物杂交以产生具有期望性状的植物的F1、F2或随后的世代。
可以获得双单倍体植物,其不携带转基因或诱变的基因。此外,双单倍体植物可以快速地从杂种F1产生纯合的F2。
序列表
SEQ ID NO:1:共有CENPC基序,蛋白序列
SEQ ID NO:2:共有茄科CENPC蛋白序列
SEQ ID NO:3:共有茄属CENPC蛋白序列
SEQ ID NO:4:番茄CENPC蛋白序列(Solyc03g120340.2.1)
SEQ ID NO:5:共有茄科CENPC DH-诱导结构域蛋白序列
SEQ ID NO:6:共有茄属CENPC DH-诱导结构域蛋白序列
SEQ ID NO:7:番茄CENPC-552_553insH-D554K-N555Y编码序列
SEQ ID NO:8:番茄CENPC-552_553insH-D554K-N555Y蛋白序列
SEQ ID NO:9:番茄CENPC-M556V编码序列
SEQ ID NO:10:番茄CENPC-M556V蛋白序列
SEQ ID NO:11:番茄CENPC基因组DNA序列(Solyc03g120340.2.1)
SEQ ID NO:12:番茄CENPC-552_553insH-D554K-N555Y基因组DNA序列
SEQ ID NO:13:番茄CENPC-M556V基因组DNA序列
SEQ ID NO:14:番茄CENPC编码序列(Solyc03g120340.2.1)
SEQ ID NO:15:共有葫芦科CENPC蛋白序列
SEQ ID NO:16:共有十字花科CENPC蛋白序列
SEQ ID NO:17:共有豆科CENPC蛋白序列
SEQ ID NO:18:共有禾本科CENPC蛋白序列
SEQ ID NO:19:共有蔷薇科CENPC蛋白序列
附图说明
图1示出CENPC-552_553insH-D554K-N555Y突变体的四分体。箭头指示微核。
实施例
材料和方法
植物材料
使用两个番茄栽培种,即“MoneyBergTMV+”和“MicroTom”。按照WO 2007/037678和WO2009/041810中描述的方法,从番茄MoneyBergTMV+突变群体在基因CENPC中选择两个体细胞非同义突变体,即CENPC-552_553insH-D554K-N555Y和CENPC-M556V。CENPC-552_553insH-D554K-N555Y突变在内源性CENPC蛋白的氨基酸残基554和555,由于剪接受体位点突变,在蛋白位置552和553之间有额外氨基酸残基的插入。CENPC-M556V在内源性CENPC蛋白的氨基酸残基556处突变。按照WO 2007/037678和WO2009/041810中描述的方法,从相同的番茄MoneyBerg TMV+突变群体在基因Msi2中选择体细胞同义突变,即Msi2_D337D,其在氨基酸位置337处突变。将所选的突变植物自花授粉,并且在后代中分别选择对于突变的多个或一个基因座是纯合的植物。
方法
单亲基因组消除和所得到的单倍体植物产生是由所谓的单倍体诱导系与另一非单倍体诱导系如育种品系或MicroTom之间进行杂交引起的。在相对高温(26-28℃)下进行用于单亲基因组消除的番茄品系杂交,因为已知升高的温度可以(但是仅在某些情况下)对单亲基因组消除的发生具有积极影响(Sanei et al.PNAS 108.33(2011):E498-E505)。
结果
CENPC-552_553insH-D554K-N555Y突变体中G至T、G至A、C至A和A至T的非同义突变在蛋白水平导致3个变化。(1)外显子7之前具有野生型序列“tagcag^GTT”(内含子6处于小写打字设置,外显子7第一密码子处于大写类型设置,剪接位点由插入符号表示)的剪接受体位点具有G至T突变,这导致产生新新的剪接受体位点:“tag^CATGTT”。在此将编码组氨酸的“CAT”密码子插入氨基酸位置552和553之间,在5’-端延长外显子7(SEQ ID NO:7)。(2)G至A和C至A突变导致在蛋白位置554处天冬氨酸至赖氨酸的氨基酸修饰。(3)A至T突变导致在蛋白位置555处天冬酰胺至酪氨酸的氨基酸修饰。CENPC-M556V突变体中A至G的非同义突变导致在蛋白位置556处甲硫氨酸至缬氨酸的氨基酸修饰。Msi2_D337D突变体中C至T的同义突变未导致氨基酸修饰。此外这个植物在选择突变群体期间已同样处理,并且在CENPC基因中没有任何突变。因此Msi2_D337D突变体用作单亲基因组消除杂交的对照。
在相对高温(26-28℃)下的杂交中,对CENPC-552_553insH-D554K-N555Y、CENPC-M556V或Msi2_D337D纯合的突变植物用作花粉供体和用作雌性,分别利用未突变的野生型MicroTom植物作为雌性或花粉供体。表1列出所有进行的杂交的概览以及对MicroTom表型评价的后代植物的数量。
表1.进行的杂交的列表。所有列出的突变植物的遗传背景是MoneyBergTMV+。示出测试的后代植物的数量和表现出MicroTom矮小表型的后代植物的数量和进行杂交的年份。
将源自表1中列出的CENPC-552_553insH-D554K-N555Y、CENPC-M556V、Msi_D337D和MoneyBerg TMV+杂交的种子播种并通过流式细胞术评价其DNA含量。流式细胞术分析导致确定所有测试的植物仅正常二倍体倍性水平,与野生型番茄栽培种如MoneyBergTMV+相似,除了来自2015的源自CENPC-M556V x MicroTom杂交的一株植物;发现这株植物是非整倍性。栽培种MicroTom具有矮小表型,已知这是隐性的(Marti et al,J Exp Bot,Vol.57,No.9,pp.2037–2047,2006)。MicroTom与例如MoneyBergTMV+野生型栽培种杂交之后,仅发现具有MoneyBergTMV+野生型栽培种的不确定的非矮小表型的后代。对与Msi2_D337D同义突变体和MicroTom的杂交发现了相同现象;MicroTom和Msi2_D337D突变体杂交的所有后代均表现出MoneyBergTMV+亲本的不确定的非矮小表型。值得注意的是,利用CENPC-552_553insH-D554K-N555Y突变体作为父本或母本,发现总计8株植物表现出MicroTom表型。此外,利用CENPC-M556V作为父本,发现总计5株植物表现出MicroTom表型。对于所有提到的具有MicroTom表型的13株植物,它们的表型表明MoneyBergTMV+亲本遗传物质不是所获得的后代的部分,并且这表明这13株后代植物是单倍体MicroTom来源的。据发现所有提到的具有MicroTom表型的13株植物的倍性是二倍体,这表明发生了自发加倍,已描述对于番茄具有异常高出现频率的现象(Report of the Tomato Genetics Cooperative Number 62-December2012)。
对于具有MicroTom表型的CENPC-552_553insH-D554K-N555Y后代,为了确定单亲基因组消除是否已发生和发生至什么程度,对2014年的后代的总计44个位置进行单核苷酸多态性(SNP)测定,跨越12条番茄染色体中的每条(染色体1、2、3、4、5、6、10和12上4个SNP;染色体8和11上3个SNP;染色体9上2个SNP)。对2015年的后代进行相同分析,现在在22个位置上(染色体1、2、3、4、5、6、7、8、10和12上2个SNP;染色体9和11上1个SNP)。所选单核苷酸多态性对于MicroTom亲本的一个碱基对是纯合的,对于MoneyBergTMV+亲本中的除了MicroTom碱基对的所有碱基对是纯合的。野生型MicroTom栽培种和MoneyBergTMV+栽培种之间的普通杂交会导致杂合的单核苷酸多态性评分。但是,当单亲基因组消除过程发生时,预期丢失单倍体诱导系基因组。
单核苷酸多态性测试导致还表现出MicroTom表型的8株植物中的每株仅召唤(calling)来自MicroTom亲本的纯合碱基对评分,未召唤MoneyBergTMV+亲本的。基于单核苷酸多态性评分得出结论,CENPC-552_553insH-D554K-N555Y突变体的整个基因组不再存在于后代中。因此,可以得出结论,CENPC-552_553insH-D554K-N555Y突变体具有高效单倍体诱导系的功能。在其中CENPC-552_553insH-D554K-N555Y突变体用作母本的杂交中,可以排除MicroTom的自交。鉴于非常少量的后代表现出MicroTom表型(65个中仅1个种子和306中仅2个种子),并且仅评分了纯合碱基对,在利用MicroTom作为母本的实验中极不可能发生自交。
对于具有MicroTom表型的CENPC-M556V后代,为了确定单亲基因组消除是否已发生和发生至什么程度,2014年对总计24个位置进行单核苷酸多态性(SNP)测定,跨越12条番茄染色体中的每条,每条染色体2个SNP,并且在2015年测试了22个位置(染色体1、2、3、4、5、6、7、8、10和12上2个SNP;染色体9和11上1个SNP)。所选单核苷酸多态性对于MicroTom亲本的一个碱基对是纯合的,对于MoneyBergTMV+亲本中除了的MicroTom碱基对的所有碱基对是纯合的。野生型MicroTom栽培种和MoneyBergTMV+栽培种之间的普通杂交会导致杂合的单核苷酸多态性评分。但是,当单亲基因组消除过程发生时,预期丢失单倍体诱导系基因组。
单核苷酸多态性测试导致还表现出MicroTom表型的5株植物中的每株仅召唤来自MicroTom亲本的纯合碱基对评分,未召唤MoneyBergTMV+亲本的。基于单核苷酸多态性评分得出结论,CENPC-M556V突变体的整个基因组不再存在于后代中。因此,可以得出结论,CENPC-M556V突变体具有高效单倍体诱导系的功能。在其中CENPC-M556V突变体用作母本的杂交中,可以排除MicroTom的自交。鉴于非常少量的后代表现出MicroTom表型(188个中仅4个种子和317中仅1个种子),并且仅评分了纯合碱基对,在利用MicroTom作为母本的实验中极不可能发生自交。
CENPC-552_553insH-D554K-N555Y突变体的表型
检查CENPC-552_553insH-D554K-N555Y突变体和未突变的RZ52201对照植物的花粉四分体是否发生异常。从4个不同花桁架至少采一朵花,将其花药用DAPI(4',6-二脒基-2-苯基吲哚)染色并将染色的花药压扁以观察花粉四分体。对于CENPC-552_553insH-D554K-N555Y突变体,以2.34±0.90%的平均频率观察到微核(图1)。对于对照植物花,以0.58±0.36%的平均频率观察到微核。用Mann-Whitney等级和检验评价对照和突变体频率之间的差异并发现两组之间中值的差异大于偶然预期,因此得出结论,有统计显著差异(P=0.016)。
因此可以得出结论,因为CENPC-552_553insH-D554K-N555Y突变,减数分裂期间染色体的分离与对照相比更频繁地受到干扰。有丝分裂,例如观察到微核,常用作作物中种间、种内杂交中染色体消除和单倍体产生的直接证据。例如,在玉米DH-诱导系的研究中发现了异常有丝分裂以及异常减数分裂,例如微核(Qiu,Fazhan,et al.Current PlantBiology 1(2014):83-90)。CENPC-552_553insH-D554K-N555Y突变体中减数分裂微核的观察表明在有丝分裂期间发生了相似过程。可能在野生型和CENPC-552_553insH-D554K-N555Y合子融合之后第一有丝分裂期间单亲基因组消除过程发生,并且这导致观察到单倍体诱导。
序列表
<110> 主基因有限公司
<120> 制备单倍体和随后的双单倍体植物的方法
<130> P6069721PCT
<150> NL2015552
<151> 2015-10-02
<160> 19
<170> PatentIn version 3.5
<210> 1
<211> 24
<212> PRT
<213> artificial sequence
<220>
<223> consensus CenPC motif
<220>
<221> MISC_FEATURE
<222> (1)..(1)
<223> Xaa is Asn or Gly
<220>
<221> MISC_FEATURE
<222> (2)..(2)
<223> Xaa is Arg or Leu or Val
<220>
<221> MISC_FEATURE
<222> (4)..(4)
<223> Xaa is Arg or Lys or Val
<220>
<221> MISC_FEATURE
<222> (5)..(5)
<223> Xaa is Ser or Thr
<220>
<221> MISC_FEATURE
<222> (6)..(6)
<223> Xaa is Asn or Lys or Met or Ser or Thr
<220>
<221> MISC_FEATURE
<222> (8)..(8)
<223> Xaa is Ile or Met or Thr or Val
<220>
<221> MISC_FEATURE
<222> (9)..(9)
<223> Xaa is Arg or Lys
<220>
<221> MISC_FEATURE
<222> (10)..(10)
<223> Xaa is Ile or Leu or Ser or Thr or Val
<220>
<221> MISC_FEATURE
<222> (11)..(11)
<223> Xaa is Ala or Arg or Lys
<220>
<221> MISC_FEATURE
<222> (13)..(13)
<223> Xaa is Leu or Val
<220>
<221> MISC_FEATURE
<222> (14)..(14)
<223> Xaa is Ala or Arg or Asn or Gln or Glu
<220>
<221> MISC_FEATURE
<222> (15)..(15)
<223> Xaa is His or Phe or Ser or Trp or Tyr
<220>
<221> MISC_FEATURE
<222> (17)..(17)
<223> Xaa is Arg or Leu or Lys
<220>
<221> MISC_FEATURE
<222> (18)..(18)
<223> Xaa is Asn or Gly
<220>
<221> MISC_FEATURE
<222> (20)..(20)
<223> Xaa is Arg or Gln or Lys
<220>
<221> MISC_FEATURE
<222> (21)..(21)
<223> Xaa is Ile or Met or Leu or Phe or Pro or Val
<220>
<221> MISC_FEATURE
<222> (22)..(22)
<223> Xaa is Asp or Ile or Leu or Thr or Val
<220>
<221> MISC_FEATURE
<222> (24)..(24)
<223> Xaa is Gln or Glu or Gly or Lys or Thr or Val
<400> 1
Xaa Xaa Arg Xaa Xaa Xaa Arg Xaa Xaa Xaa Xaa Pro Xaa Xaa Xaa Trp
1 5 10 15
Xaa Xaa Glu Xaa Xaa Xaa Tyr Xaa
20
<210> 2
<211> 713
<212> PRT
<213> Solanaceae
<220>
<221> misc_feature
<222> (99)..(99)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (150)..(150)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (161)..(161)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (196)..(196)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (255)..(255)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (260)..(260)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (390)..(390)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (554)..(554)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (696)..(696)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (700)..(700)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (708)..(708)
<223> Xaa can be any naturally occurring amino acid
<400> 2
Met Val Asn Glu Ala Leu Thr Ser Asp Pro Val Asp Pro Leu Arg Gly
1 5 10 15
Leu Ala Gly Leu Ser Leu Leu Pro Lys Thr Ile Arg Val Ser Thr Asp
20 25 30
Ala Ser Val Ser Val Asp Pro Lys Asp Leu Glu Ser Ile His Asn Phe
35 40 45
Met Lys Ser Met Glu Thr Lys Gly Pro Gly Leu Leu Glu Glu Ala Arg
50 55 60
Ala Ile Val Asp Asn Gly Ala Glu Leu Leu Asn Thr Lys Phe Thr Ser
65 70 75 80
Phe Ile Met Ser Lys Gly Ile Asp Gly Asp Leu Ala Met Lys Gly Lys
85 90 95
Glu Lys Xaa Gln Glu Arg Arg Pro Gly Leu Gly Arg Lys Arg Ala Arg
100 105 110
Phe Ser Leu Lys Pro Ser Thr Ser Gln Pro Pro Val Ser Thr Ala Pro
115 120 125
Arg Leu Asp Ile Asp Gln Leu Ser Asp Pro Val Glu Phe Phe Ser Ala
130 135 140
Ala Glu Arg Leu Glu Xaa Ala Glu Lys Glu Ile Glu Arg Leu Lys Gly
145 150 155 160
Xaa Ser Ile His Asp Pro Asp Val Asn Asn Pro Pro Ala Asn Ala Arg
165 170 175
Arg Arg Arg Pro Gly Ile Leu Gly Lys Ser Val Arg Tyr Lys His Arg
180 185 190
Phe Ser Ser Xaa Gln Pro Glu Asn Asp Asp Ala Phe Ile Ser Ser Gln
195 200 205
Glu Thr Leu Glu Ser Asp Ile Leu Ala Glu His Gly Ser Gln Leu Pro
210 215 220
Glu Glu Leu Pro Gly Leu Asn Val Glu Leu Gln Glu Ala Asp Ser Pro
225 230 235 240
Gly Ser Ile Lys Lys Thr Glu Asn Arg Ile Asn Gly Ile Leu Xaa Glu
245 250 255
Leu Leu Ser Xaa Asn Gly Glu Asp Leu Asp Gly Asp Met Ala Val Ser
260 265 270
Lys Leu Gln Glu Arg Leu Gln Ile Lys Pro Ile Glu Leu Gly Thr Leu
275 280 285
Cys Ile Pro Glu Phe Pro Val Thr Gly Lys Val Asp Gly Lys Ala Phe
290 295 300
Gly Glu Arg Ile Gln Lys Pro Arg Lys Phe Ser Leu Glu Ile Arg Glu
305 310 315 320
Leu Val Lys Ser Ala Thr Glu Gly Thr Pro Ser Thr His Lys Gln His
325 330 335
Glu Glu Ser Pro Ala Ser Asn Leu Ala Ser Pro Thr Pro Pro Lys Ser
340 345 350
Pro Phe Gly Ser Leu Ser Leu Leu Lys Lys Lys Ile Met Gln Ser Asn
355 360 365
Pro Leu Arg Asp Pro Phe Ser Pro Leu Asn Ile Asp Leu Gln Ser Glu
370 375 380
His Pro Asp Trp Ser Xaa Lys Met Asn Ser Gln Cys Val Asn Asn Asn
385 390 395 400
Ala Gly Pro Thr Glu Ser His Gly Glu Thr Glu Asn Asp Asn Thr Asn
405 410 415
Ile Met Val Pro Leu Arg Gly Ser Asp Leu Ser His Glu Gln Leu Met
420 425 430
Glu Lys Asn Ser Gly Arg Asp Ser Val Lys Thr Gly Pro Asn Gly Ser
435 440 445
Arg Ser Gly Met Glu Gln Glu Asn Gly Tyr Asp Asp Ile Asp Ile Asn
450 455 460
Thr Asp Ile Asn Leu Asn Met Arg Asn Met Asp Ser His Tyr Glu Ser
465 470 475 480
Asp Gly Leu Asp Lys Val Lys Asp Asp Ser Val Ile Asn Asn Val Leu
485 490 495
Lys Asp Gln Gln Gly Leu Glu Thr Glu Ser Tyr Ile Ser Cys Gln Lys
500 505 510
Met Gln Asp Gly Glu Val Leu Ala Glu Thr Leu Pro Ser Leu Gln Ala
515 520 525
Gln Gly Lys Ala Asp Asp Thr Ala Asn Tyr Thr Val Glu Thr Ala Val
530 535 540
Glu Asp Phe Gly Ser Thr Glu Ile Asp Xaa Gln Val Asp Asn Met Pro
545 550 555 560
Pro Glu Thr Ala His Pro Ser Ala Glu Gln Asp His His Phe Glu Asp
565 570 575
Ser Val Lys Asp Leu Thr Ser Asp Gln Leu Ser Ser Val Ala Val Glu
580 585 590
Val Pro Ser Thr Glu Val Arg Ser Lys Phe Pro Glu Met Ser Pro Gln
595 600 605
His His Ala Gln Ala Lys Asp Lys Gln Gln Lys Ala Lys Arg Pro Ala
610 615 620
Gly Gly Arg Arg Glu Arg Lys Ala Leu Ser Ser Arg Pro Ser Leu Ala
625 630 635 640
Asp Ala Gly Thr Ser Phe Glu Ser Gly Val Arg Arg Ser Lys Arg Met
645 650 655
Lys Thr Arg Pro Leu Glu Tyr Trp Lys Gly Glu Arg Leu Leu Tyr Gly
660 665 670
Arg Val Asn Glu Ser Leu Lys Leu Val Gly Leu Lys Tyr Ile Ser Pro
675 680 685
Gly Lys Gly Ser Val Lys Val Xaa Ser Tyr Ile Xaa Asp Asp Tyr Lys
690 695 700
Asp Leu Val Xaa Leu Ala Ala Arg Tyr
705 710
<210> 3
<211> 709
<212> PRT
<213> Solanum
<400> 3
Met Val Asn Glu Ala Leu Ile Ser Asp Pro Val Asp Pro Leu His Ser
1 5 10 15
Leu Ala Gly Leu Ser Leu Leu Pro Thr Thr Val Arg Val Ser Thr Gly
20 25 30
Ala Ser Val Ser Val Asp Ser Lys Asp Leu Glu Ser Ile His Asn Phe
35 40 45
Met Lys Ser Met Glu Thr Lys Gly Pro Gly Leu Leu Glu Glu Ala Arg
50 55 60
Glu Ile Val Asp Asn Gly Ala Glu Leu Leu Asn Thr Lys Phe Thr Ser
65 70 75 80
Phe Ile Arg Ser Lys Gly Ile Asp Gly Asp Leu Ala Ile Lys Gly Lys
85 90 95
Glu Lys Leu Gln Glu Arg Arg Pro Gly Leu Gly Arg Lys Arg Ala Arg
100 105 110
Phe Ser Leu Lys Pro Ser Thr Ser Gln Pro Thr Val Ser Ile Ala Pro
115 120 125
Arg Leu Asp Ile Asp Gln Leu Ser Asp Pro Val Glu Phe Phe Ser Val
130 135 140
Ala Glu Lys Leu Glu Val Ala Glu Lys Glu Ile Glu Arg Gln Lys Gly
145 150 155 160
Gly Ser Ile His Asp Pro Asp Val Asn Asn Pro Pro Ala Asn Ala Arg
165 170 175
Arg Arg Arg Pro Gly Ile Leu Gly Lys Ser Val Lys Tyr Lys His Arg
180 185 190
Phe Ser Ser Ser Gln Pro Glu Asn Asp Asp Ala Phe Ile Ser Ser Gln
195 200 205
Glu Thr Leu Glu Asp Asp Ile Leu Val Glu His Gly Ser Gln Leu Pro
210 215 220
Glu Glu Leu His Gly Leu Asn Val Glu Leu Gln Glu Ala Glu Leu Thr
225 230 235 240
Gly Pro Ile Lys Lys Ser Glu Asn Arg Ile Asn Lys Ile Leu Asp Glu
245 250 255
Leu Leu Ser Gly Ser Gly Glu Asp Leu Asp Arg Asp Met Ala Val Ser
260 265 270
Lys Leu Gln Glu Gln Leu Lys Ile Lys Pro Ile Glu Leu Gly Thr Leu
275 280 285
Cys Ile Pro Glu Phe Pro Val Thr Gly Lys Phe Asp Gly Lys Ala Leu
290 295 300
Gly Glu Arg Ile Gln Lys Pro Arg Lys Phe Ser Leu Glu Ile Ala Glu
305 310 315 320
Leu Val Lys Ser Ala Thr Glu Gly Thr Pro Ser Ser His Lys Gln His
325 330 335
Glu Glu Ser Pro Ala Ser Lys Leu Ala Ser Pro Thr Pro Pro Lys Ser
340 345 350
Pro Phe Gly Ser Leu Ser Leu Leu Lys Lys Lys Leu Met Gln Ser Asn
355 360 365
Pro Leu Arg Asp Pro Phe Ser Pro Leu Asn Ile Asp Leu Gln Ser Glu
370 375 380
His Pro Asp Trp Ser Val Lys Lys Lys Ser Gln Cys Val Asn Asn Asn
385 390 395 400
Val Gly Pro Ile Glu Ser Arg Gly Cys Glu Asn Thr Asn Ile Met Val
405 410 415
Pro Leu Arg Gly Ser Asp Leu Val His Glu Gln Pro Ile Glu Lys Asn
420 425 430
Pro Gly Arg Asp Ser Val Lys Thr Gly Pro Asn Gly Ser Arg Ser Gly
435 440 445
Met Glu Gln His Asn Gly Tyr Asp Asp Ile Asp Ala Asn Thr Asn Asp
450 455 460
Asn Leu Asn Met Arg Asn Val Asp Ser His His Glu Ser Asp Gly Leu
465 470 475 480
Asp Lys Val Lys Asp Asp Ser Val Ile Lys Asn Val Leu Lys Ala Leu
485 490 495
Gln Gly Leu Glu Thr Lys Ser Tyr Ile Asn Cys Gln Lys Leu Gln Asp
500 505 510
Ser Glu Val Leu Ala Glu Thr Leu Pro Ser Leu Gln Ala Gln Gly Lys
515 520 525
Ala Val Asp Thr Ala Asn Tyr Thr Ile Glu Thr Ala Val Glu Asp Phe
530 535 540
Gly Ser Thr Glu Ile Asp Gln Leu Val Asp Asn Met Leu Pro Glu Thr
545 550 555 560
Ala Pro Ser Ala Glu Gln Asp His Tyr Phe Glu Asp Ser Val Lys Asp
565 570 575
Leu Asn Ser Asp Gln Leu Asn Ser Val Gly Val Glu Val Pro Ser Arg
580 585 590
Asp Val Arg Pro Lys Phe Pro Glu Met Ser Pro Gln His His Lys Gln
595 600 605
Ala Lys Asp Lys Gln Gln Lys Ala Lys Lys Leu Ala Val Gly Arg Arg
610 615 620
Glu Arg Lys His Leu Ser Ser Arg Pro Ser Leu Ala Asp Ala Gly Thr
625 630 635 640
Ser Phe Glu Ser Gly Val Arg Arg Ser Lys Arg Met Lys Thr Arg Pro
645 650 655
Leu Glu Tyr Trp Lys Gly Glu Arg Leu Leu Tyr Gly Arg Val Asp Glu
660 665 670
Gly Leu Lys Leu Val Gly Leu Lys Tyr Ile Ser Pro Gly Lys Gly Ser
675 680 685
Phe Lys Val Lys Ser Tyr Ile Pro Asp Asp Tyr Lys Asp Leu Val Asp
690 695 700
Leu Ala Ala Arg Tyr
705
<210> 4
<211> 709
<212> PRT
<213> Solanum lycopersicum
<400> 4
Met Val Asn Glu Ala Leu Ile Ser Asp Pro Val Asp Pro Leu His Ser
1 5 10 15
Leu Ala Gly Leu Ser Leu Leu Pro Thr Thr Val Arg Val Ser Thr Gly
20 25 30
Ala Ser Val Ser Val Asp Ser Lys Asp Leu Glu Ser Ile His Asn Phe
35 40 45
Met Lys Ser Met Glu Thr Lys Gly Pro Gly Leu Leu Glu Glu Ala Arg
50 55 60
Glu Ile Val Asp Asn Gly Ala Glu Leu Leu Asn Thr Lys Phe Thr Ser
65 70 75 80
Phe Ile Arg Ser Lys Gly Ile Asp Gly Asp Leu Ala Ile Lys Gly Lys
85 90 95
Glu Lys Val Gln Glu Arg Arg Pro Gly Leu Gly Arg Lys Arg Ala Arg
100 105 110
Phe Ser Leu Lys Pro Ser Thr Ser Gln Pro Thr Val Ser Ile Ala Pro
115 120 125
Arg Leu Asp Ile Asp Gln Leu Ser Asp Pro Val Glu Phe Phe Ser Val
130 135 140
Ala Glu Lys Leu Glu Val Ala Glu Lys Glu Ile Glu Arg Gln Lys Gly
145 150 155 160
Gly Ser Ile His Asp Pro Asp Val Asn Asn Pro Pro Ala Asn Ala Arg
165 170 175
Arg Arg Arg Pro Gly Ile Leu Gly Lys Ser Val Lys Tyr Lys His Arg
180 185 190
Phe Ser Ser Ser Gln Pro Glu Asn Asp Asp Ala Phe Ile Ser Ser Gln
195 200 205
Glu Thr Leu Glu Asp Asp Ile Leu Val Glu His Gly Ser Gln Leu Pro
210 215 220
Glu Glu Leu His Gly Leu Asn Val Glu Leu Gln Glu Ala Glu Leu Thr
225 230 235 240
Gly Pro Ile Lys Lys Ser Glu Asn Arg Ile Asn Lys Ile Leu Asp Glu
245 250 255
Leu Leu Ser Gly Ser Gly Glu Asp Leu Asp Arg Asp Met Ala Val Ser
260 265 270
Lys Leu Gln Glu Gln Leu Lys Ile Lys Pro Ile Glu Leu Gly Thr Leu
275 280 285
Cys Ile Pro Glu Phe Pro Val Thr Gly Lys Phe Asp Gly Lys Ala Leu
290 295 300
Gly Glu Arg Ile Gln Lys Pro Ser Lys Phe Phe Leu Glu Ile Ala Glu
305 310 315 320
Leu Val Lys Ser Ala Thr Glu Gly Thr Pro Ser Ser His Lys Gln His
325 330 335
Glu Glu Ser Pro Ala Ser Lys Leu Ala Ser Pro Thr Pro Pro Lys Ser
340 345 350
Pro Phe Gly Ser Leu Ser Leu Leu Lys Lys Lys Leu Met Gln Ser Asn
355 360 365
Pro Leu Arg Asp Pro Phe Ser Pro Leu Asn Ile Asp Leu Gln Ser Glu
370 375 380
His Pro Asp Trp Ser Ala Lys Lys Lys Ser Gln Cys Val Asn Asn Asn
385 390 395 400
Val Gly Pro Ile Glu Ser Arg Gly Cys Glu Asn Thr Asn Ile Met Val
405 410 415
Pro Leu Arg Gly Ser Asp Leu Val His Glu Gln Pro Ile Glu Lys Asn
420 425 430
Pro Gly Arg Asp Ser Val Lys Thr Gly Pro Asn Gly Ser Arg Ser Gly
435 440 445
Met Glu Gln His Asn Gly Tyr Asp Asp Ile Asp Ala Asn Thr Asn Asp
450 455 460
Asn Leu Asn Met Arg Asn Val Asp Ser His His Glu Ser Asp Gly Leu
465 470 475 480
Asp Lys Val Lys Asp Asp Ser Val Ile Lys Asn Val Leu Lys Ala Leu
485 490 495
Gln Gly Leu Glu Thr Lys Ser Tyr Ile Asp Cys Gln Lys Leu Gln Asp
500 505 510
Ser Glu Val Leu Ala Glu Thr Leu Pro Ser Leu Gln Ala Gln Gly Lys
515 520 525
Ala Val Asp Thr Ala Asn Tyr Thr Ile Glu Thr Ala Val Glu Asp Phe
530 535 540
Gly Ser Thr Glu Ile Asp Pro Leu Val Asp Asn Met Leu Pro Glu Thr
545 550 555 560
Ala Pro Ser Ala Glu Gln Asp His Tyr Phe Glu Asp Ser Val Lys Asp
565 570 575
Leu Asn Ser Asp Gln Leu Asn Ser Val Gly Val Glu Val Pro Ser Arg
580 585 590
Asp Val Arg Pro Lys Phe Pro Glu Met Ser Pro Gln His His Lys Gln
595 600 605
Ala Lys Asp Lys Gln Gln Lys Ala Lys Glu Leu Ala Val Gly Arg Arg
610 615 620
Glu Arg Lys His Leu Ser Ser Arg Pro Ser Leu Ala Asp Ala Gly Thr
625 630 635 640
Ser Phe Glu Ser Gly Val Arg Arg Ser Lys Arg Met Lys Thr Arg Pro
645 650 655
Leu Glu Tyr Trp Lys Gly Glu Arg Leu Leu Tyr Gly Arg Val Asp Glu
660 665 670
Gly Leu Lys Leu Val Gly Leu Lys Tyr Ile Ser Pro Gly Lys Gly Ser
675 680 685
Phe Lys Val Lys Ser Tyr Ile Pro Asp Asp Tyr Lys Asp Leu Val Asp
690 695 700
Leu Ala Ala Arg Tyr
705
<210> 5
<211> 15
<212> PRT
<213> Solanaceae
<220>
<221> MISC_FEATURE
<222> (3)..(3)
<223> Xaa is Asp or Gly
<220>
<221> MISC_FEATURE
<222> (4)..(4)
<223> Xaa is Gln or Gly or Pro
<220>
<221> MISC_FEATURE
<222> (5)..(5)
<223> Xaa is Gln or Leu
<220>
<221> MISC_FEATURE
<222> (8)..(8)
<223> Xaa is Asp or Asn
<220>
<221> MISC_FEATURE
<222> (10)..(10)
<223> Xaa is Leu or Pro
<220>
<221> MISC_FEATURE
<222> (12)..(12)
<223> Xaa is Gln or Glu
<220>
<221> MISC_FEATURE
<222> (13)..(13)
<223> Xaa is Arg or Thr
<220>
<221> MISC_FEATURE
<222> (15)..(15)
<223> Xaa is Asn or His or Pro
<400> 5
Glu Ile Xaa Xaa Xaa Val Asp Xaa Met Xaa Pro Xaa Xaa Ala Xaa
1 5 10 15
<210> 6
<211> 15
<212> PRT
<213> Solanum
<220>
<221> MISC_FEATURE
<222> (2)..(2)
<223> Xaa is Ile or Thr
<220>
<221> MISC_FEATURE
<222> (4)..(4)
<223> Xaa is Gln or Pro
<400> 6
Glu Xaa Asp Xaa Leu Val Asp Asn Met Leu Pro Glu Thr Ala Pro
1 5 10 15
<210> 7
<211> 2133
<212> DNA
<213> Solanum lycopersicum
<400> 7
atggtgaacg aagctcttat ctccgatccg gtggatcctc tccacagcct tgccggactt 60
tctctactcc caacaacagt tagggtttcc accggcgcct cagtatcagt agactccaaa 120
gacctagagt caattcacaa tttcatgaag tccatggaaa ccaagggtcc tgggctcttg 180
gaggaggcta gggaaattgt ggataacggt gcggagcttt tgaataccaa gtttacaagt 240
ttcatacgat ctaaaggcat tgatggggat cttgcaatca agggaaagga gaaggtccag 300
gagagaagac caggacttgg gcgtaaaagg gctcgatttt ccctcaagcc tagtacaagt 360
caacctactg tcagcatagc tcctcgttta gatattgatc aactatcaga tccagtggaa 420
tttttctcag ttgctgaaaa gctagaagtt gctgagaagg aaatagaaag acagaaaggt 480
ggcagtatcc atgatccaga tgtgaataat cccccagcca atgctcggcg tcgtcgacca 540
ggcatcttgg gcaaatcggt gaagtataag caccgtttct catcctccca gcctgagaat 600
gatgatgcat ttatatcatc tcaagagaca ttggaggatg atattctggt ggaacatggt 660
tctcagttgc cagaagagct ccatggcctc aatgttgaac tacaagaagc agaactcaca 720
gggccaataa agaaatcaga aaacagaatc aacaagatac tggatgaatt actgtctggt 780
agtggtgaag atctagaccg ggacatggca gtatccaaat tgcaagagca gttgaagatc 840
aagcccattg aactaggaac tttatgtatt cctgagttcc ctgtgactgg aaagtttgat 900
ggtaaggctc ttggagagag aattcagaag cctagtaagt tttttttgga gatagcggag 960
ttggttaaaa gtgcaactga gggaacgcca tcctctcaca aacagcatga agaaagtcct 1020
gccagtaaat tagcatcacc cactccacca aaaagtccat ttggttcatt gtctttgttg 1080
aaaaagaaac ttatgcagtc aaatccactg agagatcctt tttcgcctct caacattgat 1140
ctgcaatcag agcatccaga ttggtccgcg aagaagaaat cacaatgtgt aaataataat 1200
gttggaccta ttgaatctcg tggttgtgaa aatacaaata ttatggtccc tttaagaggt 1260
tcagacttag tgcatgagca accaattgaa aagaatccag gcagagatag tgtaaaaact 1320
gggccaaatg gatctcgatc tggaatggag caacataatg gctatgatga tattgatgcc 1380
aatactaacg acaacttaaa tatgagaaat gtggattccc accatgagtc tgatgggctt 1440
gacaaagtga aagatgattc agttataaag aatgttttga aggctctaca aggtcttgag 1500
accaaatcct acattgactg tcaaaagctg caggatagtg aagttcttgc tgaaacacta 1560
ccttctcttc aagcccaagg aaaagctgtc gatacagcca attataccat agaaacagct 1620
gttgaggatt ttggatcaac tgaaattgat ccgctgcatg ttaaatatat gctaccagaa 1680
acagcgcctt ctgcagaaca agatcattac tttgaggatt ctgtcaaaga cttaaatagt 1740
gatcaattga actcagtggg agttgaagtt ccttctagag acgtgagacc taaatttccg 1800
gagatgagcc ctcagcatca caagcaggca aaagataagc aacagaaagc aaaggaactt 1860
gctgttggaa ggcgtgaaag aaaacatctt tcttctaggc caagtctagc agatgctggc 1920
acatcatttg aaagtggggt tagacgaagc aaacgaatga agacaaggcc tttggaatat 1980
tggaaaggcg aaagattatt atatggacgg gttgatgagg gtttgaagct tgttggcttg 2040
aaatacatct ctccgggaaa gggatcattt aaggtgaagt cttacattcc tgatgactac 2100
aaagacctag ttgatttggc agctcgctat tga 2133
<210> 8
<211> 710
<212> PRT
<213> Solanum lycopersicum
<400> 8
Met Val Asn Glu Ala Leu Ile Ser Asp Pro Val Asp Pro Leu His Ser
1 5 10 15
Leu Ala Gly Leu Ser Leu Leu Pro Thr Thr Val Arg Val Ser Thr Gly
20 25 30
Ala Ser Val Ser Val Asp Ser Lys Asp Leu Glu Ser Ile His Asn Phe
35 40 45
Met Lys Ser Met Glu Thr Lys Gly Pro Gly Leu Leu Glu Glu Ala Arg
50 55 60
Glu Ile Val Asp Asn Gly Ala Glu Leu Leu Asn Thr Lys Phe Thr Ser
65 70 75 80
Phe Ile Arg Ser Lys Gly Ile Asp Gly Asp Leu Ala Ile Lys Gly Lys
85 90 95
Glu Lys Val Gln Glu Arg Arg Pro Gly Leu Gly Arg Lys Arg Ala Arg
100 105 110
Phe Ser Leu Lys Pro Ser Thr Ser Gln Pro Thr Val Ser Ile Ala Pro
115 120 125
Arg Leu Asp Ile Asp Gln Leu Ser Asp Pro Val Glu Phe Phe Ser Val
130 135 140
Ala Glu Lys Leu Glu Val Ala Glu Lys Glu Ile Glu Arg Gln Lys Gly
145 150 155 160
Gly Ser Ile His Asp Pro Asp Val Asn Asn Pro Pro Ala Asn Ala Arg
165 170 175
Arg Arg Arg Pro Gly Ile Leu Gly Lys Ser Val Lys Tyr Lys His Arg
180 185 190
Phe Ser Ser Ser Gln Pro Glu Asn Asp Asp Ala Phe Ile Ser Ser Gln
195 200 205
Glu Thr Leu Glu Asp Asp Ile Leu Val Glu His Gly Ser Gln Leu Pro
210 215 220
Glu Glu Leu His Gly Leu Asn Val Glu Leu Gln Glu Ala Glu Leu Thr
225 230 235 240
Gly Pro Ile Lys Lys Ser Glu Asn Arg Ile Asn Lys Ile Leu Asp Glu
245 250 255
Leu Leu Ser Gly Ser Gly Glu Asp Leu Asp Arg Asp Met Ala Val Ser
260 265 270
Lys Leu Gln Glu Gln Leu Lys Ile Lys Pro Ile Glu Leu Gly Thr Leu
275 280 285
Cys Ile Pro Glu Phe Pro Val Thr Gly Lys Phe Asp Gly Lys Ala Leu
290 295 300
Gly Glu Arg Ile Gln Lys Pro Ser Lys Phe Phe Leu Glu Ile Ala Glu
305 310 315 320
Leu Val Lys Ser Ala Thr Glu Gly Thr Pro Ser Ser His Lys Gln His
325 330 335
Glu Glu Ser Pro Ala Ser Lys Leu Ala Ser Pro Thr Pro Pro Lys Ser
340 345 350
Pro Phe Gly Ser Leu Ser Leu Leu Lys Lys Lys Leu Met Gln Ser Asn
355 360 365
Pro Leu Arg Asp Pro Phe Ser Pro Leu Asn Ile Asp Leu Gln Ser Glu
370 375 380
His Pro Asp Trp Ser Ala Lys Lys Lys Ser Gln Cys Val Asn Asn Asn
385 390 395 400
Val Gly Pro Ile Glu Ser Arg Gly Cys Glu Asn Thr Asn Ile Met Val
405 410 415
Pro Leu Arg Gly Ser Asp Leu Val His Glu Gln Pro Ile Glu Lys Asn
420 425 430
Pro Gly Arg Asp Ser Val Lys Thr Gly Pro Asn Gly Ser Arg Ser Gly
435 440 445
Met Glu Gln His Asn Gly Tyr Asp Asp Ile Asp Ala Asn Thr Asn Asp
450 455 460
Asn Leu Asn Met Arg Asn Val Asp Ser His His Glu Ser Asp Gly Leu
465 470 475 480
Asp Lys Val Lys Asp Asp Ser Val Ile Lys Asn Val Leu Lys Ala Leu
485 490 495
Gln Gly Leu Glu Thr Lys Ser Tyr Ile Asp Cys Gln Lys Leu Gln Asp
500 505 510
Ser Glu Val Leu Ala Glu Thr Leu Pro Ser Leu Gln Ala Gln Gly Lys
515 520 525
Ala Val Asp Thr Ala Asn Tyr Thr Ile Glu Thr Ala Val Glu Asp Phe
530 535 540
Gly Ser Thr Glu Ile Asp Pro Leu His Val Lys Tyr Met Leu Pro Glu
545 550 555 560
Thr Ala Pro Ser Ala Glu Gln Asp His Tyr Phe Glu Asp Ser Val Lys
565 570 575
Asp Leu Asn Ser Asp Gln Leu Asn Ser Val Gly Val Glu Val Pro Ser
580 585 590
Arg Asp Val Arg Pro Lys Phe Pro Glu Met Ser Pro Gln His His Lys
595 600 605
Gln Ala Lys Asp Lys Gln Gln Lys Ala Lys Glu Leu Ala Val Gly Arg
610 615 620
Arg Glu Arg Lys His Leu Ser Ser Arg Pro Ser Leu Ala Asp Ala Gly
625 630 635 640
Thr Ser Phe Glu Ser Gly Val Arg Arg Ser Lys Arg Met Lys Thr Arg
645 650 655
Pro Leu Glu Tyr Trp Lys Gly Glu Arg Leu Leu Tyr Gly Arg Val Asp
660 665 670
Glu Gly Leu Lys Leu Val Gly Leu Lys Tyr Ile Ser Pro Gly Lys Gly
675 680 685
Ser Phe Lys Val Lys Ser Tyr Ile Pro Asp Asp Tyr Lys Asp Leu Val
690 695 700
Asp Leu Ala Ala Arg Tyr
705 710
<210> 9
<211> 2130
<212> DNA
<213> Solanum lycopersicum
<400> 9
atggtgaacg aagctcttat ctccgatccg gtggatcctc tccacagcct tgccggactt 60
tctctactcc caacaacagt tagggtttcc accggcgcct cagtatcagt agactccaaa 120
gacctagagt caattcacaa tttcatgaag tccatggaaa ccaagggtcc tgggctcttg 180
gaggaggcta gggaaattgt ggataacggt gcggagcttt tgaataccaa gtttacaagt 240
ttcatacgat ctaaaggcat tgatggggat cttgcaatca agggaaagga gaaggtccag 300
gagagaagac caggacttgg gcgtaaaagg gctcgatttt ccctcaagcc tagtacaagt 360
caacctactg tcagcatagc tcctcgttta gatattgatc aactatcaga tccagtggaa 420
tttttctcag ttgctgaaaa gctagaagtt gctgagaagg aaatagaaag acagaaaggt 480
ggcagtatcc atgatccaga tgtgaataat cccccagcca atgctcggcg tcgtcgacca 540
ggcatcttgg gcaaatcggt gaagtataag caccgtttct catcctccca gcctgagaat 600
gatgatgcat ttatatcatc tcaagagaca ttggaggatg atattctggt ggaacatggt 660
tctcagttgc cagaagagct ccatggcctc aatgttgaac tacaagaagc agaactcaca 720
gggccaataa agaaatcaga aaacagaatc aacaagatac tggatgaatt actgtctggt 780
agtggtgaag atctagaccg ggacatggca gtatccaaat tgcaagagca gttgaagatc 840
aagcccattg aactaggaac tttatgtatt cctgagttcc ctgtgactgg aaagtttgat 900
ggtaaggctc ttggagagag aattcagaag cctagtaagt tttttttgga gatagcggag 960
ttggttaaaa gtgcaactga gggaacgcca tcctctcaca aacagcatga agaaagtcct 1020
gccagtaaat tagcatcacc cactccacca aaaagtccat ttggttcatt gtctttgttg 1080
aaaaagaaac ttatgcagtc aaatccactg agagatcctt tttcgcctct caacattgat 1140
ctgcaatcag agcatccaga ttggtccgcg aagaagaaat cacaatgtgt aaataataat 1200
gttggaccta ttgaatctcg tggttgtgaa aatacaaata ttatggtccc tttaagaggt 1260
tcagacttag tgcatgagca accaattgaa aagaatccag gcagagatag tgtaaaaact 1320
gggccaaatg gatctcgatc tggaatggag caacataatg gctatgatga tattgatgcc 1380
aatactaacg acaacttaaa tatgagaaat gtggattccc accatgagtc tgatgggctt 1440
gacaaagtga aagatgattc agttataaag aatgttttga aggctctaca aggtcttgag 1500
accaaatcct acattgactg tcaaaagctg caggatagtg aagttcttgc tgaaacacta 1560
ccttctcttc aagcccaagg aaaagctgtc gatacagcca attataccat agaaacagct 1620
gttgaggatt ttggatcaac tgaaattgat ccgctggttg acaatgtgct accagaaaca 1680
gcgccttctg cagaacaaga tcattacttt gaggattctg tcaaagactt aaatagtgat 1740
caattgaact cagtgggagt tgaagttcct tctagagacg tgagacctaa atttccggag 1800
atgagccctc agcatcacaa gcaggcaaaa gataagcaac agaaagcaaa ggaacttgct 1860
gttggaaggc gtgaaagaaa acatctttct tctaggccaa gtctagcaga tgctggcaca 1920
tcatttgaaa gtggggttag acgaagcaaa cgaatgaaga caaggccttt ggaatattgg 1980
aaaggcgaaa gattattata tggacgggtt gatgagggtt tgaagcttgt tggcttgaaa 2040
tacatctctc cgggaaaggg atcatttaag gtgaagtctt acattcctga tgactacaaa 2100
gacctagttg atttggcagc tcgctattga 2130
<210> 10
<211> 709
<212> PRT
<213> Solanum lycopersicum
<400> 10
Met Val Asn Glu Ala Leu Ile Ser Asp Pro Val Asp Pro Leu His Ser
1 5 10 15
Leu Ala Gly Leu Ser Leu Leu Pro Thr Thr Val Arg Val Ser Thr Gly
20 25 30
Ala Ser Val Ser Val Asp Ser Lys Asp Leu Glu Ser Ile His Asn Phe
35 40 45
Met Lys Ser Met Glu Thr Lys Gly Pro Gly Leu Leu Glu Glu Ala Arg
50 55 60
Glu Ile Val Asp Asn Gly Ala Glu Leu Leu Asn Thr Lys Phe Thr Ser
65 70 75 80
Phe Ile Arg Ser Lys Gly Ile Asp Gly Asp Leu Ala Ile Lys Gly Lys
85 90 95
Glu Lys Val Gln Glu Arg Arg Pro Gly Leu Gly Arg Lys Arg Ala Arg
100 105 110
Phe Ser Leu Lys Pro Ser Thr Ser Gln Pro Thr Val Ser Ile Ala Pro
115 120 125
Arg Leu Asp Ile Asp Gln Leu Ser Asp Pro Val Glu Phe Phe Ser Val
130 135 140
Ala Glu Lys Leu Glu Val Ala Glu Lys Glu Ile Glu Arg Gln Lys Gly
145 150 155 160
Gly Ser Ile His Asp Pro Asp Val Asn Asn Pro Pro Ala Asn Ala Arg
165 170 175
Arg Arg Arg Pro Gly Ile Leu Gly Lys Ser Val Lys Tyr Lys His Arg
180 185 190
Phe Ser Ser Ser Gln Pro Glu Asn Asp Asp Ala Phe Ile Ser Ser Gln
195 200 205
Glu Thr Leu Glu Asp Asp Ile Leu Val Glu His Gly Ser Gln Leu Pro
210 215 220
Glu Glu Leu His Gly Leu Asn Val Glu Leu Gln Glu Ala Glu Leu Thr
225 230 235 240
Gly Pro Ile Lys Lys Ser Glu Asn Arg Ile Asn Lys Ile Leu Asp Glu
245 250 255
Leu Leu Ser Gly Ser Gly Glu Asp Leu Asp Arg Asp Met Ala Val Ser
260 265 270
Lys Leu Gln Glu Gln Leu Lys Ile Lys Pro Ile Glu Leu Gly Thr Leu
275 280 285
Cys Ile Pro Glu Phe Pro Val Thr Gly Lys Phe Asp Gly Lys Ala Leu
290 295 300
Gly Glu Arg Ile Gln Lys Pro Ser Lys Phe Phe Leu Glu Ile Ala Glu
305 310 315 320
Leu Val Lys Ser Ala Thr Glu Gly Thr Pro Ser Ser His Lys Gln His
325 330 335
Glu Glu Ser Pro Ala Ser Lys Leu Ala Ser Pro Thr Pro Pro Lys Ser
340 345 350
Pro Phe Gly Ser Leu Ser Leu Leu Lys Lys Lys Leu Met Gln Ser Asn
355 360 365
Pro Leu Arg Asp Pro Phe Ser Pro Leu Asn Ile Asp Leu Gln Ser Glu
370 375 380
His Pro Asp Trp Ser Ala Lys Lys Lys Ser Gln Cys Val Asn Asn Asn
385 390 395 400
Val Gly Pro Ile Glu Ser Arg Gly Cys Glu Asn Thr Asn Ile Met Val
405 410 415
Pro Leu Arg Gly Ser Asp Leu Val His Glu Gln Pro Ile Glu Lys Asn
420 425 430
Pro Gly Arg Asp Ser Val Lys Thr Gly Pro Asn Gly Ser Arg Ser Gly
435 440 445
Met Glu Gln His Asn Gly Tyr Asp Asp Ile Asp Ala Asn Thr Asn Asp
450 455 460
Asn Leu Asn Met Arg Asn Val Asp Ser His His Glu Ser Asp Gly Leu
465 470 475 480
Asp Lys Val Lys Asp Asp Ser Val Ile Lys Asn Val Leu Lys Ala Leu
485 490 495
Gln Gly Leu Glu Thr Lys Ser Tyr Ile Asp Cys Gln Lys Leu Gln Asp
500 505 510
Ser Glu Val Leu Ala Glu Thr Leu Pro Ser Leu Gln Ala Gln Gly Lys
515 520 525
Ala Val Asp Thr Ala Asn Tyr Thr Ile Glu Thr Ala Val Glu Asp Phe
530 535 540
Gly Ser Thr Glu Ile Asp Pro Leu Val Asp Asn Val Leu Pro Glu Thr
545 550 555 560
Ala Pro Ser Ala Glu Gln Asp His Tyr Phe Glu Asp Ser Val Lys Asp
565 570 575
Leu Asn Ser Asp Gln Leu Asn Ser Val Gly Val Glu Val Pro Ser Arg
580 585 590
Asp Val Arg Pro Lys Phe Pro Glu Met Ser Pro Gln His His Lys Gln
595 600 605
Ala Lys Asp Lys Gln Gln Lys Ala Lys Glu Leu Ala Val Gly Arg Arg
610 615 620
Glu Arg Lys His Leu Ser Ser Arg Pro Ser Leu Ala Asp Ala Gly Thr
625 630 635 640
Ser Phe Glu Ser Gly Val Arg Arg Ser Lys Arg Met Lys Thr Arg Pro
645 650 655
Leu Glu Tyr Trp Lys Gly Glu Arg Leu Leu Tyr Gly Arg Val Asp Glu
660 665 670
Gly Leu Lys Leu Val Gly Leu Lys Tyr Ile Ser Pro Gly Lys Gly Ser
675 680 685
Phe Lys Val Lys Ser Tyr Ile Pro Asp Asp Tyr Lys Asp Leu Val Asp
690 695 700
Leu Ala Ala Arg Tyr
705
<210> 11
<211> 6220
<212> DNA
<213> Solanum lycopersicum
<400> 11
atggtgaacg aagctcttat ctccgatccg gtggatcctc tccacagcct tgccggactt 60
tctctactcc caacaacagt tagggtttcc accggcgcct cagtatcagt agactccaaa 120
gacctagagt caattcacaa tttcatgaag tccatggtaa ttttccgttt gtttttcttc 180
acttctttag atttctagct cttttataga tcttacatgt taatttagag gagaagtagt 240
gttaatgtcg ttactatgga gttttcgctg ttcttcggtt cgttcctgca ctgaactcca 300
acttacaatt agtacaatta aaatggagtc taacttacat aattgttgta gtttgtccgt 360
ttacaattgg ctagttatat gattttggat gatgttgttc tccttcttta tgataataaa 420
aggaaaccaa gggtcctggg ctcttggagg aggctaggga aattgtggat aacggtgcgg 480
agcttttgaa taccaagttt acaagtttca tacgatctaa aggcattgat ggggatcttg 540
caatcaaggg aaaggagaag gtccaggaga gaagaccagg acttgggcgt aaaagggctc 600
gattttccct caagcctagt acaaggtaaa ttatagacag tttttcttta ttctctaatt 660
agatcctatt gaaaccatgg tgttagctta ccttgctatg cagtcaacct actgtcagca 720
tagctcctcg tttagatatt gatcaactat cagatccagt ggaatttttc tcagttgctg 780
aaaagctaga aggtgatttt gtttcttttg ttatctctta actatctgct tgcaaatttg 840
atccgtcggc aactaaaaac agtatatatt atacttagaa aaataacagt tttagtgttt 900
tacatatggt gaacttacag ttgctgagaa ggaaatagaa agacagaaag gtggcagtat 960
ccatgatcca gatgtgaata atcccccagc caatgctcgg cgtcgtcgac caggcatctt 1020
ggggtacacc tagatactct ttgttttttt acatggaaat gcctgtccta cctttatcgt 1080
cctctcaact tgttgttgca cctttttaga gttctctttt ctgtctcagc aaatcggtga 1140
agtataagca ccgtttctca tcctcccagc ctgagaatga tgatgcattt atatcatctc 1200
aagagacatt ggaggatgat attctggtgg aacatggttc tcagttgcca gaagagctcc 1260
atggcctcaa tgttgaacta caagaagcag aactcacagg ttattgggtt taactaatca 1320
agatagatac cttctgattt ctagattata tttttaactt ctctatgagc agaatgtcat 1380
ttcagaagtg ataattgctt tccaattcaa cagggccaat aaagaaatca gaaaacagaa 1440
tcaacaagat actggatgaa ttactgtctg gtagtggtga agatctagac cgggacatgg 1500
cagtatccaa attgcaagag cagttgaaga tcaagcccat tgaactagga actttatgta 1560
ttcctgagtt ccctgtgact ggaaagtttg atggtaaggc tcttggagag agaattcaga 1620
agcctagtaa gttttttttg gagatagcgg agttggttaa aagtgcaact gagggaacgc 1680
catcctctca caaacagcat gaagaaagtc ctgccagtaa attagcatca cccactccac 1740
caaaaagtcc atttggttca ttgtctttgt tgaaaaagaa acttatgcag tcaaatccac 1800
tgagagatcc tttttcgcct ctcaacattg atctgcaatc agagcatcca gattggtccg 1860
cgaagaagaa atcacaatgt gtaaataata atgttggacc tattgaatct cgtggttgtg 1920
aaaatacaaa tattatggtc cctttaagag gttcagactt agtgcatgag caaccaattg 1980
aaaagaatcc aggcagagat agtgtaaaaa ctgggccaaa tggatctcga tctggaatgg 2040
agcaacataa tggctatgat gatattgatg ccaatactaa cgacaactta aatatgagaa 2100
atgtggattc ccaccatgag tctgatgggc ttgacaaagt gaaagatgat tcagttataa 2160
agaatgtttt gaaggctcta caaggtcttg agaccaaatc ctacattgac tgtcaaaagc 2220
tgcaggatag tgaagttctt gctgaaacac taccttctct tcaagcccaa ggaaaagctg 2280
tcgatacagc caattatacc atagaaacag ctgttgagga ttttggatca actgaaattg 2340
atccgctggc aagtctatcc acttcttact attatatgct gcatttgata cattattcca 2400
ggagttataa ttcaaactgt gacatttttt cattcatacg tcattagcag gttgacaata 2460
tgctaccaga aacagcgcct tctgcagaac aagatcatta ctttgaggat tctgtcaaag 2520
acttaaatag tggtgagatt ctattttgga tgattttttt tatgccaagt catcatttat 2580
gaagatgcga catttgagca ttgtctattt cttgctagat tcttttgtat acacaaattt 2640
ttgtacgtat tcaaaacaat cttttttatg ttttaacaca tcgcttgagt tttacccgga 2700
atcatctgca gtcaactatt cgttttttga ccacttatat tcaactctta actgggtgat 2760
tcatggtact ggaactggac aattcttagg tctgctacag gctatagatt aaggtgtgaa 2820
gtgctggaat ttagtatacg aagaagtaac tgcccatgtt tgccagaaat tgtactgcaa 2880
tagaccaata ccttggttgc ttggaatgtt ctgtcataac ttctctttcc ttttcctttt 2940
catctctggt tttttaatgg gaggatgcat gtgatgcatc tttataaaaa atagatgtgt 3000
agaattttga acttgtagtt gtcaagaatc atgacttttg atcttcattt tttttaaaaa 3060
aggtaatgac tcaattgaga agatggggat aacgctctat cattgtatac catattgaaa 3120
accttacaaa agatatggtt ctcagcaaaa acacatgcat cactatttat catgatgttt 3180
taagtactcc aaaagtaaca agatttgtct aatatgtttg aacttcactt ctatctttcg 3240
agcatcctgt taggtactag atataaatta acgagacgta agtttgtact ggtacatgca 3300
agttattgct gcattctgat gttctattgt ggttatagga gcattaaggt gtctatagtg 3360
tcacgagcaa agcattaggg atgattaatc attaaagtaa cccatgtact gatagcaaaa 3420
gatcatatgc cacatattga tacctattgc gtagtcacaa actcaaccct gctcttcaga 3480
gtcagaaggc gcttccactt aacccagttt ataattggtt acttgcttta ctttctttta 3540
tttataaagt aatatgctac ctccaaatat gaacttcagc tgctgaaatc attctcacat 3600
tgatcacctt ctcttttgca atggttcttt gagcttgtgt cactctttac attataaagt 3660
tgtcatagta cctgtgcatt ctgaatatat gttgtttttc ttgaacatat agctagttat 3720
tttacccact ctactttgca tatcttaact agtaataaca gtctaaagtt tggaaagaac 3780
ttgagaacct tggtatcttt atacagatca attgaactca gtgggagttg aagttccttc 3840
tagagacgtg agacctaaat ttccggagat gagccctcag catcacaagc aggttgcctc 3900
ctttcttgaa tggtccttca ttatttttta tttatatagg aaactcaaag tgccaagtta 3960
atcctttggt attcacacac acacatacac actctctctc tctctctccc aaaagcaaat 4020
aatgatggca gggtttaagg ggtcaaaata cttgcgacat acaaaagcct ggtatttgag 4080
tggagaagtg agcacaatgt ccaaaattta tgctccatac agtttcaaac catttgccat 4140
tggtcctcag agtttttcgg atcgaaaaca attattgtta aagagtctac aatatcaaag 4200
tcagtaaaaa tcgtctgatt ctccaattgt aactgtaaat tagaagacag taaagctgat 4260
tgcttgtatg taaacaaatc tgtagatgcc taaacactag gatagggttt gtgcaaaaac 4320
atatcgcaat tcccaaattt aaaaaaaaac tagcatgaac tgcgtttgat aaccatgatt 4380
atttttttgt tcttttgaaa aaagtgcaat gatgtgactg atttaagttg ccaaatgtgt 4440
tgatttctgt ctagggttag gacattttaa agctgtctac tgaaatgacc ctctgatatt 4500
attggtgtta aaatttgaca accagtctgt ataagagtcg atatttctga cgtgacagtg 4560
gatattgaat gatattgatt gaacacatta atagttttag cccatcatgt ctcctaattt 4620
tgggtttaca tgtgaatgct tgtgctcttt gcagttgtat ttctttacct gtattggtta 4680
tactgattga catgcaatat ttctgatgca ttaggcaaaa gataagcaac agaaagcaaa 4740
ggaacttgct gttggaaggc gtgaaagaaa acatctttct tctaggccaa gtctagcagg 4800
tttttactct tgcgactatg gggatgtctt catttgaagt ctttcatttg tgtttttgat 4860
aaagaatttc atgaatttga cagatgctgg cacatcattt gaaagtgggg ttagacgaag 4920
caaacgaatg aagacaaggc ctttggaata ttggaaaggc gaaagattat tatatggacg 4980
ggttgatgag ggtgagtatt gtcttgtaaa ttcttgtgtt gttactttgc tgggtttctg 5040
ttggattcat ttgttagact tgggtgatag ggtaataatt catcttgatc ctcaaatcta 5100
gtttttcttt ttttggcgcg tgcgtgtgag agagagatgt gtgaaactag gccacaacat 5160
gctagacttt atacttatag tcttgggaag gtaactactc aaggatattt tcttgtcctt 5220
tagataggat gtttatcaca ctaaacgacc taatattgga gaggttggtg gtaacatatg 5280
cacattttgc atagaactct acaagacagc gaaagaaaat attagggacg gcttagctat 5340
tagagaagca tggtaactag gttacttgca tgtctgctaa gagagtgcaa gttagggtat 5400
cagaatctag ttttcaggga ttagtttcgt acttggtcaa gtctcttcca gcaggagatt 5460
aacttagtta aggctctcct agttggtgac ttactagctc agaatactca ttggaacttg 5520
aattacagga aattaggtaa tttgatcctc aatatttttg tgcttgaaaa tcatcaccga 5580
gataatgtag tagacttatt tcctaaatca gccaacatgc tgaattccat aaattgtcaa 5640
gcacaaaatt gaagtaattt ttgaaaacta atcatttcaa ttttggatat ttcacttaag 5700
ggatgccttt agttactttg gcaagtttat tctagttgag cactctctta tagaaagtag 5760
aaacttgagc cataggaact taggtagttt aacccatcat attttcttgc ttgaaaattt 5820
atcattgaga taatagatca gacgtagttc atatatcatc caacttgctg aattccataa 5880
atggtcaaca aaaattaaag taattcgaaa gtgattgttt cagtgtagaa gcaaattgca 5940
gccaacattg agtagcagct tttggatatt acttctatcg taactagcaa ttcaatacat 6000
taaagcatat gctaaacaca atgaacttat cttttcgact ggttgtttct atgtttaacc 6060
tgtggagaaa acaacagatt tagtatatcc gtgtgtttct gttgcaggtt tgaagcttgt 6120
tggcttgaaa tacatctctc cgggaaaggg atcatttaag gtgaagtctt acattcctga 6180
tgactacaaa gacctagttg atttggcagc tcgctattga 6220
<210> 12
<211> 6220
<212> DNA
<213> Solanum lycopersicum
<400> 12
atggtgaacg aagctcttat ctccgatccg gtggatcctc tccacagcct tgccggactt 60
tctctactcc caacaacagt tagggtttcc accggcgcct cagtatcagt agactccaaa 120
gacctagagt caattcacaa tttcatgaag tccatggtaa ttttccgttt gtttttcttc 180
acttctttag atttctagct cttttataga tcttacatgt taatttagag gagaagtagt 240
gttaatgtcg ttactatgga gttttcgctg ttcttcggtt cgttcctgca ctgaactcca 300
acttacaatt agtacaatta aaatggagtc taacttacat aattgttgta gtttgtccgt 360
ttacaattgg ctagttatat gattttggat gatgttgttc tccttcttta tgataataaa 420
aggaaaccaa gggtcctggg ctcttggagg aggctaggga aattgtggat aacggtgcgg 480
agcttttgaa taccaagttt acaagtttca tacgatctaa aggcattgat ggggatcttg 540
caatcaaggg aaaggagaag gtccaggaga gaagaccagg acttgggcgt aaaagggctc 600
gattttccct caagcctagt acaaggtaaa ttatagacag tttttcttta ttctctaatt 660
agatcctatt gaaaccatgg tgttagctta ccttgctatg cagtcaacct actgtcagca 720
tagctcctcg tttagatatt gatcaactat cagatccagt ggaatttttc tcagttgctg 780
aaaagctaga aggtgatttt gtttcttttg ttatctctta actatctgct tgcaaatttg 840
atccgtcggc aactaaaaac agtatatatt atacttagaa aaataacagt tttagtgttt 900
tacatatggt gaacttacag ttgctgagaa ggaaatagaa agacagaaag gtggcagtat 960
ccatgatcca gatgtgaata atcccccagc caatgctcgg cgtcgtcgac caggcatctt 1020
ggggtacacc tagatactct ttgttttttt acatggaaat gcctgtccta cctttatcgt 1080
cctctcaact tgttgttgca cctttttaga gttctctttt ctgtctcagc aaatcggtga 1140
agtataagca ccgtttctca tcctcccagc ctgagaatga tgatgcattt atatcatctc 1200
aagagacatt ggaggatgat attctggtgg aacatggttc tcagttgcca gaagagctcc 1260
atggcctcaa tgttgaacta caagaagcag aactcacagg ttattgggtt taactaatca 1320
agatagatac cttctgattt ctagattata tttttaactt ctctatgagc agaatgtcat 1380
ttcagaagtg ataattgctt tccaattcaa cagggccaat aaagaaatca gaaaacagaa 1440
tcaacaagat actggatgaa ttactgtctg gtagtggtga agatctagac cgggacatgg 1500
cagtatccaa attgcaagag cagttgaaga tcaagcccat tgaactagga actttatgta 1560
ttcctgagtt ccctgtgact ggaaagtttg atggtaaggc tcttggagag agaattcaga 1620
agcctagtaa gttttttttg gagatagcgg agttggttaa aagtgcaact gagggaacgc 1680
catcctctca caaacagcat gaagaaagtc ctgccagtaa attagcatca cccactccac 1740
caaaaagtcc atttggttca ttgtctttgt tgaaaaagaa acttatgcag tcaaatccac 1800
tgagagatcc tttttcgcct ctcaacattg atctgcaatc agagcatcca gattggtccg 1860
cgaagaagaa atcacaatgt gtaaataata atgttggacc tattgaatct cgtggttgtg 1920
aaaatacaaa tattatggtc cctttaagag gttcagactt agtgcatgag caaccaattg 1980
aaaagaatcc aggcagagat agtgtaaaaa ctgggccaaa tggatctcga tctggaatgg 2040
agcaacataa tggctatgat gatattgatg ccaatactaa cgacaactta aatatgagaa 2100
atgtggattc ccaccatgag tctgatgggc ttgacaaagt gaaagatgat tcagttataa 2160
agaatgtttt gaaggctcta caaggtcttg agaccaaatc ctacattgac tgtcaaaagc 2220
tgcaggatag tgaagttctt gctgaaacac taccttctct tcaagcccaa ggaaaagctg 2280
tcgatacagc caattatacc atagaaacag ctgttgagga ttttggatca actgaaattg 2340
atccgctggc aagtctatcc acttcttact attatatgct gcatttgata cattattcca 2400
ggagttataa ttcaaactgt gacatttttt cattcatacg tcattagcat gttaaatata 2460
tgctaccaga aacagcgcct tctgcagaac aagatcatta ctttgaggat tctgtcaaag 2520
acttaaatag tggtgagatt ctattttgga tgattttttt tatgccaagt catcatttat 2580
gaagatgcga catttgagca ttgtctattt cttgctagat tcttttgtat acacaaattt 2640
ttgtacgtat tcaaaacaat cttttttatg ttttaacaca tcgcttgagt tttacccgga 2700
atcatctgca gtcaactatt cgttttttga ccacttatat tcaactctta actgggtgat 2760
tcatggtact ggaactggac aattcttagg tctgctacag gctatagatt aaggtgtgaa 2820
gtgctggaat ttagtatacg aagaagtaac tgcccatgtt tgccagaaat tgtactgcaa 2880
tagaccaata ccttggttgc ttggaatgtt ctgtcataac ttctctttcc ttttcctttt 2940
catctctggt tttttaatgg gaggatgcat gtgatgcatc tttataaaaa atagatgtgt 3000
agaattttga acttgtagtt gtcaagaatc atgacttttg atcttcattt tttttaaaaa 3060
aggtaatgac tcaattgaga agatggggat aacgctctat cattgtatac catattgaaa 3120
accttacaaa agatatggtt ctcagcaaaa acacatgcat cactatttat catgatgttt 3180
taagtactcc aaaagtaaca agatttgtct aatatgtttg aacttcactt ctatctttcg 3240
agcatcctgt taggtactag atataaatta acgagacgta agtttgtact ggtacatgca 3300
agttattgct gcattctgat gttctattgt ggttatagga gcattaaggt gtctatagtg 3360
tcacgagcaa agcattaggg atgattaatc attaaagtaa cccatgtact gatagcaaaa 3420
gatcatatgc cacatattga tacctattgc gtagtcacaa actcaaccct gctcttcaga 3480
gtcagaaggc gcttccactt aacccagttt ataattggtt acttgcttta ctttctttta 3540
tttataaagt aatatgctac ctccaaatat gaacttcagc tgctgaaatc attctcacat 3600
tgatcacctt ctcttttgca atggttcttt gagcttgtgt cactctttac attataaagt 3660
tgtcatagta cctgtgcatt ctgaatatat gttgtttttc ttgaacatat agctagttat 3720
tttacccact ctactttgca tatcttaact agtaataaca gtctaaagtt tggaaagaac 3780
ttgagaacct tggtatcttt atacagatca attgaactca gtgggagttg aagttccttc 3840
tagagacgtg agacctaaat ttccggagat gagccctcag catcacaagc aggttgcctc 3900
ctttcttgaa tggtccttca ttatttttta tttatatagg aaactcaaag tgccaagtta 3960
atcctttggt attcacacac acacatacac actctctctc tctctctccc aaaagcaaat 4020
aatgatggca gggtttaagg ggtcaaaata cttgcgacat acaaaagcct ggtatttgag 4080
tggagaagtg agcacaatgt ccaaaattta tgctccatac agtttcaaac catttgccat 4140
tggtcctcag agtttttcgg atcgaaaaca attattgtta aagagtctac aatatcaaag 4200
tcagtaaaaa tcgtctgatt ctccaattgt aactgtaaat tagaagacag taaagctgat 4260
tgcttgtatg taaacaaatc tgtagatgcc taaacactag gatagggttt gtgcaaaaac 4320
atatcgcaat tcccaaattt aaaaaaaaac tagcatgaac tgcgtttgat aaccatgatt 4380
atttttttgt tcttttgaaa aaagtgcaat gatgtgactg atttaagttg ccaaatgtgt 4440
tgatttctgt ctagggttag gacattttaa agctgtctac tgaaatgacc ctctgatatt 4500
attggtgtta aaatttgaca accagtctgt ataagagtcg atatttctga cgtgacagtg 4560
gatattgaat gatattgatt gaacacatta atagttttag cccatcatgt ctcctaattt 4620
tgggtttaca tgtgaatgct tgtgctcttt gcagttgtat ttctttacct gtattggtta 4680
tactgattga catgcaatat ttctgatgca ttaggcaaaa gataagcaac agaaagcaaa 4740
ggaacttgct gttggaaggc gtgaaagaaa acatctttct tctaggccaa gtctagcagg 4800
tttttactct tgcgactatg gggatgtctt catttgaagt ctttcatttg tgtttttgat 4860
aaagaatttc atgaatttga cagatgctgg cacatcattt gaaagtgggg ttagacgaag 4920
caaacgaatg aagacaaggc ctttggaata ttggaaaggc gaaagattat tatatggacg 4980
ggttgatgag ggtgagtatt gtcttgtaaa ttcttgtgtt gttactttgc tgggtttctg 5040
ttggattcat ttgttagact tgggtgatag ggtaataatt catcttgatc ctcaaatcta 5100
gtttttcttt ttttggcgcg tgcgtgtgag agagagatgt gtgaaactag gccacaacat 5160
gctagacttt atacttatag tcttgggaag gtaactactc aaggatattt tcttgtcctt 5220
tagataggat gtttatcaca ctaaacgacc taatattgga gaggttggtg gtaacatatg 5280
cacattttgc atagaactct acaagacagc gaaagaaaat attagggacg gcttagctat 5340
tagagaagca tggtaactag gttacttgca tgtctgctaa gagagtgcaa gttagggtat 5400
cagaatctag ttttcaggga ttagtttcgt acttggtcaa gtctcttcca gcaggagatt 5460
aacttagtta aggctctcct agttggtgac ttactagctc agaatactca ttggaacttg 5520
aattacagga aattaggtaa tttgatcctc aatatttttg tgcttgaaaa tcatcaccga 5580
gataatgtag tagacttatt tcctaaatca gccaacatgc tgaattccat aaattgtcaa 5640
gcacaaaatt gaagtaattt ttgaaaacta atcatttcaa ttttggatat ttcacttaag 5700
ggatgccttt agttactttg gcaagtttat tctagttgag cactctctta tagaaagtag 5760
aaacttgagc cataggaact taggtagttt aacccatcat attttcttgc ttgaaaattt 5820
atcattgaga taatagatca gacgtagttc atatatcatc caacttgctg aattccataa 5880
atggtcaaca aaaattaaag taattcgaaa gtgattgttt cagtgtagaa gcaaattgca 5940
gccaacattg agtagcagct tttggatatt acttctatcg taactagcaa ttcaatacat 6000
taaagcatat gctaaacaca atgaacttat cttttcgact ggttgtttct atgtttaacc 6060
tgtggagaaa acaacagatt tagtatatcc gtgtgtttct gttgcaggtt tgaagcttgt 6120
tggcttgaaa tacatctctc cgggaaaggg atcatttaag gtgaagtctt acattcctga 6180
tgactacaaa gacctagttg atttggcagc tcgctattga 6220
<210> 13
<211> 6220
<212> DNA
<213> Solanum lycopersicum
<400> 13
atggtgaacg aagctcttat ctccgatccg gtggatcctc tccacagcct tgccggactt 60
tctctactcc caacaacagt tagggtttcc accggcgcct cagtatcagt agactccaaa 120
gacctagagt caattcacaa tttcatgaag tccatggtaa ttttccgttt gtttttcttc 180
acttctttag atttctagct cttttataga tcttacatgt taatttagag gagaagtagt 240
gttaatgtcg ttactatgga gttttcgctg ttcttcggtt cgttcctgca ctgaactcca 300
acttacaatt agtacaatta aaatggagtc taacttacat aattgttgta gtttgtccgt 360
ttacaattgg ctagttatat gattttggat gatgttgttc tccttcttta tgataataaa 420
aggaaaccaa gggtcctggg ctcttggagg aggctaggga aattgtggat aacggtgcgg 480
agcttttgaa taccaagttt acaagtttca tacgatctaa aggcattgat ggggatcttg 540
caatcaaggg aaaggagaag gtccaggaga gaagaccagg acttgggcgt aaaagggctc 600
gattttccct caagcctagt acaaggtaaa ttatagacag tttttcttta ttctctaatt 660
agatcctatt gaaaccatgg tgttagctta ccttgctatg cagtcaacct actgtcagca 720
tagctcctcg tttagatatt gatcaactat cagatccagt ggaatttttc tcagttgctg 780
aaaagctaga aggtgatttt gtttcttttg ttatctctta actatctgct tgcaaatttg 840
atccgtcggc aactaaaaac agtatatatt atacttagaa aaataacagt tttagtgttt 900
tacatatggt gaacttacag ttgctgagaa ggaaatagaa agacagaaag gtggcagtat 960
ccatgatcca gatgtgaata atcccccagc caatgctcgg cgtcgtcgac caggcatctt 1020
ggggtacacc tagatactct ttgttttttt acatggaaat gcctgtccta cctttatcgt 1080
cctctcaact tgttgttgca cctttttaga gttctctttt ctgtctcagc aaatcggtga 1140
agtataagca ccgtttctca tcctcccagc ctgagaatga tgatgcattt atatcatctc 1200
aagagacatt ggaggatgat attctggtgg aacatggttc tcagttgcca gaagagctcc 1260
atggcctcaa tgttgaacta caagaagcag aactcacagg ttattgggtt taactaatca 1320
agatagatac cttctgattt ctagattata tttttaactt ctctatgagc agaatgtcat 1380
ttcagaagtg ataattgctt tccaattcaa cagggccaat aaagaaatca gaaaacagaa 1440
tcaacaagat actggatgaa ttactgtctg gtagtggtga agatctagac cgggacatgg 1500
cagtatccaa attgcaagag cagttgaaga tcaagcccat tgaactagga actttatgta 1560
ttcctgagtt ccctgtgact ggaaagtttg atggtaaggc tcttggagag agaattcaga 1620
agcctagtaa gttttttttg gagatagcgg agttggttaa aagtgcaact gagggaacgc 1680
catcctctca caaacagcat gaagaaagtc ctgccagtaa attagcatca cccactccac 1740
caaaaagtcc atttggttca ttgtctttgt tgaaaaagaa acttatgcag tcaaatccac 1800
tgagagatcc tttttcgcct ctcaacattg atctgcaatc agagcatcca gattggtccg 1860
cgaagaagaa atcacaatgt gtaaataata atgttggacc tattgaatct cgtggttgtg 1920
aaaatacaaa tattatggtc cctttaagag gttcagactt agtgcatgag caaccaattg 1980
aaaagaatcc aggcagagat agtgtaaaaa ctgggccaaa tggatctcga tctggaatgg 2040
agcaacataa tggctatgat gatattgatg ccaatactaa cgacaactta aatatgagaa 2100
atgtggattc ccaccatgag tctgatgggc ttgacaaagt gaaagatgat tcagttataa 2160
agaatgtttt gaaggctcta caaggtcttg agaccaaatc ctacattgac tgtcaaaagc 2220
tgcaggatag tgaagttctt gctgaaacac taccttctct tcaagcccaa ggaaaagctg 2280
tcgatacagc caattatacc atagaaacag ctgttgagga ttttggatca actgaaattg 2340
atccgctggc aagtctatcc acttcttact attatatgct gcatttgata cattattcca 2400
ggagttataa ttcaaactgt gacatttttt cattcatacg tcattagcag gttgacaatg 2460
tgctaccaga aacagcgcct tctgcagaac aagatcatta ctttgaggat tctgtcaaag 2520
acttaaatag tggtgagatt ctattttgga tgattttttt tatgccaagt catcatttat 2580
gaagatgcga catttgagca ttgtctattt cttgctagat tcttttgtat acacaaattt 2640
ttgtacgtat tcaaaacaat cttttttatg ttttaacaca tcgcttgagt tttacccgga 2700
atcatctgca gtcaactatt cgttttttga ccacttatat tcaactctta actgggtgat 2760
tcatggtact ggaactggac aattcttagg tctgctacag gctatagatt aaggtgtgaa 2820
gtgctggaat ttagtatacg aagaagtaac tgcccatgtt tgccagaaat tgtactgcaa 2880
tagaccaata ccttggttgc ttggaatgtt ctgtcataac ttctctttcc ttttcctttt 2940
catctctggt tttttaatgg gaggatgcat gtgatgcatc tttataaaaa atagatgtgt 3000
agaattttga acttgtagtt gtcaagaatc atgacttttg atcttcattt tttttaaaaa 3060
aggtaatgac tcaattgaga agatggggat aacgctctat cattgtatac catattgaaa 3120
accttacaaa agatatggtt ctcagcaaaa acacatgcat cactatttat catgatgttt 3180
taagtactcc aaaagtaaca agatttgtct aatatgtttg aacttcactt ctatctttcg 3240
agcatcctgt taggtactag atataaatta acgagacgta agtttgtact ggtacatgca 3300
agttattgct gcattctgat gttctattgt ggttatagga gcattaaggt gtctatagtg 3360
tcacgagcaa agcattaggg atgattaatc attaaagtaa cccatgtact gatagcaaaa 3420
gatcatatgc cacatattga tacctattgc gtagtcacaa actcaaccct gctcttcaga 3480
gtcagaaggc gcttccactt aacccagttt ataattggtt acttgcttta ctttctttta 3540
tttataaagt aatatgctac ctccaaatat gaacttcagc tgctgaaatc attctcacat 3600
tgatcacctt ctcttttgca atggttcttt gagcttgtgt cactctttac attataaagt 3660
tgtcatagta cctgtgcatt ctgaatatat gttgtttttc ttgaacatat agctagttat 3720
tttacccact ctactttgca tatcttaact agtaataaca gtctaaagtt tggaaagaac 3780
ttgagaacct tggtatcttt atacagatca attgaactca gtgggagttg aagttccttc 3840
tagagacgtg agacctaaat ttccggagat gagccctcag catcacaagc aggttgcctc 3900
ctttcttgaa tggtccttca ttatttttta tttatatagg aaactcaaag tgccaagtta 3960
atcctttggt attcacacac acacatacac actctctctc tctctctccc aaaagcaaat 4020
aatgatggca gggtttaagg ggtcaaaata cttgcgacat acaaaagcct ggtatttgag 4080
tggagaagtg agcacaatgt ccaaaattta tgctccatac agtttcaaac catttgccat 4140
tggtcctcag agtttttcgg atcgaaaaca attattgtta aagagtctac aatatcaaag 4200
tcagtaaaaa tcgtctgatt ctccaattgt aactgtaaat tagaagacag taaagctgat 4260
tgcttgtatg taaacaaatc tgtagatgcc taaacactag gatagggttt gtgcaaaaac 4320
atatcgcaat tcccaaattt aaaaaaaaac tagcatgaac tgcgtttgat aaccatgatt 4380
atttttttgt tcttttgaaa aaagtgcaat gatgtgactg atttaagttg ccaaatgtgt 4440
tgatttctgt ctagggttag gacattttaa agctgtctac tgaaatgacc ctctgatatt 4500
attggtgtta aaatttgaca accagtctgt ataagagtcg atatttctga cgtgacagtg 4560
gatattgaat gatattgatt gaacacatta atagttttag cccatcatgt ctcctaattt 4620
tgggtttaca tgtgaatgct tgtgctcttt gcagttgtat ttctttacct gtattggtta 4680
tactgattga catgcaatat ttctgatgca ttaggcaaaa gataagcaac agaaagcaaa 4740
ggaacttgct gttggaaggc gtgaaagaaa acatctttct tctaggccaa gtctagcagg 4800
tttttactct tgcgactatg gggatgtctt catttgaagt ctttcatttg tgtttttgat 4860
aaagaatttc atgaatttga cagatgctgg cacatcattt gaaagtgggg ttagacgaag 4920
caaacgaatg aagacaaggc ctttggaata ttggaaaggc gaaagattat tatatggacg 4980
ggttgatgag ggtgagtatt gtcttgtaaa ttcttgtgtt gttactttgc tgggtttctg 5040
ttggattcat ttgttagact tgggtgatag ggtaataatt catcttgatc ctcaaatcta 5100
gtttttcttt ttttggcgcg tgcgtgtgag agagagatgt gtgaaactag gccacaacat 5160
gctagacttt atacttatag tcttgggaag gtaactactc aaggatattt tcttgtcctt 5220
tagataggat gtttatcaca ctaaacgacc taatattgga gaggttggtg gtaacatatg 5280
cacattttgc atagaactct acaagacagc gaaagaaaat attagggacg gcttagctat 5340
tagagaagca tggtaactag gttacttgca tgtctgctaa gagagtgcaa gttagggtat 5400
cagaatctag ttttcaggga ttagtttcgt acttggtcaa gtctcttcca gcaggagatt 5460
aacttagtta aggctctcct agttggtgac ttactagctc agaatactca ttggaacttg 5520
aattacagga aattaggtaa tttgatcctc aatatttttg tgcttgaaaa tcatcaccga 5580
gataatgtag tagacttatt tcctaaatca gccaacatgc tgaattccat aaattgtcaa 5640
gcacaaaatt gaagtaattt ttgaaaacta atcatttcaa ttttggatat ttcacttaag 5700
ggatgccttt agttactttg gcaagtttat tctagttgag cactctctta tagaaagtag 5760
aaacttgagc cataggaact taggtagttt aacccatcat attttcttgc ttgaaaattt 5820
atcattgaga taatagatca gacgtagttc atatatcatc caacttgctg aattccataa 5880
atggtcaaca aaaattaaag taattcgaaa gtgattgttt cagtgtagaa gcaaattgca 5940
gccaacattg agtagcagct tttggatatt acttctatcg taactagcaa ttcaatacat 6000
taaagcatat gctaaacaca atgaacttat cttttcgact ggttgtttct atgtttaacc 6060
tgtggagaaa acaacagatt tagtatatcc gtgtgtttct gttgcaggtt tgaagcttgt 6120
tggcttgaaa tacatctctc cgggaaaggg atcatttaag gtgaagtctt acattcctga 6180
tgactacaaa gacctagttg atttggcagc tcgctattga 6220
<210> 14
<211> 2130
<212> DNA
<213> Solanum lycopersicum
<400> 14
atggtgaacg aagctcttat ctccgatccg gtggatcctc tccacagcct tgccggactt 60
tctctactcc caacaacagt tagggtttcc accggcgcct cagtatcagt agactccaaa 120
gacctagagt caattcacaa tttcatgaag tccatggaaa ccaagggtcc tgggctcttg 180
gaggaggcta gggaaattgt ggataacggt gcggagcttt tgaataccaa gtttacaagt 240
ttcatacgat ctaaaggcat tgatggggat cttgcaatca agggaaagga gaaggtccag 300
gagagaagac caggacttgg gcgtaaaagg gctcgatttt ccctcaagcc tagtacaagt 360
caacctactg tcagcatagc tcctcgttta gatattgatc aactatcaga tccagtggaa 420
tttttctcag ttgctgaaaa gctagaagtt gctgagaagg aaatagaaag acagaaaggt 480
ggcagtatcc atgatccaga tgtgaataat cccccagcca atgctcggcg tcgtcgacca 540
ggcatcttgg gcaaatcggt gaagtataag caccgtttct catcctccca gcctgagaat 600
gatgatgcat ttatatcatc tcaagagaca ttggaggatg atattctggt ggaacatggt 660
tctcagttgc cagaagagct ccatggcctc aatgttgaac tacaagaagc agaactcaca 720
gggccaataa agaaatcaga aaacagaatc aacaagatac tggatgaatt actgtctggt 780
agtggtgaag atctagaccg ggacatggca gtatccaaat tgcaagagca gttgaagatc 840
aagcccattg aactaggaac tttatgtatt cctgagttcc ctgtgactgg aaagtttgat 900
ggtaaggctc ttggagagag aattcagaag cctagtaagt tttttttgga gatagcggag 960
ttggttaaaa gtgcaactga gggaacgcca tcctctcaca aacagcatga agaaagtcct 1020
gccagtaaat tagcatcacc cactccacca aaaagtccat ttggttcatt gtctttgttg 1080
aaaaagaaac ttatgcagtc aaatccactg agagatcctt tttcgcctct caacattgat 1140
ctgcaatcag agcatccaga ttggtccgcg aagaagaaat cacaatgtgt aaataataat 1200
gttggaccta ttgaatctcg tggttgtgaa aatacaaata ttatggtccc tttaagaggt 1260
tcagacttag tgcatgagca accaattgaa aagaatccag gcagagatag tgtaaaaact 1320
gggccaaatg gatctcgatc tggaatggag caacataatg gctatgatga tattgatgcc 1380
aatactaacg acaacttaaa tatgagaaat gtggattccc accatgagtc tgatgggctt 1440
gacaaagtga aagatgattc agttataaag aatgttttga aggctctaca aggtcttgag 1500
accaaatcct acattgactg tcaaaagctg caggatagtg aagttcttgc tgaaacacta 1560
ccttctcttc aagcccaagg aaaagctgtc gatacagcca attataccat agaaacagct 1620
gttgaggatt ttggatcaac tgaaattgat ccgctggttg acaatatgct accagaaaca 1680
gcgccttctg cagaacaaga tcattacttt gaggattctg tcaaagactt aaatagtgat 1740
caattgaact cagtgggagt tgaagttcct tctagagacg tgagacctaa atttccggag 1800
atgagccctc agcatcacaa gcaggcaaaa gataagcaac agaaagcaaa ggaacttgct 1860
gttggaaggc gtgaaagaaa acatctttct tctaggccaa gtctagcaga tgctggcaca 1920
tcatttgaaa gtggggttag acgaagcaaa cgaatgaaga caaggccttt ggaatattgg 1980
aaaggcgaaa gattattata tggacgggtt gatgagggtt tgaagcttgt tggcttgaaa 2040
tacatctctc cgggaaaggg atcatttaag gtgaagtctt acattcctga tgactacaaa 2100
gacctagttg atttggcagc tcgctattga 2130
<210> 15
<211> 670
<212> PRT
<213> Cucurbitaceae
<220>
<221> misc_feature
<222> (200)..(200)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (342)..(342)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (383)..(383)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (556)..(556)
<223> Xaa can be any naturally occurring amino acid
<400> 15
Met Val Asn Glu Glu Ala Arg His Ser Asp Val Ile Asp Pro Leu Ala
1 5 10 15
Ala Tyr Ser Gly Ile Asn Leu Phe Pro Thr Ala Phe Gly Thr Leu Pro
20 25 30
Asp Pro Ser Lys Pro His Asp Leu Gly Thr Asp Leu Asp Gly Ile His
35 40 45
Lys Arg Leu Lys Ser Met Val Leu Arg Ser Pro Ser Lys Leu Leu Glu
50 55 60
Gln Ala Arg Ser Ile Leu Asp Gly Asn Ser Asn Ser Met Ile Ser Glu
65 70 75 80
Ala Ala Thr Phe Leu Val Lys Asn Glu Lys Asn Glu Glu Ala Thr Val
85 90 95
Lys Ala Glu Glu Asn Pro Gln Glu Arg Arg Pro Ala Leu Asn Arg Lys
100 105 110
Arg Ala Arg Phe Ser Leu Lys Pro Asp Ala Arg Gln Pro Pro Val Asn
115 120 125
Leu Glu Pro Thr Phe Asp Ile Lys Gln Leu Lys Asp Pro Glu Glu Phe
130 135 140
Phe Leu Ala Tyr Glu Lys His Glu Asn Ala Lys Lys Glu Ile Gln Lys
145 150 155 160
Gln Thr Gly Ala Val Leu Lys Asp Leu Asn Gln Gln Asn Pro Ser Thr
165 170 175
Asn Thr Arg Gln Arg Arg Pro Gly Ile Leu Gly Arg Ser Val Arg Tyr
180 185 190
Lys His Gln Tyr Ser Ser Ile Xaa Thr Glu Asp Asp Gln Asn Val Asp
195 200 205
Pro Ser Gln Val Thr Phe Asp Ser Gly Ile Phe Ser Pro Leu Lys Leu
210 215 220
Gly Thr Glu Thr His Pro Ser Pro His Ile Ile Asp Ser Glu Lys Lys
225 230 235 240
Thr Asp Glu Asp Val Ala Phe Glu Glu Glu Glu Glu Glu Glu Glu Leu
245 250 255
Val Ala Ser Ala Thr Lys Ala Glu Asn Arg Val Asn Asp Ile Leu Asp
260 265 270
Glu Phe Leu Ser Gly Asn Cys Glu Asp Leu Glu Gly Asp Arg Ala Ile
275 280 285
Asn Ile Leu Gln Glu Arg Leu Gln Ile Lys Pro Leu Thr Leu Glu Lys
290 295 300
Leu Cys Leu Pro Asp Leu Glu Ala Ile Pro Thr Met Asn Leu Lys Ser
305 310 315 320
Ser Arg Gly Asn Leu Ser Lys Arg Ser Leu Ile Ser Val Asp Asn Gln
325 330 335
Leu Gln Lys Ile Glu Xaa Leu Lys Ser Lys Gln Asp Asn Glu Asn Leu
340 345 350
Val Asn Pro Val Ser Thr Pro Ser Ser Met Arg Ser Pro Leu Ala Ser
355 360 365
Leu Ser Ala Leu Asn Arg Arg Ile Ser Leu Ser Asn Ser Ser Xaa Asp
370 375 380
Ser Phe Ser Ala His Gly Ile Asp Gln Ser Pro Ala Arg Asp Pro Tyr
385 390 395 400
Leu Phe Glu Leu Gly Asn His Leu Ser Asp Ala Val Gly Ile Thr Glu
405 410 415
Gln Ser Ser Val Ser Lys Leu Lys Pro Leu Leu Thr Arg Asp Gly Gly
420 425 430
Thr Val Ala Asn Gly Ile Lys Pro Ser Lys Ile Leu Ser Gly Asp Asp
435 440 445
Ser Met Ser Lys Ile Ser Ser Ser Asn Ile Leu Asn Val Pro Gln Val
450 455 460
Gly Gly Asn Thr Ala Leu Ser Gly Thr Tyr Ala Ser Thr Glu Ala Lys
465 470 475 480
Asn Val Ser Gly Ser Ser Thr Asp Val Glu Ile Asn Glu Lys Leu Ser
485 490 495
Cys Leu Glu Ala Gln Ala Asp Ala Val Ala Asn Met Gln Ile Glu Asp
500 505 510
His Glu Gly Ser Ala Ser Glu Gln Pro Lys Leu Ser Glu Val Asp Leu
515 520 525
Ile Lys Glu Tyr Pro Val Gly Ile Arg Ser Gln Leu Asp Gln Ser Thr
530 535 540
Thr Thr Thr Cys Ala Glu Asn Ile Val Asp Gly Xaa Ser Arg Ser Ser
545 550 555 560
Gly Thr Asp His His Asp Gly Glu Gln Val Lys Pro Lys Ser Arg Ala
565 570 575
Asn Lys Gln Arg Lys Gly Lys Lys Ile Ser Gly Arg Gln Ser Leu Ala
580 585 590
Gly Ala Gly Thr Thr Trp Gln Ser Gly Val Arg Arg Ser Thr Arg Phe
595 600 605
Lys Thr Arg Pro Leu Glu Tyr Trp Lys Gly Glu Arg Leu Leu Tyr Gly
610 615 620
Arg Val His Glu Ser Leu Ala Thr Val Ile Gly Leu Lys Tyr Val Ser
625 630 635 640
Pro Ala Lys Gly Asn Gly Lys Pro Thr Met Lys Val Lys Ser Leu Val
645 650 655
Ser Asn Glu Tyr Lys Asp Leu Val Glu Leu Ala Ala Leu His
660 665 670
<210> 16
<211> 713
<212> PRT
<213> Brassicaceae
<220>
<221> misc_feature
<222> (4)..(4)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (40)..(40)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (103)..(103)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (206)..(206)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (215)..(215)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (242)..(242)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (256)..(256)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (271)..(271)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (277)..(277)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (296)..(296)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (363)..(363)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (365)..(365)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (477)..(477)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (484)..(484)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (537)..(537)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (583)..(583)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (606)..(606)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (624)..(624)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (688)..(688)
<223> Xaa can be any naturally occurring amino acid
<400> 16
Met Ala Asp Xaa Ser Arg Ser Ser Ser Leu Glu Asp Asp Pro Leu His
1 5 10 15
Ala Tyr Ser Gly Leu Ser Leu Phe Pro Arg Thr Leu Lys Ser Leu Ser
20 25 30
Asn Pro Leu Pro Pro Pro Leu Xaa Gln Ser Glu Asp Leu Gln Gln Thr
35 40 45
His Thr Leu Leu Glu Ser Met Pro Phe Glu Ile Gln Lys Glu His Gln
50 55 60
Glu Gln Ala Lys Ala Ile Leu Glu Asp Val Asn Val Asp Val Lys Leu
65 70 75 80
Asn Pro Ile Pro Asn Lys Arg Glu Arg Arg Pro Gly Leu Asp Arg Lys
85 90 95
Arg Lys Ser Phe Ser Leu Xaa Leu Thr Thr Ser Gln Pro Pro Pro Val
100 105 110
Ala Pro Ser Phe Asp Pro Ser Lys Tyr Pro Lys Pro Glu Asp Tyr Phe
115 120 125
Ala Ala Tyr Asp Lys Phe Glu Leu Ala Asn Arg Glu Trp Gln Lys Gln
130 135 140
Thr Gly Ser Ser Val Ile Asp Thr Gln Gln Asn Pro Pro Ser Arg Arg
145 150 155 160
Pro Arg Arg Pro Gly Ile Pro Gly Arg Lys Arg Gly Pro Tyr Lys His
165 170 175
Thr Tyr Thr Asp Ser Tyr Phe Thr Asp Ala Ile Asn Leu Glu Ala Ser
180 185 190
Glu Lys Glu Asn Pro Ile Pro Ser Glu Gln Ser Leu Glu Xaa Thr Thr
195 200 205
Ala Ala His Val Thr Thr Xaa Asp Arg Glu Val Asp Asp Ser Thr Val
210 215 220
Asp Thr Asp Lys Asp Leu Asn Asn Ile Leu Thr Glu Leu Leu Ala Cys
225 230 235 240
Ser Xaa Asp Glu Leu Glu Gly Asp Ala Ala Val Lys Leu Leu Glu Xaa
245 250 255
Arg Leu Gln Ile Lys Pro Phe Asn Glu Lys Phe Asp Ile Pro Xaa Phe
260 265 270
Gln Asp Val Arg Xaa Met Asp Leu Lys Ala Ser Gly Ser Asn Pro Ser
275 280 285
Asn Arg Lys Ser Ala Leu Ser Xaa Ile Gln Asn Leu Leu Lys Gly Ile
290 295 300
Asn Arg Asp Ala Val Arg Lys Asn Ser His Ser Pro Ser Pro Lys His
305 310 315 320
Phe Ser Ser Pro Asn Pro Pro Glu Asp Gln Phe Ser Phe Pro Asp Ile
325 330 335
His Asn Leu Leu Pro Gly Asp Gln Gln Pro Ser Glu Val Asp Ile Gln
340 345 350
Pro Ala Lys Asp Leu Asn Ile Gly Ser Ser Xaa Ala Xaa Asp Ala Asp
355 360 365
Lys Asp Ile Pro Asn Thr Ser Pro Ser Asn Val Gly Thr Val Asp Val
370 375 380
Ala Ser Pro Phe Asn Ser Ser Val Gln Lys Ser Ser Gly Glu Asp Asp
385 390 395 400
Ser Thr His Ser Gly Ile His Arg Ser His Ser Ser Arg Asp Gly Asn
405 410 415
Ala Asp Asn Cys Val Asp Asp Ser Ile Thr Asn Ile Asn Ser Ala Thr
420 425 430
Leu Glu Val Asn Val Asp Met Gln Thr Lys Gly Lys Glu Gly Asp Val
435 440 445
Pro Met Ser Glu Ser Gly Ala Asn Arg Asn Thr Gly Arg Arg Glu Asn
450 455 460
Asp Ala Asp Ile Asn Glu Glu Thr Asp Tyr Leu Glu Xaa Leu Ala Glu
465 470 475 480
Tyr Ala Ser Xaa Glu Val Thr Arg Pro Phe Thr Val Glu Glu Asp Ser
485 490 495
Ile Pro Tyr Gln Gln Gly Glu Ser Ser Lys Ser Pro Asn Arg Ala Pro
500 505 510
Glu Gln Tyr Asn Thr Met Asp Gly Ser Phe Glu His Ala Glu His Ile
515 520 525
Gln Gly Gln His Glu Glu Glu Asn Xaa Asn Thr Asp Thr Ala Cys Gly
530 535 540
Leu Gln Val Glu Asn Ala Gln Glu Val His Asn Ser Ser His Lys Gln
545 550 555 560
Thr Asn Lys Arg Arg Lys Arg Gly Ser Ser Asp Ser Asn Met Lys Lys
565 570 575
Arg Ser Lys Thr Val His Xaa Glu Thr Gly Gly Asp Lys Gln Met Lys
580 585 590
Thr Leu Pro His Glu Ser Gly Ala Lys Lys Gln Thr Lys Xaa Lys Ser
595 600 605
Asn Glu Arg Glu Glu Lys Lys Gln Lys Lys Thr Val Thr Arg Glu Xaa
610 615 620
Lys Leu Phe Ser Arg Arg Lys Ser Leu Ala Ala Ala Gly Thr Lys Met
625 630 635 640
Glu Gly Gly Val Arg Arg Ser Thr Arg Ile Lys Ser Arg Pro Leu Glu
645 650 655
Tyr Trp Arg Gly Glu Arg Phe Leu Tyr Gly Arg Ile His Glu Ser Leu
660 665 670
Thr Thr Val Ile Gly Ile Lys Tyr Ala Ser Pro Gly Lys Gly Lys Xaa
675 680 685
Asp Lys Arg Ala Ser Lys Val Lys Ser Phe Val Ser Asp Asp Tyr Lys
690 695 700
Glu Leu Val Asp Phe Ala Ala Leu His
705 710
<210> 17
<211> 657
<212> PRT
<213> Fabaceae
<220>
<221> misc_feature
<222> (27)..(27)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (36)..(36)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (45)..(45)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (55)..(55)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (61)..(61)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (79)..(79)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (89)..(89)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (116)..(116)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (119)..(119)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (125)..(125)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (129)..(129)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (134)..(134)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (138)..(138)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (142)..(142)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (152)..(153)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (155)..(155)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (161)..(162)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (167)..(168)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (171)..(171)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (174)..(174)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (179)..(179)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (185)..(185)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (198)..(198)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (211)..(211)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (237)..(238)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (266)..(266)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (274)..(274)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (314)..(314)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (320)..(320)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (322)..(322)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (335)..(335)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (341)..(342)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (350)..(350)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (358)..(358)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (410)..(411)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (416)..(416)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (426)..(426)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (458)..(458)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (479)..(479)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (488)..(488)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (523)..(523)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (534)..(534)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (571)..(571)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (587)..(587)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (609)..(609)
<223> Xaa can be any naturally occurring amino acid
<400> 17
Met Ala Ser Leu Pro Ser Ser Glu Pro Tyr Asn Asp Asp Thr Ile His
1 5 10 15
His Leu Arg Ser Met Ala Leu Arg Val Phe Xaa Thr Glu Asn Leu Thr
20 25 30
Gln Asp Val Xaa Asn Asp Ala Ser Glu Gly Glu Phe Xaa Arg Lys Arg
35 40 45
Arg Pro Gly Leu Gly Leu Xaa Arg Pro Arg Phe Ser Xaa Lys Pro Thr
50 55 60
Lys Lys Pro Ser Val Glu Asp Leu Leu Pro Ile Leu Asp Leu Xaa Ala
65 70 75 80
Leu Lys Asp Pro Ala Glu Phe Phe Xaa Ala His Glu Arg Leu Glu Asn
85 90 95
Ala Lys Arg Glu Ile Gln Lys Gln Leu Gly Ala Ser Glu Ser Asp Gln
100 105 110
Asp Ser Thr Xaa Pro Arg Xaa Arg Arg Pro Gly Leu Xaa Gly Asn Arg
115 120 125
Xaa Pro Ile Arg Tyr Xaa His Arg Tyr Xaa Thr Glu Thr Xaa Asp Asp
130 135 140
Val Leu Ser Ser Gln Glu Ala Xaa Xaa Ser Xaa Ser Leu Asp Pro Val
145 150 155 160
Xaa Xaa Asn Thr Asp Lys Xaa Xaa Ala Ser Xaa Ala Ser Xaa Glu Lys
165 170 175
Glu Val Xaa Asp Ser Ser Ala Ile Xaa Gly Asn Glu Leu Asp Glu Leu
180 185 190
Leu Asp Gly Leu Leu Xaa Cys Asn Ser Glu Asp Leu Glu Gly Asp Gly
195 200 205
Ala Met Xaa Leu Leu Gln Glu Arg Leu Gln Ile Lys Pro Ile Ala Leu
210 215 220
Glu Lys Phe Ser Val Pro Asp Phe Pro Asp Lys Gln Xaa Xaa Asp Leu
225 230 235 240
Lys Ser Leu Gln Gly Asn Lys Ser Lys Pro Arg Lys Ala Leu Ser Asp
245 250 255
Ile Asp Asn Leu Leu Lys Gly Met Asn Xaa Lys Lys Thr Pro Leu Lys
260 265 270
Arg Xaa Val Gln Cys Pro Val Gln Gln Leu Ala Ser Pro Thr Pro Pro
275 280 285
Arg Ser Pro Phe Ala Ser Leu Leu Ser Leu Gln Lys His Ile Ser Arg
290 295 300
Ser Lys Gln Ser Val Asp Pro Phe Ser Xaa His Glu Ile Asp His Xaa
305 310 315 320
Ser Xaa Lys Asn Tyr Ser Pro Thr His Met Val Asn Pro Glu Xaa Asn
325 330 335
Leu Val Gly Ser Xaa Xaa Leu Ser Asn Glu Leu Asn Ala Xaa Met Ile
340 345 350
Glu Asp Val Ile Ala Xaa Gly Lys Thr Ser Leu Asp Thr Asp Arg Asn
355 360 365
Gly Thr Ser Thr Ser Glu Ile Pro Arg Phe Asp Val Ser Asn Glu Pro
370 375 380
His Asp Ile Asn Thr His Thr Ser Glu Ile Ser Lys Glu Asp Asn Ser
385 390 395 400
Gly Lys Ser Ser Asn Asn Leu Asn Val Xaa Xaa Ile Glu Asp Ile Xaa
405 410 415
Ala Val Gly Thr Ser Leu Ala Glu Asp Xaa Ala Arg Asn Cys Thr Ser
420 425 430
Thr Pro Gln Lys Ser Met Val Asp Asn Ser Arg Glu Pro Arg Phe Asp
435 440 445
Ala Asn Val Asp Ser Asn Glu Pro Val Xaa Met Asp Val Asp Ile Gly
450 455 460
Gly Ile Ser Gly Met Gly Lys Arg Val Met Asp Asp Thr Glu Xaa Arg
465 470 475 480
Gln Asn Ile Glu Pro Asn Glu Xaa Cys Gln Ser Glu Asp Lys Thr Asn
485 490 495
Met Gln Thr Phe Thr Ala Ser Ile Pro Thr Asp Asp Thr Asn Leu Asn
500 505 510
Val Val Pro Leu Ala Asp Gln Ser Asn Pro Xaa Gly Tyr Gln Ala Ser
515 520 525
Ser Val Asp Lys Arg Xaa Arg Arg Ser Asp Asp Gly Pro Glu His Gln
530 535 540
Cys Leu Gln Glu Lys Thr Asp Gly Ser Met Ala Pro Val Asn Gly Gln
545 550 555 560
Lys Arg Val Lys Ser Arg Val Lys Ser Lys Xaa Lys Lys Leu Ser Arg
565 570 575
Lys Ser Leu Ala Asp Ala Gly Thr Ser Trp Xaa Ser Gly Leu Arg Arg
580 585 590
Ser Thr Arg Ile Arg Thr Arg Pro Leu Glu Tyr Trp Lys Gly Glu Arg
595 600 605
Xaa Val Tyr Gly Arg Val His Gln Ser Leu Ala Thr Val Ile Gly Val
610 615 620
Lys Cys Met Ser Pro Gly Ser Asp Gly Lys Pro Thr Met Lys Val Lys
625 630 635 640
Ser Tyr Val Ser Asp Lys Tyr Lys Glu Leu Phe Glu Leu Ala Ser Leu
645 650 655
Tyr
<210> 18
<211> 696
<212> PRT
<213> Poaceae
<220>
<221> misc_feature
<222> (8)..(8)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (110)..(110)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (128)..(128)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (133)..(133)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (144)..(144)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (153)..(153)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (192)..(192)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (197)..(197)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (220)..(220)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (242)..(242)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (246)..(246)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (249)..(249)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (265)..(265)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (286)..(286)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (295)..(295)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (299)..(299)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (311)..(311)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (328)..(328)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (349)..(349)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (379)..(379)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (416)..(416)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (423)..(423)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (439)..(439)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (488)..(488)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (503)..(503)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (526)..(526)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (533)..(533)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (580)..(580)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (611)..(611)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (649)..(649)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (692)..(692)
<223> Xaa can be any naturally occurring amino acid
<400> 18
Met Asp Ala Ala Asp Pro Leu Xaa Ala Ile Ser Ser Pro Ala Arg Leu
1 5 10 15
Leu Pro Arg Thr Leu Gly Pro Ala Ala Ala Ser Pro Ser Lys Ala Arg
20 25 30
Glu Ala Leu Leu Glu Ala Ile Ser Arg Leu Lys Gly Ser Lys Glu Leu
35 40 45
Val Glu Gln Ala Arg Met Val Leu Lys Glu His Gly Asp Ile Gln Lys
50 55 60
Leu Tyr His Asp Asp Gly Val Lys Ala Pro Ala Asn Gly Ser Lys Asn
65 70 75 80
Gln Gln Gly Arg Arg Pro Ala Leu Asp Arg Lys Arg Ala Arg Phe Thr
85 90 95
Met Lys Asp Thr Ala Ser Lys Pro Val Pro Val Val Asp Xaa Ser Lys
100 105 110
Leu Leu Asn Ile Ser Asp Pro Glu Glu Tyr Phe Met Thr Leu Asp Xaa
115 120 125
Leu Glu Glu Ala Xaa Lys Glu Ile Lys Arg Leu Asn Gly Glu Val Xaa
130 135 140
Lys Ala Val Leu Asn Phe Asp Pro Xaa Asp Pro Pro Lys Arg Arg Pro
145 150 155 160
Gly Leu Leu Gly Arg Lys Ser Val Arg Ser Phe Lys Phe Ile Asp Ala
165 170 175
Asp Thr Gln Asp Pro Ile Glu Val Pro Ala Ser Gln Thr Glu Thr Xaa
180 185 190
Thr Gly Ser Gln Xaa Ser Gln Asp Asp Met His Ala Ser Val Ala Glu
195 200 205
Lys Asn Glu Gln Ser Val Pro Ser Ser Ser Ser Xaa Ala Ile Ser Asp
210 215 220
Val Ser Gly Lys Glu Asp Ser Leu Ala Glu Lys Asp Gly Arg Asp Asp
225 230 235 240
Leu Xaa Tyr Leu Leu Xaa Ser Leu Xaa Asn Leu Asp Glu Ser Glu Glu
245 250 255
Glu Asn Phe Leu Arg Lys Thr Leu Xaa Ile Lys Glu Ile Arg Lys Ile
260 265 270
Glu Lys Val Cys Leu Pro Asn Ser Ile Pro Gly Asp Arg Xaa Leu Arg
275 280 285
Ser Asn Thr Glu Gln Lys Xaa Ser Met Arg Xaa His Pro Pro Glu Ser
290 295 300
Leu Pro Gln Ser His Gln Xaa Arg Ile Ser Glu Leu Glu Lys His Leu
305 310 315 320
Phe Pro Gly Asp Ala Ala Asn Xaa Lys Cys Thr Asp Leu Glu Asp Asp
325 330 335
Glu Ser Glu Gly Ser Pro Asp Ile Val Met Gly Glu Xaa Ser Leu Val
340 345 350
His Asp Ser Ser Asp Val Leu Met Thr Asp Glu Ala Asn Thr Ala Ser
355 360 365
Glu Ile Asp Arg Glu Thr Pro Asn Leu Gly Xaa Lys Ala Ala Asp His
370 375 380
Val Leu Asp Pro Glu Pro Asn Asp His Ala Tyr Glu Arg Gln Pro Gly
385 390 395 400
Ser Ser Leu Gly Leu Asp Thr Glu Val Ala Lys Glu Lys Glu Ala Xaa
405 410 415
Ser Arg Ser Asn Ile Ser Xaa Glu Glu Asp Asp Val Pro Ile Asp Tyr
420 425 430
Pro Thr Gly Arg Ser Asn Xaa Glu Thr Glu Val Ser Ser Pro His His
435 440 445
Leu Glu Gly Ser Ser Thr Glu Val Leu Ser Ser Thr Pro Gly Arg Asn
450 455 460
Ala Ser Pro Asp Gly Ile Asp Arg Thr Ser His Thr Ala Glu Asp Ser
465 470 475 480
Ile Gln His Leu Glu Ala Val Xaa Glu Asp Gly Val Lys Gln Asp Lys
485 490 495
Ser Ser Gln Pro Ser Glu Xaa Pro Leu Glu Asp Ile Asp Pro Gln Asn
500 505 510
Gln Ser Gln Met His Gly Gly Ser Thr Lys Lys Leu Ala Xaa Asp Ser
515 520 525
Asn Ala Leu Ser Xaa Ser Lys Gln Lys Lys Gln Gln Ala Ala Gln Glu
530 535 540
Gly Lys Met Lys Lys Gln Ser Lys Arg Gly Lys Lys Val Ala Asp Glu
545 550 555 560
Ser Ser Pro Leu Glu Ile Pro Gln Asn Phe Asp Ser Glu Asn Gln Pro
565 570 575
His Asn Asp Xaa Asn Ile Glu Gln Gln His Thr Val Thr Ser Ser Pro
580 585 590
Leu Ser Pro Asn Lys Gly Lys Gly Gln Lys Gly Ala Gln Arg Arg Asn
595 600 605
Lys Thr Xaa Lys Leu Asn Gln Arg Lys Ser Leu Gly Asp Ala Gly Leu
610 615 620
Ala Trp Gln Ser Gly Val Arg Arg Ser Thr Arg Ile Arg Ser Arg Pro
625 630 635 640
Leu Glu His Trp Leu Gly Glu Arg Xaa Leu Tyr Gly Arg Ile His Asp
645 650 655
Thr Met Ala Val Ile Gly Ile Lys Ser Tyr Ser Pro Ser Gln Asp Gly
660 665 670
Lys Lys Thr Leu Lys Val Lys Ser Phe Val Pro Asp Gln Tyr Ser Asp
675 680 685
Leu Val Ala Xaa Ser Ala Lys Tyr
690 695
<210> 19
<211> 745
<212> PRT
<213> Rosaceae
<220>
<221> misc_feature
<222> (73)..(73)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (118)..(118)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (150)..(150)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (170)..(170)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (185)..(185)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (197)..(197)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (199)..(199)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (211)..(211)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (219)..(219)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (221)..(221)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (233)..(233)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (241)..(241)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (269)..(269)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (274)..(274)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (319)..(319)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (321)..(321)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (339)..(339)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (369)..(370)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (375)..(375)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (383)..(383)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (420)..(420)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (450)..(451)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (456)..(456)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (458)..(459)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (467)..(467)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (472)..(472)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (476)..(476)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (482)..(482)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (496)..(496)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (508)..(508)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (519)..(520)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (526)..(526)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (536)..(536)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (538)..(538)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (542)..(542)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (549)..(549)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (553)..(553)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (574)..(574)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (579)..(579)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (585)..(585)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (589)..(589)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (615)..(615)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (633)..(633)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (650)..(650)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (657)..(657)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (661)..(661)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (663)..(663)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (705)..(705)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (710)..(710)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (716)..(716)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (722)..(722)
<223> Xaa can be any naturally occurring amino acid
<400> 19
Met Asn Trp Ser Ser Asp Pro Val Asp Pro Leu Gln Gly Phe Thr Gly
1 5 10 15
Leu Ala Phe Lys Pro Leu Asn Thr Ala Ser Gln Val Lys Leu Val Asp
20 25 30
Gln Val Lys Asn Ile Leu Ser Asp Thr Ser Lys Thr Leu Lys Ser Gly
35 40 45
Asn Pro Gln Ala Thr Lys Gln Lys Ser Glu Gly Pro Glu Lys Ala Ser
50 55 60
Gln Pro Asn Met Ser Leu Leu Pro Xaa Asp Ile Asn Gly Leu Glu Ala
65 70 75 80
Arg Lys Glu Asn Phe Arg Gly Asp Ala Ala Leu Ala Asp Gln Gln Ala
85 90 95
Ile His Ile Arg Leu Lys Ser Met Ala Ser Gln His Ser Pro Ser Lys
100 105 110
Leu Lys Asp Gln Ala Xaa Asn Ile Val Ser Gly Thr Ser Glu Ile Leu
115 120 125
Glu Pro Gly Asn Arg Gln Ala Leu Lys Gln Lys Asn Lys Val Val Pro
130 135 140
Glu Lys Ala Val Glu Xaa Pro Arg Gln Arg Arg Pro Ala Leu Gly Leu
145 150 155 160
Lys Arg Ala Arg Phe Ser Met Lys Pro Xaa Ser Ser Gln Pro Asp Thr
165 170 175
Ser Leu Leu Pro Pro Phe Asp Ala Xaa Lys Tyr Thr Asp Pro Glu Glu
180 185 190
Leu Phe Lys Glu Xaa Glu Xaa Tyr Glu Asn Ala Lys Lys Glu Leu Glu
195 200 205
Lys Gln Xaa Gly Gly Ala Ile Leu Asp Ala Xaa Lys Xaa Asn Pro Ser
210 215 220
Pro Ile Lys Arg Thr Arg Arg Pro Xaa Ile Leu Arg Lys Arg Ala Lys
225 230 235 240
Xaa Lys His Ser Tyr Pro Leu Met Asp Phe Glu Ser Ser Glu Asn Gly
245 250 255
Gln Glu Thr Ser Ile Ser Pro Leu Asn His Ser Thr Xaa Ile Glu Pro
260 265 270
Asn Xaa Asn Val Ala Leu Glu Glu Met Asp Leu Ala Gly Ser Leu Ala
275 280 285
Glu Lys Glu Val Asn Gly Asp Ile Leu Phe Asp Glu Leu Leu Ser Leu
290 295 300
Asn Thr Glu Cys Glu Leu Glu Gly Asp Gly Ala Val Thr His Xaa Gln
305 310 315 320
Xaa Cys Leu Arg Met Lys Pro Ile Glu Pro Glu Lys Ser Asp Leu Pro
325 330 335
Glu Phe Xaa Ser Ile Asp Ser Ser Arg Arg Thr Leu Pro Lys Gly Asp
340 345 350
Cys Leu Thr Asp Ile Asp Asn Leu Leu Lys Gly Leu Ile Ser Ser Thr
355 360 365
Xaa Xaa Lys His Arg Lys Xaa Gly Ala Glu Gly Ser Ile His Xaa Ala
370 375 380
Ser Pro Thr Pro Pro Lys Ser Pro Phe Ala Ser Ile Leu Asp Leu His
385 390 395 400
Lys Arg Ile Leu His Ser Ser Pro Ser Ser Asp Pro Phe Ser Ala His
405 410 415
Asp Ile Asp Xaa Phe Leu Pro Glu Thr Asn Pro Ser Ser Val Glu Asn
420 425 430
Arg Asn Lys Gln Ser Glu Leu Val Asp Met Arg Glu Gln Ile Thr Val
435 440 445
Ser Xaa Xaa Leu Lys Ser Pro Xaa Ile Xaa Xaa Asn Asp Asn Ile Glu
450 455 460
Val Ala Xaa Gly Gly Ser Ser Xaa Val Asp Ile Xaa Glu Phe Ser Tyr
465 470 475 480
Ala Xaa Lys Arg Ser Val Ser Glu Asp Ser Ser Lys His Gly Asp Xaa
485 490 495
Arg Ile Asp Val Gly Ser Ser Gly Ser His Val Xaa Leu Glu Asp Asn
500 505 510
Ile Gly Gly Ser Asn Met Xaa Xaa Arg Val Ile Asn Asp Xaa Ser His
515 520 525
Ser Pro Gly Ala Asp Thr Asp Xaa Trp Xaa Asn Gly Asp Xaa Gly Asp
530 535 540
Asn Asp Gly Asp Xaa Ile Val Glu Xaa Glu His Glu Glu Ala Val Ala
545 550 555 560
Ser Ala Glu Pro Glu Leu Asn Val Ala Asp Ser Thr Leu Xaa Lys Ala
565 570 575
Asn Gly Xaa Thr Leu Asn Asp Asn Xaa His Pro Asp Xaa Asp Glu Thr
580 585 590
Asp Leu Asn Arg Asp Asn Val Ala Asn Asp Gly Asp Glu Thr Gln Val
595 600 605
Glu Asp Lys His Glu Glu Xaa Leu Ala Ser Glu Glu Pro Glu Leu Asn
610 615 620
Val Ala Asp Ser Thr Leu Glu Asn Xaa Ser Ser Ala Leu Asn Glu Asn
625 630 635 640
Ile Gln Ile Lys Ala Asn Ser Arg Pro Xaa Ile Arg Lys Arg Lys Ser
645 650 655
Xaa Glu Val Ser Xaa Arg Xaa Ser Leu Ala Gly Ala Gly Thr Thr Trp
660 665 670
Gln Ser Gly Val Arg Arg Ser Thr Arg Ile Lys Thr Arg Pro Leu Glu
675 680 685
Tyr Trp Lys Gly Glu Arg Leu Leu Tyr Gly Arg Ile His Asp Ser Leu
690 695 700
Xaa Thr Val Ile Gly Xaa Lys Tyr Ala Ser Pro Xaa Lys Gly Asp Asn
705 710 715 720
Gly Xaa Gly Pro Leu Lys Val Lys Ser Phe Val Ser Asp Glu Tyr Lys
725 730 735
Glu Leu Val Glu Leu Ala Ala Leu His
740 745

Claims (51)

1.包含一个或多个活性突变的植物来源的CENPC蛋白。
2.权利要求1的CENPC蛋白,其中所述一个或多个活性突变存在于包含SEQ ID NO:2、3、4或15-19中任一个的氨基酸序列的蛋白质中。
3.权利要求2的CENPC蛋白,其中在蛋白质中产生所述一个或多个活性突变,所述蛋白质包含SEQ ID NO:2、3、4或15-19中任一个或其变体的氨基酸序列,所述变体与SEQ ID NO:2、3、4或15-19中任一个的氨基酸序列具有至少70%,更优选至少80%,甚至更优选至少90%,甚至更优选至少95%,最优选至少98%或99%序列相同性。
4.前述权利要求中任一项的CENPC蛋白,其中所述一个或多个活性突变存在于SEQ IDNO:5或6中任一个所示的氨基酸序列所表示的双单倍体诱导结构域中。
5.前述权利要求中任一项的CENPC蛋白,其中所述一个或多个活性突变选自:在SEQ IDNO:3或4中任一个的氨基酸序列中,位置552和553的氨基酸残基之间的突变,位置554的氨基酸残基的突变,位置555的氨基酸残基的突变以及位置556的氨基酸残基的突变,或者它们的任何组合;或者在SEQ ID NO:2的氨基酸序列中,位置555和556的氨基酸残基之间的突变,位置557的氨基酸残基的突变,位置558的氨基酸残基的突变以及位置559的氨基酸残基的突变,或者它们的任何组合。
6.权利要求5的CENPC蛋白,其中在SEQ ID NO:3或4中任一个的氨基酸序列的位置554或者在SEQ ID NO:2的氨基酸序列中的位置557被突变的氨基酸是天冬氨酸和/或在SEQ IDNO:3或4中任一个的氨基酸序列的位置555或者在SEQ ID NO:2的氨基酸序列中的位置558被改变的氨基酸是天冬酰胺和/或在SEQ ID NO:3或4中任一个的氨基酸序列的位置556或者在SEQ ID NO:2的氨基酸序列中的位置559被改变的氨基酸是甲硫氨酸。
7.权利要求5或6中任一项的CENPC蛋白,其中在SEQ ID NO:3或4中任一个的氨基酸序列的位置554或者在SEQ ID NO:2的氨基酸序列中的位置557的氨基酸变为带正电荷的氨基酸残基,优选赖氨酸,和/或在SEQ ID NO:3或4中任一个的氨基酸序列的位置555或者在SEQID NO:2的氨基酸序列中的位置558的氨基酸变为酪氨酸,和/或在SEQ ID NO:3或4中任一个的氨基酸序列的位置556或者在SEQ ID NO:2的氨基酸序列中的位置557的氨基酸变为缬氨酸,和/或其中在SEQ ID NO:3或4中任一个的氨基酸序列的氨基酸残基552和553之间或者SEQ ID NO:2的氨基酸序列中氨基酸残基555和556之间插入带正电荷的残基,优选组氨酸。
8.权利要求5-7中任一项的CENPC蛋白,其中在SEQ ID NO:3或4中任一个的氨基酸序列的氨基酸残基552和553之间或者SEQ ID NO:2的氨基酸序列中氨基酸残基555和556之间插入组氨酸,和/或在SEQ ID NO:3或4中任一个的氨基酸序列的位置554或者在SEQ ID NO:2的氨基酸序列中的位置557的天冬氨酸变为赖氨酸,和/或在SEQ ID NO:3或4中任一个的氨基酸序列的位置555或者在SEQ ID NO:2的氨基酸序列中的位置558的天冬酰胺变为酪氨酸。
9.权利要求8的CENPC蛋白,其包含SEQ ID NO:8的氨基酸序列。
10.权利要求9的CENPC蛋白,其由包含SEQ ID NO:7或12中任一个的核酸序列的多核苷酸编码。
11.权利要求7的CENPC蛋白,其包含SEQ ID NO:10的氨基酸序列。
12.权利要求11的CENPC蛋白,其由包含SEQ ID NO:9或13中任一个的核酸序列的多核苷酸编码。
13.前述权利要求中任一项的CENPC蛋白,其由具有活性突变的CENPC蛋白编码多核苷酸编码,当存在于没有其内源性CENPC蛋白编码多核苷酸和/或内源性CENPC蛋白的植物中时,其允许所述植物存活,并且当所述植物与野生型植物杂交时,允许产生一些单倍体子代,或者具有异常倍性的子代。
14.权利要求13的CENPC蛋白,其中所产生的子代的至少0.1、0.5、1或5%是单倍体或具有异常倍性。
15.前述权利要求中任一项的CENPC蛋白,其衍生自内源性CENPC蛋白,所述衍生通过利用靶向性核苷酸交换或应用内切核酸酶在编码所述内源性CENPC蛋白的多核苷酸中引入突变进行。
16.权利要求1的CENPC蛋白,其中所述一个或多个活性突变不存在于包含SEQ ID NO:1中示出的氨基酸序列的蛋白质结构域中。
17.编码前述权利要求中任一项的CENPC蛋白的多核苷酸。
18.包含SEQ ID NO:11或14中任一个或其变体的核酸序列的多核苷酸,所述变体与SEQID NO:11或14中任一个的氨基酸序列具有至少70%,更优选至少80%,甚至更优选至少90%,甚至更优选至少95%,最优选至少98%或99%序列相同性,但是其中在SEQ ID NO:11的核酸序列的位置2449-2450和/或2454-2462或者在SEQ ID NO:14的位置1660-1668的一个或多个核苷酸经修饰,从而所述核酸编码CENPC蛋白,其中SEQ ID NO:3的氨基酸序列在位置554和/或在位置555和/或在位置556具有改变的残基,和/或在SEQ ID NO:3的氨基酸序列的氨基酸残基552和553之间具有氨基酸残基如组氨酸的插入。
19.包含SEQ ID NO:7或12中任一个的核酸序列的多核苷酸。
20.包含SEQ ID NO:9或13中任一个的核酸序列的多核苷酸。
21.权利要求17-20中任一项的多核苷酸,其是分离的。
22.包含权利要求17-21中任一项的多核苷酸的嵌合基因。
23.包含权利要求17-21中任一项的多核苷酸或权利要求22的嵌合基因的载体。
24.包含权利要求17-21中任一项的多核苷酸、权利要求22的嵌合基因或权利要求23的载体的宿主细胞。
25.权利要求24的宿主细胞,其是植物细胞,优选番茄植物细胞。
26.包含权利要求17-21中任一项的多核苷酸、权利要求22的嵌合基因或权利要求23的载体的植物。
27.权利要求26的植物,其中内源性CENPC蛋白不表达。
28.权利要求26或27中任一项的植物,其是茄属植物,优选番茄(Solanumlycopersicum)植物。
29.制备权利要求26-28中任一项的植物的方法,所述方法包括以下步骤:
d)修饰植物细胞内的内源性植物CENPC蛋白编码多核苷酸以获得具有活性突变的植物CENPC蛋白编码多核苷酸;
e)选择包含具有活性突变的植物CENPC蛋白编码多核苷酸的植物细胞;以及
f)任选地,从所述植物细胞再生植物。
30.制备权利要求26-28中任一项的植物的方法,所述方法包括以下步骤:
d)用权利要求17-21中任一项的多核苷酸、权利要求22的嵌合基因或权利要求23的载体转化植物细胞;
e)选择包含所述多核苷酸、嵌合基因或载体的植物细胞;以及
f)任选地,从所述植物细胞再生植物。
31.权利要求29或30中任一项的方法,所述方法进一步包括以下步骤:
修饰所述植物细胞以防止内源性CENPC蛋白表达。
32.权利要求31的方法,其中修饰所述植物细胞内的内源性植物CENPC蛋白编码多核苷酸以防止内源性CENPC蛋白表达。
33.产生单倍体植物或具有异常倍性的植物的方法,所述方法包括以下步骤:
e)将表达内源性植物CENPC蛋白的植物与权利要求26-28中任一项的植物杂交,其中权利要求26-28中任一项的植物至少在其生殖部分和/或在胚发育期间不表达内源性CENPC蛋白;
f)收获种子;
g)从所述种子种植至少一个幼苗、小植物或植物;以及
h)选择单倍体幼苗、小植物或植物,具有异常倍性的幼苗、小植物或植物,或者双单倍体幼苗、小植物或植物。
34.一种产生双单倍体植物的方法,所述方法包括以下步骤:
将权利要求33的步骤d)中获得的单倍体植物转化为双单倍体植物。
35.权利要求34的方法,其中所述转化通过用秋水仙碱处理进行。
36.权利要求33-35中任一项的方法,其中所述表达内源性植物CENPC蛋白的植物是F1植物。
37.权利要求33-36中任一项的方法,其中表达内源性CENPC蛋白的植物是杂交的花粉亲本。
38.权利要求33-36中任一项的方法,其中表达内源性植物CENPC蛋白的植物是杂交的胚珠亲本。
39.权利要求33-38中任一项的方法,其中所述杂交在约24℃-约30℃的温度范围内进行。
40.权利要求33-39中任一项的方法,其不包括有性杂交所述植物的整个基因组。
41.权利要求17-21中任一项的多核苷酸在制备单倍体诱导系中的用途。
42.包含权利要求17-21中任一项的多核苷酸、权利要求22的嵌合基因或权利要求23的载体的番茄植物。
43.包含多核苷酸的番茄植物,所述多核苷酸编码包含SEQ ID NO:8或10中任一个的氨基酸序列的蛋白。
44.包含多核苷酸的番茄植物,所述多核苷酸包含SEQ ID NO:7、12、9或13中任一个的核酸序列。
45.包含编码权利要求1-16中任一项的CENPC蛋白的多核苷酸的番茄植物。
46.在包含SEQ ID NO:4的氨基酸序列的多肽中包含一个或多个活性突变的番茄植物。
47.权利要求42-46中任一项的番茄植物用于制备单倍体番茄植物的用途。
48.权利要求42-46中任一项的番茄植物用于制备双单倍体番茄植物的用途。
49.权利要求47-48中任一项的用途,其中权利要求42-46中任一项的番茄植物至少在其生殖部分和/或在胚发育期间不表达内源性CENPC蛋白。
50.一种产生单倍体或双单倍体植物的方法,所述方法包括鉴定表达内源性CENPC蛋白的植物和权利要求26-28中任一项的植物,其中权利要求26-28中任一项的植物不表达内源性CENPC蛋白。
51.权利要求50的方法,其不包括有性杂交所述植物的整个基因组。
CN201680070035.XA 2015-10-02 2016-10-03 制备单倍体和随后的双单倍体植物的方法 Pending CN108290934A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
NL2015552 2015-10-02
NL2015552 2015-10-02
PCT/NL2016/050682 WO2017058022A1 (en) 2015-10-02 2016-10-03 Method for the production of haploid and subsequent doubled haploid plants

Publications (1)

Publication Number Publication Date
CN108290934A true CN108290934A (zh) 2018-07-17

Family

ID=55178277

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201680070035.XA Pending CN108290934A (zh) 2015-10-02 2016-10-03 制备单倍体和随后的双单倍体植物的方法

Country Status (10)

Country Link
US (1) US11279947B2 (zh)
EP (1) EP3356392A1 (zh)
JP (2) JP2018529348A (zh)
CN (1) CN108290934A (zh)
AU (2) AU2016331020B2 (zh)
BR (1) BR112018006569A2 (zh)
CA (1) CA3000131A1 (zh)
IL (1) IL258473A (zh)
MX (1) MX2018003978A (zh)
WO (1) WO2017058022A1 (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BR112019004850A2 (pt) 2016-09-14 2019-06-11 Monsanto Technology Llc métodos e composições para edição de genoma por meio de indução de haploides
CN113631715A (zh) * 2018-10-12 2021-11-09 先正达农作物保护股份公司 新的小麦cenh3等位基因
EP3689135A1 (en) * 2019-01-30 2020-08-05 KWS SAAT SE & Co. KGaA Haploid inducers
JP2023527446A (ja) 2020-05-29 2023-06-28 カー・ヴェー・エス ザート エス・エー ウント コー. カー・ゲー・アー・アー 植物単数体の誘導

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102459615A (zh) * 2009-06-08 2012-05-16 纽海姆有限公司 耐旱植物
US20140090099A1 (en) * 2009-10-06 2014-03-27 The Regents Of The University Of California Generation of haploid plants and improved plant breeding
WO2014110274A2 (en) * 2013-01-09 2014-07-17 Regents Of The University Of California A California Corporation Generation of haploid plants

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US543949A (en) * 1895-08-06 Portable shelf
ATE52800T1 (de) 1983-01-13 1990-06-15 Max Planck Gesellschaft Verfahren zum einbringen von expressionsfaehigen genen in pflanzenzellgenome und hybride ti plasmidvektoren enthaltende agrobacterium-staemme verwendbar in diesem verfahren.
WO1984002913A1 (en) 1983-01-17 1984-08-02 Monsanto Co Chimeric genes suitable for expression in plant cells
EP0120561B1 (en) 1983-01-27 1987-07-22 General Foods Corporation Water-agglomeration method for depeptide sweetened products
NL8300699A (nl) 1983-02-24 1984-09-17 Univ Leiden Werkwijze voor het inbouwen van vreemd dna in het genoom van tweezaadlobbige planten; werkwijze voor het produceren van agrobacterium tumefaciens bacterien; stabiele cointegraat plasmiden; planten en plantecellen met gewijzigde genetische eigenschappen; werkwijze voor het bereiden van chemische en/of farmaceutische produkten.
ES2018274T5 (es) 1986-03-11 1996-12-16 Plant Genetic Systems Nv Celulas vegetales resistentes a los inhibidores de glutamina sintetasa, preparadas por ingenieria genetica.
EP0265556A1 (en) 1986-10-31 1988-05-04 Max-Planck-Gesellschaft zur Förderung der Wissenschaften e.V. Stable binary agrobacterium vectors and their use
US5693507A (en) 1988-09-26 1997-12-02 Auburn University Genetic engineering of plant chloroplasts
ATE453728T1 (de) 2005-09-29 2010-01-15 Keygene Nv Screening mutagenisierter populationen mit hohem durchsatz
CN101801176A (zh) 2007-09-24 2010-08-11 凯津公司 选择具有特异性突变的植物的方法
EP2574234A1 (en) * 2011-09-29 2013-04-03 Rijk Zwaan Zaadteelt en Zaadhandel B.V. Quartet breeding

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102459615A (zh) * 2009-06-08 2012-05-16 纽海姆有限公司 耐旱植物
US20140090099A1 (en) * 2009-10-06 2014-03-27 The Regents Of The University Of California Generation of haploid plants and improved plant breeding
WO2014110274A2 (en) * 2013-01-09 2014-07-17 Regents Of The University Of California A California Corporation Generation of haploid plants

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
无: "登录号XP_010318558.1", 《NCBI_GENBANK》 *

Also Published As

Publication number Publication date
MX2018003978A (es) 2018-08-15
EP3356392A1 (en) 2018-08-08
AU2021206832A1 (en) 2021-08-12
CA3000131A1 (en) 2017-04-06
IL258473A (en) 2018-05-31
AU2016331020B2 (en) 2021-04-29
BR112018006569A2 (pt) 2018-12-11
AU2021206832B2 (en) 2024-01-18
JP2018529348A (ja) 2018-10-11
WO2017058022A1 (en) 2017-04-06
US11279947B2 (en) 2022-03-22
AU2016331020A1 (en) 2018-04-19
US20190078117A1 (en) 2019-03-14
JP2022028656A (ja) 2022-02-16

Similar Documents

Publication Publication Date Title
AU2011336603B2 (en) Synthetic clonal reproduction through seeds
US9745596B2 (en) Identification and use of KRP mutants in wheat
US20220186238A1 (en) Diplospory gene
AU2021206832B2 (en) Method for the production of haploid and subsequent doubled haploid plants
CN108368518B (zh) 制备单倍体和随后的双单倍体植物的方法
US20090031444A1 (en) Homologous recombination in plants
WO2023065966A1 (zh) Bfne基因在番茄株型改良和生物产量提高中的应用
WO2015185514A1 (en) A dominant mutation in the tdm gene leading to diplogametes production in plants
CN105949291B (zh) 水稻mis1蛋白及其编码基因与应用
US20190225657A1 (en) Method for the production of haploid and subsequent doubled haploid plants
EP4082332A1 (en) Solanaceous plant and solanaceous plant cell having resistance to tomato spotted wilt virus, and method for producing solanaceous plant
CN106318923A (zh) 一种高温逆境下调控叶绿体发育的蛋白质及其基因和应用
EP3689135A1 (en) Haploid inducers
EP4234700A2 (en) Compositions and methods comprising plants with modified anthocyanin content
CN112695041B (zh) ZmSBP28基因在调控玉米株型中的用途
WO2011107537A1 (en) New plants with modified expression or activity of ethylene response factors
CN114644692A (zh) 一种定点突变创制旱敏感玉米种质的方法及其应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination