CN101258246A - Ste20样基因表达对植物产率的提高 - Google Patents

Ste20样基因表达对植物产率的提高 Download PDF

Info

Publication number
CN101258246A
CN101258246A CNA2006800323571A CN200680032357A CN101258246A CN 101258246 A CN101258246 A CN 101258246A CN A2006800323571 A CNA2006800323571 A CN A2006800323571A CN 200680032357 A CN200680032357 A CN 200680032357A CN 101258246 A CN101258246 A CN 101258246A
Authority
CN
China
Prior art keywords
ser
leu
glu
lys
ala
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2006800323571A
Other languages
English (en)
Other versions
CN101258246B (zh
Inventor
C·勒佐
A·I·桑兹莫林纳罗
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CropDesign NV
Original Assignee
CropDesign NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CropDesign NV filed Critical CropDesign NV
Publication of CN101258246A publication Critical patent/CN101258246A/zh
Application granted granted Critical
Publication of CN101258246B publication Critical patent/CN101258246B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1205Phosphotransferases with an alcohol group as acceptor (2.7.1), e.g. protein kinases
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A40/00Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
    • Y02A40/10Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture
    • Y02A40/146Genetically Modified [GMO] plants, e.g. transgenic plants

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Cell Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Agricultural Chemicals And Associated Chemicals (AREA)

Abstract

本发明涉及通过调节植物中Ste20样多肽或其同源物编码核酸的表达来增加植物产率的方法。一类这样的方法包括向植物中引入Ste20样核酸分子或其变体。本发明还涉及引入了Ste20样核酸分子或其变体的转基因植物,所述植物相对于对照植物具有增加的产率。本发明也涉及在本发明方法中有用的构建体。

Description

Ste20样基因表达对植物产率的提高
发明领域
本发明一般地涉及分子生物学领域,并涉及相对于对照植物增加植物产率的方法。更具体地,本发明涉及增加植物产率的方法,包括调节植物中Ste20样多肽或其同源物编码核酸的表达。本发明还涉及具有调节的Ste20样多肽或其同源物编码核酸表达的植物,所述植物相对于对照植物具有增加的产率。本发明还提供在发明方法中有用的构建体。
发明背景
鉴于世界人口不断增长而农业可耕种土地面积逐渐缩小,激起提高农业效率方面的研究。作物和园艺改良的常规方法是利用选育技术来鉴定具有期望特性的植物。然而,这样的选育技术有几个缺点,即这些技术通常是劳动密集型的,并且产生通常含有异源遗传组分的植物,这些遗传组分并非总是产生从亲本植物遗传的期望性状。分子生物学的进展已经允许人类改造动物和植物的种质(germplasm)。植物遗传工程需要分离和操作遗传物质(通常为DNA或RNA的形式)及随后将所述遗传物质引入植物。这样的技术能够提供具有多种改良的经济、农业或园艺性状的作物或植物。具有特别经济利益的性状是产率,其必然是与指定作物、面积以及时期相关的。产率通常被定义为来自作物经济价值的可测量产出。其可以根据数量和/或质量来定义。产率直接依赖于几种因素,例如:器官的数量和大小,植物构造(例如分枝数),种子产量等等。根的发育,营养吸收和胁迫耐受性也是决定产率的重要因素。因此优化上述因素之一可以有助于增加作物的产率。
植物生物量为饲料作物如苜蓿、青贮谷物和干草的产率。在谷物作物中使用产率的许多替代参数(proxy)。其中首要的是估算植物大小。根据物种以及发育阶段的不同,可以通过许多方法测量植物大小,但是包括植物总干重、地上干重、地上鲜重、叶面积、茎体积、植物高度、莲座植物(rosette)直径、叶长、根长、根生物量、分蘖数和叶数。许多物种在给定的发育阶段维持植物不同部分大小间的保守比。利用这些异速生长关系而对这些有关大小的测量结果进行由此及彼的外推(如Tittonell等2005 Agric Ecosys& Environ 105:213)。早期发育阶段的植物大小通常将与晚期发育阶段的植物大小有关。具有更大叶面积的较大植物通常能够比较小的植物吸收更多的光和二氧化碳,因此很可能在同期增重更多(Fasoula & Tollenaar 2005Maydica 50:39)。除了植物所具有的最初达到较大大小的微环境或遗传优势的潜在延续,此为其附加效应。植物大小和生长速率存在着强遗传组件(如ter Steege等2005 Plant Physiology 139:1078),且迄今为止,种种多样化基因型植物在一种环境条件下的大小很可能与另一种环境条件下的大小有关(Hittalmani等2003 Theoretical Applied Genetics 107:679)。以这种方式,使用标准环境作为田地中作物在不同时间和地点所遭遇的多样化动态环境的替代参数。
收获指数为种子产率与地上干重的比值,其在许多环境条件下相对稳定,因此在植物大小和谷物产率之间通常能够获得比较稳固的相关性(如Rebetzke等2002 Crop Science 42:739)。这些方法固有地联系在一起,因为大多数谷物生物量取决于植物叶和茎当前或贮存的光合作用生产力(Gardener等1985 Physiology of Crop Plants.Iowa State University Press,68-73页)。因此,对植物大小的选择,甚至是在发育早期阶段的选择,已经用作为未来潜在产率的指标(如Tittonell等2005 Agric Ecosys &Environ 105:213)。当测试遗传差异对胁迫耐受性的影响时,温室或植物培养室与田地相比具有固有的优势:即能够使土壤性能、温度、水和营养的可用性以及光强度标准化。不过,因缺乏风力或昆虫导致不良授粉,或由于空间不足以让成熟根或冠层生长等等,对产率造成的这些人工局限性会限制这些控制环境在测试产率差异中的应用。因此,在培养室或温室标准条件下测量早期发育阶段的植物大小,是提供潜在遗传产率优势指标的标准方法。
种子产率是尤其重要的性状,原因在于许多植物的种子对于人类和动物营养至关重要。诸如谷物、稻类、小麦、芸苔和大豆的作物占人类总卡路里摄取量的一半以上,不论是通过种子本身的直接消耗,还是通过由加工的种子所饲养的肉类产品的消耗。它们也是工业加工所用的糖类、油类和多类代谢物的来源。种子含有胚(新的芽和根的来源)和胚乳(在萌发和幼苗早期生长过程中胚生长的营养源)。种子的发育涉及许多基因,并且需要代谢物自根、叶和茎转移至正在生长的种子。特别是胚乳,吸收糖类、油类和蛋白质的代谢前体,将其合成为贮存高分子,以使谷粒长大。增加植物种子产率的能力,无论是增加种子数量、种子生物量、种子发育、种子饱满性状或任何其他种子相关性状,将在农业中具有许多应用,而且甚至具有许多非农业用途,例如诸如药物、抗体或疫苗等物质的生物技术生产。
Ste20是属于MAP4激酶群(MAP4K,MAP激酶激酶激酶激酶或MAP3K激酶)的Ser/Thr激酶,并且首次是从酵母中分离的。MAP4K为通过直接磷酸化MAP3K而激活MAP激酶级联反应的激酶。最近的系统发生研究鉴别了6大MAP4K群,其中有STE20/PAK群的MAP4K(Champion等,Trends Plant Sci.9,123-129,2004)。大多数MAP4K具有N-末端催化结构域,虽然Ste20的植物蛋白质同源物可能具有不同的构成。Ste20群激酶的成员据信起MAP激酶级联反应调节物的作用(Dan等,Trends Cell Biol.11,220-230,2001),并且据信特别作用于G蛋白下游的MEKK和Raf型的MAP3激酶(Champion等,2004)。酵母Ste20在多种信号传导通路中起作用,例如,表明假丝酵母(Candida)Ste20参与信息素信号传导、入侵生长(invasivegrowth)、高渗胁迫应答、细胞壁完整性以及CDC42的结合,这是极化形态发生(polarized morphogenesis)所必需的(Calcagno等,Yeast 21,557-568,2004)。在果蝇(Drosophila)中,Ste20同源物Hippo据报道参与细胞周期进程(Udan等,Nat.Cell Biol.5,853-855,2003)。总而言之,STE20/PAK指导的信号传导效应在一方面似乎为影响基因表达的细胞核事件,同时又是影响细胞动力学的细胞骨架事件(Bagrodia和Cerione,Trends Cell Biol.9,350-355,1999)。尽管Ste20和相关蛋白质在酵母、果蝇和哺乳动物细胞中进行了相对充分的研究,但是对于酵母Ste20的植物同源物知之甚少或者说一无所知。Leprince等(Biochim.Biophys.Acta 1444,1-13,1999)表征了来自欧洲油菜(Brassica napus)的MAP4K。其表达似乎受细胞周期调控,且转录物据报道在根、长角果和花芽中最为丰富。不过,未描述突变体或转基因植物。
现已惊奇地发现,与对照植物相比,调节植物中Ste20样多肽或其同源物编码核酸的表达,使植物具有增加的产率。优选Ste20样多肽或其同源物为植物来源的。
发明内容
因此本发明提供了增加植物产率的方法,包括调节植物中Ste20样多肽或其同源物编码核酸的表达。
有利地,实施根据本发明的方法产生相对于对照植物产率增加、特别是种子产率增加的植物。
选择对照植物是实验设置的常规部分,并且包括相应的野生型植物或不含目的基因的相应植物。对照植物通常为相同的植物物种,或者甚至与待比较植物为同一品种。对照植物还可以是待比较植物的无效合子(nullizygote)。无效合子是因分离而丢失转基因的个体。如本文所用的“对照植物”不仅指完整植物,而且指植物部分,包括种子和种子部分。
“参照”、“参照植物”、“对照”、“对照植物”、“野生型”或“野生型植物”尤其是细胞、组织、器官、植物或其部分,它们未按照本发明的方法生产。从而,术语“野生型”、“对照”或“参照”可互换,并且可以是细胞或植物的部分,如细胞器、组织或植物,它们未按照文中所述的本发明方法修饰或处理。从而,用作为野生型、对照或参照的细胞或植物部分如细胞器或植物,尽可能地对应于本发明的细胞、植物或其部分,而且除了本发明方法所致结果以外的任何其他特性都与本发明的主题对象(subject)尽可能地相同。因而,对野生型、对照或参照进行相同的处理,或者尽可能地进行相同处理,即条件或特性仅仅是可能有差异,但并不影响所测特性的品质。换言之,这意味着野生型代表(1)携带不变或非调节形式的基因或等位基因的植物,或者(2)由之获得本发明方法生产的植物的起始材料/植物。
优选在类似条件下对野生型植物和本发明方法生产的植物进行任何比较。术语“类似条件”是指在待比较的实验之间,所有的条件都保持相同:例如培养或生长条件、测定条件(如缓冲液组成、温度、底物、病原株、浓度等等)。
术语“参照”、“对照”或“野生型”优选为比较对象,如细胞器、细胞、组织、植物,其未按照本发明方法调节、修饰或处理,并且任何其他特性都与本发明的主题对象尽可能地相似。参照、对照或野生型在其基因组、转录物组(transcriptome)、蛋白质组或代谢物组(metabolome)方面与本发明的主题对象尽可能地相似。优选术语“参照-”、“对照-”或“野生型-”-细胞器、-细胞、-组织或-植物与细胞器、细胞、组织或植物相关,与本发明的细胞器、细胞、组织或植物、或其部分在遗传上几乎相同,优选95%,更优选98%,甚至更优选99,00%,特别是99,10%,99,30%,99,50%,99,70%,99,90%,99,99%,99,999%或更高。最优选“参照”、“对照”或“野生型”为比较对象,如细胞器、细胞、组织、植物,其与本发明方法的植物、细胞器在遗传上相同,根据本发明方法核酸分子或由其编码的基因产物经改变、调节或修饰除外。
在不能提供与本发明主题对象的差异仅在于不是本发明主题对象的对照、参照或野生型的情况下,对照、参照或野生型可以是这样的植物,其中导致代谢物增加的活性调节原因如实施例中所述。
术语“产率”通常定义为具有经济价值的可测量产出,其必然是与指定作物、面积以及时期相关的。植物各部分基于其数量、大小和/或重量对产率直接做出贡献。而真正的产率是作物年亩产率,用总产量(既包括收获产量也包括评估产量)除以种植的英亩数予以确定。
术语“增加”、“改进”或“提高”可互换,且在本发明意义上应理解为与文中所定义的野生型植物相比,产率和/或生长多出至少5%、6%、7%、8%、9%或10%,优选至少15%或20%,更优选25%、30%、35%或40%。
与对照、参照或野生型相比,就多肽活性而言的增加在细胞、组织、细胞器、器官或生物或其部分中优选多出至少达5%,优选至少10%或至少15%,特别优选至少20%、25%、30%或以上,极其优选至少40%、50%或60%,最优选至少70%或以上。
文中所定义的术语“增加的产率”是指植物一个或多个部分增加的生物量(重量),可以包括地上(可收获)部分和/或地下(可收获)部分;
特别地,这样的可收获部分为种子和叶生物量,并且实施本发明的方法导致植物具有增加的叶生物量和相对于对照植物种子产率而言增加的种子产率。
增加的种子产率可表现为如下一项或多项:a)种子生物量(种子总重量)的增加,其可以是单粒种子基础和/或每棵植株和/或每公顷或英亩的增加;b)每棵植株增加的花数;c)增加的(饱满)种子数量;d)增加的种子饱满率(其表达为饱满种子数除以种子总数的比率);e)增加的收获指数,其表达为可收获部分如种子的产率除以总生物量的比率;和f)增加的千粒重(TKW),这通过计数饱满种子数量及其总重量,进行外推得到。TKW增加可源于种子大小和/或种子重量的增加,并且也可源于胚和/或胚乳大小的增加。
术语“表达”或“基因表达”指由于一种或多种特定基因的转录而出现的表型性状。术语“表达”或“基因表达”特别指一种或多种基因转录为结构RNA(rRNA、tRNA)或mRNA,随后翻译为蛋白质。该过程包括DNA的转录、所产生mRNA产物的加工,以及其翻译为活性蛋白质。
就表达或基因表达而言的术语“调节”指与对照植物相比,因所述基因表达而改变表达水平的过程,优选表达水平增加。原始未调节的表达可以是随后翻译的结构RNA(rRNA、tRNA)或mRNA的任何类型的表达。术语“调节...活性”应理解为本发明核酸序列或编码蛋白质的任何表达改变,导致植物产率增加和/或生长增加。
种子产率增加也可以表现为种子大小和/或种子体积的增加,这也可以影响种子的组成(包括油类、蛋白质和糖类的总含量和组成)。此外,种子产率增加也可以表现为种子面积和/或种子宽度和/或种子周长的增加。增加的产率也可以导致改良的构造,或者由于改良的构造而发生。
以谷物为例,产率增加可以表现为下列一种或多种情况:每公顷或每英亩植物数量的增加、每棵植株谷穗数量的增加、行数、行粒数、粒重量、千粒重、谷穗长度/直径的增加、种子饱满率(其为饱满种子数除以种子总数乘以100)的增加,等等。以稻为例,产率增加可以表现为下列一种或多种情况:每公顷或每英亩的植物数量、每棵植株的圆锥花序数量、每个圆锥花序的小穗数量、每个圆锥花序的花朵(小花)数量(其表达为饱满种子数与初级圆锥花序的比率)、种子饱满率(其为饱满种子数除以种子总数乘以100)的增加、千粒重的增加,等等。产率的增加也可以导致改良的构造,或可以作为改良的构造的结果而发生。
根据优选的方面,实施本发明的方法产生产率、特别是种子产率增加的植物。因此根据本发明,提供了增加植物产率的方法,所述方法包括调制植物中Ste20样多肽或其同源物编码核酸的表达。
由于本发明的转基因植物具有增加的产率,相对于相应野生型植物在其生命周期相应阶段的生长速率而言,这些植物可能呈现增加的生长速率(至少在其部分生命周期中)。增加的生长速率可以是对植物的一个或多个部分(包括种子)特异性的,或者可以基本上遍及整株植物。具有增加生长速率的植物可以具有更短的生命周期。植物的生命周期可以理解为表示从成熟干种子生长至植物产生类似于起始材料的成熟干种子阶段所需的时间。此生命周期可以受到诸如早期活力、生长速率、开花时间和种子成熟速度等因素的影响。生长速率的增加可以出现在植物生命周期的一个或多个阶段,或者出现在基本上整个植物生命周期的过程中。在植物生命周期的早期阶段,生长速率的增加可以反映出增强的活力。生长速率的增加可以改变植物的收获周期,使植物能够比其他可能的情况更晚播种和/或更快收获(类似的效果可以通过较早的开花时间获得)。如果生长速率充分增加,可以允许播种同种植物物种更多的种子(例如完全在一个常规的生长期内,播种和收获稻植物、接着播种和收获更多的稻植物)。与之类似,如果生长速率充分地增加,可能允许播种不同植物物种更多的种子(例如播种和收获稻植物,随后,例如,播种和任选的收获大豆、马铃薯或任何其他植物)。在一些作物植物的情况下,也有可能从同一根茎收获增加的次数。改变植物的收获周期可以导致每英亩年生物量产量的增加(这是由于(比方说在一年中)任何特定植物可以生长和收获次数的增加)。与野生型对应物相比,生长速率的增加还能够在更广阔的地域栽培转基因植物,因为种植农作物的地域限制通常由种植时(早季)或收获时(晚季)不利的环境条件所决定。如果缩短收获周期,可以避免这类不利条件。可以由生长曲线获取多种参数,来确定生长速率,这类参数可以是:T-Mid(植物达到其最大大小的50%所需时间)和T-90(植物达到其最大大小90%所需时间)等等。
根据本发明优选的方面,实施本发明的方法产生与对照植物相比具有增加的生长速率或增加的产率的植物。因此,本发明提供了增加植物产率和/或生长速率的方法,所述方法包括调节、优选增加植物中Ste20样蛋白质编码核酸的表达。
无论植物处于非胁迫条件下,还是植物相对于对照植物接触多种胁迫,都发生产率和/或生长速率的增加。通常植物通过更加缓慢的生长来应答胁迫接触。在重度胁迫条件下,植物甚至可以完全停止生长。另一方面,轻度胁迫在文中定义为当植物接触时不导致植物完全停止生长丧失重新开始生长能力的任何胁迫。本发明意义上的轻度胁迫导致胁迫植物的生长与非胁迫条件下的对照植物相比,下降不到40%、35%或30%,优选不到25%、20%或15%,更优选不到14%、13%、12%、11%或10%或更低。由于耕作方法(灌溉、施肥、杀虫剂处理)的发展,栽培的作物植物常常不会遇到重度胁迫。因此,由轻度胁迫诱导的受损的生长通常成为农业中不期望的因素。轻度胁迫可以是植物接触的日常的生物和/或非生物(环境)胁迫。典型的非生物或环境胁迫包括由反常的热或冷/冰冻温度产生的温度胁迫;盐胁迫;水胁迫(干旱或过量的水)。化学物质也可以引起非生物胁迫。生物胁迫一般是由病原如细菌、病毒、真菌和昆虫引起的那些胁迫。根据本发明另一优选的实施方案,根据本发明的方法在非胁迫或者轻度非生物或生物胁迫条件、优选非胁迫条件或轻度非生物胁迫条件下发生产率和/或生长速率的增加。
有利地,可以在任何植物中改良上述生长特征。
本文所用术语“植物”包括整株植物、植物的祖先和后代以及植物部分,包括种子、枝条、茎、叶、根(包括块茎)、花以及组织和器官,其中上述每一种都包含目的基因/核酸。术语“植物”也包含悬浮培养物、愈伤组织、胚、分生组织区、配子体、孢子体、花粉和小孢子,同样其中上述每一种都包含目的基因/核酸。
在本发明方法中尤其有用的植物包括所有属于植物界(Viridiplantae)超家族的植物,特别是单子叶和双子叶植物,包括选自下列清单的饲料或饲料豆科植物、观赏植物、粮食作物、乔木或灌木:槭树属物种(Acer spp.)、猕猴桃属物种(Actinidia spp.)、秋葵属物种(Abelmoschus spp.)、冰草属物种(Agropyron spp.)、葱芹属物种(Allium spp.)、苋属物种(Amaranthus spp.)、凤梨(Ananas comosus)、番荔枝属物种(Annona spp.)、芹菜(Apiumgraveolens)、拟南芥(Arabidopsis thaliana)、落花生属物种(Arachis spp.)、木波罗属物种(Artocarpus spp.)、石刁柏(Asparagus officinalis)、燕麦(Avenasativa)、阳桃(Averrhoa carambola)、冬瓜(Benincasa hispida)、巴西栗(Bertholletia excelsea)、甜菜(Beta vulgaris)、芸苔属物种(Brassica spp.)、Cadaba farinosa、大叶茶(Camellia sinensis)、美人蕉(Canna indica)、辣椒属物种(Capsicum spp.)、苔草(Carex elata)、番木瓜(Carica papaya)、大果假虎刺(Carissa macrocarpa)、山核桃属物种(Carya spp.)、红花(Carthamustinctorius)、栗属物种(Castanea spp.)、苦苣(Cichorium endivia)、樟属物种(Cinnamomum spp.)、西瓜(Citrullus lanatus)、柑橘属物种(Citrus spp.)、椰子属物种(Cocos spp.)、咖啡属物种(Coffea spp.)、芋(Colocasia esculenta)、可拉属(Cola spp.)、芫荽(Coriandrum sativum)、榛属物种(Corylus spp.)、山楂属物种(Crataegus spp.)、番红花(Crocus sativus)、南瓜属物种(Cucurbitaspp.)、香瓜属物种(Cucumis spp.)、菜蓟属物种(Cynara spp.)、胡萝卜(Daucus carota)、山马蟥属物种(Desmodium spp.)、龙眼(Dimocarpuslongan)、薯蓣属物种(Dioscorea spp.)、柿树属物种(Diospyros spp.)、稗属物种(Echinochloa spp.)、穇子(Eleusine coracana)、枇杷(Eriobotryajaponica)、红仔果(Eugenia unifiora)、荞麦属物种(Fagopyrum spp.)、山毛榉属物种(Fagus spp.)、无花果(Ficus carica)、金桔属物种(Fortunellaspp.)、草莓属物种(Fragaria spp.)、银杏(Ginkgo biloba)、大豆属物种(Glycine spp.)、陆地棉(Gossypium hirsutum)、向日葵属物种(Helianthusspp.)、萱草(Hemerocallis fulva)、木槿属物种(Hibiscus spp.)、大麦属物种(Hordeum spp.)、甘薯(Ipomoea batatas)、核桃属物种(Juglans spp.)、莴苣(Lactuca sativa)、山黧豆属物种(Lathyrus spp.)、兵豆(Lens culinaris)、亚麻(Linum usitatissimum)、荔枝(Litchi chinensis)、百脉根属物种(Lotusspp.)、棱角丝瓜(Luffa acutangula)、羽扇豆属物种(Lupinus spp.)、地杨梅(Luzula sylvatica)、硬皮豆属物种(Macrotyloma spp.)、苹果属物种(Malusspp.)、西印度樱桃(Malpighia emarginata)、曼密苹果(Mammeaamericana)、芒果(Mangifera indica)、木薯属物种(Manihot spp.)、人心果(Manilkara zapota)、紫苜蓿(Medicago sativa)、草木樨属物种(Melilotusspp.)、薄荷属物种(Mentha spp.)、苦瓜属物种(Momordica spp.)、黑桑(Morusnigra)、芭蕉属物种(Musa spp.)、烟草属物种(Nicotianum spp.)、木犀榄属物种(Olea spp.)、仙人掌属物种(Opuntia spp.)、Ornithopus spp.、稻属物种(Oryza spp.)、黍属物种(Panicum sp)、鸡蛋果(Passiflora edulis)、欧防风(Pastinaca sativa)、鳄梨属物种(Persea spp.)、香芹(Petroselinum crispum)、菜豆属物种(Phaseolus spp.)、刺葵属物种(Phoenix spp.)、酸浆属物种(Physalis spp.)、松属物种(Pinus spp.)、阿月浑子(Pistacia vera)、豌豆属物种(Pisum spp.)、早熟禾属物种(Poa spp.)、杨属物种(Populus spp.)、牧豆树属物种(Prosopis spp.)、李属物种(Prunus spp.)、番石榴属物种(Psidiumspp.)、石榴(Punica granatum)、西洋梨(Pyrus communis)、栎属物种(Quercusspp.)、萝卜(Raphanus sativus)、波叶大黄(Rheum rhabarbarum)、茶藨子属物种(Ribes spp.)、悬钩子属物种(Rubus spp.)、甘蔗属物种(Saccharumspp.)、接骨木属物种(Sambucus spp.)、黑麦(Secale cereale)、胡麻属物种(Sesamum spp.)、白芥属物种(Sinapis sp.)、茄属物种(Solanum spp.)、两色蜀黍(Sorghum bicolor)、菠菜属物种(Spinacia spp.)、蒲桃属物种(Syzygiumspp.)、酸豆(Tamarindus indica)、可可树(Theobroma cacao)、车轴草属物种(Trifolium spp.)、小黑麦(Triticosecale rimpaui)、小麦属物种(Triticumspp.)、小金莲花(Tropaeolum minus)、旱金莲(Tropaeolum majus)、越桔属物种(Vaccinium spp.)、野豌豆属物种(Vicia spp.)、豇豆属物种(Vigna spp.)、香堇菜(Viola odorata)、葡萄属物种(Vitis spp.)、玉蜀黍(Zea mays)、北美洲野生稻(Zizania palustris)、枣属物种(Zizipbus spp.)等等。根据本发明优选的实施方案,植物为作物植物,如大豆、向日葵、芸苔、苜蓿、油菜籽、棉花、番茄、马铃薯或烟草。还优选植物是单子叶植物,如甘蔗。更优选植物是谷类,如稻、玉米、小麦、大麦、粟、黑麦、高粱或燕麦。
其他有利的植物选自下组:菊科[Asteraceae]如向日葵属[Helianthus]、万寿菊属[Tagetes],例如物种向日葵[Helianthus annus]、香叶万寿菊[Tagetes lucida]、万寿菊[Tagetes erecta]或细叶万寿菊[Tagetes tenuifolia];十字花科[Brassicaceae]如芸苔属[Brassica]、拟南芥属[Arabadopsis],例如物种欧洲油菜[Brassica napus]、甘蓝型油菜[Brassica rapa ssp.][芸苔、油菜籽油菜、芜菁]或拟南芥;豆科[Fabaceae]如大豆属[Glycine],例如物种大豆[Glycine max]、黄豆[Soja hispida]或大豆[Soja max];亚麻科[Linaceae]如亚麻属[Linum],例如物种亚麻或者说亚麻籽[Linum usitatissimum];禾本科[Poaceae]如大麦属[Hordeum]、黑麦属[Secale]、燕麦属[Avena]、高粱属[Sorghum]、稻属[Oryza]、玉蜀黍属[Zea]、小麦属[Triticum],例如物种大麦[Hordeum vulgare]、黑麦[Secale cereale]、燕麦[Avena sativa]、野燕麦[Avena fatua]、红燕麦[Avena byzantina]、野燕麦[Avena fatua var.sativa]、燕麦[Avena hybrida]、高粱或者说粟[Sorghum bicolor]、稻[Oryza sativa],阔叶稻[Oryza latifolia]、玉米或者说玉蜀黍[Zea mays]、小麦[Triticumaestivum]、硬粒小麦[Triticum durum]、圆锥小麦[Triticum turgidum]、Triticum hybernum、马卡小麦[Triticum macha]、面包小麦[Triticumsativum]或普通小麦[Triticum vulgare];茄科[Solanaceae]如茄属[Solanum]、番茄属[Lycopersicon],例如物种马铃薯[Solanum tuberosum]、番茄[Lycopersicon esculentum、Lycopersicon lycopersicum、Lycopersiconpyriforme、Solanum lycopersicum]或红茄[Solanum integrifolium]。
本文定义的术语“Ste20样多肽或其同源物”指MAP4K多肽,优选植物来源的MAP4K多肽,包含N-末端Ser/Thr激酶结构域(匹配SMART数据库记录SM00220,InterPro登录号IPR002290)。SEQ ID NO:2中的激酶结构域始于Y15止于F293,且包含ProSite Ser/Thr蛋白质激酶模式PS00108:
[LIVMFYC]-x-[HY]-x-D-[LIVMFY]-K-x(2)-N-[LIVMFYCT](3),其中缺少第一个x。
优选Ste20样多肽或其同源物包含Ste20标签序列(signature sequence):
G(T/N)P(Y/C/R)(W/R)MAPE(V/K)(SEQ ID NO:6;Dan等,2001),
更优选其包含序列基序:
(S/H/N)(I/L)(V/I/L/M)(S/K)(S/H/T/A/I/V)(S/G/V/A)(F/Y)(P/Q)(S/N/D/E)G(SEQ ID NO:7),
最优选Ste20样多肽或其同源物包含至少如下序列基序之一:
SEQ ID NO:8,(V/I)HSH(T/N/V)GY(G/S)(F/I)
SEQ ID NO:9,RPPLSHLPP(L/S)KS
SEQ ID NO:10,RRISGWNF
在蛋白质的C-末端可能存在卷曲螺旋基序(SEQ ID NO:2中的K450至T477)。
术语“结构域”是指在进化相关蛋白质序列的比对中,在特定位置上保守的一组氨基酸。尽管其他位置上的氨基酸可能因同源物不同而改变,但是在特定位置上高度保守的氨基酸意味着对于蛋白质结构、稳定性或活性非常重要的氨基酸。“结构域”因其在所比对的家族蛋白质同源物序列中高度保守而得以鉴定,能够用作为标识符以确定任何所讨论的多肽是否属于先前鉴定到的多肽家族(在本案中为Ste20样蛋白质家族)。术语“基序”是指蛋白质序列中短的保守区域。基序常常是高度保守的结构域部分,但也可以仅仅包括部分结构域,或者位于保守结构域之外(若基序的所有氨基酸都在所定义的结构域之外的话)。
存在用于鉴定结构域的专家数据库。例如,Ste20样蛋白质中的激酶结构域可以利用SMART(Schultz等(1998)Proc.Natl.Acad.Sci.USA 95,5857-5864;Letunic等(2002)Nucleic Acids Res 30,242-244)、InterPro(Mulder等,(2003)Nucl.Acids.Res.31,315-318)、Prosite(Bucher和Bairoch(1994),A generalized profile syntax for biomolecular sequencesmotifs and its function in automatic sequence interpretation.(In)ISMB-94;第二届分子生物学智能系统国际会议记录(Proceedings 2nd InternationalConference on Intelligent Systems for Molecular Biology)Altman R.,Brutlag D.,Karp P.,Lathrop R.,Searls D.编辑,第53-61页,AAAIPress,Menlo Park;Hulo等,Nucl.Acids.Res.32:D134-D137,(2004))或者Pfam(Bateman等,Nucleic Acids Research 30(1):276-280(2002)来鉴定。进行蛋白质序列芯片(in silico)分析的一组工具可以从ExPASy蛋白质组学服务器获得(由瑞士生物信息学研究所(Swiss Institute of Bioinformatics)主办,Gasteiger等ExPASy:the proteomics server for in-depth proteinknowledge and analysis.Nucleic Acids Res 31:3784-3788(2003))。
通过将其他蛋白质序列与SEQ ID NO:2进行比对,可以容易地鉴定上文详述的相应Ste20标签序列、激酶结构域及其序列基序。以这种方式,利用本领域熟知的常规技术如通过序列比对,可以容易地鉴定Ste20样多肽或其同源物(包括直系同源物和旁系同源物)。为比较而进行序列比对的方法是本领域众所周知的,此类方法包括GAP、BESTFIT、BLAST、FASTA和TFASTA。GAP使用Needleman和Wunsch的算法((1970)J.Mol.Biol.48:443-453)来寻找两完整序列之间匹配数最大化且空位数最小化的比对。BLAST算法(Altschul等(1990)J Mol Biol 215:403-10)计算序列同一性百分比,并对两序列之间的相似性进行统计学分析。执行BLAST分析的软件可通过美国国家生物技术信息中心公开地获得。例如,同源物可以使用ClustalW多重序列比对算法(1.83版),采用默认的双比对参数以及百分比的记分方法而容易地鉴定。利用可获自MatGAT软件包(Campanella等BMCBioinformatics.2003年7月10日4:29.MatGAT:an application thatgenerates similarity/identity matrices using protein or DNA sequences.)的方法之一,也可以确定全局相似性和同一性百分比。可以进行微小的人工编辑以优化保守基序之间的比对,这对于所属领域的技术人员而言将是显而易见的。此外,除了利用全长序列进行同源物鉴定以外,还可以利用特定结构域(如激酶结构域)。序列同一性值如上所示为百分比,是通过上述程序使用默认参数针对完整保守结构域或核酸或氨基酸序列确定的。
Ste20样多肽或其同源物的实例包括拟南芥属植物序列SEQ ID NO:12(对应于At5g14720,由GenBank登录号AAL38867编码)、SEQ ID NO:14(At1g70430,GenBank NP_177200)、SEQ ID NO:16(At1g23700,GenBankNP_173782)、SEQ ID NO:18(At1g79640,GenBank NP_178082)、SEQ IDNO:20(At4g10730,GenBank NP_192811)、SEQ ID NO:22(At4g24100,GenBank NP_194141);稻序列SEQ ID NO:24(GenBank XP_469286,SEQID NO:2的稻直系同源物)、SEQ ID NO:26(GenBank BAD37346)、SEQID NO:28(GenBank XP_468215)、SEQ ID NO:30(GenBank AAL54869)、SEQ ID NO:32(GenBank NP_912431)以及苜蓿属植物(Medicago)序列SEQ ID NO:34(SEQ ID NO:2直系同源物)。
应该理解的是,落入“Ste20样多肽或其同源物”定义的序列不限于SEQID NO:2、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32或SEQ ID NO:34所示的序列,而是任何这样的多肽,其包含如上文所定义的N-末端激酶结构域、Ste20标签序列,且优选还包含SEQ ID NO:7、8、9和10中详述的一个或多个序列基序,均可适用于实施本发明的方法。在优选的实施方案中,本发明方法中使用的同源物是SEQ ID NO:2的直系同源物。
可实施测定法以确定Ste20样活性。例如,为确定激酶活性,可利用本领域熟知的多种测定法(例如Current Protocols in Molecular Biology,卷1和2,Ausubel等(1994),Current Protocols)。Ste20样蛋白质为参与信号转导的MAP4K激酶。对于多种生物体而言,Ste20的底物被鉴定为Ste11p(Drogen et al.,Current Biology 10,630-639,2000)。除了在体外磷酸化Ste11p蛋白质,Ste20还表明磷酸化组蛋白H2B(Ahn等,Cell 120,25-36,2005)。从标准激酶测定混合物出发,可以优化缓冲液组成、离子强度及pH值。标准的5x激酶缓冲液通常含有5mg/ml BSA(牛血清白蛋白,防止激酶吸附至测定管)、150mM Tris-Cl(pH 7.5)、100mM MgCl2。虽然有些酪氨酸激酶(例如胰岛素受体激酶、IGF-1受体激酶及PDGF受体激酶)需要MnCl2而非MgCl2(或除MgCl2之外还需要MnCl2),大多数酪氨酸激酶需要二价阳离子。对于每种蛋白质激酶,其最佳二价阳离子浓度必须凭经验确定。常用的磷基团供体是放射性同位素标记的[γ-32P]ATP(通常终浓度为0.2mM)。掺入肽中的32P量可以通过测量闪烁计数器中硝化纤维素干片上的活性来确定。
此外,在植物、特别是稻中表达Ste20样蛋白质或其同源物具有与对照植物相比增加转基因植物产率的效果,其中增加的产率包括增加种子总重量、饱满种子数及收获指数中的至少一项。
蛋白质的“同源物”包括肽、寡肽、多肽、蛋白质和酶,其相对于所讨论的未修饰蛋白质具有氨基酸取代、缺失和/或插入,并且与其衍生自的未修饰蛋白质具有相似的生物活性和功能活性。
术语“同源物”包括直系同源序列和旁系同源序列,这两种特定形式的同源物涵盖用于描述基因祖先关系的进化概念。旁系同源物为相同物种内源于祖先基因复制的基因,而直系同源物为不同生物体中源于物种形成的基因。
例如,可以通过所谓的交互blast搜索容易地找到直系同源物和旁系同源物。这可以通过一次BLAST而实现,包括使用查询序列(例如SEQ ID NO:1或SEQ ID NO:2)针对任何序列数据库如可公共获得的NCBI数据库进行BLAST。当从核苷酸序列开始时,可使用BLASTN或TBLASTX(利用标准默认值),而当从蛋白质序列开始时,可使用BLASTP或TBLASTN(利用标准默认值)。BLAST结果可以任选地过滤。接着使用过滤的结果或者未过滤的结果中的全长序列针对查询序列源自的生物体的序列进行反向BLAST(二次BLAST)(在查询序列为SEQ ID NO:1或SEQ ID NO:2的情况下,二次BLAST将会针对拟南芥属植物的序列)。然后比较一次BLAST和二次BLAST的结果。如果二次BLAST中得分靠前的命中事件来自查询序列源自的相同物种,则鉴定到了旁系同源物;如果得分靠前的命中事件不是来自查询序列源自的相同物种,则鉴定到了直系同源物。优选直系同源物为SEQ ID NO:1或SEQ ID NO:2的直系同源物。得分靠前的命中事件E值低。E值越低,得分越具有显著性(或者换句话说,偶然发现此命中事件的几率越低)。E值的计算是本领域众所周知的。除了E值之外,还通过同一性百分比对种种比较进行记分。同一性百分比是指在特定长度上两比较核酸(或多肽)序列之间相同的核苷酸(或氨基酸)数。优选得分大于50,更优选大于100;且优选E值低于e-5,更优选低于e-6。在大家族的情况下可以使用CLUSTALW,接着建立邻近连接树,来辅助相关基因的聚类可视化,并鉴定直系同源物和旁系同源物。与SEQ ID NO:2直系同源的序列实例包括SEQ ID NO:24和SEQ ID NO:34。与SEQ ID NO:2旁系同源的序列实例包括SEQ ID NO:12(At5g14720)和SEQ ID NO:20(At4g10730)。
优选用于本发明方法的Ste20样蛋白质的激酶结构域与SEQ ID NO:2的Ste20蛋白质的激酶结构域具有至少40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%的序列同一性。详细说明同源物鉴定的一个实例在实施例1中给出。实施例1中所示的矩阵(表4)显示了全长蛋白质范围上的相似性和同一性(粗体)。在仅比较特定结构域的情况下,不同蛋白质之间的同一性或相似性可能较高(表5:仅激酶结构域之间的比较)。
Ste20样多肽或其同源物由Ste20样核酸/基因编码。因此文中定义的术语“Ste20样核酸/基因”是编码上文所定义的Ste20样多肽或其同源物的任何核酸/基因。
Ste20样核酸的实例包括但不限于SEQ ID NO:3、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31或SEQ ID NO:33中任一所示的那些核酸。
Ste20样核酸/基因及其变体可适用于实施本发明的方法。变体Ste20样核酸/基因包括Ste20样核酸/基因的部分、剪接变体、等位基因变体和/或能够与Ste20样核酸/基因杂交的核酸。
如本文所定义的术语“部分”是指编码多肽的一段DNA,所述多肽包含如上文所定义的Ste20标签序列G(T/N)P(Y/C/R)(W/R)MAPE(V/K)(SEQ ID NO:6)和N-末端Ser/Thr激酶结构域。例如,可以通过对Ste20样核酸进行一个或多个缺失来制备“部分”。“部分”可以以分离的形式使用,或者可将其与其他编码(或非编码)序列融合,以便例如,生产组合了若干活性的蛋白质。当与其他编码序列融合时,经翻译后所产生的多肽可能比预测的Ste20样片段要大。“部分”通常长度至少为300、400、500、600或700个核苷酸,优选长度至少为750、900、850、900或950个核苷酸,更优选长度至少为1000、1100、1200或1300个核苷酸,且最优选长度至少为1350、1400或1450个核苷酸。优选“部分”为SEQ ID NO:1、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQID NO:29、SEQ ID NO:31或SEQ ID NO:33中任一所示核酸的“部分”。最优选“部分”为SEQ ID NO:1所示核酸的“部分”。
术语“片段”、“序列片段”或“序列的一部分”、“部分”或“其部分”是指所参照原始序列的截短序列。截短序列(核酸或蛋白质序列)长度可大幅变动;最低长度为这样的序列,其大小足以提供具有与所参照原始序列相当的功能和/或活性的序列,或者在严格条件下与本发明的或本发明方法所用的核酸分子杂交,而最高长度并不重要。在有些应用中,最高长度通常并不比提供期望的原始序列活性和/或功能所需的大小长多少。相当的功能表示至少为原始序列的40%、45%或50%、优选至少60%、70%、80%或90%或以上。
Ste20样核酸/基因的其他变体为在降低的严格条件下、优选在严格条件下,能够与上文所定义的Ste20样核酸/基因、或与上文所定义的“部分”杂交的核酸。
可用于本发明方法的杂交序列编码这样的多肽,所述多肽包含如上文所定义的Ste20标签序列G(T/N)P(Y/C/R)(W/R)MAPE(V/K)(SEQ ID NO:6)和N-末端Ser/Thr激酶结构域,并且与SEQ ID NO:2所示的Ste20样蛋白质或其同源物具有基本上相同的生物活性。杂交序列通常长度至少为800个核苷酸,优选长度至少为1000个核苷酸,更优选长度至少为1200个核苷酸,且最优选长度至少为1400个核苷酸。
优选杂交序列能够与SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31或SEQ ID NO:33(或来源于此的探针)所示的核酸、或与任一上述序列的“部分”杂交,其中“部分”如上文所定义。最优选杂交序列能够与SEQ ID NO:1或其部分(或探针)杂交。设计探针的方法在本领域众所周知。探针通常长度小于1000bp、900bp、800bp、700bp、600bp,优选长度小于500bp、400bp、300bp、200bp或100bp。通常,用于DNA-DNA杂交如Southern印迹(即DNA杂交)的探针长度在100至500bp上下变动,而用于DNA-DNA杂交如PCR扩增中的DNA杂交的探针杂交区域通常短于50个但长于10个核苷酸,优选杂交区域长度为15、20、25、30、35、40、45或50。
本文定义的术语“杂交”指其中基本同源互补的核苷酸序列彼此退火的过程。杂交过程能够完全在溶液中发生,即互补的核酸都在溶液中。杂交过程也可以如此进行,即互补核酸之一固定于基质上,如磁珠、琼脂糖珠或任何其它树脂上。此外,杂交过程也可以如此进行,即其中互补核酸之一固定在固相支持物如硝酸纤维素或尼龙膜上,或者例如用照相平板印刷固定在例如硅质玻璃支持物上(后者称为核酸阵列或微阵列,或称为核酸芯片)。为了使杂交发生,通常使核酸分子热变性或化学变性,以使双链解链成两条单链,和/或除去单链核酸中的发夹结构或其它二级结构。
杂交的严格性受诸如温度、盐浓度、离子强度和杂交缓冲液组成等条件的影响。通常,对于在确定的离子强度和pH值下的特定序列,选择比热解链温度(Tm)低约30℃的低严格条件。中等严格条件是温度比Tm低20℃,而高严格条件是温度比Tm低10℃。高严格杂交条件通常用于分离与靶核酸序列具有高序列相似性的杂交序列。不过,由于遗传密码的简并性,核酸可能在序列上有差异而依然编码基本上相同的多肽。因此有时可能需要中等严格杂交条件来鉴定这样的核酸分子。
Tm是在确定的离子强度和pH值下,50%的靶序列与完全匹配的探针杂交的温度。Tm取决于溶液条件和探针的碱基组成及长度。例如,较长的序列在较高温度下特异性杂交。在低于Tm值16℃到32℃获得最大杂交率。在杂交溶液中存在一价阳离子会减少两核酸链之间的静电排斥作用,从而促进杂合体形成;当钠浓度高达0.4M时,这一作用明显(对于更高的浓度,此作用可以忽略)。每个百分点的甲酰胺可使DNA-DNA和DNA-RNA双链体的解链温度降低0.6到0.7℃,加入50%甲酰胺能够使杂交在30到45℃完成,不过这将降低杂交率。碱基对错配降低杂交率和双链体的热稳定性。平均而言,对于大的探针,每个百分点碱基错配使Tm值下降约1℃。Tm值可以用取决于杂合体类型的下列方程式计算:
1.DNA-DNA杂合体(Meinkoth和Wahl,Anal.Biochem.,138:267-284,1984):
Tm=81.5℃+16.6xlog10[Na+]a+0.41x%[G/Cb]-500x[Lc]-1-0.61×%甲酰胺
2.DNA-RNA或RNA-RNA杂合体:
Tm=79.8+18.5(log10[Na+]a)+0.58(%G/Cb)+11.8(%G/Cb)2-820/Lc
3.寡DNA或寡RNAd杂合体:
<20个核苷酸:Tm=2(ln)
20-35个核苷酸:Tm=22+1.46(ln)
a或对于其它一价阳离子,但是仅在0.01-0.4M范围内精确。
b仅对于范围30%到75%的%GC精确。
cL=双链体的碱基对长度。
d寡,寡核苷酸;ln,引物的有效长度=2×(G/C数)+(A/T数)。
可以通过许多已知技术中的任一来控制非特异性结合,例如,用含蛋白质的溶液封闭膜,在杂交缓冲液中添加异源RNA、DNA和SDS,以及用RNA酶处理。对于非同源探针,可以通过改变如下之一来进行系列杂交:(i)逐步降低退火温度(例如从68℃逐步降至42℃)或(ii)逐步降低甲酰胺浓度(例如从50%逐步降至0%)。熟练的技术人员知晓可以在杂交过程中改变的多种参数,从而保持或者改变严格条件。
除杂交条件之外,杂交特异性通常还取决于杂交后洗涤的作用。为了除去非特异杂交产生的背景,用稀释的盐溶液洗涤样品。这类洗涤的关键因素包括最终洗涤溶液的离子强度和温度:盐浓度越低、洗涤温度越高,洗涤的严格性就越高。洗涤条件通常在等于或低于杂交严格性的条件下进行。阳性杂交提供的信号至少为背景的两倍。通常,用于核酸杂交测定或基因扩增检测方法的合适的严格条件如上文所示。也可以选择更高或更低的严格性条件。熟练的技术人员知晓可以在洗涤过程中改变的多种参数,从而保持或者改变严格条件。
例如,对于长于50个核苷酸的DNA杂合体,典型的高严格杂交条件包括于65℃在1×SSC中或于42℃在1×SSC和50%甲酰胺中杂交,接着于65℃在0.3×SSC中洗涤。对于长于50个核苷酸的DNA杂合体,中等严格杂交条件的实例包括于50℃在4×SSC中或于40℃在6×SSC和50%甲酰胺中杂交,接着于50℃在2×SSC中洗涤。杂合体的长度是杂交核酸的预期长度。当序列已知的核酸杂交时,杂合体的长度可以通过比对序列并鉴定本文所述的保守区域来确定。1×SSC是0.15M NaCl和15mM柠檬酸钠;杂交和洗涤可以另外地包括5×Denhardt′s试剂、0.5-1.0%SDS、100μg/ml变性片段化的鲑精DNA、0.5%焦磷酸钠。
为了定义严格性水平,可以便利地参考Sambrook等(2001)的《分子克隆:实验室手册》,第三版,冷泉港实验室出版,冷泉港,纽约,或者CurrentProtocols in Molecular Biology,John Wiley & Sons,N.Y.(1989以及年度更新资料)。
可用于本发明方法的还有SEQ ID NO:2所示氨基酸序列同源物的编码核酸。
同源物可以是蛋白质“取代变体”的形式,即在氨基酸序列中至少有一个残基被除去,并在这一位置插入不同的残基。氨基酸取代通常是单个残基的取代,但是视施加于多肽的功能性限制而定也可能是成簇取代;插入通常在大约1到10个氨基酸残基的数量级。优选氨基酸取代包括保守的氨基酸取代。为产生这样的同源物,蛋白质的氨基酸可以由具有相似特性(如相似的疏水性、亲水性、抗原性、形成或打破α螺旋结构或β片层结构的倾向)的其它氨基酸所替换。保守取代表是本领域众所周知的(例如见Creighton(1984)Proteins.W.H.Freeman and Company和下表1)。
表1:保守氨基酸取代的实例
  残基   保守取代   残基   保守取代
  Ala   Ser   Leu   Ile;Val
  Arg   Lys   Lys   Arg;Gln
  Asn   Gln;His   Met   Leu;Ile
  Asp   Glu   Phe   Met;Leu;Tyr
  Gln   Asn   Ser   Thr;Gly
  Cys   Ser   Thr   Ser;Val
  Glu   Asp   Trp   Tyr
  Gly   Pro   Tyr   Trp;Phe
  His   Asn;Gln   Val   Ile;Leu
  Ile   Leu;Val
同源物也可以是蛋白质的“插入变体”的形式,即在蛋白质的预定位置引入一个或多个氨基酸残基。插入可以包括N-末端和/或C-末端的融合,以及单个或多个氨基酸的内部序列插入。通常,氨基酸序列内部的插入将小于N-或C-末端的融合,数量级为约1到10个残基。N-或C-末端融合蛋白质或肽的实例包括在酵母双杂交系统中应用的转录激活因子的结合结构域或激活结构域、噬菌体外壳蛋白质、(组氨酸)6标签、谷胱甘肽S-转移酶标签、蛋白质A、麦芽糖结合蛋白、二氢叶酸还原酶、Tag·100表位、c-myc表位、FLAG
Figure A20068003235700251
表位、lacZ、CMP(钙调蛋白结合肽)、HA表位、蛋白质C表位和VSV表位。
蛋白质“缺失变体”形式的同源物特征在于从蛋白质中除去一个或多个氨基酸。
可通过本领域众所周知的肽合成技术,如固相肽合成法等,或通过重组DNA操作容易地得到蛋白质的氨基酸变体(取代、缺失和/或插入变体)。用于产生蛋白质的取代、插入或缺失变体的DNA序列操作方法是本领域众所周知的。例如,本领域技术人员熟知在DNA预定位置产生取代突变的技术,其包括M13诱变、T7-Gen体外诱变(USB,Cleveland,OH)、QuickChange定点诱变(Stratagene,San Diego,CA)、PCR介导的定点诱变或其它定点诱变方法。
Ste20样多肽或其同源物可以是衍生物。“衍生物”包括肽、寡肽、多肽、蛋白质和酶,与天然产生形式的蛋白质例如SEQ ID NO:2所示蛋白质的氨基酸序列相比,其可以包括取代、缺失或添加的天然的和非天然产生的氨基酸残基。“衍生物”包括肽、寡肽、多肽,与天然产生形式的蛋白质例如SEQ ID NO:2所示蛋白质的氨基酸序列相比,其可以包括非天然产生氨基酸残基的取代或非天然产生氨基酸残基的添加。蛋白质的“衍生物”包括肽、寡肽、多肽,与天然产生形式多肽的氨基酸序列相比,其可以包括天然产生的改变的(糖基化、酰基化、泛素化、异戊烯化、磷酸化、肉豆蔻酰化、硫酸化等等)或非天然产生的改变的氨基酸残基。衍生物还可以包括相对于其源自的氨基酸序列的一个或多个非氨基酸取代或添加,例如共价或非共价地结合于氨基酸序列的报告分子或其它配体,例如与之结合有利于衍生物检测的报告分子,以及相对于天然产生蛋白质的氨基酸序列而言非天然产生的氨基酸残基。SEQ ID NO:2直系同源物或旁系同源物的衍生物为可以适合在本发明方法中使用的更多实例。
Ste20样多肽或其同源物可以由Ste20样核酸/基因的剪接变体编码。本文所用的术语“选择性剪接变体”包括其中选择的内含子和/或外显子已被切除、替换或添加、或其中内含子已被缩短或加长的核酸序列的变体。这样的变体将是基本上保留蛋白质生物活性的变体,这可以通过选择性地保留蛋白质的功能性片段来实现。这样的剪接变体可以是天然的或人工的。产生这类剪接变体的方法是本领域众所周知的。优选的剪接变体是这样的多肽编码核酸的剪接变体,所述多肽包含上文所定义的Ste20标签序列(SEQ ID NO:6)和N-末端Ser/Thr激酶结构域。优选Ste20样多肽或其同源物另外包含SEQ ID NO:7,更优选Ste20样多肽或其同源物包含如下SEQID NO:8、SEQ ID NO:9和SEQ ID NO:10中的一个或多个。还优选SEQID NO:1、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31和SEQ ID NO:33所示核酸的剪接变体。最优选SEQ ID NO:1所示核酸的剪接变体。
可用于本发明方法的另一种核酸变体为如上文所定义的Ste20样多肽或其同源物编码核酸的等位基因变体,优选这样的Ste20样多肽编码核酸的等位基因变体,所述Ste20样多肽包含Ste20标签序列(SEQ ID NO:6)和N-末端Ser/Thr激酶结构域。优选Ste20样多肽或其同源物另外包含SEQ IDNO:7,更优选Ste20样多肽或其同源物包含如下SEQ ID NO:8、SEQ IDNO:9和SEQ ID NO:10中的一个或多个。还优选SEQ ID NO:1、SEQ IDNO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31和SEQ ID NO:33所示核酸的等位基因变体。最优选SEQ ID NO:1所示核酸的等位基因变体。等位基因变体天然存在,并且这些天然等位基因的用途包含于本发明的方法中。等位基因变体包括单核苷酸多态性(SNP),以及小型插入/缺失多态性(INDEL)。INDEL的大小通常小于100bp。SNP和INDEL在大多数生物体天然存在的多态性品系中形成最大的一组序列变体。
可用于本发明方法的另一类核酸变体为通过基因改组获得核酸变体。也可利用基因改组或定向进化产生Ste20样核酸的变体。这包括DNA改组的重复,继之以适当筛选和/或选择,以产生具有修饰的生物活性的Ste20样核酸或其部分的变体(Castle等,(2004)Science 304(5674):1151-4;美国专利5,811,238和6,395,547)。
此外,可利用定点诱变可产生Ste20样核酸的变体。可以通过多种方法来完成定点诱变,最常见的是基于PCR的方法(current protocols inmolecular biology.Wiley编辑)。
Ste20样核酸或其变体可以来自任何天然或人工的来源。核酸/基因或其变体可以分离自微生物来源如酵母或真菌,或分离自植物、藻类或动物(包括人)来源。可以通过仔细的人为操作在组成和/或基因组环境方面修饰所述核酸的天然形式。优选植物来源的核酸,无论来源于同一植物物种(例如对于其被引入的物种而言)或来源于不同植物物种。可以从双子叶物种,优选从十字花科(Brassicaceae),更优选从拟南芥分离所述核酸。更优选从拟南芥中分离的Ste20样核酸,且如SEQ ID NO:1所示,而Ste20样氨基酸序列如SEQ ID NO:2所示。
根据本发明的优选方面,考虑调节、优选增加Ste20样核酸或其变体的表达。增加基因或基因产物表达的方法在本领域有充分的记录,其包括,例如由适当的启动子驱动的过表达、转录增强子或翻译增强子的使用。可以将用作启动子或增强子元件的分离的核酸引入非异源形式多核苷酸的适当位置(一般是上游),从而上调Ste20样核酸或其变体的表达。例如,可以通过突变、缺失和/或取代,在体内改变内源启动子(见Kmiec,美国专利No.5,565,350;Zarling等人,PCT/US93/03868),或者将分离的启动子在本发明基因的适当方向和距离引入植物细胞中,从而控制基因的表达。降低基因或基因产物表达的方法在本领域有充分的记录。
可以通过引入遗传修饰(优选在Ste20样基因座)提高Ste20样多肽或其同源物编码核酸的表达。本文所定义的基因座意指基因组区,其包括目的基因和编码区上游或下游的10KB。
例如,可以通过T-DNA激活、TILLING或同源重组引入遗传修饰。引入遗传修饰之后的步骤是选择表达经修饰的Ste20样多肽或其同源物便么核酸,所述表达修饰使植物具有增加的产率。
T-DNA激活标记(Hayashi等Science(1992)1350-1353)包括将通常含有启动子(也可以是翻译增强子或内含子)的T-DNA插入在目的基因的基因组区或基因编码区上游或下游10KB,从而在构型上使启动子能够指导靶向基因的表达。通常天然启动子对靶基因表达的调控被破坏,基因受新引入的启动子控制。启动子一般包含于T-DNA中。此T-DNA随机插入植物基因组,例如,通过农杆菌(Agrobacterium)感染插入,并导致在插入T-DNA附近的基因过表达。得到的转基因植物由于引入的启动子附近基因过表达而表现出显性表型。待引入的启动子可以是任意能够在期望生物体内(在本案中是植物)指导基因表达的启动子。例如,组成型的、组织偏好的、细胞类型偏好的和诱导型的启动子都适用于T-DNA激活。
也可以通过TILLING(靶向诱导的基因组局部突变)技术将遗传修饰引入Ste20样基因座。这是一种诱变技术,其用于产生和/或鉴定(以及最终分离)诱变的表达和/或活性经调节的Ste20样核酸变体。TILLING还允许选择携带此类突变变体的植物。这些突变变体可能呈现出修饰的表达,不论是就强度还是就位置或时间(例如若突变影响启动子的话)而言。TILLING将高密度诱变和高通量筛选方法结合在一起。TILLING一般遵循的步骤是:(a)EMS诱变(Redei GP和Koncz C(1992)In Methods in ArabidopsisResearch,Koncz C,Chua NH,Schell J编辑Singapore,World ScientificPublishing Co,16-82页;Feldmann等(1994)In Meyerowitz EM,Somerville CR编辑,Arabidopsis.Cold Spring Harbor Laboratory Press,Cold Spring Harbor,NY,137-172页;Lightner J和Caspar T(1998)In JMartinez-Zapater,J Salinas编辑,Methods on Molecular Biology,卷82.Humana Press,Totowa,NJ,91-104页);(b)DNA制备和个体合并;(c)目的区域的PCR扩增;(d)变性和退火以形成杂双链体;(e)DHPLC,其中库中存在的杂双链体会在色谱图上检测到额外的峰;(f)突变个体的鉴定;和(g)突变PCR产物的测序。TILLING的方法是本领域众所周知的(McCallum等(2000)Nat Biotechnol 18:455-7,由Stemple综述(2004)Nat Rev Genet5(2):145-50)。
TDNA激活和TILLING是能够产生新的等位基因和Ste20样变体的技术的实例。
利用同源重组也能够再现本发明的效果,同源重组允许向基因组中的指定选择位置引入所选的核酸。同源重组是生物科学中常规使用的标准技术,其用于低等生物体如酵母或小立碗藓(physcomitrella)。在植物中实施同源重组的方法已经不仅在模式植物中描述(Offringa等(1990)EMBOJ.9(10):3077-84),而且也在作物植物如稻中描述(Terada等(2002)NatBiotech 20(10):1030-4;Iida和Terada(2004)Curr Opin Bioteeh15(2):132-8)。所靶向的核酸(其可以是上文中定义的Ste20样核酸或其变体)无需靶向Ste20样基因座,而是可以引入到例如高表达区域。所靶向的核酸可以是改良的等位基因,其用于替换内源基因或除内源基因之外再额外引入。
引入遗传修饰(在本案中不需引入Ste20样基因座)的优选方法是在植物中引入和表达编码如上文所定义的Ste20样多肽或其同源物的核酸。引入植物的核酸可以是全长的核酸或者是上文定义的部分或杂交序列。
本发明还提供遗传构建体和载体,以促进可用于本发明方法的核苷酸序列的引入和/或表达。
因此,提供的基因构建体含有:
(i)如上文所定义的Ste20样核酸或其变体;
(ii)一个或多个能够驱动(i)中核酸序列表达的控制序列;和任选的
(iii)转录终止序列。
可以使用本领域技术人员熟知的重组DNA技术构建用于本发明方法的构建体。可以将基因构建体插入可商购的、适合于转化进入植物并适于在转化的细胞中表达目的基因的载体中。
用含有目的序列(即编码Ste20样多肽或其同源物的核酸)的载体转化植物。为了成功进行转化、选择并增殖含目的序列的宿主细胞,熟练技术人员充分知晓载体上所必需存在的遗传元件。将目的序列有效连接于一个或多个控制序列(至少连接于启动子)。术语“调控元件”、“控制序列”和“启动子”在本文都可互换使用,从广义上是指能够影响与之相连的序列表达的调控核酸序列。术语“启动子”通常指位于基因转录起点上游的核酸控制序列,且参与识别和结合RNA聚合酶以及其他蛋白质,由此指导有效连接核酸的转录。上述术语包括源自典型真核生物基因组基因的转录调控序列(包括具有或没有CCAAT盒序列的TATA盒,其对于精确的转录起始是必需的),以及另外的调控元件(即上游激活序列、增强子和沉默子),其通过应答发育刺激和/或外部刺激或以组织特异的方式改变基因表达。该术语还包括经典原核生物基因的转录调控序列,在此情况下可以包括-35盒序列和/或-10盒转录调控序列。术语“调控元件”也包括合成的融合分子或衍生物,其赋予、激活或增强细胞、组织或器官中核酸分子的表达。本文所用的术语“有效连接”指启动子序列和目的基因之间的功能性连接,从而启动子序列能够起始目的基因的转录。
在植物中有功能的合适启动子通常是已知的。它们可以采取组成型或诱导型启动子的形式。合适的启动子能够在多细胞真核生物中进行发育和/或组织特异性表达;从而可以有利地在植物中使用叶、根、花、种子、气孔、块茎或果实特异性启动子。
例如,在植物中可用的不同植物启动子为诸如USP、LegB4-、DC3启动子或来自欧芹的泛素启动子等启动子。
“植物”启动子包含调控元件,其介导编码序列区段在植物细胞中的表达。从而,植物启动子无需为植物来源的,而是可以来源于病毒或微生物,例如,特别是来源于攻击植物细胞的病毒。
“植物”启动子也可以来源于植物细胞,例如,来源于经本文所述的欲在本发明方法中表达的核酸序列转化的植物。这对于其他“植物”调控信号同样适用,例如“植物”终止子的情况。
为在植物中表达,核酸分子必须如上文所述的那样,有效连接于或者包含合适的启动子,所述启动子在合适的地点适时地以细胞或组织特异性方式表达所述基因。可用的启动子有组成型启动子(Benfey等,EMBO J.8(1989)2195-2202),如来源于植物病毒的那些启动子,如35S CAMV(Franck等,Cell 21(1980)285-294)、19S CaMV(还参见US 5352605和WO84/02913)、34S FMV(Sanger等,Plant.Mol.Biol.,14,1990:433-443),欧芹泛素启动子,或植物启动子如US 4,962,028中所述的核酮糖二磷酸缩化酶/加氧酶(Rubisco)小亚基启动子或植物启动子PRP1[Ward等,Plant.Mol.Biol.22(1993)]、SSU、PGEL1、OCS[Leisner(1988)Proc Natl Acad SciUSA 85(5):2553-2557]、lib4、usp、mas [Comai(1990)Plant Mol Biol 15(3):373-381]、STLS1、ScBV(Schenk(1999)Plant Mol Biol39(6):1221-1230)、B33、SAD1或SAD2(亚麻启动子,Jain等,Crop Science,39(6),1999:1696-1701)或nos[Shaw等(1984)Nucleic Acids Res.12(20):7831-7846]。其他组成型植物启动子的实例为甜菜V-ATPase启动子(WO 01/14572)。合成组成型启动子的实例有超级启动子(Super promoter)(WO 95/14098)和来源于G-box的启动子(WO 94/12015)。此外,适当的情况下还可以使用化学诱导型启动子,对照EP-A 388186、EP-A 335528、WO 97/06268。在植物中稳定组成型表达本发明蛋白质是有利的。然而,如果在收获前的晚期表达有利的话,最好诱导型表达本发明的多肽,因为代谢操作很可能会导致植物生长延迟。
也能够通过化学诱导型启动子促进植物基因的表达(有关综述,参见Gatz 1997,Annu.Rev.Plant Physiol.Plant Mol.Biol.,48:89-108)。当期望以时间特异性方式表达基因时,化学诱导型启动子尤其适用。此类启动子的实例有水杨酸诱导型启动子(WO 95/19443)、脱落酸诱导型启动子(EP 335528)、四环素诱导型启动子(Gatz等(1992)Plant J.2,397-404)、环己醇或乙醇诱导型启动子(WO 93/21334),或者文中所述的其他启动子。
其他合适的启动子是那些针对生物或非生物胁迫起反应的启动子,例如病原诱导的PRP1基因启动子(Ward等,Plant.Mol.Biol.22(1993)361-366)、番茄热诱导型hsp80启动子(US 5,187,267)、马铃薯冷诱导型α-淀粉酶启动子(WO 96/12814)或创伤诱导型pinII启动子(EP-A-0 375 091),或者文中所述的其他启动子。
优选的启动子尤其是那些导致基因在组织和器官、在种子细胞如胚乳细胞以及发育中的胚细胞中表达的启动子。合适的启动子有油菜籽油菜的油菜籽蛋白(napin)基因启动子(US 5,608,152)、蚕豆(Vicia faba)USP启动子(Baeumlein等,Mol Gen Genet,1991,225(3):459-67)、拟南芥油质蛋白启动子(WO 98/45461)、菜豆(Phaseolus vulgaris)菜豆蛋白启动子(US5,504,200)、芸苔Bce4启动子(WO 91/13980)、豆arc5启动子、胡萝卜DcG3启动子或豆球蛋白B4启动子(LeB4;Baeumlein等,1992,Plant Journal,2(2):233-9),以及在单子叶植物中带来种子特异性表达的启动子,如玉米、大麦、小麦、黑麦、稻等。有利的种子特异性启动子有蔗糖结合蛋白启动子(WO 00/26388)、菜豆蛋白启动子和油菜籽蛋白启动子。必须考虑的合适的启动子有大麦lpt2或lpt1基因启动子(WO 95/15389和WO 95/23230),以及WO 99/16890中所述的启动子(来自大麦大麦醇溶蛋白基因、稻谷蛋白基因、稻oryzin基因、稻醇溶谷蛋白基因、小麦醇溶蛋白基因、小麦谷蛋白基因、玉米玉米醇溶蛋白基因、燕麦谷蛋白基因、高粱kasirin基因、黑麦黑麦醇溶蛋白基因的启动子)。其他合适的启动子为Amy32b、Amy 6-6和Aleurain[US 5,677,474]、Bce4(油菜籽油菜)[US 5,530,149]、大豆球蛋白(大豆)[EP 571741]、磷酸烯醇式丙酮酸羧化酶(大豆)[JP 06/62870]、ADR12-2(大豆)[WO 98/08962],异柠檬酸裂合酶(油菜籽油菜)[US 5,689,040]或α-淀粉酶(大麦)[EP 781 849]。可用于在植物中表达基因的其他启动子有叶特异性启动子,如DE-A 19644478中所述的那些;或者光调控的启动子,如豌豆petE启动子。
其他合适的植物启动子有胞质FBPase启动子或马铃薯ST-LSI启动子(Stockhaus等,EMBO J.8,1989,2445)、大豆磷酸核糖焦磷酸氨基转移酶启动子(GenBank登录号U87999)或EP-A-0 249 676中描述的瘤特异性启动子(node-specific promoter)。
有利地,可以使用任何类型的启动子驱动核酸序列的表达。启动子可以是诱导型启动子,即应答发育、化学、环境或物理刺激,具有诱导的或增加的转录起始。诱导型启动子的实例是胁迫诱导型启动子,即当植物接触多种胁迫条件时激活的启动子,或者病原诱导型的启动子。另外或可选地,启动子可以是组织偏好的启动子,即能够在某些组织,如在叶、根、种子等组织中优先地起始转录的启动子;或者可以是普遍存在的启动子,其基本上在生物体的所有组织或细胞中激活;或者启动子可以是发育调控型的,从而在某些发育阶段或在发生发育改变的植物部分激活。能够仅在某些组织中起始转录的启动子在文中称为“组织特异性”启动子,与此类似,能够仅在某些细胞中起始转录的启动子在文中称为“细胞特异性”启动子。
优选Ste20样核酸或其变体有效的连接于组成型启动子。组成型启动子在其生长和发育的大多数但不必然是所有阶段、并在至少一种细胞、组织或器官的大多数环境条件下都转录激活。优选的组成型启动子也是基本普遍表达的组成型启动子。最优选使用GOS2启动子(来自稻)(如SEQ IDNO:5的表达盒中所用的那样)。应该明确的是本发明的应用并不限于SEQID NO:1所示的Ste20样核酸,也不限于由GOS2启动子驱动的Ste20样蛋白质编码核酸的表达。也可用来驱动Ste20样蛋白质编码核酸表达的其它组成型启动子的实例示于下表2中。
表2:组成型启动子的实例
  基因来源   表达模式   参考文献
  肌动蛋白   组成型   McElroy等,Plant Cell,2:163-171,1990
  CAMV 35S   组成型   Odell等,Nature,313:810-812,1985
  CaMV 19S   组成型   Nilsson等,Physiol.Plant.100:456-462,1997
  GOS2   组成型   de Pater等,Plant J Nov;2(6):837-44,1992
  泛素   组成型   Christensen等,Plant Mol.Biol.18:675-689,1992
  稻亲环蛋白   组成型   Buchholz等,Plant Mol Biol.25(5):837-43,1994
  玉米H3组蛋白   组成型   Lepetit等,Mol.Gen.Genet.231:276-285,1992
  肌动蛋白2   组成型   An等,Plant J.10(1);107-121,1996
任选地,还可以在引入植物的构建体中使用一个或多个终止子序列(也是一种控制序列)。术语“终止子”包括控制序列,其为位于转录单位末端的DNA序列,传递信号引发初级转录物的3’加工和多聚腺苷酸化以及转录的终止。终止子可以来自天然基因、多种其它植物基因或来自T-DNA。例如,待加入的终止子可以来自胭脂碱合酶或章鱼碱合酶基因、或可选地源自其他植物基因、或次优选地源自任何其它真核基因。另外的调控元件可以包括转录和翻译的增强子。本领域技术人员将知道适合用于实施本发明的终止子和增强子的序列。这类序列为本领域技术人员所公知或者可以容易地获得。
也可以在5’非翻译区或部分编码序列的编码序列中加入内含子序列,来增加在胞质中累积的成熟信使的数量。已显示,在植物和动物表达构建体的转录单位中纳入的可剪接内含子均可以在mRNA和蛋白质水平使基因表达增加高达1000倍:Buchman和Berg,Mol.Cell biol.8:4395-4405(1988);Callis等,Genes Dev.1:1183-1200(1987)。通常这类内含子被放置在转录单位5’末端附近时,其增强基因表达的作用达到最大。玉米内含子Adh1-S内含子1、2和6,Bronze-1内含子的使用是本领域公知的。通常见The MaizeHandbook,116章,Freeling和Walbot编辑,Springer,N.Y.(1994)。
其他控制序列(除启动子、增强子、沉默子、内含子序列、3’UTR和/或5’UTR区域之外)可以是蛋白质和/或RNA稳定元件。这类序列为本领域技术人员所公知或者可以容易地获得。
本发明的遗传构建体可以还包括在特定细胞类型中维持和/或复制所需的复制起点序列。一个实例是需要将遗传构建体作为附加型遗传元件(如质粒或粘粒分子)在细菌细胞中维持的情况。优选的复制起点包括但不限于f1-ori和colE1。
为检测和/或选择如序列表(sequence protocol)中所述以及本发明方法中所用核酸序列的成功转移,最好使用标记基因(=报告基因)。这些标记基因能够通过一系列不同的原理鉴定核酸分子的成功转移,例如通过视觉鉴定,借助于荧光、发光或者人眼不可见的光波波长范围,通过除草剂或抗生素抗性,通过称为营养标记(营养缺陷型标记)或抗营养标记(antinutritive marker),通过酶测定或通过植物激素。可提及的此类标记的实例有GFP(=绿色荧光蛋白);荧光素/荧光素酶系统;β-半乳糖苷酶及其着色底物,例如X-Gal;对例如咪唑啉酮、草甘磷、膦丝菌素或磺胺脲的除草剂抗性;对例如博来霉素、潮霉素、链霉素、卡那霉素、四环素、氯霉素、氨苄青霉素、庆大霉素、遗传霉素(G418)、壮观霉素或杀稻瘟菌素等等的抗生素抗性;营养标记如甘露糖或木糖的利用;或抗营养标记如对2-脱氧葡萄糖的抗性。这仅仅是一小部分可能的标记的名单。技术人员对这类标记极为熟悉。优选根据不同生物体和选择方法来使用不同的标记。
因此遗传构建体可以任选地包括可选择的标记基因。如本文所用,术语“可选择的标记”或“可选择的标记基因”包括赋予细胞表型的任何基因,该基因在细胞中表达,有利于鉴定和/或选择经本发明的核酸构建体转染或转化的细胞。适当的标记可以选自赋予抗生素或除草剂抗性的标记,其引入新的代谢性状或允许可视选择。可选择标记基因的实例包括赋予抗生素抗性的基因(例如磷酸化新霉素和卡那霉素的nptII,或磷酸化潮霉素的hpt)、赋予除草剂抗性的基因(例如提供Basta抗性的bar;提供草甘膦抗性的aroA或gox)、或者提供代谢性状的基因(例如允许植物使用甘露糖作为唯一碳源的manA)。可视标记基因导致形成颜色(例如β-葡糖醛酸糖苷酶GUS)、发光(例如荧光素酶)或荧光(绿色荧光蛋白GFP及其衍生物)。
已知核酸稳定或瞬时整合进植物细胞,仅少数细胞摄入外来DNA,并整合进其基因组(如果期望的话),这取决于所用的表达载体和所用的转染技术。为鉴定并选择这些整合体,通常将编码可选择标记(如上文所述,例如抗生素抗性)的基因与目的基因一起引入宿主细胞中。植物中优选的可选择标记包括那些赋予除草剂如草甘膦或草丁膦抗性的标记。其他合适的标记为例如编码参与例如糖或氨基酸生物合成通路基因的标记,如β-半乳糖苷酶、ura3或ilv2。编码基因如荧光素酶、gfp或其他荧光基因的标记同样适用。这些标记和前述标记可在突变体中使用,所述突变体中原有的这些基因没有功能,例如通过常规方法而缺失。此外,编码可选择标记的核酸分子与编码本发明多肽的核酸分子可以在同一个载体中引入宿主细胞或用于本发明的方法,或者在单独的载体中。由所引入的核酸稳定转染的细胞可以例如通过选择(例如,整合有可选择标记的细胞存活而其他细胞死去)予以鉴定。
一旦成功引入核酸,将不再需要或不期望转基因宿主细胞中存在标记基因,通常特别是抗生素和除草剂抗性基因,所以根据本发明引入核酸的方法有利地采用能够除去或切除这些标记基因的技术。一种这样的方法是称为共转化的方法。共转化法采用两个载体同时进行转化,一个载体携带根据本发明的核酸,而第二个携带标记基因。较大比例的转化体接收或者对于植物而言含有(高达40%或以上的转化体)两个载体。对于农杆菌转化,转化体通常只接收载体的一部分,即为T-DNA所侧接的序列,其通常指表达盒。随后可通过杂交从转化植物中除去标记基因。在另一种方法中,利用整合进转座子的标记基因与期望的核酸一起进行转化(称为Ac/Ds技术)。转化体可与转座酶来源杂交,或者用赋予转座酶表达的核酸瞬时或稳定转化转化体。在有些情况下(约10%),一旦成功进行了转化,转座子跳出宿主细胞基因组并丢失。在其他一些情况下,转座子跳至不同的位置。在这些情况下,必须通过杂交消除标记基因。在微生物学领域,研发了有可能或便于检测此类事件的技术。另一有利的方法有赖于称为重组系统的方法,其优势在于可以免除杂交消除步骤。最著名的这类系统称为Cre/lox系统。Cre1为重组酶,其切除位于loxP序列之间的序列。如果标记基因整合在loxP序列之间,一旦成功进行了转化,由于该重组酶的表达,其得以切除。其他重组系统有HIN/HIX、FLP/FRT及REP/STB系统(Tribble等,J.Biol.Chem.,275,2000:22255-22267;Velmurugan等,J.Cell Biol.,149,2000:553-566)。根据本发明的核酸有可能位点特异性地整合进植物基因组。这些方法自然也可以应用于微生物如酵母、真菌或细菌。
本发明还包括可由本发明方法获得的植物。本发明因此提供可由本发明方法获得的植物,所述植物中引入了Ste20样核酸或其变体。
本发明还提供用于生产具有增加的产率的转基因植物的方法,包括在植物中引入和表达上文所定义的Ste20样核酸或其变体。
出于本发明的目的,“转基因的”、“转基因”或“重组”是指,例如,核酸序列、含有所述核酸序列的表达盒(=基因构建体)或载体、或用所述核酸序列转化的生物体、根据本发明的表达盒或载体、通过重组方法产生的所有那些构建体,其中:
a)根据本发明的核酸序列,或
b)有效连接于根据本发明核酸序列的遗传控制序列,例如启动子,或c)a)和b)
不存在于其天然遗传环境中,或者已通过重组方法修饰,有可能修饰采取的形式为例如一个或多个核苷酸残基的取代、添加、缺失、倒位或插入。天然遗传环境应理解为原始植物中的天然基因组或染色体座位或者存在于基因组文库之中。在基因组文库的情况下,优选维持核酸序列的天然遗传环境,至少是部分地维持。至少在核酸序列一侧侧接的环境序列长度至少为50bp、优选至少500bp、特别优选至少1000bp、最优选至少5000bp。当天然存在的表达盒——例如核酸序列的启动子与编码具有激酶结构域的多肽或此类多肽的同源物的相应核酸之间天然存在着的组合——经非天然的合成(“人工”)方法如诱变处理修饰时,此表达盒变成转基因表达盒。例如,合适的方法描述在US 5,565,350或WO 00/15815中。
因此,如上文所述,用于本发明目的的转基因植物应理解为表示:在所述植物的基因组中,本发明方法中所用的核酸不在其天然基因座上,有可能核酸将要进行同源或异源表达。不过,正如所提到的那样,转基因的也表示:尽管在植物基因组中,根据本发明的核酸或本发明方法中所用的核酸在其天然位置上,但是所述序列已相对于天然序列而被修饰,和/或天然序列的调控序列已被修饰。转基因的优选理解为表示:根据本发明的核酸在基因组中非天然的座位上表达,即同源表达,或者优选地发生核酸的异源表达。优选的转基因植物在本文提及。
用于本发明方法中所用核酸或载体、所述表达盒或构建体或载体的宿主植物原则上有利地为所有植物,它们能够合成本发明方法中所用的多肽。
更具体地,本发明提供生产具有增加的产率的转基因植物的方法,所述方法包括:
(i)向植物细胞中引入和表达Ste20样核酸或其变体;和
(ii)在促进植物生长和发育的条件下培养植物细胞。
可以将核酸直接引入植物细胞或植物本身(包括引入组织、器官或植物的任何其它部分)。根据本发明的优选方面,优选通过转化将核酸引入植物。
本文所指术语“引入”或“转化”包括将外源多核苷酸转移进宿主细胞,不考虑转移所用的方法。能够通过器官发生或者胚胎发生随即克隆增殖的植物组织都可以使用本发明的遗传构建体转化,并从其再生整个植物。具体的组织选择将因可提供和最适于转化的具体物种的克隆增殖系统而变。示例性的靶组织包括叶盘、花粉、胚、子叶、胚轴、雌配子、愈伤组织、既有的分生组织(例如顶端分生组织、腋芽和根分生组织),以及诱导的分生组织(例如子叶分生组织和胚轴分生组织)。可以将多核苷酸瞬时地或稳定地引入宿主细胞,并且可以,例如作为质粒保持非整合的状态。可选地,其可以整合进入宿主基因组。得到的转化植物细胞可以接着以本领域技术人员公知的方式再生为转化的植物。
外来基因转移进入植物基因组中称为转化。为实施转化,利用转化方法以及由植物组织或植物细胞再生植物的方法来进行瞬时或稳定转化。有利的转化法是植物原位(in planta)转化。为此,有可能例如使农杆菌作用于植物种子,或用农杆菌接种植物分生组织。根据本发明,证明使转化农杆菌悬液作用于完整植株或至少花原基尤为有利。随后培养植物,直至获得所处理植物的种子(Clough和Bent,Plant J.(1998)16,735-743)。为选择转化的植物,通常将在转化过程中获得的植物材料置于选择性条件中,从而可将转化植物与非转化植物区分开来。例如,可以种植以上述方式获得的种子,并在最初的生长周期之后,通过喷雾对其进行合适的选择。另一可能性包括使用合适的选择剂,将种子,适用的情况下是在授粉之后,种植在琼脂板上,从而仅转化的种子能够长成植物。其他有利的转化方法、特别是植物转化方法,为技术人员所公知,并在下文描述。
植物物种的转化目前是一种相当常规的技术。有利地,可以使用几种转化方法的任一向适当的祖先细胞引入目的基因。转化方法包括用脂质体、电穿孔、增强游离DNA摄取的化学品、直接向植物注射DNA、粒子枪轰击、用病毒或花粉转化以及显微注射(microprojection)。方法可以选自用于原生质体的钙/聚乙二醇方法(Krens,F.A.等,(1882)Nature 296,72-74;Negrutiu I.等,(1987)Plant Mol.Biol.8:363-373);原生质体的电穿孔法(Shillito R.D.等,(1985)Bio/Technol 3,1099-1102);植物材料的显微注射(Crossway A.等,(1986)Mol.Gen Genet 202:179-185);DNA或RNA包被的粒子轰击(Klein T.M.等,(1987)Nature 327:70);(非整合的)病毒感染,等等。优选使用任何熟知的稻转化方法,通过农杆菌介导的转化,产生表达Ste20样核酸/基因的转基因稻植物,例如在以下任一文献中描述的方法:公开的欧洲专利申请EP 1198985 A1,Aldemita和Hodges(Planta,199:612-617,1996);Chan等(Plant Mol.Biol.22(3)491-506,1993),Hiei等(PlantJ.6(2):271-282,1994),其公开的内容如同充分阐述的那样并入本文作为参考。至于谷物转化,优选的方法如Ishida等(Nat.Biotechnol.14(6):745-50,1996)或Frame等(Plant Physiol.129(1):13-22,2002)中所述,其公开的内容如同充分阐述的那样并入本文作为参考。作为举例,所述方法由B.Jenes等,Techniques for Gene Transfer,在Transgenic Plants,卷1,Engineeringand Utilization,编辑S.D.Kung和R.Wu,Academic Press(1993)128-143以及Potrykus Annu.Rev.Plant Physiol.Plant Molec.Biol.42(1991)205-225)中进一步描述。优选将待表达的核酸或构建体克隆到载体中,所述载体适用于转化根癌农杆菌(Agrobacterium tumefaciens),例如pBin 19(Bevan等,Nucl.Acids Res.12(1984)8711)。然后以已知的方式利用由这样的载体转化的农杆菌来转化植物,特别是作物植物,例如作为举例的烟草植物,例如通过在农杆菌溶液中水浴擦伤的叶子或剁碎的叶子,然后在合适的培养基中培养之。例如,通过根癌农杆菌的植物转化由
Figure A20068003235700401
和Willmitzer在Nucl.Acid Res.(1988)16,9877中描述,或者尤其是由于F.F.White,Vectorsfor Gene Transfer in Higher Plants在Transgenic Plants,卷1,Engineeringand Utilization,编辑S.D.Kung和R.Wu,Academic Press,1993,第15-38页而为人所知。
通常在转化以后,选出存在一个或多个标记的植物细胞或细胞群,所述标记由与目的基因共转移的植物可表达基因编码,继之将转化的材料再生成整个植物。
如所提到的那样,用本发明表达载体转化的农杆菌也可以以其自身已知的方法来转化植物,如实验植物,像拟南芥或作物植物,例如像谷类、玉米、燕麦、黑麦、大麦、小麦、大豆、稻、棉花、甜菜、芸苔、向日葵、亚麻、大麻、马铃薯、烟草、番茄、胡萝卜、甜椒、油菜籽油菜、木薯淀粉、木薯、竹芋、万寿菊、苜蓿、生菜和多种树木、坚果和葡萄藤物种,特别是含油作物植物,如大豆、花生、蓖麻油植物、向日葵、玉米、棉花、亚麻、油菜籽油菜、椰子、油椰、红花(Carthamus tinctorius)或可可豆,例如通过在农杆菌溶液中水浴划破的叶子或叶节,随后在合适的培养基中培养之。
除了转化体细胞、然后再生为完整植株以外,还有可能转化植物分生组织的细胞,特别是发育成配子的那些细胞。在这种情况下,转化的配子循着天然植物的发育而产生转基因植物。因此,例如,用农杆菌处理拟南芥的种子,并从发育中的植物获得种子,其中一定比例经转化因而是转基因的[Feldman,KA和Marks MD(1987).Mol Gen Genet 208:274-289;Feldmann K(1992).在C Koncz,N-H Chua和J Shell编辑Methods inArabidopsis Research.Word Scientific,Singapore,第274-289页]。可选方法基于荧光的反复去除以及莲座叶中心切除部位与转化农杆菌一起进行的孵育,由此在随后的时间点同样能够获得转化的种子(Chang(1994).PlantJ.5:551-558;Katavic(1994).Mol Gen Genet,245:363-370)。然而,特别有效的方法是真空渗透法,及其改良法如“浸花法”(floral dip)。对于拟南芥的真空渗透,用农杆菌悬液减压处理完整植株[Bechthold,N(1993).C RAcad Sci Paris Life Sci,316:1194-1199],而对于“浸花法”,将发育中的花组织与表面活性剂处理的农杆菌悬液一起短暂孵育[Clough,SJ und Bent,AF(1998).The Plant J.16,735-743]。在两种情况下均收获一定比例的转基因种子,且可通过在上述选择性条件下培养而将这些种子与非转基因种子区分开来。另外,质体的稳定转化是有利的,因为质体在多数作物中母系遗传,降低或消除了转基因通过花粉流失的风险。叶绿体基因组的转化通常通过Klaus等,2004[Nature Biotechnology 22(2),225-229]系统展示的方法实现。简言之,将待转化的序列与可选择的标记基因一起克隆到同源于叶绿体基因组的侧翼序列之间。这些同源侧翼序列指导转基因位点特异性整合到质体中。质体转化已在许多不同的植物物种中描述,且综述可摘自Bock(2001)Transgenic plastids in basic research and plant biotechnology.J Mol Biol.2001年9月21日;312(3):425-38或Maliga,P(2003)Progresstowards commercialization of plastid transformation technology.TrendsBiotechnol.21,20-28。其他生物技术方法最近被报道为不含标记的质体转化体的形式,这可以通过瞬时共合体标记基因产生(Klaus等,2004,NatureBiotechnology 22(2),225-229)。
遗传修饰的植物细胞能够通过技术人员熟悉的所有方法再生。合适的方法可见于上述S.D.Kung和R.Wu、Potrykus或者和Willmitzer的出版物。
在DNA转移和再生之后,可评估推定转化的植物,例如用Southern分析评价目的基因的存在、拷贝数和/或基因组构造。可选的或额外地,可用Northern和/或Western分析(即RNA和/或蛋白质印迹)和/或定量PCR监测新引入DNA的表达水平,这类技术都是本领域普通技术人员所熟知的。
产生的转化植物可以通过多种方式繁殖,如通过克隆繁殖或经典的育种技术。例如,第一代(或T1)转化的植物可自交,并选择纯合的第二代(或T2)转化体,而T2植物可进一步通过经典育种技术繁殖。
产生的转化生物体可以有多种形式。例如,它们可以是转化细胞和非转化细胞的嵌合体;克隆的转化体(例如经过转化包含表达盒的所有细胞);转化和非转化组织的嫁接体(例如在植物中,转化的根茎嫁接到非转化的接穗上)。
本发明显然延及由本文所述任何方法产生的任何植物细胞或植物,以及所有的植物部分和其繁殖体。本发明还涵盖由任意上述方法产生的初级转化或转染的细胞、组织、器官或整个植物的后代,所述后代的唯一要求是与本发明方法产生的亲本呈现相同的基因型和/或表型特性。本发明也包括含有分离的Ste20样核酸或其变体的宿主细胞。本发明优选的宿主细胞是植物细胞。本发明也延及植物可收获的部分,例如但不限于:种子、叶、果实、花、茎、根茎、块茎和球茎。本发明还涉及由这样的植物的可收获部分直接衍生的产品,如干丸或干粉、油类、脂肪和脂肪酸、淀粉或蛋白质。
本发明还包括Ste20样核酸或其变体的用途以及Ste20样多肽或其同源物的用途。
一类这样的用途涉及提高植物的生长特性,特别是提高产率,尤其是种子产率。种子产率包括如下一项或多项:增加的种子总重量、增加的饱满种子数以及增加的收获指数。
可以在育种程序中使用Ste20样核酸或其变体或者Ste20样多肽或其同源物,其中鉴定可以遗传地连接于Ste20样基因或其变体的DNA标记。可以使用Ste20样核酸/基因或其变体或者Ste20样多肽或其同源物界定分子标记。然后可以在育种程序中使用此DNA或蛋白质标记,以选择产率增加的植物。例如,Ste20样基因或其变体可以是SEQ ID NO:1、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31和SEQ ID NO:33中任一所示的核酸。
Ste20样核酸/基因的等位基因变体也可以用于标记辅助的育种程序。这类育种程序有时需要使用例如EMS诱变,通过植物诱变处理引入等位基因变体;可选地,此程序可以以收集无意产生的所谓“天然”起源的等位基因变体开始。然后通过例如PCR鉴定等位基因变体。随后是选择步骤,用以选择所讨论序列的较好等位基因变体,所述等位基因变体提供增加的产率。一般通过监测含有所研究序列不同等位基因变体的植物的生长行为来进行选择,例如SEQ ID NO:1、SEQ ID NO:11、SEQ ID NO:13、SEQID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31和SEQ ID NO:33中任一的不同等位基因变体。可以在温室或田地中监测生长行为。更多任选的步骤包括将经鉴定含有较好等位基因变体的植物与其他植物杂交。例如,可使用这种方法产生目的表型特征的组合。
Ste20样核酸或其变体还可以作为探针,用于对为那些基因连锁性状的一部分并作为其标志物的基因进行遗传和物理作图。这样的信息可以在植物育种中使用,以得到具有期望表型的品系。Ste20样核酸或其变体的这类应用仅需要长至少15个核苷酸的核酸序列。Ste20样核酸或其变体可以用作限制性片段长度多态性(RFLP)标记。可用Ste20样核酸或其变体探测限制酶切消化的植物基因组DNA的Southern印迹(Sambrook J,FritschEF和Maniatis T(1989)《分子克隆:实验室手册》)。随后使用计算机程序如MapMaker(Lander等(1987)Genomics 1:174-181)对产生的带型进行遗传分析,以构建遗传图谱。此外,可以使用核酸探测含有一组个体的限制性内切酶处理的基因组DNA的Southern印迹,所述一组个体为代表明确的遗传交叉(genetic cross)的亲本和子代的一组个体。记录DNA多态性的分离,并用于计算在先前用此群体获得的遗传图谱中Ste20样核酸或其变体的位置(Botstein等(1980)Am.J.Hum.Genet.32:314-331)。
在遗传作图中使用的植物基因衍生探针的产生和用途描述于Bematzky和Tanksley(1986)Plant Mol.Biol.Reporter 4:37-41中。众多出版物中描述过用上述方法或其变通形式对特定cDNA克隆进行遗传作图。例如,可以使用F2杂交群体、回交群体、随机交配群体、近亲同基因系和其它个体组作图。这类方法是本领域技术人员众所周知的。
核酸探针也可以用于物理作图(即在物理图谱上安置序列;见Hoheisel等,在Non-mammalian Genomic Analysis:A Practical Guide,Academicpress 1996,第319-346页,及其中引用的参考文献)。
在另一实施方案中,核酸探针可用于直接荧光原位杂交(FISH)作图(Trask(1991)Trends Genet.7:149-154)。尽管目前FISH作图的方法倾向用于大的克隆(几个kb到几百个kb;见Laan等(1995)Genome Res.5:13-20),但是灵敏性的提高允许在FISH作图中应用较短的探针。
用于遗传和物理作图的多种基于核酸扩增的方法可以使用所述核酸进行。实例包括等位基因特异性扩增(Kazazian(1989)J.Lab.Clin.Med11:95-96)、PCR扩增片段的多态性(CAPS;Sheffield等(1993)Genomics16:325-332)、等位基因特异性连接(Landegren等(1988)Science 241:1077-1080)、核苷酸延伸反应(Sokolov(1990)Nucleic Acid Res.18:3671)、放射杂交作图(Walter等(1997)Nat.Genet.7:22-28)和Happy作图(Dear和Cook(1989)Nucleic Acid Res.17:6795-6807)。为实施这些方法,使用核酸序列设计和产生用于扩增反应或引物延伸反应的引物对。这类引物的设计是本领域技术人员众所周知的。使用基于PCR的遗传作图的方法,可能需要鉴定跨越相应于本发明核酸序列区域作图的亲本之间的DNA序列差异。然而,这对作图方法通常不是必要的。
根据本发明的方法得到如前所述产率提高的植物。这些有利的生长特性还可以组合其它经济上有利的性状,如其他提高产率的性状、对多种胁迫的耐受性、改良多种构造特征和/或生化和/或生理学特征的性状。
附图说明
现参考以下附图描述本发明,其中:
图1显示了Ste20样多肽的典型结构域结构。蛋白质的N-末端包含Ser/Thr激酶结构域。最最C-末端的结构域(浅灰色)具有卷曲螺旋结构,这通常但不总是存在。
图2显示了双元载体p070,用于在稻中表达处于GOS2启动子(内参PRO0129)控制之下的拟南芥Ste20样编码序列。
图3详述了用于实施本发明方法的序列实例。
实施例
现参考以下实施例描述本发明,所述实施例仅意在举例说明。除非另外说明,重组DNA技术根据描述于(Sambrook(2001)《分子克隆:实验室手册》,第三版,冷泉港实验室出版,冷泉港,纽约)或者Ausubel等(1994),Current Protocols in Molecular Biology,Current Protocols第一卷和第二卷的标准方法执行。植物分子工作的标准材料和方法由R.D.D.Croy描述于Plant Molecular Biology Labfax(1993),BIOS Scientific Publications Ltd(UK)和Blackwell Scientific Publications(UK)出版。
实施例1:SEQ ID NO:2的Ste20样蛋白质的同源物的鉴定及其相似性/同一性的确定
利用数据库序列搜索工具如基本局部比对工具(BLAST)(Altschul等(1990)J.Mol.Biol.215:403-410;和Altschul等(1997)Nucleic Acids Res.25:3389-3402),在美国国家生物技术信息中心Entrez核苷酸数据库维护的序列中鉴定本发明方法所用核酸序列的相关序列(全长cDNA、EST或基因组)。通常BLAST程序通过将核酸或多肽序列与序列数据库进行比较,以及通过计算匹配的统计学显著性,用于寻找序列之间具有局部相似性的区域。例如,对本发明核酸所编码的多肽运用TBLASTN算法,使用缺省设置,开启过滤器,以忽略低复杂度序列。分析输出视窗为两两比较,并根据概率分值(E值)排序,其中分值反映特定比对偶然发生的概率(E值越低,命中事件的显著性越高)。除了E值之外,还对比较进行同一性百分比记分。同一性百分比是指两比较核酸(或多肽)序列之间在特定长度上的相同核苷酸(或氨基酸)数。在有些情况下,可以调整缺省参数以更改搜索的严格度。
稻序列和来自多种植物物种的EST序列也可以获自其他数据库,如KOME(基于信息的稻分子生物学百科全书(Knowledge-based OryzaMolecular biological Encyclopedia);Kikuchi等,Science 301,376-379,2003)、Sputnik(Rudd,S.,Nucleic Acids Res.,33:D622-D627,2005)或真核基因直系同源物数据库(EGO,由基因组研究所(The Institute for GenomicResearch)主办)。这些数据库可用BLAST工具检索。SEQ ID NO:11至SEQID NO:34作为SEQ ID NO:2同源物核酸和蛋白质序列,并且是利用SEQID NO:2作为查询从上述数据库中获得的。
利用MatGAT(矩阵全局比对工具)软件(BMC Bioinformatics.20034:29.MatGAT:an application that generates similarity/identity matricesusing protein or DNA sequences.Campanella JJ,Bitincka L,Smalley J;由Ledion Bitincka主办的软件),来确定全长序列以及Ste20样蛋白质激酶结构域序列之间的全局相似性和同一性百分比。MatGAT软件无需对数据进行预比对,即可产生DNA或蛋白质序列的相似性/同一性矩阵。该程序利用Myers和Miller全局比对算法(空位开放罚分为11,而空位延伸罚分为1)进行一系列的两两比对,利用例如Blosum 62(对于多肽而言)计算相似性和同一性,然后将结果排列成距离矩阵。序列相似性示于对角线下方,而序列同一性示于对角线上方。SEQ ID NO:2的序列如矩阵编号1所示。
Ste20样蛋白质的激酶结构域利用SMART工具描述,且所得的序列列于表3。
表3:多个SEQ ID No中的激酶结构域列表
  SEQ ID NO:2   YEIICKIGVGVSASVYKAICIPMNSMVVAIKAIDLDQSRADFDSLRRETKTMSLLSHPNILNAYCSFTVDRCLWVVMPFMSCGSLHSIVSSSFPSGLPENCISVFLKETLNAISYLHDQGHLHRDIKAGNILVDSDGSVKLADFGVSASIYEPVTSSSGTTSSSLRLTDIAGTPYWMAPEVVHSHTGYGFKADIWSFGITALELAHGRPPLSHLPPLKSLLMKITKRFHFSDYEINTSGSSKKGNKKFSKAFREMVGLCLEQDPTKRPSAEKLLKHPFF
  SEQ ID NO:12   YKLYEEIGDGVSATVHRALCIPLNVVVAIKVLDLEKCNNDLDGIRREVQTMSLINHPNVLQAHCSFTTGHQLWVVMPYMAGGSCLHIIKSSYPDGFEEPVIATLLRETLKALVYLHAHGHIHRDVKAGNILLDSNGAVKLADFGVSACMFDTGDRQRSRNTFVGTPCWMAPEVMQQLHGYDFKADVWSFGITALELAHGHAPFSKYPPMKVLLMTLQNAPPGLDYERDKRFSKAFKEMVGTCLVKDPKKRPTSEKLLKHPFF
  SEQ ID NO:14   YELFEEVGEGVSATVYRARCIALNEIVAVKILDLEKCRNDLETIRKEVHIMSLIDHPNLLKAHCSFIDSSSLWIVMPYMSGGSCFHLMKSVYPEGLEQPIIATLLREVLKALVYLHRQGHIHRDVKAGNILIHSKGVVKLGDFGVSACMFDSGERMQTRNTFVGTPCWMAPEVMQQLDGYDFKYLAHGHAPFSKYPPMKVLLMTLQNAPPRLDYDRDKKFSKSFRELIAACLVKDPKKRPTAAKLLKHPFF
  SEQ ID NO:16   YEILEEIGDGVYRARCILLDEIVAIKIWNLEKCTNDLETIRKEVHRLSLIDHPNLLRVHCSFIDSSSLWIVMPFMSCGSSLNIMKSVYPNGLEEPVIAILLREILKALVYLHGLGHIHRNVKAGNVLVDSEGTVKLGDFEVSASMFDSVERMRTSSENTFVGNPRRMAPEKDMQQVDGYDFKVDIWSFGMTALELAHGHSPTTVLPLNLQNSPFPNYEEDTKFSKSFRELVAACLIEDPEKRPTASQLLEYPFL
  SEQ ID NO:18   YTLYEFIGQGVSALVHRALCIPFDEVVAIKILDFERDNCDLNNISREAQTMMLVDHPNVLKSHCSFVSDHNLWVIMPYMSGGSCLHILKAAYPDGFEEAIIATILREALKGLDYLHQHGHIHRDVKAGNILLGARGAVKLGDFGVSACLFDSGDRQRTRNTFVGTPCWMAPEVMEQLHGYDFKADIWSFGITGLELAHGHAPFSKYPPMKVLLMTLQNAPPGLDYERDKKFSRSFKQMIASCLVKDPSKRPSAKKLLKHSFF
  SEQ ID NO:20   YKLMEEVGYGASAVVHRAIYLPTNEVVAIKSLDLDRCNSNLDDIRREAQTMTLIDHPNVIKSFCSFAVDHHLWVVMPFMAQGSCLHLMKAAYPDGFEEAAICSMLKETLKALDYLHRQGHIHRDVKAGNILLDDTGEIKLGDFGVSACLFDNGDRQRARNTFVGTPCWMAPEVLQPGSGYNSKADIWSFGITALELAHGHAPFSKYPPMKVLLMTIQNAPPGLDYDRDKKFSKSFKELVALCLVKDQTKRPTAEKLLKHSFF
  SEQ ID NO:22   YKLMEEIGHGASAVVYRAIYLPTNEVVAIKCLDLDRCNSNLDDIRRESQTMSLIDHPNVIKSFCSFSVDHSLWVVMPFMAQGSCLHLMKTAYSDGFEESAICCVLKETLKALDYLHRQGHIHRDVKAGNILLDDNGEIKLGDFGVSACLFDNGDRQRARNTFVGTPCWMAPEVLQPGNGYNSKADIWSFGITALELAHGHAPFSKYPPMKVLLMTIQNAPPGLDYDRDKKFSKSFKEMVAMCLVKDQTKRPTAEKLLKHSCF
  SEQ ID NO:24   YRLLCKIGSGVSAVVYKAACVPLGSAVVAIKAIDLERSRANLDEVWREAKAMALLSHRNVLRAHCSFTVGSHLWVVMPFMAAGSLHSILSHGFPDGLPEQCIAVVLRDTLRALCYLHEQGRIHRDIKAGNILVDSDGSVKLADFGVSASIYETAPSTSSAFSGPINHAPPPSGAALSSSCFNDMAGTPYWMAPEVIHSHVGYGIKADIWSFGITALELAHGRPPLSHLPPSKSMLMRITSRVRLEVDASSSSSEGSSSAARKKKKFSKAFKDMVSSCLCQEPAKRPSAEKLLRHPFF
  SEQ ID NO:26   YKLCEEVGDGVSATVYKALCIPLNIEVAIKVLDLEKCSNDLDGIRREVQTMSLIDHPNLLRAYCSFTNGHQLWVIMPYMAAGSALHIMKTSFPDGFEEPVIATLLREVLKALVYLHSQGHIHRDVKAGNILIDTNGAVKLGDFGVSACMFDTGNRQRARNTFVGTPCWMAPEVMQQLHGYDYKADIWSFGITALELAHGHAPFSKYPPMKVLLMTLQNAPPGLDYERDKRFSKSFKDLVATCLVKDPRKRPSSEKLLKHSFF
  SEQ ID NO:28   YELYEEIGQGVSAIVYRSLCKPLDEIVAVKVLDFERTNSDLWLVVMQVGYTRIVAIYVPPLDLSKMIVTRICLTQNNIMREAQTMILIDQPNVMKAHCSFTNNHSLWVVMPYMAGGSCLHIMKSVYPDGFEEAVIATVLREVLKGLEYLHHHGHIHRDVKAGNILVDSRGVVKLGDFGVSACLFDSGDRQRARNTFVGTPCWMAPEVMEQLHGYDFKADIWSFGITALELAHGHAPFSKFPPMKVLLMTLQNAPPGLDYERDKKFSRHFKQMVAMCLVKDPSKRPTAKKLLKQPFF
  SEQ ID NO:30   YQLMEEVGYGAHAVVYRALFVPRNDVVAVKCLDLDQLNNNIDEIQREAQIMSLIEHPNVIRAYCSFVVEHSLWVVMPFMTEGSCLHLMKIAYPDGFEEPVIGSILKETLKALEYLHRQGQIHRDVKAGNILVDNAGIVKLGDFGVSACMFDRGDRQRSRNTFVGTPCWMAPEVLQPGTGYNFKADIWSFGITALELAHGHAPFSKYPPMKVLLMTLQNAPPGLDYDRDRRFSKSFKEMVAMCLVKDQTKRPTAEKLLKHSFF
  SEQ ID NO:32   YRLLEEVGYGANAVVYRAVFLPSNRTVAVKCLDLDRVNSNLDDIRKEAQTMSLIDHPNVIRAYCSFVVDHNLWVIMPFMSEGSCLHLMKVAYPDGFEEPVIASILKETLKALEYLHRQGHIHRDVKRNIIQAGNILMDSPGIVKLGDFGVSACMFDRGDRQRSRNTFVGTPCWMAPEVLQPGAGYNFKKYVSNHLFTNLIWLFKISLRGKNSNYHKNTGNKVLLMTLQNAPPGLDYDRDKRFSKSFKEMVAMCLVKDQTKRPTAEKLLKHSFF
  SEQ ID NO:34   YKIVDEIGAGNSAVVYKAICIPINSTPVAIKSIDLDRSRPDLDDVRREAKTLSLLSHPNILKAHCSFTVDNRLWVVMPFMAGGSLQSIISHSFQNGLTEQSIAVILKDTLNALSYLHGQGHLHRDIKSGNILVDSNGLVKLADFGVSASIYESNNSVGACSSYSSSSSNSSSSHIFTDFAGTPYWMAPEVIHSHNGYSFKADIWSFGITALELAHGRPPLSHLPPSKSLMLNITKRFKFSDFDKHSYKGHGGSNKFSKAFKDMVALCLNQDPTKRPSAEKLLKHSFF
全长序列的MATGAT分析结果示于表4,而Ste20样蛋白质激酶结构域的结果示于表5。对角线上方(粗体)出同一性百分比,而对角线下方(标准字体)给出相似性百分比。SEQ ID NO:2的Ste20样旁系同源物和直系同源物激酶结构域之间的同一性百分比范围为44%(对于SEQ ID NO:28而言)至71%(对于SEQ ID NO:34而言)。
Figure A20068003235700491
实施例2:Ste20样基因克隆
使用拟南芥幼苗cDNA文库(Invitrogen,Paisley,UK)作为模板,通过PCR扩增拟南芥Ste20样基因。从幼苗提取的RNA经反转录后,将cDNA克隆进pCMV Sport 6.0中。该库平均插入物大小为1.5kb,并且原始克隆数为1.59×107cfu。在6×1011cfu/ml的第一次扩增之后,确定原始滴度为9.6×105cfu/ml。提取质粒之后,将200ng模板用于50μl PCR混合物中。PCR扩增所用引物为Prm03186(SEQ ID NO:3,有义,启示密码子为粗体,AttB1位点为斜体:
5’-
Figure A20068003235700501
3’)和
Prm03187(SEQ ID NO:4,反向互补,AttB2位点为斜体:
5’
Figure A20068003235700502
3’),
其包括Gateway重组的AttB位点。在标准条件下使用Hifi Taq DNA聚合酶进行PCR。同样用标准方法扩增和纯化1532bp的PCR片段(包括attB位点)。接着进行Gateway操作的第一步,即BP反应,在此期间将PCR片段与pDONR201质粒在体内重组以产生(根据Gateway术语)“进入克隆”p068。作为Gateway技术一部分的质粒pDONR201购自Invitrogen。
实施例3:载体构建
随后使用进入克隆p068和用于稻转化的指定载体p00640一起进行LR反应。此载体在T-DNA边界内包含这样的功能元件:植物可选择的标记;可筛选的标记表达盒;旨在与已克隆到进入克隆中的目的序列进行LR体内重组的Gateway表达盒。用于组成型表达的稻GOS2启动子(SEQ ID NO:5第1至2193位核苷酸)(PRO0129)位于此Gateway盒的上游。
LR重组步骤之后,将所产生的表达载体Ste20样p070(图2)转化进入农杆菌菌株LBA4044,随后转化进入稻植物。使转化的稻植物生长,随后研究实施例4中描述的参数。
实施例4:处于稻GOS2启动子控制之下的Ste20样的评估及结果
大约产生了15到20个独立的T0稻转化体。初级转化体由组织培养室转移到温室生长并收获T1种子。5个事件得以保留,其中T1代发生转基因存在/缺乏的3∶1分离。通过监测可视标记的表达,在这些事件中各选出大约10个含转基因(杂合子和纯合子)的T1幼苗,以及大约10个缺少转基因(无效合子)的T1幼苗。将所选择的T1植物转移到温室中。每个植物给予一个独特的条形码标记,以将表型数据与对应植物明确联系起来。所选择的T1植物在10cm直径花盆的土壤中在下列环境设置下生长:光周期=11.5小时、日光强度=30,000勒克斯或以上、日间温度=28℃、夜间温度=22℃、相对湿度=60-70%。转基因植物和相应的无效合子在随机位置上并排生长。从播种期直到成熟期,使植物几次通过数字成像箱。在每个时间点上对每株植物从至少6个不同的角度取得数字图像(2048×1536像素,1600万色)。
收获成熟的初级圆锥花序、装袋并贴上条形码标记,然后在37℃烤箱中干燥三天。随后将圆锥花序脱粒并且收集所有的种子。使用鼓风装置将饱满谷壳和空壳分开。在分离后,使用可商购的计数仪器对两批种子进行计数。弃去空壳。在分析天平上称重饱满的谷壳,并使用数字成像测量种子的截面积。此方法得到一组下面描述的种子相关参数:
饱满种子数通过计数分离步骤之后剩余的饱满壳数来确定。种子总产率通过称重从植物收获的全部饱满的壳来测量。千粒重(TKW)从已计数的饱满种子数及其总重外推得到。收获指数定义为种子总重量与地上面积(mm2)的比值乘以系数106。这些参数是使用图像分析软件,以自动方式从数字图像中得到并且进行统计分析的。利用客户定制装置测量单个种子参数(包括宽度、长度、面积、重量),所述装置由两个主要组件即称重装置和成像装置构成,连接于进行图像分析的软件。
将对不平衡设计进行修正的双因子ANOVA(方差分析)用作统计模型,对植物表型特征进行全面评估。对用所述基因转化的所有植株的所有事件的所有测量参数进行F检验。进行F检验以检查基因对所有转化事件的效应,并检验基因的总效应,亦称为“整体基因效应”。如果F检验的值显示数据具有显著性,那么结论是有“基因”效应,这意味着不仅仅是基因的存在或定位引起了效应。真实整体基因效应的显著性阈值设置为F检验的5%概率水平。
为了检查基因在事件中的效应,即品系特异性效应,在每一事件中使用来自转基因植物和相应无效植物的数据集进行t检验。“无效植物”或“无效分离子”或“无效合子”是以与转基因植物相同的方式处理、但是转基因已经从中分离的植物。也可以将无效植物描述为纯合的阴性转化植物。将t检验的显著性阈值设定为10%概率水平。一些事件的结果可以高于此阈值或低于此阈值。这是基于这种假设,即基因可以仅在基因组中的某些位置中具有效应,且这种位置依赖性效应的发生不是罕见的。本文此类基因效应也称为“基因的品系效应(line effect of the gene)”。通过将t值与t分布比较得到p值,或者可选地通过将F值与F分布比较得到p值。p值则给出了无效假设(即不存在转基因效应)正确的概率。
在第一个实验中得到的Ste20数据在使用T2植物的第二个实验中得到证实。选择了具有正确表达模式的4个品系用于进一步分析。通过监控标记表达来筛选T1中来自阳性植物(杂合子和纯合子)的一批种子。对于每一个所选事件,随后保存几批杂合种子用于进行T2评估。在每批种子中,在温室中种植等量的阳性和阴性植物用于评估。
在T2代中评估了总计120个Ste20转化植物,即每个事件的30个植物中,有15个为转基因阳性而15个为阴性。
由于进行的两个实验具有重叠事件,因此进行组合分析。这可用于检查两个实验中效应的一致性,并且如果情况果真如此,其可用于从两个实验中收集证据从而增加结论的可信性。使用的方法是考虑到数据的多级结构(即实验-事件-分离子)的混合模型方法。通过对比卡方分布的似然比测试来获得p值。
实施例5:Ste20转化体的评估:产率相关参数的测量
当如上所述对种子进行分析时,发明人发现,与缺乏Ste20转基因的植物相比,用Ste20基因构建体转化的植物具有更高的种子产率,表达为饱满种子数、种子总重量和收获指数。
T1代植物所获得的结果总结于表6:
表6
  %差异   p值
  饱满种子数   +38   0.0003
  种子总重量   +38   0.0004
  收获指数   +42   0.0001
T2代再次获得这些阳性结果。表6的数据显示了由T2代个体品系的数据计算得到的饱满种子数、种子总重量和收获指数的整体增长百分比,以及相应的p值。在与T1代结果的组合分析中,对这些T2数据进行了重新评估,并且获得的p值显示所观察到的效应具有显著性。
表7
Figure A20068003235700531
序列表
<110>克罗普迪塞恩股份有限公司
<120>Ste20样基因表达对植物产率的提高
<130>PF57841
<150>EP 05106135.6
<151>2005-07-06
<150>US 60/697,338
<151>2005-07-08
<160>34
<170>PatentIn version 3.3
<210>1
<211>1554
<212>DNA
<213>拟南芥(Arabidopsis thaliana)
<400>1
cataacaatt caataagcaa gagtgtactc atcttctttc tatttatggc tcggaacaag    60
ctcgagttcc ctcttgatgc tgaagcctac gagatcatct gcaagatagg cgttggtgtt   120
agtgcttcgg tctacaaggc catatgcatt ccgatgaact caatggtagt tgctatcaaa   180
gccatcgatc ttgatcagtc gcgggctgac tttgacagtc ttcgccgtga aaccaagacg   240
atgtctctgc tttctcatcc gaatattctc aatgcttatt gttcattcac cgttgatcga   300
tgtctctggg tggttatgcc attcatgtct tgtggctctc ttcattcgat cgtctcttcg   360
tcttttccaa gtgggttacc agaaaactgc atttccgtct tcctcaagga aactctgaat   420
gcaatctcgt atcttcacga tcagggtcat ttgcaccgtg acatcaaggc aggtaacatt   480
ctggtagatt ctgatggatc cgtgaagctc gctgatttcg gagtatctgc atccatctat   540
gaacccgtga catcttcctc tggaacaaca tcttcttctt taaggttaac tgatatagcg   600
ggaacaccgt attggatggc tccggaagtg gttcattccc acacagggta tggtttcaaa   660
gcagacattt ggtctttcgg gataacagcg ttggagttag cacatggaag acctccgtta   720
tctcacttac cgccgttgaa gagtctgctc atgaagatca ccaaaaggtt tcatttttct   780
gattacgaga tcaatacgag cggaagcagc aaaaagggta acaagaagtt ctcaaaagct   840
tttagagaaa tggttggttt gtgtctagag caagatccta ctaaaagacc atcggcagag   900
aagttgttga agcatccttt tttcaagaac tgtaaaggac tcgactttgt ggtcaagaac   960
gtgttgcata gcttgtcaaa cgcagagcag atgtttatgg agagtcagat tttgatcaag  1020
agtgttggag atgatgatga agaagaagaa gaagaagacg aagagatagt gaagaataga  1080
agaatcagtg ggtggaattt ccgtgaagac gatctccaac ttagtccagt gttcccagct  1140
actgaatcag actcttctga gtccagtcca cgtgaagaag atcaatcaaa agacaaaaag  1200
gaagacgata acgtcacaat aacggggtat gaactcggtt taggtttgtc gaacgaggaa  1260
gctaagaacc aagaaggtga ggttgttggg tttgataaag atttggtgtt agagaaactg  1320
aaagtgttga agaaaagttt agagcatcaa agagcaagag tgtcgattat aatcgaagca  1380
ttgagtgggg acaaggaaga gaagagcaga gaagaagagc ttctagagat ggtggagaag  1440
ttaaagattg aattggaaac tgagaagcta aagaccttgc gtgctgataa agatagtgtt  1500
ttgggttaac tattctaaac ttgttaatat tttttttcta tatgctaaaa ttat        1554
<210>2
<211>487
<212>PRT
<213>拟南芥
<400>2
Met Ala Arg Asn Lys Leu Glu Phe Pro Leu Asp Ala Glu Ala Tyr Glu
1               5                   10                  15
Ile Ile Cys Lys Ile Gly Val Gly Val Ser Ala Ser Val Tyr Lys Ala
            20                  25                  30
Ile Cys Ile Pro Met Asn Ser Met Val Val Ala Ile Lys Ala Ile Asp
        35                  40                  45
Leu Asp Gln Ser Arg Ala Asp Phe Asp Ser Leu Arg Arg Glu Thr Lys
    50                  55                  60
Thr Met Ser Leu Leu Ser His Pro Asn Ile Leu Asn Ala Tyr Cys Ser
65                  70                  75                  80
Phe Thr Val Asp Arg Cys Leu Trp Val Val Met Pro Phe Met Ser Cys
                85                  90                  95
Gly Ser Leu His Ser Ile Val Ser Ser Ser Phe Pro Ser Gly Leu Pro
            100                 105                 110
Glu Asn Cys Ile Ser Val Phe Leu Lys Glu Thr Leu Asn Ala Ile Ser
        115                 120                 125
Tyr Leu His Asp Gln Gly His Leu His Arg Asp Ile Lys Ala Gly Asn
    130                 135                 140
Ile Leu Val Asp Ser Asp Gly Ser Val Lys Leu Ala Asp Phe Gly Val
145                 150                 155                 160
Ser Ala Ser Ile Tyr Glu Pro Val Thr Ser Ser Ser Gly Thr Thr Ser
                165                 170                 175
Ser Ser Leu Arg Leu Thr Asp Ile Ala Gly Thr Pro Tyr Trp Met Ala
            180                 185                 190
Pro Glu Val Val His Ser His Thr Gly Tyr Gly Phe Lys Ala Asp Ile
        195                 200                 205
Trp Ser Phe Gly Ile Thr Ala Leu Glu Leu Ala His Gly Arg Pro Pro
    210                 215                 220
Leu Ser His Leu Pro Pro Leu Lys Ser Leu Leu Met Lys Ile Thr Lys
225                 230                 235                 240
Arg Phe His Phe Ser Asp Tyr Glu Ile Asn Thr Ser Gly Ser Ser Lys
                245                 250                 255
Lys Gly Asn Lys Lys Phe Ser Lys Ala Phe Arg Glu Met Val Gly Leu
            260                 265                 270
Cys Leu Glu Gln Asp Pro Thr Lys Arg Pro Ser Ala Glu Lys Leu Leu
        275                 280                 285
Lys His Pro Phe Phe Lys Asn Cys Lys Gly Leu Asp Phe Val Val Lys
    290                 295                 300
Asn Val Leu His Ser Leu Ser Asn Ala Glu Gln Met Phe Met Glu Ser
305                 310                 315                 320
Gln Ile Leu Ile Lys Ser Val Gly Asp Asp Asp Glu Glu Glu Glu Glu
                325                 330                 335
Glu Asp Glu Glu Ile Val Lys Asn Arg Arg Ile Ser Gly Trp Asn Phe
            340                 345                 350
Arg Glu Asp Asp Leu Gln Leu Ser Pro Val Phe Pro Ala Thr Glu Ser
        355                 360                 365
Asp Ser Ser Glu Ser Ser Pro Arg Glu Glu Asp Gln Ser Lys Asp Lys
    370                 375                 380
Lys Glu Asp Asp Asn Val Thr Ile Thr Gly Tyr Glu Leu Gly Leu Gly
385                 390                 395                 400
Leu Ser Asn Glu Glu Ala Lys Asn Gln Glu Gly Glu Val Val Gly Phe
                405                 410                 415
Asp Lys Asp Leu Val Leu Glu Lys Leu Lys Val Leu Lys Lys Ser Leu
            420                 425                 430
Glu His Gln Arg Ala Arg Val Ser Ile Ile Ile Glu Ala Leu Ser Gly
        435                 440                 445
Asp Lys Glu Glu Lys Ser Arg Glu Glu Glu Leu Leu Glu Met Val Glu
    450                 455                 460
Lys Leu Lys Ile Glu Leu Glu Thr Glu Lys Leu Lys Thr Leu Arg Ala
465                 470                 475                 480
Asp Lys Asp Ser Val Leu Gly
               485
<210>3
<211>52
<212>DNA
<213>人工序列
<220>
<223>引物:prm03186
<400>3
ggggacaagt ttgtacaaaa aagcaggctt cacaatggct cggaacaagc tc        52
<210>4
<211>56
<212>DNA
<213>人工序列
<220>
<223>引物:prm03187
<400>4
ggggaccact ttgtacaaga aagctgggta atagttaacc caaaacacta tcttta    56
<210>5
<211>3710
<212>DNA
<213>人工序列
<220>
<223>表达盒
<400>5
aatccgaaaa gtttctgcac cgttttcacc ccctaactaa caatataggg aacgtgtgct    60
aaatataaaa tgagacctta tatatgtagc gctgataact agaactatgc aagaaaaact   120
catccaccta ctttagtggc aatcgggcta aataaaaaag agtcgctaca ctagtttcgt   180
tttccttagt aattaagtgg gaaaatgaaa tcattattgc ttagaatata cgttcacatc   240
tctgtcatga agttaaatta ttcgaggtag ccataattgt catcaaactc ttcttgaata   300
aaaaaatctt tctagctgaa ctcaatgggt aaagagagag atttttttta aaaaaataga   360
atgaagatat tctgaacgta ttggcaaaga tttaaacata taattatata attttatagt   420
ttgtgcattc gtcatatcgc acatcattaa ggacatgtct tactccatcc caatttttat   480
ttagtaatta aagacaattg acttattttt attatttatc ttttttcgat tagatgcaag   540
gtacttacgc acacactttg tgctcatgtg catgtgtgag tgcacctcct caatacacgt   600
tcaactagca acacatctct aatatcactc gcctatttaa tacatttagg tagcaatatc   660
tgaattcaag cactccacca tcaccagacc acttttaata atatctaaaa tacaaaaaat   720
aattttacag aatagcatga aaagtatgaa acgaactatt taggtttttc acatacaaaa   780
aaaaaaagaa ttttgctcgt gcgcgagcgc caatctccca tattgggcac acaggcaaca   840
acagagtggc tgcccacaga acaacccaca aaaaacgatg atctaacgga ggacagcaag   900
tccgcaacaa ccttttaaca gcaggctttg cggccaggag agaggaggag aggcaaagaa   960
aaccaagcat cctcctcctc ccatctataa attcctcccc ccttttcccc tctctatata  1020
ggaggcatcc aagccaagaa gagggagagc accaaggaca cgcgactagc agaagccgag  1080
cgaccgcctt cttcgatcca tatcttccgg tcgagttctt ggtcgatctc ttccctcctc  1140
cacctcctcc tcacagggta tgtgcccttc ggttgttctt ggatttattg ttctaggttg  1200
tgtagtacgg gcgttgatgt taggaaaggg gatctgtatc tgtgatgatt cctgttcttg  1260
gatttgggat agaggggttc ttgatgttgc atgttatcgg ttcggtttga ttagtagtat  1320
ggttttcaat cgtctggaga gctctatgga aatgaaatgg tttagggtac ggaatcttgc  1380
gattttgtga gtaccttttg tttgaggtaa aatcagagca ccggtgattt tgcttggtgt  1440
aataaaagta cggttgtttg gtcctcgatt ctggtagtga tgcttctcga tttgacgaag  1500
ctatcctttg tttattccct attgaacaaa aataatccaa ctttgaagac ggtcccgttg  1560
atgagattga atgattgatt cttaagcctg tccaaaattt cgcagctggc ttgtttagat  1620
acagtagtcc ccatcacgaa attcatggaa acagttataa tcctcaggaa caggggattc  1680
cctgttcttc cgatttgctt tagtcccaga attttttttc ccaaatatct taaaaagtca  1740
ctttctggtt cagttcaatg aattgattgc tacaaataat gcttttatag cgttatccta  1800
gctgtagttc agttaatagg taatacccct atagtttagt caggagaaga acttatccga  1860
tttctgatct ccatttttaa ttatatgaaa tgaactgtag cataagcagt attcatttgg  1920
attatttttt ttattagctc tcaccccttc attattctga gctgaaagtc tggcatgaac  1980
tgtcctcaat tttgttttca aattcacatc gattatctat gcattatcct cttgtatcta  2040
cctgtagaag tttctttttg gttattcctt gactgcttga ttacagaaag aaatttatga  2100
agctgtaatc gggatagtta tactgcttgt tcttatgatt catttccttt gtgcagttct  2160
tggtgtagct tgccactttc accagcaaag ttcatttaaa tcaactaggg atatcacaag  2220
tttgtacaaa aaagcaggct tcacaatggc tcggaacaag ctcgagttcc ctcttgatgc  2280
tgaagcctac gagatcatct gcaagatagg cgttggtgtt agtgcttcgg tctacaaggc  2340
catatgcatt ccgatgaact caatggtagt tgctatcaaa gccatcgatc ttgatcagtc  2400
gcgggctgac tttgacagtc ttcgccgtga aaccaagacg atgtctctgc tttctcatcc  2460
gaatattctc aatgcttatt gttcattcac cgttgatcga tgtctctggg tggttatgcc  2520
attcatgtct tgtggctctc ttcattcgat cgtctcttcg tcttttccaa gtgggttacc  2580
agaaaactgc atttccgtct tcctcaagga aactctgaat gcaatctcgt atcttcacga  2640
tcagggtcat ttgcaccgtg acatcaaggc aggtaacatt ctggtagatt ctgatggatc  2700
cgtgaagctc gctgatttcg gagtatctgc atccatctat gaacccgtga catcttcctc  2760
tggaacaaca tcttcttctt taaggttaac tgatatagcg ggaacaccgt attggatggc  2820
tccggaagtg gttcattccc acacagggta tggtttcaaa gcagacattt ggtctttcgg  2880
gataacagcg ttggagttag cacatggaag acctccgtta tctcacttac cgccgttgaa  2940
gagtctgctc atgaagatca ccaaaaggtt tcatttttct gattacgaga tcaatacgag  3000
cggaagcagc aaaaagggta acaagaagtt ctcaaaagct tttagagaaa tggttggttt  3060
gtgtctagag caagatccta ctaaaagacc atcggcagag aagttgttga agcatccttt  3120
tttcaagaac tgtaaaggac tcgactttgt ggtcaagaac gtgttgcata gcttgtcaaa  3180
cgcagagcag atgtttatgg agagtcagat tttgatcaag agtgttggag atgatgatga  3240
agaagaagaa gaagaagacg aagagatagt gaagaataga agaatcagtg ggtggaattt  3300
ccgtgaagac gatctccaac ttagtccagt gttcccagct actgaatcag actcttctga  3360
gtccagtcca cgtgaagaag atcaatcaaa agacaaaaag gaagacgata acgtcacaat  3420
aacggggtat gaactcggtt taggtttgtc gaacgaggaa gctaagaacc aagaaggtga  3480
ggttgttggg tttgataaag atttggtgtt agagaaactg aaagtgttga agaaaagttt  3540
agagcatcaa agagcaagag tgtcgattat aatcgaagca ttgagtgggg acaaggaaga  3600
gaagagcaga gaagaagagc ttctagagat ggtggagaag ttaaagattg aattggaaac  3660
tgagaagcta aagaccttgc gtgctgataa agatagtgtt ttgggttaac             3710
<210>6
<211>10
<212>PRT
<213>人工序列
<220>
<223>ste20标签序列
<220>
<221>MISC_FEATURE
<222>(2)..(2)
<223>Xaa可以是Thr或Asn
<220>
<221>MISC_FEATURE
<222>(4)..(4)
<223>Xaa可以是Tyr、Cys或Arg
<220>
<221>MISC_FEATURE
<222>(5)..(5)
<223>Xaa可以是Trp或Arg
<220>
<221>MISC_FEATURE
<222>(10)..(10)
<223>Xaa可以是Val或Lys
<400>6
Gly Xaa Pro Xaa Xaa Met Ala Pro Glu Xaa
1               5                   10
<210>7
<211>10
<212>PRT
<213>人工序列
<220>
<223>共有序列
<220>
<221>MISC_FEATURE
<222>(1)..(1)
<223>Xaa可以是Ser、His或Asn
<220>
<221>MISC_FEATURE
<222>(2)..(2)
<223>Xaa可以是Ile或Leu
<220>
<221>MISC_FEATURE
<222>(3)..(3)
<223>Xaa可以是Val、Ile、Leu或Met
<220>
<221>MISC_FEATURE
<222>(4)..(4)
<223>Xaa可以是Ser或Lys
<220>
<221>MISC_FEATURE
<222>(5)..(5)
<223>Xaa可以是Ser、His、Thr、Ala、Ile或Val
<220>
<221>MISC_FEATURE
<222>(6)..(6)
<223>Xaa可以是Ser、Gly、Val或Ala
<220>
<221>MISC_FEATURE
<222>(7)..(7)
<223>Xaa可以是Phe或Tyr
<220>
<221>MISC_FEATURE
<222>(8)..(8)
<223>Xaa可以是Pro或Gln
<220>
<221>MISC_FEATURE
<222>(9)..(9)
<223>Xaa可以是Ser、Asn、Asp或Glu
<400>7
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Gly
1               5                   10
<210>8
<211>9
<212>PRT
<213>人工序列
<220>
<223>共有序列
<220>
<221>MISC_FEATURE
<222>(1)..(1)
<223>Xaa可以是Val或Ile
<220>
<221>MISC_FEATURE
<222>(5)..(5)
<223>Xaa可以是Thr、Ash或Val
<220>
<221>MISC_FEATURE
<222>(8)..(8)
<223>Xaa可以是Gly或Ser
<220>
<221>MISC_FEATURE
<222>(9)..(9)
<223>Xaa可以是Phe或Ile
<400>8
Xaa His Ser His Xaa Gly Tyr Xaa Xaa
1               5
<210>9
<211>12
<212>PRT
<213>人工序列
<220>
<223>共有序列
<220>
<221>MISC_FEATURE
<222>(10)..(10)
<223>Xaa可以是Leu或Ser
<400>9
Arg Pro Pro Leu Ser His Leu Pro Pro Xaa Lys Ser
1               5                   10
<210>10
<211>8
<212>PRT
<213>人工序列
<220>
<223>共有序列
<400>10
Arg Arg Ile Ser Gly Trp Asn Phe
1               5
<210>11
<211>2772
<212>DNA
<213>拟南芥
<400>11
cagacgacag aaaagctaac cacaagagga ggagagaaac tcgataacaa acaagagaaa    60
gagaaagcga gattctaaaa tctaatctcg tgcttccaat tcaaataatt ttgtctcctt   120
agcggatcga tcgtagatta taaagctccg ccgtcgcctc cgccgcaatc gacggcggtg   180
tctacgtcgc tttcgtttcg tgcgtaacag gaggagcagc agcaaaataa gtcagcttaa   240
gtaacgccgt ctttgatttg acttgagata agtattttgg tgatatggca ttgatgatgt   300
ttccgcattt gctcgacgtt gacgaaaagt aaaatgctgg cgaattggaa gaaaccacat   360
acagattgat gctctcttca gtcgacctct tttgtaaatt tgttgaaact tacggggtcg   420
aaggtgtgta gcatatatgc tataagaaga ttataaagta aaaattatgg aatcgggttc   480
agagaaaaag ttccctctca atgcaaaaga ctacaagtta tatgaagaaa ttggagatgg   540
tgtcagtgcg actgtgcata gagctttgtg tataccgctt aatgtggtag ttgctatcaa   600
ggttcttgat ctggaaaagt gcaacaacga tctggatggg atccggagag aggtgcaaac   660
aatgagtctg atcaaccatc caaatgtgtt gcaagctcat tgctcattta ccaccggaca   720
ccagctttgg gttgtgatgc cttacatggc tggaggatct tgtctccata taattaagtc   780
ttcctatcca gatggatttg aggaacctgt tatcgctact ttacttcgtg agactctgaa   840
agctcttgta tatcttcatg ctcatgggca tatccacagg gatgtgaagg ctggaaacat   900
tttattggat tccaatggtg ccgttaagtt agcagacttt ggagtatcag cttgcatgtt   960
tgatacggga gatagacaac gttccagaaa tacatttgtt gggactccat gctggatggc  1020
tcctgaagtc atgcagcaac tacatggata tgatttcaaa gcagatgtat ggtcatttgg  1080
aataacagca cttgaattgg cacatggtca tgccccattt tccaaatatc cgccaatgaa  1140
ggttttgctg atgaccttac aaaatgcacc tcctggactt gactacgaga gagacaaaag  1200
attctcgaaa gccttcaagg aaatggtggg tacatgcctg gtgaaggacc caaagaagcg  1260
tccaacttca gaaaagcttt tgaaacaccc tttcttcaaa catgcacgtc cagctgatta  1320
cctggttaaa acaattctaa atggtcttcc tccattaggt gatcgctata gacaaataaa  1380
gtcgaaggaa gctgatctcc taatgcaaaa caaatctgaa tatgaagcgc acttatcaca  1440
gcaagagtat ataaggggaa taagcgcttg gaatttcaat ctcgaggacc taaaaactca  1500
agctgccctt atttcagatg atgatacttc acatgctgaa gagcccgatt tcaaccaaaa  1560
gcaatgtgaa agacaggatg aatctgctct ttcccctgaa agggctagca gctcagcaac  1620
agctcctagt caagatgacg aactgaatga tattcatgat ttagagagtt ctttcgcctc  1680
atttccaatc aaacctcttc aagcactaaa aggctgcttt gatatcagtg aggacgagga  1740
taatgcaact actcctgatt ggaaagatgc taatgtaaat tctggacaac agcttttaac  1800
aaaggcttcc attggatctt tggccgaaac cacgaaagaa gaggacactg cagcacaaaa  1860
cacttcttta ccacgtcatg tcatttctga acagaaaaaa tatttgagcg gttcaattat  1920
accagagagt actttctctc caaaaagaat cacatctgat gctgataggg agtttcaaca  1980
gcgtagatat caaacagagc ggagctacag cggatcatta taccgcacca agagagattc  2040
cgtggacgag acgtcagaag tcccgcatgt ggagcacaag ggacggttta aggtcacatc  2100
agcagatctg agtcccaagg gatctacaaa ctctacattc acaccattta gtggtggtac  2160
aagcagccct agttgcctca atgctacaac cgcctcaatc ctcccatcaa ttcagtcgat  2220
tttgcagcaa aatgctatgc aacgggaaga gattttgaga ctaatcaaat acttggagca  2280
aacctctgcc aagcaacctg gatcgcctga gacgaacgtc gatgacctat tgcagacgcc  2340
tcctgcaacc tcacgagaga gagaacttca gtctcaagtc atgctactac aacaaagctt  2400
ttccagccta acagaagaac taaagaaaca gaagcagaaa aatgggcagt tggagaatca  2460
gttgaacgca ttaacacaca gaaatgattg agtctcaaaa gccatcgaga caaggctgag  2520
agatacaact ggggatcttg agttaaaaaa acacaaaatt ccctttcaag gcaaaaagaa  2580
gaaatagaga agatttgtgt gctttatatt tctattgggt gtaatttgtt tgacaggttt  2640
atattatgtg acaactacta cagtgatttt cttatttttg gggaagtttt ccccactttt  2700
cttttttact tatttgtgtt ttatgatatg ctatgtaaac aaaatactat tgtttaatta  2760
tgtt tctgtg tg                                                     2772
<210>12
<211>674
<212>PRT
<213>拟南芥
<400>12
Met Glu Ser Ser Ser Glu Lys Lys Phe Pro Leu Asn Ala Lys Asp Tyr
1               5                   10                  15
Lys Leu Tyr Glu Glu Ile Gly Asp Gly Val Ser Ala Thr Val His Arg
            20                  25                  30
Ala Leu Cys Ile Pro Leu Asn Val Val Val Ala Ile Lys Val Leu Asp
        35                  40                  45
Leu Glu Lys Cys Asn Asn Asp Leu Asp Gly Ile Arg Arg Glu Val Gln
    50                  55                  60
Thr Met Ser Leu Ile Asn His Pro Asn Val Leu Gln Ala His Cys Ser
65                  70                  75                  80
Phe Thr Thr Gly His Gln Leu Trp Val Val Met Pro Tyr Met Ala Gly
                85                  90                  95
Gly Ser Cys Leu His Ile Ile Lys Ser Ser Tyr Pro Asp Gly Phe Glu
            100                 105                 110
Glu Pro Val Ile Ala Thr Leu Leu Arg Glu Thr Leu Lys Ala Leu Val
        115                 120                 125
Tyr Leu His Ala His Gly His Ile His Arg Asp Val Lys Ala Gly Asn
    130                 135                 140
Ile Leu Leu Asp Ser Asn Gly Ala Val Lys Leu Ala Asp Phe Gly Val
145                 150                 155                 160
Ser Ala Cys Met Phe Asp Thr Gly Asp Arg Gln Arg Ser Arg Asn Thr
                165                 170                 175
Phe Val Gly Thr Pro Cys Trp Met Ala Pro Glu Val Met Gln Gln Leu
            180                 185                 190
His Gly Tyr Asp Phe Lys Ala Asp Val Trp Ser Phe Gly Ile Thr Ala
        195                 200                 205
Leu Glu Leu Ala His Gly His Ala Pro Phe Ser Lys Tyr Pro Pro Met
    210                 215                 220
Lys Val Leu Leu Met Thr Leu Gln Asn Ala Pro Pro Gly Leu Asp Tyr
225                 230                 235                 240
Glu Arg Asp Lys Arg Phe Ser Lys Ala Phe Lys Glu Met Val Gly Thr
                245                 250                 255
Cys Leu Val Lys Asp Pro Lys Lys Arg Pro Thr Ser Glu Lys Leu Leu
            260                 265                 270
Lys His Pro Phe Phe Lys His Ala Arg Pro Ala Asp Tyr Leu Val Lys
        275                 280                 285
Thr Ile Leu Asn Gly Leu Pro Pro Leu Gly Asp Arg Tyr Arg Gln Ile
    290                 295                 300
Lys Ser Lys Glu Ala Asp Leu Leu Met Gln Asn Lys Ser Glu Tyr Glu
305                 310                 315                 320
Ala His Leu Ser Gln Gln Glu Tyr Ile Arg Gly Ile Ser Ala Trp Asn
                325                 330                 335
Phe Asn Leu Glu Asp Leu Lys Thr Gln Ala Ala Leu Ile Ser Asp Asp
            340                 345                 350
Asp Thr Ser His Ala Glu Glu Pro Asp Phe Asn Gln Lys Gln Cys Glu
        355                 360                 365
Arg Gln Asp Glu Ser Ala Leu Ser Pro Glu Arg Ala Ser Ser Ser Ala
    370                 375                 380
Thr Ala Pro Ser Gln Asp Asp Glu Leu Asn Asp Ile His Asp Leu Glu
385                 390                 395                 400
Ser Ser Phe Ala Ser Phe Pro Ile Lys Pro Leu Gln Ala Leu Lys Gly
                405                 410                 415
Cys Phe Asp Ile Ser Glu Asp Glu Asp Asn Ala Thr Thr Pro Asp Trp
            420                 425                 430
Lys Asp Ala Asn Val Asn Ser Gly Gln Gln Leu Leu Thr Lys Ala Ser
        435                 440                 445
Ile Gly Ser Leu Ala Glu Thr Thr Lys Glu Glu Asp Thr Ala Ala Gln
    450                 455                 460
Asn Thr Ser Leu Pro Arg His Val Ile Ser Glu Gln Lys Lys Tyr Leu
465                 470                 475                 480
Ser Gly Ser Ile Ile Pro Glu Ser Thr Phe Ser Pro Lys Arg Ile Thr
                485                 490                 495
Ser Asp Ala Asp Arg Glu Phe Gln Gln Arg Arg Tyr Gln Thr Glu Arg
            500                 505                 510
Ser Tyr Ser Gly Ser Leu Tyr Arg Thr Lys Arg Asp Ser Val Asp Glu
        515                 520                 525
Thr Ser Glu Val Pro His Val Glu His Lys Gly Arg Phe Lys Val Thr
    530                 535                 540
Ser Ala Asp Leu Ser Pro Lys Gly Ser Thr Asn Ser Thr Phe Thr Pro
545                 550                 555                 560
Phe Ser Gly Gly Thr Ser Ser Pro Ser Cys Leu Asn Ala Thr Thr Ala
                565                 570                 575
Ser Ile Leu Pro Ser Ile Gln Ser Ile Leu Gln Gln Asn Ala Met Gln
            580                 585                 590
Arg Glu Glu Ile Leu Arg Leu Ile Lys Tyr Leu Glu Gln Thr Ser Ala
        595                 600                 605
Lys Gln Pro Gly Ser Pro Glu Thr Asn Val Asp Asp Leu Leu Gln Thr
    610                 615                 620
Pro Pro Ala Thr Ser Arg Glu Arg Glu Leu Gln Ser Gln Val Met Leu
625                 630                 635                 640
Leu Gln Gln Ser Phe Ser Ser Leu Thr Glu Glu Leu Lys Lys Gln Lys
                645                 650                 655
Gln Lys Asn Gly Gln Leu Glu Asn Gln Leu Asn Ala Leu Thr His Arg
            660                 665                 670
Asn Asp
<210>13
<211>1785
<212>DNA
<213>拟南芥
<400>13
atggctggtt catcaacgaa acgatttcct ctatatgcta aagattatga gctctttgaa    60
gaggtaggag aaggtgttag tgctactgtg tatagagctc gttgcattgc tcttaacgag   120
attgtcgctg ttaaaatctt ggatctcgaa aaatgcagga atgatttgga aacaatacgc   180
aaggaagttc atataatgag tttgattgat catccgaatt tattgaaagc gcattgttcg   240
tttatcgaca gtagtagttt gtggattgta atgccttata tgtcgggtgg ttcttgtttt   300
catttaatga aatctgtata tccggaaggt cttgagcaac ctataattgc tactttgttg   360
agggaagtgc ttaaagctct tgtttatctt catagacaag gtcacatcca tagagatgtt   420
aaggctggga atatattgat tcactcaaaa ggcgtagtta aacttggaga ctttggagtt   480
tcagcatgta tgtttgatag tggagaaaga atgcaaacaa ggaatacatt cgttgggact   540
ccttgttgga tggcacctga ggttatgcag caactagatg gatatgattt caagtatctt   600
gctcatggtc atgccccatt ttccaaatat ccacctatga aggtgctact aatgacatta   660
caaaatgcac ctcctcgtct agactatgac agagataaga aattctcaaa gtcatttaga   720
gagttaatcg cagcgtgctt agttaaagat ccgaaaaagc gtccaactgc agcaaaactt   780
ctgaaacatc ctttcttcaa acatgctcgg tctacagatt atttgtcccg taaaattctt   840
catggtcttt ctccacttgg tgaacgtttt aaaaagctca aggaggcaga ggctgagttg   900
ttcaaaggca taaatggtga caaagaacag ttgtctcagc atgagtatat gagaggaatt   960
agtgcttgga actttgatct tgaagcattg agaaggcagg catcacttgt aattattcca  1020
aatgaagaaa tctataattc agagatacag gaactgaaca gaaatggaga tgtaccaaaa  1080
ggaaaaccag tgatacaaag gtcacagact atgcctttgg aatatttctc agaaaaggca  1140
agtgatatgg tgagtgagag tagcagtcaa ttaaccggtt cattacttcc ttcgtttcat  1200
cgcaaattcc tcccggctct tggcaatgca tgtaactcga gcgatagagc agcagagaag  1260
ctcgcttttg aagagccacg tcaagtacta cacccattag cggatacaaa gaaaattaga  1320
aaagcaggaa gtgatcagca ggagaaacca aaaaatggtt acgcagatag tcctgtgaac  1380
cgtgaatctt ccacattatc aaaggaacca ttagcggata caaagcaagt tagaaaacca  1440
ggaaatgagc aggagaaacc aaaaaacggc tatatagtta gtcatgtgaa ccgtgaatct  1500
tccacatcag aggaaatcct cccactgttg cagagtctcc tggttcagaa tgacattcaa  1560
agggcgcaag taatcaggtt aattagattt tttgatcgaa ctgcgaaaac ggaaaatcca  1620
atctcaaaaa ccgaaggagt gcaggagaaa gatctgcaat ctcaagttca gtttttggag  1680
caaagtgttg agaagcttgt agaggaagtt cagagaagaa aagatataaa tagtcagcta  1740
gagcaacaga tcagctctct gattagcagc aacaacatct cttaa                 1785
<210>14
<211>594
<212>PRT
<213>拟南芥
<400>14
Met Ala Gly Ser Ser Thr Lys Arg Phe Pro Leu Tyr Ala Lys Asp Tyr
1               5                   10                  15
Glu Leu Phe Glu Glu Val Gly Glu Gly Val Ser Ala Thr Val Tyr Arg
            20                  25                  30
Ala Arg Cys Ile Ala Leu Asn Glu Ile Val Ala Val Lys Ile Leu Asp
        35                  40                  45
Leu Glu Lys Cys Arg Asn Asp Leu Glu Thr Ile Arg Lys Glu Val His
    50                  55                  60
Ile Met Ser Leu Ile Asp His Pro Asn Leu Leu Lys Ala His Cys Ser
65                  70                  75                  80
Phe Ile Asp Ser Ser Ser Leu Trp Ile Val Met Pro Tyr Met Ser Gly
                85                  90                  95
Gly Ser Cys Phe His Leu Met Lys Ser Val Tyr Pro Glu Gly Leu Glu
            100                 105                 110
Gln Pro Ile Ile Ala Thr Leu Leu Arg Glu Val Leu Lys Ala Leu Val
        115                 120                 125
Tyr Leu His Arg Gln Gly His Ile His Arg Asp Val Lys Ala Gly Asn
    130                 135                 140
Ile Leu Ile His Ser Lys Gly Val Val Lys Leu Gly Asp Phe Gly Val
145                 150                 155                 160
Ser Ala Cys Met Phe Asp Ser Gly Glu Arg Met Gln Thr Arg Asn Thr
                165                 170                 175
Phe Val Gly Thr Pro Cys Trp Met Ala Pro Glu Val Met Gln Gln Leu
            180                 185                 190
Asp Gly Tyr Asp Phe Lys Tyr Leu Ala His Gly His Ala Pro Phe Ser
        195                 200                 205
Lys Tyr Pro Pro Met Lys Val Leu Leu Met Thr Leu Gln Asn Ala Pro
    210                 215                 220
Pro Arg Leu Asp Tyr Asp Arg Asp Lys Lys Phe Ser Lys Ser Phe Arg
225                 230                 235                 240
Glu Leu Ile Ala Ala Cys Leu Val Lys Asp Pro Lys Lys Arg Pro Thr
                245                 250                 255
Ala Ala Lys Leu Leu Lys His Pro Phe Phe Lys His Ala Arg Ser Thr
            260                 265                 270
Asp Tyr Leu Ser Arg Lys Ile Leu His Gly Leu Ser Pro Leu Gly Glu
        275                 280                 285
Arg Phe Lys Lys Leu Lys Glu Ala Glu Ala Glu Leu Phe Lys Gly Ile
    290                 295                 300
Asn Gly Asp Lys Glu Gln Leu Ser Gln His Glu Tyr Met Arg Gly Ile
305                 310                 315                 320
Ser Ala Trp Asn Phe Asp Leu Glu Ala Leu Arg Arg Gln Ala Ser Leu
                325                 330                 335
Val Ile Ile Pro Asn Glu Glu Ile Tyr Asn Ser Glu Ile Gln Glu Leu
            340                 345                 350
Asn Arg Asn Gly Asp Val Pro Lys Gly Lys Pro Val Ile Gln Arg Ser
        355                 360                 365
Gln Thr Met Pro Leu Glu Tyr Phe Ser Glu Lys Ala Ser Asp Met Val
    370                 375                 380
Ser Glu Ser Ser Ser Gln Leu Thr Gly Ser Leu Leu Pro Ser Phe His
385                 390                 395                 400
Arg Lys Phe Leu Pro Ala Leu Gly Asn Ala Cys Asn Ser Ser Asp Arg
                405                 410                 415
Ala Ala Glu Lys Leu Ala Phe Glu Glu Pro Arg Gln Val Leu His Pro
            420                 425                 430
Leu Ala Asp Thr Lys Lys Ile Arg Lys Ala Gly Ser Asp Gln Gln G1u
        435                 440                 445
Lys Pro Lys Asn Gly Tyr Ala Asp Ser Pro Val Asn Arg Glu Ser Ser
    450                 455                 460
Thr Leu Ser Lys Glu Pro Leu Ala Asp Thr Lys Gln Val Arg Lys Pro
465                 470                 475                 480
Gly Asn Glu Gln Glu Lys Pro Lys Asn Gly Tyr Ile Val Ser His Val
                485                 490                 495
Asn Arg Glu Ser Ser Thr Ser Glu Glu Ile Leu Pro Leu Leu Gln Ser
            500                 505                 510
Leu Leu Val Gln Asn Asp Ile Gln Arg Ala Gln Val Ile Arg Leu Ile
        515                 520                 525
Arg Phe Phe Asp Arg Thr Ala Lys Thr Glu Asn Pro Ile Ser Lys Thr
    530                 535                 540
Glu Gly Val Gln Glu Lys Asp Leu Gln Ser Gln Val Gln Phe Leu Glu
545                 550                 555                 560
Gln Ser Val Glu Lys Leu Val Glu Glu Val Gln Arg Arg Lys Asp Ile
                565                 570                 575
Asn Ser Gln Leu Glu Gln Gln Ile Ser Ser Leu Ile Ser Ser Asn Asn
            580                 585                 590
Ile Ser
<210>15
<211>1422
<212>DNA
<213>拟南芥
<400>15
atgacgagtt caccggaaac gagatttcct ctggttgcga aagattacga gattttagaa   60
gagataggcg atggtgttta cagagctcga tgcattctac ttgatgaaat tgtagccatc  120
aagatctgga accttgaaaa atgcaccaac gatctggaaa ccataaggaa agaagttcat  180
agattgagct taattgatca tccaaatcta ttgagggtgc attgctcttt catagatagt  240
agcagcttgt ggattgtgat gccttttatg tcgtgcggct cttccttgaa cataatgaaa  300
tcagtctatc caaatggtct tgaggaacct gtaattgcta tattgttgcg ggagattctt   360
aaagctcttg tttaccttca tggactagga cacatccatc gaaatgttaa ggctgggaat   420
gtactggttg actcagaagg aactgttaag ctcggtgact ttgaagtttc agcatccatg   480
tttgatagtg tggaaaggat gcgtactagt tctgagaata cttttgttgg aaatccacgc   540
cggatggcac ctgagaagga tatgcagcaa gttgatggct atgatttcaa agtggatatc   600
tggtcgtttg gcatgactgc cctggaactt gcccatggtc attcacctac cacggtgcta   660
ccattgaact tacaaaattc tccctttcct aactatgaag aagacacgaa attctctaag   720
tcttttagag agttggtcgc agcttgcttg atagaagatc cagaaaaacg tccgaccgct   780
tcacaactac tggaatatcc gttcttacag caaactcttt ctactgaata cttggctagt   840
acatttcttg atggcctctc tccgcttggt gagcgttata gaaagctgaa ggaggaaaag   900
gccaagttgg ttaaaggtgt agatggtaac aaggagaaag tatctcagga aaatgttgaa   960
gcgctgctga tggaacctgc tagtcttgtg aaccctgttt cttgtgatac tgctcaagtc  1020
ctcccaatct tacagaatat cctgatccaa aatgatatcc aaagggaaaa tgttgaagcg  1080
ctgctgacgg aacctgctat tcttgtgaac cctgtttctt gtgatactgc tcaagtcctc  1140
ccaatcgtac agaatatcct gatccagaat gatatccaaa ggaaaaggtt aatcggttta  1200
atgcaactct gtgatccaac tgctggtaag tttgctgttc tatcactaga atttgcatct  1260
tctctatgtt acaagttcca tgacctgatc ttgatttttg tacagaaatc agaattccga  1320
ttggcaatac agaagttggg cagatatcaa caacagagac agatctattg tctgaggttc  1380
acgttttgca gcagaggtaa tgataaattc cacaagcttt aa                     1422
<210>16
<211>473
<212>PRT
<213>拟南芥
<400>16
Met Thr Ser Ser Pro Glu Thr Arg Phe Pro Leu Val Ala Lys Asp Tyr
1               5                   10                  15
Glu Ile Leu Glu Glu Ile Gly Asp Gly Val Tyr Arg Ala Arg Cys Ile
            20                  25                  30
Leu Leu Asp Glu Ile Val Ala Ile Lys Ile Trp Asn Leu Glu Lys Cys
        35                  40                  45
Thr Asn Asp Leu Glu Thr Ile Arg Lys Glu Val His Arg Leu Ser Leu
    50                  55                  60
Ile Asp His Pro Asn Leu Leu Arg Val His Cys Ser Phe Ile Asp Ser
65                  70                  75                  80
Ser Ser Leu Trp Ile Val Met Pro Phe Met Ser Cys Gly Ser Ser Leu
                85                  90                  95
Asn Ile Met Lys Ser Val Tyr Pro Asn Gly Leu Glu Glu Pro Val Ile
            100                 105                 110
Ala Ile Leu Leu Arg Glu Ile Leu Lys Ala Leu Val Tyr Leu His Gly
        115                 120                 125
Leu Gly His Ile His Arg Asn Val Lys Ala Gly Asn Val Leu Val Asp
    130                 135                 140
Ser Glu Gly Thr Val Lys Leu Gly Asp Phe Glu Val Ser Ala Ser Met
145                 150                 155                 160
Phe Asp Ser Val Glu Arg Met Arg Thr Ser Ser Glu Asn Thr Phe Val
                165                 170                 175
Gly Asn Pro Arg Arg Met Ala Pro Glu Lys Asp Met Gln Gln Val Asp
            180                 185                 190
Gly Tyr Asp Phe Lys Val Asp Ile Trp Ser Phe Gly Met Thr Ala Leu
        195                 200                 205
Glu Leu Ala His Gly His Ser Pro Thr Thr Val Leu Pro Leu Asn Leu
    210                 215                 220
Gln Asn Ser Pro Phe Pro Asn Tyr Glu Glu Asp Thr Lys Phe Ser Lys
225                 230                 235                 240
Ser Phe Arg Glu Leu Val Ala Ala Cys Leu Ile Glu Asp Pro Glu Lys
                245                 250                 255
Arg Pro Thr Ala Ser Gln Leu Leu Glu Tyr Pro Phe Leu Gln Gln Thr
            260                 265                 270
Leu Ser Thr Glu Tyr Leu Ala Ser Thr Phe Leu Asp Gly Leu Ser Pro
         275                 280                 285
Leu Gly Glu Arg Tyr Arg Lys Leu Lys Glu Glu Lys Ala Lys Leu Val
    290                 295                 300
Lys Gly Val Asp Gly Asn Lys Glu Lys Val Ser Gln Glu Asn Val Glu
305                 310                 315                 320
Ala Leu Leu Met Glu Pro Ala Ser Leu Val Asn Pro Val Ser Cys Asp
                325                 330                 335
Thr Ala Gln Val Leu Pro Ile Leu Gln Asn Ile Leu Ile Gln Asn Asp
            340                 345                 350
Ile Gln Arg Glu Asn Val Glu Ala Leu Leu Thr Glu Pro Ala Ile Leu
        355                 360                 365
Val Asn Pro Val Ser Cys Asp Thr Ala Gln Val Leu Pro Ile Val Gln
    370                 375                 380
Asn Ile Leu Ile Gln Asn Asp Ile Gln Arg Lys Arg Leu Ile Gly Leu
385                 390                 395                 400
Met Gln Leu Cys Asp Pro Thr Ala Gly Lys Phe Ala Val Leu Ser Leu
                405                 410                 415
Glu Phe Ala Ser Ser Leu Cys Tyr Lys Phe His Asp Leu Ile Leu Ile
            420                 425                 430
Phe Val Gln Lys Ser Glu Phe Arg Leu Ala Ile Gln Lys Leu Gly Arg
        435                 440                 445
Tyr Gln Gln Gln Arg Gln Ile Tyr Cys Leu Arg Phe Thr Phe Cys Ser
    450                 455                 460
Arg Gly Asn Asp Lys Phe His Lys Leu
465                 470
<210>17
<211>2085
<212>DNA
<213>拟南芥
<400>17
atggagaaga agaagtatcc aattggacca gagcattata ctctctacga gtttattgga     60
caaggtgtta gtgctctagt gcatcgtgct ttgtgcattc cgtttgatga agtcgttgct    120
attaagattc ttgattttga acgcgataac tgcgatctga acaacatctc tcgtgaagcg    180
cagacgatga tgcttgttga tcatcccaat gtgttgaagt cacattgttc ctttgttagt    240
gatcacaatt tgtgggtcat catgccatac atgtctggtg gttcttgtct tcacattcta    300
aaagctgcat atcctgatgg ttttgaagaa gctattatag ctactatatt gcgtgaagct    360
ttgaagggat tagactatct ccatcagcat ggccacattc atcgcgatgt caaagctggg    420
aatatattgc ttggtgctcg aggtgcagtc aagttgggag actttggtgt atctgcctgt    480
ctctttgatt caggtgatag gcaacggaca aggaacacat ttgttggaac accttgctgg    540
atggcacctg aagtcatgga gcagctacat ggttatgact tcaaggctga tatttggtcg    600
tttggtataa ctgggctaga gcttgctcat ggtcacgctc ctttctctaa atatccacca    660
atgaaggttc tgcttatgac gttgcaaaat gcaccaccag ggctggatta cgaaagagat   720
aagaagtttt ccaggtcttt caagcagatg atcgccagtt gtctagttaa agacccttcc   780
aaacgcccgt ctgcaaaaaa gttgttaaag cactcctttt tcaagcaagc aagatcaagc   840
gattacattg cacgaaaact tctggatggg ttaccagatc ttgttaatcg tgttcaggca   900
ataaagagaa aggaagaaga tatgcttgca caagagaaaa tggcagatgg agaaaaggaa   960
gaattgtccc agcctttaaa cgcttgtcat agtaccatgc agaatgaata taagagaggt  1020
atcagcgggt ggaatttcaa tcttgatgat atgaaagccc aggcttcatt gatccaggac  1080
atggactgtg gcttttcgga cagtttatcg ggaagtgcaa cttcgttgca ggctctagat  1140
tcacaggata cacaatcgga gattcaggag gatactggtc aaataactaa taagtatctc  1200
caacctctga ttcaccgaag tctaagtatc gcgagggata aatctgatga tgattcaagt  1260
cttgccagcc ccagttatga tagctacgta tattcctccc cccgtcatga ggatttatct  1320
ttaaacaata cacatgttgg tagtacgcat gcaaacaatg ggaaaccaac ggatgccaca  1380
tcaatcccaa ccaatcaacc aacagagatt atagcaggga gctctgtttt ggcagatgga  1440
aatggtgctc ccaataaagg agagagtgat aaaactcaag aacagcttca aaacgggtca  1500
aactgcaatg ggacacatcc tacagtggga ggagatgacg taccaacgga gatggctgtt  1560
aaaccaccca aagcagcatc aagcctagat gaatctgatg acaaatcaaa gccgccagtt  1620
gtgcagcaaa gagggcgttt taaagtaact tctgaaaatc tcgacatcga gaaggtggtg  1680
gcgccttcgc caatactgca aaagagtcac agcatgcagg tgctctgcca acattcctct  1740
gcttctctac ctcactctga tgtcacattg ccaaacctaa ccagctcata tgtttacccg  1800
ctggtgtatc cagttctgca aactaatatt ttggaaaggg ataacatttt gcatatgatg  1860
aaagtactca ccaacagaga gttgacagat ggacgtgcag ttgaacaagg aagtatacaa  1920
caacctactg tgcccccaac tgagaaatcc atgcttgaag cagcacacga aagagagaaa  1980
gaactgctcc atgacataac cgacctgcaa tggaggctca tttgtgcaga agaagagctt  2040
cagaaataca aaaccgaaca cgcccaagta agtatgagta actaa                  2085
<210>18
<211>694
<212>PRT
<213>拟南芥
<400>18
Met Glu Lys Lys Lys Tyr Pro Ile Gly Pro Glu His Tyr Thr Leu Tyr
1               5                   10                  15
Glu Phe Ile Gly Gln Gly Val Ser Ala Leu Val His Arg Ala Leu Cys
            20                  25                  30
Ile Pro Phe Asp Glu Val Val Ala Ile Lys Ile Leu Asp Phe Glu Arg
        35                  40                  45
Asp Asn Cys Asp Leu Asn Asn Ile Ser Arg Glu Ala Gln Thr Met Met
    50                  55                  60
Leu Val Asp His Pro Asn Val Leu Lys Ser His Cys Ser Phe Val Ser
65                  70                  75                  80
Asp His Asn Leu Trp Val Ile Met Pro Tyr Met Ser Gly Gly Ser Cys
                85                  90                  95
Leu His Ile Leu Lys Ala Ala Tyr Pro Asp Gly Phe Glu Glu Ala Ile
            100                 105                 110
Ile Ala Thr Ile Leu Arg Glu Ala Leu Lys Gly Leu Asp Tyr Leu His
        115                 120                 125
Gln His Gly His Ile His Arg Asp Val Lys Ala Gly Asn Ile Leu Leu
    130                 135                 140
Gly Ala Arg Gly Ala Val Lys Leu Gly Asp Phe Gly Val Ser Ala Cys
145                 150                 155                 160
Leu Phe Asp Ser Gly Asp Arg Gln Arg Thr Arg Asn Thr Phe Val Gly
                165                 170                 175
Thr Pro Cys Trp Met Ala Pro Glu Val Met Glu Gln Leu His Gly Tyr
            180                 185                 190
Asp Phe Lys Ala Asp Ile Trp Ser Phe Gly Ile Thr Gly Leu Glu Leu
        195                 200                 205
Ala His Gly His Ala Pro Phe Ser Lys Tyr Pro Pro Met Lys Val Leu
    210                 215                 220
Leu Met Thr Leu Gln Asn Ala Pro Pro Gly Leu Asp Tyr Glu Arg Asp
225                 230                 235                 240
Lys Lys Phe Ser Arg Ser Phe Lys Gln Met Ile Ala Ser Cys Leu Val
                245                 250                 255
Lys Asp Pro Ser Lys Arg Pro Ser Ala Lys Lys Leu Leu Lys His Ser
            260                 265                 270
Phe Phe Lys Gln Ala Arg Ser Ser Asp Tyr Ile Ala Arg Lys Leu Leu
        275                 280                 285
Asp Gly Leu Pro Asp Leu Val Asn Arg Val Gln Ala Ile Lys Arg Lys
    290                 295                 300
Glu Glu Asp Met Leu Ala Gln Glu Lys Met Ala Asp Gly Glu Lys Glu
305                 310                 315                 320
Glu Leu Ser Gln Pro Leu Asn Ala Cys His Ser Thr Met Gln Asn Glu
                325                 330                 335
Tyr Lys Arg Gly Ile Ser Gly Trp Asn Phe Asn Leu Asp Asp Met Lys
            340                 345                 350
Ala Gln Ala Ser Leu Ile Gln Asp Met Asp Cys Gly Phe Ser Asp Ser
        355                 360                 365
Leu Ser Gly Ser Ala Thr Ser Leu Gln Ala Leu Asp Ser Gln Asp Thr
    370                 375                 380
Gln Ser Glu Ile Gln Glu Asp Thr Gly Gln Ile Thr Asn Lys Tyr Leu
385                 390                 395                 400
Gln Pro Leu Ile His Arg Ser Leu Ser Ile Ala Arg Asp Lys Ser Asp
                405                 410                 415
Asp Asp Ser Ser Leu Ala Ser Pro Ser Tyr Asp Ser Tyr Val Tyr Ser
            420                 425                 430
Ser Pro Arg His Glu Asp Leu Ser Leu Asn Asn Thr His Val Gly Ser
        435                 440                 445
Thr His Ala Asn Asn Gly Lys Pro Thr Asp Ala Thr Ser Ile Pro Thr
    450                 455                 460
Asn Gln Pro Thr Glu Ile Ile Ala Gly Ser Ser Val Leu Ala Asp Gly
465                 470                 475                 480
Asn Gly Ala Pro Asn Lys Gly Glu Ser Asp Lys Thr Gln Glu Gln Leu
                485                 490                 495
Gln Asn Gly Ser Asn Cys Asn Gly Thr His Pro Thr Val Gly Gly Asp
            500                 505                 510
Asp Val Pro Thr Glu Met Ala Val Lys Pro Pro Lys Ala Ala Ser Ser
        515                 520                 525
Leu Asp Glu Ser Asp Asp Lys Ser Lys Pro Pro Val Val Gln Gln Arg
    530                 535                 540
Gly Arg Phe Lys Val Thr Ser Glu Asn Leu Asp Ile Glu Lys Val Val
545                 550                 555                 560
Ala Pro Ser Pro Ile Leu Gln Lys Ser His Ser Met Gln Val Leu Cys
                565                 570                 575
Gln His Ser Ser Ala Ser Leu Pro His Ser Asp Val Thr Leu Pro Asn
            580                 585                 590
Leu Thr Ser Ser Tyr Val Tyr Pro Leu Val Tyr Pro Val Leu Gln Thr
        595                 600                 605
Asn Ile Leu Glu Arg Asp Asn Ile Leu His Met Met Lys Val Leu Thr
    610                 615                 620
Asn Arg Glu Leu Thr Asp Gly Arg Ala Val Glu Gln Gly Ser Ile Gln
625                 630                 635                 640
Gln Pro Thr Val Pro Pro Thr Glu Lys Ser Met Leu Glu Ala Ala His
                645                 650                 655
Glu Arg Glu Lys Glu Leu Leu His Asp Ile Thr Asp Leu Gln Trp Arg
            660                 665                 670
Leu Ile Cys Ala Glu Glu Glu Leu Gln Lys Tyr Lys Thr Glu His Ala
        675                 680                 685
Gln Val Ser Met Ser Asn
    690
<210>19
<211>2591
<212>DNA
<213>拟南芥
<400>19
gtcacacaag ccgaatccaa aaatgtaaca agaaaaacaa atcttcacaa ggcaaaaaat     60
ccaaaattga gttttttttt tcttcatttt ttacaatggt gtctcggttt cgtcttgctc    120
tagaggctgt tttgggttcg agacgacgta agaagatggc gagtactagt agtggtggtg    180
gtggtggtgg tgataagaag aagaagaaag gtttctctgt aaaccctaaa gattataaac    240
ttatggaaga agttggatat ggtgctagtg ctgttgttca tcgtgctatt tatcttccta    300
ctaatgaagt tgttgctatc aagtctttgg atctcgatcg ctgcaatagt aatctggatg    360
atataaggag ggaggctcag actatgactt tgatagacca tccgaatgtt ataaagtcgt    420
tttgttcgtt tgctgttgat catcatctat gggtcgttat gccatttatg gctcagggtt    480
cgtgtttgca tctaatgaaa gcagcgtatc cagatggatt tgaagaggcg gctatatgtt   540
ctatgctgaa agaaacactt aaagctcttg attatcttca tagacaaggg catatccatc   600
gagatgttaa ggctggaaac atacttcttg atgacactgg cgagattaag ttaggtgatt   660
ttggtgtctc tgcatgtttg tttgacaatg gcgataggca acgtgcaaga aatacatttg   720
ttggtactcc atgctggatg gcaccggaag tcttgcagcc agggagtgga tacaattcaa   780
aggctgatat atggtctttt ggaataacgg cgctggagtt ggctcacggt catgcacctt   840
tctcaaaata tccccctatg aaggtactct taatgactat ccaaaatgca ccacctggcc   900
ttgattatga ccgtgataag aagttttcaa agtcctttaa agaattggta gcattgtgtc   960
tggtgaaaga tcaaacaaaa aggccaactg ctgaaaaatt gttgaaacac tcatttttca  1020
agaatgtgaa gcctccagag atctgtgtaa aaaaattatt tgtcgattta ccacctcttt  1080
ggactcgcgt aaaagctctt caggccaagg atgctgcaca gcttgctttg aaaggaatgg  1140
cctctgctga ccaggatgct atatcacaga gtgaatacca aagaggagta agtgcttgga  1200
acttcaatat cgaagatttg aaagaacaag catctttgct agatgatgat gacattctaa  1260
cagagagtag ggaagaagaa gaatcttttg gcgaacagtt gcataataag gctaggcaag  1320
tatctggtag tcaattgcta tctgaaaaca tgaatggaaa ggaaaaagct tcagatactg  1380
aggtggtaga acctatctgt gaagagaaat ccactctcaa ttcaaccact tcttctgtgg  1440
aacaaccggc atcaagttca gaacaagacg ttccacaggc caagggtaag ccagtgagac  1500
tccagactca tagtggacca ctttcatccg gtgtcgtgtt aatcaattca gactcagaga  1560
aggttcatgg ttatgaaagg tctgagagtg aacggcaact gaaatcatca gtccggaggg  1620
cacccagctt tagtggtcct ttgaatcttc caaatcgtgc ttcagcaaac agtctttcag  1680
ctcctatcaa atcttctgga ggatttcgtg attctataga tgacaagtcg aaggctaatg  1740
tggttcaaat caaaggaaga ttttcagtaa catcagaaaa cttggatctt gcaagggcat  1800
cccctttgag aaaatctgcc agtgttggga attggatact tgattctaaa atgccaacgg  1860
gccaggccat caaggagtca agtagtcatc tctcattcat tatacctcag cttcaaaatc  1920
tgttccagca aaattcaatg cagcaggatc ttattatgaa tctagtgaat accttacaac  1980
aagctgctga aacaacagat ggttctcaaa atggaaagtt gccgcctttg cctcgaggat  2040
ctgacagcaa tggaaccgtt gtagaactta cagcagctga gcgagagagg ttactactta  2100
ccaagataac cgagcttcga gctaggatga aagagttgac ggaagaactt gaagtagaaa  2160
aatcaaaaca gacccaactg cagcagaaat tgaaatcagt caccggtcgc gagcaattgt  2220
aatcagagac cgggaacact gaccttacta cagagaagct ttttaggagg agagaaaagt  2280
atgttttgta cactaagaaa accagagagc tctctgatca tgaaagcaaa aaggacaggt  2340
ttggttctgt tctgtataag tgcagaagca gagtcaccat cggccatttg tttctgacag  2400
aagaagccgg aaacaaaaac agatagagag agataaatag agaagaaagc tctttggcca  2460
tggaaaattg tatttgttta tttaatctaa acactacaaa actttacatt ttttattatt  2520
gttagcaaca aatatagact cttccttttt tgtgtggatt gtaaatgaaa cattatttga  2580
tgtatttgtt t                                                       2591
<210>20
<211>708
<212>PRT
<213>拟南芥
<400>20
Met Val Ser Arg Phe Arg Leu Ala Leu Glu Ala Val Leu Gly Ser Arg
1               5                   10                  15
Arg Arg Lys Lys Met Ala Ser Thr Ser Ser Gly Gly Gly Gly Gly Gly
            20                  25                  30
Asp Lys Lys Lys Lys Lys Gly Phe Ser Val Asn Pro Lys Asp Tyr Lys
        35                  40                  45
Leu Met Glu Glu Val Gly Tyr Gly Ala Ser Ala Val Val His Arg Ala
    50                  55                  60
Ile Tyr Leu Pro Thr Asn Glu Val Val Ala Ile Lys Ser Leu Asp Leu
65                  70                  75                  80
Asp Arg Cys Asn Ser Asn Leu Asp Asp Ile Arg Arg Glu Ala Gln Thr
                85                  90                  95
Met Thr Leu Ile Asp His Pro Asn Val Ile Lys Ser Phe Cys Ser Phe
            100                 105                 110
Ala Val Asp His His Leu Trp Val Val Met Pro Phe Met Ala Gln Gly
        115                 120                 125
Ser Cys Leu His Leu Met Lys Ala Ala Tyr Pro Asp Gly Phe Glu Glu
    130                 135                 140
Ala Ala Ile Cys Ser Met Leu Lys Glu Thr Leu Lys Ala Leu Asp Tyr
145                 150                 155                 160
Leu His Arg Gln Gly His Ile His Arg Asp Val Lys Ala Gly Asn Ile
                165                 170                 175
Leu Leu Asp Asp Thr Gly Glu Ile Lys Leu Gly Asp Phe Gly Val Ser
            180                 185                 190
Ala Cys Leu Phe Asp Asn Gly Asp Arg Gln Arg Ala Arg Asn Thr Phe
        195                 200                 205
Val Gly Thr Pro Cys Trp Met Ala Pro Glu Val Leu Gln Pro Gly Ser
    210                 215                 220
Gly Tyr Asn Ser Lys Ala Asp Ile Trp Ser Phe Gly Ile Thr Ala Leu
225                 230                 235                 240
Glu Leu Ala His Gly His Ala Pro Phe Ser Lys Tyr Pro Pro Met Lys
                245                 250                 255
Val Leu Leu Met Thr Ile Gln Asn Ala Pro Pro Gly Leu Asp Tyr Asp
            260                 265                 270
Arg Asp Lys Lys Phe Ser Lys Ser Phe Lys Glu Leu Val Ala Leu Cys
        275                 280                 285
Leu Val Lys Asp Gln Thr Lys Arg Pro Thr Ala Glu Lys Leu Leu Lys
    290                 295                 300
His Ser Phe Phe Lys Asn Val Lys Pro Pro Glu Ile Cys Val Lys Lys
305                 310                 315                 320
Leu Phe Val Asp Leu Pro Pro Leu Trp Thr Arg Val Lys Ala Leu Gln
                325                 330                 335
Ala Lys Asp Ala Ala Gln Leu Ala Leu Lys Gly Met Ala Ser Ala Asp
            340                 345                 350
Gln Asp Ala Ile Ser Gln Ser Glu Tyr Gln Arg Gly Val Ser Ala Trp
        355                 360                 365
Asn Phe Asn Ile Glu Asp Leu Lys Glu Gln Ala Ser Leu Leu Asp Asp
    370                 375                 380
Asp Asp Ile Leu Thr Glu Ser Arg Glu Glu Glu Glu Ser Phe Gly Glu
385                 390                 395                 400
Gln Leu His Asn Lys Ala Arg Gln Val Ser Gly Ser Gln Leu Leu Ser
                405                 410                 415
Glu Asn Met Asn Gly Lys Glu Lys Ala Ser Asp Thr Glu Val Val Glu
            420                 425                 430
Pro Ile Cys Glu Glu Lys Ser Thr Leu Asn Ser Thr Thr Ser Ser Val
        435                 440                 445
Glu Gln Pro Ala Ser Ser Ser Glu Gln Asp Val Pro Gln Ala Lys Gly
    450                 455                 460
Lys Pro Val Arg Leu Gln Thr His Ser Gly Pro Leu Ser Ser Gly Val
465                 470                 475                 480
Val Leu Ile Asn Ser Asp Ser Glu Lys Val Hi s Gly Tyr Glu Arg Ser
                485                 490                 495
Glu Ser Glu Arg Gln Leu Lys Ser Ser Val Arg Arg Ala Pro Ser Phe
            500                 505                 510
Ser Gly Pro Leu Asn Leu Pro Asn Arg Ala Ser Ala Asn Ser Leu Ser
        515                 520                 525
Ala Pro Ile Lys Ser Ser Gly Gly Phe Arg Asp Ser Ile Asp Asp Lys
    530                 535                 540
Ser Lys Ala Asn Val Val Gln Ile Lys Gly Arg Phe Ser Val Thr Ser
545                 550                 555                 560
Glu Asn Leu Asp Leu Ala Arg Ala Ser Pro Leu Arg Lys Ser Ala Ser
                565                 570                 575
Val Gly Asn Trp Ile Leu Asp Ser Lys Met Pro Thr Gly Gln Ala Ile
            580                 585                 590
Lys Glu Ser Ser Ser His Leu Ser Phe Ile Ile Pro Gln Leu Gln Asn
        595                 600                 605
Leu Phe Gln Gln Asn Ser Met Gln Gln Asp Leu Ile Met Asn Leu Val
    610                 615                 620
Asn Thr Leu Gln Gln Ala Ala Glu Thr Thr Asp Gly Ser Gln Asn Gly
625                 630                 635                 640
Lys Leu Pro Pro Leu Pro Arg Gly Ser Asp Ser Asn Gly Thr Val Val
                645                 650                 655
Glu Leu Thr Ala Ala Glu Arg Glu Arg Leu Leu Leu Thr Lys Ile Thr
            660                 665                 670
Glu Leu Arg Ala Arg Met Lys Glu Leu Thr Glu Glu Leu Glu Val Glu
        675                 680                 685
Lys Ser Lys Gln Thr Gln Leu Gln Gln Lys Leu Lys Ser Val Thr Gly
    690                 695                 700
Arg Glu Gln Leu
705
<210>21
<211>2782
<212>DNA
<213>拟南芥
<400>21
aaactactag tctctatctc tctcagctcc agattttgtt tcttcttctt ctgtgttaaa     60
ttcatttgat ttgttgtatc tgaaggcgaa attactggtt tctgattttt ggtggtattc    120
agggcggttt taaagcgacg gaagaagatg gtgggaggag gaggaggtag tagtggtcgt    180
ggtggtggta gtggtagtgg tagtagtaag cagcagagag gtttctctat gaatcctaaa    240
gactataagc taatggaaga aataggccat ggagctagcg ctgttgtcta tcgagcgatc    300
tatctcccta ctaatgaagt cgtcgccatc aagtgtttgg atctcgatcg ctgcaatagc    360
aatctggatg atattaggag ggaatctcag actatgagtt tgatagacca tcccaacgtt    420
ataaagtcgt tttgttcatt ctctgtcgac catagtcttt gggttgttat gccattcatg    480
gctcaaggtt cgtgtttgca tcttatgaag actgcgtatt cagacggatt tgaagagtct    540
gctatatgtt gtgtattaaa agaaactctt aaagctcttg attatcttca tagacaaggc    600
catatccatc gggatgttaa ggctggaaac atacttcttg atgacaatgg tgagattaag    660
cttggcgatt ttggtgtctc tgcttgcttg tttgataacg gtgataggca acgtgctaga    720
aacacatttg ttggtactcc ttgctggatg gcaccggaag ttttgcagcc gggaaatgga    780
tacaattcca aggctgatat ctggtcattt ggtataacag cacttgaatt ggcccatggt    840
catgcacctt tctcaaaata tcctcccatg aaggtgctcc taatgactat tcaaaacgca    900
cctcctggcc ttgattatga ccgtgataag aaattttcta agtcctttaa agaaatggtt    960
gcaatgtgtt tggtgaaaga tcaaacaaaa aggccaactg ctgaaaaact gctgaagcac   1020
tcctgtttca aacacacgaa gcctccagag caaactgtga aaattttatt ttccgattta   1080
ccacctcttt ggacacgtgt aaaatctctt caggataagg atgctcaaca gcttgcatta   1140
aagagaatgg ccactgctga cgaggaagct atatcacaga gcgaatacca aagaggagtg   1200
agcgcttgga actttgacgt cagagacttg aaaacacaag catctttgtt aattgatgat   1260
gatgatctag aagagagtaa ggaagatgaa gaaatattat gtgcacagtt taataaggtg   1320
aatgacagag agcaagtatt tgatagtctg caactatatg aaaacatgaa cggaaaagaa   1380
aaggtttcca atactgaggt ggaagaacca acctgcaaag agaaattcac tttcgttaca   1440
actacttctt ctttagaacg aatgtcacca aattcagagc atgacattcc cgaggccaag   1500
gttaagccat taagacgcca aagtcagagt ggaccactta caagcaggac tgtattaagc   1560
cactcggctt cagagaaaag tcatatcttt gaaagatccg agagtgaacc gcagacggca   1620
ccaacagtcc gaagagcacc cagctttagt ggtcctttga atctttcaac ccgtgcttct   1680
tcaaacagtt tgtctgctcc catcaaatac tcaggaggat tccgtgattc tctggatgat   1740
aagtcaaagg ctaatctggt tcagaaagga cgattttcag taacatcagg aaatgtagat   1800
cttgcgaagg atgttccatt aagtatagtc cctcgtcgat ctccacaggc gacccccctg   1860
agaaaatctg caagtgtggg taactggata cttgagccca aaatgccaac agctcagcct   1920
cagacgatca aggagcatag tagccatcct acgtcttcct cacccatcat gcctcaactt   1980
caacatctat tccagcaaaa ctcaatacaa caggatctta ttatgaattt actaaatagc   2040
ttacaacccg tggaggcaac agaaggttct caatctggga agttaccacc tttgcctcgc   2100
tcagacagta atggaaacgt tgaacctgtg gcttcagaga gggagaggtt acttcttagc   2160
agtatctccg acctccgtgc taggctggac gacttaacgg aggaactcga tatagagaaa   2220
tcaaaataca gccaactgca acagaaattg aaagcattca cgggtcgcga acactaagtg   2280
taaccagagg gaaagcgaca ctggaaacac tgaactgcac agaacctgta ggagaaagag  2340
tgaagtctct tttggttata acagtaataa ccagacaaga gcttagagac agtgaggcat  2400
agagcatatc aatttcttta gttgggttca gtgtaggttc cagacgatga caatgacgac  2460
taaaacaaga tacgaccgat gtctgcttct gatgtaaact actagttgaa gacaacagaa  2520
acgaatacag aaataaaaga aaaggagaag aaagttcctt tggggggtct caaccccaca  2580
tatatttgct tatatattta ttatcacacg ttttgatcat tttttgtttt attttgtttg  2640
gtgtatcata atttactagt gagataaagg agaaagctct tcttttgggt tctttgtgta  2700
ttgtaatttg taaatgcaaa ttgattgatg tacttttgtg ttttcatcac attcttaaac  2760
attatcttct ggttttacct ta                                           2782
<210>22
<211>709
<212>PRT
<213>拟南芥
<400>22
Met Val Gly Gly Gly Gly Gly Ser Ser Gly Arg Gly Gly Gly Ser Gly
1               5                   10                  15
Ser Gly Ser Ser Lys Gln Gln Arg Gly Phe Ser Met Asn Pro Lys Asp
            20                  25                  30
Tyr Lys Leu Met Glu Glu Ile Gly His Gly Ala Ser Ala Val Val Tyr
        35                  40                  45
Arg Ala Ile Tyr Leu Pro Thr Asn Glu Val Val Ala Ile Lys Cys Leu
    50                  55                  60
Asp Leu Asp Arg Cys Asn Ser Asn Leu Asp Asp Ile Arg Arg Glu Ser
65                  70                  75                  80
Gln Thr Met Ser Leu Ile Asp His Pro Asn Val Ile Lys Ser Phe Cys
                85                  90                  95
Ser Phe Ser Val Asp His Ser Leu Trp Val Val Met Pro Phe Met Ala
            100                 105                 110
Gln Gly Ser Cys Leu His Leu Met Lys Thr Ala Tyr Ser Asp Gly Phe
        115                 120                 125
Glu Glu Ser Ala Ile Cys Cys Val Leu Lys Glu Thr Leu Lys Ala Leu
    130                 135                 140
Asp Tyr Leu His Arg Gln Gly His Ile His Arg Asp Val Lys Ala Gly
145                 150                 155                 160
Asn Ile Leu Leu Asp Asp Asn Gly Glu Ile Lys Leu Gly Asp Phe Gly
                165                 170                 175
Val Ser Ala Cys Leu Phe Asp Asn Gly Asp Arg Gln Arg Ala Arg Asn
            180                 185                 190
Thr Phe Val Gly Thr Pro Cys Trp Met Ala Pro Glu Val Leu Gln Pro
        195                 200                 205
Gly Asn Gly Tyr Asn Ser Lys Ala Asp Ile Trp Ser Phe Gly Ile Thr
    210                 215                 220
Ala Leu Glu Leu Ala His Gly His Ala Pro Phe Ser Lys Tyr Pro Pro
225                 230                 235                 240
Met Lys Val Leu Leu Met Thr Ile Gln Asn Ala Pro Pro Gly Leu Asp
                245                 250                 255
Tyr Asp Arg Asp Lys Lys Phe Ser Lys Ser Phe Lys Glu Met Val Ala
            260                 265                 270
Met Cys Leu Val Lys Asp Gln Thr Lys Arg Pro Thr Ala Glu Lys Leu
        275                 280                 285
Leu Lys His Ser Cys Phe Lys His Thr Lys Pro Pro Glu Gln Thr Val
    290                 295                 300
Lys Ile Leu Phe Ser Asp Leu Pro Pro Leu Trp Thr Arg Val Lys Ser
305                 310                 315                 320
Leu Gln Asp Lys Asp Ala Gln Gln Leu Ala Leu Lys Arg Met Ala Thr
                325                 330                 335
Ala Asp Glu Glu Ala Ile Ser Gln Ser Glu Tyr Gln Arg Gly Val Ser
            340                 345                 350
Ala Trp Asn Phe Asp Val Arg Asp Leu Lys Thr Gln Ala Ser Leu Leu
        355                 360                 365
Ile Asp Asp Asp Asp Leu Glu Glu Ser Lys Glu Asp Glu Glu Ile Leu
    370                 375                 380
Cys Ala Gln Phe Asn Lys Val Asn Asp Arg Glu Gln Val Phe Asp Ser
385                 390                 395                 400
Leu Gln Leu Tyr Glu Asn Met Asn Gly Lys Glu Lys Val Ser Asn Thr
                405                 410                 415
Glu Val Glu Glu Pro Thr Cys Lys Glu Lys Phe Thr Phe Val Thr Thr
            420                 425                 430
Thr Ser Ser Leu Glu Arg Met Ser Pro Asn Ser Glu His Asp Ile Pro
        435                 440                 445
Glu Ala Lys Val Lys Pro Leu Arg Arg Gln Ser Gln Ser Gly Pro Leu
    450                 455                 460
Thr Ser Arg Thr Val Leu Ser His Ser Ala Ser Glu Lys Ser His Ile
465                 470                 475                 480
Phe Glu Arg Ser Glu Ser Glu Pro Gln Thr Ala Pro Thr Val Arg Arg
                485                 490                 495
Ala Pro Ser Phe Ser Gly Pro Leu Asn Leu Ser Thr Arg Ala Ser Ser
            500                 505                 510
Asn Ser Leu Ser Ala Pro Ile Lys Tyr Ser Gly Gly Phe Arg Asp Ser
        515                 520                 525
Leu Asp Asp Lys Ser Lys Ala Asn Leu Val Gln Lys Gly Arg Phe Ser
    530                 535                 540
Val Thr Ser Gly Asn Val Asp Leu Ala Lys Asp Val Pro Leu Ser Ile
545                 550                 555                 560
Val Pro Arg Arg Ser Pro Gln Ala Thr Pro Leu Arg Lys Ser Ala Ser
                565                 570                 575
Val Gly Asn Trp Ile Leu Glu Pro Lys Met Pro Thr Ala Gln Pro Gln
            580                 585                 590
Thr Ile Lys Glu His Ser Ser His Pro Thr Ser Ser Ser Pro Ile Met
        595                 600                 605
Pro Gln Leu Gln His Leu Phe Gln Gln Asn Ser Ile Gln Gln Asp Leu
    610                 615                 620
Ile Met Asn Leu Leu Asn Ser Leu Gln Pro Val Glu Ala Thr Glu Gly
625                 630                 635                 640
Ser Gln Ser Gly Lys Leu Pro Pro Leu Pro Arg Ser Asp Ser Asn Gly
                645                 650                 655
Asn Val Glu Pro Val Ala Ser Glu Arg Glu Arg Leu Leu Leu Ser Ser
            660                 665                 670
Ile Ser Asp Leu Arg Ala Arg Leu Asp Asp Leu Thr Glu Glu Leu Asp
        675                 680                 685
Ile Glu Lys Ser Lys Tyr Ser Gln Leu Gln Gln Lys Leu Lys Ala Phe
    690                 695                 700
Thr Gly Arg Glu His
705
<210>23
<211>2286
<212>DNA
<213>稻(Oryza sativa)
<400>23
atggccaagg cgtgggagaa ggtggcgacg gcggcggggt tgggtgggtc gggggagagg     60
cgcaagtacc cgatccgcgt ggaggactac gagctgtacg aggagatcgg gcagggggtc    120
agcgccatcg tgtaccgatc gctctgcaag cccctcgacg agatcgtcgc cgtcaaggtg    180
ctcgacttcg agcgcacaaa cagtgacctg tggttagttg taatgcaagt aggttatact    240
cggattgttg cgatttacgt accgccgctt gatctgtcta aaatgatagt aacacggata    300
tgcttgacgc agaacaacat catgcgtgaa gctcagacga tgattctcat agatcagcct    360
aacgtcatga aggcacattg ttcatttaca aataaccact cgttgtgggt ggtcatgcca    420
tacatggctg gagggtcttg ccttcacata atgaagtcag tctatccaga tggttttgaa    480
gaagctgtca ttgcaactgt acttcgtgaa gtcctgaaag gtttggagta ccttcatcat    540
catgggcata tacatcgtga tgtgaaggca gggaatatac ttgttgattc acggggtgta    600
gtcaagcttg gagattttgg ggtttctgct tgcctttttg attctggtga caggcaacgg    660
gctaggaata ctttcgtggg aactccttgc tggatggcac cagaggttat ggagcagcta    720
catggatacg atttcaaggc agacatatgg tccttcggaa ttactgcact tgaacttgcc    780
catggtcatg ctcctttctc gaagttccct cccatgaagg tcttacttat gacacttcag    840
aatgcccctc cgggccttga ctatgagaga gataagaaat tttcaaggca tttcaagcaa    900
atggttgcta tgtgtctggt aaaagaccct tcaaaaaggc ctacagcgaa aaaattgctg    960
aagcaaccct ttttcaagca agctcgctcc agtgatttca ttagtcgaaa gcttttggag   1020
ggattgcctg gccttggtgc cagatattta gctctgaagg aaaaggatga agttttactt   1080
tctcaaaaga aaatgcctga tggacagaag gaagaaatct cacaggatga atacaaaaga   1140
ggcatcagta gctggaactt tgatatggat gacctgaagt ctcaagcttc acttattaca   1200
gagtgtgatg acagtatatc gtgcaaagat tcagatgcat catgtttcta tgacttggac    1260
accattttac cagagcgagc aacaggacct catatgtcaa gagttttttc aattaagtat    1320
gatacggaca ccgaaaatga tgtgatgagc aatgataagt cagcagtttc atctcctgag    1380
caccccattt gtttagcaag gaatacatca atgctcagga ctacaaacgg ggtacatgca    1440
aatggccagg tcaggaaaca cagctccaca gaaagtagtg aactggactt gcaagagaaa    1500
gattcagatg ctattccaac cagttcattc agctcatttc atgaaaggaa gttttctttc    1560
agttcttgct catctgatgg atttctttca tccaaagaga gctcgaagca tcaaattaac    1620
attcataacc gtgacaagtg caacggagga cccttgcaag ttgcagatga accatcccct    1680
gaagctgttc caaaggtgcc taaatcatca gcagcaaatg ttgaggacca cgacgataga    1740
tcgaaacctc ctcttataca gcaaagaggc cgttttaaag ttacgcctgg gcatgttgag    1800
ttggataagg attttcaata tcgttcgatt caagaattga tgccatctgt tgggagcaat    1860
atacaggcaa tttcgcacct tccttcgtta agtataccat cctcaattga ggctgcatca    1920
accattattg gtgggtccct ttatatgcag ctgtacaatg ttctacagac aaatatgctt    1980
cagagggagc aaatacttca tgcgatgaaa cagttaagtg gttgcgatat ggcaatgacg    2040
tcacctgcct gcattgctcc tgcaagtcgc gcatcatctc catcatcagc attatcaatt    2100
gacagatcat tgttggaagc ggcacacgaa aaggagaagg agctggtcaa tgagatcact    2160
gagctgcaat ggcggttagt gtgttcgcag gacgagatac agaggctcaa agcaaaggca    2220
gcccaggtga ccatatctga tcttgtggag atgctgttag atatggaaca gcacgggaag    2280
gattga                                                               2286
<210>24
<211>534
<212>PRT
<213>稻
<400>24
Met Ala Ala Ala Ala Gly Ser Val Gly Gly Asp Asp His His His His
1               5                   10                  15
Gln Gln Ala Arg Tyr Pro Leu Asp Ala Gly Ser Tyr Arg Leu Leu Cys
            20                  25                  30
Lys Ile Gly Ser Gly Val Ser Ala Val Val Tyr Lys Ala Ala Cys Val
        35                  40                  45
Pro Leu Gly Ser Ala Val Val Ala Ile Lys Ala Ile Asp Leu Glu Arg
    50                  55                  60
Ser Arg Ala Asn Leu Asp Glu Val Trp Arg Glu Ala Lys Ala Met Ala
65                  70                  75                  80
Leu Leu Ser His Arg Asn Val Leu Arg Ala His Cys Ser Phe Thr Val
                85                  90                  95
Gly Ser His Leu Trp Val Val Met Pro Phe Met Ala Ala Gly Ser Leu
            100                 105                 110
His Ser Ile Leu Ser His Gly Phe Pro Asp Gly Leu Pro Glu Gln Cys
        115                 120                 125
Ile Ala Val Val Leu Arg Asp Thr Leu Arg Ala Leu Cys Tyr Leu His
    130                 135                 140
Glu Gln Gly Arg Ile His Arg Asp Ile Lys Ala Gly Asn Ile Leu Val
145                 150                 155                 160
Asp Ser Asp Gly Ser Val Lys Leu Ala Asp Phe Gly Val Ser Ala Ser
                165                 170                 175
Ile Tyr Glu Thr Ala Pro Ser Thr Ser Ser Ala Phe Ser Gly Pro Ile
            180                 185                 190
Asn His Ala Pro Pro Pro Ser Gly Ala Ala Leu Ser Ser Ser Cys Phe
        195                 200                 205
Asn Asp Met Ala Gly Thr Pro Tyr Trp Met Ala Pro Glu Val Ile His
    210                 215                 220
Ser His Val Gly Tyr Gly Ile Lys Ala Asp Ile Trp Ser Phe Gly Ile
225                 230                 235                 240
Thr Ala Leu Glu Leu Ala His Gly Arg Pro Pro Leu Ser His Leu Pro
                245                 250                 255
Pro Ser Lys Ser Met Leu Met Arg Ile Thr Ser Arg Val Arg Leu Glu
            260                 265                 270
Val Asp Ala Ser Ser Ser Ser Ser Glu Gly Ser Ser Ser Ala Ala Arg
        275                 280                 285
Lys Lys Lys Lys Phe Ser Lys Ala Phe Lys Asp Met Val Ser Ser Cys
    290                 295                 300
Leu Cys Gln Glu Pro Ala Lys Arg Pro Ser Ala Glu Lys Leu Leu Arg
305                 310                 315                 320
His Pro Phe Phe Lys Gly Cys Arg Ser Arg Asp Tyr Asp Tyr Leu Val
                325                 330                 335
Arg Asn Val Leu Asp Ala Val Pro Thr Val Glu Glu Arg Cys Arg Asp
            340                 345                 350
Ser Thr Gln Leu Cys Gly Cys Ala Arg Gly Ala Arg Cys Val Ser Pro
        355                 360                 365
Cys Arg His Ala Ser Ser Gly Ser Asn Val Val Ala Ala Lys Asn Arg
    370                 375                 380
Arg Ile Ser Gly Trp Asn Phe Asn Glu Glu Ser Phe Glu Leu Asp Pro
385                 390                 395                 400
Thr Asp Lys Pro Pro Glu Gln Gln Gln Gln Gln Pro Cys Phe Pro Phe
                405                 410                 415
His His Asp Asn Asp Asp Asp Met Val Glu His Glu Gln Glu Gln Arg
            420                 425                 430
Arg Arg Gln Asp Gly Asn Asp Gly Ser Ser Asp Val Ala Val Pro His
        435                 440                 445
Leu Val Thr Ile Leu Gly Ser Leu Glu Met Gln Arg Asp Met Val Met
    450                 455                 460
Gln Val Leu Glu Gly Asp Gly Gly Gly Gly Gly Glu Thr Ala Gly Arg
465                 470                 475                 480
Glu Glu Met Leu Val Gly Tyr Val Arg Glu Leu Glu Lys Arg Val Gln
                485                 490                 495
Glu Leu Ser Thr Glu Val Glu Glu Glu Met Ala Arg Asn Ala His Leu
            500                 505                 510
Gln Glu Leu Leu His Glu Arg Ala Cys Glu Asn His Thr Asp Ser Ser
        515                 520                 525
His Thr Ser Gly Ser Arg
    530
<210>25
<211>3038
<212>DNA
<213>稻
<400>25
gaccttctct tcctccctcg acacctctcc ccacgttacg ctgcctcctc ctcctcctcg      60
cctccctctc gtgggcgtcg tccccctccg ccaccgccgc cgcccgccgc agcagccgca     120
gaaggggact ccacctcctc ccggatctgc tcgatcgccc ccgattctgt agcttctcct     180
ctgctcagat ccgccccctt gcttttcatc cagctcgtgg cacccgagat ccgctgccgc     240
cgccgccgtc tctgcggtcc tcctcccccc tcgccggtgg ggaaccccgc cgccccgaag     300
cgcgttgcag cgtgtactac tgccggactg ccaaagtacg cttgctgcta gccatttcgg     360
tagcttttgt ggtttctact taactatcgt gtttggcaat acaacacctt ggaccaaagg     420
atgcttgaaa gatagactgg ataattaaga ctggatgcca aagtacgctt gctgctagcc     480
atttcggtag cttttgtggt ttctacttaa ctatcgtgtt tggcaataca acaccttgga     540
ccaaaggatg cttgaaagat agactggata attaagaact atattggact gtacattcgc     600
ctatagactt agtcatgctg ctggttgttc tctgtcgctg ctacaaggtg ttcgtgctat     660
tgccttctgc ttctgtgtgc tatggtaatt gtaactctgt ggttattgcg catgatgctc     720
tttgaatttg agccatggag catgcaagga gatttccaac agatcccaaa gaatataaat     780
tatgtgagga agttggagat ggtgtagtgc tacggtgtac aaagctcttt gtatcccact     840
taatattgaa gttgccatta aagttcttga ccttgagaag tgcagtaatg acctggatgg     900
gataagacga gaagtacaaa ccatgagctt gattgatcat ccaaatcttc ttcgagcata     960
ttgctcgttt acaaatggtc atcagctttg ggttattatg ccttacatgg ccgctggatc    1020
tgctctgcac attatgaaaa cttcttttcc agatgggttt gaggagccag tcattgcaac    1080
tcttttgcgg gaggttctta aagctcttgt ctacctacac tcccaagggc atattcacag    1140
agatgtaaag gctggaaata tcctaataga tacaaatgga gctgtcaagc taggagactt    1200
tggagtgtca gcctgcatgt ttgatactgg gaataggcaa agagcacgaa acacttttgt    1260
agggacccct tgctggatgg ctccagaagt tatgcaacaa ctgcatggtt atgattacaa    1320
agctgacatt tggtcctttg gtataacggc attggaacta gcatatggtc atgctccatt    1380
ttcaaagtac cctccaatga aggtattgct tatgaccttg caaaatgcac caccaggtct    1440
agactatgag agggacaagc gattttcaaa gtctttcaag gatttggttg caacttgctt    1500
agtcaaggat ccacgcaagc gtccatcttc agaaaagctc ttgaagcatt ctttttttaa    1560
gcatgcacgt acagctgaat ttcttgcacg aagtattctt gacggcctcc ccccgctggg    1620
tgaacgcttt aggacattga agggaaaaga ggctgacttg cttcttagta ataagcttgg    1680
ttcagagagc aaggagcaac tatcacagaa agagtacata cgaggaatca gtggttggaa    1740
cttcaatctg gaggacttga aaaatgcagc cgcccttata gacaatacaa acggaacgtg    1800
ccatttagat ggtgttaaca gcaaattcaa ggatggttta caagaagcta atgaaccaga    1860
aaatatttac cagggacggg ctaaccttgt tgcttctgca aggcctgagg atgagataca    1920
agaggtcgaa gatctggatg gtgctctcgc ctcttctttc cccagccgcc cccttgaggc    1980
actaaaatct tgctttgatg tttgtgggga tgatgatccc cctactgcta ctgatttgag    2040
ggagcaacca aatatggaat ctacatcacc tatgcagcag ttccaacaaa ttgagaatca    2100
taaaagtgcc aactgtaatg gtgaaagttt ggaaagaagt gcctctgtac catcaaattt    2160
ggtcaatagt gggtcccaca agttcttaag tggttccctg atacctgaac atgttctttc    2220
tccttacagg aatgttggca atgacccagc aaggaatgag tgtcatcaga aaaatacatg    2280
caacaggaac cgcagtgggc ctttattccg ccaaatgaaa gatccacgcg cacatctgcc    2340
tgttgaacct gaggagcaat ccgaaggaaa agttatccag cgaagggggc gttttcaggt    2400
tacatcagat agtattgctc aaaaggtagc ttcatccgca agcagcagta ggtgctcaaa    2460
tttaccaatc ggagtaacac gatcaactgt ccatccatcg acaattcttc caacactaca    2520
attcatgata cagcaaaata ctatgcaaaa ggaagtgata agtagactga tttcttcaat    2580
tgaggaaata tctgatgctg ctgatgcaag tacaactggt tcatctcagc catctggagt    2640
gcatttcaga gagaaggaac tgcagtcgta catcgccaac ttgcagcaaa gtgtcaccga    2700
acttgctgag gaagttcaga gattaaagct caaaaacact cagctcgagg agcagatcaa    2760
tgcattgccc aaaaaagatg aaaggttacg aagagaggat acccgacaac aatgatatgc    2820
acaatgcact tgtaaccccc gctgtaaaat cagttcccca attttgaatt tggttagcaa    2880
aattatttgt attttgttcg aagtcaggcc tggtgtatct ttgtaatttg taattatttt    2940
agcaaggtga aattatagtt attttcattt gtacaggata tttcaatcta taccaaagtt    3000
aaaagcttgg tactagaaaa taccaaatca tctttcct                            3038
<210>26
<211>693
<212>PRT
<213>稻
<400>26
Met Glu His Ala Arg Arg Phe Pro Thr Asp Pro Lys Glu Tyr Lys Leu
1               5                   10                  15
Cys Glu Glu Val Gly Asp Gly Val Ser Ala Thr Val Tyr Lys Ala Leu
            20                  25                  30
Cys Ile Pro Leu Asn Ile Glu Val Ala Ile Lys Val Leu Asp Leu Glu
        35                  40                  45
Lys Cys Ser Asn Asp Leu Asp Gly Ile Arg Arg Glu Val Gln Thr Met
    50                  55                  60
Ser Leu Ile Asp His Pro Asn Leu Leu Arg Ala Tyr Cys Ser Phe Thr
65                  70                  75                  80
Asn Gly His Gln Leu Trp Val Ile Met Pro Tyr Met Ala Ala Gly Ser
                85                  90                  95
Ala Leu His Ile Met Lys Thr Ser Phe Pro Asp Gly Phe Glu Glu Pro
            100                 105                 110
Val Ile Ala Thr Leu Leu Arg Glu Val Leu Lys Ala Leu Val Tyr Leu
        115                 120                 125
His Ser Gln Gly His Ile His Arg Asp Val Lys Ala Gly Asn Ile Leu
    130                 135                 140
Ile Asp Thr Asn Gly Ala Val Lys Leu Gly Asp Phe Gly Val Ser Ala
145                 150                 155                 160
Cys Met Phe Asp Thr Gly Asn Arg Gln Arg Ala Arg Asn Thr Phe Val
                165                 170                 175
Gly Thr Pro Cys Trp Met Ala Pro Glu Val Met Gln Gln Leu His Gly
            180                 185                 190
Tyr Asp Tyr Lys Ala Asp Ile Trp Ser Phe Gly Ile Thr Ala Leu Glu
        195                 200                 205
Leu Ala His Gly His Ala Pro Phe Ser Lys Tyr Pro Pro Met Lys Val
    210                 215                 220
Leu Leu Met Thr Leu Gln Asn Ala Pro Pro Gly Leu Asp Tyr Glu Arg
225                 230                 235                 240
Asp Lys Arg Phe Ser Lys Ser Phe Lys Asp Leu Val Ala Thr Cys Leu
                245                 250                 255
Val Lys Asp Pro Arg Lys Arg Pro Ser Ser Glu Lys Leu Leu Lys His
            260                 265                 270
Ser Phe Phe Lys His Ala Arg Thr Ala Glu Phe Leu Ala Arg Ser Ile
        275                 280                 285
Leu Asp Gly Leu Pro Pro Leu Gly Glu Arg Phe Arg Thr Leu Lys Gly
    290                 295                 300
Lys Glu Ala Asp Leu Leu Leu Ser Asn Lys Leu Gly Ser Glu Ser Lys
305                 310                 315                 320
Glu Gln Leu Ser Gln Lys Glu Tyr Ile Arg Gly Ile Ser Gly Trp Asn
                325                 330                 335
Phe Asn Leu Glu Asp Leu Lys Asn Ala Ala Ala Leu Ile Asp Asn Thr
            340                 345                 350
Asn Gly Thr Cys His Leu Asp Gly Val Asn Ser Lys Phe Lys Asp Gly
        355                 360                 365
Leu Gln Glu Ala Asn Glu Pro Glu Asn Ile Tyr Gln Gly Arg Ala Asn
    370                 375                 380
Leu Val Ala Ser Ala Arg Pro Glu Asp Glu Ile Gln Glu Val Glu Asp
385                 390                 395                 400
Leu Asp Gly Ala Leu Ala Ser Ser Phe Pro Ser Arg Pro Leu Glu Ala
                405                 410                 415
Leu Lys Ser Cys Phe Asp Val Cys Gly Asp Asp Asp Pro Pro Thr Ala
            420                 425                 430
Thr Asp Leu Arg Glu Gln Pro Asn Met Glu Ser Thr Ser Pro Met Gln
        435                 440                 445
Gln Phe Gln Gln Ile Glu Asn His Lys Ser Ala Asn Cys Asn Gly Glu
    450                 455                 460
Ser Leu Glu Arg Ser Ala Ser Val Pro Ser Asn Leu Val Asn Ser Gly
465                 470                 475                 480
Ser His Lys Phe Leu Ser Gly Ser Leu Ile Pro Glu His Val Leu Ser
                485                 490                 495
Pro Tyr Arg Asn Val Gly Asn Asp Pro Ala Arg Asn Glu Cys His Gln
            500                 505                 510
Lys Asn Thr Cys Asn Arg Asn Arg Ser Gly Pro Leu Phe Arg Gln Met
        515                 520                 525
Lys Asp Pro Arg Ala His Leu Pro Val Glu Pro Glu Glu Gln Ser Glu
    530                 535                 540
Gly Lys Val Ile Gln Arg Arg Gly Arg Phe Gln Val Thr Ser Asp Ser
545                 550                 555                 560
Ile Ala Gln Lys Val Ala Ser Ser Ala Ser Ser Ser Arg Cys Ser Asn
                565                 570                 575
Leu Pro Ile Gly Val Thr Arg Ser Thr Val His Pro Ser Thr Ile Leu
            580                 585                 590
Pro Thr Leu Gln Phe Met Ile Gln Gln Asn Thr Met Gln Lys Glu Val
        595                 600                 605
Ile Ser Arg Leu Ile Ser Ser Ile Glu Glu Ile Ser Asp Ala Ala Asp
    610                 615                 620
Ala Ser Thr Thr Gly Ser Ser Gln Pro Ser Gly Val His Phe Arg Glu
625                 630                 635                 640
Lys Glu Leu Gln Ser Tyr Ile Ala Asn Leu Gln Gln Ser Val Thr Glu
                 645                 650                 655
Leu Ala Glu Glu Val Gln Arg Leu Lys Leu Lys Asn Thr Gln Leu Glu
            660                 665                 670
Glu Gln Ile Asn Ala Leu Pro Lys Lys Asp Glu Arg Leu Arg Arg Glu
        675                 680                 685
Asp Thr Arg Gln Gln
     690
<210>27
<211>2286
<212>DNA
<2l3>稻
<400>27
atggccaagg cgtgggagaa ggtggcgacg gcggcggggt tgggtgggtc gggggagagg      60
cgcaagtacc cgatccgcgt ggaggactac gagctgtacg aggagatcgg gcagggggtc     120
agcgccatcg tgtaccgatc gctctgcaag cccctcgacg agatcgtcgc cgtcaaggtg     180
ctcgacttcg agcgcacaaa cagtgacctg tggttagttg taatgcaagt aggttatact     240
cggattgttg cgatttacgt accgccgctt gatctgtcta aaatgatagt aacacggata     300
tgcttgacgc agaacaacat catgcgtgaa gctcagacga tgattctcat agatcagcct     360
aacgtcatga aggcacattg ttcatttaca aataaccact cgttgtgggt ggtcatgcca     420
tacatggctg gagggtcttg ccttcacata atgaagtcag tctatccaga tggttttgaa     480
gaagctgtca ttgcaactgt acttcgtgaa gtcctgaaag gtttggagta ccttcatcat     540
catgggcata tacatcgtga tgtgaaggca gggaatatac ttgttgattc acggggtgta     600
gtcaagcttg gagattttgg ggtttctgct tgcctttttg attctggtga caggcaacgg     660
gctaggaata ctttcgtggg aactccttgc tggatggcac cagaggttat ggagcagcta     720
catggatacg atttcaaggc agacatatgg tccttcggaa ttactgcact tgaacttgcc     780
catggtcatg ctcctttctc gaagttccct cccatgaagg tcttacttat gacacttcag     840
aatgcccctc cgggccttga ctatgagaga gataagaaat tttcaaggca tttcaagcaa     900
atggttgcta tgtgtctggt aaaagaccct tcaaaaaggc ctacagcgaa aaaattgctg     960
aagcaaccct ttttcaagca agctcgctcc agtgatttca ttagtcgaaa gcttttggag    1020
ggattgcctg gccttggtgc cagatattta gctctgaagg aaaaggatga agttttactt    1080
tctcaaaaga aaatgcctga tggacagaag gaagaaatct cacaggatga atacaaaaga    1140
ggcatcagta gctggaactt tgatatggat gacctgaagt ctcaagcttc acttattaca    1200
gagtgtgatg acagtatatc gtgcaaagat tcagatgcat catgtttcta tgacttggac    1260
accattttac cagagcgagc aacaggacct catatgtcaa gagttttttc aattaagtat    1320
gatacggaca ccgaaaatga tgtgatgagc aatgataagt cagcagtttc atctcctgag    1380
caccccattt gtttagcaag gaatacatca atgctcagga ctacaaacgg ggtacatgca    1440
aatggccagg tcaggaaaca cagctccaca gaaagtagtg aactggactt gcaagagaaa    1500
gattcagatg ctattccaac cagttcattc agctcatttc atgaaaggaa gttttctttc    1560
agttcttget catctgatgg atttctttca tccaaagaga gctcgaagca tcaaattaac    1620
attcataacc gtgacaagtg caacggagga cccttgcaag ttgcagatga accatcccct    1680
gaagctgttc caaaggtgcc taaatcatca gcagcaaatg ttgaggacca cgacgataga    1740
tcgaaacctc ctcttataca gcaaagaggc cgttttaaag ttacgcctgg gcatgttgag    1800
ttggataagg attttcaata tcgttcgatt caagaattga tgccatctgt tgggagcaat    1860
atacaggcaa tttcgcacct tccttcgtta agtataccat cctcaattga ggctgcatca    1920
accattattg gtgggtccct ttatatgcag ctgtacaatg ttctacagac aaatatgctt    1980
cagagggagc aaatacttca tgcgatgaaa cagttaagtg gttgcgatat ggcaatgacg    2040
tcacctgcct gcattgctcc tgcaagtcgc gcatcatctc catcatcagc attatcaatt    2100
gacagatcat tgttggaagc ggcacacgaa aaggagaagg agctggtcaa tgagatcact    2160
gagctgcaat ggcggttagt gtgttcgcag gacgagatac agaggctcaa agcaaaggca    2220
gcccaggtga ccatatctga tcttgtggag atgctgttag atatggaaca gcacgggaag    2280
gattga                                                               2286
<210>28
<211>761
<212>PRT
<213>稻
<400>28
Met Ala Lys Ala Trp Glu Lys Val Ala Thr Ala Ala Gly Leu Gly Gly
1               5                   10                  15
Ser Gly Glu Arg Arg Lys Tyr Pro Ile Arg Val Glu Asp Tyr Glu Leu
            20                   25                 30
Tyr Glu Glu Ile Gly Gln Gly Val Ser Ala Ile Val Tyr Arg Ser Leu
        35                  40                  45
Cys Lys Pro Leu Asp Glu Ile Val Ala Val Lys Val Leu Asp Phe Glu
    50                  55                  60
Arg Thr Asn Ser Asp Leu Trp Leu Val Val Met Gln Val Gly Tyr Thr
65                  70                  75                  80
Arg Ile Val Ala Ile Tyr Val Pro Pro Leu Asp Leu Ser Lys Met Ile
                85                  90                  95
Val Thr Arg Ile Cys Leu Thr Gln Asn Asn Ile Met Arg Glu Ala Gln
            100                 105                 110
Thr Met Ile Leu Ile Asp Gln Pro Asn Val Met Lys Ala His Cys Ser
        115                 120                 125
Phe Thr Asn Asn His Ser Leu Trp Val Val Met Pro Tyr Met Ala Gly
    130                 135                 140
Gly Ser Cys Leu His Ile Met Lys Ser Val Tyr Pro Asp Gly Phe Glu
145                 150                 155                 160
Glu Ala Val Ile Ala Thr Val Leu Arg Glu Val Leu Lys Gly Leu Glu
                165                 170                 175
Tyr Leu His His His Gly His Ile His Arg Asp Val Lys Ala Gly Asn
            180                 185                 190
Ile Leu Val Asp Ser Arg Gly Val Val Lys Leu Gly Asp Phe Gly Val
        195                 200                 205
Ser Ala Cys Leu Phe Asp Ser Gly Asp Arg Gln Arg Ala Arg Asn Thr
    210                 215                 220
Phe Val Gly Thr Pro Cys Trp Met Ala Pro Glu Val Met Glu Gln Leu
225                 230                 235                 240
His Gly Tyr Asp Phe Lys Ala Asp Ile Trp Ser Phe Gly Ile Thr Ala
                245                 250                 255
Leu Glu Leu Ala His Gly His Ala Pro Phe Ser Lys Phe Pro Pro Met
            260                 265                 270
Lys Val Leu Leu Met Thr Leu Gln Asn Ala Pro Pro Gly Leu Asp Tyr
        275                 280                 285
Glu Arg Asp Lys Lys Phe Ser Arg His Phe Lys Gln Met Val Ala Met
    290                 295                 300
Cys Leu Val Lys Asp Pro Ser Lys Arg Pro Thr Ala Lys Lys Leu Leu
305                 310                 315                 320
Lys Gln Pro Phe Phe Lys Gln Ala Arg Ser Ser Asp Phe Ile Ser Arg
                325                 330                 335
Lys Leu Leu Glu Gly Leu Pro Gly Leu Gly Ala Arg Tyr Leu Ala Leu
            340                 345                 350
Lys Glu Lys Asp Glu Val Leu Leu Ser Gln Lys Lys Met Pro Asp Gly
        355                 360                 365
Gln Lys Glu Glu Ile Ser Gln Asp Glu Tyr Lys Arg Gly Ile Ser Ser
    370                 375                 380
Trp Asn Phe Asp Met Asp Asp Leu Lys Ser Gln Ala Ser Leu Ile Thr
385                 390                 395                 400
Glu Cys Asp Asp Ser Ile Ser Cys Lys Asp Ser Asp Ala Ser Cys Phe
                405                 410                 415
Tyr Asp Leu Asp Thr Ile Leu Pro Glu Arg Ala Thr Gly Pro His Met
            420                 425                 430
Ser Arg Val Phe Ser Ile Lys Tyr Asp Thr Asp Thr Glu Asn Asp Val
        435                 440                 445
Met Ser Asn Asp Lys Ser Ala Val Ser Ser Pro Glu His Pro Ile Cys
    450                 455                 460
Leu Ala Arg Asn Thr Ser Met Leu Arg Thr Thr Asn Gly Val His Ala
465                 470                 475                 480
Asn Gly Gln Val Arg Lys His Ser Ser Thr Glu Ser Ser Glu Leu Asp
                485                 490                 495
Leu Gln Glu Lys Asp Ser Asp Ala Ile Pro Thr Ser Ser Phe Ser Ser
            500                 505                 510
Phe His Glu Arg Lys Phe Ser Phe Ser Ser Cys Ser Ser Asp Gly Phe
        515                 520                 525
Leu Ser Ser Lys Glu Ser Ser Lys His Gln Ile Asn Ile His Asn Arg
    530                 535                 540
Asp Lys Cys Asn Gly Gly Pro Leu Gln Val Ala Asp Glu Pro Ser Pro
545                 550                 555                 560
Glu Ala Val Pro Lys Val Pro Lys Ser Ser Ala Ala Asn Val Glu Asp
                565                 570                 575
His Asp Asp Arg Ser Lys Pro Pro Leu Ile Gln Gln Arg Gly Arg Phe
            580                 585                 590
Lys Val Thr Pro Gly His Val Glu Leu Asp Lys Asp Phe Gln Tyr Arg
        595                 600                 605
Ser Ile Gln Glu Leu Met Pro Ser Val Gly Ser Asn Ile Gln Ala Ile
    610                 615                 620
Ser His Leu Pro Ser Leu Ser Ile Pro Ser Ser Ile Glu Ala Ala Ser
625                 630                 635                 640
Thr Ile Ile Gly Gly Ser Leu Tyr Met Gln Leu Tyr Asn Val Leu Gln
                645                 650                 655
Thr Asn Met Leu Gln Arg Glu Gln Ile Leu His Ala Met Lys Gln Leu
            660                 665                 670
Ser Gly Cys Asp Met Ala Met Thr Ser Pro Ala Cys Ile Ala Pro Ala
        675                 680                 685
Ser Arg Ala Ser Ser Pro Ser Ser Ala Leu Ser Ile Asp Arg Ser Leu
    690                 695                 700
Leu Glu Ala Ala His Glu Lys Glu Lys Glu Leu Val Asn Glu Ile Thr
705                 710                 715                 720
Glu Leu Gln Trp Arg Leu Val Cys Ser Gln Asp Glu Ile Gln Arg Leu
                725                 730                 735
Lys Ala Lys Ala Ala Gln Val Thr Ile Ser Asp Leu Val Glu Met Leu
            740                 745                 750
Leu Asp Met Glu Gln His Gly Lys Asp
        755                 760
<210>29
<211>1623
<212>DNA
<213>稻
<400>29
atggggagga acgggagcgt caagcgtacg tcgtcgtcgg gggcggcggc ggcgttcacg     60
gcgaatcccc gcgactacca gctcatggag gaggtcgggt acggggcgca cgccgtcgtg    120
taccgcgcgc tgttcgtccc caggaacgac gtcgtggctg tcaagtgcct ggatctcgat    180
cagctcaaca acaacatcga tgaaatccaa cgggaggctc aaatcatgag cttgatagag    240
catcctaatg tcatcagggc ttactgctca tttgttgttg agcacagcct ttgggtagta    300
atgccattta tgactgaggg ttcatgtctg cacctaatga agattgcata tcctgatggt    360
ttcgaggaac ctgttattgg ctctattcta aaggaaacac ttaaggcttt ggagtacctt    420
cacaggcaag gacaaatcca tcgtgatgtc aaggccggca atatccttgt tgataatgct    480
ggtatagtga agcttgggga cttcggcgtg tctgcttgta tgtttgatag aggtgatcga     540
caaagatcta ggaacacatt tgtgggaaca ccgtgttgga tggctccaga agtgctccag     600
ccaggcactg gatataactt caaagctgac atatggtcat ttggaatcac tgcacttgaa     660
cttgcccatg gccatgcacc gttttcaaag tatcccccta tgaaggttct tctcatgacc     720
ctccagaatg ctccacctgg tctcgactat gatcgagacc gaagattctc aaagtcattt     780
aaggagatgg ttgcaatgtg cttggtaaaa gatcaaacaa agagaccaac agctgagaag     840
ttgctaaagc attcattttt caaaaatgca aaacctccag aattgacaat gaagggtatc     900
ttaactgatt tacctcctct atgggaccgt gtaaaggctc tccagcttaa agatgcagca     960
cagttggcct tgaagaaaat gccttcttct gagcaggagg cactctccat gagtgaatac    1020
caacgaggtg ttagtgcatg gaacttcgat gttgaagatc tcaaggccca agcatcacta    1080
attcgtgatg atgaaccccc tgaaataaaa gaagacgatg atactgcaag aaccattgaa    1140
gttgaaaagg attcattttc taggaatcat ttggggaagt cgtcgagtac aattgaaaat    1200
ttcttcagtg gacggacctc taccactgca gcaaattcgg atggaaaagg cgatttttca    1260
tttgaagctt ttgattttgg tgaaaacaac gttgatacta aaattatgcc caatgggtat    1320
gaaaacgcta gatcagagaa tagctcatca ccctctacat caaagcaaga tccagagtca    1380
aaatattgga gaagtacttc tggacagaaa caacaaactt ctggcactcc agctgtccat    1440
tctggtgggg ttaatagctc aacaactgaa aagggccatg gtgttgaaag ggatgcaact    1500
gttcaattgg catctgataa acttaggact gaaacgagaa gagcaacaaa tcttagtggt    1560
ccattgtcac tgccaactcg tgcttctgca aacagtctgt cagctcctat tcgatcttca    1620
gga                                                                  1623
<210>30
<211>541
<212>PRT
<213>稻
<400>30
Met Gly Arg Asn Gly Ser Val Lys Arg Thr Ser Ser Ser Gly Ala Ala
1               5                   10                  15
Ala Ala Phe Thr Ala Asn Pro Arg Asp Tyr Gln Leu Met Glu Glu Val
            20                  25                  30
Gly Tyr Gly Ala His Ala Val Val Tyr Arg Ala Leu Phe Val Pro Arg
        35                  40                  45
Asn Asp Val Val Ala Val Lys Cys Leu Asp Leu Asp Gln Leu Asn Asn
    50                  55                  60
Asn Ile Asp Glu Ile Gln Arg Glu Ala Gln Ile Met Ser Leu Ile Glu
65                  70                  75                  80
His Pro Asn Val Ile Arg Ala Tyr Cys Ser Phe Val Val Glu His Ser
                85                  90                  95
Leu Trp Val Val Met Pro Phe Met Thr Glu Gly Ser Cys Leu His Leu
            100                 105                 110
Met Lys Ile Ala Tyr Pro Asp Gly Phe Glu Glu Pro Val Ile Gly Ser
        115                 120                 125
Ile Leu Lys Glu Thr Leu Lys Ala Leu Glu Tyr Leu His Arg Gln Gly
    130                 135                 140
Gln Ile His Arg Asp Val Lys Ala Gly Asn Ile Leu Val Asp Asn Ala
145                 150                 155                 160
Gly Ile Val Lys Leu Gly Asp Phe Gly Val Ser Ala Cys Met Phe Asp
                165                 170                 175
Arg Gly Asp Arg Gln Arg Ser Arg Asn Thr Phe Val Gly Thr Pro Cys
            180                 185                 190
Trp Met Ala Pro Glu Val Leu Gln Pro Gly Thr Gly Tyr Asn Phe Lys
        195                 200                 205
Ala Asp Ile Trp Ser Phe Gly Ile Thr Ala Leu Glu Leu Ala His Gly
    210                 215                 220
His Ala Pro Phe Ser Lys Tyr Pro Pro Met Lys Val Leu Leu Met Thr
225                 230                 235                 240
Leu Gln Asn Ala Pro Pro Gly Leu Asp Tyr Asp Arg Asp Arg Arg Phe
                245                 250                 255
Ser Lys Ser Phe Lys Glu Met Val Ala Met Cys Leu Val Lys Asp Gln
            260                 265                 270
Thr Lys Arg Pro Thr Ala Glu Lys Leu Leu Lys His Ser Phe Phe Lys
        275                 280                 285
Asn Ala Lys Pro Pro Glu Leu Thr Met Lys Gly Ile Leu Thr Asp Leu
    290                 295                 300
Pro Pro Leu Trp Asp Arg Val Lys Ala Leu Gln Leu Lys Asp Ala Ala
305                 310                 315                 320
Gln Leu Ala Leu Lys Lys Met Pro Ser Ser Glu Gln Glu Ala Leu Ser
                325                 330                 335
Met Ser Glu Tyr Gln Arg Gly Val Ser Ala Trp Asn Phe Asp Val Glu
            340                 345                 350
Asp Leu Lys Ala Gln Ala Ser Leu Ile Arg Asp Asp Glu Pro Pro Glu
        355                 360                 365
Ile Lys Glu Asp Asp Asp Thr Ala Arg Thr Ile Glu Val Glu Lys Asp
    370                 375                 380
Ser Phe Ser Arg Asn His Leu Gly Lys Ser Ser Ser Thr Ile Glu Asn
385                 390                 395                 400
Phe Phe Ser Gly Arg Thr Ser Thr Thr Ala Ala Asn Ser Asp Gly Lys
                405                 410                 415
Gly Asp Phe Ser Phe Glu Ala Phe Asp Phe Gly Glu Asn Asn Val Asp
            420                 425                 430
Thr Lys Ile Met Pro Asn Gly Tyr Glu Asn Ala Arg Ser Glu Asn Ser
        435                 440                 445
Ser Ser Pro Ser Thr Ser Lys Gln Asp Pro Glu Ser Lys Tyr Trp Arg
    450                 455                 460
Ser Thr Ser Gly Gln Lys Gln Gln Thr Ser Gly Thr Pro Ala Val His
465                 470                 475                 480
Ser Gly Gly Val Asn Ser Ser Thr Thr Glu Lys Gly His Gly Val Glu
                485                 490                 495
Arg Asp Ala Thr Val Gln Leu Ala Ser Asp Lys Leu Arg Thr Glu Thr
            500                 505                 510
Arg Arg Ala Thr Asn Leu Ser Gly Pro Leu Ser Leu Pro Thr Arg Ala
        515                 520                 525
Ser Ala Asn Ser Leu Ser Ala Pro Ile Arg Ser Ser Gly
    530                 535                 540
<210>31
<211>1938
<212>DNA
<213>稻
<400>31
atggtgagga gcgggagtgt gcggcggacg gccgcgtcgt cgtcgcccgc cgcggcggcg      60
gtgccgacgg ccttcaccgc ctcgcccggc gactaccgcc ttctggagga ggtcggctac     120
ggcgcgaacg ccgtcgtgta ccgggcggtg ttcctgccat ccaaccggac cgtcgccgtc     180
aagtgcctgg atctcgatcg tgtcaacagt aacctcgatg atataagaaa agaggcacaa     240
acgatgagct tgatagatca ccctaatgtc atcagggctt actgctcatt tgttgtggat     300
cataacctct gggtgataat gccattcatg tcagagggtt catgtttaca cctgatgaag     360
gttgcatatc ctgatggttt tgaggagcct gttatcgcct ctatcctaaa ggaaacactt     420
aaggctctag agtacctcca tcggcaagga catatccata gggatgtcaa gcgtaatatt     480
atacaggcgg gtaatatcct tatggacagt cctggtatag tgaaacttgg ggactttggt     540
gtctctgctt gtatgtttga tagaggtgat agacaaagat ccaggaatac attcgtggga     600
acaccatgct ggatggctcc agaagttctc cagcctggag caggatataa tttcaagaaa     660
tatgtttcaa accatttgtt taccaactta atttggttat ttaaaatttc cttaaggggt     720
aagaactcta actaccataa aaatactggg aataaggttc ttctcatgac ccttcaaaat     780
gcaccaccag gccttgacta tgaccgtgat aaaagattct caaagtcttt caaggaaatg     840
gttgcaatgt gcctggtcaa agatcaaaca aagaggccaa cggctgaaaa gttactaaag     900
cactcatttt tcaagaacgc aaaacctcca gagctgactg ttaagagtat tttaactgat     960
ttgccccctc tgtgggatcg tgtaaaagcg ctccagctaa aagatgcagc acaattagct    1020
ttgaagaaaa tgccttcttc tgaacaggag gcactttcta tgattcatga tgatgatcca    1080
cctgaaataa aggaagatgt tgacaatgat agaataaatg aagctgataa ggagccgttt    1140
tctggcaatc attttggaca accaaaaatt ttgagtggaa agcacttcag gttgaatcat    1200
gaacaaactt gtgtcactgc agtaagtcca ggggggaata tgcatgagac aagcagagga    1260
ttggtttctg aacctggtga tgctgatagt gaaaggaaag ttgatggata tagaaaacaa    1320
ggggaagcgg cagttaagtt ggcatctgat aaacaaaaga gttgtacaaa aagaaccaca    1380
aatctcagtg gtcctcttgc actccctact cgtgcttctg caaatagtct gtctgctcct    1440
attcggtctt ctggaggcta tgtgggctcc ttgggagata agtctaagcg tagtgtggtg    1500
gagataaaag gacgtttttc agtgacatct gagaatgtgg atcttgcaaa ggttcaggaa    1560
gttccaacaa gcggcatttc acgcaaatta caggagggat cttcactgag aaaatcagcc    1620
agcgttggtc attggccggt ggatgctaag ccaatggatc tcatcacaaa cctcctaagt    1680
agcttgcaac agaatgagaa agctgacgca acacagtata gacttggtaa tatggatggt    1740
gatacagagg ttgaaacgtc tatttccgag ggagaacggt cattacttgt caaaatattt    1800
gaattgcaat ctagaatgat ttcattaacc gatgaactga tcacaacaaa actgcaacat    1860
gtccagctac aagaagagct aaaaatactg tactgtcacg aagaaataat cgacactagg    1920
gaggtggaca atgcttga                                                  1938
<210>32
<211>645
<212>PRT
<213>稻
<400>32
Met Val Arg Ser Gly Ser Val Arg Arg Thr Ala Ala Ser Ser Ser Pro
1               5                   10                  15
Ala Ala Ala Ala Val Pro Thr Ala Phe Thr Ala Ser Pro Gly Asp Tyr
            20                  25                  30
Arg Leu Leu Glu Glu Val Gly Tyr Gly Ala Asn Ala Val Val Tyr Arg
        35                  40                  45
Ala Val Phe Leu Pro Ser Asn Arg Thr Val Ala Val Lys Cys Leu Asp
    50                  55                  60
Leu Asp Arg Val Asn Ser Asn Leu Asp Asp Ile Arg Lys Glu Ala Gln
65                  70                  75                  80
Thr Met Ser Leu Ile Asp His Pro Asn Val Ile Arg Ala Tyr Cys Ser
                85                  90                  95
Phe Val Val Asp His Asn Leu Trp Val Ile Met Pro Phe Met Ser Glu
            100                 105                 110
Gly Ser Cys Leu His Leu Met Lys Val Ala Tyr Pro Asp Gly Phe Glu
        115                 120                 125
Glu Pro Val Ile Ala Ser Ile Leu Lys Glu Thr Leu Lys Ala Leu Glu
    130                 135                 140
Tyr Leu His Arg Gln Gly His Ile His Arg Asp Val Lys Arg Asn Ile
145                 150                 155                 160
Ile Gln Ala Gly Asn Ile Leu Met Asp Ser Pro Gly Ile Val Lys Leu
                165                 170                 175
Gly Asp Phe Gly Val Ser Ala Cys Met Phe Asp Arg Gly Asp Arg Gln
            180                 185                 190
Arg Ser Arg Asn Thr Phe Val Gly Thr Pro Cys Trp Met Ala Pro Glu
        195                 200                 205
Val Leu Gln Pro Gly Ala Gly Tyr Asn Phe Lys Lys Tyr Val Ser Asn
    210                 215                 220
His Leu Phe Thr Asn Leu Ile Trp Leu Phe Lys Ile Ser Leu Arg Gly
225                 230                 235                 240
Lys Asn Ser Asn Tyr His Lys Asn Thr Gly Asn Lys Val Leu Leu Met
                245                 250                 255
Thr Leu Gln Asn Ala Pro Pro Gly Leu Asp Tyr Asp Arg Asp Lys Arg
            260                 265                 270
Phe Ser Lys Ser Phe Lys Glu Met Val Ala Met Cys Leu Val Lys Asp
        275                 280                 285
Gln Thr Lys Arg Pro Thr Ala Glu Lys Leu Leu Lys His Ser Phe Phe
    290                 295                 300
Lys Asn Ala Lys Pro Pro Glu Leu Thr Val Lys Ser Ile Leu Thr Asp
305                 310                 315                 320
Leu Pro Pro Leu Trp Asp Arg Val Lys Ala Leu Gln Leu Lys Asp Ala
                325                 330                 335
Ala Gln Leu Ala Leu Lys Lys Met Pro Ser Ser Glu Gln Glu Ala Leu
            340                 345                 350
Ser Met Ile His Asp Asp Asp Pro Pro Glu Ile Lys Glu Asp Val Asp
        355                 360                 365
Asn Asp Arg Ile Asn Glu Ala Asp Lys Glu Pro Phe Ser Gly Asn His
    370                 375                 380
Phe Gly Gln Pro Lys Ile Leu Ser Gly Lys His Phe Arg Leu Asn His
385                 390                 395                 400
Glu Gln Thr Cys Val Thr Ala Val Ser Pro Gly Gly Asn Met His Glu
                405                 410                 415
Thr Ser Arg Gly Leu Val Ser Glu Pro Gly Asp Ala Asp Ser Glu Arg
            420                 425                 430
Lys Val Asp Gly Tyr Arg Lys Gln Gly Glu Ala Ala Val Lys Leu Ala
        435                 440                 445
Ser Asp Lys Gln Lys Ser Cys Thr Lys Arg Thr Thr Asn Leu Ser Gly
    450                 455                 460
Pro Leu Ala Leu Pro Thr Arg Ala Ser Ala Asn Ser Leu Ser Ala Pro
465                 470                 475                 480
Ile Arg Ser Ser Gly Gly Tyr Val Gly Ser Leu Gly Asp Lys Ser Lys
                485                 490                 495
Arg Ser Val Val Glu Ile Lys Gly Arg Phe Ser Val Thr Ser Glu Asn
            500                 505                 510
Val Asp Leu Ala Lys Val Gln Glu Val Pro Thr Ser Gly Ile Ser Arg
        515                 520                 525
Lys Leu Gln Glu Gly Ser Ser Leu Arg Lys Ser Ala Ser Val Gly His
    530                 535                 540
Trp Pro Val Asp Ala Lys Pro Met Asp Leu Ile Thr Asn Leu Leu Ser
545                 550                 555                 560
Ser Leu Gln Gln Asn Glu Lys Ala Asp Ala Thr Gln Tyr Arg Leu Gly
                565                 570                 575
Asn Met Asp Gly Asp Thr Glu Val Glu Thr Ser Ile Ser Glu Gly Glu
            580                 585                 590
Arg Ser Leu Leu Val Lys Ile Phe Glu Leu Gln Ser Arg Met Ile Ser
        595                 600                 605
Leu Thr Asp Glu Leu Ile Thr Thr Lys Leu Gln His Val Gln Leu Gln
    610                 615                 620
Glu Glu Leu Lys Ile Leu Tyr Cys His Glu Glu Ile Ile Asp Thr Arg
625                 630                 635                 640
Glu Val Asp Asn Ala
                645
<210>33
<211>2040
<212>DNA
<213>紫花苜蓿(Medicago sativa)
<400>33
atttattaaa attgatgtga cggtctctat agggccgttt catctaaatt tattaaaatt     60
tagatccaac tatcttataa tccgttgcac tgtgcaacag ttatagagaa tccaaattcc    120
gtaacaggag cttaaattct ctatgattgt tgcacatctc cggtagagta tctaaattta    180
agaaatacaa catatcagag atattatgta gaaacacata ttatcaagtt aattaactag    240
taggactatt agcagcagag gaaattaggt gaagcttgat attctccagc tgcatctcca    300
gctgcaagtt cttcttcttc tcattttcca attctgtcct caacttagag atctcttgca    360
ccattttctc atcactttca gccacatgaa tctcctctcc accaattaga ttcattagaa    420
acttaacttg tcccaactct tgttccaagc tctctttcaa cacattcaac gttgccaacg   480
tagcttcacg gttcttaaca acaccaccga cattttcatg atcaaccaca tcagaagtat   540
tggtctttgg ctccatcaca gttcctgatg ctgtaacaac agcatcctct tggatcactt   600
tttcttcttc gaaccgaact tgtttcacaa cttcatcatc tttgctttga tcctttggga   660
atacaggcac aagttccaat ccatcttcat tgaaattcca gccactgatt cttctctgtt   720
tcacattttt cactgactcg tcatcatcgt cgtctccatc atccttgcac tttgaatctg   780
gatccattat agctttgatc tctttatacc ttttctcaac actaggcaat ccattcaaca   840
cattcttcac caaaacatct gatcccttgc agtttttaaa gaatgaatgc ttaagtaact   900
tctcagcaga gggtcttttt gtaggatctt gattcaaaca taaagcaacc atatccttaa   960
aagccttaga gaatttgtta ctaccaccat gacccttgta actatgttta tcaaaatcag  1020
aaaacttaaa cctctttgta atgtttagca tcaatgactt agaaggagga agatgagaaa  1080
gtggtggtct tccatgtgct aactccaaag ctgttatccc aaaagaccag atatcagctt  1140
tgaaactgta accattatga gagtgaataa cctcaggagc catccaataa ggtgttccag  1200
caaaatcagt aaatatatga gaagaagaag aattcgaaga cgaagatgaa taagaagaac  1260
atgctcctac agagttgttt gattcataaa tggaagcaga aacaccaaaa tctgcaagtt  1320
tcactaatcc atttgagtca acaaggatgt taccagattt gatatctcta tgaagatgtc  1380
cttgtccatg aaggtaagaa agagcattga gagtgtcttt gagaataaca gctatggatt  1440
gttctgttaa gccgttttgg aaagagtgag agataatgga ttgtaatgaa cctccagcca  1500
tgaatggcat aaccacccaa agacggttgt caacggtgaa agaacagtga gctttgagga  1560
tgttggggtg ggaaagaagt gataatgtct ttgcttcacg tctaacatcg tcaaggtcgg  1620
ggcgcgaacg atccaagtct atggatttga tagctactgg tgtggagttt atagggatgc  1680
agattgcttt gtagacgacg gcgctgttac cggcgccaat ctcgtcgacg attttatagg  1740
aggaagagtc taatggatat tgcactcttt ctgctatgtt ggtagccatg gaaataatgg  1800
aagttgagat ataagagtgt gtgtgtgtgt gtgtgttaga ggttgaaaat ggttgtttga  1860
aaatatataa gatgaatgaa ttgcatggat tggtgatgga tggatggatg gtgaaattaa  1920
ttgataaaga gagtggtagg ttgagtttga gcagttttct tgtgaaggtt gatgaaaaaa  1980
gaagaaaata tcattaggca gaggtgattt atttctcaat gatctatcag tggttgtgaa  2040
<210>34
<211>518
<212>PRT
<213>紫花苜蓿
<400>34
Met Ala Thr Asn Ile Ala Glu Arg Val Gln Tyr Pro Leu Asp Ser Ser
1               5                   10                  15
Ser Tyr Lys Ile Val Asp Glu Ile Gly Ala Gly Asn Ser Ala Val Val
            20                  25                  30
Tyr Lys Ala Ile Cys Ile Pro Ile Asn Ser Thr Pro Val Ala Ile Lys
        35                  40                  45
Ser Ile Asp Leu Asp Arg Ser Arg Pro Asp Leu Asp Asp Val Arg Arg
    50                  55                  60
Glu Ala Lys Thr Leu Ser Leu Leu Ser His Pro Asn Ile Leu Lys Ala
65                  70                  75                  80
His Cys Ser Phe Thr Val Asp Asn Arg Leu Trp Val Val Met Pro Phe
                85                  90                  95
Met Ala Gly Gly Ser Leu Gln Ser Ile Ile Ser His Ser Phe Gln Asn
            100                 105                 110
Gly Leu Thr Glu Gln Ser Ile Ala Val Ile Leu Lys Asp Thr Leu Asn
        115                 120                 125
Ala Leu Ser Tyr Leu His Gly Gln Gly His Leu His Arg Asp Ile Lys
    130                 135                 140
Ser Gly Asn Ile Leu Val Asp Ser Asn Gly Leu Val Lys Leu Ala Asp
145                 150                 155                 160
Phe Gly Val Ser Ala Ser Ile Tyr Glu Ser Asn Asn Ser Val Gly Ala
                165                 170                 175
Cys Ser Ser Tyr Ser Ser Ser Ser Ser Asn Ser Ser Ser Ser His Ile
            180                 185                 190
Phe Thr Asp Phe Ala Gly Thr Pro Tyr Trp Met Ala Pro Glu Val Ile
        195                 200                 205
His Ser His Asn Gly Tyr Ser Phe Lys Ala Asp Ile Trp Ser Phe Gly
    210                 215                 220
Ile Thr Ala Leu Glu Leu Ala His Gly Arg Pro Pro Leu Ser His Leu
225                 230                 235                 240
Pro Pro Ser Lys Ser Leu Met Leu Asn Ile Thr Lys Arg Phe Lys Phe
                245                 250                 255
Ser Asp Phe Asp Lys His Ser Tyr Lys Gly His Gly Gly Ser Asn Lys
            260                 265                 270
Phe Ser Lys Ala Phe Lys Asp Met Val Ala Leu Cys Leu Asn Gln Asp
        275                 280                 285
Pro Thr Lys Arg Pro Ser Ala Glu Lys Leu Leu Lys His Ser Phe Phe
    290                 295                 300
Lys Asn Cys Lys Gly Ser Asp Val Leu Val Lys Asn Val Leu Asn Gly
305                 310                 315                 320
Leu Pro Ser Val Glu Lys Arg Tyr Lys Glu Ile Lys Ala Ile Met Asp
                325                 330                 335
Pro Asp Ser Lys Cys Lys Asp Asp Gly Asp Asp Asp Asp Asp Glu Ser
            340                 345                 350
Val Lys Asn Val Lys Gln Arg Arg Ile Ser Gly Trp Asn Phe Asn Glu
        355                 360                 365
Asp Gly Leu Glu Leu Val Pro Val Phe Pro Lys Asp Gln Ser Lys Asp
    370                 375                 380
Asp Glu Val Val Lys Gln Val Arg Phe Glu Glu Glu Lys Val Ile Gln
385                 390                 395                 400
Glu Asp Ala Val Val Thr Ala Ser Gly Thr Val Met Glu Pro Lys Thr
                405                 410                 415
Asn Thr Ser Asp Val Val Asp His Glu Asn Val Gly Gly Val Val Lys
            420                 425                 430
Asn Arg Glu Ala Thr Leu Ala Thr Leu Asn Val Leu Lys Glu Ser Leu
        435                 440                 445
Glu Gln Glu Leu Gly Gln Val Lys Phe Leu Met Asn Leu Ile Gly Gly
    450                 455                 460
Glu Glu Ile His Val Ala Glu Ser Asp Glu Lys Met Val Gln Glu Ile
465                 470                 475                 480
Ser Lys Leu Arg Thr Glu Leu Glu Asn Glu Lys Lys Lys Asn Leu Gln
                485                 490                 495
Leu Glu Met Gln Leu Glu Asn Ile Lys Leu His Leu Ile Ser Ser Ala
            500                 505                 510
Ala Asn Ser Pro Thr Ser
        515

Claims (27)

1. 相对于对照植物增加植物产率的方法,包括调节植物中Ste20样多肽或其同源物编码核酸的表达,和任选地选择具有增加的产率的植物。
2. 根据权利要求1的方法,其中通过引入遗传修饰来实现所述调节的表达,优选在编码Ste20多肽或其同源物的基因座引入遗传修饰。
3. 根据权利要求2的方法,其中通过T-DNA激活、TILLING、定点诱变或定向进化之一实现所述遗传修饰。
4. 相对于对照植物增加植物产率的方法,包括在植物中引入和表达Ste20样核酸或其变体。
5. 根据权利要求4的方法,其中所述核酸编码SEQ ID NO:2的Ste20蛋白质的直系同源物或旁系同源物。
6. 根据权利要求4的方法,其中所述变体为Ste20样核酸的部分或能够与Ste20样核酸杂交的序列,所述部分或杂交序列编码这样的多肽,所述多肽包含激酶结构域和SEQ ID NO:6的Ste20标签序列。
7. 根据权利要求5或6的方法,其中所述Ste20样核酸或其变体在植物中过表达。
8. 根据权利要求5至7中任一项的方法,其中所述Ste20样核酸或其变体是植物来源的,优选来自双子叶植物,优选来自十字花科,更优选所述核酸来自拟南芥。
9. 根据权利要求5至8中任一项的方法,其中所述Ste20样核酸或其变体有效连接于组成型启动子。
10. 根据权利要求9的方法,其中所述组成型启动子为GOS2启动子。
11. 根据权利要求1至10中任一项的方法,其中所述增加的产率是增加的种子产率。
12. 根据权利要求1至11中任一项的方法,其中所述增加的产率选自:增加的种子总重量、增加的饱满种子数或增加的收获指数。
13. 可根据权利要求1至12中任一项的方法获得的植物。
14. 构建体,其包含:
(i)Ste20样核酸或其变体;
(ii)能够驱动(i)中核酸序列表达的一个或多个控制序列;和任选的(iii)转录终止序列。
15. 根据权利要求14的构建体,其中所述控制序列为组成型启动子。
16. 根据权利要求15的构建体,其中所述组成型启动子为GOS2启动子。
17. 根据权利要求16的构建体,其中GOS2启动子如SEQ ID NO:5第1至2193位核苷酸所示。
18. 用根据权利要求14至17中任一项的构建体转化的植物。
19. 产生具有增加的产率的转基因植物的方法,所述方法包括:
(i)在植物或植物细胞中引入和表Ste20样核酸或其变体;
(ii)在促进植物生长和发育的条件下培养植物细胞。
20. 具有增加的产率的转基因植物,其通过向所述植物中引入Ste20样核酸或其变体产生。
21. 根据权利要求13、18或20的转基因植物,其中所述植物是诸如甘蔗的单子叶植物,或者其中所述植物是诸如稻、玉米、小麦、大麦、粟、黑麦、燕麦或高粱的谷类。
22. 根据权利要求13、18、20或21中任一项的植物的可收获部分。
23. 根据权利要求22的植物可收获部分,其中所述可收获部分是种子。
24. 从根据权利要求21的植物、和/或从根据权利要求22或23的植物可收获部分直接衍生的产品。
25. Ste20样核酸/基因或其变体、或Ste20样多肽或其同源物在增加相对于对照植物的产率、尤其是种子产率中的用途。
26. 根据权利要求25的用途,其中所述种子产率为增加的种子总重量、增加的饱满种子数和增加的收获指数中的一项或多项。
27. Ste20样核酸/基因或其变体、或Ste20样多肽或其同源物作为分子标记的用途。
CN2006800323571A 2005-07-06 2006-07-06 Ste20样基因表达对植物产率的提高 Expired - Fee Related CN101258246B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
EP05106135 2005-07-06
EP05106135.6 2005-07-06
US69733805P 2005-07-08 2005-07-08
US60/697,338 2005-07-08
PCT/EP2006/063976 WO2007003660A1 (en) 2005-07-06 2006-07-06 Plant yield improvement by ste20-like gene expression

Publications (2)

Publication Number Publication Date
CN101258246A true CN101258246A (zh) 2008-09-03
CN101258246B CN101258246B (zh) 2012-09-05

Family

ID=35094589

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2006800323571A Expired - Fee Related CN101258246B (zh) 2005-07-06 2006-07-06 Ste20样基因表达对植物产率的提高

Country Status (9)

Country Link
US (2) US8119858B2 (zh)
EP (2) EP1902135A1 (zh)
CN (1) CN101258246B (zh)
AR (1) AR054161A1 (zh)
AU (1) AU2006264937B2 (zh)
BR (1) BRPI0612710A2 (zh)
CA (1) CA2612116A1 (zh)
WO (1) WO2007003660A1 (zh)
ZA (1) ZA200800066B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103533827A (zh) * 2011-05-11 2014-01-22 巴斯夫植物科学有限公司 具有增强的产量相关性状的植物和用于产生该植物的方法

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2006264937B2 (en) * 2005-07-06 2011-01-27 Cropdesign N.V. Plant yield improvement by Ste20-like gene expression
CN101889089B (zh) * 2007-11-27 2013-10-23 巴斯夫植物科学有限公司 具有增加的胁迫耐受性和产率的转基因植物
CA2905743C (en) 2013-03-13 2021-09-28 Pioneer Hi-Bred International, Inc. Glyphosate application for weed control in brassica
EP3744727A1 (en) 2013-03-14 2020-12-02 Pioneer Hi-Bred International, Inc. Compositions and methods to control insect pests
RU2015143825A (ru) 2013-03-15 2017-04-26 Пайонир Хай-Бред Интернэшнл, Инк. Полипептиды phi-4 и способы их применения
EA030896B1 (ru) 2013-08-16 2018-10-31 Пайонир Хай-Бред Интернэшнл, Инк. Инсектицидные белки и способы их применения
ES2937045T3 (es) 2013-09-13 2023-03-23 Pioneer Hi Bred Int Proteínas insecticidas y métodos para su uso
UA120608C2 (uk) 2014-02-07 2020-01-10 Піонір Хай-Бред Інтернешнл, Інк. Очищений поліпептид ptip-83 та спосіб його застосування
US9101100B1 (en) * 2014-04-30 2015-08-11 Ceres, Inc. Methods and materials for high throughput testing of transgene combinations
US20170247719A1 (en) 2014-09-17 2017-08-31 Pioneer Hi-Bred International, Inc. Compositions and methods to control insect pests
WO2016061206A1 (en) 2014-10-16 2016-04-21 Pioneer Hi-Bred International, Inc. Insecticidal proteins and methods for their use
US20170359965A1 (en) 2014-12-19 2017-12-21 E I Du Pont De Nemours And Company Polylactic acid compositions with accelerated degradation rate and increased heat stability
BR112017024948A2 (pt) 2015-05-19 2018-07-31 Pioneer Hi Bred Int proteínas inseticidas e métodos para uso das mesmas
MX2017016119A (es) 2015-06-16 2018-03-07 Pioneer Hi Bred Int Composiciones y metodos para controlar plagas de insectos.
BR112018002535A2 (pt) 2015-08-06 2018-09-25 Du Pont polipeptídeo inseticida recombinante, polinucleotídeo recombinante, construto de dna, planta transgênica ou célula de planta, composição, proteína de fusão, método para controlar uma praga, método para inibir crescimento ou para exterminar uma população de pragas ou uma praga e uso do polipeptídeo
AU2016315655A1 (en) 2015-08-28 2018-02-01 E. I. Du Pont De Nemours And Company Ochrobactrum-mediated transformation of plants
CN108575091A (zh) 2015-12-18 2018-09-25 先锋国际良种公司 杀昆虫蛋白及其使用方法
CN109068660B (zh) 2016-05-04 2023-05-02 先锋国际良种公司 杀昆虫蛋白及其使用方法
EP3472323A1 (en) 2016-06-16 2019-04-24 Pioneer Hi-Bred International, Inc. Compositions and methods to control insect pests
WO2018005411A1 (en) 2016-07-01 2018-01-04 Pioneer Hi-Bred International, Inc. Insecticidal proteins from plants and methods for their use
WO2018013333A1 (en) 2016-07-12 2018-01-18 Pioneer Hi-Bred International, Inc. Compositions and methods to control insect pests
CN116003539A (zh) 2016-11-01 2023-04-25 先锋国际良种公司 杀昆虫蛋白及其使用方法
WO2020076888A1 (en) 2018-10-10 2020-04-16 Pioneer Hi-Bred International, Inc. Plant growth-promoting microbes, compositions, and uses
CA3186978A1 (en) 2020-07-14 2022-01-20 Pioneer Hi-Bred International, Inc. Insecticidal proteins and methods for their use

Family Cites Families (48)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1984002913A1 (en) 1983-01-17 1984-08-02 Monsanto Co Chimeric genes suitable for expression in plant cells
US5352605A (en) 1983-01-17 1994-10-04 Monsanto Company Chimeric genes for transforming plant cells using viral promoters
US5504200A (en) 1983-04-15 1996-04-02 Mycogen Plant Science, Inc. Plant gene expression
US4630393A (en) * 1984-09-21 1986-12-23 Uf Genetics, Inc. Production of hybrid "improved supersweet" sweet corn
US5420034A (en) 1986-07-31 1995-05-30 Calgene, Inc. Seed-specific transcriptional regulation
DK162399C (da) 1986-01-28 1992-03-23 Danisco Fremgangsmaade til ekspression af gener i baelgplanteceller, dna-fragment, rekombineret dna-fragment samt plasmid til brug ved udoevelsen af fremgangsmaaden
US4962028A (en) 1986-07-09 1990-10-09 Dna Plant Technology Corporation Plant promotors
US5614395A (en) 1988-03-08 1997-03-25 Ciba-Geigy Corporation Chemically regulatable and anti-pathogenic DNA sequences and uses thereof
NZ228320A (en) 1988-03-29 1991-06-25 Du Pont Nucleic acid promoter fragments of the promoter region homologous to the em gene of wheat, dna constructs therefrom and plants thereof
CA1341467C (en) 1988-07-29 2004-12-07 John C. Rogers Producing commercially valuable polypeptides with genetically transformed endosperm tissue
DE3843628A1 (de) 1988-12-21 1990-07-05 Inst Genbiologische Forschung Wundinduzierbare und kartoffelknollenspezifische transkriptionale regulation
HU218717B (hu) 1989-03-17 2000-11-28 E. I. Du Pont De Nemours And Co. Nukleinsav-termelést fokozó növényi eredetű génfragmentek és eljárás előállításukra
CA2058756A1 (en) 1990-03-16 1991-09-17 Vic. C. Knauf Sequences preferentially expressed in early seed development and methods related thereto
US5187267A (en) 1990-06-19 1993-02-16 Calgene, Inc. Plant proteins, promoters, coding sequences and use
DE4208050A1 (de) 1992-03-13 1993-09-23 Bayer Ag Azolylmethyl-fluorcyclopropyl-derivate
CA2092069A1 (en) 1992-03-27 1993-09-28 Asako Iida An expression plasmid for seeds
AU3901993A (en) 1992-04-13 1993-11-18 Zeneca Limited Dna constructs and plants incorporating them
WO1993022443A1 (en) 1992-04-24 1993-11-11 Sri International In vivo homologous sequence targeting in eukaryotic cells
JPH0662870A (ja) 1992-08-18 1994-03-08 Mitsui Giyousai Shokubutsu Bio Kenkyusho:Kk 大豆ホスホエノールピルビン酸カルボキシラーゼ遺伝子のプロモーター領域及び5’非翻訳領域
WO1994012015A1 (en) 1992-11-30 1994-06-09 Chua Nam Hai Expression motifs that confer tissue- and developmental-specific expression in plants
US5656451A (en) * 1993-07-30 1997-08-12 Yale University OspE, OspF, and S1 polypeptides in borrelia burgdorferi
DE69434624T2 (de) 1993-11-19 2006-12-14 Biotechnology Research And Development Corp., Peoria Chimäre regulatorische regionen und gen - kassetten zur genexpression in pflanzen
GB9324707D0 (en) 1993-12-02 1994-01-19 Olsen Odd Arne Promoter
WO1995015972A1 (en) 1993-12-09 1995-06-15 Thomas Jefferson University Compounds and methods for site-directed mutations in eukaryotic cells
US5605793A (en) 1994-02-17 1997-02-25 Affymax Technologies N.V. Methods for in vitro recombination
US6395547B1 (en) 1994-02-17 2002-05-28 Maxygen, Inc. Methods for generating polynucleotides having desired characteristics by iterative selection and recombination
GB9403512D0 (en) 1994-02-24 1994-04-13 Olsen Odd Arne Promoter
GB9421286D0 (en) 1994-10-21 1994-12-07 Danisco Promoter
US5689040A (en) 1995-02-23 1997-11-18 The Regents Of The University Of California Plant promoter sequences useful for gene expression in seeds and seedlings
US5952489A (en) 1995-07-05 1999-09-14 Sapporo Breweries Limited Tissue-specific promoter
GB9516241D0 (en) 1995-08-08 1995-10-11 Zeneca Ltd Dna constructs
US5912415A (en) 1996-05-16 1999-06-15 Regents Of The University Of Minnesota Arabidopsis spindly gene, methods of identification and use
US5981841A (en) 1996-08-30 1999-11-09 Monsanto Company Early seed 5' regulatory sequence
DE19644478A1 (de) 1996-10-25 1998-04-30 Basf Ag Blattspezifische Expression von Genen in transgenen Pflanzen
US5977436A (en) 1997-04-09 1999-11-02 Rhone Poulenc Agrochimie Oleosin 5' regulatory region for the modification of plant seed lipid composition
EP1019517B2 (en) 1997-09-30 2014-05-21 The Regents of The University of California Production of proteins in plant seeds
AU5553599A (en) * 1998-08-10 2000-03-06 General Hospital Corporation, The Transgenic plants expressing a mapkkk protein kinase domain
US6555732B1 (en) 1998-09-14 2003-04-29 Pioneer Hi-Bred International, Inc. Rac-like genes and methods of use
US6504083B1 (en) 1998-10-06 2003-01-07 Pioneer Hi-Bred International, Inc. Maize Gos-2 promoters
DE19852195C2 (de) 1998-11-04 2000-11-02 Inst Pflanzengenetik & Kultur Neue Expressionskassette zur Expression von beliebigen Genen in Pflanzensamen
ATE480140T1 (de) 1999-07-22 2010-09-15 Nat Inst Of Agrobio Sciences Verfahren zur superschnellen transformation von monokotyledonen
RU2002107795A (ru) 1999-08-26 2004-03-10 БАСФ ПЛАНТ САЙЕНС ГмбХ (DE) Экспрессия растительных генов под контролем конститутивных промоторов V-арт-азы растений
US20040172685A1 (en) 1999-12-06 2004-09-02 John Mundy Method of using MAPK4 and orthologues thereof to control plant disease resistance and plant growth
US20110131679A2 (en) * 2000-04-19 2011-06-02 Thomas La Rosa Rice Nucleic Acid Molecules and Other Molecules Associated with Plants and Uses Thereof for Plant Improvement
US7834146B2 (en) * 2000-05-08 2010-11-16 Monsanto Technology Llc Recombinant polypeptides associated with plants
US20060134630A1 (en) * 2002-10-09 2006-06-22 Novozymes A/S Method for screening for an antimicrobial polypeptide
US20060150283A1 (en) * 2004-02-13 2006-07-06 Nickolai Alexandrov Sequence-determined DNA fragments and corresponding polypeptides encoded thereby
AU2006264937B2 (en) * 2005-07-06 2011-01-27 Cropdesign N.V. Plant yield improvement by Ste20-like gene expression

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103533827A (zh) * 2011-05-11 2014-01-22 巴斯夫植物科学有限公司 具有增强的产量相关性状的植物和用于产生该植物的方法

Also Published As

Publication number Publication date
US20120110695A1 (en) 2012-05-03
EP2431472A1 (en) 2012-03-21
US8119858B2 (en) 2012-02-21
CN101258246B (zh) 2012-09-05
BRPI0612710A2 (pt) 2012-10-02
AR054161A1 (es) 2007-06-06
US20090025101A1 (en) 2009-01-22
EP1902135A1 (en) 2008-03-26
WO2007003660A1 (en) 2007-01-11
AU2006264937A1 (en) 2007-01-11
CA2612116A1 (en) 2007-01-11
AU2006264937B2 (en) 2011-01-27
ZA200800066B (en) 2009-08-26

Similar Documents

Publication Publication Date Title
CN101258246B (zh) Ste20样基因表达对植物产率的提高
CN101495640B (zh) 具有增强的产量相关性状的伸展蛋白受体样激酶受调节表达的植物和用于产生该植物的方法
CN101415829B (zh) 具有增强的产量相关性状的植物和用于产生该植物的方法
CN101801998B (zh) 养分可利用度减小下具有改良生长特性的植物及其制备方法
KR101255415B1 (ko) 향상된 수확량 관련 형질을 갖는 식물 및 이의 제조 방법
CN101981195B (zh) 产量相关性状增强的植物及其制备方法
CN101268193A (zh) 通过组3 lea表达的植物产量改良
CN103773796A (zh) 具有增强的产量相关性状的植物和用于产生该植物的方法
CN101018865A (zh) 具有改良生长特性的植物及其制备方法
CN101688214A (zh) 具有增强的产量相关性状的植物和用于产生该植物的方法
CN102143971A (zh) 通过过表达编码tfl-1 样蛋白的多核苷酸而具有增强的产量相关性状的植物及其制备方法
CN101883783A (zh) 具有增强的产量相关性状的植物及其制备方法
BRPI0718977A2 (pt) Método para aumentar rendimento de sementes em plantas em relação às plantas de controle, construção, uso da mesma, planta, parte de planta ou célula de planta, método para a produção de uma planta transgênica tendo redimento aumentado de sementes em relação às plantas de controle, planta transgênica, partes colhíveis de uma planta, produtos, e, uso de um ácido nucleico
CN101627125A (zh) 具有增强的产量相关性状的植物及其制备方法
CN103233037A (zh) 具有增强的产量相关性状和/或提高的非生物胁迫抗性的植物和制备该植物的方法
CN104404078A (zh) 具有增强的产率相关性状的植物及其制备方法
CN101365786A (zh) 具有改良的生长特征的植物及其生产方法
EP2436760A1 (en) Plants having improved growth characteristics and method for making the same
CN101023176A (zh) 具有改良生长特性的植物及其制备方法
CN101969759A (zh) 具有增强的产量相关性状的植物及其制备方法
CN101874116B (zh) 具有增强的产量相关性状的植物及其生产方法
CN101595222B (zh) 具有改良的种子产量相关性状的植物及其制备方法
CN104099368A (zh) 具有改良特征的植物及其制备方法
CN101548016B (zh) 产率相关性状增强的植物及使用来自yabby蛋白家族的共有序列制备其的方法
CN101356188A (zh) 具有改良生长特性的植物及其制备方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20120905

Termination date: 20150706

EXPY Termination of patent right or utility model