CN101849009A

CN101849009A - 具有增强的产率相关性状的植物及其制备方法

Info

Publication number: CN101849009A
Application number: CN200880025418A
Authority: CN
Inventors: Y·海茨费尔德; V·弗兰卡德
Original assignee: BASF Plant Science Co GmbH
Current assignee: BASF Plant Science Co GmbH; BASF Plant Science GmbH
Priority date: 2007-07-20
Filing date: 2008-07-21
Publication date: 2010-09-29
Also published as: CN104404078A; AU2008280152B2; US20140165230A1; EP2173884A2; AR067633A1; WO2009013263A3; US20100325753A1; WO2009013263A2; EP2173884B1; US8697947B2; DE112008001879T5; EP2987861A1; AU2008280152A1; ES2440265T3; EP2535417A1; CN102827865A; CA2692777A1

Abstract

本发明总体上涉及分子生物学领域，并且涉及通过调节植物中编码产率增加性多肽的核酸序列的表达来增强多种植物产率相关性状的方法，所述产率增加性多肽选自：核定位AT-hook基序蛋白19/20(AHL19/20)、GRP(生长调节蛋白)(其中所述GRP多肽是金属硫蛋白2a(MT2a)多肽)、丙氨酸氨基转移酶(AAT)样多肽、和丙氨酸氨基转移酶(AAT)多肽。本发明还涉及具有调节的产率增加性多肽编码核酸序列表达的植物，所述产率增加性多肽选自：核定位AT-hook基序蛋白19/20(AHL19/20)、GRP(生长调节蛋白)(其中所述GRP多肽是金属硫蛋白2a(MT2a)多肽)、丙氨酸氨基转移酶(AAT)样多肽、和丙氨酸氨基转移酶(AAT)多肽，该植物相对于对照植物具有增强的产率相关性状。本发明还提供了可以用于本发明方法的构建体。

Description

具有增强的产率相关性状的植物及其制备方法

发明领域

本发明一般涉及分子生物学领域，并且涉及通过增加植物中产率增加性多肽的编码核酸序列的表达来增强多种植物产率相关性状的方法，所述产率增加性多肽选自：

核定位AT-hook基序蛋白19/20(AHL19/20)、

GRP(生长调节蛋白，其中所述GRP多肽是金属硫蛋白2a(MT2a)多肽)、丙氨酸氨基转移酶(AAT)样多肽，和

丙氨酸氨基转移酶(AAT)多肽。本发明还涉及具有增加的编码所述产率增加性多肽的核酸序列的表达的植物，该植物相对于对照植物具有增强的产率相关性状。本发明还提供了用于本发明方法的构建体。

背景技术

不断增长的世界人口和逐渐减少的农业可用耕地助长了提高农业效率研究之势。传统的作物和园艺学改良方法利用选育技术来鉴定具有期望特性的植物。然而，此类选育技术有若干缺陷，即这些技术一般为劳动密集型的，而且产生的植物通常含有异质的遗传组分，这些异质的遗传组分不一定总是导致期望性状自亲本植物的传递。分子生物学的进展已经使人类能够修饰动物和植物的种质。植物遗传工程需要分离和操作遗传物质(一般为DNA或RNA的形式)以及随后将遗传物质引入植物。这类技术能够产生具多种改良的经济、农艺或园艺性状的作物或植物。

具有特别经济意义的一种性状是增加的产率。产率通常定义为作物可测量经济价值的产出。这可以以数量和/或质量的方式进行定义。产率直接取决于若干因素，例如器官的数量和大小、植物构造(例如，分枝的数量)、种子产量、叶子衰老等等。根的发育、营养吸收、胁迫耐受性和早期活力也是决定产率的重要因素。因此优化一个或多个上述因素也可以促进作物产率的增加。

种子产率是特别重要的性状，这是因为许多植物的种子对于人类和动物营养而言至关重要。通过对种子本身的直接消耗，或是通过消耗由加工的种子所饲养的肉类产品，作物诸如玉米、稻、小麦、芸苔(canola)和大豆等占人类总卡路里摄取量的一半以上。它们也是工业加工所用的糖类、油类和多类代谢物的来源。种子含有胚(新的枝条和根的来源)和胚乳(萌发过程和幼苗早期生长过程中胚生长的营养源)。种子的发育涉及许多基因，并且需要代谢物自根、叶和茎转移至正在生长的种子。特别是胚乳，同化糖类、油类和蛋白质的代谢前体，将其合成为贮存性高分子，以充盈籽粒。

收获指数为种子产率与地上干重之间的比值，其在许多环境条件下相对稳定，因此在植物大小和粮谷(grain)产率之间通常能够获得比较稳靠的相关性(如Rebetzke等人(2002)Crop Science 42：739)。这些方法存在固有的联系，原因是大多数粮谷生物量取决于植物叶和茎的当前的或贮存的光合产率(Gardener等人(1985)Physiology of Crop Plants.Iowa StateUniversity Press，68-73页)。因此，对植物大小的选择，甚至是在发育早期阶段的选择，已经用作为未来潜在产率的指标(如Tittonell等人(2005)Agric Ecosys&Environ 105：213)。当检查遗传差异对胁迫耐受性的影响时，温室或植物生长室环境与田间相比具有固有的优势，即，能够使土壤性能、温度、水和养分可利用度以及光强度标准化。不过，由于因缺乏风力或昆虫导致的不良授粉，或由于空间不足以让成熟根或冠层生长等等，而对产率造成的人为局限性，会限制这些受控环境在测试产率差异中的应用。因此，在生长室或温室中在标准化条件下测量早期发育阶段的植物大小，是提供潜在遗传产率优势指标的标准作法。

另一重要的性状为增加的非生物胁迫耐受性。非生物胁迫是导致全世界作物损失的首要原因，使大多数主要作物植物的平均产率下降超过50％(Wang等人，Planta(2003)218：1-14)。非生物胁迫可以因干旱、盐度、极端温度、化学毒性、养分(大量元素和/或微量元素)过量或不足、辐射和氧化胁迫而引起。提高植物非生物胁迫耐受性的能力将对全世界的农场主带来重大的经济利益，并将使得能够在不利条件下以及在原本不可能栽培作物的地域中栽培作物。

对于许多作物而言，另一重要的性状是早期活力(early vigour)。改良早期活力是温带和热带稻类栽培种的现代稻类育种项目的重要目标。长根对于水栽稻的恰当土壤锚固至关重要。在直接向涝地里播种稻米的情况下，以及在植物必须迅速穿过水出苗的情况下，较长的枝条与活力有关。在进行条播的情况下，较长的中胚轴和胚芽鞘对于优良的出苗至关重要。改造植物早期活力的能力在农业上将具有极其重要的意义。例如，一直以来早期活力弱限制了在欧洲大西洋地区引入基于玉米带种质的玉米(玉蜀黍，Zea mays L.)杂交种。

另一重要的性状是在非生物胁迫条件下生长的植物的增强的产率相关性状。非生物胁迫是导致全世界作物损失的首要原因，使大多数主要作物植物的平均产率下降超过50％(Wang等人，Planta(2003)218：1-14)。非生物胁迫可以因干旱、盐度、极端温度、化学毒性、养分(大量元素和/或微量元素)过量或不足、辐射和氧化胁迫而引起。增强在非生物胁迫条件下生长的植物的产率相关性状的能力将对全世界的农场主带来重大的经济利益，并将使得能够在不利条件下以及在原本不可能栽培作物的地域中栽培作物。

因此通过优化上述因素之一可以增加作物产率。

视最终用途而定，可能更优选修饰某些产率性状。例如，对于诸如饲料或木材生产或者生物燃料资源等应用，可能期望植物营养部分的增长，而对于诸如面粉、淀粉或油料生产等应用，可能特别期望种子参数的增长。即便是在种子参数之中，视用途而定，一些参数也可能比另一些更优。多种机制可促成增加的种子产率，无论形式是增加的种子大小、还是增加的种子数量。

增加植物产率相关性状(种子产率和/或生物量)的一种方法可以是修饰植物的内在生长机制，如细胞周期或者参与植物生长或防御机制的各种信号传递路径。

发明内容

现已发现，通过在植物中增加编码核定位AT-hook基序蛋白19/20(AHL19/20)多肽的核酸序列的表达，可以相对于对照植物增强植物的多种种子产率相关性状，而无延迟的开花。增强的种子产率性状相关性状包括一个或多个下列性状：增加的每圆锥花序的花数、增加的每株植物的种子总产率、增加的饱满种子数和增加的收获指数。

此外，现已发现，增加编码GRP多肽(其中所述GRP多肽是金属硫蛋白2a(MT2a)多肽)的核酸序列的表达，可以产生在非生物胁迫条件下生长时相对于在相当条件下生长的对照植物具有增强的产率相关性状的植物。

此外，现还发现，调节ATT样多肽编码核酸在地上植物部分中的表达，可以产生相对于对照植物具有增强的产率相关性状，特别是增加的产率，的植物。

此外，现已发现，在非限氮条件下生长的植物的产率相关性状可通过调节ATT多肽编码核酸在这样的植物中的表达来增强。

发明背景

DNA结合蛋白是包含任何DNA结合结构域并因此对DNA具有特定的或一般的亲和力的蛋白质。DNA结合蛋白包括例如调节转录过程的转录因子、切割DNA分子的核酸酶以及参与细胞核中DNA包装的组蛋白。

AT-hook基序是首先在高迁移率组非组蛋白染色体蛋白质HMG-I/Y中描述的短DNA结合蛋白基序(Reeves和Nissen(1990)J Biol Chem 265：8573-8582)。已知AT-hook与富含AT的核酸序列的小沟相互作用(Huth等(1997)Nat Struc Biol 4：657-665)。已在广泛的来自动物、植物和微生物的DNA结合蛋白中鉴定到AT-hook基序。与几种已良好表征的DNA结合基序不同，AT-hook基序短，不超过13个氨基酸残基，并且在其中心具有典型的三肽序列甘氨酸-精氨酸-脯氨酸(Gly-Arg-Pro或GRP)。

在拟南芥(Arabidopsis thaliana)中，大约30种包含至少一个AT-hook基序的多肽还包含植物及原核生物保守(plant and prokaryotes conserved，PPC)结构域，该结构域在欧洲生物信息学研究所(EuropeanBioinformatics Institute)(EBI)的InterPro结构域数据库中被描述为DUF296(未知功能结构域296)(Fujimoto等(2004)Plant Molec Biol 56：225-239)。这些蛋白质之一被发现定位于核质中，从而被称为核定位AT-hook基序蛋白1(AHL1；Fujimoto等，同上)。类似地命名了旁系同源多肽，即AHL，并顺序编号。

在美国专利7,193,129和美国专利申请2005/0097638中，将拟南芥AHL多肽AHL19(根据Fujimoto等，同上)(标识为G2153)转化入拟南芥，并且使用35S CaMV启动子进行表达。转基因植物显示出改良的性状，例如增加的盐胁迫耐受性、增加的渗透胁迫耐受性、增加的干旱耐受性、增加的对冷冻的耐受性和增加的对糖的植物应答。在美国专利申请2005/0097638中，与对照植物相比较，AHL19多肽以及几种旁系同源AHL多肽的过量表达(在35S CaMV启动子的控制下)显著延迟了转基因植物的开花，从而增加产率。

发明概述

根据一个实施方案，提供了相对于对照植物增强植物的种子产率相关性状的方法，该方法包括增加编码AHL19/20多肽的核酸序列在植物中的表达。增强的种子产率相关性状包括一个或多个下列性状：增加的每圆锥花序的花数、增加的每株植物的种子总产率、增加的饱满种子数和增加的收获指数。

根据一个实施方案，提供了相对于对照植物增强在非生物胁迫条件下生长的植物的产率相关性状的方法，该方法包括增加GRP多肽编码核酸序列在植物中的表达，其中所述GRP多肽是金属硫蛋白2a(MT2a)多肽，增强的产率相关性状是一个或多个下列性状：增加的地上生物量、增加的每株植物的种子总产率、增加的饱满种子数、增加的种子总数、增加的一级圆锥花序(primary panicles)数、和增加的种子饱满率。

根据本发明的一个实施方案，提供了相对于对照植物增强植物的产率相关性状的方法，该方法包括调节编码AAT-样多肽的核酸在地上植物部分中的表达。在优选实施方案中，编码AAT-样多肽的核酸的表达通过将所述核酸有效连接至在地上植物部分中具有活性的启动子来进行调节(优选增加)。

根据一个实施方案，提供了增强在非限氮条件下生长的植物的产率相关性状的方法，该方法包括调节ATT多肽编码核酸在植物中的表达。

定义

多肽/蛋白质

术语“多肽”和“蛋白质”在文中互换使用，是指通过肽键连接起来的、任意长度的氨基酸多聚体。

多核苷酸/核酸/核酸序列/核苷酸序列

术语“多核苷酸”、“核酸序列”、“核苷酸序列”、“核酸”在文中互换使用，是指任何长度的无支链形式的多聚核苷酸，所述核苷酸或者为核糖核苷酸或者为脱氧核糖核苷酸或者为两者的组合。

对照植物

选择合适的对照植物是实验设置的常规部分，并且可以包括相应的野生型植物或不含目的基因的相应植物。对照植物通常与待评估植物为相同的植物物种，或者甚至为同一品种。对照植物还可以是待评估植物的无效合子(nullizygote)。如本文所用的“对照植物”不仅指完整植物，而且指植物部分，包括种子和种子部分。

同源物

蛋白质的“同源物”包括肽、寡肽、多肽、蛋白质和酶，其相对于所讨论的未修饰蛋白质具有氨基酸取代、缺失和/或插入，并且具有与其源自的未修饰蛋白质相似的生物活性和功能活性。

缺失是指从蛋白质中除去一个或多个氨基酸。

插入是指在蛋白质的预定位置引入一个或多个氨基酸残基。插入可以包括单个或多个氨基酸的N-末端和/或C-末端融合以及序列内插入。一般氨基酸序列内部的插入将小于N-或C-末端的融合，数量级约1到10个残基。N-或C-末端融合蛋白质或肽的实例包括如在酵母双杂交系统中应用的转录激活因子的结合结构域或激活结构域、噬菌体外壳蛋白、(组氨酸)-6-标签、谷胱甘肽S-转移酶标签、蛋白质A、麦芽糖结合蛋白、二氢叶酸还原酶、Tag·100表位、c-myc表位、

表位、lacz、CMP(钙调蛋白结合肽)、HA表位、蛋白质C表位和VSV表位。

取代是指蛋白质中的氨基酸用具有相似性质(如相似的疏水性、亲水性、抗原性、形成或打破α螺旋结构或β片层结构的倾向性)的其他氨基酸替换。氨基酸取代通常是单个残基的取代，但是视施加于多肽上的功能性限制而定也可以发生成簇取代；取代通常在大约1到10个氨基酸残基数量级。氨基酸取代优选为保守氨基酸取代。保守取代表在本领域众所周知(参见例如Creighton(1984)Proteins．W.H.Freeman and Company(编辑)和下表1)。

表1：保守氨基酸取代的实例

残基	保守取代	残基	保守取代
残基	保守取代	残基	保守取代	Ala	Ser	Leu	Ile；Val
Arg	Lys	Lys	Arg；Gln	Ala	Ser	Leu	Ile；Val
Arg	Lys	Lys	Arg；Gln	Asn	Gln；His	Met	Leu；Ile
Asp	Glu	Phe	Met；Leu；Tyr	Asn	Gln；His	Met	Leu；Ile
Asp	Glu	Phe	Met；Leu；Tyr	Gln	Asn	Ser	Thr；Gly
Cys	Ser	Thr	Ser；Val	Gln	Asn	Ser	Thr；Gly
Cys	Ser	Thr	Ser；Val	Glu	Asp	Trp	Tyr
Gly	Pro	Tyr	Trp；Phe	Glu	Asp	Trp	Tyr
Gly	Pro	Tyr	Trp；Phe	His	Asn；Gln	Val	Ile；Leu
Ile	Leu；Val			His	Asn；Gln	Val	Ile；Leu

可通过本领域众所周知的肽合成技术，如固相肽合成法等，或通过重组DNA操作，容易地进行氨基酸取代、缺失和/或插入。用于产生蛋白质的取代、插入或缺失变体的DNA序列操作方法是本领域众所周知的。例如，本领域的技术人员熟知在DNA预定位置进行取代突变的技术，包括M13诱变、T7-Gen体外诱变(USB，Cleveland，OH)、QuickChange定点诱变(Stratagene，San Diego，CA)、PCR介导的定点诱变或其他定点诱变方案。

衍生物

“衍生物”包括肽、寡肽、多肽，与蛋白质如目的蛋白质的天然形式的氨基酸序列相比，其可以包括用非天然氨基酸残基进行的氨基酸取代、或者添加非天然氨基酸残基。蛋白质的“衍生物”还包括肽、寡肽、多肽，与多肽天然形式的氨基酸序列相比，其可以包括天然改变的(糖基化、酰基化、异戊二烯化、磷酸化、豆蔻酰化、硫酸化等)或非天然改变的氨基酸残基。衍生物与其源自的氨基酸序列相比，还可以包括一个或多个非氨基酸替代或添加，例如共价或非共价地结合于氨基酸序列的报告分子或其他配体，如与之结合有利于衍生物检测的报告分子，以及相对于天然蛋白质的氨基酸序列而言的非天然氨基酸残基。

此外，“衍生物”还包括天然形式的蛋白质与标签肽如FLAG、HIS6或硫氧还蛋白的融合物(关于标签肽的综述请参见Terpe，Appl.Microbiol.Biotechnol.60，523-533，2003)。

直系同源物/旁系同源物

直系同源物和旁系同源物涵盖用于描述基因祖先关系的进化概念。旁系同源物为相同物种内的基因，其源自于祖先基因的复制；而直系同源物为来自不同生物体的基因，其起源于物种形成，并且也源自于共同的祖先基因。

结构域

术语“结构域”是指在进化相关蛋白质序列的比对中，在特定位置上保守的一组氨基酸。尽管其他位置上的氨基酸可能因同源物不同而改变，但是在特定位置上高度保守的氨基酸则意味着对于蛋白质结构、稳定性或功能而言很可能是必不可少的氨基酸。“结构域”因其在所比对的家族蛋白质同源物序列中高度保守而得以鉴定，故能够用作为标识符以确定任何所讨论的多肽是否属于先前鉴定到的多肽家族。

基序/共有序列/标签序列

术语“基序”或“共有序列”或“标签序列”(signature)是指进化相关蛋白质序列中短的保守区域。基序常常是高度保守的结构域部分，但也可能仅仅包括部分结构域，或者位于保守结构域之外(若基序的所有氨基酸都落在所定义的结构域之外的话)。

杂交

本文定义的术语“杂交”指其中基本同源互补的核苷酸序列彼此退火的过程。杂交过程能够完全在溶液中发生，即互补的两核酸分子都处在溶液中。杂交过程也能够这样进行，即互补核酸分子之一固定于基质上，如磁珠、琼脂糖珠或任何其它树脂上。此外，杂交过程也能够这样进行，即其中互补核酸分子之一固定在固相支持物如硝酸纤维素或尼龙膜上，或者通过例如照相平板印刷术固定在例如硅质玻璃支持物上(后者称为核酸序列阵列或微阵列，或称为核酸序列芯片)。为了使杂交发生，通常使核酸分子热变性或化学变性，以使双链解链成两条单链，和/或除去单链核酸分子中的发夹结构或其它二级结构。

术语“严格性”是指发生杂交的条件。杂交的严格性受诸如温度、盐浓度、离子强度和杂交缓冲液组成等条件的影响。通常，对于特定序列而言，在确定的离子强度和pH值下，低严格条件选择为比热解链温度(T_m)低大约30℃。中等严格条件为温度比T_m低20℃，而高严格条件为温度比T_m低10℃。高严格杂交条件通常用于分离与靶核酸序列具有高序列相似性的杂交序列。不过，由于遗传密码的简并性，核酸序列可以在序列上有偏差而依然编码基本上相同的多肽。因此有时可能需要中等严格杂交条件来鉴定这样的核酸序列分子。

T_m是在确定的离子强度和pH值下，50％的靶序列与完全匹配的探针杂交的温度。T_m取决于溶液条件和探针的碱基组成及长度。例如，较长的序列在较高温度下特异性杂交。在低于T_m值大约16℃到32℃获得最大杂交速率。在杂交溶液中存在一价阳离子会减少两核酸序列链之间的静电排斥作用，从而促进杂交体形成；当钠浓度高达0.4M时，这一作用可见(对于更高的浓度，此效应可以忽略不计)。每个百分点的甲酰胺可使DNA-DNA和DNA-RNA双链体的解链温度降低0.6到0.7℃，加入50％甲酰胺能够使杂交在30到45℃完成，尽管这将降低杂交速率。碱基对错配降低杂交速率和双链体的热稳定性。平均而言，对于大的探针，每个百分点碱基错配使T_m值下降约1℃。依赖于杂交体类型，T_m值可以利用下列公式计算：

1)DNA-DNA杂交体(Meinkoth和Wahl，Anal.Biochem.，138：267-284，1984)：

Tm＝81.5℃+16.6×log₁₀[Na⁺]^a+0.41×％[G/C^b]-500×[L^c]^-1-0.61×％甲酰胺

2)DNA-RNA或RNA-RNA杂交体：

Tm＝79.8+18.5(log₁₀[Na⁺]^a)+0.58(％G/C^b)+11.8(％G/C^b)²-820/L^c

3)寡DNA或寡RNA^d杂交体：

＜20个核苷酸：Tm＝2(l_n)

20-35个核苷酸：Tm＝22+1.46(l_n)

^a或对于其它一价阳离子，但是仅在0.01-0.4M范围内精确。

^b仅对于在30％到75％范围内的％GC精确。

^cL＝双链体的碱基对长度。

^d寡，寡核苷酸；l_n，＝引物的有效长度＝2×(G/C数)+(A/T数)。

非特异性结合可以通过许多已知技术中的任一来控制，例如用含蛋白质的溶液封闭膜，在杂交缓冲液中添加异源RNA、DNA和SDS，以及用RNA酶处理。对于非同源探针，可以通过改变如下条件之一来进行系列杂交：(i)逐渐降低退火温度(例如从68℃降至42℃)，或(ii)逐渐降低甲酰胺浓度(例如从50％降至0％)。熟练技术人员知晓可以在杂交过程中改变的多种参数，从而保持或者改变严格条件。

除杂交条件外，杂交特异性通常还是杂交后洗涤的函数。为了除去非特异杂交产生的背景，用稀释的盐溶液洗涤样品。这类洗涤的关键因素包括最终洗涤溶液的离子强度和温度：盐浓度越低、洗涤温度越高，洗涤的严格性就越高。洗涤条件通常在等于或低于杂交严格性的条件下进行。阳性杂交给出至少为背景两倍的信号。一般按如上来设置适用于核酸序列杂交试验或基因扩增检测操作的适宜严格条件。也可以选择更高或更低的严格条件。熟练技术人员知晓可以在洗涤过程中改变的多种参数，从而保持或者改变严格条件。

例如，长于50个核苷酸的DNA杂交体的典型的高严格杂交条件包括在1×SSC中于65℃杂交或者在1×SSC和50％甲酰胺中于42℃杂交，接着在0.3×SSC中于65℃洗涤。长于50个核苷酸的DNA杂交体的中等严格杂交条件的实例包括在4×SSC中于50℃杂交或者在6×SSC和50％甲酰胺中于40℃杂交，接着在2×SSC中于50℃洗涤。杂交体的长度是针对杂交的核酸预期的长度。当已知序列的核酸分子进行杂交时，杂交体的长度可以通过比对序列并鉴定本文所述的保守区域进行确定。1×SSC是0.15M NaCl和15mM柠檬酸钠；杂交溶液和洗涤溶液可以另外地包括5×Denhardt’s试剂、0.5-1.0％SDS、100μg/ml片段化的变性鲑精DNA、0.5％焦磷酸钠。

为了定义严格性水平，可以参考Sambrook等(2001)的《分子克隆：实验室手册》，第三版，冷泉港实验室出版，冷泉港，纽约，或者CurrentProtocols in Molecular Biology，John Wiley&Sons，N.Y.(1989及年度更新资料)。

剪接变体

本文所用的术语“剪接变体”包括这样的核酸序列变体，其中选择的内含子和/或外显子已被切除、替换、置换或添加，或者其中内含子已被缩短或增长。这样的变体可以基本上保持蛋白质的生物活性；这可以通过选择性地保留蛋白质的功能性区段来实现。这样的剪接变体可以是天然的或人造的。预测和分离这类剪接变体的方法是本领域众所周知的(参见例如Foissac和Schiex(2005)BMC Bioinformatics 6：25)。

等位基因变体

等位基因或等位基因变体为处于相同的染色体位置上的给定基因的可选形式。等位基因变体包括单核苷酸多态性(SNP)，以及小的插入/缺失多态性(INDEL)。INDEL的大小通常小于100bp。SNP和INDEL在大多数生物体的天然存在的多态性品系中形成最大的一组序列变体。

基因改组/定向进化

基因改组或定向进化包括重复实施DNA改组，继之适当筛选和/或选择，以产生编码具有修饰生物活性的蛋白质的核酸序列变体或其部分(Castle等(2004)Science 304(5674)：1151-4；美国专利5,811,238和6,395,547)。

调控元件/控制序列/启动子

术语“调控元件”、“控制序列”和“启动子”在文中均可互换使用，按广义来理解，指能够实现与之相连的序列表达的调控核酸序列。术语“启动子”通常是指位于基因转录起始位点上游的核酸控制序列，其参与RNA聚合酶和其他蛋白质的识别和结合，由此指导有效连接的核酸进行转录。上述术语包括源自经典真核生物基因组基因的转录调控序列(包括精确转录起始所必需的TATA盒，以及具有或没有CCAAT盒序列)，以及另外的调控元件(即上游激活序列、增强子和沉默子)——它们通过应答发育刺激和/或外部刺激或以组织特异的方式改变基因表达。所述术语还包括经典原核生物基因的转录调控序列，在此情况下其可以包括-35盒序列和/或-10盒转录调控序列。术语“调控元件”也包括合成的融合分子或衍生物，其赋予、激活或增加细胞、组织或器官中核酸序列分子的表达。

“植物启动子”包含能够介导编码序列区段在植物细胞中表达的调控元件。“植物启动子”优选来源于植物细胞，例如，来源于待被欲在本发明方法中表达的以及本文所述的核酸序列转化的植物。这对于其他“植物”调控信号同样适用，例如“植物”终止子的情况。位于可用于本发明方法的核苷酸序列上游的启动子可以通过一个或多个核苷酸取代、插入和/或缺失进行修饰，而不会干扰启动子、开放读框(ORF)或者3’调控区如终止子或远离ORF的其他3’调控区的功能或活性。此外还有可能通过修饰启动子的序列而增强其活性，或者将其完全替换为活性更强的启动子、甚至是来自异源生物体的启动子。为在植物中表达，核酸序列分子必须如上文所述的那样，有效连接于或者包含适宜的启动子，其中所述启动子将在正确的时间点以所需的空间表达模式表达所述基因。

为鉴定功能上等同的启动子，可以例如通过将启动子与报告基因有效连接、测定所述报告基因在植物多种组织中的表达水平和模式，来分析候选启动子的启动子强度和/或表达模式。众所周知的适宜报告基因包括例如β-葡糖醛酸糖苷酶或β-半乳糖苷酶。通过测量β-葡糖醛酸糖苷酶或β-半乳糖苷酶的酶活性可以确定启动子活性。然后可以将该启动子强度和/或表达模式与参照启动子(如本发明方法中所用的启动子)相比较。可选地，可以利用本领域公知的方法，如Northern印迹(RNA分析)结合放射自显影图的光密度测量分析、定量实时PCR或RT-PCR(Heid等，1996 Genome Methods 6：986-994)，通过定量本发明方法所用核酸序列的mRNA水平或者将该mRNA水平与持家基因如18S rRNA的mRNA水平进行比较，来测定启动子强度。通常，“弱启动子”旨在表示驱动编码序列低水平表达的启动子。“低水平”旨在表示每个细胞大约1/10,000个转录物到大约1/100,000个转录物、到大约1/500,0000个转录物的水平。相反，“强启动子”驱动编码序列高水平表达，或者说以每个细胞大约1/10个转录物到大约1/100个转录物、到大约1/1000个转录物的水平表达。通常，“中等强度启动子”旨在表示以在所有情况下都低于在35S CaMV启动子控制下获得的水平的水平驱动编码序列表达的启动子。

有效连接

本文所用的术语“有效连接”是指启动子序列和目的基因之间的功能性连接，从而启动子序列能够起始目的基因的转录。

组成型启动子

“组成型启动子”是指在生长和发育的大多数但不必是所有阶段，并且在大多数环境条件下在至少一种细胞、组织或器官中转录激活的启动子。下表2a给出了组成型启动子的实例。

表2a：植物组成型启动子的实例

基因来源	参考文献
基因来源	参考文献	肌动蛋白	McElroy等，Plant Cell，2：163-171，1990
HMGB	WO 2004/070039	肌动蛋白	McElroy等，Plant Cell，2：163-171，1990
HMGB	WO 2004/070039	GOS2	de Pater等，Plant J Nov；2(6)：837-44，1992，WO2004/065596
泛素	Christensen等，Plant Mol.Biol.18：675-689，1992	GOS2	de Pater等，Plant J Nov；2(6)：837-44，1992，WO2004/065596
泛素	Christensen等，Plant Mol.Biol.18：675-689，1992	稻亲环蛋白	Buchholz等，Plant Mol Biol.25(5)：837-43，1994
玉米H3组蛋白	Lepetit等，Mol.Gen.Genet.231：276-285，1992	稻亲环蛋白	Buchholz等，Plant Mol Biol.25(5)：837-43，1994
玉米H3组蛋白	Lepetit等，Mol.Gen.Genet.231：276-285，1992	苜蓿H3组蛋白	Wu等，Plant Mol.Biol.11：641-649，1988
肌动蛋白2	An等，Plant J.10(1)；107-121，1996	苜蓿H3组蛋白	Wu等，Plant Mol.Biol.11：641-649，1988
肌动蛋白2	An等，Plant J.10(1)；107-121，1996	核酮糖二磷酸羧化/加氧酶小亚基	US 4,962,028
OCS	Leisner(1988)Proc Natl Acad Sci USA 85(5)：2553	核酮糖二磷酸羧化/加氧酶小亚基	US 4,962,028
OCS	Leisner(1988)Proc Natl Acad Sci USA 85(5)：2553	SAD1	Jain等，Crop Science，39(6)，1999：1696
SAD2	Jain等，Crop Science，39(6)，1999：1696	SAD1	Jain等，Crop Science，39(6)，1999：1696
SAD2	Jain等，Crop Science，39(6)，1999：1696	V-ATP酶	WO 01/14572
G-盒蛋白质	WO 94/12015	V-ATP酶	WO 01/14572

遍在启动子

遍在启动子在生物体的基本上所有组织或细胞中都有活性。

发育调控型启动子

发育调控型启动子在某些发育阶段或在经历发育改变的植物部分中有活性。

诱导型启动子

诱导型启动子响应于化学(有关综述请参见Gatz 1997，Annu.Rev.Plant Physiol.Plant Mol.Biol.，48：89-108)、环境或物理刺激而具有诱导的或增加的转录起始；或者可以是“胁迫诱导型”，即在植物接触各种胁迫条件时激活；或者是“病原体诱导型”，即在植物接触各种病原体时激活。

器官特异性/组织特异性启动子

器官特异性或组织特异性的启动子是能够在某些器官或组织，如在叶、根、种子等组织中优先起始转录的启动子。例如，“根特异性启动子”是主要在植物根中转录激活的启动子，基本上排除了在任何其他植物部分的激活，但仍允许在这些其他植物部分中的任何渗漏表达。能够仅在某些细胞中起始转录的启动子在文中称为“细胞特异性”启动子。

根特异性启动子的实例列于下面的表2b中。

表2b：根特异性启动子的实例

基因来源	参考文献
基因来源	参考文献	RCc3	Plant Mol Biol.1995 Jan；27(2)：237-48
拟南芥PHT1	Kovama等，2005；Mudge等(2002，Plant J.31：341)	RCc3	Plant Mol Biol.1995 Jan；27(2)：237-48
拟南芥PHT1	Kovama等，2005；Mudge等(2002，Plant J.31：341)	苜蓿(Medicago)磷酸转运蛋白	Xiao等，2006
拟南芥Pyk10	Nitz等(2001)Plant Sci 161(2)：337-346	苜蓿(Medicago)磷酸转运蛋白	Xiao等，2006
拟南芥Pyk10	Nitz等(2001)Plant Sci 161(2)：337-346	根可表达基因	Tingey等，EMBO J.6：1，1987.
烟草生长素可诱导基因	Van der Zaal等，Plant Mol.Biol.16，983，1991.	根可表达基因	Tingey等，EMBO J.6：1，1987.
烟草生长素可诱导基因	Van der Zaal等，Plant Mol.Biol.16，983，1991.	β-微管蛋白	Oppenheimer，等，Gene 63：87，1988.
烟草根特异性基因	Conkling，等，Plant Physiol.93：1203，1990.	β-微管蛋白	Oppenheimer，等，Gene 63：87，1988.
烟草根特异性基因	Conkling，等，Plant Physiol.93：1203，1990.	欧洲油菜(B.napus)G1-3b基因	美国专利No.5,401,836
SbPRP1	Suzuki等，Plant Mol.Biol.21：109-119，1993.	欧洲油菜(B.napus)G1-3b基因	美国专利No.5,401,836
SbPRP1	Suzuki等，Plant Mol.Biol.21：109-119，1993.	LRX1	Baumberger等2001，Genes&Dev.15：1128
BTG-26欧洲油菜	US 20050044585	LRX1	Baumberger等2001，Genes&Dev.15：1128

基因来源	参考文献
基因来源	参考文献	LeAMT1(番茄)	Lauter等(1996，PNAS 3：8139)
The LeNRT1-1(番茄)	Lauter等(1996，PNAS 3：8139)	LeAMT1(番茄)	Lauter等(1996，PNAS 3：8139)
The LeNRT1-1(番茄)	Lauter等(1996，PNAS 3：8139)	I型patatin基因(马铃薯)	Liu等，Plant Mol.Biol.153：386-395，1991.
KDC1(胡萝卜(Daucuscarota))	Downey等(2000，J.Biol.Chem.275：39420)	I型patatin基因(马铃薯)	Liu等，Plant Mol.Biol.153：386-395，1991.
KDC1(胡萝卜(Daucuscarota))	Downey等(2000，J.Biol.Chem.275：39420)	TobRB7基因	W Song(1997)PhD Thesis，North CarolinaState University，Raleigh，NC USA
OsRAB5a(稻)	Wang等2002，Plant Sci.163：273	TobRB7基因
OsRAB5a(稻)	Wang等2002，Plant Sci.163：273	ALF5(拟南芥)	Diener等(2001，Plant Cell 13：1625)
NRT2；1Np(白花丹叶烟草(N.plumbaginifolia))	Quesada等(1997，Plant Mol.Biol.34：265)	ALF5(拟南芥)	Diener等(2001，Plant Cell 13：1625)
NRT2；1Np(白花丹叶烟草(N.plumbaginifolia))	Quesada等(1997，Plant Mol.Biol.34：265)	大麦根特异性凝集素	Lerner&Raikhel(1989)Plant Phys 91：124-129
根特异性富羟脯氨酸蛋白质	Keller&Lamb(1989)Genes&Dev 3：1639-1646	大麦根特异性凝集素	Lerner&Raikhel(1989)Plant Phys 91：124-129
根特异性富羟脯氨酸蛋白质	Keller&Lamb(1989)Genes&Dev 3：1639-1646	拟南芥CDC27B/hobbit	Blilou等(2002)Genes&Dev 16：2566-2575

种子特异性启动子主要在种子组织中，但不必仅在种子组织中(渗漏表达的情况)转录激活。种子特异性启动可以在种子发育和/或萌发期间激活。种子特异性启动子的实例示于下面的表2c中。种子特异性启动子的其他实例可参见Qing Qu和Takaiwa(Plant Biotechnol.J.2，113-125，2004)，其中揭示的内容在此纳入本文作为参考就如同陈述了其全部内容那样。

表2c：种子特异性启动子的实例

基因来源	参考文献
基因来源	参考文献	种子特异性基因	Simon等，Plant Mol.Biol.5：191，1985；
	Scofield等，J.Biol.Chem.262：12202，1987.；	种子特异性基因	Simon等，Plant Mol.Biol.5：191，1985；

基因来源	参考文献
基因来源	参考文献		Baszczynski等，Plant Mol.Biol.14：633，1990.
巴西坚果白蛋白	Pearson等，Plant Mol.Biol.18：235-245，1992.		Baszczynski等，Plant Mol.Biol.14：633，1990.
巴西坚果白蛋白	Pearson等，Plant Mol.Biol.18：235-245，1992.	豆球蛋白	Ellis等，Plant Mol.Biol.10：203-214，1988.
谷蛋白(稻)	Takaiwa等，Mol.Gen.Genet.208：15-22，1986；	豆球蛋白	Ellis等，Plant Mol.Biol.10：203-214，1988.
谷蛋白(稻)	Takaiwa等，Mol.Gen.Genet.208：15-22，1986；		Takaiwa等，FEBS Letts.221：43-47，1987.
玉米醇溶蛋白	Matzke等Plant Mol Biol，14(3)：323-321990		Takaiwa等，FEBS Letts.221：43-47，1987.
玉米醇溶蛋白	Matzke等Plant Mol Biol，14(3)：323-321990	napA	Stalberg等，Planta 199：515-519，1996.
小麦LMW和HMW麦谷蛋白-1	Mol Gen Genet 216：81-90，1989；NAR 17：461-2，1989	napA	Stalberg等，Planta 199：515-519，1996.
小麦LMW和HMW麦谷蛋白-1	Mol Gen Genet 216：81-90，1989；NAR 17：461-2，1989	小麦SPA	Albani等，Plant Cell，9：171-184，1997
小麦α，β，γ-麦醇溶蛋白	EMBO J.3：1409-15，1984	小麦SPA	Albani等，Plant Cell，9：171-184，1997
小麦α，β，γ-麦醇溶蛋白	EMBO J.3：1409-15，1984	大麦Itr1启动子	Diaz等(1995)Mol Gen Genet 248(5)：592-8
大麦B1，C，D，大麦醇溶蛋白	Theor Appl Gen 98：1253-62，1999；Plant J 4：343-55，1993；Mol Gen Genet 250：750-60，1996	大麦Itr1启动子	Diaz等(1995)Mol Gen Genet 248(5)：592-8
大麦B1，C，D，大麦醇溶蛋白		大麦DOF	Mena等，The Plant Journal，116(1)：53-62，1998
blz2	EP99106056.7	大麦DOF	Mena等，The Plant Journal，116(1)：53-62，1998
blz2	EP99106056.7	合成启动子	Vicente-Carbajosa等，Plant J.13：629-640，1998.
稻的谷醇溶蛋白NRP33	Wu等，Plant Cell Physiology 39(8)885-889，1998	合成启动子	Vicente-Carbajosa等，Plant J.13：629-640，1998.
稻的谷醇溶蛋白NRP33	Wu等，Plant Cell Physiology 39(8)885-889，1998	稻a-球蛋白Glb-1	Wu等，Plant Cell Physiology 39(8)885-889，1998
稻OSH1	Sato等，Proc.Natl.Acad.Sci.USA，93：8117-8122，1996	稻a-球蛋白Glb-1	Wu等，Plant Cell Physiology 39(8)885-889，1998

基因来源	参考文献
基因来源	参考文献	稻α-球蛋白REB/OHP-1	Nakase等Plant Mol.Biol.33：513-522，1997
稻ADP-葡萄糖焦磷酸化酶	Trans Res 6：157-68，1997	稻α-球蛋白REB/OHP-1	Nakase等Plant Mol.Biol.33：513-522，1997
稻ADP-葡萄糖焦磷酸化酶	Trans Res 6：157-68，1997	玉米ESR基因家族	Plant J 12：235-46，1997
高粱α-高粱醇溶蛋白	DeRose等，Plant Mol.Biol 32：1029-35，1996	玉米ESR基因家族	Plant J 12：235-46，1997
高粱α-高粱醇溶蛋白	DeRose等，Plant Mol.Biol 32：1029-35，1996	KNOX	Postma-Haarsma等，Plant Mol.Biol.39：257-71，1999
稻油质蛋白	Wu et al，J.Biochem.123：386，1998	KNOX	Postma-Haarsma等，Plant Mol.Biol.39：257-71，1999
稻油质蛋白	Wu et al，J.Biochem.123：386，1998	向日葵油质蛋白	Cummins等，Plant Mol. Biol.19：873-876，1992
PRO0117，推定的稻40S核糖体蛋白质	WO 2004/070039	向日葵油质蛋白	Cummins等，Plant Mol. Biol.19：873-876，1992
PRO0117，推定的稻40S核糖体蛋白质	WO 2004/070039	PRO0136，稻丙氨酸氨基转移酶	未出版
PRO0147，胰蛋白酶抑制剂ITR1(大麦)	未出版	PRO0136，稻丙氨酸氨基转移酶	未出版
PRO0147，胰蛋白酶抑制剂ITR1(大麦)	未出版	PRO0151，稻WSI18	WO 2004/070039
PRO0175，稻RAB21	WO 2004/070039	PRO0151，稻WSI18	WO 2004/070039
PRO0175，稻RAB21	WO 2004/070039	PRO005	WO 2004/070039
PRO0095	WO 2004/070039	PRO005	WO 2004/070039
PRO0095	WO 2004/070039	α-淀粉酶(Amy32b)	Lanahan等，Plant Cell 4：203-211，1992；Skriver et al，Proc Natl Acad Sci USA 88：7266-7270，1991

基因来源	参考文献
基因来源	参考文献	组织蛋白酶β-样基因	Cejudo等，Plant Mol Biol 20：849-856，1992
大麦Ltp2	Kalla等，Plant J.6：849-60，1994	组织蛋白酶β-样基因	Cejudo等，Plant Mol Biol 20：849-856，1992
大麦Ltp2	Kalla等，Plant J.6：849-60，1994	Chi26	Leah等，Plant J.4：579-89，1994
玉米B-Peru	Selinger等，Genetics 149；1125-38，1998	Chi26	Leah等，Plant J.4：579-89，1994

“在地上部分中具有活性的启动子”是指能够优先地在植物的地上部分中起始转录的启动子，基本上排除了在任何其他植物部分(特别是地下部分)的激活，但仍允许在这些其他植物部分中的任何渗漏表达。下面的表2d显示主要在绿色组织中具有转录活性的此类启动子的实例。

如文中所定义的绿色组织特异性启动子是主要在绿色组织中转录激活的启动子，基本上排除了在任何其他植物部分的激活，但仍允许有在这些其他植物部分中的任何渗漏表达。

可用于本发明方法的绿色组织特异性启动子的实例示于下面的表2d中。

表2d：绿色组织特异性启动子的实例

基因	表达	参考文献
基因	表达	参考文献	玉米正磷酸二激酶	叶特异性	Fukavama等，2001
玉米磷酸烯醇丙酮酸羧化酶	叶特异性	Kausch等，2001	玉米正磷酸二激酶	叶特异性	Fukavama等，2001
玉米磷酸烯醇丙酮酸羧化酶	叶特异性	Kausch等，2001	稻磷酸烯醇丙酮酸羧化酶	叶特异性	Liu等，2003
稻Rubisco小亚基	叶特异性	Nomura等，2000	稻磷酸烯醇丙酮酸羧化酶	叶特异性	Liu等，2003
稻Rubisco小亚基	叶特异性	Nomura等，2000	稻β扩展蛋白EXBP9	枝条特异性	WO 2004/070039
木豆(Pigeonpea)Rubisco小亚基	叶特异性	Panguluri等，2005	稻β扩展蛋白EXBP9	枝条特异性	WO 2004/070039
木豆(Pigeonpea)Rubisco小亚基	叶特异性	Panguluri等，2005	豌豆(Pea)RBCS3A	叶特异性

组织特异性启动子的另一实例是分生组织特异性启动子，其主要在分生组织中转录激活，基本上排除了在任何其他植物部分的激活，但仍允许有在这些其他植物部分中的任何渗漏表达。可用于进行本发明方法的分生组织特异性启动子的实例示于下面的表2e中。

表2e：分生组织特异性启动子的实例

基因来源	表达模式	参考文献
基因来源	表达模式	参考文献	稻OSH1	枝条顶端分生组织，从胚球形期到幼苗期	Sato等(1996)Proc.Natl.Acad.Sci.USA，93：8117-8122
稻金属硫蛋白	分生组织特异性	BAD87835.1	稻OSH1	枝条顶端分生组织，从胚球形期到幼苗期	Sato等(1996)Proc.Natl.Acad.Sci.USA，93：8117-8122
稻金属硫蛋白	分生组织特异性	BAD87835.1	WAK1&WAK 2	枝条和根顶端分生组织，及在扩展的叶和萼片中	Wagner&Kohorn(2001)Plant Cell 13(2)：303-318

表2f：胚乳组织特异性启动子的实例

基因来源	参考文献
基因来源	参考文献	谷蛋白(稻)	Takaiwa等(1986)Mol Gen Genet 208：15-22；Takaiwa等(1987)FEBS Letts.221：43-47
玉米醇溶蛋白	Matzke等，(1990)Plant Mol Biol 14(3)：323-32	谷蛋白(稻)
玉米醇溶蛋白	Matzke等，(1990)Plant Mol Biol 14(3)：323-32	小麦LMW和HMW麦谷蛋白-1	Colot等(1989)Mol Gen Genet 216：81-90，Anderson等(1989)NAR 17：461-2
小麦SPA	Albani等(1997)Plant Cell 9：171-184	小麦LMW和HMW麦谷蛋白-1
小麦SPA	Albani等(1997)Plant Cell 9：171-184	小麦的麦醇溶蛋白	Rafalski等(1984)EMBO 3：1409-15
大麦Itr1启动子	Diaz等(1995)Mol Gen Genet 248(5)：592-8	小麦的麦醇溶蛋白	Rafalski等(1984)EMBO 3：1409-15
大麦Itr1启动子	Diaz等(1995)Mol Gen Genet 248(5)：592-8	大麦B1，C，D大麦醇溶蛋白	Cho等(1999)Theor Appl Genet 98：1253-62；Muller等(1993)Plant J 4：343-55；Sorenson等(1996)Mol Gen Genet 250：750-60
大麦DOF	Mena等，(1998)Plant J 116(1)：53-62	大麦B1，C，D大麦醇溶蛋白

基因来源	参考文献
基因来源	参考文献	blz2	Onate等(1999)J Biol Chem 274(14)：9175-82
合成启动子	Vicente-Carbajosa等(1998)Plant J 13：629-640	blz2	Onate等(1999)J Biol Chem 274(14)：9175-82
合成启动子	Vicente-Carbajosa等(1998)Plant J 13：629-640	稻的谷醇溶蛋白NRP33	Wu等，(1998)Plant Cell Physiol 39(8)885-889
稻球蛋白Glb-1	Wu等(1998)Plant Cell Physiol 39(8)885-889	稻的谷醇溶蛋白NRP33	Wu等，(1998)Plant Cell Physiol 39(8)885-889
稻球蛋白Glb-1	Wu等(1998)Plant Cell Physiol 39(8)885-889	稻球蛋白REB/OHP-1	Nakase等(1997)Plant Molec Biol 33：513-522
稻ADP-葡萄糖焦磷酸化酶	Russell等(1997)Trans Res 6：157-68	稻球蛋白REB/OHP-1	Nakase等(1997)Plant Molec Biol 33：513-522
稻ADP-葡萄糖焦磷酸化酶	Russell等(1997)Trans Res 6：157-68	玉米ESR基因家族	Opsahl-Ferstad等(1997)Plant J 12：235-46
高粱的高粱醇溶蛋白	DeRose等(1996)Plant Mol Biol 32：1029-35	玉米ESR基因家族	Opsahl-Ferstad等(1997)Plant J 12：235-46

表2g：胚特异性启动子的实例

基因来源	参考文献
基因来源	参考文献	稻OSH1	Sato等，Proc.Natl.Acad.Sci.USA，93：8117-8122，1996
KNOX	Postma-Haarsma等，Plant Mol.Biol.39：257-71，1999	稻OSH1	Sato等，Proc.Natl.Acad.Sci.USA，93：8117-8122，1996
KNOX	Postma-Haarsma等，Plant Mol.Biol.39：257-71，1999	PRO0151	WO 2004/070039
PRO0175	WO 2004/070039	PRO0151	WO 2004/070039
PRO0175	WO 2004/070039	PRO005	WO 2004/070039
PRO0095	WO 2004/070039	PRO005	WO 2004/070039

表2h：糊粉特异性启动子的实例

基因来源	参考文献
基因来源	参考文献	α-淀粉酶(Amy32b)	Lanahan等，Plant Cell 4：203-211，1992；Skriver等，Proc Natl Acad Sci USA 88：7266-7270，1991
组织蛋白酶β-样基因	Cejudo等，Plant Mol Biol 20：849-856，1992	α-淀粉酶(Amy32b)
组织蛋白酶β-样基因	Cejudo等，Plant Mol Biol 20：849-856，1992	大麦Ltp2	Kalla等，Plant J.6：849-60，1994
Chi26	Leah等，Plant J.4：579-89，1994	大麦Ltp2	Kalla等，Plant J.6：849-60，1994
Chi26	Leah等，Plant J.4：579-89，1994	玉米B-Peru	Selinger等，Genetics 149；1125-38，1998

终止子

术语“终止子”包括如下控制序列，其为位于转录单位末端的DNA序列，发送对初级转录物进行3’加工和多聚腺苷酸化以及终止转录的信号。终止子可以源自天然基因、多种其他植物基因、或T-DNA。例如，待加入的终止子可以源自例如胭脂碱合酶或章鱼碱合酶基因、或可选地源自其它植物基因、或次优选地源自任何其它真核基因。

调节

与表达或基因表达相关联时，术语“调节”是指与对照植物相比，所述基因表达的表达水平被改变的过程，优选使所述表达水平增加。原始未调节的表达可以是结构RNA(rRNA、tRNA)或随后进行翻译的mRNA的任何类型的表达。术语“调节活性”应理解为对本发明核酸序列或编码蛋白质的表达的如下任何改变，所述改变导致植物产率增加和/或生长增加。

表达

术语“表达”或“基因表达”是指一种或多种特定基因或特定遗传构建体的转录。术语“表达”或“基因表达”特别指一种或多种基因或遗传构建体转录为结构RNA(rRNA、tRNA)或mRNA，并随后翻译或不翻译为蛋白质。该过程包括DNA的转录、以及所产生mRNA产物的加工。

增加的表达/过表达

如本文所用的术语“增加的表达”或“过表达”表示超出原始野生型表达水平的任何形式的表达。

增加基因或基因产物表达的方法在本领域有充分的记载，这包括，例如通过适当的启动子驱动的过表达、转录增增强子或翻译增强子的使用。可以将用作启动子或增强子元件的分离的核酸序列引入非异源形式多核苷酸的适当位置(一般是上游)，从而上调目的多肽编码核酸序列的表达。例如，可以通过突变、缺失和/或取代，体内地改变内源启动子(见Kmiec，US5,565,350；Zarling等，WO9322443)，或者将分离的启动子引入植物细胞中使其相对于本发明基因具有恰当的方向和距离，从而控制基因的表达。

如果期望多肽表达，通常期望在多核苷酸编码区的3’末端纳入多聚腺苷酸化区域。多聚腺苷酸化区域可以源自天然基因、多种其它植物基因或T-DNA。例如，待加入的3’末端序列可以源自胭脂碱合酶或章鱼碱合酶基因、或可选地源自其他植物基因、或次优选地源自任何其它真核基因。

也可以在5’非翻译区(UTR)或部分编码区的编码序列中加入内含子序列，来增加在胞质中累积的成熟信使的量。已显示，在植物和动物表达构建体的转录单位中纳入可剪接内含子可以在mRNA和蛋白质水平使基因表达增加高达1000倍(Buchman和Berg(1988)Mol.Cell biol.8：4395-4405；Callis等(1987)Genes Dev.1：1183-1200)。通常这类内含子被放置在转录单位5’末端附近时，其增加基因表达的作用最大。玉米内含子Adh1-S内含子1、2和6以及Bronze-1内含子的使用是本领域公知的。一般信息请参见TheMaize Handbook，第116章，Freeling和Walbot编辑，Springer，N.Y.(1994)。

内源基因

本文述及的“内源”基因不仅指见于植物之中的天然形式的所讨论基因(即未经人为干预)，而且指随后(重新)引入到植物中的分离形式的相同基因(或基本上同源的核酸/基因)(转基因)。例如，含有这样的转基因的转基因植物可以发生转基因表达的实质性下降和/或内源基因表达的实质性下降。

分离的基因可以从生物体中分离，或者可以是人造例如通过化学合成制备的。

降低的表达

本文述及的“降低的表达”或者表达“下降或基本上消除”应理解为表示内源基因表达和/或多肽水平和/或多肽活性相对于对照植物降低。所述下降或基本上消除按照递增的优选顺序是与对照植物相比，下降至少10％、20％、30％、40％或50％、60％、70％、80％、85％、90％或95％、96％、97％、98％、99％或更多。

为了降低或者基本上消除植物中内源基因的表达，需要一段足够长度的基本上连续核苷酸的核酸序列。为了实施基因沉默，这可以少到20，19，18，17，16，15，14，13，12，11，10或更少个核苷酸，备选地可以多到整个基因(包括5’和/或3’UTR，部分地或全部地)。该基本上连续的核苷酸链可以来自编码目的蛋白质(靶基因)的核酸序列，或者来自任何能编码目的蛋白质的直系同源物、旁系同源物或同源物的核酸序列。优选地，该基本连续的核苷酸链能与靶基因(有义或反义链)形成氢键，更优选地，该基本连续的核苷酸链按递增的优选顺序与靶基因(有义或反义链)具有50％，60％，70％，80％，85％，90％，95％，96％，97％，98％，99％，100％序列同一性。编码(功能性)多肽的核酸序列对于本文所讨论的多种用于降低或基本上消除内源基因表达的方法不是必需的。

降低或基本上消除表达可利用常规工具和技术实现。降低或基本消除内源基因表达的一个方法是RNA-介导的沉默，其中使用核酸序列或其部分(在这种情况下，一段基本上连续的核苷酸链，其来自目的基因，或者来自任何能编码目的蛋白质的直系同源物、旁系同源物或同源物的核酸序列)的反向重复——优选能形成发夹结构。RNA沉默方法的另一个实例涉及向植物中以有义方向导入核酸序列或者其部分(在这种情况下，一段基本连续的核苷酸链，其来自目的基因，或者来自任何能编码目的蛋白质的直系同源物，旁系同源物或同源物的核酸序列)。RNA沉默方法的另一个实例涉及反义核酸序列的使用。基因沉默还可通过插入诱变(例如，T-DNA插入或转座子插入)或通过例如Angell和Baulcombe((1999)Plant J 20(3)：357-62)，(Amplicon VIGS WO 98/36083)或Baulcombe(WO 99/15682)描述的策略来实现。其他方法，例如使用抗内源多肽的抗体在植物中抑制其功能或干扰其中牵涉多肽的信号传递路径，对于本领域技术人员来说是熟知的。可使用人造和/或天然microRNA(miRNA)敲除基因表达和/或mRNA翻译。内源miRNA是长度通常为19至24个核苷酸的单链小RNA。可以特异地对长度通常为21个核苷酸的人造microRNA(amiRNA)进行遗传工程改造以使之负调节单个或多个目的基因的基因表达。植物microRNA靶的选择的决定因素是本领域众所周知的。用于靶识别的经验参数已经确定并且可以用来辅助设计特定的amiRNA(Schwab等，Dev.Cell 8(4)，517-527，2005)。用于设计并产生amiRNA及其前体的便利工具也是公众可获得的(Schwab等，Plant Cell，18，1121-1133，2006)。

更详细的：

降低或基本上消除表达可利用常规工具和技术实现。降低或基本消除内源基因表达的一个优选方法是在植物中引入和表达遗传构建体，在该遗传构建体中核酸(在这种情况下，一段基本连续的核苷酸链，其来自目的基因，或者来自任何能编码任何目的蛋白质的直系同源物、旁系同源物或同源物的核酸)被克隆为由间隔序列(非编码DNA)分隔开的反向重复序列(部分地或者全部地)。

在这种优选的方法中，内源基因的表达通过RNA-介导的沉默，被降低或基本消除，在该RNA-介导的沉默中使用核酸或其部分(在这种情况下，一段基本上连续的核苷酸链，其来自目的基因，或者来自任何能编码目的蛋白质的直系同源物、旁系同源物或同源物的核酸)的反向重复——优选能形成发夹结构——来实现。该反向重复被克隆在含有控制序列的表达载体上。非编码DNA核酸序列(间隔序列，例如基质附着区片段(MAR)，内含子，多接头等)被放置在形成该反向重复的两个反向核酸之间。该反向重复序列转录后，形成具有(部分或者全部)自互补结构的嵌合RNA。该双链RNA结构称为发夹RNA(hpRNA)。发夹RNA被植物加工为siRNAs，siRNAs整合进入RNA诱导的沉默复合物(RISC)中。RISC进一步断裂mRNA转录物，由此实质性地降低待翻译成多肽的mRNA转录物的数量。有关其它一般细节，敬请参见例如，Grierson等(1998)WO98/53083；Waterhouse等(1999)WO 99/53050)。

本发明方法的实施并不依赖于在植物中引入和表达其中以反向重复形式克隆核酸的遗传构建体；而是可以使用几种众所周知的“基因沉默”方法中的任何一种或多种来获得相同的效果。

用于降低内源基因表达的一种此类方法是RNA介导的基因表达沉默(下调)。这种情况下的沉默在植物中由与靶内源基因基本相似的双链RNA序列(dsRNA)触发。该dsRNA进一步被植物加工成大约20到大约26个核苷酸，称为小干扰RNA(siRNAs)。siRNAs整合进RNA诱导的沉默复合物(RISC)中，该沉默复合物断裂内源靶基因的mRNA转录物，由此实质性地降低待翻译成多肽的mRNA转录物的数量。优选地，该双链RNA序列对应于靶基因。

RNA沉默方法的另一个实例涉及向植物中以有义方向导入核酸序列或者其部分(在这种情况下，一段基本连续的核苷酸链，其来自目的基因，或者来自任何能编码目的蛋白质的直系同源物，旁系同源物或同源物的核酸)。“有义方向”指DNA序列与其mRNA转录物是同源的。因此导入植物中的将是核酸序列的至少一个拷贝。该额外的核酸序列将降低此内源基因的表达，造成被称为共抑制(co-suppression)的现象。如果在植物中导入核酸序列的几个额外拷贝，基因表达的降低将会更加明显，原因是高转录水平和共抑制的触发之间存在正相关。

RNA沉默方法的另一个实例涉及反义核酸序列的使用。反义核酸序列包括与编码蛋白质的“有义”核酸序列互补，即，与双链cDNA分子的编码链互补，或者与mRNA转录序列互补，的核苷酸序列。反义核酸序列优选与要沉默的内源基因互补。互补可位于基因的“编码区”和/或“非编码区”。术语“编码区”指包含可翻译成氨基酸残基的密码子的核苷酸序列区域。术语“非编码区”指位于编码区两侧的5′和3′序列，该区可转录但不翻译成氨基酸(也称为5′和3′非翻译区)。

反义核酸序列可以根据Watson和Crick碱基配对规则设计。反义核酸序列可以与整个核酸序列(在此情况下，一段基本上连续的核苷酸链，其来自目的基因、或来自任何能够编码目的蛋白的直向同源物、旁系同源物或同源物的核酸)互补，不过也可以是仅与核酸序列的一部分(包括mRNA 5’和3’UTR)反义的寡核苷酸。例如，反义寡核苷酸序列可以与围绕编码多肽的mRNA转录物的翻译起始位点的区域互补。合适的反义寡核苷酸序列的长度是本领域已知的并且可以从长度约50、45、40、35、30、25、20、15或10个核苷酸或更少的核苷酸开始。本发明的反义核酸序列可以利用本领域已知方法，使用化学合成和酶连接反应而构建。例如，反义核酸序列(例如反义寡核苷酸序列)可以使用天然存在的核苷酸或多种修饰的核苷酸化学地合成，其中所述修饰的核苷酸被设计旨在增加分子的生物学稳定性或增加反义核酸序列与有义核酸序列之间所形成双链体的物理稳定性，例如，可以使用硫代磷酸酯衍生物和吖啶取代的核苷酸。可以用来产生反义核酸序列的修饰核苷酸的实例是本领域众所周知的。已知的核苷酸修饰包括甲基化、环化和′加帽′及用类似物(如肌苷)取代一个或多个天然存在的核苷酸。其它的核苷酸修饰是本领域众所周知的。

这种反义核酸序列可以使用核酸序列已经以反义方向亚克隆入其中(即从插入的核酸转录的RNA将与目的靶核酸呈反义方向)的表达载体，以生物学方式产生。优选地，反义核酸序列在植物中的产生借助稳定整合的核酸构建体进行，其中所述的核酸构建体包含启动子、有效连接的反义寡核苷酸和终止子。

用于本发明方法中实现沉默的核酸分子(无论向植物中导入或在原位(in situ)产生)将与编码多肽的mRNA转录物和/或基因组DNA杂交或结合，由此通过例如抑制转录和/或翻译而抑制蛋白质表达。杂交可以是常规核苷酸互补以形成稳定双链体，或在结合DNA双链体的反义核酸序列的情况下，为在双螺旋大沟内的特异相互作用。反义核酸序列可以通过转化或在特定组织部位直接注射而导入植物。备选地，可以对反义核酸序列进行靶向选定细胞的修饰，并且随后系统性施用。例如，对于系统性施用，反义核酸序列可以被修饰以便它们能够特异结合表达在所选择的细胞表面上的受体或抗原，例如使反义核酸序列与可以和细胞表面受体或抗原结合的肽或抗体连接。反义核酸序列也可以使用本文中所述的载体送递至细胞内。

根据又一个方面，反义核酸序列是α-异头核酸序列。α异头核酸序列与互补性RNA形成特异的双链杂交分子，其中与惯常b-单元相反，所述链走向相互平行(Gaultier等(1987)Nucl Ac Res 15：6625-6641)。反义核酸序列也可以包含2′-o-甲基核糖核苷酸(Inoue等(1987)Nucl Ac Res 15，6131-6148)或嵌合RNA-DNA类似物(Inoue等(1987)FEBS Lett.215，327-330)。

内源基因表达的降低或基本消除也可以使用核酶而进行。核酶是具有核糖核酸酶活性的催化性RNA分子，能够切割与其具有互补区域的单链核酸序列，如mRNA。因此，核酶(例如锤头核酶(在Haselhoff和Gerlach(1988)Nature 334，585-591中描述)可以用来催化性地切割编码多肽的mRNA转录物，由此实质性地降低待翻译成多肽的mRNA转录物的数目。可以设计对核酸序列具特异性的核酶(见例如：Cech等美国专利号4,987,071；和Cech等美国专利号5,116,742)。备选地，可以使用对应于核酸序列的mRNA转录物，从RNA分子库中选出具有特异性核糖核酸酶活性的催化性RNA(Bartel和Szostak(1993)Science 261，1411-1418)。核酶用于植物中基因沉默的用途是本领域已知的(例如Atkins等(1994)WO94/00012；Lenne等(1995)WO 95/03404；Lutziger等(2000)WO 00/00619；Prinsen等(1997)WO 97/13865和Scott等(1997)WO 97/38116)。

基因沉默也可以通过插入诱变(例如T-DNA插入或转座子插入)或通过如Angell和Baulcombe((1999)Plant J.20(3)：357-62)、(Amplicon VIGSWO 98/36083)或Baulcombe(WO 99/15682)及其它人描述的策略而实现。

当在内源基因上存在突变和/或在随后导入植物的分离的基因/核酸上存在突变时，基因沉默也可发生。降低或基本消除可以由无功能的多肽引起。例如，多肽可以与多种相互作用性蛋白质结合；由此通过一个或多个突变和/或截短可以提供仍能够结合相互作用性蛋白质(如受体蛋白质)但不能表现其正常功能(如起信号作用的配体)的多肽。

另一种基因沉默的方法是靶定与基因调节区(例如启动子和/或增强子)互补的核酸序列以形成阻止基因在靶细胞中转录的三螺旋结构。见Helene，C.，Anticancer Drug Res.6，569-84，1991；Helene等，Ann.N.Y.Acad.Sci.660，27-361992和Maher，L.J.Bioassays 14，807-15，1992。

其它方法，如使用针对内源性多肽的抗体以抑制此多肽在植物中的功能，或干扰所述多肽参与的信号途径，对于技术人员将是众所周知的。尤其可以构思的是，人造分子可以用于抑制靶多肽的生物学功能，或用于干扰靶多肽参与的信号途径。

备选地，可以建立筛选程序以在植物群体中鉴定基因的天然变体，所述变体编码具有降低活性的多肽。此类天然变体也可以用于例如进行同源重组。

人工和/或天然的microRNA(miRNA)可以用来敲除基因表达和/或mRNA翻译。内源性miRNA是通常19-24个核苷酸长度的单链小RNA。它们的主要功能是调节基因表达和/或mRNA翻译。大多数的植物microRNA(miRNA)与其靶序列具有完全的或接近完全的互补性。然而，存在具有多达5个错配的天然靶标。它们由切酶家族的双链特异性RNA酶从具有特征性折回结构的较长非编码性RNA中加工而来。加工后，它们通过与RNA诱导的沉默复合物(RISC)的主要成分Argonaute蛋白质结合而掺入该复合体。MiRNA充当RISC的特异性成分，因为它们可以与细胞质中的靶核酸(大多是mRNA)碱基配对。后续的调节事件包括靶mRNA的切割和破坏和/或翻译抑制。因此，miRNA过表达的效应常常反映为靶基因降低的mRNA水平。

可以特异地遗传构建通常21个核苷酸长度的人工microRNA(amiRNAs)，以负调节单个或多个目的基因的基因表达。植物microRNA靶的选择的决定因素是本领域众所周知的。用于靶识别的经验参数已经确定并且可以用来辅助设计特定的amiRNA(Schwab等，Dev.Cell 8，517-527，2005)。用于设计并产生amiRNA及其前体的便利工具也是公众可获得的(Schwab等，Plant Cell，18，1121-1133，2006)。

为最佳性能，用于在植物中降低内源基因表达的基因沉默技术需要使用来自单子叶植物的核酸序列以转化单子叶植物，和使用来自双子叶植物的核酸序列以转化双子叶植物。优选地，将来自任何给定植物物种的核酸序列导入同一个物种内。例如，将来自稻的核酸序列转化至稻植物。然而，并非绝对要求待导入的核酸序列起源于与该核酸序列将要导入的植物相同的植物物种。只要内源性靶基因与待导入的核酸序列之间存在相当大的同源性就足够了。

上文描述了用于降低或基本消除内源基因在植物中表达的多种方法的实例。本领域技术人员能够容易地适应性调整前述用于沉默的方法，以例如通过利用合适启动子而降低内源基因在整株植物或在其部分中的表达。

选择标记(基因)/报告基因

“选择标记”、“可选择标记基因”或“报告基因”包括赋予细胞表型的任何基因，该基因在细胞中的表达有利于鉴定和/或选择被本发明的核酸序列构建体转染或转化了的细胞。这些标记基因通过各种不同的原理使得能够鉴定核酸序列分子的成功转移。适宜的标记可以选自赋予抗生素或除草剂抗性的标记，其引入新的代谢性状或允许可视选择。可选择标记基因的实例包括赋予抗生素抗性的基因(例如磷酸化新霉素和卡那霉素的nptII，或磷酸化潮霉素的hpt，或赋予例如对博来霉素、链霉素、四环素、氯霉素、氨苄青霉素、庆大霉素、遗传霉素(G418)、壮观霉素或杀稻瘟素抗性的基因)、赋予除草剂抗性的基因(例如提供抗抗性的bar；提供抗草甘膦抗性的aroA或gox，或赋予例如对咪唑啉酮、膦丝菌素或磺酰脲抗性的基因)、或者提供代谢性状的基因(如允许植物使用甘露糖作为唯一碳源的manA，或导致木糖利用的木糖异构酶，或抗营养标记如对2-脱氧葡萄糖的抗性)。可视标记基因的表达导致形成颜色(例如β-葡糖醛酸糖苷酶GUS，或β-半乳糖苷酶及其有色底物，例如X-Gal)、发光(如萤光素/萤光素酶系统)或荧光(绿色荧光蛋白GFP及其衍生物)。这里仅仅是列出了一小部分可用的标记。技术人员对这类标记极为熟悉。取决于生物体和选择方法，优选不同的标记。

已知，取决于所用的表达载体和所用的转染技术，当核酸序列向植物细胞进行稳定或瞬时整合时，仅少数细胞能摄入外来DNA，并将其整合入基因组(如果期望的话)。为鉴定并选择这些整合体，通常将编码选择标记(如上文所述的那些)的基因与目的基因一起引入宿主细胞中。这些标记能够例如在如下突变体中使用，在所述突变体中这些基因例如通过常规方法缺失而没有功能。此外，编码选择标记的核酸序列分子与编码本发明多肽或用于本发明方法的序列可以在同一个载体中引入宿主细胞，或者在分开的载体中引入。已由所引入的核酸序列稳定转染的细胞可以例如通过选择(例如，整合有选择标记的细胞存活而其他细胞死去)予以鉴定。

由于一旦成功引入核酸序列后，将不再需要或不期望转基因宿主细胞中存在标记基因，特别是抗生素和除草剂抗性基因，所以根据本发明引入核酸序列的方法有利地采用能够除去或切除这些标记基因的技术。一种这样的方法是称为共转化的方法。共转化法采用两个载体同时进行转化，一个载体携带根据本发明的核酸序列，而第二个携带标记基因。很大比例的转化体将接收或者对于植物而言(高达40％或以上的转化体)含有两个载体。对于农杆菌转化，转化体通常只接收载体的一部分，即被T-DNA侧翼包围的序列，其通常是表达盒。随后可通过杂交(cross)从转化植物中除去标记基因。在另一种方法中，利用整合进转座子的标记基因与期望的核酸序列一起进行转化(称为Ac/Ds技术)。转化体可与转座酶来源杂交，或者用赋予转座酶表达的核酸序列构建体瞬时或稳定转化转化体。一旦成功进行了转化，在有些情况下(约10％)，转座子将跳离宿主细胞基因组并丢失。在另一些情况下，转座子跳至不同的位置。在这些情况下，必须通过杂交消除标记基因。微生物学中，已经研发了可以或便于检测此类事件的技术。另一有利的方法有赖于称为重组系统的方法，其优势在于可以免除杂交消除步骤。最著名的这类系统称为Cre/lox系统。Cre1为重组酶，且切除位于loxP序列之间的序列。如果标记基因整合在loxP序列之间，一旦成功进行了转化，将因重组酶的表达而得以切除。其他重组系统有HIN/HIX、FLP/FRT及REP/STB系统(Tribble等，J.Biol.Chem.，275，2000：22255-22267；Velmurugan等，J.Cell Biol.，149，2000：553-566)。根据本发明的核酸序列可以位点特异性地整合进植物基因组。这些方法自然也可以应用于微生物如酵母、真菌或细菌。

转基因的/转基因/重组

出于本发明的目的，“转基因的”、“转基因”或“重组”当与例如，核酸序列，含有所述核酸序列的表达盒、基因构建体或载体，或用根据本发明的核酸序列、表达盒或载体转化的生物体相关时，是指所有这些构建体通过重组方法产生，其中：

(a)编码可用于本发明方法的蛋白质的核酸序列，或

(b)与本发明核酸序列有效连接的遗传控制序列，例如启动子，或

(c)(a)和(b)

不位于其天然遗传环境中，或者已通过重组方法修饰，该修饰可以为例如一个或多个核苷酸残基的取代、添加、缺失、倒位或插入。天然遗传环境应理解为指在起始植物中的天然基因组或染色体座位或存在于基因组文库之中。在基因组文库的情况下，优选至少部分地保持核酸序列的天然遗传环境。该环境至少位于核酸序列一侧，且具有至少为50bp、优选至少500bp、特别优选至少1000bp、最优选至少5000bp序列长度。当天然存在的表达盒——例如编码可用于本发明方法的多肽的相应核酸序列与该核酸序列的天然启动子之间天然存在着的组合——经非天然的合成(“人造”)方法如诱变处理而被修饰时，此表达盒成为转基因表达盒。例如，合适的方法描述在US 5,565,350或WO 00/15815中。

因此，如上文所述，为了本发明目的，转基因植物应理解为表示：在所述植物的基因组中，本发明方法中所用的核酸序列不在其天然基因座上，该核酸可以为同源或异源表达。不过，正如所提到的那样，转基因也表示：当在植物基因组中，根据本发明的核酸序列或本发明方法中所用的核酸序列位于其天然位置上时，所述序列已相对于天然序列被修饰，和/或该天然序列的调控序列已被修饰。转基因优选指：根据本发明的核酸序列在基因组中于非天然的座位上表达，即同源表达，或者优选发生核酸的异源表达。优选的转基因植物在文中述及。

转化

本文述及的术语“引入”或“转化”包括将外源多核苷酸转移进宿主细胞，不考虑转移所用的方法。可以使用本发明的遗传构建体转化能够通过器官发生或者胚胎发生随后进行克隆繁殖的植物组织，并从其再生整个植物。具体选择的组织将因可得的和最适于待转化的具体物种的克隆繁殖系统而变。示例性的组织靶标包括叶盘、花粉、胚、子叶、下胚轴、雌配子、愈伤组织、既有的分生组织(例如顶端分生组织、腋芽和根分生组织)，以及诱导的分生组织(例如子叶分生组织和下胚轴分生组织)。可将多核苷酸瞬时或稳定地导入宿主细胞，其可保持非整合状态例如作为质粒。可选择地，可将其整合入宿主基因组。然后以本领域技术人员已知的方法将所得的转化的植物细胞用于再生转化的植物。

外来基因转移进入植物基因组中称为转化。植物物种的转化现在是相当常规的技术。有利地，可使用几种转化方法中的任一方法将目的基因导入适宜的祖先细胞。可以利用转化方法以及由植物组织或植物细胞再生植物的方法来进行瞬时或稳定转化。转化方法包括脂质体的使用、电穿孔、增加游离DNA摄取的化学物质、DNA至植物的直接注射、基因枪轰击(particle gun bombardment)、使用病毒或花粉的转化以及显微注射。方法可选自用于原生质体的钙/聚乙二醇方法(Krens，F.A.等人，(1982)Nature296，72-74；Negrutiu I等人(1987)Plant Mol Biol 8：363-373)、原生质体的电穿孔(Shillito R.D.等人(1985)Bio/Technol 3，1099-1102)、至植物材料内的显微注射(Crossway A等人，(1986)Mol.Gen Genet 202：179-185)；DNA或RNA包被的微粒轰击(Klein TM等人，(1987)Nature 327：70)；使用(非整合型)病毒的感染等。优选通过农杆菌介导的转化产生转基因植物，包括转基因作物植物。一种有利的转化法是植物原位(in planta)转化。为此，可以例如使农杆菌作用于植物种子，或用农杆菌接种植物分生组织。已经证明，根据本发明尤为有利的是，使转化了的农杆菌悬液作用于完整植株或至少花原基。随后培养植物，直至获得所处理植物的种子(Clough和Bent，Plant J.(1998)16，735-743)。农杆菌介导的稻转化方法包括众所周知的稻转化方法，例如在任一如下文献中描述的方法：欧洲专利申请EP 1198985A1，Aldemita和Hodges(Planta，199：612-617，1996)；Chan等(Plant Mol.Biol.22(3)491-506，1993)，Hiei等(Plant J.6(2)：271-282，1994)，其公开的内容在此并入本文作为参考就如同陈述了其全部内容那样。至于玉米转化，优选的方法如Ishida等(Nat.Biotechnol.14(6)：745-50，1996)或Frame等(Plant Physiol.129(1)：13-22，2002)中所述，其公开的内容全部地并入本文作为参考。作为举例说明，所述方法还由B.Jenes等，Techniques for GeneTransfer，在Transgenic Plants，卷1，Engineering and Utilization，编辑S.D.Kung和R.Wu，Academic Press(1993)128-143以及Potrykus Annu.Rev.Plant Physiol.Plant Molec.Biol.42(1991)205-225)中进一步描述。优选将待表达的核酸或构建体克隆到载体中，所述载体适用于转化根癌农杆菌(Agrobacterium tumefaciens)，例如pBin19(Bevan等，Nucl.Acids Res.12(1984)8711)。然后以已知的方式利用由这样的载体转化的农杆菌来转化植物，例如用作模式植物的植物，像拟南芥(Arabidopsis thaliana，其在本发明范围内不视为作物植物)；或者作物植物，例如作为举例的烟草植物，例如通过在农杆菌溶液中浸没擦伤的叶子或切碎的叶子，然后在合适的培养基中培养之。通过根癌农杆菌的植物转化例如已由

和Willmitzer在Nucl.Acid Res.(1988)16，9877描述，或者尤其是可从F.F.White，Vectors for Gene Transfer in Higher Plants在Transgenic Plants，卷1，Engineering and Utilization，编辑S.D.Kung和R.Wu，Academic Press，1993，第15-38页获知。

除了体细胞(其随后必须再生为完整植株)转化以外，还可以转化植物分生组织的细胞，特别是可以发育成配子的那些细胞。在这种情况下，转化的配子循着天然植物的发育而产生转基因植物。因此，例如，可以用农杆菌处理拟南芥的种子，并从一定比例经转化因而是转基因的发育植物收获种子[Feldman，KA和Marks MD(1987).Mol Gen Genet 208：274-289；Feldmann K(1992).在C Koncz，N-H Chua和J Shell编辑Methods inArabidopsis Research.Word Scientific，Singapore，第274-289页]。可选的方法基于反复去除花序以及使莲座中心切割部位与转化的农杆菌一起孵育，由此在随后的时间点同样能够获得转化的种子(Chang(1994).Plant J.5：551-558；Katavic(1994).Mol Gen Genet，245：363-370)。然而，一种特别有效的方法是真空渗入法，及其改良方法如“花器浸蘸法”(floral dip)。对于拟南芥的真空渗入，用农杆菌悬液在减压下处理完整植株[Bechthold，N(1993).C R Acad Sci Paris Life Sci，316：1194-1199]，而对于“花器浸蘸法”，将发育中的花组织与表面活性剂处理的农杆菌悬液短暂孵育[Clough，SJ和Bent，AF(1998).The Plant J.16，735-743]。在两种情况下均收获一定比例的转基因种子，这些种子可通过在上述选择性条件下培养而与非转基因种子区分开来。另外，质体的稳定转化是有利的，因为质体在多数作物中为母系遗传，从而降低或消除了转基因通过花粉传播的风险。叶绿体基因组的转化通常通过Klaus等，2004[Nature Biotechnology 22(2)，225-229]中系统性展示的方法实现。简言之，将待转化的序列与可选择标记基因一起克隆到同源于叶绿体基因组的侧翼序列之间。这些同源侧翼序列指导转基因位点特异性整合到质体基因组中。质体转化已在许多不同的植物物种中描述，且综述由Bock(2001)Transgenic plastids in basic research and plantbiotechnology.J Mol Biol.2001年9月21日；312(3)：425-38或Maliga，P(2003)Progress towards commercialization of plastid transformationtechnology.Trends Biotechnol.21，20-28给出。最近报道了形式为无标记的质体转化体的其他生物技术方法，所述转化体可以利用瞬时共整合的标记基因产生(Klaus等，2004，Nature Biotechnology 22(2)，225-229)。

T-DNA激活标签

T-DNA激活标签(Hayashi等Science(1992)1350-1353)包括将通常含有启动子(也可以是翻译增强子或内含子)的T-DNA插入在目的基因的基因组区或基因编码区上游或下游10kb处，从而在构型上使启动子能够指导被靶向基因的表达。通常天然启动子对被靶向基因表达的调控被破坏，基因落入新引入的启动子控制。启动子一般包含于T-DNA中。可以例如，通过农杆菌感染将此T-DNA随机插入植物基因组中，并导致插入T-DNA附近的基因的表达被修饰。得到的转基因植物将由于紧靠引入的启动子的基因的表达改变而表现出显性表型。

TILLING

术语“TILLING”为“靶向诱导的基因组局部损伤”(Targeted InducedLocal Lesions In Genomes)的缩写，是一种用于产生和/或鉴定编码具有修饰的表达和/或活性的蛋白质的核酸序列的诱变技术。TILLING还允许选择携带此类突变变体的植物。这些突变变体可以在强度、位置或时间(例如，如果突变影响启动子的话)上呈现出修饰的表达。这些突变变体可以比其天然形式基因呈现更高的活性。TILLING将高密度诱变和高通量筛选方法结合在一起。TILLING一般遵循的步骤有：(a)EMS诱变(Redei GP和Koncz C，(1992)In Methods in Arabidopsis Research，Koncz C，Chua NH，Schell J编辑，新加坡，World Scientific Publishing Co，第16-82页；Feldmann等，(1994)In Meyerowitz EM，Somerville CR编辑，Arabidopsis.冷泉港实验室出版社，冷泉港，纽约，第137-172页；Lightner J和CasparT，(1998)In J Martinez-Zapater，J Salinas编辑，Methods on MolecularBiology，82卷Humana Press，Totowa，NJ，第91-104页)；(b)个体的DNA制备和合并(pooling)；(c)目的区域的PCR扩增；(d)变性和退火以使异源双链体能够形成；(e)DHPLC，其中合并物中异源双链体的存在在色谱图中检测为额外的峰；(f)突变个体的鉴定；和(g)突变PCR产物的测序。用于TILLING的方法在本领域内是众所周知的(McCallum等，(2000)NatBiotechnol 18：455-457；由Stemple(2004)Nat Rev Genet 5(2)：145-50进行综述)。

同源重组

同源重组允许向基因组中的指定选择位置引入所选的核酸序列。同源重组是生物科学中常规用于低等生物体如酵母或苔藓剑叶藓属(physcomitrella)的标准技术。在植物中进行同源重组的方法已经不仅在模式植物中描述(Offringa等(1990)EMBO J.9(10)：3077-84)，而且也在作物植物，如稻中描述(Terada等(2002)Nat Biotech 20(10)：1030-4；Iida和Terada(2004)Curr Opin Biotechnol 15(2)：132-8)。

产率

术语“产率”通常表示具有经济价值的可测量产出，其一般是与特定的作物、面积和时期相关的。各植物部分基于其数量、大小和/或重量对产率直接做出贡献，或者实际产率是每英亩作物的年产率，用总产量(包括收获的产量和估定的产量)除以种植的英亩数来确定。术语植物的“产率”可以与该植物的营养性生物量、繁殖器官、和/或繁殖体(如种子)相关。

术语植物的“产率”可以与该植物的营养性生物量(根和/或枝条生物量)、繁殖器官、和/或繁殖体(如种子)相关。

早期活力

“早期活力”是指活跃健康且很好均衡的生长，特别是在植物生长的早期阶段，其可以由增强的植物适度(fitness)引起，例如，由植物更好地适应其环境(即优化能源资源的利用以及在枝条和根之间的分配)引起。具有早期活力的植物也可以显示出增加的幼苗存活和更佳的作物齐苗(establisment)，这往往产生高度均一的田地(作物以齐整的方式生长，即大多数植物基本上同时达到发育的各阶段)，以及常常更优更高的产率。因此，早期活力可以通过测量多种因素来确定，如千粒重、萌发率、出苗率、幼苗生长、幼苗高度、根长度、根和枝条生物量，等等。

增加/提高/增强

术语“增加”、“提高”或“增强”可互换，且在本发明意义上表示与文中所定义的对照植物相比，产率和/或生长多出至少5％、6％、7％、8％、9％或10％，优选至少15％或20％，更优选25％、30％、35％或40％。

种子产率

增加的种子产率可表现为如下一个或多个方面：a)种子生物量(种子总重量)的增加，这可以是以单粒种子和/或每植株和/或每公顷或英亩为基础的增加；b)每圆锥花序和/或每植株的花数的增加；c)增加的(饱满)种子数；d)增加的种子饱满率(其表达为饱满种子数与种子总数的比率)；e)增加的收获指数，其表达为可收获部分如种子的产率除以总生物量的比率；f)增加的一级圆锥花序数；g)增加的千粒重(TKW)，这通过计数饱满种子数和它们的总重量外推得到。TKW增加可来自于种子大小和/或种子重量的增加，并且也可来自胚和/或胚乳大小的增加。

种子产率的增加也可表现为种子大小和/或种子体积的增加。此外，种子产率的增加也可表现为种子面积和/或种子长度和/或种子宽度和/或种子周长的增加。增加的产率也可以导致改变的构造，或可以因改变的构造而发生。

绿度指数(greenness index)

如本文所用的“绿度指数”根据植物的数字图像计算。对于图像中属于植物目标的每一个像素，计算绿色值相对于红色值(在用于编码颜色的RGB模型中)之比。绿度指数表达为绿红比超过给定阈值的像素百分比。在正常生长条件下、在盐胁迫生长条件下、在养分可利用度下降的生长条件下，在开花前末次成像中测量植物的绿度指数。相反，在干旱胁迫生长条件下，在干旱后的首次成像中测量植物的绿度指数。

植物

本文所用术语“植物”涵盖整株植物、植物的祖先和后代以及植物部分，包括种子、枝条、茎、叶、根(包括块茎)、花以及组织和器官，其中上述每一种都包含目的基因/核酸序列。术语“植物”也包括植物细胞、悬浮培养物、愈伤组织、胚、分生组织区、配子体、孢子体、花粉和小孢子，同样其中上述每一种都包含目的基因/核酸序列。

尤其可用于本发明方法的植物包括属于植物界(Viridiplantae)超家族的所有植物，尤其是单子叶植物和双子叶植物，包括饲料或豆科牧草、观赏植物、粮食作物、乔木或灌木，选自：槭树属物种(Acer spp.)、猕猴桃属物种(Actinidia spp.)、秋葵属物种(Abelmoschus spp.)、剑麻(Agavesisalana)、冰草属物种(Agropyron spp.)、匍茎剪股颖(Agrostis stolonifera)、葱属物种(Allium spp.)、苋属物种(Amaranthus spp.)、滨草(Ammophilaarenaria)、凤梨(Ananas comosus)、番荔枝属物种(Annona spp.)、芹菜(Apium graveolens)、落花生属物种(Arachis spp.)、木波罗属物种(Artocarpusspp.)、石刁柏(Asparagus officinalis)、燕麦属物种(Avena spp.)(如燕麦(Avena sativa)、野燕麦(Avena fatua)、比赞燕麦(Avena byzantina)、Avenafatua var.sativa、杂种燕麦(Avena hybrida))、阳桃(Averrhoa carambola)、簕竹属物种(Bambusa sp.)、冬瓜(Benincasa hispida)、巴西栗(Bertholletiaexcelsea)、甜菜(Beta vulgaris)、芸苔属物种(Brassica spp.)(如欧洲油菜(Brassica napus)、芜青(Brassica rapa ssp.)[芸苔、油菜籽油菜、芜菁])、Cadaba farinosa、大叶茶(Camellia sinensis)、美人蕉(Canna indica)、大麻(Cannabis sativa)、辣椒属物种(Capsicum spp.)、苔草(Carex elata)、番木瓜(Carica papaya)、大果假虎刺(Carissa macrocarpa)、山核桃属物种(Caryaspp.)、红花(Carthamus tinctorius)、栗属物种(Castanea spp.)、爪哇木棉(Ceiba pentandra)、苦苣(Cichorium endivia)、樟属物种(Cinnamomumspp.)、西瓜(Citrullus lanatus)、柑橘属物种(Citrus spp.)、椰子属物种(Cocosspp.)、咖啡属物种(Coffea spp.)、芋(Colocasia esculenta)、可拉属(Colaspp.)、黄麻属物种(Corchorus sp.)、芫荽(Coriandrum sativum)、榛属物种(Corylus spp.)、山楂属物种(Crataegus spp.)、番红花(Crocus sativus)、南瓜属物种(Cucurbita spp.)、香瓜属物种(Cucumis spp.)、菜蓟属物种(Cynaraspp.)、胡萝卜(Daucus carota)、山马蟥属物种(Desmodium spp.)、龙眼(Dimocarpus longan)、薯蓣属物种(Dioscorea spp.)、柿树属物种(Diospyrosspp.)、稗属物种(Echinochloa spp.)、油棕属(Elaeis)(如非洲油棕(Elaeisguineensis)、美洲油棕(Elaeis oleifera))、穇子(Eleusine coracana)、蔗茅属物种(Erianthus sp.)、枇杷(Eriobotrya japonica)、桉属物种(Eucalyptu sp)、红仔果(Eugenia uniflora)、荞麦属物种(Fagopyrum spp.)、山毛榉属物种(Fagus spp.)、苇状羊茅(Festuca arundinacea)、无花果(Ficus carica)、金桔属物种(Fortunella spp.)、草莓属物种(Fragaria spp.)、银杏(Ginkgo biloba)、大豆属物种(Glycine spp.)(如大豆(Glycine max)、黄豆(Soja hispida)或大豆(Soja max))、陆地棉(Gossypium hirsutum)、向日葵属物种(Helianthusspp.)(如向日葵(Helianthus annus))、萱草(Hemerocallis fulva)、木槿属物种(Hibiscus spp.)、大麦属物种(Hordeum spp.)(如大麦(Hordeum vulgare))、甘薯(Ipomoea batatas)、核桃属物种(Juglans spp.)、莴苣(Lactuca sativa)、山黧豆属物种(Lathyrus spp.)、兵豆(Lens culinaris)、亚麻(Linumusitatissimum)、荔枝(Litchi chinensis)、百脉根属物种(Lotus spp.)、棱角丝瓜(Luffa acutangula)、羽扇豆属物种(Lupinus spp.)、地杨梅(Luzulasylvatica)、番茄属物种(Lycopersicon spp.)(如番茄(Lycopersiconesculentum、Lycopersicon lycopersicum、Lycopersicon pyriforme)、硬皮豆属物种(Macrotyloma spp.)、苹果属物种(Malus spp.)、西印度樱桃(Malpighiaemarginata)、曼密苹果(Mammea americana)、芒果(Mangifera indica)、木薯属物种(Manihot spp.)、人心果(Manilkara zapota)、紫花苜蓿(Medicagosativa)、草木樨属物种(Melilotus spp.)、薄荷属物种(Mentha spp.)、芒(Miscanthus sinensis)、苦瓜属物种(Momordica spp.)、黑桑(Morus nigra)、芭蕉属物种(Musa spp.)、烟草属物种(Nicotiana spp.)、木犀榄属物种(Oleaspp.)、仙人掌属物种(Opuntia spp.)、Ornithopus spp.、稻属物种(Oryzaspp.)(如稻(Oryza sativa)，阔叶稻(Oryza latifolia))、黍糜(Panicummiliaceum)、柳枝稷(Panicum virgatum)、鸡蛋果(Passiflora edulis)、欧防风(Pastinaca sativa)、狼尾草属(Pennisetum sp.)、鳄梨属物种(Persea spp.)、香芹(Petroselinum crispum)、虉草(Phalaris arundinacea)、菜豆属物种(Phaseolus spp.)、梯牧草(Phleum pratense)、刺葵属物种(Phoenix spp.)、南方芦苇(Phragmites australis)、酸浆属物种(Physalis spp.)、松属物种(Pinusspp.)、阿月浑子(Pistacia vera)、豌豆属物种(Pisum spp.)、早熟禾属物种(Poaspp.)、杨属物种(Populus spp.)、牧豆树属物种(Prosopis spp.)、李属物种(Prunus spp.)、番石榴属物种(Psidium spp.)、石榴(Punica granatum)、西洋梨(Pyrus communis)、栎属物种(Quercus spp.)、萝卜(Raphanus sativus)、波叶大黄(Rheum rhabarbarum)、茶藨子属物种(Ribes spp.)、蓖麻(Ricinuscommunis)、悬钩子属物种(Rubus spp.)、甘蔗属物种(Saccharum spp.)、柳属物种(Salix sp.)、接骨木属物种(Sambucus spp.)、黑麦(Secale cereale)、胡麻属物种(Sesamum spp.)、白芥属物种(Sinapis sp.)、茄属物种(Solanumspp.)(如马铃薯(Solanum tuberosum)、红茄(Solanum integrifolium)或番柿(Solanum lycopersicum))、两色蜀黍(Sorghum bicolor)、菠菜属物种(Spinaciaspp.)、蒲桃属物种(Syzygium spp.)、万寿菊属物种(Tagetes spp.)、酸豆(Tamarindus indica)、可可树(Theobroma cacao)、车轴草属物种(Trifoliumspp.)、黑小麦属(Triticale sp.)、小黑麦(Triticosecale rimpaui)、小麦属物种(Triticum spp.)(如小麦(Triticum aestivum)、硬粒小麦(Triticum durum)、圆锥小麦(Triticum turgidum)、Triticum hybernum、马卡小麦(Triticummacha)、面包小麦(Triticum sativum)或普通小麦(Triticum vulgare))、小金莲花(Tropaeolum minus)、旱金莲(Tropaeolum majus)、越桔属物种(Vaccinium spp.)、野豌豆属物种(Vicia spp.)、豇豆属物种(Vigna spp.)、香堇菜(Viola odorata)、葡萄属物种(Vitis spp.)、玉蜀黍(Zea mays)、北美洲野生稻(Zizania palustris)、枣属物种(Ziziphus spp.)等等。

发明详述

现已令人惊讶地发现，增加植物中编码AHL19/20多肽的核酸序列的表达，可以产生相对于对照植物具有增强的种子产率相关性状、无延迟开花的植物。根据第一种实施方案，本发明提供了相对于对照植物增强植物的种子产率相关性状的方法，包括增加植物中编码AHL19/20多肽的核酸序列的表达。

增加编码AHL19/20多肽的核酸序列的表达的优选方法是在植物中引入和表达编码AHL19/20多肽的核酸序列。

在一个实施方案中，下文述及的任何“可用于本发明方法的蛋白质”应理解为表示如本文所定义的AHL19/20多肽。下文述及的任何“可用于本发明方法的核酸序列”应理解为表示能够编码这样的AHL19/20多肽的核酸序列。待引入植物(从而可用于实施本发明方法)的核酸序列是编码现在将要描述的此类多肽的任何核酸序列，下文也称为“AHL19/20核酸序列”或“AHL19/20基因”。

如本文定义的“AHL19/20多肽”指包含与SEQ ID NO：36所示的保守结构域(CD)(包括在SEQ ID NO：2中)具有至少70％、75％、80％、85％、90％、95％、98％、99％或更高氨基酸序列同一性的结构域的任何多肽。

备选地或另外地，如本文定义的“AHL19/20多肽”指如下任何多肽，所述多肽包含：(i)与SEQ ID NO：37所示的AT-hook基序具有至少75％、80％、85％、90％、95％、98％、99％或更高氨基酸序列同一性的基序；和(ii)与SEQ ID NO：38所示的植物及原核生物保守(PPC)结构域具有至少55％、60％、65％、70％、75％、80％、85％、90％、95％、98％、99％或更高氨基酸序列同一性的结构域。

备选地或另外地，如本文定义的“AHL19/20多肽”指如下任何多肽，所述多肽包含：(i)核定位信号；(ii)具有InterPro登录号IPR014476的AT-hook DNA结合基序；和(iii)具有InterPro登录号IPR005175的植物及原核生物保守(PPC)结构域。

备选地或另外地，如本文定义的“AHL19/20多肽”指如下任何多肽序列，所述多肽序列，当用于构建AHL系统发生树，例如图1或图2中描述的系统发生树时，与包含SEQ ID NO：2所示多肽序列的AHL19/20多肽群而非任何其他AHL群聚类。

备选地或另外地，如本文定义的“AHL19/20多肽”指如下任何多肽，所述多肽按照递增的优选顺序与SEQ ID NO：2所示的AHL19/20多肽或与本文表A中所示的任何全长多肽序列具有至少50％、55％、60％、65％、70％、75％、80％、85％、90％、95％、98％、99％或更高的氨基酸序列同一性。

现还发现，增加植物中编码GRP多肽(其中所述GRP多肽是金属硫蛋白2a(MT2a)多肽)的核酸序列的表达，产生在非生物胁迫条件下生长时相对于对照植物相具有增强的产率相关性状的植物。根据第一种实施方案，本发明提供了相对于对照植物增强在非生物胁迫条件下生长的植物的产率相关性状的方法，包括增加植物中GRP多肽编码核酸序列的表达，其中所述GRP多肽是金属硫蛋白2a(MT2a)多肽。

用于增加GRP多肽编码核酸序列的表达的优选方法是在植物中引入和表达GRP多肽编码核酸序列。

在一个实施方案中，下文述及的任何“可用于本发明方法的蛋白质”应理解为表示如本文所定义的GRP多肽。下文述及的任何“可用于本发明方法的核酸序列”应理解为表示能够编码这样的GRP多肽的核酸序列。待引入植物(从而可用于实施本发明金属硫蛋白2a(MT2a)多肽方法)的核酸序列是编码现在将要描述的此类蛋白质的任何核酸序列，下文也称为“GRP核酸序列”或“GRP基因”。

本文中定义的“GRP多肽”是指SEQ ID NO：46所示的蛋白质以及其直系同源物、旁系同源物和同源物。

优选，SEQ ID NO：46的直系同源物、旁系同源物和同源物具有InterPro登录号IPR000347，描述为植物金属硫蛋白，家族15。

备选地或另外地，本文中所定义的“GRP多肽”是指按照递增的优选顺序与SEQ ID NO：46所示的GRP多肽具有至少50％、55％、60％、65％、70％、75％、80％、85％、90％、95％、98％、99％或更高的氨基酸序列同一性的任何多肽。

金属硫蛋白在本领域内是熟知的，关于最近的综述和分类，参见Cobbett和Goldsbrough(2002)。金属硫蛋白是具有哑铃构型的小蛋白质，其源于彼此通过具有可变长度和氨基酸组成的区域分隔开的保守N末端和C末端富半胱氨酸结构域。基于一级结构，可区分4种类型的金属硫蛋白。SEQ ID NO：46的金属硫蛋白包含Cobbett和Goldsbrough(2002)所定义的2型金属硫蛋白典型的保守N末端结构域，该结构域包含共有序列“MSCCGG(N/S)CGCG(T/S/A)(G/A/S)C(K/Q/S)C”，因此，用于本发明方法的优选同源物是包含该保守结构域的金属硫蛋白。

此外，现已发现，优先调节ATT样多肽编码核酸在地上植物部分中的表达，可以产生相对于对照植物具有增强的产率相关性状的植物。根据优选实施方案，优先在地上植物部分中调节表达可以通过使用在地上植物部分中具有活性的启动子来进行。术语“在地上部分中具有活性的启动子”在本文“定义”部分进行了定义。

此外，现已发现，调节AAT多肽编码核酸的表达可以产生当在非限氮条件下生长时相对于对照植物具有增强的产率相关性状的植物。根据第一实施方案，本发明提供了相对于对照植物增强植物的产率相关性状的方法，包括调节AAT多肽编码核酸在非限氮条件下生长的植物中的表达。

在于地上植物部分中具有活性的启动子控制下调节(优选增加)AAT样多肽编码核酸的表达的一个优选方法是，在植物中引入和表达在于地上植物部分中具有活性的启动子控制下的AAT样多肽编码核酸。

调节(优选增加)AAT多肽编码核酸的表达的一个优选方法是，在植物中引入和表达AAT多肽编码核酸。

在一个实施方案中，下文述及的任何“可用于本发明方法的蛋白质”应理解为表示如本文所定义的AAT样多肽。下文述及的任何“可用于本发明方法的核酸”应理解为表示能够编码这样的AAT样多肽的核酸。待引入植物(从而可用于实施本发明方法)的核酸是编码现在将要描述的此类蛋白质的任何核酸，下文也称为“AAT样核酸”或“AAT样基因”。

在一个实施方案中，下文述及的任何“可用于本发明方法的蛋白质”应理解为表示如本文所定义的AAT多肽。下文述及的任何“可用于本发明方法的核酸”应理解为表示能够编码这样的AAT多肽的核酸。待引入植物(从而可用于实施本发明方法)的核酸是编码现在将要描述的此类蛋白质的任何核酸，下文也称为“AAT核酸”或“AAT基因”。

本文定义的“AAT样多肽”或“AAT多肽”是指具有一个或多个下列特征的任何多肽：

(a)催化下列反应的能力：

L-丙氨酸+2-酮戊二酸丙酮酸+L-谷氨酸

(b)属于酶分类编号：EC 2.6.1.2.

(c)具有氨基转移酶结构域(在InterPro中称为IPR004839；以及在PFAM中称为PF00155)

(d)具有1-氨基环丙烷-1-羧酸合酶结构域(在InterPro中称为IPR001176)

(e)靶向线粒体

(f)当用于构建包含AAT序列的系统发生树时，与包含SEQ ID NO：51或SEQ ID NO：56的AAT样多肽或AAT多肽群而非任何其他AAT或AAT样序列群聚类。

术语“结构域”和“基序”在本文“定义”部分进行了定义。存在用于鉴定结构域的专家数据库，例如SMART(Schultz等(1998)Proc.Natl.Acad.Sci.USA 95，5857-5864；Letunic等(2002)Nucleic Acids Res 30，242-244)、InterPro(Mulder等，(2003)Nucl.Acids.Res.31，315-318)、Prosite(Bucher和Bairoch(1994)，A generalized profile syntax for biomolecular sequencesmotifs and its function in automatic sequence interpretation.(In)ISMB-94；第二届分子生物学智能系统国际会议记录(Proceedings 2nd InternationalConference on Intelligent Systems for Molecular Biology)Altman R.，Brutlag D.，Karp P.，Lathrop R.，Searls D.编辑，53-61页，AAAI Press，Menlo Park；Hulo等，Nucl.Acids.Res.32：D134-D137，(2004))或者Pfam(Bateman等，Nucleic Acids Research 30(1)：276-280(2002)。进行蛋白质序列芯片(in silico)分析的一组工具可以从ExPASy蛋白质组学服务器获得(瑞士生物信息学研究所(Swiss Institute of Bioinformatics)(Gasteiger等ExPASy：the proteomics server for in-depth protein knowledge andanalysis.Nucleic Acids Res 31：3784-3788(2003))。SEQ ID NO：2多肽序列的分析在下面示于本文实施例2和4。例如，SEQ ID NO：2所示的AHL19/20肽包含具有InterPro登录号IPR014476的AT-hook DNA结合基序和在InterPro数据库中具有InterPro登录号IPR005175并被描述为DUF296(未知功能结构域296)的植物及原核生物保守(PPC)结构域。还可使用常规技术，例如利用序列比对来鉴定结构域。一个这样的结构域是如SEQ ID NO：36所示的SEQ ID NO：2的保守结构域(CD)。所述CD包含预测的NLS、AT-hook DNA结合基序和PCC结构域，如图3中示意性显示的和图4中所示的。

为比较而进行序列比对的方法是本领域众所周知的，此类方法包括GAP、BESTFIT、BLAST、FASTA和TFASTA。GAP使用Needleman和Wunsch的算法((1970)J.Mol.Biol.48：443-453)来寻找可以使匹配数最大化且空位数最小化的两序列间的全局(即跨越全序列)比对。BLAST算法(Altschul等(1990)J Mol Biol 215：403-10)计算序列同一性百分比，并对两序列之间的相似性进行统计学分析。执行BLAST分析的软件可通过美国国家生物技术信息中心(NCBI)公开地获得。例如，同源物可以使用ClustalW多重序列比对算法(1.83版)，采用默认的成对比对参数以及百分比的记分方法而容易地鉴定。利用可获自MatGAT软件包(Campanella等，(2003)BMC Bioinformatics.10：29.MatGAT：an application thatgenerates similarity/identity matrices using protein or DNA sequences)的方法之一，也可以确定全局相似性和同一性百分比。可以进行微小的人工编辑以优化保守基序之间的比对，这对于所属领域的技术人员而言将是显而易见的。此外，除了利用全长序列进行同源物鉴定以外，还可以利用特定的结构域。可以利用上述程序采用默认参数，针对完整核酸序列或多肽序列或者针对选择的结构域或保守基序，确定序列同一性值。本文中实施例3在表B中描述了SEQ ID NO：2所示的AHL19/20多肽与表A中所列的AHL19/20多肽之间的同一性百分比，其范围在50％至99％氨基酸序列同一性之间。在表B1中，显示了SEQ ID NO：36(包含于SEQ ID NO：2中)所示的CD与实施例1表A中所列的AHL19/20多肽的CD之间的同一性百分比，其范围在70％至99％氨基酸序列同一性之间。

蛋白质亚细胞定位预测任务是重要的且得到充分研究的。已知蛋白质的定位有助于阐明其功能。用于蛋白质定位的实验方法从免疫定位至使用绿色荧光蛋白(GFP)来标记蛋白质。这些方法是精确的，但是与计算机方法相比非常费劳力。最近在根据序列数据计算机预测蛋白质定位方面取得了许多进展。其中本领域技术人员公知的算法可在Swiss Institute forBioinformatics托管的ExPASy Proteomics tools上获得，例如，PSort、TargetP、ChloroP、LocTree、Predotar、LipoP、MITOPROT、PATS、PTS1、SignalP等。本发明多肽的亚细胞定位的鉴定示于实施例6。在SEQID NO：2的AHL19/20多肽中发现了预测的核定位信号(NLS)。NLS是具有带正电荷的赖氨酸或精氨酸的一个或多个短序列。特别地，本发明的SEQ ID NO：2经预测定位在真核细胞的核区室。

此外，用于本发明方法的AHL19/20多肽(至少以其天然形式)通常，但不是必需地，具有转录调控活性并能够与其他蛋白质相互作用。因此，具有降低的转录调控活性、无转录调控活性、具有降低的蛋白质-蛋白质相互作用能力或不具有蛋白质-蛋白质相互作用能力的AHL19/20多肽都可同等地用于本发明的方法。可使用本领域中熟知的技术(例如CurrentProtocols in Molecular Biology，第1和2卷，Ausubel等(1994)，CurrentProtocols)容易地体外或体内确定DNA结合活性和蛋白质-蛋白质相互作用。为了确定AHL19/20多肽的DNA结合活性，几种测定法是可用的，例如DNA结合凝胶-迁移测定法(或凝胶阻滞试验；Korfhage等(1994)Plant C 6：695-708)，体外DNA结合测定法(Schindler等(1993)Plant J4(1)：137-150)，或酵母、动物和植物细胞中AHL19/20多肽的转录激活(Halbach等(2000)Nucleic Acid Res 28(18)：3542-3550)。可使用随机寡核苷酸选择技术(Viola&Gonzalez(May 26，2007)Biochemistry)确定特定的DNA结合序列。

在一个实施方案中，本发明以SEQ ID NO：1所示的核酸序列转化植物来进行举例说明，其编码SEQ ID NO：2的ALH19/20多肽序列。然而，本发明的实施并不局限于这些序列；本发明的方法可以有利地利用任何编码本文所定义的AHL19/20多肽的核酸序列来实施。

编码AHL19/20多肽的核酸序列的实例在本文实施例1表A中给出。这样的核酸序列可用于实施本发明的方法。实施例1表A中给出的多肽序列为SEQ ID NO：2所示AHL19/20多肽的直系同源物和旁系同源物的示例序列，其中术语“直系同源物”和“旁系同源物”如本文所定义。可以通过进行所谓的交互BLAST搜索，容易地找到其它直系同源物和旁系同源物。通常，这包括第一BLAST，即，以查询序列(例如，利用实施例1表A中所列的任一序列)针对任何序列数据库如可公共获得的NCBI数据库进行BLAST。当从核苷酸序列开始时，通常使用BLASTN或TBLASTX(利用标准默认值)，而当从蛋白质序列开始时，则使用BLASTP或TBLASTN(利用标准默认值)。BLAST结果可以任选地过滤。接着使用过滤的结果或者未过滤的结果中的全长序列针对查询序列来源生物的序列进行反向BLAST(第二BLAST)(在查询序列为SEQ ID NO：1或SEQ ID NO：2的情况下，第二BLAST将针对拟南芥序列进行)。然后比较第一和第二BLAST的结果。如果第一BLAST中高排序的命中事件(high-ranking hit)与查询序列源自相同的物种，然后反向BLAST理想地导致查询序列处于最高命中事件之列，则找到了旁系同源物；如果第一BLAST中高排序的命中事件与查询序列不源自相同的物种，且优选地在反向BLAST时导致查询序列处于最高命中事件之列，则找到了直系同源物。

此外，GRP多肽，就SEQ ID NO：46和其直系同源物、旁系同源物和同源物而言，通常具有可在金属饱和试验(Scheuhammer等，Toxicol.Appl Pharmacol.82，417-425，1986)中测量的金属结合活性和/或可用作氧化还原传感器(Fabisiak等，Methods Enzymol.353，268-281(2002))。

在一个实施方案中，本发明以SEQ ID NO：45所示的核酸序列转化植物来进行举例说明，其编码SEQ ID NO：46的多肽序列。然而，本发明的实施并不局限于这些序列；本发明的方法可以有利地利用本文所定义的任何GRP编码核酸序列或GRP多肽来实施。

GRP多肽编码核酸序列的实例可在本领域已知的数据库中找到。这样的核酸序列可用于实施本发明的方法。直系同源物和旁系同源物(术语“直系同源物”和“直系同源物”如本文所定义)可通过实施所谓的交互BLAST搜索而容易地找到。通常，这包括第一BLAST，以查询序列(例如，利用SEQ ID NO：46)针对任何序列数据库如可公共获得的NCBI数据库进行BLAST。当从核苷酸序列开始时，通常使用BLASTN或TBLASTX(利用标准默认值)，而当从蛋白质序列开始时，则使用BLASTP或TBLASTN(利用标准默认值)。BLAST结果可以任选地过滤。接着使用过滤的结果或者未过滤的结果中的全长序列针对查询序列来源生物的序列进行反向BLAST(第二BLAST)(在查询序列为SEQ ID NO：45或SEQ ID NO：46的情况下，第二BLAST将会针对拟南芥序列进行)。然后比较第一和第二BLAST的结果。如果第一BLAST中高排序的命中事件与查询序列源自相同的物种，然后反向BLAST理想地导致查询序列处于最高命中事件之列，则找到了旁系同源物；如果第一BLAST中高排序的命中事件与查询序列源自不同物种，且优选地在反向BLAST时导致查询序列处于最高命中事件之列，则找到了直系同源物。

在一个实施方案中，本发明以SEQ ID NO：50所示的核酸序列转化植物来进行举例说明，其编码SEQ ID NO：51的多肽序列。然而，本发明的实施并不局限于这些序列；本发明的方法可以有利地利用本文所定义的任何AAT样核酸或AAT样多肽来实施。

可用于实施本发明方法的核酸的实例包括SEQ ID NO：51所示的ATT样多肽的直系同源物和旁系同源物，其中术语“直系同源物”和“旁系同源物”如本文所定义。可以通过进行所谓的交互BLAST搜索，容易地找到直系同源物和旁系同源物。通常，这包括第一BLAST，以查询序列(例如SEQ ID NO：50或SEQ ID NO：51)针对任何序列数据库如可公共获得的NCBI数据库进行BLAST。当从核苷酸序列开始时，通常使用BLASTN或TBLASTX(利用标准默认值)，而当从蛋白质序列开始时，则使用BLASTP或TBLASTN(利用标准默认值)。BLAST结果可以任选地过滤。接着使用过滤的结果或者未过滤的结果中的全长序列针对查询序列来源生物的序列进行反向BLAST(第二BLAST)(在查询序列为SEQ ID NO：50或SEQ ID NO：51的情况下，第二BLAST将会针对衣藻(Chlamydomonas)序列进行)。然后比较第一和第二BLAST的结果。如果第一BLAST中高排序的命中事件与查询序列源自相同的物种，然后反向BLAST理想地导致查询序列处于最高命中事件之列，则找到了旁系同源物；如果第一BLAST中高排序的命中事件与查询序列源自不同物种，且优选地在反向BLAST时导致查询序列处于最高命中事件之列，则找到了直系同源物。

在一个实施方案中，本发明以SEQ ID NO：55所示的核酸序列转化植物来进行举例说明，其编码SEQ ID NO：56的多肽序列。然而，本发明的实施并不局限于这些序列；本发明的方法可以有利地利用本文所定义的任何AAT编码核酸或AAT多肽来实施。

本文实施例1中给出了寻找AAT多肽或其直系同源物或旁系同源物的编码核酸的方法实例。这样的核酸可用于本发明的方法。直系同源物和旁系同源物可以通过进行所谓的交互BLAST搜索容易地找到。通常，这包括第一BLAST，以查询序列(例如利用SEQ ID NO：55或SEQ ID NO：56)针对任何序列数据库如可公共获得的NCBI数据库进行BLAST。当从核苷酸序列开始时，通常使用BLASTN或TBLASTX(利用标准默认值)，而当从蛋白质序列开始时，则使用BLASTP或TBLASTN(利用标准默认值)。BLAST结果可以任选地过滤。接着使用过滤的结果或者未过滤的结果中的全长序列针对查询序列来源生物的序列进行反向BLAST(第二BLAST)(在查询序列为SEQ ID NO：55或SEQ ID NO：56的情况下，第二BLAST将针对稻序列进行)。然后比较第一和第二BLAST的结果。如果第一BLAST中高排序的命中事件与查询序列源自相同的物种，然后反向BLAST理想地导致查询序列处于最高命中事件之列，则找到了旁系同源物；如果第一BLAST中高排序的命中事件与查询序列源自不同物种，且优选地在反向BLAST时导致查询序列处于最高命中事件之列，则找到了直系同源物。

高排序的命中事件是E值低的命中事件。E值越低，分值越具有显著性(或者换句话说，偶然发现此命中事件的几率越低)。E值的计算是本领域众所周知的。除了E值之外，还对比较进行同一性百分比记分。同一性百分比是指两比较核酸(或多肽)序列之间在特定长度上的相同核苷酸(或氨基酸)数。在大家族的情况下可以使用ClustalW，继之以邻接树，来辅助对相关基因聚类的可视化和鉴定直系同源物和旁系同源物。在含有SEQ ID NO：2的群内聚类的任何序列(AHL19多肽；图1和2中用圆圈标示的)可被认为落在上述AHL19/20多肽定义内，并且可被认为适合用于本发明的方法。

核酸变体也可用于实施本发明的方法。这类核酸变体的实例包括编码实施例1表A中所示任一多肽序列的同源物和衍生物的核酸序列，其中“同源物”和“衍生物”如本文所定义。同样可用于本发明方法的有编码实施例1表A所示任一多肽序列的直系同源物或旁系同源物的同源物和衍生物的核酸序列。可用于本发明方法的同源物和衍生物与其源自的未修饰蛋白质具有基本上相同的生物活性和功能活性。

可用于实施本发明方法的其他核酸变体包括编码ALH19/20多肽的核酸序列的部分、与编码ALH19/20多肽的核酸序列杂交的核酸序列、编码ALH19/20多肽的核酸序列的剪接变体、编码ALH19/20多肽的核酸序列的等位基因变体，以及通过基因改组获得的ALH19/20多肽编码核酸序列的变体。术语杂交序列、剪接变体、等位基因变体和基因改组如本文所述。

编码ALH19/20多肽的核酸序列无需是全长核酸序列，因为本发明方法的实施不依赖于全长核酸序列的使用。根据本发明，提供了增强植物的种子产率相关性状的方法，包括在植物中引入和表达实施例1表A所示任一核酸序列的部分、或者编码实施例1表A所示任一多肽序列的直系同源物、旁系同源物或同源物的核酸序列的部分。

编码SEQ ID NO：46的同源物和衍生物的核酸序列变体也可用于实施本发明的方法，术语“同源物”和“衍生物”如本文所定义。同样可用于本发明方法是编码SEQ ID NO：46的直系同源物或旁系同源物的同源物和衍生物的核酸序列。可用于本发明方法的同源物和衍生物与其源自的未修饰蛋白质具有基本上相同的生物活性和功能活性。

可用于实施本发明方法的其他核酸序列变体包括GRP多肽编码核酸序列的部分、与GRP多肽编码核酸序列杂交的核酸序列、GRP多肽编码核酸序列的剪接变体、GRP多肽编码核酸序列的等位基因变体，以及通过基因改组获得的GRP多肽编码核酸序列的变体。术语杂交序列、剪接变体、等位基因变体和基因改组如本文所述。

GRP多肽编码核酸序列无需是全长核酸序列，因为本发明方法的实施不依赖于全长核酸序列的使用。根据本发明，提供了增强在非生物胁迫条件下生长的植物的产率相关性状的方法，包括在植物中引入和表达SEQ IDNO：45的部分或编码SEQ ID NO：46的直系同源物、旁系同源物或同源物的核酸序列的部分。

核酸变体也可用于实施本发明的方法。这类核酸变体的实例包括编码SEQ ID NO：51的同源物和衍生物的核酸，术语“同源物”和“衍生物”如本文所定义。同样可用于本发明方法的有编码SEQ ID NO：51所示AAT样多肽或SEQ ID NO：56所示AAT多肽的直系同源物或旁系同源物的同源物和衍生物的核酸。可用于本发明方法的同源物和衍生物与其源自的未修饰蛋白质具有基本上相同的生物活性和功能活性。

可用于实施本发明方法的其他核酸变体包括AAT样多肽或AAT多肽编码核酸的部分、与AAT样多肽或AAT多肽编码核酸杂交的核酸、AAT样多肽或AAT多肽编码核酸的剪接变体、AAT样多肽或AAT多肽编码核酸的等位基因变体，以及通过基因改组获得的AAT样多肽或AAT多肽编码核酸的变体。术语杂交序列、剪接变体、等位基因变体和基因改组如本文所述。

AAT样多肽或AAT多肽编码核酸无需是全长核酸，因为本发明方法的实施不依赖于全长核酸序列的使用。根据本发明，提供了增强植物的产率相关性状的方法，包括在植物中引入和表达SEQ ID NO：50或SEQ ID NO：55的部分或编码SEQ ID NO：51或SEQ ID NO：56的直系同源物、旁系同源物或同源物的核酸的部分。

核酸序列的“部分”可以例如，通过对核酸序列进行一个或多个缺失来制备。“部分”可以以分离的形式使用，或者可将其与其他编码(或非编码)序列融合，以便例如，产生组合了若干活性的蛋白质。当与其他编码序列融合时，经翻译后所产生的多肽可能比针对该蛋白质部分所预测到的要大。

可用于本发明方法的“部分”编码如本文所定义的AHL19/20多肽，并与实施例1表A所示多肽序列具有基本上相同的生物活性。优选“部分”是实施例1表A所示任一核酸序列的部分，或是编码实施例1表A所示任一多肽序列的直系同源物或旁系同源物的核酸序列的部分。优选“部分”按照递增的优选顺序是至少400、450、500、550、600、650、700、750、800、850、900、940个连续核苷酸长，所述连续核苷酸来自实施例1表A所示任一核酸序列或者编码实施例1表A所示任一多肽序列的直系同源物或旁系同源物的核酸序列。优选，所述部分是编码多肽序列的核酸序列的部分，其中所述多肽序列当用于构建AHL系统发生树，例如图1或图2中描述的系统发生树时，与包含SEQ ID NO：2所示多肽序列的AHL19/20多肽群而非任何其他AHL群聚类。最优选“部分”是核酸序列SEQ ID NO：1的部分。

可用于本发明方法的“部分”编码如本文所定义的GRP多肽，并与SEQID NO：46所示多肽序列具有基本上相同的生物活性。优选部分是SEQ IDNO：45所示核酸序列的部分，或是编码SEQ ID NO：46所示多肽序列的直系同源物或旁系同源物的核酸序列的部分。优选“部分”长度是至少50、75、100、125、150、175、200、210、220、230、240或更多个连续核苷酸，所述连续核苷酸来自SEQ ID NO：45或者编码SEQ ID NO：46的直系同源物或旁系同源物的核酸序列。最优选，所述部分是SEQ ID NO：45的核酸序列的部分。

可用于本发明方法的“部分”编码如本文所定义的AAT样多肽，并与SEQ ID NO：51的氨基酸序列具有基本上相同的生物活性。优选“部分”长度是至少500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、1300、1350、1400、1450、1500、1550个连续核苷酸，所述连续核苷酸来自SEQ ID NO：50或者编码SEQ ID NO：51的直系同源物或旁系同源物的核酸序列。

优选“部分”编码这样的氨基酸序列的片段，当用于构建包含AAT序列的系统发生树时，所述氨基酸序列与包含SEQ ID NO：51的AAT样多肽群而非任何其他AAT或AAT样序列群聚类。

可用于本发明方法的“部分”编码如本文所定义的AAT多肽，并与SEQID NO：56的氨基酸序列具有基本上相同的生物活性。优选“部分”长度是至少500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、1300、1350、1400、1450个连续核苷酸，所述连续核苷酸来自SEQ ID NO：55或者编码SEQ ID NO：56的直系同源物或旁系同源物的核酸序列。

优选，所述部分编码氨基酸序列的片段，所述氨基酸序列，当用于构建包含AAT序列的系统发生树时，与包含SEQ ID NO：56的AAT多肽群而非任何其他AAT序列群聚类。

可用于本发明方法的另一核酸序列变体为在降低的严格条件下、优选在严格条件下，能够与本文所定义的产率增加性多肽的编码核酸序列或者本文所定义的“部分”杂交的核酸序列，其中所述产率增加性多肽选自：核定位AT-hook基序蛋白19/20(AHL19/20)、GRP(生长调节蛋白，其中所述GRP多肽是金属硫蛋白2a(MT2a)多肽)、丙氨酸氨基转移酶(AAT)样多肽和丙氨酸氨基转移酶(AAT)多肽。

根据本发明，在一个实施方案中提供了增加植物的种子产率相关性状的方法，包括在植物中引入和表达能够与实施例1表A所示任一核酸序列杂交的核酸序列，或者包括在植物中引入和表达能够与编码实施例1表A所示任一核酸序列的直系同源物、旁系同源物或同源物的核酸序列杂交的核酸序列。

可用于本发明方法的杂交序列编码如本文所定义的AHL19/20多肽，与实施例1表A所示多肽序列具有基本上相同的生物活性。优选杂交序列能够与实施例1表A所示任一核酸序列杂交、或与任一前述序列的部分杂交，其中部分如上文所定义；或者其中杂交序列能够与编码实施例1表A所示任一多肽序列的直系同源物或旁系同源物的核酸序列杂交。优选，所述杂交序列能够与编码多肽序列的核酸序列杂交，所述多肽序列，当用于构建AHL系统发生树，例如图1或图2中描述的系统发生树时，与包含SEQ ID NO：2所示多肽序列的AHL19/20多肽群而非任何其他AHL群聚类。最优选杂交序列能够与SEQ ID NO：1所示的核酸序列或其部分杂交。

根据本发明，在一个实施方案中提供了强在非生物胁迫条件下生长的的包括SEQ ID NO：45杂交的核酸序列，或包括在植物中引入和表达能够与编码SEQ ID NO：46的直系同源物、旁系同源物或同源物的核酸杂交的核酸。

可用于本发明方法的杂交序列编码如本文所定义的GRP多肽，与SEQID NO：46所示多肽序列具有基本上相同的生物活性。优选杂交序列能够与SEQ ID NO：45杂交、或与该序列的部分杂交，其中部分如上文所定义；或者杂交序列能够与编码SEQ ID NO：46的直系同源物或旁系同源物的核酸序列或其部分杂交。

根据本发明，在一个实施方案中提供了增强植物的产率相关性状的方法，包括在植物中引入和表达能够与SEQ ID NO：50杂交或者能够与编码SEQ ID NO：51的直系同源物、旁系同源物或同源物的核酸杂交的核酸。

可用于本发明方法的杂交序列编码如本文所定义的AAT样多肽，与SEQ ID NO：51所示氨基酸序列具有基本上相同的生物活性。优选杂交序列能够与编码SEQ ID NO：51的直系同源物、旁系同源物或同源物的核酸杂交、或与这样的核酸的部分杂交，部分如上文所定义。最优选，杂交序列能够与SEQ ID NO：50所示核酸杂交或与其部分杂交。

根据本发明，提供了增强植物的产率相关性状的方法，包括在植物中引入和表达能够与SEQ ID NO：55杂交或者能够与编码SEQ ID NO：56的直系同源物、旁系同源物或同源物的核酸杂交的核酸。

可用于本发明方法的杂交序列编码如本文所定义的AAT多肽，与SEQID NO：56的氨基酸序列具有基本上相同的生物活性。优选杂交序列能够与编码SEQ ID NO：56的直系同源物、旁系同源物或同源物的核酸杂交、或与这样的核酸的部分杂交，部分如上文所定义。最优选，杂交序列能够与SEQ ID NO：55所示核酸杂交或与其部分杂交。

优选杂交序列编码具有这样的氨基酸序列的多肽，该氨基酸序列当全长且用于构建包含AAT序列的系统发生树时，与包含SEQ ID NO：51的AAT样多肽群或与包含SEQ ID NO：56的AAT多肽群而非任何其他AAT或AAT样序列群聚类。

可用于本发明方法的另一类核酸序列变体为编码前文所定义的产率增加性多肽的剪接变体，其中剪接变体如本文所定义，所述产率增加性多肽选自：核定位AT-hook基序蛋白19/20(AHL19/20)、GRP(生长调节蛋白，其中所述GRP多肽是金属硫蛋白2a(MT2a)多肽)、丙氨酸氨基转移酶(AAT)样多肽和丙氨酸氨基转移酶(AAT)多肽。

根据本发明，提供了增强种子产率相关性状的方法，包括在植物中引入和表达实施例1表A所示任一核酸序列的剪接变体、或编码实施例1表A所示任一多肽序列的直系同源物、旁系同源物或同源物的核酸序列的剪接变体。

在一个实施方案中，剪接变体是SEQ ID NO：1所示核酸序列的剪接变体，或编码SEQ ID NO：2的直系同源物或旁系同源物的核酸序列的剪接变体。优选剪接变体是编码这样的多肽序列的核酸序列的剪接变体，所述多肽序列，当用于构建AHL系统发生树，例如图1或图2中描述的系统发生树时，与包含SEQ ID NO：2所示多肽序列的AHL19/20多肽群而非任何其他AHL群聚类。

在一个根据本发明的实施方案中，提供了相对于对照植物增强在非生物胁迫条件下生长的植物的产率相关性状的方法，包括在植物中引入和表达SEQ ID NO：45的剪接变体、或编码SEQ ID NO：46的直系同源物、旁系同源物或同源物的核酸序列的剪接变体。

在一个根据本发明的实施方案中，提供了增强植物的产率相关性状的方法，包括在植物中引入和表达SEQ ID NO：50或SEQ ID NO：55的剪接变体、或编码SEQ ID NO：51或SEQ ID NO：56的直系同源物、旁系同源物或同源物的核酸的剪接变体。

优选由剪接变体编码的氨基酸序列，当用于构建包含AAT序列的系统发生树时，与包含SEQ ID NO：51的AAT样多肽群或与包含SEQ ID NO：56的AAT多肽群而非任何其他AAT或AAT样序列群聚类。

可用于实施本发明方法的另一类核酸序列变体为编码前文所定义的产率增加性多肽的核酸序列的等位基因变体，其中等位基因变体如本文所定义，所述产率增加性多肽选自：核定位AT-hook基序蛋白19/20(AHL19/20)、GRP(生长调节蛋白，其中所述GRP多肽是金属硫蛋白2a(MT2a)多肽)、丙氨酸氨基转移酶(AAT)样多肽和丙氨酸氨基转移酶(AAT)多肽。

在一个根据本发明的实施方案中，提供了增强种子产率相关性状的方法，包括在植物中引入和表达实施例1表A所示任一核酸序列的等位基因变体，或者包括在植物中引入和表达编码实施例1表A所示任一多肽序列的直系同源物、旁系同源物或同源物的核酸序列的等位基因变体。

可用于本发明方法的等位基因变体与SEQ ID NO：2的AHL19/20多肽及实施例1表A所示的任一多肽序列具有基本上相同的生物活性。等位基因变体天然存在，并且这些天然等位基因的应用包含于本发明的方法中。优选等位基因变体为SEQ ID NO：1的等位基因变体，或编码SEQ ID NO：2的直系同源物或旁系同源物的核酸序列的等位基因变体。优选等位基因变体是这样的多肽序列的等位基因变体，所述多肽序列当用于构建AHL系统发生树，例如图1或图2中描述的系统发生树时，与包含SEQ ID NO：2所示多肽序列的AHL19/20多肽群而非任何其他AHL群聚类。

在一个根据本发明的实施方案中，提供了增强在非生物胁迫条件下生长的植物的产率相关性状的方法，包括在植物中引入和表达SEQ ID NO：45的等位基因变体、或包括在植物中引入和表达编码SEQ ID NO：46所示多肽序列的直系同源物、旁系同源物或同源物的核酸序列的等位基因变体。

可用于本发明方法的等位基因变体与SEQ ID NO：46的GRP多肽具有基本上相同的生物活性。等位基因变体天然存在，并且这些天然等位基因的应用包含于本发明的方法中。

在一个根据本发明的实施方案中，提供了增强植物的产率相关性状的方法，包括在植物中引入和表达SEQ ID NO：50或SEQ ID NO：55的等位基因变体、或编码SEQ ID NO：51或SEQ ID NO：56的氨基酸序列的直系同源物、旁系同源物或同源物的核酸的等位基因变体。

可用于本发明方法的等位基因变体与SEQ ID NO：51的AAT样多肽或SEQ ID NO：56的AAT多肽具有基本上相同的生物活性。等位基因变体天然存在，并且这些天然等位基因的应用包含于本发明的方法中。优选由等位基因变体编码的氨基酸序列，当用于构建包含AAT序列的系统发生树时，与包含SEQ ID NO：51的AAT样多肽群或与包含SEQ ID NL：56的AAT多肽群而非任何其他AAT或AAT样序列群聚类。

基因改组或定向进化也可用于产生上文所定义的产率增加性多肽的编码核酸序列的变体；其中术语“基因改组”如本文所定义，所述产率增加性多肽选自：核定位AT-hook基序蛋白19/20(AHL19/20)、GRP(生长调节蛋白，其中所述GRP多肽是金属硫蛋白2a(MT2a)多肽)、丙氨酸氨基转移酶(AAT)样多肽和丙氨酸氨基转移酶(AAT)多肽。

在一个根据本发明的实施方案中，提供了增强种子产率相关性状的方法，包括在植物中引入和表达实施例1表A所示任一核酸序列的变体，或者包括在植物中引入和表达编码实施例1表A所示任一多肽序列的直系同源物、旁系同源物或同源物的核酸序列的变体，该变体核酸序列通过基因改组获得。

优选，通过基因改组获得的核酸序列编码多肽序列，所述多肽序列，当用于构建AHL系统发生树，例如图1或图2中描述的系统发生树时，与包含SEQ ID NO：2所示多肽序列的AHL19/20多肽群而非任何其他AHL群聚类。

在一个根据本发明的实施方案中，提供了增强在非生物胁迫条件下生长的植物的产率相关性状的方法，包括在植物中引入和表达SEQ ID NO：45的变体核酸序列，或者包括在植物中引入和表达编码SEQ ID NO：46的直系同源物、旁系同源物或同源物的核酸序列的变体，该变体核酸序列通过基因改组获得。

在一个根据本发明的实施方案中，提供了增强植物的产率相关性状的方法，包括在植物中引入和表达SEQ ID NO：50或SEQ ID NO：55的变体，或编码SEQ ID NO：51或SEQ ID NO：56的直系同源物、旁系同源物或同源物的核酸的变体，该变体核酸通过基因改组获得。

优选，通过基因改组获得的变体核酸编码这样的氨基酸序列，当用于构建包含AAT序列的系统发生树时，其与包含SEQ ID NO：51的AAT样多肽群或与包含SEQ ID NO：56的AAT多肽群而非任何其他AAT或AAT样序列群聚类。

此外，还可利用定点诱变获得核酸序列变体。若干方法可用来实现定点诱变，最常见的是基于PCR的方法(Current Protocols in MolecularBiology.Wiley编辑)。

AHL19/20多肽编码核酸序列可以来自任何天然或人造的来源。可以通过有意的人为操作在组成和/或基因组环境上修饰核酸序列，使之不同于天然形式。优选AHL19/20多肽编码核酸序列来自植物，还优选来自双子叶植物，更优选来自十字花科(Brassicaceae)，最优选所述核酸序列来自拟南芥。

GRP多肽编码核酸序列可以来自任何天然或人造的来源。可以通过有意的人为操作在组成和/或基因组环境上修饰核酸序列，使之不同于天然形式。优选GRP多肽编码核酸序列来自植物。在SEQ ID NO：45的情况下，GRP多肽编码核酸序列优选来自双子叶植物，更优选来自十字花科，最优选所述核酸序列来自拟南芥。

实施本发明的方法产生相对于对照植物具有增强的种子产率相关性状的植物。术语“产率”和“种子产率”在本文“定义”部分有更详细的说明。

实施本发明的方法产生在非生物胁迫条件下生长时相对于对照植物具有增强的产率相关性状的植物。特别地，实施本发明的方法产生当在非生物胁迫条件下生长时相对于对照植物具有增加的早期活力和增加的产率，特别地增加的生物量和增加的种子产率，的植物。术语“产率”和“种子产率”在本文“定义”部分有更详细的说明。

此处所述及的增强的产率相关性状应理解为表示植物的一个或多个部分的早期活力和/或生物量(重量)的增加，所述部分可以包括地上(可收获)部分和/或地下(可收获)部分。特别地，这样的可收获部分为生物量和/或种子，并且实施本发明的方法使得在非生物胁迫条件下生长的植物，相对于在相当条件下生长的对照植物的早期活力、生物量或种子产率，具有增加的早期活力、生物量和/或种子产率。

AAT样多肽编码核酸可以来自任何天然或人造的来源。可以通过有意的人为操作在组成和/或基因组环境上修饰核酸，使之不同于天然形式。优选AAT样核酸来自藻类，还优选来自衣藻属(Chlamydomonas)，更优选来自物种雷氏衣藻(Chlamydomonas reinhardtii)。

实施本发明的方法产生具有增强的产率相关性状的植物。特别地，实施本发明的方法产生相对于对照植物具有增加的产率，尤其是具有增加的种子产率，的植物。术语“产率”和“种子产率”在本文“定义”部分有更详细的说明。

此处所述及的增强的产率相关性状应理解为表示植物的一个或多个部分的生物量(重量)的增加，所述部分可以包括地上(可收获)部分和/或地下(可收获)部分。特别地，这样的可收获部分为种子。

AAT多肽编码核酸可以来自任何天然或人造的来源。可以通过有意的人为操作在组成和/或基因组环境上修饰核酸，使之不同于天然形式。优选POI多肽编码核酸来自植物。还优选来自单子叶植物，更优选来自禾本科(Poaceae)，最优选所述核酸来自稻(Oryza sativa)。

此处所述及的增强的产率相关性状应理解为表示植物的一个或多个部分的生物量(重量)的增加，所述部分可以包括地上(可收获)部分和/或地下(可收获)部分。特别地，这样的可收获部分为种子。并且实施本发明的方法使得植物相对于对照植物的种子产率具有增加的种子产率。

以玉米为例，产率增加可以表现为如下一个或多个方面：每公顷或英亩建植(established))的植物数的增加；每株植物的穗数的增加；行数、行粒数、粒重、千粒重、穗长度/直径的增加；种子饱满率(其为饱满种子数除以种子总数并乘以100)的增加，等等。以稻为例，产率增加可以表现为如下一个或多个方面的增加：每公顷或英亩的植物数、每株植物的圆锥花序数、每个圆锥花序的小穗数、每个圆锥花序的花朵(小花)数(其表达为饱满种子数占一级圆锥花序(primary panicles)数的比率)、种子饱满率(其为饱满种子数除以种子总数并乘以100)的增加、千粒重的增加，等等。

在一个实施方案中，本发明提供了相对于对照植物增强植物的种子产率相关性状的方法，所述方法包括增加植物中编码本文所定义的AHL19/20多肽的核酸序列的表达。

由于根据本发明的转基因植物具有增加的种产率相关性状，这些植物可呈现出，相对于对照植物在其生命周期相应阶段的生长速率而言，增加的生长速率(至少在其部分生命周期中)。

在一个实施方案中，本发明提供了相对于在相当的条件下生长的对照植物，增强在非生物胁迫生长条件下的植物的产率相关性状，特别地植物的生物量和/或种子产率的方法，所述方法包括增加植物中编码本文所定义的GRP多肽的核酸序列的表达。

由于在非生物胁迫条件下生长的本发明转基因植物具有增强的种子产率相关性状，这些植物可呈现出，相对于在相当生长条件下的对照植物在其生命周期的相应阶段上的生长速率而言，增加的生长速率(至少在其部分生命周期中)。

在一个根据本发明的实施方案中，提供了相对于对照植物增加植物的产率、特别是种子产率的方法，所述方法包括调节植物中编码本文所定义的AA样多肽或AAT多肽的核酸的表达，优选增加表达。

由于本发明的转基因植物具有增加的产率，这些植物可呈现出，相对于对照植物在其生命周期相应阶段的生长速率而言，增加的生长速率(至少在其部分生命周期中)。

增加的生长速率可以是对植物的一个或多个部分(包括种子)特异的，或者可以基本上遍及整株植物。具有增加生长速率的植物可以具有更短的生命周期。植物的生命周期可以理解为表示从成熟干种子生长至植物产生类似于起始材料的成熟干种子的阶段所需的时间。此生命周期可以受到诸如早期活力、生长速率、绿度指数、开花时间和种子成熟速度等因素的影响。生长速率的增加可以出现在植物生命周期的一个或多个阶段，或者出现在基本上整个植物生命周期的过程中。在植物生命周期的早期阶段，生长速率的增加可以反映出增加的(早期)活力。生长速率的增加可以改变植物的收获周期，使植物能够比原来可能的情况更晚播种和/或更快收获(类似的效果可以通过较早的开花时间获得；在作物中延迟的开花通常不是期望的性状)。如果生长速率充分增加，可以允许再播种同种植物物种的种子(例如完全在一个常规的生长期内，播种和收获稻类植物、接着再播种和收获稻类植物)。与此类似，如果生长速率充分地增加，可以允许再播种不同植物物种的种子(例如播种和收获玉米植物，随后，例如，播种和任选地收获大豆、马铃薯或任何其他适合的植物)。在一些作物植物的情况下，也可能可以从同一砧木得到额外次数的收获。改变植物的收获周期可以导致每英亩年生物量产量的增加(这是由于(比方说在一年中)任何特定植物可以生长和收获的次数的增加)。与野生型对应物相比，生长速率的增加还可能允许在更广阔的地域栽培转基因植物，这是因为种植作物的地域限制通常由种植时(早季)或收获时(晚季)不利的环境条件所决定。如果缩短收获周期，就可以避免这类不利条件。可以通过从生长曲线获得多种参数来确定生长速率，这类参数可以是：T-Mid(植物达到其最大大小的50％所需的时间)和T-90(植物达到其最大大小90％所需的时间)等等。本文所定义的生长速率不用于表示延迟的开花。

根据本发明的一个实施方案，实施本发明的方法产生了相对于对照植物具有增加的生长速率的植物。因此，根据本发明的该实施方案，提供了增加植物生长速率的方法，所述方法包括增加植物中编码本文所定义的AHL19/20多肽的核酸序列的表达。

根据本发明的一个实施方案，实施本发明的方法产生了在非生物胁迫条件下生长时相对于对照植物具有增加的生长速率的植物。因此，根据本发明的该实施方案，提供了增加在非生物胁迫条件下生长的植物生长速率的方法，所述方法包括增加植物中编码本文所定义的GRP多肽的核酸序列的表达。

根据本发明的一个实施方案，实施本发明的方法产生了相对于对照植物具有增加的生长速率的植物。因此，根据本发明的该实施方案，提供了增加植物生长速率的方法，所述方法包括调节，优选增加，地上植物部分中编码本文所定义的ATT样多肽或ATT多肽的核酸的表达。

与在相当条件下生长的对照植物相比，增强的种子产率相关性状可以发生在植物处于非胁迫条件下或暴露于多种胁迫时。与对照植物相比，产率相关性状的增强(种子产率和/或生长速率的增加)可以发生在植物处于非胁迫条件下或暴露于多种胁迫时。

在特别优选实施方案中，在非胁迫条件下实施本发明的方法。然而，无论植物处于非胁迫条件下还是暴露于不同的胁迫，都可以发生与对照植物相比，产率和/或生长速率的增加。

植物通常通过更缓慢地生长来对暴露于胁迫作出反应。在重度的胁迫条件下，植物甚至可能完全停止生长。另一方面，轻度的胁迫在此处定义为植物暴露于该胁迫后、不导致植物出现无重新生长能力的完全停止生长的任何胁迫。在本发明的意义上，轻度胁迫导致受胁迫的植物与在非胁迫条件下的对照植物相比，生长减少不足40％、35％或30％，优选不足25％、20％或15％，更优选不足14％、13％、12％、11％或10％或更低。由于农业实践(灌溉、施肥、农药处理)的进步，在栽培的作物植物中通常不会遇到重度胁迫。因此，由轻度胁迫诱导的减弱的生长通常是农业上不期望的特征。轻度胁迫可以是植物接触到的日常生物和/或非生物(环境)胁迫。非生物胁迫可以由干旱或过多的水、缺氧胁迫、盐胁迫、化学毒性、氧化胁迫和热、冷或冰冻温度引起。非生物胁迫可以是由水胁迫(特别由于干旱)、盐胁迫、氧化胁迫或离子胁迫引起的渗透胁迫。生物胁迫通常是由病原体例如细菌、病毒、真菌、线虫和昆虫引起的胁迫。本文所用的术语“非胁迫”条件是允许植物最佳生长的环境条件。本领域技术人员知晓给定区域的正常土壤条件和气候条件。

如Wang等(Planta(2003)218：1-14)所报道的那样，非生物胁迫引起一系列的形态学、生理学、生物化学和分子变化，对植物生长和生产力造成不利影响。已知干旱、盐度、极端温度和氧化胁迫相互联系，并可以通过相似的机制诱发生长和细胞损害。Rabbani等(Plant Physiol(2003)133：1755-1767)描述了干旱胁迫和高盐度胁迫之间特别高程度的“对话(cross-talk)”。例如，干旱和/或盐度主要表现为渗透胁迫，导致破坏细胞中的稳态和离子分布。氧化胁迫通常与高温或低温、盐度或干旱胁迫相伴，可以引起功能及结构蛋白质的变性。所以，这些多种多样的环境胁迫通常激活相似的细胞信号传递路径和细胞应答，如应激蛋白的产生、抗氧化剂的上调、相容溶质的累积以及生长阻抑。如本文所用的术语“非胁迫”条件为那些允许植物最佳生长的环境条件。本领域技术人员知晓给定区域的正常土壤条件和气候条件。

在一个实施方案中，实施本发明的方法产生在非胁迫条件下或在轻度胁迫条件下生长时相对于在相当条件下生长的对照植物具有增强的种子产率相关性状的植物。因此，根据本发明的一个实施方案，提供了增强在非胁迫条件下或在轻度胁迫条件下生长的植物的种子产率相关性状的方法，所述方法包括增加植物中AHL19/20多肽编码核酸序列的表达。

在一个实施方案中，实施本发明的方法产生在轻度胁迫条件下生长时相对于在相当条件下生长的对照植物具有增强的产率相关性状的植物。因此，根据本发明的一个实施方案，提供了增强在轻度胁迫条件下生长的植物的产率相关性状的方法，所述方法包括增加植物中GRP多肽编码核酸序列的表达。

实施本发明的方法产生在非生物胁迫条件下生长时相对于在相当条件下生长的对照植物具有增强的产率相关性状的植物。如Wang等(Planta(2003)218：1-14)所报道的那样，非生物胁迫引起一系列的形态学、生理学、生物化学和分子变化，对植物生长和生产力造成不利影响。已知干旱、盐度、极端温度和氧化胁迫相互联系，并可以通过相似的机制诱发生长和细胞损害。Rabbani等(Plant Physiol(2003)133：1755-1767)描述了干旱胁迫和高盐度胁迫之间存在着的一种特别高程度的“对话(cross-talk)”。例如，干旱和/或盐度主要表现为渗透胁迫，导致破坏细胞中的稳态和离子分布。氧化胁迫通常与高温或低温、盐度或干旱胁迫相伴，可以引起功能及结构蛋白质的变性。所以，这些多种多样的环境胁迫通常激活相似的细胞信号传递路径和细胞应答，如应激蛋白的产生、抗氧化剂的上调、相容溶质的累积以及生长阻抑。因为多种多样的环境胁迫激活相似的路径，因此本发明以干旱胁迫进行的举例说明不应当被看作局限于干旱胁迫，而是应该看作为一个筛选，其显示了如本文所定义的AHL19/20多肽可以参与在一般的非生物胁迫条件下增加产率相关性状(相对于在相当的胁迫条件生长的对照植物而言)。

因为多种多样的环境胁迫激活相似的路径，因此本发明以干旱胁迫和盐胁迫进行的举例不应当被看作局限于干旱胁迫或盐胁迫，而是应该看作是一个筛选，其显示了如本文所定义的GRP多肽可以参与在一般的非生物胁迫条件下增强产率相关性状(相对于在相当的胁迫条件生长的对照植物而言)。

如本文所定义的术语“非生物胁迫”应当理解为表示任何一个或多个下列胁迫：水胁迫(由干旱或过多的水引起的)、缺氧胁迫、盐胁迫、温度胁迫(由热、冷或冰冻温度引起的)、化学毒性胁迫和氧化胁迫。根据本发明的一个方面，非生物胁迫是渗透胁迫，其选自水胁迫、盐胁迫、氧化胁迫和离子胁迫。优选，水胁迫是干旱胁迫。术语盐胁迫不限于食用盐(NaCl)，而可以是由NaCl、KCl、LiCl、MgCl₂、CaCl₂等中的一种或多种引起的任何胁迫。

优选，非生物胁迫是干旱胁迫。备选地，非生物胁迫是盐胁迫。

在一个实施方案中，实施本发明的方法产生了在非生物胁迫条件下生长时相对于在相当的胁迫条件下生长的对照植物具有增强的种子产率相关性状的植物。因此，根据本发明，提供了增强在非生物胁迫条件下生长的植物的种子产率相关性状的方法，所述方法包括增加植物中AHL19/20多肽编码核酸序列的表达。根据本发明的一个方面，非生物胁迫是渗透胁迫，其选自一个或多个下列胁迫：水胁迫、盐胁迫、氧化胁迫和离子胁迫。

在一个实施方案中，实施本发明的方法产生了在非生物胁迫条件下生长时相对于在相当的胁迫条件下生长的对照植物具有增强的产率相关性状的植物。因此，根据本发明，提供了增强在非生物胁迫条件下生长的植物的产率相关性状的方法，所述方法包括增加植物中GRP多肽编码核酸序列的表达。根据本发明的一个方面，非生物胁迫是渗透胁迫，其选自一个或多个下列胁迫：水胁迫、盐胁迫、氧化胁迫和离子胁迫。优选，非生物胁迫是干旱胁迫。备选地或另外地，非生物胁迫是盐胁迫。

非生物环境胁迫的另一实例是植物为生长和发育需要同化吸收的一种或多种养分的可利用度减小。由于养分利用效率对植物产率和产品质量的强烈影响，有大量化肥倾倒在田间以优化植物生长和品质。植物生产力一般受限于三种主要养分：磷、钾和氮，而这三者中的氮通常是植物生长的限速元素。因此，植物生长所需的主要营养素是氮(N)。氮是见于活细胞中的众多重要化合物(包括氨基酸、蛋白质(酶)、核酸和叶绿素)的组成成分。1.5％-2％的植物干物质是氮，约合植物总蛋白质的16％。因而，氮可利用度是作物植物生长和产量的主要限制因素(Frink等人(1999)Proc NatlAcad Sci USA 96(4)：1175-1180)，而且对蛋白质累积和氨基酸组成也具有重大影响。因此，在限氮条件下生长时具有增强的种子产率相关性状的作物植物具有重大意义。

在一个实施方案中，实施本发明的方法产生了在养分可利用度下降的条件下，特别是在氮可利用度下降的条件下生长时，相对于在相当条件下生长的对照植物，具有增强的种子产率相关性状的植物。因此，根据本发明，提供了增强在养分可利用度下降，优选氮可利用度下降的条件下生长的植物的种子产率相关性状的方法，所述方法包括增加植物中AHL19/20多肽编码核酸序列的表达。养分可利用度下降可以因养分，诸如氮、磷及其他含磷化合物、钾、钙、镉、镁、锰、铁和硼等，缺乏或过量所致。优选，养分可利用度下降是氮可利用度的下降。

在一个实施方案中，实施本发明的方法产生了在养分可利用度下降的条件下，特别是在氮可利用度下降的条件下，生长时，相对于在相当条件下生长的对照植物，具有增强的产率相关性状的植物。因此，根据本发明，提供了增强在养分可利用度下降的条件下生长的植物的产率相关性状的方法，所述方法包括增加植物中GRP多肽编码核酸序列的表达。养分可利用度下降可包括养分，诸如氮、磷及其他含磷化合物、钾、钙、镉、镁、锰、铁和硼等，的可利用度下降。

实施本发明的方法产生了在非胁迫条件下生长时相对于对照植物具有增加的产率的植物。因此，根据本发明，提供了增加在非胁迫条件下生长的植物的产率的方法，所述方法包括增加地上植物部分中AAT样多肽编码核酸的表达。

本发明包括可由根据本发明的方法获得的植物或其部分(包括种子)或其细胞。所述植物或其部分或其细胞含有编码如上文所定义的产率增加性多肽的核酸转基因，所述产率增加性多肽选自：核定位AT-hook基序蛋白19/20(AHL19/20)、GRP(生长调节蛋白，其中所述GRP多肽是金属硫蛋白2a(MT2a)多肽)、丙氨酸氨基转移酶(AAT)样多肽和丙氨酸氨基转移酶(AAT)多肽。

本发明还提供遗传构建体和载体，以利于在植物中引入和/或增加表达编码产率增加性多肽的核酸序列，所述产率增加性多肽选自：核定位AT-hook基序蛋白19/20(AHL19/20)、GRP(生长调节蛋白，其中所述GRP多肽是金属硫蛋白2a(MT2a)多肽)、丙氨酸氨基转移酶(AAT)样多肽和丙氨酸氨基转移酶(AAT)多肽。可以将基因构建体插入适于转化进入植物并适于在转化的细胞中表达目的基因的载体中，该载体可以是可商购的载体。本发明还提供了如本文所定义的基因构建体在本发明方法中的用途。

更具体地，本发明提供这样的构建体，其含有：

(a)编码如上文所定义的产率增加性多肽的核酸序列，所述产率增加性多肽选自：核定位AT-hook基序蛋白19/20(AHL19/20)、GRP(生长调节蛋白，其中所述GRP多肽是金属硫蛋白2a(MT2a)多肽)、丙氨酸氨基转移酶(AAT)样多肽和丙氨酸氨基转移酶(AAT)多肽。

(b)一个或多个能够增加(a)中核酸序列表达的控制序列；和任选的

(c)转录终止序列。

在一个实施方案中，编码AHL19/20多肽的核酸序列如上文所定义。术语“控制序列”和“终止序列”如本文所定义。

优选，构建体的控制序列之一是从植物基因组分离的组成型启动子。植物组成型启动子的实例是GOS2启动子，优选稻GOS2启动子，更优选由SEQ ID NO：35所示的GOS2启动子。

在一个实施方案中，编码GRP多肽的核酸序列如上文所定义。术语“控制序列”和“终止序列”如本文所定义。

优选，编码AAT样多肽或AAT多肽的核酸如上文所定义。术语“控制序列”和“终止序列”如本文所定义。

可以使用含有任何上述核酸序列的载体转化植物。技术人员充分知晓载体中必须存在的遗传元件，以便成功进行转化、选择并繁殖含目的序列的宿主细胞。可以将目的序列有效连接于一个或多个控制序列(至少连接于启动子)。

有利地，可以使用任何类型的天然或合成启动子增加核酸序列的表达。组成型启动子，优选从植物基因组分离的组成型启动子，在所述方法中特别有用。植物组成型启动子驱动编码序列以在所有情况下均低于在35SCaMV病毒启动子控制下获得的水平的水平表达。

其他器官特异性启动子，例如用于在叶、茎、块茎、分生组织、种子(胚和/或胚乳)中优先表达的器官特异性启动子，在实施本发明的方法中是有用的。关于各种启动子类型的定义，敬请参见本文“定义”部分。

应当清楚本发明的可实施性并不受限于SEQ ID NO：1所示的AHL19/20多肽编码核酸序列，而且本发明的可实施性也不受限于由组成型启动子所驱动的AHL19/20多肽编码核酸序列的表达。

应当清楚本发明的可实施性并不受限于SEQ ID NO：45所示的GRP多肽编码核酸序列，而且本发明的可实施性也不受限于由组成型启动子所驱动的GRP多肽编码核酸序列的表达。

组成型启动子优选为GOS2启动子，优选来自稻的GOS2启动子。还优选GOS2启动子为基本上类似于SEQ ID NO：47的核酸序列，最优选GOS2启动子如SEQ ID NO：47所示。有关组成型启动子的更多实例，敬请参见本文“定义”部分表2。

应当清楚本发明的可实施性并不局限于SEQ ID NO：50所示的AAT样核酸，而且本发明的可实施性也不局限于由原叶绿素酸酯还原酶启动子所驱动的AAT样多肽编码核酸的表达。

有关各种启动子类型的定义，敬请参见“定义”部分。特别可用于本发明方法的是根特异性启动子，特别是根表皮特异性启动子。根特异性启动子优选是硝酸转运蛋白启动子，还优选来自稻(如由Lin，2000描述的OsNRT1启动子)。该启动子由SEQ ID NO：59显示。还可将与SEQ ID NO：59基本上相似的核酸序列用于本发明的方法。还可用于实施本发明方法的其他根特异性启动子的实例示于上述“定义”部分的表2b中。

应当清楚本发明的可实施性并不局限于SEQ ID NO：55所示的AAT核酸，而且本发明的可实施性也不局限于由稻硝酸转运蛋白启动子OsNRT1所驱动的AAT核酸的表达。

任选的，还可以在引入植物的构建体中使用一个或多个终止子序列。另外的调控元件可以包括转录和翻译增强子。本领域技术人员会知道适合用于进行本发明的终止子和增强子的序列。如“定义”部分所说明的那样，也可以向5’非翻译区(UTR)或在编码序列中加入内含子序列，来增加在胞质中累积的成熟信使的量。其他控制序列(除启动子、增强子、沉默子、内含子序列、3’UTR和/或5’UTR区域之外)可以是蛋白质和/或RNA稳定元件。这类序列为本领域技术人员公知或者可以容易地获得。

本发明的遗传构建体可以还包括对于在特定细胞类型中维持和/或复制所必需的复制起点序列。一个实例是需要将遗传构建体作为附加型遗传元件(如质粒或粘粒分子)在细菌细胞中维持的情况。优选的复制起点包括但不限于f1-ori和colE1。

为检测本发明方法中所用核酸序列的成功转移和/或选择含有这些核酸序列的转基因植物，有利的是使用标记基因(或报告基因)。因此，遗传构建体可以任选地含有选择标记基因。选择标记在本文“定义”部分有更详细的说明。

标记基因一旦不再需要，可以从转基因细胞中除去或切除之。进行标记去除的技术在本领域公知，有用的技术在上文“定义”部分有说明。

已知，取决于所用的表达载体和所用的转染技术，当核酸序列向植物细胞进行稳定或瞬时整合时，仅少数细胞能摄入外来DNA，并将其整合入基因组(如果期望的话)。为鉴定并选择这些整合体，通常将编码可选择标记(如上文所述的那些)的基因与目的基因一起引入宿主细胞中。这些标记能够例如在如下突变体中使用，在所述突变体中这些基因例如通过常规方法缺失而没有功能。此外，编码可选择标记的核酸序列分子可以与编码本发明多肽或用于本发明方法的序列在同一个载体中引入宿主细胞，或者在分开的载体中引入。已由所引入的核酸序列稳定转染的细胞可以例如通过选择(例如，整合有可选择标记的细胞存活而其他细胞死去)予以鉴定。标记基因一旦不再需要，可以从转基因细胞中除去或切除之。进行标记去除的技术在本领域公知，有用的技术在上文“定义”部分有说明。

在一个实施方案中，本发明还提供了产生相对于对照植物具有增强的种子产率相关性状的转基因植物的方法，包括在植物中引入和表达编码如前文所定义的AHL19/20多肽的任何核酸序列。

更具体地，本发明提供了产生相对于对照植物具有增加的种子产率相关性状的转基因植物的方法，所述方法包括：

(i)在植物、植物部分或植物细胞中引入和表达在植物组成型启动子控制下的AHL19/20多肽编码核酸序列；和

(ii)在促进植物生长和发育的条件下培养植物细胞、植物部分或植物。

(i)中的核酸序列可以是任何能够编码如本文所述的AHL19/20多肽的核酸序列。

在一个实施方案中，本发明还提供了产生在非生物胁迫条件下生长时相对于对照植物具有增强的产率相关性状的转基因植物的方法，包括在植物中引入和表达任何编码如前文所定义的GRP多肽的核酸序列。

更具体地，本发明提供了产生在非生物胁迫条件下生长时相对于对照植物具有增强的产率相关性状的转基因植物的方法，所述方法包括：

1.在植物、植物部分或植物细胞中引入和表达GRP多肽编码核酸序列；和

2.在促进植物生长和发育的条件下培养植物、植物部分或植物细胞。

(1)中的核酸序列可以是任何能够编码如本文所述的GRP多肽的核酸序列。

在一个实施方案中，本发明还提供了产生相对于对照植物具有增强的产率相关性状的转基因植物的方法，包括在地上植物部分中引入和表达任何编码如前文所定义的AAT样多肽的核酸。

更具体地，本发明提供了产生具有增强的产率相关性状的转基因植物的方法，所述方法包括：

(i)在地上植物部分或在植物细胞中引入和表达在于地上植物部分中具有活性的启动子的控制下的AAT样核酸；和

(ii)在促进植物生长和发育的条件下培养植物细胞。

(i)中的核酸可以是任何如本文所述的ATT样核酸。

更具体地，本发明提供了产生具有增强的产率相关性状，特别是增加的(种子)产率的转基因植物的方法，所述方法包括：

(i)在植物或植物细胞中引入和表达AAT核酸；和

(ii)在非限氮条件下培养植物细胞。

(i)中的核酸可以是任何能够编码本文所定义的AAT多肽的核酸。

可以将核酸序列直接引入植物细胞或植物本身(包括引入组织、器官或植物的任何其它部分)。根据本发明优选的方面，优选通过转化将核酸序列引入植物。术语“转化”在本文“定义”部分有更详细的说明。

遗传修饰的植物细胞可以通过技术人员熟悉的所有方法再生。合适的方法可见于上述S.D.Kung和R.Wu、Potrykus或者

和Willmitzer的出版物。

通常在转化以后，选出存在一个或多个标记的植物细胞或细胞群，所述标记由与目的基因共转移的植物可表达基因编码，继之将转化的材料再生成整个植物。为选择转化的植物，通常将在转化过程中获得的植物材料置于选择性条件下，从而可将转化的植物与非转化植物区分开来。例如，可以种植以上述方式获得的种子，并在最初的生长期之后，通过喷雾对其进行合适的选择。另一可能方案是将种子，酌情在消毒之后，种在使用合适的选择剂的琼脂板上，从而仅转化的种子能够长成植物。可选地，针对转化的植物筛选选择标记如上文所述标记的存在。

DNA转移和再生之后，还可评价推定转化的植物，例如用Southern分析(DNA印迹)，评价目的基因的存在、拷贝数和/或基因组构造。可选的或额外地，可用Northern和/或Western分析(蛋白质印迹)监测新引入的DNA的表达水平，这两种技术都是本领域普通技术人员所熟知的。

产生的转化植物可以通过多种方式繁殖，如通过克隆繁殖或经典的育种技术。例如，第一代(或T1)转化的植物可自交，选择纯合的第二代(或T2)转化体，然后T2植物可进一步通过经典育种技术繁殖。产生的转化生物体可以有多种形式。例如，它们可以是转化细胞和非转化细胞的嵌合体；克隆转化体(例如所有细胞经转化含有表达盒)；转化和非转化组织的嫁接体(例如在植物中，转化的砧木嫁接到非转化的接穗上)。

本发明显然延及由本文所述方法产生的任何植物细胞或植物，以及所有的植物部分及繁殖体。本发明还延及由任何上述方法产生的原代转化或转染的细胞、组织、器官或整个植物的后代，唯一的要求是所述后代呈现出与在本发明方法中产生的亲本相同的基因型和/或表型特征。

在一个实施方案中，本发明也包括含有与植物组成型启动子有效连接的、编码上文所定义的AHL19/20多肽的分离核酸序列的宿主细胞。

在一个实施方案中，本发明也包括含有编码上文所定义的GRP多肽的分离核酸序列的宿主细胞。

在一个实施方案中，本发明也包括含有编码上文所定义的AAT样多肽或AAT多肽的分离核酸的宿主细胞。

根据本发明优选的宿主细胞是植物细胞。对于用于本发明方法的核酸或载体、表达盒或构建体或载体，其宿主植物原则上有利地为能够合成在本发明方法中使用的多肽的所有植物。

本发明的方法有利地适用于任何植物。尤其可用于本发明方法的植物包括属于植物界超家族的所有植物，尤其是单子叶植物和双子叶植物，包括饲料或豆科牧草、观赏植物、粮食作物、乔木或灌木。根据本发明优选的实施方案，植物为作物植物。作物植物的实例包括大豆、向日葵、芸苔(canola)、苜蓿、油菜籽、棉花、番茄、马铃薯和烟草。还优选植物是单子叶植物。单子叶植物的实例包括甘蔗。更优选植物是谷类。谷类的实例包括稻、玉米、小麦、大麦、粟、黑麦、黑小麦、高粱和燕麦。

本发明也延及含有与植物组成型启动子有效连接的编码AHL19/20(如上文所定义的)的分离核酸序列的植物的可收获部分，例如但不限于：种子、叶、果实、花、茎、根茎、块茎和球茎。本发明还涉及由这样的植物的可收获部分衍生的、优选直接衍生的产品，如干丸(pellet)或干粉、油类、脂肪和脂肪酸、淀粉或蛋白质。

增加核酸序列或基因或基因产物表达的方法在本领域有充分的记录，并且实例在“定义”部分提供。

如上文所述，增加AHL19/20多肽编码核酸序列表达的优选方法是在植物中引入和表达AHL19/20多肽编码核酸序列；然而，实施所述方法的效果，即增强种子产率相关性状，也可以利用其他众所周知的技术实现，包括但不限于：T-DNA激活标签、TILLING、同源重组。这些技术的说明在“定义”部分提供。

如上文所述，增加GRP多肽编码核酸序列表达的优选方法是在植物中引入和表达GRP多肽编码核酸序列；然而，实施所述方法的效果，即增强在非生物胁迫条件下生长的植物的产率相关性状，也可以利用其他众所周知的技术实现，包括但不限于：T-DNA激活标签、TILLING、同源重组现。这些技术的说明在“定义”部分提供。

如上文所述，调节(优选，增加)AAT样多肽或AAT多肽编码核酸的表达的优选方法是在植物中引入和表达编码AAT样多肽或AAT多肽的核酸；然而，实施所述方法的效果，即增强产率相关性状，也可以利用其他众所周知的技术实现，包括但不限于：T-DNA激活标签、TILLING、同源重组现。这些技术的说明在“定义”部分提供。

本发明还包括编码如本文所述的AHL19/20多肽的核酸序列的用途以及这些AHL19/20多肽的用途，用于在正常生长条件下和养分可利用度下降的条件下，优选氮可利用度下降的条件下，增强植物的任何上述种子产率相关性状。

本发明还包括编码如本文所述的GRP多肽的核酸序列的用途以及这些GRP多肽的用途，用于增强在非生物胁迫条件下生长的植物的任何上述产率相关性状。

本发明还包括编码如本文所述的AAT样多肽或AAT多肽的核酸的用途以及这些AAT样多肽或AAT多肽的用途，用于增强植物的任何上述产率相关性状。

可以在育种程序中使用编码本文所述产率增加性多肽的核酸或所述产率增加性多肽本身，其中鉴定可能与产率增加性多肽编码基因遗传连锁的DNA标记。可以使用所述核酸/基因或所述AAT样多肽本身定义分子标记。接着可以将此DNA或蛋白质标记在育种程序中使用，以在本发明的方法中选择具有如上文所定义的增强的产率相关性状的植物。

产率增加性多肽编码核酸/基因的等位基因变体也可以用于标记辅助的育种程序。这类育种程序有时需要使用例如EMS诱变，通过植物诱变处理引入等位基因变异；可选的，此类程序可以以一组无意产生的所谓“天然”起源的等位基因变体开始。然后通过例如PCR进行等位基因变体的鉴定。随后是选择步骤，用以选择所讨论序列的、提供增加的产率的、优良等位基因变体。一般通过监测含有所讨论序列的不同等位基因变体的植物的生长行为来进行选择。可以在温室或田地中监测生长行为。其它任选的步骤包括将经鉴定含有优良等位基因变体的植物与另一植物杂交。例如，可使用这种方法产生感兴趣表型特征的组合。

产率增加性多肽编码核酸还可以作为探针，用于对包含其的基因进行遗传和物理作图以及用作与那些基因连锁的性状的标志物。这样的信息可以在植物育种中使用，以培育具有所期望表型的株系。产率增加性多肽编码核酸的这类应用仅需要长度至少15个核苷酸的核酸序列。产率增加性多肽编码核酸可以用作限制性片段长度多态性(RFLP)标记。可用AAT样核酸探测限制酶切消化的植物基因组DNA的Southern印迹(Sambrook J，Fritsch EF和Maniatis T(1989)《分子克隆：实验室手册》)。随后使用计算机程序如MapMaker(Lander等(1987)Genomics 1：174-181)对产生的带型进行遗传分析，以构建遗传图谱。另外，可以使用核酸探测含有一组个体的限制性内切酶处理的基因组DNA的Southern印迹，所述一组个体为一个确定的遗传杂交的亲本和子代。记录DNA多态性的分离，并用于计算产率增加性多肽编码核酸在先前用此群体获得的遗传图谱中的位置(Botstein等(1980)Am.J.Hum.Genet.32：314-331)。

用于遗传作图的植物基因衍生探针的产生和应用描述于Bematzky和Tanksley(1986)Plant Mol.Biol.Reporter 4：37-41中。众多出版物中描述过用上述方法或其变通形式对特定cDNA克隆的遗传作图。例如，可以使用F2杂交群体、回交群体、随机交配群体、近等基因系和其它个体组作图。这类方法是本领域技术人员众所周知的。

核酸序列探针也可以用来进行物理作图(即在物理图谱上安置序列；参见Hoheisel等In：Non-mammalian Genomic Analysis：A Practical Guide，Academic press 1996，第319-346页，及其中引用的参考文献)。

在另一个实施方案中，核酸序列探针可用于进行直接荧光原位杂交(FISH)作图(Trask(1991)Trends Genet.7：149-154)。尽管目前FISH作图的方法倾向使用大的克隆(几个kb到几百个kb；参见Laan等(1995)GenomeRes.5：13-20)，但是灵敏性的提高可以允许在FISH作图中应用较短的探针。

用于遗传和物理作图的多种基于核酸序列扩增的方法可以使用所述核酸序列进行。实例包括等位基因特异性扩增(Kazazian(1989)J.Lab.Clin.Med 11：95-96)、PCR扩增片段的多态性(CAPS；Sheffield等(1993)Genomics 16：325-332)、等位基因特异性连接(Landegren等(1988)Science241：1077-1080)、核苷酸延伸反应(Sokolov(1990)Nucleic Acid Res.18：3671)、放射杂交作图(Walter等(1997)Nat.Genet.7：22-28)和Happy作图(Dear和Cook(1989)Nucleic Acid Res.17：6795-6807)。为实施这些方法，使用核酸序列设计和产生用于扩增反应或引物延伸反应的引物对。这类引物的设计是本领域技术人员众所周知的。采用基于PCR的遗传作图的方法中，可能需要鉴定用于作图杂交的亲本之间在相应于本发明核酸序列的区域中的DNA序列差异。但是，通常这对作图方法不是必要的。

根据本发明的方法得到如前文所述具有增加的种子产率相关性状的植物。这些性状还可以组合其它经济上有利的性状，如其它产率增加性状、对其他非生物和生物胁迫的耐受性、改变多种构造特征和/或生物化学和/或生理学特征的性状。

根据本发明的方法得到如前文所述在非生物胁迫条件下生长时具有增强的产率相关性状的植物。这些性状还可以组合其它经济上有利的性状，如其它产率增强性状、对其他非生物和生物胁迫的耐受性、改变多种构造特征和/或生物化学和/或生理学特征的性状。

在一个实施方案中，本发明涉及概述如下的主题：

第1项：相对于对照植物增强植物的种子产率相关性状的方法，包括增加植物中编码核定位AT-hook基序蛋白19/20(AHL19/20)多肽的核酸序列的表达，该AHL19/20多肽包含与SEQ ID NO：36所示保守结构域(CD)具有至少70％、75％、80％、85％、90％、95％、98％、99％或更大氨基酸序列同一性的结构域，以及任选地选择具有增强的种子产率相关性状的植物。

第2项：根据第1项的方法，其中所述AHL19/20多肽包含：i)与SEQ IDNO：37所示AT-hook基序具有至少75％、80％、85％、90％、95％、98％、99％或更大的氨基酸序列同一性的基序；和(ii)与SEQ ID NO：38所示植物及原核生物保守(PPC)结构域具有至少55％、60％、65％、70％、75％、80％、85％、90％、95％、98％、99％或更大的氨基酸序列同一性的结构域。

第3项：根据第1或2项的方法，其中所述AHL19/20多肽包含：(i)核定位信号；(ii)具有InterPro登录号IPR014476的AT-hook DNA结合基序；和(iii)具有InterPro登录号IPR005175的植物及原核生物保守(PPC)结构域。

第4项：根据任何前述项的方法，其中所述AHL19/20多肽，当用于构建AHL系统发生树，例如图1或图2中描述的系统发生树时，与包含SEQ IDNO：2所示多肽序列的AHL19/20多肽群而非任何其他AHL群聚类。

第5项：根据任何前述项的方法，其中所述AHL19/20多肽按照递增的优选顺序与SEQ ID NO：2所示的AHL19/20多肽、或本文表A中所示的任何多肽序列具有至少50％、55％、60％、65％、70％、75％、80％、85％、90％、95％、98％、99％或更高的氨基酸序列同一性。

第6项：根据任何前述项的方法，其中所述编码AHL19/20多肽的核酸序列为表A中所示的任一SEQ ID NO核酸序列或其部分、或能够与表A中所示的任一SEQ ID NO核酸序列杂交的序列。

第7项：根据任何前述项的方法，其中所述核酸序列编码表A中所示的任何SEQ ID NO多肽序列的直系同源物或旁系同源物。

第8项：根据任何前述项的方法，其中所述增加的表达通过任何一个或多个下列技术实现：T-DNA激活标签、TILLING、或同源重组。

第9项：根据任何前述项的方法，其中所述增加的表达通过在植物中引入和表达编码AHL19/20多肽的核酸序列来实现。

第10项：根据任何前述项的方法，其中所述增强的种子产率相关性状是一个或多个下列性状：(i)增加的每圆锥花序的花数；(ii)增加的每植物的种子总重量；(iii)增加的饱满种子数；或(iv)增加的收获指数。

第11项：根据任何前述项的方法，其中相对于对照植物，所述增强的种子产率相关性状发生在于养分可利用度下降的条件下，优选在氮可利用度下降的条件下生长的植物中。

第12项：根据第11项的方法，其中所述增强的种子产率相关性状是一个或多个下列性状：(i)增加的每植物的种子总产率；(ii)增加的饱满种子数；或(iii)增加的收获指数。

第13项：根据任何前述项的方法，其中所述核酸序列与组成型启动子，优选与植物组成型启动子，更优选与GOS2启动子，最优选与SEQ ID NO：35所示的稻GOS2启动子有效连接。

第14项：根据任何前述项的方法，其中所述编码AHL19/20多肽的核酸序列是植物来源的，优选来自双子叶植物，还优选来自十字花科，最优选来自拟南芥。

第15项：可通过任何前述项的方法获得的植物、其部分(包括种子)或植物细胞，其中所述植物、其部分或细胞包含与植物组成型启动子有效连接的编码AHL19/20多肽的分离核酸转基因。

第16项：构建体，包含：

(a)编码第1至5项的任一项中所定义的AHL19/20多肽的核酸序列；

(b)一个或多个能够驱动(a)中的核酸序列表达的控制序列；和任选地

(c)转录终止序列。

第17项：根据第16项的构建体，其中所述控制序列是植物组成型启动子，优选GOS2启动子，更优选SEQ ID NO：35所示的GOS2启动子。

第18项：根据第16或17项的构建体在产生相对于对照植物具有增强的种子产率相关性状的植物的方法中的用途，所述增强的种子产率相关性状是一个或多个下列性状：(i)增加的每圆锥花序的花数；(ii)增加的每植物的种子总重量；(iii)增加的饱满种子数；或(iv)增加的收获指数。

第19项：用根据第16或17项的构建体转化的植物、植物部分或植物细胞。

第20项：产生相对于对照植物具有增强的种子产率相关性状的转基因植物的方法，包括：

(i)在植物、植物部分或植物细胞中引入和表达处于植物组成型启动子控制之下的编码第1至6之任一项中定义的AHL19/20多肽的核酸序列；和

(ii)在促进植物生长和发育的条件下培养所述植物细胞、植物部分或植物。

第21项：由于与植物组成型启动子有效连接的编码第1至5项之任一项中定义的AHL19/20多肽的核酸序列的表达增加而相对于对照植物具有增强的种子产率相关性状的转基因植物、或源自所述转基因植物的转基因植物细胞或转基因植物部分。

第22项：根据第15、19或21项的转基因植物或源自所述转基因植物的转基因植物细胞，其中所述植物是作物植物或单子叶植物或谷类，例如稻、玉米、小麦、大麦、粟、黑麦、黑小麦、高粱和燕麦。

第23项：根据第22项的植物的包含AHL19/20多肽编码核酸序列的可收获部分，其中所述可收获部分优选是种子。

第24项：来源于根据第22项的植物和/或来源于根据第23项的植物的可收获部分的产品。

第25项：编码第1至6之任一项中所定义的AHL19/20多肽的核酸序列在增强种子产率相关性状中的用途，所述增强的种子产率相关性状包括一个或多个下列性状：i)增加的每圆锥花序的花数；(ii)增加的每植物的种子总重量；(iii)增加的饱满种子数；或(iv)增加的收获指数。

第26项：根据第25项的用途，其中所述增强的种子产率相关性状在养分可利用度下降的条件下，优选在氮可利用度下降的条件下发生。

在一个实施方案中，本发明涉及概述如下的主题：

第27项：相对于对照植物增强在非生物胁迫条件下生长的植物的产率相关性状的方法，包括增加植物中编码GRP多肽的核酸序列的表达，其中所述GRP多肽是SEQ ID NO：46所示的金属硫蛋白2a(MT2a)多肽或其直系同源物、旁系同源物或同源物，以及任选地选择在非生物胁迫条件下生长时具有增强的产率相关性状的植物。

第28项：根据第27项的方法，其中所述SEQ ID NO：46所示的GRP多肽和其直系同源物、旁系同源物或同源物具有InterPro登录号IPR000347，被描述为植物金属硫蛋白家族15。

第29项：根据第27或28项的方法，其中所述GRP多肽按照递增的优选顺序与SEQ ID NO：46所示的GRP多肽具有至少50％、55％、60％、65％、70％、75％、80％、85％、90％、95％、98％、99％或更高的氨基酸序列同一性。

第30项：根据前述第27至29之任一项的方法，其中所述编码GRP多肽的核酸序列为SEQ ID NO：45的核酸序列或其部分、或能够与SEQ ID NO：45的核酸序列或其部分杂交的序列。

第31项：根据前述第27至30之任一项的方法，其中所述增加的表达通在植物中引入和表达编码所述GRP多肽的核酸序列来实现。

第32项：根据前述第27至31之任一项的方法，其中所述非生物胁迫是选自一个或多个下列胁迫的渗透胁迫：水胁迫、盐胁迫、氧化胁迫和离子胁迫。

第33项：根据第32项的方法，其中所述水胁迫是干旱胁迫。

第34项：根据第32项的方法，其中所述离子胁迫是盐胁迫。

第35项：根据前述第27至34之任一项的方法，其中所述增强的产率相关性状是一个或多个下列性状：相对于对照植物，增加的地上生物量、增加的每植物的种子总产率、增加的饱满种子数、增加的饱满种子总数、增加的一级圆锥花序数和增加的种子饱满率。

第36项：根据前述第27至35之任一项的方法，其中所述核酸序列与组成型启动子，优选与GOS2启动子，最优选与稻GOS2启动子有效连接。

第37项：根据前述第27至36之任一项的方法，其中所述编码GRP多肽的核酸序列是植物来源的，优选来自双子叶植物，还优选来自十字花科，最优选来自拟南芥。

第38项：GRP多肽编码核酸序列在增强在非生物胁迫条件下生长的植物的产率相关性状中的用途。

第39项：根据第38项的编码GRP多肽的核酸序列的用途，其中所述增强的产率相关性状选自一个或多个下列性状：与对照植物相比，增加的地上生物量、增加的每植物的种子总产率、增加的饱满种子数、增加的饱满种子总数、增加的一级圆锥花序数和增加的种子饱满率。

第40项：根据第39项的编码GRP多肽的核酸序列的用途，其中所述非生物胁迫是选自一个或多个下列胁迫的渗透胁迫：水胁迫、盐胁迫、氧化胁迫和离子胁迫。

第41项：根据第40项的编码GRP多肽的核酸序列的用途，所述水胁迫是干旱胁迫。

第42项：根据第40项的编码GRP多肽的核酸序列的用途，所述离子胁迫是盐胁迫。

在一个实施方案中，本发明涉及概述如下的主题：

第43项：相对于对照植物增强植物的产率相关性状的方法，包括调节地上植物部分中编码丙氨酸氨基转移酶(AAT)样多肽的核酸的表达。

第44项：根据第43项的方法，其中所述AAT样多肽包括一个或多个下列特征：

(i)催化下列反应的能力：

(ii)属于酶分类编号：EC 2.6.1.2.

(iii)具有氨基转移酶结构域(在InterPro中称为IPR004839；以及在PFAM中称为PF00155)

(iv)具有1-氨基环丙烷-1-羧酸合酶结构域(在InterPro中称为IPR001176)

(v)靶向线粒体

(vi)当用于构建包含AAT序列的系统发生树时，与包含SEQ ID NO：51的AAT样多肽群而非任何其他AAT或AAT样序列群聚类。

第45项：根据第43或44项的方法，其中所述调节表达通过在植物中引入和表达处于在地上植物部分中具有活性的启动子控制之下的AAT样多肽编码核酸来实现。

第46项：根据前述第43至45之任一项的方法，其中所述AAT样多肽编码核酸能够与SEQ ID NO：50所示的核酸杂交。

第47项：根据前述第43至46之任一项的方法，其中所述核酸序列编码SEQ ID NO：51所示蛋白质的直系同源物或旁系同源物。

第48项：根据前述第43至47之任一项的方法，其中所述增强的产率相关性状包括与对照植物相比，增加的产率，优选增加的种子产率。

第49项：根据前述第43至48之任一项的方法，其中在非胁迫条件下获得所述增强的产率相关性状。

第50项：根据第45至49之任一项的方法，其中所述在地上部分中具有活性的启动子是枝条特异性和/或叶特异性启动子。

第51项：根据第43至50之任一项的方法，其中所述AAT样多肽编码核酸是藻类来源的，优选来自衣藻属，还优选来自物种雷氏衣藻。

第52项：可通过前述第43至51之任一项的方法获得的植物或其部分，包括种子，其中所述植物或其部分包含编码AAT样多肽的重组核酸。

第53项：构建体，包含：

(a)编码第44、46或47项之任一中定义的AAT样多肽的核酸；

(b)能够驱动(a)中的核酸序列在地上部分中表达的启动子序列；和任选地

(c)转录终止序列。

第54项：根据第53项的构建体在用于产生相对于对照植物具有增加的产率，特别地增加的种子产率的植物的方法中的用途。

第55项：用根据第53项的购建体转化的植物、植物部分或植物细胞。.

第56项：产生与对照植物相比具有增加的产率，特别地增加的种子产率的转基因植物的方法，包括：

(i)在植物中引入和表达编码第44、46或47之任一项中所定义的AAT样多肽的核酸，该核酸处于在地上部分中具有活性的启动子的控制之下；和

(ii)在促进植物生长和发育的条件下培养所述植物细胞。

第57项：由于编码第44、46或47之任一项中定义的AAT样多肽的核酸的表达增加而与对照植物相比具有增加的产率，特别是增加的种子产率的转基因植物、或源自所述转基因植物的转基因植物细胞，其中所述核酸处于在地上部分中具有活性的启动子的控制之下。

第58项：根据第52、55或57项的转基因植物或源自其的转基因植物细胞，其中所述植物是作物植物或单子叶植物或谷类，例如稻、玉米、小麦、大麦、粟、黑麦、黑小麦(triticale)、高粱和燕麦。

第59项：根据第58项的植物的可收获部分，其中所述可收获部分是种子。

第60项：来源于根据第58项的植物和/或来源于根据第59项的植物的可收获部分的产品。

第61项：AAT样多肽编码核酸用于相对于对照植物增加植物的产率，特别是增加种子产率的用途，其中该核酸处于在地上部分中具有活性的启动子的控制之下。

在一个实施方案中，本发明涉及概述如下的主题：

第62项：相对于对照植物增强植物的产率相关性状的方法，包括调节植物中编码丙氨酸氨基转移酶(AAT)的核酸的表达，该植物在氮可利用度未限制的条件下生长。

第63项：根据第62项的方法，其中所述AAT样多肽包含一个或多个下列特征：

(i)催化下列反应的能力：

(ii)属于酶分类编号：EC 2.6.1.2.

(v)当用于构建包含AAT序列的系统发生树时，与包含SEQ ID NO：56的AAT样多肽群而非任何其他AAT或AAT样序列群聚类。

第64项：根据第62或63项的方法，其中所述调节表达通过在植物中引入和表达编码AAT样多肽的核酸来实现。

第65项：根据前述第62至64之任一项的方法，其中所述AAT样多肽编码核酸能够与SEQ ID NO：55所示的核酸杂交。

第66项：根据前述第62至65之任一项的方法，其中所述核酸序列编码SEQ ID NO：56所示蛋白质的直系同源物或旁系同源物。

第67项：根据前述第62至66之任一项的方法，其中所述增强的产率相关性状包括与对照植物相比，增加的产率，优选增加的生物量和/或增加的种子产率。

第68项：根据第64至67之任一项的方法，其中所述核酸与组织特异性启动子，优选根特异性启动子，最优选根-表皮-特异性启动子有效连接。

第69项：根据第68项的方法，其中所述根-表皮-特异性启动子是硝酸转运蛋白启动子，优选来自稻。

第70项：根据前述第62至69之任一项的方法，其中所述AAT编码核酸是植物来源的，优选来自单子叶植物，优选来自禾本科，更优选来自稻属，最优选来自稻。

第71项：可通过根据前述第62至70之任一项的方法获得的植物或其部分，包括种子，其中所述植物或其部分包含编码AAT的重组核酸。

第72项：构建体，包括：

(a)编码第63项中所定义的AAT的核酸；

(b)硝酸转运蛋白启动子，优选来自稻；和任选地

(c)转录终止序列。

第73项：根据第72项的构建体的用途，其用于产生相对于对照植物在非限氮条件下具有增加的产率，特别是增加的生物量和/或增加的种子产率，的植物的方法。

第74项：用根据第71项的构建体转化的植物、植物部分或植物细胞。

第75项：产生与对照植物相比在非限氮条件下具有增加的产率，特别地增加的生物量和/或增加的种子产率的转基因植物的方法，包括：

(i)在植物中引入和表达编码第63项中所定义的AAT的核酸；和

(ii)在促进植物生长和发育的条件下培养所述植物细胞。

第76项：由于编码第63项中所定义的AAT的核酸的表达增加而与对照植物相比在非限氮条件下具有增加的产率，特别地增加的生物量和/或增加的种子产率，的转基因植物、或源自所述转基因植物的转基因植物细胞。

第77项：根据第71、74或76项的转基因植物或源自其的转基因植物细胞，其中所述植物是作物植物或单子叶植物或谷类，例如稻、玉米、小麦、大麦、粟、黑麦、黑小麦、高粱和燕麦。

第78项：根据第77项的植物的可收获部分，其中所述可收获部分优选是枝条生物量和/或种子。

第79项：来源于根据第77项的植物和/或来源于根据第78项的植物的可收获部分的产品。

第80项：AAT编码核酸用于相对于对照植物增加在非限氮条件下植物的产率，特别地增加种子产率和/或枝条生物量，的用途。

附图说明

现参考以下附图描述本发明，其中：

图1显示在使用渐进式比对Clustal算法(1.83)，利用默认值对属于AHL家族的所有多肽(描述于Fujimoto等，(2004)Plant Molec Biol，56：225-239)进行比对后构建的邻接树(neighbour-joining tree)。包含两个拟南芥旁系同源物，即AHL19(SEQ ID NO：2或AT3G04570)和AHL20(SEQ ID NO：4或AT4G14465)，的目的群已被圈出。

图2显示在使用渐进式比对Clustal算法(1.83)，利用默认值对属于AHL家族的所有多肽(描述在Fujimoto等，(2004)Plant Molec Biol，56：225-239中)以及本文实施例1表A的所有AHL19/20直系同源物和旁系同源物进行比对后构建的邻接树。

图3以卡通形式显示SEQ ID NO：2所示的AHL19/20多肽，其包含下列特征：预测的NLS、AT-hook DNA结合基序(其核心是三肽GRP；包含于InterPro登录号IPR014476(预测的AT-hook DNA-结合)中)、PPC结构域(植物及原核生物保守结构域；包含于InterPro登录号IPR005175(未知功能蛋白质DUF296)中)、和包含AT-hook DNA结合基序和PPC结构域的保守结构域(CD)。

图4显示表A的AHL19/20多肽的保守结构域(如对于SEQ ID NO：2由SEQ ID NO：38显示)的CLUSTAL W(1；83)多重序列比对，其中鉴定了多个特征。从多肽的N端至C端，它们是：(i)预测的核定位信号(NLS)；(ii)AT-hook DNA结合基序，具有核心三肽GRP；和(iii)PPC结构域(DUF296)。

图5显示双元载体(binary vector)，其用于稻中于稻GOS2启动子(pGOS2)控制之下的AHL19/20多肽编码核酸序列的增加表达。

图6详述了可用于实施本发明方法的序列的实例。

图7显示双元载体，其用于稻中处于稻GOS2启动子控制之下的GRP编码核酸序列(其中所述GRP多肽是金属硫蛋白2a(MT2a)多肽)(pGOS2::GRP)的增加表达。

图8详述了可用于实施本发明方法的序列的实例。

图9显示了双元载体，其用于稻中处于稻的原叶绿素酸酯启动子控制之下的AAT样核酸的增加表达。

图10详述了可用于实施本发明方法的序列的实例。

图11显示双元载体，其用于稻中处于稻OsNRT1启动子控制之下的AAT核酸的增加表达。

图12详述了可用于实施本发明方法的序列的实例。

实施例

现参考以下实施例描述本发明，所述实施例仅意在举例说明。如下实施例并非旨在完全界定或以其他方式限制本发明的范围。

DNA操作除非另外说明，重组DNA技术根据描述于(Sambrook(2001)《分子克隆：实验室手册》，第三版，冷泉港实验室出版，冷泉港，纽约)或者Ausubel等(1994)，Current Protocols in Molecular Biology，CurrentProtocols第一卷和第二卷的标准方法进行。植物分子操作的标准材料和方法由R.D.D.Croy描述于Plant Molecular Biology Labfase(1993)，由BIOSScientific Publications Ltd(UK)和Blackwell Scientific Publications(UK)出版。

实施例1：与本发明方法所用核酸序列相关的序列的鉴定

利用数据库序列搜索工具，如基本局部比对工具(BLAST)(Altschul等(1990)J.Mol.Biol.215：403-410；和Altschul等(1997)Nucleic Acids Res.25：3389-3402)，在美国国家生物技术信息中心(NCBI)Entrez核苷酸数据库维护的序列中，鉴定了与本发明方法所用的核酸序列相关的序列(全长cDNA、EST或基因组序列)。BLAST程序通过将核酸序列或多肽序列与序列数据库进行比较，以及通过计算匹配的统计学显著性，用于寻找序列之间具有局部相似性的区域。例如，对本发明核酸序列所编码的多肽运用了TBLASTN算法，使用默认设置，开启过滤器以滤过低复杂度序列。分析的输出视窗为两两比较，并根据概率分值(E值)排序，其中分值反映特定比对偶然发生的概率(E值越低，命中事件的显著性越高)。除了E值之外，还对比较进行了同一性百分比记分。同一性百分比是指两比较核酸(或多肽)序列之间在特定长度上的相同核苷酸(或氨基酸)数。在有些情况下，可以调整默认参数以更改搜索的严格度。例如，可以增加E值以显示严格度较低的匹配。以此方式，可鉴定短的几乎精确的匹配。

表A提供了与本发明方法所用的核酸序列相关的核酸序列的列表。

表A：AHL19/20多肽的实例

名称	来源生物	核酸SEQID NO：	多肽SEQID NO：	数据库登录号	状态
名称	来源生物	核酸SEQID NO：	多肽SEQID NO：	数据库登录号	状态	Arath_AHL19	拟南芥(Arabidopsis thaliana)	1	2	AT3G04570NP_566232	全长(FL)
Arath_AHL20	拟南芥	3	4	AT4G14465NP_567432	FL	Arath_AHL19	拟南芥(Arabidopsis thaliana)	1	2	AT3G04570NP_566232	全长(FL)
Arath_AHL20	拟南芥	3	4	AT4G14465NP_567432	FL	Aqufo_AHL19/20	Aquilegia formosa xAquilegia pubescens	5	6	DT758489，DT758488.1的重叠群	FL
Brana_AHL19/20	欧洲油菜(Brassica napus)	7	8	CS226287	FL	Aqufo_AHL19/20	Aquilegia formosa xAquilegia pubescens	5	6	DT758489，DT758488.1的重叠群	FL
Brana_AHL19/20	欧洲油菜(Brassica napus)	7	8	CS226287	FL	Brara_AHL19/20	甘蓝型油菜(Brassica napus)	9	10	AC189468	FL
Glyma_AHL19/20	大豆(Glycine max)	11	12	CS137412	FL	Brara_AHL19/20	甘蓝型油菜(Brassica napus)	9	10	AC189468	FL
Glyma_AHL19/20	大豆(Glycine max)	11	12	CS137412	FL	Goshi_AHL19/20	陆地棉(Gossypium hirsutum)	13	14	DW519458	FL

名称	来源生物	核酸SEQID NO：	多肽SEQID NO：	数据库登录号	状态
名称	来源生物	核酸SEQID NO：	多肽SEQID NO：	数据库登录号	状态	Lacsa_AHL19/20	莴苣(Lactuca sativa)	15	16	DW047323	FL
Lotja_AHL19/20	日本百脉根(Lotus japonicus)	17	18	AP004971	FL	Lacsa_AHL19/20	莴苣(Lactuca sativa)	15	16	DW047323	FL
Lotja_AHL19/20	日本百脉根(Lotus japonicus)	17	18	AP004971	FL	Orysa_AHL19/20	稻(Oryza sativa)	19	20	AK110263Os08g0563200	FL
Orysa_AHL19/20II	稻	21	22	CT837915Os02g0820800	FL	Orysa_AHL19/20	稻(Oryza sativa)	19	20	AK110263Os08g0563200	FL
Orysa_AHL19/20II	稻	21	22	CT837915Os02g0820800	FL	名称	来源生物	核酸SEQID NO：	多肽SEQID NO：	数据库登录号	状态
Poptr_AHL19/20	似欧洲山杨(Populus tremuloides)	23	24	scaff_XIII.441	FL	名称	来源生物	核酸SEQID NO：	多肽SEQID NO：	数据库登录号	状态
Poptr_AHL19/20	似欧洲山杨(Populus tremuloides)	23	24	scaff_XIII.441	FL	Soltu_AHL19/20	马铃薯(Solanum tuberosum)	25	26	CN215397.1CK276075.1的重叠群	FL

名称	来源生物	核酸SEQID NO：	多肽SEQID NO：	数据库登录号	状态
名称	来源生物	核酸SEQID NO：	多肽SEQID NO：	数据库登录号	状态	Thlca_AHL19/20	天蓝遏蓝菜(Thlaspi caerulescens)	27	28	DQ022564	FL
Vitvi_AHL19/20	葡萄(Vitis vinifera)	29	30	AM463589	FL	Thlca_AHL19/20	天蓝遏蓝菜(Thlaspi caerulescens)	27	28	DQ022564	FL
Vitvi_AHL19/20	葡萄(Vitis vinifera)	29	30	AM463589	FL	Vitvi_AHL19/20II	葡萄	31	32	AM429692	FL
Zeama_AHL19/20	玉蜀黍(Zea mays)	33	34	AC190270	FL	Vitvi_AHL19/20II	葡萄	31	32	AM429692	FL

在一些情况下，相关序列已经由研究机构如基因组研究所(Institute forGenomic Research，TIGR)实验性地进行了装配并向公众公开。可以利用真核基因直系同源物(Eukaryotic Gene Orthologs，EGO)数据库，通过关键词搜索，或是采用BLAST算法运用目的核酸序列或多肽序列，鉴定这样的相关序列。在其他情况下，已由例如Joint Genome Institute，针对特定生物例如白杨和Ostreococcus tauri，建立了专门的核酸序列数据库。

实施例2：本发明多肽序列的比对

使用基于流行的渐进式比对ClustalW算法(Thompson等(1997)Nucleic Acids Res 25：4876-4882；Chenna等(2003)Nucleic Acids Res31：3497-3500)的Vector NTI软件包(Invitrogen)AlignX程序，实施多肽序列的比对。默认值为空位开放罚分10，空位延伸罚分0.1，而选择的权重矩阵为Blosum 62(如果比对多肽的话)。可以进行微小的人造编辑以进一步优化比对。利用Vector NTI(Invitrogen)的AlignX程序中提供的邻接聚类算法，构建多肽的系统发生树。

使用渐进式比对Clustal算法(1.83)，利用默认值(Thompson等，(1997)Nucleic Acids Res 25：4876-4882；Chenna等，(2003).Nucleic Acids Res31：3497-3500)，对Fujimoto等(2004；下面表A1)中鉴定的所有拟南芥AHL多肽序列进行了比对。然后构建了邻接树，并且示于本申请的图1中。包含两个拟南芥旁系同源物，AHL19(SEQ ID NO：2或AT3G04570)和AHL20(SEQ ID NO：4或AT4G14465)，的目的群已被圈出。(在上文所述的新多重序列比对步骤后)落在该AHL19/20群中的任何多肽被认为可用于实施如本文所述的本发明方法。

表A1：在拟南芥中鉴定的AHL多肽

AHL编号	Tair登录号	NCBI登录号
AHL编号	Tair登录号	NCBI登录号	AHL1	At4g12080	NP_192945
AHL2	At4g22770	NP_194008	AHL1	At4g12080	NP_192945
AHL2	At4g22770	NP_194008	AHL3	At4g25320	NP_194262
AHL4	At5g51590	NP_199972	AHL3	At4g25320	NP_194262
AHL4	At5g51590	NP_199972	AHL5	At1g63470	NP_176536
AHL6	At5g62260	NP_201032	AHL5	At1g63470	NP_176536
AHL6	At5g62260	NP_201032	AHL7	At4g00200	NP_191931
AHL8	At5g46640	NP_199476	AHL7	At4g00200	NP_191931
AHL8	At5g46640	NP_199476	AHL9	At2g45850	NP_182109
AHL10	At2g33620	NP_565769	AHL9	At2g45850	NP_182109
AHL10	At2g33620	NP_565769	AHL11	At3g61310	NP_191690
AHL12	At1g63480	NP_176537	AHL11	At3g61310	NP_191690

AHL编号	Tair登录号	NCBI登录号
AHL编号	Tair登录号	NCBI登录号	AHL13	At4g17950	NP_567546
AHL14	At3g04590	NP_187109	AHL13	At4g17950	NP_567546
AHL14	At3g04590	NP_187109	AHL15	At3g55560	NP_191115
AHL16	At2g42940	NP_181822	AHL15	At3g55560	NP_191115
AHL16	At2g42940	NP_181822	AHL17	At5g49700	NP_199781
AHL18	At3g60870	NP_191646	AHL17	At5g49700	NP_199781
AHL18	At3g60870	NP_191646	AHL19	At3g04570	NP_566232
AHL20	At4g14465	NP_567432	AHL19	At3g04570	NP_566232
AHL20	At4g14465	NP_567432	AHL21	At2g35270	NP_181070
AHL22	At2g45430	NP_182067	AHL21	At2g35270	NP_181070
AHL22	At2g45430	NP_182067	AHL编号	Tair登录号	NCBI登录号
AHL23	At4g17800	NP_193515	AHL编号	Tair登录号	NCBI登录号
AHL23	At4g17800	NP_193515	AHL24	At4g22810	NP_194012
AHL25	At4g35390	NP_195265	AHL24	At4g22810	NP_194012
AHL25	At4g35390	NP_195265	AHL26	At4g12050	NP_192942
AHL27	At1g20900	NP_173514	AHL26	At4g12050	NP_192942
AHL27	At1g20900	NP_173514	AHL28	At1g14490	NP_172901
AHL29	At1g76500	NP_177776	AHL28	At1g14490	NP_172901

进行了第二多重序列比对，包括表A中的所有AHL19/20直系同源物多肽和表A1中的所有AHL序列。之后构建邻接树，并且示于本申请的图2中。包含两个拟南芥旁系同源物，AHL19(SEQ ID NO：2或AT3G04570)和AHL20(SEQ ID NO：4或AT4G14465)，的目的群已被圈出。落在该AHL19/20群中的任何多肽被认为可用于实施如本文所述的本发明方法。

在表A的AHL19/20多肽的多重序列比对后鉴定了SEQ ID NO：36所示的SEQ ID NO：2的保守结构域(CD)。在第二步骤中，使用渐进式比对Clustal算法(1.83)，利用默认值，选择(从全长多肽序列中)和比对了表A的AHL19/20多肽的CD。许多特征可被鉴定，并且标示于图4中。从多肽的N端至C端，它们是：(i)预测的核定位信号(NLS)；(ii)AT-hookDNA结合基序，具有核心三肽GRP；和(iii)PPC结构域(DUF 296)。

利用Vector NTI(Invitrogen)的AlignX程序中提供的邻接聚类算法，构建AAT样多肽和AAT多肽的系统发生树。

实施例3：可用于实施本发明方法的多肽序列之间的全局同一性百分比计算

可用于实施本发明方法的全长多肽序列之间的全局相似性和同一性百分比，利用本领域可用方法之一，即MatGAT(矩阵全局比对工具)软件(BMC Bioinformatics.2003 4：29.MatGAT：an application that generatessimilarity/identity matrices using protein or DNA sequences.CampanellaJJ，Bitincka L，Smalley J；由Ledion Bitincka托管的软件)，进行了确定。MatGAT软件无需对数据进行预比对，即可产生DNA或蛋白质序列的相似性/同一性矩阵。该程序利用Myers和Miller全局比对算法(空位开放罚分为12，而空位延伸罚分为2)进行一系列的两两比对，利用例如Blosum 62(对于多肽而言)计算相似性和同一性，然后将结果排列成距离矩阵。序列相似性示于对角线下半部，而序列同一性示于对角线上半部。

比较所用的参数有：

记分矩阵：Blosum 62

首个空位：12

延伸空位：2

还可以产生针对特定结构域的局部比对的MATGAT表或有关特定结构域之间的同一性/相似性百分比的数据。

对于多肽序列全长上的全局相似性和同一性(将部分多肽序列排除在外)，软件分析的结果示于表B。对角线上方给出同一性百分比，而对角线下方给出相似性百分比。

与SEQ ID NO：2相比，可用于实施本发明方法的多肽序列之间的同一性百分比可低至52％氨基酸同一性。

表B：多肽序列全长上的全局相似性和同一性的MatGAT结果

	1	2	3	4	5	6	7	8	9	10	11	12	13	14	15	16	17
	1	2	3	4	5	6	7	8	9	10	11	12	13	14	15	16	17	1.Aqufo_AHL19_20		63	64	61	61	60	73	66	71	59	61	66	70	63	73	71	58
2.Arath_AHL19	72		56	94	94	56	59	61	59	48	55	61	63	97	61	57	52	1.Aqufo_AHL19_20		63	64	61	61	60	73	66	71	59	61	66	70	63	73	71	58
2.Arath_AHL19	72		56	94	94	56	59	61	59	48	55	61	63	97	61	57	52	3.Arath_AHL20	76	70		54	54	56	63	63	61	54	58	59	61	57	61	63	54
4.Brana_AHL19_20	70	96	67		100	56	59	61	58	49	55	60	61	94	60	56	52	3.Arath_AHL20	76	70		54	54	56	63	63	61	54	58	59	61	57	61	63	54
4.Brana_AHL19_20	70	96	67		100	56	59	61	58	49	55	60	61	94	60	56	52	5.Brara_AHL19_20	70	96	67	100		56	59	61	58	49	55	60	61	94	60	56	52
6.Glyma_AHL19_20	75	68	73	68	68		60	64	59	52	58	66	63	58	67	59	55	5.Brara_AHL19_20	70	96	67	100		56	59	61	58	49	55	60	61	94	60	56	52
6.Glyma_AHL19_20	75	68	73	68	68		60	64	59	52	58	66	63	58	67	59	55	7.Goshi_AHL19_20	82	69	75	67	67	77		64	70	61	66	64	67	59	71	79	61
8.Lacsa_AHL19_20	79	72	77	72	72	81	80		63	56	59	69	73	61	72	64	56	7.Goshi_AHL19_20	82	69	75	67	67	77		64	70	61	66	64	67	59	71	79	61
8.Lacsa_AHL19_20	79	72	77	72	72	81	80		63	56	59	69	73	61	72	64	56	9.Lotja_AHL19_20	82	72	75	71	71	74	80	77		59	61	63	69	58	71	72	62
10.Orysa_AHL19_20	67	58	65	58	58	65	68	69	66		66	52	55	48	56	62	70	9.Lotja_AHL19_20	82	72	75	71	71	74	80	77		59	61	63	69	58	71	72	62
10.Orysa_AHL19_20	67	58	65	58	58	65	68	69	66		66	52	55	48	56	62	70	11.Orysa_AHL19_20\II	71	64	69	63	63	73	76	73	72	70		59	60	56	60	66	67
12.Poptr_AHL19_20	81	71	73	71	71	80	80	81	80	64	74		72	61	75	62	54	11.Orysa_AHL19_20\II	71	64	69	63	63	73	76	73	72	70		59	60	56	60	66	67
12.Poptr_AHL19_20	81	71	73	71	71	80	80	81	80	64	74		72	61	75	62	54	13.Soltu_AHL19_20	82	75	76	75	75	79	77	81	80	61	70	87		63	78	66	58
14.Thlca_AHL19_20	73	98	69	95	95	70	68	72	73	58	66	72	75		61	58	52	13.Soltu_AHL19_20	82	75	76	75	75	79	77	81	80	61	70	87		63	78	66	58
14.Thlca_AHL19_20	73	98	69	95	95	70	68	72	73	58	66	72	75		61	58	52	15.Vitvi_AHL19_20	85	72	74	71	71	81	79	82	82	65	70	85	90	71		69	57
16.Vitvi_AHL19_20\II	80	66	74	66	66	73	84	78	79	70	76	75	76	66	78		63	15.Vitvi_AHL19_20	85	72	74	71	71	81	79	82	82	65	70	85	90	71		69	57

如果在SEQ ID NO：2的保守结构域(CD)(SEQ ID NO：36所示)与可用于实施本发明的多肽的CD之间进行同一性计算的话，则同一性百分比可显著增加。CD包含AT-hook DNA结合基序(对于SEQ ID NO：2，如SEQ IDNO：37所示)和PPC结构域(对于SEQ ID NO：2，如SEQ ID NO：38所示)。可用于实施本发明方法的多肽序列在CD上的同一性百分比为75％至99％氨基酸同一性，见表B1。这显著高于在全长AHL19/20多肽序列之间计算的氨基酸同一性百分比。

表B1：多肽序列间在CD结构域上的全局相似性和同一性的MatGAT结果。

	1	2	3	4	5	6	7	8	9	10	11	12	13	14	15	16	17
	1	2	3	4	5	6	7	8	9	10	11	12	13	14	15	16	17	1.CD_Aqufo_AHL19_20		81	81	80	80	77	92	83	87	86	87	81	84	81	84	92	86
2.CD_Arath_AHL19	91		78	98	98	75	82	77	78	76	80	78	80	99	81	81	77	1.CD_Aqufo_AHL19_20		81	81	80	80	77	92	83	87	86	87	81	84	81	84	92	86
2.CD_Arath_AHL19	91		78	98	98	75	82	77	78	76	80	78	80	99	81	81	77	3.CD_Arath_AHL20	93	88		77	77	73	84	80	79	77	81	76	79	78	79	82	78
4.CD_Brana_AHL19_20	91	99	88		100	75	82	77	78	76	79	78	79	98	80	80	78	3.CD_Arath_AHL20	93	88		77	77	73	84	80	79	77	81	76	79	78	79	82	78
4.CD_Brana_AHL19_20	91	99	88		100	75	82	77	78	76	79	78	79	98	80	80	78	5.CD_Brara_AHL19_20	91	99	88	100		75	82	77	78	76	79	78	79	98	80	80	78
6.CD_Glyma_AHL19_20	92	88	89	88	88		80	78	80	74	79	81	78	75	82	80	78	5.CD_Brara_AHL19_20	91	99	88	100		75	82	77	78	76	79	78	79	98	80	80	78
6.CD_Glyma_AHL19_20	92	88	89	88	88		80	78	80	74	79	81	78	75	82	80	78	7.CD_Goshi_AHL19_20	98	91	93	91	91	93		86	92	87	89	85	88	82	90	94	88
8.CD_Lacsa_AHL19_20	96	90	92	90	90	92	96		81	78	83	86	87	77	88	83	78	7.CD_Goshi_AHL19_20	98	91	93	91	91	93		86	92	87	89	85	88	82	90	94	88
8.CD_Lacsa_AHL19_20	96	90	92	90	90	92	96		81	78	83	86	87	77	88	83	78	9.CD_Lotja_AHL19_20	96	90	93	90	90	94	98	95		86	86	81	86	78	86	94	89
10.CD_Orysa_AHL19_20	94	87	89	87	87	89	92	92	93		89	78	84	76	81	86	95	9.CD_Lotja_AHL19_20	96	90	93	90	90	94	98	95		86	86	81	86	78	86	94	89
10.CD_Orysa_AHL19_20	94	87	89	87	87	89	92	92	93		89	78	84	76	81	86	95	11.CD_Orysa_AHL19_20\II	94	88	89	88	88	93	95	93	96	95		81	87	80	86	89	90
12.CD_Poptr_AHL19_20	96	88	91	88	88	93	97	95	96	92	93		86	78	87	84	78	11.CD_Orysa_AHL19_20\II	94	88	89	88	88	93	95	93	96	95		81	87	80	86	89	90
12.CD_Poptr_AHL19_20	96	88	91	88	88	93	97	95	96	92	93		86	78	87	84	78	13.CD_Soltu_AHL19_20	94	89	91	89	89	93	96	95	96	90	93	96		80	90	89	83
14.CD_Thlca_AHL19_20	91	100	88	99	99	88	91	90	90	87	88	89	89		81	81	77	13.CD_Soltu_AHL19_20	94	89	91	89	89	93	96	95	96	90	93	96		80	90	89	83
14.CD_Thlca_AHL19_20	91	100	88	99	99	88	91	90	90	87	88	89	89		81	81	77	15.CD_Vitvi_AHL19_20	94	90	91	90	90	94	96	96	96	90	93	95	96	90		88	81
16.CD_Vitvi_AHL19_20\II	96	90	92	90	90	93	98	94	99	92	95	95	95	90	95		87	15.CD_Vitvi_AHL19_20	94	90	91	90	90	94	96	96	96	90	93	95	96	90		88	81
16.CD_Vitvi_AHL19_20\II	96	90	92	90	90	93	98	94	99	92	95	95	95	90	95		87	17.CD_Zeama_AHL19_20	94	88	90	88	88	91	94	93	95	96	96	92	90	88	90	93

实施例4：可用于实施本发明方法的多肽序列中所含结构域的鉴定

蛋白质家族、结构域和位点整合资源(Integrated Resource of ProteinFamilies，Domains and Sites(InterPro))数据库是用于基于文本以及序列的搜索的常用标签数据库的整合界面。InterPro数据库将这些数据库结合起来，它们利用不同的方法学和有关已充分表征的蛋白质的不同角度生物学信息来产生蛋白质标签。合作数据库包括SWISS-PROT、PROSITE、TrEMBL、PRINTS、ProDom和Pfam、Smart和TIGRFAMs。Interpro由位于英国的欧洲生物信息学研究所(European Bioinformatics Institute)托管。

SEQ ID NO：2所示多肽序列的InterPro扫描结果示于表C

表C：SEQ ID NO：2所示多肽序列的InterPro扫描结果

InterPro登录号和登录名	整合数据库名称	整合数据库登录号	整合数据库登录名	SEQ ID NO：2上氨基酸坐标
InterPro登录号和登录名	整合数据库名称	整合数据库登录号	整合数据库登录名	SEQ ID NO：2上氨基酸坐标	IPR005175结构域：未知功能蛋白质DUF296	PFAM	PF03479	DUF 296	107-232
InterProIPR014476家族：预测的AT-hook DNA结合基序	PIR	PIRSF016021	ESCAROLA	1-315	IPR005175结构域：未知功能蛋白质DUF296	PFAM	PF03479	DUF 296	107-232

将GRP多肽序列用作查询序列搜索InterPro数据库。可用于实施本发明方法的GRP多肽匹配一个InterPro登录号，如在下面表中所示的：

InterPro登录号	整合数据库名称	整合数据库登录号	整合数据库登录名
InterPro登录号	整合数据库名称	整合数据库登录号	整合数据库登录名	InterProIPR000347植物金属硫蛋白，家族15	ProDom	PD001611	Metallthion_15p
	Pfam	PF01439	Metallothio_2	InterProIPR000347植物金属硫蛋白，家族15	ProDom	PD001611	Metallthion_15p

SEQ ID NO：51和SEQ ID NO：56所示的多肽序列的InterPro扫描结果示于下面：

InterPro：

IPR001176：结构域1-氨基环丙烷-1-羧酸合酶，区域[203-224][256-280][292-315]

IPR004839：结构域氨基转移酶，I类和II类，区域[145-314]

PFAM：

PF00155结构域氨基转移酶I类和II类，评分为8.4e-19，区域[108-509]

实施例5：用于实施本发明方法的多肽序列的亚细胞定位预测

TargetP 1.1预测真核蛋白质的亚细胞定位。基于如下任一N-端前序列的预测性存在，进行定位确定：叶绿体转运肽(cTP)、线粒体靶向肽(mTP)或分泌途径信号肽(SP)。最终预测所基于的分值并非真正的概率，且它们加起来不一定为1。不过，根据TargetP，得分最高的定位是最可能的，且分值之间的关系(可靠性级别)可作为所述预测的可靠性的指标。可靠性级别(RC)范围从1到5，其中1表示最强的预测。TargetP由丹麦技术大学(Technical University of Denmark)的服务器维护。

对于经预测含有N-端前序列的序列，还可以预测潜在的切割位点。

选择了多种参数，例如生物体类型(非植物或植物)、截断值设置(无、预先规定的截断值设置或者用户指定的截断值设置)以及切割位点的预测计算(是或否)。

SEQ ID NO：2所示多肽序列的TargetP 1.1分析结果示于表D7。选择的是“植物”生物体类型，并且未规定截断值。SEQ ID NO：2所示多肽序列的预测的亚细胞定位不是叶绿体，不是线粒体，也不是分泌途径，而最可能是细胞核。

在SEQ ID NO：2的AHL19/20多肽中发现(例如通过多重序列比对，然后目检)预测的核定位信号(NLS)。NLS是一个或多个具有带正电荷的赖氨酸或精氨酸的短序列。本发明的SEQ ID NO：2经预测定位在真核细胞的细胞核区室。

表D：SEQ ID NO：2所示多肽序列的TargetP 1.1分析

长度(AA)	315
长度(AA)	315	叶绿体转运肽	0.100
线粒体转运肽	0.278	叶绿体转运肽	0.100
线粒体转运肽	0.278	分泌路径信号肽	0.033
其他亚细胞靶向	0.703	分泌路径信号肽	0.033
其他亚细胞靶向	0.703	预测的定位	其他
可靠性级别	3	预测的定位	其他

SEQ ID NO：51所示多肽序列的TargetP 1.1分析结果如下。

TargetP预测：线粒体(0.837，质量2)

可以利用许多算法进行亚细胞定位预测分析，包括：

·ChloroP 1.1，由丹麦技术大学服务器托管；

·蛋白质寻觅亚细胞定位预测软件(Protein Prowler SubcellularLocalisation Predictor)，1.2版，由澳大利亚布里斯班昆士兰大学分子生物科学研究所(Institute for Molecular Bioscience，University of Queensland，Brisbane，Australia)的服务器托管；

·PENCE Proteome Analyst PA-GOSUB 2.5，由加拿大大阿尔贝塔埃德蒙顿阿尔贝塔大学(University of Alberta，Edmonton，Alberta，Canada)的服务器托管；

·TMHMM，由丹麦技术大学服务器托管。

实施例6：与可用于本发明方法的多肽序列相关的分析

AAT样多肽可具有催化下列反应的能力：

本领域技术人员将能够容易地检查该活性。

实施例7：本发明核酸序列的克隆

除非另外指出，否则按照(Sambrook(2001)Molecular Cloning：alaboratory manual，第3版Cold Spring Harbor Laboratory Press，CSH，New York)或Ausubel等，(1994)，Current Protocols in Molecular Biology，Current Protocols的第1和2卷中所述标准方案进行重组DNA技术。用于植物分子工作的标准材料和方法描述于由BIOS Scientific PublicationsLtd(UK)和Blackwell Scientific Publications(UK)出版的R.D.D.Croy编著的Plant Molecular Biology Labfax(1993)中。

使用从混合植物组织提取的mRNA合成的拟南芥cDNA文库作为模板，通过PCR，扩增编码AHL19多肽的拟南芥cDNA。PCR扩增使用引物prm8135(SEQ ID NO：41；有义：5’-ggggacaagtttgtacaaaaaagcaggcttaaacaatggcgaatccatggtg-3’)和引物prm08136(SEQ ID NO：42；反义，互补：5’-ggggaccactttgtacaagaaagctgggttaaaaaccattttaacgcacg-3’)，包含用于Gateway重组的AttB位点。在标准条件下使用Hifi Taq DNA聚合酶进行PCR。同样利用标准方法扩增和纯化预期长度(包括attB位点)的PCR片段。接着进行Gateway操作的第一步，即BP反应，在此期间PCR片段与pDONR201质粒体内重组，产生Gateway术语所称的“进入(entry)克隆”。作为

技术一部分的质粒pDONR201购自Invitrogen。

SEQ ID NO：45的克隆：

使用定制的拟南芥混合组织cDNA文库(在pCMV Sport 6.0中；Invitrogen，Paisley，UK)作为模板，通过PCR，扩增本发明方法所用的核酸序列SEQ ID NO：45。在50μl PCR混合物中使用200ng的模板，在标准条件下利用Hifi Taq DNA聚合酶进行PCR。使用的引物是prm03240(SEQ ID NO：48；有义：5’ggggacaagtttgtacaaaaaagcaggcttcacaatgtcttgctgtggaggaa 3’)和prm03241(SEQ ID NO：49；反义，互补：5’-ggggaccactttgtacaagaaagctgggtttcacttgcaggtgcaag 3’)，其包括进行Gateway重组的AttB位点。同样利用标准方法纯化扩增的PCR片段。接着进行Gateway操作的第一步，即BP反应，在此期间PCR片段与pDONR201质粒体内重组以产生Gateway术语所称的“进入克隆”。作为

技术一部分的质粒pDONR201购自英骏公司(Invitrogen)。

在50μl PCR混合物中使用200ng的模板，在标准条件下利用HifiTaq DNA聚合酶通过PCR扩增本发明方法所用的核酸序列SEQ ID NO：50。使用的引物是prm08408(SEQ ID NO：53；有义，起始密码子为粗体)：5’-ggggacaagtttgtacaaaaaagcaggcttaaacaatgcggaaggaagcgac-3’和prm08409(SEQ ID NO：54；反义，互补)：5’-ggggaccactttgtacaagaaagctgggtcgaattgctaagctgttacga-3’，其包括进行Gateway重组的AttB位点。同样利用标准方法纯化扩增的PCR片段。接着进行Gateway操作的第一步，即BP反应，在此期间PCR片段与pDONR201质粒体内重组以产生Gateway术语所称的“进入克隆”，即pAAT-like。作为技术一部分的质粒pDONR201购自Invitrogen。

使用稻cDNA文库(在pCMV Sport 6.0中；Invitrogen，Paisley，UK)作为模板，通过PCR，扩增本发明方法所用的核酸序列SEQ ID NO：55。在50μl PCR混合物中使用200ng的模板，在标准条件下利用Hifi Taq DNA聚合酶进行PCR。使用的引物是prm001646(SEQ ID NO：58；有义，起始密码子为粗体)：5’-ggggacaagtttgtacaaaaaagcaggcttcacaatggctgctcccagc-3’和prm001647(SEQ ID NO：59；反义，互补)：5’-ggggaccactttgtacaagaaagctgggtaattcagtcgcggtacg-3’，其包括进行Gateway重组的AttB位点。同样利用标准方法纯化扩增的PCR片段。接着进行Gateway操作的第一步，即BP反应，在此期间PCR片段与pDONR201质粒体内重组以产生Gateway术语所称的“进入克隆”，即pAAT。作为

技术一部分的质粒pDONR201购自Invitrogen。

实施例8：使用公开的核酸序列构建表达载体

随后将包含SEQ ID NO：1的进入克隆与用于稻转化的目的载体(destination vector)一起用于LR反应。此载体在T-DNA边界内包含如下功能性元件：植物选择标记；可筛选标记表达盒；旨在与已克隆到进入克隆中的目的核酸序列进行LR体内重组的Gateway盒。用于组成型表达的稻GOS2启动子(SEQ ID NO：35)位于此Gateway盒的上游。

在LR重组步骤之后，根据本领域众所周知的方法将所产生的表达载体pGOS2::AHL19/20(图5)转化进农杆菌菌株LBA4044。

随后将包含SEQ ID NO：45的进入克隆与用于稻转化的目的载体一起用于LR反应。此载体在T-DNA边界内包含如下功能性元件：植物选择标记；可筛选标记表达盒；旨在与已克隆到进入克隆中的目的核酸序列进行LR体内重组的Gateway盒。用于组成型表达的稻HMGB启动子(SEQ IDNO：47)位于此Gateway盒的上游。

在LR重组步骤之后，根据本领域众所周知的方法将所产生的表达载体pGOS2::GRP(图7)转化进农杆菌菌株LBA4044。

随后将包含SEQ ID NO：50的进入克隆与用于稻转化的目的载体一起用于LR反应。此载体在T-DNA边界内包含如下功能性元件：植物选择标记；可筛选标记表达盒；旨在与已克隆到进入克隆中的目的核酸序列进行LR体内重组的Gateway盒。用于枝条和叶特异性表达的稻推定原叶绿素酸酯还原酶启动子(SEQ ID NO：52)位于此Gateway盒的上游。

在LR重组步骤之后，根据本领域众所周知的方法将所产生的表达载体(图9)转化进农杆菌菌株LBA4044。

随后将包含SEQ ID NO：55的进入克隆与用于稻转化的目的载体一起用于LR反应。此载体在T-DNA边界内包含如下功能性元件：植物选择标记；可筛选标记表达盒；旨在与已克隆到进入克隆中的目的核酸序列进行LR体内重组的Gateway盒。用于根表皮和根毛特异性表达的稻NRT1启动子(SEQ ID NO：57)位于此Gateway盒的上游。

在LR重组步骤之后，根据本领域众所周知的方法将所产生的表达载体pNRT1::ATT(图11)转化进农杆菌菌株LBA4044。

实施例9：植物转化

稻转化

独立地使用包含表达载体的这些农杆菌转化稻植物。使梗稻栽培种日本晴(rice japonica cultivar Nipponbare)的成熟干种子脱壳。通过在70％的乙醇中孵育1分钟，然后在0.2％HgCl₂中孵育30分钟，之后用无菌蒸馏水洗涤6次，每次15分钟来进行消毒。然后在包含2，4-D的培养基(愈伤组织诱导培养基)中萌发无菌种子。在黑暗中孵育4周后，切取盾片来源的胚发生愈伤组织，然后在相同的培养基上进行繁殖。2周后，通过在相同的培养基上传代培养再另外2周来繁殖或增殖愈伤组织。在共培养前3天在新鲜培养基上传代培养胚发生愈伤组织块(以增强细胞分裂活性)。

包含各表达载体的农杆菌株LBA4404独立地用于共培养。将农杆菌接种在具有适宜的抗生素的AB培养基上，在28℃培养3天。然后收集细菌，将其悬浮在液体共培养培养基中至大约为1的密度(OD₆₀₀)。然后将悬浮液转移至培养皿(Petri dish)，将愈伤组织浸渍在悬浮液中15分钟。然后将愈伤组织在滤纸上吸干，之后转移至固化的共培养培养基，在25℃黑暗中孵育3天。然后在选择剂存在的情况下在28℃黑暗中，在包含2，4-D的培养基上生长共培养的愈伤组织4周。在此期间，产生了快速生长的抗性愈伤组织岛。在将该物质转移至再生培养基和在光照下孵育后，胚发生潜力被释放，在接下来的4至5周中发育出芽。将芽从愈伤组织切下，然后在包含生长素的培养基上孵育2至3周，然后将它们从所述培养基转移至土壤中。在温室中在高湿度和短日照下生长出变硬的芽(shoot)。

对于每个构建体产生了大约35个独立的T0稻转化体。将原代转化体从组织培养室转移至温室。在进行确认T-DNA插入物的拷贝数的定量PCR分析后，只保留展示对选择剂具抗性的单拷贝转基因植物用于T1种子的收获。然后在移植后3至5个月收获种子。该方法以50％多的比率产生了单基因座转化体(Aldemita和Hodges1996，Chan等1993，Hiei等1994)。

实施例10：表型评估方法

10.1评估设置

产生了大约35个独立的T0稻转化体。原代转化体由组织培养室转移到温室生长并收获T1种子。保留了6个事件，这些事件中T1后代发生转基因存在/缺乏的3∶1分离。通过监测可视标记的表达，对于这些事件之每一个，各选出大约10个含转基因的T1幼苗(杂合子和纯合子)，以及大约10个缺少转基因的T1幼苗(无效合子)。转基因植物和相应的无效合子在随机位置上并排生长。温室条件为短日照(12小时光照)，日间28℃，夜间22℃，相对湿度70％。

从播种期到成熟期，植物数次通过数码成像箱。在每个时间点上对每株植物从至少6个不同的角度获取数码图像(2048×1536像素，1千6百万色素)。

减少的养分(氮)可利用度筛选

在除营养液以外正常的条件下在花盆土中培养来自6个事件(T2种子)的植物。从植物移植到成熟，用特定的营养液对花盆进行浇灌，所述营养液的氮(N)含量降低，通常低7到8倍。其余的栽培(植物成熟、种子收获)与不在非生物胁迫条件下培养的植物相同。如针对正常条件下的生长所详述的那样，记录生长和产率参数。

10.2统计分析：F检验

利用双因素ANOVA(方差分析)作为统计模型，对植物表型特征进行总体评估。对用本发明基因转化的所有事件的所有植株的测量到的所有参数进行F检验。进行F检验以在所有转化事件上检查基因的效应，并检验基因的总体效应，亦称为“整体基因效应”(global gene effect)。真实的整体基因效应的显著性阈值设置为F检验的5％概率水平。显著性F检验值指向基因效应，意味着不仅仅只是基因的存在或位置引起表型差异。

按照用于T1代相同的评估方法但是每个事件评估更多个体，对4个T1事件的T2代进行进一步的评估。

当进行了具有重叠事件的两个实验时，进行组合分析。这可用于检查效应在两个实验中的一致性，并且如果情况果真如此，其可用于将来自两个实验的证据集合起来以增加结论的可信度。使用的方法是考虑到数据的多层结构(即实验-事件-分离子)的混合模型方法。通过比较似然比检验与卡方分布，获得P值。

在GRP多肽的情况下的干旱筛选

在正常条件下在花盆土中培养来自T1、T2或更后代的稻植物，直到它们进入抽穗期。然后将其转移到限制灌溉的“干燥”区域。向随机选择的花盆中插入湿度探测仪，以监测土壤水含量(SWC)。当SWC低于一定的阈值时，自动向植物持续补水，直到再次达到正常水平。然后将植物再次重新转移到正常条件下。其余的栽培(植物成熟、种子收获)与不在非生物胁迫条件下培养的植物相同。如针对正常条件下的生长所详述的那样，记录生长和产率参数。

在GRP多肽的情况下的盐胁迫筛选

将来自T1、T2或更后代的稻植物生长在椰子纤维和argex(3∶1的比率)制造的基质上。在将小植株移植入温室后前两周中使用正常的营养液。在前两周后，向营养液中加入25mM盐(NaCl)，直至收获植物。如针对正常条件下的生长所详述的那样，记录生长和产率参数。

在AAT样多肽和AAT多肽的情况下的干旱筛选

在正常条件下在花盆土中培养来自T2种子的植物，直到它们进入抽穗期。然后将其转移到限制灌溉的“干燥”区域。向随机选择的花盆中插入湿度探测仪，以监测土壤水含量(SWC)。当SWC低于一定的阈值时，自动向植物持续补水，直到再次达到正常水平。然后将植物再次重新转移到正常条件下。其余的栽培(植物成熟、种子收获)与不在非生物胁迫条件下培养的植物相同。如针对正常条件下的生长所详述的那样，记录生长和产率参数。

在AAT样多肽和AAT多肽的情况下的氮利用效率筛选

在除营养液以外正常的条件下在花盆土中培养来自T2种子的稻植物。从植物移植到成熟，用特定的营养液对花盆进行浇灌，所述营养液的氮(N)含量降低，通常低7到8倍。其余的栽培(植物成熟、种子收获)与不在非生物胁迫条件下培养的植物相同。如针对正常条件下的生长所详述的那样，记录生长和产率参数。

10.3测量的参数

生物量相关参数测量

植物地上面积(或者说叶生物量)通过计数数码图像上区别于背景的来自于地上植物部分的像素的总数而确定。此值为同一时间点从不同的角度拍摄的照片的平均值，并通过校准转换为以平方毫米表示的物理表面值(physical surface value)。实验表明通过这种方法测量的地上植物面积与植物地上部分的生物量相关。所述地上面积为在植物达到其最大叶生物量的时间点测量的面积。早期活力是萌发后3周植物(幼苗)的地上面积。根生物量的增加表示为总根生物量的增加(测量为在植物生命期中观察到的根的最大生物量)；或表示为根/条指数的增加(测量为在根和枝条活跃生长期中根质量与枝条质量之间的比率)。

早期活力通过计数区别于背景的来自地上植物部分的像数的总数来确定。此值为同一时间点从不同的角度拍摄的照片的平均值，并通过校准转换为以平方毫米表示的物理表面值。下面所述的关于早期活力的结果是萌发后3周的植物的结果。

种子相关参数测量

收获成熟的一级圆锥花序、计数、装袋、贴上条形码标记，然后在烤箱中于37℃干燥三天。随后将圆锥花序脱粒，收集并计数所有的种子。使用鼓风装置将饱满谷壳和空壳分开。弃去空壳，再次计数剩下的部分。在分析天平上称重饱满的谷壳。通过计数在分离步骤之后剩下的饱满谷壳数确定饱满种子数。通过称量从一株植物收获的所有饱满谷壳来测量每植物的种子总重量。通过计数从植物收获的谷壳数来测量每株植物的种子总数。根据计数的饱满种子数及其总重量外推得出千粒重(TKW)。收获指数(HI)在本发明中定义为每植物的种子总重量和地上面积(mm²)之间的比值再乘以因子10⁶。每圆锥花序的花总数在本发明中定义为种子总数与成熟的一级圆锥花序数之间的比值。种子饱满率在本发明中定义为饱满种子数占种子(或小花)总数的比例(以％表示)。

实施例11：在正常生长条件下的转基因稻植物的表型评估结果

对在用于组成型表达的GOS2启动子控制之下表达编码SEQ ID NO：2所示AHL19/20多肽的核酸序列的转基因稻植物，在生长于正常生长条件下时进行了评估，评估结果如下所示。

与相应的无效合子(对照植物)相比，转基因植物的每圆锥花序的花数、每植物的种子总产率、饱满种子总数和收获指数均有显著增加，如表E中所示。

表E：在正常生长条件下，对在用于组成型表达的GOS2启动子控制之下表达编码SEQ ID NO：2所示AHL19/20多肽的核酸序列的转基因稻植物的评估结果。

性状	T1代中6个事件的平均增加％
性状	T1代中6个事件的平均增加％	每圆锥花序的花数	14％
每植物的种子总产率	17％	每圆锥花序的花数	14％
每植物的种子总产率	17％	饱满种子总数	17％
收获指数	17％	饱满种子总数	17％

对在非胁迫条件下生长的并且在稻的原叶绿素酸酯还原酶启动子控制之下表达AAT样核酸的转基因稻植物的评估，显示出与对照植物相比转基因植物的收获指数(HI)显著增加。还观察到与对照植物相比，转基因植物的早期活力、种子总重量和饱满种子数增加。

对在非限氮条件下生长的并且在稻NRT1启动子控制之下表达AAT核酸的转基因稻植物的评估，显示出与对照植物相比，地上面积、植物重量、早期活力增加。

实施例12：在养分(氮)可利用度降低的生长条件下的转基因稻植物的表型评估结果

对在养分(氮)可利用度降低的生长条件下生长的并且在用于组成型表达的GOS2启动子控制之下表达编码SEQ ID NO：2所示AHL19/20多肽的核酸序列的转基因稻植物的评估结果示于下面。

与相应的无效合子(对照植物)相比，转基因植物的每植物的种子总产率、饱满种子总数和收获指数均显著增加，如表F中所示。

表F：对在养分(氮)可利用度降低的生长条件下，对在用于组成型表达的GOS2启动子控制之下表达编码SEQ ID NO：2所示AHL19/20多肽的核酸序列的转基因稻植物的评估结果。

性状	T1代中2个事件的平均增加％
性状	T1代中2个事件的平均增加％	早期活力	18％
每植物的种子总产率	26％	早期活力	18％
每植物的种子总产率	26％	饱满种子总数	27％
种子总数	24％	饱满种子总数	27％

实施例13：在盐和/或干旱胁迫生长条件下的转基因稻植物的表型评估结果

在盐胁迫条件下生长时于GOS2启动子控制之下表达SEQ ID NO：45所示的GRP核酸序列的转基因稻植物，显示出与在相当条件下生长的对照植物相比，地上生物量、每植物的种子总产率、饱满种子数、种子总数和一级圆锥花序(first panicles)数的5％以上增加，如下表中所示。

	T2代中的总体平均增加％
	T2代中的总体平均增加％	地上生物量	20％
每植物的种子总产率	32％	地上生物量	20％
每植物的种子总产率	32％	饱满种子数	29％
种子总数	19％	饱满种子数	29％
种子总数	19％	一级圆锥花序数	23％

在干旱胁迫条件下生长的、于GOS2启动子控制之下表达SEQ ID NO：45所示GRP核酸序列的转基因稻植物，显示出与在相当条件下生长的对照植物相比，地上生物量、每植物的种子总产率、饱满种子数、种子总数和种子饱满率的5％以上增加，如下表中所示。

	T1代中最佳事件的平均增加％
	T1代中最佳事件的平均增加％	每植物的种子总产率	39％
饱满种子数	38％	每植物的种子总产率	39％
饱满种子数	38％	种子总数	19％
种子饱满率	12％	种子总数	19％

实施例14：其他作物的转化实例

玉米的转化

使用由Ishida等(1996)Nature Biotech 14(6)：745-50描述的方法的改进方法进行玉米(Zea mays)的转化。在玉米中转化是基因型依赖性的，只有特定的基因型易于进行转化和再生。近交系A188(University ofMinnesota)或以A188作为亲本的杂种是用于转化的供体材料的良好来源，但也可成功地使用其他基因型。在授粉后大约11天(DAP)当未成熟的胚的长度为大约1至1.2mm时，从玉米植物收获穗子。将未成熟的胚与包含表达载体的根癌农杆菌共培养，通过器官发生再生转基因植物。将切离的胚培养在包含选择剂(例如咪唑啉酮，但可使用不同的选择标记)的愈伤组织诱导培养基，然后是玉米再生培养基上。在光照的情况下在25℃孵育培养皿2至3周，或直至芽产生。将绿色的芽从各胚转移至玉米生根培养基，在25℃孵育2-3周，直至根产生。然后将生根的芽移植至温室土壤中。从展示对选择剂具有抗性的且包含单拷贝T-DNA插入物的植物产生T1种子。

小麦转化

使用由Ishida等(1996)Nature Biotech 14(6)：745-50描述的方法进行小麦的转化。通常将栽培品种Bobwhite(可从CIMMYT，Mexico获得)用于转化。将未成熟的胚与包含表达载体的根癌农杆菌共培养，通过器官发生再生转基因植物。在与农杆菌孵育后，将胚体外培养在包含选择剂(例如咪唑啉酮，但可使用不同的选择标记)的愈伤组织诱导培养基，然后是再生培养基上。在光照的情况下在25℃孵育培养皿2至3周，或直至芽产生。将绿色的芽从各胚转移至生根培养基，在25℃孵育2-3周，直至根产生。将生根的芽移植至温室土壤中。从展示对选择剂具有抗性的且包含单拷贝T-DNA插入物的植物产生T1种子。

大豆转化

按照Texas A&M专利US 5,164,310中描述的方法的改进方法转化大豆。几种商品化大豆品种易于通过该方法进行转化。通常将栽培品种Jack(可从Illinois Seed foundation获得)用于转化。对大豆种子消毒以便体外播种。从7日龄幼苗切取下胚轴、胚根和一片子叶。让上胚轴和剩下的子叶进一步生长产生腋节(axillary node)。切取这些腋节，将其与包含表达载体的根癌农杆菌一起孵育。在共培养处理后，洗涤外植体，然后转移至选择培养基。切取再生的芽，将其置于芽伸长培养基上。将长度不超过1cm的芽置于生根培养基上直至根产生。将生根的芽转移至温室的土壤中。从展示对选择剂具有抗性的且包含单拷贝T-DNA插入物的植物产生T1种子。

油菜(rapeseed)/芸苔(Canola)的转化

5-6日龄的幼苗的子叶柄和下胚轴用作组织培养的外植体，按照Babic等(1998，Plant Cell Rep 17：183-188)对其进行转化。商业栽培品种Westar(Agriculture Canada)是用于转化的标准品种，但也可使用其他品种。对Canola种子进行表面消毒以进行体外播种。从体外幼苗切取具有附着的子叶的子叶柄外植体，然后通过将子叶柄外植体的切口末端浸入细菌悬浮液中接种农杆菌(包含表达载体)。然后将外植体在23℃、16小时光照下，在包含3mg/l BAP、3％蔗糖、0.7％Phytagar的MSBAP-3培养基上培养2天。在与农杆菌共培养2天后，将子叶柄外植体转移至包含3mg/l BAP、头孢氨噻肟、羧苄青霉素或替卡西林-克拉维酸(timentin)(300mg/l)的MSBAP-3培养基上培养7天，然后在具有头孢氨噻肟(cefotaxime)、羧苄青霉素或替卡西林-克拉维酸和选择剂的MSBAP-3培养基上培养直至芽再生。当芽的长度为5-10mm时，将其切离，然后转移至芽伸长培养基(MSBAP-0.5，包含0.5mg/l BAP)。将长度大约2cm的芽转移至生根培养基(MS0)以进行根诱导。将生根的芽移植至温室的土壤中。从展示对选择剂具有抗性的且包含单拷贝T-DNA插入物的植物产生T1种子。

苜蓿的转化

使用(McKersie等，1999 Plant Physiol 119：839-847)的方法转化苜蓿(Medicago sativa)的再生克隆。苜蓿的再生和转化是基因型依赖性的，因而需要再生的植物。已描述了用于获得再生植物的方法。例如，这些再生植物可选自栽培品种Rangelander(Agriculture Canada)或由Brown DCW和A Atanassov(1985.Plant Cell Tissue Organ Culture 4：111-112)描述的任何其他商业苜蓿品种。可选择地，RA3品种(University of Wisconsin)已选择用于组织培养(Walker等，1978 Am J Bot 65：654-659)。将子叶柄外植体与包含表达载体的根癌农杆菌C58C1 pMP90(McKersie等，1999 PlantPhysiol 119：839-847)或LBA4404的过夜培养物共培养。将外植体在黑暗中在包含288mg/L Pro、53mg/L硫代脯氨酸、4.35g/L K₂SO₄和100μm乙酰丁香酮的SH诱导培养基上共培养3天。在一半浓度的Murashige-Skoog培养基(Murashige和Skoog，1962)中洗涤外植体，然后将其种在不含乙酰丁香酮但具有适宜的选择剂和适宜的抗生素(以抑制农杆菌的生长)的相同SH诱导培养基上。在几周后，将体细胞胚转移至不含生长调节剂、无抗生素但含有50g/L蔗糖的BOi2Y发育培养基中。随后在一半浓度的Murashige-Skoog培养基上萌发体细胞胚。将生根的幼苗移植入花盆和生长在温室中。从展示对选择剂具有抗性的且包含单拷贝T-DNA插入物的植物产生T1种子。

棉花转化

使用根癌农杆菌在下胚轴外植体上转化棉花(Gossypium hirsutum L.)。商业品种例如Coker 130或Coker 312(SeedCo，Lubbock，TX)是用于转化的标准品种，但也可使用其他品种。对种子进行表面消毒，然后在黑暗处萌发。从萌发的幼苗切取长度大约1-1.5厘米的下胚轴外植体。将下胚轴外植体浸没在含有表达载体的根癌农杆菌接种物中5分钟，然后在黑暗处在24℃在MS+1.8mg/l KNO3+2％葡萄糖上共培养大约48小时。将外植体转移至含有适当的细菌和植物选择标记(更换数次)的相同培养基中，直至看到胚发生愈伤组织。分离愈伤组织，然后进行传代培养直至体细胞胚出现。将来源于体细胞胚的小植株在生根培养基上成熟直至根发育。将生根的幼苗移植至温室中的花盆土中。从展示对选择剂具有抗性的并且包含单拷贝T-DNA插入物的植物产生T1种子。

实施例13：非生物胁迫筛选的实例

干旱筛选

在正常条件下在花盆土中培养来自所选数目的事件的植物，直到它们进入抽穗期。然后将其转移到限制灌溉的“干燥”区域。向随机选择的花盆中插入湿度探测仪，以监测土壤水含量(SWC)。当SWC低于一定的阈值时，自动向植物持续补水，直到再次达到正常水平。然后将植物重新转移到正常条件下。其余的栽培(植物成熟、种子收获)与不在非生物胁迫条件下培养的植物相同。如针对正常条件下的生长所详述的那样，记录生长和产率参数。

盐胁迫筛选

将植物生长在椰子纤维和argex(3∶1的比率)制造的基质上。在将小植株移植入温室后前2两周中使用正常的营养液。在前两周后，向营养液中加入25mM盐(NaCl)，直至收获植物。如针对正常条件下的生长所详述的那样，记录生长和产率参数。

实施例14：非生物胁迫筛选

氮利用效率筛选

在除营养液以外正常的条件下在花盆土中培养来自T1、T2或更后代的稻植物。从植物移植到成熟一直用特定的营养液对花盆进行浇灌，所述营养液的氮(N)含量降低，通常低7到8倍。其余的栽培(植物成熟、种子收获)与不在非生物胁迫条件下培养的植物相同。如针对正常条件下的生长所详述的那样，记录生长和产率参数。

序列表

<110>巴斯福植物科学(BASF Plant Science GmbH)

<120>具有增强的产率相关性状的植物及其制备方法

<130>PF59353

<160>59

<170>PatentIn version 3.3

<210>1

<211>948

<212>DNA

<213>拟南芥(Arabidopsis thaliana)

<400>1

atggcgaatc catggtggac aggacaagtg aacctatccg gcctcgaaac gacgccgcct 60

ggttcctctc agttaaagaa accagatctc cacatctcca tgaacatggc catggactca 120

ggtcacaata atcatcacca tcaccaagaa gtcgataaca acaacaacga cgacgataga 180

gacaacttga gtggagacga ccacgagcca cgtgaaggag ccgtagaagc ccccacgcgc 240

cgtccacgtg gacgtcctgc tggttccaag aacaaaccaa agccaccgat cttcgtcact 300

cgcgattctc caaatgctct caagagccat gtcatggaga tcgctagtgg gactgacgtc 360

atcgaaaccc tagctacttt tgctaggcgg cgtcaacgtg gcatctgcat cttgagcgga 420

aatggcacag tggctaacgt caccctccgt caaccctcga ccgctgccgt tgcggcggct 480

cctggtggtg cggctgtttt ggctttacaa gggaggtttg agattctttc tttaaccggt 540

tctttcttgc caggaccggc tccacctggt tccaccggtt taacgattta cttagccggt 600

ggtcaaggtc aggttgttgg aggaagcgtg gtgggcccat tgatggcagc aggtccggtg 660

atgctgatcg ccgccacgtt ctctaacgcg acttacgaga gattgccatt ggaggaggaa 720

gaggcagcag agagaggcgg tggtggaggc agcggaggag tggttccggg gcagctcgga 780

ggcggaggtt cgccactaag cagcggtgct ggtggaggcg acggtaacca aggacttccg 840

gtgtataata tgccgggaaa tcttgtttct aatggtggca gtggtggagg aggacagatg 900

agcggccaag aagcttatgg ttgggctcaa gctaggtcag gattttaa 948

<210>2

<211>315

<212>PRT

<213>拟南芥

<400>2

Met Ala Asn Pro Trp Trp Thr Gly Gln Val Asn Leu Ser Gly Leu Glu

1 5 10 15

Thr Thr Pro Pro Gly Ser Ser Gln Leu Lys Lys Pro Asp Leu His Ile

20 25 30

Ser Met Asn Met Ala Met Asp Ser Gly His Asn Asn His His His His

35 40 45

Gln Glu Val Asp Asn Asn Asn Asn Asp Asp Asp Arg Asp Asn Leu Ser

50 55 60

Gly Asp Asp His Glu Pro Arg Glu Gly Ala Val Glu Ala Pro Thr Arg

65 70 75 80

Arg Pro Arg Gly Arg Pro Ala Gly Ser Lys Asn Lys Pro Lys Pro Pro

85 90 95

Ile Phe Val Thr Arg Asp Ser Pro Asn Ala Leu Lys Ser His Val Met

100 105 110

Glu Ile Ala Ser Gly Thr Asp Val Ile Glu Thr Leu Ala Thr Phe Ala

115 120 125

Arg Arg Arg Gln Arg Gly Ile Cys Ile Leu Ser Gly Asn Gly Thr Val

130 135 140

Ala Asn Val Thr Leu Arg Gln Pro Ser Thr Ala Ala Val Ala Ala Ala

145 150 155 160

Pro Gly Gly Ala Ala Val Leu Ala Leu Gln Gl y Arg Phe Glu Il e Leu

165 170 175

Ser Leu Thr Gly Ser Phe Leu Pro Gly Pro Ala Pro Pro Gly Ser Thr

180 185 190

Gly Leu Thr Ile Tyr Leu Ala Gly Gly Gln Gly Gln Val Val Gly Gly

195 200 205

Ser Val Val Gly Pro Leu Met Ala Ala Gly Pro Val Met Leu Ile Ala

210 215 220

Ala Thr Phe Ser Asn Ala Thr Tyr Glu Arg Leu Pro Leu Glu Glu Glu

225 230 235 240

Glu Ala Ala Glu Arg Gly Gly Gly Gly Gly Ser Gly Gly Val Val Pro

245 250 255

Gly Gln Leu Gly Gly Gly Gly Ser Pro Leu Ser Ser GlyAla Gly Gly

260 265 270

Gly Asp Gly Asn Gln Gly Leu Pro Val Tyr Asn Met Pro Gly Asn Leu

275 280 285

Val Ser Asn Gly Gly Ser Gly Gly Gly Gly Gln Met Ser Gly Gln Glu

290 295 300

Ala Tyr Gly Trp Ala Gln Ala Arg Ser Gly Phe

305 310 315

<210>3

<211>846

<212>DNA

<213>拟南芥

<400>3

atggcaaacc cttggtggac gaaccagagt ggtttagcgg gcatggtgga ccattcggtc 60

tcctcaggcc atcaccaaaa ccatcaccac caaagtcttc ttaccaaagg agatcttgga 120

atagccatga atcagagcca agacaacgac caagacgaag aagatgatcc tagagaagga 180

gccgttgagg tggtcaaccg tagaccaaga ggtagaccac caggatccaa aaacaaaccc 240

aaagctccaa tctttgtgac aagagacagc cccaacgcac tccgtagcca tgtcttggag 300

atctccgacg gcagtgacgt cgccgacaca atcgctcact tctcaagacg caggcaacgc 360

ggcgtttgcg ttctcagcgg gacaggctca gtcgctaacg tcaccctccg ccaagccgcc 420

gcaccaggag gtgtggtctc tctccaaggc aggtttgaaa tcttatcttt aaccggtgct 480

ttcctccctg gaccttcccc acccgggtca accggtttaa cggtttactt agccggggtc 540

cagggtcagg tcgttggagg tagcgttgta ggcccactct tagccatagg gtcggtcatg 600

gtgattgctg ctactttctc taacgctact tatgagagat tgcccatgga agaagaggaa 660

gacggtggcg gctcaagaca gattcacgga ggcggtgact caccgcccag aatcggtagt 720

aacctgcctg atctatcagg gatggccggg ccaggctaca atatgccgcc gcatctgatt 780

ccaaatgggg ctggtcagct agggcacgaa ccatatacat gggtccacgc aagaccacct 840

tactga 846

<210>4

<211>281

<212>PRT

<213>拟南芥

<400>4

Met Ala Asn Pro Trp Trp Thr Asn Gln Ser Gly Leu Ala Gly Met Val

1 5 10 15

Asp His Ser Val Ser Ser Gly His His Gln Asn His His His Gln Ser

20 25 30

Leu Leu Thr Lys Gly Asp Leu Gly IleAla Met Asn Gln Ser Gln Asp

35 40 45

Asn Asp Gln Asp Glu Glu Asp Asp Pro Arg Glu Gly Ala Val Glu Val

50 55 60

Val Asn Arg Arg Pro Arg Gly Arg Pro Pro Gly Ser Lys Asn Lys Pro

65 70 75 80

Lys Ala Pro Ile Phe ValThr Arg Asp Ser Pro Asn Ala Leu Arg Ser

85 90 95

His ValLeu Glu Ile Ser Asp Gly Ser Asp Val Ala Asp Thr Ile Ala

100 105 110

His Phe Ser Arg Arg Arg Gln Arg Gly Val Cys Val Leu Ser Gly Thr

115 120 125

Gly Ser Val Ala Asn Val Thr Leu Arg Gln Ala Ala Ala Pro Gly Gly

130 135 140

Val Val Ser Leu Gln Gly Arg Phe Glu Ile Leu Ser Leu Thr Gly Ala

145 150 155 160

Phe Leu Pro Gly Pro Ser Pro Pro Gly Ser Thr Gly Leu Thr Val Tyr

165 170 175

Leu Ala Gly Val Gln Gly Gln Val Val Gly Gly Ser Val Val Gly Pro

180 185 190

Leu Leu Ala Ile Gly Ser Val Met Val Ile Ala Ala Thr Phe Ser Asn

195 200 205

Ala Thr Tyr Glu Arg Leu Pro Met Glu Glu Glu Glu Asp Gly Gly Gly

210 215 220

Ser Arg Gln Ile His Gly Gly Gly Asp Ser Pro Pro Arg Ile Gly Ser

225 230 235 240

Asn Leu Pro Asp Leu Ser Gly Met Ala Gly Pro Gly Tyr Asn Met Pro

245 250 255

Pro His Leu Ile Pro Asn Gly Ala Gly Gln Leu Gly His Glu Pro Tyr

260 265 270

Thr Trp Val His Ala Arg Pro Pro Tyr

275 280

<210>5

<211>867

<212>DNA

<213>Aquilegia formosa x Aquilegia pubescens

<400>5

atggcaaatc catggtggac tgggcaggtg ggactgcctg gtggtttaga aacaggagcg 60

ggttcacctg cgtttagaaa acgcgatcga gatttatcga tgaatgaaag tgtaagtggt 120

ggtagaggag gtgaggatga cgatgaaaga gataacggtg atgagcctaa agaaggtgcg 180

gtagagatag gtaaccgccg tccaaggggc cgaccacctg ggtcaaagaa caagccaaaa 240

ccaccgattt ttgtgactcg cgatagccca aacgcgctta ggagccatgt gatggaggtc 300

tcaagtggga ctgatgtagc cgaaagtgta gcccaatttg ctaggaggcg acaaagaggt 360

gtttgtgtac ttagtggtag tggcgtagtg gccaatgtaa cattgcgaca accttcagct 420

ccaagtgcag ttgtggctct gcaaggtcga ttcgaaatat tgtctctaac tggttcattc 480

ttgcctgggc cggcaccccc aggatcaact gggctgacgg tctacttggc aggcggtcag 540

gggcaagtgg taggcggtag cgtggttggt actcttattg cagctggtcc agttattgtg 600

attgcagcaa catttgcaaa tgcaacatat gagagactac caattgagga ggaggaggat 660

gcaggaagtg gaggtcaggg acaactccag ggcggtgcag gaagctcacc accaccaatt 720

ggaagcagta ccgggcaaca gcaaccaggg atgccagacc tatcctcttt gccagtgtat 780

aatatgccac caaacctact ccaaaatgga gggcagatga accagcaaga agcatatgct 840

tgggctcatg ctcggccacc gtattga 867

<210>6

<211>288

<212>PRT

<213>Aquilegia formosa x Aquilegia pubescens

<400>6

Met Ala Asn Pro Trp Trp Thr Gly Gln Val Gly Leu Pro Gly Gly Leu

1 5 10 15

Glu Thr Gly Ala Gly Ser Pro Ala Phe Arg Lys Arg Asp Arg Asp Leu

20 25 30

Ser Met Asn Glu Ser Val Ser Gly Gly Arg Gly Gly Glu Asp Asp Asp

35 40 45

Glu Arg Asp Asn Gly Asp Glu Pro Lys Glu Gly Ala Val Glu Ile Gly

50 55 60

Asn Arg Arg Pro Arg Gly Arg Pro Pro Gly Ser Lys Asn Lys Pro Lys

65 70 75 80

Pro Pro Ile Phe Val Thr Arg Asp Ser Pro Asn Ala Leu Arg Ser His

85 90 95

Val Met Glu Val Ser Ser Gly Thr Asp Val Ala Glu Ser Val Ala Gln

100 105 110

Phe Ala Arg Arg Arg Gln Arg Gly Val Cys Val Leu Ser Gly Ser Gly

115 120 125

Val Val Ala Asn Val Thr Leu Arg Gln Pro Ser Ala Pro Ser Ala Val

130 135 140

Val Ala Leu Gln Gly Arg Phe Glu Ile Leu Ser Leu Thr Gly Ser Phe

145 150 155 160

Leu Pro Gly Pro Ala Pro Pro Gly Ser Thr Gly Leu Thr Val Tyr Leu

165 170 175

Ala Gly Gly Gln Gly Gln Val Val Gly Gly Ser Val Val Gly Thr Leu

180 185 190

Ile Ala Ala Gly Pro Val Ile Val Ile Ala Ala Thr Phe Ala Asn Ala

195 200 205

Thr Tyr Glu Arg Leu Pro Ile Glu Glu Glu Glu Asp Ala Gly Ser Gly

210 215 220

Gly Gln Gly Gln Leu Gln Gly Gly Ala Gly Ser Ser Pro Pro Pro Ile

225 230 235 240

Gly Ser Ser Thr Gly Gln Gln Gln Pro Gly Met Pro Asp Leu Ser Ser

245 250 255

Leu Pro Val Tyr Asn Met Pro Pro Asn Leu Leu Gln Asn Gly Gly Gln

260 265 270

Met Asn Gln Gln Glu Ala Tyr Ala Trp Ala His Ala Arg Pro Pro Tyr

275 280 285

<210>7

<211>948

<212>DNA

<213>欧洲油菜(Brassica napus)

<400>7

atggcgaatc catggtggac aggacaagtg aatctctccg gcctcgaaac gacgccgccg 60

agttcctctc agttaaagac accagatctc cacatctcca tgaatatggc catggactca 120

ggtcataaca accaccacca tcatcaccaa gaagtcaaca ccaacaacaa caacgaagac 180

gatagagaca acttgagcgg cgacgaccac gagccacgtg aaggagccgt ggaagctccc 240

acgcgccgac cacgtggacg tcctgctggt tccaagaaca aaccaaagcc accaatcttt 300

gtcacgcgtg actctccaaa cgctctcaag agccatgtca tggagatcgc tagtgggact 360

gacgtcatcg aaaccctagc tactttcgct aggcggcgcc aacgtggcat ctgcatcttg 420

agcggtaacg gcacggtggc taacgtcaca ctccgtcaac catcagtggc tcccgttgca 480

gctgcccctg gtggtgcggc tgtattggcg ttacaaggga ggtttgagat tctttctcta 540

accggttctt tcttacctgg accggctcca cctggatcca ctggtttaac tatttactta 600

gctggtggtc aaggtcaggt tgttggagga agcgtggtgg ggccattgat ggctgctggt 660

ccggtgatgc taatcgctgc cacgttttct aatgcgactt atgagagatt acctttggat 720

gaggaagaag cggctgaaag aggtggcggt ggaagcgacg gaggagtggt tccagggcag 780

ctcgggggcg taggttcccc gctgagtagt ggtggcggtg gaggccatgg gaaccaagga 840

cttcccgcgt ataatatgcc cggaaatctt gcttctaatg gcggtggagg aggacagatg 900

agcggccaag aagcttacgg ttgggctcaa gctaggtcag gattttaa 948

<210>8

<211>315

<212>PRT

<213>欧洲油菜

<400>8

Met Ala Asn Pro Trp Trp Thr Gly Gln Val Asn Leu Ser Gly Leu Glu

1 5 10 15

Thr Thr Pro Pro Ser Ser Ser Gln Leu Lys Thr Pro Asp Leu His Ile

20 25 30

Ser Met Asn Met Ala Met Asp Ser Gly His Asn Asn His His His His

35 40 45

His Gln Glu Val Asn Thr Asn Asn Asn Asn Glu Asp Asp Arg Asp Asn

50 55 60

Leu Ser Gly Asp Asp His Glu Pro Arg Glu Gly Ala Val Glu Ala Pro

65 70 75 80

Thr Arg Arg Pro Arg Gly Arg Pro Ala Gly Ser Lys Asn Lys Pro Lys

85 90 95

Pro Pro Ile Phe Val Thr Arg Asp Ser Pro Asn Ala Leu Lys Ser His

100 105 110

Val Met Glu Ile Ala Ser Gly Thr Asp Val Ile Glu Thr Leu Ala Thr

115 120 125

Phe Ala Arg Arg Arg Gln Arg Gly Ile Cys Ile Leu Ser Gly Asn Gly

130 135 140

Thr Val Ala Asn Val Thr Leu Arg Gln Pro Ser Val Ala Pro Val Ala

145 150 155 160

Ala Ala Pro Gly Gly Ala Ala Val Leu Ala Leu Gln Gly Arg Phe Glu

165 170 175

Ile Leu Ser Leu Thr Gly Ser Phe Leu Pro Gly Pro Ala Pro Pro Gly

180 185 190

Ser Thr Gly Leu Thr Ile Tyr Leu Ala Gly Gly Gln Gly Gln Val Val

195 200 205

Gly Gly Ser Val Val Gly Pro Leu Met Ala Ala Gly Pro Val Met Leu

210 215 220

Ile Ala Ala Thr Phe Ser Asn Ala Thr Tyr Glu Arg Leu Pro Leu Asp

225 230 235 240

Glu Glu Glu Ala Ala Glu Arg Gly Gly Gly Gly Ser Asp Gly Gly Val

245 250 255

Val Pro Gly Gln Leu Gly Gly Val Gly Ser Pro Leu Ser Ser Gly Gly

260 265 270

Gly Gly Gly His Gly Asn Gln Gly Leu Pro Ala Tyr Asn Met Pro Gly

275 280 285

Asn Leu Ala Ser Asn Gly Gly Gly Gly Gly Gln Met Ser Gly Gln Glu

290 295 300

Ala Tyr Gly Trp Ala Gln Ala Arg Ser Gly Phe

305 310 315

<210>9

<211>978

<212>DNA

<213>芜青(Brassica rapa)

<400>9

ataatcagat acaatctatt tagggtttta atggcgaatc catggtggac aggacaagtg 60

aatctctccg gcctcgaaac gacgccgccg agttcctctc agttaaagac accagatctc 120

cacatctcca tgaatatggc catggactca ggtcataaca accaccacca tcatcaccaa 180

gaagtcaaca ccaacaacaa caacgaagac gatagagaca acttgagcgg cgacgaccac 240

gagccacgtg aaggagccgt ggaagctccc acgcgccgac cacgtggacg tcctgctggt 300

tccaagaaca aaccaaagcc accaatcttt gtcacgcgtg actctccaaa cgctctcaag 360

agccatgtca tggagatcgc tagtgggact gacgtcatcg aaaccctagc tactttcgct 420

aggcggcgcc aacgtggcat ctgcatcttg agcggtaacg gcacggtggc taacgtcaca 480

ctccgtcaac catcagtggc tcccgttgca gctgcccctg gtggtgcggc tgtattggcg 540

ttacaaggga ggtttgagat tctttctcta accggttctt tcttacctgg accggctcca 600

cctggatcca ctggtttaac tatttactta gctggtggtc aaggtcaggt tgttggagga 660

agcgtggtgg ggccattgat ggctgctggt ccggtgatgc taatcgctgc cacgttttct 720

aatgcgactt atgagagatt acctttggat gaggaagaag cggctgaaag aggtggcggt 780

ggaagcgacg gaggagtggt tccagggcag ctcgggggcg taggttcccc gctgagtagt 840

ggtggcggtg gaggccatgg gaaccaagga cttcccgcgt ataatatgcc cggaaatctt 900

gcttctaatg gcggtggagg aggacagatg agcggccaag aagcttacgg ttgggctcaa 960

gctaggtcag gattttaa 978

<210>10

<211>315

<212>PRT

<213>芜青

<400>l0

Met Ala Asn Pro Trp Trp Thr Gly Gln Val Asn Leu Ser Gly Leu Glu

1 5 10 15

Thr Thr Pro Pro Ser Ser Ser Gln Leu Lys Thr Pro Asp Leu His Ile

20 25 30

Ser Met Asn Met Ala Met Asp Ser Gly His Asn Asn His His His His

35 40 45

His Gln Glu Val Asn Thr Asn Asn Asn Asn Glu Asp Asp Arg Asp Asn

50 55 60

Leu Ser Gly Asp Asp His Glu Pro Arg Glu Gly Ala Val Glu Ala Pro

65 70 75 80

Thr Arg Arg Pro Arg Gly Arg Pro Ala Gly Ser Lys Asn Lys Pro Lys

85 90 95

Pro Pro Ile Phe Val Thr Arg Asp Ser Pro Asn Ala Leu Lys Ser His

100 105 110

Val Met Glu Ile Ala Ser Gly Thr Asp Val Ile Glu Thr Leu Ala Thr

115 120 125

Phe Ala Arg Arg Arg GlnArg Gly Ile Cys Ile Leu Ser Gly Asn Gly

130 135 140

Thr Val Ala Asn Val Thr Leu Arg Gln Pro Ser Val Ala Pro Val Ala

145 150 155 160

Ala Ala Pro Gly Gly Ala Ala Val Leu Ala Leu Gln Gly Arg Phe Glu

165 170 175

Ile Leu Ser Leu Thr Gly Ser Phe Leu Pro Gly Pro Ala Pro Pro Gly

180 185 190

Ser Thr Gly Leu Thr Ile Tyr Leu Ala Gly Gly Gln Gly Gln Val Val

195 200 205

Gly Gly Ser Val Val Gly Pro Leu MetAla Ala Gly Pro Val Met Leu

210 215 220

Ile Ala Ala Thr Phe Ser Asn Ala Thr Tyr Glu Arg Leu Pro Leu Asp

225 230 235 240

Glu Glu Glu Ala Ala Glu Arg Gly Gly Gly Gly Ser Asp Gly Gly Val

245 250 255

Val Pro Gly Gln Leu Gly Gly Val Gly Ser Pro Leu Ser Ser Gly Gly

260 265 270

Gly Gly Gly His Gly Asn Gln Gly Leu Pro Ala Tyr Asn Met Pro Gly

275 280 285

Asn Leu Ala Ser Asn Gly Gly Gly Gly Gly Gln Met Ser Gly Gln Glu

290 295 300

Ala Tyr Gly Trp Ala Gln Ala Arg Ser Gly Phe

305 310 315

<210>11

<211>843

<212>DNA

<213>大豆(Glycine max)

<400>11

atggccaacc ggtggtggac cgggtcggtg ggtctagaga actctggcca ctcgatgaaa 60

aaaccggatc tggggttttc catgaacgag agtacggtga cggggaacca tataggagaa 120

gaagatgagg acagagaaaa cagcgacgag ccaagagagg gagctattga cgtcgccacc 180

acgcgccgcc ctaggggacg tccaccgggc tccagaaaca agccgaaacc gccgatattc 240

gtcacccgag acagccctaa cgcgctgcgg agccacgtca tggagattgc cgtcggagcc 300

gacatcgccg actgcgtggc gcagttcgct cggaggcgcc agcgcggggt ttccattctc 360

agcggcagcg ggaccgtcgt caacgtcaat ctccggcaac ccacggcacc cggcgccgtc 420

atggcgctcc acggccgctt cgacatcctc tccctcaccg gctcctttct ccctgggccg 480

tcccctcccg gcgccaccgg gctcacaatc tacctcgccg gaggccaggg gcagatcgtc 540

ggcggcggag tggtgggccc gctcgtggcg gcgggccccg tattggtaat ggcggctact 600

ttttccaatg ctacgtatga aagattgcct ttagaggatg atgatcagga acaacacggc 660

ggcggaggcg gaggaggttc gccgcaggaa aaaaccgggg gtcccggcga ggcgtcgtcg 720

tcgatttcgg tttataacaa taatgttcct ccgagtttag gtcttccgaa tgggcaacat 780

ctgaaccatg aagcttattc ttctccttgg ggtcattctc ctcatgccag acctcctttc 840

taa 843

<210>12

<211>280

<212>PRT

<213>大豆

<400>12

Met Ala Asn Arg Trp Trp Thr Gly Ser Val Gly Leu Glu Asn Ser Gly

1 5 10 15

His Ser Met Lys Lys Pro Asp Leu Gly Phe Ser Met Asn Glu Ser Thr

20 25 30

Val Thr Gly Asn His Ile Gly Glu Glu Asp Glu Asp Arg Glu Asn Ser

35 40 45

Asp Glu Pro Arg Glu Gly Ala Ile Asp Val Ala Thr Thr Arg Arg Pro

50 55 60

Arg Gly Arg Pro Pro Gly Ser Arg Asn Lys Pro Lys Pro Pro Ile Phe

65 70 75 80

Val Thr Arg Asp Ser Pro Asn Ala Leu Arg Ser His Val Met Glu Ile

85 90 95

Ala Val Gly Ala Asp Ile Ala Asp Cys Val Ala Gln Phe Ala Arg Arg

100 105 110

Arg Gln Arg Gly Val Ser Ile Leu Ser Gly Ser Gly Thr Val Val Asn

115 120 125

Val Asn Leu Arg Gln Pro Thr Ala Pro Gly Ala Val Met Ala Leu His

130 135 140

Gly Arg Phe Asp Ile Leu Ser Leu Thr Gly Ser Phe Leu Pro Gly Pro

145 150 155 160

Ser Pro Pro Gly Ala Thr Gly Leu Thr Ile Tyr Leu Ala Gly Gly Gln

165 170 175

Gly Gln Ile Val Gly Gly Gly Val Val Gly Pro Leu Val Ala Ala Gly

180 185 190

Pro Val Leu Val Met Ala Ala Thr Phe Ser Asn Ala Thr Tyr Glu Arg

195 200 205

Leu Pro Leu Glu Asp Asp Asp Gln Glu Gln His Gly Gly Gly Gly Gly

210 215 220

Gly Gly Ser Pro Gln Glu Lys Thr Gly Gly Pro Gly Glu Ala Ser Ser

225 230 235 240

Ser Ile Ser Val Tyr Asn Asn Asn Val Pro Pro Ser Leu Gly Leu Pro

245 250 255

Asn Gly Gln His Leu Asn His Glu Ala Tyr Ser Ser Pro Trp Gly His

260 265 270

Ser Pro His Ala Arg Pro Pro Phe

275 280

<210>13

<211>834

<212>DNA

<213>陆地棉(Gossypium hirsutum)

<400>13

atggacccgg caggcaattc accagcttta aacaaacgtg accttgaaat ttctatgaac 60

gatgctaaca aaagtagaag caacggaaga ggggatgatg atgatgaaga tagagacacc 120

ggcgatgagc ctaaagaagg agcggtcgag gtcggtaacc gaagaccccg aggtcgtcca 180

ccgggatcca aaaacaagcc taaaccaccc atttttgtga caagggatag ccctaacgcg 240

ctccgtagtc atgttatgga agtcgcaagt ggaaccgatg tagccgagag tatagcccaa 300

ttcgctcgga gaagacaacg tggagtttgt ttgcttagcg gcagcggctc ggtcgccaac 360

gttactctaa gacaaccggc agcacccggc gcggtggttg cccttcatgg aaggtttgaa 420

attttgtctt tgaccggggc ttttctcccc ggaccggctc caccgggatc gacagggctc 480

accgtgtact tagctggtgg tcaaggacaa gttgttggag gaagtgttgt cggctcactt 540

atagcagcag ggcctgttat ggtcattgca gcaacttttt ccaacgcaac ttatgaaaga 600

ctgcctttag aagatgaaga agaagttgta agcgccggtc acggtggacc gatgcaaggc 660

ggagcaaacg attcaccgcc ggaaattggg agtagcggag gcggcggttc acacacaggt 720

ctgcctgatc catcttcact tccaatatac aatttgcctc ctaatttact ctcaaatgga 780

gggcaactag ggcatgaacc ctatggttgg acacatggga gaccacccta ttaa 834

<210>14

<211>277

<212>PRT

<213>陆地棉

<400>14

Met Asp Pro Ala Gly Asn Ser Pro Ala Leu Asn Lys Arg Asp Leu Glu

1 5 10 15

Ile Ser Met Asn Asp Ala Asn Lys Ser Arg Ser Asn Gly Arg Gly Asp

20 25 30

Asp Asp Asp Glu Asp Arg Asp Thr Gly Asp Glu Pro Lys Glu Gly Ala

35 40 45

Val Glu Val Gly Asn Arg Arg Pro Arg Gly Arg Pro Pro Gly Ser Lys

50 55 60

Asn Lys Pro Lys Pro Pro Ile Phe Val Thr Arg Asp Ser Pro Asn Ala

65 70 75 80

Leu Arg Ser His Val Met Glu Val Ala Ser Gly Thr Asp Val Ala Glu

85 90 95

Ser Ile Ala Gln Phe Ala Arg Arg Arg Gln Arg Gly Val Cys Leu Leu

100 105 110

Ser Gly Ser Gly Ser Val Ala Asn Val Thr Leu Arg Gln Pro Ala Ala

115 120 125

Pro Gly Ala ValVal Ala Leu His Gly Arg Phe Glu Ile Leu Ser Leu

130 135 140

Thr Gly Ala Phe Leu Pro Gly Pro Ala Pro Pro Gly Ser Thr Gly Leu

145 150 155 160

Thr Val Tyr Leu Ala Gly Gly Gln Gly Gln Val Val Gly Gly Ser Val

165 170 175

Val Gly Ser Leu Ile Ala Ala Gly Pro Val Met Val Ile Ala Ala Thr

180 185 190

Phe Ser Asn Ala Thr Tyr Glu Arg Leu Pro Leu Glu Asp Glu Glu Glu

195 200 205

Val Val Ser Ala Gly His Gly Gly Pro Met Gln Gly Gly Ala Asn Asp

210 215 220

Ser Pro Pro Glu Ile Gly Ser Ser Gly Gly Gly Gly Ser His Thr Gly

225 230 235 240

Leu Pro Asp Pro Ser Ser Leu Pro Ile Tyr Asn Leu Pro Pro Asn Leu

245 250 255

Leu Ser Asn Gly Gly Gln Leu Gly His Glu Pro Tyr Gly Trp Thr His

260 265 270

Gly Arg Pro Pro Tyr

275

<210>15

<211>813

<212>DNA

<213>莴苣(Lactuca sativa)

<400>15

atgtctaacc gatggtggac cggccaggtc aacgtggcag gcgtagaaac atcatctcag 60

gcgatcaaga aaccagatct gggtatctca atgaatgata ccaccacagg aagtgaagaa 120

gatgaaagag acaacaacag cgatgatcca agagaaggtg caattgaccc ttc taaccgt 180

aggccacgag gccgacctcc gggatccaaa aacaaaccaa agccaccgat tttcgtcacc 240

agagacagcc ctaacgccct ccgcagccac gtcatggagg tagcgagtgg tacagatatc 300

gcagaaagta tagctcaatt cagccgaaaa cgacaacgcg gtgtgtgtgt gatgagtgct 360

agcggcacag tcatgaatgt aaccctaaga caaccttcgg cacctggctc agtcatggct 420

ctacaaggcc ggttcgagat tttatcccta accggtgcct tcttaccggg tccttctcct 480

cctggatcca ccgggctcac tatatattta gctggtggcc agggccaggt tgtgggcggt 540

agcgtggtgg gatcattggt ggcatcagga ccagtgatgg ttatagcagc cacgttctcc 600

aacgccacat atgaaagact cccggttgag gaagaggagg aagcagatac cgtgacacct 660

gggctaggtg gtggtggatc accaccgcaa ctcggaatgg gtgatcagaa tccgatggca 720

gggtataata tgcagccgaa tttgatcccg aatggtggtg gacagatgaa ccatgaagct 780

tttgctttgg ctcatggccg gcccacgtac tag 813

<210>16

<211>270

<212>PRT

<213>莴苣

<400>16

Met Ser Asn Arg Trp Trp Thr Gly Gln Val Asn Val Ala Gly Val Glu

1 5 10 15

Thr Ser Ser Gln Ala Ile Lys Lys Pro Asp Leu Gly Ile Ser Met Asn

20 25 30

Asp Thr Thr Thr Gly Ser Glu Glu Asp Glu Arg Asp Asn Asn Ser Asp

35 40 45

Asp Pro Arg Glu Gly Ala Ile Asp Pro Ser Asn Arg Arg Pro Arg Gly

50 55 60

Arg Pro Pro Gly Ser Lys Asn Lys Pro Lys Pro Pro Ile Phe Val Thr

65 70 75 80

Arg Asp Ser Pro Asn Ala Leu Arg Ser His Val Met Glu Val Ala Ser

85 90 95

Gly Thr Asp Ile Ala Glu Ser Ile Ala Gln Phe Ser Arg Lys Arg Gln

100 105 110

Arg Gly Val Cys Val Met Ser Ala Ser Gly Thr Val Met Asn Val Thr

115 120 125

Leu Arg Gln Pro Ser Ala Pro Gly Ser Val Met Ala Leu Gln Gly Arg

130 135 140

Phe Glu Ile Leu Ser Leu Thr Gly Ala Phe Leu Pro Gly Pro Ser Pro

145 150 155 160

Pro Gly Ser Thr Gly Leu Thr Ile Tyr Leu Ala Gly Gly Gln Gly Gln

165 170 175

Val Val Gly Gly Ser Val Val Gly Ser Leu Val Ala Ser Gly Pro Val

180 185 190

Met Val Ile Ala Ala Thr Phe Ser Asn Ala Thr Tyr Glu Arg Leu Pro

195 200 205

Val Glu Glu Glu Glu Glu Ala Asp Thr Val Thr Pro Gly Leu Gly Gly

210 215 220

Gly Gly Ser Pro Pro Gln Leu Gly Met Gly Asp Gln Asn Pro Met Ala

225 230 235 240

Gly Tyr Asn Met Gln Pro Asn Leu Ile Pro Asn Gly Gly Gly Gln Met

245 250 255

Asn His Glu Ala Phe Ala Leu Ala His Gly Arg Pro Thr Tyr

260 265 270

<210>17

<211>882

<212>DNA

<213>日本百脉根(Lotus japonicus)

<400>17

atggctaatc cttggtggac aagccaggga gggttctctg gggttgaccc aggaacccat 60

tcacctggct tgagcaaacg tcacacggac cttgtgatca atgaaaacag cagcggtggt 120

aatagagatg aagatgaaga tgataacagg gaagatgagc caaaagaagg tgcagttgag 180

gttggaactc ggagaccaag gggaagacca ccgggatcca agaacaagcc aagaccaccc 240

atctttgtaa caagggacag cccaaacgcc ctgaggagtc atgttatgga ggttgcagga 300

ggagctgatg tcgcagaaag cgtggcccag tttgcgagga ggcgccagcg tggggtttgt 360

gtgatgagcg ggagtggctc tgtggcaaac gttaccctga gacaacctgc ggctccgggt 420

gctgttgtag cactccatgg caggtttgag atcttatccc taactggggc gttcctacct 480

ggccctgctc ctccaggatc cactggtcta acagtgtatc tttctggagg acagggtcag 540

gtagtgggag ggagtgtggt ggggtctcta gttgcagcag gaccagttat ggtcattgct 600

gcaacttttg ctaatgcaac atatgagagg ttgccacttg atgatgatga tgagggacct 660

agtggggccg ctacggcggc aagcggagga ggaagtggat cgtctcctcc acctggaatt 720

ggaattggca gtggtggggg tcatcaactg caggctggac tggttccaga tccatcatcc 780

atgccgttgt ataatctgcc accaaatctg ttgtccaatg gaggaggagg acaagtgggg 840

catgatgctc ttgcttgggc tcatggaaga acaccttact ga 882

<210>18

<211>293

<212>PRT

<213>日本百脉根

<400>18

Met Ala Asn Pro Trp Trp Thr Ser Gln Gly Gly Phe Ser Gly Val Asp

1 5 10 15

Pro Gly Thr His Ser Pro Gly Leu Ser Lys Arg His Thr Asp Leu Val

20 25 30

Ile Asn Glu Asn Ser Ser Gly Gly Asn Arg Asp Glu Asp Glu Asp Asp

35 40 45

Asn Arg Glu Asp Glu Pro Lys Glu Gly Ala Val Glu Val Gly Thr Arg

50 55 60

Arg Pro Arg Gly Arg Pro Pro Gly Ser Lys Asn Lys Pro Arg Pro Pro

65 70 75 80

Ile Phe Val Thr Arg Asp Ser Pro Asn Ala Leu Arg Ser His Val Met

85 90 95

Glu Val Ala Gly Gly Ala Asp Val Ala Glu Ser Val Ala Gln Phe Ala

100 105 110

Arg Arg Arg Gln Arg Gly Val Cys Val Met Ser Gly Ser Gly Ser Val

115 120 125

Ala Asn Val Thr Leu Arg Gln Pro Ala Ala Pro Gly Ala Val Val Ala

130 135 140

Leu His Gly Arg Phe Glu Ile Leu Ser Leu Thr Gly Ala Phe Leu Pro

145 150 155 160

Gly Pro Ala Pro Pro Gly Ser Thr Gly Leu Thr Val Tyr Leu Ser Gly

165 170 175

Gly Gln Gly Gln Val Val Gly Gly Ser Val Val Gly Ser Leu Val Ala

180 185 190

Ala Gly Pro Val Met ValIle Ala Ala Thr Phe Ala Asn Ala Thr Tyr

195 200 205

Glu Arg Leu Pro Leu Asp Asp Asp Asp Glu Gly Pro Ser Gly Ala Ala

210 215 220

Thr Ala Ala Ser Gly Gly Gly Ser Gly Ser Ser Pro Pro Pro Gly Ile

225 230 235 240

Gly Ile Gly Ser Gly Gly Gly His Gln Leu Gln Ala Gly Leu Val Pro

245 250 255

Asp Pro Ser Ser Met Pro Leu Tyr Asn Leu Pro Pro Asn Leu Leu Ser

260 265 270

Asn Gly Gly Gly Gly Gln Val Gly His Asp Ala Leu Ala Trp Ala His

275 280 285

Gly Arg Thr Pro Tyr

290

<210>19

<211>708

<212>DNA

<213>稻(Oryza sativa)

<400>19

atggcgtcca aggagccaag cggcgaccac gaccacgaga tgaacgggac cagcgccggg 60

ggcggcgagc ccaaggacgg cgcggtggtg accggccgca accggcgccc ccgcggacgg 120

ccgccgggct ccaagaacaa gcccaagccg cccatcttcg tgacgcggga cagcccgaac 180

gcgctgcgca gccacgtcat ggaggtggcc ggcggcgccg atgtcgccga gtccatcgcg 240

cacttcgcgc ggcggcggca gcgcggcgtc tgcgtgctca gcggggccgg caccgtgacc 300

gacgtggccc tgcgccagcc ggccgcgccg agcgccgtgg tggcgctccg tgggcggttc 360

gagatcctgt ccctgacggg gacgttcctg ccggggccgg cgccgccggg ctccaccggg 420

ctgaccgtgt acctcgccgg cgggcagggg caggtggtgg gcggcagcgt ggtggggacg 480

ctcaccgcgg cggggccggt catggtgatc gcctccacct tcgccaacgc cacctacgag 540

aggctgccgc tggatcagga ggaggaggaa gcagcggcag gcggcatgat ggcgccgccg 600

ccactcatgg ccggcgccgc cgatccacta cttttcggcg ggggaatgca cgacgccggg 660

cttgctgcat ggcaccatgc ccgccctccg ccgccgccgc cctactag 708

<210>20

<211>235

<212>PRT

<213>稻

<400>20

Met Ala Ser Lys Glu Pro Ser Gly Asp His Asp His Glu Met Asn Gly

1 5 10 15

Thr Ser Ala Gly Gly Gly Glu Pro Lys Asp Gly Ala Val Val Thr Gly

20 25 30

Arg Asn Arg Arg Pro Arg Gly Arg Pro Pro Gly Ser Lys Asn Lys Pro

35 40 45

Lys Pro Pro Ile Phe Val Thr Arg Asp Ser Pro Asn Ala Leu Arg Ser

50 55 60

His Val Met Glu Val Ala Gly Gly Ala Asp Val Ala Glu Ser Ile Ala

65 70 75 80

His Phe Ala Arg Arg Arg Gln Arg Gly Val Cys Val Leu Ser Gly Ala

85 90 95

Gly Thr Val Thr Asp Val Ala Leu Arg Gln Pro Ala Ala Pro Ser Ala

100 105 110

Val Val Ala Leu Arg Gly Arg Phe Glu Ile Leu Ser Leu Thr Gly Thr

115 120 125

Phe Leu Pro Gly Pro Ala Pro Pro Gly Ser Thr Gly Leu Thr Val Tyr

130 135 140

Leu Ala Gly Gly Gln Gly Gln Val Val Gly Gly Ser Val Val Gly Thr

145 150 155 160

Leu Thr Ala Ala Gly Pro Val Met Val Ile Ala Ser Thr Phe Ala Asn

165 170 175

Ala Thr Tyr Glu Arg Leu Pro Leu Asp Gln Glu Glu Glu Glu Ala Ala

180 185 190

Ala Gly Gly Met Met Ala Pro Pro Pro Leu Met Ala Gly Ala Ala Asp

195 200 205

Pro Leu Leu Phe Gly Gly Gly Met His Asp Ala Gly Leu Ala Ala Trp

210 215 220

His His Ala Arg Pro Pro Pro Pro Pro Pro Tyr

225 230 235

<210>21

<211>801

<212>DNA

<213>稻

<400>21

atgggcttgc cggagcagcc gtccggctcg tcgggcccca aggcggagct cccggtggcc 60

aaggagccgg aggcgagccc gacggggggc gcggcggcgg accacgccga cgagaacaac 120

gaatccggcg gcggcgagcc gcgggagggc gccgtggtgg cggcgcccaa ccggcgcccc 180

cgcggccgcc cgccgggctc caagaacaag ccgaagccgc ccatcttcgt gacgcgcgac 240

agccccaacg cgctgcgcag tcacgtcatg gaggtggccg gcggcgccga cgtcgccgac 300

gccatcgcgc agttctcgcg ccgccgccag cgcggcgtct gcgtgctcag cggcgccggg 360

acggtcgcca acgtcgcgct gcgccagccg tcggcgcccg gcgccgtcgt cgccctgcac 420

ggccgcttcg agatcctctc cctcaccggc accttcctcc caggcccggc gcctccgggt 480

tccacggggc tcaccgtcta cctcgccggc ggccagggcc aggttgtcgg cggcagcgtc 540

gtggggtcgc tcatcgccgc gggcccggtc atggtgatcg cgtccacgtt cgccaacgcc 600

acctacgagc gcctgccact ggaggaagaa gaggagggct caggcccgcc catgcccggc 660

ggcgccgagc ccctcatggc cggcggccac ggcatcgccg acccttcggc gctgccaatg 720

ttcaacctgc cgccgagcaa cgggctcggc ggcggcggcg acggcttccc atgggcggcg 780

cacccctgcc caccgtactg a 800

<210>22

<211>266

<212>PRT

<213>稻

<400>22

Met Gly Leu Pro Glu Gln Pro Ser Gly Ser Ser Gly Pro Lys Ala Glu

1 5 10 15

Leu Pro Val Ala Lys Glu Pro Gl u Ala Ser Pro Thr Gly Gly Ala Ala

20 25 30

Ala Asp His Ala Asp Glu Asn Asn Glu Ser Gly Gly Gly Glu Pro Arg

35 40 45

Glu Gly Ala Val Val Ala Ala Pro Asn Arg Arg Pro Arg Gly Arg Pro

50 55 60

Pro Gly Ser Lys Asn Lys Pro Lys Pro Pro Ile Phe Val Thr Arg Asp

65 70 75 80

Ser Pro Asn Ala Leu Arg Ser His Val Met Glu Val Ala Gly Gly Ala

85 90 95

Asp Val Ala Asp Ala Ile Ala Gln Phe Ser Arg Arg Arg Gln Arg Gly

100 105 110

Val Cys Val Leu Ser Gly Ala Gly Thr Val Ala Asn Val Ala Leu Arg

115 120 125

Gln Pro Ser Ala Pro Gly Ala Val Val Ala Leu His Gly Arg Phe Glu

130 135 140

Ile Leu Ser Leu Thr Gly Thr Phe Leu Pro Gly Pro Ala Pro Pro Gly

145 150 155 160

Ser Thr Gly Leu Thr Val Tyr Leu Ala Gly Gly Gln Gly Gln Val Val

165 170 175

Gly Gly Ser Val Val Gly Ser Leu Ile Ala Ala Gly Pro Val Met Val

180 185 190

Ile Ala Ser Thr Phe Ala Asn Ala Thr Tyr Glu Arg Leu Pro Leu Glu

195 200 205

Glu Glu Glu Glu Gly Ser Gly Pro Pro Met Pro Gly Gly Ala Glu Pro

210 215 220

Leu Met Ala Gly Gly His Gly Ile Ala Asp Pro Ser Ala Leu Pro Met

225 230 235 240

Phe Asn Leu Pro Pro Ser Asn Gly Leu Gly Gly Gly Gly Asp Gly Phe

245 250 255

Pro Trp Ala Ala His Pro Cys Pro Pro Tyr

260 265

<210>23

<211>855

<212>DNA

<213>似欧洲山杨(Populus tremuloides)

<400>23

atggcaaacc ggtggtggac agggcaagtg ggattgccgg ggatggacac atcaaccagt 60

tcatcatctc caatgaaaaa gccagatcta ggtatatcca tgtccaacaa caatagagaa 120

gccaccgaga gtggtgctgg caaagaagat gagcaagaag acgaaagaga aaatagcgac 180

gagcctagag aaggcgctat agatatcgcc tctcgccgcc ctagaggccg tccaccaggg 240

tccaagaaca agcctaagcc accaattttc gttactcgag acagccctaa tgcactcaag 300

agtcatgtga tggagatagc tagtggatct gatatagctg aaaatttagc ttgttttgca 360

aggaagagac aaagaggagt ttgtgtgctt agtggaagtg gtatggtaac caatgtaacc 420

ctcaagcaac cttctgcctc aggtgctgtt atggctctcc atggtaggtt tgagattttg 480

tcactcactg gagcgttctt gcctggacca gccccacctg gagcgacagg actaactata 540

tatttagccg gagggcaagg acaagtggta ggaggcagtg tggtaggatc actagttgca 600

tcaggaccgg taatggttat tgctgcaaca ttttcaaatg ctacttatga gagattgcca 660

ctagaagatg aagaggaagg cagtggtggc gcacaagggc agctcggtgg cggcaacggt 720

agcggtgagg gtaatggtgg gggcatgggg gatccagcaa catcaatgcc agtttatcaa 780

ttgccaaata tggtgcctaa tggacaattg aaccatgaag gatatgggtg ggctcacggc 840

agaccaccct attag 855

<210>24

<211>284

<212>PRT

<213>似欧洲山杨

<400>24

Met Ala Asn Arg Trp Trp Thr Gly Gln Val Gly Leu Pro Gly Met Asp

1 5 10 15

Thr Ser Thr Ser Ser Ser Ser Pro Met Lys Lys Pro Asp Leu Gly Ile

20 25 30

Ser Met Ser Asn Asn Asn Arg Glu Ala Thr Glu Ser Gly Ala Gly Lys

35 40 45

Glu Asp Glu Gln Glu Asp Glu Arg Glu Asn Ser Asp Glu Pro Arg Glu

50 55 60

Gly Ala Ile Asp Ile Ala Ser Arg Arg Pro Arg Gly Arg Pro Pro Gly

65 70 75 80

Ser Lys Asn Lys Pro Lys Pro Pro Ile Phe Val Thr Arg Asp Ser Pro

85 90 95

Asn Ala Leu Lys Ser His Val Met Glu Ile Ala Ser Gly Ser Asp Ile

100 105 110

Ala Glu Asn Leu Ala Cys Phe Ala Arg Lys Arg Gln Arg Gly Val Cys

115 120 125

Val Leu Ser Gly Ser Gly Met Val Thr Asn Val Thr Leu Lys Gln Pro

130 135 140

Ser Ala Ser Gly Ala Val Met Ala Leu His Gly Arg Phe Glu Ile Leu

145 150 155 160

Ser Leu Thr Gly Ala Phe Leu Pro Gly Pro Ala Pro Pro Gly Ala Thr

165 170 175

Gly Leu Thr Ile Tyr Leu Ala Gly Gly Gln Gly Gln Val Val Gly Gly

180 185 190

Ser Val Val Gly Ser Leu Val Ala Ser Gly Pro Val Met Val Ile Ala

195 200 205

Ala Thr Phe Ser Asn Ala Thr Tyr Glu Arg Leu Pro Leu Glu Asp Glu

210 215 220

Glu Glu Gly Ser Gly Gly Ala Gln Gly Gln Leu Gly Gly Gly Asn Gly

225 230 235 240

Ser Gly Glu Gly Asn Gly Gly Gly Met Gly Asp Pro Ala Thr Ser Met

245 250 255

Pro Val Tyr Gln Leu Pro Asn Met Val Pro Asn Gly Gln Leu Asn His

260 265 270

Glu Gly Tyr Gly Trp Ala His Gly Arg Pro Pro Tyr

275 280

<210>25

<211>885

<212>DNA

<213>马铃薯(Solanum tuberosum)

<400>25

atgtcaaacc catggtggac aggccaagta ggtttacaag gagttgaaac atcatcatcc 60

gcgggttcgc cttctctcaa gaagccagat ctaggcgtat caatgaacga tatagtgggt 120

ggtagtggta gtcatgatga agatagggac catagcgacg accctaaaga gggtgcagtc 180

gaagtagcca ctcgtcgacc cagaggtcga ccagctggct caaagaacaa acctaaacca 240

ccaatatttg ttacaaggga tagccctaac gcacttagaa gccacgtaat ggaagttgct 300

aatggagctg atgtggcgga aagtatagct caatttgcta ggaaaagaca aagaggtgtt 360

tgtgttttga gtgctactgg aactgttact aatgtaaccc taagacaacc atctgctcct 420

ggagctgtca tggcattaca cggccggttc gagatcttat cgttgaccgg agctttctta 480

cctggacccg cccctcctgg atcaacaggg ttgactatat acctagcagg aggacaagga 540

caagttgtgg gaggaagtgt agtagggtct ttagtggctt ccggaccagt tatggtaatt 600

gcatcaactt tttttaatgc aacatatgag aggctacctt tggaggagga ggaagaaggc 660

ggtggaacgg tggcccaagg acaacttggt ggtggtggat cgccaccggg aatgggagga 720

agtggtggtg gtggtggagg acaacaacaa caaggtggtg gtggtatggg tgatattcca 780

tcatcaaata tgccagtata taatttgcca ccaaatttgc taccaaatgg tggacaaatg 840

aaccatgaag catttggttg ggcacatgga cgccctcctt tttaa 885

<210>26

<211>294

<212>PRT

<213>马铃薯

<400>26

Met Ser Asn Pro Trp Trp Thr Gly Gln Val Gly Leu Gln Gly Val Glu

1 5 10 15

Thr Ser Ser Ser Ala Gly Ser Pro Ser Leu Lys Lys Pro Asp Leu Gly

20 25 30

Val Ser Met Asn Asp Ile Val Gly Gly Ser Gly Ser His Asp Glu Asp

35 40 45

Arg Asp His Ser Asp Asp Pro Lys Glu Gly Ala Val Glu Val Ala Thr

50 55 60

Arg Arg Pro Arg Gly Arg Pro Ala Gly Ser Lys Asn Lys Pro Lys Pro

65 70 75 80

Pro Ile Phe Val Thr Arg Asp Ser Pro Asn Ala Leu Arg Ser His Val

85 90 95

Met Glu Val Ala Asn Gly Ala Asp Val Ala Glu Ser Ile Ala Gln Phe

100 105 110

Ala Arg Lys Arg Gln Arg Gly Val Cys Val Leu Ser Ala Thr Gly Thr

115 120 125

Val Thr Asn Val Thr Leu Arg Gln Pro Ser Ala Pro Gly Ala Val Met

130 135 140

Ala Leu His Gly Arg Phe Glu Ile Leu Ser Leu Thr Gly Ala Phe Leu

145 150 155 160

Pro Gly Pro Ala Pro Pro Gly Ser Thr Gly Leu Thr Ile Tyr Leu Ala

165 170 175

Gly Gly Gln Gly Gln Val Val Gly Gly Ser Val Val Gly Ser Leu Val

180 185 190

Ala Ser Gly Pro Val Met Val Ile Ala Ser Thr Phe Phe Asn Ala Thr

195 200 205

Tyr Glu Arg Leu Pro Leu Glu Glu Glu Glu Glu Gly Gly Gly Thr Val

210 215 220

Ala Gln Gly Gln Leu Gly Gly Gly Gly Ser Pro Pro Gly Met Gly Gly

225 230 235 240

Ser Gly Gly Gly Gly Gly Gly Gln Gln Gln Gln Gly Gly Gly Gly Met

245 250 255

Gly Asp Ile Pro Ser Ser Asn Met Pro Val Tyr Asn Leu Pro Pro Asn

260 265 270

Leu Leu Pro Asn Gly Gly Gln Met Asn His Glu Ala Phe Gly Trp Ala

275 280 285

His Gly Arg Pro Pro Phe

290

<210>27

<211>939

<212>DNA

<213>天蓝遏蓝菜

<400>27

atggcgaatc catggtggac aggacaagtg aatctctccg gccttgaaac gacgccgcct 60

ggttcctctc agttaaagaa atcagatctc cacatctcca tgaacatggc catggactca 120

ggtcataaca accatcatca tcaccaagaa gtcgacaaca ataacaacaa cgatgacgac 180

agagataact tgagcggcga tgaacacgag ccacgtgaag gagccgtaga agcccccacg 240

cgccgtccac gtggacgtcc tgctggttcc aagaacaaac caaagccacc gatctttgtc 300

acgcgcgatt ctccaaacgc tctcaagagc catgtcatgg agatcgctag tgggactgac 360

gtcatcgaaa ccctagctac tttcgctagg cggcgccaac gtggcatctg catcttgagc 420

ggcaacggca cggtggctaa cgtcactctc cgccaaccat catctgccgc agttgctgcg 480

gctcccgggg gtgcggcggt tttggcttta caagggaggt ttgagattct ctctttaaca 540

ggatcgttct tgcctggacc tgctccacct ggatccaccg gtttaaccat ctacttagcc 600

ggtggtcaag gtcaggtcgt tggaggaagt gtggtggggc cat tgatggc ggctggtccg 660

gttatgttaa tcgcggccac gttttctaat gcgacttacg agagattgcc tttggaggag 720

gaagaggcgg ctgagagagg cggtggagga ggcagcgtcc caggacaact cggaggggga 780

ggctcgccgc tgagtagcgg tggtggtgga ggggatggca atcaaggact tccggtgtac 840

aatatgcccg gaaatcttgt ttctaatggt ggcggaggcg gaggacagat gagtggccaa 900

gaagcttatg gttgggctca agctaggtca ggattttaa 939

<210>28

<211>312

<212>PRT

<213>天蓝遏蓝菜

<400>28

Met Ala Asn Pro Trp Trp Thr Gly Gln Val Asn Leu Ser Gly Leu Glu

1 5 10 15

Thr Thr Pro Pro Gly Ser Ser Gln Leu Lys Lys Ser Asp Leu His Ile

20 25 30

Ser Met Asn Met Ala Met Asp Ser Gly His Asn Asn His His His His

35 40 45

Gln Glu Val Asp Asn Asn Asn Asn Asn Asp Asp Asp Arg Asp Asn Leu

50 55 60

Ser Gly Asp Glu His Glu Pro Arg Glu Gly Ala Val Glu Ala Pro Thr

65 70 75 80

Arg Arg Pro Arg Gly Arg Pro Ala Gly Ser Lys Asn Lys Pro Lys Pro

85 90 95

Pro Ile Phe Val Thr Arg Asp Ser Pro Asn Ala Leu Lys Ser His Val

100 105 110

Met Glu Ile Ala Ser Gly Thr Asp Val Ile Glu Thr Leu Ala Thr Phe

115 120 125

Ala Arg Arg Arg Gln Arg Gly Ile Cys Ile Leu Ser Gly Asn Gly Thr

130 135 140

Val Ala Asn Val Thr Leu Arg Gln Pro Ser Ser Ala Ala Val Ala Ala

145 150 155 160

Ala Pro Gly Gly Ala Ala Val Leu Ala Leu Gln Gly Arg Phe Glu Ile

165 170 175

Leu Ser Leu Thr Gly Ser Phe Leu Pro Gly Pro Ala Pro Pro Gly Ser

180 185 190

Thr Gly Leu Thr Ile Tyr Leu Ala Gly Gly Gln Gly Gln Val Val Gly

195 200 205

Gly Ser Val Val Gly Pro Leu Met Ala Ala Gly Pro Val Met Leu Ile

210 215 220

Ala Ala Thr Phe Ser Asn Ala Thr Tyr Glu Arg Leu Pro Leu Glu Glu

225 230 235 240

Glu Glu Ala Ala Glu Arg Gly Gly Gly Gly Gly Ser Val Pro Gly Gln

245 250 255

Leu Gly Gly Gly Gly Ser Pro Leu Ser Ser Gly Gly Gly Gly Gly Asp

260 265 270

Gly Asn Gln Gly Leu Pro Val Tyr Asn Met Pro Gly Asn Leu Val Ser

275 280 285

Asn Gly Gly Gly Gly Gly Gly Gln Met Ser Gly Gln Glu Ala Tyr Gly

290 295 300

Trp Ala Gln Ala Arg Ser Gly Phe

305 310

<210>29

<211>876

<212>DNA

<213>葡萄(Vitis vinifera)

<400>29

atggcgaacc ggtggtgggc tgggcaggtg ggtctgcaag gtgtagatac ctcatcagct 60

tcacctgcaa tgaagaaacc agatctggga atatccatga atgaaaatgg aggaagcggg 120

agcggaggcg gaggagagga agaagaggaa aaagaaaaca gtgatgagcc cagagagggt 180

gcaattgagg tggctacgcg caggcctagg ggccggccgc ctggctccaa gaacaagcca 240

aaacctccga tttttgtgac aagggacagc cctaacgctc tgcgcagcca cgttatggag 300

gtggcaaacg gctccgacat cacagaaagc atagcccaat tcgcgagaag gcggcaacga 360

ggcgtctgcg tgctcagcgc aagtgggaca gtcatgaacg taacgcttcg ccagccttct 420

gcccctggtg gtgcagttat ggcacttcat ggccgattcg aaattctttc cttaaccggc 480

gcgttcctac cgggaccagc gccaccaggc tccactggac taaccatata cctagcaggc 540

ggtcaagctc aggtcgtggg tggtagcgtg gtgggttcac tcatagcggc aggtccagtt 600

atggtgattg cagctacctt ttcgaatgca acctacgaga ggctccccct agaagacgaa 660

gaagaggcgg gcagcgcagc acaggagcag ctcgctggcg gcggaggcgg tggtgggtca 720

ccgccaggga ttggcggcag tggggggcag cagcaggcag ggatggcaga tccttcctcc 780

atgccggttt ataatttgcc accaaatttg cttccaaatg gtggacaact gaaccatgat 840

gcttatggtt gggcacatgg gcgccagcct tactag 876

<210>30

<211>291

<212>PRT

<213>葡萄

<400>30

Met Ala Asn Arg Trp Trp Ala Gly Gln Val Gly Leu Gln Gly Val Asp

1 5 10 15

Thr Ser Ser Ala Ser Pro Ala Met Lys Lys Pro Asp Leu Gly Ile Ser

20 25 30

Met Asn Glu Asn Gly Gly Ser Gly Ser Gly Gly Gly Gly Glu Glu Glu

35 40 45

Glu Glu Lys Glu Asn Ser Asp Glu Pro Arg Glu Gly Ala Ile Glu Val

50 55 60

Ala Thr Arg Arg Pro Arg Gly Arg Pro Pro Gly Ser Lys Asn Lys Pro

65 70 75 80

Lys Pro Pro Ile Phe Val Thr Arg Asp Ser Pro Asn Ala Leu Arg Ser

85 90 95

His Val Met Glu Val Ala Asn Gly Ser Asp Ile Thr Glu Ser Ile Ala

100 105 110

Gln Phe Ala Arg Arg Arg Gln Arg Gly Val Cys Val Leu Ser Ala Ser

115 120 125

Gly Thr Val Met Asn Val Thr Leu Arg Gln Pro Ser Ala Pro Gly Gly

130 135 140

Ala Val Met Ala Leu His Gly Arg Phe Glu Ile Leu Ser Leu Thr Gly

145 150 155 160

Ala Phe Leu Pro Gly Pro Ala Pro Pro Gly Ser Thr Gly Leu Thr Ile

165 170 175

Tyr Leu Ala Gly Gly Gln Ala Gln Val Val Gly Gly Ser Val Val Gly

180 185 190

Ser Leu Ile Ala Ala Gly Pro Val Met Val Ile Ala Ala Thr Phe Ser

195 200 205

Asn Ala Thr Tyr Glu Arg Leu Pro Leu Glu Asp Glu Glu Glu Ala Gly

210 215 220

Ser Ala Ala Gln Glu Gln Leu Ala Gly Gly Gly Gly Gly Gly Gly Ser

225 230 235 240

Pro Pro Gly Ile Gly Gly Ser Gly Gly Gln Gln Gln Ala Gly Met Ala

245 250 255

Asp Pro Ser Ser Met Pro Val Tyr Asn Leu Pro Pro Asn Leu Leu Pro

260 265 270

Asn Gly Gly Gln Leu Asn His AspAla Tyr Gly Trp Ala His Gly Arg

275 280 285

Gln Pro Tyr

290

<210>31

<211>783

<212>DNA

<213>葡萄

<400>31

atggacccgg cagctgtttc gccgatgcta aataaacgcg atcgcgagat atcaatcaac 60

gataaccccg gcacaggaga cgatgaagaa gagaaagaca acgaaggcga gcccacggag 120

ggtgcagtag aagtcggcac tcgtagacca agaggtcgcc cgcctggatc caaaaacaag 180

cccaaacccc ctattttcgt cacgcgcgac agcccgaacg cccttcggag ccacgtgatg 240

gaggtggccg gcggccacga cgttgccgaa agcgtcgccc agttcgcccg taggcgtcaa 300

cgaggggtct gcgtcctcag cggcagcggc tccgtagcca acgtgactct gagacagccc 360

gccgcgcctg gcgccgtggt ggcactccat ggaagattcg agattctgtc cctaacagga 420

gcattcctcc ccggacctgc ccctcccggc tccactggac tcaccgtgta cctcgccgga 480

ggtcagggcc aggttgtggg aggaagtgtg gttggatcac tggtagcggc aggcccggtg 540

atagtgatag ccgccacttt tgcgaacgca acatacgaaa gactgcctct ggaagaagaa 600

gaagaaggtg ggcaggcgcc gccgccgagt ggttcgccgc ctgcaattgg aagcagtggt 660

ggacagcatc actctggcct gccggagctg cccatataca atctgccacc gaacctactc 720

cctaacggcg gccaattgag tcatgacccc tactcatggg ctcatgctcg gcccccttac 780

tga 783

<210>32

<211>260

<212>PRT

<213>葡萄

<400>32

Met Asp Pro Ala Ala Val Ser Pro Met Leu Asn Lys Arg Asp Arg Glu

1 5 10 15

Ile Ser Ile Asn Asp Asn Pro Gly Thr Gly Asp Asp Glu Glu Glu Lys

20 25 30

Asp Asn Glu Gly Glu Pro Thr Glu Gly Ala Val Glu Val Gly Thr Arg

35 40 45

Arg Pro Arg Gly Arg Pro Pro Gly Ser Lys Asn Lys Pro Lys Pro Pro

50 55 60

Ile Phe Val Thr Arg Asp Ser Pro Ash Ala Leu Arg Ser His Val Met

65 70 75 80

Glu Val Ala Gly Gly His Asp Val Ala Glu Ser Val Ala Gln Phe Ala

85 90 95

Arg Arg Arg Gln Arg Gly Val Cys Val Leu Ser Gly Ser Gly Ser Val

100 105 110

Ala Asn Val Thr Leu Arg Gln Pro Ala Ala Pro Gly Ala Val Val Ala

115 120 125

Leu His Gly Arg Phe Glu Ile Leu Ser Leu Thr Gly Ala Phe Leu Pro

130 135 140

Gly Pro Ala Pro Pro Gly Ser Thr Gly Leu Thr Val Tyr Leu Ala Gly

145 150 155 160

Gly Gln Gly Gln Val Val Gly Gly Ser Val Val Gly Ser Leu Val Ala

165 170 175

Ala Gly Pro Val Ile Val Ile Ala Ala Thr Phe Ala Asn Ala Thr Tyr

180 185 190

Glu Arg Leu Pro Leu Glu Glu Glu Glu Glu Gly Gly Gln Ala Pro Pro

195 200 205

Pro Ser Gly Ser Pro Pro Ala Ile Gly Ser Ser Gly Gly Gln His His

210 215 220

Ser Gly Leu Pro Glu Leu Pro Ile Tyr Asn Leu Pro Pro Asn Leu Leu

225 230 235 240

Pro Asn Gl y Gly Gln Leu Ser His Asp Pro Tyr Ser Trp Ala His Ala

245 250 255

Arg Pro Pro Tyr

260

<210>33

<211>810

<212>DNA

<213>玉蜀黍(Zea mays)

<400>33

atggcacctt cctccaagga cggcgccacc gccaccgagc agccgacgag cggcgacgac 60

gaccgggaga acggcggcac gggcgagccc aaggaaggcg cggtggtggc gggcaaccgg 120

cggccccgcg ggcggccgcc ggggtccaag aacaagccca agccgcccat cttcgtgacg 180

cgcgacagcc ccaacgcgct gcgcagccac gtgatggagg tggccggcgg cgccgacgtg 240

gccgagtcca tcgcccactt cgcgcgccgc aggcagcgcg gcgtgtgcgt gctcagcggc 300

gcgggcaccg tcgccgacgt ggcgctccgc cagcccgcgg ctccgggcgc cgtggtcgcc 360

ctccgcggcc gcttcgagat cctctcgctc accggcacgt tcctgccggg ccccgcgccg 420

ccgggctcca cggggctcac cgtgtacctc gcgggcggcc aggggcaggt cgtcggcggc 480

agcgtcgtcg gcacgctcac cgcggcgggg cccgtcatgg tgatggcgtc cacgttcgcc 540

aacgccacct acgagaggct gccgctggac gacgccgacg aggagcccgc cgggcagcag 600

gcggcgcagc tgcctcccgg accgggcgga gggcagccta tggtaatggg cgggatggcc 660

gacccctcag cggtgccaat gttcggcggc gccggcggtg tgccgccaag cctcatgcca 720

gcaggggccg cagccgcctc ctccggtgcg ggcctgcagc tcgggcacga ccgacttgca 780

tgggctcatg cacggccacc gccatactag 810

<210>34

<211>269

<212>PRT

<213>玉蜀黍

<400>34

Met Ala Pro Ser Ser Lys Asp Gly Ala Thr Ala Thr Glu Gln Pro Thr

1 5 10 15

Ser Gly Asp Asp Asp Arg Glu Asn Gly Gly Thr Gly Glu Pro Lys Glu

20 25 30

Gly Ala Val Val Ala Gly Asn Arg Arg Pro Arg Gly Arg Pro Pro Gly

35 40 45

Ser Lys Asn Lys Pro Lys Pro Pro Ile Phe Val Thr Arg Asp Ser Pro

50 55 60

Asn Ala Leu Arg Ser His Val Met Glu Val Ala Gly Gly Ala Asp Val

65 70 75 80

Ala Glu Ser Ile Ala His Phe Ala Arg Arg Arg Gln Arg Gly Val Cys

85 90 95

Val Leu Ser Gly Ala Gly Thr Val Ala Asp Val Ala Leu Arg Gln Pro

100 105 110

Ala Ala Pro Gly Ala Val Val Ala Leu Arg Gly Arg Phe Glu Ile Leu

115 120 125

Ser Leu Thr Gly Thr Phe Leu Pro Gly Pro Ala Pro Pro Gly Ser Thr

130 135 140

Gly Leu Thr Val Tyr Leu Ala Gly Gly Gln Gly Gln Val Val Gly Gly

145 150 155 160

Ser Val Val Gly Thr Leu Thr Ala Ala Gly Pro Val Met Val Met Ala

165 170 175

Ser Thr Phe Ala Asn Ala Thr Tyr Glu Arg Leu Pro Leu Asp Asp Ala

180 185 190

Asp Glu Glu Pro Ala Gly Gln Gln Ala Ala Gln Leu Pro Pro Gly Pro

195 200 205

Gly Gly Gly Gln Pro Met Val Met Gly Gly Met Ala Asp Pro Ser Ala

210 215 220

Val Pro Met Phe Gly Gly Ala Gly Gly Val Pro Pro Ser Leu Met Pro

225 230 235 240

Ala Gly Ala Ala Ala Ala Ser Ser Gly Ala Gly Leu Gln Leu Gly His

245 250 255

Asp Arg Leu Ala Trp Ala Hi s Ala Arg Pro Pro Pro Tyr

260 265

<210>35

<211>2194

<212>DNA

<213>稻

<400>35

aatccgaaaa gtttctgcac cgttttcacc ccctaactaa caatataggg aacgtgtgct 60

aaatataaaa tgagacctta tatatgtagc gctgataact agaactatgc aagaaaaact 120

catccaccta ctttagtggc aatcgggcta aataaaaaag agtcgctaca ctagtttcgt 180

tttccttagt aattaagtgg gaaaatgaaa tcattattgc ttagaatata cgttcacatc 240

tctgtcatga agttaaatta ttcgaggtag ccataattgt catcaaactc ttcttgaata 300

aaaaaatctt tctagctgaa ctcaatgggt aaagagagag atttttttta aaaaaataga 360

atgaagatat tctgaacgta ttggcaaaga tttaaacata taattatata attttatagt 420

ttgtgcattc gtcatatcgc acatcattaa ggacatgtct tactccatcc caatttttat 480

ttagtaatta aagacaattg acttattttt attatttatc ttttttcgat tagatgcaag 540

gtacttacgc acacactttg tgctcatgtg catgtgtgag tgcacctcct caatacacgt 600

tcaactagca acacatctct aatatcactc gcctatttaa tacatttagg tagcaatatc 660

tgaattcaag cactccacca tcaccagacc acttttaata atatctaaaa tacaaaaaat 720

aattttacag aatagcatga aaagtatgaa acgaactatt taggtttttc acatacaaaa 780

aaaaaaagaa ttttgctcgt gcgcgagcgc caatctccca tattgggcac acaggcaaca 840

acagagtggc tgcccacaga acaacccaca aaaaacgatg atctaacgga ggacagcaag 900

tccgcaacaa ccttttaaca gcaggctttg cggccaggag agaggaggag aggcaaagaa 960

aaccaagcat cctccttctc ccatctataa attcctcccc ccttttcccc tctctatata 1020

ggaggcatcc aagccaagaa gagggagagc accaaggaca cgcgactagc agaagccgag 1080

cgaccgcctt ctcgatccat atcttccggt cgagttcttg gtcgatctct tccctcctcc 1140

acctcctcct cacagggtat gtgcctccct tcggttgttc ttggatttat tgttctaggt 1200

tgtgtagtac gggcgttgat gttaggaaag gggatctgta tctgtgatga ttcctgttct 1260

tggatttggg atagaggggt tcttgatgtt gcatgttatc ggttcggttt gattagtagt 1320

atggttttca atcgtctgga gagctctatg gaaatgaaat ggtttaggga tcggaatctt 1380

gcgattttgt gagtaccttt tgtttgaggt aaaatcagag caccggtgat tttgcttggt 1440

gtaataaagt acggttgttt ggtcctcgat tctggtagtg atgcttctcg atttgacgaa 1500

gctatccttt gtttattccc tattgaacaa aaataatcca actttgaaga cggtcccgtt 1560

gatgagattg aatgattgat tcttaagcct gtccaaaatt tcgcagctgg cttgtttaga 1620

tacagtagtc cccatcacga aattcatgga aacagttata atcctcagga acaggggatt 1680

ccctgttctt ccgatttgct ttagtcccag aatttttttt cccaaatatc ttaaaaagtc 1740

actttctggt tcagttcaat gaattgattg ctacaaataa tgcttttata gcgttatcct 1800

agctgtagtt cagttaatag gtaatacccc tatagtttag tcaggagaag aacttatccg 1860

atttctgatc tccattttta attatatgaa atgaactgta gcataagcag tattcatttg 1920

gattattttt tttattagct ctcacccctt cattattctg agctgaaagt ctggcatgaa 1980

ctgtcctcaa ttttgttttc aaattcacat cgattatcta tgcattatcc tcttgtatct 2040

acctgtagaa gtttcttttt ggttattcct tgactgcttg attacagaaa gaaatttatg 2100

aagctgtaat cgggatagtt atactgcttg ttcttatgat tcatttcctt tgtgcagttc 2160

ttggtgtagc ttgccacttt caccagcaaa gttc 2194

<210>36

<211>173

<212>PRT

<213>人工序列

<220>

<223>包含在SEQ ID NO：2中的保守结构域

<400>36

Glu Pro Arg Glu Gly Ala Val Glu Ala Pro Thr Arg Arg Pro Arg Gly

1 5 10 15

Arg Pro Ala Gly Ser Lys Asn Lys Pro Lys Pro Pro Ile Phe Val Thr

20 25 30

Arg Asp Ser Pro Asn Ala Leu Lys Ser His Val Met Glu Ile Ala Ser

35 40 45

Gly Thr Asp Val Ile Glu Thr Leu Ala Thr Phe Ala Arg Arg Arg Gln

50 55 60

Arg Gly Ile Cys Ile Leu Ser Gly Asn Gly Thr Val Ala Asn Val Thr

65 70 75 80

Leu Arg Gln Pro Ser Thr Ala Ala Val Ala Ala Ala Pro Gly Gly Ala

85 90 95

Ala Val Leu Ala Leu Gln Gly Arg Phe Glu Ile Leu Ser Leu Thr Gly

100 105 110

Ser Phe Leu Pro Gly Pro Ala Pro Pro Gly Ser Thr Gly Leu Thr Ile

115 120 125

Tyr Leu Ala Gly Gly Gln Gly Gln Val Val Gly Gly Ser Val Val Gly

130 135 140

Pro Leu Met Ala Ala Gly Pro Val Met Leu Il e Ala Ala Thr Phe Ser

145 150 155 160

Asn Ala Thr Tyr Glu Arg Leu Pro Leu Glu Glu Glu Glu

165 170

<210>37

<211>14

<212>PRT

<213>人工序列

<220>

<223>AT hook

<220>

<221>VARIANT

<222>(8)..(8)

<223>/置换＝″Ala″

<220>

<221>VARIANT

<222>(11)..(11)

<223>/置换＝″Arg″

<400>37

Arg Arg Pro Arg Gly Arg Pro Pro Gly Ser Lys Asn Lys Pro

1 5 10

<210>38

<211>125

<212>PRT

<213>人工序列

<220>

<223>包含在SEQ ID NO：2中的PPC结构域(DUF296)

<400>38

Leu Lys Ser His Val Met Glu Ile Ala Ser Gly Thr Asp Val Ile Glu

1 5 10 15

Thr Leu Ala Thr Phe Ala Arg Arg Arg Gln Arg Gly Ile Cys Ile Leu

20 25 30

Ser Gly Asn Gly Thr Val Ala Asn Val Thr Leu Arg Gln Pro Ser Thr

35 40 45

Ala Ala Val Ala Ala Ala Pro Gly Gly Ala Ala Val Leu Ala Leu Gln

50 55 60

Gly ArgPhe Glu Ile Leu Ser Leu Thr Gly Ser Phe Leu Pro Gly Pro

65 70 75 80

Ala Pro Pro Gly Ser Thr Gly Leu Thr Ile Tyr Leu Ala Gly Gly Gln

85 90 95

Gly Gln Val Val Gly Gly Ser Val Val Gly Pro Leu Met Ala Ala Gly

100 105 110

Pro Val Met Leu Ile Ala Ala Thr Phe Ser Asn Ala Thr

115 120 125

<210>39

<211>52

<212>DNA

<213>人工序列

<220>

<223>引物：prm8135

<400>39

ggggacaagt ttgtacaaaa aagcaggctt aaacaatggc gaatccatgg tg 52

<210>40

<211>50

<212>DNA

<213>人工序列

<220>

<223>引物：prm8136

<400>40

ggggaccact ttgtacaaga aagctgggtt aaaaaccatt ttaacgcacg 50

<210>41

<211>948

<212>DNA

<213>甘蓝(Brassica oleracea)

<400>41

atgcgaaatc catggtggac aggacaagtg aatctctcca gtctcgaaac gacgccgccg 60

agttcctctc agttaaagac accagatctc cacatctcca tgaacatggc catggtctca 120

ggtcataaca accaccatca tcatcaccaa gaagtcaaca ccaacaacaa caacgaagac 180

gatagagaca acttgagcgg cgacgaccgc gagccacgtg aaggagccgt ggaagctccc 240

acgcgccgac cacgtggacg tcctgctggt tccaagaaca aaccaaagcc accaatcttt 300

gtcacgcgtg attctccaaa cgctctcaag agccatgtca tggagatcgc tagtgggact 360

gatgtcatag aaaccctagc tactttcgct aggcggcgcc aacgtggcat ctgcatcttg 420

agcggtaacg gcacggtggc taacgtcaca ctccgtcaac catcagtggc tcccgttgca 480

gctgcccctg gtggtgcggc tgtattggcg ttacaaggga ggtttgagat tctttctcta 540

accggttctt tcttacctgg accggctcca cctggatcca ctggtttaac tatttactta 600

gctggtggtc aaggtcaggt tgttggagga agcgtggtgg gggcattgat ggctgctggt 660

ccggtgatgc taatcgctgc cacgttttct aatgcgactt atgagagatt acctttggat 720

gaggaagaag cggctgaaag aggtggcggt ggaagcgacg gaggagtggt tccagggcag 780

ctcgggggcg taggttcccc gctgagtagt ggtggcggtg gaggccacgg gaaccaagga 840

cttcccgcat ataatatgcc cggaaacctt gcttctaatg gcggtggagg aggacagatg 900

agcagccaag aagcgtacgg ttgggctcaa gctaggtcag gattttaa 948

<210>42

<211>315

<212>PRT

<213>甘蓝

<400>42

Met Arg Asn Pro Trp Trp Thr Gly Gln Val Asn Leu Ser Ser Leu Glu

1 5 10 15

Thr Thr Pro Pro Ser Ser Ser Gln Leu Lys Thr Pro Asp Leu His Ile

20 25 30

Ser Met Asn Met Ala Met Val Ser Gly His Asn Asn His His His His

35 40 45

His Gln Glu Val Asn Thr Asn Asn Asn Asn Glu Asp Asp Arg Asp Asn

50 55 60

Leu Ser Gly Asp Asp Arg Glu Pro Arg Glu Gly Ala Val Glu Ala Pro

65 70 75 80

Thr Arg Arg Pro Arg Gly Arg Pro Ala Gly Ser Lys Asn Lys Pro Lys

85 90 95

Pro Pro Ile Phe Val Thr Arg Asp Ser Pro Asn Ala Leu Lys Ser His

100 105 110

Val Met Glu Ile Ala Ser Gly Thr Asp Val Ile Glu Thr Leu Ala Thr

115 120 125

Phe Ala Arg Arg Arg Gln Arg Gly Ile Cys Ile Leu Ser Gly Asn Gly

130 135 140

Thr ValAla Asn Val Thr Leu Arg Gln Pro Ser Val Ala Pro Val Ala

145 150 155 160

Ala Ala Pro Gly Gly Ala Ala Val Leu Ala Leu Gln Gly Arg Phe Glu

165 170 175

Ile Leu Ser Leu Thr Gly Ser Phe Leu Pro Gly Pro Ala Pro Pro Gly

180 185 190

Ser Thr Gly Leu Thr Ile Tyr Leu Ala Gly Gly Gln Gly Gln Val Val

195 200 205

Gly Gly Ser Val Val Gly Ala Leu Met Ala Ala Gly Pro Val Met Leu

210 215 220

Ile Ala Ala Thr Phe Ser Asn Ala Thr Tyr Glu Arg Leu Pro Leu Asp

225 230 235 240

Glu Glu Glu Ala Ala Glu Arg Gly Gly Gly Gly Ser Asp Gly Gly Val

245 250 255

Val Pro Gly Gln Leu Gly Gly Val Gly Ser Pro Leu Ser Ser Gly Gly

260 265 270

Gly Gly Gly His Gly Asn Gln Gly Leu Pro Ala Tyr Asn Met Pro Gly

275 280 285

Asn Leu Ala Ser Asn Gly Gly Gly Gly Gly Gln Met Ser Ser Gln Glu

290 295 300

Ala Tyr Gly Trp Ala Gln Ala Arg Ser Gly Phe

305 310 315

<210>43

<211>918

<212>DNA

<213>蒺藜苜蓿(Me dicago truncatula)

<400>43

atggcgaaca ggtggtggac cggaccggtt ggtctaggag ggatggacaa ctcagtaacc 60

tcctctccac taggaaaacc ggatctgggt ttctccatga atcaaagtgc tgtaacagga 120

gtgaacaaca tgaacaacaa caacaatgaa gaagaagaag atgagaaaga aaacagcgac 180

gaacacaaag gaggtgcaat agaaacaaac acctccacgc gccgcccaag aggccgtcca 240

tcaggttcaa aaaacaaacc aaaaccacca atattcataa caagagatag ccctaacgcg 300

ctacgaagcc atgtcatgga agtagcaaca ggaacagata tatcagatag catcgttcag 360

tttgcaagaa aaagacagag aggtatttgc attctaagcg caagtggaac cgtcgttaac 420

gtttctctcc ggcaacctac aggtcccgga gctgtggtag cgcttccagg gagatttgat 480

atactctctt tgactggttc tgtgcttcct ggaccttcac cgccgggagc tactggtttg 540

actatttatc tttctggagg acaaggacag gtggttggcg gcggagttgt tggtcccctt 600

gtggcggcag gaccagttat gttgatggcg gcgacatttt cgaatgctac gtatgagagg 660

ctgccggttg aggatggtga tgatcaagaa gggcatcagg gtggtggtgg tgatgatgag 720

tctccgacgc gtgcagcggg gatgggacag ttagcgattg gatctgttgg agaaggttct 780

tcaattccac caggctataa caatgttggt ggtaatttgg gtgtttcaaa tggaggacaa 840

caacaattgt tgaataatca tgaggcttat aataattctc cttggggtca tgctagtcat 900

ggtagaccac catactaa 918

<210>4

<211>305

<212>PRT

<213>蒺藜苜蓿

<400>44

Met Ala Asn Arg Trp Trp Thr Gly Pro Val Gly Leu Gly Gly Met Asp

1 5 10 15

Asn Ser Val Thr Ser Ser Pro Leu Gly Lys Pro Asp Leu Gly Phe Ser

20 25 30

Met Asn Gln Ser Ala Val Thr Gly Val Asn Asn Met Asn Asn Asn Asn

35 40 45

Asn Glu Glu Glu Glu Asp Glu Lys Glu Asn Ser Asp Glu His Lys Gly

50 55 60

Gly Ala Ile Glu Thr Asn Thr Ser Thr Arg Arg Pro Arg Gly Arg Pro

65 70 75 80

Ser Gly Ser Lys Asn Lys Pro Lys Pro Pro Ile Phe Ile Thr Arg Asp

85 90 95

Ser Pro Asn Ala Leu Arg Ser His Val Met Glu Val Ala Thr Gly Thr

100 105 110

Asp Ile Ser Asp Ser Ile Val Gln Phe Ala Arg Lys Arg Gln Arg Gly

115 120 125

Ile Cys Ile Leu Ser Ala Ser Gly Thr Val Val Asn Val Ser Leu Arg

130 135 140

Gln Pro Thr Gly Pro Gly Ala Val Val Ala Leu Pro Gly Arg Phe Asp

145 150 155 160

Ile Leu Ser Leu Thr Gly Ser Val Leu Pro Gly Pro Ser Pro Pro Gly

165 170 175

Ala Thr Gly Leu Thr Ile Tyr Leu Ser Gly Gly Gln Gly Gln Val Val

180 185 190

Gly Gly Gly Va lVal Gly Pro Leu Val Ala Ala Gly Pro Val Met Leu

195 200 205

Met Ala Ala Thr Phe Ser Asn Ala Thr Tyr Glu Arg Leu Pro Val Glu

210 215 220

Asp Gly Asp Asp Gln Glu Gly His Gln Gly Gly Gly Gly Asp Asp Glu

225 230 235 240

Ser Pro Thr Arg Ala Ala Gly Met Gly Gln Leu Ala Ile Gly Ser Val

245 250 255

Gly Glu Gly Ser Ser Ile Pro Pro Gly Tyr Asn Asn Val Gly Gly Asn

260 265 270

Leu Gly Val Ser Asn Gly Gly Gln Gln Gln Leu Leu Asn Asn His Glu

275 280 285

Ala Tyr Asn Asn Ser Pro Trp Gly His Ala Ser His Gly Arg Pro Pro

290 295 300

Tyr

305

<210>45

<211>632

<212>DNA

<213>拟南芥

<400>45

gcagttccct actctcgcgt taacgctagc atggatctcg ggccccaaat aatgatttta 60

ttttgactga tagtgacctg ttcgttgcaa caaattgatg agcaatgctt ttttataatg 120

ccaactttgt acaaaaaagc aggcttcaca atgtcttgct gtggaggaaa ctgcggatgt 180

ggatctggct gcaagtgcgg caacggttgt ggaggttgca aaatgtaccc tgacttggga 240

ttctccggcg agacaaccac aactgagact tttgtcttgg gcgttgcacc ggcgatgaag 300

aatcagtacg aggcttcagg ggagagtaac aacgctgaga acgatgcttg caagtgtgga 360

tctgactgca agtgtgatcc ttgcacctgc aagtgaaacc cagctttctt gtacaaagtt 420

ggcattataa gaaagcattg cttatcaatt tgttgcaacg aacaggtcac tatcagtcaa 480

aataaaatca ttatttgcca tccagctgca gctctggccc gtgtctcaaa atctctgatg 540

ttacattgca caagataaaa atatatcatc atgaacaata aaactgtctg cttacataaa 600

cagtaataca aggggtgtta tgagccatat tc 632

<210>46

<211>81

<212>PRT

<213>拟南芥

<400>46

Met Ser Cys Cys Gly Gly Asn Cys Gly Cys Gly Ser Gly Cys Lys Cys

1 5 10 15

Gly Asn Gly Cys Gly Gly Cys Lys Met Tyr Pro Asp Leu Gly Phe Ser

20 25 30

Gly Glu Thr Thr Thr Thr Glu Thr Phe Val Leu Gly Val Ala Pro Ala

35 40 45

Met Lys Asn Gln Tyr Glu Ala Ser Gly Glu Ser Asn Asn Ala Glu Asn

50 55 60

Asp Ala Cys Lys Cys Gly Ser Asp Cys Lys Cys Asp Pro Cys Thr Cys

65 70 75 80

Lys

<210>47

<211>2194

<212>DNA

<213>稻

<400>47

aatccgaaaa gtttctgcac cgttttcacc ccctaactaa caatataggg aacgtgtgct 60

aaatataaaa tgagacctta tatatgtagc gctgataact agaactatgc aagaaaaact 120

catccaccta ctttagtggc aatcgggcta aataaaaaag agtcgctaca ctagtttcgt 180

tttccttagt aattaagtgg gaaaatgaaa tcattattgc ttagaatata cgttcacatc 240

tctgtcatga agttaaatta ttcgaggtag ccataattgt catcaaactc ttcttgaata 300

aaaaaatctt tctagctgaa ctcaatgggt aaagagagag atttttttta aaaaaataga 360

atgaagatat tctgaacgta ttggcaaaga tttaaacata taattatata attttatagt 420

ttgtgcattc gtcatatcgc acatcattaa ggacatgtct tactccatcc caatttttat 480

ttagtaatta aagacaattg acttattttt attatttatc ttttttcgat tagatgcaag 540

gtacttacgc acacactttg tgctcatgtg catgtgtgag tgcacctcct caatacacgt 600

tcaactagca acacatctct aatatcactc gcctatttaa tacatttagg tagcaatatc 660

tgaattcaag cactccacca tcaccagacc acttttaata atatctaaaa tacaaaaaat 720

aattttacag aatagcatga aaagtatgaa acgaactatt taggtttttc acatacaaaa 780

aaaaaaagaa ttttgctcgt gcgcgagcgc caatctccca tattgggcac acaggcaaca 840

acagagtggc tgcccacaga acaacccaca aaaaacgatg atctaacgga ggacagcaag 900

tccgcaacaa ccttttaaca gcaggctttg cggccaggag agaggaggag aggcaaagaa 960

aaccaagcat cctccttctc ccatctataa attcctcccc ccttttcccc tctctatata 1020

ggaggcatcc aagccaagaa gagggagagc accaaggaca cgcgactagc agaagccgag 1080

cgaccgcctt ctcgatccat atcttccggt cgagttcttg gtcgatctct tccctcctcc 1140

acctcctcct cacagggtat gtgcctccct tcggttgttc ttggatttat tgttctaggt 1200

tgtgtagtac gggcgttgat gttaggaaag gggatctgta tctgtgatga ttcctgttct 1260

tggatttggg atagaggggt tcttgatgtt gcatgttatc ggttcggttt gattagtagt 1320

atggttttca atcgtctgga gagctctatg gaaatgaaat ggtttaggga tcggaatctt 1380

gcgattttgt gagtaccttt tgtttgaggt aaaatcagag caccggtgat tttgcttggt 1440

gtaataaagt acggttgttt ggtcctcgat tctggtagtg atgcttctcg atttgacgaa 1500

gctatccttt gtttattccc tattgaacaa aaataatcca actttgaaga cggtcccgtt 1560

gatgagattg aatgattgat tcttaagcct gtccaaaatt tcgcagctgg cttgtttaga 1620

tacagtagtc cccatcacga aattcatgga aacagttata atcctcagga acaggggatt 1680

ccctgttctt ccgatttgct ttagtcccag aatttttttt cccaaatatc ttaaaaagtc 1740

actttctggt tcagttcaat gaattgattg ctacaaataa tgcttttata gcgttatcct 1800

agctgtagtt cagttaatag gtaatacccc tatagtttag tcaggagaag aacttatccg 1860

atttctgatc tccattttta attatatgaa atgaactgta gcataagcag tattcatttg 1920

gattattttt tttattagct ctcacccctt cattattctg agctgaaagt ctggcatgaa 1980

ctgtcctcaa ttttgttttc aaattcacat cgattatcta tgcattatcc tcttgtatct 2040

acctgtagaa gtttcttttt ggttattcct tgactgcttg attacagaaa gaaatttatg 2100

aagctgtaat cgggatagtt atactgcttg ttcttatgat tcatttcctt tgtgcagttc 2160

ttggtgtagc ttgccacttt caccagcaaa gttc 2194

<210>48

<211>53

<212>DNA

<213>人工序列

<220>

<223>引物：prm03240

<400>48

ggggacaagt ttgtacaaaa aagcaggctt cacaatgtct tgctgtggag gaa 53

<210>49

<211>47

<212>DNA

<213>人工序列

<220>

<223>引物：prm03241

<400>49

ggggaccact ttgtacaaga aagctgggtt tcacttgcag gtgcaag 47

<210>50

<211>1566

<212>DNA

<213>雷氏衣藻(Chlamydomonas reinhardtii)

<400>50

atgcggaagg aagcgactcg tcttgtgtcc gccctgctgc gggcgggcaa caatggcgtg 60

tctacgtcgt gggctgttgg tggcactcgc ctcaagtcgg cgatgcccca gcctgatgag 120

aagaaggacg aggacctgca tgccaaggag ggcaaggtgc tgcaccctca ccttctgaac 180

gagaacgtgg tgaagactca gtatgccgtc cgtggcgagc tttacctgcg cgctgagcag 240

ctccgcaagg agggcaagga gatcattttc acaaacgtcg gaaacccgca cgcgctgggt 300

gccaagcccc tgaccttcac ccgtcaggtg ctagccctgt gcgccgcgcc cttcctgctg 360

gatcacccca aggtggagga catgttcccc gccgacgcca tcgcgcgtgc caagaagatc 420

ctagcctcct tcaagggcgg tgtgggcgcc tacaccgact cgcgtggcaa cccgctggtg 480

cgcgaggagg tggcccgctt catcgagaag cgtgacggcg ttccctcgaa ccccgaccac 540

atcttcctga cggacggcgc ctcggtggcc gtgcgcttgt gcctgaacgc catgatccgc 600

cacgaccgcg actccgtgct ggtgcccatc ccgcagtacc cgctgtacag cgcctccatc 660

cgcctgtacg gcggcacgct ggtgggctac ttcctggatg agcgccgcgg ctggggcctg 720

tccgtggagg agctgcagcg cgcgctgcag gaggcgcgcg aggagggcaa gctggtgcgc 780

ggcctggtgt ttatcaaccc cggtaacccc accggccagt gcttgagcaa ggagaacctg 840

caggagctga tcaagtttgc gtaccaggag aagattgtgc tcatggcgga tgaggtgtac 900

caggagaacg tgtaccagga tgagcggccg tttgtgagcg ccaagaaggt gatgtgggag 960

atgggcgagc cctaccgcag ccacgtggag ctgctgtcct tccacaccgt gtccaagggc 1020

actgccggcg agtgcggcct gcgcggcggc tacgtggaga tgactaacat ccaccccggc 1080

gccattgagg aggtgtgcaa gtgcgcctcc attaacctgt cgcccaacac catgggccag 1140

atcgcgctgt ccgtgctcgt caacccgccc aagcccggcg atccctctta cgaccagtac 1200

accaaggaga aggcctcgga gctggtgtcg ctgcgccgcc gcgcgcacat ggtgacggac 1260

ggcttcaacg cgctggacgg cgtcacctgc aacttcaccg agggcgccat gtacagcttc 1320

ccccagatta agctgccggc caaggcgctg gaggccgcca aggccgccgg aaaggcgggc 1380

gacgtgttct actgcctcaa acttctggag gccaccggca tctccaccgt gcccggcagc 1440

ggcttcggcc aggaggaggg caccttccac ctgcgcacca ccattctgcc tcgcgaggag 1500

gtgatgacgc acttcgtgga gaagttcgac aagttccaca aggacttcat gaagcagtat 1560

tcgtaa 1566

<210>51

<211>521

<212>PRT

<213>雷氏衣藻

<400>51

Met Arg Lys Glu Ala Thr Arg Leu Val Ser Ala Leu Leu Arg Ala Gly

1 5 10 15

Asn Asn Gly Val Ser Thr Ser Trp Ala Val Gly Gly Thr Arg Leu Lys

20 25 30

Ser Ala Met Pro Gln Pro Asp Glu Lys Lys Asp Glu Asp Leu His Ala

35 40 45

Lys Glu Gly Lys Val Leu His Pro His Leu Leu Asn Glu Asn Val Val

50 55 60

Lys Thr Gln Tyr Ala Val Arg Gly Glu Leu Tyr Leu Arg Ala Glu Gln

65 70 75 80

Leu Arg Lys Glu Gly Lys Glu Ile Ile Phe Thr Asn Val Gly Asn Pro

85 90 95

Hi s Ala Leu Gly Ala Lys Pro Leu Thr Phe Thr Arg Gln Val Leu Ala

100 105 110

Leu Cys Ala Ala Pro Phe Leu Leu Asp His Pro Lys Val Glu Asp Met

115 120 125

Phe Pro Ala Asp Ala Ile Ala Arg Ala Lys Lys Ile Leu Ala Ser Phe

130 135 140

Lys Gly Gly Val Gly Ala Tyr Thr Asp Ser Arg Gly Asn Pro Leu Val

145 150 155 160

Arg Glu Glu Val Ala Arg Phe Ile Glu Lys Arg Asp Gly Val Pro Ser

165 170 175

Asn Pro Asp His Ile Phe Leu Thr Asp Gly Ala Ser Val Ala Val Arg

180 185 190

Leu Cys Leu Asn Ala Met Ile Arg His Asp Arg Asp Ser Val Leu Val

195 200 205

Pro Ile Pro Gln Tyr Pro Leu Tyr Ser Ala Ser Ile Arg Leu Tyr Gly

210 215 220

Gly Thr Leu Val Gly Tyr Phe Leu Asp Glu Arg Arg Gly Trp Gly Leu

225 230 235 240

Ser Val Glu Glu Leu Gln Arg Ala Leu Gln Glu Ala Arg Glu Glu Gly

245 250 255

Lys Leu Val Arg Gly Leu Val Phe Ile Asn Pro Gly Asn Pro Thr Gly

260 265 270

Gln Cys Leu Ser Lys Glu Asn Leu Gln Glu Leu Ile Lys Phe Ala Tyr

275 280 285

Gln Glu Lys Ile Val Leu Met Ala Asp Glu Val Tyr Gln Glu Asn Val

290 295 300

Tyr Gln Asp Glu Arg Pro Phe Val Ser Ala Lys Lys Val Met Trp Glu

305 310 315 320

Met Gly Glu Pro Tyr Arg Ser His Val Glu Leu Leu Ser Phe His Thr

325 330 335

Val Ser Lys Gly Thr Ala Gly Glu Cys Gly Leu Arg Gly Gly Tyr Val

340 345 350

Glu Met Thr AsnIle Hi s Pro Gly Ala Ile Glu Glu Val Cys Lys Cys

355 360 365

Ala Ser Ile Asn Leu Ser Pro Asn Thr Met Gly Gln Ile Ala Leu Ser

370 375 380

Val Leu Val Asn Pro Pro Lys Pro Gly Asp Pro Ser Tyr Asp Gln Tyr

385 390 395 400

Thr Lys Glu Lys Ala Ser Glu Leu Val Ser Leu Arg Arg Arg Ala His

405 410 415

Met Val Thr Asp Gly Phe Asn Ala Leu Asp Gl y ValThr Cys Asn Phe

420 425 430

Thr Glu Gly Ala Met Tyr Ser Phe Pro Gln Ile Lys Leu Pro Ala Lys

435 440 445

Ala Leu Glu Ala Ala Lys Ala Ala Gly Lys Ala Gly Asp Val Phe Tyr

450 455 460

Cys Leu Lys Leu Leu Glu Ala Thr Gly Ile Ser Thr Val Pro Gly Ser

465 470 475 480

Gly Phe Gly Gln Glu Glu Gly Thr Phe His Leu Arg Thr Thr Ile Leu

485 490 495

Pro Arg Glu Glu Val Met Thr HisPhe Val Glu LysPhe Asp Lys Phe

500 505 510

His Lys Asp Phe Met Lys Gln Tyr Ser

515 520

<210>52

<211>1416

<212>DNA

<213>稻

<400>52

cccacgcgtc cgcccacgcg tccgggacac cagaaacata gtacacttga gctcactcca 60

aactcaaaca ctcacaccaa tggctctcca agttcaggcc gcactcctgc cctctgctct 120

ctctgtcccc aagaagggta acttgagcgc ggtggtgaag gagccggggt tccttagcgt 180

gagcagaagg ccaagaagcc gtcgctggtg gtgagggcgg tggcgacgcg gcgggccggt 240

ggcgagcccc ggcgcgggca cgtcgaaggc ggacgggaag aagacgctgc ggcagggggt 300

ggtggtgatc accggcgcgt cgtcggggct cgggctcgcg gcggcgaagg cgcttggcgg 360

agacggggaa gtggcacgtg gtgatggcgt tccgcgactt tcctgaaggc ggcgacggcg 420

gcgaaggcgg cggggatggc ggcggggagc tacaccgtca tgcacctgga cctcgcctcc 480

ctcgacagcg tccgccagtt cgtggacaac ttccggcgct ccggcatgcc gctcgacgcg 540

ctggtgtgca acgccgcaca tctaccggcc gacggcgcgg caaccgacgt tcaacgccga 600

cgggtacgag atgagcgtcg gggtgaacca cctgggccac ttcctcctcg cccgcctcat 660

gctcgacgac ctcaagaaat ccgactaccc gtcgcggcgg ctcatcatcc tcggctccat 720

caccggcaac accaacacct tcgccggcaa cgtccctccc aaggccgggc taggcgacct 780

ccgggggctc gccggcgggc tccgcgggca gaacgggtcg gcgatgatcg acggcgcgga 840

gagcttcgac ggcgccaagg cgtacaagga cagcaagatc tgtaacatgc tgacgatgca 900

ggagttccac cggagattcc acgaggagac cgggatcacg ttcgcgtcgc tgtacccggg 960

gtgcatcgcg acgacgggct tgttccgcga gcacatcccg ctgttccggc tgctgttccc 1020

gccgttccag cggttcgtga cgaaggggtt cgtgtcggag gcggagtccg ggaagcggct 1080

ggcgcaggtg gtgggcgacc cgagcctgac caagtccggc gtgtactgga gctggaacaa 1140

ggactcggcg tcgttcgaga accagctctc gcaggaggcc agcgacccgg agaaggccag 1200

gaagctctgg gacctcagcg agaagctcgt cggcctcgtc tgagtttatt atttacccat 1260

tcgtttcaac tgttaatttc ttcggggttt agggggtttc agctttcagt gagagaggcc 1320

tgtcaagtga tgtacaatta gtaatttttt tttacccgac aaatcatgca ataaaaccac 1380

aggcttacat tatcgatttg tccacctaaa ttaagt 1416

<210>53

<211>52

<212>DNA

<213>人工序列

<220>

<223>引物：prm08408

<400>53

ggggacaagt ttgtacaaaa aagcaggctt aaacaatgcg gaaggaagcg ac 52

<210>54

<211>50

<212>DNA

<213>人工序列

<220>

<223>引物：prm08409

<400>54

ggggaccact ttgtacaaga aagctgggtc gaattgctaa gctgttacga 50

<210>55

<211>1453

<212>DNA

<213>稻

<400>55

atggctgctc ccagcgtcgc cgtcgacaac ctcaacccca aggttttgaa ttgtgagtat 60

gcagtgcgtg gagagattgt gatccatgct cagcgcctgc agcaacagct acagactcaa 120

ccagggtctc ttccttttga tgagatccta tactgcaaca ttgggaatcc ccagtctctt 180

ggtcagaagc cagttacatt cttcagggag gttattgctc tttgtgatca tccatgcttg 240

ttggaaaagg aggaaaccaa atcattgttc agtgctgatg ccatttctcg agcaacaaca 300

attcttgcct cgattcctgg aagagcaact ggagcataca gccacagcca gggcatcaaa 360

gggctgcgtg atgcaattgc tgctggaatt gcatcacgtg atggataccc tgcaaatgca 420

gacgacattt tccttactga cggagcaagc cctggagttc acatgatgat gcagttactg 480

ataaggaacg agaaagatgg cattctctgc ccaattcctc aatatccttt gtactcagcc 540

tccattgctc ttcatggtgg agctcttgtc ccgtattatc ttaatgaatc aacaggctgg 600

ggtttggaga tctctgacct taagaagcaa ctcgaagatt ctcggttgaa aggcattgat 660

gttagggctt tggtagttat caatccagga aatccaactg ggcaggttct tgctgaggaa 720

aaccaacggg acatagtgaa gttctgcaaa aatgagggac ttgttcttct ggctgatgag 780

gtgtaccaag agaacatcta tgttgacaac aagaaattta actctttcaa gaagatagcg 840

agatccatgg gatacaacga ggatgatctc cctttagtat catttcaatc tgtttctaag 900

ggatattatg gtgaatgtgg caaaagagga ggctacatgg agattactgg cttcagtgct 960

ccagttagag agcagatcta caaagtggcg tcagtgaact tatgttccaa tatcactggc 1020

cagatccttg ccagcctcgt catgaatcca ccaaaggctg gagatgcatc atatgcttca 1080

tacaaggcag agaaagatgg aatcctccaa tcattagctc gccgtgcaaa ggcattggag 1140

aatgctttca acagtcttga gggaattaca tgcaacaaaa ctgaaggagc aatgtacctc 1200

ttccctcagc ttagtctgcc acaaaaggca attgacgctg ctaaagctgc taacaaagca 1260

cctgatgctt tctatgccct tcgtctcctc gaggcaaccg gaattgttgt tgtccctgga 1320

tctggatttg gccaagttcc tggcacatgg cacatcagat gcacaatcct gccacaggag 1380

gagaagatcc ccgcgatcat ctcccgcttc aaggcattcc atgagggctt catggcagcg 1440

taccgcgact gaa 1453

<210>56

<211>483

<212>PRT

<213>稻

<400>56

Met Ala Ala Pro Ser Val Ala Val Asp Asn Leu Asn Pro Lys Val Leu

1 5 10 15

Asn Cys Glu Tyr Ala Val Arg Gly Glu Ile Val Ile His Ala Gln Arg

20 25 30

Leu Gln Gln Gln Leu Gln Thr Gln Pro Gly Ser Leu Pro Phe Asp Glu

35 40 45

Ile Leu Tyr Cys Asn Ile Gly Asn Pro Gln Ser Leu Gly Gln Lys Pro

50 55 60

Val Thr Phe Phe Arg Glu Val Ile Ala Leu Cys Asp His Pro Cys Leu

65 70 75 80

Leu Glu Lys Glu Glu Thr Lys Ser Leu Phe Ser Ala Asp Ala Ile Ser

85 90 95

Arg Ala Thr Thr Ile Leu Ala Ser Ile Pro Gly Arg Ala Thr Gly Ala

100 105 110

Tyr Ser His Ser Gln Gly Ile Lys Gly Leu Arg Asp Ala Ile Ala Ala

115 120 125

Gly Ile Ala Ser Arg Asp Gly Tyr Pro Ala Asn Ala Asp Asp Ile Phe

130 135 140

Leu Thr Asp Gly Ala Ser Pro Gly Val His Met Met Met Gln Leu Leu

145 150 155 160

Ile Arg Asn Glu Lys Asp Gly Ile Leu Cys Pro Ile Pro Gln Tyr Pro

165 170 175

Leu Tyr Ser Ala Ser Ile Ala Leu His Gly Gly Ala Leu Val Pro Tyr

180 185 190

Tyr Leu Asn Glu Ser Thr Gly Trp Gly Leu Glu Ile Ser Asp Leu Lys

195 200 205

Lys Gln Leu Glu Asp Ser Arg Leu Lys Gly Ile Asp Val Arg Ala Leu

210 215 220

Val Val Ile Asn Pro Gly Asn Pro Thr Gly Gln Val Leu Ala Glu Glu

225 230 235 240

Asn Gln Arg Asp Ile Val Lys Phe Cys Lys Asn Glu Gly Leu Val Leu

245 250 255

Leu Ala Asp Glu Val Tyr Gln Glu Asn Ile Tyr Val Asp Asn Lys Lys

260 265 270

Phe Asn Ser Phe Lys Lys Ile Ala Arg Ser Met Gly Tyr Asn Glu Asp

275 280 285

Asp Leu Pro Leu Val Ser Phe Gln Ser Val Ser Lys Gly Tyr Tyr Gly

290 295 300

Glu Cys Gly Lys Arg Gly Gly Tyr Met Glu Ile Thr Gly Phe Ser Ala

305 310 315 320

Pro Val Arg Glu Gln Ile Tyr Lys Val Ala Ser Val Asn Leu Cys Ser

325 330 335

Asn Ile Thr Gly Gln Ile Leu Ala Ser Leu Val Met Asn Pro Pro Lys

340 345 350

Ala Gly Asp Ala Ser Tyr Ala Ser Tyr Lys Ala Glu Lys Asp Gly Ile

355 360 365

Leu Gln Ser Leu Ala Arg Arg Ala Lys Ala Leu Glu Asn Ala Phe Asn

370 375 380

Ser Leu Glu Gly Ile Thr Cys Asn Lys Thr Glu Gly Ala Met Tyr Leu

385 390 395 400

Phe Pro Gln Leu Ser Leu Pro Gln Lys Ala Ile Asp Ala Ala Lys Ala

405 410 415

Ala Asn Lys Ala Pro Asp Ala Phe Tyr Ala Leu Arg Leu Leu Glu Ala

420 425 430

Thr Gly Ile Val Val Val Pro Gly Ser Gly Phe Gly Gln Val Pro Gly

435 440 445

Thr Trp His Ile Arg Cys Thr Ile Leu Pro Gln Glu Glu Lys Ile Pro

450 455 460

Ala Ile Ile Ser Arg Phe Lys Ala Phe His Glu Gly Phe Met Ala Ala

465 470 475 480

Tyr Arg Asp

<210>57

<211>2559

<212>DNA

<213>稻

<400>57

gaaaggggag agaaagagag agaagggaga gagagagaga gagaaggatg aggaagaaga 60

agggatgggg cgctggcgag ctcctctctg cgggtgaacg gccgacaagc tcctcccccg 120

cgcgtggacg gccagcgacc tccttccctg tgcgttgtcg ccgccgcccc gcgctctagt 180

gattgaaggt gagaggagag gaaaagatga gagagagggg agaggggtga gaatgatacg 240

tggggccata tgtcggtggg tcccactatt tttttttgtt aatgacatgt tggtcctaca 300

aatttttgtt tttactctaa tgccacctaa gcgacacgtc gacgacacgt ggaacgaaga 360

ccgggtcaac accgccacgt aggtgccacg tcagccaaaa ccaattccaa aaccacctag 420

gatatagttt gcaccggttt tgttagttag aagagtcgat atatccggtt ttgtggttgg 480

aggtcatgaa tcgtactctg gccatagttg agggagttaa agtatatttt ttccaaggaa 540

aaaatgaatc gagtgtgtca aactgaactg aagacttaaa aaggttgaat ggcagtttga 600

ctgctagtgc attaatcaga tttaaactta caatactact tatttttttc cctctcgagg 660

aatgtctagc agtatatttg cttgacagct caaaaatata aaggatttgc agtaccatcc 720

aaatttagga acaacataca tggaaaagac aaatcgcctg gcgcatgagg cgcttacgtg 780

caggaaaaat aaaaggaaac tgaagctgga aaaaagagag acattataat ttgccgttgc 840

tcattttcta ttttagtgag agttacatgc gggtgcagtg gtgcgtgtga gttgtgactc 900

tccacttccg tgtaatcggg aaaagaagta aaaaagaaaa gaaaagggga gtcggagaga 960

gcaccggtag cattattcca agcaggtgga cccgcgtgtc atccccactc tacaaagcgc 1020

aaaatcatca agggccttcg cctcggcgtg gaggagagtg aggacggccc acgcggagca 1080

gcagagagtc gggaggtggc tccgcttcca cagctctact ccatctctct cagtgtcggg 1140

ctcgccggag tccggccaat ccagccggtt catgcttcat tctctcggtg cgtgatttct 1200

ccgattttcg tctccatcta gtacctgaag cgaggcaaat ttaattgccc ccttttcggt 1260

gcaaactatc tcgtcagatt agtcgcatgc atgttccttc gttgaatttt gcaaagttag 1320

ttgtagagag aagttcttgg gagggtggat gctacggtct catcttctct cttttccccc 1380

aacaagcgag ctagcgaagg ggaaaatggg gggagcagaa gaatatccat gttaggttcg 1440

cgtgcttgcc tctcggctga gctctagctg ttacggcgtt cgtcaggatg gctaatccgt 1500

ctcgccaatt agaagatgga taggtcgtag cgttagatgg attacttgat ggttgatgcg 1560

ctgcccattt attgttctta gcaggttctg tcttctcagt ccgtgtgagt gtttcatcat 1620

attggctacc aagatgatca ctcttcgttt atcaagagag tagggtgaga tctcaatccg 1680

ttgcaactga tgagtacttc ctttgtctca gaatgtaagt atttttgagt tagacacaga 1740

tattaagaaa gtaggtagag atgattggag gagagttgtg attgatgggg aagagaaagt 1800

aggtgaaaaa aaatggttgt gattggttaa gaggacagag taggtgaata aatagcttca 1860

ttttgagaca agttactgtg ctaaaaatag ctacattttg agacggagat agtagtatac 1920

ttcacttact accgagtacg gctttagttt tgctacctcc gtcctaaaat atagcaacct 1980

aggatcggat gtagcatgtt actactaatc tagataggca gcatgtctaa attcatagta 2040

atatggtgac tcgtttagta gaatgttgat atattttagg atggaagaaa tatataaata 2100

ctgttttttt attcgaagta gttggcccat catttctgaa atagatgatt gatgccatga 2160

cgccgcttgc tttctagaac tactagtaat tttaggtgag agctagtact gatgcgtcag 2220

tctaagataa tggacaaaaa agggctacag gctactattg attatcacat taaaactctg 2280

tacgacagat ttttctgatt aaatgatagc catatgccca acgtgctgct tgtctaaact 2340

gaaacctgac atcactcaca gtatgcccag ttgttgggtg gtctattatt atttataaat 2400

tataactctg gcattttttt tattgtaggg caatatgttt tccattattt tccattaaaa 2460

cctctaatct gcacttccac tatctgctca aaatctcagg ctactttctt tcctcttcct 2520

caggacatta acctggttta cttgtaagaa agtaaagcc 2559

<210>58

<211>49

<212>DNA

<213>人工序列

<220>

<223>引物：prm001646

<400>58

ggggacaagt ttgtacaaaa aagcaggctt cacaatggct gctcccagc 49

<210>59

<211>46

<212>DNA

<213>人工序列

<220>

<223>引物：prm001647

<400>59

ggggaccact ttgtacaaga aagctgggta attcagtcgc ggtacg 46

Claims

1.相对于对照植物增强植物的种子产率相关性状的方法，包括增加植物中编码产率增加性多肽的核酸序列的表达，所述产率增加性多肽选自：核定位AT-hook基序蛋白19/20(AHL19/20)、GRP(生长调节蛋白，其中所述GRP多肽是金属硫蛋白2a(MT2a)多肽)、丙氨酸氨基转移酶(AAT)样多肽，和丙氨酸氨基转移酶(AAT)多肽，以及任选地选择具有增强的种子产率相关性状的植物。

2.权利要求1的方法，其中所述产率增加性多肽是核定位AT-hook基序蛋白19/20(AHL19/20)多肽，该AHL19/20多肽包含与SEQ ID NO：36所示保守结构域(CD)具有至少70％、75％、80％、85％、90％、95％、98％、99％或更大的氨基酸序列同一性的结构域，或所述AHL19/20多肽包含：(i)与SEQ ID NO：37所示AT-hook基序具有至少75％、80％、85％、90％、95％、98％、99％或更大的氨基酸序列同一性的基序；和(ii)与SEQID NO：38所示植物及原核生物保守(PPC)结构域具有至少55％、60％、65％、70％、75％、80％、85％、90％、95％、98％、99％或更大的氨基酸序列同一性的结构域。

3.权利要求1或2的方法，其中所述AHL19/20多肽包含：(i)核定位信号；(ii)具有InterPro登录号IPR014476的AT-hook DNA结合基序；和(iii)具有InterPro登录号IPR005175的植物及原核生物保守(PPC)结构域。

4.任何前述权利要求的方法，其中所述AHL19/20多肽，当用于构建AHL系统发生树，例如图1或图2中描述的系统发生树时，与包含SEQ IDNO：2所示多肽序列的AHL19/20多肽群而非任何其他AHL群聚类。

5.权利要求1的方法，其中所述产率增加性多肽按照递增的优选顺序分别与SEQ ID NO：2所示的AHL19/20多肽、或本文表A中所示的任何多肽序列、或SEQ ID NO：46所示GRP多肽、或SEQ ID NO：51所示AAT样多肽、或SEQ ID NO：56所示AAT多肽具有至少50％、55％、60％、65％、70％、75％、80％、85％、90％、95％、98％、99％或更高的氨基酸序列同一性。

6.任何前述权利要求的方法，其中所述编码AHL19/20多肽的核酸序列为表A中所示的任一SEQ ID NO核酸序列或其部分、或能够与表A中所示的任一SEQ ID NO核酸序列杂交的序列。

7.任何前述权利要求的方法，其中所述核酸序列编码表A中所示的任何SEQ ID NO多肽序列的直系同源物或旁系同源物。

8.任何前述权利要求的方法，其中所述增加的表达通过任何一个或多个下列技术实现：T-DNA激活标签、TILLING、或同源重组。

9.任何前述权利要求的方法，其中所述增加的表达通过在植物中引入和表达编码AHL19/20多肽的核酸序列来实现。

10.任何前述权利要求的方法，其中所述增强的种子产率相关性状是一个或多个下列性状：(i)增加的每圆锥花序的花数；(ii)增加的每植物的种子总重量；(iii)增加的饱满种子数；或(iv)增加的收获指数。

11.权利要求2的方法，其中相对于对照植物，所述增强的种子产率相关性状发生在于养分可利用度下降的条件下，优选氮可利用度下降的条件下生长的植物中。

12.权利要求11的方法，其中所述增强的种子产率相关性状是一个或多个下列性状：(i)增加的每植物的种子总产率；(ii)增加的饱满种子数；或(iii)增加的收获指数。

13.权利要求2的方法，其中所述核酸序列与组成型启动子，优选与植物组成型启动子，更优选与GOS2启动子，最优选与SEQ ID NO：35所示的稻的GOS2启动子有效连接。

14.任何前述权利要求的方法，其中所述编码AHL19/20多肽的核酸序列是植物来源的，优选来自双子叶植物，还优选来自十字花科，最优选来自拟南芥。

15.可通过任何前述权利要求的方法获得的植物、其部分(包括种子)、或植物细胞，其中所述植物、其部分或细胞包含与植物组成型启动子有效连接的编码产率增加性多肽的分离的核酸转基因，所述产率增加性多肽选自：核定位AT-hook基序蛋白19/20(AHL19/20)、GRP(生长调节蛋白，其中所述GRP多肽是金属硫蛋白2a(MT2a)多肽)、丙氨酸氨基转移酶(AAT)样多肽和丙氨酸氨基转移酶(AAT)多肽。

16.构建体，其包含：

(a)编码产率增加性多肽的核酸序列，所述产率增加性多肽选自权利要求2至7中任一项所定义的：核定位AT-hook基序蛋白19/20(AHL19/20)、GRP(生长调节蛋白，其中所述GRP多肽是金属硫蛋白2a(MT2a)多肽)、丙氨酸氨基转移酶(AAT)样多肽和丙氨酸氨基转移酶(AAT)多肽；

(c)转录终止序列。

17.权利要求16的构建体，其中所述控制序列是植物组成型启动子，优选GOS2启动子，更优选SEQ ID NO：35所示的GOS2启动子。

18.权利要求16或17的构建体在产生相对于对照植物具有增强的种子产率相关性状的植物的方法中的用途，所述增强的种子产率相关性状是一个或多个下列性状：(i)增加的每圆锥花序的花数；(ii)增加的每植物的种子总重量；(iii)增加的饱满种子数；或(iv)增加的收获指数。

19.用权利要求16或17的构建体转化的植物、植物部分或植物细胞。

20.产生相对于对照植物具有增强的种子产率相关性状的转基因植物的方法，包括：

(i)在植物、植物部分或植物细胞中引入和表达处于植物组成型启动子控制之下的编码产率增加性多肽的核酸序列，所述产率增加性多肽选自权利要求2至7中任一项所定义的：核定位AT-hook基序蛋白19/20(AHL19/20)、GRP(生长调节蛋白，其中所述GRP多肽是金属硫蛋白2a(MT2a)多肽)、丙氨酸氨基转移酶(AAT)样多肽和丙氨酸氨基转移酶(AAT)多肽；和

21.由于编码产率增加性多肽的核酸序列的增加表达而相对于对照植物具有增强的种子产率相关性状的转基因植物、或源自所述转基因植物的转基因植物细胞或转基因植物部分，其中所述核酸序列与植物组成型启动子有效连接，所述产率增加性多肽选自权利要求2至7中任一项所定义的：核定位AT-hook基序蛋白19/20(AHL19/20)、GRP(生长调节蛋白，其中所述GRP多肽是金属硫蛋白2a(MT2a)多肽)、丙氨酸氨基转移酶(AAT)样多肽和丙氨酸氨基转移酶(AAT)多肽。

22.权利要求15、19或21的转基因植物或源自所述转基因植物的转基因植物细胞，其中所述植物是作物植物或单子叶植物或谷类，例如稻、玉米、小麦、大麦、粟、黑麦、黑小麦、高粱和燕麦。

23.权利要求22的植物的可收获部分，其包含编码产率增加性多肽的核酸序列，所述产率增加性多肽选自：核定位AT-hook基序蛋白19/20(AHL19/20)、GRP(生长调节蛋白，其中所述GRP多肽是金属硫蛋白2a(MT2a)多肽)、丙氨酸氨基转移酶(AAT)样多肽和丙氨酸氨基转移酶(AAT)多肽，其中所述可收获部分优选是种子。

24.来源于权利要求22的植物和/或来源于权利要求23的植物的可收获部分的产品。

25.编码产率增加性多肽的核酸序列在增强种子产率相关性状中的用途，所述产率增加性多肽选自如权利要求2至7中任一项所定义的：核定位AT-hook基序蛋白19/20(AHL19/20)、GRP(生长调节蛋白，其中所述GRP多肽是金属硫蛋白2a(MT2a)多肽)、丙氨酸氨基转移酶(AAT)样多肽和丙氨酸氨基转移酶(AAT)多肽，所述增强的种子产率相关性状包括一个或多个下列性状：i)增加的每圆锥花序的花数；(ii)增加的每植物的种子总重量；(iii)增加的饱满种子数；或(iv)增加的收获指数。

26.权利要求25的用途，其中所述增强的种子产率相关性状在养分可利用度下降的条件下，优选在氮可利用度下降的条件下发生。