CN101855355A

CN101855355A - 具有提高的产量相关性状的植物和用于制备该植物的方法

Info

Publication number: CN101855355A
Application number: CN200880115920A
Authority: CN
Inventors: C·勒佐; A·I·桑兹莫林纳罗; V·弗兰卡德; R·S·萨洛姆; J·M·穆莱特萨洛尔特
Original assignee: BASF Plant Science Co GmbH
Current assignee: BASF Plant Science Co GmbH; BASF Plant Science GmbH
Priority date: 2007-09-14
Filing date: 2008-09-15
Publication date: 2010-10-06
Anticipated expiration: 2028-09-15
Also published as: MX2010002753A; DE112008002458T5; EP2537940A2; WO2009034188A1; CN101855355B; RU2010114527A; EP2205748A1; RU2503721C2; CA2699066A1; EP2537940A3; AU2008297099A1; US9617557B2; US20110061133A1; AR069824A1

Abstract

本发明总体上涉及分子生物学领域并涉及用于通过增加植物中编码多肽的核酸序列表达来提高多种植物产量相关性状的方法，其中所述多肽选自GRF多肽、RAA1样多肽、SYR多肽、ARKL多肽和YTP多肽。本发明也涉及具有编码多肽的核酸序列的表达增加的植物，所述多肽选自GRF多肽、RAA1样多肽、SYR多肽、ARKL多肽和YTP多肽，其中所述植物相对于对照植物而言具有提高的产量相关性状。本发明也提供了在本发明方法中有用的构建体。

Description

具有提高的产量相关性状的植物和用于制备该植物的方法

本发明总体上涉及分子生物学领域并涉及用于通过在植物中表达多肽的核酸序列提高多种植物产量相关性状的方法，其中所述多肽选自GRF多肽、RAA1样多肽、SYR多肽、ARKL多肽和YTP多肽。本发明也涉及具有编码多肽的核酸序列的表达增加的植物，所述多肽选自GRF多肽、RAA1样多肽、SYR多肽、ARKL多肽和YTP多肽，其中所述植物相对于对照植物具有提高的产量相关性状。本发明也提供了在本发明方法中有用的构建体。

持续增长的世界人口和农业用可耕地供应萎缩刺激了有关提高农业效率的研究。常规的作物及园艺学改良手段利用选择育种技术以鉴定具有受欢迎特征的植物。然而，此类选择育种技术具有几个缺陷，即这些技术一般耗费很多劳动并且产生这样的植物，其经常含有可能并不总导致受欢迎性状从亲代植物传递下去的异源遗传组分。分子生物学进展已经允许人类改良动物及植物的种质。植物的遗传工程使得可以分离和操作遗传物质(一般处于DNA或RNA形式)并且随后导入该遗传物质至植物中。此类技术具有产生具备多种经济学、农学或园艺学改良性状的作物或植物的能力。

具有特殊经济意义的性状是提高的产量。产量通常定义为来自作物的经济价值的可测量结果。该结果可以就数量和/或品质方面进行定义。产量直接取决于几个因素，例如器官的数目和大小、植物构造(例如枝的数目)、种子产生、叶衰老等。根发育、养分摄入、胁迫耐受性和早期生长势(earlyvigor)也可以是决定产量的重要因素。优化前述因素因而可以有助于提高作物产量。

种子产量是特别重要的性状，因为许多植物的种子对人和动物营养是重要的。作物如谷物、稻、小麦、卡诺拉油菜和大豆占超过一半的人类总热量摄入，无论通过直接消费种子本身或通过消费基于加工的种子而产生的肉产品。作物也是糖、油及工业加工中所用许多类型代谢物的来源。种子含有胚(新苗和新根的来源)和胚乳(萌发期间和籽苗早期生长期间用于胚生长的养分来源)。种子发育涉及多种基因并且需要代谢物从根、叶和茎转移至正在生长的种子中。胚乳尤其同化糖类、油和蛋白质的代谢前体并且将它们合成为贮藏大分子以灌满籽粒。

植物生物量是饲料作物如苜蓿、饲用谷物和干草的产量。产量的许多代用物已经用于谷物作物。它们当中主要是对植物尺寸的估计。植物尺寸可以根据物种和发育阶段以多种方式测量，不过包括总植物干重、地上部分干重、地上部分鲜重、叶面积、茎体积、植物高度、莲座丛直径、叶长度、根长度、根质量、分蘖数和叶数。许多物种维持在给定发育阶段上植物不同部分的尺寸之间的保守比率。这些异速增长关系用来从这些尺寸量值之一外推至另一种尺寸量值(例如Tittonell等人2005Agric Ecosys &Environ 105：213)。在发育早期的植物尺寸一般与发育中稍后的植物尺寸相关。具有较大叶面积的较大植物通常可以比较小的植物吸收更多光线和二氧化碳并且因而可能会在相同的时段期间获得更大重量(Fasoula和Tollenaar 2005Maydica 50：39)。此外，这也是植物应当初始实现较大尺寸的微环境优势或遗传优势的潜在延续。存在针对植物尺寸和生长速率的强遗传组分(例如ter Steege等人2005Plant Physiology 139：1078)，并且因而对于一系列各异遗传表型，在一种环境条件下的植物尺寸很可能关联于另一种环境条件下的尺寸(Hittalmani等人2003Theoretical AppliedGenetics 107：679)。以这种方式，使用标准环境作为作物在田间于不同位置及时间所遭遇的多样且动态环境的代用物。

对于许多作物的另一个重要性状是早期生长势。改进早期生长势是现代稻育种计划在温带和热带稻品种方面的重要目标。长根对于水栽稻中正确土壤固定是重要的。在稻直接播种至被淹没田地的情况下，以及在植物必须从水中迅速出苗的情况下，较长的苗与生长势相关。在实施条播的情况下，较长的中胚轴和胚芽鞘对良好出苗是重要的。将早期生长势人工改造到植物内的能力在农业中将是极重要的。例如，不良的早期生长势已经限制了基于玉米带种质(Corn Belt germplasm)在欧洲大西洋地区引种玉米(Zea mayes L.)杂种。

收获指数即种子产量对地上部分干重的比率在许多环境条件下是相对稳定的并且因而可以经常获得植物尺寸与谷物产量之间的强相关(例如Rebetzke等人2002 Crop Science 42：739)。这些过程是内在联系的，因为谷物生物量的主要部分取决于植物叶和茎的现有和储备光合生产率(Gardener等人1985Physiology of Crop Plants.Iowa State UniversityPress，第68-73页)。因此，选择植物尺寸(甚至在发育的早期)已经用作未来潜在产能的指示物(例如Tittonell等人2005Agric Ecosys & Environ105：213)。当检验遗传差异对胁迫耐受性的影响时，使土壤属性、温度、水和养分有效性和光强度标准化的能力是温室或植物生长室环境与田间相比的固有优势。然而，产量因不良授粉所致的人为限制可能限制这些受控环境检验产量差异的用途，其中所述的不良授粉因缺少风和昆虫或成熟根或根冠生长的足够空间引起。因此，在标准化条件下在生长室或温室测量发育早期的植物尺寸是提供潜在遗传产量优势指示的标准操作。

另一个重要性状是改良的非生物胁迫耐受性。非生物胁迫是世界范围作物损失的主要原因，对于大多数主要作物植物而言平均产量降低超过50％(Wang等人，(2003)Planta 218：1-14)。非生物胁迫可以由干旱、盐度、极端温度、化学毒性养分、(大分子和/或微量元素)过量或匮乏、辐射和氧化胁迫引起。提高植物的非生物胁迫耐受性能力将在世界范围对农民是巨大的经济优势并且将允许在不利条件期间及在本来不可能栽培作物的陆地上栽培作物。

因而可以通过优化前述因素之一提高作物产量。

取决于最终用途，对某些产量性状的改良可能优先于其它产量性状。例如对于应用如饲料或木材生产或生物燃料资源而言，增加植物营养体部分可能是希望的，而对于应用如面粉、淀粉或油生产而言，种子参数提高可能是特别希望的。即便在种子参数当中，某些参数可以更优先于其它参数，这取决于用途。多种机制可以有助于提高种子产量，无论其形式为提高的种子尺寸或提高的种子数目。

提高植物中产量相关性状(种子产量和/或生物量)的一种方法可以是通过调节植物的内在生长机制如细胞周期或参与植物生长或参与防御机制的多种信号传导途径。

现在已经发现可以通过增加植物中编码生长调节因子(GRF)多肽的核酸序列表达而相对于对照植物提高植物中的多种产量相关性状。提高的产量相关性状包含以下一项或多项：提高的早期生长势、提高的地上部分生物量、提高的每株植物总种子产量、提高的种子充实率、提高的收获指数和提高的千粒核重。

现在已经发现可以通过调节植物中编码RAA1样(根构造相关的1(Root Architecture Associated 1))的核酸表达而改善植物中的多种生长特征。

现在已经发现可以通过调节植物中编码种子产量调节蛋白(SYR)的核酸表达而改善植物中的多种生长特征、特别地提高的非生物胁迫抗性。

现在已经发现可以通过调节植物中编码ARKL(ARADIA样)多肽的核酸表达而改善植物中的多种产量相关性状。

现在已经发现可以通过调节植物中编码YTP(产量跨膜蛋白)的核酸表达而改善植物中的多种产量相关性状。

背景

DNA结合蛋白是包含许多DNA结合结构域的任一DNA结合结构域并且因而具有对DNA的特异或普遍亲和性的蛋白质。DNA结合蛋白包括例如调节转录过程的转录因子、切割DNA分子的核酸酶和参与细胞核中DNA包装的组蛋白。

转录因子通常定义为显示序列特异性DNA结合亲和性并且能够激活和/或阻遏转录的蛋白质。拟南芥(Arabidopsis thaliana)基因组编码至少1533种转录调节蛋白，占其预计基因总数的约5.9％(Riechmann等人，(2000)Science 290：2105-2109)。稻转录因子数据库(DRTF)是籼稻(Oryzasativa L.ssp.indica)和粳稻(Oryza sativa L.ssp.japonica)的已知和预测转录因子的集合，并且目前含有籼稻中的2,025种推定转录因子(TF)基因模型和粳稻中的2,384种推定转录因子基因模型，分布在63个家族中(Gao等人(2006)Bioinformatics 2006，22(10)：1286-7)。

这些家族之一是对植物特异的生长调节因子(GRF)转录因子家族。已经在拟南芥中鉴定了至少9种GRF多肽(Kim等人，(2003)Plant J 36：94-104)和在稻中鉴定了至少12种GRF多肽(Choi等人，(2004)Plant CellPhysiol 45(7)：897-904)。GRF多肽以其氨基端半侧存在至少2个高度保守的结构域为特征，其中所述高度保守的结构域以每个结构域内部最保守的氨基酸命名：(i)QLQ结构域(InterPro登录号IPR014978，PFAM登录号PF08880)，其中该结构域的最保守氨基酸是Gln-Leu-Gln；和(ii)WRC结构域(InterPro登录号IPR014977，PFAM登录号PF08879)，其中该结构域的最保守氨基酸是Trp-Arg-Cys。WRC结构域还含有两个明显不同的结构特征，即WRC结构域富含碱性氨基酸Lys和Arg，并还以保守间隔(CX₉CX₁₀CX₂H)包含3个Cys和1个His残基，其中所述保守间隔命名为转录效应子(ET)结构域(Ellerstrom等人，(2005)Plant Molec Biol 59：663-681)。ET结构域中半胱氨酸和组氨酸的保守间隔类似于锌指(锌结合)蛋白。此外，在GRF多肽序列中通常包含核定位信号(NLS)。

已经使用酵母双杂交相互作用测定法展示了一些GRF多肽与转录辅激活蛋白小家族GRF-相互作用因子(GIF1至GIF3，又叫做滑膜肉瘤易位(SYT)多肽，SYT1至SYT3)的相互作用(Kim和Kende(2004)Proc NatlAcad Sci 101：13374-13379)。

名字GRF也已经赋予属于14-3-3多肽家族的另一个类型的多肽(和Ferl(1994)Plant Physiol 106：1593-1604)，所述多肽与用于开展本发明方法的GRF多肽完全无关。

用35S CaMV病毒组成型启动子控制下的稻GRF(OsGRF1)多肽转化的转基因拟南芥植物显示弯曲的叶、初生花序的伸长严重降低和延迟抽苔(van der Knapp等人，(2000)Plant Physiol 122：695-704)。与野生型植物相比，用2种拟南芥GRF多肽(AtGRF1和AtGRF2)之一转化的转基因拟南芥植物产生更大的叶和子叶，抽苔延迟并且部分地不育(原因在于缺少有活力的花粉)(Kim等人，(2003)Plant J 36：94-104)。

在美国专利申请US2006/0048240中，将一种拟南芥GRF多肽鉴定为SEQ ID NO：33421。在美国专利申请2007/0022495，将一种鼠耳芥GRF多肽鉴定为SEQ ID NO：1803(在其中又称作G1438)。使用35S CaMV启动子过量表达G1438的转基因拟南芥属植物展示深绿色的叶。

出人意料地，现在已经发现：增加编码GRF多肽的核酸序列的表达产生了相对于对照植物具有提高的产量相关性状的植物。

根据一个实施方案，提供了用于相对于对照植物而言提高植物中产量相关性状的方法，包括增加植物中编码GRF多肽的核酸序列的表达。提高的产量相关性状包含以下一项或多项：提高的早期生长势、提高的地上部分生物量、提高的每株植物总种子产量、提高的种子充实率、提高的收获指数和提高的千粒核重。

关于单子叶植物中根形成的分子生物学知之甚少。迄今仅鉴定到影响根发育的几种基因：例子是形成少数或不形成根颈或支柱根的rt1突变体(Jenkins，J.Hered.21：79-80，1930)、展示缺陷种子根的asr1突变体(DeMiranda等人，Maize Genet.Coop.News Lett.54：18-19，1980)、缺少结节(不定)根的rtcs突变体(Hetz等人，Plant J.10：845-857，1996)、具有缩短侧根的slr1突变体和slr2突变体(Hochholdinger等人，Plant Physiol125：1529-1539，2001)或在主根的横向启动和种子根形成的启动方面均受影响的rum1(Woll等人，Plant Physiol.，139，1255-1267，2005)。Liu等人(Proteomics 6，4300-4308，2006)在野生型和rum1籽苗的主根之间进行蛋白质组比较并鉴定了差异性地受调节并参与木质素生物合成、防御和柠檬酸循环的另外12种基因。

单子叶植物中参与根形成的另一种基因是首次从稻分离的raa1(Ge等人，Plant Physiol.135，1502-1513，2004)：该基因编码一种与拟南芥FPF1(促开花因子1)具有58％同源性的12.0-kD蛋白质。在稻中，RAA1特异性地表达在顶端分生组织、根尖伸长区、枝区的中柱和青年侧根中。组成型过量表达提高不定根的数目，不过主根生长减少。此外，内源性植物生长素含量增加。OsRAA1也由植物生长素诱导；提示在稻根发育中RAA1与植物生长素之间存在正反馈调节作用(Ge等人，2004)。另外，过量表达OsRAA1的植物具有较长的叶和不育性小花(Ge等人，2004)。WO2006/067219公开了FPF1和相关蛋白质用于增加植物中碳水化合物产生的用途，但是过量表达FPF1的转基因植物不显示提高的种子产量并且据报道不影响根生长。

出人意料地，现在已经发现：调节编码RAA1样多肽的核酸表达产生了相对于对照植物而言具有增强的产量相关性状、特别地提高的产量的植物。

根据一个实施方案，提供了用于相对于对照植物改善植物的产量相关性状的方法，包括调节植物中编码RAA1样多肽的核酸表达。改善的产量相关性状包含提高的高度、苗根比率、根厚度、绿度指数、每穗花数和提高的千粒核重。在正常生长条件以及胁迫条件下观察到改善的产量相关性状。

种子产量调节蛋白(SYR)是迄今尚未表征的一种新蛋白质。SYR对名为ARGOS的拟南芥蛋白显示一些同源性(在DNA水平上约48％序列同一性，在蛋白质水平上约45％序列同一性)(Hu等人，Plant Cell 15，1951-1961，2003；US 2005/0108793)。Hu等人推测ARGOS是功能独特的蛋白质并且由单一基因编码。拟南芥中ARGOS过量表达的主要表型是提高的叶生物量和开花延迟。相反，稻中SYR的过量表达主要提高种子产量，而叶生物量和开花时间没有明显受影响。

出人意料地，现在已经发现：调节植物中编码种子产量调节蛋白(此后命名为SYR)的核酸表达产生了在非胁迫条件下生长时相对于对照植物而言具有增强的非生物胁迫耐受性的植物。

因此，本发明提供了用于相对于对照植物增强在非胁迫条件下生长的植物中产量相关性状的方法，包括调节植物中编码SYR多肽的核酸表达。

ARKL多肽包含与小鼠蛋白ARKADIA中存在的RING指结构域相似的RING指结构域，其中所述的小鼠蛋白ARKADIA是参与胚发生期间Nodal信号传导的E3遍在蛋白连接酶(Mavrakis等人2007；PLoS Biol.2007年3月；5(3)：e67)。

遍在蛋白化，作为通过共价连接遍在蛋白而修饰蛋白质的过程，是真核生物中多种细胞过程的中心和必需部分。在植物中，该途径的缺陷引起许多发育异常、对外界刺激的应答改变和细胞周期及生长模式的变化。遍在蛋白化的蛋白质通过26S蛋白酶体依赖性或非依赖性途径被定向降解。遍在蛋白修饰在信号传导蛋白的激活、内吞作用、分选和组蛋白修饰中发挥作用。

遍在蛋白化蛋白质的命运由遍在蛋白连接的本质决定。单个或多个遍在蛋白可以附着至靶(单遍在蛋白化和多遍在蛋白化；用来形成遍在蛋白链的特定Lys残基可以影响修饰蛋白质的最终命运，例如降解或激活。

遍在蛋白对蛋白质的附着在一个多步骤过程中发生，这个多步骤过程涉及3种酶，称作E1、E2、E3(Glikcman和Ciechanover(2000)Physiol Rev82：377-482)。最初，遍在蛋白以ATP依赖性方式连接至蛋白质，随后所述遍在蛋白转移至E2蛋白质中的半胱氨酸接纳体以形成E2-遍在蛋白中间体，其中所述的E2-遍在蛋白中间体在遍在蛋白连接酶(又称作E3连接酶或E3酶)所介导的一个反应中充当针对靶蛋白的遍在蛋白供体。存在多种类型的E3连接酶。RING型E3连接酶以存在称作RING指或RING-ZnF(真正有兴趣的新基因-锌指)的保守蛋白质结构域为特征。

锌结合基序是稳定的结构，并且它们在结合其靶时很少经历构象变化。大多数ZnF蛋白含有与其靶分子产生串联接触的多个指样突出物，经常识别伸展的底物。RING指是据推测在蛋白质-蛋白质相互作用中发挥作用的特化的锌结合结构域。RING指长40至60个残基并与两个锌原子配位。它不同于其他锌指的地方是与锌离子配位的8个金属配体氨基酸残基属于称作横撑(cross-brace)结构的特定结构(Borden(2000).J Mol Biol 295：1103-1112)。这种结构域中与锌离子配位的半胱氨酸/组氨酸的间隔是C-x(2)-C-x(9至39)-C-x(1至3)-H-X(2至3)-C-x(2)-C-x(4至48)-C-x(2)-C。金属配体对1和3配位配对以结合一个锌离子，而金属配体对2和4配位配对以结合第二个锌离子。存在两种不同的变体，C3HC4型和C3H2C3型，它们是明显相关的，尽管半胱氨酸/组氨酸模式不同。后者类型有时候称作′RING-H2指′。在后者中，锌离子的配位由6个半胱氨酸和2个组氨酸介导，而在C3HC4中，由7个半胱氨酸和1个组氨酸介导。

在拟南芥中存在至少477种包含RING结构域的推定蛋白质。一些推定蛋白质含有多个RING指结构域。RING结构域已经基于存在的金属配体残基和/或这些结构域之间的氨基酸数划分成8种类型(Stone等人2005)Plant Phys.137，13-30。RING-H2类是拟南芥中的最大类别。基于结构域的本质和它们的结构组织，拟南芥RING指蛋白已经进一步分成30个组，组1至组30。也识别出一些组内部的亚组，例如，组2的亚组2.1和2.2(Stone等人2005)。组I称作缺少之前描述的结构域的RING指蛋白质的组。对那些蛋白质的序列分析揭示出RING结构域之外少数蛋白质之间具有相似性的区域，它们被称作DAR1至DAR3(与RING相关的结构域)。DAR1和DAR3长大约40个氨基酸并且DAR2长大约120个氨基酸。据报道DAR1仅存在于植物来源的蛋白质中(Stone等人，2005)。共同保守结构域的存在提示了包含所述结构域的蛋白质的相关功能。

出人意料地，现在已经发现：调节编码ARKL多肽的核酸表达产生了相对于对照植物而言具有增强的产量相关性状、特别地提高的产量的植物。

根据一个实施方案，提供了用于相对于对照植物改善或增强植物的产量相关性状的方法，包括调节植物中编码ARKL多肽的核酸表达。

全部真核细胞均含有在细胞内部建起多种膜封闭区室的复杂内膜系统。该内膜系统是参与细胞内部运输的膜结构的总称。内膜系统的主要组分是内质网、高尔基体、囊泡、细胞膜和核膜。内膜系统的诸成员借助彼此或通过使用囊泡使物质通过。全部细胞的共同特征是称作胞浆膜的外部限制膜。

细胞膜由脂质和蛋白质建立。蛋白质与膜的缔合作用可以借助共价键发生，其中蛋白质借助所述共价键与膜的脂质缔合。在称为跨膜蛋白的情形下，蛋白质的多肽链实际上横越脂双层。与膜的缔合作用也可以借助所谓外周蛋白的蛋白质通过非共价键与整合型膜蛋白的突出部分缔合而发生。

跨膜蛋白(TM蛋白)具有两亲本质，具备疏水性TM区段(TMS)和亲水环(hydrophilic loop)。在跨膜蛋白中，在脂质双层内部的部分主要由疏水性氨基酸组成。这些疏水性氨基酸通常以α螺旋排列，从而在肽键处的极性羰基(-C＝O)和氨基(-NH)可以彼此相互作用，而不与疏水性周围环境相互作用。从脂质双层突出的那些多肽部分倾向于具有高百分数的亲水氨基酸。另外，突入胞外空间的那些多肽部分通常被糖基化。

已经基于实验性X射线晶体学、NMR、基因融合技术、替代的半胱氨酸可及性方法、Asp(N)连接糖基化实验和其他生物化学方法确定了蛋白质的跨膜拓朴学。此外，已经开发了从TM蛋白的氨基酸序列确定其结构和功能的许多跨膜拓朴学预测方法(

等人，2001；Ikeda等人，2002；Chen等人，2002)。

蛋白质之间蛋白质序列相似性的分析已经得益于基因组领域的发展。可以使用特定算法对仍未赋予功能的两种或多种蛋白质当中保守的许多结构域实施分析。一种这样的保守结构域是如Pfam中所述的所谓DUF221结构域(功能未知结构域221)(Finn等人Nucleic Acids Research(2006)数据库卷34：D247-D251)。这种结构域发现于一个假定的跨膜蛋白家族中，所述的假定的跨膜蛋白均不具有任何已知功能，所比对的区域是538个残基最大长度。该结构域存在于许多真核来源的蛋白质中。已经报道了编码包含DUF221的蛋白质的拟南芥基因EDR4在脱水处理时短暂表达(Kiyosue等人；Plant Mol Biol.199425(5)：791-8)。已经报道了敲除编码另一种含有DUF221结构域的蛋白质的基因的拟南芥突变体gfs10具有与液泡分选突变体相似的表型(Fuji等人；2007.Plant Cell.2007.19(2)：597-609)。

出人意料地，现在已经发现：调节编码YTP多肽的核酸表达产生了相对于对照植物而言具有增强的产量相关性状、特别地提高的产量的植物。

根据一个实施方案，提供了用于相对于对照植物增强(改善)植物的产量相关性状的方法，包括调节植物中编码YTP多肽的核酸表达。

定义

多肽/蛋白质

术语“多肽”和“蛋白质”在本文中可相互交换地使用并且指由肽键连接起来的任意长度聚合物形式的氨基酸。

多核苷酸/核酸/核酸序列/核苷酸序列

术语“多核苷酸”、“核酸序列”、“核苷酸序列”、“核酸”、“核酸分子”在本文中可相互交换地使用并且指任意长度的聚合非分支形式的核苷酸，即核糖核苷酸或脱氧核糖核苷酸或这二者的组合。

对照植物

选择合适的对照植物是实验设计的例行部分并且可以包括相应的野生型植物或无目的基因的相应植物。对照植物一般是相同的植物物种或甚至是与待评估植物相同的品种。对照植物也可以是待评估植物的失效合子。失效合子是因分离而丢失转基因的个体。如本文中所用的“对照植物”不仅指完整植物，也指植物部分，包括种子和种子部分。

同源物

蛋白质的“同源物”包括这样的肽、寡肽、多肽、蛋白质和酶，它们相对于非修饰的所讨论蛋白质具有氨基酸替换、缺失和/或插入并且与衍生它们的非修饰蛋白质具有相似的生物学活性和功能活性。

缺失指从蛋白质中移除一个或多个氨基酸。

插入指一个或多个氨基酸残基被导入蛋白质中的预定位点。插入可以包含氨基端融合和/或羧基端融合以及序列内插入单个或多个氨基酸。通常，在氨基酸序列内部的插入物比氨基端融合物或羧基端融合物小约1至10个残基级别。氨基端或羧基端融合蛋白或融合肽的例子包括如酵母双杂交系统中所用的转录激活物的结合结构域或激活结构域、噬菌体外壳蛋白、(组氨酸)-6-标签、谷胱甘肽S-转移酶-标签、蛋白A、麦芽糖结合蛋白、二氢叶酸还原酶、Tag·100表位、c-myc表位、

-表位、lacZ、CMP(钙调蛋白结合肽)、HA表位、蛋白C表位和VSV表位。

替换指以具有相似特性(如相似的疏水性、亲水性、抗原性、形成或破坏α-螺旋结构或β-折叠结构的倾向性)的其他氨基酸替代蛋白质的氨基酸。氨基酸替换一般是单个残基的，但是根据给予多肽的功能性约束条件，可以是簇集的；插入通常是约1至10个氨基酸残基级别。氨基酸替换优选地是保守性氨基酸替换。保守性替换表是本领域熟知的(见例如Creighton(1984)Proteins.W.H.Freeman and Company(编著)和下表1)。

表1：保守性氨基酸替换的例子

残基	保守性替换	残基	保守性替换
残基	保守性替换	残基	保守性替换	Ala	Ser	Leu	Ile；Val

残基	保守性替换	残基	保守性替换
残基	保守性替换	残基	保守性替换	Arg	Lys	Lys	Arg；Gln
Asn	Gln；His	Met	Leu；Ile	Arg	Lys	Lys	Arg；Gln
Asn	Gln；His	Met	Leu；Ile	Asp	Glu	Phe	Met；Leu；Tyr
Gln	Asn	Ser	Thr；Gly	Asp	Glu	Phe	Met；Leu；Tyr
Gln	Asn	Ser	Thr；Gly	Cys	Ser	Thr	Ser；Val
Glu	Asp	Trp	Tyr	Cys	Ser	Thr	Ser；Val
Glu	Asp	Trp	Tyr	Gly	Pro	Tyr	Trp；Phe
His	Asn；Gln	Val	Ile；Leu	Gly	Pro	Tyr	Trp；Phe
His	Asn；Gln	Val	Ile；Leu	Ile	Leu，Val

氨基酸替换、缺失和/或插入可以使用本领域熟知的肽合成技术如固相肽合成法等或通过重组DNA操作轻易地进行。用于操作DNA序列以产生蛋白质的替换、插入或缺失变体的方法是本领域熟知的。例如，用于在DNA的预定位点处产生替换突变的技术是本领域技术人员熟知的并且包括M13诱变法、T7-Gen体外诱变法(USB，Cleveland，OH)、QuickChange位点定向诱变法(Stratagene，San Diego，CA)、PCR介导的位点定向诱变或其他位点定向诱变法。

衍生物

“衍生物”包括这样的肽、寡肽、多肽，其中与天然存在形式蛋白质(如目的蛋白)的氨基酸序列相比较，它们包含非天然存在的氨基酸残基对氨基酸的替换或非天然存在的氨基酸残基的添加。蛋白质的“衍生物”也包括这样的肽、寡肽、多肽，其中与所述多肽的天然存在形式的氨基酸序列相比，它们包含天然存在的改变(糖基化、酰化、异戊二烯化、磷酸化、肉豆蔻酰化、硫酸化等)的氨基酸残基或非天然存在的改变的氨基酸残基。与衍生出衍生物的氨基酸序列相比较，该衍生物可以也包含与所述氨基酸序列共价或非共价结合的一个或多个非氨基酸取代基或添加物(例如报道分子或其他配体)，如所结合旨在促进检测该衍生物的报道分子，和相对于天然存在蛋白质的氨基酸序列而言，包含非天然存在的氨基酸残基。

此外，“衍生物”也包括天然存在形式蛋白质与标签肽如FLAG、HIS6或硫氧还蛋白(对于标签肽的综述，见Terpe，Appl.Microbiol.Biotechnol.60，523-533，2003)的融合物。

直向同源物/旁系同源物

直向同源物和旁系同源物包括用来描述基因祖先关系的进化概念。旁系同源物是相同物种内因祖先基因复制而起源的基因；直向同源物是来自不同生物的因物种形成而起源的基因，并且也衍生于共同的祖先基因。

结构域

术语“结构域”指在进化相关性蛋白质的序列比对结果上的特定位置处保守的一组氨基酸。尽管在其他位置处的氨基酸可以在同源物之间不同，然而在特定位置处高度保守的氨基酸指示在蛋白质结构、稳定性或功能方面很可能是必需的氨基酸。结构域因其在蛋白质同源物家族的比对序列中高程度保守而鉴定，故它们可以用作鉴定物来确定所讨论的任意多肽是否属于先前已鉴定的多肽家族。

基序/共有序列/标签

术语“基序”或“共有序列”或“标签”指在进化相关蛋白质的序列中的短保守区域。基序往往是结构域的高度保守部分，但是也可以仅包括该结构域的部分，或可以位于保守结构域之外(若该基序的全部氨基酸位于定义的结构域之外)。

杂交

如本文中所定义的术语“杂交”是其中基本上同源的互补核苷酸序列相互复性的过程。杂交过程可以完全在溶液中进行，即两种互补性核酸分子均处在溶液中。杂交过程也可以用固定至基质如磁珠、琼脂糖凝胶(Sepharose)珠或任何其他树脂的互补性核酸分子之一进行。杂交过程也可以用固定至固体支持物如硝酸纤维素膜或尼龙膜上或通过例如照相平版印刷术固定至例如硅玻璃支持物(后者称作核酸序列阵列或微阵列或称作核酸序列芯片)的互补性核酸分子之一进行。为使杂交发生，核酸分子通常被热变性或化学变性，以将双链解链成两条单链和/或去除来自单链核酸分子的发夹或其他二级结构。

术语“严格性”指杂交发生的条件。杂交的严格性受诸条件如温度、盐浓度、离子强度和杂交缓冲液组成的影响。通常，将低严格条件选择成在定义的离子强度和pH处，低于特定序列的热解链温度(Tm)约30℃。中等严格条件是当所述温度在Tm以下20℃时，并且高严格条件是当所述温度在Tm以下10℃时。高严格杂交条件一般用于分离与靶核酸序列具有高序列相似性的杂交序列。然而，核酸序列可以在序列上偏离且依旧编码基本上相同的多肽，原因是遗传密码的简并性。因而，有时候可能需要中等严格杂交条件以鉴定此类核酸分子序列。

Tm是在定义的离子强度和pH处的下述温度，其中50％的靶序列在所述温度与完全匹配的探针杂交。Tm取决于溶液条件和探针的碱基组成及长度。例如，较长的序列在更高温度上特异性杂交。最大杂交速率从低于Tm约16℃直至32℃获得。杂交溶液中一价阳离子的存在降低了两条核酸分子链之间的静电排斥作用，因而促进杂交体形成；这种作用对于直到0.4M的钠浓度是显而易见的(对于更高的浓度而言，可以忽略这种作用)。甲酰胺降低DNA-DNA和DNA-RNA双链体的解链温度，每百分数的甲酰胺降低0.6至0.7℃，且添加50％甲酰胺允许在30至45℃杂交，尽管杂交速率会降低。碱基对错配降低杂交速率和双链体的热稳定性。平均且对于大的探针而言，Tm下降约1℃/每％碱基错配。根据杂交体的类型，Tm可以使用以下等式计算：

1)DNA-DNA杂交体(Meinkoth和Wahl，Anal.Biochem.，138：267-284，1984)：

T_m＝81.5℃+16.6×log₁₀[Na⁺]^a+0.41×％[G/C^b]-500×L^c]^-1-0.61×％甲酰胺

2)DNA-RNA杂交体或RNA-RNA杂交体：

T_m＝79.8+18.5(log₁₀[Na⁺]^a)+0.58(％G/C^b)+11.8(％G/C^b)²-820/L^c

3)寡DNA杂交体或寡RNA^d杂交体：

对少于20个核苷酸而言：T_m＝2(l_n)

对20-35个核苷酸而言：T_m＝22+1.46(l_n)

^a或者用于其他一价阳离子，但是仅在0.01-0.4M范围内是精确的。

^b仅对于在30％-75％范围内的％GC是精确的。

^cL＝双链体的碱基对长度。

^d Oligo，寡核苷酸；l_n，＝引物的有效长度＝2×(G/C数)+(A/T数)。

可以使用许多已知技术中任意一种技术控制非特异性结合，例如将膜以含有蛋白质的溶液封闭、添加异源RNA、异源DNA和SDS至杂交缓冲液，并且用RNA酶处理。对于非同源性探针，可以通过变换以下条件之一：(i)渐进地降低复性温度(例如从68℃至42℃)或(ii)渐进地降低甲酰胺浓度(例如从50％至0％)进行一系列杂交。技术人员了解可以在杂交期间变更并且会维持或改变所述严格条件的多个参数。

除了杂交条件之外，杂交特异性一般还取决于杂交后洗液的功能。为除去因非特异性杂交引起的背景，用稀释的盐溶液洗涤样品。此类洗液的关键因素包括最终洗涤溶液的离子强度和温度：盐浓度越低且洗涤温度越高，则洗涤的严格性越高。洗涤条件一般在杂交严格性上或低于所述杂交严格性进行。阳性杂交产生至少两倍于背景信号的信号。通常，用于核酸序列杂交测定法或基因扩增检测方法的适宜严格条件如上所述。也可以选择严格性更高或更低的条件。技术人员了解可以在洗涤期间变更并且会维持或改变所述严格条件的多个参数。

例如，用于长度大于50个核苷酸的DNA杂交体的典型高严格杂交条件包括在65℃于1×SSC中或在42℃于1×SSC和50％甲酰胺中杂交，随后在65℃于0.3×SSC中洗涤。用于长度大于50个核苷酸的DNA杂交体的中等严格杂交条件的例子包括在50℃于4×SSC或在40℃于6×SSC和50％甲酰胺中杂交，随后在50℃于2×SSC中洗涤。杂交体的长度是杂交核酸的预期长度。当序列已知的核酸分子杂交时，可以通过比对序列并鉴定本文中所述的保守区而确定杂交体长度。1×SSC是0.15M NaCl和15mM柠檬酸钠；杂交溶液和洗涤溶液可以额外地包括5×Denhardt试剂、0.5-1.0％SDS、100μg/ml变性的片段化鲑精DNA、0.5％焦磷酸钠。

出于定义严格性水平的目的，可以参考Sambrook等(2001)MolecularCloning：a laboratory manual，第三版Cold Spring Harbor LaboratoryPress，CSH，New York或参考Current Protocols in Molecular Biology，John Wiley&Sons，N.Y.(1989和年度更新版)。

剪接变体

如本文中所用的术语“剪接变体”包括其中已经切除、替换、置换或添加所选内含子和/或外显子或其中已经缩短或加长内含子的核酸序列的变体。此类变体将是基本上保留蛋白质的生物学活性的一类变体；这可以通过选择性保留蛋白质的功能片段实现。此类剪接变体可以在自然界中找到或可以人工制备。用于预测和分离此类剪接变体的方法是本领域熟知的(见例如Foissac和Schiex(2005)BMC Bioinformatics.6：25)。

等位变体

等位基因或等位变体是给定基因位于相同染色体位置处的备选形式。等位变体包含单核苷酸多态性(SNP)和小的插入/缺失多态性(INDEL)。INDEL的大小通常小于100bp。SNP和INDEL形成大部分生物的天然存在多态性株系中的序列变体的最大集合。

基因改组/定向进化

基因改组或定向进化由反复DNA改组，随后适当筛选和/或选择以产生编码具有改良生物学活性的蛋白质的核酸序列或其部分的变体而组成(Castle等人，(2004)Science 304(5674)：1151-4；美国专利5,811,238和6,395,547)。

调节元件/调控序列/启动子

术语“调节元件”、“调控序列”和“启动子”均在本文中可相互交换地使用并且在广泛含义上意指能够实现与它们相连接的序列表达的调节性核酸序列。术语“启动子”一般指位于基因转录起点上游并参与识别和结合RNA聚合酶和其他蛋白质，因而指导有效连接的核酸转录的核酸序列调控序列。前述术语包括从经典真核基因组基因(包括对于精确转录启动所需的TATA框，具有或没有CCAAT框序列)衍生的转录调节序列和应答发育性刺激和/或外部刺激或以组织特异性方式而改变基因表达的其它调节元件(即上游激活序列、增强子(increaser)和沉默子)。本术语还包括经典原核基因的转录调节序列，在此情况下它可以包括一个-35框序列和/或一个-10框转录调节序列。术语“调节元件”也包含赋予、激活或增加核酸分子序列在细胞、组织或器官中表达的人工融合分子或衍生物。

“植物启动子”包含介导植物细胞中编码序列节段表达的调节元件。因此，植物启动子不必须是植物来源的，但可以源自病毒或微生物，例如来自侵袭植物细胞的病毒。“植物启动子”优选地源于植物细胞，例如来自用在本发明方法中待表达并在本文中描述的核酸序列转化的植物。这也适用于其他“植物”调节信号，如“植物”终止子。用于本发明方法中的核苷酸序列上游的启动子可以通过一个或多个核苷酸替换、插入和/或缺失进行修饰，但不影响启动子、可读框(ORF)或3’调节区如终止子或远离ORF存在的其他3’调节区的功能性或活性。还有可能所述启动子的活性因修饰其序列或它们被更活跃的启动子、甚至来自异源生物的启动子彻底替换而提高。为了在植物中表达，如上所述，核酸序列分子必须有效地连接至或包含在正确的时间点并以所需空间表达模式表达基因的合适启动子。

为鉴定功能性等同启动子，候选启动子的启动子强度和/或表达模式可以例如通过将此启动子有效连接至报道基因并分析该报道基因在植物的多种组织中的表达水平和模式进行分析。合适的熟知报道基因包括例如β-葡糖醛酸酶或β-半乳糖苷酶。启动子活性通过测量β-葡糖醛酸酶或β-半乳糖苷酶的酶活性进行分析。启动子强度和/或表达模式可以随后与参考启动子(如在本发明方法中使用的一种启动子)的启动子强度和/或表达模式比较。备选地，启动子强度可以使用本领域已知方法如RNA印迹法及放射自显影图的密度计分析法、定量实时PCR或RT-PCR(Heid等，1996GenomeMethods 6：986-994)，通过量化mRNA水平或通过将本发明方法中所用核酸序列的mRNA水平与持家基因(如18S rRNA)的mRNA水平比较进行分析。通常“弱启动子”意指驱动编码序列在低水平表达的启动子。“低水平”意指在每个细胞约1/10,000转录物至约1/100,000转录物、至约1/500,0000转录物的水平上。相反，“强启动子”驱动编码序列在高水平、或以每个细胞约1/10转录物至约1/100转录物、至约1/1000转录物表达。通常，“中等强度启动子”意指驱动编码序列在一切情况下以低于受35S CaMV启动子控制时所获得水平的水平表达的启动子。

有效地连接

如本文中所用的术语“有效地连接”指启动子序列与目的基因之间的功能连接，从而该启动子序列能够启动该目的基因转录。

组成型启动子

“组成型启动子”指在生长和发育的大部分期间但不是必需在全部期间，以及在大多数环境条件下，在至少一种细胞、组织或器官中有转录活性的启动子。下表2a给出组成型启动子的例子。

表2a：植物组成型启动子的例子

基因来源	参考文献
基因来源	参考文献	肌动蛋白	McElroy等人，Plant Cell，2：163-171，1990
HMGB	WO 2004/070039	肌动蛋白	McElroy等人，Plant Cell，2：163-171，1990
HMGB	WO 2004/070039	GOS2	de Pater等人，Plant J Nov；2(6)：837-44，1992，WO
基因来源	参考文献	GOS2	de Pater等人，Plant J Nov；2(6)：837-44，1992，WO
基因来源	参考文献		2004/065596
遍在蛋白	Christensen等人，Plant Mol.Biol.18：675-689，1992		2004/065596
遍在蛋白	Christensen等人，Plant Mol.Biol.18：675-689，1992	稻亲环蛋白	Buchholz等人，Plant Mol Biol.25(5)：837-43，1994
玉米H3组蛋白	Lepetit等人，Mol.Gen.Genet.231：276-285，1992	稻亲环蛋白	Buchholz等人，Plant Mol Biol.25(5)：837-43，1994
玉米H3组蛋白	Lepetit等人，Mol.Gen.Genet.231：276-285，1992	苜蓿H3组蛋白	Wu等人.Plant Mol.Biol.11：641-649，1988
肌动蛋白2	An等人，Plant J.10(1)；107-121，1996	苜蓿H3组蛋白	Wu等人.Plant Mol.Biol.11：641-649，1988
肌动蛋白2	An等人，Plant J.10(1)；107-121，1996	核酮糖二磷酸羧化酶-加氧酶小亚基	US 4,962,028
OCS	Leisner(1988)Proc Natl Acad Sci USA 85(5)：2553	核酮糖二磷酸羧化酶-加氧酶小亚基	US 4,962,028
OCS	Leisner(1988)Proc Natl Acad Sci USA 85(5)：2553	SAD1	Jain等人，Crop Science，39(6)，1999：1696
SAD2	Jain等人，Crop Science，39(6)，1999：1696	SAD1	Jain等人，Crop Science，39(6)，1999：1696

基因来源	参考文献
基因来源	参考文献	V-ATP酶	WO 01/14572
G框蛋白	WO 94/12015	V-ATP酶	WO 01/14572
G框蛋白	WO 94/12015	CAMV 35S	Odell等人，Nature，313：810-812，1985
CaMV 19S	Nilsson等人，Physiol.Plant.100：456-462，1997	CAMV 35S	Odell等人，Nature，313：810-812，1985
CaMV 19S	Nilsson等人，Physiol.Plant.100：456-462，1997	34S FMV	Sanger等人，Plant.Mol.Biol.，14，1990：433-443
nos	Shaw 等人(1984)Nucleic Acids Res.12(20)：7831-7846	34S FMV	Sanger等人，Plant.Mol.Biol.，14，1990：433-443

遍在启动子

遍在启动子是在生物的全部组织或细胞中基本上有活性的。

发育调节型启动子

发育调节型启动子在某些发育阶段期间或在经历发育变化的植物的部分中有活性。

诱导型启动子

诱导型启动子在应答化学刺激(综述见Gatz 1997，Annu.Rev.PlantPhysiol.Plant Mol.Biol.，48：89-108)、环境刺激或物理刺激时具有诱导的或提高的转录启动作用，或可以是“胁迫诱导的”，即当植物暴露于多种胁迫条件时其激活，或是“病原体诱导的”，即当植物暴露于多种病原体时其激活。

器官特异性/组织特异性启动子

器官特异性或组织特异性启动子是能够偏好地启动某些器官或组织如叶、根、种子组织等中转录的启动子。例如，“根特异性启动子”是这样的启动子，该启动子优势地在植物根中具有转录活性，在植物的任何其他部分中基本上无活性，尽管在该植物的这些其他部分中仍允许任意泄露表达。能够仅在某些细胞中启动转录的启动子在本文中称作“细胞特异性的”。

根特异性启动子的例子列于下表2b中。

表2b：根特异性启动子的例子

基因来源	参考文献
基因来源	参考文献	稻RCc3	Xu等人(1995)Plant Mol Biol27(2)：237-48

基因来源	参考文献
基因来源	参考文献	拟南芥磷酸盐转运蛋白PHT1	Kovama等人，2005
苜蓿磷酸盐转运蛋白	Xiao等人，2006	拟南芥磷酸盐转运蛋白PHT1	Kovama等人，2005
苜蓿磷酸盐转运蛋白	Xiao等人，2006	拟南芥属Pyk10	Nitz等人(2001)Plant Sci 161(2)：337-346
烟草根特异性基因RB7、RD2、RD5、RH12	Conkling等人(1990)Plant Phys93(3)：1203-1211	拟南芥属Pyk10	Nitz等人(2001)Plant Sci 161(2)：337-346
烟草根特异性基因RB7、RD2、RD5、RH12	Conkling等人(1990)Plant Phys93(3)：1203-1211	大麦根特异性凝集素	Lerner和Raikhel(1989)PlantPhys 91：124-129
根特异性羟基脯氨酸丰富蛋白	Keller和Lamb(1989)Genes&Dev 3：1639-1646	大麦根特异性凝集素	Lerner和Raikhel(1989)PlantPhys 91：124-129
根特异性羟基脯氨酸丰富蛋白	Keller和Lamb(1989)Genes&Dev 3：1639-1646	拟南芥CDC27B/hobbit	Blilou等人(2002)Genes&Dev16：2566-2575

种子特异性启动子是能够在种子组织中优势地具有转录活性的启动子，但无需排他性地在种子组织中有转录活性(在泄露表达的情况下)。种子特异性启动子可以在种子发育期间和/或萌发期间有活性。种子特异性启动子的例子示于下文表2c中。种子特异性启动子的其他例子在Qing Qu和Takaiwa(Plant Biotechnol.J.2，113-125，2004)中给出，所述文献的公开内容如完整所述那样通过引用方式并入本文。

表2c：种子特异性启动子的例子

基因来源	参考文献
基因来源	参考文献	种子特异性基因	Simon等人，Plant Mol.Biol.5：191，1985；
	Scofield等人，J.Biol.Chem.262：12202，1987.；	种子特异性基因	Simon等人，Plant Mol.Biol.5：191，1985；
	Scofield等人，J.Biol.Chem.262：12202，1987.；		Baszczynski等人，Plant Mol.Biol.14：633，1990.
巴西坚果(Brazil Nut)白蛋白	Pearson等人，Plant Mol.Biol.18：235-245，1992.		Baszczynski等人，Plant Mol.Biol.14：633，1990.

基因来源	参考文献
基因来源	参考文献	豆球蛋白	Ellis等人，Plant Mol.Biol.10：203-214，1988.
谷蛋白(稻)	Takaiwa等人，Mol.Gen.Genet.208：15-22，1986；	豆球蛋白	Ellis等人，Plant Mol.Biol.10：203-214，1988.
谷蛋白(稻)	Takaiwa等人，Mol.Gen.Genet.208：15-22，1986；		Takaiwa等人，FEBS Letts.221：43-47，1987.
玉米醇溶蛋白	Matzke等人，Plant Mol Biol，14(3)：323-321990		Takaiwa等人，FEBS Letts.221：43-47，1987.
玉米醇溶蛋白	Matzke等人，Plant Mol Biol，14(3)：323-321990	NapA	Stalberg等人，Planta 199：515-519，1996.
小麦LMW和HMW麦谷蛋白-1	Mol Gen Genet 216：81-90，1989；NAR 17：461-2，1989	NapA	Stalberg等人，Planta 199：515-519，1996.
小麦LMW和HMW麦谷蛋白-1	Mol Gen Genet 216：81-90，1989；NAR 17：461-2，1989	小麦SPA	Albani等人，Plant Cell，9：171-184，1997
小麦α、β、γ-麦醇溶蛋白	EMBO J.3：1409-15，1984	小麦SPA	Albani等人，Plant Cell，9：171-184，1997
小麦α、β、γ-麦醇溶蛋白	EMBO J.3：1409-15，1984	大麦Itr1启动子	Diaz等人.(1995)Mol Gen Genet 248(5)：592-8
大麦B1、C、D大麦醇溶蛋白	Theor Appl Gen 98：1253-62，1999；Plant J4：343-55，1993；Mol Gen Genet 250：750-60，1996	大麦Itr1启动子	Diaz等人.(1995)Mol Gen Genet 248(5)：592-8
大麦B1、C、D大麦醇溶蛋白		大麦DOF	Mena等人，The Plant Journal，116(1)：53-62，
基因来源	参考文献	大麦DOF	Mena等人，The Plant Journal，116(1)：53-62，
基因来源	参考文献		1998
blz2	EP99106056.7		1998
blz2	EP99106056.7	合成的启动子	Vicente-Carbajosa等人，Plant J.13：629-640，1998.
稻谷醇溶蛋白NRP33	Wu等人，Plant Cell Physiology 39(8)885-889，1998	合成的启动子	Vicente-Carbajosa等人，Plant J.13：629-640，1998.

基因来源	参考文献
基因来源	参考文献	稻α-球蛋白Glb-1	Wu等人，Plant Cell Physiology 39(8)885-889，1998
稻OSH1	Sato等人，Proc.Natl.Acad.Sci.USA，93：8117-8122，1996	稻α-球蛋白Glb-1	Wu等人，Plant Cell Physiology 39(8)885-889，1998
稻OSH1	Sato等人，Proc.Natl.Acad.Sci.USA，93：8117-8122，1996	稻α-球蛋白REB/OHP-1	Nakase等人，Plant Mol.Biol.33：513-522，1997.
稻ADP-葡萄糖焦磷酸酶	Trans Res 6：157-68，1997	稻α-球蛋白REB/OHP-1	Nakase等人，Plant Mol.Biol.33：513-522，1997.
稻ADP-葡萄糖焦磷酸酶	Trans Res 6：157-68，1997	玉米ESR基因家族	Plant J 12：235-46，1997
高粱α-高粱醇溶蛋白	DeRose等人，Plant Mol.Biol.32：1029-35，1996.	玉米ESR基因家族	Plant J 12：235-46，1997
高粱α-高粱醇溶蛋白	DeRose等人，Plant Mol.Biol.32：1029-35，1996.	KNOX	Postma-Haarsma等人，Plant Mol.Biol.39：257-71，1999
稻油质蛋白	Wu等人，J.Biochem.123：386，1998	KNOX	Postma-Haarsma等人，Plant Mol.Biol.39：257-71，1999
稻油质蛋白	Wu等人，J.Biochem.123：386，1998	向日葵油质蛋白	Cummins等人，Plant Mol.Biol.19：873-876，1992
PRO0117，推定的稻40S核糖体蛋白	WO 2004/070039	向日葵油质蛋白	Cummins等人，Plant Mol.Biol.19：873-876，1992
PRO0117，推定的稻40S核糖体蛋白	WO 2004/070039	PRO0136，稻丙氨酸氨基转移酶	未公开
PRO0147，胰蛋白酶抑制剂ITR1(大麦)	未公开	PRO0136，稻丙氨酸氨基转移酶	未公开
PRO0147，胰蛋白酶抑制剂ITR1(大麦)	未公开	PRO0151，稻WSI18	WO 2004/070039
基因来源	参考文献	PRO0151，稻WSI18	WO 2004/070039
基因来源	参考文献	PRO0175，稻RAB21	WO 2004/070039
PRO005	WO 2004/070039	PRO0175，稻RAB21	WO 2004/070039

基因来源	参考文献
基因来源	参考文献	PRO0095	WO 2004/070039
α-淀粉酶(Amy32b)	Lanahan等人，Plant Cell 4：203-211，1992；Skriver等人，Proc Natl Acad Sci USA88：7266-7270，1991	PRO0095	WO 2004/070039
α-淀粉酶(Amy32b)		组织蛋白酶β样基因	Cejudo等人，Plant Mol Biol 20：849-856，1992
大麦Ltp2	Kalla等人，Plant J.6：849-60，1994	组织蛋白酶β样基因	Cejudo等人，Plant Mol Biol 20：849-856，1992
大麦Ltp2	Kalla等人，Plant J.6：849-60，1994	Chi26	Leah等人，Plant J.4：579-89，1994
玉米B-Peru	Selinger等人，Genetics 149；1125-38,1998	Chi26	Leah等人，Plant J.4：579-89，1994

如本文中所定义的绿色组织特异性启动子是优势地在绿色组织中具有转录活性的启动子，在植物的任何其它部分内基本上无活性，尽管在该植物的这些其他部分中仍允许任意泄露表达。

可以用来实施本发明方法的绿色组织特异性启动子的例子示于下文表2d中。

表2d：绿色组织特异性启动子的例子

基因	表达	参考文献
基因	表达	参考文献	玉米正磷酸二激酶	叶特异的	Fukavama等人，2001
玉米磷酸烯醇式丙酮酸羧化酶	叶特异的	Kausch等人，2001	玉米正磷酸二激酶	叶特异的	Fukavama等人，2001
玉米磷酸烯醇式丙酮酸羧化酶	叶特异的	Kausch等人，2001	稻磷酸烯醇式丙酮酸羧化酶	叶特异的	Liu等人，2003
稻核酮糖二磷酸羧化酶-加氧酶小亚基	叶特异的	Nomura等人，2000	稻磷酸烯醇式丙酮酸羧化酶	叶特异的	Liu等人，2003
稻核酮糖二磷酸羧化酶-加氧酶小亚基	叶特异的	Nomura等人，2000	稻β扩展蛋白EXBP9	苗特异的	WO 2004/070039
木豆(Pigeonpea)核酮糖二磷酸羧化酶-加氧酶小亚基	叶特异的	Panguluri等人，2005	稻β扩展蛋白EXBP9	苗特异的	WO 2004/070039

基因	表达	参考文献
基因	表达	参考文献	豌豆RBCS3A	叶特异的

组织特异性启动子的另一个例子是分生组织特异性启动子，其优势地在分生组织中具有转录活性，在植物的任何其它部分内基本上无活性，尽管在该植物的这些其他部分中仍允许任意泄露表达。可以用来实施本发明方法的分生组织特异性启动子的例子示于下文表2e中。

表2e：分生组织特异性启动子的例子

基因来源	表达模式	参考文献
基因来源	表达模式	参考文献	稻OSH1	从胚球期至籽苗期的苗顶端分生组织	Sato等人(1996)Proc.Natl.Acad.Sci.USA，93：8117-8122
稻金属硫蛋白	分生组织特异性	BAD87835.1	稻OSH1	从胚球期至籽苗期的苗顶端分生组织	Sato等人(1996)Proc.Natl.Acad.Sci.USA，93：8117-8122
稻金属硫蛋白	分生组织特异性	BAD87835.1	WAK1和WAK2	苗和根顶端分生组织，和正在扩展的叶和萼片中	Wagner和Kohorn(2001)Plant Cell 13(2)：303-318

终止子

术语“终止子”包括作为转录单元末端处DNA序列的调控序列，所述的DNA序列产生初级转录物的3′加工和多腺苷酸化及转录终止的信号。终止子可以从天然基因、从多种其他植物基因或从T-DNA衍生。待添加的终止子可以从例如胭脂碱合酶基因或章鱼碱合酶基因或备选地从另一种植物基因或较次优选地从任何其他真核基因衍生。

调节

就表达或基因表达而言，术语“调节”意指这样的过程，在所述过程中与对照植物相比较，表达水平因所述基因的表达而改变，优选地，表达水平可以提高或降低。原始、未调节的表达可以是结构性RNA(rRNA、tRNA)或mRNA的任何类型的表达，随后是翻译。术语“调节活性”应当意指本发明核酸序列或所编码蛋白质的表达的任何改变，这引起植物产量提高和/或生长增加。

表达

术语“表达”或“基因表达”意指某个特定基因或多个特定基因或特定基因构建体的转录。术语“表达”或“基因表达”尤其意指某个基因或某些基因或基因构建体转录成结构性RNA(rRNA、tRNA)或mRNA，所述RNA随后翻译成或不翻译成蛋白质。该过程包括DNA的转录和所得mRNA产物的加工。

增加的表达/过量表达

如本文中所用的术语“增加的表达”或“过量表达”意指相对于原有野生型表达水平为额外的任何形式的表达。

用于提高基因或基因产物表达的方法在本领域内被充分报道并且包括例如由适宜启动子驱动的过量表达、使用转录增强子或翻译增强子。可以导入在非异源形式的多核苷酸的适宜位置(一般在上游)中导入充当启动子或增强子元件的分离的核酸，从而上调编码目的多肽的核酸表达。例如，可以在体内通过突变、缺失和/或替换而改变内源性启动子(见Kmiec，US5,565,350；Zarling等，WO9322443)，或可以将分离的启动子以相对于本发明基因的恰当方向及距离导入植物细胞，从而控制该基因的表达。

若需要多肽表达，通常希望的是在多核苷酸编码区的3’末端包括多腺苷酸化区。该多腺苷酸化区可以从天然基因、从多种其他植物基因或从T-DNA衍生。待添加的3’末端序列可以从例如胭脂碱合酶基因或章鱼碱合酶基因或备选地从另一种植物基因或较不优选地从任何其他真核基因衍生。

内含子序列也可以添加至5’非翻译区(UTR)或部分编码序列的编码序列以提高细胞质中聚集的成熟信使的量。已经显示在植物和动物表达构建体的转录单位中包含可剪接内含子提高了mRNA水平及蛋白质水平上的基因表达高达1000倍(Buchman和Berg(1988)Mol.Cell biol.8：4395-4405；Callis等(1987)Gens Dev 1：1183-1200)。基因表达的此类内含子增强作用一般在所述内含子置于转录单位的5’末端附近时是最强烈的。玉米内含子Adh1-S内含子1、2和6、Bronze-1内含子的用途是本领域已知的。对于总体信息，见：《玉米手册》，第116章，编者Freeling和Walbot，Springer，N.Y.(1994)。

内源基因

本文中对“内源性”基因的称谓不仅指如植物中以其天然形式(即没有人类任何干预)存在的所讨论基因，还指处于分离形式的随后(再)被导入植物(转基因)的相同基因(或基本上同源的核酸/基因)。例如，含有这种转基因的转基因植物可以遭遇转基因表达的相当大程度地度降低和/或内源基因表达的实质降低。

分离的基因可以从生物分离或可以是人造的，例如通过化学合成法。

降低的表达

本文中提及的“降低的表达”或“降低或基本消除表达”意指内源基因表达和/或多肽水平和/或多肽活性相对于对照植物的下降。与对照植物相比较，所述降低或基本上消除以增加的优选顺序是至少10％、20％、30％、40％或50％、60％、70％、80％、85％、90％或95％、96％、97％、98％、99％或更多降低。

为了降低或基本消除植物中内源基因的表达，需要核酸序列的基本上连续的核苷酸的足够长度。为进行基因沉默，该长度可以短至20、19、18、17、16、15、14、13、12、11、10个或更少核苷酸，或者该长度可以长至整个基因(包括部分或完整的5’和/或3’UTR)。基本上连续的核苷酸片段可以从编码目的蛋白的核酸序列(靶基因)或从能够编码目的蛋白的直向同源物、旁系同源物或同源物的任何核酸序列衍生。优选地，基本上连续的核苷酸的片段能够与靶基因(有义链或反义链)形成氢键，更优选地，基本上连续的核苷酸片段以增加的优选顺序与靶基因(有义链或反义链)具有50％、60％、70％、80％、85％、90％、95％、96％、97％、98％、99％、100％的序列同一性。编码(功能性)多肽的核酸序列不是本文中所讨论用于降低或基本消除内源基因表达的多种方法的前提。

可以使用常规工具和技术完成表达的这种降低或基本消除。用于降低或基本消除内源基因表达的方法是使用核酸序列或其部分(在此情况下，所述部分是从目的基因衍生或从能够编码目的蛋白的直向同源物、旁系同源物或同源物的任何核酸序列中衍生的一段基本上连续的核苷酸)的反向重复序列(其优选能够形成发夹结构)进行RNA介导的沉默。RNA沉默方法的另一个例子包括将核酸序列或其部分(在此情况下是从目的基因或从能够编码目的蛋白的直向同源物、旁系同源物或同源物的任何核酸序列中衍生的一段基本上连续的核苷酸)以有义方向导入植物。RNA沉默方法的另一个例子涉及使用反义核酸序列。基因沉默也可以通过插入诱变(例如T-DNA插入或转座子插入)或通过如Angell和Baulcombe((1999)Plant J.20(3)：357-62)、(Amplicon VIGS WO 98/36083)或Baulcombe(WO 99/15682)及其他人描述的策略实现。技术人员会熟知其他方法，如使用针对内源多肽的抗体以抑制该多肽在植物中(in planta)的功能，或干扰涉及某多肽的信号传导途径。人工和/或天然的微RNA(miRNA)可以用来敲除基因表达和/或mRNA翻译。内源miRNA是通常19-24个核苷酸的单链小RNA。

可以使用常规工具和技术完成表达的这种降低或基本消除。用于降低或基本消除内源基因表达的优选方法是在植物中导入并表达基因构建体，其中将核酸(在此情况下，从目的基因或从能够编码任何一种目的蛋白的直向同源物、旁系同源物或同源物的任何核酸中衍生的一段基本上连续的核苷酸)克隆至所述基因构建体，(部分或完全地)作为被间隔序列(非编码性DNA)隔开的反向重复序列。

在这种优选的方法中，使用核酸或其部分(在此情况下，所述部分是从目的基因或从能够编码目的蛋白的直向同源物、旁系同源物或同源物的任何核酸中衍生的一段基本上连续的核苷酸)的反向重复序列(其优选能够形成发夹结构)，通过RNA介导的沉默作用降低或基本上消除内源基因的表达。在包含调控序列的表达载体中克隆该反向重复序列。非编码性DNA核酸序列(间隔序列，例如基质附着区片段(MAR)、内含子、多接头等)位于形成所述反向重复序列的两个反向核酸之间。在反向重复序列转录后，形成具有(部分或完全)自我互补性结构的嵌合RNA。这种双链RNA结构称作发夹RNA(hpRNA)。hpRNA由植物加工成siRNA，该siRNA被掺入RNA诱导的沉默复合体(RISC)。该RISC进一步切开所述mRNA转录物，从而相当大程度地降低待翻译成多肽的mRNA转录物的数目。对于其他一般细节，见例如Grierson等人(1998)WO 98/53083；Waterhouse等人(1999)WO 99/53050。

本发明方法的实施不取决于在植物中导入并表达将所述核酸作为反向重复序列克隆到其中的基因构建体，不过可以使用几种熟知“基因沉默”方法中任何一种或多种方法来实现相同效果。

用于降低内源基因表达的一种这样的方法是RNA介导的基因表达沉默(下调)。在这种情况下，沉默作用由植物中与内源性靶基因实质相似的双链RNA序列(dsRNA)触发。这种dsRNA进一步被植物加工成约20个至约26个核苷酸的所谓短干扰RNA(siRNA)。所述siRNA被掺入RNA诱导的沉默复合体(RISC)，其中所述RISC切割内源靶基因的mRNA转录物，从而相当大程度地将降低待翻译成多肽的mRNA转录物的数目。优选地，所述双链RNA序列与靶基因对应。

RNA沉默方法的另一个例子涉及将核酸序列或其部分(在此情况下是从目的基因或从能够编码目的蛋白的直向同源物、旁系同源物或同源物的任何核酸中衍生的一段基本上连续的核苷酸)以有义方向导入植物。“有义方向”涉及与自身mRNA转录物同源的DNA序列。因而将所述核酸序列的至少一个拷贝导入植物。这个额外核酸序列会降低内源基因表达，从而产生已知为共抑制作用的现象。将一个核酸序列的几个额外拷贝导入植物时，基因表达的降低将更明显，因为高转录物水平与触发共抑制作用之间存在正相关。

RNA沉默方法的另一个例子涉及使用反义核酸序列。“反义”核酸序列包含与编码蛋白质的“有义”核酸序列互补，即与双链cDNA分子的编码链互补，或与mRNA转录物序列互补的核苷酸序列。反义核酸序列优选地互补于待沉默的内源基因。这种互补性可以存在于基因的“编码区”中和/或其“非编码区”中。术语“编码区”指包含被翻译成氨基酸残基的密码子的核苷酸序列的区域。术语“非编码区”指分布在编码区侧翼的被转录但不翻译成氨基酸的5’和3’序列(也称作5’和3’非翻译区)。

反义核酸序列可以根据Watson和Crick碱基对规则设计。反义核酸序列可以互补于整个核酸序列(在此情况下是从目的基因或从能够编码目的蛋白的直向同源物、旁系同源物或同源物的任何核酸中衍生的一段基本上连续的核苷酸)，不过也可以是仅对所述核酸序列的一部分(包括mRNA5’和3’UTR)反义的寡核苷酸。例如，反义寡核苷酸序列可以互补于编码多肽的mRNA转录物的翻译起点周围的区域。合适反义寡核苷酸序列的长度是本领域已知的并且可以从约50、45、40、35、30、25、20、15或10个核苷酸或更小的核苷酸长度开始。本发明的反义核酸序列可以使用化学合成反应和酶连接反应，利用本领域已知的方法构建。例如，反义核酸序列(例如反义寡核苷酸序列)可以使用天然存在核苷酸或以多种方式修饰的核苷酸化学地合成，其中所述的修饰核苷酸设计旨在增加分子的生物学稳定性或增加反义与有义核酸序列之间所形成的双链体的物理稳定性，例如，可以使用硫代磷酸酯衍生物和吖啶取代的核苷酸。可以用来产生反义核酸序列的修饰核苷酸的例子是本领域熟知的。已知的核苷酸修饰包括甲基化、环化和‘加帽’及用类似物(如肌苷)替换一个或多个天然存在核苷酸。对核苷酸的其他修饰作用是本领域熟知的。

反义核酸序列可以使用表达载体以生物学方式产生，其中一种核酸序列已经以反义方向亚克隆(即从插入的核酸转录出的RNA会对目的靶核酸为反义方向)到所述表达载体中。优选地，植物中反义核酸序列的产生借助稳定整合的核酸构建体进行，其中所述的核酸构建体包含启动子、有效连接的反义寡核苷酸和终止子。

用于本发明方法中沉默作用的核酸分子(无论被导入植物中或原位(insitu)地产生)与mRNA转录物和/或编码多肽的基因组DNA杂交或结合以因而抑制蛋白质的表达，例如通过抑制转录和/或翻译做到这一点。杂交可以因形成稳定双链体的常规核苷酸互补性引起，或例如，在与DNA双链体结合的反义核酸序列的情况下，因双螺旋大沟内的特异性相互作用引起。反义核酸序列可以通过在特定组织部位转化或直接注射导入植物。备选地，反义核酸序列可以被修饰以靶向所选的细胞并且随后全身性施用。例如，对于全身性施用，可以修饰反义核酸序列，从而它们与表达在所选细胞表面上的受体或抗原特异性地结合，例如通过将所述反义核酸序列连接至与细胞表面受体或抗原结合的肽或抗体连接而做到这一点。反义核酸序列也可以使用本文中所述的载体递送至细胞。

根据又一个方面，反义核酸序列是α-端基异构核酸序列。α端基异构核酸序列与互补RNA形成特定的双链杂交体，在所述双链杂交体中与常见的b-单元相反，所述链彼此平行(Gaultier等(1987)Nucl Ac Res15：6625-6641)。反义核酸序列也可以包含2’-O-甲基核糖核苷酸(Inoue等(1987)Nucl Ac Res 15，6131-6148)或嵌合RNA-DNA类似物(Inoue等(1987)FEBS Lett.215，327-330)。

内源基因表达的降低或基本上消除也可以使用核酶进行。核酶是具有核糖核酸酶活性的催化性RNA分子，能够切割与之具有互补区域的单链核酸序列，如mRNA。因此，核酶(例如锤头状核酶(在Haselhoff和Gerlach(1988)Nature 334，585-591中描述)可以用来催化地切割编码多肽的mRNA转录物，因而相当大程度地降低待翻译成多肽的mRNA转录物的数目。可以设计对核酸序列具有专一性的核酶(见例如：Cech等美国专利号4,987,071；和Cech等美国专利号5,116,742)。备选地，与核酸序列相对应的mRNA转录物可以用来从RNA分子的汇集物中选出具有特定核糖核酸酶活性的催化性RNA(Bartel和Szostak(1993)Science 261，1411-1418)。核酶用于植物中基因沉默的用途是本领域已知的(例如Atkins等人(1994)WO 94/00012；Lenne等人(1995)WO 95/03404；Lutziger等人(2000)WO 00/00619；Prinsen等人(1997)WO 97/13865和Scott等人(1997)WO 97/38116)。

基因沉默也可以通过插入诱变(例如T-DNA插入或转座子插入)或通过如Angell和Baulcombe((1999)Plant J.20(3)：357-62)、(Amplicon VIGSWO 98/36083)或Baulcombe(WO 99/15682)及其他人描述的策略实现。

如果内源基因中存在突变和/或在随后导入植物的分离基因/核酸中存在突变，基因沉默也可能发生。所述降低或基本上消除可以由无功能的多肽引起。例如，该多肽可以与多种相互作用的蛋白质结合；一种或多种突变和/或截短作用因而可以产生仍能够结合相互作用的蛋白质(如受体蛋白)但不能展示正常功能的多肽(如信号传导配体)。

基因沉默的又一种方法是瞄准互补于基因调节区(例如启动子和/或增强子)的核酸序列以形成阻止靶细胞中基因转录的三重螺旋结构。见Helene，C.，Anticancer Drug Res.6，569-84，1991；Helene等，Ann.N.Y.Acad.Sci.660，27-361992；和Maher，L.J.Bioassays 14，807-15，1992。

技术人员会熟知其他方法，如使用针对内源多肽的抗体以抑制该多肽在植物中(in planta)的功能，或干扰涉及某多肽的信号传导途径。特别地，可以考虑人造分子可能用于抑制靶多肽的生物学功能，或用于干扰涉及所述靶多肽的信号传导途径。

备选地，可以建立筛选程序以鉴定植物群体中基因的天然变体，其中所述的变体编码具有降低的活性的多肽。也可以使用此类天然变体，例如来进行同源重组。

人工和/或天然的微RNA(miRNA)可以用来敲除基因表达和/或mRNA翻译。内源miRNA是通常19-24个核苷酸的单链小RNA。它们主要发挥调节基因表达和/或mRNA翻译的功能。大多数的植物微RNA(miRNA)与其靶序列具有完全或接近完全的互补性。然而，存在具有多达5个错配的天然靶。它们从具有特征性折返结构的较长非编码性RNA由Dicer家族的双链特异性RNA酶加工得来。加工后，它们通过与RNA诱导的沉默复合体(RISC)的主要组分-Argonaute蛋白结合被掺入该复合体。miRNA充当RISC的特异性组分，因为它们与胞浆中的靶核酸(大多是mRNA)发生碱基配对。后续调节事件包括靶mRNA切割和摧毁和/或翻译抑制。miRNA过量表达的影响因此往往反映为靶基因的mRNA水平降低。

可以特别地遗传工程化一般21个核苷酸长度的人工微RNA(amiRNA)以负向地调节单个或多个目的基因的基因表达。选择植物的微RNA靶的决定因素是本领域熟知的。已经定义了用于靶识别的经验参数并且可以使用它们辅助特定amiRNA的设计(Schwab等人，(2005)Dev Cell8(4)：517-27)。用于设计并产生amiRNA及其前体的便利工具也是公众可获得的(Schwab等人，(2006)Plant Cel 18(5)：1121-33)。

为了最佳性能，用于降低植物中内源基因表达的基因沉默技术需要使用来自单子叶植物的核酸序列转化单子叶植物，并使用来自双子叶植物的核酸序列转化双子叶植物。优选地，将来自任意的给定植物物种的核酸序列导入相同的物种。例如，将来自稻的核酸序列转化到稻植物中。然而，不绝对要求待导入的核酸序列来自与待导入该核酸序列的植物相同的植物物种。只要内源性靶基因与待导入的核酸序列之间存在实质同源性即可。

上文描述了用于降低或基本上消除植物中内源基因表达的多种方法的例子。例如，本领域技术人员将能够轻易调整用于沉默的前述方法，从而通过利用合适的启动子在完整植物中或其部分中实现内源基因表达的降低。

选择标记(基因)/报道基因

“选择标记”、“选择标记基因”或“报道基因”包括向细胞赋予表型的任意基因，其中在所述细胞中表达所述“选择标记”、“选择标记基因”或“报道基因”以促进鉴定和/或选择用本发明核酸序列构建体转染或转化的细胞。这些标记基因能够借助一系列不同原理而鉴定核酸序列分子的成功转移。合适的标记可以选自赋予抗生素抗性或除草剂抗性、导入新代谢性状或允许目视选择的标记。选择标记基因的例子包括赋予抗生素抗性的基因(如使新霉素和卡那霉素磷酸化的nptII或使潮霉素磷酸化的hpt或赋予针对例如博来霉素、链霉素、四环素、氯霉素、氨苄青霉素、庆大霉素、遗传霉素(Geneticin)(G418)、壮观霉素或杀稻瘟菌素的抗性的基因)、赋予除草剂抗性的基因(例如提供

抗性的bar；提供草甘膦抗性的aroA或gox或赋予针对例如咪唑啉酮、膦丝菌素或磺脲类的抗性的基因)或提供代谢性状的基因(如允许植物使用甘露糖作为唯一碳源的manA，或利用木糖的木糖异构酶，或抗营养性标记如2-脱氧葡萄糖抗性)。目视标记基因的表达导致颜色(例如β-葡糖醛酸酶、GUS或β-半乳糖苷酶与其有色底物例如X-Gal)、发光(如萤光素/萤光素酶系统)或荧光(绿色荧光蛋白GFP和其衍生物)的形成。这个名单仅代表少数的可能标记。技术人员熟悉此类标记。取决于生物和选择方法，优选不同的标记。

已知当核酸序列稳定或瞬时地整合至植物细胞时，仅少数细胞摄取外来DNA，并且根据需要，将外来DNA整合至细胞基因组中，这取决于所用的表达载体和所用的转染技术。为鉴定并选择这些整合体，通常将编码选择标记的基因(如上文所述的基因)连同目的基因一起导入宿主细胞。这些标记可以在这些基因例如通过常规方法缺失而无功能的突变体中使用。此外，编码选择标记的核酸序列分子可以在包含编码本发明多肽或本发明方法中所用多肽的序列的相同载体上，或在独立的载体上导入宿主细胞。已经用所导入核酸序列稳定转染的细胞可以例如通过选择作用鉴定(例如具有整合的选择标记的细胞存活而其他细胞死亡)。

因为一旦已经成功地导入所述标记基因、尤其抗生素抗性基因和除草剂抗性基因，则这些核酸序列是转基因宿主细胞中不再需要或不想要的，因此用于导入核酸序列的本发明方法有利地使用能够移除或切除这些标记基因的技术。一种这样的方法是所谓共转化法。共转化法同时使用两种载体以转化，一种载体携带本发明的核酸序列而第二种载体携带标记基因。大比例的转化体接受或在植物情况下包含(多达40％或更多的转化体)这两种载体。在用农杆菌(Agrobacterium)转化的情况下，转化体通常仅接受载体的一部分，即侧翼存在T-DNA的序列，该序列通常代表表达盒。标记基因随后可以通过实施杂交从转化植物中移除。在另一种方法中，整合至转座子的标记基因与想要的核酸序列一起用于转化(称作Ac/Ds技术)。转化体可以与转座酶来源物杂交，或转化体用引起转座酶表达的核酸序列构建体瞬时或稳定转化。在一些情况下(大约10％)，一旦转化已经成功发生，则转座子从宿主细胞的基因组跳出并丢失。在其他许多情况下，转座子跳到一个不同位置。在这些情况下，标记基因必须通过实施杂交来消除。在微生物学中，开发了有可能或促进检测这类事件的技术。又一种有利方法依赖于所谓重组系统；所述方法的优势在于杂交消除作用可以用该重组系统实行。最知名的该类型系统称作Cre/lox系统。Cre1是移除位于loxP序列之间序列的重组酶。如果标记基因整合于loxP序列之间，一旦转化已经成功发生，则它因重组酶的表达被移除。其他重组系统是HIN/HIX、FLP/FRT和REP/STB系统(Tribble等，J.Biol.Chem.，275，2000：22255-22267；Velmurugan等，J.Cell Biol.，149，2000：553-566)。位点特异性地整合本发明核酸序列至植物基因组是可能的。自然，这些方法也可以应用于微生物如酵母、真菌或细菌。

转基因的/转基因/重组

为本发明的目的，“转基因的”、“转基因”或“重组”例如就核酸序列而言，意指包含所述核酸序列的表达盒、基因构建体或载体，或用本发明核酸序列、表达盒或载体转化的生物，这些构建体均通过重组方法产生，其中

(a)编码在本发明方法中有用的蛋白质的核酸序列，或

(b)与本发明核酸序列有效连接的基因调控序列，例如启动子，或

(c)a)和b)

并不位于它们的天然遗传环境中或已经通过重组方法被修饰，所述的修饰有可能采取例如替换、添加、倒位或插入一个或多个核苷酸残基的形式。天然遗传环境理解为意指原初植物中的天然基因组位点或染色体位点或存在于基因组文库中。在基因组文库的情况下，优选地保留，至少部分地保留该核酸序列的天然遗传环境。该环境分布在该核酸序列的至少一侧并且具有至少50bp、优选至少500bp、特别优选至少1000bp、最优选至少5000bp序列长度。当通过非天然、合成性(“人工”)方法(例如诱变处理)修饰天然存在表达盒时，该表达盒-例如所述核酸序列的天然启动子与编码如上文所定义在本发明方法中有用的多肽的相应核酸序列的天然存在组合-变成转基因表达盒。合适的方法例如在US 5,565,350或WO 00/15815中描述。

为本发明目的，如上所述，将转基因植物因此理解为意指本发明方法中所用诸核酸序列不处于它们在所述植物基因组中的天然基因座处，从而有可能同源或异源地表达所述核酸序列。然而，如所提及，转基因还意指尽管本发明的或本发明方法中所用的诸核酸序列处于它们在植物基因组中的天然位置处，然而相对于天然序列，它们的序列已经被修饰，和/或所述天然序列的调节序列已经被修饰。转基因优选地理解为意指本发明核酸序列在基因组中的非天然基因座处表达，即所述核酸序列的同源表达或优选异源表达发生。在本文中提及了优选的转基因植物。

转化

如本文中提及的术语“导入”或“转化”包括转移外源多核苷酸至宿主细胞中，无论转化所用的方法是什么。能够后续克隆性增殖(无论通过器官发生或胚发生)的植物组织可以用本发明的基因构建体转化并且可完整植物以从中再生。所选的具体组织根据可用于并且最好适于正在进行转化的具体物种的克隆性增殖系统变化。示例性靶组织包括叶盘、花粉、胚、子叶、下胚轴、大配子体、愈伤组织、现存的分生组织(例如顶端分生组织、腋芽和根分生组织)和诱导的分生组织(例如子叶分生组织和下胚轴分生组织)。多核苷酸可以瞬时或稳定地导入宿主细胞并且可以非整合地维持，例如作为质粒。备选地，它可以整合至宿主基因组中。所得的转化植物细胞随后可以用来以本领域技术人员已知的方式再生出转化植物。

外来基因转移至植物基因组的过程称作转化。植物物种的转化现在是相当常规的技术。有利地，可以使用几种转化方法中的任意方法将目的基因导入合适的祖先细胞。描述用于转化并从植物组织或植物细胞再生出植物的方法可以用于瞬时转化或稳定转化。转化方法包括使用脂质体、电穿孔法、增加游离DNA摄入的化学品、DNA直接注射至植物、粒子枪轰击法、使用病毒或花粉的转化法和微量投射法(microprojection)。转化方法可以选自用于原生质体的钙/聚乙二醇法(Krens，F.A.等人，(1982)Nature296，72-74；Negrutiu I等人(1987)Plant Mol Biol 8：363-373)；原生质体的电穿孔法(Shillito R.D.等人(1985)Bio/Technol 3，1099-1102)；对植物材料的微量注射法(Crossway A等人，(1986)Mol.Gen Genet 202：179-185)；DNA或RNA包被粒子轰击法(Klein TM等人，(1987)Nature 327：70)、用(非整合性)病毒感染等。包括转基因作物植物在内的转基因植物优选通过农杆菌介导的转化法产生。有利的转化方法是植物原位(in planta)转化法。为此目的，例如有可能使农杆菌作用于植物种子或有可能用农杆菌接种植物分生组织。根据本发明，已经证明将转化的农杆菌悬液作用于完整植物或至少作用于花原基是特别有利的。随后培育该植物直至获得已处理植物的种子(Clough和Bent，Plant J.(1998)16，735-743)。用于农杆菌介导稻转化的方法包括用于稻转化的熟知方法，如在以下任意文献中描述的那些方法：欧洲专利申请EP 1198985A1，Aldemita和Hodges(Planta 199：612-617，1996)；Chan等(Plant Mol Biol 22(3)：491-506，1993)，Hiei等(Plant J 6(2)：271-282，1994)，其公开内容如充分所述那样通过引用的方式并入本文。在谷物转化的情况下，优选的方法如Ishida等人(Nat.Biotechnol 14(6)：745-50，1996)或Frame等人(Plant Physiol 129(1)：13-22，2002)描述，其公开内容如充分所述那样通过引用的方式并入本文。所述方法例如还由B.Jenes等，Techniques for Gene，在：Transgenic Plants，第1卷，Engineering and Utilization，编者S.D.Kung和R.Wu，AcademicPress(1993)128-143及在Potrykus Annu.Rev.Plant Physiol.Plant Molec.Biol.42(1991)205-225)中描述。待表达的核酸序列或构建体优选地克隆至适于转化根癌农杆菌(Agrobacterium tumefaciens)的载体，例如pBin19(Bevan等人，Nucl.Acids Res.12(1984)8711)。通过这种载体转化的农杆菌随后可以按照已知方式用于转化植物，例如作为模型使用的植物如拟南芥属植物(拟南芥在本发明范围不视为作物植物)，或作物植物，例如烟草植物，所述方式例如是通过在农杆菌溶液中浸泡擦伤的叶或切碎的叶并随后在合适培养基中培育它们。借助根癌农杆菌转化植物例如由

和Willmitzer在Nucl.Acid Res.(1988)16，9877中描述或尤其从F.F.White，用于高等植物中基因转移的载体(Vectors for Gene Transfer in HigherPlants)；在Transgenic Plants，第1卷，Engineering and Utilization，S.D.Kung和R.Wu编著，Academic Press，1993，第15-38页中获知。

除了转化随后必需再生成完整植物的体细胞之外，也可以转化植物分生组织的细胞，并且尤其那些发育成配子的细胞。在这种情况下，转化的配子遵循天然的植物发育过程，从而产生转基因植物。因此，例如用农杆菌处理拟南芥属植物的种子并且从正在发育的植物中获得种子，其中一定比例的所述植物被转化并且因此是转基因的[Feldman，KA和MarksMD(1987)Mol Gen Genet 208：274-289；Feldmann K(1992)，在：编者CKoncz，N-H Chua和J Shell，Methods in Arabidopsis Research.WordScientific，Singapore，第274-289页]。备选方法基于反复移除花序并将莲座丛中心内的切除部位与转化的农杆菌孵育，因而同样可以在较晚的时间点获得转化的种子(Chang(1994)Plant J.5：551-558；Katavic(1994)MolGen Genet，245：363-370)。然而，特别有效的方法是改良真空浸润法，如“浸花”法。在拟南芥属植物真空浸润法的情况下，用农杆菌悬液在减低的压力下处理完整植物[Bechthold，N(1993).C R Acad Sci Paris Life Sci，316：1194-1199]，而在“浸花”法的情况下，将正在发育的花组织与表面活性剂处理过的农杆菌悬液短暂孵育[Clough，SJ和Bent，AF(1998)The Plant J.16，735-743]。在这两种情况下均收获某个比例的转基因种子，并且这些种子可以通过生长在如上所述的选择条件下与非转基因种子区分开。此外，质体的稳定转化是有利的，因为质体在大部分作物中以母系方式遗传，这降低或消除了借助花粉的转基因流动风险。叶绿体基因组的转化一般通过已经在Klaus等人，2004[Nature Biotechnology 22(2)，225-229]中示意性展示的方法实现。简而言之，将待转化的序列连同选择标记基因一起克隆至同源于叶绿体基因组的侧翼序列之间。这些同源侧翼序列指导向原质体系的位点特异性整合。已经对许多不同的植物物种描述质体转化法并且在Bock(2001)基础研究和植物生物技术中的转基因质体(Transgenic plastidsin basic research and plant biotechnology).J Mol Biol.2001年月21日；312(3)：425-38或Maliga，P(2003)质体转化技术商业化进展(Progresstowards commercialization of plastid transformation technology)，TrendsBiotechnol.21，20-28中给出综述。其他的生物技术进展最近已经以无标记质体转化体的形式报道，其中可以通过瞬时共整合的标记基因产生所述无标记质体转化体(Klaus等人，2004，Nature Biotechnology 22(2)，225-229)。

T-DNA活化标签技术(T-DNA activation tagging)

T-DNA活化标签技术(Hayashi等人Science(1992)1350-1353)涉及以如此方式在目的基因的基因组区域内或基因编码区的上游或下游10kb处插入通常含有启动子(也可以是翻译增强子或内含子)的T-DNA，从而该启动子指导目标基因的表达。一般，目标基因的天然启动子对该基因表达的调节作用被破坏，并且该基因受新导入的启动子控制。该启动子一般嵌入T-DNA中。这种T-DNA随机地插入植物基因组，例如借助农杆菌感染，并且引起在所插入T-DNA附近的基因表达受到调节。所得的转基因植物表现显性表型，原因在于所导入启动子附近的基因受修饰的表达。

TILLING

术语“TILLING”是“基因组中定向诱导局部损伤法”的缩写并且指用于产生和/或鉴定核酸序列的诱变技术，其中所述核酸序列编码具有改良表达和/或活性的蛋白质。TILLING还允许选择携带此类突变变体的植物。这些突变变体可以展示在强度或在位置或在时间方面改良的表达(例如，如果所述突变影响启动子)。这些突变变体可以展示比其天然形式基因所表现活性更高的活性。TILLING联合了高密度诱变法与高通量筛选法。一般在TILLING中遵循的步骤是：(a)EMS诱变(Redei GP和Koncz C(1992)在Methods in Arabidopsis Research，Koncz C，Chua NH，Schell J，Singapore编辑，World Scientific Publishing Co，第16-82页；Feldmann等，(1994)在Meyerowitz EM，Somerville CR编辑，Arabidopsis.Cold Spring HarborLaboratory Press，Cold Spring Harbor，NY，第137-172页；Lightner和Caspar T(1998)在J Martinez-Zapater，J Salinas编者，Methods onMolecular Biology第82卷.Humana Press，Totowa，NJ，第91-104页)；(b)制备和汇集个体DNA；(c)PCR扩增目的区域；(d)变性和复性以导致异双链体形成；(e)DHPLC，其中汇集物中异双链体的存在被检测为色谱图中的一个额外峰；(f)鉴定突变个体；和(g)将突变PCR产物测序。

同源重组

同源重组允许在基因组中限定的所选位置处导入所选核酸序列。同源重组是在生物科学中例行用于低等生物如酵母或小立碗藓属(Physcomitrella)苔藓的标准技术。已经对模式植物(Offringa等人(1990)EMBO J 9(10)：3077-84)和作物植物例如稻(Terada等人(2002)NatBiotech 20(10)：1030-4；Iida和Terada(2004)Curr Opin Biotech 15(2)：132-8)描述了用于植物中进行同源重组的方法，并且存在与靶生物无关而通常适用的方法(Miller等人，Nature Biotechnol.25，778-785，2007)。

产量

术语“产量”通常意指经济价值的可测量结果，一般与指定作物、与面积并且与时间间隔有关。单个植物部分基于它们的数目、大小和/或重量而直接有助于对产量，或实际产量是某种作物和一年的每平方米产量，这通过总产量(包括收获的和评估的产量)除以种植的平方米数而确定。术语植物的“产量”可以涉及该植物的营养生物量(根和/或苗生物量)、涉及繁殖器官和/或涉及繁殖体(如种子)。

早期生长势

“早期生长势”指活跃、健康、充分平衡的生长，尤其是植物生长早期期间，并且可以因提高的植物适应性所致，其中所述提高的植物适的原因是例如该植物更好地适应环境(即优化能量资源的用途和在苗与根之间的分配)。具有早期生长势的植物也显示提高的籽苗存活和更佳的作物建立，这往往产生高度均一的田块(作物以均一方式生长，即大多数植物在基本上相同的时间达到各个发育期)和往往更好及更高的产量。因而，早期生长势可以通过测量多种因素如千粒核重(Thousand Kernel Weight)、萌发百分数、出苗百分数、籽苗生长、籽苗高度、根长度、根和苗生物量和许多其他因素等确定。

提高/改善/增强

术语“提高”、“改善”或“增强”是相互可交换的并且在应用含义上应当意指与如本文中定义的对照植物相比较，至少5％、6％、7％、8％、9％或10％、优选至少15％或20％、更优选地25％、30％、35％或40％更多的产量和/或生长。

种子产量

提高的种子产量自身可以表现为以下一个或多个指标：a)种子生物量(种子总重量)增加，这可以基于单粒种子基础和/或每株植物和/或每公顷或每英亩；b)提高的每穗和/或每株植物花数目；c)提高的(充实)种子数；d)提高的种子充实率(其表述为充实种子数与种子总数之间的比率)；e)提高的收获指数，其表述为可收获部分(如种子)产量与总生物量的比率；f)提高的初生穗数；(g)提高的千粒核重(TKW)，这从计数的充实种子数及它们的总重量外推出来。提高的TKW可以因增加的种子尺寸和/或种子重量引起，并且也可以因胚尺寸和/或胚乳尺寸增加引起。

种子产量的提高也可以表现为种子尺寸和/或种子体积的增加。此外，产量提高也可以本身表现为种子面积和/或种子长度和/或种子宽度和/或种子周长的提高。提高的种子产量也可以产生改良的构造，或可以因改良的构造而出现。

绿度指数

从植物的数字图像计算如本文中所用的“绿度指数”。对属于图像上植物目标的每个像素计算绿色值与红色值的比率(在编码颜色的RGB模式中)。绿度指数表述为绿色/红色比超过给定阈值的像素百分数。在正常生长条件下，在盐胁迫生长条件下和在养分可利用性降低的生长条件下，植物的绿度指数在开花前的最后成像中测量。相反，在干旱胁迫生长条件下，植物的绿度指数在干旱后的首次成像中测量。

植物

本文中所用的术语“植物”包括完整植物、植物的祖先及子代和包括种子、苗、茎、叶、根(包括块茎)、花和组织、器官在内的植物部分，其中每种前述对象包含目的基因/核酸序列。术语“植物”也包括植物细胞、悬浮培养物、愈伤组织、胚、分生组织区、配子体、孢子体、花粉和小孢子，同样其中每种前述对象包含目的基因/核酸序列。

在本发明方法中特别有用的植物包括属于植物界(Viridiplantae)超家族、尤其单子叶和双子叶植物的全部植物，包括饲用或饲料豆科植物、观赏植物、粮食作物、树或灌木，其中所述植物选自包含以下物种的名单：槭树属某些物种(Acer spp.)、猕猴桃属某些物种(Actinidia spp.)、秋葵属某些物种(Abelmoschus spp.)、剑麻(Agave sisalana)、冰草属某些物种(Agropyron spp.)、匍匐剪股颖(Agrostis stolonifera)、葱属某些物种(Alliumspp.)、苋属某些物种(Amaranthus spp.)、欧洲海滨草(Ammophila arenaria)、凤梨(Ananas comosus)、番荔枝属某些物种(Annona spp.)、旱芹(Apiumgraveolens)、蜘蛛兰属某些物种(Arachis spp.)、木波罗属某些物种(Artocarpus spp.)、石刁柏(Asparagus officinalis)、燕麦属物种(Avenaspp.)(例如燕麦(Avena sativa)、野燕麦(Avena fatua)、比赞燕麦(Avenabyzantina)、野燕麦原变种(Avena fatua var.sativa)、杂种燕麦(Avenahybrida)、阳桃(Averrhoa carambola)、箣竹属物种(Bambusa sp.)、冬瓜(Benincasa hispida)、巴西栗(Bertholletia excelsea)、甜菜(Beta vulgaris)、芸苔属物种(Brassica spp.)(例如欧洲油菜(Brassica napus)、芜青物种(Brassica rapa ssp.)物种[卡诺拉油菜、欧洲油菜(oilseed rape)、蔓青(turniprape)])、Cadaba farinosa、茶(Camellia sinensis)、美人蕉(Canna indica)、大麻(Cannabis sativa)、辣椒属某些物种(Capsicum spp.)、Carex elata、番木瓜(Carica papaya)、大果假虎刺(Carissa macrocarpa)、山核桃属某些物种(Carya spp.)、红花(Carthamus tinctorius)、栗属某些物种(Castanea spp.)、美洲木棉(Ceiba pentandra)、苦苣(Cichorium endivia)、樟属某些物种(Cinnamomum spp.)、西瓜(Citrullus lanatus)、柑橘属某些物种(Citrus spp.)、椰子属某些物种(Cocos spp.)、咖啡属某些物种(Coffea spp.)、芋头(Colocasiaesculenta)、非洲梧桐属某些物种(Cola spp.)、黄麻属物种(Corchorus sp.)、芫荽(Coriandrum sativum)、榛属某些物种(Corylus spp.)、山楂属某些物种(Crataegus spp.)、番红花(Crocus sativus)、南瓜属某些物种(Cucurbita spp.)、香瓜属某些物种(Cucumis spp.)、菜蓟属某些物种(Cynara spp.)、胡萝卜(Daucus carota)、山马蝗属某些物种(Desmodium spp.)、龙眼(Dimocarpuslongan)、薯蓣属某些物种(Dioscorea spp.)、柿树属某些物种(Diospyros spp.)、稗属某些物种(Echinochloa spp.)、油棕属(Elaeis)(例如油棕(Elaeisguineensis)、美洲油棕(Elaeis oleifera))、穇子(Eleusine coracana)、蔗茅属物种(Erianthus sp.)、枇杷(Eriobotrya japonica)、桉属物种(Eucalyptus sp.)、红仔果(Eugenia uniflora)、荞麦属某些物种(Fagopyrum spp.)、水青冈属某些物种(Fagus spp.)、苇状羊茅(Festuca arundinacea)、无花果(Ficus carica)、金桔属某些物种种(Fortunella spp.)、草莓属某些物种(Fragaria spp.)、银杏(Ginkgo biloba)、大豆属(Glycine spp.)(例如大豆(Glycine max)、大豆(Sojahispida)或大豆(Soja max))、陆地棉(Gossypium hirstum)、向日葵属(Helianthus spp.)(例如向日葵(Helianthus annuus))、长管萱草(Hemerocallisfulva)、木槿属某些物种(Hibiscus spp.)、大麦属(Hordeum spp.)(例如大麦(Hordeum vulgare))、甘薯(Ipomoea batatas)、核桃属某些物种(Juglans spp.)、莴苣(Lactuca sativa)、山黧豆属某些物种(Lathyrus spp.)、兵豆(Lensculinaris)、亚麻(Linum usitatissimum)、荔枝(Litchi chinensis)、百脉根属某些物种(Lotus spp.)、棱角丝瓜(Luffa acutangula)、羽扇豆属某些物种(Lupinus spp.)、Luzula sylvatica、番茄属物种(Lycopersicon spp.)(例如番茄(Lycopersicon esculentum、Lycopersicon lycopersicum、Lycopersiconpyriforme))、硬皮豆属某些物种(Macrotyloma spp.)、苹果属物种(Malusspp.)、凹缘金虎尾(Malpighia emarginata)、牛油果(Mammea americana)、芒果(Mangifera indica)、木薯属某些物种(Manihot spp.)、人心果(Manilkarazapota)、苜蓿(Medicago sativa)、草木樨属某些物种(Melilotus spp.)、薄荷属某些物种(Mentha spp.)、芒(Miscanthus sinensis)、苦瓜属某些物种(Momordica spp.)、黑桑(Morus nigra)、芭蕉属某些物种(Musa spp.)、烟草属某些物种(Nicotiana spp.)、木犀榄属某些物种(Olea spp.)、仙人掌属某些物种(Opuntia spp.)、鸟足豆属某些物种(Ornithopus spp.)、稻属(Oryzaspp.)(例如稻、阔叶稻(Oryza latifolia))、稷(Panicum miliaceum)、柳枝稷(Panicum virgatum)、鸡蛋果(Passiflora edulis)、欧防风(Pastinaca sativa)、狼尾草属物种(Pennisetum sp.)、鳄梨属某些物种(Persea spp.)、欧芹(Petroselinum crispum)、虉草(Phalaris arundinacea)、菜豆属某些物种(Phaseolus spp.)、猫尾草(Phleum pratense)、刺葵属某些物种(Phoenix spp.)、南方芦苇(Phragmites australis)、酸浆属某些物种(Physalis spp.)、松属某些物种(Pinus spp.)、阿月浑子(Pistacia vera)、豌豆属某些物种(Pisum spp.)、早熟禾属某些物种(Poa spp.)、杨属某些物种(Populus spp.)、牧豆草属某些物种(Prosopis spp.)、李属某些物种(Prunus spp.)、番石榴属某些物种(Psidium spp.)、石榴(Punica granatum)、西洋梨(Pyrus communis)、栎属某些物种(Quercus spp.)、萝卜(Raphanus sativus)、波叶大黄(Rheumrhabarbarum)、茶藨子属某些物种(Ribes spp.)、蓖麻(Ricinus communis)、悬钩子属某些物种(Rubus spp.)、甘蔗属某些物种(Saccharum spp.)、柳属物种(Salix sp.)、接骨木属某些物种(Sambucus spp.)、黑麦(Secale cereale)、胡麻属某些物种(Sesamum spp.)、白芥属物种(Sinapis sp)、茄属(Solanumspp.)(例如马铃薯(Solanum tuberosum)、红茄(Solanum integrifolium)或番茄)、两色蜀黍(Sorghum bicolor)、菠菜属某些物种(Spinacia spp.)、蒲桃属某些物种(Syzygium spp.)、万寿菊属某些物种(Tagetes spp.)、酸豆(Tamarindus indica)、可可树(Theobroma cacao)、车轴草属某些物种(Trifolium spp.)、小黑麦属物种(Triticale sp.)、Triticosecale rimpaui、小麦属(Triticum spp.)(例如普通小麦(Triticum aestivum)、硬粒小麦(Triticumdurum)、圆柱小麦(Triticum turgidum)、Triticum hybernum、马卡小麦(Triticum macha)、普通小麦(Triticum sativum)或普通小麦(Triticumvulgare))、小金莲花(Tropaeolum minus)、金莲花(Tropaeolum majus)、越桔属某些物种(Vaccinium spp.)、野碗豆属某些物种(Vicia spp.)、豇豆属某些物种(Vigna spp.)、香堇(Viola odorata)、葡萄属某些物种(Vitis spp.)、玉米(Zea mays)、Zizania palustris、枣属某些物种(Ziziphus spp.)及其他。

发明详述

出人意料地，现在已经发现：增加植物中编码GRF多肽的核酸序列的表达产生了相对于对照植物具有提高的产量相关性状的植物。根据第一实施方案，本发明提供了用于相对于对照植物而言提高植物中产量相关性状的方法，包括增加植物中编码GRF多肽的核酸序列的表达。

用于增加编码GRF多肽的核酸序列表达的优选方法是在植物中导入并表达编码GRF多肽的核酸序列。

下文任何对“本发明方法中有用的蛋白质”的谈及在一个实施方案中意指如本文中定义的GRF多肽。下文任何对“本发明方法中有用的核酸序列”的谈及意指能够编码这种GRF多肽的核酸序列。待导入植物(并且因而在实施本发明方法中有用)的核酸序列是编码现在将描述的多肽类型的任意核酸序列，下文也称作“GRF核酸序列”或“GRF基因”。

如本文中定义的“GRF多肽”指这样的任意多肽，其包含：(i)与如SEQID NO：115所代表的QLQ结构域具有至少50％、55％、60％、65％、70％、75％、80％、85％、90％、95％、98％、99％或更多氨基酸序列同一性的结构域；和(ii)与如SEQ ID NO：116所代表的WRC结构域具有至少50％、55％、60％、65％、70％、75％、80％、85％、90％、95％、98％、99％或更多氨基酸序列同一性的结构域。

备选地或额外地，如本文中定义的“GRF多肽”指这样的任意多肽，其包含：(i)具有InterPro登录号IPR014978(PFAM登录号PF08880)的QLQ结构域；(ii)具有InterPro登录号IPR014977(PFAM登录号PF08879)的WRC结构域；和(iii)包含在保守间隔(CX₉CX₁₀CX₂H)中的3个Cys和一个His残基的转录效应子(ET)结构域。

备选地或额外地，如本文中定义的“GRF多肽”指这样的任意多肽，其以增加的优选顺序与如SEQ ID NO：2所代表的GRF多肽或与本文表A中给出的任意全长多肽序列具有至少50％、55％、60％、65％、70％、75％、80％、85％、90％、95％、98％、99％或更多的氨基酸序列同一性。

备选地或额外地，“GRF多肽”在酵母双杂交相互作用测定法中与GRF相互作用因子(GIF)多肽(又叫做滑膜肉瘤易位(SYT)多肽)相互作用。

出人意料地，现在已经发现：调节植物中编码RAA1样多肽的核酸表达产生相对于对照植物具有增强的产量相关性状的植物。根据第一实施方案，本发明提供了用于相对于对照植物增强植物中产量相关性状的方法，包括调节植物中编码RAA1样多肽的核酸表达。

用于调节(优选提高)编码RAA1样多肽的核酸表达的优选方法是在植物中导入并表达编码RAA1样多肽的核酸。

下文任何对“本发明方法中有用的蛋白质”的谈及在一个实施方案中意指如本文中定义的RAA1样多肽。下文任何对“在本发明方法中有用的核酸”的谈及指能够编码这种RAA1样多肽的核酸。待导入植物(并且因而在实施本发明方法中有用)的核酸是编码现在将描述的蛋白质类型的任意核酸，下文也称作“RAA1样核酸”或“RAA1样基因”。

如本文中定义的“RAA1样多肽”指由SEQ ID NO：121代表的任意多肽并指其直向同源物和旁系同源物。RAA1样蛋白是小的(分子量在10与21kDA之间)碱性多肽(pI高于8.5)，并通常地在使用具有默认设置的标准Needleman-Wunsch比对程序时与SEQ ID NO：121比对的序列中具有0或1个Cys残基。

优选地，RAA1样多肽包含两个或多个以下保守序列基序：

SEQ ID NO：162，基序1：GVW(V/L)F

SEQ ID NO：163，基序2：LGW(E/S)RY(Y/F)

SEQ ID NO：164，基序3：(D/H)L(L/I)S(I/V/L)P(R/K/A)(S/D)F

SEQ ID NO：165，基序4：(H/Y)(F/M)YD(V/I)VVK(N/T)(R/P)。

备选地，RAA1蛋白的同源物以增加的优选顺序与SEQ ID NO：121所代表的氨基酸具有至少30％、31％、32％、33％、34％、35％、36％、37％、38％、39％、40％、41％、42％、43％、44％、45％、46％、47％、48％、49％、50％、51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％整体序列同一性，条件是该同源蛋白包含如上文概述的保守基序1(a、b、c或d)、2和3及亮氨酸丰富结构域。使用总体比对算法如程序GAP(GCG Wisconsin Package，Accelrys)中的Needleman Wunsch算法，优选地采用默认参数，确定整体序列同一性。

优选地，该多肽序列在构建进化系统树(如图8中所绘制的一个进化系统树(Ge等人，2004))中使用时，与包含如SEQ ID NO：121所代表的氨基酸序列的RAA1样多肽组聚类，而不与任何其他组聚类。

出人意料地，现在已经发现：调节植物中编码SYR多肽的核酸表达产生了在非生物胁迫条件下生长时相对于对照植物具有增强的产量相关性状的植物。根据第一实施方案，本发明提供了用于相对于对照植物增强在非胁迫条件下生长的植物中产量相关性状的方法，包括调节植物中编码SYR多肽的核酸表达。

用于调节(优选增加)编码SYR多肽的核酸表达的优选方法是在植物中导入并表达编码SYR多肽的核酸。

下文任何对“本发明方法中有用的蛋白质”的谈及在一个实施方案中意指如本文中定义的SYR多肽。下文任何对“在本发明方法中有用的核酸”的谈及意指能够编码这种SYR多肽的核酸。待导入植物(并且因而在实施本发明方法中有用)的核酸是编码现在将描述的蛋白质类型的任意核酸，下文也称作“SYR核酸”或“SYR基因”。

如本文中定义的术语“SYR蛋白质或其同源物”指约65个至约200个氨基酸的多肽，其包含(i)在该蛋白质羧基半端中类似于亮氨酸拉链的亮氨酸丰富结构域，所述亮氨酸丰富结构域(ii)前有具备序列YFS(保守基序5a，SEQ ID NO：173)或YFT(保守基序5b，SEQ ID NO：174)或YFG(保守基序5c，SEQ ID NO：175)或YLG(保守基序5d，SEQ ID NO：176)的三肽，并且(iii)后接保守基序6((V/A/I)LAFMP(T/S)，SEQ ID NO：177)。优选地，保守基序6是(A/V)LAFMP(T/S)，最优选地，该保守基序是VLAFMPT。“SYR蛋白质或其同源物”优选地也具有以保守基序7(SYL或PYL，SEQID NO：178)结尾的保守羧基端肽。SYR蛋白或其同源物的亮氨酸丰富结构域长约38至48个氨基酸，其紧邻保守基序5之后开始并紧邻保守基序6之前结束，并且包含至少30％的亮氨酸。该亮氨酸丰富结构域优选地具有类似于亮氨酸拉链基序(L-X₆-L-X₆-L-X₆-L，其中X₆是6个连续氨基酸的序列)的基序。SYR蛋白的优选例子由SEQ ID NO：169代表，在图11中给出其结构域的概览。

进一步优选地，SYR蛋白具有两个跨膜结构域，该蛋白质的氨基端部分和羧基端部分位于内部，而所述部分之间的跨膜结构域位于外部。

备选地，SYR蛋白的同源物以增加的优选顺序与SEQ ID NO：169所代表的氨基酸具有至少27％、28％、29％、30％、31％、32％、33％、34％、35％、36％、37％、38％、39％、40％、41％、42％、43％、44％、45％、46％、47％、48％、49％、50％、51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、或99％整体序列同一性，条件是该同源蛋白包含如上文概述的保守基序5(a、b、c或d)、6和7及亮氨酸丰富结构域。使用总体比对算法如程序GAP(GCGWisconsin Package，Accelrys)中的Needleman Wunsch算法，优选地采用默认参数，确定整体序列同一性。与整体序列同一性相比较，仅考虑保守的结构域或基序时，该序列同一性通常会更高。

出人意料地，现在已经发现：调节植物中编码ARKL多肽的核酸表达产生了相对于对照植物具有增强的产量相关性状的植物。根据第一实施方案，本发明提供了用于相对于对照植物增强植物中产量相关性状的方法，包括调节植物中编码ARKL多肽的核酸表达。

用于调节(优选提高)编码ARKL多肽的核酸表达的优选方法是在植物中导入并表达编码ARKL多肽的核酸。

下文对任何“在本发明方法中有用的蛋白质”的谈及意指如本文中定义的ARKL多肽。下文对任何“在本发明方法中有用的核酸”的谈及意指能够编码这种ARKL多肽的核酸。待导入植物(并且因而在实施本发明方法中有用)的核酸是编码现在将描述的蛋白质类型的任意核酸，下文也称作“ARKL核酸”或“ARKL基因”。

如本文中定义的“ARKL多肽”指包含锌指RING型保守结构域和任选地包含DAR1结构域的任意多肽。ARKL多肽中发现的RING型锌指包含规范的C3H2C3锌指结构域型。它可以进一步划分成如Stone等人2005年定义的组I内部的RING-H2型。

已经报道了代表RING-H2结构域的共有序列，为如CX(2)CX(9-39)CX(1-3)HX(2-3)HX(2)CX(4-48)CX(2)C(SEQ ID NO：400)所代表那样。ARKL多肽中可变环的长度一般在金属配体2和3之间是14-15个氨基酸并且在金属配体6和7之间是10个氨基酸(图1)。除涉及Zn²⁺离子直接配位的那些氨基酸残基之外的特定氨基酸残基是在ARKL多肽的RING-H2结构域中高度保守的(图1)。SEQ ID NO：401代表大多数ARKL多肽之间保守的共有序列。

在本发明方法中有用的优选ARKL多肽指包含ZfC3H2C3锌指RING结构域的多肽，这种结构域如SEQ ID NO：400或以增加的优选顺序与如SEQ ID NO：306至SEQ ID NO.351所代表的一个或多个ZfC3H2C3结构域具有至少50％、55％、60％、65％、70％、75％、80％、85％、90％、95％或更多序列同一性的多肽代表。进一步优选地，本发明的ARKL多肽包含如SEQ ID NO：401所代表的ZfC3H2C3结构域。

ARKL多肽一般包含名为DAR1(与RING相关的结构域)的额外结构域，其中先前已描述了所述结构域出现在少数植物源RING蛋白的RING结构域外部(Stone等人，2005)。DAR1结构域一般发现位于RING结构域的氨基端。通常，DAR1结构域包含如SEQ ID NO：399(基序8)所代表的保守氨基酸标签。

在本发明方法中有用的进一步优选ARKL多肽指这样的多肽，其以增加的优选顺序与如SEQ ID NO：352至SEQ ID NO.398所代表的一个或多个DAR1结构域具有至少50％、55％、60％、65％、70％、75％、80％、85％、90％、95％或更多序列同一性的DAR1结构域。仍更优选地，本发明的ARKL多肽包含如SEQ ID NO：399所代表的基序8。

锌指RING型和DAR1结构域可以在专门研究蛋白家族、结构域和功能位点的蛋白数据库如Pfam(Finn等人Nucleic Acids Research(2006)数据库第34卷：D247-D251)或集成蛋白特征序列数据库：PROSITE、PRINTS、ProDom、Pfam、SMART、TIGRFAMs、PIRSF、SUPERFAMILY、Gene3D和PANTHER的InterPro(Mulder等人2007Nucleic AcidsResearch，2007，数据库第34卷D224-D228)中找到。Pfam编纂了覆盖许多常见蛋白质结构域和家族的多重序列比对结果和隐匿马尔科夫模型(HMM)的庞大集合并且通过英国Sanger研究所可获得。如Pfam数据库中所认为的受信任匹配是评分高于收集临界阈值的那些序列。RING-H2结构域(Pfam登录号：PF00097)的收集临界阈值在Pfam HMM_fs方法中是16.0并且在Pfam HMM_ls方法中是15.2。然而，包含真实RING-H2结构域的潜在匹配依旧可以低于该收集临界值。优选地，在本发明方法中有用的ARKL多肽是在它们的序列中具有一个或多个下述结构域的蛋白质，其中所述结构域超出Pfam蛋白质结构域家族PF000097的收集临界值，又称作锌指C3HC4型(RING指)家族结构域。

备选地，可以通过用包含锌指RING型和/或DAR1结构域的已知多肽开展序列比较并在所述结构域的区域内建立相似性而鉴定多肽中的锌指RING型和DAR1结构域。可以使用本领域熟知的任意方法如Blast算法比对所述序列。取得与给定序列出现比对结果的概率作为用于鉴定相似多肽的基础。一般用来代表这种概率的参数称作e-值。所述e-值是S评分可靠性的一个量度。S评分是查询项与所示序列的相似性的一个度量。e-值描述给定S评分预期以多大频率随机发生。临界e-值可以高至1.0。来自使用ARKL多肽作为查询序列的BLAST搜索输出结果的受信任e-值的常见阈值低于e^-5(＝10^-5)、1.e^-10、1.e^-15、1.e^-20、1.e^-25、1.e^-50、1.e^-75、1.e^-100、1.e^-200、1.e^-300、1.e^-400、1.e^-500、1.e^-600、1.e^-700和1.e^-800。优选地，在本发明方法中有用的ARKL多肽包含这样的序列，该序列以增加的优选顺序在比对结果中与如已知ARKL多肽例如SEQ ID NO：213中发现的锌指RING型

DAR1结构域具有低于e^-5(＝10^-5)、1.e^-10、1.e^-15、1.e^-20、1.e^-25、1.e^-50、1.e^-75、1.e^-100、1.e^-200、1.e^-300、1.e^-400、1.e^-500、1.e^-600、1.e^-700和1.e^-800的e-值。

表A中给出在本发明方法中有用的ARKL多肽的例子。分别在SEQ IDNO：306至SEQ ID NO：351和SEQ ID NO：352至SEQ ID NO：398中给出包含如表A的代表性ARKL多肽中存在的RING-H2和DAR1结构域的序列。在实施例4中给出如在选择表A的ARKL多肽中存在的RING-H2和DAR1结构域位置的氨基酸坐标。

在本发明方法中有用的进一步优选ARKL多肽是以增加的优选顺序与表A中给出的任意多肽具有至少50％、55％、60％、65％、70％、75％、80％、85％、90％、95％、96％、98％或更多序列同一性的那些ARKL多肽。

出人意料地，现在已经发现：调节植物中编码YTP多肽的核酸表达产生了相对于对照植物具有增强的产量相关性状的植物。根据第一实施方案，本发明提供了用于相对于对照植物增强植物中产量相关性状的方法，包括调节植物中编码YTP多肽的核酸表达。

用于调节(优选增加)编码YTP多肽的核酸表达的优选方法是在植物中导入并表达编码YTP多肽的核酸。

下文任何对“本发明方法中有用的蛋白质”的谈及在一个实施方案中意指如本文中定义的YTP多肽。下文对任何“在本发明方法中有用的核酸”的谈及意指能够编码这种YTP多肽的核酸。待导入植物(并且因而在实施本发明方法中有用)的核酸是编码现在将描述的蛋白质类型的任意核酸，下文也称作“YTP核酸”或“YTP基因”。

如本文中定义的“YTP多肽”指包含至少一个跨膜结构域和DUF221结构域的至少50个连续氨基酸部分的多肽。额外地，YTP多肽可以包含如SEQ ID NO：546所代表的基序9。

跨膜蛋白具有两亲性结构，该两亲性结构具备横穿膜的疏水性区段和可能位于膜两侧任意一侧的亲水环(见图20)。环是位于两个TM结构域之间的蛋白质区段(区域)。位于膜内侧的平均大小的环一般比位于膜外侧的那些环带更多负电荷。

跨膜结构域形成一般12-35个氨基酸残基的二级结构(通常是α或β螺旋)。跨膜结构域之间的环一般短于60个氨基酸残基，尽管也可以存在长的球形区域。YTP多肽中跨膜结构域的数目是可变的，不过一般在2和20之间。

YTP多肽中发现的跨膜结构域优选地具有8个和50个之间的氨基酸，最优选地具有8、12、14、16、18、20、22、24、26、28、30、32、34、35或36个氨基酸。YTP多肽中发现的环优选地具有超过20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、100个氨基酸残基。

在本发明方法中有用的优选YTP多肽以增加的优选顺序包含多于1、2、4、5、6、8、10、12个跨膜结构域。

跨膜结构域是富含非极性氨基酸的高度疏水性蛋白质。表3显示根据侧链特性的氨基酸分类。标出了疏水性氨基酸。肽的疏水性特性可以由本领域熟知(如Kyte和Doolittle(1982)J.Mol.Biol.，157：105-132所报道)的方法确定。

在本发明方法中有用的YTP多肽优选地包含具有至少20％、30％、40％、50％、60％或更多非极性氨基酸的跨膜结构域。表3给出20种必需氨基酸的极性。

表3：根据侧链特性的氨基酸分类。

氨基酸	三字母	单字母	侧链极性	侧链酸度或碱度	亲水指数
氨基酸	三字母	单字母	侧链极性	侧链酸度或碱度	亲水指数	精氨酸	Arg	R	极性	碱性	-4.5
天冬酰胺	Asn	N	极性	中性	-3.5	精氨酸	Arg	R	极性	碱性	-4.5

氨基酸	三字母	单字母	侧链极性	侧链酸度或碱度	亲水指数
氨基酸	三字母	单字母	侧链极性	侧链酸度或碱度	亲水指数	天冬氨酸	Asp	D	极性	酸性	-3.5
半胱氨酸	Cys	C	极性	中性	2.5	天冬氨酸	Asp	D	极性	酸性	-3.5
半胱氨酸	Cys	C	极性	中性	2.5	谷氨酸	Glu	E	极性	酸性	-3.5
谷氨酰胺	Gln	Q	极性	中性	-3.5	谷氨酸	Glu	E	极性	酸性	-3.5
谷氨酰胺	Gln	Q	极性	中性	-3.5	组氨酸	His	H	极性	碱性	-3.2
赖氨酸	Lys	K	极性	碱性	-3.9	组氨酸	His	H	极性	碱性	-3.2
赖氨酸	Lys	K	极性	碱性	-3.9	丝氨酸	Ser	S	极性	中性	-0.8
苏氨酸	Thr	T	极性	中性	-0.7	丝氨酸	Ser	S	极性	中性	-0.8
苏氨酸	Thr	T	极性	中性	-0.7	酪氨酸	Tyr	Y	极性	中性	-1.3
氨基酸	三字母	单字母	侧链极性	侧链酸度或碱度	亲水指数	酪氨酸	Tyr	Y	极性	中性	-1.3
氨基酸	三字母	单字母	侧链极性	侧链酸度或碱度	亲水指数	丙氨酸	Ala	A	非极性	中性	1.8
甘氨酸	Gly	G	非极性	中性	-0.4	丙氨酸	Ala	A	非极性	中性	1.8
甘氨酸	Gly	G	非极性	中性	-0.4	异亮氨酸	Ile	I	非极性	中性	4.5
亮氨酸	Leu	L	非极性	中性	3.8	异亮氨酸	Ile	I	非极性	中性	4.5
亮氨酸	Leu	L	非极性	中性	3.8	甲硫氨酸	Met	M	非极性	中性	1.9
苯丙氨酸	Phe	F	非极性	中性	2.8	甲硫氨酸	Met	M	非极性	中性	1.9
苯丙氨酸	Phe	F	非极性	中性	2.8	脯氨酸	Pro	P	非极性	中性	-1.6
色氨酸	Trp	W	非极性	中性	-0.9	脯氨酸	Pro	P	非极性	中性	-1.6
色氨酸	Trp	W	非极性	中性	-0.9	缬氨酸	Val	V	非极性	中性	4.2

蛋白质中的跨膜结构域可以使用本领域熟知的许多技术如X射线晶体学、NMR、基因融合技术、替代的半胱氨酸可及性方法、Asp(N)连接的糖基化实验鉴定。额外地或备选地，可以使用计算机算法来预测跨膜结构域。此类结构域的例子已经被描述并且可在提供生物信息服务的机构获得(

等人2001.Bioinformatics 17，646)。在本文的实施例部分中显示了使用这样一种算法来预测YTP多肽中跨膜结构域。

DUF221结构域指某些真核来源蛋白质中发现的一种保守氨基酸序列。DUF221结构域通常具有350至550个残基长度。源自拟南芥和稻的YTP多肽中所包含的DUF221结构域的例子由SEQ ID NO：518至SEQ IDNO：543代表。在SEQ ID NO：544中给出代表序列SEQ ID NO：518至SEQ ID NO：543的共有序列。

本发明的优选YTP多肽包含DUF221结构域的至少50个连续氨基酸，其中所述的DUF221结构域以增加的优选顺序与SEQ ID NO：518至SEQID NO：544所代表的任一结构域具有至少50％、55％、60％、65％、70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性。使用本领域熟知的算法如Blast优选地在局部比对中建立序列相似性。

可以通过在含有保守蛋白质结构域的专业化数据库如Pfam(Finn等人Nucleic Acids Research(2006)数据库第34期：D247-D251)中搜索轻易地鉴定YTP多肽。本领域熟知在搜索此类数据库中有用的工具，例如允许同时搜索几个蛋白质结构域数据库的INTERPRO(欧洲生物信息研究所，UK)。

DUF221结构域可以通过与包含DUF221结构域的已知多肽进行序列比较并在DUF221结构域区范围内建立相似性百分数加以鉴定。可以使用本领域熟知的任意方法如Blast算法(用于局部比对)或BestFit算法(用于总体比对)比对所述序列。取得与给定序列的比对结果的概率作为鉴定相似多肽的基础。一般用来代表这种概率的参数称作e-值。e-值是评分“S”的可靠性的一种量度。“S”是所比对的两个序列之间相似性的一种度量。e-值描述给定“S”评分预期以多大频率随机发生。临界e-值可以高至1.0。与查询序列显示显著序列同一性并由BLAST搜索产生的受信任(真实)命中的常见阈值低于1.e^-5，在某种情况下采用甚至更低的阈值，例如1.e^-10，或甚至更低。

优选地，在本发明方法中有用的YTP多肽包含DUF221结构域的至少50个连续氨基酸，其中所述的DUF221结构域在局部比对结果中以增加的优选顺序与一种已知多肽(如表A的任一多肽)中存在的DUF221结构域具有低于1.e^-5、1.e^-10、1.e^-15、1.e^-20、1.e^-25、1.e^-50、1.e^-75、1.e^-100、1.e^-200、1.e^-300、1.e^-400、1.e^-500、1.e^-600、1.e^-700和1.e^-800的e-值。

应当理解编码本发明YTP多肽的核酸不限于天然来源的序列。该核酸可以编码“从头”设计的YTP多肽。

备选地或额外地，YTP蛋白以增加的优选顺序与SEQ ID NO：409所代表的氨基酸具有至少25％、26％、27％、28％、29％、30％、31％、32％、33％、34％、35％、36％、37％、38％、39％、40％、41％、42％、43％、44％、45％、46％、47％、48％、49％、50％、51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％整体序列同一性。

使用总体比对算法如程序GAP(GCG Wisconsin Package，Accelrys)中的Needleman Wunsch算法，优选地采用默认参数，确定整体序列同一性。与整体序列同一性相比较，仅考虑保守的结构域或基序时，该序列同一性通常会更高。

优选地，YTP多肽序列在构建进化系统树(如图21中所绘制的一个进化系统树)中使用时，与包含如SEQ ID NO：409所代表的氨基酸序列的组1聚类，而不与组2中的YTP多肽聚类。

术语“结构域”和“基序”在本文的“定义”部分中定义。存在用于鉴定结构域的专业数据库，例如，SMART(Schultz等人(1998)Proc.Natl.Acad.Sci.USA 95，5857-5864；Letunic等人(2002)Nucleic Acids Res 30，242-244)、InterPro(Mulder等人，(2003)Nucl.Acids.Res.31，315-318)、Prosite(Bucher和Bairoch(1994)，用于生物分子序列基序的概括特征结构及其在自动化序列解读中的功能(A generalized profile syntax forbiomolecular sequences motifs and its function in automatic sequenceinterpretation).(在)ISMB-94；第二届分子生物学智能系统国际会议文集.Altman R.，Brutlag D.，Karp P.，Lathrop R.，Searls D.编辑，第53-61页，AAAIPress，Menlo Park；Hulo等人，Nucl.Acids.Res.32：D134-D137，(2004))或Pfam(Bateman等人，Nucleic Acids Research 30(1)：276-280(2002))。一组用于计算机方式分析蛋白质序列的工具可在ExPASY蛋白质组服务器(瑞士生物信息研究所(Gasteiger等人，ExPASy：用于深入认识和分析蛋白质的蛋白质组服务器(The proteomics server for in-depthprotein knowledge and analysis)，Nucleic Acids Res.31：3784-3788(2003))上获得。

以下在本文实施例2和4中呈现对SEQ ID NO：2的多肽序列的分析。例如，如SEQ ID NO：2所代表的GRF多肽包含InterPro结构域数据库中具有InterPro登录号IPR014978(PFAM登录号PF08880)的QLQ结构域和具有InterPro登录号IPR014977(PFAM登录号PF08879)的WRC结构域。也可以使用常规技术如通过序列比对法鉴定结构域。在图2中显示本文表A的多肽的QLQ结构域的比对结果，并且在图3中显示本文表A的多肽的WRC结构域的比对结果。此类比对结果用于鉴定GRF多肽之间最保守的氨基酸，如QLQ和WRC氨基酸残基。

用于比对序列以做比较的方法是本领域熟知的，此类方法包括GAP、BESTFIT、BLAST、FASTA和TFASTA。GAP使用Needleman和Wunsch算法((1970)J Mol Biol 48：443-453)以找到使匹配数最大化并使空位数最小化的两个序列的总体(即覆盖完整序列的)比对结果。BLAST算法(Altschul等人，(1990)J Mol Biol 215：403-10)计算序列同一性百分数并开展两个序列之间相似性的统计分析。用于开展BLAST分析的软件是通过国家生物技术信息中心(NCBI)可公开获得的。同源物可以使用例如ClustalW多重序列比对算法(1.83版本)，以默认配对比对参数和百分数评分方法轻易地鉴定。相似性和同一性的总体百分数也可以使用MatGAT软件包中的可用方法之一确定(Campanella等，(2003)BMC Bioinformatics，10：29.MatGAT：使用蛋白质序列或DNA序列产生相似性/同一性矩阵的一种应用(an application that generates similarity/identity matrices using proteinor DNA sequences))。如本领域技术人员会显而易见，可以进行少许手工编辑以优化保守基序之间的比对。此外，作为使用全长序列鉴定同源物的替代，也可以使用特定的结构域。利用上文提及的程序，使用默认参数，可以在完整核酸序列或多肽序列范围或所选的结构域保守基序范围内确定序列同一性值。

对于局部比对，Smith-Waterman算法是特别有用的(Smith TF，Waterman MS(1981)J.Mol.Biol 147(1)；195-7)。

在QLQ结构域外部和在WRC结构域外部，GRF多肽据称具有低的氨基酸序列同一性。本文的实施例3在表B中描述如SEQ ID NO：2所代表的GRF多肽与表A中所列出GRF多肽之间的同一性百分数，所述同一性百分数可以如15％氨基酸序列同一性那样低。如果在SEQ ID NO：2的QLQ结构域(如由SEQ ID NO：2中包含的SEQ ID NO：115所代表；图2中代表的表A的GRF多肽的QLQ结构域)与在实施本发明中有用的多肽的QLQ结构域之间开展同一性计算，可能相当大程度地提高同一性百分数。类似地，如果在SEQ ID NO：2的WRC结构域(如由SEQ ID NO：2中包含的SEQ ID NO：116所代表；图3中代表的表A的GRF多肽的WRC结构域)与在实施本发明中有用的多肽的WRC结构域之间开展同一性计算，可能相当大程度地提高同一性百分数。在实施本发明中有用的多肽序列之间的QLQ结构域范围内的同一性百分数范围是在25％和99％氨基酸同一性之间，并且在实施本发明中有用的多肽序列之间的WRC结构域范围内的同一性百分数范围是在60％和99％氨基酸同一性之间。如也可以在图3中观察到，WRC结构域在不同GRF多肽之间比QLQ结构域更保守，如图2中所示。

蛋白质亚细胞定位预测的任务是重要的并且得到充分研究。知晓蛋白质的定位有助于阐明其功能。用于蛋白质定位的实验方法的范围从免疫定位至使用绿色荧光蛋白(GFP)或β-葡糖醛酸酶(GUS)对蛋白质加标签。虽然此类方法与计算性方法相比繁琐费累，然而它准确。最近在从序列数据计算性预测蛋白质定位方面取得长足进展。在瑞士生物信息研究所维护的ExPASy蛋白质组工具上可获得本领域技术人员熟知算法当中的例如PSort、TargetP、ChloroP、LocTree、Predotar、LipoP、MITOPROT、PATS、PTS1、SignalP等。

另外，在本发明方法中有用的GRF多肽(至少以它们的天然形式)一般，但并非必需具有转录调节活性和与其他蛋白质相互作用的能力。因此，转录调节活性降低、无转录调节活性、蛋白质-蛋白质相互作用能力降低或无蛋白质-蛋白质相互作用能力的GRF多肽可以同等地用于本发明的方法中。可以使用本领域熟知的技术(例如在Current Protocols in MolecularBiology，第1和2卷，Ausubel等人(1994)，Current Protocols中)轻易地在体外或体内确定DNA结合活性和蛋白质-蛋白质相互作用。GRF多肽能够在酵母细胞中转录地激活报道基因(Kim和Kende(2004)Proc Natl AcadSci 101(36)：13374-13379)。使用酵母双杂交蛋白质-蛋白质相互作用测定法，GRF多肽也能够在酵母细胞中与GRF相互作用因子多肽(GIF1至GIF3；又叫做滑膜肉瘤易位(SYT)多肽，SYT1至SYT3)在体内相互作用(上文的Kim和Kende)。也使用体外结合测定法来显示GRF多肽和GIF(也称作SYT)多肽是相互作用的配偶物(上文的Kim和Kende)。

本发明在一个实施方案中通过用SEQ ID NO：1所代表的核酸序列转化植物进行说明，其中所述核酸序列编码SEQ ID NO：2的GRF多肽序列。然而，本发明的实施不限于这些序列；本发明的方法可以有利地使用编码如本文中所定义GRF多肽的任意核酸序列实施。

本发明在一个实施方案中通过用SEQ ID NO：120所代表的核酸序列转化植物进行说明，其中所述核酸序列编码SEQ ID NO：121的多肽序列。然而，本发明的实施不限于这些序列；本发明的方法可以有利地使用编码RAA1样的任意核酸或如本文中定义的RAA1样多肽实施。

另外，RAA1样多肽当根据如实施例中所概述的本发明方法在稻中表达时，产生这样的植物，其具有提高的产量相关性状，尤其提高的根苗指数、提高的每穗花数和提高的千粒核重。

跨膜结构域长约15至30个氨基酸并且通常由形成α螺旋的疏水性残基组成。各跨膜结构域通常基于疏水性预测(例如Klein等人，Biochim.Biophys.Acta 815，468，1985；或Sonnhammer等人，在编者J.Glasgow，T.Littlejohn，F.Major，R.Lathrop，D.Sankoff和C.Sensen《第六届分子生物学智能系统国际会议文集》(Proceedings of the Sixth InternationalConference on Intelligent Systems for Molecular Biology)，第175-182页，Menlo Park，CA，1998.AAAI Press.)。

属于定义“SYR多肽或其同源物”的蛋白质的例子在实施例部分的表A中给出并包括来自多种单子叶植物如稻(SEQ ID NO：169、SEQ ID NO：179和SEQ ID NO：180)、谷物(SEQ ID NO：181)、小麦(SEQ ID NO：182)、大麦(SEQ ID NO：183)、甘蔗(SEQ ID NO：184和SEQ ID NO：185)、高粱(SEQ ID NO：186)；和来自双子叶植物如拟南芥(SEQ ID NO：187和SEQID NO：188)、葡萄(SEQ ID NO：189)、柑橘(SEQ ID NO：190)或番茄(SEQID NO：191和SEQ ID NO：192)的序列。构思了Leu丰富结构域对于蛋白质的功能重要，因而带有Leu丰富结构域、但无保守基序5或6的蛋白质也可以用于本发明的方法中，此类蛋白质的例子在SEQ ID NO：201和202中给出。

应当理解术语“SYR多肽或其同源物”不限于SEQ ID NO：169所代表的序列或不限于列出作为SEQ ID NO：179至SEQ ID NO：192的同源物，但是应当理解符合包含如上文所定义亮氨酸丰富结构域这一标准的约65至约200个氨基酸的任意多肽可以适合于本发明方法中，其中所述的亮氨酸丰富结构域前有保守三肽基序5(a、b、c或d)并且后接保守基序6和优选地还后接保守基序7；或与SEQ ID NO：169的序列具有至少38％序列同一性。

SYR蛋白质或其同源物的活性可以通过在稻中表达GOS2启动子控制下的SYR蛋白质或同源物进行分析，其中所述的表达产生与相应野生型植物相比，在缺氮条件下或在干旱胁迫条件下生长时具有提高的生物量和/或种子产量的植物。种子产量的这种提高可以以几种方式测量，例如测量为总种子重量、充实种子数、充实率、收获指数或千粒核重的提高。

本发明在一个实施方案中通过用SEQ ID NO：168所代表的核酸序列转化植物进行说明，其中所述核酸序列编码SEQ ID NO：169的多肽序列。然而，本发明的实施不限于这些序列；本发明的方法可以有利地使用编码SYR的任意核酸或如本文中定义的SYR多肽实施。

另外，ARKL多肽(至少以它们的天然形式)一般具有E3遍在蛋白-蛋白质连接酶活性。用于测量E3遍在蛋白-蛋白质连接酶活性的工具和技术是本领域熟知的(美国专利6737244；WO/2001/075145；Miura等人(2005)Proc Natl Acad Sci U S A.102(21)：7760-7765；Kawasaki等人(2005)ThePlant Journal 44，258-270。简而言之，ARKL多肽的E3遍在蛋白连接酶活性可以通过将ARKL蛋白与E1和E2蛋白和加标签的遍在蛋白孵育进行分析。可以在SDS-PAGE电泳并使用针对遍在蛋白标签的抗体实施印迹后检测遍在蛋白化的蛋白质。可以在该测定法中使用的E1和E2蛋白的例子是小麦E1蛋白和拟南芥AtUBC1E2蛋白。以组氨酸加标签的遍在蛋白和检测它的抗体是市售的(Calbiochem，San Diego，CA，USA)。

另外，ARKL多肽当根据如实施例中所概述的本发明方法在稻中表达时，产生这样的植物，其具有提高的产量相关性状，尤其千粒核重、总种子产量、早期生长势和/或收获指数。

本发明在一个实施方案中通过用SEQ ID NO：212所代表的核酸序列转化植物进行说明，其中所述核酸序列编码SEQ ID NO：213的多肽序列。然而，本发明的实施不限于这些序列；本发明的方法可以有利地使用编码ARKL的任意核酸或如本文中定义的ARKL多肽实施。

另外，YTP多肽一般具有种子产量增强活性。用于测量产量增强(或改进)活性的工具和方法是本领域熟知的。在本文中实施例部分提供了其他细节。

另外，YTP多肽当根据如实施例10至15中所概述的本发明方法在稻中表达并按照表型方式评价时，产生这样的植物，其具有提高的产量相关性状，尤其总种子重量、千粒核重、每穗花数、种子充实率和收获指数之一项或多项。

本发明在一个实施方案中通过用SEQ ID NO：408所代表的核酸序列转化植物进行说明，其中所述核酸序列编码SEQ ID NO：409的多肽序列。然而，本发明的实施不限于这些序列；本发明的方法可以有利地使用编码YTP的任意核酸或如本文中定义的YTP多肽实施。

编码本发明多肽的核酸序列的例子在本文实施例1的表A中给出，特别是编码分别选自以下多肽的核酸序列：在表A1中给出的GRF多肽、在表A2中给出的RAA1样多肽、在表A3中给出的SYR多肽、在表A4中给出的ARKL多肽和在表A5中给出的YTP多肽。

此类核酸序列在实施本发明的方法中有用。在实施例1的表A中给出的多肽序列是选自以下多肽的直向同源物和旁系同源物的示例序列，所述多肽分别由SEQ ID NO：2、121、169、213或409所代表的GRF多肽、RAA1样多肽、SYR多肽、ARKL多肽和YTP多肽代表，术语“直向同源物”和“旁系同源物”如本文中定义。其他直向同源物和旁系同源物可以通过开展所谓交互性blast搜索轻易地鉴定。通常，这包括第一BLAST，其中所述的第一BLAST包括将查询序列(例如使用实施例1的表A中列出的任意序列)针对任意序列数据库，如可公开获得的NCBI数据库进行BLAST。当从核苷酸序列开始时，一般使用BLASTN或TBLASTX(使用标准默认值)，并且当从蛋白质序列开始时，使用BLASTP或TBLASTN(使用标准默认值)。可以任选地筛选BLAST结果。筛选结果或非筛选结果的全长序列随后针对来自生物的序列进行反向BLAST搜索(第二BLAST)，其中查询序列从所述的生物中衍生(在查询序列分别是SEQ ID NO：1、120、168、212或408或分别是SEQ ID NO：2、121、169、213或409的情况下，第二BLAST因而将针对拟南芥序列进行)。随后比较第一BLAST和第二BLAST的结果。如果来自第一blast的高阶位命中是源自与衍生查询序列的物种相同的物种，则鉴定到旁系同源物，随后一个反向BLAST理想地在最高命中当中产生该查询序列；若在第一BLAST中的高阶位命中不是源自与衍生查询序列的物种相同的物种，则鉴定到直向同源物，并且在反向BLAST时，优选地产生属于最高命中的该查询序列。

在本说明书中使用的术语“表A”将用来说明表A1、A2、A3、A4和/或A5的内容。在本说明书中使用的术语“表A1”将用来说明表A1的内容。在本说明书中使用的术语“表A2”将用来说明表A2的内容。在本说明书中使用的术语“表A3”将用来说明表A3的内容。在本说明书中使用的术语“表A4”将用来说明表A4的内容。在本说明书中使用的术语“表A5”将用来说明表A5的内容。

在一个优选的实施方案中，术语“表A”意指表A1。在一个优选的实施方案中，术语“表A”意指表A2。在一个优选的实施方案中，术语“表A”意指表A3。在一个优选的实施方案中，术语“表A”意指表A4。在一个优选的实施方案中，术语“表A”意指表A5。

高阶位命中是具有低E-值的那些命中。E-值越低，评分越显著(或换句话说，偶然发现该命中的几率越低)。E-值的计算是本领域熟知的。除了E-值外，比较结果也由同一性百分数评价。同一性百分数指两个所比较的核酸(或多肽)序列之间特定长度范围内相同核苷酸(或氨基酸)的数目。在大型家族的情况下，可以使用ClustalW，随后使用邻接树法，以帮助观察相关基因的聚类并鉴定直向同源物和旁系同源物。

核酸变体也可以用于实施本发明的方法中。此类变体的例子包括编码在实施例1的表A中所给出多肽序列任一者的同源物和衍生物的核酸序列，术语“同源物”和“衍生物”如本文中定义。这样的核酸序列也在本发明方法中有用，其编码在实施例1的表A中所给出任一多肽序列的直向同源物或旁系同源物的同源物和衍生物。在本发明方法中有用的同源物和衍生物与衍生它们的未修饰蛋白质具有基本上相同的生物学活性和功能活性。

在本发明的一个实施方案中，在本发明方法中有用的优选衍生物是在与所述锌离子之一配位的RING指结构域中配体5的位置处具有半胱氨酸残基(见图15)的ARKL多肽。在本发明方法中有用的另一种优选衍生物是在锌离子配体位置处具有7个半胱氨酸和一个组氨酸(ZfC3HC4)作为残基的ARKL多肽。

在实施本发明方法中有用的其他核酸变体包括编码分别选自由GRF多肽、RAA1样多肽、SYR多肽、ARKL多肽和YTP多肽组成的组中多肽的核酸序列的部分、与编码分别选自由GRF多肽、RAA1样多肽、SYR多肽、ARKL多肽和YTP多肽组成的组中多肽的核酸序列杂交的核酸序列、编码分别选自由GRF多肽、RAA1样多肽、SYR多肽、ARKL多肽和YTP多肽组成的组中多肽的核酸序列的剪接变体、编码分别选自由GRF多肽、RAA1样多肽、SYR多肽、ARKL多肽和YTP多肽组成的组中多肽的核酸序列的等位变体和通过基因改组获得的编码多肽的核酸序列的变体，其中所述多肽选自分别如本文中所定义GRF多肽、RAA1样多肽、SYR多肽、ARKL多肽和YTP多肽组成的组。术语“杂交序列”、“剪接变体”、“等位变体”和“基因改组作用”如本文中所述。

编码选自分别如本文中所定义的GRF多肽、RAA1样多肽、SYR多肽、ARKL多肽和YTP多肽组成的组中多肽的核酸序列不必须是全长核酸序列，因为本发明方法的实施不取决于全长核酸序列的使用。根据本发明，提供了用于提高植物中产量相关性状的方法，包括在植物中导入并表达实施例1的表A中所给出任一核酸序列的一部分或编码实施例1表A中所给出任意多肽序列的直向同源物、旁系同源物或同源物的核酸序列的一部分。

核酸序列的一部分可以例如通过对所述核酸序列产生一个或多个缺失而制备。所述部分可以以分离的形式使用或它们可以与其他编码(或非编码)序列融合，例如旨在产生联合有几种活性的蛋白质。当融合至其他编码序列时，翻译后产生的所得多肽可以比对该蛋白质部分所预测的多肽更大。

在本发明方法中有用的部分在一个实施方案中编码如本文中定义的GRF多肽，并且基本上具有如实施例1的表A1中所给出多肽序列相同的生物学活性。优选地，此部分是在实施例1的表A1中给出的任一核酸序列的一部分，或是编码在实施例1的表A1中所给出任一多肽序列的直向同源物或旁系同源物的核酸序列的一部分。优选地，该部分的长度以增加的优选顺序是至少400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1190个连续核苷酸，所述连续核苷酸属于实施例1的表A1中给出的任一核酸序列或属于编码在实施例1的表A1中所给出任一多肽序列的直向同源物或旁系同源物的核酸序列。优选地，该部分是编码多肽序列的核酸序列的一部分，所述的多肽序列包含：(i)与如SEQ ID NO：115所代表的QLQ结构域具有至少50％、55％、60％、65％、70％、75％、80％、85％、90％、95％、98％、99％或更多氨基酸序列同一性的结构域；和(ii)与如SEQ ID NO：116所代表的WRC结构域具有至少50％、55％、60％、65％、70％、75％、80％、85％、90％、95％、98％、99％或更多氨基酸序列同一性的结构域。最优选地，该部分是SEQID NO：1的核酸序列的一部分。

在本发明方法中有用的部分在一个实施方案中编码如本文中定义的RAA1样多肽，并且基本上具有如实施例1的表A2中所给出氨基酸序列相同的生物学活性。优选地，此部分是在实施例1的表A2中给出的任一核酸的一部分，或是编码在实施例1的表A2中所给出任一氨基酸序列的直向同源物或旁系同源物的核酸的一部分。优选地，该部分的长度是至少250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000、2100、2200个连续核苷酸，所述连续核苷酸属于实施例1的表A2中给出的任一核酸序列或属于编码在实施例1的表A2中所给出任一氨基酸序列的直向同源物或旁系同源物的核酸。最优选地，该部分是SEQID NO：120的核酸的一部分。优选地，该部分编码下述氨基酸序列的片段，其中所述氨基酸序列在构建进化系统树(如图8中所绘制的一个进化系统树)中使用时，与包含如SEQ ID NO：121所代表的氨基酸序列的RAA1样多肽组聚类，而不与任何其他组聚类。

在本发明方法中有用的部分在一个实施方案中编码如本文中定义的SYR样多肽，并且基本上具有如实施例1的表A3中所给出氨基酸序列相同的生物学活性。优选地，此部分是在实施例1的表A3中给出的任一核酸的一部分，或是编码在实施例1的表A3中所给出任一氨基酸序列的直向同源物或旁系同源物的核酸的一部分。优选地，该部分的长度是至少150、200、250、300、350、400、450、500、550、600个连续核苷酸，所述连续核苷酸属于实施例1的表A3中给出的任一核酸序列或属于编码在实施例1的表A3中所给出任一氨基酸序列的直向同源物或旁系同源物的核酸。最优选地，该部分是SEQ ID NO：168的核酸的一部分。优选地，该部分编码约65个至约200个氨基酸的多肽，其包含如上文定义的前有保守三肽基序5(a、b、c或d)并且后接保守基序6和优选还后接保守基序7的亮氨酸丰富结构域；或与SEQ ID NO：169的序列具有至少38％序列同一性。

在本发明方法中有用的部分在一个实施方案中编码如本文中定义的ARKL样多肽，并且基本上具有如实施例1的表A4中所给出氨基酸序列相同的生物学活性。优选地，此部分是在实施例1的表A4中给出的任一核酸的一部分，或是编码在实施例1的表A4中所给出任一氨基酸序列的直向同源物或旁系同源物的核酸的一部分。优选地，该部分的长度是至少500、550、600、650、700、750、800、850、900、950、1000个连续核苷酸，所述连续核苷酸属于实施例1的表A4中给出的任一核酸序列或属于编码在实施例1的表A4中所给出任一氨基酸序列的直向同源物或旁系同源物的核酸。最优选地，该部分是SEQ ID NO：212的核酸的一部分。优选地，该部分编码下述氨基酸序列的片段，其中所述氨基酸序列在构建进化系统树(如图17中所绘制的一个进化系统树)中使用时，与包含如SEQ IDNO：213所代表的氨基酸序列的ARKL多肽组聚类，而不与任何其他组如Musmu_Goliath序列所代表的组聚类。

在本发明方法中有用的部分在一个实施方案中编码如本文中定义的YTP样多肽，并且基本上具有如实施例1的表A5中所给出氨基酸序列相同的生物学活性。优选地，此部分是在实施例1的表A5中给出的任一核酸的一部分，或是编码在实施例1的表A5中所给出任一氨基酸序列的直向同源物或旁系同源物的核酸的一部分。优选地，该部分的长度是至少300、400、500、550、600、650、700、750、800、850、900、950、1000、1500、2000、2500、3000个连续核苷酸，所述连续核苷酸属于实施例1的表A5中给出的任一核酸序列或属于编码在实施例1的表A5中所给出任一氨基酸序列的直向同源物或旁系同源物的核酸。最优选地，该部分是SEQID NO：408的核酸的一部分。优选地，该部分编码下述氨基酸序列的片段，其中所述氨基酸序列在构建进化系统树(如图21中所绘制的一个进化系统树)中使用时，与包含如SEQ ID NO：409所代表的氨基酸序列的组1聚类，而不与组2中的YTP多肽聚类。

在本发明方法中有用的另一种核酸序列变体是能够在降低的严格条件下、优选地在严格条件下与编码多肽的核酸序列或与如本文中定义的部分杂交的核酸序列，其中所述多肽选自分别如本文中定义的GRF多肽、RAA1样多肽、SYR多肽、ARKL多肽和YTP多肽组成的组。

根据本发明，提供了用于提高植物中产量相关性状的方法，包括在植物中导入并表达能够与实施例1的表A中给出的任一核酸杂交的核酸序列，或包括在植物中导入并表达这样的核酸序列，其中所述核酸序列能够与编码在实施例1的表A中给出的任意核酸序列的直向同源物、旁系同源物或同源物的核酸序列杂交。

在本发明方法中有用的杂交序列编码选自分别如本文中定义的GRF多肽、RAA1样多肽、SYR多肽、ARKL多肽和YTP多肽组成的组中的多肽，并且具有基本上具有如实施例1的表A中所给出多肽序列相同的生物学活性。优选地，该杂交序列能够与实施例1的表A中给出的任一核酸序列或与这些序列中任一序列的一部分杂交，所述的一部分如上文定义，或其中所述杂交序列能够与编码在实施例1的表A中给出的任一多肽序列的直向同源物或旁系同源物的核酸序列杂交。

优选地，在一个实施方案中该杂交序列能够与编码多肽序列的核酸序列杂交，其中所述的多肽序列包含i)与如SEQ ID NO：115所代表的QLQ结构域具有至少50％、55％、60％、65％、70％、75％、80％、85％、90％、95％、98％、99％或更多氨基酸序列同一性的结构域；和(ii)与如SEQ ID NO：116所代表的WRC结构域具有至少50％、55％、60％、65％、70％、75％、80％、85％、90％、95％、98％、99％或更多氨基酸序列同一性的结构域。最优选地，该杂交序列能够与如SEQ ID NO：1所代表的核酸序列或与其一部分杂交。

优选地，在一个实施方案中该杂交序列能够与如SEQ ID NO：120所代表的核酸或与其一部分杂交。

优选地，该杂交序列部分编码具有下述氨基酸序列的多肽，其中当所述氨基酸序列是全长并且在构建进化系统树(如图8中所绘制的一个进化系统树)中使用时，该氨基酸序列与包含如SEQ ID NO：121所代表的氨基酸序列的RAA1样多肽组聚类，而不与任何其他组聚类。

优选地，在一个实施方案中该杂交序列能够与如SEQ ID NO：168所代表的核酸或与其一部分杂交。

优选地，该杂交序列编码约65个至约200个氨基酸的多肽，其包含如上文定义的前有保守三肽基序5(a、b、c或d)并且后接保守基序6和优选还后接保守基序7的亮氨酸丰富结构域；或与SEQ ID NO：169的序列具有至少38％序列同一性。

优选地，在一个实施方案中该杂交序列能够与如SEQ ID NO：212所代表的核酸或与其一部分杂交。

优选地，该杂交序列部分编码具有下述氨基酸序列的多肽，其中当所述氨基酸序列是全长并且在构建进化系统树(如图17中所绘制的一个进化系统树)中使用时，该氨基酸序列与包含如SEQ ID NO：213所代表的氨基酸序列的ARKL样多肽组聚类，而不与任何其他组如Musmu_Goliath序列所代表的组聚类。

优选地，在一个实施方案中该杂交序列能够与如SEQ ID NO：408所代表的核酸或与其一部分杂交。

优选地，该杂交序列部分编码具有下述氨基酸序列的多肽，其中当所述氨基酸序列是全长并且在构建进化系统树(如图21中所绘制的一个进化系统树)中使用时，与包含如SEQ ID NO：409所代表的氨基酸序列的组1聚类，而不与组2中的YTP多肽聚类。

在本发明方法中有用的另一种核酸序列变体是编码选自分别如本文中所定义的GRF多肽、RAA1样多肽、SYR多肽、ARKL多肽和YTP多肽组成的组中多肽的剪接变体，剪接变体如本文中定义。

根据本发明，提供了用于提高产量相关性状的方法，包括在植物中导入并表达实施例1的表A中所给出任一核酸序列的剪接变体或编码实施例1表A中所给出任意多肽序列的直向同源物、旁系同源物或同源物的核酸序列的剪接变体。

优选的剪接变体在一个实施方案中是由SEQ ID NO：1所代表的核酸序列的剪接变体，或是编码SEQ ID NO：2的直向同源物或旁系同源物的核酸序列的剪接变体。优选地，该剪接变体是编码多肽序列的核酸序列的剪接变体，所述的多肽序列包含：(i)与如SEQ ID NO：115所代表的QLQ结构域具有至少50％、55％、60％、65％、70％、75％、80％、85％、90％、95％、98％、99％或更多氨基酸序列同一性的结构域；和(ii)与如SEQ ID NO：116所代表的WRC结构域具有至少50％、55％、60％、65％、70％、75％、80％、85％、90％、95％、98％、99％或更多氨基酸序列同一性的结构域。

优选的剪接变体在一个实施方案中是由SEQ ID NO：120所代表的核酸的剪接变体，或是编码SEQ ID NO：121的直向同源物或旁系同源物的核酸的剪接变体。优选地，由所述剪接变体编码的氨基酸序列在构建进化系统树(如图8中所绘制的一个进化系统树)中使用时，与包含如SEQ ID

NO：121所代表的氨基酸序列的RAA1样多肽组聚类，而不与任何其他组聚类。

优选的剪接变体在一个实施方案中是由SEQ ID NO：168所代表的核酸的剪接变体，或是编码SEQ ID NO：169的直向同源物或旁系同源物的核酸的剪接变体。优选地，由该剪接变体编码的氨基酸序列是约65个至约200个氨基酸的多肽，其包含如上文定义的前有保守三肽基序5(a、b、c或d)并且后接保守基序6和优选还后接保守基序7的亮氨酸丰富结构域；或与SEQ ID NO：169的序列具有至少38％序列同一性。

优选的剪接变体在一个实施方案中是由SEQ ID NO：212所代表的核酸的剪接变体，或是编码SEQ ID NO：213的直向同源物或旁系同源物的核酸的剪接变体。优选地，由该剪接变体编码的氨基酸序列在构建进化系统树，如图17中所绘制的一个进化系统树中使用时，与包含如SEQ ID NO：213所代表的氨基酸序列的ARKL多肽组聚类，而不与任何其他组如Musmu_Goliath序列所代表的组聚类。

优选的剪接变体在一个实施方案中是由SEQ ID NO：408所代表的核酸的剪接变体，或是编码SEQ ID NO：409的直向同源物或旁系同源物的核酸的剪接变体。优选地，由所述剪接变体编码的氨基酸序列在构建进化系统树(如图21中所绘制的一个进化系统树)中使用时，与包含如SEQ IDNO：409所代表的氨基酸序列的组1聚类，而不与组2中的YTP多肽聚类。

在实施本发明方法中有用的另一种核酸序列变体是编码多肽的核酸序列的等位变体，其中所述的多肽选自如上文分别所定义GRF多肽、RAA1样多肽、SYR多肽、ARKL多肽和YTP多肽组成的组，等位变体如本文中定义。

根据本发明，提供了用于提高产量相关性状的方法，包括在植物中导入并表达实施例1的表A中所给出任一核酸序列的等位变体，或包括在植物中导入并表达编码实施例1表A中所给出任意多肽序列的直向同源物、旁系同源物或同源物的核酸序列的等位变体。

在本发明的一个实施方案中有用的等位变体基本上具有如SEQ IDNO：2的GRF多肽和实施例1的表A中所述任意多肽序列相同的生物学活性。等位变体存在于自然界中，并且在本发明的方法中包括使用这些天然等位基因。优选地，该等位变体是SEQ ID NO：1的等位变体或编码SEQID NO：2的直向同源物或旁系同源物的核酸序列的等位变体。优选地，该等位变体是多肽序列的等位变体，所述的多肽序列包含：(i)与如SEQ IDNO：115所代表的QLQ结构域具有至少50％、55％、60％、65％、70％、75％、80％、85％、90％、95％、98％、99％或更多氨基酸序列同一性的结构域；和(ii)与如SEQ ID NO：116所代表的WRC结构域具有至少50％、55％、60％、65％、70％、75％、80％、85％、90％、95％、98％、99％或更多氨基酸序列同一性的结构域。

在本发明的一个实施方案中有用的等位变体基本上具有如SEQ IDNO：121的RAA1样多肽和实施例1的表A中所述任意氨基酸序列相同的生物学活性。等位变体存在于自然界中，并且在本发明的方法中包括使用这些天然等位基因。优选地，该等位变体是SEQ ID NO：120的等位变体或编码SEQ ID NO：121的直向同源物或旁系同源物的核酸的等位变体。优选地，由所述等位变体编码的氨基酸序列在构建进化系统树(如图8中所绘制的一个进化系统树)中使用时，与包含如SEQ ID NO：121所代表的氨基酸序列的RAA1样多肽聚类，而不与任何其他组聚类。

在本发明的一个实施方案中有用的等位变体基本上具有如SEQ IDNO：169的SYR多肽和实施例1的表A中所述任意氨基酸序列相同的生物学活性。等位变体存在于自然界中，并且在本发明的方法中包括使用这些天然等位基因。优选地，该等位变体是SEQ ID NO：168的等位变体或编码SEQ ID NO：169的直向同源物或旁系同源物的核酸的等位变体。优选地，由该等位变体编码的氨基酸序列是约65个至约200个氨基酸的多肽，其包含如上文定义的前有保守三肽基序5(a、b、c或d)并且后接保守基序6和优选还后接保守基序7的亮氨酸丰富结构域；或与SEQ ID NO：169的序列具有至少38％序列同一性。

在本发明的一个实施方案中有用的等位变体基本上具有如SEQ IDNO：213的ARKL多肽和实施例1的表A中所述任意氨基酸序列相同的生物学活性。等位变体存在于自然界中，并且在本发明的方法中包括使用这些天然等位基因。优选地，该等位变体是SEQ ID NO：212的等位变体或编码SEQ ID NO：213的直向同源物或旁系同源物的核酸的等位变体。优选地，由该等位变体编码的氨基酸序列在构建进化系统树，如图17中所绘制的一个进化系统树中使用时，与包含如SEQ ID NO：213所代表的氨基酸序列的ARKL多肽组聚类，而不与任何其他组如Musmu_Goliath序列所代表的组聚类。

在本发明的一个实施方案中有用的等位变体基本上具有如SEQ IDNO：409的YTP多肽和实施例1的表A中所述任意氨基酸序列相同的生物学活性。等位变体存在于自然界中，并且在本发明的方法中包括使用这些天然等位基因。优选地，该等位变体是SEQ ID NO：408的等位变体或编码SEQ ID NO：409的直向同源物或旁系同源物的核酸的等位变体。优选地，由该等位变体编码的氨基酸序列在构建进化系统树(如图21中所绘制的一个进化系统树)中使用时，与包含如SEQ ID NO：409所代表的氨基酸序列的组1聚类，而不与组2中的YTP多肽聚类。

基因改组或定向进化也可以用来生成编码多肽的核酸序列的变体，其中所述的多肽选自如上文分别所定义的GRF多肽、RAA1样多肽、SYR多肽、ARKL多肽和YTP多肽组成的组，术语“基因改组”如本文中定义。

根据本发明，提供了用于提高产量相关性状的方法，包括在植物中导入并表达在实施例1的表A中给出的任一核酸序列的变体，或包括在植物中导入并表达核酸序列的变体，所述的核酸序列编码在实施例1的表A中给出的任意多肽序列的直向同源物、旁系同源物或同源物，其中所述的变体核酸序列通过基因改组获得。

优选地在一个实施方案中，通过基因改组所获得的变体核酸编码这样的多肽序列，其包含：(i)与如SEQ ID NO：115所代表的QLQ结构域具有至少50％、55％、60％、65％、70％、75％、80％、85％、90％、95％、98％、99％或更多氨基酸序列同一性的结构域；和(ii)与如SEQ ID NO：116所代表的WRC结构域具有至少50％、55％、60％、65％、70％、75％、80％、85％、90％、95％、98％、99％或更多氨基酸序列同一性的结构域。

优选地在一个实施方案中，由基因改组获得的变体核酸编码的氨基酸序列在构建进化系统树(如图8中所绘制的一个进化系统树)中使用时，与包含如SEQ ID NO：121所代表的氨基酸序列的RAA1样多肽组聚类，而不与任何其他组聚类。

优选地在一个实施方案中，由基因改组获得的变体核酸编码的氨基酸序列是约65个至约200个氨基酸的多肽，其包含如上文定义的前有保守三肽基序5(a、b、c或d)并且后接保守基序6和优选还后接保守基序7的亮氨酸丰富结构域；或与SEQ ID NO：169的序列具有至少38％序列同一性。

优选地在一个实施方案中，由基因改组获得的变体核酸编码的氨基酸序列在构建进化系统树(如图17中所绘制的一个进化系统树)中使用时，与包含如SEQ ID NO：213所代表的氨基酸序列的ARKL多肽组聚类，而不与任何其他组如PF00097Musmu_Goliath序列所代表的组聚类。

优选地在一个实施方案中，由基因改组获得的变体核酸编码的氨基酸序列在构建进化系统树(如图21中所绘制的一个进化系统树)中使用时，与包含如SEQ ID NO：409所代表的氨基酸序列的组1聚类，而不与组2中的YTP多肽聚类。

另外，核酸序列变体也可以通过位点定向诱变获得。几种方法可用于实现位点定向诱变，最常见的是基于PCR的方法(Current Protocols inMolecular Biology.Wiley编辑)。

编码GRF多肽的核酸序列可以从任何天然来源或人工来源衍生。该核酸序列可以通过人类有意操作，在组成和/或基因组环境方面从其天然形式中修饰而来。优选地，编码GRF多肽的核酸序列来自植物，进一步优选地来自双子叶植物，更优选地来自十字花科(Brassicaceae)，该核酸序列最优选地来自拟南芥。

编码RAA1样多肽的核酸可以从任何任何天然或人工来源衍生。该核酸可以通过人类有意操作，在组成和/或基因组环境方面从其天然形式中修饰而来。优选地，编码RAA1样多肽的核酸来自植物，进一步优选地来自单子叶植物，更优选地来自禾本科(Poaceae)，最优选地该核酸来自稻。

编码SYR多肽的核酸可以从任何天然来源或人工来源衍生。该核酸可以通过人类有意操作，在组成和/或基因组环境方面从其天然形式中修饰而来。优选地，编码SYR多肽的核酸来自植物，进一步优选地来自单子叶植物，更优选地来自禾本科，最优选地该核酸来自稻。

编码ARKL多肽的核酸可以从任何天然来源或人工来源衍生。该核酸可以通过人类有意操作，在组成和/或基因组环境方面从其天然形式中修饰而来。优选地，编码ARKL多肽的核酸来自植物，进一步优选地来自单子叶植物，更优选地来自禾本科，最优选地该核酸来自稻。

编码YTP多肽的核酸也可以通过从头设计的YTP多肽编码，即不从天然来源衍生。该核酸可以通过人类有意操作，在组成和/或基因组环境方面从其天然形式中修饰而来。优选地，编码YTP多肽的核酸来自植物，进一步优选地来自单子叶植物，更优选地来自禾本科，最优选地该核酸来自稻。

本发明方法的实施在一个实施方案中产生了具有增强的产量相关性状的植物。特别地，本发明方法的实施产生了相对于对照植物具有提高的产量、特别地提高的种子产量的植物。术语“产量”和“种子产量”在本文的“定义”部分中更详细地描述。

本发明方法的实施在一个实施方案中产生这样的植物，该植物与对照植物相比在非生物胁迫下生长时具有提高的非生物胁迫抗性(或非生物胁迫耐受性，所述术语可互换地使用)，实现增强的产量相关性状。特别地，本发明方法的实施产生了相对于对照植物具有提高的产量、特别地提高的种子产量和提高的生物量的植物。术语“产量”和“种子产量”在本文的“定义”部分中更详细地描述。

本文中对增强的产量相关性状的谈及意指植物的一个或多个部分的生物量(重量)增加，所述的部分可以包括地上(可收获)部分和/或地下(可收获)部分。

在一个实施方案中，此类可收获部分是种子，并且本发明方法的实施产生了相对于对照植物的种子产量而言具有提高的种子产量的植物。

在一个实施方案中，此类可收获部分是根、花和/或种子，并且本发明方法的实施产生了相对于对照植物的种子产量而言具有提高的生物量和/或种子产量的植物。

在一个实施方案中，此类可收获部分是种子，并且本发明方法的实施产生了相对于对照植物的种子产量而言具有提高的产量、总种子重量、种子充实率、花(或小花)数、收获指数和千粒核重的植物。

以谷物为例，产量提高可以表现为以下一个或多个指标：每公顷或英亩建立的植物的数目提高、每株植物穗数提高、行数、每行核粒数、核粒重、千粒核重、花序长度/直径的提高、种子充实率(即充实种子数除以种子总数并乘以100)提高，及其他。以稻为例，产量提高可以自身表现为下列一种或多种指标的提高：每公顷或英亩植物数、每株植物的花序数、每个花序的小穗数、每花序的花(小花)数目(其表述为充实种子数对原生花序数的比率)、种子充实率(即充实种子数除以种子总数并乘以100)提高、千粒核重提高及其他。

本发明提供了用于相对于对照植物提高植物中产量相关性状的方法，所述方法包括增加植物中编码选自分别如本文中所定义的GRF多肽和RAA1样多肽组成的组中多肽的核酸序列表达。

本发明提供了用于相对于对照植物提高植物的非生物胁迫抗性、从而在非生物胁迫条件下生长时，相对于对照植物而言导致植物提高的产量、尤其种子产量和/或提高的生物量，所述方法包括调节植物中编码如本文中所定义的SYR多肽的核酸表达，优选地增加该核酸表达。

本发明提供了用于相对于对照植物提高植物的产量、尤其种子产量的方法，所述方法包括调节植物中编码如本文中定义的ARKL多肽的核酸表达。

本发明提供了用于相对于对照植物提高植物的产量、尤其种子产量的方法，所述方法包括调节植物中编码如本文中定义的YTP多肽的核酸表达。

由于本发明的转基因植物具有提高的产量相关性状，故这些植物有可能在其生活周期的对应阶段(在其生活周期的至少部分期间)上相对于对照植物的生长速率表现出提高的生长速率。

除了提高的产量能力外，提高的养分摄取效率也可以有助于产量的提高。观察到本发明的植物显示较高的养分摄取效率。当植物处于胁迫下时，提高的养分摄取效率允许植物更好地生长。也观察到本发明的植物具有提高的干旱胁迫耐受性，这允许植物在阻滞或抑制对照植物生长的条件下继续生长。

提高的生长速率可以是植物的一个或多个部分(包括种子)特有的，或可以基本上遍及整株植物。具有提高的生长速率的植物可以具备更短的生活周期。植物的生活周期可以意指从干燥成熟种子生长直至植物已经产生与起始材料相似的干燥成熟种子的阶段所需要的时间。这个生活周期可以受诸因素如早期生长势、生长速率、绿度指数、开花时间和种子成熟速度影响。生长速率的提高可以在植物生活周期的一个或多个阶段上或基本上在植物整个生活周期期间发生。提高的生长速率在植物生活周期的早期期间可以反映增加的(早期)生长势。生长速率的提高可以改变植物的收获周期，从而允许植物较晚播种和/或较早收获，而这本来是不可能的(相似效果可以随较早的开花时间获得；延迟的开花通常不是作物中想要的性状)。如果大幅提高生长速率，则可以允许进一步播种相同植物物种的种子(例如播种并收获稻植物，随后播种并收获其他稻植物，全部稻植物均处于一个常规生长时期中)。类似地，如果大幅提高生长速率，则可以允许进一步播种不同植物物种的种子(例如播种并收获谷物植物，随后例如播种并任选收获大豆、马铃薯或任何其他合适的植物)。在一些作物植物的例子中，来自相同根状茎的额外收获次数也可以是可能的。改变植物的收获周期可以导致每英亩一年生物量生产提高(原因在于可以培育并收获任何具体植物的次数(即在一年中)提高)。生长速率的提高也可以允许将转基因植物在比其野生型对应物更广泛的地理区域内培育，因为培育作物的地域限制往往由栽种时期(早季)或在收获时期(晚季)的不利环境条件决定。如果缩短收获周期，则可以避开这类不利条件。生长速率可以通过从生长曲线衍生多个参数而确定，此类参数可以是：T-Mid(植物达到50％最大植物大小所花费的时间)和T-90(植物达到90％最大植物大小所花费的时间)，以及其他。

根据本发明的优选特征，本发明方法的实施产生了相对于对照植物具有提高的生长速率的植物。因此，根据本发明，提供了用于提高植物生长速率的方法，所述方法包括增加植物中编码如本文中定义的GRF多肽或RAA1样多肽或YTP多肽或ARKL多肽的核酸序列表达。

根据本发明的优选特征，本发明方法的实施产生了相对于对照植物，在非生物胁迫条件下生长时具有提高的生长速率的植物。因此，根据本发明，提供了用于提高非生物胁迫条件下植物生长速率的方法，所述方法包括调节植物中编码如本文中定义的SYR多肽的核酸表达、优选地增加该核酸表达。

与可比较条件下生长的对照植物相比较，无论该植物处于非胁迫条件下或无论该植物暴露于多种胁迫，提高的产量相关性状均出现。植物一般通过生长得更慢而应答于胁迫暴露。在严重胁迫条件下，植物甚至可能完全停止生长。另一方面，轻度胁迫在本文中定义为植物所暴露的任何下述胁迫，其中所述的胁迫不导致植物完全停止生长，但同时不能恢复生长。与非胁迫条件下的对照植物相比较，轻度胁迫在本发明的意义下导致受胁迫植物的生长降低小于40％、35％或30％、优选地小于25％、20％或15％、更优选地小于14％、13％、12％、11％或10％或更低。由于农业实践(灌溉、施肥、杀虫剂处理)的进步，栽培作物植物中并不经常遭遇严重胁迫。因此，由轻度胁迫诱导的受损生长对于农业往往是不受欢迎的特征。轻度胁迫是植物所暴露的常见生物胁迫和/或非生物(环境)胁迫。

非生物胁迫可以因干旱或过量的水、缺氧胁迫、盐胁迫、化学毒性、氧化胁迫和热、寒冷或冰冻温度所致。非生物胁迫可以是因水胁迫(尤其因为干旱)、盐胁迫、氧化胁迫或离子胁迫引起的渗透胁迫。生物胁迫一般是由病原体如细菌、病毒、真菌、线虫和昆虫引起的那些胁迫。如本文中所用的术语“非胁迫”条件是允许植物最佳生长的那些环境条件。本领域技术人员清楚对于给定地点的正常土壤条件和气候条件。

特别地，本发明的方法可以在非胁迫条件下或在轻度干旱条件开展以产生相对于对照植物具有提高的产量的植物。如Wang等人(Planta(2003)218：1-14)中报道，非生物胁迫导致一系列不利地影响植物生长及生产力的形态学、生理学、生物化学和分子变化。干旱、盐度、极端温度和氧化胁迫已知相互联系并可以通过相似的机制诱导生长损害及细胞损害。Rabbani等人(Plant Physiol(2003)133：1755-1767)描述了干旱胁迫与高盐度胁迫之间极高程度的“交互作用”。例如，干旱和/或盐化作用主要表现为渗透胁迫，从而导致细胞内稳态和离子分布的破坏。经常伴随高温或低温、盐度或干旱胁迫的氧化胁迫可以引起功能蛋白和结构蛋白变性。因此，这些多样的环境胁迫常常激活相似的细胞信号传导途径和细胞应答，如产生胁迫蛋白、上调抗氧化物质、积累兼容性溶质和生长停滞。如本文中所用的术语“非胁迫”条件是允许植物最佳生长的那些环境条件。本领域技术人员清楚对于给定地点的正常土壤条件和气候条件。

与对照植物相比较，无论所述植物处于非胁迫条件下或无论所述植物暴露于多种胁迫，产量和/或生长速率的提高均出现。植物一般通过生长得更慢而应答于胁迫暴露。在严重胁迫条件下，植物甚至可能完全停止生长。另一方面，轻度胁迫在本文中定义为植物所暴露的任何下述胁迫，其中所述的胁迫不导致植物完全停止生长，但同时不能恢复生长。由于农业实践(灌溉、施肥、杀虫剂处理)的进步，栽培作物植物中并不经常遭遇严重胁迫。因此，由轻度胁迫诱导的受损生长对于农业往往是不受欢迎的特征。轻度胁迫是植物所暴露的常见生物胁迫和/或非生物(环境)胁迫。非生物胁迫可以因干旱或过量的水、缺氧胁迫、盐胁迫、化学毒性、氧化胁迫和热、寒冷或冰冻温度所致。非生物胁迫可以是因水胁迫(尤其因为干旱)、盐胁迫、氧化胁迫或离子胁迫引起的渗透胁迫。生物胁迫一般是由病原体如细菌、病毒、真菌和昆虫引起的那些胁迫。

相对于在可比较条件下培育的对照植物，本发明方法的实施在一个实施方案中产生在非胁迫条件下或在轻度胁迫条件下培育的具有提高的产量相关性状的植物。因此，根据本发明，提供了用于提高非胁迫条件下或在轻度胁迫条件下生长的植物中产量相关性状的方法，所述方法包括增加植物中编码GRF多肽的核酸序列表达。

相对于可比较胁迫条件下生长的对照植物，本发明方法的实施产生在非生物胁迫条件下生长的具有提高的产量相关性状的植物。如Wang等人(Planta(2003)218：1-14)中报道，非生物胁迫导致一系列不利地影响植物生长及生产力的形态学、生理学、生物化学和分子变化。干旱、盐度、极端温度和氧化胁迫已知相互联系并可以通过相似的机制诱导生长损害及细胞损害。Rabbani等人(Plant Physiol(2003)133：1755-1767)描述了干旱胁迫与高盐度胁迫之间极高程度的“交互作用”。例如，干旱和/或盐化作用主要表现为渗透胁迫，从而导致细胞内稳态和离子分布的破坏。经常伴随高温或低温、盐度或干旱胁迫的氧化胁迫可以引起功能蛋白和结构蛋白变性。因此，这些多样的环境胁迫常常激活相似的细胞信号传导途径和细胞应答，如产生胁迫蛋白、上调抗氧化物质、积累兼容性溶质和生长停滞。由于多样的环境胁迫激活相似途径，故本发明采用干旱胁迫的示例不应当视为限于干旱胁迫，而更应视为一种筛选法以相对于可比较胁迫条件下、通常在非生物胁迫下培育的对照植物，说明如上文定义的GRF多肽参与提高产量相关性状。

如本文中定义的术语“非生物胁迫”意指以下任意一项或多项：水胁迫(因干旱或过量的水所致)、缺氧胁迫、盐胁迫、温度胁迫(因热、寒冷或冰冻温度所致)、化学毒性胁迫和氧化胁迫。根据本发明的一个方面，所述非生物胁迫是渗透胁迫，其选自水胁迫、盐胁迫、氧化胁迫和离子胁迫。优选地，水胁迫是干旱胁迫。术语“盐胁迫”不限于普通盐(NaCl)，不过可以是由以下一种或多种盐：NaCl、KCl、LiCl、MgCl₂、CaCl₂等引起的任意胁迫。

相对于可比较胁迫条件下培育的对照植物，本发明方法的实施产生在非生物胁迫条件下具有提高的产量相关性状的植物。因此，根据本发明，提供了用于提高非生物胁迫条件下生长的植物中产量相关性状的方法，所述方法包括增加植物中编码GRF多肽的核酸序列表达。根据本发明的一个方面，所述非生物胁迫是渗透胁迫，其选自以下一种或多种胁迫：水胁迫、盐胁迫、氧化胁迫和离子胁迫。

非生物的环境胁迫的另一个例子是需要被所述植物同化用于生长和发育的一种或多种养分的可利用性降低。因为养分利用效率强烈影响植物产量和产品品质，故向田地倾注大量肥料以优化植物生长和产品品质。植物的生产量通常受3种主要养分磷、钾和氮限制，这3种养分中，氮通常是是植物生长的限速性元素。因此，植物生长所需的主要营养元素是氮(N)。氮是活细胞中存在的许多重要化合物的组成成分，所述的重要化合物包括氨基酸、蛋白质(酶)、核酸和叶绿素。1.5％至2％的植物干物质是氮而大约16％的植物总蛋白是氮。因此，氮可利用性是作物植物生长和生产的主要限制性因素(Frink等人(1999)Proc Natl Acad Sci USA 96(4)：1175-1180)，并且也对蛋白质积累和氨基酸组成产生重大影响。因此，在氮限制性条件下生长时具有提高的产量相关性状的植物是意义重大的。

本发明方法的实施产生在养分可利用性降低、尤其氮可利用性降低的条件下培育的植物，该植物相对于可比较条件下培育的对照植物具有提高的产量相关性状。因此，根据本发明，提供了用于提高在降低的养分可用性、优选降低的氮可用性条件下生长的植物中产量相关性状的方法，所述方法包括增加植物中编码GRF多肽的核酸序列表达。降低的养分可利用性可以因养分如氮、磷酸盐和其他含磷化合物、钾、钙、镉、镁、锰、铁和硼及其他养分匮乏或过多所致。优选地，降低的养分可利用性是降低的氮可利用性。

相对于可比较条件下生长的对照植物，本发明方法的实施在一个实施方案中赋予在非胁迫条件下或在轻度干旱条件下生长的植物提高的产量。因此，根据本发明，提供了用于在非胁迫条件下或在轻度干旱条件下培育的植物中提高产量的方法，所述方法包括增加植物中编码RAA1样多肽的核酸表达。

相对于可比较条件下生长的对照植物，本发明方法的实施在一个实施方案中赋予在养分缺乏条件下、尤其在缺氮条件下生长的植物提高的产量。因此，根据本发明，提供了用于在营养缺乏条件下生长的植物中提高产量的方法，所述方法包括调节植物中编码RAA1样多肽的核酸表达。养分缺乏可以因养分如氮、磷酸盐和其他含磷化合物、钾、钙、镉、镁、锰、铁和硼及其他元素缺少所致。

相对于可比较条件下生长的对照植物，本发明方法的实施赋予在非生物胁迫条件如轻度至严重干旱条件下生长的植物提高的产量。因此，根据本发明，提供了用于提高在非生物胁迫条件如轻度至严重干旱条件下生长的植物中产量的方法，所述方法包括增加植物中编码SYR多肽的核酸表达。如本文中所用的术语“严重干旱条件”或“严重干旱胁迫”是与非胁迫条件下生长的对照植物的产量相比较，引起对照植物中50％或更多产量下降的那些干旱条件。

相对于可比较条件下生长的对照植物，本发明方法的实施在一个实施方案中赋予在养分缺乏条件下、尤其在缺氮条件下生长的植物提高的产量。因此，根据本发明，提供了用于提高在营养缺乏条件下生长的植物中产量的方法，所述方法包括增加植物中编码SYR多肽的核酸表达。养分缺乏可以因养分如氮、磷酸盐和其他含磷化合物、钾、钙、镉、镁、锰、铁和硼及其他元素缺少所致。

相对于在可比较条件下生长的对照植物，本发明方法的实施赋予在非胁迫条件下或在轻度干旱条件下生长的植物提高的产量。因此，根据本发明，提供了用于提高在非胁迫条件下或在轻度干旱条件下生长的植物中产量的方法，所述方法包括调节植物中编码ARKL多肽的核酸表达。

相对于可比较条件下生长的对照植物，本发明方法的实施在一个实施方案中赋予在养分缺乏条件下、尤其在缺氮条件下生长的植物提高的产量。因此，根据本发明，提供了用于提高在营养缺乏条件下生长的植物中产量的方法，所述方法包括调节植物中编码ARKL多肽的核酸表达。养分缺乏可以因养分如氮、磷酸盐和其他含磷化合物、钾、钙、镉、镁、锰、铁和硼及其他元素缺少所致。

相对于在可比较条件下生长的对照植物，本发明方法的实施赋予在非胁迫条件下或在轻度干旱条件下生长的植物提高的产量。因此，根据本发明，提供了用于提高在非胁迫条件下或在轻度干旱条件下生长的植物中产量的方法，所述方法包括调节植物中编码YTP多肽的核酸表达。

相对于可比较条件下生长的对照植物，本发明方法的实施赋予在养分缺乏条件下、尤其在缺氮条件下生长的植物提高的产量。因此，根据本发明，提供了用于提高在营养缺乏条件下生长的植物中产量的方法，所述方法包括调节植物中编码YTP多肽的核酸表达。养分缺乏可以因养分如氮、磷酸盐和其他含磷化合物、钾、钙、镉、镁、锰、铁和硼及其他元素缺少所致。

本发明包括通过本发明方法可获得的植物或其部分(包括种子)或其细胞。所述植物或其部分或其细胞包含编码选自分别如上文所定义GRF多肽、RAA1样多肽、SYR多肽、ARKL多肽和YTP多肽组成的组中多肽的核酸转基因。

本发明也提供了基因构建体和载体以促进植物中编码选自分别如上文所定义GRF多肽、RAA1样多肽、SYR多肽、ARKL多肽和YTP多肽组成的组中多肽的核酸序列导入和/或增加的表达。基因构建体可以插入适于转化到植物中并适于在转化细胞中表达目的基因的载体中，所述载体可以是市售的。本发明也提供了如本文中定义的基因构建体在本发明方法中的用途。

更具体地，在一个实施方案中，本发明提供了构建体，其包含：

(a)编码如上文定义的GRF多肽的核酸序列；

(b)能够增加(a)的核酸序列表达的一个或多个调控序列；和任选地

(c)转录终止序列。

优选地，编码GRF多肽的核酸序列如上文定义。术语“调控序列”和“终止序列”如本文中定义。

优选地，构建体的调控序列之一是从植物基因组分离的组成型启动子。植物组成型启动子的例子是GOS2启动子，优选地是稻GOS2启动子，更优选地是如SEQ ID NO：117所代表的GOS2启动子。

(d)编码如上文定义的RAA1样多肽的核酸；

(e)能够驱动(a)的核酸序列表达的一个或多个调控序列；和任选地

(f)转录终止序列。

优选地，编码RAA1样多肽的核酸如上文定义。术语“调控序列”和“终止序列”如本文中定义。

1.编码如上文定义的SYR多肽的核酸；

2.能够驱动(a)的核酸序列表达的一个或多个调控序列；和任选地

3.转录终止序列。

优选地，编码SYR多肽的核酸如上文定义。术语“调控序列”和“终止序列”如本文中定义。

1.编码如上文定义的ARKL多肽的核酸；

3.转录终止序列。

优选地，编码ARKL多肽的核酸如上文定义。术语“调控序列”和“终止序列”如本文中定义。

1.编码如上文定义的YTP多肽的核酸；

3.转录终止序列。

优选地，编码YTP多肽的核酸如上文定义。术语“调控序列”和“终止序列”如本文中定义。

植物用包含任意上述核酸序列的载体转化。技术人员非常了解必须存在于所述载体上以便成功转化、选择和增殖含有目的序列的宿主细胞的遗传元件。此目的序列有效地与一个或多个调控序列(至少与启动子)连接。

有利地，任意类型的启动子，无论是天然的或合成的，可以用来增加所述核酸序列的表达。组成型启动子是在所述方法中特别有用的，优选从植物基因组分离的组成型启动子。该植物组成型启动子驱动编码序列在全部情况低于受35S CaMV病毒启动子控制时所获得水平的水平上表达。

其他器官特异性启动子，例如用于叶、茎、块茎、分生组织、种子(胚和/或胚乳)中优先表达的器官特异性启动子，是在实施本发明的方法中有用的。对于多种启动子类型的定义，见本文中的“定义”部分。

优选地在一个实施方案中，组成型启动子也是遍在启动子。对于多种启动子类型的定义，见本文中的“定义”部分。

应当明白本发明的应用不限于由SEQ ID NO：1代表的编码GRF多肽的核酸序列，本发明的应用也不限于编码GRF多肽的核酸序列被组成型启动子驱动时的表达。

应当明白本发明的应用不限于由SEQ ID NO：120代表的编码RAA1样多肽的核酸，本发明的应用也不限于编码RAA1样多肽的核酸被组成型启动子驱动时的表达。

组成型启动子优选地是GOS2启动子，优选地是来自稻的GOS2启动子。进一步优选地，该组成型启动子由基本上与SEQ ID NO：124相似的核酸序列代表，最优选地该组成型启动子如SEQ ID NO：124或SEQ IDNO：211所代表。根据本发明的另一个优选特征，该组成型启动子是高速泳动族蛋白(HMGP)启动子，优选地是来自稻的HMGP启动子，更优选地与SEQ ID NO：125基本上相似，最优选地与SEQ ID NO：125同一。对于组成型启动子的其他例子，见本文“定义”部分中的表2。

应当明白本发明的应用不限于由SEQ ID NO：168代表的编码SYR多肽的核酸，本发明的应用也不限于编码SYR多肽的核酸被组成型启动子驱动时的表达。

组成型启动子优选地是GOS2启动子，优选地是来自稻的GOS2启动子。进一步优选地，该组成型启动子由基本上与SEQ ID NO：172或SEQ IDNO：211相似的核酸序列代表，最优选地，该组成型启动子如SEQ ID NO：172或SEQ ID NO：211所代表那样。对于有用的组成型启动子的其他例子，见本文“定义”部分中的表2。

应当明白本发明的应用不限于由SEQ ID NO：212代表的编码ARKL多肽的核酸，本发明的应用也不限于编码ARKL多肽的核酸被组成型启动子驱动时或被根特异性启动子驱动时的表达。

该组成型启动子优选地是GOS2启动子，优选地是来自稻的GOS2启动子。进一步优选地，该组成型启动子由基本上与SEQ ID NO：406相似的核酸序列代表，最优选地该组成型启动子如SEQ ID NO：406或SEQ IDNO：211所代表那样。对于组成型启动子的其他例子，见本文“定义”部分中的表2。

应当明白本发明的应用不限于由SEQ ID NO：1代表的编码YTP多肽的核酸，本发明的应用也不限于编码YTP多肽的核酸被组成型启动子驱动时的表达。

组成型启动子优选地是GOS2启动子，优选地是来自稻的GOS2启动子。进一步优选地，该组成型启动子由基本上与SEQ ID NO：548相似的核酸序列代表，最优选地该组成型启动子如SEQ ID NO：548或SEQ IDNO：211所代表那样。对于组成型启动子的其他例子，见本文“定义”部分中的表2。

任选地，可以在被导入植物的构建体中使用一个或多个终止子序列。额外的调节元件可以包括转录增强子以及翻译增强子。本领域技术人员将知道可能适用于实施本发明的终止子和增强子序列。如定义部分中描述，内含子序列也可以添加至5’非翻译区(UTR)或编码序列中，以提高细胞质中积累的成熟信使的量。(除启动子、增强子、沉默子、内含子序列、3’UTR和/或5’UTR区域之外的)其他调控序列可以是蛋白质和/或RNA稳定元件。此类序列将是已知的或可以由本领域技术人员轻易地获得。

任选地，可以在被导入植物的构建体中使用一个或多个终止子序列。优选地，该构建体包含与SEQ ID NO：166基本上相似或同一的表达盒，所述表达盒包含GOS2启动子、编码RAA1样多肽的核酸。在一个备选的实施方案中，该构建体包含与SEQ ID NO：167基本上相似或同一的表达盒，所述表达盒包含HMGP启动子、编码RAA1样多肽的核酸。

任选地，可以在被导入植物的构建体中使用一个或多个终止子序列。优选地，该构建体包含与SEQ ID NO 407基本上相似或同一的表达盒，所述表达盒包含GOS2启动子、编码Orysa_ARKL1多肽的核酸和T-玉米醇溶蛋白+T-核酮糖二磷酸羧化酶-加氧酶转录终止子序列。

任选地，可以在被导入植物的构建体中使用一个或多个终止子序列。优选地，该构建体包含与SEQ ID NO 549基本上相似或相同的表达盒，所述表达盒包含GOS2启动子、编码YTP多肽的核酸和T-玉米醇溶蛋白+T-核酮糖二磷酸羧化酶-加氧酶转录终止子序列。

额外的调节元件可以包括转录增强子以及翻译增强子。本领域技术人员将知道可能适用于实施本发明的终止子和增强子序列。如定义部分中描述，内含子序列也可以添加至5’非翻译区(UTR)或编码序列中，以提高细胞质中积累的成熟信使的量。(除启动子、增强子、沉默子、内含子序列、3′UTR和/或5′UTR区域之外的)其他调控序列可以是蛋白质/或RNA稳定化元件。此类序列将是已知的或可以由本领域技术人员轻易地获得。

本发明的基因构建体可以还包括对于特定细胞类型中维持和/或复制所需要的复制起点序列。一个例子是当需要将基因构建体在细菌细胞中作为游离型遗传元件(例如质粒或粘粒分子)维持时的复制起点。优选的复制起点包括但不限于f1-ori和colE1。

为检测如在本发明方法中有用的核酸序列的成功转移和/或选择包含这些核酸序列的转基因植物，使用标记基因(或报道基因)是有利的。因此，所述基因构建体可以任选地包含选择标记基因。选择标记在本文的“定义”部分中更详细地描述。

一旦不再需要所述标记基因时，可以从转基因细胞中移除或切除它们。用于标记移除的技术是本领域已知的，有用的技术在上文定义部分中描述。

已知当核酸序列稳定或瞬时地整合至植物细胞时，仅少数细胞摄取外来DNA，并且根据需要，将外来DNA整合至细胞基因组中，这取决于所用的表达载体和所用的转染技术。为鉴定并选择这些整合体，通常将编码选择标记的基因(如上文所述的基因)连同目的基因一起导入宿主细胞。这些标记可以在这些基因例如通过常规方法缺失而无功能的突变体中使用。此外，编码选择标记的核酸序列分子可以在包含编码本发明多肽或本发明方法中所用多肽的序列的相同载体上，或在独立的载体上导入宿主细胞。已经用所导入核酸序列稳定转染的细胞可以例如通过选择作用鉴定(例如具有整合的选择标记的细胞存活而其他细胞死亡)。一旦不再需要所述标记基因时，可以从转基因细胞中移除或切除它们。用于移除标记基因的技术是本领域已知的，有用的技术在上文定义部分中描述。

本发明提供了用于产生相对于对照植物而言具有提高的产量相关性状的转基因植物的方法，所述方法包括在植物中导入并表达编码这样多肽的任意核酸序列，所述多肽选自分别如本文以上所定义的GRF多肽、RAA1样多肽、SYR多肽、ARKL多肽和YTP多肽组成的组。

更具体地，在一个实施方案中，本发明提供了用于产生相对于对照植物具有提高的产量相关性状的转基因植物的方法，所述方法包括：

(i)在植物、植物部分或植物细胞中导入并表达在植物组成型启动子控制下的编码GRF多肽的核酸序列；和

(ii)在促进植物生长和发育的条件下培育所述植物细胞、植物部分或植物。

(i)的核酸序列可以是能够编码如本文中定义的GRF多肽的任意核酸序列。

更具体地，在一个实施方案中，本发明提供了用于产生转基因植物的方法，所述转基因植物具有提高的增强产量相关性状、特别地提高的生物量和/或种子产量，其中所述方法包括：

i)在植物或植物细胞中导入并表达编码RAA1样多肽的核酸；和

ii)在促进植物生长和发育的条件下培育植物细胞。

(i)的核酸可以是能够编码如本文中定义的RAA1样多肽的任意核酸。

更具体地，在一个实施方案中，本发明提供了用于产生转基因植物的方法，所述转基因植物具有提高的增强产量相关性状、特别地提高的(种子)产量和/或提高的生物量，其中所述方法包括：

(i)在植物或植物细胞中导入并表达编码SYR多肽的核酸；和

(ii)在促进植物生长和发育的条件下培育植物细胞。

(i)的核酸可以是能够编码如本文中定义的SYR多肽的任意核酸。

更具体地，在一个实施方案中，本发明提供了用于产生转基因植物的方法，所述转基因植物具有增加的增强产量相关性状、特别地提高的(种子)产量，其中所述方法包括：

(i)在植物或植物细胞中导入并表达编码ARKL多肽的核酸；和

(ii)在促进植物生长和发育的条件下培育植物细胞。

(i)的核酸可以是能够编码如本文中定义的ARKL多肽的任意核酸。

i)在植物或植物细胞中导入并表达编码YTP多肽的核酸；和

ii)在促进植物生长和发育的条件下培育植物细胞。

(i)的核酸可以是能够编码如本文中定义的YTP多肽的任意核酸。

所述核酸序列可以直接导入植物细胞或导入植物自身(包括导入组织、器官或植物的任何其他部分)。根据本发明的优选特征，该核酸序列优选地通过转化作用导入植物。术语“转化”在本文的“定义”部分中更详细地描述。可以借助技术人员熟悉的全部方法再生出基因修饰的植物细胞。合适的方法可以在上文提及的S.D.Kung和R.Wu，Potrykus或

和Willmitzer的出版物中找到。

通常在转化后，对植物细胞或细胞群体选择一个或多个标记的存在性，其中所述标记由随同目的基因一起共转移的植物可表达基因编码，随后将转化材料再生成完整植物。为了选择转化的植物，转化中获得的植物材料一般经历选择条件，从而转化植物可以与非转化植物区分开。例如，以上文所述方式获得的种子可以播种，并且在初始培育时间后，通过喷洒经受合适的选择。另一种可能性在于种子根据需要消毒后，在使用合适选择剂的琼脂板上培育，从而仅转化的种子可以长成植物。备选地，筛选所述转化植物的选择标记(如上文所述的选择标记)的存在。

在DNA转移和再生后，推定转化的植物也可以例如使用DNA印迹分析就目的基因的存在、拷贝数和/或基因组构造进行评价。备选地或额外地，可以使用RNA印迹分析和/或蛋白质印迹分析监测新导入的DNA的表达水平，这两项技术均是本领域普通技术人员熟知的。

产生的转化植物可以通过多种方法繁殖，如通过克隆繁殖法或经典育种技术。例如，第一世代(或T1)转化植物可以进行自交并且选择纯合的第二世代(或T2)转化体，并且T2植物随后可以通过经典育种技术进一步繁殖。产生的转化生物可以采取多种形式。例如，它们可以是转化细胞和非转化细胞的嵌合体；克隆性转化体(例如，被转化以含有表达盒的全部细胞)；转化组织和非转化组织的移植体(例如在植物中，与未转化接穗嫁接的转化根状茎)。

本发明明确地扩展至由本文中所述任意方法产生的任意植物细胞或植物，并扩展至全部植物部分及其繁殖体。本发明进一步扩展以包括已经由前述任意方法产生的原代转化或转染细胞、组织、器官或完整植物的子代，唯一要求是子代展示出与如本发明方法中的亲本相同的基因型和/或表型特征。

本发明也包括这样的宿主细胞，其含有与植物组成型启动子有效连接的编码多肽的分离核酸序列，所述多肽选自分别如本文以上所定义的GRF多肽、RAA1样多肽、SYR多肽、ARKL多肽和YTP多肽组成的组。优选的本发明宿主细胞是植物细胞。相对于本发明方法中所用核酸序列或载体、表达盒或构建体或载体的宿主植物原则上有利地是能够合成在本发明方法中使用的多肽的全部植物。

本发明的方法有利地适用于任意植物。在本发明中特别有用的植物包括属于植物界超家族、尤其属于单子叶和双子叶植物的全部植物，包括饲用或饲料豆科植物、观赏植物、粮食作物、树或灌木。根据本发明的优选实施方案，植物是作物植物。作物植物的例子包括大豆、向日葵、卡诺拉油菜、苜蓿、油菜籽、棉花、番茄、马铃薯和烟草。更优选地，该植物是单子叶植物。单子叶植物的例子包括甘蔗。更优选地，该植物是禾谷植物。谷物植物的例子包括稻、玉米、小麦、大麦、谷子、黑麦、小黑麦、高粱、二粒小麦、斯卑尔脱小麦、黑麦属(secale)、单粒小麦、埃塞俄比亚画眉草(teff)、蜀黍(milo)和燕麦。

本发明也扩展至植物的可收获部分，如但不限于种子、叶、果实、花、茎、根、根状茎、块茎和球茎，其中所述的植物包含与植物组成型启动子有效连接的编码多肽的分离核酸序列，其中所述多肽选自分别(如本文以上定义的)GRF多肽、RAA1样多肽、SYR多肽、ARKL多肽和YTP多肽组成的组。本发明进一步涉及衍生自、优选直接衍生自此种植物的可收获部分的产品，如干燥颗粒或粉末、油、脂肪和脂肪酸、淀粉或蛋白质。

根据本发明的优选特征，受调节的表达是增加的表达。在本领域中充分报道了用于增加核酸或基因或基因产物表达的方法并且在定义部分中提供了例子。

如上文所述，用于增加编码分别选自由GRF多肽、RAA1样多肽、SYR多肽、ARKL多肽和YTP多肽组成的组中多肽的核酸序列表达的优选方法是在植物中导入并表达编码分别选自由GRF多肽、RAA1样多肽、SYR多肽、ARKL多肽和YTP多肽组成的组中多肽的核酸序列；然而，也可以使用包括但不限于T-DNA活化标签法、TILLING、同源重组在内的其他熟知技术实现实施本方法的效果，即提高产量相关性状。在定义部分中提供了对这些技术的描述。

本发明也在一个实施方案中包括编码如文中所述GRF多肽的核酸序列和这些GRF多肽在正常生长条件下、在非生物胁迫生长条件(优选地在渗透胁迫生长条件)下、和在养分可利用性降低的条件下、优选地在氮可利用性降低的生长条件下提高植物中任意前述产量相关性状的用途。

本发明也在一个实施方案中包括编码如本文中所述RAA1样多肽的核酸的用途，和这些RAA1样多肽的用途，用于增强植物中任意的前述产量相关性状。

本发明也在一个实施方案中包括编码如本文中所述SYR多肽的核酸的用途，和这些SYR多肽的用途，用于增强非生物胁迫条件下生长的植物中任意的前述产量相关性状。

本发明也在一个实施方案中包括编码如本文中所述ARKL多肽的核酸的用途，和这些ARKL多肽的用途，用于增强植物中任意的前述产量相关性状。

本发明也在一个实施方案中包括编码如本文中所述YTP多肽的核酸的用途，和这些YTP多肽的用途，用于增强植物中任意的前述产量相关性状。

编码分别选自由本文中所述GRF多肽、RAA1样多肽、SYR多肽、ARKL多肽和YTP多肽组成的组中多肽的核酸序列或本发明的多肽本身可以用于其中鉴定到下述DNA标记的育种程序中，其中所述的DNA标记可能遗传地与编码GRF多肽的基因连锁。所述基因/核酸序列或GRF多肽、RAA1样多肽、SYR多肽、ARKL多肽和YTP多肽自身可以用来定义分子标记。这种DNA或蛋白质标记随后可以在育种程序中用来在本发明的方法中选择具有提高的如上文所定义产量相关性状的植物。

编码分别选自由GRF多肽、RAA1样多肽、SYR多肽、ARKL多肽和YTP多肽组成的组中多肽的基因/核酸序列的等位变体也可以用于标记辅助的育种程序中。此类育种程序有时需要使用例如EMS诱变法通过对植物进行诱变处理而导入等位变异；备选地，所述程序可以从收集并非故意造成的所谓“天然”来源的等位变体开始。随后进行等位变体的鉴定，例如通过PCR法。此后是步骤：选择所讨论的和导致产量相关性状提高的序列的优异等位变体。一般通过监测含有所讨论序列的不同等位变体的植物的生长性能实施选择。可以在温室中或在田间监测生长性能。其他任选步骤包括将其中鉴定到优异等位变体的植物与另一种植物杂交。这可能用来例如产生感兴趣的表型特征的组合。

编码分别选自由GRF多肽、RAA1样多肽、SYR多肽、ARKL多肽和YTP多肽组成的组中多肽的核酸序列也可以作为探针用于遗传地或物理地绘制所述探针形成其部分的基因并且用作与这些基因连锁的性状的标记。此类信息可以用于植物育种中，以开发具有所希望表型的品系。编码分别选自由GRF多肽、RAA1样多肽、SYR多肽、ARKL多肽和YTP多肽组成的组中多肽的核酸序列的此种用途仅需要至少15个核苷酸长度的核酸序列。编码分别选自由GRF多肽、RAA1样多肽、SYR多肽、ARKL多肽和YTP多肽组成的组中多肽的核酸序列可以用作限制性片段长度多态性(RFLP)标记。限制性消化的植物基因组DNA的DNA印迹物(Sambrook J，Fritsch EF和Maniatis T(1989)Molecular Cloning，ALaboratory Manual)可以用编码分别选自由GRF多肽、RAA1样多肽、SYR多肽、ARKL多肽和YTP多肽组成的组中多肽的核酸序列探测。所得的结合模式随后可以使用计算机程序如MapMaker(Lander等人(1987)Genomics 1：174-181)开展遗传分析以构建遗传图。此外，所述核酸序列可以用来探测含有一组个体的限制性核酸内切酶处理的基因组DNA的DNA印迹物，其中所述的一组个体代表具有定义的遗传杂交的亲本和子代。DNA多态性的分离是明显的并用来计算编码GRF多肽的核酸序列在先前使用这个群体获得的遗传图中的位置(Botstein等人(1980)Am.J.Hum.Genet.32：314-331)。

在Bernatzky和Tanksley(1986)Plant Mol.Biol.Reporter 4：37-41中描述了植物基因来源的探针的产生及其在遗传作图中的用途。许多出版物描述了使用上文概述的方法学或其变例对特定cDNA克隆的遗传作图。例如，F2互交群、回交群、随机交配群、邻近纯合系和其他个体群体可以用于作图。此类方法学是本领域技术人员熟知的。

所述核酸序列探针也可以用于物理作图(即序列在物理图上的排列；见Hoheisel等在：Non-mammalian Genomic Analyasis：A Practical Guide，Academic press 1996，第319-346页及其中引用的参考文献)。

在另一个实施方案中，所述核酸序列探针可以在直接荧光原位杂交(FISH)作图法(Trask(1991)Trends Genet.7：149-154)中使用。尽管当前的FISH作图法支持使用大的克隆(几个kb至几百个kb；见Laan等人(1995)Genome Res.5：13-20)，然而灵敏度的改善可以允许使用更短探针进行FISH作图。

用于遗传作图及物理作图的多种基于核酸序列扩增的方法可以使用所述核酸序列而实施。方法例子包括等位基因特异性扩增法(Kazazian(1989)J.Lab.Clin.Med 11：95-96)、PCR扩增片段的多态性(CAPS；Sheffield等人(1993)Genomics 16：325-332)、等位基因特异性连接(Landegren等人(1988)Science 241：1077-1080)、核苷酸延伸反应(Sokolov(1990)NucleicAcid Res.18：3671)、放射杂交作图(Walter等人(1997)Nat.Genet.7：22-28)和Happy作图法(Dear和Cook(1989)Nucleic Acid Res.17：6795-6807)。对于这些方法，使用一种核酸序列的序列来设计并产生在扩增反应或在引物延伸反应中使用的引物对。此类引物的设计是本领域技术人员熟知的。在使用基于PCR遗传作图的方法中，可能需要在对应于当前核酸序列的区域中鉴定作图交叉的亲本之间的DNA序列差异。然而，这对作图法而言通常不是必需的。

如前文所述，本发明方法在一个实施方案中产生了具有提高的产量相关性状的植物。这些性状也可以与经济上有利的其他性状组合，如其他的产量提高性状、非生物胁迫和生物胁迫耐受性、除草剂、杀虫剂耐受性、调节多种构造性特征和/或生物化学特征和/或生理学特征的性状。

如前文所述，本发明方法在一个实施方案中产生了具有增强的产量相关性状的植物。这些性状也可以与经济上有利的其他性状组合，如其他的产量增强性状、针对其他非生物胁迫和生物胁迫的耐受性、调节多种构造性特征和/或生物化学特征和/或生理学特征的性状。

用于转基因植物中基因堆叠的方法是本领域熟知的(见例如，Halpin(2005)Plant Biotech J(3)：141-155综述)。基因堆叠可以通过反复步骤进行，其中两种或多种转基因可以通过含有一种转基因的植物与携带其他转基因的个体杂交或备选地通过用新基因再转化(或超转化)含有一种转基因的植物依次导入植物。所述迭代方法的一个限制是转基因是不连锁的并且将位于植物基因组中不同的随机基因座处。结果是两个基因座可能在后续世代中分离，这影响了育种程序。

备选地，基因堆叠可以借助更快并且可以用于转化技术的所有范围的共转化法实现。例如使用农杆菌转化法时，(至少两种)转基因可以以许多构象(conformation)存在：

(i)将编码序列融合以在翻译时形成单一多肽并且处在单一启动子的控制下；

(ii)将编码序列依次地置于单一启动子下游，由影响mRNA合成(内部核糖体进入位点IRES、2A打滑信号(2A stuttering signal)等)或多肽合成(由蛋白酶底物位点等隔开的多聚蛋白等)的核酸信号隔开；

(iii)编码序列独立受各自的启动子驱动，并且所述启动子-编码序列组合位于相同的T-DNA内部；

(iv)编码序列独立受各自的启动子驱动，并且所述启动子-编码序列组合位于相同质粒的不同T-DNA中；

(v)编码序列独立受各自的启动子驱动，并且所述启动子-编码序列组合位于寄居在相同或各自的农杆菌菌株中的不同质粒的不同T-DNA中。

在另一个实施方案中，本发明提供了用于相对于对照植物而言提高植物中产量相关性状的方法，包括增加植物中编码GRF多肽的核酸序列表达和调节相同植物中编码第二种多肽的核酸序列表达。

在一个实施方案中，本发明涉及如下概括的主题物：

1.用于相对于对照植物提高植物中产量相关性状的方法，包括增加植物中编码生长调节因子(GRF)多肽的核酸序列表达，和任选地选择具有提高的产量相关性状的植物，其中所述GRF多肽包含(i)与如SEQ ID NO：115所代表的QLQ结构域具有至少50％、55％、60％、65％、70％、75％、80％、85％、90％、95％、98％、99％或更多氨基酸序列同一性的结构域；和(ii)与如SEQ ID NO：116所代表的WRC结构域具有至少50％、55％、60％、65％、70％、75％、80％、85％、90％、95％、98％、99％或更多氨基酸序列同一性的结构域。

2.根据项1的方法，其中所述的GRF多肽包含：(i)具有InterPro登录号IPR014978(PFAM登录号PF08880)的QLQ结构域；(ii)具有InterPro登录号IPR014977(PFAM登录号PF08879)的WRC结构域；和(iii)包含在保守间隔(CX₉CX₁₀CX₂H)中的3个Cys和一个His残基的转录效应子(ET)结构域。

3.根据项1或2的方法，其中所述的GRF多肽以增加的优选顺序与如SEQ ID NO：2所代表的GRF多肽或与本文表A中给出的任一多肽序列具有至少50％、55％、60％、65％、70％、75％、80％、85％、90％、95％、98％、99％或更多氨基酸序列同一性。

4.根据任一前述项的方法，其中所述的编码GRF多肽的核酸序列由表A中给出的任一核酸序列SEQ ID NO或其部分或者由能够与表A中给出的任一核酸序列SEQ ID NO杂交的序列代表。

5.根据任一前述项的方法，其中所述的核酸序列编码表A中给出的任一多肽序列SEQ ID NO的直向同源物或旁系同源物。

6.根据任一前述项的方法，其中所述增加的表达由以下任意一种或多种方法实现：T-DNA激活标签法、TILLING或同源重组。

7.根据任一前述项的方法，其中所述增加的表达通过在植物中导入并表达编码GRF多肽的核酸序列实现。

8.根据任一前述项的方法，其中所述提高的产量相关性状是以下一项或多项：(i)提高的早期生长势；(ii)提高的地上部分生物量；(iii)提高的每株植物总种子产量；(iv)提高的种子充实率；(v)提高的收获指数；或(vii)提高的千粒核重(TKW)。

9.根据任一前述项的方法，其中所述的核酸序列有效地连接至组成型启动子、优选地有效连接至植物组成型启动子，更优选地有效连接至GOS2启动子、最优选地有效连接至如SEQ ID NO：117所代表的来自稻的GOS2启动子。

10.根据任一前述项的方法，其中所述的编码GRF多肽的核酸序列是植物来源的，优选地来自双子叶植物，进一步优选地来自十字花科，最优选地来自拟南芥。

11.由根据任一前述项的方法可获得的植物、其部分(包括种子)或植物细胞，其中所述的植物、其部分或细胞包含有效连接至植物组成型启动子的编码GRF多肽的分离的核酸转基因。

12.构建体，其包含：

1.编码如项1至5任一项中定义的GRF多肽的核酸序列；

3.转录终止序列。

13.根据项12的构建体，其中所述的调控序列是植物组成型启动子，优选地是GOS2启动子，更优选地是如SEQ ID NO：117所代表的GOS2启动子。

14.根据项12或13的构建体在用于制备植物的方法中的用途，所述植物相对于对照植物具有提高的产量相关性状，其中所述提高的产量相关性状是以下一项或多项：(i)提高的早期生长势；(ii)提高的地上部分生物量；(iii)提高的每株植物总种子产量；(iv)提高的种子充实率；(v)提高的收获指数；或(vii)提高的千粒核重(TKW)。

15.用根据项12或13的构建体转化的植物、植物部分或植物细胞。

16.用于产生相对于对照植物具有提高的产量相关性状的转基因植物的方法，包括：

(i)在植物、植物部分或植物细胞中导入并表达在植物组成型启动子控制下的编码如项1至5任一项中定义的GRF多肽的核酸序列；和

17.转基因植物，其相对于对照植物具有因编码如项1至5任一项中所定义GRF多肽的核酸序列表达增加引起的提高的产量相关性状，所述核酸序列有效连接至植物组成型启动子，或者从所述转基因植物衍生的转基因植物细胞或转基因植物部分。

18.根据项11、15或17的转基因植物，其中所述的植物是作物植物或单子叶植物或谷物植物，如稻、玉米、小麦、大麦、谷子、黑麦、小黑麦、高粱和燕麦，或从所述转基因植物衍生的转基因植物细胞。

19.包含分离的核酸序列的可收获部分，所述分离的核酸序列编码根据项18的植物的GRF多肽，其中所述的可收获部分优选地是种子。

20.产物，从根据项18的植物和/或从根据项19的植物的可收获部分衍生。

21.编码如项1至5任一项中所定义GRF多肽的核酸序列在提高产量相关性状中的用途，其中所述的产量相关性状包含以下一项或多项：(i)提高的早期生长势；(ii)提高的地上部分生物量；(iii)提高的每株植物总种子产量；(iv)提高的种子充实率；(v)提高的收获指数；或(vii)提高的千粒核重(TKW)。

在一个实施方案中，本发明涉及如下概括的主题物：

22.用于相对于对照植物增强植物中产量相关性状的方法，包括调节植物中编码RAA1样多肽的核酸表达，其中所述的RAA1样多肽包含两个或多个以下基序：

(i)基序1：GVW(V/L)F(SEQ ID NO：162)，

(ii)基序2：LGW(E/S)RY(Y/F)(SEQ ID NO：163)，

(iii)基序3：(D/H)L(L/I)S(I/V/L)P(R/K/A)(S/D)F(SEQ ID NO：164)，

(iv)基序4：(H/Y)(F/M)YD(V/I)VVK(N/T)(R/P)(SEQ ID NO：165)。

23.根据项22的方法，其中所述的RAA1样多肽还具有10与21KDa之间的分子量和高于8.5的pI。

24.根据项22或23的方法，其中所述受调节的表达通过在植物中导入并表达编码RAA1样多肽的核酸实现。

25.根据任一前述项的方法，其中所述的编码RAA1样多肽的核酸编码表A中所列的任一种蛋白质或是这种核酸的一部分或是能够与这种核酸杂交的核酸。

26.根据任一前述项的方法，其中所述的核酸序列编码表A中给出的任意蛋白质的直向同源物或旁系同源物。

27.根据任一前述项的方法，其中所述的增强的产量相关性状包括相对于对照植物提高的产量、优选提高的生物量和/或提高的种子产量。

28.根据项22至27任一项的方法，其中所述增强的产量相关性状在非胁迫条件下获得。

29.根据项22至27任一项的方法，其中所述的增强的产量相关性状在缺氮条件下获得。

30.根据项24至29任一项的方法，其中所述的核酸有效连接至组成型启动子。

31.根据项30的方法，其中所述的组成型启动子是GOS2启动子或HMGP启动子，优选地是来自稻的GOS2启动子或HMGP启动子。

32.根据任一前述项的方法，其中所述的编码RAA1多肽的核酸是植物来源的，优选地来自双子叶植物，进一步优选地来自禾本科(Poaceae)，更优选地来自稻属(Oryza)，最优选地来自稻(Oryza sativa)。

33.由根据任一前述项的方法可获得的植物或其部分，包括种子，其中所述的植物或其部分包含编码RAA1样多肽的重组核酸。

34.构建体，其包含：

(i)编码RAA1样多肽的核酸；

(ii)能够驱动(a)的核酸序列表达的一个或多个调控序列；和任选地

(iii)转录终止序列。

35.根据项34的构建体，其中所述调控序列之一是组成型启动子。

36.根据项35的构建体，其中所述的组成型启动子是GOS2启动子或HMGP启动子，优选地是来自稻的GOS2启动子或HMGP启动子。

37.根据项34至36任一项的构建体在用于产生植物的方法中的用途，所述植物相对于对照植物具有提高的产量，特别地提高的生物量和/或提高的种子产量。

38.用根据项34至36任意项的构建体转化的植物、植物部分或植物细胞。

39.用于产生转基因植物的方法，所述的转基因植物相对于对照植物具有提高的产量、特别地提高的生物量和/或提高的种子产量，该方法包括：

(i)在植物中导入并表达编码RAA1样多肽的核酸；和

(ii)在促进植物生长和发育的条件下培育植物细胞。

40.转基因植物，其相对于对照植物具有因编码RAA1样多肽的核酸的受调节表达引起的提高产量、特别地提高的生物量和/或提高的种子产量，或从所述转基因植物衍生的转基因植物细胞。

41.根据项33、38或39的转基因植物，或从其中衍生的转基因植物细胞，其中所述的植物是作物植物或单子叶植物或禾谷植物，如稻、玉米、小麦、大麦、谷子、黑麦、小黑麦、高粱和燕麦。

42.根据项41的植物的可收获部分，其中所述的可收获部分优选地是根生物量和/或种子。

43.产物，从根据项41的植物和/或从根据项42的植物的可收获部分衍生。

44.编码RAA1样多肽的核酸在植物中相对于对照植物提高产量、特别地提高种子产量和/或根生物量中的用途。

在一个实施方案中，本发明涉及如下概括的主题物：

45.用于相对于对照植物提高植物中非生物胁迫抗性的方法，包括调节植物中编码SYR多肽的核酸表达，所述SYR多肽包含前有保守三肽基序5(SEQ ID NO：173、174、175或176之一)并后接保守基序6(SEQ ID NO：177)的亮氨酸丰富结构域，其中所述提高的非生物胁迫抗性是相对于对照植物而言提高的养分摄取效率和/或提高的干旱胁迫耐受性。

46.根据项45的方法，其中所述的SYR多肽以增加的优选顺序与SEQ ID NO：169所代表的SYR多肽具有至少27％、30％、35％、40％、45％、50％、55％、60％、65％、70％、75％、80％、85％、90％、95％或更多的序列同一性。

47.根据项45或46的方法，其中所述的编码SYR多肽的核酸由表A中给出的任一核酸SEQ ID NO或其部分或者由能够与表A中给出的任一核酸SEQ ID NO杂交的序列代表。

48.根据项45至47任一项的方法，其中所述的核酸序列编码表A中给出的任意SEQ ID NO的直向同源物或旁系同源物。

49.根据任一前述项的方法，其中所述的SYR蛋白还包含保守基序7(SEQ ID NO：178)。

50.根据任一前述项的方法，其中所述的养分摄取效率导致提高的种子产量和/或提高的生物量。

51.项50的方法，其中所述提高的种子产量至少包含提高的总种子重量、千粒核重和/或提高的充实种子数。

52.项50的方法，其中所述提高的生物量是提高的苗生物量和/或提高的根生物量。

53.根据任一前述项的方法，其中所述提高的养分摄取效率在轻度干旱条件下出现。

54.根据任一前述项的方法，其中所述提高的干旱胁迫耐受性导致提高的种子产量。

55.项54的方法，其中所述提高的种子产量至少包含提高的总种子重量、充实率和/或收获指数。

56.根据任一前述项的方法，其中所述受调节的表达通过在植物中导入并表达编码SYR多肽的核酸实现。

57.根据项56的方法，其中所述核酸有效地连接至组成型启动子，优选地有效连接至GOS2启动子。

58.根据任一前述项的方法，其中所述的编码SYR多肽的核酸是植物来源的，优选地来自单子叶植物，进一步优选地来自禾本科，更优选地来自稻属，最优选地来自稻。

59.构建体在用于制备具有提高的非生物胁迫抗性的植物的方法中的用途，所述构建体包含

(a)编码如项45至49任一项中定义的SYR多肽的核酸；

(b)能够驱动(a)的核酸序列表达的一个或多个调控序列；和任选地

(c)转录终止序列，

并且其中所述调控序列之一是组成型启动子，优选地是GOS2启动子，并且其中所述提高的非生物胁迫抗性是相对于对照植物提高的养分摄取效率和/或提高的干旱胁迫耐受性。

60.编码SYR多肽的核酸在用于相对于对照植物提高植物中非生物胁迫抗性的方法中的用途，其中所述提高的非生物胁迫抗性是相对于对照植物而言提高的养分摄取效率和/或提高的干旱胁迫耐受性。

61.根据项60的用途，其中所述提高的养分摄取效率导致提高的种子产量和/或提高的生物量。

62.根据项60的用途，其中所述提高的干旱胁迫耐受性导致提高的种子产量。

在一个实施方案中，本发明涉及如下概括的主题物：

63.用于相对于对照植物增强植物中产量相关性状的方法，包括调节植物中编码ARKL多肽的核酸表达。

64.根据项63的方法，其中所述的ARKL多肽包含一个或多个以下结构域：

(i)如SEQ ID NO：400所代表的ZfC3H2C3结构域或以增加的优选顺序与如SEQ ID NO：95至SEQ ID NO.351所代表的一个或多个ZfC3H2C3结构域具有至少50％、55％、60％、65％、70％、75％、80％、85％、90％、95％或更多序列同一性的结构域；和

(II)以增加的优选顺序与如SEQ ID NO：352至SEQ ID NO.398所代表的一个或多个PfamB2828结构域具有至少50％、55％、60％、65％、70％、75％、80％、85％、90％、95％或更多序列同一性的DAR1结构域。

65.根据项63和64的方法，其中所述的ARKL多肽包含一个或多个以下结构：

(i)如SEQ ID NO：401所代表的ZfC3H2C3结构域；

(ii)如SEQ ID NO：399所代表的基序8。

66.根据项63至65的方法，其中所述受调节的表达通过在植物中导入并表达编码ARKL多肽的核酸实施。

67.根据任一前述项的方法，其中所述的编码ARKL多肽的核酸编码表A中所列的任一种蛋白质或是这种核酸的一部分或是能够与这种核酸杂交的核酸。

68.根据任一前述项的方法，其中所述的核酸序列编码表A中给出的任意蛋白质的直向同源物或旁系同源物。

69.根据任一前述项的方法，其中所述的增强的产量相关性状包括相对于对照植物提高的产量、优选提高的种子产量。

70.根据前述项的方法，其中所述增强的产量相关性状在非胁迫条件下获得。

71.根据前述项的方法，其中所述增强的产量相关性状在干旱胁迫条件下获得。

72.根据任一前述项的方法，其中所述的核酸有效连接至组成型启动子，优选地有效连接至GOS2启动子，最优选地有效连接至来自稻的GOS2启动子。

73.根据任一前述项的方法，其中所述的编码ARKL多肽的核酸是植物来源的，优选地来自单子叶植物，进一步优选地来自禾本科，更优选地来自稻属，最优选地来自稻。

74.通过根据任意前述项的方法可获得的植物或其部分，包括种子，其中所述的植物或其部分包含编码ARKL多肽的重组核酸。

75.构建体，其包含：

(i)编码如项63至65中定义的ARKL多肽的核酸；

(iii)转录终止序列。

76.根据项75的构建体，其中所述的控制序列之一是组成型启动子，优选地是GOS2启动子，最优选地是来自稻的GOS2启动子。

77.根据项75或76的构建体在用于制备植物的方法中的用途，所述植物相对于对照植物具有增强的产量相关性状，优选提高的产量，更优选提高的种子产量。

78.用根据项75或76的构建体转化的植物、植物部分或植物细胞。

79.用于产生转基因植物的方法，所述的转基因植物相对于对照植物具有提高的产量、特别地提高的种子产量，该方法包括：

(i)在植物中导入并表达编码如项63至65中定义的ARKL多肽的核酸；和

(ii)在促进植物生长和发育的条件下培育植物细胞。

80.转基因植物，其因编码如项63至65中所定义ARKL多肽的核酸的表达增加而相对于对照植物具有提高的产量、特别地提高的种子产量，或从所述转基因植物衍生的转基因植物细胞。

81.根据项74、78或80的转基因植物或从其中衍生的转基因植物细胞，其中所述的植物是作物植物或单子叶植物或禾谷植物，如稻、玉米、小麦、大麦、谷子、黑麦、小黑麦、高粱和燕麦。

82.根据项81的植物的可收获部分，其中所述的可收获部分优选地是苗生物量和/或种子。

83.产物，从根据项81的植物和/或从根据项82的植物的可收获部分衍生。

84.编码ARKL多肽的核酸在相对于对照植物增强产量相关性状、优选提高的产量、更优选提高的种子产量中的用途。

在一个实施方案中，本发明涉及如下概括的主题物：

85.用于相对于对照植物改善植物中产量相关性状的方法，包括调节植物中编码YTP多肽的核酸表达，所述YTP多肽包含：

(i)至少一个跨膜结构域和

(ii)DUF221结构域的至少一部分。

86.根据项85的方法，其中所述的部分以增加的优选顺序与SEQ ID

NO：518至SEQ ID NO：544所代表的任一结构域具有至少50％、55％、60％、65％、70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性。

87.根据项85或86的方法，其中所述的编码YTP多肽的核酸编码以增加的优选顺序与表A的任一多肽具有至少50％、55％、60％、65％、70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％氨基酸序列同一性的多肽。

88.根据任一前述项的方法，其中所述的YTP多肽还包含基序9(SEQID NO：545)。

89.根据任一前述项的方法，其中所述受调节的表达通过在植物中导入并表达编码YTP多肽的核酸实现。

90.根据任一前述项的方法，其中所述的编码YTP多肽的核酸编码表A中所列的任一种蛋白质或是这种核酸的一部分或是能够与这种核酸杂交的核酸。

91.根据任一前述项的方法，其中所述核酸序列编码表A中给出的任意蛋白质的直向同源物或旁系同源物或是这种核酸的一部分或是能够与这种核酸杂交的核酸。

92.根据任一前述项的方法，其中所述的增强的产量相关性状包括相对于对照植物提高的产量、优选提高的种子产量。

93.根据项85至92任一项的方法，其中所述增强的产量相关性状在非胁迫条件下获得。

94.根据项89至93任一项的方法，其中所述的核酸有效连接至组成型启动子，优选地有效连接至GOS2启动子，最优选地有效连接至来自稻的GOS2启动子。

95.根据任一前述项的方法，其中所述的编码YTP多肽的核酸是植物来源的，优选地来自双子叶植物，进一步优选地来自禾本科，更优选地来自稻属，最优选地来自稻。

96.通过根据任意前述项的方法可获得的植物或其部分，包括种子，其中所述的植物或其部分包含编码YTP多肽的重组核酸。

97.构建体，其包含：

(i)编码如项85至88中定义的YTP多肽的核酸；

(iii)转录终止序列。

98.根据项97的构建体，其中所述的控制序列之一是组成型启动子，优选地是GOS2启动子，最优选地是来自稻的GOS2启动子。

99.根据项97或98的构建体在用于制备植物的方法中的用途，所述植物相对于对照植物具有提高的产量，特别地提高的种子产量。

100.用根据项97或98的构建体转化的植物、植物部分或植物细胞。

101.用于产生转基因植物的方法，所述的转基因植物相对于对照植物具有提高的产量、特别地提高的种子产量，该方法包括：

(i)在植物中导入并表达编码如项85至88中定义的YTP多肽的核酸；和

(ii)在促进植物生长和发育的条件下培育植物细胞。

102.转基因植物，其因编码如项85至88中所定义YTP多肽的核酸的受调节表达而相对于对照植物具有提高的产量、特别地提高的种子产量，或从所述转基因植物衍生的转基因植物细胞。

103.根据项96、100或102的转基因植物，或从其中衍生的转基因植物细胞，其中所述的植物是作物植物或单子叶植物或禾谷植物，如稻、玉米、小麦、大麦、谷子、黑麦、小黑麦、高粱和燕麦。

104.根据项103的植物的可收获部分，其中所述的可收获部分优选地是苗生物量和/或种子。

105.产物，从根据项103的植物和/或从根据项104的植物的可收获部分衍生。

106.编码YTP多肽的核酸在相对于对照植物提高植物中产量、特别地在提高种子产量和/或苗生物量中的用途。

附图简述

本发明现在将参考以下图进行描述，其中：

图1代表如SEQ ID NO：2所代表的GRF多肽的卡通图，其中所述GRF多肽包含以下特征：(i)具有InterPro登录号IPR014978(PFAM登录号PF08880)的QLQ结构域；(ii)具有InterPro登录号IPR014977(PFAM登录号PF08879)的WRC结构域；和(iii)以保守间隔(CX₉CX₁₀CX₂H)包含3个Cys和一个His残基的位于WRC结构域内部的转录效应子(ET)结构域。

图2显示来自表A的GRF多肽的(对于SEQ ID NO：2，如SEQ ID NO：115所代表的)QLQ结构域的(来自Invitrogen公司Vector NTI 10.3的)AlignX多重序列比对结果。保守QLQ氨基酸残基位于多重比对结果的顶部。(用黑色框框定的)两个另外的非常保守残基是E(Glu)和P(Pro)。

图3显示来自表A的GRF多肽的(对于SEQ ID NO：2，如SEQ ID NO：116所代表的)WRC结构域的(来自Invitrogen公司Vector NTI 10.3的)AlignX多重序列比对结果。在共有序列中以粗体标出保守的WRC氨基酸残基。在整个比对结果范围内用方框垂直地标出并在比对结果的底部鉴定到命名为转录效应子(ET)结构域的保守间隔(CX₉CX₁₀CX₂H)中的3个Cys和1个His残基。用双下划线标出WRC结构域中所包含的推定的核定位信号(NLS)。

图4显示用于稻中增加在来自稻的GOS2启动子(pGOS2)控制下编码GRF多肽的核酸序列表达的双元载体。

图5详述了在实施本发明方法中有用的序列的例子。

图6代表具有以粗体下划线标出的保守标签序列的稻RAA1样蛋白(SEQ ID NO：121)的序列。

图7显示多种RAA1样蛋白的多重比对结果。NP_001046787对应于Q0E1D7，NP_001052368对应于Q0JEF5，AAR97604对应于Q6RIBO，NP_001042631对应于Q9LGE3，NP_001045304对应于Q8LR63，NP_974763对应于Q9LXB5，NP_197868对应于O23624，NP_194866对应于Q5Q0B3，NP_001060595对应于Q8H475。

图8显示RAA1样多肽的进化系统树(Ge等人，2004)。OsRAA1对应于SEQ ID NO：121。

图9描述用于稻中增加在稻GOS2启动子(pGOS2)控制下编码RAA1样的核酸表达的双元载体。

图10详述在实施本发明方法中有用的诸序列的例子。

图11给出在SEQ ID NO：169中存在的保守基序的概略图。亮氨酸丰富结构域用下划线标出，保守基序5、6和7以粗体表示并且斜体字序列代表具有推定的蛋白激酶C磷酸化位点的推定的N-糖基化位点。

图12显示多种SYR蛋白的多重比对结果。星号表示相同的氨基酸残基，冒号代表高度保守的替换并且点号代表保守性较小的替换。采用来自图11的信息，可以轻易地在其他SYR蛋白中鉴定SEQ ID NO：171中的多个结构域和保守基序。

图13显示用于在稻中转化并表达在稻GOS2启动子控制下的稻SYR核酸的双元载体pGOS2::SYR。

图14详述在实施本发明方法中有用或在分离此类序列中有用的诸序列的例子。序列可以从公共EST汇编库以较低质量的测序结果产生。因而，可以预期少数核酸替换。5’和3’UTR也可以用于实施本发明的方法。SEQID NO：193代表ARGOS蛋白序列(GenBank登录号AY305869)。

图15代表SEQ ID NO：213的氨基酸序列。保守的结构域pfamB2828和ZfC3H2C3(pfam00097)分别以粗体和加下划线的字符醒目标出。高度保守的基序8以下划点线表示。将ARKL多肽中最高度保守的氨基酸残基框定。显示了保守的氨基金属配体位置(编号)和与锌(Zn²⁺)配位的氨基酸对。

图16代表所选ARKL多肽的多重比对结果。标出了共有序列中高度保守的氨基酸残基。如此图中所示，ARKL多肽羧基端的序列比氨基端序列更为高度保守。

图17显示ARKL多肽的进化系统树，该进化系统树基于如SEQ ID NO：306-314、316-318、322、323、402所代表的ARKL多肽中包含的RING指(pfam00097)结构域的比对结果(SEQ ID NO：402包含小鼠(Musmusculus)Akadia多肽中存在的pfam00097(RING锌指)结构域并且SEQID NO：403代表如小鼠Goliath多肽中存在的pfam00097结构域。所用的缩写：Os：稻(Orysa)；Hv：大麦(Horvu)；Gm：大豆(Glyma)；Zm：玉米(Zeama)；Musmu：小鼠。

图18描述用于增加在稻GOS2启动子(pGOS2)控制下如SEQ ID NO：212所代表的OS_ARKL1核酸表达的双元载体。

图19详述在实施本发明方法中有用的诸序列的例子。

图20代表YTP1的序列(SEQ ID NO：409)。将跨膜结构域框出。具有124个氨基酸残基的DUF221结构域的一部分以粗体醒目标出。基序8以下划线标出。基序8中的不变残基以较大尺寸的字母标出。第一和第三环预测位于膜的外部；第二环位于内部。

图21显示所选YTP多肽的进化系统树。

图22代表所选YTP多肽的多重比对结果。给出了如SEQ ID NO：544所代表的共有序列。标出了该共有序列中的保守氨基酸残基；空白代表低保守性的区域。

图23代表了用于稻中增加在稻GOS2启动子(pGOS2)控制下编码YTP1的核酸表达的双元载体。

图24详述在实施本发明方法中有用的诸序列的例子。

实施例

本发明现在参考如下实施例进行描述，所述实施例仅是示意性的。以下实施例不意图完全限定或限制本发明的范围。

DNA操作：除非另外说明，重组DNA技术根据(Sambrook(2001)Molecular Cloning：a laboratory manual，第3版Cold Spring HarborLaboratory Press，CSH，New York)或Ausubel等人(1994)，CurrentProtocols in Molecular Biology，Current Protocols第1卷和第2卷中描述的标准方案进行。用于植物分子研究工作的标准材料和方法在BIOS科学出版有限责任公司(BIOS Scientific Publications Ltd(英国))和Blackwell科学出版社(Blackwell Scientific Publications)(英国)出版的R.D.D.Croy的Plant Molecular Biology Labfax(1993)中描述。

实施例1：鉴定与本发明方法中所用核酸序列相关的序列

用数据库搜索工具如基本局部比对工具(BLAST)(Altschul等人(1990)J.Mol.Biol.215：403-410；和Altschul等人(1997)Nucleic Acids Res.25：3389-3402)，在国家生物技术信息中心(NCBI)的Entrez核苷酸数据库中维护的那些序列中鉴定到与本发明方法中所用核酸序列相关的(全长cDNA、EST或基因组)序列。使用该程序通过将核酸序列或多肽序列与序列数据库比较并且计算匹配的统计显著性来找到序列之间的局部相似性区域。由本发明核酸序列编码的多肽用于TBLASTN算法，采用默认设置和过滤程序以略去低复杂性序列启动。该分析的输出结果通过逐对比较进行检验，并根据概率评分(E-值)进行评级，其中所述的评分反映特定比对结果偶然发生的概率(E-值越低，命中的显著性越高)。除E-值外，比较也可以通过同一性百分数评分。同一性百分数指两个所比较的核酸(或多肽)序列之间特定长度范围内相同的核苷酸(或氨基酸)的数目。在一些情况下，可以调整默认参数以调节搜索的严格性。例如，可以提高E-值以显示严格性更低的匹配。以这种方式，可以鉴定到短的近乎完全的匹配。

表A提供了与本发明方法中所用核酸序列相关的核酸序列名单。

表A1：GRF多肽序列和编码性核酸序列的例子：

名称	来源生物	核酸SEQIDNO：	多肽SEQIDNO：	数据库登录号
名称	来源生物	核酸SEQIDNO：	多肽SEQIDNO：	数据库登录号	Arath_GRF_At3G13960.1	拟南芥	1	2	AT3G13960.1
Arath_GRF_At2G06200.1	拟南芥	3	4	At2G06200.1	Arath_GRF_At3G13960.1	拟南芥	1	2	AT3G13960.1
Arath_GRF_At2G06200.1	拟南芥	3	4	At2G06200.1	Arath_GRF_At2G22840.1	拟南芥	5	6	At2G22840.1
Arath_GRF_At2G36400.1	拟南芥	7	8	At2G36400.1	Arath_GRF_At2G22840.1	拟南芥	5	6	At2G22840.1
Arath_GRF_At2G36400.1	拟南芥	7	8	At2G36400.1	Arath_GRF_At2G45480.1	拟南芥	9	10	At2G45480.1
Arath_GRF_At3G52910.1	拟南芥	11	12	At3G52910.1	Arath_GRF_At2G45480.1	拟南芥	9	10	At2G45480.1
Arath_GRF_At3G52910.1	拟南芥	11	12	At3G52910.1	Arath_GRF_At4G24150.1	拟南芥	13	14	At4G24150.1
Arath_GRF_At4G37740.1	拟南芥	15	16	At4G37740.1	Arath_GRF_At4G24150.1	拟南芥	13	14	At4G24150.1
Arath_GRF_At4G37740.1	拟南芥	15	16	At4G37740.1	Arath_GRF_At5G53660.1	拟南芥	17	18	At5G53660.1
Aqufo_GRF	美丽耧斗菜(Aquilegiaformosa)x柔毛耧斗菜(Aquilegiapubescens)	19	20	DT756681.1DR946716.1	Arath_GRF_At5G53660.1	拟南芥	17	18	At5G53660.1
Aqufo_GRF	美丽耧斗菜(Aquilegiaformosa)x柔毛耧斗菜(Aquilegiapubescens)	19	20	DT756681.1DR946716.1	Brana_GRF	欧洲油菜	21	22	CN730217.1ES922527
Horvu_GRF	大麦	23	24	AK250947.1	Brana_GRF	欧洲油菜	21	22	CN730217.1ES922527
Horvu_GRF	大麦	23	24	AK250947.1	Lyces_GRF	番茄	25	26	BT013977.1

名称	来源生物	核酸SEQIDNO：	多肽SEQIDNO：	数据库登录号
名称	来源生物	核酸SEQIDNO：	多肽SEQIDNO：	数据库登录号	Medtr_GRF	蒺藜苜蓿(Medicagotruncatula)	27	28	AC144645.17
Medtr_GRF like	蒺藜苜蓿	29	30	AC174350.4	Medtr_GRF	蒺藜苜蓿(Medicagotruncatula)	27	28	AC144645.17
Medtr_GRF like	蒺藜苜蓿	29	30	AC174350.4	Orysa_GRF_Os02g47280.2	稻	31	32	Os02g47280.2
名称	来源生物	核酸SEQIDNO：	多肽SEQIDNO：	数据库登录号	Orysa_GRF_Os02g47280.2	稻	31	32	Os02g47280.2
名称	来源生物	核酸SEQIDNO：	多肽SEQIDNO：	数据库登录号	Orysa_GRF_Os02g53690.1	稻	33	34	Os02g53690.1
Orysa_GRF_Os03g51970.1	稻	35	36	Os03g51970.1	Orysa_GRF_Os02g53690.1	稻	33	34	Os02g53690.1
Orysa_GRF_Os03g51970.1	稻	35	36	Os03g51970.1	Orysa GRF_Os04g48510.1	稻	37	38	Os04g48510.1
Orysa_GRF_Os04g51190.1	稻	39	40	Os04g51190.1	Orysa GRF_Os04g48510.1	稻	37	38	Os04g48510.1
Orysa_GRF_Os04g51190.1	稻	39	40	Os04g51190.1	Orysa_GRF_Os06g02560.1	稻	41	42	Os06g02560.1
Orysa_GRF_Os11g35030.1	稻	43	44	Os11g35030.1	Orysa_GRF_Os06g02560.1	稻	41	42	Os06g02560.1
Orysa_GRF_Os11g35030.1	稻	43	44	Os11g35030.1	Orysa_GRF_Os12g29980.1	稻	45	46	Os12g29980.1
Oyrsa_GRF_Os03g47140.1	稻	47	48	Os03g47140.1	Orysa_GRF_Os12g29980.1	稻	45	46	Os12g29980.1
Oyrsa_GRF_Os03g47140.1	稻	47	48	Os03g47140.1	Orysa_GRF_gi_115447910_ref_NM_001054270.1	稻	49	50	NM_001054270.1
Orysa_GRF_gi_115460325_ref_NM_001060298.1	稻	51	52	NM_001060298.1	Orysa_GRF_gi_115447910_ref_NM_001054270.1	稻	49	50	NM_001054270.1
Orysa_GRF_gi_115460325_ref_NM_001060298.1	稻	51	52	NM_001060298.1	Orysa_GRF_gi_115471984_ref_NM_001066126.1	稻	53	54	NM_001066126.1

名称	来源生物	核酸SEQIDNO：	多肽SEQIDNO：	数据库登录号
名称	来源生物	核酸SEQIDNO：	多肽SEQIDNO：	数据库登录号	Poptr_GRF_lcl_scaff_XIV.39	美洲山杨(Populustremuloides)	55	56	lcl_scaff_XIV.39
Poptr_GRF_lcl_scaff_II.1070	美洲山杨	57	58	lcl_scaff_II.1070	Poptr_GRF_lcl_scaff_XIV.39	美洲山杨(Populustremuloides)	55	56	lcl_scaff_XIV.39
Poptr_GRF_lcl_scaff_II.1070	美洲山杨	57	58	lcl_scaff_II.1070	Poptr_GRF_lcl_scaff_I.1018	美洲山杨	59	60	lcl_scaff_I.1018
Poptr_GRF_lcl_scaff_28.10	美洲山杨	61	62	lcl_scaff_28.10	Poptr_GRF_lcl_scaff_I.1018	美洲山杨	59	60	lcl_scaff_I.1018
Poptr_GRF_lcl_scaff_28.10	美洲山杨	61	62	lcl_scaff_28.10	名称	来源生物	核酸SEQIDNO：	多肽SEQIDNO：	数据库登录号
Poptr_GRF_lcl_scaff_I.995	美洲山杨	63	64	lcl_scaff_I.995	名称	来源生物	核酸SEQIDNO：	多肽SEQIDNO：	数据库登录号
Poptr_GRF_lcl_scaff_I.995	美洲山杨	63	64	lcl_scaff_I.995	Poptr_GRF_lcl_scaff_III.741	美洲山杨	65	66	lcl_scaff_III.741
Poptr_GRF_lcl_scaff_VII.1274	美洲山杨	67	68	lcl_scaff_VII.1274	Poptr_GRF_lcl_scaff_III.741	美洲山杨	65	66	lcl_scaff_III.741
Poptr_GRF_lcl_scaff_VII.1274	美洲山杨	67	68	lcl_scaff_VII.1274	Poptr_GRF_lcl_scaff_XII.277	美洲山杨	69	70	lcl_scaff_XII.277
Poptr_GRF_lcl_scaff_XIII.769	美洲山杨	71	72	lcl_scaff_XIII.769	Poptr_GRF_lcl_scaff_XII.277	美洲山杨	69	70	lcl_scaff_XII.277
Poptr_GRF_lcl_scaff_XIII.769	美洲山杨	71	72	lcl_scaff_XIII.769	Poptr_GRF_lcl_scaff_XIV.174	美洲山杨	73	74	lcl_scaff_XIV.174
Poptr_GRF_lcl_scaff_XIV.51	美洲山杨	75	76	lcl_scaff_XIV.51	Poptr_GRF_lcl_scaff_XIV.174	美洲山杨	73	74	lcl_scaff_XIV.174

名称	来源生物	核酸SEQIDNO：	多肽SEQIDNO：	数据库登录号
名称	来源生物	核酸SEQIDNO：	多肽SEQIDNO：	数据库登录号	Poptr_GRF_lcl_scaff_XIX.480	美洲山杨	77	78	lcl_scaff_XIX.480
Poptr_GRF_lcl_scaff_28.309	美洲山杨	79	80	lcl_scaff_28.309	Poptr_GRF_lcl_scaff_XIX.480	美洲山杨	77	78	lcl_scaff_XIX.480
Poptr_GRF_lcl_scaff_28.309	美洲山杨	79	80	lcl_scaff_28.309	Poptr_GRF_lcl_scaff_I.688	美洲山杨	81	82	lcl_scaff_I.688
Sacof_GRF	甘蔗(Saccharumofficinarum)	83	84	CA084837.1CA238919.1CA122516.1	Poptr_GRF_lcl_scaff_I.688	美洲山杨	81	82	lcl_scaff_I.688
Sacof_GRF	甘蔗(Saccharumofficinarum)	83	84	CA084837.1CA238919.1CA122516.1	Vitvi_GRF	葡萄(Vitis	85	86	AM468035
名称	来源生物	核酸SEQIDNO：	多肽SEQIDNO：	数据库登录号	Vitvi_GRF	葡萄(Vitis	85	86	AM468035
名称	来源生物	核酸SEQIDNO：	多肽SEQIDNO：	数据库登录号		vinifera)
Zeama_GRF10_gi_146008494_gb_EF515849.1	玉米	87	88	EF515849.1		vinifera)
Zeama_GRF10_gi_146008494_gb_EF515849.1	玉米	87	88	EF515849.1	Zeama_GRF11_gi_146008515_gb_EF515850.1	玉米	89	90	EF515850.1
Zeama_GRF12_gi_146008534_gb_EF515851.1	玉米	91	92	EF515851.1	Zeama_GRF11_gi_146008515_gb_EF515850.1	玉米	89	90	EF515850.1
Zeama_GRF12_gi_146008534_gb_EF515851.1	玉米	91	92	EF515851.1	Zeama_GRF13_gi_146008539_gb_EF515852.1	玉米	93	94	EF515852.1
Zeama_GRF14_gi_146008560gb_EF515853.1	玉米	95	96	EF515853.1	Zeama_GRF13_gi_146008539_gb_EF515852.1	玉米	93	94	EF515852.1
Zeama_GRF14_gi_146008560gb_EF515853.1	玉米	95	96	EF515853.1	Zeama_GRF1_gi_146008330_gb_EF515840.1	玉米	97	98	EF515840.1

名称	来源生物	核酸SEQIDNO：	多肽SEQIDNO：	数据库登录号
名称	来源生物	核酸SEQIDNO：	多肽SEQIDNO：	数据库登录号	Zeama_GRF2_gi_146008352_gb_EF515841.1	玉米	99	100	EF515841.1
Zeama_GRF3_gi_146008368_gb_EF515842.1	玉米	101	102	EF515842.1	Zeama_GRF2_gi_146008352_gb_EF515841.1	玉米	99	100	EF515841.1
Zeama_GRF3_gi_146008368_gb_EF515842.1	玉米	101	102	EF515842.1	Zeama_GRF4_gi_146008393_gb_EF515843.1	玉米	103	104	EF515843.1
Zeama_GRF5_gi_146008412_gb_EF515844.1	玉米	105	106	EF515844.1	Zeama_GRF4_gi_146008393_gb_EF515843.1	玉米	103	104	EF515843.1
Zeama_GRF5_gi_146008412_gb_EF515844.1	玉米	105	106	EF515844.1	Zeama_GRF6_gi_146008429_gb_EF515845.1	玉米	107	108	EF515845.1
Zeama_GRF7_gi_1460084	玉米	109	110	EF515846.1	Zeama_GRF6_gi_146008429_gb_EF515845.1	玉米	107	108	EF515845.1
Zeama_GRF7_gi_1460084	玉米	109	110	EF515846.1	名称	来源生物	核酸SEQIDNO：	多肽SEQIDNO：	数据库登录号
40_gb_EF515846.1					名称	来源生物	核酸SEQIDNO：	多肽SEQIDNO：	数据库登录号
40_gb_EF515846.1					Zeama_GRF8_gi_146008461_gb_EF515847.1	玉米	111	112	EF515847.1
Zeama_GRF9_gi_146008475_gb_EF515848.1	玉米	113	114	EF515848.1	Zeama_GRF8_gi_146008461_gb_EF515847.1	玉米	111	112	EF515847.1

表A2：RAA1样多肽的例子：

除了在NCBI可获得的公众可用核酸序列外，也按照如本文以上所述的相同方法搜索专利序列数据库。

表A3提供了与如SEQ ID NO：168所代表的核酸序列和由SEQ IDNO：169代表的蛋白质序列相关的核酸序列和蛋白质序列名单。

表A3：与本发明方法中有用的核酸序列(SEQ ID NO：168)相关的核酸序列和相应的推导多肽。

名称	来源生物	多肽SEQID NO：	核酸SEQID NO：	数据库登录号	状态
名称	来源生物	多肽SEQID NO：	核酸SEQID NO：	数据库登录号	状态	OsSYR	稻	169	168	/	全长或部分
稻SYR同源物1	稻	179	194	XP_472637	全长	OsSYR	稻	169	168	/	全长或部分
稻SYR同源物1	稻	179	194	XP_472637	全长	稻SYR同源物2	稻	180		AP008218	全长
玉米SYR同源物	玉米	181	195	AY110705	部分	稻SYR同源物2	稻	180		AP008218	全长
玉米SYR同源物	玉米	181	195	AY110705	部分	小麦SYR同源物	普通小麦	182		/	全长
大麦SYR同源物	大麦	183	203	CB871444	全长	小麦SYR同源物	普通小麦	182		/	全长
大麦SYR同源物	大麦	183	203	CB871444	全长	甘蔗SYR同	甘蔗	184	204	CA165713	部分
名称	来源生物	多肽SEQID NO：	核酸SEQID NO：	数据库登录号	状态	甘蔗SYR同	甘蔗	184	204	CA165713	部分
名称	来源生物	多肽SEQID NO：	核酸SEQID NO：	数据库登录号	状态	源物1
甘蔗SYR同源物2	甘蔗	185	205	CA242805	全长	源物1
甘蔗SYR同源物2	甘蔗	185	205	CA242805	全长	高梁SYR同源物	两色蜀黍(Sorghumbicolor)	186	206	CX611532	全长
AtSYR同源物1	拟南芥	187	207	NM_115853	全长	高梁SYR同源物	两色蜀黍(Sorghumbicolor)	186	206	CX611532	全长
AtSYR同源物1	拟南芥	187	207	NM_115853	全长	AtSYR同源物2	拟南芥	188	208	NM_180078	全长
葡萄SYR同源物	葡萄	189	196	CF404276	全长	AtSYR同源物2	拟南芥	188	208	NM_180078	全长

名称	来源生物	多肽SEQID NO：	核酸SEQID NO：	数据库登录号	状态
名称	来源生物	多肽SEQID NO：	核酸SEQID NO：	数据库登录号	状态	柑橘属(Citrus)SYR同源物	柑橘(Citrusreticulata)	190	197	CF830612	部分
番茄SYR同源物1	番茄	191	199	AI774560	全长	柑橘属(Citrus)SYR同源物	柑橘(Citrusreticulata)	190	197	CF830612	部分
番茄SYR同源物1	番茄	191	199	AI774560	全长	番茄SYR同源物2	番茄	192	198	BG125370	全长
Argos	拟南芥	193	209	AY305869	全长	番茄SYR同源物2	番茄	192	198	BG125370	全长

表A4：ARKL核酸和各自编码的多肽的例子。

描述＊	植物来源	核酸SEQ IDNO：	蛋白质SEQ IDNO：
描述＊	植物来源	核酸SEQ IDNO：	蛋白质SEQ IDNO：	Orysa_ARKL1	稻	212	213
Orysa_ARKL2	稻	214	215	Orysa_ARKL1	稻	212	213
Orysa_ARKL2	稻	214	215	Orysa_ARKL3	稻	216	217
Orysa_ARKL4	稻	218	219	Orysa_ARKL3	稻	216	217
Orysa_ARKL4	稻	218	219	Orysa_ARKL5	稻	220	221
Orysa_ARKL6	稻	222	223	Orysa_ARKL5	稻	220	221
Orysa_ARKL6	稻	222	223	Orysa_ARKL7	稻	224	225
Orysa_ARKL8	稻	226	227	Orysa_ARKL7	稻	224	225
Orysa_ARKL8	稻	226	227	Orysa_ARKL9	稻	228	229
Zeama_ARKL1	玉米	230	231	Orysa_ARKL9	稻	228	229

描述＊	植物来源	核酸SEQ IDNO：	蛋白质SEQ IDNO：
描述＊	植物来源	核酸SEQ IDNO：	蛋白质SEQ IDNO：	Zeama_ARKL2	玉米	232	233
Horvu_ARKL1	大麦	234	235	Zeama_ARKL2	玉米	232	233
Horvu_ARKL1	大麦	234	235	Horvu_ARKL2	大麦	236	237
Horvu_ARKL3	大麦	238	239	Horvu_ARKL2	大麦	236	237
Horvu_ARKL3	大麦	238	239	Lyces_ARKL1	番茄	240	241
Lyces_ARKL2	番茄	242	243	Lyces_ARKL1	番茄	240	241
Lyces_ARKL2	番茄	242	243	Lyces_ARKL3	番茄	244	245
Glyma_ARKL1	大豆	246	247	Lyces_ARKL3	番茄	244	245
Glyma_ARKL1	大豆	246	247	Glyma_ARKL2	大豆	248	249
Zinel_ARKL1	百日菊(Zinniaelegans)	250	251	Glyma_ARKL2	大豆	248	249
Zinel_ARKL1	百日菊(Zinniaelegans)	250	251	Lotja_ARKL1	百脉根(Lotusjaponicus)	252	253
Arath_ARKL1	拟南芥	254	255	Lotja_ARKL1	百脉根(Lotusjaponicus)	252	253
Arath_ARKL1	拟南芥	254	255	描述＊	植物来源	核酸SEQ IDNO：	蛋白质SEQ IDNO：
Arath_ARKL2	拟南芥	256	257	描述＊	植物来源	核酸SEQ IDNO：	蛋白质SEQ IDNO：
Arath_ARKL2	拟南芥	256	257	Arath_ARKL3	拟南芥	258	259
Arath_ARKL4	拟南芥	260	261	Arath_ARKL3	拟南芥	258	259
Arath_ARKL4	拟南芥	260	261	Arath_ARKL5	拟南芥	262	263

描述＊	植物来源	核酸SEQ IDNO：	蛋白质SEQ IDNO：
描述＊	植物来源	核酸SEQ IDNO：	蛋白质SEQ IDNO：	Arath_ARKL6	拟南芥	264	265
Arath_ARKL7	拟南芥	266	267	Arath_ARKL6	拟南芥	264	265
Arath_ARKL7	拟南芥	266	267	Arath_ARKL8	拟南芥	268	269
Arath_ARKL9	拟南芥	270	271	Arath_ARKL8	拟南芥	268	269
Arath_ARKL9	拟南芥	270	271	Arath_ARKL10	拟南芥	272	273
Arath_ARKL11	拟南芥	274	275	Arath_ARKL10	拟南芥	272	273
Arath_ARKL11	拟南芥	274	275	Arath_ARKL12	拟南芥	276	277
Poptr_ARKL1	毛果杨(Populustrichocarpa)	278	279	Arath_ARKL12	拟南芥	276	277
Poptr_ARKL1	毛果杨(Populustrichocarpa)	278	279	Poptr_ARKL2	毛果杨	280	281
Poptr_ARKL3	毛果杨	282	283	Poptr_ARKL2	毛果杨	280	281
Poptr_ARKL3	毛果杨	282	283	Poptr_ARKL4	毛果杨	284	285
Poptr_ARKL5	毛果杨	286	287	Poptr_ARKL4	毛果杨	284	285
Poptr_ARKL5	毛果杨	286	287	Poptr_ARKL6	毛果杨	288	289
Poptr_ARKL7	毛果杨	290	291	Poptr_ARKL6	毛果杨	288	289
Poptr_ARKL7	毛果杨	290	291	Poptr_ARKL8	毛果杨	292	293
Poptr_ARKL9	毛果杨	294	295	Poptr_ARKL8	毛果杨	292	293
Poptr_ARKL9	毛果杨	294	295	Poptr_ARKL10	毛果杨	296	297
Medtr_ARKL1	蒺藜苜蓿	298	299	Poptr_ARKL10	毛果杨	296	297

描述＊	植物来源	核酸SEQ IDNO：	蛋白质SEQ IDNO：
描述＊	植物来源	核酸SEQ IDNO：	蛋白质SEQ IDNO：	Medtr_ARKL2	蒺藜苜蓿	300	301
描述＊	植物来源	核酸SEQ IDNO：	蛋白质SEQ IDNO：	Medtr_ARKL2	蒺藜苜蓿	300	301
描述＊	植物来源	核酸SEQ IDNO：	蛋白质SEQ IDNO：	Medtr_ARKL3	蒺藜苜蓿	302	303
Medtr_ARKL4	蒺藜苜蓿	304	305	Medtr_ARKL3	蒺藜苜蓿	302	303

＊Orysa：稻；Zeama：玉米；Horvu：大麦；Lyces：番茄；Glyma：大豆；Zinel：百日菊；Lotja：百脉根；Arath：拟南芥；Poptr：毛果杨；Medtr：蒺藜苜蓿。

表A5提供了与本发明方法中所用核酸序列相关的核酸序列名单。

表A5：YTP核酸和多肽的例子：

名称	别名	来源生物	核酸SEQIDNO	蛋白质SEQIDNO
名称	别名	来源生物	核酸SEQIDNO	蛋白质SEQIDNO	YTP1	YTP1部分	稻	408	409
YTP2	Os01g0534900(768)	稻	410	411	YTP1	YTP1部分	稻	408	409
YTP2	Os01g0534900(768)	稻	410	411	YTP3	Os01g0950900(701)	稻	412	413
YTP4	Os03g0137400(792)	稻	414	415	YTP3	Os01g0950900(701)	稻	412	413
YTP4	Os03g0137400(792)	稻	414	415	YTP5	Os03g0673800(777)	稻	416	417

名称	别名	来源生物	核酸SEQIDNO	蛋白质SEQIDNO
名称	别名	来源生物	核酸SEQIDNO	蛋白质SEQIDNO	YTP6	Os03g0726300(743)	稻	418	419
YTP7	Os05g0393800(767)	稻	420	421	YTP6	Os03g0726300(743)	稻	418	419
YTP7	Os05g0393800(767)	稻	420	421	YTP8	Os05g0594700(766)	稻	422	423
名称	别名	来源生物	核酸SEQIDNO	蛋白质SEQIDNO	YTP8	Os05g0594700(766)	稻	422	423
名称	别名	来源生物	核酸SEQIDNO	蛋白质SEQIDNO	YTP9	Os07g0150100(731)	稻	424	425
YTP10	Os10g0579100(810)	稻	426	427	YTP9	Os07g0150100(731)	稻	424	425
YTP10	Os10g0579100(810)	稻	426	427	YTP11	Os12g0582800(695)	稻	428	429
YTP12	Os12g0633600(763)	稻	430	431	YTP11	Os12g0582800(695)	稻	428	429
YTP12	Os12g0633600(763)	稻	430	431	YTP13	AT1G10090(762)	拟南芥	432	433
YTP14	AT1G11960(375)	拟南芥	434	435	YTP13	AT1G10090(762)	拟南芥	432	433
YTP14	AT1G11960(375)	拟南芥	434	435	YTP15	AT1G30360(724)	拟南芥	436	437
YTP16	AT1G58520(657)	拟南芥	438	439	YTP15	AT1G30360(724)	拟南芥	436	437
YTP16	AT1G58520(657)	拟南芥	438	439	YTP17	AT1G62320(769)	拟南芥	440	441
YTP18	AT1G69450(711)	拟南芥	442	443	YTP17	AT1G62320(769)	拟南芥	440	441

名称	别名	来源生物	核酸SEQIDNO	蛋白质SEQIDNO
名称	别名	来源生物	核酸SEQIDNO	蛋白质SEQIDNO	YTP19	AT3G01100(596)	拟南芥	444	445
YTP20	AT3G21620(756)	拟南芥	446	447	YTP19	AT3G01100(596)	拟南芥	444	445
YTP20	AT3G21620(756)	拟南芥	446	447	YTP21	AT3G54510(617)	拟南芥	448	449
YTP22	AT4G02900(806)	拟南芥	450	451	YTP21	AT3G54510(617)	拟南芥	448	449
YTP22	AT4G02900(806)	拟南芥	450	451	YTP23	AT4G04340(772)	拟南芥	452	453
YTP24	AT4G15430(761)	拟南芥	454	455	YTP23	AT4G04340(772)	拟南芥	452	453
YTP24	AT4G15430(761)	拟南芥	454	455	YTP25	AT4G22120(771)	拟南芥	456	457
YTP26	AT4G35870(817)	拟南芥	458	459	YTP25	AT4G22120(771)	拟南芥	456	457
YTP26	AT4G35870(817)	拟南芥	458	459	YTP27	AQGI.2hit1部分的耧斗菜属	耧斗菜属(Aquilegia)物种	460	461
名称	别名	来源生物	核酸SEQIDNO	蛋白质SEQIDNO	YTP27	AQGI.2hit1部分的耧斗菜属	耧斗菜属(Aquilegia)物种	460	461
名称	别名	来源生物	核酸SEQIDNO	蛋白质SEQIDNO		(PGI)(707)
YTP28	lcl_175_Medicago(712)	蒺藜苜蓿	462	463		(PGI)(707)
YTP28	lcl_175_Medicago(712)	蒺藜苜蓿	462	463	YTP29	lcl_21269_Medicago(790)	蒺藜苜蓿	464	465
YTP30	lcl_24278_Medicago(766)	蒺藜苜蓿	466	467	YTP29	lcl_21269_Medicago(790)	蒺藜苜蓿	464	465
YTP30	lcl_24278_Medicago(766)	蒺藜苜蓿	466	467	YTP31	lcl_3723_Medicago(461)	蒺藜苜蓿	468	469

名称	别名	来源生物	核酸SEQIDNO	蛋白质SEQIDNO
名称	别名	来源生物	核酸SEQIDNO	蛋白质SEQIDNO	YTP32	lcl_scaff_1405.2(301)	毛果杨	470	471
YTP33	lcl_scaff_1405.3(276)	毛果杨	472	473	YTP32	lcl_scaff_1405.2(301)	毛果杨	470	471
YTP33	lcl_scaff_1405.3(276)	毛果杨	472	473	YTP34	lcl_scaff_166.26(775)	毛果杨	474	475
YTP35	lcl_scaff_166.27(774)	毛果杨	476	477	YTP34	lcl_scaff_166.26(775)	毛果杨	474	475
YTP35	lcl_scaff_166.27(774)	毛果杨	476	477	YTP36	lcl_scaff_29.271(831)	毛果杨	478	479
YTP37	lcl_scaff_I.2570(724)	毛果杨	480	481	YTP36	lcl_scaff_29.271(831)	毛果杨	478	479
YTP37	lcl_scaff_I.2570(724)	毛果杨	480	481	YTP38	lcl_scaff_II.1056(706)	毛果杨	482	483
YTP39	lcl_scaff_II.2075(767)	毛果杨	484	485	YTP38	lcl_scaff_II.1056(706)	毛果杨	482	483
YTP39	lcl_scaff_II.2075(767)	毛果杨	484	485	名称	别名	来源生物	核酸SEQIDNO	蛋白质SEQIDNO
YTP40	lcl_scaff_III.1644(726)	毛果杨	486	487	名称	别名	来源生物	核酸SEQIDNO	蛋白质SEQIDNO
YTP40	lcl_scaff_III.1644(726)	毛果杨	486	487	YTP41	lcl_scaff_III.729(516)	毛果杨	488	489
YTP42	lcl_scaff_IV.1089(436)	毛果杨	490	491	YTP41	lcl_scaff_III.729(516)	毛果杨	488	489

名称	别名	来源生物	核酸SEQIDNO	蛋白质SEQIDNO
名称	别名	来源生物	核酸SEQIDNO	蛋白质SEQIDNO	YTP43	lcl_scaff_VIII.848(714)	毛果杨	492	493
YTP44	lcl_scaff_XI.92(546)	毛果杨	494	495	YTP43	lcl_scaff_VIII.848(714)	毛果杨	492	493
YTP44	lcl_scaff_XI.92(546)	毛果杨	494	495	YTP45	lcl_scaff_XI.94(708)	毛果杨	496	497
YTP46	lcl_scaff_XIV.1036(846)	毛果杨	498	499	YTP45	lcl_scaff_XI.94(708)	毛果杨	496	497
YTP46	lcl_scaff_XIV.1036(846)	毛果杨	498	499	YTP47	Triae_TA80116_4565(535)	普通小麦	500	501
YTP48	volvox2_104236	强壮团藻(Volvoxcarteri)	502	503	YTP47	Triae_TA80116_4565(535)	普通小麦	500	501
YTP48	volvox2_104236	强壮团藻(Volvoxcarteri)	502	503	YTP49	VOLVOX_95919	强壮团藻	504	505
YTP50	chlamy-174910(1129)	雷氏衣藻(Chlamydomonasreinhardtii)	506	507	YTP49	VOLVOX_95919	强壮团藻	504	505
YTP50	chlamy-174910(1129)	雷氏衣藻(Chlamydomonasreinhardtii)	506	507	YTP51	chlamy-194774(1429)	雷氏衣藻	508	509
YTP52	ref_NP_014557.1	粟酒裂殖酵母	510	511	YTP51	chlamy-194774(1429)	雷氏衣藻	508	509
YTP52	ref_NP_014557.1	粟酒裂殖酵母	510	511	名称	别名	来源生物	核酸SEQIDNO	蛋白质SEQIDNO
	(991)	(Schizosaccharomyces pombe)			名称	别名	来源生物	核酸SEQIDNO	蛋白质SEQIDNO

名称	别名	来源生物	核酸SEQIDNO	蛋白质SEQIDNO
名称	别名	来源生物	核酸SEQIDNO	蛋白质SEQIDNO	YTP53	ref_NP_592939.1_(871)	棉阿舒囊霉(Ashbya gossypii)	512	513
YTP54	ref_NP_984890.1_(875)	乳酸克鲁维酵母(Kluyveromyceslactis)	514	515	YTP53	ref_NP_592939.1_(871)	棉阿舒囊霉(Ashbya gossypii)	512	513
YTP54	ref_NP_984890.1_(875)	乳酸克鲁维酵母(Kluyveromyceslactis)	514	515	YTP55	ref_XP_452699.1_(967)	酿酒酵母(Saccharomycescerevisiae)	516	517

在一些情况下，相关序列已经由研究机构如基因组研究机构(TIGR)初步地汇编并且公开披露。可以使用真核生物基因直向同源物(EGO)数据库来鉴定此类相关序列，这可通过关键词搜索或通过使用BLAST算法以目的核酸序列或多肽序列进行。在其他情况下，已经对特定生物创建了专用核酸序列数据库，如由联合基因组研究所(Joint Genome Institute)例如对杨(poplar)和Ostreococcus tauri创建的专用核酸序列数据库。

实施例2：

a)GRF多肽序列的比对

使用(来自Invitrogen公司Vector NTI 10.3的)AlignX算法进行表A中全部GRF多肽序列的多重序列比对。在本申请的图2中显示来自表A的(如对SEQ ID NO：2的SEQ ID NO：115所代表的)GRF多肽的QLQ结构域的比对结果。保守QLQ氨基酸残基位于多重比对结果的顶部。(用黑色框框定的)两个另外的非常保守残基是E(Glu)和P(Pro)。在本申请的图3中显示来自表A的(如对SEQ ID NO：2的SEQ ID NO：116所代表的)GRF多肽的WRC结构域的比对结果。以粗体标出共有序列中保守的WRC氨基酸残基。在整个比对结果范围内用方框垂直地标出并在比对结果的底部鉴定到命名为转录效应子(ET)结构域的保守间隔(CX₉CX₁₀CX₂H)中的3个Cys和1个His残基。

b)RAA1样多肽序列的比对

使用来自Vector NTI(Invitrogen)的AlignX程序进行多肽序列的比对，其中所述AlignX程序基于流行的累进比对Clustal W算法(Thompson等人(1997)Nucleic Acids Res 25：4876-4882；Chenna等人(2003)，NucleicAcids Res 31：3497-3500)。空位开口罚分的默认值是10，空位延伸罚分是0.1并且所选的权重矩阵是Blosum 62(若比对多肽)。进行少许手工编辑以优化该比对。诸RAA1样多肽之间的序列保守性基本上遍及整个序列内，除所述蛋白质氨基半端中的Gly和/或Ser丰富区域之外。所述RAA1样多肽在图7中比对。

c)SYR多肽序列的比对

AlignX(Vector NTI，Invitrogen)基于流行的累进比对Clustal算法(Thompson等人(1997)Nucleic Acids Res 25：4876-4882；Chenna等人(2003).Nucleic Acids Res 31：3497-3500)。可以使用邻接聚类算法构建进化系统树。空位开口罚分的默认值是10，空位延伸罚分是0.1并且所选的权重矩阵是Blosum 62(若比对多肽)。

在图12中显示了使用与鉴定在开展本发明方法中有用的多肽相关的多肽的多重序列比对结果。可以在多种序列中轻易地区分亮氨酸丰富重复序列和保守基序。

d)ARKL多肽序列的比对

使用来自Vector NTI(Invitrogen)的AlignX程序进行多肽序列的比对，其中所述AlignX程序基于流行的累进比对Clustal W算法(Thompson等人(1997)Nucleic Acids Res 25：4876-4882；Chenna等人(2003)，NucleicAcids Res 31：3497-3500)。空位开口罚分的默认值是10，空位延伸罚分是0.1并且所选的权重矩阵是Blosum 62(若比对多肽)。可以进行少许手工编辑以优化该比对。诸ARKL多肽之间的序列保守性基本上存在于羧基端沿着所述多肽的DAR1和RING-H2结构域内，氨基端结构域通常在序列长度和组成方面更为多变。所述ARKL多肽在图16中比对。

使用如Vector NTI(Invitrogen)的AlignX程序中所提供的邻接法聚类算法构建ARKL多肽的进化系统树(图17)。

e)YTP多肽序列的比对

使用来自Vector NTI(Invitrogen)的AlignX程序进行多肽序列的比对，其中所述AlignX程序基于流行的累进比对Clustal W算法(Thompson等人(1997)Nucleic Acids Res 25：4876-4882；Chenna等人(2003)，NucleicAcids Res 31：3497-3500)。空位开口罚分的默认值是10，空位延伸罚分是0.1并且所选的权重矩阵是Blosum 62(若比对多肽)。可以进行少许手工编辑以优化该比对。诸YTP多肽之间的序列保守性在所述多肽蛋白的羧基端沿DUF221结构域中较高。氨基端结构域通常在序列长度和组成方面更为多变。所述YTP多肽在图22中比对。标出了共有序列中高度保守的氨基酸残基(见图22)。

使用如Vector NTI(Invitrogen)的AlignX程序中所提供的邻接法聚类算法构建YTP多肽的进化系统树(图21)。如图21中所示，组1包含与SEQID NO：409(图21中的YTP1)聚类的YTP多肽。

实施例3：计算在实施本发明方法中有用的多肽序列之间的总体同一性百分数

使用现有技术领域可获得的方法之一，即MatGAT(矩阵总体比对工具)软件(BMC Bioinformatics.20034：29.MatGAT：使用蛋白质序列或DNA序列产生相似性/同一性矩阵的一项应用(an application that generatessimilarity/identity matrices using protein or DNA sequences)，CampanellaJJ，Bitincka L，Smalley J；该软件由Ledion Bitincka维护)确定在实施本发明方法中有用的全长多肽序列之间的总体相似性和同一性百分数。MatGAT软件对DNA序列或蛋白质序列产生相似性/同一性矩阵，无需预先比对数据。该程序使用Myers和Miller总体比对算法(空位开口罚分12和空位延伸罚分2)执行一系列配对比对，使用例如Blosum 62(对于多肽而言)计算相似性和同一性并且随后将结果置于距离矩阵中。在分割线下半部分显示序列相似性，并且在对角分割线的上半部分显示序列同一性。

比较中使用的参数是：

评分矩阵：Blosum62

第一空位：12

延伸空位：2

表B中显示在多肽序列的全长范围内总体相似性和同一性的软件分析结果(不包括部分多肽序列)。

与SEQ ID NO：2相比较，在实施本发明方法中有用的全长多肽序列之间的同一性百分数可以低至15％氨基酸同一性。

如果在SEQ ID NO：2的QLQ结构域(如由SEQ ID NO：2中包含的SEQ ID NO：115所代表；图2中代表的表A的GRF多肽的QLQ结构域)与在实施本发明中有用的多肽的QLQ结构域之间开展同一性计算，可能相当大程度地提高同一性百分数。类似地，如果在SEQ ID NO：2的WRC结构域(如由SEQ ID NO：2中包含的SEQ ID NO：116所代表；图3中代表的表A的GRF多肽的WRC结构域)与在实施本发明中有用的多肽的WRC结构域之间开展同一性计算，可能相当大程度地提高同一性百分数。在实施本发明中有用的多肽序列之间的QLQ结构域范围内的同一性百分数范围是在25％和99％氨基酸同一性之间，并且在实施本发明中有用的多肽序列之间的WRC结构域范围内的同一性百分数范围是在60％和99％氨基酸同一性之间。这也可以在图3中观察到，不同GRF多肽之间WRC结构域比QLQ结构域更保守，如图2中所示。

QLQ结构域之间的氨基酸同一性百分数和WRC结构域之间的同一性百分数显著高于全长GRF多肽序列之间所计算的氨基酸同一性百分数。

在表B2中显示所述多肽序列的全长范围内总体相似性和同一性的与RAA1样多肽相关的软件分析结果。在对角线上方给出相似性百分数而在对角线下方给出同一性百分数(粗体字)。

剔除Q9LXB6(SEQ ID NO：155)不考虑，与SEQ ID NO：121相比，在实施本发明方法中有用的RAA1样多肽序列之间的同一性百分数可以低至31％氨基酸同一性。

表B2：在多肽序列的全长范围内总体相似性和同一性的MatGAT结果。SEQ ID NO：121由Q9LGE3代表。

表B5-2显示与表B5-1中所用序列相对应的SEQ ID NO：。

表5-2：DUF221结构域

描述	SEQ ID NO
描述	SEQ ID NO	YTP13_DUF221	530
YTP16_DUF221	533	YTP13_DUF221	530
YTP16_DUF221	533	YTP5_DUF221	522
YTP12_DUF221	529	YTP5_DUF221	522
YTP12_DUF221	529	YTP6_DUF221	523
YTP18_DUF221	525	YTP6_DUF221	523
YTP18_DUF221	525	YTP11_DUF221	528
YTP19_DUF221	536	YTP11_DUF221	528
YTP19_DUF221	536	YTP21_DUF221	538
YTP3_DUF221	520	YTP21_DUF221	538
YTP3_DUF221	520	YTP15_DUF221	532
YTP9_DUF221	526	YTP15_DUF221	532
YTP9_DUF221	526	YTP26_DUF221	543
YTP4_DUF221	521	YTP26_DUF221	543
YTP4_DUF221	521	YTP1_DUF221	518

实施例4：鉴定在实施本发明方法中有用的多肽序列中所包含的结构域

蛋白质家族、结构域和位点的集成资源(InterPro)数据库是针对基于文本及基于序列的搜索法的常用特征标识数据库的集成界面。InterPro数据库合并了这些数据库，所述数据库使用不同的方法学及不同程度的有关充分表征的蛋白质的生物学信息以获得蛋白质特征标识(proteinsignatures)。合作数据库包括SWISS-PROT、PROSITE、TrEMBL、PRINTS、ProDom和Pfam、Smart和TIGRFAM。Interpro由英国欧洲生物信息学研究所维护。

在表C中呈现如SEQ ID NO：2所代表的多肽序列的InterPro扫描结果。

表C1：如SEQ ID NO：2所代表的多肽序列的InterPro扫描结果

InterPro登录号和名称	集成的数据库名称	集成的数据库登录号	集成的数据库登录名称
InterPro登录号和名称	集成的数据库名称	集成的数据库登录号	集成的数据库登录名称	IPR014977WRC结构域	PFAM	PF08879	WRC
IPR014978QLQ结构域	PFAM	PF08880	QLQ	IPR014977WRC结构域	PFAM	PF08879	WRC

在表C1中呈现如SEQ ID NO：213所代表的多肽序列的InterPro扫描结果。

表C2-1：如SEQ ID NO：213所代表的多肽序列的InterPro扫描结果(主要登录号)

查询	InterPRO登录	描述登录Interpro	搜索方法	搜索的数据库	数据库中的登录	查询序列中的氨基酸坐标	E值
查询	InterPRO登录	描述登录Interpro	搜索方法	搜索的数据库	数据库中的登录	查询序列中的氨基酸坐标	E值	Orysa_ARKL1	IPR0013083	RING/FYVE/PHD型锌指	Gene3D	Gene3D	G3DSA：3.30.40.10	315-365	1.5e-10
Orysa_ARKL1	IPR001841	Ring型锌指	HMMSmart	Smart	SM00184	319-359	7.4e-07	Orysa_ARKL1	IPR0013083	RING/FYVE/PHD型锌指	Gene3D	Gene3D	G3DSA：3.30.40.10	315-365	1.5e-10
Orysa_ARKL1	IPR001841	Ring型锌指	HMMSmart	Smart	SM00184	319-359	7.4e-07	Orysa_ARKL1	无IPR登录	RING指蛋白24相关	HMMPanther	Panther	PTHR22766	316-365	9.6e-12
Orysa_ARKL1	IPR001841	Ring型锌指	HMMPfam	Pfam	PF00097	319-359	4.9e-09	Orysa_ARKL1	无IPR登录	RING指蛋白24相关	HMMPanther	Panther	PTHR22766	316-365	9.6e-12
Orysa_ARKL1	IPR001841	Ring型锌指	HMMPfam	Pfam	PF00097	319-359	4.9e-09	Orysa_ARKL1	无IPR登录	NA＊	HMMPfam	Pfam	PF2828	266-296

表C2给出了包含表A的ARKL多肽中保守RING结构域(ZfC3HC4)和DAR1(PfamB2828)的SEQ ID NO：。

表C2-2.ARKL多肽中的RING和DAR1结构域

结构域	参考蛋白	SEQ ID NO：
结构域	参考蛋白	SEQ ID NO：	ZfC3HC4_Orysa_ARKL1	Orysa_ARKL1	306
ZfC3HC4_Orysa_ARKL3	Orysa_ARKL3	307	ZfC3HC4_Orysa_ARKL1	Orysa_ARKL1	306
ZfC3HC4_Orysa_ARKL3	Orysa_ARKL3	307	ZfC3HC4_Orysa_ARKL4	Orysa_ARKL4	308
ZfC3HC4_Orysa_ARKL5	Orysa_ARKL5	309	ZfC3HC4_Orysa_ARKL4	Orysa_ARKL4	308
ZfC3HC4_Orysa_ARKL5	Orysa_ARKL5	309	ZfC3HC4_Orysa_ARKL6	Orysa_ARKL6	310
ZfC3HC4_Orysa_ARKL7	Orysa_ARKL7	311	ZfC3HC4_Orysa_ARKL6	Orysa_ARKL6	310
ZfC3HC4_Orysa_ARKL7	Orysa_ARKL7	311	ZfC3HC4_Orysa_ARKL8	Orysa_ARKL8	312
ZfC3HC4_Orysa_ARKL9	Orysa_ARKL9	313	ZfC3HC4_Orysa_ARKL8	Orysa_ARKL8	312
ZfC3HC4_Orysa_ARKL9	Orysa_ARKL9	313	ZfC3HC4_Zeama_ARKL1	Zeama_ARKL1	314
ZfC3HC4_Zeama_ARKL2	Zeama_ARKL2	315	ZfC3HC4_Zeama_ARKL1	Zeama_ARKL1	314
ZfC3HC4_Zeama_ARKL2	Zeama_ARKL2	315	ZfC3HC4_Horvu_ARKL1	Horvu_ARKL1	316
ZfC3HC4_Horvu_ARKL2	Horvu_ARKL2	317	ZfC3HC4_Horvu_ARKL1	Horvu_ARKL1	316
ZfC3HC4_Horvu_ARKL2	Horvu_ARKL2	317	ZfC3HC4_Horvu_ARKL3	Horvu_ARKL3	318
ZfC3HC4_Lyces_ARKL1	Lyces_ARKL1	319	ZfC3HC4_Horvu_ARKL3	Horvu_ARKL3	318
ZfC3HC4_Lyces_ARKL1	Lyces_ARKL1	319	ZfC3HC4_Lyces_ARKL2	Lyces_ARKL2	320
ZfC3HC4_Lyces_ARKL3	Lyces_ARKL3	321	ZfC3HC4_Lyces_ARKL2	Lyces_ARKL2	320
ZfC3HC4_Lyces_ARKL3	Lyces_ARKL3	321	ZfC3HC4_Glyma_ARKL1	Glyma_ARKL1	322
ZfC3HC4_Glyma_ARKL2	Glyma_ARKL2	323	ZfC3HC4_Glyma_ARKL1	Glyma_ARKL1	322
ZfC3HC4_Glyma_ARKL2	Glyma_ARKL2	323	ZfC3HC4_Zinel_ARKL1	Zinel_ARKL1	324
ZfC3HC4_Lotja_ARKL1	Lotja_ARKL1	325	ZfC3HC4_Zinel_ARKL1	Zinel_ARKL1	324

结构域	参考蛋白	SEQ ID NO：
结构域	参考蛋白	SEQ ID NO：	ZfC3HC4_Arath_ARKL1	Arath_ARKL1	326
ZfC3HC4_Arath_ARKL2	Arath_ARKL2	327	ZfC3HC4_Arath_ARKL1	Arath_ARKL1	326
ZfC3HC4_Arath_ARKL2	Arath_ARKL2	327	ZfC3HC4_Arath_ARKL3	Arath_ARKL3	328
结构域	参考蛋白	SEQ ID NO：	ZfC3HC4_Arath_ARKL3	Arath_ARKL3	328
结构域	参考蛋白	SEQ ID NO：	ZfC3HC4_Arath_ARKL4	Arath_ARKL4	329
ZfC3HC4_Arath_ARKL5	Arath_ARKL5	330	ZfC3HC4_Arath_ARKL4	Arath_ARKL4	329
ZfC3HC4_Arath_ARKL5	Arath_ARKL5	330	ZfC3HC4_Arath_ARKL6	Arath_ARKL6	331
ZfC3HC4_Arath_ARKL7	Arath_ARKL7	332	ZfC3HC4_Arath_ARKL6	Arath_ARKL6	331
ZfC3HC4_Arath_ARKL7	Arath_ARKL7	332	ZfC3HC4_Arath_ARKL8	Arath_ARKL8	333
ZfC3HC4_Arath_ARKL9	Arath_ARKL9	334	ZfC3HC4_Arath_ARKL8	Arath_ARKL8	333
ZfC3HC4_Arath_ARKL9	Arath_ARKL9	334	ZfC3HC4_Arath_ARKL10	Arath_ARKL10	335
ZfC3HC4_Arath_ARKL11	Arath_ARKL11	336	ZfC3HC4_Arath_ARKL10	Arath_ARKL10	335
ZfC3HC4_Arath_ARKL11	Arath_ARKL11	336	ZfC3HC4_Arath_ARKL12	Arath_ARKL12	337
ZfC3HC4_Poptr_ARKL1	Poptr_ARKL1	338	ZfC3HC4_Arath_ARKL12	Arath_ARKL12	337
ZfC3HC4_Poptr_ARKL1	Poptr_ARKL1	338	ZfC3HC4_Poptr_ARKL2	Poptr_ARKL2	339
ZfC3HC4_Poptr_ARKL3	Poptr_ARKL3	340	ZfC3HC4_Poptr_ARKL2	Poptr_ARKL2	339
ZfC3HC4_Poptr_ARKL3	Poptr_ARKL3	340	ZfC3HC4_Poptr_ARKL4	Poptr_ARKL4	341
ZfC3HC4_Poptr_ARKL5	Poptr_ARKL5	342	ZfC3HC4_Poptr_ARKL4	Poptr_ARKL4	341
ZfC3HC4_Poptr_ARKL5	Poptr_ARKL5	342	ZfC3HC4_Poptr_ARKL6	Poptr_ARKL6	343
ZfC3HC4_Poptr_ARKL7	Poptr_ARKL7	344	ZfC3HC4_Poptr_ARKL6	Poptr_ARKL6	343

结构域	参考蛋白	SEQ ID NO：
结构域	参考蛋白	SEQ ID NO：	ZfC3HC4_Poptr_ARKL8	Poptr_ARKL8	345
ZfC3HC4_Poptr_ARKL9	Poptr_ARKL9	346	ZfC3HC4_Poptr_ARKL8	Poptr_ARKL8	345
ZfC3HC4_Poptr_ARKL9	Poptr_ARKL9	346	ZfC3HC4_Poptr_ARKL10	Poptr_ARKL10	347
ZfC3HC4_Medtr_ARKL1	Medtr_ARKL1	348	ZfC3HC4_Poptr_ARKL10	Poptr_ARKL10	347
ZfC3HC4_Medtr_ARKL1	Medtr_ARKL1	348	ZfC3HC4_Medtr_ARKL2	Medtr_ARKL2	349
ZfC3HC4_Medtr_ARKL3	Medtr_ARKL3	350	ZfC3HC4_Medtr_ARKL2	Medtr_ARKL2	349
ZfC3HC4_Medtr_ARKL3	Medtr_ARKL3	350	ZfC3HC4_Medtr_ARKL4	Medtr_ARKL4	351
PfamB2828_Orysa_ARKL1	Orysa_ARKL1	352	ZfC3HC4_Medtr_ARKL4	Medtr_ARKL4	351
PfamB2828_Orysa_ARKL1	Orysa_ARKL1	352	PfamB2828_Orysa_ARKL2	Orysa_ARKL2	353
PfamB2828_Orysa_ARKL3	Orysa_ARKL3	354	PfamB2828_Orysa_ARKL2	Orysa_ARKL2	353
PfamB2828_Orysa_ARKL3	Orysa_ARKL3	354	结构域	参考蛋白	SEQ ID NO：
PfamB2828_Orysa_ARKL4	Orysa_ARKL4	355	结构域	参考蛋白	SEQ ID NO：
PfamB2828_Orysa_ARKL4	Orysa_ARKL4	355	PfamB2828_Orysa_ARKL5	Orysa_ARKL5	356
PfamB2828_Orysa_ARKL6	Orysa_ARKL6	357	PfamB2828_Orysa_ARKL5	Orysa_ARKL5	356
PfamB2828_Orysa_ARKL6	Orysa_ARKL6	357	PfamB2828_Orysa_ARKL7	Orysa_ARKL7	358
PfamB2828_Orysa_ARKL8	Orysa_ARKL8	359	PfamB2828_Orysa_ARKL7	Orysa_ARKL7	358
PfamB2828_Orysa_ARKL8	Orysa_ARKL8	359	PfamB2828_Orysa_ARKL9	Orysa_ARKL9	360
PfamB2828_Zeama_ARKL1	Zeama_ARKL1	361	PfamB2828_Orysa_ARKL9	Orysa_ARKL9	360
PfamB2828_Zeama_ARKL1	Zeama_ARKL1	361	PfamB2828_Zeama_ARKL2	Zeama_ARKL2	362
PfamB2828_Horvu_ARKL1	Horvu_ARKL1	363	PfamB2828_Zeama_ARKL2	Zeama_ARKL2	362

结构域	参考蛋白	SEQ ID NO：
结构域	参考蛋白	SEQ ID NO：	PfamB2828_Horvu_ARKL2	Horvu_ARKL2	364
PfamB2828_Horvu_ARKL3	Horvu_ARKL3	365	PfamB2828_Horvu_ARKL2	Horvu_ARKL2	364
PfamB2828_Horvu_ARKL3	Horvu_ARKL3	365	PfamB2828_Lyces_ARKL1	Lyces_ARKL1	366
PfamB2828_Lyces_ARKL2	Lyces_ARKL2	367	PfamB2828_Lyces_ARKL1	Lyces_ARKL1	366
PfamB2828_Lyces_ARKL2	Lyces_ARKL2	367	PfamB2828_Lyces_ARKL3	Lyces_ARKL3	368
PfamB2828_Glyma_ARKL1	Glyma_ARKL1	369	PfamB2828_Lyces_ARKL3	Lyces_ARKL3	368
PfamB2828_Glyma_ARKL1	Glyma_ARKL1	369	PfamB2828_Glyma_ARKL2	Glyma_ARKL2	370
PfamB2828_Zinel_ARKL1	Zinel_ARKL1	371	PfamB2828_Glyma_ARKL2	Glyma_ARKL2	370
PfamB2828_Zinel_ARKL1	Zinel_ARKL1	371	PfamB2828_Lotja_ARKL1	Lotja_ARKL1	372
PfamB2828_Arath_ARKL1	Arath_ARKL1	373	PfamB2828_Lotja_ARKL1	Lotja_ARKL1	372
PfamB2828_Arath_ARKL1	Arath_ARKL1	373	PfamB2828_Arath_ARKL2	Arath_ARKL2	374
PfamB2828_Arath_ARKL3	Arath_ARKL3	375	PfamB2828_Arath_ARKL2	Arath_ARKL2	374
PfamB2828_Arath_ARKL3	Arath_ARKL3	375	PfamB2828_Arath_ARKL4	Arath_ARKL4	376
PfamB2828_Arath_ARKL5	Arath_ARKL5	377	PfamB2828_Arath_ARKL4	Arath_ARKL4	376
PfamB2828_Arath_ARKL5	Arath_ARKL5	377	PfamB2828_Arath_ARKL6	Arath_ARKL6	378
PfamB2828_Arath_ARKL7	Arath_ARKL7	379	PfamB2828_Arath_ARKL6	Arath_ARKL6	378
PfamB2828_Arath_ARKL7	Arath_ARKL7	379	PfamB2828_Arath_ARKL8	Arath_ARKL8	380
结构域	参考蛋白	SEQ ID NO：	PfamB2828_Arath_ARKL8	Arath_ARKL8	380
结构域	参考蛋白	SEQ ID NO：	PfamB2828_Arath_ARKL9	Arath_ARKL9	381
PfamB2828_Arath_ARKL10	Arath_ARKL10	382	PfamB2828_Arath_ARKL9	Arath_ARKL9	381

结构域	参考蛋白	SEQ ID NO：
结构域	参考蛋白	SEQ ID NO：	PfamB2828_Arath_ARKL11	Arath_ARKL11	383
PfamB2828_Arath_ARKL12	Arath_ARKL12	384	PfamB2828_Arath_ARKL11	Arath_ARKL11	383
PfamB2828_Arath_ARKL12	Arath_ARKL12	384	PfamB2828_Poptr_ARKL1	Poptr_ARKL1	385
PfamB2828_Poptr_ARKL2	Poptr_ARKL2	386	PfamB2828_Poptr_ARKL1	Poptr_ARKL1	385
PfamB2828_Poptr_ARKL2	Poptr_ARKL2	386	PfamB2828_Poptr_ARKL3	Poptr_ARKL3	387
PfamB2828_Poptr_ARKL4	Poptr_ARKL4	388	PfamB2828_Poptr_ARKL3	Poptr_ARKL3	387
PfamB2828_Poptr_ARKL4	Poptr_ARKL4	388	PfamB2828_Poptr_ARKL5	Poptr_ARKL5	389
PfamB2828_Poptr_ARKL6	Poptr_ARKL6	390	PfamB2828_Poptr_ARKL5	Poptr_ARKL5	389
PfamB2828_Poptr_ARKL6	Poptr_ARKL6	390	PfamB2828_Poptr_ARKL7	Poptr_ARKL7	391
PfamB2828_Poptr_ARKL8	Poptr_ARKL8	392	PfamB2828_Poptr_ARKL7	Poptr_ARKL7	391
PfamB2828_Poptr_ARKL8	Poptr_ARKL8	392	PfamB2828_Poptr_ARKL9	Poptr_ARKL9	393
PfamB2828_Poptr_ARKL10	Poptr_ARKL10	394	PfamB2828_Poptr_ARKL9	Poptr_ARKL9	393
PfamB2828_Poptr_ARKL10	Poptr_ARKL10	394	PfamB2828_Medtr_ARKL1	Medtr_ARKL1	395
PfamB2828_Medtr_ARKL2	Medtr_ARKL2	396	PfamB2828_Medtr_ARKL1	Medtr_ARKL1	395
PfamB2828_Medtr_ARKL2	Medtr_ARKL2	396	PfamB2828_Medtr_ARKL3	Medtr_ARKL3	397
PfamB2828_Medtr_ARKL4	Medtr_ARKL4	398	PfamB2828_Medtr_ARKL3	Medtr_ARKL3	397

在表C3-1(受信任匹配)和表C2(与Pfam-B的匹配)中呈现Pfam搜索如SEQ ID NO：409所代表多肽序列的结果。

表C3-1：来自使用SEQ ID NO：409作为查询序列的Pfam搜索的受信任匹配。受信任匹配具有比Pfam中特定结构域的收集临界阈值更高的收集临界阈值。DUF221是具有登录号PF02714的Pfam-A结构域。

结构域	起始	终止	比特(Bits)	E值	比对	模式
结构域	起始	终止	比特(Bits)	E值	比对	模式	DUF221	305	411	44.10	2.3e-12	Align	fs

表C3-2：与Pfam-B的匹配

结构域	起始	终止	比对
结构域	起始	终止	比对	Pfam-B_1332	1	110	Align
Pfam-B_4698	144	233	Align	Pfam-B_1332	1	110	Align
Pfam-B_4698	144	233	Align	Pfam-B_131006	234	304	Align

实施例5：在实施本发明方法中有用的多肽序列的亚细胞定位预测

用于蛋白质定位的实验方法的范围从免疫定位至使用绿色荧光蛋白(GFP)或β-葡糖醛酸酶(GUS)对蛋白质加标签。例如，使用与GUS报道基因融合的GRF多肽来瞬时地转化洋葱上皮细胞(van der Knapp等人(2000)Plant Phys 122：695-704)。将细胞核鉴定为GRF多肽的亚细胞区室。鉴定GRF多肽的亚细胞区室化的此类方法是本领域熟知的。

通过多重序列比对、随后通过目视检查在表A的GRF多肽的WRC结构域(CRRTDGKKWRC)中找到预测的核定位信号(NLS)。NLS是具有带正电荷的赖氨酸或精氨酸的一个或多个短序列。

从序列数据进行蛋白质定位的计算预测。在本领域技术人员熟知的算法当中，例如PSort、TargetP、ChloroP、LocTree、Predotar、LipoP、MITOPROT、PATS、PTS1、SignalP等可在瑞士生物信息研究所维护的ExPASy蛋白质组工具处获得。

LOCtree是可以预测非植物和植物真核生物以及原核生物中非膜蛋白的亚细胞定位和DNA-结合倾向的算法。LOCtree将真核动物蛋白划分成5个亚细胞类别之一，而将植物蛋白划分成6个亚细胞类别之一，并且原核蛋白质划分成3个亚细胞类别之一。

下文表D显示使用SEQ ID NO：2的多肽序列信息的LOCtree输出结果。高置信度预测具有大于5的可靠性指数值。

表D使用SEQ ID NO：2的多肽序列信息的LOCtree输出结果。

预测位置	可靠性指数	中间定位预测(体系树中不同SVM的输出结果)	可靠性指数
预测位置	可靠性指数	中间定位预测(体系树中不同SVM的输出结果)	可靠性指数	DNA结合的	6	不分泌的，胞核，DNA结合的	8，6，9

使用LOCTree算法，如SEQ ID NO：2所代表的GRF多肽的预测亚细胞区室是细胞核。

实施例6：与实施本发明方法中有用的多肽序列相关的测定法

在本发明方法中有用的GRF多肽(至少以它们的天然形式)一般，但并非必需具有转录调节活性和与其他蛋白质相互作用的能力。可以使用本领域熟知的技术(例如在Current Protocols in Molecular Biology，第1和2卷，Ausubel等人(1994)，Current Protocols中)轻易地在体外或体内确定DNA结合活性和蛋白质-蛋白质相互作用。GRF多肽能够在酵母细胞中转录地激活报道基因(Kim和Kende(2004)Proc Natl Acad Sci 101(36)：13374-13379)。使用酵母双杂交蛋白质-蛋白质相互作用测定法，GRF多肽也能够在酵母细胞中与GRF相互作用因子多肽(GIF1至GIF3；又叫做SYT1至SYT3)在体内相互作用(上文的Kim和Kende)。体外结合测定法也用来显示GRF多肽和GIF(也称作SYT)多肽是相互作用的配偶物(上文的Kim和Kende)。在该出版物中描述的实验用于表征GRF多肽并且是本领域熟知的。

实施例7：在实施本发明方法中有用的多肽序列的拓扑结构预测

TargetP 1.1预测真核蛋白的亚细胞定位。基于任何氨基端前序列：叶绿体转运肽(cTP)、线粒体靶向肽(mTP)或分泌途径信号肽(SP)的预测存在性进行定位指派。作为最终预测基础的评分并不真正是概率，并且它们不是必需地加合成一体。然而，根据TargetP，具有最高评分的定位是最可能的，并且评分之间的关系(可靠性级别)可以指示该预测具有多大确定性。可靠性级别(RC)范围从1至5，其中1表示最可靠的预测。TargetP在丹麦技术大学(Technical University of Denmark)的服务器上维护。

对于预测含有氨基端前序列的序列而言，也可以预测潜在的切割位点。

可以选择许多参数，如生物组别(非植物或植物)、临界值集合(无、预定义的临界值集合或用户指定的临界值集合)和切割位点预测的计算(是或否)。

在表E1中呈现如SEQ ID NO：121所代表的多肽序列的TargetP 1.1分析的结果。选择“植物”生物组别，未定义临界值，并且对转运肽的预测长度提出要求。如SEQ ID NO：121所代表的多肽序列的亚细胞定位有可能是细胞质，没有预测到转运肽(SignalP)或核定位信号(PredictNLS)。

表E1：如SEQ ID NO：121所代表的多肽序列的TargetP 1.1分析

长度(AA)	109
长度(AA)	109	叶绿体转运肽	0.098
线粒体转运肽	0.404	叶绿体转运肽	0.098
线粒体转运肽	0.404	分泌途径信号肽	0.025
其他亚细胞靶向	0.450	分泌途径信号肽	0.025
其他亚细胞靶向	0.450	预测的位置	/
可靠性级别	5	预测的位置	/
可靠性级别	5	预测的转运肽长度	/

许多其他算法可以用来进行此类分析，包括：

·在丹麦技术大学服务器上维护的ChloroP 1.1；

·在澳大利亚布里斯班昆士兰大学生物科学研究所的服务器上维护的Protein Prowler亚细胞定位预测者1.2版；

·在加拿大阿伯特省埃德蒙顿市阿尔伯塔大学的服务器上维护的PENCE蛋白组分析专家PA-GOSUB 2.5；

·在丹麦技术大学服务器上维护的TMHMM。

在表E2中呈现如SEQ ID NO：169所代表的多肽序列的TargetP 1.1分析的结果。选择“植物”生物组别，未定义临界值，并且对转运肽的预测长度提出要求。如SEQ ID NO：169所代表的多肽序列的亚细胞定位可以是线粒体；然而，应当指出可靠性级别是5(即，最低的可靠性级别)。

表E2：如SEQ ID NO：169所代表的多肽序列的TargetP 1.1分析结果

通过在丹麦技术大学生物序列分析中心服务器上维护的TMHMM程序鉴定到两个跨膜结构域。氨基端位于内部的概率是0.997。在表F中给出关于定向的进一步细节：

表F：TMHMM 2.0的结果

定向	起始-终止残基
定向	起始-终止残基	内部	142
跨膜螺旋	4365	内部	142
跨膜螺旋	4365	外部	6674
跨膜螺旋	7592	外部	6674

定向	起始-终止残基
定向	起始-终止残基	内部	93105

许多其他算法可以用来进行此类分析，包括：

在丹麦技术大学服务器上维护的ChloroP 1.1；

在澳大利亚布里斯班昆士兰大学生物科学研究所的服务器上维护的Protein Prowler亚细胞定位预测者1.2版；

在加拿大阿伯特省埃德蒙顿市阿尔伯塔大学的服务器上维护的PENCE蛋白组分析专家PA-GOSUB 2.5；

实施例8：ARKL多肽的功能测定法

遍在蛋白化测定法基本上如Stone等人2005年所述实施。GST标记的ARKL蛋白质在30℃和pH 7.5与酵母E1、纯化的E2At UBCC8和遍在蛋白(Sigma)孵育。将反应终止并通过SDS-PAGE电泳、随后通过使用遍在蛋白抗体的蛋白质印迹法分析。

通过TPEN处理的珠结合GST-ARKL蛋白与ZnCl₂孵育进行锌螯合实验。

实施例9：在实施本发明方法中有用的多肽序列的跨膜拓扑结构预测

使用TMHMM V 2.0算法(Krogh等人2001J Mol Biol，305，567-580)来预测SEQ ID NO：409中的跨膜螺旋。

如下文所示，存在4个预测的跨膜螺旋。还显示了所述螺旋的氨基酸残基位置。至于预测跨膜螺旋之间的环，对于残基28-85与172-373之间的环而言位于膜的内侧并且对于残基109-151之间的环而言位于膜的外侧。

#预测的TMH的序列数： 4

#TMH中氨基酸的序列Exp数： 89.26923

#序列Exp数，头60个氨基酸： 22.14249

#氨基端在内部的序列总概率：0.04519

#序列可能的N端信号序列

起止终止(氨基酸坐标)

实施例10：

a)克隆如SEQ ID NO：1所代表的核酸序列

除非另外说明，重组DNA技术根据(Sambrook(2001)MolecularCloning：a laboratory manual，第3版Cold Spring Harbor LaboratoryPress，CSH，New York)或在Ausubel等人(1994)，Current Protocols inMolecular Biology，Current Protocols第1卷和第2卷中描述的标准方案进行。用于植物分子研究工作的标准材料和方法在BIOS科学出版有限责任公司(BIOS Scientific Publications Ltd(英国))和Blackwell科学出版社(Blackwell Scientific Publications(英国))出版的R.D.D.Croy的PlantMolecular Biology Labfax(1993)中描述。

使用从mRNA合成的拟南芥cDNA库作为模板，通过PCR扩增编码如SEQ ID NO：2所代表的GRF多肽序列的拟南芥cDNA，其中所述mRNA从混合的植物组织提取。包括用于Gateway重组的AttB位点的以下引物用于PCR扩增：

1)Prm 10010(SEQ ID NO：118，有义)：

5’-GGGGACAAGTTTGTACAAAAAAGCAGGCTTAAACAATGATGAGTCTAAGTGGAAGTAG-3’

2)Prm 10011(SEQ ID NO：119，反向，互补)：

5’-GGGGACCACTTTGTACAAGAAAGCTGGGTAGCTCTACTTAATTAGCTACCAG-3’

使用Hifi Taq聚合酶在标准条件进行PCR。也使用标准方法扩增并纯化具有预期长度的PCR片段(包括attB位点)。随后进行Gateway方法的第一步骤，即BP反应，在此期间，所述PCR片段与pDONR201质粒在体内重组以产生根据Gateway术语学的“进入克隆(entry clone)”。质粒pDONR201作为

技术的部分从Invitrogen购买。

b)在本发明方法中使用的编码RAA1样多肽的核酸序列的克隆

使用定制的稻幼苗cDNA文库(在pCMV Sport 6.0内；Invitrogen，Paisley，UK)作为模板通过PCR扩增在本发明方法中使用的核酸序列。使用Hifi Taq DNA聚合酶，在标准条件下利用在50μl PCR混合物中的200ng模板进行PCR。所用的引物是prm09129(SEQ ID NO：122；有义，起始密码子为粗体字)：

5’ggggacaagtttgtacaaaaaagcaggcttaaaca

tcaggggtttgggtg 3’

和prm09988(SEQ ID NO：123；反义，互补)：

5’ggggaccactttgtacaagaaagctgggttgtcgcataggtcaatttagg 3’，

其中所述引物包括用于Gateway重组的AttB位点。也使用标准方法纯化扩增的PCR片段。随后进行Gateway方法的第一步骤，即BP反应，在此期间所述PCR片段与pDONR201质粒在体内重组以产生根据Gateway术语学的“进入克隆”，pRAA1样。质粒pDONR201作为

技术的部分从Invitrogen购买。

c)编码SYR多肽的核酸序列的基因克隆

DNA操作：除非另外说明，重组DNA技术根据(Sambrook(2001)Molecular Cloning：a laboratory manual，第3版，Cold Spring HarborLaboratory Press，CSH，New York)或Ausubel等人(1994)，CurrentProtocols in Molecular Biology，Current Protocols第1卷和第2卷中描述的标准方案进行。用于植物分子研究工作的标准材料和方法在BIOS科学出版有限责任公司(BIOS Scientific Publications Ltd(英国))和Blackwell科学出版社(Blackwell Scientific Publications(英国))出版的R.D.D.Croy的Plant Molecular Biology Labfax(1993)中描述。

使用稻幼苗cDNA文库(Invitrogen，Paisley，UK)作为模板，通过PCR扩增稻SYR基因。在逆转录从幼苗提取的RNA后，将cDNA克隆入pCMVSport 6.0。该库的平均插入物大小是1.5kb并且原始克隆数目是1.59x10⁷cfu数量级。在6x10¹¹cfu/ml的首轮扩增后，确定原始滴度是9.6x10⁵cfu/ml。提取质粒后，在50μl PCR混合物中使用200ng模板。引物prm08170(SEQ ID NO：170；有义，起始密码子为粗体，AttB1位点为斜体：

5′-

gaaggtgtaggtgctagg-3′)

和prm08171(SEQ ID NO：171；反义，AttB1位点为斜体：5′-aaaaacaaaaataaattcccc-3′)，

用于PCR扩增，其中所述引物包括用于Gateway重组的AttB位点。使用Hifi Taq聚合酶在标准条件进行PCR。也使用标准方法扩增并纯化具有正确大小的PCR片段(包括attB位点)。随后进行Gateway方法的第一步骤，即BP反应，在此期间所述PCR片段与pDONR201质粒在体内重组以产生根据Gateway术语学的“进入克隆”，pSYR。质粒pDONR201作为

技术的部分从Invitrogen购买。

d)在本发明方法中使用的编码ARKL样多肽的核酸序列的克隆

使用定制的稻幼苗和穗cDNA文库(在pCMV Sport 6.0内；Invitrogen，Paisley，UK)作为模板通过PCR扩增在本发明方法中使用的核酸序列。使用Hifi Taq DNA聚合酶，在标准条件下利用在50μl PCR混合物中的200ng模板进行PCR。所用的引物是prm 04873(SEQ ID NO：404；有义，起始密码子为粗体字)：

5’-ggggacaagtttgtacaaaaaagcaggcttaaacaatggatgatcacatgggaaga-3’

和prm04874(SEQ ID NO：405；反义，互补)：

5’-ggggaccactttgtacaagaaagctgggttttggtttctgaagaagcacc-3’，

其中所述引物包括用于Gateway重组的AttB位点。也使用标准方法纯化扩增的PCR片段。随后进行Gateway方法的第一步骤，即BP反应，在此期间所述PCR片段与pDONR201质粒在体内重组以产生根据Gateway术语学的“进入克隆”，pARKL。质粒pDONR201作为技术的部分从Invitrogen购买。

e)在本发明方法中使用的编码YTP多肽的核酸的克隆

使用定制的稻幼苗cDNA文库(在pCMV Sport 6.0内；Invitrogen，Paisley，UK)作为模板通过PCR扩增在本发明方法中使用的核酸序列。使用Hifi Taq DNA聚合酶，在标准条件下利用在50μl PCR混合物中的200ng模板进行PCR。所用的引物是(SEQ ID NO：546；有义，起始密码子为粗体字)：

5’-ggggacaagtttgtacaaaaaagcaggcttaaacaatggacaccgcgtcgt-3’

和(SEQ ID NO：547；反义，互补)：

5’-ggggaccactttgtacaagaaagctgggtcagcacttgcattagatggat-3’，

其中所述引物包括用于Gateway重组的AttB位点。也使用标准方法纯化扩增的PCR片段。随后进行Gateway方法的第一步骤，即BP反应，在此期间所述PCR片段与pDONR201质粒在体内重组以产生根据Gateway术语学的“进入克隆”，pENTR-YTP1。质粒pDONR201作为技术的部分从Invitrogen购买。

实施例11：

a)使用如SEQ ID NO：1所代表的核酸序列的表达载体构建

包含SEQ ID NO：1的进入克隆随后在LR反应中与用于稻转化法的目的载体一起使用。这种载体含有在T-DNA边界内部的植物选择标记、筛选标记表达盒和意图与已经克隆在该进入克隆中的目的核酸序列发生LR体内重组的Gateway盒作为功能性元件。用于组成型表达的稻GOS2启动子(SEQ ID NO：117)位于该Gateway盒上游。

在LR重组步骤后，所得表达载体pGOS2::GRF(图4)根据本领域熟知的方法转化至农杆菌菌株LBA4044中。

b)使用如SEQ ID NO：120所代表的核酸序列的表达载体构建

包含SEQ ID NO：120的进入克隆随后在LR反应中与用于稻转化的目的载体一起使用。这种载体含有在T-DNA边界内部的植物选择标记、筛选标记表达盒和意图与已经克隆在该进入克隆中的目的核酸序列发生LR体内重组的Gateway盒作为功能性元件。用于组成型表达的稻GOS2启动子(SEQ ID NO：124)位于该Gateway盒上游。在备选的实施方案中，用于组成型表达的稻HMGP启动子(SEQ ID NO：125)位于该Gateway盒上游。

在LR重组步骤后，所得表达载体pGOS2::RAA1样(图9)或pHMGP::RAA1样根据本领域熟知的方法转化至农杆菌菌株LBA4044中。

c)使用编码SYR多肽的核酸序列的表达载体构建

进入克隆pSYR随后在LR反应中与用于稻转化的目的地载体一起使用。这种载体含有在T-DNA边界内部的植物选择标记、筛选标记表达盒和意图与已经克隆在该进入克隆中的目的序列发生LR体内重组的Gateway盒作为功能性元件。用于组成型表达的稻GOS2启动子(SEQ IDNO：211)位于该Gateway盒上游。制备了相似的载体构建体，不过是用高速泳动族蛋白启动子(HMGP，SEQ ID NO：200或SEQ ID NO：210)，而不是用GOS启动子。

在LR重组步骤后，将所得表达载体pGOS2::SYR(带GOS2启动子)和pHMGP::SYR(带HMGP启动子)(二者均用于SYR组成型表达)(图13)转化到农杆菌菌株LBA4044中并且随后转化至稻植物。

d)使用如SEQ ID NO：212所代表的核酸序列的表达载体构建

包含SEQ ID NO：212的进入克隆随后在LR反应中与用于稻转化的目的载体一起使用。这种载体含有在T-DNA边界内部的植物选择标记、筛选标记表达盒和意图与已经克隆在该进入克隆中的目的核酸序列发生LR体内重组的Gateway盒作为功能性元件。用于根特异性表达的稻GOS2启动子(SEQ ID NO：406)位于该Gateway盒上游。

在LR重组步骤后，所得表达载体pGOS2::ARKL(图18)根据本领域熟知的方法转化至农杆菌菌株LBA4044中。

e)使用如SEQ ID NO：408所代表的核酸序列的表达载体构建

包含SEQ ID NO：408的进入克隆随后在LR反应中与用于稻转化的目的载体一起使用。这种载体含有在T-DNA边界内部的植物选择标记、筛选标记表达盒和意图与已经克隆在该进入克隆中的目的核酸序列发生LR体内重组的Gateway盒作为功能性元件。用于根特异性表达的稻GOS2启动子(SEQ ID NO：548)位于该Gateway盒上游。

在LR重组步骤后，所得表达载体pGOS2::YTP1(图23)根据本领域熟知的方法转化至农杆菌菌株LBA4044中。

实施例12：植物转化

稻转化

使用含有所述表达载体的农杆菌来转化稻植物。将粳稻栽培品种日本晴(Nipponbare)的成熟干燥种子脱壳。通过如下方式实施消毒：在70％乙醇中孵育1分钟，随后在0.2％HgCl₂中孵育30分钟，随后用无菌蒸馏水洗涤6次15分钟。无菌的种子随后在含有2，4-D的培养基(愈伤组织诱导培养基)上萌发。在黑暗中孵育4周后，将胚发生的盾片衍生的愈伤组织切下并在相同的培养基上增殖。2周后，将所述愈伤组织通过在同一种培养基上传代培养另外2周进行繁殖或增殖。胚发生的愈伤组织片在新鲜培养基上传代培养3日，随后共培育(以助长细胞分裂活性)。

将含有每一单个表达载体的农杆菌菌株LBA4404独立地用于共培育。农杆菌接种在含有适宜抗生素的AB培养基上并在28℃培养3日。随后收集细菌并在液体共培育培养基中悬浮至密度(OD₆₀₀)约1。该混悬液随后转移至培养皿内并将所述愈伤组织浸入此混悬液中15分钟。将所述愈伤组织随后在滤纸上蘸干并转移至固化的共培育培养基，并在25℃于黑暗中孵育3日。共培育的愈伤组织在含2，4-D的培养基上在28℃于黑暗中在选择剂存在下培育4周。在此期间，迅速生长的抗性愈伤组织团发育。在转移这种材料至再生培养基并在光照下孵育后，释放了胚发生潜能并且苗在随后4至5周内发育。将苗从愈伤组织切下并且在含有植物生长素的培养基上孵育2至3周，将苗从所述培养基转移至土壤。硬化的苗在温室中于高湿度和短日照下培育。

对于每一个构建体，产生大约35个独立的T0稻转化体。将原代转化体从组织培养箱转移至温室。在定量PCR分析验证T-DNA插入物的拷贝数后，仅保留显示所述选择剂抗性的单拷贝转基因植物用于收获T1种子。种子随后在移栽后3至5个月收获。该方法以超过50％的比例产生单基因座转化体(Aldemita和Hodges1996，Chan等1993，Hiei等1994)。

实施例13：表型评价方法

13.1-1评价建立概述

产生大约35个独立的T0稻转化体。将原代转化体从组织培养室转移至温室以培育并收获T1种子。留下6个事件，其中所述事件的T1子代以3∶1比例对所述转基因的存在/不存在分离。对于这些事件中的每个事件，通过监测目视标记表达选出大约10株含有该转基因的T1籽苗(杂合子和纯合子)和大约10株缺少该转基因的T1籽苗(失效合子)。以随机位置并排生长转基因植物和相应的失效合子。温室条件是短日照(12小时光照)，在光照下28℃和在黑暗中22℃，和70％相对湿度。

13.1-2对于用稻GOS2启动子或HMGP启动子控制下的SYR所转化的植物的评价建立

产生大约15至20个独立T0稻转化体。将原代转化体从组织培养室转移至温室以培育并收获T1种子。留下下述8个事件，其中所述事件的T1子代对所述转基因的存在/不存在以3∶1比例分离。对于这些事件中的每个事件，通过监测目视标记表达选出大约10株含有该转基因的T1籽苗(杂合子和纯合子)和大约10株缺少该转基因的T1籽苗(失效合子)。将选择的T1植物转移至温室。每株植物接受唯一条码标签以将表型分型数据无误地关联至相应植物。在直径10cm花钵的土壤中在以下的环境设置中培育选择的T1植物：光周期＝11.5小时，昼间光强度＝30,000勒克斯或更大，昼间温度＝28℃或更高，夜间温度＝22℃，相对湿度＝60-70％。

总体建立

植物从播种期至成熟期数次通过数字成像室。在每个时间点上，从至少6个不同角度拍摄每株植物的数字图像(2048×1536像素，1600万颜色)。

4个T1事件在T2世代中按照如对T1世代相同的评价方法进一步评估，但是每个事件采用更多个体。植物从播种期至成熟期数次通过数字成像室。在每个时间点上，从至少6个不同角度拍摄每株植物的数字图像(2048×1536像素，1600万颜色)。

13.2统计分析：F-检验

使用两因素ANOVA(变量分析)作为总体评价植物表型特征的统计模型。对于用本发明基因转化的全部事件的全部植物的全部所测量参数实施F检验。实施F检验以检查该基因对全部转化事件的影响并验证该基因的整体作用(又称作基因总体作用)。真实基因总体作用显著性的阈值对于所述F检验设置在5％概率水平上。显著性F检验值指出基因作用，这意味不仅仅是基因的存在或位置才造成表型上的差异。

因为实施了具有重叠事件的两个实验，故进行联合分析。这用于检验对这两个实验影响的一致性，并且如果一致，则用于积累来自两个实验的证据以提高结论的可信度。所用的方法是考虑数据的多重水平结构的混合模型法(即实验-事件-分离子)。通过比较似然比检验与卡方分布(chi squaredistribution)获得P-值。

因为实施了具有重叠事件的两个实验，故进行联合分析。这用于检验对这两个实验影响的一致性，并且如果一致，则用于积累来自两个实验的证据以提高结论的可信度。所用的方法是考虑数据的多重水平结构的混合模型法(即实验-事件-分离子)。通过比较似然比检验与卡方分布获得P-值。

13.3测量的参数

生物量相关的参数测量(一般方法)

植物地上部分面积(或叶生物量)通过计数来自植物地上部分的数字图像上与背景区别的像素总数而确定。这个值对相同时间点上从不同角度拍摄的画面进行平均化并且通过校正转化成以平方mm表述的物理表面值(physical surface value)。实验显示以这种方式测量的地上部分植物面积与地上植物部分的生物量相关。地上部分面积是在植物已经达到其最大叶生物量的时间点上所测量的面积。早期生长势是萌发后3周的植物(籽苗)地上部分面积。根生物量的增加表述为总根生物量增加(测量为植物寿命期间所观察到的根最大生物量)；或表述为根苗指数增加(测量为根和苗的活跃生长时间中根质量与苗质量之间的比例)。

早期生长势通过计数来自植物部分的与背景区别的像素总数确定。这个值对相同时间点上从不同角度拍摄的画面进行平均化并且通过校正转化成以平方mm表述的物理表面值。下述结果针对萌发后3周的植物。

种子相关的参数测量(一般方法)

将成熟的原发花序收获、计数、装袋、加条形码标记并且随后在干燥箱内于37°干燥3日。随后将所述花序脱粒，并且收集和计数全部种子。使用吹气装置将充实粒与空粒分开。弃去空粒并且再次计数剩余部分。充实粒在分析天平上称重。充实种子数通过计数分离步骤后仍留下的充实粒的数目确定。每株植物的种子总产量通过称量从一株植物收获的全部充实粒而测量。每株植物的种子总数通过计数从一株植物收获的壳数测量。千粒核重(TKW)从计数的充实种子数及它们的总重量外推出来。收获指数(HI)在本发明中定义为每株植物种子总产量与地上部分面积(mm²)之间的比率，乘以系数10⁶。如本发明中定义的每花序总花数是种子总数与成熟原发花序数之间的比率。如本发明中定义的种子充实率是充实种子数对种子(或小花)总数的比例(表述为％)。

氮利用效率筛选(对于用SYR转化的植物)

来自T2种子的稻植物在盆栽土壤中于正常条件下培育，除了营养液之外。从移植至成熟期间用含有降低的、通常7至8倍之间更少的氮(N)含量的特定营养液浇灌所述花钵。栽培的剩余部分(植物成熟、种子收获)与不在非生物胁迫下培育的植物相同。如对正常条件下详述那样记录生长和产量参数。

干旱胁迫筛选(对于用SYR转化的植物)

在盆栽土壤中在正常条件下培育来自T1、T2或其他世代的稻植物直至它们达到抽穗期。随后将它们转移至灌溉减少的“干燥”区。将湿度探测器插入随机选择的花钵内，以监测土壤水含量(SWC)。当SWC下降低于某个阈值时，自动地对所述植物连续再灌溉直至再次达到正常水平。随后将植物再次转移至正常条件。栽培的剩余部分(植物成熟、种子收获)与不在非生物胁迫条件下培育的植物相同。如对正常条件下详述那样记录生长和产量参数。施加的干旱条件是如上文定义的“严重干旱条件”。

实施例14：表型评价表达编码如SEQ ID NO：2所代表GRF多肽的核酸序列的转基因稻植物的结果

下文呈现了评价转基因稻植物的结果，其中所述的转基因稻植物在用于组成型表达的GOS2启动子控制下表达编码如SEQ ID NO：2所代表的GRF多肽的核酸序列并且在正常生长下培育。

如表G中所示，与相应的失效合子(对照)相比，在转基因植物的早期生长势、地上部分生物量、每株植物总种子产量、种子充实率、收获指数和千粒核重(TKW)方面存在显著提高。

表G：评价转基因稻植物的结果，其中所述的转基因稻植物在用于组成型表达的GOS2启动子控制下表达编码如SEQ ID NO：2所代表的GRF多肽的核酸序列。

性状	T1世代中6个事件的总体平均提高％
性状	T1世代中6个事件的总体平均提高％	地上部分生物量	2％
早期生长势	13％	地上部分生物量	2％
早期生长势	13％	每株植物总种子产量	12％
种子充实率	5％	每株植物总种子产量	12％
种子充实率	5％	收获指数	11％
TKW	11％	收获指数	11％

实施例15：

a)表型评价表达编码其他GRF多肽的核酸序列的转基因稻植物的结果

产生了转基因稻植物，如下文表H中所示，所述转基因稻植物独立地在用于组成型表达的GOS2启动子控制下表达编码其他GRF多肽的核酸序列。

对于这三种构建体，与相应的失效合子(对照)相比，在转基因植物的种子千粒核重(TKW)方面存在提高。这种提高比表达编码如SEQ ID NO：2所代表GRF多肽的核酸序列的转基因植物的种子较不明显。

表H：转基因稻植物中在用于组成型表达的GOS2启动子控制下所测试的其他GRF核酸和多肽序列

测试的GRF多肽	核酸SEQ ID NO	多肽SEQ ID NO
测试的GRF多肽	核酸SEQ ID NO	多肽SEQ ID NO	AT4G37740	SEQ ID NO：15	SEQ ID NO：16
AT2G36400	SEQ ID NO：7	SEQ ID NO：8	AT4G37740	SEQ ID NO：15	SEQ ID NO：16
AT2G36400	SEQ ID NO：7	SEQ ID NO：8	AT2G22840	SEQ ID NO：5	SEQ ID NO：6

b)表型评价表达RAA1样核酸的转基因植物的结果

评价非胁迫条件下在组成型启动子(无论是GOS2或HMGP)控制下表达RAA1样核酸的转基因稻植物的结果如下：观察到千粒核重提高至少2％，并且观察到至少一种以下参数：苗根指数、总根生物量、每花穗花数提高多于5％。还在降低的氮可利用性条件下，观察到根生物量、高度和绿度指数之一项或多项提高。

c1)测量在缺氮条件下生长的pGOS2::SYR转化体的产量相关参数：

当分析如上文所述的种子时，本发明人发现用pGOS2::SYR基因构建体转化并在缺氮胁迫下生长的植物与缺少SYR转基因的植物相比具有更高的表现为充实种子数(提高多于5％)、总种子重量(提高多于5％)和TKW(提高多于2.5％)的种子产量。也观察到苗生物量(多于5％)和根生物量(几个品系多于5％)的提高。

c2)测量在严重干旱条件下生长的pGOS2::SYR转化体的产量相关参数：

当分析如上文所述的种子时，本发明人发现用pGOS2::SYR基因构建体转化并在严重干旱条件下生长的植物与缺少SYR转基因的植物相比具有更高的表现为总种子重量(提高多于5％)、充实率(提高多于5％)和收获指数(提高多于5％)的种子产量。

d)表型评价表达Orysa_ARKL1核酸的转基因植物的结果

下文呈现了评价在非胁迫条件下表达Orysa_ARKL1核酸的转基因稻植物的结果。观察到出苗生长势(早期生长势)、总种子产量、充实种子数和收获指数提高至少5％，并且观察到千粒核重提高3％。

表I.表型评价结果。

性状	非胁迫条件下转基因植物/对照植物中的提高％
性状	非胁迫条件下转基因植物/对照植物中的提高％	总种子产量	11
充实种子数	8	总种子产量	11
充实种子数	8	TKW	3
早期生长势	11	TKW	3
早期生长势	11	收获指数	6

也在如上文所述的干旱胁迫条件下评价表达Orysa ARKL1核酸的转基因稻植物。与相应的对照相比，转基因植物中相同参数(种子产量、充实种子数、早期生长势和收获指数)也提高，尽管以较低的程度提高。

e)表型评价表达YTP1核酸的转基因植物的结果

下文呈现了评价在非胁迫条件下表达YTP1核酸的转基因稻植物的结果。观察到总种子产量、种子充实率、每穗花数、收获指数提高至少5％，并且千粒核重提高2％。

下文呈现了评价在非胁迫条件下表达YTP1核酸的转基因稻植物的结果。观察到总种子重量、充实种子数、充实率、收获指数和千粒核重提高(表J)。

表J.表型评价结果。

产量相关性状	相对于对照植物而言转基因植物中的提高％
产量相关性状	相对于对照植物而言转基因植物中的提高％	总种子产量	10

产量相关性状	相对于对照植物而言转基因植物中的提高％
产量相关性状	相对于对照植物而言转基因植物中的提高％	种子充实率	6
每穗花数	7	种子充实率	6
每穗花数	7	收获指数	12
千粒核重	2	收获指数	12

实施例16：其他作物转化的例子

谷物转化

玉米(Zea mays)的转化用Ishida等人(1996).Nature Biotech 14(6)：745-50所述方法的改良形式进行。在谷物中，转化是基因型依赖的并且仅特定基因型适合于转化和再生。近交系A188(明尼苏达大学)或以A188作为亲本的杂交体是用于转化的供体材料的良好来源，不过其他基因型也可以成功地使用。谷穗从授粉后大约11日(DAP)的谷物植物收获，此时不成熟的胚的长度是大约1至1.2mm。不成熟的胚与含有表达载体的根癌农杆菌共培育，并且转基因植物通过器官发生过程回收。将切下的胚在愈伤组织诱导培养基上、随后在玉米再生培养基上培育，其中所述的培养基含有选择剂(例如咪唑啉酮，不过可以使用不同的选择标记)。培养板在25℃于光照下孵育2-3周，或直至苗发育。将来自每个胚的绿色苗转移至玉米生根培养基并在25℃孵育2-3周，直至根发育。将生根的苗移植至温室中的土壤内。T1种子从显示选择剂耐受性并且含有单拷贝T-DNA插入物的植物产生。

小麦转化

用Ishida等人(1996)Nature Biotech 14(6)：745-50描述的方法进行小麦的转化。栽培品种Bobwhite(可从墨西哥CIMMYT获得)通常用于转化。将不成熟的胚与含有表达载体的根癌农杆菌共培育，并且通过器官发生过程回收转基因植物。与农杆菌孵育后，将所述胚在愈伤组织诱导培养基上、随后于再生培养基上体外培育，其中所述的培养基含有选择剂(例如咪唑啉酮，不过可以使用不同的选择标记)。培养板在25℃于光照下孵育2-3周，或直至苗发育。将来自每个胚的绿色苗转移至生根培养基并在25℃孵育2-3周，直至根发育。将生根的苗移植至温室中的土壤内。T1种子从显示选择剂耐受性并且含有单拷贝T-DNA插入物的植物产生。

大豆转化

根据Texas A&M美国专利5,164,310中描述的改良方法转化大豆。几个商业大豆品种适合通过这种方法转化。栽培品种Jack(从Illinois种子基金会可获得)通常用于转化。将大豆种子消毒用于体外播种。从7日龄的年幼籽苗切除下胚轴、胚根和一片子叶。进一步培育上胚轴和剩余的子叶以发育腋生结节。切下这些腋生结节并与含有表达载体的根癌农杆菌孵育。在共培育处理之后，洗涤外植体并转移至选择培养基。切下再生的苗并置于苗伸长培养基上。将长度不超过1cm的苗置于生根培养基上直至根发育。将生根的苗移植至温室中的土壤内。T1种子从显示选择剂耐受性并且含有单拷贝T-DNA插入物的植物产生。

油菜籽/卡诺拉油菜转化

使用5-6日龄的年幼籽苗的子叶柄和下胚轴作为组织培养用外植体并且根据Babic等人(1998，Plant Cell Rep 17：183-188)进行转化。商业品种Westar(Agriculture Canada)是用于转化的标准品种，不过也可以使用其他品种。将卡诺拉油菜种子作表面消毒用于体外播种。从所述体外籽苗切下带有子叶的子叶柄外植体，并且通过将该叶柄外植体的切口末端浸入细菌悬液用(含有表达载体的)农杆菌接种。所述外植体随后在23℃，16小时光照下于含有3mg/l BAP、3％蔗糖、0.7％植物琼脂的MSBAP-3培养基上培养2日。与农杆菌共培育2日后，将所述叶柄外植体转移至含有3mg/lBAP、头孢噻肟、羧苄青霉素或特美汀(300mg/l)的MSBAP-3培养基上培养7日，并且随后在含有头孢噻肟、羧苄青霉素或特美汀和选择剂的MSBAP-3培养基上培养，直至苗再生。当苗的长度是5-10mm时，切下这些苗并且转移至苗伸长培养基(MSBAP-0.5，含有0.5mg/l BAP)。将长度大约2cm的苗转移至用于根诱导的生根培养基(MS0)。将生根的苗移植至温室中的土壤内。T1种子从显示选择剂耐受性并且含有单拷贝T-DNA插入物的植物产生。

苜蓿转化

使用(McKersie等，1999 Plant Physiol 119：839-847)的方法转化苜蓿的再生性克隆。苜蓿的再生和转化是基因型依赖性的并且因而需要再生性植物。已经描述了获得再生性植物的方法。例如，这些再生性植物可以选自栽培品种Rangelander(Agriculture Canada)或如Brown DCW和AAtanassov(1985.Plant Cell Tissue Culture 4：111-112)所述的任何其他商业苜蓿品种。备选地，已经选择RA3品种(威斯康星大学)用于组织培养(Walker等，1978Am J Bot 65：654-659)。叶柄外植体与含有表达载体的根癌农杆菌C58C1 pMP90(McKersie等，1999Plant Physiol 119：839-847)或LBA4404的过夜培养物共培育。所述外植体在黑暗中于含有288mg/LPro、53mg/L硫代脯氨酸、4.35g/L K₂SO₄和100μm乙酰丁香酮的SH诱导培养基上共培育3日。所述外植体在半浓度的Murashige-Skoog培养基(Murashige和Skoog，1962)中洗涤并铺种在不含乙酰丁香酮而含有合适选择剂和抑止农杆菌生长的合适抗生素的同一种SH诱导培养基上。几周后，将体细胞胚转移至不含生长调节剂、不含抗生素和含有50g/L蔗糖的BOi2Y发育培养基。随后在半浓度的Murashige-Skoog培养基上萌发体细胞胚。将生根的籽苗移植至花钵内并且在温室中培育。T1种子从显示选择剂耐受性并且含有单拷贝T-DNA插入物的植物产生。

棉属植物转化

使用根癌农杆菌，在下胚轴外植体上进行棉花转化。商业品种如Coker130或Coker 312(SeedCo，Lubbock，TX)是用于转化的标准品种，不过也可以使用其他品种。将种子进行表面消毒并在黑暗中萌发。将下胚轴外植体从萌发的籽苗切下呈约1-1.5厘米长。该下胚轴外植体浸没在含有所述表达载体的根癌农杆菌接种物中5分钟，随后在MS+1.8mg/l KNO₃+2％葡萄糖上在24℃于黑暗中共培育约48小时。将所述外植体转移至含有适宜的细菌选择标记和植物选择标记的相同培养基(更换数次)，直至见到胚发生的愈伤组织。将所述愈伤组织分开并传代培养直至体细胞胚出现。从体细胞胚衍生的小植物在生根培养基上成熟直至根发育。将生根的苗移植至温室中的盆栽土壤内。T1种子从显示选择剂耐受性并且含有单拷贝T-DNA插入物的植物产生。

实施例17：非生物胁迫筛选的例子

干旱筛选

来自所选数目事件的植物在盆栽土壤中在正常条件下培育直至它们达到抽穗期。随后将它们转移至灌溉减少的“干燥”区。将湿度探测器插入随机选择的花钵内，以监测土壤水含量(SWC)。当SWC下降低于某个阈值时，自动地对所述植物连续地再灌溉直至再次达到正常水平。随后将植物转移至正常条件。栽培的剩余部分(植物成熟、种子收获)与不在非生物胁迫条件下培育的植物相同。如对正常条件下详述那样记录生长和产量参数。

盐胁迫筛选

植物在由椰子纤维和argex(3∶1比率)组成的基质上培育。在温室中移植小植物后，在头两周期间使用正常营养液。在这两周后，添加25mM盐(NaCl)至所述营养液，直至收获植物。如对正常条件下详述那样记录生长和产量参数。

降低的营养(氮)可利用性筛选

在除营养液之外的正常条件下在盆栽土壤中培育来自6个事件(T2种子)的植物。从移植至成熟期间用含有降低的、通常7至8倍之间更少的氮(N)含量的特定营养液浇灌所述花钵。培育的其余部分(植物成熟、种子收获)与不在非生物胁迫下培育的植物相同。如对正常条件下详述那样记录生长和产量参数。

Claims

1.用于相对于对照植物而言提高植物中产量相关性状的方法，所述方法包括调节植物中编码选自以下多肽的核酸序列表达，

-生长调节因子(GRF)多肽，

-RAA1样多肽，

-SYR多肽，

-ARKL多肽，

-和

-YTP多肽，

和任选地选择具有提高的产量相关性状的植物。

2.根据权利要求1的方法，其中：

-所述GRF多肽包含：

(i)与SEQ ID NO：115所代表的QLQ结构域具有至少50％、55％、60％、65％、70％、75％、80％、85％、90％、95％、98％、99％或更多氨基酸序列同一性的结构域；和

(ii)与SEQ ID NO：116所代表的WRC结构域具有至少50％、55％、60％、65％、70％、75％、80％、85％、90％、95％、98％、99％或更多氨基酸序列同一性的结构域，

-所述RAA1样多肽包含两个或多个以下基序：

(iii)基序1：GVW(V/L)F(SEQ ID NO：162)，

(iv)基序2：LGW(E/S)RY(Y/F)(SEQ ID NO：163)，

(v)基序3：(D/H)L(L/I)S(I/V/L)P(R/K/A)(S/D)F(SEQ ID NO：164)，

(vi)基序4：(H/Y)(F/M)YD(V/I)VVK(N/T)(R/P)(SEQ ID NO：165)，

-所述SYR多肽包含前有保守三肽基序1(SEQ ID NO：173、174、175或176之一)并后接保守基序2(SEQ ID NO：177)的亮氨酸丰富结构域，

-所述ARKL多肽包含一个或多个以下结构域：

(vii)SEQ ID NO：400所代表的ZfC3H2C3结构域或以增加的优选顺序与SEQ ID NO：306至SEQ ID NO.351所代表的一个或多个ZfC3H2C3结构域具有至少50％、55％、60％、65％、70％、75％、80％、85％、90％、95％或更多序列同一性的结构域；和

(viii)以增加的优选顺序与SEQ ID NO：35至SEQ ID NO.398所代表的一个或多个PfamB2828结构域具有至少50％、55％、60％、65％、70％、75％、80％、85％、90％、95％或更多序列同一性的DAR1结构域，

-和

-所述YTP多肽包含

(ix)至少一个跨膜结构域和

(x)DUF221结构域的至少一部分，

和任选地选择具有提高的产量相关性状的植物。

3.根据权利要求1的方法，其中所述GRF多肽包含：(i)具有InterPro登录号IPR014978(PFAM登录号PF08880)的QLQ结构域；(ii)具有InterPro登录号IPR014977(PFAM登录号PF08879)的WRC结构域；和(iii)包含在保守间隔(CX₉CX₁₀CX₂H)中的3个Cys和一个His残基的转录效应子(ET)结构域。

4.根据权利要求1的方法，其中所述GRF多肽以增加的优选顺序与SEQ ID NO：2所代表的GRF多肽或与本文表A中给出的任一多肽序列具有至少50％、55％、60％、65％、70％、75％、80％、85％、90％、95％、98％、99％或更多氨基酸序列同一性。

5.根据任一前述权利要求的方法，其中所述的编码GRF多肽的核酸序列由表A中给出的任一核酸序列SEQ ID NO或其部分代表或者由能够与表A中给出的任一核酸序列SEQ ID NO杂交的序列代表。

6.根据任一前述权利要求的方法，其中所述的核酸序列编码表A中给出的任一多肽序列SEQ ID NO的直向同源物或旁系同源物。

7.根据任一前述权利要求的方法，其中所述增加的表达通过T-DNA激活标签法、TILLING或同源重组中的任意一种或多种实现。

8.根据任一前述权利要求的方法，其中所述增加的表达通过在植物中导入并表达编码GRF多肽的核酸序列实现。

9.根据任一前述权利要求的方法，其中所述提高的产量相关性状是以下一项或多项：(i)提高的早期生长势；(ii)提高的地上部分生物量；(iii)提高的每株植物总种子产量；(iv)提高的种子充实率；(v)提高的收获指数；或(vi)提高的千粒核重(TKW)。

10.根据任一前述权利要求的方法，其中所述的核酸序列有效连接至组成型启动子，优选地有效连接至植物组成型启动子，更优选地有效连接至GOS2启动子，最优选地有效连接至SEQ ID NO：117所代表的来自稻的GOS2启动子。

11.根据任一前述权利要求的方法，其中所述的编码GRF多肽的核酸序列是植物来源的，优选地来自双子叶植物，进一步优选地来自十字花科(Brassicaceae)，最优选地来自拟南芥(Arabidopsis thaliana)。

12.根据任一前述权利要求的方法能获得的植物、其部分(包括种子)或植物细胞，其中所述的植物、其部分或细胞包含编码选自以下多肽的分离的核酸转基因，

-生长调节因子(GRF)多肽，

-RAA1样多肽，

-SYR多肽，

-ARKL多肽，

-和

-YTP多肽，

所述分离的核酸转基因有效连接至植物组成型启动子。

13.构建体，其包含：

(a)编码多肽的核酸序列，所述多肽选自权利要求1至6任一项中所定义的GRF多肽、RAA1样多肽、SYR多肽、ARKL多肽和YTP多肽；

(c)转录终止序列。

14.根据权利要求13的构建体，其中所述的调控序列是植物组成型启动子，优选地是GOS2启动子，更优选地是SEQ ID NO：117所代表的GOS2启动子。

15.根据权利要求13或14的构建体在用于制备植物的方法中的用途，所述植物相对于对照植物而言具有提高的产量相关性状，所述提高的产量相关性状是以下一项或多项：(i)提高的早期生长势；(ii)提高的生物量，优选地提高的地上部分生物量；(iii)提高的每株植物总种子产量；(iv)提高的种子充实率；(v)提高的收获指数；(vi)提高的千粒核重(TKW)；(vii)提高的非生物胁迫抗性，优选地提高的干旱胁迫耐受性；或(viii)提高的养分摄取效率。

16.用根据权利要求13或14的构建体转化的植物、植物部分或植物细胞。

17.用于产生相对于对照植物而言具有提高的产量相关性状的转基因植物的方法，所述方法包括：

(i)在植物、植物部分或植物细胞中导入并表达在植物组成型启动子控制下的编码多肽的核酸序列，所述多肽选自权利要求1至6任一项中所定义的GRF多肽、RAA1样多肽、SYR多肽、ARKL多肽和YTP多肽；和

18.转基因植物，其相对于对照植物而言具有因编码多肽的核酸序列表达增加所引起的提高的产量相关性状，所述核酸序列有效连接至植物组成型启动子，所述多肽选自权利要求1至6任一项中所定义的GRF多肽、RAA1样多肽、SYR多肽、ARKL多肽和YTP多肽，或者从所述转基因植物衍生的转基因植物细胞或转基因植物部分。

19.根据权利要求12、16或18的转基因植物，其中所述的植物是作物植物或单子叶植物或谷物植物，如稻、玉米、小麦、大麦、谷子、黑麦、小黑麦、高粱和燕麦，或从所述转基因植物衍生的转基因植物细胞。

20.根据权利要求18的植物的包含编码多肽的分离核酸序列的可收获部分，所述多肽选自GRF多肽、RAA1样多肽、SYR多肽、ARKL多肽和YTP多肽，其中所述可收获部分优选地是种子。

21.产物，其从根据权利要求18的植物和/或从根据权利要求20的植物的可收获部分衍生。

22.编码多肽的核酸序列在提高产量相关性状中的用途，所述多肽选自权利要求1至6任一项中所定义的GRF多肽、RAA1样多肽、SYR多肽、ARKL多肽和YTP多肽，所述产量相关性状包含以下一项或多项：(i)提高的早期生长势；(ii)提高的地上部分生物量；(iii)提高的每株植物总种子产量；(iv)提高的种子充实率；(v)提高的收获指数；或(vi)提高的千粒核重(TKW)、(vii)提高的非生物胁迫抗性，优选地提高的干旱胁迫耐受性；或(viii)提高的养分摄取效率。