CN102459613A - 具有增强的产量相关性状的植物及其制备方法 - Google Patents

具有增强的产量相关性状的植物及其制备方法 Download PDF

Info

Publication number
CN102459613A
CN102459613A CN2010800289562A CN201080028956A CN102459613A CN 102459613 A CN102459613 A CN 102459613A CN 2010800289562 A CN2010800289562 A CN 2010800289562A CN 201080028956 A CN201080028956 A CN 201080028956A CN 102459613 A CN102459613 A CN 102459613A
Authority
CN
China
Prior art keywords
plant
nucleic acid
polypeptide
motif
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2010800289562A
Other languages
English (en)
Inventor
A·I·桑兹莫林纳罗
V·弗兰卡德
Y·海茨费尔德
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BASF Plant Science Co GmbH
Original Assignee
BASF Plant Science Co GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BASF Plant Science Co GmbH filed Critical BASF Plant Science Co GmbH
Priority to CN201510126199.7A priority Critical patent/CN104789573A/zh
Publication of CN102459613A publication Critical patent/CN102459613A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/415Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • C12N15/8262Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield involving plant development
    • C12N15/827Flower development or morphology, e.g. flowering promoting factor [FPF]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • C12N15/8271Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance
    • C12N15/8273Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for drought, cold, salt resistance
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A40/00Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
    • Y02A40/10Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture
    • Y02A40/146Genetically Modified [GMO] plants, e.g. transgenic plants

Abstract

本发明一般地涉及分子生物学领域,涉及通过调节编码C3H样多肽、或SPATULA样(SPT)多肽、或IDI2(缺铁诱导2)多肽、或eIF4F样蛋白质复合物亚基、或GR-RBP(富甘氨酸RNA结合蛋白)多肽的核酸在植物中的表达来增强植物中多种产量相关性状和/或植物生长特性的方法。本发明还涉及具有经调节的C3H样多肽、或SPATULA样(SPT)多肽、或IDI2(缺铁诱导2)多肽、或eIF4F样蛋白质复合物亚基、或GR-RBP(富甘氨酸RNA结合蛋白)多肽编码核酸的表达和/或活性的植物,所述植物相对于相应的野生型植物或其他对照植物具有增强的产量相关性状和/或植物生长特性。本发明还提供了可以用于本发明方法的构建体。

Description

具有增强的产量相关性状的植物及其制备方法
技术领域
本发明一般地涉及分子生物学领域,涉及通过调节编码C3H样多肽的核酸在植物中的表达来增强植物中多种产量相关性状的方法。本发明还涉及具有经调节的C3H样多肽编码核酸表达的植物,所述植物相对于相应的野生型植物或其他对照植物具有增强的产量相关性状。本发明还提供了可以用于本发明方法的构建体。
本发明一般地涉及分子生物学领域,涉及通过调节编码SPATULA样(SPT)多肽的核酸在植物中的表达来增强多种产量相关性状的方法。本发明还涉及具有经调节的SPT样多肽编码核酸表达的植物,所述植物相对于相应的野生型植物或其他对照植物具有增强的产量相关性状。本发明还提供了可以用于本发明方法的构建体。
本发明一般地涉及分子生物学领域,涉及通过调节编码IDI2(缺铁诱导2,Iron Deficiency Induced 2)多肽的核酸在植物中的表达来改善多种植物生长特性的方法。本发明还涉及具有经调节的IDI2多肽编码核酸表达的植物,所述植物相对于相应的野生型植物或其他对照植物具有改善的生长特性。本发明还提供了可以用于本发明方法的构建体。
本发明一般地涉及分子生物学领域,涉及通过调节eIF4F样蛋白质复合物在植物中的活性来改善多种植物生长特性的方法。本发明还涉及具有经调节的eIF4F样蛋白质复合物的活性的植物,所述植物相对于相应的野生型植物或其他对照植物具有增强的生长特性。本发明还提供了可以用于本发明方法的构建体。
本发明一般地涉及分子生物学领域,涉及通过调节编码GR-RBP(富甘氨酸RNA结合蛋白,Glycine Rich-RNA Binding Protein)多肽的核酸在植物中的表达来改善多种植物生长特性的方法。本发明还涉及具有经调节的GR-RBP多肽编码核酸表达的植物,所述植物相对于相应的野生型植物或其他对照植物具有改善的生长特性。本发明还提供了可以用于本发明方法的构建体。
背景技术
不断增长的世界人口和逐渐减少的农业可用耕地推动了提高农业效率研究之势。传统的作物和园艺学改良方法利用选育技术来鉴定具有期望特征的植物。然而,此类选育技术有若干缺陷,即这些技术一般为劳动密集型的,而且产生的植物通常含有异质的遗传组分,这些异质的遗传组分可能不总是导致期望的性状自亲本植物传速。分子生物学的进展已经使人类能够修饰动物和植物的种质。植物遗传工程需要分离和操作遗传物质(一般为DNA或RNA的形式)以及随后将遗传物质引入植物。此类技术有能力输送具有多种改良的经济、农业或园艺性状的作物或植物。
具有特别经济利益的性状是增加的产量。产量通常定义为作物的可测量的具有经济价值的产出。这可以以数量和/或质量的方式进行定义。产量直接取决于若干因素,例如器官的数量和大小、植物构造(例如,分枝的数量)、种子生产、叶子衰老等等。根的发育、营养吸收、胁迫耐受性和早期活力也可以是决定产量的重要因素。因此优化上述因素可以促进作物产量的增加。
种子产量是特别重要的性状,这是因为许多植物的种子对于人类和动物营养而言至关重要。诸如玉米、稻、小麦、芸苔(canola)和大豆等作物占人类总卡路里摄取量的一半以上,或是通过对种子本身的直接消耗,或是通过对饲养自加工的种子的肉类产品的消耗。它们也可以是工业加工中所用的糖类、油类和多类代谢物的来源。种子含有胚(新的枝条和根的来源)和胚乳(萌发期和幼苗早期生长过程中胚生长的营养源)。种子的发育涉及许多基因,并且需要代谢物自根、叶和茎转移至正在生长的种子。特别是胚乳可以同化糖类、油类和蛋白质的代谢前体,将其合成为贮存高分子,以充盈籽粒。
对于许多作物而言,另一重要的性状是早期活力。提高早期活力是温带和热带稻类栽培种的现代稻类育种项目的重要目标。长根对于水栽稻的土壤锚固至关重要。在直接向涝地里播种稻米的情况下,以及在植物必须迅速透水出苗的情况下,较长的枝条均与活力有关。在进行条播的情况下,较长的中胚轴和胚芽鞘对于优良的出苗至关重要。改造植物早期活力的能力在农业上将具有极其重要的意义。例如,一直以来早期活力弱限制了在欧洲大西洋地区引入基于玉米带种质的玉米(玉蜀黍,Zea mays L.)杂交种。
再一重要的性状为提高的非生物胁迫耐受性。非生物胁迫是全世界作物损失的主要原因,使大多数主要作物植物平均产量降低50%以上(Wang等,Planta(2003)218:1-14)。非生物胁迫可以因为干旱、盐度、极端温度、化学毒性、营养物(大量元素和/或微量元素)的过剩或不足、辐射及氧化胁迫引起。提高非生物胁迫植物耐受性的能力将对全世界农场主带来重大的经济利益,并将使人们能够在否则将不可能进行作物栽培的地区和不利条件下进行作物栽培。
因此通过优化上述因素之一可以增加作物产量。
视最终用途而定,对某些产量性状的修饰可能优于对其他产量性状的修饰。例如,对于诸如饲料或木材生产或者生物燃料源等应用,可能期望植物营养部分的增加,而对于诸如面粉、淀粉或油料生产等应用,可能特别期望种子参数的增强。即便是在种子参数之中,取决于应用,一些参数也可能优于其它参数。多种机制可以促成增加的种子产量,无论是以增加的种子大小还是以增加的种子数量的形式。
增强植物产量(种子产量和/或生物量)的一种方法可以是修饰植物的内在生长机制,如细胞周期或者参与植物生长或防御机制的多种信号传递路径。
发明概述
现已发现,可通过在植物中调节C3H样多肽编码核酸在植物中的表达来增强植物的多种产量相关性状。
现已发现,可通过调节SPT样多肽编码核酸在植物中的表达来增强植物的多种产量相关性状。
现已发现,可通过在植物中调节IDI2(缺铁诱导2)编码核酸在植物中的表达来改善植物的多种生长特征。
现已发现,可通过调节至少eIF4F样蛋白质复合物亚基多肽编码核酸在植物中的活性和/或所述蛋白质复合物的水平来改善植物的多种生长特征。
现已发现,可通过调节GR-RBP(富甘氨酸RNA结合蛋白)编码核酸在植物中的表达来改善植物的多种生长特征。
背景
1.C3H样多肽
在拟南芥蛋白质组中检测到数量最多的结构域之一是环指结构域。环指结构域起初以其首先被发现存在的蛋白质的首字母缩略词命名,该蛋白由真正感兴趣的新基因(Really Interesting New Gene)编码。环指结构域与锌指结构域相关;然而锌指由配位结合一个锌离子的两对锌配体组成,而环指则由结合两个离子的四对配体组成。环结构域基本上可被视为蛋白质相互作用结构域。
环指结构域包括不同类型的亚结构域,即C3HC4类和C3H2C3类,也分别被称为RING-HC和RING H2。
2.SPATULA样(SPT)多肽
碱性/螺旋-环-螺旋(bHLH)转录因子及其同源物构成植物和动物基因组中的大家族。Li等,2006(Plant Physiol Aug;141(4):1167-84)在水稻基因组中鉴定出了167个bHLH基因,并报道,这些基因的系统发生分析表明它们构成具有强烈支持率的进化枝。也对来自拟南芥(Arabidopsis thaliana)的bHLH蛋白的系统发生进行了研究,见Toledo-Ortiz等,2003(Plant Cell,Aug;15(8):1749-70);Buck和Atchley,2003(J Mol Evol.Jun;56(6):742-50)。
SPATULA是bHLH转录因子。Groszmann等,2008(PlantJournal,July 55(1):40-52)描述SPATULA(SPT)基因参与了隔膜、花柱和柱头的发生。他们还在真双子叶植物、水稻和裸子植物中鉴别出了AtSPT的12个直系同源基因。他们鉴别出了除BHLH结构域以外的两个保守结构域:两亲螺旋和酸性结构域。SPATULA也被报道为种子萌发的光稳定阻遏因子,见Penfield等,2005(Curr Biol.Nov 22;15(22):1988-2006)。
3.IDI2(缺铁诱导2)多肽
缺铁诱导的cDNA IDI2首先是从铁质缺乏的大麦根中分离出来的。其编码的蛋白与真核生物起始因子2B的α亚基(Yamaguchi等,J.Exp.Bot.51,2001-2007,2000)具有低相似性,该蛋白质是鸟嘌呤核苷酸交换因子(GEF),在蛋白质合成的调节中起着关键作用。mRNA的翻译从起始甲硫氨酸-tRNAi结合到40S核糖体亚基开始,由eIF-2(为eIF-2·GTP·Met-tRNAi三元复合物的组分)介导。在起始过程中,结合到eIF-2的GTP被水解,由eIF-2和GDP组成的二元复合物从80S起始复合物中释放出来。由于eIF-2对GDP比对GTP具有高100至400倍的亲和力,故需要称作eIF-2B的鸟嘌呤核苷酸交换因子(GEF)来再生eIF-2的GTP结合形式,eIF-2的GTP结合形式随后能够参与到另一个翻译起始循环中。
真核生物翻译起始因子eIF-2B是由5个不同亚基(α、β、γ、δ和ε)组成的复合物,其催化与eIF-2结合的GDP和GTP的交换。该家族包括来自真核生物的起始因子2B的α、β和δ亚基、来自古细菌的相关蛋白以及来自原核生物的IF-2,还包括真核生物、古细菌或真细菌中的蛋白质亚家族。IDI2蛋白是eIF2Bα样蛋白家族的成员,该家族与eIF2Bα/β/δ家族不同。该家族的成员也被表征为5-甲硫基核糖-1-磷酸异构酶,该酶是甲硫氨酸补救途径中的酶。
IDI2的转录受铁或锌缺乏的诱导,但不受铜或锰缺乏的诱导(Yamaguchi等,2000)。在硼耐受和硼不耐受的植物之间,IDI2的表达没有显著差异(Patterson等,Plant Physiol.144,1612-1631,2007)。据推测,IDI2的功能是调节在铁缺乏适应中所需的蛋白质的合成速率(Yamaguchi等,2000)、特别是翻译的起始(Negishi等,Plant J.,30,83-94,2002)。
4.eIF4F样蛋白质复合物亚基
在原核生物和真核生物中,蛋白质合成由不同的机制控制。在真核生物中,该机制涉及几个多亚基复合物,其中包括真核生物翻译起始因子(eIFs)。通常,在mRNA的起始密码子处,起始tRNA、40S和60S核糖体亚基被eIF组装成80S核糖体。因此,起始翻译机制被视为蛋白质翻译的限速步骤。
参与翻译起始的两个主要复合物中,一个是eIF4F,它结合到mRNA的7mGppp帽子并招募43S复合物;另一个是43S复合物,它将40核糖体亚基带至5’UTR并允许5’扫描正确的起始AUG密码子。eIF4F(eIF4E+eIF4G+eIF4A的复合物)和eIF(iso)4F(eIF(iso)4E+eIF(iso)4G+eIF4A的复合物)在体外具有相似的支持翻译起始的活性(Lax等,发育的机制(Mechanisms of Development),Volume 122,Issues 7-8,July 2005,Pp.865-876;Browning等,J.Biol.Chem.267(1992),pp.10096-10100)。
eIF4E多肽与eIF4G和eIF4A结合形成eIF4F蛋白质复合物,该复合物充当其它起始因子例如eIF4B,eIF3以及poly(A)结合蛋白组装的脚手架。
参与翻译的其它因子有eIF5,在遇到起始AUG时,eIF5可以使整个43S复合物解离。然后,eIF5B促进核糖体的60S和40S亚基的解离,随后翻译真正开始。PolyA结合蛋白结合到eIF4F上,使CDS的头端(START)和末端(END)互相靠近,以便核糖体40S亚基的高效循环。
在植物中,eIF4isoF由eIF4isoE,isoG和eIF4A亚基组成。“iso”亚基是“正常”亚基的功能等同物,通常比其正常的对应物短得多,并与其正常的对应物具有很低的序列同源性。
在真核生物中,eIF4F似乎起不同的作用;在动物中,eIF4E是癌基因,其机制是通过对细胞凋亡的抑制来起作用的。水稻eIF4isoG的过量表达,当该等位基因为敏感性等位基因时,能够增加对黄斑驳病毒的易感性。eIF5A通常和程序性细胞死亡相关,其在植物中的过量表达导致互相矛盾的结果:严重的生长缺陷(Hopkins等,Plant Physiology,September2008,Vol.148,pp.479-489)或增加的莲座叶大小(Liu等,Journal ofExperimental Botany,Vol.59,No.4,pp.939-950,2008)。
Daniel R.Gallie(Plant Molecular Biology 50:949-970,2002.)揭示了翻译期间所需的蛋白与蛋白间的相互作用,但只是集中在那些参与核基因翻译的蛋白质相互作用上,因为叶绿体和线粒体的翻译装置为原核生物来源。因此,呈现了几种eIF在翻译机制中的作用。在该文献中提及了植物eIF4G(eIF4F的较大亚基)和eIF4A以及它们在植物中在起始期间的作用。然而,也很显然,关于它们对起始过程的作用知之甚少,在它们对该过程的贡献和增强的产量相关性状之间没能建立起联系。
文献“Albar等(eIF(iso)4G翻译起始因子中的突变赋予水稻对水稻黄斑驳病毒的高抗性-The Plant Journal(2006)47,417-426)”中揭示了IF4G的同种型在水稻和病毒抗性(即关于水稻黄斑驳病毒(RYMV))中发生的相互作用中的作用。同样,在所提到的该文献的主题和增强的产量相关性状之间也没建立起联系,除非植物受病毒严重感染。
其它提及植物eIF4F的文献,例如Laura K.Mayberry等(Methodsin Enzymology,Volume 430,Chapter 15-pp.397-408-Elsevier 2007)提到了重组小麦eIF的表达和纯化,但对于增强产量相关性状,仍然没有揭示过任何的效应或应用方法。
本发明的方法涉及用于获得具有增强的产量相关性状的植物的方法以及所述植物。
5.GR-RBP(富甘氨酸RNA结合蛋白)多肽
拟南芥基因组编码超过200个不同的RNA结合蛋白(RBP)。这些RBP在发育过程中在转录后基因调节中起作用(由综述,Trendsin Plant Science,2009),由于它们结合到剪接位点并结合到新生前体RNA上剪接因子的结合位点上,从而通过与剪接因子竞争来负调控剪接。大多数RBP是植物特有的并可能涉及植物特有的功能。该组RBP包括富含甘氨酸的RNA结合蛋白超家族(GR-RBPs;Wang和Brendel,Genome Biol.5,R102,2004)。GR-RBP典型地包含位于N-末端的RNA识别基序(RRMs)和C-末端的富含甘氨酸的结构域(GD)。
尽管据报道GR-RBP参与多种发育过程,包括植物对各种环境条件的适应,但GR-RBP的过量表达也导致了对植物生长的相反作用:例如,在拟南芥中表达GR-RBP4导致了萌发延迟。且没有增加耐冷或耐冻性(Kwak等,J.Exp.Bot.56,3007-3016,2005)。对于其它RBP,仅在微生物中证实了在冷胁迫或高温胁迫上的作用(Kwak等,Nucl.Ac.Res.35,506-516,2007;Sahi等,Plant Science 173,144-155,2007)。
概述
1.C3H样多肽
令人惊讶地,现已发现,调节编码包含C3H2C3类RING结构域的多肽的核酸的表达可以产生相对于对照植物具有增强的产量相关性状的植物。
根据一个实施方案,本发明提供用于相对于对照植物增强多种产量相关性状的方法,包括调节编码C3H样多肽的核酸在植物中的表达。
2.SPATULA样(SPT)多肽
令人惊讶地,现已发现,调节编码SPT样多肽的核酸的表达可以产生相对于对照植物具有增强的产量相关性状的植物。
根据一个实施方案,本发明提供用于相对于对照植物增强产量相关性状的方法,包括调节编码SPT样多肽的核酸在植物中的表达。
3.IDI2(缺铁诱导2)多肽
令人惊讶地,现已发现,调节编码IDI2多肽的核酸的表达可以产生相对于对照植物具有增强的产量相关性状、尤其是增加的产量和/或早期活力的植物。
根据一个实施方案,本发明提供用于相对于对照植物改善产量相关性状的方法,包括调节编码IDI2多肽的核酸在植物中的表达。
4.eIF4F样蛋白质复合物亚基
本发明一般地涉及分子生物学领域,涉及通过调节eIF4F样蛋白质复合物的活性来改善多种植物生长特性的方法。本发明还涉及具有经调节的eIF4F样蛋白质复合物的活性的植物,所述植物相对于相应的野生型植物或其他对照植物具有增强的生长特性。本发明还提供了可以用于本发明方法的构建体。
令人惊讶地,现已发现,调节eIF4F样蛋白质复合物的活性可以产生相对于对照植物具有增强的产量相关性状、尤其是增加的产量的植物。
根据一个实施方案,本发明提供用于相对于对照植物改善产量相关性状的方法,包括调节eIF4F样蛋白质复合物在植物中的活性。
5.GR-RBP(富甘氨酸RNA结合蛋白)多肽
令人惊讶地,现已发现,调节编码GR-RBP多肽的核酸的表达可以产生相对于对照植物具有增强的产量相关性状、尤其是增加的产量和/或早期活力的植物。
根据一个实施方案,本发明提供用于相对于对照植物改善产量相关性状的方法,包括调节编码GR-RBP多肽的核酸在植物中的表达。
定义
多肽/蛋白质
术语“多肽”和“蛋白质”在文中可互换使用,是指通过肽键连接起来的、任意长度的氨基酸的聚合物。
多核苷酸/核酸/核酸序列/核苷酸序列
术语“多核苷酸”、“核酸序列”、“核苷酸序列”、“核酸”、“核酸分子”在文中可互换使用,是指任何长度的无支链形式的核苷酸聚合物,所述核苷酸可以为核糖核苷酸或脱氧核糖核苷酸或者两者的组合。
同源物
蛋白质的“同源物”包括肽、寡肽、多肽、蛋白质和酶,其相对于所讨论的未修饰蛋白质具有氨基酸取代、缺失和/或插入,并且与其源自的未修饰蛋白质具有相似的生物活性和功能活性。
缺失是指从蛋白质中除去一个或多个氨基酸。
插入是指在蛋白质的预定位置引入一个或多个氨基酸残基。插入可以包括N-末端和/或C-末端融合,以及单个或多个氨基酸的序列内插入。一般,氨基酸序列内的插入将小于N-或C-末端的融合,约1到10个残基左右。N-或C-末端融合蛋白或肽的实例包括在酵母双杂交系统中应用的转录激活因子的结合结构域或激活结构域、噬菌体外壳蛋白、(组氨酸)-6-标签、谷胱甘肽S-转移酶标签、蛋白质A、麦芽糖结合蛋白、二氢叶酸还原酶、Tag·100表位、c-myc表位、
Figure BDA0000125779720000101
表位、lacZ、CMP(钙调蛋白结合肽)、HA表位、蛋白质C表位和VSV表位。
取代是指蛋白质中的氨基酸用具有相似特性(如相似的疏水性、亲水性、抗原性、形成或打破α螺旋结构或β片层结构的倾向)的其他氨基酸替换。氨基酸取代一般是单残基的取代,但是视施加于多肽上的功能性限制而定也可以是成簇取代,并且可以是1到10个氨基酸;插入通常在大约1到10个氨基酸残基的数量级。氨基酸取代优选为保守氨基酸取代。保守取代表在本领域公知(参见例如Creighton(1984)Proteins.W.H.Freeman and Company(编辑)和下表1)。
表1:保守氨基酸取代的实例
  残基   保守取代   残基   保守取代
  Ala   Ser   Leu   Ile;Val
  Arg   Lys   Lys   Arg;Gln
  Asn   Gln;His   Met   Leu;Ile
  Asp   Glu   Phe   Met;Leu;Tyr
  Gln   Asn   Ser   Thr;Gly
  Cys   Ser   Thr   Ser;Val
  Glu   Asp   Trp   Tyr
  Gly   Pro   Tyr   Trp;Phe
  His   Asn;Gln   Val   Ile;Leu
  Ile   Leu;Val
可通过本领域公知的肽合成技术,如固相肽合成法等,或通过重组DNA操作,容易地进行氨基酸取代、缺失和/或插入。用于产生蛋白质的取代、插入或缺失变体的DNA序列操作方法在本领域公知。例如,本领域的技术人员公知在DNA预定位置进行取代突变的技术,包括M13诱变、T7-Gen体外诱变(USB,Cleveland,OH)、QuickChange定点诱变(Stratagene,San Diego,CA)、PCR介导的定点诱变或其他定点诱变方案。
衍生物
“衍生物”包括肽、寡肽、多肽,与蛋白质如目的蛋白质的天然形式的氨基酸序列相比,其可以包括用非天然氨基酸残基进行的氨基酸取代、或者添加非天然氨基酸残基。蛋白质的“衍生物”还包括肽、寡肽、多肽,与多肽的天然形式的氨基酸序列相比,其可以包括天然改变的(糖基化、酰基化、异戊烯化、磷酸化、肉豆蔻酰化、硫酸化等)或非天然改变的氨基酸残基。衍生物与其源自的氨基酸序列相比,还可以包括一个或多个非氨基酸取代或添加,例如共价或非共价地结合于氨基酸序列的报告分子或其他配体,例如与氨基酸序列结合以有利于其检测的报告分子,以及相对于天然蛋白质的氨基酸序列而言非天然的氨基酸残基。此外,“衍生物”还可以包括天然形式的蛋白质与标签肽(tagging peptide)例如FLAG、HIS6或硫氧还蛋白的融合物(关于标签肽的综述,参见Terpe,Appl.Microbiol.Biotechnol.60,523-533,2003)。
直向同源物/旁系同源物
直向同源物和旁系同源物涵盖用于描述基因的祖先关系的进化概念。旁系同源物为相同物种内的基因,其起源自祖先基因的复制;而直向同源物为来自不同生物体的基因,其通过物种形成起源,并且也源自于共同的祖先基因。
结构域、基序/共有序列/标签序列(Signature)
术语“结构域”是指在进化相关蛋白质的序列比对中,在特定位置上保守的一组氨基酸。尽管其他位置上的氨基酸可能因同源物不同而改变,但是在特定位置上高度保守的氨基酸则意味着对于蛋白质结构、稳定性或功能而言很可能是必不可少的氨基酸。“结构域”通过在蛋白质同源物家族的比对序列中其高度的保守性而鉴定,其能够用作为标识符以确定任何所讨论的多肽是否属于先前鉴定到的多肽家族。
术语“基序”或“共有序列”或“标签序列”是指进化相关蛋白质序列中短的保守区域。基序常常是结构域的高度保守的部分,但也可以包括仅仅部分的结构域,或者可以是位于保守结构域之外(若基序的所有氨基酸都落在所定义的结构域之外的话)。
存在用于鉴定结构域的专家数据库,例如SMART(Schultz等(1998)Proc.Natl.Acad.Sci.USA 95,5857-5864;Letunic等(2002)Nucleic AcidsRes 30,242-244)、InterPro(Mulder等,(2003)Nucl.Acids.Res.31,315-318)、Prosite(Bucher和Bairoch(1994),A generalized profile syntax forbiomolecular sequences motifs and its function in automatic sequenceinterpretation.(In)ISMB-94;第二届分子生物学智能系统国际会议记录(Proceedings 2nd International Conference on Intelligent Systems forMolecular Biology)Altman R.,Brutlag D.,Karp P.,Lathrop R.,Searls D.编辑,53-61页,AAAIPress,Menlo Park;Hulo等,Nucl.Acids.Res.32:D134-D137,(2004))或者Pfam(Bateman等,Nucleic Acids Research 30(1):276-280(2002))。进行蛋白质序列芯片(in silico)分析的一组工具可以从ExPASy蛋白质组学服务器获得(瑞士生物信息学研究所(Swiss Institute ofBioinformatics)(Gasteiger等ExPASy:the proteomics server for in-depthprotein knowledge and analysis.Nucleic Acids Res 31:3784-3788(2003))。结构域或基序也可以利用常规技术例如通过序列比对来鉴定。
为比较而进行序列比对的方法是本领域公知的,此类方法包括GAP、BESTFIT、BLAST、FASTA和TFASTA。GAP使用Needleman和Wunsch的算法((1970)J.Mol.Biol.48:443-453)来寻找两序列之间匹配数最大化且空位数最小化的全局(即跨越完整序列)的比对。BLAST算法(Altschul等(1990)J Mol Biol 215:403-10)计算序列同一性百分比,并对两序列之间的相似性进行统计学分析。执行BLAST分析的软件可通过美国国家生物技术信息中心(NCBI)公开地获得。同源物可以例如,使用ClustalW多重序列比对算法(1.83版),采用默认的成对比对参数以及百分比的记分方法而容易地鉴定。利用可获自MatGAT软件包(Campanella等,(2003)BMC Bioinformatics,10:29.2003 Jul 10;4:29.MatGAT:anapplication that generates similarity/identity matrices using protein orDNA sequences)的方法之一,也可以确定全局相似性和同一性百分比。可以进行微小的人工编辑以优化保守基序之间的比对,这对于所属领域的技术人员而言将是显而易见的。此外,除了利用全长序列进行同源物鉴定以外,还可以利用特定的结构域。可以利用上述程序采用默认参数针对完整核酸或氨基酸序列或者选择的结构域或保守基序来确定序列同一性值。对于局部比对,Smith-Waterman算法是特别有用的(Smith TF,WatermanMS(1981)J.Mol.Biol 147(1);195-7)。
交互BLAST
通常,这包括一次BLAST,即以查询序列(例如,利用实施例部分表A中所列的任何序列)针对任何序列数据库如可公共获得的NCBI数据库进行BLAST。当从核苷酸序列开始时,通常使用BLASTN或TBLASTX(利用标准默认值),而当从蛋白质序列开始时,则使用BLASTP或TBLASTN(利用标准默认值)。BLAST结果可以任选地过滤。接着使用过滤的结果或者未过滤的结果中的全长序列针对查询序列来源生物的序列进行反向BLAST(二次BLAST)。然后比较一次和二次BLAST的结果。如果一次BLAST中分值靠前的命中事件来自查询序列源自的相同物种,而理想地反向BLAST导致查询序列在最高命中事件中,则鉴定到了旁系同源物;如果一次BLAST中分值靠前的命中事件不是来自查询序列源自的相同物种,且优选地反向BLAST导致查询序列处于最高命中事件之列,则找到了直向同源物。
分值靠前的命中事件是E值低的命中事件。E值越低,分值越具有显著性(或者换句话说,偶然发现此命中事件的几率越低)。E值的计算是本领域众所周知的。除了E值之外,还可以对比较进行同一性百分比记分。同一性百分比是指两比较核酸(或多肽)序列之间在特定长度上的相同核苷酸(或氨基酸)数。在大家族的情况下,可以使用ClustalW,继之以邻接树来辅助对相关基因的聚类进行可视化和鉴定直向同源物和旁系同源物。
杂交
本文定义的术语“杂交”指其中基本同源互补的核苷酸序列彼此退火的过程。杂交过程能够完全在溶液中发生,即互补的核酸都处在溶液中。杂交过程也能够这样进行,即互补核酸之一固定于基质,如磁珠、琼脂糖珠或任何其它树脂上。此外,杂交过程也能够这样进行,即其中互补核酸之一固定在固相支持物如硝酸纤维素或尼龙膜上,或者通过例如照相平板印刷术固定在例如硅质玻璃支持物上(后者称为核酸阵列或微阵列,或称为核酸芯片)。为了使杂交发生,通常使核酸分子热变性或化学变性,以使双链解链成两条单链,和/或除去单链核酸中的发夹结构或其它二级结构。
术语“严格性”是指进行杂交的条件。杂交的严格性受诸如温度、盐浓度、离子强度和杂交缓冲液组成等条件的影响。通常,在确定的离子强度和pH,对于特定序列而言,低严格条件选择为比热解链温度(Tm)低大约30℃。中等严格条件为温度比Tm低20℃,而高严格条件为温度比Tm低10℃。高严格杂交条件通常用于分离与靶核酸序列具有高序列相似性的杂交序列。不过,由于遗传密码的简并性,核酸可以在序列上有偏差而依然编码基本上相同的多肽。因此有时可能需要中等严格杂交条件来鉴定这样的核酸分子。
Tm是在确定的离子强度和pH值时,50%的靶序列与完美匹配的探针杂交的温度。Tm取决于溶液条件和探针的碱基组成及长度。例如,较长的序列在较高温度特异性杂交。在低于Tm值大约16℃到32℃获得最大杂交速率。在杂交溶液中存在一价阳离子会减少两核酸链之间的静电排斥作用,从而促进杂交体形成;当钠浓度不超过0.4M时,这一作用明显(对于更高的浓度,此效应可以忽略不计)。每个百分点的甲酰胺可使DNA-DNA和DNA-RNA双链体的解链温度降低0.6到0.7℃,加入50%甲酰胺能够使杂交在30到45℃进行,尽管这将降低杂交速率。碱基对错配降低杂交速率和双链体的热稳定性。平均而言,对于大的探针,每个百分点碱基错配使Tm值下降约1℃。取决于杂交体的类型,Tm值可以利用下列公式计算:
1)DNA-DNA杂交体(Meinkoth和Wahl,Anal.Biochem.,138:267-284,1984):
Tm=81.5℃+16.6×log10[Na+]a+0.41×%[G/Cb]-500×[Lc]-1-0.61×%甲酰胺
2)DNA-RNA或RNA-RNA杂交体:
Tm=79.8+18.5(log10[Na+]a)+0.58(%G/Cb)+11.8(%G/Cb)2-820/Lc
3)寡DNA或寡RNAd杂交体:
<20个核苷酸:Tm=2(ln)
20-35个核苷酸:Tm=22+1.46(ln)
a或用于其它一价阳离子,但是仅在0.01-0.4M范围内准确。
b仅对于在30%到75%范围内的%GC是准确的。
cL=双链体的碱基对长度。
d寡,寡核苷酸;ln,=引物的有效长度=2×(G/C数)+(A/T数)。
非特异性结合可以通过许多已知技术中的任一种来控制,例如用含蛋白质的溶液封闭膜,在杂交缓冲液中添加异源RNA、DNA和SDS,以及用RNA酶处理。对于非同源探针,可以通过改变如下条件之一来进行一系列杂交:(i)逐渐降低退火温度(例如从68℃降至42℃),或(ii)逐渐降低甲酰胺浓度(例如从50%降至0%)。熟练技术人员知晓可以在杂交过程中改变而保持或者改变严格条件的各种参数。
除杂交条件外,杂交特异性通常还是杂交后洗涤的函数。为了除去非特异杂交产生的背景,用稀释的盐溶液洗涤样品。这类洗涤的关键因素包括最终洗涤溶液的离子强度和温度:盐浓度越低、洗涤温度越高,洗涤的严格性就越高。洗涤条件通常在等于或低于杂交严格性的条件下进行。阳性杂交给出至少为背景两倍的信号。一般,适用于核酸杂交测定或基因扩增检测操作的适宜严格条件如上文所示设置。也可以选择更高或更低的严格条件。熟练技术人员知晓可以在洗涤过程中改变从而保持或者改变严格条件的各种参数。
例如,长于50个核苷酸的DNA杂交体的典型的高严格杂交条件包括在1×SSC中于65℃杂交或者在1×SSC和50%甲酰胺中于42℃杂交,接着在0.3×SSC中于65℃洗涤。长于50个核苷酸的DNA杂交体的中等严格杂交条件的实例包括在4×SSC中于50℃杂交或者在6×SSC和50%甲酰胺中于40℃杂交,接着在2×SSC中于50℃洗涤。杂交体的长度是杂交核酸的预期长度。当已知序列的核酸进行杂交时,杂交体的长度可以通过比对序列并鉴定本文所述的保守区域来确定。1×SSC是0.15M NaCl和15mM柠檬酸钠;杂交溶液和洗涤溶液可以另外地包括5×Denhardt试剂、0.5-1.0%SDS、100μg/ml片段化的变性鲑精DNA、0.5%焦磷酸钠。
为了定义严格性水平,可以参考Sambrook等(2001)的《分子克隆:实验室手册》,第三版,冷泉港实验室出版,冷泉港,纽约,或者Current Protocols in Molecular Biology,John Wiley & Sons,N.Y.(1989及年度更新资料)。
剪接变体
本文所用的术语“剪接变体”包括这样的核酸序列变体,其中选择的内含子和/或外显子已被切除、替换、置换或添加,或者其中内含子已被缩短或增长。这样的变体基本上保持了蛋白质的生物活性;这可以通过选择性地保留蛋白质的功能性区段来实现。这样的剪接变体可以是天然的或人工的。预测和分离这类剪接变体的方法是本领域众所周知的(参见例如Foissac和Schiex(2005)BMC Bioinformatics 6:25)。
等位基因变体
等位基因或等位基因变体为位于相同的染色体位置的给定基因的可选形式。等位基因变体包括单核苷酸多态性(SNP),以及小型插入/缺失多态性(INDEL)。INDEL的大小通常小于100bp。在大多数生物体的天然多态性品系中SNP和INDEL形成最大的一组序列变体。
内源基因
本文述及“内源”基因不仅指见于植物之中的天然形式的所讨论基因(即未经人为干预),而且指随后(重新)引入到植物中的分离形式的所述基因(或基本上同源的核酸/基因)(转基因)。例如,含有这样的转基因的转基因植物可遭遇该转基因表达的实质性下降和/或该内源基因表达的实质性下降。该分离的基因可从生物体分离或可以例如通过化学合成进行人造。
基因改组/定向进化
基因改组或定向进化是重复进行DNA改组以及继之的适当筛选和/或选择,以产生编码具有修饰生物活性的蛋白质的核酸或其部分的变体(Castle等(2004)Science 304(5674):1151-4;美国专利5,811,238和6,395,547)。
构建体
另外的调控元件可以包括转录和翻译的增强子。本领域技术人员会知道适合用于实施本发明的终止子和增强子的序列。如“定义”部分所说明的那样,也可以向5’非翻译区(UTR)或在编码序列中加入内含子序列,来增加在胞质中累积的成熟信使的量。其他控制序列(除启动子、增强子、沉默子、内含子序列、3’UTR和/或5’UTR区域之外)可以有蛋白质和/或RNA稳定元件。这类序列为本领域技术人员公知或者可以容易地获得。
本发明的遗传构建体可以还包括为在特定细胞类型中维持和/或复制所需的复制起点序列。一个实例是需要将遗传构建体作为染色体外遗传元件(如质粒或粘粒分子)在细菌细胞中维持的情况。优选的复制起点包括但不限于f1-ori和colE1。
为检测本发明方法中所用核酸序列的成功转移和/或选择含有这些核酸的转基因植物,最好使用标记基因(或报告基因)。因此,遗传构建体可以任选地含有可选择标记基因。可选择标记在本文“定义”部分有更详细的说明。一旦不再需要标记基因可从转基因细胞将其除去或切除。用于标记去除的技术在本领域内是已知的,有用的技术描述于上文中定义部分。
调控元件/控制序列/启动子
术语“调控元件”、“控制序列”和“启动子”在文中均可互换使用,取其广义,是指能够影响与之相连的序列表达的调控性核酸序列。术语“启动子”通常是指位于基因转录起点上游的核酸控制序列,其参与识别和结合RNA聚合酶及其他蛋白质,由此指导有效连接的核酸进行转录。上述术语包括源自经典真核生物基因组基因的转录调控序列(包括对于精确的转录起始是必需的TATA盒,带或不带CCAAT盒序列),以及其他调控元件(即上游激活序列、增强子和沉默子)——它们通过应答发育刺激和/或外部刺激或以组织特异的方式改变基因表达。该术语还包括经典原核生物基因的转录调控序列,在此情况下可以包括-35盒序列和/或-10盒转录调控序列。术语“调控元件”也涵盖合成的融合分子或衍生物,其赋予、激活或增强细胞、组织或器官中核酸序列分子的表达。
“植物启动子”包括可以介导编码序列区段在植物细胞中表达的调控元件。因此,植物启动子不必是植物来源的,还可来源于病毒或微生物,例如来自攻击植物细胞的病毒。“植物启动子”还可来源于植物细胞,例如,来源于待用欲在本发明方法中表达的以及本文所述的核酸序列转化的植物。这对于其他“植物”调控信号同样适用,例如“植物”终止子。位于可用于本发明方法的核苷酸序列上游的启动子可以通过一个或多个核苷酸取代、插入和/或缺失进行修饰,而不干扰启动子、开放读框(ORF)或者3’调控区如终止子或远离ORF的其他3’调控区的功能或活性。此外,还可以通过修饰启动子的序列而增加其活性,或者将其完全替换为活性更强的启动子、甚至是来自异源生物体的启动子。为在植物中表达,核酸分子必须,如上文所述的那样,有效连接于或者包含适宜的启动子,所述启动子将在恰当的时间点以所需的空间表达模式表达所述基因。
为鉴定功能上等同的启动子,可以例如通过将候选启动子与报告基因有效连接、测定所述报告基因在植物多种组织中的表达水平和模式,来分析候选启动子的启动子强度和/或表达模式。公知的适宜报告基因包括例如β-葡糖醛酸糖苷酶或β-半乳糖苷酶。通过测量β-葡糖醛酸糖苷酶或β-半乳糖苷酶的酶活来测定启动子活性。然后可以将该启动子强度和/或表达模式与参照启动子(如本发明方法中所用的启动子)相比较。可选地,可以利用本领域公知的方法,如Northern印迹(RNA分析)结合放射自显影图的密度计量分析、定量实时PCR或RT-PCR(Heid等,1996 GenomeMethods 6:986-994),通过定量mRNA水平或者将本发明方法所用核酸的mRNA水平与持家基因如18S rRNA的mRNA水平进行比较,来测定启动子强度。通常,“弱启动子”表示驱动编码序列低水平表达的启动子。“低水平”表示每个细胞约1/10,000个转录物到约1/100,000个转录物、到约1/500,0000个转录物的水平。相反,“强启动子”驱动编码序列高水平表达,或者说每个细胞约1/10个转录物到约1/100个转录物、到约1/1000个转录物。一般,“中等强度启动子”表示以低于强启动子的水平,尤其是以在所有情况下都低于在35S CaMV启动子控制下所获得水平的水平,驱动编码序列表达的启动子。
有效连接
本文所用的术语“有效连接”是指启动子序列和目的基因之间的功能性连接,从而启动子序列能够起始目的基因的转录。
组成型启动子
“组成型启动子”是指在生长和发育的大多数但不必然是所有阶段,在大多数环境条件下,在至少一种细胞、组织或器官中具有转录活性的启动子。下表2a给出了组成型启动子的实例。
表2a:组成型启动子的实例
Figure BDA0000125779720000201
Figure BDA0000125779720000211
遍在启动子
遍在启动子基本上在生物体所有的组织或细胞中都有活性。
发育调控型启动子
发育调控型启动子在某些发育阶段或在经历发育改变的植物部分有活性。
诱导型启动子
诱导型启动子响应化学品(综述参见Gatz 1997,Annu.Rev.PlantPhysiol.Plant Mol.Biol.,48:89-108)、环境或物理刺激而诱导或增加转录起始,或者可以是“胁迫诱导型”,即当植物接触多种胁迫条件时被激活,或者是“病原体诱导型”,即当植物接触多种病原体时被激活。
器官特异性/组织特异性启动子
器官特异性或组织特异性的启动子是能够在某些器官或组织(如叶、根、种子组织等)中优先起始转录的启动子。例如,“根特异性启动子”是主要在植物根中,基本上排除在植物的任何其他部分中,具有转录活性的启动子,但仍允许在这些其他植物部分中的任何渗漏表达。能够仅在某些细胞中起始转录的启动子在文中称为“细胞特异性”启动子。
根特异性启动子的实例列于下表2b。
表2b:根特异性启动子的实例
Figure BDA0000125779720000221
Figure BDA0000125779720000231
种子特异性启动子主要在种子组织中,但不必仅在种子组织中(渗漏表达的情况下),具有转录活性。种子特异性启动子可以在种子发育和/或萌发期间具有活性。种子特异性启动子可以是胚乳/糊粉层/胚特异性的。种子特异性启动子(胚乳/糊粉层/胚特异性的)的实例列于下表2c至表2f中。种子特异性启动子的更多实例在Qing Qu和Takaiwa(PlantBiotechnol.J.2,113-125,2004)中给出,其公开内容作为参考并入本文,如同充分阐述的那样。
表2c:种子特异性启动子的实例
Figure BDA0000125779720000232
Figure BDA0000125779720000241
Figure BDA0000125779720000251
表2d:胚乳特异性启动子的实例
Figure BDA0000125779720000252
Figure BDA0000125779720000261
表2e:胚特异性启动子的实例
  基因来源   参考文献
  稻OSH1   Sato等,Proc.Natl.Acad.Sci.USA,93:8117-8122,1996
  KNOX   Postma-Haarsma等,Plant Mol.Biol.39:257-71,1999
  PRO0151   WO 2004/070039
  PRO0175   WO 2004/070039
  PRO005   WO 2004/070039
  PRO0095   WO 2004/070039
表2f:糊粉特异性启动子的实例
Figure BDA0000125779720000271
如文中所定义的绿色组织特异性启动子是主要在绿色组织中,基本上排除在任何其他植物部分中,具有转录活性的启动子,但仍允许在这些其他植物部分中的任何渗漏表达。
可以用来实施本发明方法的绿色组织特异性启动子的实例示于下表2g。
表2g:绿色组织特异性启动子的实例
Figure BDA0000125779720000272
组织特异性启动子的另一实例是分生组织特异性启动子,其主要在分生组织中,基本上排除在任何其他植物部分中,具有转录活性,但仍允许在这些其他植物部分的任何渗漏表达。可以用来实施本发明方法的绿色分生组织特异性启动子的实例示于下表2h。
表2h:分生组织特异性启动子的实例
Figure BDA0000125779720000281
终止子
术语“终止子”包括这样的控制序列,其为位于转录单位末端的DNA序列,发送初级转录物进行3’加工和多聚腺苷酸化以及终止转录的信号。终止子可以源自天然基因、多种其他植物基因、或T-DNA。例如,待加入的终止子可以源自胭脂碱合酶或章鱼碱合酶基因、或可选地源自其它植物基因、或次优选地源自任何其它真核基因。
可选择标记(基因)/报告基因
“可选择标记”、“可选择标记基因”或“报告基因”包括赋予细胞表型的任何基因,其中该表型在细胞中的表达有利于鉴定和/或选择经本发明的核酸构建体转染或转化的细胞。这些标记基因通过一系列不同的原理使得能够鉴定核酸分子的成功转移。适宜的标记可以选自赋予抗生素或除草剂抗性、引入新的代谢性状或允许可视选择的标记。可选择标记基因的实例包括赋予抗生素抗性的基因(例如磷酸化新霉素和卡那霉素的nptII,或磷酸化潮霉素的hpt,或赋予抗例如博来霉素、链霉素、四环素、氯霉素、氨苄青霉素、庆大霉素、遗传霉素(G418)、壮观霉素或杀稻瘟素抗性的基因)、赋予除草剂抗性的基因(例如提供抗
Figure BDA0000125779720000282
抗性的bar;提供抗草甘膦抗性的aroA或gox,或赋予抗例如咪唑啉酮、膦丝菌素或磺胺脲抗性的基因)、或者提供代谢性状的基因(如允许植物使用甘露糖作为唯一碳源的manA,或有关木糖利用的木糖异构酶,或抗营养标记如对2-脱氧葡萄糖的抗性)。可视标记基因的表达导致形成颜色(例如β-葡糖醛酸糖苷酶GUS,或β-半乳糖苷酶及其有色底物,例如X-Gal)、发光(如萤光素/萤光素酶系统)或荧光(绿色荧光蛋白GFP及其衍生物)。这仅仅是一小部分可能标记的名单。技术人员熟悉此类标记。取决于生物体和选择方法,优选不同的标记。
已知对于核酸在植物细胞中的稳定或瞬时整合,取决于所用的表达载体和所用的转染技术,仅少数细胞可以摄入该外来DNA,以及,如果期望的话,整合进其基因组。为鉴定并选择这些整合体,通常将编码可选择标记(例如上文所述的那些)的基因与目的基因一起引入宿主细胞中。这些标记能够在例如突变体中使用,所述突变体中原有的这些基因例如通过常规方法缺失而没有功能。此外,编码可选择标记的核酸分子可与编码本发明多肽的或用于本发明方法的序列包含在同一个载体中,或者在分开的载体中引入宿主细胞。已经稳定转染了所引入的核酸的细胞可以例如通过选择(例如,整合有可选择标记的细胞存活而其他细胞死去)予以鉴定。
由于一旦成功引入了核酸后将不再需要或不期望转基因宿主细胞中存在标记基因,特别是抗生素和除草剂抗性基因,所以根据本发明用于引入核酸的方法最好采用能够除去或切除这些标记基因的技术。一种这样的方法是称为共转化的方法。共转化法采用两个载体同时进行转化,一个载体携带根据本发明的核酸,而第二个携带标记基因。很大比例的转化体接收或者对于植物而言(高达40%或以上的转化体)含有两个载体。对于农杆菌转化,转化体通常只接收载体的一部分,即被T-DNA侧翼包围的序列,其通常是表达盒。随后可通过杂交从转化植物中除去标记基因。在另一种方法中,利用整合在转座子中的标记基因与期望的核酸一起进行转化(称为Ac/Ds技术)。转化体可与转座酶来源杂交,或者用赋予转座酶表达的核酸构建体来瞬时或稳定转化转化体。在有些情况下(约10%),一旦成功进行了转化,转座子会跳离宿主细胞基因组并丢失。在另外一些情况下,转座子会跳至不同的位置。在这些情况下,必须通过杂交以消除标记基因。在微生物学领域,已经研发了使得可以或便于检测此类事件的技术。另一有利的方法有赖于所谓的重组系统;其优势在于可以免除杂交消除。最著名的这类系统是称为Cre/lox系统的系统。Cre1为重组酶,其切除位于loxP序列之间的序列。如果标记基因整合在loxP序列之间,一旦转化成功后,其会因Cre1重组酶的表达而得以切除。其他重组系统有HIN/HIX、FLP/FRT和REP/STB系统(Tribble等,J.Biol.Chem.,275,2000:22255-22267;Velmurugan等,J.Cell Biol.,149,2000:553-566)。根据本发明的核酸序列可以位点特异性地整合进植物基因组。这些方法自然也可以应用于微生物如酵母、真菌或细菌。
转基因的/转基因/重组
出于本发明的目的,就例如本发明的核酸序列、含有所述核酸序列的表达盒、基因构建体或载体、或用所述核酸序列、表达盒或载体转化的生物体而言,“转基因的”、“转基因”或“重组”是指所有这些构建体通过重组方法产生,其中:
(a)编码可用于本发明方法的蛋白质的核酸序列,或
(b)有效连接于本发明核酸序列的遗传控制序列,例如启动子,或
(c)(a)和(b)
不存在于其天然遗传环境中,或者已通过重组方法修饰,该修饰可以采取的形式为例如一个或多个核苷酸残基的取代、添加、缺失、倒位或插入。天然遗传环境应理解为原始植物中天然的基因组或染色体座位或者存在于基因组文库之中。在基因组文库的情况下,优选保持、至少是部分地保持核酸序列的天然遗传环境。该环境至少位于核酸序列的一侧,长度至少为50bp、优选至少500bp、特别优选至少1000bp、最优选至少5000bp。当天然存在的表达盒——例如编码可用于本发明方法的多肽的相应核酸序列与该核酸序列的天然启动子之间的天然组合——经非天然的合成(“人工”)方法例如诱变处理而被修饰时,此表达盒变成转基因表达盒。合适的方法描述在例如,US 5,565,350或WO 00/15815中。
因此,如上文所述,用于本发明目的的转基因植物应理解为指:在所述植物的基因组中,本发明方法中所用的核酸不在其天然基因座上,其中所述核酸可以进行同源或异源表达。不过,正如所提到的那样,转基因也表示:尽管在植物基因组中根据本发明的或本发明方法中所用的核酸在其天然位置上,但是所述序列已相对于天然序列而被修饰,和/或天然序列的调控序列已被修饰。转基因优选理解为表示:根据本发明的核酸在基因组中非天然的座位上表达,即同源表达,或者优选发生核酸的异源表达。优选的转基因植物在文中述及。
调节
与表达或基因表达相关的术语“调节”是指与对照植物相比,所述基因表达的表达水平被改变的过程,其中表达水平可增加或降低。原始未调节的表达可以是结构RNA(rRNA、tRNA)或随后进行翻译的mRNA的任何类型的表达。术语“调节活性”应理解为本发明核酸序列或编码蛋白质的任何表达改变,该改变导致植物产量增加和/或生长增加。
表达
术语“表达”或“基因表达”是指特定基因或特定基因构建体的转录。术语“表达”或“基因表达”特别地是指基因(一个或多个)或基因构建体至结构RNA(rRNA、tRNA)或mRNA的转录,有或无后者至蛋白质的随后翻译。该过程包括DNA的转录和所获得的mRNA产物的加工。
增加的表达/过表达
如本文所用的术语“增加的表达”或“过表达”表示超出原始野生型表达水平的任何形式的表达。
增加基因或基因产物表达的方法在本领域有充分的文献记载,且包括,例如由适当的启动子驱动的过表达、转录增强子或翻译增强子的使用。可以将用作启动子或增强子元件的分离的核酸引入非异源形式的多核苷酸的适当位置(一般是上游),从而上调编码目的多肽的核酸序列的表达。例如,可以通过突变、缺失和/或取代,在体内改变内源启动子(见Kmiec,US 5,565,350;Zarling等,WO9322443),或者可以将分离的启动子在相对于本发明基因的适当方向和距离引入植物细胞中,从而控制基因的表达。
如果期望多肽表达,通常期望在多核苷酸编码区的3’末端纳入多聚腺苷酸化区域。多聚腺苷酸化区域可以源自天然基因、多种其它植物基因或T-DNA。例如,待加入的3’末端序列可以源自胭脂碱合酶或章鱼碱合酶基因、或可选地源自其他植物基因、或次优选地源自任何其它真核基因。
也可以在5’非翻译区(UTR)或部分编码序列的编码序列中加入内含子序列,来增加在胞质中累积的成熟信使的量。已显示,在植物和动物表达构建体的转录单位中纳入可剪接内含子,可以在mRNA和蛋白质水平使基因表达增加高达1000倍(Buchman和Berg(1988)Mol.Cell biol.8:4395-4405;Callis等(1987)Genes Dev.1:1183-1200)。通常内含子放置在转录单位5’末端附近时,增强基因表达的作用最大。玉蜀黍内含子Adh1-S内含子1、2和6,Bronze-1内含子的使用是本领域公知的。一般信息请参见The Maize Handbook,第116章,Freeling和Walbot编辑,Springer,N.Y.(1994)。
降低的表达
本文述及“降低的表达”或者表达“减小或基本上消除”应理解为表示,内源基因表达和/或多肽水平和/或多肽活性相对于对照植物降低。所述减小或基本上消除按照递增的优选顺序为,与对照植物相比,减小至少10%、20%、30%、40%或50%、60%、70%、80%、85%、90%或95%、96%、97%、98%、99%或更多。
为减小或基本上消除植物中内源基因的表达,需要一段足够长度的、基本上连续核苷酸的核酸序列。为进行基因沉默,这可以少至20、19、18、17、16、15、14、13、12、11、10或更少的核苷酸,可选地,这可以多至完整的基因(包括部分或完整的5’和/或3’UTR)。此基本上连续的核苷酸链可以源自编码目的蛋白质的核酸(靶基因),或者源自能够编码目的蛋白质的直向同源物、旁系同源物或同源物的任何核酸。优选地,基本上连续的核苷酸链能够与靶基因(有义链或反义链)形成氢键,更优选地,基本上连续的核苷酸链按照递增的优选顺序与靶基因(有义链或反义链)50%、60%、70%、80%、85%、90%、95%、96%、97%、98%、99%、100%序列相同。对于本文所讨论的用于减小或基本上消除内源基因表达的各种方法而言,编码(功能性)多肽的核酸序列并非必需的。
减小或基本上消除表达可以利用常规工具和技术来实现。减小或基本上消除内源基因表达的一个优选方法是通过向植物中引入和表达基因构建体,其中,核酸(在此情况中,源自目的基因、或者源自能够编码任一目的蛋白质的直向同源物、旁系同源物或同源物的任何核酸的、一段基本上连续核苷酸的链)以被间隔子(非编码DNA)分隔开的、(部分或完全地)反向重复的形式克隆在该构建体中。
在这样的优选方法中,利用核酸或其部分(在此情况中,源自目的基因、或者源自能够编码目的蛋白质的直向同源物、旁系同源物或同源物的任何核酸的、一段基本上连续核苷酸的链)的反向重复(优选能够形成发夹结构),通过RNA介导的沉默,实现减小或基本上消除内源基因的表达。将该反向重复序列克隆进包含控制序列的表达载体中。非编码DNA核酸序列(间隔子,例如基质附着区片段(MAR)、内含子、多接头等)位于形成该反向重复的两个反向核酸之间。该反向重复序列转录后,形成具有(部分或完全)自我互补结构的嵌合RNA。该双链RNA结构称为发夹RNA(hpRNA)。hpRNA被植物加工成可以整合入RNA诱导的沉默复合物(RISC)中的siRNA。RISC进而切割mRNA转录物,从而显著减少待翻译成多肽的mRNA转录物的数量。关于其他一般细节,参见例如Grierson等(1998)WO 98/53083;Waterhouse等(1999)WO 99/53050)。
本发明的方法的实施不依赖于向植物中引入和表达其中以反向重复形式克隆了核酸分子的基因构建体,而是可以使用几种公知的“基因沉默”法中的任一个或多个来实现相同的效应。
用于减小内源基因表达的一个这样的方法是RNA介导的基因表达的沉默(下调)。在该情况下沉默在植物中由双链RNA序列(dsRNA)触发,所述双链RNA序列基本上与靶内源基因相似。该dsRNA被植物进一步加工成称为短干扰RNA(siRNA)的大约20至大约26个核苷酸。siRNA整合入RNA诱导的沉默复合物(RISC),该复合物切割内源靶基因的mRNA转录物,从而实质性减少待翻译成多肽的mRNA转录物的数量。优选,双链RNA序列相应于靶基因。
RNA沉默法的另一实例包括以有义取向,向植物中引入核酸序列或其部分(在这种情况下,源自目的基因、或者源自能够编码目的蛋白质的直向同源物、旁系同源物或同源物的任何核酸的、一段基本上连续核苷酸的链)。“有义取向”是指与其mRNA转录物同源的DNA序列。从而至少一个拷贝的核酸序列被引入植物。该额外的核酸序列将减小内源基因的表达,从而产生称为共抑制的现象。如果将几个额外拷贝的核酸序列引入植物,则基因表达的减小将更明显,因为在高转录水平与共抑制的触发之间存在正相关。
RNA沉默法的另一实例包括使用反义核酸序列。“反义”核酸序列包含这样的核苷酸序列,所述核苷酸序列与编码蛋白质的“有义”核酸序列互补,即与双链cDNA分子的编码链互补或与mRNA转录物序列互补。反义核酸序列优选与待沉默的内源基因互补。互补性可位于基因的“编码区”和/或“非编码区”中。术语“编码区”是指包含将翻译成氨基酸残基的密码子的核苷酸序列的区域。术语“非编码区”是指连接在编码区侧翼的5′和3′序列,其可被转录但不被翻译成氨基酸(也称为5′和3′非翻译区)。
可根据沃尔森和克里克碱基配对法则设计反义核酸序列。反义核酸序列可与整个核酸序列(在这种情况下,源自目的基因、或者源自能够编码目的蛋白质的直向同源物、旁系同源物或同源物的任何核酸的、一段基本上连续核苷酸的链)互补,但也可以是仅对核酸序列的部分(包括mRNA 5’和3’UTR)反义的寡核苷酸。例如,反义寡核苷酸序列可与围绕编码多肽的mRNA转录物的翻译起始位点的区域互补。适宜的反义寡核苷酸序列的长度在本领域内是已知的并且可以开始于长大约50、45、40、35、30、25、20、15或10个核苷酸或更少。可使用本领域内已知的方法,使用化学合成和酶促连接反应,构建根据本发明的反义核酸序列。例如,反义核酸序列(例如,反义寡核苷酸序列)可使用天然存在的核苷酸或各种修饰核苷酸来化学合成,所述修饰核苷酸经设计用以增加分子的生物学稳定性或增加反义与有义核酸序列之间形成的双链体的物理稳定性,例如可使用硫代磷酸酯衍生物和吖啶取代的核苷酸。可用于产生反义核酸序列的修饰核苷酸的实例在本领域是公知的。已知的核苷酸修饰包括甲基化、环化和“加帽”和用类似物例如肌苷对一个或多个天然存在的核苷酸的取代。核苷酸的其他修饰在本领域是公知的。
可使用已将核酸序列以反义取向(即,从插入的核酸转录的RNA针对目的靶核酸是反义取向)亚克隆入其中的表达载体,生物学地产生反义核酸序列。优选,植物中,通过稳定地整合的包含启动子、有效连接的反义寡核苷酸和终止子的核酸构建体,产生反义核酸序列。
用于在本发明的方法中进行沉默的核酸分子(无论引入植物的还是原位产生的)与编码多肽的mRNA转录物和/或基因组DNA杂交或结合,从而例如通过抑制转录和/或翻译来抑制蛋白质的表达。杂交可通过常规核苷酸互补性以形成稳定的双链体或者,例如在结合DNA双链体的反义核酸序列的情况下,通过双螺旋的大沟中的特定相互作用而产生。可通过转化或在特定组织位置直接注射,将反义核酸序列引入植物。可选地,可修饰反义核酸序列以靶向选择的细胞,然后全身性施用。例如,为了进行全身性施用,可以修饰反义核酸序列,以便其特异性结合选择的细胞表面上表达的受体或抗原(例如,通过将反义核酸序列连接至结合细胞表面受体或抗原的肽或抗体)。还可使用本文中描述的载体将反义核酸序列递送至细胞。
根据另一个方面,反义核酸序列是α-异头物核酸序列。α-异头物核酸序列与互补RNA形成特定的双链杂交体,其中与常见的b单元(b-units)不同,链走向彼此平行(Gaultier等(1987)Nucl Ac Res 15:6625-6641)。反义核酸序列还可包含2′-o-甲基核糖核苷酸(Inoue等(1987)NuclAc Res 15,6131-6148)或嵌合RNA-DNA类似物(Inoue等(1987)FEBSLett.215,327-330)。
还可使用核酶减少或基本上消除内源基因的表达。核酶是具有核糖核酸酶活性的催化性RNA分子,该分子能够切割与其具有互补区的单链核酸序列例如mRNA。因此,核酶(例如,锤头核酶(Haselhoff和Gerlach(1988)Nature 334,585-591)中描述的)可用于催化切割编码多肽的mRNA转录物,从而显著减少待翻译成多肽的mRNA的数量。可设计具有对于核酸序列的特异性的核酶(参见例如:Cech等美国专利号4,987,071;和Cech等美国专利号5,116,742)。可选择地,可以使用相应于核酸序列的mRNA转录物,从RNA分子库中选择具有特定核糖核酸酶活性的催化性RNA(Bartel和Szostak(1993)Science 261,1411-1418)。核酶用于在植物中进行基因沉默的用途在本领域是已知的(例如,Atkins等(1994)WO94/00012;Lenne等(1995)WO 95/03404;Lutziger等(2000)WO 00/00619;Prinsen等(1997)WO 97/13865和Scott等(1997)WO 97/38116)。
基因沉默还可以通过插入诱变(例如,T-DNA插入或转座子插入)或通过Angell和Baulcombe((1999)Plant J 20(3):357-62)、(AmpliconVIGS WO 98/36083)或Baulcombe(WO 99/15682)等所述的策略来实现。
如果在内源基因上存在突变和/或在随后引入植物的分离基因/核酸上存在突变,那么基因沉默也可发生。减少或基本上消除可通过非功能性多肽引起。例如,多肽可能结合多种相互作用的蛋白质;因此,可以通过一个或多个突变和/或截短,提供仍然能够结合相互作用的蛋白质(例如受体蛋白)但不能展示其正常功能(例如信号转导配体)的多肽。
进行基因沉默的另一个方法是通过用与基因的调控区(例如启动子和/或增强子)互补的核酸序列来打靶以形成三螺旋结构,所述结构阻止基因在靶细胞中的转录。参见Helene,C.,Anticancer Drug Res.6,569-84,1991;Helene等,Ann.N.Y.Acad.Sci.660,27-36 1992;和Maher,L.J.Bioassays 14,807-15,1992。
其他方法,例如应用针对内源多肽的抗体在植物原位(in planta)抑制其功能、或干扰多肽所参与的信号传递通路,对于技术人员是公知的。特别地,可预期人造分子可用于抑制靶多肽的生物功能,或用于干扰其中靶多肽参与的信号转导途径。
可选择地,可设置筛选程序以鉴定植物群体中基因的天然变体,该变体编码具有减少的活性的多肽。这样的天然变体也可用于例如进行同源重组。
人工和/或天然微小RNA(miRNA)可以用来敲除基因表达和/或mRNA翻译。内源miRNA为单链小RNA,一般长度19-24个核苷酸。它们主要用于调控基因表达和/或mRNA翻译。大多数植物microRNA(miRNA)具有与其靶序列完全或几乎完全的互补性。然而,存在具有达到5个错配的天然靶。miRNA利用Dicer家族的双链特异性RNA酶从具有特征性折回结构的更长的非编码RNA加工而来。一旦加工后,它们通过结合RNA诱导的沉默复合物(RISC)的主要成分Argonaute蛋白,而掺入到RNA诱导沉默复合物中。MiRNA充当RISC的特异性组件,因为它们与细胞质中的靶核酸(大多数为mRNA)碱基配对。随后的调控事件包括靶mRNA切割和破坏和/或翻译抑制。因此,miRNA过表达的效应常反映为靶基因的降低的mRNA水平。
人工微小RNA(amiRNA)一般长度21个核苷酸,可以特异地遗传改造以负调控单个或多个目的基因的基因表达。植物微小RNA靶标选择的决定因素在本领域公知。已经定义了靶标识别的经验参数,并且可用来辅助设计特异性amiRNA(Schwab等,(2005)Dev Cell 8:517-527,2005)。设计和生成amiRNA及其前体的便利工具也是公众可获得的(Schwab等,(2006)Plant Cell 18(5):1121-1133,2006)。
为优化性能,用来减小植物中内源基因表达的基因沉默技术需要应用来自单子叶植物的核酸序列转化单子叶植物,而使用来自双子叶植物的核酸序列转化双子叶植物。优选,将来自任何给定植物物种的核酸序列引入到相同物种中。例如,来自稻的核酸序列转化到稻植物中。然而,待引入的核酸序列来源于与其待引入的植物相同的植物物种并非是绝对必需的。内源靶基因与待引入的核酸之间基本上同源就足够了。
上文描述了减小或基本上消除植物中内源基因表达的多种方法的实例。本领域技术人员将能够容易地调整上述沉默方法,以便例如通过应用适当的启动子而实现内源基因在整株植物或其部分中的表达减小。
转化
本文述及的术语“引入”或“转化”包括将外源多核苷酸转移进宿主细胞,不考虑转移所用的方法。能够随后通过器官发生或者胚胎发生进行克隆增殖的植物组织都可以使用本发明的遗传构建体转化,并从其再生整个植物。具体的组织选择将因可用于和最适于待转化的具体物种的克隆增殖系统而变。示例性的组织靶标包括叶盘、花粉、胚、子叶、下胚轴、雌配子、愈伤组织、既有的分生组织(例如顶端分生组织、腋芽和根分生组织),以及诱导的分生组织(例如子叶分生组织和下胚轴分生组织)。可以将多核苷酸瞬时地或稳定地引入宿主细胞,并且可以,例如作为质粒以非整合的状态维持。可选地,其可以整合进入宿主基因组。得到的转化植物细胞可以接着以本领域技术人员已知的方式再生为转化的植物。
外来基因转移进入植物基因组中称为转化。植物物种的转化目前是一种相当常规的技术。有利地,可以使用若干转化方法的任一种向适当的祖先细胞引入目的基因。可以利用公开的转化方法以及由植物组织或植物细胞再生植物的方法来进行瞬时或稳定转化。转化方法包括应用脂质体、电穿孔、增加游离DNA摄取的化学物质、直接向植物注射DNA、粒子枪轰击、用病毒或花粉转化和微粒轰击。方法可以选自用于原生质体的钙/聚乙二醇方法(Krens,F.A.等,(1882)Nature 296,72-74;Negrutiu I.等,(1987)Plant Mol.Biol.8:363-373);原生质体的电穿孔法(Shillito R.D.等,(1985)Bio/Technol 3,1099-1102);植物材料的显微注射(Crossway A.等,(1986)Mol.Gen Genet 202:179-185);DNA或RNA包被的粒子轰击(Klein T.M.等,(1987)Nature 327:70);用(非整合型)病毒感染,等等。优选通过农杆菌介导的转化,产生转基因植物,包括转基因作物植物。有利的转化法是植物原位转化。为此,可以例如使农杆菌作用于植物种子,或用农杆菌接种植物分生组织。已经证明,根据本发明尤为有利的是使转化的农杆菌悬液作用于完整植株或至少花原基。随后培养植物,直至获得所处理植物的种子(Clough和Bent,Plant J.(1998)16,735-743)。农杆菌介导的稻转化方法包括公知的稻转化方法,例如在任一如下文献中描述的那些:欧洲专利申请EP 1198985 A1,Aldemita和Hodges(Planta,199:612-617,1996);Chan等(Plant Mol.Biol.22(3)491-506,1993),Hiei等(Plant J.6(2):271-282,1994),其公开内容并入本文作为参考,如同充分阐述的那样。至于玉米转化,优选的方法如Ishida等(Nat.Biotechnol.14(6):745-50,1996)或Frame等(Plant Physiol.129(1):13-22,2002)中所述,其公开内容并入本文作为参考,如同充分阐述的那样。作为举例说明,所述方法还由B.Jenes等,Techniques for Gene Transfer,在Transgenic Plants,卷1,Engineering and Utilization,编辑S.D.Kung和R.Wu,Academic Press(1993)128-143以及Potrykus Annu.Rev.PlantPhysiol.Plant Molec.Biol.42(1991)205-225)中进一步描述。优选将待表达的核酸或构建体克隆到载体中,所述载体适用于转化根癌农杆菌(Agrobacterium tumefaciens),例如pBin19(Bevan等,Nucl.Acids Res.12(1984)8711)。然后以已知的方式利用由这样的载体转化的农杆菌来转化植物,例如模式植物,像拟南芥属植物(拟南芥(Arabidopsis thaliana)在本发明范围内不视为作物植物);或者作物植物,例如烟草植物,例如通过将擦伤的叶子或切碎的叶子浸在农杆菌溶液中,然后在合适的培养基中培养之。通过根癌农杆菌的植物转化由例如,
Figure BDA0000125779720000391
和Willmitzer在Nucl.Acid Res.(1988)16,9877中描述,或者尤其可以参见F.F.White,Vectorsfor Gene Transfer in Higher Plants在Transgenic Plants,卷1,Engineering and Utilization,编辑S.D.Kung和R.Wu,Academic Press,1993,第15-38页。
除了转化之后不得不再生为完整植株的体细胞,还可以转化植物分生组织的细胞,特别是可以发育成配子的那些细胞。在这种情况下,转化的配子循着天然植物的发育而产生转基因植物。因此,例如,用农杆菌处理拟南芥的种子,并从发育中的植物获得种子,其中一定比例的植物被转化因而是转基因的[Feldman,KA和Marks MD(1987).Mol Gen Genet208:274-289;Feldmann K(1992).在C Koncz,N-H Chua和J Shell编辑Methods in Arabidopsis Research.Word Scientific,Singapore,第274-289页]。可选的方法基于花序的反复去除以及莲座中心切割部位与转化农杆菌一起进行的孵育,由此在随后的时间点同样能够获得转化的种子(Chang(1994).Plant J.5:551-558;Katavic(1994).Mol Gen Genet,245:363-370)。然而,特别有效的方法是改良的真空浸润法,如“浸花法”(floral dip)。对于拟南芥的真空浸润,减压下用农杆菌悬液处理完整植株[Bechthold,N(1993).C R Acad Sci Paris Life Sci,316:1194-1199],而对于“浸花法”,将发育中的花组织与表面活性剂处理的农杆菌悬液短暂孵育[Clough,SJ和Bent,AF(1998).The Plant J.16,735-743]。在两种情况下均收获一定比例的转基因种子,且可通过在上述选择性条件下培养而将这些种子与非转基因种子区分开来。另外,质体的稳定转化是有利的,因为质体在多数作物中为母系遗传,从而降低或消除了转基因通过花粉流失的风险。叶绿体基因组的转化通常通过Klaus等,2004[NatureBiotechnology 22(2),225-229]系统展示的方法实现。简言之,将待转化的序列与可选择的标记基因一起克隆到同源于叶绿体基因组的侧翼序列之间。这些同源侧翼序列指导转基因位点特异性整合到质体基因组中。质体转化已在许多不同的植物物种中描述,且综述由Bock(2001)Transgenicplastids in basic research and plant biotechnology.J Mol Biol.2001年9月21日;312(3):425-38或Maliga,P(2003)Progress towardscommercialization of plastid transformation technology.Trends Biotechnol.21,20-28给出。最近报道了其他生物技术进步,无标记的质体转化体,这可通过瞬时共整合的标记基因产生(Klaus等,2004,NatureBiotechnology 22(2),225-229)。
遗传修饰的植物细胞能够通过技术人员熟悉的所有方法再生。合适的方法可见于上述S.D.Kung和R.Wu、Potrykus或者
Figure BDA0000125779720000411
和Willmitzer的出版物。
通常在转化以后,选出存在一个或多个标记的植物细胞或细胞群,所述标记由与目的基因共转移的植物可表达基因编码,接着使转化的材料再生成整个植物。为选择转化的植物,通常将在转化中获得的植物材料置于选择性条件下,从而可将转化的植物与未转化的植物区分开来。例如,可以种植以上述方式获得的种子,并在最初的生长期之后,通过喷雾对其进行合适的选择。另一可能性方案是在使用合适的选择剂的琼脂板上生长种子(酌情在灭菌后),从而仅转化的种子能够长成植物。可选地,针对可选择标记例如上文所述标记的存在,筛选转化的植物。
DNA转移和再生之后,还可例如用Southern分析(DNA印迹),评价推定转化的植物,评价目的基因的存在、拷贝数和/或基因组构造。可选的或额外地,可用Northern和/或Western分析(蛋白质印迹)监测新引入的DNA的表达水平,这两种技术都是本领域普通技术人员所公知的。
产生的转化植物可以通过多种方式繁殖,如通过克隆繁殖或经典的育种技术。例如,第一代(或T1)转化的植物可自交,选择纯合的第二代(或T2)转化体,而T2植物可进一步通过经典育种技术繁殖。产生的转化生物体可以呈多种形式。例如,它们可以是转化细胞和非转化细胞的嵌合体;克隆的转化体(例如所有细胞已转化而含有表达盒);转化的和非转化的组织的嫁接体(例如在植物中,转化的砧木嫁接到非转化的接穗上)。
T-DNA激活标记
T-DNA激活标记(Hayashi等Science(1992)1350-1353)包括将T-DNA[通常含有启动子(也可以是翻译增强子或内含子)]插入在目的基因的基因组区或基因编码区上游或下游10kb处,从而在构型上使启动子能够指导靶基因的表达。通常破坏天然启动子对靶基因表达的调控,而使基因落入新引入的启动子的控制下。启动子一般包含于T-DNA中。此T-DNA可以例如通过农杆菌感染而随机插入植物基因组中,并导致所插入T-DNA附近的基因的表达被修饰。得到的转基因植物由于位于引入的启动子附近的基因的修饰表达而表现出显性表型。
TILLING
术语“TILLING”为“靶向诱导的基因组局部损伤”(Targeted InducedLocal Lesions In Genomes)的缩写,是一种用于生成和/或鉴定编码具有修饰的表达和/或活性的蛋白质的核酸的诱变技术。TILLING还允许选择携带此类突变变体的植物。这些突变变体可以在强度、位置或时间(例如,如果突变影响启动子的话)上呈现出修饰的表达。这些突变变体可以比其天然形式基因呈现更高的活性。TILLING将高密度诱变和高通量筛选方法结合在一起。TILLING一般遵循的步骤有:(a)EMS诱变(Redei GP和Koncz C,(1992)In Methods in Arabidopsis Research,Koncz C,Chua NH,Schell J编辑,新加坡,World Scientific Publishing Co,第16-82页;Feldmann等,(1994)In Meyerowitz EM,Somerville CR编辑,Arabidopsis.冷泉港实验室出版社,冷泉港,纽约,第137-172页;Lightner J和Caspar T,(1998)In J Martinez-Zapater,J Salinas编辑,Methods on MolecularBiology,82卷Humana Press,Totowa,NJ,第91-104页);(b)DNA制备和个体合并;(c)目的区域的PCR扩增;(d)变性和退火以形成杂双链体;(e)DHPLC,其中合并物中存在的杂双链体在色谱图上检测为额外的峰;(f)突变个体的鉴定;和(g)突变PCR产物的测序。TILLING的方法是本领域公知的(McCallum等(2002)Nat Biotechnol 18:455-457,由Stemple综述(2004)Nat Rev Genet 5(2):145-50)。
同源重组
同源重组允许向基因组中的规定选定位置引入所选的核酸。同源重组是生物科学中常规用于低等生物体如酵母或剑叶藓(physcomitrella)的标准技术。在植物中进行同源重组的方法已经不仅在模式植物中描述(Offringa等(1990)EMBO J.9(10):3077-84),而且也在作物植物,如稻中描述(Terada等(2002)Nat Biotech 20(10):1030-4;Iida和Terada(2004)Curr Opin Biotechnol 15(2):132-8),并且存在无论靶生物种类的通常可应用的方法(Miller等,Nature Biotechnol.25,778-785,2007)。
产量相关性状
产量相关性状包括如下之一或多种:产量、生物量、种子产量、早期活力、绿度指数、增加的生长速率、改善的农艺性状(例如,提高的水利用效率(WUE),氮利用效率(NUE)等)。
产量
术语“产量”通常表示具有经济价值的可测量产出,其一般是与规定的作物、面积和/或时期相关的。各植物部分基于其数量、大小和/或重量对产量直接做出贡献,或者实际产量是年作物每平方米的产量,用总产量(既包括收获的产量也包括估定的产量)除以种植的平方米来确定。术语植物的“产量”可能与该植物的营养性生物量(根和/或枝条生物量)、繁殖器官、和/或繁殖体(如种子)相关。
以玉米为例,产量增加可以表现为如下一个或多个方面:每平方米建植的植物数的增加、每株植物的穗数的增加、行数、行粒数、粒重、千粒重、穗长度/直径的增加、种子饱满率(为饱满种子数除以种子总数并乘以100)的增加,等等。以稻为例,产量增加可以表现为如下一个或多个方面的增加:每平方米的植物数、每株植物的圆锥花序数、圆锥花序长度、每圆锥花序的小穗数、每圆锥花序的花朵(小花)数、种子饱满率(为饱满种子数除以种子总数并乘以100)的增加、千粒重的增加,等等。在稻中,耐淹性也可以导致增加的产量。
早期活力
“早期活力”是指活跃健康充分均衡的生长(特别是在植物生长的早期阶段),其可以因植物适应性(fitness)增强引起,例如,由于植物更好地适应其环境(即,优化能源资源的利用以及在枝条和根之间的分配)引起。具有早期活力的植物也显示出增加的幼苗存活和更佳的作物齐苗,这往往产生高均匀度的田地(作物以齐整的方式生长,即大多数植物基本上同时达到各发育阶段),以及往往是更优更高的产量。因此,早期活力可以通过测量多种因素来确定,如千粒重、萌发率、出苗率、幼苗生长、幼苗高度、根长度、根和枝条生物量,等等。
增加的生长速率
增加的生长速率可以特异于植物的一个或多个部分(包括种子),或者可以基本上遍及整株植物。具有增加生长速率的植物可以具有更短的生命周期。植物的生命周期可以理解为指,从成熟干种子生长至植物已经产生类似于起始材料的成熟干种子的阶段所需的时间。此生命周期可以受到诸如萌发速度、早期活力、生长速率、绿度指数、开花时间和种子成熟速度等因素的影响。生长速率的增加可以发生在植物生命周期的一个或多个阶段,或者发生在基本上整个植物生命周期的过程中。在植物生命周期的早期阶段,生长速率的增加可以反映出增强的活力。生长速率的增加可以改变植物的收获周期,使植物能够比原可能的情况更晚播种和/或更快收获(类似的效果可以通过较早的开花时间获得)。如果生长速率充分增加,可以允许再次播种同种植物物种的种子(例如完全在一个常规的生长期内,播种和收获稻类植物、接着再次播种和收获稻类植物)。与此类似,如果生长速率充分地增加,可以允许再播种不同植物物种的种子(例如播种和收获玉米植物,随后,例如,播种和任选的收获大豆、马铃薯或任何其他适宜的植物)。在一些作物植物的情况下也可能从同一砧木收获增加的次数。改变植物的收获周期可以导致每平方米年生物量产量的增加(这是由于(比方说在一年中)任何特定植物可以生长和收获的次数增加)。与野生型对应物相比,生长速率的增加还允许在更广阔的地域栽培转基因植物,这是因为种植作物的地域限制常由种植时(早季)或收获时(晚季)不利的环境条件所决定。如果缩短收获周期,就可以避免这类不利条件。可以通过自生长曲线获得多种参数,确定生长速率,这类参数可以是:T-Mid(植物达到其最大大小的50%所需的时间)和T-90(植物达到其最大大小的90%所需的时间)等等。
胁迫抗性
相对于对照植物,产量和/或生长速率的增加可以发生在植物处于非胁迫条件下或发生在植物暴露于各种胁迫的情况下。通常植物通过更加缓慢的生长来应答胁迫接触。在重度胁迫条件下,植物甚至可以完全停止生长。另一方面,轻度胁迫在文中定义为当植物接触时不导致植物完全停止生长且丧失重新开始生长的能力的任何胁迫。本发明意义上的轻度胁迫导致受胁迫植物的生长,与非胁迫条件下的对照植物相比,下降不到40%、35%、30%或25%、更优选下降不到20%或15%。由于农业实践(灌溉、施肥、农药处理)的发展,栽培的作物植物往往并不会遇到重度胁迫。因此,由轻度胁迫诱发的受损的生长通常成为农业中不期望的性质。轻度胁迫是植物接触的日常的生物和/或非生物(环境)胁迫。非生物胁迫可以因干旱或过量的水、缺氧胁迫、盐胁迫、化学毒性、氧化胁迫以及热、冷或冰冻温度而引起。非生物胁迫可以是由于水胁迫(特别是由于干旱)、盐胁迫、氧化胁迫或离子胁迫引起的渗透胁迫。生物胁迫一般是由病原体例如细菌、病毒、真菌、线虫和昆虫所引起的那些胁迫。
特别地,可在非胁迫条件下或在轻度干旱条件下进行本发明方法以产生相对于对照植物具有增加的产量的植物。如Wang等(Planta(2003)218:1-14)所报道的那样,非生物胁迫引起一系列的形态学、生理学、生物化学和分子变化,对植物生长和生产力造成不利影响。已知干旱、盐度、极端温度和氧化胁迫相互联系,并可以通过相似的机制诱发生长和细胞损害。Rabbani等(Plant Physiol(2003)133:1755-1767)描述了干旱胁迫和高盐度胁迫之间存在着的特别高程度的“交叉对话”。例如,干旱和/或盐度主要表现为渗透胁迫,导致破坏细胞中的稳态和离子分布。氧化胁迫通常与高温或低温、盐度或干旱胁迫相伴,可以引起功能及结构蛋白质的变性。所以,这些多种多样的环境胁迫通常激活相似的细胞信号传递通路和细胞应答,如应激蛋白的产生、抗氧化剂的上调、可混溶溶质的累积以及生长阻抑。如本文中所用的术语“非胁迫”条件是允许植物最佳生长的那些环境条件。本领域技术人员知道给定位置的正常土壤条件和气候条件。具有最佳生长条件(在非胁迫条件下生长)的植物通常按照递增的优选次序产生这样的植物在给定的环境中的平均产量的至少97%、95%、92%、90%、87%、85%、83%、80%、77%或75%。可基于收获和/或季节,计算平均产量。本领域技术人员将知晓作物的平均产量产出。
养分缺乏可以因诸如氮、磷酸及其他含磷化合物、钾、钙、镁、锰、铁和硼等养分的缺乏所致。
术语盐胁迫不局限于氯化钠(NaCl),而可以是如下之一种或多种:NaCl、KCl、LiCl、MgCl2、CaCl2等等。
增加/提高/增强
术语“增加”、“提高”或“增强”可互换,且在本申请意义上表示与文中所定义的对照植物相比,产量和/或生长多出至少3%、4%、5%、6%、7%、8%、9%或10%,优选至少15%或20%,更优选25%、30%、35%或40%。
种子产量
增加的种子产量自身可表现为如下一项或多项:a)种子生物量(种子总重量)的增加,这可以是基于单粒种子和/或每植株和/或每平方米的增加;b)每植株花数的增加;c)增加的(饱满)种子数;d)增加的种子饱满率(其表达为饱满种子数与种子总数的比率);e)增加的收获指数,其表达为可收获部分如种子的产量除以总生物量的比率;f)增加的千粒重(TKW),这通过计数饱满种子数和它们的总重量外推得到。TKW增加可来自于种子大小和/或种子重量的增加,并且也可来自胚和/或胚乳大小的增加。
种子产量的增加也可表现为种子大小和/或种子体积的增加。此外,种子产量的增加自身也可表现为种子面积和/或种子长度和/或种子宽度和/或种子周长的增加。增加的产量也可以导致改变的构造,或可以因改变的构造而发生。
绿度指数
如本文所用的“绿度指数”根据植物的数字图像计算。对于图像中属于植物目标的每一个像素,计算绿值相对于红值之比(在RGB模型中用于色度编码)。绿度指数表达为绿红比超过给定阈值的像素百分比。在正常生长条件下、在盐胁迫生长条件下、在养分可利用度下降的生长条件下,在开花前的末次成像中测量植物绿度指数。相反,在干旱胁迫生长条件下,在干旱后的首次成像中测量植物绿度指数。
标记辅助育种
这类育种程序有时需要使用例如EMS诱变,通过植物诱变处理引入等位基因变异;可选的,此类程序可以起始于一系列无意产生的所谓“天然”起源的等位基因变体。然后通过例如PCR进行等位基因变体的鉴定。随后是选择步骤,用以选择所讨论序列的较好等位基因变体,该变体提供增加的产量。一般通过监测含有所讨论序列的不同等位基因变体的植物的生长行为来进行选择。可以在温室或田地中监测生长行为。更多任选的步骤包括使经鉴定含有较好等位基因变体的植物与另一植物杂交。例如,可使用这种方法产生感兴趣表型特征的组合。
在(遗传作图)中用作探针
利用编码目的蛋白质的核酸进行基因的遗传和物理作图仅需要长度至少15个核苷酸的核酸序列。此类核酸可以用作限制性片段长度多态性(RFLP)标记。可以用编码目的蛋白质的核酸探测限制酶切消化的植物基因组DNA的Southern印迹(Sambrook J,Fritsch EF和Maniatis T(1989)《分子克隆:实验室手册》)。随后使用计算机程序如MapMaker(Lander等(1987)Genomics 1:174-181)对产生的带型进行遗传分析,以构建遗传图谱。另外,可以使用所述核酸探测含有一组如下个体的限制性内切酶处理的基因组DNA的Southern印迹,所述该组个体为规定的遗传杂交的亲本和子代。记录DNA多态性的分离,并用于计算编码目的蛋白质的核酸在先前用此群体所获得的遗传图谱中的位置(Botstein等(1980)Am.J.Hum.Genet.32:314-331)。
有关在遗传作图中使用的植物基因衍生探针的产生和使用,描述于Bernatzky和Tanksley(1986)Plant Mol.Biol.Reporter 4:37-41中。众多出版物中描述过用上述方法或其变通形式对特定cDNA克隆进行的遗传作图。例如,可以使用F2杂交群体、回交群体、随机交配群体、近等基因系和其它个体组作图。这类方法是本领域技术人员公知的。
核酸探针也可以用来进行物理作图(即在物理图谱上安置序列;参见Hoheisel等In:Non-mammalian Genomic Analysis:A Practical Guide,Academic press 1996,第319-346页,及其中引用的参考文献)。
在另一个实施方案中,核酸探针可用于直接荧光原位杂交(FISH)作图(Trask(1991)Trends Genet.7:149-154)。尽管目前FISH作图的方法倾向使用大的克隆(几个kb到几百个kb;参见Laan等(1995)Genome Res.5:13-20),但是灵敏性的提高可以允许在FISH作图中应用较短的探针。
用于遗传和物理作图的多种基于核酸扩增的方法可以使用所述核酸序列进行。实例包括等位基因特异性扩增(Kazazian(1989)J.Lab.Clin.Med 11:95-96)、PCR扩增片段的多态性(CAPS;Sheffield等(1993)Genomics 16:325-332)、等位基因特异性连接(Landegren等(1988)Science241:1077-1080)、核苷酸延伸反应(Sokolov(1990)Nucleic Acid Res.18:3671)、放射杂交作图(Walter等(1997)Nat.Genet.7:22-28)和Happy作图(Dear和Cook(1989)Nucleic Acid Res.17:6795-6807)。为实施这些方法,使用核酸的序列设计和产生用于扩增反应或引物延伸反应的引物对。这类引物的设计是本领域技术人员公知的。在采用基于PCR的遗传作图的方法中,可能需要鉴定作图杂交的亲本之间在相应于本发明核酸序列的区域中的DNA序列差异。然而,这对作图方法通常不是必要的。
植物
本文所用术语“植物”涵盖整株植物、植物的祖先和后代以及植物部分,包括种子、枝条、茎、叶、根(包括块茎)、花以及组织和器官,其中上述每一种都含有目的基因/核酸。术语“植物”也涵盖植物细胞、悬浮培养物、愈伤组织、胚、分生组织区、配子体、孢子体、花粉和小孢子,同样其中上述每一种都含有目的基因/核酸。
尤其可用于本发明方法的植物包括属于植物界(Viridiplantae)超家族的所有植物,尤其是单子叶植物和双子叶植物,包括饲料或饲料豆科植物、观赏植物、粮食作物、乔木或灌木,选自包括如下的列表:槭树属物种(Acer spp.)、猕猴桃属物种(Actinidia spp.)、秋葵属物种(Abelmoschusspp.)、剑麻(Agave sisalana)、冰草属物种(Agropyron spp.)、匍茎剪股颖(Agrostis stolonifera)、葱芹属物种(Allium spp.)、苋属物种(Amaranthusspp.)、滨草(Ammophila arenaria)、凤梨(Ananas comosus)、番荔枝属物种(Annona spp.)、芹菜(Apium graveolens)、落花生属物种(Arachisspp.)、木波罗属物种(Artocarpus spp.)、石刁柏(Asparagus officinalis)、燕麦属物种(Avena spp.)(如燕麦(Avena sativa)、野燕麦(Avena fatua)、比赞燕麦(Avena byzantina)、Avena fatua var.sativa、杂种燕麦(Avenahybrida))、阳桃(Averrhoa carambola)、簕竹属物种(Bambusa sp.)、冬瓜(Benincasa hispida)、巴西栗(Bertholletia excelsea)、甜菜(Beta vulgaris)、芸苔属物种(Brassica spp.)(如欧洲油菜(Brassica napus)、甘蓝型油菜(Brassica rapa ssp.)[芸苔、油菜籽油菜、芜菁])、Cadaba farinosa、大叶茶(Camellia sinensis)、美人蕉(Canna indica)、大麻(Cannabis sativa)、辣椒属物种(Capsicum spp.)、苔草(Carex elata)、番木瓜(Carica papaya)、大果假虎刺(Carissa macrocarpa)、山核桃属物种(Carya spp.)、红花(Carthamus tinctorius)、粟属物种(Castanea spp.)、Ceiba pentandra、苦苣(Cichorium endivia)、樟属物种(Cinnamomum spp.)、西瓜(Citrulluslanatus)、柑橘属物种(Citrus spp.)、椰子属物种(Cocos spp.)、咖啡属物种(Coffea spp.)、芋(Colocasia esculenta)、可拉属物种(Cola spp.)、黄麻属物种(Corchorus sp.)、芫荽(Coriandrum sativum)、榛属物种(Corylusspp.)、山楂属物种(Crataegus spp.)、番红花(Crocus sativus)、南瓜属物种(Cucurbita spp.)、香瓜属物种(Cucumis spp.)、菜蓟属物种(Cynaraspp.)、胡萝卜(Daucus carota)、山马蟥属物种(Desmodium spp.)、龙眼(Dimocarpus longan)、薯蓣属物种(Dioscorea spp.)、柿树属物种(Diospyros spp.)、稗属物种(Echinochloa spp.)、油棕属(Elaeis)(如非洲油棕(Elaeis guineensis)、美洲油棕(Elaeis oleifera))、穇子(Eleusinecoracana)、埃塞俄比亚画眉草(Eragrostis tef)、蔗茅属物种(Erianthussp.)、枇杷(Eriobotrya japonica)、桉属物种(Eucalyptus sp)、红仔果(Eugenia uniflora)、荞麦属物种(Fagopyrum spp.)、山毛榉属物种(Fagusspp.)、苇状羊茅(Festuca arundinacea)、无花果(Ficus carica)、金桔属物种(Fortunella spp.)、草莓属物种(Fragaria spp.)、银杏(Ginkgo biloba)、大豆属物种(Glycine spp.)(如大豆(Glycine max)、黄豆(Soja hispida)或大豆(Soja max))、陆地棉(Gossypium hirsutum)、向日葵属物种(Helianthusspp.)(如向日葵(Helianthus annus))、萱草(Hemerocallis fulva)、木槿属物种(Hibiscus spp.)、大麦属物种(Hordeum spp.)(如大麦(Hordeumvulgare))、甘薯(Ipomoea batatas)、核桃属物种(Juglans spp.)、莴苣(Lactuca sativa)、山黧豆属物种(Lathyrus spp.)、兵豆(Lens culinaris)、亚麻(Linum usitatissimum)、荔枝(Litchi chinensis)、百脉根属物种(Lotusspp.)、棱角丝瓜(Luffa acutangula)、羽扇豆属物种(Lupinus spp.)、地杨梅(Luzula sylvatica)、番茄属物种(Lycopersicon spp.)(如番茄(Lycopersicon esculentum、Lycopersicon lycopersicum、Lycopersiconpyriforme)、硬皮豆属物种(Macrotyloma spp.)、苹果属物种(Malusspp.)、西印度樱桃(Malpighia emarginata)、曼密苹果(Mammeaamericana)、芒果(Mangifera indica)、木薯属物种(Manihot spp.)、人心果(Manilkara zapota)、紫花苜蓿(Medicago sativa)、草木樨属物种(Melilotus spp.)、薄荷属物种(Mentha spp.)、芒(Miscanthus sinensis)、苦瓜属物种(Momordica spp.)、黑桑(Morus nigra)、芭蕉属物种(Musaspp.)、烟草属物种(Nicotiana spp.)、木犀榄属物种(Olea spp.)、仙人掌属物种(Opuntia spp.)、Ornithopus spp.、稻属物种(Oryza spp.)(如稻(Oryzasativa),阔叶稻(Oryza latifolia))、黍糜(Panicum miliaceum)、柳枝稷(Panicum virgatum)、鸡蛋果(Passiflora edulis)、欧防风(Pastinacasativa)、狼尾草属物种(Pennisetum sp.)、鳄梨属物种(Persea spp.)、香芹(Petroselinum crispum)、虉草(Phalaris arundinacea)、菜豆属物种(Phaseolus spp.)、梯牧草(Phleum pratense)、刺葵属物种(Phoenix spp.)、南方芦苇(Phragmites australis)、酸浆属物种(Physalis spp.)、松属物种(Pinus spp.)、阿月浑子(Pistacia vera)、豌豆属物种(Pisum spp.)、早熟禾属物种(Poa spp.)、杨属物种(Populus spp.)、牧豆树属物种(Prosopisspp.)、李属物种(Prunus spp.)、番石榴属物种(Psidium spp.)、石榴(Punica granatum)、西洋梨(Pyrus communis)、栎属物种(Quercusspp.)、萝卜(Raphanus sativus)、波叶大黄(Rheum rhabarbarum)、茶藨子属物种(Ribes spp.)、蓖麻(Ricinus communis)、悬钩子属物种(Rubusspp.)、甘蔗属物种(Saccharum spp.)、柳属物种(Salix sp.)、接骨木属物种(Sambucus spp.)、黑麦(Secale cereale)、胡麻属物种(Sesamum spp.)、白芥属物种(Sinapis sp.)、茄属物种(Solanum spp.)(如马铃薯(Solanumtuberosum)、红茄(Solanum integrifolium)或番柿(Solanumlycopersicum))、两色蜀黍(Sorghum bicolor)、菠菜属物种(Spinaciaspp.)、蒲桃属物种(Syzygium spp.)、万寿菊属物种(Tagetes spp.)、酸豆(Tamarindus indica)、可可树(Theobroma cacao)、车轴草属物种(Trifolium spp.)、鸭茅状磨擦禾(Tripsacum dactyloides)、小黑麦(Triticosecale rimpaui)、小麦属物种(Triticum spp.)(如小麦(Triticumaestivum)、硬粒小麦(Triticum durum)、圆锥小麦(Triticum turgidum)、Triticum hybernum、马卡小麦(Triticum macha)、面包小麦(Triticumsativum)、一粒小麦(Triticum monococcum)或普通小麦(Triticumvulgare))、小金莲花(Tropaeolum minus)、旱金莲(Tropaeolum majus)、越桔属物种(Vaccinium spp.)、野豌豆属物种(Vicia spp.)、豇豆属物种(Vigna spp.)、香堇菜(Viola odorata)、葡萄属物种(Vitis spp.)、玉蜀黍(Zea mays)、北美洲野生稻(Zizania palustris)、枣属物种(Ziziphus spp.)等等。
对照植物
选择适宜的对照植物是实验设置的常规部分,并且可以包括相应的野生型植物或不含目的基因的相应植物。对照植物一般与待评估植物为相同的植物物种,或者甚至为同一品种。对照植物还可以是待评估植物的无效合子。无效合子是因分离而失去转基因的个体。如本文所用的“对照植物”不仅指完整植物,而且还指植物部分,包括种子和种子部分。
发明详述
现已令人惊讶地发现,在植物中调节编码C3H样多肽的核酸的表达可以产生相对于对照植物具有增强的产量相关性状的植物。根据第一实施方案,本发明提供了相对于对照植物增强植物的产量相关性状的方法,包括调节编码C3H样多肽的核酸在植物中的表达以及任选地选择具有增强的产量相关性状的植物。
此外,现已令人惊讶地发现,在植物中调节编码SPT样多肽的核酸的表达可以产生相对于对照植物具有增强的产量相关性状的植物。根据第一实施方案,本发明提供了相对于对照植物增强植物的产量相关性状的方法,包括调节编码SPT样多肽的核酸在植物中的表达以及任选地选择具有增强的产量相关性状的植物。
此外,现已令人惊讶地发现,在植物中调节编码IDI2多肽的核酸的表达可以产生相对于对照植物具有增强的产量相关性状的植物。根据第一实施方案,本发明提供了相对于对照植物增强植物的产量相关性状的方法,包括调节编码IDI2多肽的核酸在植物中的表达以及任选地选择具有增强的产量相关性状的植物。
本发明还提供了迄今未知的IDI2编码核酸和IDI2多肽。
根据本发明的另一个实施方案,因此提供了分离的核酸分子,其选自:
(i)SEQ ID NO:139,157,164,169,171,186之任一所示的核酸;
(ii)SEQ ID NO:139,157,164,169,171,186之任一所示的核酸的互补序列;
(iii)编码GR-RBP多肽的核酸,所述多肽按照递增的优选次序与SEQ ID NO:140,202,209,214,216,231之任一所示的氨基酸序列具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的序列同一性,并包含基序1至6中的一个或多个。
根据本发明的另一个实施方案,也提供了分离的多肽,其选自:
(i)SEQ ID NO:140,202,209,214,216,231之任一所示的氨基酸序列;
(ii)按照递增的优选次序与SEQ ID NO:140,202,209,214,216,231之任一所示的氨基酸序列具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的序列同一性、并包含基序1至6中的一个或多个的氨基酸序列。
(iii)上文(i)或(ii)所给出的任何氨基酸序列的衍生物。
此外,现已令人惊讶地发现,在植物中调节eIF4F样蛋白质复合物的活性可以产生相对于对照植物具有增强的产量相关性状的植物。根据第一实施方案,本发明提供了相对于对照植物增强植物的产量相关性状的方法,包括调节eIF4F样蛋白质复合物在植物中的活性和任选地选择具有增强的产量相关性状的植物。eIF4F样蛋白质复合物由eIF4E,4A,4G多肽或蛋白质亚基组成。
本发明还提供了迄今未知的eIF4F蛋白质复合物亚基编码核酸和所述亚基多肽。
根据本发明的另一个实施方案,因此提供了分离的核酸分子,其选自:
(i)SEQ ID NO:306所示的核酸;
(ii)SEQ ID NO:306所示的核酸的互补序列;
(iii)编码SEQ ID NO:307所示多肽的核酸,优选地由于遗传密码的简并性,所述分离的核酸可以来源于SEQ ID NO:307所示的多肽序列,且进一步优选地赋予相对于对照植物增强的产量相关性状;
(iv)按照递增的优选次序与表A4的核酸序列之任一具有至少30%,31%,32%,33%,34%,35%,36%,37%,38%,39%,40%,41%,42%,43%,44%,45%,46%,47%,48%,49%,50%,51%,52%,53%,54%,55%,56%,57%,58%,59%,60%,61%,62%,63%,64%,65%,66%,67%,68%,69%,70%,71%,72%,73%,74%,75%,76%,77%,78%,79%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%或99%的序列同一性的核酸,其还优选地赋予相对于对照植物增强的产量相关性状;
(v)在严紧杂交条件下与(i)至(iv)的核酸分子杂交的核酸分子,其优选地赋予相对于对照植物增强的产量相关性状;
(vi)编码至少eIF4F亚基多肽的核酸,其中所述多肽按照递增的优选次序与SEQ ID NO:68所示的氨基酸序列以及表A4中其它氨基酸序列之任一具有至少50%,51%,52%,53%,54%,55%,56%,57%,58%,59%,60%,61%,62%,63%,64%,65%,66%,67%,68%,69%,70%,71%,72%,73%,74%,75%,76%,77%,78%,79%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%或99%的序列同一性,并优选地赋予相对于对照植物增强的产量相关性状。
根据本发明的另一个实施方案,也提供了分离的多肽,其选自:
(i)SEQ ID NO:307所示的氨基酸序列;
(ii)按照递增的优选次序与SEQ ID NO:307所示的氨基酸序列以及表A4中其它氨基酸序列之任一具有至少50%,51%,52%,53%,54%,55%,56%,57%,58%,59%,60%,61%,62%,63%,64%,65%,66%,67%,68%,69%,70%,71%,72%,73%,74%,75%,76%,77%,78%,79%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%或99%的序列同一性的氨基酸序列,其优选地赋予相对于对照植物增强的产量相关性状;
(iii)上文(i)或(ii)所给出的任何氨基酸序列的衍生物。
此外,现已令人惊讶地发现,在植物中调节编码GR-RBP多肽的核酸的表达可以产生相对于对照植物具有增强的产量相关性状的植物。根据第一实施方案,本发明提供了相对于对照植物增强植物的产量相关性状的方法,包括调节编码GR-RBP多肽的核酸在植物中的表达和任选地选择具有增强的产量相关性状的植物。
本发明还提供了迄今未知的GR-RBP编码核酸和GR-RBP多肽。
根据本发明的另一个实施方案,因此提供了分离的核酸分子,其选自:
(i)SEQ ID NO:848,849,851,852,853,854,857,862,873,874,875,876,878,879,893,897,898,900,901,905,928,931,932,933,934,937之任一所示的核酸;
(ii)SEQ ID NO:848,849,851,852,853,854,857,862,873,874,875,876,878,879,893,897,898,900,901,905,928,931,932,933,934,937之任一所示的核酸的互补序列;
(iii)编码GR-RBP多肽的核酸,其中所述多肽按照递增的优选次序与SEQ ID NO:945,946,948,949,950,951,954,959,970,971,972,973,975,976,990,994,995,997,998,1002,1025,1028,1029,1030,1031,1034之任一所示的氨基酸序列具有至少50%,55%,60%,65%,70%,75%,80%,85%,90%,95%,96%,97%,98%,99%或更高的序列同一性,并包含标签序列3(SEQ ID NO:830)和标签序列4(SEQ ID NO:831)。
根据本发明的另一个实施方案,也提供了分离的多肽,其选自:
(i)SEQ ID NO:945,946,948,949,950,951,954,959,970,971,972,973,975,976,990,994,995,997,998,1002,1025,1028,1029,1030,1031,1034之任一所示的氨基酸序列;
(ii)按照递增的优选次序与SEQ ID NO:945,946,948,949,950,951,954,959,970,971,972,973,975,976,990,994,995,997,998,1002,1025,1028,1029,1030,1031,1034之任一所示的氨基酸序列具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的序列同一性、并包含标签序列3(SEQ ID NO:830)和标签序列4(SEQ ID NO:831)的氨基酸序列;
(iii)上文(i)或(ii)所给出的任何氨基酸序列的衍生物。
用于调节(优选地,增加)编码C3H样多肽、或SPT多肽、或IDI2多肽或GR-RBP多肽的核酸的表达的一个优选方法是,向植物中引入和表达编码C3H样多肽、或SPT多肽、或IDI2多肽或GR-RBP多肽的核酸。
关于C3H样多肽,下文中对“用于本发明方法的蛋白质”的任何提及,均旨在指如本文中定义的C3H样多肽。下文中对“用于本发明方法的核酸”的任何提及,均旨在指能够编码这样的C3H样多肽的核酸。待引入植物中(并因此可以用于实施本发明方法)的核酸是编码现将进行描述的此类蛋白质的任何核酸,在下文中也称为“C3H样核酸”或“C3H样基因”。
如本文中定义的“C3H样多肽”是指包含结构域4、以及结构域1,2,3和5中的任一个或多个的任何多肽:
结构域1:C-X2-C-X12-23-C-X2-C-X2-G-F
其中X为任何氨基酸,加下划线的残基是保守的
结构域2:Y-X7-12-L-X3-P-X10-G
其中X为任何氨基酸,加下划线的残基是保守的
结构域3:S-K-X6-P
其中X为任何氨基酸,加下划线的残基是保守的
结构域4:RING-C3H2C3类
结构域5:DUF1117
优选地,结构域1为:CYSCTRFINLSDHTL----------IVCPHCDNGF,或为包含加下划线的保守残基、并按照递增的优选次序与结构域1中没有加下划线的残基具有至少60%,65%,70%,75%,80%,85%,90%,95%或更高的序列同一性的结构域,其中“-”为空位或任何残基。
优选地,结构域2为:YDDGDG-----SGLRPLPPTVSEFLLGSG,或为包含加下划线的保守残基、并按照递增的优选次序与结构域2中没有加下划线的残基具有至少60%,65%,70%,75%,80%,85%,90%,95%或更高的序列同一性的结构域,其中“-”为空位或任何残基。
优选地,结构域3为:SKAAIESMP,或为包含加下划线的保守残基、并按照递增的优选次序与结构域3中没有加下划线的残基具有至少60%,65%,70%,75%,80%,85%,90%,95%或更高的序列同一性的结构域。
优选地,结构域4为:
CAVCKEEFELHAEARELPCKHLYHSDCILPWLTVRNSCPVCR,或为包含加下划线的保守残基、并按照递增的优选次序与结构域4中没有加下划线的残基具有至少60%,65%,70%,75%,80%,85%,90%,95%或更高的序列同一性的结构域。
优选地,结构域5为:GLTIWRLPGGGFAVGRFSGGRSA-GESHFPVVYTEMDGGLN,或为按照递增的优选次序与结构域5具有至少60%,65%,70%,75%,80%,85%,90%,95%或更高的序列同一性的结构域,其中“-”为空位或任何残基。
典型地,C3H样多肽的同源物按照递增的优选次序与SEQ ID NO:2所示的氨基酸具有至少25%,26%,27%,28%,29%,30%,31%,32%,33%,34%,35%,36%,37%,38%,39%,40%,41%,42%,43%,44%,45%,46%,47%,48%,49%,50%,51%,52%,53%,54%,55%,56%,57%,58%,59%,60%,61%,62%,63%,64%,65%,66%,67%,68%,69%,70%,71%,72%,73%,74%,75%,76%,77%,78%,79%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%或99%的全序列同一性,并包含结构域4以及结构域1,2,3和5的任何一个或多个。可以使用全局比对算法,例如程序GAP(GCGWisconsin Package,Accelrys)中的Needleman Wunsch算法,优选利用缺省参数和优选利用成熟蛋白质的序列(即,不考虑分泌信号或转运肽),确定全序列同一性。与全序列同一性相比,当只考虑保守结构域或基序时,序列同一性通常更高。
优选地,所述多肽序列,当用于构建系统发生树,例如图2中描述的系统发生树时,与包含SEQ ID NO:2所示的氨基酸序列的C3H样多肽的组而非任何其他组聚类。
关于SPT样多肽,下文中对“用于本发明方法的蛋白质”的任何提及,均旨在指如本文中定义的SPT样多肽。下文中对“用于本发明方法的核酸”的任何提及,均旨在指能够编码这样的SPT样多肽的核酸。待引入植物中(并因此可以用于实施本发明方法)的核酸是编码现将进行描述的此类蛋白质的任何核酸,在下文中也称为“SPT样核酸”或“SPT样基因”。
如本文中定义的“SPT样多肽”是指包含以下每一个基序的任何多肽,优选从N-末端到C-末端:
基序I:包含EEISTFLHQLLH的两亲螺旋,或按照递增的优选次序与基序I具有至少60%,65%,70%,75%,80%,85%,90%,95%或更高的序列同一性的基序。
基序II:包含DLGDFSCDSEK的酸性结构域,或按照递增的优选次序与基序II具有至少60%,65%,70%,75%,80%,85%,90%,95%或更高的序列同一性的基序。
基序III:包含AAEVHNLSEKRRRSRINEKMKALQNLIPNSNKTDKASMLDEAIEYLKQL的bHLH结构域,或按照递增的优选次序与基序III具有至少60%,65%,70%,75%,80%,85%,90%,95%或更高的序列同一性的基序。
SPT样多肽优选还包含一个或多个富含丝氨酸的区域。富丝氨酸区域旨在表示,按照递增的优选次序,在任何给定的连续氨基酸的区段中至少30%,40%,50%,60%,70%,80%,90%或更多的丝氨酸残基。
优选地,该一个或多个富丝氨酸区域位于如图4的比对中所示的位置。
优选地,bHLH结构域还包含一个或多个核定位信号(NLS),优选位于图4的比对中所示的位置。
SPT样多肽优选还包含与最靠近C-末端区域的bHLH结构域相邻的β链,该β链优选包含QLQVQMLTM。
可选地或此外,SPT样多肽按照递增的优选次序与SEQ ID NO:97所示的氨基酸具有至少25%,26%,27%,28%,29%,30%,31%,32%,33%,34%,35%,36%,37%,38%,39%,40%,41%,42%,43%,44%,45%,46%,47%,48%,49%,50%,51%,52%,53%,54%,55%,56%,57%,58%,59%,60%,61%,62%,63%,64%,65%,66%,67%,68%,69%,70%,71%,72%,73%,74%,75%,76%,77%,78%,79%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%或99%的全序列同一性并且包含如上所定义的基序I至III的每一个。可以使用全局比对算法,例如程序GAP(GCG Wisconsin Package,Accelrys)中的Needleman Wunsch算法,优选利用缺省参数和优选利用成熟蛋白质的序列(即,不考虑分泌信号或转运肽),确定全序列同一性。与全序列同一性相比,当只考虑保守结构域或基序时,序列同一性通常更高。
优选地,所述多肽序列,当用于构建系统发生树,例如图5中描述的系统发生树时,与包含SEQ ID NO:97所示的氨基酸序列的SPT样多肽的组(以箭头指示)而非任何其他组聚类。
关于IDI2多肽,下文中对“用于本发明方法的蛋白质”的任何提及,均旨在指如本文中定义的IDI2多肽。下文中对“用于本发明方法的核酸”的任何提及,均旨在指能够编码这样的IDI2多肽的核酸。待引入植物中(并因此可以用于实施本发明方法)的核酸是编码现将进行描述的此类蛋白质的任何核酸,在下文中也称为“IDI2核酸”或“IDI2基因”。
如本文中定义的“IDI2多肽”是指真核生物翻译起始因子EIF-2B的任何α亚基,该α亚基包含IF-2B结构域(Pfam登录号PF01008)。优选地,IDI2多肽也包含以下基序的一个或多个:
基序1(SEQ ID NO:141):SL[QR]LLDQRKLPLET[IV]Y[LI][DE][IV][KR]D[SA]ADGWNAIR[DE]MVVRGAPAIAI
基序2(SEQ ID NO:142):HCNTGSLATAGYGTALGVIR[AS]LHS[EG]GVL[EL][RKS]A[YF][CA]TETRPFNQ
基序3(SEQ ID NO:143):EAAE[TI]ML[VE]DDVA[DS]NKAIGS[HY]G
基序4(SEQ ID NO:144):[SA]LRLLDQRKLPLE[MT][DV]YIDVK[DS]SADGWNAIRDMVVRGAPAIAI
基序5(SEQ ID NO:145):CNTGSLATAG[YV]GTALGV[IL]RAL[HR][SE][GT]GVLE[KS]A[FA][CA]TETRP[FYL]NQG
基序6(SEQ ID NO:146):M[KA][SQ]GQV[QD]AV[IV]VGADR[IV]AANGDTANKIGTY
更优选地,IDI2多肽包含至少2个、最优选3个上述基序。
可选地,IDI2蛋白的同源物按照递增的优选次序与SEQ ID NO:140所示的氨基酸具有至少25%,26%,27%,28%,29%,30%,31%,32%,33%,34%,35%,36%,37%,38%,39%,40%,41%,42%,43%,44%,45%,46%,47%,48%,49%,50%,51%,52%,53%,54%,55%,56%,57%,58%,59%,60%,61%,62%,63%,64%,65%,66%,67%,68%,69%,70%,71%,72%,73%,74%,75%,76%,77%,78%,79%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%或99%的全序列同一性,条件是同源蛋白质包含上文所列的保守基序。可以使用全局比对算法,例如程序GAP(GCG Wisconsin Package,Accelrys)中的Needleman Wunsch算法,优选利用缺省参数确定全序列同一性。与全序列同一性相比,当只考虑保守结构域或基序时,序列同一性通常更高。优选地,IDI2多肽中的基序,按照递增的优选次序,与SEQID NO:141至SEQ ID NO:146(基序1至6)所示的基序具有至少70%,71%,72%,73%,74%,75%,76%,77%,78%,79%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%或99%的序列同一性。
优选,所述多肽序列,当用于构建系统发生树,例如图9中描述的系统发生树时,与A或B组而非与任何其他组聚类,更优选地与包含SEQ ID NO:140所示的氨基酸序列的IDI2多肽的A组聚类。
关于eIF4F样蛋白质复合物亚基,eIF4F样蛋白质复合物的活性优选可以通过调节eIF4F样蛋白质复合物的一个或多个亚基(即eIF4G和/或eIF4A和/或eIF4E)的表达,和/或通过调节eIF4F样蛋白质复合物的水平来进行调节。一个用于调节eIF4F样蛋白质复合物的活性的优选方法是在植物中导入和表达编码eIF4F样蛋白质复合物亚基(例如eIF4E、eIF4G和/或eIF4A和/或其同种型中的一个或多个)的核酸。
如本文中定义的“eIF4F样蛋白质复合物”是指包含eIF4E,eIF4G和/或eIF4A亚基、和/或其同种型的任何蛋白质复合物。在植物中,eIF4F主要由eIFiso4G,eIFiso4E和eIF4A亚基组成。
eIF4F样蛋白质复合物的这些组成亚基的功能包括:识别mRNA 5′帽子结构(eIF4E)、向5′区域递送RNA解旋酶(eIF4A)、在mRNA和核糖体间架桥(eIF4G)、以及通过与poly(A)结合蛋白的相互作用使mRNA环化(eIF4G)。
1.IF4isoG的定义:
eIF4isoG属于eIF4F样蛋白质复合物,它是eIF4E,eIF4A,eIF4B和polyA结合蛋白的停靠元件(docking element)。它是eIF4G的同种型,其序列具有约750-800个氨基酸。如本文中定义的“eIF4isoG多肽”是指包含以下3个基序的任何多肽:
基序7:KAV[LF]EPTFCPMYA[QL]LCSDLNEKLP[PS]FPS[ED]EPGGKE ITFKRVLLN[NI]CQE AF、或按照递增的优选次序与基序7具有至少50%,51%,52%,53%,54%,55%,56%,57%,58%,59%,60%,61%,62%,63%,64%,65%,66%,67%,68%,69%,70%,71%,72%,73%,74%,75%,76%,77%,78%,79%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%或99%或更高的序列同一性的基序。
基序8:CP[AE]EENVEAIC[QH]FFNTIGKQLDE[SN]PKSRRIND[MVT]YF[SIN][RQ]LKEL[TS][TS]NPQLAPR、或按照递增的优选次序与基序8具有至少50%,51%,52%,53%,54%,55%,56%,57%,58%,59%,60%,61%,62%,63%,64%,65%,66%,67%,68%,69%,70%,71%,72%,73%,74%,75%,76%,77%,78%,79%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%或99%或更高的序列同一性的基序。
基序9:T[AG]P[DE]QE[ML]ERRDKERLVKLRTLGNIRLIGELLKQKMVPEKIVHHIVQELLG、或按照递增的优选次序与基序9具有至少50%,51%,52%,53%,54%,55%,56%,57%,58%,59%,60%,61%,62%,63%,64%,65%,66%,67%,68%,69%,70%,71%,72%,73%,74%,75%,76%,77%,78%,79%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%或99%或更高的序列同一性的基序。
优选地,本发明的eIF4isoG多肽包含以下保守结构域:MA3(Pfam登录号:PF02847)和MIF4G(PFam登录号:PF02854)。
2.IF4G的定义:
eIF4G属于eIF4F样蛋白质复合物,它也是eIF4E,eIF4A,eIF4B和polyA结合蛋白的停靠元件,因此就其在翻译中的作用,它具有与eIF4isoG在功能上等同的结合。其序列具有约1570-1900个氨基酸。如本文中定义的“eIF4G多肽”是指包含以下3个基序的任何多肽:
基序10:TPQNF[ED][KR]LFEQVKAVNIDN[AV]VTL[TN]GVISQIF[DE]KALMEPTFCEMYANFC FH、或按照递增的优选次序与基序10具有至少50%,51%,52%,53%,54%,55%,56%,57%,58%,59%,60%,61%,62%,63%,64%,65%,66%,67%,68%,69%,70%,71%,72%,73%,74%,75%,76%,77%,78%,79%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%或99%或更高的序列同一性的基序。
基序11:IGELYKK[RK]MLTERIMHECIKKLLGQYQ[DN]PDEE[DN][IV]E[AS]LCKLMSTIGEMI DH、或按照递增的优选次序与基序11具有至少50%,51%,52%,53%,54%,55%,56%,57%,58%,59%,60%,61%,62%,63%,64%,65%,66%,67%,68%,69%,70%,71%,72%,73%,74%,75%,76%,77%,78%,79%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%或99%或更高的序列同一性的基序。
基序12:LSNN[MQ][KN]LSSRVRFMLKD[ASV]IDLRKNKWQQRRKVEGPKKIEEVHRDAAQE RQ、或按照递增的优选次序与基序12具有至少50%,51%,52%,53%,54%,55%,56%,57%,58%,59%,60%,61%,62%,63%,64%,65%,66%,67%,68%,69%,70%,71%,72%,73%,74%,75%,76%,77%,78%,79%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%或99%或更高的序列同一性的基序。
优选地,本发明的eIF4G多肽包含以下保守结构域:MA3(Pfam登录号:PF02847)和MIF4G(PFam登录号:PF02854)。
3.eIF4A多肽的定义:
eIF4A多肽也是eIF4F样蛋白质复合物的亚基,它是结合到eIF4G/isoG并在mRNA的m7Gppp帽子处招募eIF4B的多肽。其序列长约369-414个氨基酸。如本文中定义的“eIF4A多肽”是指包含以下3个基序的任何多肽:
基序13:RDELTLEGIKQF[YF]V[NA]V[ED][KR]EEWK[LF][DE]TLCDLY[ED]TL[AT]ITQ[SA]VIF、或按照递增的优选次序与基序13具有至少50%,51%,52%,53%,54%,55%,56%,57%,58%,59%,60%,61%,62%,63%,64%,65%,66%,67%,68%,69%,70%,71%,72%,73%,74%,75%,76%,77%,78%,79%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%或99%或更高的序列同一性的基序。
基序14:SLVINYDLP[TN][QN][PR]E[NL]Y[LI]HRIGRSGRFGRKGVAINF、或按照递增的优选次序与基序14具有至少50%,51%,52%,53%,54%,55%,56%,57%,58%,59%,60%,61%,62%,63%,64%,65%,66%,67%,68%,69%,70%,71%,72%,73%,74%,75%,76%,77%,78%,79%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%或99%或更高的序列同一性的基序。
基序15:MG[LI][QK]E[ND]LLRGIYAYGFEKPSAIQQR[GA][IV]VP[FI][CI]KG[LR]DVI[QA]QAQ SGTGKT[AS][TM][FI]、或按照递增的优选次序与基序15具有至少50%,51%,52%,53%,54%,55%,56%,57%,58%,59%,60%,61%,62%,63%,64%,65%,66%,67%,68%,69%,70%,71%,72%,73%,74%,75%,76%,77%,78%,79%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%或99%或更高的序列同一性的基序。
优选地,本发明的eIF4A多肽包含以下保守结构域:DEAD(Pfam登录号:PF00270)和解旋酶_C(Helicase_C)(PFam登录号:PF00271)。
4.eIF4E多肽的定义:
eIF4E多肽也是eIF4F样蛋白质复合物的亚基,它是在翻译起始过程中结合到eIF4G/isoG和mRNA的m7Gppp帽子的多肽。其序列具有约195-286个氨基酸长。如本文中定义的“eIF4E多肽”是指包含以下3个基序的任何多肽:
基序16:YTFSTVE[ED]FW[SG]LYNNIH[HR]PSKLAVGADF[HY]CFK[NH]KIEPKWEDP[VI]CA NGGKW/或按照递增的优选次序与基序16具有至少50%,51%,52%,53%,54%,55%,56%,57%,58%,59%,60%,61%,62%,63%,64%,65%,66%,67%,68%,69%,70%,71%,72%,73%,74%,75%,76%,77%,78%,79%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%或99%或更高的序列同一性的基序。
基序17:T[SC]WLYTLLA[ML]IGEQFD[HY]GD[ED]ICGAVV[NS]VR、或按照递增的优选次序与基序17具有至少50%,51%,52%,53%,54%,55%,56%,57%,58%,59%,60%,61%,62%,63%,64%,65%,66%,67%,68%,69%,70%,71%,72%,73%,74%,75%,76%,77%,78%,79%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%或99%或更高的序列同一性的基序。
基序18:E[KR]I[AS][LI]WTKNA[AS]NE[AST]AQ[VL]SIGKQWKEFLDYN[DE][TS]IGFIFH[ED]DA、或按照递增的优选次序与基序18具有至少50%,51%,52%,53%,54%,55%,56%,57%,58%,59%,60%,61%,62%,63%,64%,65%,66%,67%,68%,69%,70%,71%,72%,73%,74%,75%,76%,77%,78%,79%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%或99%或更高的序列同一性的基序。
优选地,本发明的eIF4E多肽包含以下保守结构域:IF4E(Pfam登录号:PF01652)。
5.eIF4isoE多肽的定义:
eIF4isoE多肽是eIF4E的同种型,是eIF4F样蛋白质复合物的亚基。它具有与eIF4E一样的结合活性,长约189-217个氨基酸。如本文中定义的“eIF4isoE多肽”是指包含以下3个基序的任何多肽:
基序19:WCLYDQ[IV]F[KR]PSKLP[GA]NADFHLFKAG[VI]EPKWEDPECANGGKW、或按照递增的优选次序与基序19具有至少50%,51%,52%,53%,54%,55%,56%,57%,58%,59%,60%,61%,62%,63%,64%,65%,66%,67%,68%,69%,70%,71%,72%,73%,74%,75%,76%,77%,78%,79%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%或99%或更高的序列同一性的基序。
基序20:L[ED]TMWLETLMALIGEQFD[ED][AS][DE][ED]ICGVVASVR或按照递增的优选次序与基序20具有至少50%,51%,52%,53%,54%,55%,56%,57%,58%,59%,60%,61%,62%,63%,64%,65%,66%,67%,68%,69%,70%,71%,72%,73%,74%,75%,76%,77%,78%,79%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%或99%或更高的序列同一性的基序。
基序21:QDKL[SA]LWT[KR][TN]A[AS]NEA[AV]QM[SG]IG[RK]KWKE[IV]ID、或按照递增的优选次序与基序21具有至少50%,51%,52%,53%,54%,55%,56%,57%,58%,59%,60%,61%,62%,63%,64%,65%,66%,67%,68%,69%,70%,71%,72%,73%,74%,75%,76%,77%,78%,79%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%或99%或更高的序列同一性的基序。
优选地,本发明的eIF4isoE多肽包含以下保守结构域:IF4E(Pfam登录号:PF01652)。
在本发明的一个优选实施方案中,eIF4G或其同种型的表达被增强,最优选地eIF4isoG被过量表达。
在本发明的另一个优选实施方案中,eIF4A的表达被增强。
在本发明的最优选实施方案中,eIF4isoG和/或eIF4A被过量表达而eIF4isoE的表达被降低,优选地使eIF4isoG和eIF4A过量表达。
可选地,eIF4F样蛋白质复合物亚基多肽的同源物按照递增的优选次序与SEQ ID NO:241,SEQ ID NO:301和/或SEQ ID NO.561所示的氨基酸具有至少25%,26%,27%,28%,29%,30%,31%,32%,33%,34%,35%,36%,37%,38%,39%,40%,41%,42%,43%,44%,45%,46%,47%,48%,49%,50%,51%,52%,53%,54%,55%,56%,57%,58%,59%,60%,61%,62%,63%,64%,65%,66%,67%,68%,69%,70%,71%,72%,73%,74%,75%,76%,77%,78%,79%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%或99%的全序列同一性,条件是同源蛋白质包含上文所列的保守基序。可以使用全局比对算法,例如程序GAP(GCG Wisconsin Package,Accelrys)中的Needleman Wunsch算法,优选利用缺省参数和优选利用成熟蛋白质的序列(即,不考虑分泌信号或转运肽),确定全序列同一性。与全序列同一性相比,当只考虑保守结构域或基序时,序列同一性通常更高。对于局部比对,Smith-Waterman算法是特别有用的(Smith TF,Waterman MS(1981)J.Mol.Biol 147(1);195-7)。
优选地,eIF4F亚基的多肽序列,当将其用于构建系统发生树例如图12,13和14中描述的系统发生树时,其与包含SEQ ID NO:241,SEQID NO:301和/或SEQ ID NO:561所示的氨基酸序列的eIF4F样蛋白质复合物亚基(例如eIF4isoG,eIF4A和eIF4isoE)的组聚类。
最优选地,本发明的多肽序列与SEQ ID NO:241编码的eIF4F样蛋白质复合物亚基eIF4isoG的组而非与任何其他组聚类。
关于GR-RBP多肽,下文中对“用于本发明方法的蛋白质”的任何提及,均旨在指如本文中定义的GR-RBP多肽。下文中对“用于本发明方法的核酸”的任何提及,均旨在指能够编码这样的GR-RBP多肽的核酸。待引入植物中(并因此可以用于实施本发明方法)的核酸是编码现将进行描述的此类蛋白质的任何核酸,在下文中也称为“GR-RBP核酸”或“GR-RBP基因”。
如本文中定义的“GR-RBP多肽”是指包含RNA识别基序1(Pfam登录号PF00076,RRM_1)的任何RNA结合多肽。优选地GR-RBP多肽还包含一个或多个以下标签序列:
标签序列1(SEQ ID NO:828):GGYGG
标签序列2(SEQ ID NO:829):GGYG
标签序列3(SEQ ID NO:830):[CLIV][FY][IV]GG[LIMV]
标签序列4(SEQ ID NO:831):RGF[GA]F[IV][SDHTN][FY]
优选地,GR-RBP多肽包含HMMPanther PTHR10432:SF31RRM_Gly_rich结构域。可选择地,GR-RBP多肽还在蛋白质的C-端半部分中包含富甘氨酸结构域。本发明所使用的术语“富甘氨酸结构域”是指在GR-RBP多肽的序列中包含至少30%的甘氨酸残基的至少10个、优选至少11个、优选至少12个、更优选至少13个、最优选至少15个氨基酸的区段。
再优选地,GR-RBP多肽包含一个或多个以下基序:
基序22(SEQ ID NO:832):S[ST]KLF[VI]GGL[SA][WY]GTDD[QH]SL[RK][ED]AF[SA]S[FY]G[ED]V[VT][ED]A[RK][VI]I[TV]DR[ED][TS]GRSRGFGFV[TNS][FY]
基序23(SEQ ID NO:833):S[ST]KLF[VI]GGL[SA][WY]GTDD[QH]SL[RK][ED]AF[AS][SK][FY]G[ED]V[VTI][ED]A[RK][VI]I[TV]DR[ED]TGRSRGFGFV[TNS][FY]
基序24(SEQ ID NO:834):[ML]DG[KQ][ED]L[DN]GRN[IV]RV[NS]YAN[ED]RP[SR]
基序25(SEQ ID NO:835):[SE]E[EDA]A[KS][AS]AISAMDG[KQ][ED]LNGRN[IV]RV[NS]YA[NT][ED]R
基序26(SEQ ID NO:836):MA[FA]LNKLG[SG][LA]LRQSA
基序27(SEQ ID NO:837):MA[FA][LCF]NKLG[SGN]LLRQSASS[SN]SAS
更优选地,GR-RBP多肽按照递增的优选次序包含至少2个、或至少3个上述基序。
可选地,GR-RBP蛋白的同源物按照递增的优选次序与SEQ ID NO:827所示的氨基酸具有至少25%,26%,27%,28%,29%,30%,31%,32%,33%,34%,35%,36%,37%,38%,39%,40%,41%,42%,43%,44%,45%,46%,47%,48%,49%,50%,51%,52%,53%,54%,55%,56%,57%,58%,59%,60%,61%,62%,63%,64%,65%,66%,67%,68%,69%,70%,71%,72%,73%,74%,75%,76%,77%,78%,79%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%,或99%的全序列同一性,条件是同源蛋白质包含上文所列的1个、2个或3个保守基序。可以使用全局比对算法,例如程序GAP(GCGWisconsin Package,Accelrys)中的Needleman Wunsch算法,优选利用缺省参数,确定全序列同一性。与全序列同一性相比,当只考虑保守结构域或基序时,序列同一性通常更高。优选地,GR-RBP多肽中的基序,按照递增的优选次序,具有与SEQ ID NO:832至SEQ ID NO:837(基序22至27)所示的基序至少70%,71%,72%,73%,74%,75%,76%,77%,78%,79%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%或99%的序列同一性。
优选地,所述多肽序列,当用于构建系统发生树,例如图18中描述的系统发生树时,与A或B组而非与任何其他组聚类,更优选地与包含SEQ ID NO:827所示的氨基酸序列的A组GR-RBP多肽聚类。
术语“结构域”、“标签序列”和“基序”在本文“定义”部分定义。存在用于鉴定结构域的专家数据库,例如SMART(Schultz等(1998)Proc.Natl.Acad.Sci.USA 95,5857-5864;Letunic等(2002)Nucleic Acids Res 30,242-244)、InterPro(Mulder等,(2003)Nucl.Acids.Res.31,315-318)、Prosite(Bucher和Bairoch(1994),A generalized profile syntax forbiomolecular sequences motifs and its function in automatic sequenceinterpretation.(In)ISMB-94;第二届分子生物学智能系统国际会议记录(Proceedings 2nd International Conference on Intelligent Systems forMolecular Biology)Altman R.,Brutlag D.,Karp P.,Lathrop R.,Searls D.编辑,53-61页,AAAIPress,Menlo Park;Hulo等,Nucl.Acids.Res.32:D134-D137,(2004))或者Pfam(Bateman等,Nucleic Acids Research 30(1):276-280(2002))。进行蛋白质序列芯片(in silico)分析的一组工具可以从ExPASy蛋白质组学服务器获得(瑞士生物信息学研究所(Swiss Institute ofBioinformatics)(Gasteiger等ExPASy:the proteomics server for in-depthprotein knowledge and analysis.Nucleic Acids Res 31:3784-3788(2003))。结构域或基序也可以利用常规技术例如通过序列比对来鉴定。
为比较而进行序列比对的方法是本领域公知的,此类方法包括GAP、BESTFIT、BLAST、FASTA和TFASTA。GAP使用Needleman和Wunsch的算法((1970)J.Mol.Biol.48:443-453)来寻找两序列之间匹配数最大化且空位数最小化的全局(即跨越完整序列)的比对。BLAST算法(Altschul等(1990)J Mol Biol 215:403-10)计算序列同一性百分比,并对两序列之间的相似性进行统计学分析。执行BLAST分析的软件可通过美国国家生物技术信息中心(NCBI)公开地获得。同源物可以例如,使用ClustalW多重序列比对算法(1.83版),采用默认的成对比对参数以及百分比的记分方法而容易地鉴定。利用可获自MatGAT软件包(Campanella等,(2003)BMC Bioinformatics,10:29.2003 Jul 10;4:29.MatGAT:anapplication that generates similarity/identity matrices using protein orDNA sequences)的方法之一,也可以确定全局相似性和同一性百分比。可以进行微小的人工编辑以优化保守基序之间的比对,这对于所属领域的技术人员而言将是显而易见的。此外,除了利用全长序列进行同源物鉴定以外,还可以利用特定的结构域。可以利用上述程序采用默认参数针对完整核酸或氨基酸序列或者选择的结构域或保守基序来确定序列同一性值。对于局部比对,Smith-Waterman算法是特别有用的(Smith TF,WatermanMS(1981)J.Mol.Biol 147(1);195-7)。
此外,C3H样多肽,当如实施例部分所述根据本发明的方法在稻中表达时,产生相对于对照植物具有增强的产量相关性状,特别是增加的地上面积,和增加的种子产量的植物。
此外,C3H样多肽可显示优选的亚细胞定位,通常在细胞核、细胞质、叶绿体或线粒体之一个或多个中。预测蛋白质亚细胞定位的任务非常重要并进行了充分研究。用于蛋白质定位的实验方法范围广泛,从免疫定位到利用绿色荧光蛋白(GFP)或β-葡糖醛酸糖苷酶(GUS)标记蛋白质。与计算方法相比,此类方法虽然劳动量大但精确。最近在根据序列数据计算预测蛋白质定位方面取得了很大进步。从瑞士生物信息学研究所托管的ExPASy蛋白质组学工具可获得本领域技术人员公知的算法,例如PSort、TargetP、ChloroP、LocTree、Predotar、LipoP、MITOPROT、PATS、PTS1、SignalP、TMHMM和其他。
此外,SPT样多肽(至少以其天然形式)典型地具有DNA结合活性。用于确定DNA结合活性的工具和技术在本领域公知。
此外,SPT样多肽,当如实施例部分中所述的按照本发明方法在稻中表达时,产生相对于对照植物具有增强的产量相关性状,特别是增加的千粒重(TKW)的植物。
由于在SPT样多肽中存在核定位信号(见图4的比对),SPT样多肽典型地位于细胞核中。用于蛋白质定位的实验方法范围广泛,从免疫定位到利用绿色荧光蛋白(GFP)或β-葡糖醛酸糖苷酶(GUS)标记蛋白质。与计算方法相比,此类方法虽然劳动量大但精确。最近在根据序列数据计算预测蛋白质定位方面取得了很大进步。从瑞士生物信息学研究所托管的ExPASy蛋白质组学工具可获得本领域技术人员公知的算法,例如PSort、TargetP、ChloroP、LocTree、Predotar、LipoP、MITOPROT、PATS、PTS1、SignalP、TMHMM和其他。
此外,IDI2多肽(作为eIF2B的α亚基)(至少以其天然形式)可以介导eIF2的磷酸化。用于确定eIF2Bα亚基的活性的工具和技术在本领域公知,见例如Fabian等(J.Biol.Chem.272,12359-12369,1997和Prot.Expr.Purif.13,16-22,1998)。在实施例6中提供了更详细的说明。
此外,IDI2多肽,当如实施例7和8中所述的按照本发明方法在稻中表达时,产生当在养分限制的条件下生长时具有增强的产量相关性状的植物,特别是增加的种子总重量、增加的饱满种子数和/或增加的收获指数。
此外,eIF4F样蛋白质复合物亚基(至少以其天然形式)典型地具有翻译活性。用于确定该活性的工具和技术在本领域公知。
此外,eIF4F样蛋白质复合物亚基,当如实施例8和9中所述的按照本发明方法在稻中表达时,产生具有增强的产量相关性状(特别是,每株植物的最高高度、每圆锥花序的花朵(小花)数和每平方米的植物数(收获指数))的植物。
此外,eIF4F样蛋白质复合物亚基可显示优选的亚细胞定位,通常在细胞核、细胞质、叶绿体或线粒体之一个或多个中。预测蛋白质亚细胞定位的任务非常重要并进行了充分研究。知晓蛋白质的定位有助于阐释其功能。用于蛋白质定位的实验方法范围广泛,从免疫定位到利用绿色荧光蛋白(GFP)或β-葡糖醛酸糖苷酶(GUS)标记蛋白质。与计算方法相比,此类方法虽然劳动量大但精确。最近在根据序列数据计算预测蛋白质定位方面取得了很大进步。从瑞士生物信息学研究所托管的ExPASy蛋白质组学工具可获得本领域技术人员公知的算法,例如PSort、TargetP、ChloroP、LocTree、Predotar、LipoP、MITOPROT、PATS、PTS1、SignalP、TMHMM和其他。
此外,GR-RBP多肽(至少以其天然形式)典型地具有RNA结合活性。用于确定RNA结合活性的工具和技术在本领域公知,见例如Kwak等(2005)或Hirose等(Nucl.Ac.Res.21,3981-3987,1993)。在实施例6中提供了更详细的说明。
此外,GR-RBP多肽,当如实施例7和8中所述根据本发明的方法在稻中表达时,产生当在干旱胁迫条件下生长时具有增强的产量相关性状,特别是增加的饱满率的植物。
关于C3H样多肽,本发明以编码SEQ ID NO:2的多肽序列的SEQID NO:1所示核酸序列转化植物来进行举例说明。然而,本发明的实施并不局限于这些序列;本发明的方法可以有利地利用本文所定义的任何C3H样编码核酸或C3H样多肽来实施。
编码C3H样多肽的核酸的实例在本文实施例部分表A1中给出。这样的核酸可用于实施本发明的方法。实施例部分表A1所给出的氨基酸序列为SEQ ID NO:2所示的C3H样多肽的直向同源物和旁系同源物的示例序列,其中术语“直向同源物”和“旁系同源物”如本文所定义。其他的直向同源物和旁系同源物可以通过进行所谓的交互BLAST搜索,容易地找到。通常,这包括一次BLAST,即以查询序列(例如,利用实施例部分表A1中所列的任何序列)针对任何序列数据库如可公共获得的NCBI数据库进行BLAST。当从核苷酸序列开始时,通常使用BLASTN或TBLASTX(利用标准默认值),而当从蛋白质序列开始时,则使用BLASTP或TBLASTN(利用标准默认值)。BLAST结果可以任选地过滤。接着使用过滤的结果或者未过滤的结果中的全长序列针对查询序列来源生物的序列进行反向BLAST(二次BLAST)(在查询序列为SEQ ID NO:1或SEQ IDNO:2的情况下,二次BLAST因此将会针对苜蓿(Medicago)序列进行)。然后比较一次和二次BLAST的结果。如果一次BLAST中分值靠前的命中事件来自查询序列源自的相同物种,而理想地反向BLAST导致查询序列在最高命中事件中,则鉴定到了旁系同源物;如果一次BLAST中分值靠前的命中事件不是来自查询序列源自的相同物种,且优选地反向BLAST导致查询序列处于最高命中事件之列,则找到了直向同源物。
关于SPT样多肽,本发明以编码SEQ ID NO:97的多肽序列的SEQ ID NO:96所示核酸序列转化植物来进行举例说明。然而,本发明的实施并不局限于这些序列;本发明的方法可以有利地利用本文所定义的任何SPT样编码核酸或SPT样多肽来实施。
编码SPT样多肽的核酸的实例在本文实施例部分表A2中给出。这样的核酸可用于实施本发明的方法。实施例部分表A2所给出的氨基酸序列为SEQ ID NO:97所示的SPT样多肽的直向同源物和旁系同源物的示例序列,其中术语“直向同源物”和“旁系同源物”如本文所定义。其他的直向同源物和旁系同源物可以通过进行所谓的交互BLAST搜索,容易地找到。通常,这包括一次BLAST,即以查询序列(例如,利用实施例部分表A2中所列的任何序列)针对任何序列数据库如可公共获得的NCBI数据库进行BLAST。当从核苷酸序列开始时,通常使用BLASTN或TBLASTX(利用标准默认值),而当从蛋白质序列开始时,则使用BLASTP或TBLASTN(利用标准默认值)。BLAST结果可以任选地过滤。接着使用过滤的结果或者未过滤的结果中的全长序列针对查询序列来源生物的序列进行反向BLAST(二次BLAST)(在查询序列为SEQ ID NO:96或SEQID NO:97的情况下,二次BLAST因此将会针对杨树(poplar)序列进行)。然后比较一次和二次BLAST的结果。如果一次BLAST中分值靠前的命中事件来自查询序列源自的相同物种,而理想地反向BLAST导致查询序列在最高命中事件中,则鉴定到了旁系同源物;如果一次BLAST中分值靠前的命中事件不是来自查询序列源自的相同物种,且优选地反向BLAST导致查询序列处于最高命中事件之列,则找到了直向同源物。
关于IDI2多肽,本发明以编码SEQ ID NO:140的多肽序列的SEQID NO:139所示核酸序列转化植物来进行举例说明。然而,本发明的实施并不局限于这些序列;本发明的方法可以有利地利用本文所定义的任何IDI2编码核酸或IDI2多肽来实施。
编码IDI2多肽的核酸的实例在本文实施例部分表A3中给出。这样的核酸可用于实施本发明的方法。实施例部分表A3所给出的氨基酸序列为SEQ ID NO:140所示IDI2多肽的直向同源物和旁系同源物的示例序列,其中术语“直向同源物”和“旁系同源物”如本文所定义。其他的直向同源物和旁系同源物可以通过进行所谓的交互BLAST搜索,容易地找到。通常,这包括一次BLAST,即以查询序列(例如,利用实施例部分表A3中所列的任何序列)针对任何序列数据库如可公共获得的NCBI数据库进行BLAST。当从核苷酸序列开始时,通常使用BLASTN或TBLASTX(利用标准默认值),而当从蛋白质序列开始时,则使用BLASTP或TBLASTN(利用标准默认值)。BLAST结果可以任选地过滤。接着使用过滤的结果或者未过滤的结果中的全长序列针对查询序列来源生物的序列进行反向BLAST(二次BLAST)(在查询序列为SEQ ID NO:139或SEQID NO:140的情况下,二次BLAST因此将会针对甘蔗(Saccharumofficinarum)序列进行)。然后比较一次和二次BLAST的结果。如果一次BLAST中分值靠前的命中事件来自查询序列源自的相同物种,而理想地反向BLAST导致查询序列在最高命中事件中,则鉴定到了旁系同源物;如果一次BLAST中分值靠前的命中事件不是来自查询序列源自的相同物种,且优选地反向BLAST导致查询序列处于最高命中事件之列,则找到了直向同源物。
关于eIF4F样蛋白质复合物亚基,本发明以至少具有以下序列的核酸转化植物来进行举例说明:编码SEQ ID NO:241的多肽序列的SEQID NO:240、编码SEQ ID NO 301的多肽序列的SEQ ID NO 300、以及编码SEQ ID NO:561的多肽序列的SEQ ID NO:560。然而,本发明的实施并不局限于这些序列;本发明的方法可以有利地利用本文所定义的至少一种eIF4F样蛋白质复合物亚基编码核酸或至少一种eIF4F样蛋白质复合物亚基来实施。
编码eIF4F样蛋白质复合物亚基的核酸的实例在本文实施例部分表A4中给出。在本发明范围,“表A4”包括表A4a、A4b和A4c。这样的核酸可用于实施本发明的方法。实施例部分表A4所给出的氨基酸序列为SEQ ID NO:241,SEQ ID NO 301和SEQ ID NO:561所示eIF4F样蛋白质复合物亚基的直向同源物和旁系同源物的示例序列,其中术语“直向同源物”和“旁系同源物”如本文所定义。其他的直向同源物和旁系同源物可以通过进行所谓的交互BLAST搜索,容易地找到。通常,这包括一次BLAST,即以查询序列(例如,利用实施例部分表A4中所列的任何序列)针对任何序列数据库如可公共获得的NCBI数据库进行BLAST。当从核苷酸序列开始时,通常使用BLASTN或TBLASTX(利用标准默认值),而当从蛋白质序列开始时,则使用BLASTP或TBLASTN(利用标准默认值)。BLAST结果可以任选地过滤。接着使用过滤的结果或者未过滤的结果中的全长序列针对查询序列来源生物的序列进行反向BLAST(二次BLAST)(在查询序列为SEQ ID NO:240或SEQ ID NO:241的情况下,二次BLAST因此将会针对稻序列进行)。然后比较一次和二次BLAST的结果。如果一次BLAST中分值靠前的命中事件来自查询序列源自的相同物种,而理想地反向BLAST导致查询序列在最高命中事件中,则鉴定到了旁系同源物;如果一次BLAST中分值靠前的命中事件不是来自查询序列源自的相同物种,且优选地反向BLAST导致查询序列处于最高命中事件之列,则找到了直向同源物。
关于GR-RBP多肽,本发明以编码SEQ ID NO:827的多肽序列的SEQ ID NO:826所示核酸序列转化植物来进行举例说明。然而,本发明的实施并不局限于这些序列;本发明的方法可以有利地利用本文所定义的任何GR-RBP编码核酸或GR-RBP多肽来实施。
编码GR-RBP多肽的核酸的实例在本文实施例部分表A5中给出。这样的核酸可用于实施本发明的方法。实施例部分表A5所给出的氨基酸序列为SEQ ID NO:827所示GR-RBP多肽的直向同源物和旁系同源物的示例序列,其中术语“直向同源物”和“旁系同源物”如本文所定义。其他的直向同源物和旁系同源物可以通过进行所谓的交互BLAST搜索,容易地找到。通常,这包括一次BLAST,即以查询序列(例如,利用实施例部分表A5中所列的任何序列)针对任何序列数据库如可公共获得的NCBI数据库进行BLAST。当从核苷酸序列开始时,通常使用BLASTN或TBLASTX(利用标准默认值),而当从蛋白质序列开始时,则使用BLASTP或TBLASTN(利用标准默认值)。BLAST结果可以任选地过滤。接着使用过滤的结果或者未过滤的结果中的全长序列针对查询序列来源生物的序列进行反向BLAST(二次BLAST)(在查询序列为SEQ ID NO:826或SEQ ID NO:827的情况下,二次BLAST因此将会针对稻序列进行)。然后比较一次和二次BLAST的结果。如果一次BLAST中分值靠前的命中事件来自查询序列源自的相同物种,而理想地反向BLAST导致查询序列在最高命中事件中,则鉴定到了旁系同源物;如果一次BLAST中分值靠前的命中事件不是来自查询序列源自的相同物种,且优选地反向BLAST导致查询序列处于最高命中事件之列,则找到了直向同源物。
分值靠前的命中事件是E值低的命中事件。E值越低,分值越具有显著性(或者换句话说,偶然发现此命中事件的几率越低)。E值的计算是本领域众所周知的。除了E值之外,还可以对比较进行同一性百分比记分。同一性百分比是指两比较核酸(或多肽)序列之间在特定长度上的相同核苷酸(或氨基酸)数。在大家族的情况下,可以使用ClustalW,继之以邻接树来辅助对相关基因的聚类进行可视化和鉴定直向同源物和旁系同源物。
预测蛋白质亚细胞定位的任务非常重要并进行了充分研究。知晓蛋白质的定位有助于阐释其功能。用于蛋白质定位的实验方法范围广泛,从免疫定位到利用绿色荧光蛋白(GFP)或β-葡糖醛酸糖苷酶(GUS)标记蛋白质。与计算方法相比,此类方法虽然劳动量大但精确。最近在根据序列数据计算预测蛋白质定位方面取得了很大进步。从瑞士生物信息学研究所托管的ExPASy蛋白质组学工具可获得本领域技术人员公知的算法,例如PSort、TargetP、ChloroP、LocTree、Predotar、LipoP、MITOPROT、PATS、PTS1、SignalP、TMHMM和其他。
核酸变体也可用于实施本发明的方法。这类变体的实例包括编码实施例部分表A1至A5中给出的任一氨基酸序列的同源物和衍生物的核酸,其中“同源物”和“衍生物”如本文所定义。同样可用于本发明方法的有,编码实施例部分表A1至表A5所给出的任一氨基酸序列的直向同源物或旁系同源物的同源物和衍生物的核酸。可用于本发明方法的同源物和衍生物与其源自的未修饰蛋白质具有基本上相同的生物活性和功能活性。可以用于实施本发明方法的其它变体为密码子使用经优化或miRNA靶位点被移去的变体。
可用于实施本发明方法的其他核酸变体包括编码C3H样多肽、或SPT多肽、或IDI2多肽、或eIF4F样蛋白质复合物亚基或GR-RBP多肽的核酸的部分、与编码C3H样多肽、或SPT多肽、或IDI2多肽、或eIF4F样蛋白质复合物亚基或GR-RBP多肽的核酸杂交的核酸、编码C3H样多肽、或SPT多肽、或IDI2多肽、或eIF4F样蛋白质复合物亚基或GR-RBP多肽的核酸的剪接变体、编码C3H样多肽、或SPT多肽、或IDI2多肽、或eIF4F样蛋白质复合物亚基或GR-RBP多肽的核酸的等位基因变体,以及通过基因改组获得的编码C3H样多肽、或SPT多肽、或IDI2多肽、或eIF4F样蛋白质复合物亚基或GR-RBP多肽的核酸的变体。术语杂交序列、剪接变体、等位基因变体和基因改组如本文所述。
编码C3H样多肽、或SPT多肽、或IDI2多肽、或eIF4F样蛋白质复合物亚基或GR-RBP多肽的核酸无需是全长核酸,因为本发明方法的实施不依赖于全长核酸序列的使用。根据本发明,提供了增强植物产量相关性状的方法,包括在植物中引入和表达实施例部分表A1至A5所给出的任一核酸序列的部分、或者编码实施例部分表A1至A5所给出的任一氨基酸序列的直向同源物、旁系同源物或同源物的核酸的部分。
可以例如,通过对核酸进行一个或多个缺失来制备核酸的“部分”。“部分”可以以分离的形式使用,或者可将其与其他编码(或非编码)序列融合,以便例如,产生组合了几种活性的蛋白质。当与其他编码序列融合时,经翻译后所产生的多肽可能比针对该蛋白质部分预测的大小要大。
关于C3H样多肽,可用于本发明方法的部分编码如本文所定义的C3H样多肽,并与实施例部分表A1所给出的氨基酸序列具有基本上相同的生物活性。优选“部分”是实施例部分表A1所给出的任一核酸的部分,或是编码实施例部分表A1所给出的任一氨基酸序列的直向同源物或旁系同源物的核酸的部分。优选“部分”为长度至少500,550,600,650,700,750,800,850,900,950,1000,1050,1100,1150,1200,1250,1300,1350,1400,1450,1500或更多个连续核苷酸,该连续核苷酸来自实施例部分表A1所给出的任一核酸序列,或编码实施例部分表A1所给出任一氨基酸序列的直向同源物或旁系同源物的核酸。最优选“部分”是SEQ ID NO:1所示核酸的部分。优选,“部分”编码氨基酸序列的片段,当将其用于构建系统发生树例如图2中描述的系统发生树时,其与包含SEQ ID NO:2所示的氨基酸序列的C3H样多肽的组而非与任何其他组聚类。
关于SPT样多肽,可用于本发明方法的部分编码如本文所定义的SPT样多肽,并与实施例部分表A2所给出的氨基酸序列具有基本上相同的生物活性。优选“部分”是实施例部分表A2所给出的任一核酸的部分,或是编码实施例部分表A2所给出的任一氨基酸序列的直向同源物或旁系同源物的核酸的部分。优选“部分”为长度至少500,550,600,650,700,750,800,850,900,950,1000,1050,1100,1150,1200,1250,1300,1350,1400,1450,1500或更多个连续核苷酸,该连续核苷酸来自实施例部分表A2所给出的任一核酸序列,或编码实施例部分表A2所给出任一氨基酸序列的直向同源物或旁系同源物的核酸。最优选“部分”是SEQ ID NO:96所示核酸的部分。优选,“部分”编码氨基酸序列的片段,当将其用于构建系统发生树例如图5中描述的系统发生树时,其与包含SEQ ID NO:97所示的氨基酸序列的SPT样多肽的组而非与任何其他组聚类。
关于IDI2多肽,可用于本发明方法的部分编码如本文所定义的IDI2多肽,并与实施例部分表A3所给出的氨基酸序列具有基本上相同的生物活性。优选“部分”是实施例部分表A3所给出的任一核酸的部分,或是编码实施例部分表A3所给出的任一氨基酸序列的直向同源物或旁系同源物的核酸的部分。优选“部分”为长度至少500,550,600,650,700,750,800,850,900,950,1000,1050,1100,1150,1200,1250,1300,1350,1400,1500,1600,1700,1800,1900,2000,2100,2200,2300,2400,2500,2600个连续核苷酸,该连续核苷酸来自实施例部分表A3所给出的任一核酸序列,或编码实施例部分表A3所给出任一氨基酸序列的直向同源物或旁系同源物的核酸。最优选“部分”是SEQ ID NO:139所示核酸的部分。优选,“部分”编码氨基酸序列的片段,当将其用于构建系统发生树例如图9中描述的系统发生树时,与A或B组而非与任何其他组聚类,更优选地与包含SEQID NO:140所示的氨基酸序列的IDI2多肽的A组聚类。
关于eIF4F样蛋白质复合物亚基,可用于本发明方法的部分编码如本文所定义的eIF4F样蛋白质复合物亚基,并与实施例部分表A4所给出的氨基酸序列具有基本上相同的生物活性。优选“部分”是实施例部分表A4所给出的任一核酸的部分,或是编码实施例部分表A所给出的任一氨基酸序列的直向同源物或旁系同源物的核酸的部分。优选“部分”为长度至少500,550,600,650,700,750,800,850,900,950,1000个连续核苷酸,该连续核苷酸来自实施例部分表A4所给出的任一核酸序列,或编码实施例部分表A4所给出任一氨基酸序列的直向同源物或旁系同源物的核酸。最优选“部分”是SEQ ID NO:240,300或560所示核酸的部分。优选,“部分”编码氨基酸序列的片段,当将其用于构建系统发生树例如图12,13和14中描述的系统发生树时,其与包含SEQ ID NO:241所示的氨基酸序列的eIF4F样亚基多肽的组而非与任何其他组聚类。
关于GR-RBP多肽,可用于本发明方法的部分编码如本文所定义的GR-RBP多肽,并与实施例部分表A5所给出的氨基酸序列具有基本上相同的生物活性。优选“部分”是实施例部分表A5所给出的任一核酸的部分,或是编码实施例部分表A5所给出的任一氨基酸序列的直向同源物或旁系同源物的核酸的部分。优选“部分”为长度至少300,350,400,450,500,550,600,650,700,750,800,850,900,950,1000,1050,1100,1150,1200,1250,1300,1350,1400,1450,1500个连续核苷酸,该连续核苷酸来自实施例部分表A5所给出的任一核酸序列,或编码实施例部分表A5所给出任一氨基酸序列的直向同源物或旁系同源物的核酸。最优选“部分”是SEQID NO:826所示核酸的部分。优选,“部分”编码氨基酸序列的片段,当将其用于构建系统发生树例如图18中描述的系统发生树时,与A或B组而非与任何其他组聚类,更优选地与包含SEQ ID NO:827所示的氨基酸序列的GR-RBP多肽A组聚类。
可以用于本发明方法的另一核酸变体是这样的核酸,所述核酸能够在降低的严格条件下,优选在严格条件下与编码本文中定义的C3H样多肽、或SPT多肽、或IDI2多肽、或eIF4F样蛋白质复合物亚基或GR-RBP多肽的核酸,或者与本文中定义的部分杂交。
根据本发明,提供了增强植物的产量相关性状的方法,包括向植物中引入和表达能够与实施例部分表A1至A5所给出的任一核酸杂交的核酸,或包括向植物中引入和表达能够与编码实施例部分表A1至A5所给出的任何核酸序列的直向同源物、旁系同源物或同源物的核酸杂交的核酸。
关于C3H样多肽,用于本发明方法的杂交序列编码本文中定义的C3H样多肽,所述多肽与实施例部分表A1所给出的氨基酸序列具有基本上相同的生物活性。优选,杂交序列能够与实施例部分表A1所给出的任一核酸的互补序列杂交,或与这些序列之任一的部分杂交,其中“部分”如上文所定义,或者所述杂交序列能够与编码实施例部分表A1所给出的任一氨基酸序列的直向同源物或旁系同源物的核酸的互补序列杂交。最优选,所述杂交序列能够与SEQ ID NO:1所示的核酸的互补序列或与其部分杂交。
优选,所述杂交序列编码具有氨基酸序列的多肽,所述氨基酸序列,当全长用于构建系统发生树例如图2中描述的系统发生树时,与包含SEQ ID NO:2所示的氨基酸序列的C3H样多肽的组而非与任何其他组聚类。
关于SPT样多肽,用于本发明方法的杂交序列编码本文中定义的SPT样多肽,所述多肽与实施例部分表A2所给出的氨基酸序列具有基本上相同的生物活性。优选,杂交序列能够与实施例部分表A2所给出的任一核酸的互补序列杂交,或与这些序列之任一的部分杂交,其中“部分”如上文所定义,或者所述杂交序列能够与编码实施例部分表A2所给出的任一氨基酸序列的直向同源物或旁系同源物的核酸的互补序列杂交。最优选,所述杂交序列能够与SEQ ID NO:96所示的核酸的互补序列或与其部分杂交。
优选,所述杂交序列编码具有氨基酸序列的多肽,所述氨基酸序列,当全长用于构建系统发生树例如图5中描述的系统发生树时,与包含SEQ ID NO:97所示的氨基酸序列的SPT样多肽的组而非与任何其他组聚类。
关于IDI2多肽,用于本发明方法的杂交序列编码本文中定义的IDI2多肽,所述多肽与实施例部分表A3所给出的氨基酸序列具有基本上相同的生物活性。优选,杂交序列能够与实施例部分表A3所给出的任一核酸的互补序列杂交,或与这些序列之任一的部分杂交,其中“部分”如上文所定义,或者所述杂交序列能够与编码实施例部分表A3所给出的任一氨基酸序列的直向同源物或旁系同源物的核酸的互补序列杂交。最优选,所述杂交序列能够SEQ ID NO:139所示的核酸的互补序列或与其部分杂交。
优选,所述杂交序列编码具有氨基酸序列的多肽,所述氨基酸序列,当全长用于构建系统发生树例如图9中描述的系统发生树时,与A或B组而非与任何其他组聚类,更优选地与包含SEQ ID NO:140所示的氨基酸序列的IDI2多肽A组聚类。
关于eIF4F样蛋白质复合物亚基,用于本发明方法的杂交序列编码本文中定义的eIF4F样蛋白质复合物亚基,所述多肽与实施例部分表A4所给出的氨基酸序列具有基本上相同的生物活性。优选,杂交序列能够与实施例部分表A4所给出的任一核酸的互补序列杂交,或与这些序列之任一的部分杂交,其中“部分”如上文所定义,或者所述杂交序列能够与编码实施例部分表A4所给出的任一氨基酸序列的直向同源物或旁系同源物的核酸的互补序列杂交。最优选,所述杂交序列能够与SEQ ID NO:240,SEQ ID NO 300或SEQ ID NO:560所示的核酸的互补序列杂交,以及在本发明再一优选实施方案中,所述杂交序列能够与SEQ ID NO:240所示的核酸的互补序列或与其任何部分杂交。
优选,所述杂交序列编码至少具有如下氨基酸序列的多肽,所述氨基酸序列,当全长用于构建系统发生树例如图12,13和14中描述的系统发生树时,与包含SEQ ID NO:241,SEQ ID NO:301或SEQ ID NO:561所示的氨基酸序列,最优选地SEQ ID NO:241所示的氨基酸序列的eIF4F样蛋白质复合物亚基的组而非与任何其他组聚类。
关于GR-RBP多肽,用于本发明方法的杂交序列编码本文中定义的GR-RBP多肽,所述多肽与实施例部分表A5所给出的氨基酸序列具有基本上相同的生物活性。优选,杂交序列能够与实施例部分表A5所给出的任一核酸的互补序列杂交,或与这些序列之任一的部分杂交,其中“部分”如上文所定义,或者所述杂交序列能够与编码实施例部分表A5所给出的任一氨基酸序列的直向同源物或旁系同源物的核酸的互补序列杂交。最优选,所述杂交序列能够与SEQ ID NO:826所示的核酸的互补序列或与其部分杂交。
优选,所述杂交序列编码具有氨基酸序列的多肽,所述氨基酸序列,当全长用于构建系统发生树例如图18中描述的系统发生树时,与A或B组而非与任何其他组聚类,更优选地与包含SEQ ID NO:827所示的氨基酸序列的GR-RBP多肽的A组聚类。
关于C3H样多肽、或SPT多肽、或IDI2多肽或GR-RBP多肽,可以用于本发明方法的另一核酸变体是编码上文中定义的C3H样多肽、或SPT多肽、或IDI2多肽或GR-RBP多肽的剪接变体,剪接变体如本文中定义。
关于eIF4F样蛋白质复合物亚基,可以用于本发明方法的另一核酸变体是至少编码上文中定义的eIF4F样蛋白质复合物亚基的剪接变体,剪接变体如本文中定义。
关于C3H样多肽、或SPT多肽、或IDI2多肽或GR-RBP多肽,根据本发明,提供了用于增强植物的产量相关性状的方法,包括向植物中引入和表达实施例部分表A1、或表A2、或表A3或表A5所给出的任一核酸序列的剪接变体,或编码实施例部分表A1、或表A2、或表A3或表A5所给出的任何氨基酸序列的直向同源物、旁系同源物或同源物的核酸的剪接变体。
关于eIF4F样蛋白质复合物亚基,根据本发明,提供了用于增强植物的产量相关性状的方法,包括向植物中引入和表达实施例部分表A4所给出的至少一种核酸序列的剪接变体,或至少一种编码实施例部分表A4所给出的至少一种氨基酸序列的直向同源物、旁系同源物或同源物的核酸的剪接变体。
关于C3H样多肽,优选剪接变体是如SEQ ID NO:1所示的核酸的剪接变体,或编码SEQ ID NO:2的直向同源物或旁系同源物的核酸的剪接变体。优选,由所述剪接变体编码的氨基酸序列,当用于构建系统发生树例如图2中描述的系统发生树时,与包含SEQ ID NO:2所示的氨基酸序列的C3H样多肽的组而非与任何其他组聚类。
关于SPT多肽,优选剪接变体是如SEQ ID NO:96所示的核酸的剪接变体,或编码SEQ ID NO:97的直向同源物或旁系同源物的核酸的剪接变体。优选,由所述剪接变体编码的氨基酸序列,当用于构建系统发生树例如图5中描述的系统发生树时,与包含SEQ ID NO:97所示的氨基酸序列的SPT样多肽的组而非与任何其他组聚类。
关于IDI2多肽,优选剪接变体是如SEQ ID NO:139所示的核酸的剪接变体,或编码SEQ ID NO:140的直向同源物或旁系同源物的核酸的剪接变体。优选,由所述剪接变体编码的氨基酸序列,当用于构建系统发生树例如图9中描述的系统发生树时,与A或B组而非与任何其他组聚类,更优选地与包含SEQ ID NO:140所示的氨基酸序列的IDI2多肽的A组聚类。
关于eIF4F样蛋白质复合物亚基,优选剪接变体是如SEQ ID NO:240,SEQ ID NO:300和/或SEQ ID NO:560所示的核酸的剪接变体,或编码SEQ ID NO:241,SEQ ID NO:301或SEQ ID NO:561的直向同源物或旁系同源物的核酸的剪接变体。优选,由所述剪接变体编码的氨基酸序列,当用于构建系统发生树例如图12,13和/或14中描述的系统发生树时,与包含SEQ ID NO:241,SEQ ID NO:301或SEQ ID NO:561所示的至少一种氨基酸序列、最优选SEQ ID NO:241所示的氨基酸序列的至少一个eIF4F样蛋白质复合物亚基(例如eIF4isoG/G,eIF4A或eIF4E/isoE)组而非与任何其他组聚类。
关于GR-RBP多肽,优选剪接变体是如SEQ ID NO:826所示的核酸的剪接变体,或编码SEQ ID NO:827的直向同源物或旁系同源物的核酸的剪接变体。优选,由所述剪接变体编码的氨基酸序列,当用于构建系统发生树例如图18中描述的系统发生树时,与A或B组而非与任何其他组聚类,更优选地与包含SEQ ID NO:826所示的氨基酸序列的GR-RBP多肽的A组聚类。
可用于本发明方法的另一核酸变体为编码前文所定义的C3H样多肽、或SPT多肽、或IDI2多肽、或eIF4F样蛋白质复合物亚基或GR-RBP多肽的核酸的等位基因变体,等位基因变体如本文所定义。
根据本发明,提供了增强植物产量相关性状的方法,包括在植物中引入和表达实施例部分表A1至A5所给出的任一核酸的等位基因变体,或包括在植物中引入和表达编码实施例部分表A1至A5所给出的任一氨基酸序列的直向同源物、旁系同源物或同源物的核酸的等位基因变体。
关于C3H样多肽,由可用于本发明方法的等位基因变体编码的多肽与SEQ ID NO:2的C3H样多肽及实施例部分表A1中描述的任何氨基酸序列具有基本上相同的生物活性。等位基因变体天然存在,并且对这些天然等位基因的应用包含于本发明的方法中。优选等位基因变体为SEQ IDNO:1的等位基因变体,或编码SEQ ID NO:2的直向同源物或旁系同源物的核酸的等位基因变体。优选,由等位基因变体编码的氨基酸序列,当用于构建系统发生树例如图2中描述的系统发生树时,与包含SEQ IDNO:2所示的氨基酸序列的C3H样多肽的组而非与任何其他组聚类。
关于SPT多肽,由可用于本发明方法的等位基因变体编码的多肽与SEQ ID NO:97的SPT样多肽及实施例部分表A2中描述的任何氨基酸序列具有基本上相同的生物活性。等位基因变体天然存在,并且对这些天然等位基因的应用包含于本发明的方法中。优选等位基因变体为SEQ IDNO:96的等位基因变体,或编码SEQ ID NO:97的直向同源物或旁系同源物的核酸的等位基因变体。优选,由等位基因变体编码的氨基酸序列,当用于构建系统发生树例如图5中描述的系统发生树时,与包含SEQ IDNO:97所示的氨基酸序列的SPT样多肽的组而非与任何其他组聚类。
关于IDI2多肽,由可用于本发明方法的等位基因变体编码的多肽与SEQ ID NO:140的IDI2多肽及实施例部分表A3中描述的任何氨基酸序列具有基本上相同的生物活性。等位基因变体天然存在,并且对这些天然等位基因的应用包含于本发明的方法中。优选等位基因变体为SEQ IDNO:139的等位基因变体,或编码SEQ ID NO:140的直向同源物或旁系同源物的核酸的等位基因变体。优选,由等位基因变体编码的氨基酸序列,当用于构建系统发生树例如图3中描述的系统发生树时,与A或B组而非与任何其他组聚类,更优选地与包含SEQ ID NO:140所示的氨基酸序列的IDI2多肽的A组聚类。
关于eIF4F样蛋白质复合物亚基,由可用于本发明方法的等位基因变体编码的多肽与SEQ ID NO:241,SEQ ID NO:301或SEQ ID NO:561所示序列之任一的eIF4F样蛋白质复合物亚基及实施例部分表A4中描述的任何氨基酸序列具有基本上相同的生物活性。等位基因变体天然存在,并且对这些天然等位基因的应用包含于本发明的方法中。优选等位基因变体为SEQ ID NO:240,SEQ ID NO:300和/或SEQ ID NO:560的等位基因变体,或编码SEQ ID NO:241,SEQ ID NO:301和/或SEQ ID NO:561的直向同源物或旁系同源物的核酸的等位基因变体。优选,由等位基因变体编码的氨基酸序列,当用于构建系统发生树例如图12,13和/或14中描述的系统发生树时,与包含SEQ ID NO:241所示的氨基酸序列的eIF4F样蛋白质复合物亚基,例如eIF4isoG/G,eIF4A或eIF4E/isoE,而非与任何其他组聚类。
关于GR-RBP多肽,由可用于本发明方法的等位基因变体编码的多肽与SEQ ID NO:827的GR-RBP多肽及实施例部分表A5中描述的任何氨基酸序列具有基本上相同的生物活性。等位基因变体天然存在,并且对这些天然等位基因的应用包含于本发明的方法中。优选等位基因变体为SEQ ID NO:826的等位基因变体,或编码SEQ ID NO:827的直向同源物或旁系同源物的核酸的等位基因变体。优选,由等位基因变体编码的氨基酸序列,当用于构建系统发生树例如图18中描述的系统发生树时,与A或B组而非与任何其他组聚类,更优选地与包含SEQ ID NO:827所示的氨基酸序列的GR-RBP多肽的A组聚类。
基因改组或定向进化也可用于产生编码上文所定义的C3H样多肽、或SPT多肽、或IDI2多肽、或eIF4F样蛋白质复合物亚基或GR-RBP多肽的核酸的变体;其中术语“基因改组”如本文所定义。
根据本发明,提供了用于增强植物的产量相关性状的方法,包括向植物中引入和表达实施例部分的表A1至A5所给出的任一核酸序列的变体,或包括向植物中引入和表达编码实施例部分的表A1至A5所给出的任何氨基酸序列的直向同源物、旁系同源物或同源物的核酸的变体,其中所述变体核酸通过基因改组获得。
关于C3H样多肽,优选,由通过基因改组获得的变体核酸编码的氨基酸序列,当用于构建系统发生树例如图2中描述的系统发生树时,与包含SEQ ID NO:2所示的氨基酸序列的C3H样多肽的组而非与任何其他组聚类。
关于SPT多肽,优选,由通过基因改组获得的变体核酸编码的氨基酸序列,当用于构建系统发生树例如图5中描述的系统发生树时,与包含SEQ ID NO:97所示的氨基酸序列的SPT样多肽的组而非与任何其他组聚类。
关于IDI2多肽,优选,由通过基因改组获得的变体核酸编码的氨基酸序列,当用于构建系统发生树例如图9中描述的系统发生树时,与A或B组而非与任何其他组聚类,更优选地多肽序列与包含SEQ ID NO:140所示的氨基酸序列的IDI2多肽的A组聚类。
关于eIF4F样蛋白质复合物亚基,优选,由通过基因改组获得的变体核酸编码的氨基酸序列,当用于构建系统发生树例如图12,13和/或14中描述的系统发生树时,与包含SEQ ID NO:241,SEQ ID NO:301和/或SEQ ID NO:561所示的氨基酸序列的eIF4F样蛋白质复合物亚基的组,最优选地与包含SEQ ID NO:241所示的氨基酸序列的eIF4F样蛋白质复合物亚基的组而非与任何其他组聚类。
关于GR-RBP多肽,优选,由通过基因改组获得的变体核酸编码的氨基酸序列,当用于构建系统发生树例如图18中描述的系统发生树时,与A或B组而非与任何其他组聚类,更优选地与包含SEQ ID NO:827所示的氨基酸序列的GR-RBP多肽的A组聚类。
此外,还可利用定点诱变获得核酸变体。若干方法可用来实现定点诱变,最常见的是基于PCR的方法(Current Protocols in MolecularBiology.Wiley编辑)。
编码C3H样多肽的核酸可以源自任何天然或人工来源。该核酸可以通过有意的人为操作而在组成和/或基因组环境上不同于其天然形式。优选,编码C3H样多肽的核酸来自植物,优选来自苜蓿科(Medicago),最优选核酸来自蒺藜苜蓿(Medicago truncatula)。
编码SPT样多肽的核酸可以源自任何天然或人工来源。该核酸可以通过有意的人为操作而在组成和/或基因组环境上不同于其天然形式。优选,编码SPT样多肽的核酸可以来自植物,更优选来自杨柳科(Salicaceae),优选来自杨属(Populus),最优选核酸来自毛果杨(Populustrichocarpa)。
编码IDI2多肽的核酸可以源自任何天然或人工来源。该核酸可以通过有意的人为操作而在组成和/或基因组环境上不同于其天然形式。优选,编码IDI2多肽的核酸可以来自植物,更优选来自单子叶植物,更优选来自禾本科(Poaceae),最优选核酸来自甘蔗(Saccharum officinarum)。
编码eIF4F样蛋白质复合物亚基的核酸可以源自任何天然或人工来源。该核酸可以通过有意的人为操作而在组成和/或基因组环境上不同于其天然形式。优选,编码eIF4F样蛋白质复合物亚基的核酸可以来自植物,更优选来自单子叶植物,更优选来自禾本科(Poaceae),最优选核酸来自稻(Oryza sativa)。
编码GR-RBP多肽的核酸可以源自任何天然或人工来源。该核酸可以通过有意的人为操作而在组成和/或基因组环境上不同于其天然形式。优选,编码GR-RBP多肽的核酸可以来自植物,更优选来自单子叶植物,更优选来自禾本科(Poaceae),最优选核酸来自稻(Oryza sativa)。
关于C3H样多肽、或SPT多肽、或eIF4F样蛋白质复合物亚基,本发明方法的实施产生具有增强的产量相关性状的植物。尤其是,本发明方法的实施产生与对照植物相比较具有增加的产量,特别是增加的种子产量的植物。术语“产量”和“种子产量”在本文“定义”部分有更详细的说明。
关于IDI2多肽、或GR-RBP多肽,本发明方法的实施产生具有增强的产量相关性状的植物。尤其是,本发明方法的实施产生与对照植物相比较具有增加的产量,特别是增加的种子产量、增加的生物量和/或增加的早期活力的植物。术语“产量”、“种子产量”和“早期活力”在本文“定义”部分有更详细的说明。
关于C3H样多肽、或SPT多肽、或eIF4F样蛋白质复合物亚基,本文中提及增强的产量相关性状,旨在表示植物的一个或多个部分的生物量(重量)的增加,所述部分可以包括地上(可收获的)部分和/或地下(可收获的)部分。特别地,该可收获部分是种子,并且本发明方法的实施导致与对照植物的种子产量相比较具有增加的种子产量的植物。
关于IDI2多肽,本文中提及增强的产量相关性状,旨在表示植物的一个或多个部分的生物量(重量)的增加,所述部分可以包括地上(可收获的)部分和/或地下(可收获的)部分。特别地,该可收获部分是种子、地上生物量和/或根,并且本发明方法的实施导致与对照植物相比较具有增加的早期活力、增加的种子产量,和/或增加的生物量的植物。
关于GR-RBP多肽,本文中提及增强的产量相关性状,旨在表示植物的一个或多个部分的生物量(重量)的增加,所述部分可以包括地上(可收获的)部分和/或地下(可收获的)部分。特别地,该可收获部分是种子和/或根,并且本发明方法的实施导致与对照植物的种子产量相比较具有增加的种子产量和/或与对照植物相比较具有增加的根生长的植物。
以玉米为例,产量增加可以表现为如下一个或多个方面:每平方米建植的植物数的增加、每株植物的穗数的增加、行数、行粒数、粒重、千粒重、穗长度/直径的增加、种子饱满率(为饱满种子数除以种子总数并乘以100)的增加,等等。
以稻为例,产量增加可以表现为如下一个或多个方面的增加:每平方米的植物数、每株植物的圆锥花序数、圆锥花序长度、每圆锥花序的小穗数、每圆锥花序的花朵(小花)数(表达为饱满种子数占一级圆锥花序数(primary panicles)的比率)、种子饱满率(为饱满种子数除以种子总数并乘以100)的增加、千粒重的增加,等等。在稻中,耐淹性也可以导致增加的产量。
本发明提供了相对于对照植物增加植物的产量,特别地种子产量,的方法,所述方法包括调节编码本文所定义的C3H样多肽、或SPT多肽、或IDI2多肽的核酸在植物中的表达。
本发明提供了相对于对照植物增加植物的产量,特别地种子产量,的方法,所述方法包括通过调节至少一种本文所定义的eIF4F样蛋白质复合物亚基多肽的编码核酸的表达,调节eIF4F样蛋白质复合物在植物中的活性。
本发明提供了相对于对照植物增加植物的产量,特别地种子产量和/或根产量,的方法,所述方法包括调节编码本文所定义的GR-RBP多肽的核酸在植物中的表达。
由于本发明的转基因植物具有增强的产量,故,相对于对照植物在其生命周期的相应阶段的生长速率而言,这些植物可能呈现增加的生长速率(至少在其部分生命周期中)。
增加的生长速率可以特异于植物的一个或多个部分(包括种子),或者可以基本上遍及整株植物。具有增加生长速率的植物可以具有更短的生命周期。植物的生命周期可以理解为指,从成熟干种子生长至植物已经产生类似于起始材料的成熟干种子的阶段所需的时间。此生命周期可以受到诸如萌发速度、早期活力、生长速率、绿度指数、开花时间和种子成熟速度等因素的影响。生长速率的增加可以发生在植物生命周期的一个或多个阶段,或者发生在基本上整个植物生命周期的过程中。在植物生命周期的早期阶段生长速率的增加可以反映为增强的活力。生长速率的增加可以改变植物的收获周期,使植物能够比原可能的情况更晚播种和/或更快收获(类似的效果可以通过较早的开花时间获得)。如果生长速率充分增加,可以允许再次播种同种植物物种的种子(例如完全在一个常规的生长期内,播种和收获稻类植物、接着再次播种和收获稻类植物)。与此类似,如果生长速率充分地增加,可以允许再播种不同植物物种的种子(例如播种和收获玉米植物,随后,例如,播种和任选的收获大豆、马铃薯或任何其他适宜的植物)。在一些作物植物的情况下也可能从同一砧木收获增加的次数。改变植物的收获周期可以导致每平方米年生物量产量的增加(这是由于(比方说在一年中)任何特定植物可以生长和收获的次数增加)。与野生型对应物相比,生长速率的增加还允许在更广阔的地域栽培转基因植物,这是因为种植作物的地域限制常由种植时(早季)或收获时(晚季)不利的环境条件所决定。如果缩短收获周期,就可以避免这类不利条件。可以通过自生长曲线获得多种参数,确定生长速率,这类参数可以是:T-Mid(植物达到其最大大小的50%所需的时间)和T-90(植物达到其最大大小的90%所需的时间)等等。
关于C3H样多肽、或SPT多肽、或IDI2多肽或GR-RBP多肽,根据本发明优选的方面,实施本发明方法产生相对于对照植物具有增加的生长速率的植物。因此,本发明提供了增加植物生长速率的方法,所述方法包括调节编码本文所定义的C3H样多肽、或SPT多肽、或IDI2多肽、或eIF4F样蛋白质复合物或GR-RBP多肽的核酸在植物中的表达。
关于eIF4F样蛋白质复合物亚基,根据本发明优选的方面,实施本发明方法产生相对于对照植物具有增加的生长速率的植物。因此,本发明提供了增加植物生长速率的方法,所述方法包括通过调节和表达编码至少一种本文所定义的eIF4F样蛋白质复合物亚基多肽的核酸来调节eIF4F样蛋白质复合物在植物中的活性。
相对于对照植物而言产量和/或生长速率的增强可以发生在植物处于非胁迫条件下或发生在植物暴露于各种胁迫的情况下。通常植物通过更加缓慢的生长来应答胁迫接触。在重度胁迫条件下,植物甚至可以完全停止生长。另一方面,轻度胁迫在文中定义为当植物接触时不导致植物完全停止生长且丧失重新开始生长的能力的任何胁迫。本发明意义上的轻度胁迫导致受胁迫植物的生长,与非胁迫条件下的对照植物相比,下降不到40%、35%、30%或25%、更优选下降不到20%或15%。由于农业实践(灌溉、施肥、农药处理)的发展,栽培的作物植物往往并不会遇到重度胁迫。因此,由轻度胁迫诱发的受损的生长通常成为农业中不期望的性质。轻度胁迫是植物接触的日常的生物和/或非生物(环境)胁迫。非生物胁迫可以因干旱或过量的水、缺氧胁迫、盐胁迫、化学毒性、氧化胁迫以及热、冷或冰冻温度而引起。非生物胁迫可以是由于水胁迫(特别是由于干旱)、盐胁迫、氧化胁迫或离子胁迫引起的渗透胁迫。生物胁迫一般是由病原体例如细菌、病毒、真菌、线虫和昆虫所引起的那些胁迫。生物胁迫通常是由病原体,例如细菌、病毒、真菌、线虫和昆虫等引起的胁迫。术语“非胁迫”条件如本文中所使用的是指允许植物最佳生长的那些环境条件。本领域技术人员知道给定位置的正常土壤条件和气候条件。术语非胁迫条件在本文中涵盖植物接触到的偶尔或日常的轻度胁迫(如本文中所定义),但不包括重度胁迫。
特别地,可在非胁迫条件下或在轻度干旱条件下进行本发明方法以产生相对于对照植物具有增加的产量的植物。如Wang等(Planta(2003)218:1-14)所报道的那样,非生物胁迫引起一系列的形态学、生理学、生物化学和分子变化,对植物生长和生产力造成不利影响。已知干旱、盐度、极端温度和氧化胁迫相互联系,并可以通过相似的机制诱发生长和细胞损害。Rabbani等(Plant Physiol(2003)133:1755-1767)描述了干旱胁迫和高盐度胁迫之间存在着的特别高程度的“交叉对话”。例如,干旱和/或盐度主要表现为渗透胁迫,导致破坏细胞中的稳态和离子分布。氧化胁迫通常与高温或低温、盐度或干旱胁迫相伴,可以引起功能及结构蛋白质的变性。所以,这些多种多样的环境胁迫通常激活相似的细胞信号传递通路和细胞应答,如应激蛋白的产生、抗氧化剂的上调、可混溶溶质的累积以及生长阻抑。如本文中所用的术语“非胁迫”条件是允许植物最佳生长的那些环境条件。本领域技术人员知道给定位置的正常土壤条件和气候条件。具有最佳生长条件(在非胁迫条件下生长)的植物通常按照递增的优选次序产生这样的植物在给定的环境中的平均产量的至少97%、95%、92%、90%、87%、85%、83%、80%、77%或75%。可基于收获和/或季节,计算平均产量。本领域技术人员将知晓作物的平均产量产出。
关于C3H样多肽、或SPT多肽、或IDI2多肽或GR-RBP多肽,实施本发明方法产生,在非胁迫条件下或在轻度干旱条件下生长时相对于在相当条件下生长的对照植物具有增加的产量的植物。因此,根据本发明,提供了用于在非胁迫条件下或轻度干旱条件下生长的植物中增加产量的方法,所述方法包括调节编码C3H样多肽、或SPT多肽、或IDI2多肽或GR-RBP多肽的核酸在植物中的表达。
关于eIF4F样蛋白质复合物亚基,实施本发明方法产生,在非胁迫条件下或在轻度干旱条件下生长时相对于在相当条件下生长的对照植物具有增加的产量的植物。因此,根据本发明,提供了用于在非胁迫条件下或轻度干旱条件下生长的植物中增加产量的方法,所述方法包括通过调节和表达至少一种eIF4F样蛋白质复合物亚基多肽编码核酸来调节eIF4F样蛋白质复合物在植物中的活性。
关于C3H样多肽、或SPT多肽、或IDI2多肽或GR-RBP多肽,实施本发明方法产生,生长在养分缺乏的条件下、特别是氮缺乏条件下,相对于在相当条件下生长的对照植物,具有增加的产量的植物。因此,根据本发明,提供了用于在养分缺乏条件下生长的植物中增加产量的方法,所述方法包括调节编码C3H样多肽、或SPT多肽、或IDI2多肽、或eIF4F样蛋白质复合物或GR-RBP多肽的核酸在植物中的表达。养分缺乏可以因诸如氮、磷酸及其他含磷化合物、钾、钙、镁、锰、铁和硼等养分的缺乏所致。关于IDI2多肽,养分缺乏优选地为氮的缺乏。
关于eIF4F样蛋白质复合物亚基,实施本发明方法产生,生长在养分缺乏的条件下、特别是氮缺乏条件下,相对于在相当条件下生长的对照植物,具有增加的产量的植物。因此,根据本发明,提供了用于在养分缺乏条件下生长的植物中增加产量的方法,所述方法包括通过调节和表达至少一种eIF4F样蛋白质复合物亚基多肽编码核酸来调节eIF4F样蛋白质复合物的活性。养分缺乏可以因诸如氮、磷酸及其他含磷化合物、钾、钙、镁、锰、铁和硼等养分的缺乏所致。
实施本发明方法产生,生长在盐胁迫的条件下,相对于在相当条件下生长的对照植物,具有增加的产量的植物。因此,根据本发明,提供了用于在盐胁迫的条件下生长的植物中增加产量的方法,所述方法包括调节编码C3H样多肽的核酸在植物中的表达。术语盐胁迫不局限于氯化钠(NaCl),而可以是如下一种或多种盐:NaCl、KCl、LiCl、MgCl2、CaCl2等。
本发明包括可由根据本发明的方法获得的植物或其部分(包括种子)。所述植物或其部分含有编码如上文所定义的C3H样多肽、或SPT多肽、或IDI2多肽、或eIF4F样蛋白质复合物亚基或GR-RBP多肽的核酸转基因。
关于C3H样多肽、或SPT多肽、或IDI2多肽、或eIF4F样蛋白质复合物亚基或GR-RBP多肽,本发明还提供遗传构建体和载体,以利于编码C3H样多肽、或SPT多肽、或IDI2多肽、或eIF4F样蛋白质复合物亚基或GR-RBP多肽的核酸在植物中的引入和/或表达。可以将基因构建体插入适于转化进入植物并适于在转化的细胞中表达目的基因的载体(可商购获得)中。本发明还提供了如本文所定义的基因构建体在本发明方法中的用途。
关于eIF4F样蛋白质复合物亚基,本发明还提供遗传构建体和载体,以利于至少一种eIF4F样蛋白质复合物亚基多肽编码核酸在植物中的引入和/或表达。可以将基因构建体插入适于转化进入植物并适于在转化的细胞中表达目的基因的载体(可商购获得)中。本发明还提供了如本文所定义的基因构建体在本发明方法中的用途。
更特别地,本发明提供这样的构建体,其含有:
(a)编码如上文所定义的C3H样多肽、或SPT多肽、或IDI2多肽或GR-RBP多肽的核酸,或至少一种上文所定义的eIF4F样蛋白质复合物亚基多肽编码核酸;
(b)一个或多个能够驱动(a)中核酸序列表达的控制序列;和任选的
(c)转录终止序列。
关于C3H样多肽、或SPT多肽、或IDI2多肽、或GR-RBP多肽,编码C3H样多肽、或SPT多肽、或IDI2多肽、或GR-RBP多肽的核酸优选如以上所定义。关于eIF4F样蛋白质复合物亚基,编码eIF4F样蛋白质复合物亚基的核酸优选为至少一种如以上所定义的亚基多肽的编码核酸。术语“控制序列”和“终止序列”如本文所定义。
可以使用含有任何上述核酸的载体转化植物。技术人员充分知晓载体中必须存在的遗传元件,以便成功进行转化、选择并繁殖含目的序列的宿主细胞。目的序列将有效连接于一个或多个控制序列(至少连接于启动子)。
有利地,可以使用任何类型的天然或合成启动子来驱动核酸序列的表达,但优选启动子是植物来源的。组成型启动子在本发明方法中特别有用,优选组成型启动子也是遍在启动子、或中等强度的遍在启动子。有关各种启动子类型的定义,参见本文中“定义”部分。
关于C3H样多肽,应当清楚,本发明的实施并不局限于SEQ ID NO:1所示的C3H样多肽编码核酸,而且本发明的实施也不局限于由组成型启动子所驱动的C3H样多肽编码核酸的表达。
所述组成型启动子优选是中等强度的启动子,更优选选自植物来源的启动子,例如GOS2启动子,更优选启动子是来自稻的GOS2启动子。更优选组成型启动子为与SEQ ID NO:95基本上相似的核酸序列,最优选组成型启动子如SEQ ID NO:95所示。有关组成型启动子的其他实例,参见本文中“定义”部分。
任选的,可以在引入植物的构建体中使用一个或多个终止子序列。优选,构建体包含表达盒,所述表达盒包含与SEQ ID NO:95基本上相似的GOS2启动子和编码C3H样多肽的核酸。
关于SPT多肽,应当清楚,本发明的实施并不局限于SEQ ID NO:96所示的SPT样多肽编码核酸,而且本发明的实施也不局限于由组成型启动子所驱动的SPT样多肽编码核酸的表达。
所述组成型启动子优选是中等强度的启动子,更优选选自植物来源的启动子,例如GOS2启动子,更优选启动子是来自稻的GOS2启动子。更优选组成型启动子为与SEQ ID NO:135基本上相似的核酸序列,最优选组成型启动子如SEQ ID NO:135所示。有关组成型启动子的其他实例,参见本文中“定义”部分。
任选的,可以在引入植物的构建体中使用一个或多个终止子序列。优选,构建体包含表达盒,所述表达盒包含与SEQ ID NO:135基本上相似的GOS2启动子和编码SPT样多肽的核酸。
关于IDI2多肽,应当清楚,本发明的实施并不局限于SEQ ID NO:139所示的IDI2多肽编码核酸,而且本发明的实施也不局限于由组成型启动子所驱动的IDI2多肽编码核酸的表达。
所述组成型启动子优选是中等强度的启动子,更优选选自植物来源的启动子,例如GOS2启动子,更优选启动子是来自稻的GOS2启动子。更优选组成型启动子为与SEQ ID NO:149基本上相似的核酸序列,最优选组成型启动子如SEQ ID NO:149所示。有关组成型启动子的其他实例,参见本文中“定义”部分。
任选的,可以在引入植物的构建体中使用一个或多个终止子序列。优选,构建体包含表达盒,所述表达盒包含与SEQ ID NO:149基本上相似的水稻GOS2启动子和编码IDI2多肽的核酸。
关于eIF4F样蛋白质复合物亚基,应当清楚,本发明的实施并不局限于SEQ ID NO:240,SEQ ID NO:300和/或SEQ ID NO:560所示的eIF4F样蛋白质复合物亚基多肽编码核酸,而且本发明的实施也不局限于由组成型启动子所驱动的eIF4F样蛋白质复合物亚基多肽编码核酸的表达。
所述组成型启动子优选是中等强度的启动子,更优选选自植物来源的启动子,例如GOS2启动子,更优选启动子是来自稻的GOS2启动子。更优选组成型启动子为与SEQ ID NO:818和/或SEQ ID NO:819基本上相似的核酸序列,最优选组成型启动子如SEQ ID NO:818所示。有关组成型启动子的其他实例,参见本文中“定义”部分。
任选的,可以在引入植物的构建体中使用一个或多个终止子序列。优选,构建体包含表达盒,所述表达盒包含与SEQ ID NO:818基本上相似的GOS2启动子和至少一种eIF4F样蛋白质复合物亚基多肽编码核酸。
关于GR-RBP多肽,应当清楚,本发明的实施并不局限于SEQ IDNO:826所示的GR-RBP多肽编码核酸,而且本发明的实施也不局限于由组成型启动子所驱动的GR-RBP多肽编码核酸的表达。
所述组成型启动子优选是中等强度的启动子,更优选选自植物来源的启动子,例如GOS2启动子,更优选启动子是来自稻的GOS2启动子。更优选组成型启动子为与SEQ ID NO:840基本上相似的核酸序列,最优选组成型启动子如SEQ ID NO:840所示。有关组成型启动子的其他实例,参见本文中“定义”部分。
任选的,可以在引入植物的构建体中使用一个或多个终止子序列。优选,构建体包含表达盒,所述表达盒包含与SEQ ID NO:840基本上相似的稻GOS2启动子和编码GR-RBP多肽的核酸。
另外的调控元件可以包括转录和翻译的增强子。本领域技术人员会知道适合用于实施本发明的终止子和增强子的序列。如“定义”部分所说明的那样,也可以向5’非翻译区(UTR)或在编码序列中加入内含子序列,来增加在胞质中累积的成熟信使的量。其他控制序列(除启动子、增强子、沉默子、内含子序列、3’UTR和/或5’UTR区之外)可以有蛋白质和/或RNA稳定元件。这类序列为本领域技术人员公知或者可以容易地获得。
本发明的遗传构建体可以还包括为在特定细胞类型中维持和/或复制所需的复制起点序列。一个实例是需要将遗传构建体作为染色体外遗传元件(如质粒或粘粒分子)在细菌细胞中维持的情况。优选的复制起点包括但不限于f1-ori和colE1。
为检测本发明方法中所用核酸序列的成功转移和/或选择含有这些核酸的转基因植物,最好使用标记基因(或报告基因)。因此,遗传构建体可以任选地含有可选择标记基因。可选择标记在本文“定义”部分有更详细的说明。一旦不再需要标记基因,可从转基因细胞中将其除去或切除。用于标记去除的技术在本领域内是已知的,有用的技术描述于上文中定义部分。
本发明还提供了产生相对于对照植物具有增强的产量相关性状的转基因植物的方法,包括在植物中引入和表达编码如前文所定义的C3H样多肽、或SPT多肽、或IDI2多肽、或eIF4F样蛋白质复合物亚基或GR-RBP多肽的任何核酸。
更具体地,本发明提供了产生具有增强的产量相关性状,特别是增加的(种子)产量的转基因植物的方法,所述方法包括:
(i)向植物或植物细胞中引入和表达编码C3H样多肽、或SPT多肽、或IDI2多肽、或eIF4F样蛋白质复合物亚基或GR-RBP多肽的核酸;和
(ii)在促进植物生长和发育的条件下培养所述植物细胞。
(i)中的核酸可以为任何能够编码如本文定义的C3H样多肽、或SPT多肽、或IDI2多肽、或eIF4F样蛋白质复合物亚基或GR-RBP多肽的核酸。
本发明还提供了产生相对于对照植物具有增强的产量相关性状的转基因植物的方法,包括在植物中引入和表达编码如前文所定义的C3H样多肽、或SPT多肽、或IDI2多肽、或eIF4F样蛋白质复合物亚基或GR-RBP多肽的任何核酸。
更具体地,本发明提供了产生具有增强的产量相关性状、尤其是增加的产量和/或增加的早期活力,的转基因植物的方法,所述方法包括:
(i)向植物或植物细胞中引入和表达编码C3H样多肽、或SPT多肽、或IDI2多肽、或eIF4F样蛋白质复合物亚基或GR-RBP多肽的核酸;和
(ii)在促进植物生长和发育的条件下培养所述植物细胞。
(i)中的核酸可以为任何能够编码如本文定义的C3H样多肽、或SPT多肽、或IDI2多肽、或eIF4F样蛋白质复合物亚基或GR-RBP多肽的核酸。
本发明还提供了产生相对于对照植物具有增强的产量相关性状的转基因植物的方法,包括在植物中引入和表达至少一种如前文所定义的eIF4F样蛋白质复合物亚基多肽编码核酸。
更具体地,本发明提供了产生具有增强的产量相关性状,特别是增加的(种子)产量的转基因植物的方法,所述方法包括:
(i)向植物或植物细胞中引入和表达至少一种eIF4F样蛋白质复合物亚基多肽编码核酸;和
(ii)在促进植物生长和发育的条件下培养所述植物细胞。
(i)中的核酸可以为任何能够编码如本文定义的eIF4F样蛋白质复合物亚基多肽的核酸。
可以将核酸直接引入植物细胞或植物本身(包括引入植物的组织、器官或任何其它部分)。根据本发明优选的方面,优选通过转化将核酸引入植物。术语“转化”在本文“定义”部分有更详细的说明。
遗传修饰的植物细胞可以通过技术人员熟悉的所有方法再生。合适的方法可见于上述S.D.Kung和R.Wu、Potrykus或者
Figure BDA0000125779720000991
和Willmitzer的出版物。
通常在转化以后,选出存在一个或多个标记的植物细胞或细胞群,所述标记由与目的基因共转移的植物可表达基因编码,接着使转化的材料再生成整个植物。为选择转化的植物,通常将在转化中获得的植物材料置于选择性条件下,从而可将转化的植物与未转化的植物区分开来。例如,可以种植以上述方式获得的种子,并在最初的生长期之后,通过喷雾对其进行合适的选择。另一可能性方案是在使用合适的选择剂的琼脂板上生长种子(酌情在灭菌后),从而仅转化的种子能够长成植物。可选地,针对转化的植物筛选可选择标记例如上文所述标记的存在。
DNA转移和再生之后,还可例如用Southern分析(DNA印迹),评价推定转化的植物,评价目的基因的存在、拷贝数和/或基因组构造。可选的或额外地,可用Northern和/或Western分析(蛋白质印迹)监测新引入的DNA的表达水平,这两种技术都是本领域普通技术人员所公知的。
产生的转化植物可以通过多种方式繁殖,如通过克隆繁殖或经典的育种技术。例如,第一代(或T1)转化的植物可自交,选择纯合的第二代(或T2)转化体,而T2植物可进一步通过经典育种技术繁殖。产生的转化生物体可以呈多种形式。例如,它们可以是转化细胞和非转化细胞的嵌合体;克隆的转化体(例如所有细胞已转化而含有表达盒);转化的和非转化的组织的嫁接体(例如在植物中,转化的砧木嫁接到非转化的接穗上)。
本发明显然延及由本文所述任何方法产生的任何植物细胞或植物,以及其所有的植物部分及繁殖体。本发明还延及由任何上述方法产生的原代转化或转染的细胞、组织、器官或整个植物的后代,所述后代的唯一要求是与根据本发明方法所产生的亲本呈现相同的基因型和/或表型特征。
本发明也包括包含编码上文所定义的C3H样多肽、或SPT多肽、或IDI2多肽、或eIF4F样蛋白质复合物亚基多肽或GR-RBP多肽的分离核酸的宿主细胞。根据本发明优选的宿主细胞是植物细胞。对于在本发明方法中使用的核酸或载体、表达盒或构建体或载体,宿主植物原则上有利地为能够合成用于本发明方法的多肽的所有植物
本发明方法有利地适用于任何植物。尤其可用于本发明方法的植物包括属于植物界超家族的所有植物,尤其是单子叶植物和双子叶植物,包括饲料或牧草豆科植物、观赏植物、粮食作物、乔木或灌木。根据本发明优选的实施方案,植物为作物植物。作物植物的实例包括大豆、向日葵、芸苔、苜蓿、油菜籽、亚麻籽(linseed)、棉花、番茄、马铃薯和烟草。还优选植物是单子叶植物。单子叶植物的实例包括甘蔗。更优选植物是谷类。谷类的实例包括稻、玉米、小麦、大麦、粟、黑麦、黑小麦、高粱、二粒小麦、斯佩耳特小麦(spelt)、裸麦(secale)、单粒小麦、埃塞俄比亚画眉草、买罗高粱(milo)和燕麦。
本发明也延及植物的可收获部分,例如但不限于:种子、叶、果实、花、茎、根、根茎、块茎和球茎,所述可收获部分含有编码C3H样多肽、或SPT多肽、或IDI2多肽、或eIF4F样蛋白质复合物亚基多肽或GR-RBP多肽的重组核酸。本发明还涉及由这样的植物的可收获部分衍生的、优选直接衍生的产品,如干丸(pellets)或粉、油类、脂肪和脂肪酸、淀粉或蛋白质。
根据本发明的优选方面,表达的调节是表达的增加。增加核酸或基因或基因产物表达的方法在本领域有充分的文献记载,并且实例在“定义”部分提供。
如上文所述,调节编码C3H样多肽、或SPT多肽、或IDI2多肽、或eIF4F样蛋白质复合物亚基多肽或GR-RBP多肽的核酸表达的一个优选方法是,在植物中引入和表达编码C3H样多肽、或SPT多肽、或IDI2多肽、或eIF4F样蛋白质复合物亚基多肽或GR-RBP多肽的核酸;然而,实施所述方法的效果,即增强产量相关性状,也可以利用其他众所周知的技术实现,包括但不限于:T-DNA激活标记、TILLING、同源重组。这些技术的说明在“定义”部分提供。
本发明还包括在增强植物的任一上述产量相关性状中编码如本文所述的C3H样多肽的核酸的用途,以及这些C3H样多肽、或SPT多肽、或IDI2多肽、或eIF4F样蛋白质复合物亚基多肽或GR-RBP多肽的用途。
可以在育种程序中使用编码本文所述的C3H样多肽、或SPT多肽、或IDI2多肽、或eIF4F样蛋白质复合物亚基多肽或GR-RBP多肽的核酸、或所述C3H样多肽、或SPT多肽、或IDI2多肽、或eIF4F样蛋白质复合物亚基多肽或GR-RBP多肽本身,其中鉴定可以与编码C3H样多肽、或SPT多肽、或IDI2多肽、或eIF4F样蛋白质复合物亚基多肽或GR-RBP多肽的基因遗传连锁的DNA标记。可以使用所述核酸/基因或所述C3H样多肽、或SPT多肽、或IDI2多肽、或eIF4F样蛋白质复合物亚基多肽或GR-RBP多肽本身来定义分子标记。接着可以在育种程序中使用此DNA或蛋白质标记,以在本发明方法中选择具有如上文所定义的增强的产量相关性状的植物。
编码C3H样多肽的核酸/基因的等位基因变体也可以用于标记辅助的育种程序。这类育种程序有时需要使用例如EMS诱变,通过植物诱变处理引入等位基因变异;可选的,此类程序可以起始于一系列无意产生的所谓“天然”起源的等位基因变体。然后通过例如PCR进行等位基因变体的鉴定。随后是选择步骤,用以选择所讨论序列的较好等位基因变体,该变体提供增强的产量。一般通过监测含有所讨论序列的不同等位基因变体的植物的生长行为来进行选择。可以在温室或田地中监测生长行为。更多任选的步骤包括使经鉴定含有较好等位基因变体的植物与另一植物杂交。例如,可使用这种方法产生感兴趣表型特征的组合。
编码C3H样多肽、或SPT多肽、或IDI2多肽、或eIF4F样蛋白质复合物亚基多肽或GR-RBP多肽的核酸还可以用作探针,对包含其的基因进行遗传和物理作图,以及用作与这些基因连锁的性状的标记。这样的信息可以在植物育种中使用,以培育具有所期望表型的株系。编码C3H样多肽、或SPT多肽、或IDI2多肽、或eIF4F样蛋白质复合物亚基多肽或GR-RBP多肽的核酸的这类应用仅需要长度至少15个核苷酸的核酸序列。编码C3H样多肽、或SPT多肽、或IDI2多肽、或eIF4F样蛋白质复合物亚基多肽或GR-RBP多肽的核酸可以用作限制性片段长度多态性(RFLP)标记。可以用C3H样多肽、或SPT多肽、或IDI2多肽、或eIF4F样蛋白质复合物亚基多肽或GR-RBP多肽编码核酸探测限制酶切消化的植物基因组DNA的Southern印迹(Sambrook J,Fritsch EF和Maniatis T(1989)《分子克隆:实验室手册》)。随后使用计算机程序如MapMaker(Lander等(1987)Genomics 1:174-181)对产生的带型进行遗传分析,以构建遗传图谱。另外,所述核酸可用于探测含有一组如下个体的限制性内切酶处理的基因组DNA的Southern印迹,所述该组个体为规定的遗传杂交的亲本和子代。记录DNA多态性的分离,并用于计算编码C3H样多肽、或SPT多肽、或IDI2多肽、或eIF4F样蛋白质复合物亚基多肽或GR-RBP多肽的核酸在先前用此群体所获得的遗传图谱中的位置(Botstein等(1980)Am.J.Hum.Genet.32:314-331)。
有关在遗传作图中使用的植物基因衍生探针的产生和使用,描述于Bernatzky和Tanksley(1986)Plant Mol.Biol.Reporter 4:37-41中。众多出版物中描述过用上述方法或其变通形式对特定cDNA克隆进行的遗传作图。例如,可以使用F2杂交群体、回交群体、随机交配群体、近等基因系和其它个体组作图。这类方法是本领域技术人员公知的。
核酸探针也可以用来进行物理作图(即在物理图谱上安置序列;参见Hoheisel等In:Non-mammalian Genomic Analysis:A Practical Guide,Academic press 1996,第319-346页,及其中引用的参考文献)。
在另一个实施方案中,核酸探针可用于直接荧光原位杂交(FISH)作图(Trask(1991)Trends Genet.7:149-154)。尽管目前FISH作图的方法倾向使用大的克隆(几个kb到几百个kb;参见Laan等(1995)Genome Res.5:13-20),但是灵敏性的提高可以允许在FISH作图中应用较短的探针。
用于遗传和物理作图的多种基于核酸扩增的方法可以使用所述核酸进行。实例包括等位基因特异性扩增(Kazazian(1989)J.Lab.Clin.Med11:95-96)、PCR扩增片段的多态性(CAPS;Sheffield等(1993)Genomics16:325-332)、等位基因特异性连接(Landegren等(1988)Science 241:1077-1080)、核苷酸延伸反应(Sokolov(1990)Nucleic Acid Res.18:3671)、放射杂交作图(Walter等(1997)Nat.Genet.7:22-28)和Happy作图(Dear和Cook(1989)Nucleic Acid Res.17:6795-6807)。为实施这些方法,使用核酸的序列设计和产生用于扩增反应或引物延伸反应的引物对。这类引物的设计是本领域技术人员公知的。在采用基于PCR的遗传作图的方法中,可能需要鉴定作图杂交的亲本之间在相应于本发明核酸序列的区域中的DNA序列差异。然而,这对作图方法通常不是必要的。
本发明方法导致具有如前文所述增强的产量相关性状的植物。这些性状还可以组合其它经济上有利的性状,例如其它产量增强性状、对其他非生物和生物胁迫的耐受性、改变各种构造特征和/或生物化学和/或生理学特征的性状。
项目
1.C3H样多肽
1.用于相对于对照植物增强植物的产量相关性状的方法,包括调节编码C3H样多肽的核酸在植物中的表达,其中所述C3H样多肽包含结构域4以及结构域1,2,3和5中的任一个或多个:
结构域1:C-X2-C-X12-23-C-X2-C-X2-G-F
其中X为任何氨基酸,加下划线的残基是保守的
结构域2:Y-X7-12-L-X3-P-X10-G
其中X为任何氨基酸,加下划线的残基是保守的
结构域3:S-K-X6-P
其中X为任何氨基酸,加下划线的残基是保守的
结构域4:RING-C3H2C3类
结构域5:DUF1117
2.根据项1的方法,其中结构域1为:CYSCTRFINLSDHTL----------IVCPHCDNGF,或为包含加下划线的保守残基、并按照递增的优选次序与结构域1中没有加下划线的残基具有至少60%,65%,70%,75%,80%,85%,90%,95%或更高的序列同一性的结构域,其中“-”为空位或任何残基。
3.根据项1或2的方法,其中结构域2为:YDDGDG-----SGLRPLPPTVSEFLLGSG,或为包含加下划线的保守残基、并按照递增的优选次序与结构域2中没有加下划线的残基具有至少60%,65%,70%,75%,80%,85%,90%,95%或更高的序列同一性的结构域,其中“-”为空位或任何残基。
4.根据项1至3的任一项的方法,其中结构域3为:SKAAIESMP,或为包含加下划线的保守残基、并按照递增的优选次序与结构域3中没有加下划线的残基具有至少60%,65%,70%,75%,80%,85%,90%,95%或更高的序列同一性的结构域。
5.根据项1至4的任一项的方法,其中结构域4为:CAVCKEEFELHAEARELPCKHLYHSDCILPWLTVRNSCPVCR,或为包含加下划线的保守残基、并按照递增的优选次序与结构域4中没有加下划线的残基具有至少60%,65%,70%,75%,80%,85%,90%,95%或更高的序列同一性的结构域。
6.根据项1至5的任一项的方法,其中结构域5为:GLTIWRLPGGGFAVGRFSGGRSA-GESHFPVVYTEMDGGLN,或为按照递增的优选次序与结构域5具有至少60%,65%,70%,75%,80%,85%,90%,95%或更高的序列同一性的结构域,其中“-”为空位或任何残基。
7.根据项1至6的任一项的方法,其中所述调节的表达通过向植物中引入和表达编码C3H样多肽的核酸来实现。
8.根据项1至7的任一项的方法,其中所述编码C3H样多肽的核酸编码表A1所列的任一蛋白质,或是这样的核酸的部分,或是能够与这样的核酸杂交的核酸。
9.根据项1至8的任一项的方法,其中所述核酸序列编码表A1中所给出的任何蛋白质的直向同源物或旁系同源物。
10.根据任何前述项的方法,其中所述增强的产量相关性状包括相对于对照植物增加的产量,优选增加的生物量和/或增加的种子产量。
11.根据项1至10的任一项的方法,其中在干旱胁迫条件下获得所述增强的产量相关性状。
12.根据项7至11的任一项的方法,其中所述核酸有效地连接至组成型启动子,优选连接至GOS2启动子,最优选连接至来自稻的GOS2启动子。
13.根据项1至12的任一项的方法,其中所述编码C3H样多肽的核酸是植物来源的,优选苜蓿科(Medicago),更优选蒺藜苜蓿(Medicagotruncatula)。
14.可通过根据项1至13的任一项的方法获得的植物或其部分,包括种子,其中所述植物或其部分包含编码C3H样多肽的重组核酸。
15.构建体,其包含:
(i)编码如项1至6的任一项中定义的C3H样多肽的核酸;
(ii)能够驱动(i)的核酸序列表达的一个或多个控制序列;和任选地
(iii)转录终止序列。
16.根据项15的构建体,其中所述控制序列之一是组成型启动子,优选GOS2启动子,最优选来自稻的GOS2启动子。
17.根据项15或16的构建体在用于制备相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量的植物的方法中的用途。
18.利用根据项15或16的构建体转化的植物、植物部分或植物细胞。
19.用于产生相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量的转基因植物的方法,其包括:
(i)向植物中引入和表达编码如项1至6的任一项中定义的C3H样多肽的核酸;和
(ii)在促进植物生长和发育的条件下培养所述植物细胞。
20.相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量的转基因植物,或源于所述转基因植物的转基因植物细胞,所述增加的产量因编码如项1至6的任一项中定义的C3H样多肽的核酸的被调节的表达而产生。
21.根据项14、18或20的转基因植物或源于其的转基因植物细胞,其中所述植物是作物植物或单子叶植物或谷类植物,例如稻、玉米、小麦、大麦、粟、黑麦(rye)、黑小麦、高粱、二粒小麦、斯佩耳特小麦、裸麦(secale)、单粒小麦、埃塞俄比亚画眉草、买罗高梁和燕麦。
22.根据项21的植物的可收获部分,其中所述可收获部分优选是枝条生物量和/或种子。
23.从根据项21的植物和/或从根据项22的植物的可收获部分产生的产品。
24.编码C3H样多肽的核酸在相对于对照植物增加植物的产量,特别是增加种子产量和/或枝条生物量中的用途。
2.SPATULA样(SPT)多肽
1.用于相对于对照植物增强植物的产量相关性状的方法,包括调节编码SPT样多肽的核酸在植物中的表达,所述SPT样多肽包含以下每一个基序,优选从N-末端到C-末端:
基序I:包含EEISTFLHQLLH的两亲螺旋,或按照递增的优选次序与基序I具有至少60%,65%,70%,75%,80%,85%,90%,95%或更高的序列同一性的基序;以及
基序II:包含DLGDFSCDSEK的酸性结构域,或按照递增的优选次序与基序II具有至少60%,65%,70%,75%,80%,85%,90%,95%或更高的序列同一性的基序;以及
基序III:包含AAEVHNLSEKRRRSRINEKMKALQNLIPNSNKTDKASMLDEAIEYLKQL的bHLH结构域,或按照递增的优选次序与基序III具有至少60%,65%,70%,75%,80%,85%,90%,95%或更高的序列同一性的基序。
2.根据项1的方法,其中SPT样多肽还包含一个或多个富丝氨酸区域。
3.根据项1或2的方法,其中bHLH结构域还包含一个或多个核定位信号(NLS)。
4.根据项1至3的任一项的方法,其中SPT样多肽包含β链,该β链于最靠近C-末端区域处与bHLH结构域相邻,其中β链优选包含QLQVQMLTM。
5.根据项1至4的任一项的方法,其中所述调节的表达通过向植物中引入和表达编码SPT样多肽的核酸来实现。
6.根据项1至5的任一项的方法,其中所述编码SPT样多肽的核酸编码表A2所列的任一蛋白质,或是这样的核酸的部分,或是能够与这样的核酸杂交的核酸。
7.根据项1至6的任一项的方法,其中所述核酸序列编码表A2中所给出的任何蛋白质的直向同源物或旁系同源物。
8.根据任何前述项的方法,其中所述增强的产量相关性状包括相对于对照植物增加的产量,优选增加的生物量和/或增加的种子产量。
9.根据项1至8的任一项的方法,其中在非胁迫条件下获得所述增强的产量相关性状。
10.根据项1至9的任一项的方法,其中在干旱胁迫、盐胁迫或氮缺乏条件下获得所述增强的产量相关性状
11.根据项3至8的任一项的方法,其中所述核酸有效地连接至组成型启动子,优选连接至GOS2启动子,最优选连接至来自稻的GOS2启动子。
12.根据项1至11的任一项的方法,其中所述编码SPT样多肽的核酸是植物来源的,优选来自杨柳科(Salicaceae)、更优选来自杨属(Populus),最优选来自毛果杨(Populus trichocarpa)。
13.可通过根据项1至12的任一项的方法获得的植物或其部分,包括种子,其中所述植物或其部分包含编码如项1至4的任一项中定义的SPT样多肽的重组核酸。
14.构建体,其包含:
(i)编码如项1至4的任一项中定义的SPT样多肽的核酸;
(ii)能够驱动(i)的核酸序列表达的一个或多个控制序列;和任选地
(iii)转录终止序列。
15.根据项14的构建体,其中所述控制序列之一是组成型启动子,优选GOS2启动子,最优选来自稻的GOS2启动子。
16.根据项14或15的构建体在用于制备相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量的植物的方法中的用途。
17.利用根据项14或15的构建体转化的植物、植物部分或植物细胞。
18.用于产生相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量的转基因植物的方法,其包括:
(i)向植物中引入和表达编码如项1至4的任一项中定义的SPT样多肽的核酸;和
(ii)在促进植物生长和发育的条件下培养所述植物细胞。
19.相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量的转基因植物,或源于所述转基因植物的转基因植物细胞,所述增加的产量因编码如项1至4的任一项中定义的SPT样多肽的核酸的被调节的表达而产生。
20.根据项13、17或19的转基因植物或源于其的转基因植物细胞,其中所述植物是作物植物或单子叶植物或谷类植物,例如稻、玉米、小麦、大麦、粟、黑麦(rye)、黑小麦、高粱、二粒小麦、斯佩耳特小麦、裸麦(secale)、单粒小麦、埃塞俄比亚画眉草、买罗高梁和燕麦。
21.根据项20的植物的可收获部分,其中所述可收获部分优选是枝条生物量和/或种子。
22.从根据项20的植物和/或从根据项21的植物的可收获部分产生的产品。
23.编码如项1至4的任一项中定义的SPT样多肽的核酸在相对于对照植物增加植物的产量,特别是增加种子产量和/或枝条生物量中的用途。
3.IDI2(缺铁诱导2)多肽
1.用于相对于对照植物增强植物的产量相关性状的方法,包括调节编码IDI2多肽的核酸在植物中的表达,其中所述IDI2多肽包含IF-2B结构域。
2.根据项1的方法,其中所述IDI2多肽包含SEQ ID NO:141至SEQ ID NO:146之任一所示的一个或多个基序。
3.根据项1或2的方法,其中所述调节的表达通过向植物中引入和表达编码IDI2多肽的核酸来实现。
4.根据项1至3的任一项的方法,其中所述编码IDI2多肽的核酸编码表A3所列的任一蛋白质,或是这样的核酸的部分,或是能够与这样的核酸杂交的核酸。
5.根据项1至4的任一项的方法,其中所述核酸序列编码表A3中所给出的任何蛋白质的直向同源物或旁系同源物。
6.根据任何前述项的方法,其中所述增强的产量相关性状包括相对于对照植物增加的产量,优选增加的种子产量。
7.根据项1至6的任一项的方法,其中在氮缺乏条件下获得所述增强的产量相关性状。
8.根据项3至7的任一项的方法,其中所述核酸有效地连接至组成型启动子,优选连接至GOS2启动子,最优选连接至来自稻的GOS2启动子。
9.根据项1至8的任一项的方法,其中所述编码IDI2多肽的核酸是植物来源的,优选来自单子叶植物,更优选来自禾本科(Poaceae),更优选来自甘蔗属(Saccharum),最优选来自甘蔗(Saccharumofficinarum)。
10.可通过根据项1至9的任一项的方法获得的植物或其部分,包括种子,其中所述植物或其部分包含编码IDI2多肽的重组核酸。
11.构建体,其包含:
(i)编码如项1至2的任一项中定义的IDI2多肽的核酸;
(ii)能够驱动(i)的核酸序列表达的一个或多个控制序列;和任选地
(iii)转录终止序列。
12.根据项11的构建体,其中所述控制序列之一是组成型启动子,优选GOS2启动子,最优选来自稻的GOS2启动子。
13.根据项11或12的构建体在用于制备相对于对照植物具有增加的产量,特别是增加的种子产量的植物的方法中的用途。
14.利用根据项11或12的构建体转化的植物、植物部分或植物细胞。
15.用于产生相对于对照植物具有增加的产量,特别是增加的种子产量的转基因植物的方法,其包括:
(i)向植物中引入和表达编码如项1至2的任一项中定义的IDI2多肽的核酸;和
(ii)在促进植物生长和发育的条件下培养所述植物细胞。
16.相对于对照植物具有增加的产量,特别是增加的种子产量的转基因植物,或源于所述转基因植物的转基因植物细胞,所述增加的产量因编码如项1或2的任一项中定义的IDI2多肽的核酸的被调节的表达而产生。
17.根据项10、14或16的转基因植物或源于其的转基因植物细胞,其中所述植物是作物植物或单子叶植物或谷类植物,例如稻、玉米、小麦、大麦、粟、黑麦(rye)、黑小麦、高粱、二粒小麦、斯佩耳特小麦、裸麦(secale)、单粒小麦、埃塞俄比亚画眉草、买罗高梁和燕麦。
18.根据项17的植物的可收获部分,其中所述可收获部分优选是种子。
19.从根据项17的植物和/或从根据项18的植物的可收获部分产生的产品。
20.编码IDI2多肽的核酸在相对于对照植物增加植物的产量,特别是增加种子产量中的用途。
21.分离的核酸分子,其选自:
(i)SEQ ID NO:139,157,164,169,171,186之任一所示的核酸;
(ii)SEQ ID NO:139,157,164,169,171,186之任一所示的核酸的互补序列;
(iii)编码IDI2多肽的核酸,所述多肽按照递增的优选次序与SEQID NO:140,202,209,214,216,231之任一所示的氨基酸序列具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的序列同一性,并包含基序1至6中的一个或多个。
22.分离的多肽,其选自:
(i)SEQ ID NO:140,202,209,214,216,231之任一所示的氨基酸序列;
(ii)按照递增的优选次序与SEQ ID NO:140,202,209,214,216,231之任一所示的氨基酸序列具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的序列同一性,并包含基序1至6中的一个或多个的氨基酸序列。
(iii)上文(i)或(ii)所给出的任何氨基酸序列的衍生物。
4.eIF4F样蛋白质复合物
1.用于相对于对照植物增强植物的产量相关性状的方法,包括通过调节eIF4F样蛋白质复合物亚基多肽和/或其同种型的表达,和/或通过调节eIF4F样蛋白质复合物的水平,来调节eIF4F样蛋白质复合物的活性,其中所述eIF4F样蛋白质复合物包含亚基eIF4G,eIF4A和eIF4E或其同种型,所述亚基分别包含以下具有Pfam登录号的CC结构域:
(i)对于eIF4G多肽:MA3(PFam登录号:PF02847)和MIF4G(PFam登录号:PF02854);
(ii)对于eIF4A多肽:DEAD(PFam登录号:PF00270)和解旋酶_C(Helicase_C)(PFam登录号:PF00271);
(iii)对于eIF4E多肽:IF4E(PFam登录号:PF01652)。
2.根据项1的方法,其中所述eIF4G亚基多肽包含CC结构域,该CC结构域
(i)如SEQ ID NO:240所示,和/或
(ii)优选地与SEQ ID NO:241所示的eIF4G多肽具有至少50%,51%,52%,53%,54%,55%,56%,57%,58%,59%,60%,61%,62%,63%,64%,65%,66%,67%,68%,69%,70%,71%,72%,73%,74%,75%,76%,77%,78%,79%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%或99%的序列同一性。
3.根据项1的方法,其中所述eIF4A亚基多肽包含CC结构域,该CC结构域
(i)如SEQ ID NO:300所示,和/或
(ii)优选地与SEQ ID NO:301所示的eIF4G多肽具有至少50%,51%,52%,53%,54%,55%,56%,57%,58%,59%,60%,61%,62%,63%,64%,65%,66%,67%,68%,69%,70%,71%,72%,73%,74%,75%,76%,77%,78%,79%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%或99%的序列同一性。
4.根据项1的方法,其中所述eIF4E亚基多肽包含CC结构域,该CC结构域
(i)如SEQ ID NO:560所示,和/或
(ii)优选地与SEQ ID NO:561所示的eIF4G多肽具有至少50%,51%,52%,53%,54%,55%,56%,57%,58%,59%,60%,61%,62%,63%,64%,65%,66%,67%,68%,69%,70%,71%,72%,73%,74%,75%,76%,77%,78%,79%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%或99%的序列同一性。
5.根据项1或2的方法,其中所述eIF4G亚基多肽包含以下基序:
基序7:KAV[LF]EPTFCPMYA[QL]LCSDLNEKLP[PS]FPS[ED]EPGGKEITFKRVLLN[NI]C QEAF、或按照递增的优选次序与基序7具有至少50%,51%,52%,53%,54%,55%,56%,57%,58%,59%,60%,61%,62%,63%,64%,65%,66%,67%,68%,69%,70%,71%,72%,73%,74%,75%,76%,77%,78%,79%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%或99%或更高的序列同一性的基序;
基序8:CP[AE]EENVEAIC[QH]FFNTIGKQLDE[SN]PKSRRIND[MVT]YF[SIN][RQ]LKEL[TS][TS]NPQLAPR、或按照递增的优选次序与基序8具有至少50%,51%,52%,53%,54%,55%,56%,57%,58%,59%,60%,61%,62%,63%,64%,65%,66%,67%,68%,69%,70%,71%,72%,73%,74%,75%,76%,77%,78%,79%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%或99%或更高的序列同一性的基序;
基序9:T[AG]P[DE]QE[ML]ERRDKERLVKLRTLGNIRLIGELLKQKMVPEKIVHHIVQEL LG、或按照递增的优选次序与基序9具有至少50%,51%,52%,53%,54%,55%,56%,57%,58%,59%,60%,61%,62%,63%,64%,65%,66%,67%,68%,69%,70%,71%,72%,73%,74%,75%,76%,77%,78%,79%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%或99%或更高的序列同一性的基序;
基序10:TPQNF[ED][KR]LFEQVKAVNIDN[AV]VTL[TN]GVISQIF[DE]KALMEPTFCEMY ANFCFH或按照速增的优选次序与基序10具有至少50%,51%,52%,53%,54%,55%,56%,57%,58%,59%,60%,61%,62%,63%,64%,65%,66%,67%,68%,69%,70%,71%,72%,73%,74%,75%,76%,77%,78%,79%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%或99%或更高的序列同一性的基序;
基序11:IGELYKK[RK]MLTERIMHECIKKLLGQYQ[DN]PDEE[DN][IV]E[AS]LCKLMSTIG EMIDH、或按照递增的优选次序与基序11具有至少50%,51%,52%,53%,54%,55%,56%,57%,58%,59%,60%,61%,62%,63%,64%,65%,66%,67%,68%,69%,70%,71%,72%,73%,74%,75%,76%,77%,78%,79%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%或99%或更高的序列同一性的基序;
基序12:LSNN[MQ][KN]LSSRVRFMLKD[ASV]IDLRKNKWQQRRKVEGPKKIEEVHRDA AQERQ、或按照递增的优选次序与基序12具有至少50%,51%,52%,53%,54%,55%,56%,57%,58%,59%,60%,61%,62%,63%,64%,65%,66%,67%,68%,69%,70%,71%,72%,73%,74%,75%,76%,77%,78%,79%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%或99%或更高的序列同一性的基序。
6.根据项5的方法,其中所述eIF4G亚基多肽优选为eIF4isoG多肽并包含以下基序:
基序7:KAV[LF]EPTFCPMYA[QL]LCSDLNEKLP[PS]FPS[ED]EPGGKEITFKRVLLN[NI]C QEAF、或按照递增的优选次序与基序7具有至少50%,51%,52%,53%,54%,55%,56%,57%,58%,59%,60%,61%,62%,63%,64%,65%,66%,67%,68%,69%,70%,71%,72%,73%,74%,75%,76%,77%,78%,79%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%或99%或更高的序列同一性的基序;
基序8:CP[AE]EENVEAIC[QH]FFNTIGKQLDE[SN]PKSRRIND[MVT]YF[SIN][RQ]LKEL[TS][TS]NPQLAPR、或按照递增的优选次序与基序8具有至少50%,51%,52%,53%,54%,55%,56%,57%,58%,59%,60%,61%,62%,63%,64%,65%,66%,67%,68%,69%,70%,71%,72%,73%,74%,75%,76%,77%,78%,79%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%或99%或更高的序列同一性的基序。
基序9:T[AG]P[DE]QE[ML]ERRDKERLVKLRTLGNIRLIGELLKQKMVPEKIVHHIVQEL LG、或按照递增的优选次序与基序9具有至少50%,51%,52%,53%,54%,55%,56%,57%,58%,59%,60%,61%,62%,63%,64%,65%,66%,67%,68%,69%,70%,71%,72%,73%,74%,75%,76%,77%,78%,79%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%或99%或更高的序列同一性的基序。
7.根据项1或3的方法,其中所述eIF4A亚基多肽包含以下基序:
基序13:RDELTLEGIKQF[YF]V[NA]V[ED][KR]EEWK[LF][DE]TLCDLY[ED]TL[AT]ITQ[SA]VIF、或按照递增的优选次序与基序13具有至少50%,51%,52%,53%,54%,55%,56%,57%,58%,59%,60%,61%,62%,63%,64%,65%,66%,67%,68%,69%,70%,71%,72%,73%,74%,75%,76%,77%,78%,79%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%或99%或更高的序列同一性的基序;
基序14:SLVINYDLP[TN][QN][PR]E[NL]Y[LI]HRIGRSGRFGRKGVAINF、或按照递增的优选次序与基序14具有至少50%,51%,52%,53%,54%,55%,56%,57%,58%,59%,60%,61%,62%,63%,64%,65%,66%,67%,68%,69%,70%,71%,72%,73%,74%,75%,76%,77%,78%,79%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%或99%或更高的序列同一性的基序;
基序15:MG[LI][QK]E[ND]LLRGIYAYGFEKPSAIQQR[GA][IV]VP[FI][CI]KG[LR]DVI[QA]QAQSGTGKT[AS][TM][FI]、或按照递增的优选次序与基序15具有至少50%,51%,52%,53%,54%,55%,56%,57%,58%,59%,60%,61%,62%,63%,64%,65%,66%,67%,68%,69%,70%,71%,72%,73%,74%,75%,76%,77%,78%,79%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%或99%或更高的序列同一性的基序。
8.根据项1或4的方法,其中所述eIF4E亚基多肽包含以下基序:
基序16:YTFSTVE[ED]FW[SG]LYNNIH[HR]PSKLAVGADF[HY]CFK[NH]KIEPKWEDP[VI]CANGGKW、或按照递增的优选次序与基序16具有至少50%,51%,52%,53%,54%,55%,56%,57%,58%,59%,60%,61%,62%,63%,64%,65%,66%,67%,68%,69%,70%,71%,72%,73%,74%,75%,76%,77%,78%,79%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%或99%或更高的序列同一性的基序;
基序17:T[SC]WLYTLLA[ML]IGEQFD[HY]GD[ED]ICGAVV[NS]VR、或按照递增的优选次序与基序17具有至少50%,51%,52%,53%,54%,55%,56%,57%,58%,59%,60%,61%,62%,63%,64%,65%,66%,67%,68%,69%,70%,71%,72%,73%,74%,75%,76%,77%,78%,79%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%或99%或更高的序列同一性的基序;
基序18:E[KR]I[AS][LI]WTKNA[AS]NE[AST]AQ[VL]SIGKQWKEFLDYN[DE][TS]IGFIFH[ED]DA、或按照递增的优选次序与基序18具有至少50%,51%,52%,53%,54%,55%,56%,57%,58%,59%,60%,61%,62%,63%,64%,65%,66%,67%,68%,69%,70%,71%,72%,73%,74%,75%,76%,77%,78%,79%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%或99%或更高的序列同一性的基序;
基序19:WCLYDQ[IV]F[KR]PSKLP[GA]NADFHLFKAG[VI]EPKWEDPECANGGKW、或按照递增的优选次序与基序19具有至少50%,51%,52%,53%,54%,55%,56%,57%,58%,59%,60%,61%,62%,63%,64%,65%,66%,67%,68%,69%,70%,71%,72%,73%,74%,75%,76%,77%,78%,79%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%或99%或更高的序列同一性的基序;
基序20:L[ED]TMWLETLMALIGEQFD[ED][AS][DE][ED]ICGVVASVR、或按照递增的优选次序与基序20具有至少50%,51%,52%,53%,54%,55%,56%,57%,58%,59%,60%,61%,62%,63%,64%,65%,66%,67%,68%,69%,70%,71%,72%,73%,74%,75%,76%,77%,78%,79%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%或99%或更高的序列同一性的基序;
基序21:QDKL[SA]LWT[KR][TN]A[AS]NEA[AV]QM[SG]IG[RK]KWKE[IV]ID或按照递增的优选次序与基序21具有至少50%,51%,52%,53%,54%,55%,56%,57%,58%,59%,60%,61%,62%,63%,64%,65%,66%,67%,68%,69%,70%,71%,72%,73%,74%,75%,76%,77%,78%,79%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%或99%或更高的序列同一性的基序。
9.根据项1至8的任一项的方法,其中所述亚基eIF4E,eIF4G和eIF4A的至少一个的所述调节的表达通过引入和表达至少编码eIF4F亚基多肽之一的核酸,或至少这样的核酸的部分,或能够与这样的核酸杂交的核酸来实现。
10.根据项1,2,5或6的方法,其中所述核酸编码eIF4G亚基多肽和/或其同种型,或是这样的核酸的部分,或是能够与这样的核酸杂交的核酸,其中该eIF4F亚基多肽优选为eIF4isoG亚基。
11.根据项1,3或7的方法,其中所述核酸编码eIF4A亚基多肽和/或其同种型,或是这样的核酸的部分,或是能够与这样的核酸杂交的核酸,其中该eIF4F亚基优选为eIF4A亚基。
12.根据项1,4或8的方法,其中所述核酸编码eIF4E亚基多肽和/或其同种型,或是这样的核酸的部分,或是能够与这样的核酸杂交的核酸,其中该eIF4F亚基优选为eIF4isoE亚基。
13.根据项1至12之任一项的方法,其中所述编码eIF4F亚基多肽的核酸、或该核酸的部分、或能够与该核酸杂交的核酸被过量表达,其中优选编码eIF4G和/或eIF4A和/或它们的同种型的核酸,特别是编码eIF4isoG和/或eIF4A的核酸。
14.根据项1至13的任一项的方法,其中所述核酸序列编码表A4中所给出的任何多肽的直向同源物或旁系同源物。
15.根据项1至14的任一项的方法,其中所述增强的产量相关性状包括相对于对照植物增加的产量,优选增加的生物量和/或增加的种子产量。
16.根据项1至15的任一项的方法,其中在非胁迫条件下获得所述增强的产量相关性状。
17.根据项1至16的任一项的方法,其中在干旱胁迫、盐胁迫或氮缺乏条件下获得所述增强的产量相关性状
18.根据项3至17的任一项的方法,其中所述核酸有效地连接至组成型启动子,优选连接至GOS2启动子,最优选连接至来自稻的GOS2启动子。
19.根据项1至18的任一项的方法,其中所述编码至少一种eIF4F多肽亚基的核酸是植物来源的,优选来自双子叶植物,更优选来自十字花科,更优选来自拟南芥属(Arabidopsis),最优选来自拟南芥(Arabidopsisthaliana)。
20.可通过根据项1至19的任一项的方法获得的植物或其部分,包括种子,其中所述植物或其部分包含至少一个编码eIF4F多肽亚基的重组核酸。
21.构建体,其包含:
(i)编码如项1或2中定义的至少一个eIF4F多肽亚基的核酸;
(ii)能够驱动(i)的核酸序列表达的一个或多个控制序列;和任选地
(iii)转录终止序列。
22.根据项21的构建体,其中所述控制序列之一是组成型启动子,优选GOS2启动子,最优选来自稻的GOS2启动子。
23.根据项21或22的构建体在用于制备相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量的植物的方法中的用途。
24.利用根据项21或22的构建体转化的植物、植物部分或植物细胞。
25.用于产生相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量的转基因植物的方法,其包括:
(i)向植物中引入和表达编码如项1或2中定义的至少一个eIF4F多肽亚基的核酸;和
(ii)在促进植物生长和发育的条件下培养所述植物细胞。
26.相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量的转基因植物,或源于所述转基因植物的转基因植物细胞,所述增加的产量因编码如项1或2中定义的至少一个eIF4F多肽亚基的至少一个核酸的被调节的表达而产生。
27.根据项20、24或26的转基因植物或源于其的转基因植物细胞,其中所述植物是作物植物或单子叶植物或谷类植物,例如稻、玉米、小麦、大麦、粟、黑麦(rye)、黑小麦、高粱、二粒小麦、斯佩耳特小麦、裸麦(secale)、单粒小麦、埃塞俄比亚画眉草、买罗高梁和燕麦。
28.根据项27的植物的可收获部分,其中所述可收获部分优选是枝条生物量和/或种子。
29.从根据项27的植物和/或从根据项28的植物的可收获部分产生的产品。
30.编码至少一个eIF4F多肽亚基的核酸在相对于对照植物增加植物的产量,特别是增加种子产量和/或枝条生物量中的用途。
31.分离的核酸分子,其选自:
(i)SEQ ID NO:306所示的核酸;
(ii)SEQ ID NO:306所示的核酸的互补序列;
(iii)编码SEQ ID NO:307之任一所示多肽的核酸,优选地由于遗传密码的简并性结果,所述分离的核酸可以来源于SEQ ID NO:307所示的多肽序列并还优选地赋予相对于对照植物增强的产量相关性状;
(iv)按照递增的优选次序与表A4的核酸序列之任一具有至少30%,31%,32%,33%,34%,35%,36%,37%,38%,39%,40%,41%,42%,43%,44%,45%,46%,47%,48%,49%,50%,51%,52%,53%,54%,55%,56%,57%,58%,59%,60%,61%,62%,63%,64%,65%,66%,67%,68%,69%,70%,71%,72%,73%,74%,75%,76%,77%,78%,79%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%或99%的序列同一性的核酸,该核酸还优选地赋予相对于对照植物增强的产量相关性状。
(v)在严紧杂交条件下与(i)至(iv)的核酸分子杂交的核酸分子,其优选地赋予相对于对照植物增强的产量相关性状。
(vi)编码至少eIF4F亚基多肽的核酸,其中所述多肽按照递增的优选次序与SEQ ID NO:307所示的氨基酸序列以及表A4中其它氨基酸序列之任一具有至少50%,51%,52%,53%,54%,55%,56%,57%,58%,59%,60%,61%,62%,63%,64%,65%,66%,67%,68%,69%,70%,71%,72%,73%,74%,75%,76%,77%,78%,79%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%或99%的序列同一性并优选地赋予相对于对照植物增强的产量相关性状。
32.分离的多肽,其选自:
(i)SEQ ID NO:307所示的氨基酸序列;
(ii)按照递增的优选次序与SEQ ID NO:307所示的氨基酸序列以及表A4中其它氨基酸序列之任一具有至少50%,51%,52%,53%,54%,55%,56%,57%,58%,59%,60%,61%,62%,63%,64%,65%,66%,67%,68%,69%,70%,71%,72%,73%,74%,75%,76%,77%,78%,79%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%或99%的序列同一性的氨基酸序列,其优选地赋予相对于对照植物增强的产量相关性状。
(iii)上文(i)或(ii)所给出的任何氨基酸序列的衍生物。
5.GR-RBP(富甘氨酸-RNA结合蛋白)多肽
1.用于相对于对照植物增强植物的产量相关性状的方法,包括调节编码富甘氨酸RNA结合蛋白(GR-RBP多肽)的核酸在植物中的表达,其中所述GR-RBP多肽包含RNA识别基序1(Pfam登录号为PF00076,RRM_1)。
2.根据项1的方法,其中所述GR-RBP多肽包含SEQ ID NO:828至SEQ ID NO:837中给出的标签序列或基序之一个或多个。
3.根据项1或2的方法,其中所述调节的表达通过向植物中引入和表达编码GR-RBP多肽的核酸来实现。
4.根据项1至3的任一项的方法,其中所述编码GR-RBP多肽的核酸编码表A5所列的任一蛋白质,或是这样的核酸的部分,或是能够与这样的核酸杂交的核酸。
5.根据项1至4的任一项的方法,其中所述核酸序列编码表A5中所给出的任何蛋白质的直向同源物或旁系同源物。
6.根据任何前述项的方法,其中所述增强的产量相关性状包括相对于对照植物增加的早期活力和/或增加的产量,优选增加的生物量和/或增加的种子产量。
7.根据项1至6的任一项的方法,其中在干旱胁迫条件下获得所述增强的产量相关性状。
8.根据项1至6的任一项的方法,其中在非胁迫条件下获得所述增强的产量相关性状。
9.根据项3至8的任一项的方法,其中所述核酸有效地连接至组成型启动子,优选连接至GOS2启动子,最优选连接至来自稻的GOS2启动子。
10.根据项1至9的任一项的方法,其中所述编码GR-RBP多肽的核酸是植物来源的,优选来自单子叶植物,再优选来自禾本科(Poaceae),更优选来自稻属(Oryza),最优选核酸来自稻(Oryza sativa)。
11.可通过根据项1至10的任一项的方法获得的植物或其部分,包括种子,其中所述植物或其部分包含编码GR-RBP多肽的重组核酸。
12.构建体,其包含:
(i)编码如项1或2中定义的GR-RBP多肽的核酸;
(ii)能够驱动(i)的核酸序列表达的一个或多个控制序列;和任选地
(iii)转录终止序列。
13.根据项12的构建体,其中所述控制序列之一是组成型启动子,优选GOS2启动子,最优选来自稻的GOS2启动子。
14.根据项12或13的构建体在用于制备相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量的植物的方法中的用途。
15.利用根据项12或13的构建体转化的植物、植物部分或植物细胞。
16.用于产生相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量的转基因植物的方法,其包括:
(i)向植物中引入和表达编码如项1或2的任一项中定义的GR-RBP多肽的核酸;和
(ii)在促进植物生长和发育的条件下培养所述植物细胞。
17.相对于对照植物具有增加的产量,特别是增加的早期活力、增加的生物量和/或增加的种子产量的转基因植物,或源于所述转基因植物的转基因植物细胞,所述增加的产量因编码如项1或2的任一项中定义的GR-RBP多肽的核酸的被调节的表达而产生。
18.根据项11、15或17的转基因植物或源于其的转基因植物细胞,其中所述植物是作物植物或单子叶植物或谷类植物,例如稻、玉米、小麦、大麦、粟、黑麦(rye)、黑小麦、高粱、二粒小麦、斯佩耳特小麦、裸麦(secale)、单粒小麦、埃塞俄比亚画眉草、买罗高梁和燕麦。
19.根据项18的植物的可收获部分,其中所述可收获部分优选是枝条生物量和/或种子。
20.从根据项18的植物和/或从根据项19的植物的可收获部分产生的产品。
21.编码GR-RBP多肽的核酸在相对于对照植物增加植物的产量,特别是增加早期活力、种子产量和/或枝条生物量中的用途。
22.分离的核酸分子,其选自:
(i)SEQ ID NO:848,849,851,852,853,854,857,862,873,874,875,876,878,879,893,897,898,900,901,905,928,931,932,933,934,937之任一所示的核酸;
(ii)SEQ ID NO:848,849,851,852,853,854,857,862,873,874,875,876,878,879,893,897,898,900,901,905,928,931,932,933,934,937之任一所示的核酸的互补序列;
(iii)编码GR-RBP多肽的核酸,其中所述多肽按照递增的优选次序与SEQ ID NO:945,946,948,949,950,951,854,959,970,971,972,973,975,976,990,994,995,997,998,1002,1025,1028,1029,1030,1031,1034之任一所示的氨基酸序列具有至少50%,55%,60%,65%,70%,75%,80%,85%,90%,95%,96%,97%,98%,99%或更高的序列同一性,并包含标签序列3(SEQ ID NO:830)和标签序列4(SEQ ID NO:831)。
23.分离的多肽,其选自:
(i)SEQ ID NO:945,946,948,949,950,951,854,959,970,971,972,973,975,976,990,994,995,997,998,1002,1025,1028,1029,1030,1031,1034之任一所示的氨基酸序列;
(ii)按照递增的优选次序与SEQ ID NO:945,946,948,949,950,951,854,959,970,971,972,973,975,976,990,994,995,997,998,1002,1025,1028,1029,1030,1031,1034之任一所示的氨基酸序列具有至少50%,55%,60%,65%,70%,75%,80%,85%,90%,95%,96%,97%,98%,99%或更高的序列同一性、并包含标签序列3(SEQ ID NO:830)和标签序列4(SEQ ID NO:831)的氨基酸序列;
(iii)上文(i)或(ii)所给出的任何氨基酸序列的衍生物。
附图说明
现参考以下附图描述本发明,其中:
图1为C3H样多肽序列的多重比对。多肽序列的比对利用ClustalW 2.0渐近比对算法(Thompson等(1997)Nucleic Acids Res 25:4876-4882;Chenna等(2003).Nucleic Acids Res 31:3497-3500),使用标准设置(慢比对,相似性矩阵:Gonnet、空位开放罚分10,空位延伸罚分0.2))来进行。进行微小的手工编辑以进一步优化比对。
图2显示系统发生树。该系统发生树使用Vector NTI(Invitrogen)的AlignX程序中提供的邻接聚类算法构建。
图3显示双元载体,用于在稻GOS2启动子(pGOS2)控制之下增加C3H样编码核酸在稻(Oryza sativa)中的表达。
图4显示多重比对。多肽序列的比对利用Clustal W 2.0渐近比对算法(Thompson等(1997)Nucleic Acids Res 25:4876-4882;Chenna等(2003).Nucleic Acids Res 31:3497-3500),使用标准设置(慢比对,相似性矩阵:Gonnet、空位开放罚分10,空位延伸罚分0.2))来进行。进行微小的手工编辑以进一步优化比对。
图5显示SPT样多肽的系统发生树。该树使用Vector NTI(Invitrogen)的AlignX程序中提供的邻接聚类算法构建。
图6显示双元载体,用于在稻GOS2启动子(pGOS2)控制之下增加SPT样编码核酸在稻(Oryza sativa)中的表达。
图7显示SEQ ID NO:140的结构域结构,其中IF-2B(PF01008)结构域以斜体表示,保守的基序4至6以加下划线表示。
图8显示来自A和B组的IDI2多肽的多重比对。
图9显示IDI2多肽的系统发生树,SEQ ID NO:140对应A组中的Saccof_IDI2。采用MAFFT进行序列比对,以Dendroscope(Huson等(2007),BMC Bioinformatics 8(1):460)进行可视化。相应的SEQ ID Nos可以在表A3中找到。
图10显示双元载体,用于在稻GOS2启动子(pGOS2)控制之下增加IDI2编码核酸在稻(Oryza sativa)中的表达。
图11显示eIF4F多肽的组成,其主要亚基eIF4G,eIF4E和eIF4A。
图12显示所选择的eIF4G和isoG蛋白质的环状系统发生图。使用MUSCLE 3.7(Edgar(2004),Nucleic Acids Research 32(5):1792-97)比对蛋白质。使用QuickTree 1.1(Howe等.(2002),Bioinformatics 18(11):1546-7)计算邻接树。显示在100次自展重复后主分枝的支持率。使用Dendroscope 2.0.1(Huson等.(2007),BMC Bioinformatics 8(1):460)绘制环状系统发生图。稻(O.sativa)eIF4isoG以粗黑体表示。
图13显示所选择的eIF4E和isoE蛋白质的系统发生树,采用MAFFT(Katoh和Toh(2008)Briefings in Bioinformatics 9:286-298)进行比对。使用QuickTree(Howe等.(2002),Bioinformatics 18(11):1546-7)计算邻接树,100次自展重复。使用Dendroscope(Huson等.(2007),BMCBioinformatics 8(1):460)绘制环状系统发生图。显示主分枝的100次自展重复的置信水平。物种缩写见序列表。
图14显示所选择的eIF4A多肽的系统发生树,采用MAFFT(Katoh和Toh(2008)Briefings in Bioinformatics 9:286-298)进行比对。使用QuickTree(Howe等.(2002),Bioinformatics 18(11):1546-7)计算邻接树,100次自展重复。使用Dendroscope(Huson等.(2007),BMCBioinformatics 8(1):460)绘制环状系统发生图。显示主分枝的100次自展重复的置信水平。物种缩写见序列表。
图15显示双元载体,用于在稻GOS2启动子(pGOS2)控制之下增加eIF4isoG或eIF4A编码核酸在稻(Oryza sativa)中的表达。
图16显示SEQ ID NO:827的结构域结构,其中保守的RRM_1结构域(PF00076,以粗斜体表示)和富含甘氨酸区域以加粗表示。GGYGG和GGYG标签序列以加下划线表示。
图17显示采用VNTI构建的多种GR-RBP多肽的多重比对。以阴影表示保守氨基酸,并共有序列复制在比对的下面。
图18显示GR-RBP多肽的系统发生树,SEQ ID NO:827(加框的)是进化枝A的部分。采用MAFFT进行序列比对,以Dendroscope(Huson等(2007),BMC Bioinformatics 8(1):460)进行可视化。
图19显示双元载体,用于在稻GOS2启动子(pGOS2)控制之下增加GR-RBP编码核酸在稻(Oryza sativa)中的表达。
实施例
现参考以下实施例描述本发明,所述实施例仅意在举例说明。如下实施例并非旨在完全限定或以其他方式限制本发明的范围。
DNA操作:除非另外说明,重组DNA技术根据描述于(Sambrook(2001)《分子克隆:实验室手册》,第三版,冷泉港实验室出版,冷泉港,纽约)或者Ausubel等(1994),Current Protocols in Molecular Biology,Current Protocols第一卷和第二卷的标准方案进行。用于植物分子工作的标准材料和方法由R.D.D.Croy描述于Plant Molecular Biology Labfase(1993),由BIOS Scientific Publications Ltd(UK)和Blackwell ScientificPublications(UK)出版。
实施例1:鉴定与本发明方法所用核酸序列相关的序列
利用了数据库序列搜索工具,例如基本局部比对工具(BLAST)(Altschul等(1990)J.Mol.Biol.215:403-410;和Altschul等(1997)NucleicAcids Res.25:3389-3402),在美国国家生物技术信息中心(NCBI)的Entrez核苷酸数据库所保持的序列中,鉴定了与SEQ ID NO:1和SEQ ID NO:2相关的序列(全长cDNA、EST或基因组序列)。该程序通过将核酸或多肽序列与序列数据库进行比较,以及通过计算匹配的统计学显著性,用于寻找序列之间的局部相似的区域。例如,在TBLASTN算法中,利用了SEQ ID NO:1编码的多肽,其中使用默认设置,开启过滤器以忽略低复杂度序列。分析的输出视窗为两两比较,并根据概率分值(E值)排序,其中分值反映特定比对偶然发生的概率(E值越低,命中事件的显著性越高)。除了E值之外,还对比较进行同一性百分比记分。同一性百分比是指两比较核酸(或多肽)序列之间在特定长度上的相同核苷酸(或氨基酸)数。在一些情况下,可调整缺省参数来改变搜索的严格性。例如增加E值以显示不太严格的匹配。这样,可鉴定到短的几乎完全的匹配。
1.1.C3H样多肽
表A1提供了与SEQ ID NO:1和SEQ ID NO:2相关的核酸序列的列表
表A1:C3H样序列的实例
Figure BDA0000125779720001281
Figure BDA0000125779720001291
Figure BDA0000125779720001301
在一些情况下,相关序列已经由研究机构如基因组研究机构(Institute for Genomic Research,TIGR;始于TA)尝试性地进行了装配并向公众公开。可以通过关键词搜索,或是采用BLAST算法,运用目的核酸序列或多肽序列,利用真核基因直向同源物(Eukaryotic GeneOrthologs,EGO)数据库来鉴定这样的相关序列。在其他情况下,已经针对特定的生物创建了特定的核酸序列数据库,例如由联合基因组研究所(Joint Genome Institute)创建。此外,对私有数据库的使用也已允许鉴定新型核酸和多肽序列。
1.2.SPATULA样(SPT)多肽
表A2提供了与SEQ ID NO:96和SEQ ID NO:97相关的核酸序列的列表
表A2:SPT样序列的实例:
Figure BDA0000125779720001302
Figure BDA0000125779720001311
在一些情况下,相关序列已经由研究机构如基因组研究机构(Institute for Genomic Research,TIGR;始于TA)尝试性地进行了装配并向公众公开。可以通过关键词搜索,或是采用BLAST算法,运用目的核酸序列或多肽序列,利用真核基因直向同源物(Eukaryotic GeneOrthologs,EGO)数据库来鉴定这样的相关序列。在其他情况下,已经针对特定的生物创建了特定的核酸序列数据库,例如由联合基因组研究所(Joint Genome Institute)创建。
1.3.IDI2(缺铁诱导2)多肽
表A3提供了与可以用于本发明方法中的核酸序列相关的核酸序列的列表。
表A3:IDI2多肽的实例:
Figure BDA0000125779720001312
Figure BDA0000125779720001321
Figure BDA0000125779720001331
在一些情况下,相关序列已经由研究机构如基因组研究机构(Institute for Genomic Research,TIGR;始于TA)尝试性地进行了装配并向公众公开。可以通过关键词搜索,或是采用BLAST算法,运用目的核酸序列或多肽序列,利用真核基因直向同源物(Eukaryotic GeneOrthologs,EGO)数据库来鉴定这样的相关序列。在其他情况下,已经针对特定的生物创建了特定的核酸序列数据库,例如由联合基因组研究所(Joint Genome Institute)创建。此外,对私有数据库的使用也已允许鉴定新型核酸和多肽序列。
1.4.eIF4F样蛋白质复合物
表A4a,A4b和A4c提供了与可以用于本发明方法中的核酸序列相关的核酸序列的列表。表A4,如本文所指,表示表A4a,A4b和A4c的任何一个或多个。
表A4a:eIF4isoG样多肽的实例:
Figure BDA0000125779720001332
Figure BDA0000125779720001341
表A4b:eIF4A样多肽的实例:
Figure BDA0000125779720001351
Figure BDA0000125779720001371
表A4c:eIF4isoE样多肽的实例:
Figure BDA0000125779720001381
Figure BDA0000125779720001391
Figure BDA0000125779720001401
Figure BDA0000125779720001411
在一些情况下,相关序列已经由研究机构如基因组研究机构(Institute forGenomic Research,TIGR;始于TA)尝试性地进行了装配并向公众公开。可以通过关键词搜索,或是采用BLAST算法,运用目的核酸序列或多肽序列,利用真核基因直向同源物(Eukaryotic Gene Orthologs,EGO)数据库来鉴定这样的相关序列。在其他情况下,已经针对特定的生物创建了特定的核酸序列数据库,例如由联合基因组研究所(Joint Genome Institute)创建。此外,对私有数据库的使用也已允许鉴定新型核酸和多肽序列。
1.5.GR-RBP(富甘氨酸RNA结合蛋白)多肽
表A5提供了与可以用于本发明方法中的核酸序列相关的核酸序列的列表。
表A5:GR-RBP多肽的实例:
Figure BDA0000125779720001431
Figure BDA0000125779720001441
在一些情况下,相关序列已经由研究机构如基因组研究机构(Institute for Genomic Research,TIGR;始于TA)尝试性地进行了装配并向公众公开。可以通过关键词搜索,或是采用BLAST算法,运用目的核酸序列或多肽序列,利用真核基因直向同源物(Eukaryotic GeneOrthologs,EGO)数据库来鉴定这样的相关序列。在其他情况下,已经针对特定的生物创建了特定的核酸序列数据库,例如由联合基因组研究所(Joint Genome Institute)创建。此外,对私有数据库的使用也已允许鉴定新型核酸和多肽序列。
实施例2:比对与本发明方法所用的多肽序列相关的序列
2.1.C3H样多肽
多肽序列的比对利用Clustal W 2.0渐近比对算法(Thompson等(1997)Nucleic Acids Res 25:4876-4882;Chenna等(2003).Nucleic AcidsRes 31:3497-3500),使用标准设置(慢比对,相似性矩阵:Gonnet、空位开放罚分10,空位延伸罚分0.2))来进行。进行微小的手工编辑以进一步优化比对。
使用Vector NTI(Invitrogen)的AlignX程序中提供的邻接聚类算法,构建了C3H样多肽的系统发生树(图2)。
2.2.SPATULA样(SPT)多肽
多肽序列的比对利用Clustal W 2.0渐近比对算法(Thompson等(1997)Nucleic Acids Res 25:4876-4882;Chenna等(2003).Nucleic AcidsRes 31:3497-3500),使用标准设置(慢比对,相似性矩阵:Gonnet、空位开放罚分10,空位延伸罚分0.2))来进行。进行微小的手工编辑以进一步优化比对。
使用Vector NTI(Invitrogen)的AlignX程序中提供的邻接聚类算法,构建了SPATULA样多肽的系统发生树(图5)。
2.3.IDI2(缺铁诱导2)多肽
多肽序列的比对利用Clustal W 2.0渐近比对算法(Thompson等(1997)Nucleic Acids Res 25:4876-4882;Chenna等(2003).Nucleic AcidsRes 31:3497-3500),使用标准设置(慢比对,相似性矩阵:Gonnet、空位开放罚分10,空位延伸罚分0.2))来进行。进行微小的手工编辑以进一步优化比对。组A的IDI2多肽在图8中进行比对。在蛋白质序列的N-末端半部分中发现了最高度的保守,C-末端部分在长度上是可变的。该比对可以被用于确定长约5至10个氨基酸的保守标签序列。优选使用蛋白质的保守区域,可以通过星号(相同的残基)、冒号(高度保守的替换)和圆点(保守替换)进行识别。
使用MAFFT(Katoh和Toh(2008)Briefings in Bioinformatics 9:286-298)比对序列,构建GR-RBP多肽的系统发生树(图9)。使用QuickTree(Howe等.(2002),Bioinformatics 18(11):1546-7)计算邻接树。显示在100次自展重复后主分枝的支持率。以Dendroscope(Huson等(2007),BMCBioinformatics 8(1):460)进行树的可视化。该树显示了在IDI2多肽内2个亚组(A和B)的清楚轮廓以及几个离群值(outliers),SEQ ID NO:140与组A内的序列聚类。
2.4.eIF4F样蛋白质复合物
多肽序列的比对利用Clustal W 2.0渐近比对算法(Thompson等(1997)Nucleic Acids Res 25:4876-4882;Chenna等(2003).Nucleic AcidsRes 31:3497-3500),使用标准设置(慢比对,相似性矩阵:Gonnet(或Blosum 62(如果比对多肽))、空位开放罚分10,空位延伸罚分0.2))来进行。进行微小的手工编辑以进一步优化比对。
使用Vector NTI(Invitrogen)的AlignX程序中提供的邻接聚类算法,构建了eIF4F样蛋白质复合物亚基多肽,eIF4G/isoG,eIG4A和eIF4E/iso,的系统发生树(图12、13和14)。
多肽序列的比对利用Clustal W 2.0渐近比对算法(Thompson等(1997)Nucleic Acids Res 25:4876-4882;Chenna等(2003).Nucleic AcidsRes 31:3497-3500),使用标准设置(慢比对,相似性矩阵:Gonnet、空位开放罚分10,空位延伸罚分0.2))来进行。进行微小的手工编辑以进一步优化比对。
2.5.GR-RBP(富甘氨酸RNA结合蛋白)多肽
多肽序列的比对利用VNTI(Advance 10,Invitrogen),使用默认设置来进行。使用Clustal W算法(Nucleic Acid Research,22(22):4673-4680,1994)产生比对。GR-RBP多肽的比对在图17中显示。在蛋白质序列的N-末端半部分中发现了最高度的保守,富含甘氨酸结构域尽管在长度上是可变的,但是可以很容易地被识别。
使用MAFFT(Katoh和Toh(2008)Briefings in Bioinformatics 9:286-298)比对序列来构建GR-RBP多肽的系统发生树(图18)。使用QuickTree(Howe等.(2002),Bioinformatics 18(11):1546-7)计算邻接树。显示在100次自展重复后主分枝的支持率。以Dendroscope(Huson等(2007),BMCBioinformatics 8(1):460)进行树的可视化。该树显示在GR-RBP多肽内2个亚组(组A和较小的组B)的清楚轮廓。SEQ ID NO:827与组A内的序列聚类。
实施例3:计算可以用于实施本发明方法的多肽序列之间的全局同一性百分比
3.1.C3H样多肽
全长多肽序列之间的全局相似性和同一性百分比,利用MatGAT(矩阵全局比对工具)软件(BMC Bioinformatics.2003 4:29.MatGAT:anapplication that generates similarity/identity matrices using protein orDNA sequences.Campanella JJ,Bitincka L,Smalley J;软件由LedionBitincka托管)来确定。MatGAT软件无需对数据进行预比对,即可产生DNA或蛋白质序列的相似性/同一性矩阵。该程序利用Myers和Miller全局比对算法(空位开放罚分为12,而空位延伸罚分为2)进行一系列的两两比对,利用例如Blosum 62(对于多肽而言)计算相似性和同一性,然后将结果排列成距离矩阵。序列相似性示于对角线下半部,而序列同一性示于对角线上半部。
比较所用的参数为:
记分矩阵:Blosum 62
首个空位:12
延伸空位:2
多肽序列全长范围的全局相似性和同一性的软件分析结果示于表B1。同一性百分比示于对角线上方,而相似性百分比示于对角线下方。
Figure BDA0000125779720001481
Figure BDA0000125779720001491
Figure BDA0000125779720001501
Figure BDA0000125779720001511
还可以获得有关特定结构域的局部比对的MATGAT表,或有关特定结构域之间的同一性/相似性百分比的数据。
3.2.SPATULA样(SPT)多肽
可以用于实施本发明方法的全长多肽序列之间的全局相似性和同一性百分比,利用MatGAT(矩阵全局比对工具)软件(BMC Bioinformatics.2003 4:29.MatGAT:an application that generates similarity/identitymatrices using protein or DNA sequences.Campanella JJ,Bitincka L,Smalley J;软件由Ledion Bitincka托管)来确定。MatGAT软件无需对数据进行预比对,即可产生DNA或蛋白质序列的相似性/同一性矩阵。该程序利用Myers和Miller全局比对算法(空位开放罚分为12,而空位延伸罚分为2)进行一系列的两两比对,利用例如Blosum 62(对于多肽而言)计算相似性和同一性,然后将结果排列成距离矩阵。序列相似性示于对角线下半部,而序列同一性示于对角线上半部。
比较所用的参数为:
记分矩阵:Blosum 62
首个空位:12
延伸空位:2
多肽序列全长范围的全局相似性和同一性的软件分析结果示于表B2。同一性百分比示于对角线上方,而相似性百分比示于对角线下方。
还可以获得有关特定结构域的局部比对的MATGAT表,或有关特定结构域之间的同一性/相似性百分比的数据。
3.3.IDI2(缺铁诱导2)多肽
可以用于实施本发明方法的全长多肽序列之间的全局相似性和同一性百分比,利用本领域可用方法之一即MatGAT(矩阵全局比对工具)软件(BMC Bioinformatics.2003 4:29.MatGAT:an application thatgenerates similarity/identity matrices using protein or DNA sequences.Campanella JJ,Bitincka L,Smalley J;软件由Ledion Bitincka托管)来确定。MatGAT软件无需对数据进行预比对,即可产生DNA或蛋白质序列的相似性/同一性矩阵。该程序利用Myers和Miller全局比对算法(空位开放罚分为12,而空位延伸罚分为2)进行一系列的两两比对,利用例如Blosum 62(对于多肽而言)计算相似性和同一性,然后将结果排列成距离矩阵。序列相似性示于对角线下半部,而序列同一性示于对角线上半部。
比较所用的参数为:
记分矩阵:Blosum 62
首个空位:12
延伸空位:2
多肽序列全长范围的全局相似性和同一性的软件分析结果示于表B3。还可以获得有关特定结构域的局部比对的MATGAT表,或有关特定结构域之间的同一性/相似性百分比的数据。
3.3.IDI2(缺铁诱导2)多肽
可以用于实施本发明方法的全长多肽序列之间的全局相似性和同一性百分比,利用本领域可用方法之一即MatGAT(矩阵全局比对工具)软件(BMC Bioinformatics.2003 4:29.MatGAT:an application thatgenerates similarity/identity matrices using protein or DNA sequences.Campanella JJ,Bitincka L,Smalley J;软件由Ledion Bitincka托管)来确定。MatGAT软件无需对数据进行预比对,即可产生DNA或蛋白质序列的相似性/同一性矩阵。该程序利用Myers和Miller全局比对算法(空位开放罚分为12,而空位延伸罚分为2)进行一系列的两两比对,利用例如Blosum 62(对于多肽而言)计算相似性和同一性,然后将结果排列成距离矩阵。序列相似性示于对角线下半部,而序列同一性示于对角线上半部。
比较所用的参数为:
记分矩阵:Blosum 62
首个空位:12
延伸空位:2
多肽序列全长范围的全局相似性和同一性的软件分析结果示于表B3。
与SEQ ID NO:140相比较,可以用于本发明方法的IDI2多肽序列之间的同一性百分比可低至24%氨基酸同一性。
Figure BDA0000125779720001561
Figure BDA0000125779720001571
Figure BDA0000125779720001581
Figure BDA0000125779720001591
Figure BDA0000125779720001601
3.4.eIF4F样蛋白质复合物
可以用于实施本发明方法的全长多肽序列之间的全局相似性和同一性百分比,利用本领域可用方法之一即MatGAT(矩阵全局比对工具)软件(BMC Bioinformatics.2003 4:29.MatGAT:an application thatgenerates similarity/identity matrices using protein or DNA sequences.Campanella JJ,Bitincka L,Smalley J;软件由Ledion Bitincka托管)来确定。MatGAT软件无需对数据进行预比对,即可产生DNA或蛋白质序列的相似性/同一性矩阵。该程序利用Myers和Miller全局比对算法(空位开放罚分为12,而空位延伸罚分为2)进行一系列的两两比对,利用例如Blosum 62(对于多肽而言)计算相似性和同一性,然后将结果排列成距离矩阵。序列同一性示于对角线上半部。
比较所用的参数为:
记分矩阵:Blosum 62
首个空位:12
延伸空位:2
多肽序列全长范围的全局同一性的软件分析结果示于表B4。同一性百分比示于对角线上方,而相似性百分比示于对角线下方。
与SEQ ID NO:241相比较,可以用于本发明方法的eIF4isoG多肽序列之间的同一性百分比可低至56.4%氨基酸同一性。
Figure BDA0000125779720001631
3.5.GR-RBP(富甘氨酸RNA结合蛋白)多肽
可以用于实施本发明方法的全长多肽序列之间的全局相似性和同一性百分比,利用本领域可用方法之一即MatGAT(矩阵全局比对工具)软件(BMC Bioinformatics.2003 4:29.MatGAT:an application thatgenerates similarity/identity matrices using protein or DNA sequences.Campanella JJ,Bitincka L,Smalley J;软件由Ledion Bitincka托管)来确定。MatGAT软件无需对数据进行预比对,即可产生DNA或蛋白质序列的相似性/同一性矩阵。该程序利用Myers和Miller全局比对算法(空位开放罚分为12,而空位延伸罚分为2)进行一系列的两两比对,利用例如Blosum 62(对于多肽而言)计算相似性和同一性,然后将结果排列成距离矩阵。序列相似性示于对角线下半部,而序列同一性示于对角线上半部
比较所用的参数为:
记分矩阵:Blosum 62
首个空位:12
延伸空位:2
组A GR-RBP蛋白的多肽序列在全长范围的全局相似性和同一性的软件分析结果示于表B5。与SEQ ID NO:827相比较,可以用于本发明方法的GR-RBP多肽序列之间的同一性百分比可低至10.3%氨基酸同一性。当组B GR-RBP蛋白的序列也包括在分析中时,该百分比保持不变。
Figure BDA0000125779720001651
Figure BDA0000125779720001661
Figure BDA0000125779720001671
Figure BDA0000125779720001681
Figure BDA0000125779720001691
Figure BDA0000125779720001701
实施例4:鉴定可以用于实施本发明方法的多肽序列中所含的结构域
4.1.C3H样多肽
蛋白质家族、结构域和位点整合资源(Integrated Resource of ProteinFamilies,Domains and Sites(InterPro))数据库是进行基于文本以及序列的搜索的、常用标签数据库的一个整合界面。InterPro数据库将这些数据库结合起来,这些数据库利用不同的方法学和有关充分表征的蛋白质的不同程度的生物信息来产生蛋白质标签。合作数据库包括SWISS-PROT、PROSITE、TrEMBL、PRINTS、ProDom和Pfam、Smart和TIGRFAMs。Pfam是覆盖许多常见蛋白质结构域和家族的、多重序列比对和隐马尔可夫模型的大集合。Pfam由位于英国的桑格研究所服务器(Sanger Institute server)托管。Interpro由位于英国的欧洲生物信息学研究所(European Bioinformatics Institute)托管。
4.2.SPATULA样(SPT)多肽
蛋白质家族、结构域和位点整合资源(Integrated Resource of ProteinFamilies,Domains and Sites(InterPro))数据库是进行基于文本以及序列的搜索的、常用标签数据库的一个整合界面。InterPro数据库将这些数据库结合起来,这些数据库利用不同的方法学和有关充分表征的蛋白质的不同程度的生物信息来产生蛋白质标签。合作数据库包括SWISS-PROT、PROSITE、TrEMBL、PRINTS、ProDom和Pfam、Smart和TIGRFAMs。Pfam是覆盖许多常见蛋白质结构域和家族的、多重序列比对和隐马尔可夫模型的大集合。Pfam由位于英国的桑格研究所服务器(Sanger Institute server)托管。Interpro由位于英国的欧洲生物信息学研究所(European Bioinformatics Institute)托管。
SEQ ID NO:97的多肽序列的InterPro扫描结果示于以下表C1中。
表C1:SEQ ID NO:97的多肽序列的InterPro扫描结果。
Figure BDA0000125779720001721
4.3.IDI2(缺铁诱导2)多肽
蛋白质家族、结构域和位点整合资源(Integrated Resource of ProteinFamilies,Domains and Sites(InterPro))数据库是进行基于文本以及序列的搜索的、常用标签数据库的一个整合界面。InterPro数据库将这些数据库结合起来,这些数据库利用不同的方法学和有关充分表征的蛋白质的不同程度的生物信息来产生蛋白质标签。合作数据库包括SWISS-PROT、PROSITE、TrEMBL、PRINTS、ProDom和Pfam、Smart和TIGRFAMs。Pfam是覆盖许多常见蛋白质结构域和家族的、多重序列比对和隐马尔可夫模型的大集合。Pfam由位于英国的桑格研究所服务器(Sanger Institute server)托管。Interpro由位于英国的欧洲生物信息学研究所(European Bioinformatics Institute)托管。
SEQ ID NO:2所示的多肽序列的InterPro扫描结果示于表C2中。
表C2:SEQ ID NO:140所示多肽序列的InterPro扫描结果(主登录号)。
Figure BDA0000125779720001731
4.4.eIF4F样蛋白质复合物
蛋白质家族、结构域和位点整合资源(Integrated Resource of ProteinFamilies,Domains and Sites(InterPro))数据库是进行基于文本以及序列的搜索的、常用标签数据库的一个整合界面。InterPro数据库将这些数据库结合起来,这些数据库利用不同的方法学和有关充分表征的蛋白质的不同程度的生物信息来产生蛋白质标签。合作数据库包括SWISS-PROT、PROSITE、TrEMBL、PRINTS、ProDom和Pfam、Smart和TIGRFAMs。Pfam是覆盖许多常见蛋白质结构域和家族的、多重序列比对和隐马尔可夫模型的大集合。Pfam由位于英国的桑格研究所服务器(Sanger Institute server)托管。Interpro由位于英国的欧洲生物信息学研究所(European Bioinformatics Institute)托管。表C3表示表C3a和表C3b的任何一个或多个。
eIF4isoG和eIF4A多肽序列的InterPro扫描结果示于表C3中。
表C3a:SEQ ID NO:241所示多肽序列的InterPro扫描结果(主登录号)-eIF4isoG(Os04g42140)的InterPro基序搜索
Figure BDA0000125779720001741
表C3b:SEQ ID NO:301所示多肽序列的InterPro扫描结果(主登录号)-eIF4A(Os06g48750)的InterPro基序搜索
  方法   登录   结构域   起始   终止   E-值
  superfamily   SSF52540   SSF52540   78   414   740e-49
  superfamily   SSF52540   SSF52540   41   424   4.40e-58
  HMMPanther   PTHR10967:SF2   PTHR10967:SF2   25   414   0
  HMMPanther   PTHR10967   PTHR10967   25   414   0
  Gene3D   G3DSA:3.40.50.300   G3DSA:3.40.50.300   282   400   6.50e-32
  Gene3D   G3DSA:3.40.50.300   G3DSA:3.40.50.300   28   252   4.00e-69
  ProfileScan   PS51192   Helicase_ATP_bind_1   72   242   0
  ProfileScan   PS51195   Q_motif   41   69   0
  HMMSmart   SM00487   DEXDc   60   257   2.70e-56
  HMMPfam   PF00270   DEAD   65   231   5.30e-59
  Profilescan   PS51194   Helicase_Cter   253   414   0
  HMMSmart   SM00490   HELICc   294   375   3.60e-31
  HMMPfam   PF00271   Helicase_C   299   375   8.60e-30
  Profilescan   PS00039   Dead_ATP_Helicase   188   196   8.00e-05
4.5.GR-RBP(富甘氨酸RNA结合蛋白)多肽
蛋白质家族、结构域和位点整合资源(Integrated Resource of ProteinFamilies,Domains and Sites(InterPro))数据库是进行基于文本以及序列的搜索的、常用标签数据库的一个整合界面。InterPro数据库将这些数据库结合起来,这些数据库利用不同的方法学和有关充分表征的蛋白质的不同程度的生物信息来产生蛋白质标签。合作数据库包括SWISS-PROT、PROSITE、TrEMBL、PRINTS、ProDom和Pfam、Smart和TIGRFAMs。Pfam是覆盖许多常见蛋白质结构域和家族的、多重序列比对和隐马尔可夫模型的大集合。Pfam由位于英国的桑格研究所服务器(Sanger Institute server)托管。Interpro由位于英国的欧洲生物信息学研究所(European Bioinformatics Institute)托管。
SEQ ID NO:827所示的多肽序列的InterPro扫描结果示于表C4中。
表C4:SEQ ID NO:827所示多肽序列的InterPro扫描结果(主登录号)
Figure BDA0000125779720001761
实施例5:用于实施本发明方法的多肽序列的拓扑学预测
5.1.C3H样多肽
TargetP 1.1预测真核蛋白质的亚细胞定位。位置分配所基于的是如下任一N-末端前序列的预测性存在:叶绿体转运肽(cTP)、线粒体靶向肽(mTP)或分泌途径信号肽(SP)。最终预测所基于的分值并非真正的概率,且加起来并不必为1。不过,根据TargetP,得分最高的定位是最可能的,且分值之间的关系(可靠性级别)可作为所述预测的可靠性的指标。可靠性级别(RC)范围从1到5,其中1表示最强的预测。TargetP由丹麦技术大学(Technical University of Denmark)的服务器维护。
对于经预测包含N末端前序列的序列,还可预测潜在切割位点。
可以选择许多参数,例如生物组别(非植物或植物)、截断值设置(无、预定的截断值设置、或用户指定的截断值设置)和预测切割位点的计算(是或否)。
许多其他算法可用于实施此类分析,包括:
●在丹麦技术大学的服务器上托管的ChloroP 1.1;
●在澳大利亚布里斯班的昆士兰大学分子生物科学学院(Institute for Molecular Bioscience)的服务器上托管的ProteinProwler Subcellular Localisation Predictor 1.2版;
●在Edmonton,Alberta,Canada的阿尔伯特大学(University ofAlberta)的服务器上托管的PENCE Proteome Analyst PA-GOSUB 2.5;
●在丹麦技术大学的服务器上托管的TMHMM;
●PSORT(URL:psort.org)
●PLOC(Park和Kanehisa,Bioinformatics,19,1656-1663,2003)。
5.2.SPATULA样(SPT)多肽
TargetP 1.1预测真核蛋白质的亚细胞定位。位置分配所基于的是如下任一N-末端前序列的预测性存在:叶绿体转运肽(cTP)、线粒体靶向肽(mTP)或分泌途径信号肽(SP)。最终预测所基于的分值并非真正的概率,且加起来并不必为1。不过,根据TargetP,得分最高的定位是最可能的,且分值之间的关系(可靠性级别)可作为所述预测的可靠性的指标。可靠性级别(RC)范围从1到5,其中1表示最强的预测。TargetP由丹麦技术大学(Technical University of Denmark)的服务器维护。
对于经预测包含N末端前序列的序列,还可预测潜在切割位点。
可以选择许多参数,例如生物组别(非植物或植物)、截断值设置(无、预定的截断值设置、或用户指定的截断值设置)和预测切割位点的计算(是或否)。
许多其他算法可用于实施此类分析,包括:
●在丹麦技术大学的服务器上托管的ChloroP 1.1;
●在澳大利亚布里斯班的昆士兰大学分子生物科学学院(Institute for Molecular Bioscience)的服务器上托管的ProteinProwler Subcellular Localisation Predictor 1.2版;
●在Edmonton,Alberta,Canada的阿尔伯特大学(University ofAlberta)的服务器上托管的PENCE Proteome Analyst PA-GOSUB 2.5;
●在丹麦技术大学的服务器上托管的TMHMM;
●PSORT(URL:psort.org)
●PLOC(Park和Kanehisa,Bioinformatics,19,1656-1663,2003)。
5.3.IDI2(缺铁诱导2)多肽
TargetP 1.1预测真核蛋白质的亚细胞定位。位置分配所基于的是如下任一N-末端前序列的预测性存在:叶绿体转运肽(cTP)、线粒体靶向肽(mTP)或分泌途径信号肽(SP)。最终预测所基于的分值并非真正的概率,且加起来并不必为1。不过,根据TargetP,得分最高的定位是最可能的,且分值之间的关系(可靠性级别)可作为所述预测的可靠性的指标。可靠性级别(RC)范围从1到5,其中1表示最强的预测。TargetP由丹麦技术大学(Technical University of Denmark)的服务器维护。
对于经预测包含N末端前序列的序列,还可预测潜在切割位点。
可以选择许多参数,例如生物组别(非植物或植物)、截断值设置(无、预定的截断值设置、或用户指定的截断值设置)和预测切割位点的计算(是或否)。
SEQ ID NO:140所示多肽序列的TargetP 1.1分析结果显示于表D1。已经选择“植物”生物组别,规定无截断值,要求转运肽的预测长度。SEQ ID NO:140所示多肽序列的亚细胞定位可以是细胞质或细胞核,未预测到转运肽。
表D1:SEQ ID NO:140所示多肽序列的TargetP 1.1分析。缩写词:Len,长度;cTP,叶绿体转运肽;mTP,线粒体转运肽,SP,分泌途径信号肽,other,其它亚细胞靶向,Loc,预测的定位;RC,可靠级别;TPlen,预测的转运肽长度。
Figure BDA0000125779720001791
许多其他算法可用于实施此类分析,包括:
●在丹麦技术大学的服务器上托管的ChloroP 1.1;
●在澳大利亚布里斯班的昆士兰大学分子生物科学学院(Institute for Molecular Bioscience)的服务器上托管的ProteinProwler Subcellular Localisation Predictor 1.2版;
●在Edmonton,Alberta,Canada的阿尔伯特大学(University ofAlberta)的服务器上托管的PENCE Proteome Analyst PA-GOSUB 2.5;
●在丹麦技术大学的服务器上托管的TMHMM;
●PSORT(URL:psort.org)
●PLOC(Park和Kanehisa,Bioinformatics,19,1656-1663,2003)。
5.4.eIF4F样蛋白质复合物
TargetP 1.1预测真核蛋白质的亚细胞定位。位置分配所基于的是如下任一N-末端前序列的预测性存在:叶绿体转运肽(cTP)、线粒体靶向肽(mTP)或分泌途径信号肽(SP)。最终预测所基于的分值并非真正的概率,且加起来并不必为1。不过,根据TargetP,得分最高的定位是最可能的,且分值之间的关系(可靠性级别)可作为所述预测的可靠性的指标。可靠性级别(RC)范围从1到5,其中1表示最强的预测。TargetP由丹麦技术大学(Technical University of Denmark)的服务器维护。
对于经预测包含N末端前序列的序列,还可预测潜在切割位点。
许多其他算法可用于实施此类分析,包括:
●在丹麦技术大学的服务器上托管的ChloroP 1.1;
●在澳大利亚布里斯班的昆士兰大学分子生物科学学院(Institute for Molecular Bioscience)的服务器上托管的ProteinProwler Subcellular Localisation Predictor 1.2版;
●在Edmonton,Alberta,Canada的阿尔伯特大学(University ofAlberta)的服务器上托管的PENCE Proteome Analyst PA-GOSUB 2.5;
●在丹麦技术大学的服务器上托管的TMHMM;
●PSORT(URL:psort.org)
●PLOC(Park和Kanehisa,Bioinformatics,19,1656-1663,2003)。
5.5.GR-RBP(富甘氨酸RNA结合蛋白)多肽
TargetP 1.1预测真核蛋白质的亚细胞定位。位置分配所基于的是如下任一N-末端前序列的预测性存在:叶绿体转运肽(cTP)、线粒体靶向肽(mTP)或分泌途径信号肽(SP)。最终预测所基于的分值并非真正的概率,且加起来并不必为1。不过,根据TargetP,得分最高的定位是最可能的,且分值之间的关系(可靠性级别)可作为所述预测的可靠性的指标。可靠性级别(RC)范围从1到5,其中1表示最强的预测。TargetP由丹麦技术大学(Technical University of Denmark)的服务器维护。
对于经预测包含N末端前序列的序列,还可预测潜在切割位点。
选择了许多参数,例如生物组别(非植物或植物)、截断值设置(无、预定的截断值设置、或用户指定的截断值设置)和预测切割位点的计算(是或否)。
SEQ ID NO:2所示多肽序列的TargetP 1.1分析结果显示于表D2。已经选择“植物”生物组别,规定无截断值,要求转运肽的预测长度。SEQID NO:827所示多肽序列的亚细胞定位被预测为线粒体,转运肽看起来不存在。
表D2:SEQ ID NO:827所示多肽序列的TargetP 1.1分析。缩写词:Len,长度;cTP,叶绿体转运肽;mTP,线粒体转运肽,SP,分泌途径信号肽,other,其它亚细胞靶向,Loc,预测的定位;RC,可靠级别;TPlen,预测的转运肽长度。
Figure BDA0000125779720001811
许多其他算法可用于实施此类分析,包括:
●在丹麦技术大学的服务器上托管的ChloroP 1.1;
●在澳大利亚布里斯班的昆士兰大学分子生物科学学院(Institute for Molecular Bioscience)的服务器上托管的ProteinProwler Subcellular Localisation Predictor 1.2版;
●在Edmonton,Alberta,Canada的阿尔伯特大学(University ofAlberta)的服务器上托管的PENCE Proteome Analyst PA-GOSUB 2.5;
●在丹麦技术大学的服务器上托管的TMHMM;
●PSORT(URL:psort.org)
●PLOC(Park和Kanehisa,Bioinformatics,19,1656-1663,2003)。
实施例6:与可以用于实施本发明方法的多肽序列相关的测定法
6.1.IDI2(缺铁诱导2)多肽
可以按Fabian等(1997,1998)的描述对真核生物起始因子2B的功能进行分析。简单地说,使用杆状病毒表达载体系统(BEVS)在Sf21细胞中表达带FLAG表位标签的大鼠eIF2B的α、β、γ、δ和ε亚基的等位基因。通过在Sf21细胞中共表达所有5个亚基,在体内重建eIF2B全蛋白质,并随后采用包括抗-FALG免疫亲和柱及其后的凝胶过滤色谱的两步法进行纯化。
纯化的5亚基eIF2B复合物具有高鸟嘌呤核苷酸交换因子(GEF)活性,这可以通过利用结合到eIF2的[3H]GDP作为底物测定结合到eIF2的[3H]GDP与未标记的GDP的交换而分析。通过将包含在80ml试验缓冲液(62.5mM MOPS,pH 7.4,125mM KCl,1.25mM DTT,0.2mg/mlBSA)中的大鼠肝脏eIF2[约95%纯]和[3H]GDP(2.5mM,10.9Ci/mmol)的试管在30℃孵育10分钟,制备标记的二元复合物eIF2-[3H]GDP。调节Mg2+的浓度至2mM,使用前,将二元复合物置于冰上保存。将含有100倍过量的GDP、纯化的蛋白质或细胞裂解物(1.25-40ml)以及2mM Mg2+的试验缓冲液加到试管中,随后将标记的二元复合物(1-2pmol)加入,混合物在37℃孵育0-12分钟,以测定GEF活性。以随时间的推移eIF2介导的[3H]GDP与硝酸纤维素滤膜的结合的减少来测定交换反应。
6.2.GR-RBP(富甘氨酸RNA结合蛋白)多肽
对于GR-RBP4,GR-RBP蛋白质的RNA结合活性可以按Kwak等(2005)的描述来进行测定。
通过体外转录和翻译合成用于体外核酸结合分析试验的蛋白质。将编码GR-RBP4的cDNA亚克隆到pET-22b(+)载体(Novagen)中。使用
Figure BDA0000125779720001821
快速偶联的转录/翻译系统(Quick CoupledTranscription/Translation System)以T7 RNA聚合酶(Promega)来进行体外转录/翻译反应。将1微克DNA与包含40μlQuick Master Mix、2μl[35S]甲硫氨酸和6μl无核酸酶的水的反应混合物混合。反应混合物在30℃孵育90分钟。5μl该体外合成的蛋白质与5μl ribohomopolymer-琼脂糖微珠或DNA-纤维素微珠(以1mg ml-1的浓度)在含有1mg ml-1肝素的20μl结合缓冲液(10mM TRIS-HCl,pH 7.4,2.5mM MgCl2,0.5%Triton X-100,和125-1000mM NaCl)中混合。混合物在冰上孵育30分钟,以包含125-1000mM NaCl(无肝素)的结合缓冲液洗涤微珠3至4次以去除未结合蛋白质。在最后一次洗涤后,干燥样品,并通过在30μl的SDS上样缓冲液中煮沸来进行重悬。用SDS-12%聚丙烯酰胺凝胶电泳(PAGE)分离释放的蛋白质,用PhosphorImager(Fuji,日本)对蛋白质条带的相对强度进行定量。
在不同的NaCl浓度下,测试[35S]甲硫氨酸标记的GR-RBP4蛋白质与单链DNA(ssDNA)、双链DNA(dsDNA)、或同型核糖核酸多聚体(poly(A),poly(C),poly(G)和poly(U))之间的结合。在存在250mM NaCl时,GR-RBP4与所有测试的DNA和RNA强烈结合。也在1.0M NaCl的高盐浓度下观察到了结合。GR-RBP4对ssDNA和dsDNA以及RNAs具有高亲和性。为了进一步验证该结合分析试验的特异性,对GR-RBP家族的其它成员GR-RBP2和GR-RBP7、以及萤光素酶作为阴性对照进行测试。如Vermel等(Proc.Natl.Acad.Sci.USA 99,5866-5871,2002)所观察到的,GR-RBP2与poly(U)最强烈地结合;而如在许多其它GR-RBPs中观察到的(Ludevid等,The Plant Journal 2,999-1003,1992;Hirose等,Mol.Gen.Gen.244,360-366,1994),GR-RBP7显示与poly(G),poly(U)和ssDNA更高的亲和性。对于既不包含RRM也不包含富甘氨酸基序的萤光素酶,没有检测到结合。这些观察支持了结合分析试验的可靠性,并表明GR-RBP4以序列非特异性的方式与RNA和DNA结合。
实施例7:用于本发明方法的核酸序列的克隆
7.1.C3H样多肽
使用蒺藜苜蓿cDNA文库(在pCMV Sport 6.0中;Invitrogen,Paisley,UK)作为模板,通过PCR扩增用于本发明方法的核酸序列。在标准条件下使用Hifi Taq DNA聚合酶,在50μl PCR mix中使用200ng模板进行PCR。使用的引物是:prm10911(SEQ ID NO:93;有义,起始密码子以加粗表示):5’-ggggacaagtttgtacaaaaaagcaggcttaaacaatgaattctgaatc ctcaccc-3’和prm10912(SEQ ID NO:94;反向,互补):5’-ggggaccactttgtacaagaaagctgggtac aatagaatcaatcttccaattc-3’,,包括用于Gateway重组的AttB位点。也使用标准方法纯化扩增的PCR片段。接着进行Gateway操作的第一步,即BP反应,在此期间PCR片段与pDONR201质粒体内重组以产生Gateway术语所称的“进入(entry)克隆”,pC3H-like。作为
Figure BDA0000125779720001841
技术一部分的质粒pDONR201购自英骏公司(Invitrogen)。
含有SEQ ID NO:1的进入克隆随后与用于稻转化的Destination载体一起用于LR反应。此载体在T-DNA边界内包含如下功能性元件:植物可选择的标记;可筛选的标记表达盒;和旨在与已克隆到进入克隆中的目的核酸序列进行LR体内重组的Gateway盒。用于组成型特异表达的稻GOS2启动子(SEQ ID NO:95)位于此Gateway盒的上游。
在LR重组步骤之后,根据本领域公知的方法,将所产生的表达载体pGOS2::C3H-like(图3)转化进农杆菌菌株LBA4044。
7.2.SPATULA样(SPT)多肽
使用毛果杨cDNA文库作为模板,通过PCR扩增用于本发明方法的核酸序列。在标准条件下使用Hifi Taq DNA聚合酶,在50μl PCR mix中使用200ng模板进行PCR。使用的引物是:prm11534(SEQ ID NO:133;有义,起始密码子以加粗表示):5’-ggggacaagtttgtacaaaaaagcaggcttaaacaatggaggatctgtacggagc-3’和prm11535(SEQ ID NO:134;反向,互补):5’-ggggaccactttgtacaagaaagctgggttcataactaggccacaccaga-3’,包括用于Gateway重组的AttB位点。也使用标准方法纯化扩增的PCR片段。接着进行Gateway操作的第一步,即BP反应,在此期间PCR片段与pDONR201质粒体内重组以产生Gateway术语所称的“进入(entry)克隆”,pSPT-like。作为
Figure BDA0000125779720001842
技术一部分的质粒pDONR201购自英骏公司(Invitrogen)。
含有SEQ ID NO:96的进入克隆随后与用于稻转化的Destination载体一起用于LR反应。此载体在T-DNA边界内包含如下功能性元件:植物可选择的标记;可筛选的标记表达盒;和旨在与已克隆到进入克隆中的目的核酸序列进行LR体内重组的Gateway盒。用于组成型特异表达的稻GOS2启动子(SEQ ID NO:135)位于此Gateway盒的上游。
在LR重组步骤之后,根据本领域公知的方法,将所产生的表达载体pGOS2::SPT-like(图6)转化进农杆菌菌株LBA4044。
7.3.IDI2(缺铁诱导2)多肽
使用客户定制的甘蔗幼苗cDNA文库(在pCMV Sport 6.0中;Invitrogen,Paisley,UK)作为模板,通过PCR扩增用于本发明方法的核酸序列。在标准条件下使用Hifi Taq DNA聚合酶,在50μl PCR mix中使用200ng模板进行PCR。使用的引物是:prm08213(SEQ ID NO:147;有义,起始密码子以加粗表示):5’-ggggacaagtttgtacaaaaaagcaggcttaaacaatggtgggatccgacg-3’和prm08214(SEQ ID NO:148;反向,互补):5’-ggggaccactttgtacaagaaagctgggtgccacgcttgagagtattat t-3’,包括用于Gateway重组的AttB位点。也使用标准方法纯化扩增的PCR片段。接着进行Gateway操作的第一步,即BP反应,在此期间PCR片段与pDONR201质粒体内重组以产生Gateway术语所称的“进入(entry)克隆”,pIDI2。作为
Figure BDA0000125779720001851
技术一部分的质粒pDONR201购自英骏公司(Invitrogen)。
含有SEQ ID NO:139的进入克隆随后与用于稻转化的Destination载体一起用于LR反应。此载体在T-DNA边界内包含如下功能性元件:植物可选择的标记;可筛选的标记表达盒;和旨在与已克隆到进入克隆中的目的核酸序列进行LR体内重组的Gateway盒。用于组成型特异表达的稻GOS2启动子(SEQ ID NO:149)位于此Gateway盒的上游。
在LR重组步骤之后,根据本领域公知的方法,将所产生的表达载体pGOS2::IDI2(图9)转化进农杆菌菌株LBA4044。
7.4.eIF4F样蛋白质复合物
使用稻cDNA文库(在pCMV Sport 6.0中;Invitrogen,Paisley,UK)作为模板,通过PCR扩增用于本发明方法的核酸序列。在标准条件下使用Hifi Taq DNA聚合酶,在50μl PCR mix中使用200ng模板进行PCR。使用的引物是:
对于SEQ.ID.NO 240
引物1(SEQ ID NO:810);
(fwd)5’-ggggacaagtttgtacaaaaaagcaggcttaaacaatggagaaggatcaccag-3’
和引物2(SEQ ID NO:811):
(rev)5’-ggggaccactttgtacaagaaagctgggtttatttcagaagtttgttgca-3’,
对于SEQ.ID.NO 300
引物3(SEQ ID NO:812);
(fwd)5’-ggggacaagtttgtacaaaaaagcaggcttaaacaatggcgggaatggca-3’
和引物4(SEQ ID NO:813):
(rev)5’-ggggaccactttgtacaagaaagctgggttcaggccccttaacataactc-3’,
包括用于Gateway重组的AttB位点。也使用标准方法纯化扩增的PCR片段。接着进行Gateway操作的第一步,即BP反应,在此期间PCR片段与pDONR201质粒体内重组以产生Gateway术语所称的“进入(entry)克隆”,peIF4isoG和peIF4A。作为
Figure BDA0000125779720001861
技术一部分的质粒pDONR201购自英骏公司(Invitrogen)。
含有SEQ ID NO:240和SEQ ID NO:300的进入克隆随后与用于稻转化的Destination载体一起用于LR反应。此载体在T-DNA边界内包含如下功能性元件:植物可选择的标记;可筛选的标记表达盒;和旨在与已克隆到进入克隆中的目的核酸序列进行LR体内重组的Gateway盒。用于组成型特异表达的稻GOS2启动子(SEQ ID NO:818)位于此Gateway盒的上游。
在LR重组步骤之后,根据本领域公知的方法,将所产生的表达载体pGOS2::eIF4F4isoG和pGOS2::eIF4F4A(图15)转化进农杆菌菌株LBA4044。
7.5.GR-RBP(富甘氨酸RNA结合蛋白)多肽
使用客户定制的稻幼苗cDNA文库(在pCMV Sport 6.0中;Invitrogen,Paisley,UK)作为模板,通过PCR扩增用于本发明方法的核酸序列。在标准条件下使用Hifi Taq DNA聚合酶,在50μl PCR mix中使用200ng模板进行PCR。使用的引物是:prm10480(SEQ ID NO:838;有义,起始密码子以加粗表示):5’-ggggacaagtttgtacaaaaaagcaggcttaaacaatggcgttggctaataagatt-3’和prm10481(SEQ ID NO:838;反向,互补):5’-ggggaccactttgtacaagaaagctgggtaggctcgaaggacgtagatta-3’,包括用于Gateway重组的AttB位点。也使用标准方法纯化扩增的PCR片段。接着进行Gateway操作的第一步,即BP反应,在此期间PCR片段与pDONR201质粒体内重组以产生Gateway术语所称的“进入(entry)克隆”,pGR-RBP。作为
Figure BDA0000125779720001871
技术一部分的质粒pDONR201购自英骏公司(Invitrogen)。
含有SEQ ID NO:826的进入克隆随后与用于稻转化的Destination载体一起用于LR反应。此载体在T-DNA边界内包含如下功能性元件:植物可选择的标记;可筛选的标记表达盒;和旨在与已克隆到进入克隆中的目的核酸序列进行LR体内重组的Gateway盒。用于组成型特异表达的稻GOS2启动子(SEQ ID NO:840)位于此Gateway盒的上游。
在LR重组步骤之后,根据本领域公知的方法,将所产生的表达载体pGOS2::GR-RBP(图19)转化进农杆菌菌株LBA4044。
实施例8:植物转化
稻转化
用含表达载体的农杆菌转化稻(Oryza sativa)植物。使粳稻栽培种日本晴(Nipponbare)的成熟干种子脱壳。通过在70%乙醇中孵育1分钟,接着在0.2%HgCl2中孵育30分钟,接着用无菌蒸馏水洗6次,每次15分钟进行消毒。然后使消毒的种子在含有2,4-D的培养基(愈伤组织诱导培养基)上萌发。在黑暗中孵育四周之后,切下盾片来源的胚发生愈伤组织,并在相同的培养基中增殖。两周之后,通过在相同培养基中传代培养另外2周来扩增或者增殖愈伤组织。在共培养之前3天,在新鲜培养基上传代培养胚发生愈伤组织块(以加强细胞分裂活性)。
含有表达载体的农杆菌菌株LBA4404用于共培养。农杆菌接种于含有合适抗生素的AB培养基上,并在28℃培养3天。接着收集细菌并悬浮在液体共培养培养基中至光密度(OD600)约为1。接着将悬浮液转移至培养皿,并将愈伤组织浸于悬浮液中15分钟。随后将愈伤组织在滤纸上沾干,转移至固化的共培养培养基中,并在黑暗中于25℃孵育3天。在选择剂的存在下,共培养的愈伤组织在含有2,4-D的培养基上于28℃暗培养四周。在此期间,发育出快速生长的抗性愈伤组织岛。将此材料转移至再生培养基并在光照下孵育之后,释放了胚发生潜力,在接下来的四至五周发育出芽。将芽从愈伤组织切下,并在含生长素的培养基中孵育2到3周,将其从培养基转移至土壤。变硬的芽在高湿度和短白昼条件下在温室中培养。
一个构建体产生约35个独立的T0稻转化体。将原代转化体从组织培养室转移到温室。在定量PCR分析验证T-DNA播入物的拷贝数后,只保留对选择剂表现出耐受性的单拷贝转基因植物用以收获T1种子。在移植后三至五个月收获种子。该方法以超过50%的比率产生了单基因座转化体(Aldemita和Hodges 1996,Chan等,1993,Hiei等,1994)。
实施例9:其他作物的转化
玉米转化
用Ishida等(1996)Nature Biotech 14(6):745-50所述方法的改良方案进行玉米(玉蜀黍)转化。在玉米中转化是基因型依赖性的,并且只有特定的基因型适于转化和再生。近交系A188(明尼苏达大学)或以A188为亲本的杂种是转化供体材料的优良来源,但是也可以成功使用其它基因型。授粉后约11天(DAP),当未成熟胚的长度是约1至1.2mm时,从玉米植物收获穗。共培养未成熟胚和含有表达载体的根癌农杆菌,并通过器官发生回收转基因植物。切离的胚依次生长在含有选择剂(例如咪唑啉酮,但可使用多种选择标记)的愈伤组织诱导培养基、和玉米再生培养基上。培养板在光照下于25℃孵育2-3周,或直到芽发育。从每个胚中将绿芽转移到玉米生根培养基上并在25℃孵育2-3周,直到根发育。将生根的芽移植到温室的土壤中。从表现出对选择剂具有耐受性且含有单拷贝T-DNA插入片段的植物产生T1种子。
小麦转化
运用Ishida等(1996)Nature Biotech 14(6):745-50描述的方法,进行小麦的转化。栽培种Bobwhite(可从CIMMYT,Mexico(墨西哥)获得)常用来进行转化。共培养未成熟胚和含有表达载体的根癌农杆菌,并通过器官发生回收转基因植株。与农杆菌孵育后,胚依次体外生长在含有选择试剂(例如咪唑啉酮,但可使用多种选择标记)的愈伤组织诱导培养基,和再生培养基上。培养板在光照下于25℃孵育2-3周,或直到芽发育。从每个胚中将绿芽转移到生根培养基上并在25℃孵育2-3周,直到根发育。将生根的芽移植到温室的土壤中。从表现出对选择剂具有耐受性且含有单拷贝T-DNA插入片段的植物产生T1种子。
大豆转化
根据Texas A&M专利US 5,164,310所述方法的改良方案转化大豆。若干商业大豆品种可以通过该方法转化。栽培种Jack(可以得自伊利诺斯种子公司(the Illinois Seed foundation))常用来进行转化。对大豆种子消毒以进行体外播种。从七日龄幼苗中切出下胚轴、胚根和一个子叶。进一步培养上胚轴和剩下的子叶以发育腋结。切离这些腋结并与含有表达载体的根癌农杆菌孵育。在共培养处理后,洗涤外植体并转移到选择培养基中。切离再生的芽,置于芽伸长培养基中。将长度不超过1cm的芽置于生根培养基中直到发育出根。将生根的芽移植到温室的土壤中。从对选择剂表现出耐受性且含有单拷贝T-DNA插入片段的植物产生T1种子。
油菜籽/芸苔转化
利用5-6日龄幼苗的子叶柄和下胚轴作为外植体进行组织培养并根据Babic等(1998,Plant Cell Rep 17:183-188)进行转化。商业栽培种Westar(加拿大农业(Agriculture Canada))是用作转化的标准品种,但是也可以使用其它品种。对芸苔种子表面消毒以进行体外播种。从体外幼苗中切离附着有子叶的子叶柄外植体,并通过将子叶柄外植体的切割端浸入细菌悬浮液中来接种农杆菌(含有表达载体)。随后外植体在含有3mg/lBAP、3%蔗糖、0.7%植物琼脂(Phytagar)的MSBAP-3培养基中于23℃、16小时光照培养2天。与农杆菌共培养2天后,将子叶柄外植体转移到含有3mg/l BAP、头孢噻肟、羧苄青霉素或特美汀(300mg/l)的MSBAP-3培养基中7天,然后在含有头孢噻肟、羧苄青霉素或特美汀和选择剂的MSBAP-3培养基上培养直到芽再生。当芽长5-10mm时,将其切下并转移到芽伸长培养基(MSBAP-0.5,含有0.5mg/l BAP)中。将约2cm长的芽转移到生根培养基(MS0)中进行根诱导。将生根的芽移植到温室的土壤中。从对选择剂表现出耐受性且含有单拷贝T-DNA播入片段的植物产生T1种子。
苜蓿转化
利用(McKersie等1999Plant Physiol 119:839-847)的方法转化苜蓿(紫花苜蓿(Medicago sativa))的再生克隆。苜蓿的再生和转化是基因型依赖性的,因此需要再生植株。获得再生植株的方法已有描述。例如,这些可以选自栽培种Rangelander(加拿大农业(Agriculture Canada))或如Brown DCW和A Atanassov(1985.Plant Cell Tissue Organ Culture 4:111-112)所述的任何其它商业苜蓿品种。可选的,选择RA3品种(威斯康辛大学(University of Wisconsin))用于组织培养(Walker等,1978Am J Bot65:654-659)。子叶柄外植体与含有表达载体的根癌农杆菌C58C1 pMP90(McKersie等,1999 Plant Physiol 119:839-847)或LBA4404的过夜培养物进行共培养。外植体在含有288mg/L Pro、53mg/L硫代脯氨酸、4.35g/L K2SO4和100μm乙酰丁香酮的SH诱导培养基上在黑暗中共培养3天。外植体在半强度Murashige-Skoog培养基(Murashige和Skoog,1962)中洗涤,并置于相同的SH诱导培养基中,但该培养基不含乙酰丁香酮而含有合适的选择剂和合适的抗生素以抑制农杆菌生长。数周后,体细胞胚转移到不含生长调节剂、不含抗生素、含有50g/L蔗糖的BOi2Y发育培养基中。体细胞胚随后在半强度Murashige-Skoog培养基上萌发。生根的幼苗移植到花盆中并在温室中生长。从对选择剂表现出耐受性且含有单拷贝T-DNA插入片段的植物产生T1种子。
棉花转化
按照US 5,159,135中描述的方法使用根癌农杆菌转化棉花。于3%次氯酸钠溶液中20分钟,对棉花种子表面消毒,并且在具有500μg/ml头孢噻肟的蒸馏水中进行洗涤。然后将种子转移至具有50μg/ml苯菌灵(benomyl)的SH培养基中进行萌发。从4至6日龄的幼苗中取出下胚轴,切成0.5厘米的小块,置于0.8%琼脂上。将农杆菌悬浮液(每ml大约108个细胞,从用目的基因和适当的选择标记转化的过夜培养物稀释的)用于接种下胚轴外植体。在室温和光照下3天后,将组织转移至具有Murashige和Skoog盐和B5维生素(Gamborg等,Exp.Cell Res.50:151-158(1968))、0.1mg/l 2,4-D、0.1mg/l 6-糠氨基嘌呤(6-furfurylaminopurine)和750μg/ml MgCL2、以及50至100μg/ml头孢噻肟和400-500μg/ml羧苄青霉素(以杀死残留细菌)的固体培养基(1.6g/lGelrite)。在2至3个月(每4至6周进行一次传代培养)后分离单细胞系并且将其在选择培养基上进一步培养以进行组织扩增(30℃,16小时光周期)。接着将转化的组织在非选择培养基上进一步培养2至3个月以产生体细胞胚。将至少4mm长的健康外貌的胚转移至具有SH培养基(于细小蛭石中)的试管中,所述培养基补充有0.1mg/l吲哚乙酸、6-糠氨基嘌呤和赤霉酸。将胚在30℃和16小时的光周期下进行培养,将2至3叶期的小植株转移入具有蛭石和营养物的花盆。植物变硬,然后转移至温室以进一步栽培。
实施例10:表型评估方法
10.1评估设置
产生大约35个独立的T0稻转化体。原代转化体由组织培养室转移到温室进行生长并收获T1种子。保留6个其中T1代发生转基因的存在/缺乏的3∶1分离的事件。对于每一个此类事件,通过监测可视标记的表达,选出大约10个含转基因(杂合子和纯合子)的T1幼苗、以及大约10个缺少转基因(无效合子)的T1幼苗。转基因植物和相应的无效合子在随机位置上并排生长。温室条件为短白昼(12小时光照),日间28℃,夜间22℃,相对湿度70%。对在非胁迫条件下生长的植物定期浇水,以确保水和养分是非限制性的以及满足完成生长和发育的植物需要。
按照与T1代相同的评估程序,对3至4个T1事件在T2代中进行了进一步的评估,但是每个事件采用了更多的个体。从播种期到成熟期,植物数次通过数码成像箱。在每个时间点上对每株植物从至少6个不同的角度获取数码图像(2048×1536像素,1千6百万色)。
干旱筛选(C3H样多肽)
在正常条件下在花盆土中培养来自T2种子的植物,直到进入抽穗期。然后将其转移到“干”区,停止灌溉。向随机选择的花盆中插入湿度探测仪,以监测土壤水含量(SWC)。当SWC降至一定的阈值时,自动向植物持续补水,直到再次达到正常水平。然后将植物再次重新转移到正常条件下。其余的栽培(植物成熟、种子收获)与不在非生物胁迫条件下培养的植物相同。如针对在正常条件下生长所详述的那样,记录了生长和产量参数。
氮利用效率筛选(IDI2多肽)
在除营养液以外为正常的条件下在花盆土中栽培来自T2种子的稻植物。从植物移植到成熟,用特定的营养液对花盆进行灌溉,所述营养液含有减小的氮(N)含量,通常少7到8倍。其余的栽培(植物成熟、种子收获)与不在非生物胁迫条件下培养的植物相同。如对正常条件下生长所详细描述的那样,记录了生长和产量参数。
盐胁迫筛选
植物生长在由椰壳纤维和argex(3∶1)制成的基质上。在小植株移植到温室后的头两周期间应用正常营养液。过了头两周之后,向营养液中添加25mM盐(NaCl),直至收获植物。然后测量种子相关参数。
10.2统计学分析:F检验
利用双因素ANOVA(方差分析)作为统计模型,对植物表型特征进行总体评估。对用本发明基因转化的所有事件的所有植株的所有测量参数进行了F检验。进行F检验以检查基因在所有转化事件上的效应,并检验基因的总体效应,亦称为“整体基因效应”。真实整体基因效应的显著性阈值设置为F检验的5%概率水平。显著性F检验值指示存在基因效应,这意味着引起表型上差异的不仅仅是基因的存在或位置。
因为进行了具有重叠事件的两个实验,故进行组合分析。这可以用于检查效应在两个实验中的一致性,并且如果确是如此的话,积累来自两个实验的证据以增加结论的可靠性。所使用的方法是考虑数据的多层次结构(即实验-事件-分离子)的混合模型法。通过将似然比检验与卡方分布相比较来获得P值。
10.3测量的参数
生物量相关参数测量
从播种期到成熟期,植物数次通过数码成像箱。在每个时间点上对每株植物从至少6个不同的角度获取数码图像(2048×1536像素,1千6百万色)。
植物地上面积(或者说叶生物量)通过计数数码图像中区别于背景的地上植物部分的像素总数而确定。此值取同一时间点从不同的角度拍摄的照片的平均值,并通过校准转换为以平方毫米表示的物理表面值。实验表明通过这种方法测量的地上植物面积与植物地上部分的生物量相关。该地上面积是在植物达到其最大叶生物量的时间点测量的面积。早期活力是萌发后三周的植物(幼苗)地上面积。根生物量增加表达为根总生物量(测量为在植物一生中观察到的最大根生物量)的增加;或者表达为根/枝条指数(测量为在根和枝条活跃生长期中根生物量和枝条生物量之间的比值)的增加。
通过计数区别于背景的地上植物部分的像素总数,测定了早期活力。此值取同一时间点从不同的角度拍摄的照片的平均值,并通过校准转换为以平方毫米表示的物理表面值。下面描述的结果是针对萌发后3周的植物的。
种子相关参数测量
收获成熟的一级圆锥花序(primary panicles)、计数、装袋、贴上条形码标记,然后在烤箱中于37℃干燥三天。随后使圆锥花序脱粒,收集并计数所有的种子。使用鼓风装置使饱满谷壳和空壳分开。弃去空壳,再次计数剩下的部分。在分析天平上称重饱满的谷壳。通过计数在分离步骤之后剩下的饱满谷壳数,确定饱满种子数。通过称重从植物收获的所有饱满谷壳来测量种子总产量。通过计数从植物收获的谷壳数来测量每株植物的种子总数。根据计数的饱满种子数及其总重量外推得出千粒重(TKW)。收获指数(HI)在本发明中定义为种子总产量和地上面积(mm2)之间的比值再乘以因子106。每圆锥花序的花总数在本发明中定义为种子总数与成熟一级圆锥花序数之间的比率。种子饱满率在本发明中定义为饱满种子数占种子(或小花)总数的比例(以%表示)。
实施例11:表型评估方法
11.1.C3H样多肽(干旱胁迫)
在T1、T2或两代中,以下参数显著增加,来自F检验的p值为<0.05。也给出了转基因植物和对应的无效合子相比的差异百分比。
-地上生物量:7%
-根/枝条指数:-9.6(意思是根比枝条少)
-粗根的数量:5%
-种子总重:至少17%(在T2代中更高)
-饱满种子的数量:至少20.3%(在T2代中更高)
-饱满率:至少16.2%(在T2代中更高)
-收获指数:42.7%
-一级圆锥花序数:8.9%
在某些单独株系中,对于以下参数也观察到了正趋势:出苗活力(emergence vigour)、根生物量、增加的细根数量、总的种子数、增加的植株高度,每项均和对应的无效合子比较。
11.2.SPATULA样(SPT)多肽
T1和T2代转基因水稻植株的评估结果显示出与对应的无效合子相比在千粒重(TKW)上的显著增加。在生物量增加、增加的植株高度和种子总重的增加上也存正趋势。
11.3.IDI2(缺铁诱导2)多肽(氮限制条件)
在T1和T2代评估植株。当在氮限制条件下生长时,转基因植株具有在饱满种子的数量、收获指数和种子的总重上的增加;以下表E1中给出了详细数据:
表E1:转基因水稻植株数据总结;对于每一个参数,对于T1代和验证(T2代),显示了总体增加百分比,对于每一个参数,p值均为<0.05。
  参数   T1中的总体增加   T2中的总体增加
  种子总重   37.5%   19.0%
  饱满种子数   36.8%   16.6%
  收获指数   6.0%   13.5%
另外,表达IDI2核酸的植株也显示出与对照植株相比增加的生物量(地上部分和根生物量)、增加的早期活力和增加的种子总数。
11.4.eIF4F样蛋白质复合物
评估在非胁迫条件下,表达包含SEQ ID NO:240中最长开放阅读框的核酸的T2代转基因水稻植株,评估结果见以下表E2。关于转基因植株产生的细节,参见之前的实施例。在每圆锥花序的花数和最大根粗度上,观察到了(至少-超过)5%的增加。
表E2:表达SEQ ID NO:240的T2转基因水稻植株的结果
Figure BDA0000125779720001961
评估在非胁迫条件下,表达包含SEQ ID NO:300中最长开放阅读框的核酸的T1代转基因水稻植株,评估结果见下。关于转基因植株产生的细节,参见之前的实施例。在饱满率、收获指数和最大根粗度上,观察到了(至少-超过)5%的增加。
表E3:表达SEQ ID NO:300的T1转基因水稻植株的结果
Figure BDA0000125779720001971
11.5.GR-RBP(富甘氨酸RNA结合蛋白)多肽(干旱胁迫)
在T1和T2代评估植株。当在干旱胁迫条件下生长时,转基因植株具有早期活力上的增加,并显示出在生物量(地上部分和根)和种子产量上的增加;在表E4中给出了详细数据:
表E4:T1代转基因水稻植株数据总结;对于每一个参数,显示总体增加百分比,对于每一个参数,p值为<0.05。
  参数   总体
  最大面积(Area Max))   7.0
  出苗活力(EmerVigor)   14.3
  种子总重   51.5
  饱满率   63.5
  收获指数   45.2
  饱满种子数   51.1
  最大根粗度(Root Thick Max)   12.2
在T2代中再次观察到了早期活力和产量增加。
此外,当在非胁迫条件下生长时,在T1植株中观察到地上部分生物量、饱满率(每项5%以上)和千粒重(2.2%)的增加。

Claims (124)

1.用于相对于对照植物增强植物的产量相关性状的方法,包括调节编码C3H样多肽的核酸在植物中的表达,其中所述C3H样多肽包含结构域4以及结构域1、2、3和5中的任一个或多个:
结构域1:C-X2-C-X12-23-C-X2-C-X2-G-F
其中X为任何氨基酸,加下划线的残基是保守的
结构域2:Y-X7-12-L-X3-P-X10-G
其中X为任何氨基酸,加下划线的残基是保守的
结构域3:S-K-X6-P
其中X为任何氨基酸,加下划线的残基是保守的
结构域4:RING-C3H2C3类
结构域5:DUF1117。
2.根据权利要求1的方法,其中结构域1为:CYSCTRFINLSDHTL----------IVCPHCDNGF,或为包含加下划线的保守残基、并按照递增的优选次序与结构域1中没有加下划线的残基具有至少60%、65%、70%、75%、80%、85%、90%、95%或更高的序列同一性的结构域,其中“-”为空位或任何残基。
3.根据权利要求1或2的方法,其中结构域2为:YDDGDG-----SGLRPLPPTVSEFLLGSG,或为包含加下划线的保守残基、并按照递增的优选次序与结构域2中没有加下划线的残基具有至少60%、65%、70%、75%、80%、85%、90%、95%或更高的序列同一性的结构域,其中“-”为空位或任何残基。
4.根据权利要求1至3的任一项的方法,其中结构域3为:SKAAIESMP,或为包含加下划线的保守残基、并按照递增的优选次序与结构域3中没有加下划线的残基具有至少60%、65%、70%、75%、80%、85%、90%、95%或更高的序列同一性的结构域。
5.根据权利要求1至4的任一项的方法,其中结构域4为:CAVCKEEFELHAEARELPCKHLYHSDCILPWLTVRNSCPVCR,或为包含加下划线的保守残基、并按照递增的优选次序与结构域4中没有加下划线的残基具有至少60%、65%、70%、75%、80%、85%、90%、95%或更高的序列同一性的结构域。
6.根据权利要求1至5的任一项的方法,其中结构域5为:GLTIWRLPGGGFAVGRFSGGRSA-GESHFPVVYTEMDGGLN,或为按照递增的优选次序与结构域5具有至少60%、65%、70%、75%、80%、85%、90%、95%或更高的序列同一性的结构域,其中“-”为空位或任何残基。
7.根据权利要求1至6的任一项的方法,其中所述调节的表达通过向植物中引入和表达编码C3H样多肽的核酸来实现。
8.根据权利要求1至7的任一项的方法,其中所述编码C3H样多肽的核酸编码表A1所列的任一蛋白质,或是这样的核酸的部分,或是能够与这样的核酸杂交的核酸。
9.根据权利要求1至8的任一项的方法,其中所述核酸序列编码表A1中所给出的任何蛋白质的直向同源物或旁系同源物。
10.根据任何前述权利要求的方法,其中所述增强的产量相关性状包括相对于对照植物增加的产量,优选增加的生物量和/或增加的种子产量。
11.根据权利要求1至10的任一项的方法,其中在干旱胁迫条件下获得所述增强的产量相关性状。
12.根据权利要求7至11的任一项的方法,其中所述核酸有效地连接至组成型启动子,优选连接至GOS2启动子,最优选连接至来自稻的GOS2启动子。
13.根据权利要求1至12的任一项的方法,其中所述编码C3H样多肽的核酸是植物来源的,优选来自苜蓿科(Medicago),更优选蒺藜苜蓿(Medicago truncatula)。
14.可通过根据权利要求1至13的任一项的方法获得的植物或其部分,包括种子,其中所述植物或其部分包含编码C3H样多肽的重组核酸。
15.构建体,其包含:
A.编码如权利要求1至6的任一项中定义的C3H样多肽的核酸;
B.能够驱动(A)的核酸序列表达的一个或多个控制序列;和任选地
C.转录终止序列。
16.根据权利要求15的构建体,其中所述控制序列之一是组成型启动子,优选GOS2启动子,最优选来自稻的GOS2启动子。
17.根据权利要求15或16的构建体在用于制备相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量的植物的方法中的用途。
18.利用根据权利要求15或16的构建体转化的植物、植物部分或植物细胞。
19.用于产生相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量的转基因植物的方法,其包括:
(i)向植物中引入和表达编码如权利要求1至6的任一项中定义的C3H样多肽的核酸;和
(ii)在促进植物生长和发育的条件下培养所述植物细胞。
20.相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量的转基因植物,或源于所述转基因植物的转基因植物细胞,所述增加的产量因编码如权利要求1至6的任一项中定义的C3H样多肽的核酸的被调节的表达而产生。
21.根据权利要求14、18或20的转基因植物或源于其的转基因植物细胞,其中所述植物是作物植物或单子叶植物或谷类植物,例如稻、玉米、小麦、大麦、粟、黑麦、黑小麦、高粱、二粒小麦、斯佩耳特小麦、裸麦、单粒小麦、埃塞俄比亚画眉草、买罗高梁和燕麦。
22.根据权利要求21的植物的可收获部分,其中所述可收获部分优选是枝条生物量和/或种子。
23.从根据权利要求21的植物和/或从根据权利要求22的植物的可收获部分产生的产品。
24.编码C3H样多肽的核酸在相对于对照植物增加植物的产量,特别是增加种子产量和/或枝条生物量中的用途。
25.用于相对于对照植物增强植物的产量相关性状的方法,包括调节编码SPT样多肽的核酸在植物中的表达,所述SPT样多肽包含以下每一个基序,优选从N-末端到C-末端:
基序I:包含EEISTFLHQLLH的两亲螺旋,或按照递增的优选次序与基序I具有至少60%、65%、70%、75%、80%、85%、90%、95%或更高的序列同一性的基序;以及
基序II:包含DLGDFSCDSEK的酸性结构域,或按照递增的优选次序与基序II具有至少60%、65%、70%、75%、80%、85%、90%、95%或更高的序列同一性的基序;以及
基序III:包含AAEVHNLSEKRRRSRINEKMKALQNLIPNSNKTDKASMLDEAIEYLKQL的bHLH结构域,或按照递增的优选次序与基序III具有至少60%、65%、70%、75%、80%、85%、90%、95%或更高的序列同一性的基序。
26.根据权利要求25的方法,其中SPT样多肽还包含一个或多个富含丝氨酸的区域。
27.根据权利要求25或26的方法,其中bHLH结构域还包含一个或多个核定位信号(NLS)。
28.根据权利要求25至27的任一项的方法,其中SPT样多肽包含在最靠近C-末端区域与bHLH结构域相邻的β链,其中β链优选包含QLQVQMLTM。
29.根据权利要求25至28的任一项的方法,其中所述调节的表达通过向植物中引入和表达编码SPT样多肽的核酸来实现。
30.根据权利要求25至29的任一项的方法,其中所述编码SPT样多肽的核酸编码表A2所列的任一蛋白质,或是这样的核酸的部分,或是能够与这样的核酸杂交的核酸。
31.根据权利要求25至30的任一项的方法,其中所述核酸序列编码表A2中所给出的任何蛋白质的直向同源物或旁系同源物。
32.根据权利要求25至31的任一项的方法,其中所述增强的产量相关性状包括相对于对照植物增加的产量,优选增加的生物量和/或增加的种子产量。
33.根据权利要求25至32的任一项的方法,其中在非胁迫条件下获得所述增强的产量相关性状。
34.根据权利要求25至33的任一项的方法,其中在干旱胁迫、盐胁迫或氮缺乏条件下获得所述增强的产量相关性状。
35.根据权利要求27至32的任一项的方法,其中所述核酸有效地连接至组成型启动子,优选连接至GOS2启动子,最优选连接至来自稻的GOS2启动子。
36.根据权利要求25至35的任一项的方法,其中所述编码SPT样多肽的核酸是植物来源的,优选来自杨柳科、更优选来自杨属(Populus),最优选来自毛果杨(Populus trichocarpa)。
37.可通过根据权利要求25至36的任一项的方法获得的植物或其部分,包括种子,其中所述植物或其部分包含编码如权利要求25至29的任一项中定义的SPT样多肽的重组核酸。
38.构建体,其包含:
(i)编码如权利要求25至29的任一项中定义的SPT样多肽的核酸;
(ii)能够驱动(i)的核酸序列表达的一个或多个控制序列;和任选地
(iii)转录终止序列。
39.根据权利要求38的构建体,其中所述控制序列之一是组成型启动子,优选GOS2启动子,最优选来自稻的GOS2启动子。
40.根据权利要求38或39的构建体在用于制备相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量的植物的方法中的用途。
41.利用根据权利要求38或39的构建体转化的植物、植物部分或植物细胞。
42.用于产生相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量的转基因植物的方法,其包括:
(i)向植物中引入和表达编码如权利要求25至28的任一项中定义的SPT样多肽的核酸;和
(ii)在促进植物生长和发育的条件下培养所述植物细胞。
43.相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量的转基因植物,或源于所述转基因植物的转基因植物细胞,所述增加的产量因编码如权利要求25至28的任一项中定义的SPT样多肽的核酸的被调节的表达而产生。
44.根据权利要求37、41或43的转基因植物或源于其的转基因植物细胞,其中所述植物是作物植物或单子叶植物或谷类植物,例如稻、玉米、小麦、大麦、粟、黑麦、黑小麦、高粱、二粒小麦、斯佩耳特小麦、裸麦、单粒小麦、埃塞俄比亚画眉草、买罗高梁和燕麦。
45.根据权利要求44的植物的可收获部分,其中所述可收获部分优选是枝条生物量和/或种子。
46.从根据权利要求44的植物和/或从根据权利要求45的植物的可收获部分产生的产品。
47.编码如权利要求25至29的任一项中定义的SPT样多肽的核酸在相对于对照植物增加植物的产量,特别是增加种子产量和/或枝条生物量中的用途。
48.用于相对于对照植物增强植物的产量相关性状的方法,包括调节编码IDI2多肽的核酸在植物中的表达,其中所述IDI2多肽包含IF-2B结构域。
49.根据权利要求48的方法,其中所述IDI2多肽包含SEQ IDNO:141至SEQ ID NO:146之任一所示的基序中的一个或多个。
50.根据权利要求48或49的方法,其中所述调节的表达通过向植物中引入和表达编码IDI2多肽的核酸来实现。
51.根据权利要求48至49的任一项的方法,其中所述编码IDI2多肽的核酸编码表A3所列的任一蛋白质,或是这样的核酸的部分,或是能够与这样的核酸杂交的核酸。
52.根据权利要求48至51的任一项的方法,其中所述核酸序列编码表A3中所给出的任何蛋白质的直向同源物或旁系同源物。
53.根据权利要求48至52的任一项的方法,其中所述增强的产量相关性状包括相对于对照植物增加的产量,优选增加的种子产量。
54.根据权利要求48至53的任一项的方法,其中在氮缺乏条件下获得所述增强的产量相关性状。
55.根据权利要求50至54的任一项的方法,其中所述核酸有效地连接至组成型启动子,优选连接至GOS2启动子,最优选连接至来自稻的GOS2启动子。
56.根据权利要求48至55的任一项的方法,其中所述编码IDI2多肽的核酸是植物来源的,优选来自单子叶植物,再优选来自禾本科(Poaceae),更优选来自甘蔗属(Saccharum),最优选来自甘蔗(Saccharum officinarum)。
57.可通过根据权利要求48至56的任一项的方法获得的植物或其部分,包括种子,其中所述植物或其部分包含编码IDI2多肽的重组核酸。
58.构建体,其包含:
(i)编码如权利要求48或49中定义的IDI2多肽的核酸;
(ii)能够驱动(i)的核酸序列表达的一个或多个控制序列;和任选地
(iii)转录终止序列。
59.根据权利要求58的构建体,其中所述控制序列之一是组成型启动子,优选GOS2启动子,最优选来自稻的GOS2启动子。
60.根据权利要求58或59的构建体在用于制备相对于对照植物具有增加的产量,特别是增加的种子产量,的植物的方法中的用途。
61.利用根据权利要求58或59的构建体转化的植物、植物部分或植物细胞。
62.用于产生相对于对照植物具有增加的产量,特别是增加的种子产量的转基因植物的方法,其包括:
(i)向植物中引入和表达编码如权利要求48或49中定义的IDI2多肽的核酸;和
(ii)在促进植物生长和发育的条件下培养所述植物细胞。
63.相对于对照植物具有增加的产量,特别是增加的种子产量的转基因植物,或源于所述转基因植物的转基因植物细胞,所述增加的产量因编码如权利要求48或49中定义的IDI2多肽的核酸的被调节的表达而产生。
64.根据权利要求57、61或63的转基因植物或源于其的转基因植物细胞,其中所述植物是作物植物或单子叶植物或谷类植物,例如稻、玉米、小麦、大麦、粟、黑麦、黑小麦、高粱、二粒小麦、斯佩耳特小麦、裸麦、单粒小麦、埃塞俄比亚画眉草、买罗高梁和燕麦。
65.根据权利要求64的植物的可收获部分,其中所述可收获部分优选是种子。
66.从根据权利要求64的植物和/或从根据权利要求65的植物的可收获部分产生的产品。
67.编码IDI2多肽的核酸在相对于对照植物增加植物的产量,特别是增加种子产量中的用途。
68.分离的核酸分子,其选自:
(i)SEQ ID NO:139、157、164、169、171、186之任一所示的核酸;
(ii)SEQ ID NO:139、157、164、169、171、186之任一所示的核酸的互补序列;
(iii)编码IDI2多肽的核酸,所述多肽按照递增的优选次序与SEQID NO:140、202、209、214、216、231之任一所示的氨基酸序列具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的序列同一性,并包含基序1至6中的一个或多个。
69.分离的多肽,其选自:
(i)SEQ ID NO:140、202、209、214、216、231之任一所示的氨基酸序列;
(ii)按照递增的优选次序与SEQ ID NO:140、202、209、214、216、231之任一所示的氨基酸序列具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的序列同一性、并包含基序1至6中的一个或多个的氨基酸序列。
(iii)上面(i)或(ii)所给出的任何氨基酸序列的衍生物。
70.用于相对于对照植物增强植物的产量相关性状的方法,包括通过调节和表达eIF4F样蛋白质复合物的亚基多肽和/或其同种型,和/或通过调节eIF4F样蛋白质复合物的水平,来调节eIF4F样蛋白质复合物的活性,其中所述eIF4F样蛋白质复合物包含亚基eIF4G、eIF4A和eIF4E或其同种型,所述亚基分别包含以下具有Pfam登录号的CC结构域:
(i)对于eIF4G多肽:MA3(PFam登录号:PF02847)和MIF4G(PFam登录号:PF02854);
(ii)对于eIF4A多肽:DEAD(PFam登录号:PF00270)和Helicase_C(PFam登录号:PF00271);
(iii)对于eIF4E多肽:IF4E(PFam登录号:PF01652)。
71.根据权利要求70的方法,其中所述eIF4G亚基多肽包含CC结构域,该CC结构域
(i)如SEQ ID NO:240所示,和/或
(ii)优选地与SEQ ID NO:241所示的eIF4G多肽具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性。
72.根据权利要求70的方法,其中所述eIF4A亚基多肽包含CC结构域,该CC结构域
(i)如SEQ ID NO:300所示,和/或
(ii)优选地与SEQ ID NO:301所示的eIF4G多肽具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性。
73.根据权利要求70的方法,其中所述eIF4E亚基多肽包含CC结构域,该CC结构域
(i)如SEQ ID NO:560所示,和/或
(ii)优选地与SEQ ID NO:561所示的eIF4G多肽具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性。
74.根据权利要求70或71的方法,其中所述eIF4G亚基多肽包含以下基序:
基序7:KAV[LF]EPTFCPMYA[QL]LCSDLNEKLP[PS]FPS[ED]EPGGKEITFKRVLLN[NI]C QEAF、或按照递增的优选次序与基序7具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或更高的序列同一性的基序;
基序8:CP[AE]EENVEAIC[QH]FFNTIGKQLDE[SN]PKSRRIND[MVT]YF[SIN][RQ]LKEL[TS][TS]NPQLAPR、或按照递增的优选次序与基序8具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或更高的序列同一性的基序;
基序9:T[AG]P[DE]QE[ML]ERRDKERLVKLRTLGNIRLIGELLKQKMVPEKIVHHIVQEL LG、或按照递增的优选次序与基序9具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或更高的序列同一性的基序;
或者
基序10:TPQNF[ED][KR]LFEQVKAVNIDN[AV]VTL[TN]GVISQIF[DE]KALMEPTFCEMY ANFCFH、或按照递增的优选次序与基序10具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或更高的序列同一性的基序;
基序11:IGELYKK[RK]MLTERIMHECIKKLLGQYQ[DN]PDEE[DN][IV]E[AS]LCKLMSTIG EMIDH、或按照递增的优选次序与基序11具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或更高的序列同一性的基序;
基序12:LSNN[MQ][KN]LSSRVRFMLKD[ASV]IDLRKNKWQQRRKVEGPKKIEEVHRDA AQERQ或按照递增的优选次序与基序12具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或更高的序列同一性的基序。
75.根据权利要求74的方法,其中所述eIF4G亚基多肽优选为eIF4isoG多肽并包含以下基序:
基序7:KAV[LF]EPTFCPMYA[QL]LCSDLNEKLP[PS]FPS[ED]EPGGKEITFKRVLLN[NI]C QEAF、或按照递增的优选次序与基序7具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或更高的序列同一性的基序;
基序8:CP[AE]EENVEAIC[QH]FFNTIGKQLDE[SN]PKSRRIND[MVT]YF[SIN][RQ]LKEL[TS][TS]NPQLAPR、或按照递增的优选次序与基序8具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或更高的序列同一性的基序;
基序9:T[AG]P[DE]QE[ML]ERRDKERLVKLRTLGNIRLIGELLKQKMVPEKIVHHIVQEL LG、或按照递增的优选次序与基序9具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或更高的序列同一性的基序。
76.根据权利要求70或72的方法,其中所述eIF4A亚基多肽包含以下基序:
基序13:RDELTLEGIKQF[YF]V[NA]V[ED][KR]EEWK[LF][DE]TLCDLY[ED]TL[AT]ITQ[SA]VIF、或按照递增的优选次序与基序13具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或更高的序列同一性的基序;
基序14:SLVINYDLP[TN][QN][PR]E[NL]Y[LI]HRIGRSGRFGRKGVAINF、或按照递增的优选次序与基序14具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或更高的序列同一性的基序;
基序15:MG[LI][QK]E[ND]LLRGIYAYGFEKPSAIQQR[GA][IV]VP[FI][CI]KG[LR]DVI[QA]QAQSGTGKT[AS][TM][FI]、或按照递增的优选次序与基序15具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或更高的序列同一性的基序。
77.根据权利要求70或73的方法,其中所述eIF4E亚基多肽包含以下基序:
基序16:YTFSTVE[ED]FW[SG]LYNNIH[HR]PSKLAVGADF[HY]CFK[NH]KIEPKWEDP[VI]CANGGKW、或按照递增的优选次序与基序16具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或更高的序列同一性的基序;
基序17:T[SC]WLYTLLA[ML]IGEQFD[HY]GD[ED]ICGAVV[NS]VR、或按照递增的优选次序与基序17具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或更高的序列同一性的基序;
基序18:E[KR]I[AS][LI]WTKNA[AS]NE[AST]AQ[VL]SIGKQWKEFLDYN[DE][TS]IGFIFH[ED]DA、或按照递增的优选次序与基序18具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或更高的序列同一性的基序;
或者
基序19:WCLYDQ[IV]F[KR]PSKLP[GA]NADFHLFKAG[VI]EPKWEDPECANGGKW、或按照递增的优选次序与基序19具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或更高的序列同一性的基序;
基序20:L[ED]TMWLETLMALIGEQFD[ED][AS][DE][ED]ICGVVASVR、或按照递增的优选次序与基序20具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或更高的序列同一性的基序;
基序21:QDKL[SA]LWT[KR][TN]A[AS]NEA[AV]QM[SG]IG[RK]KWKE[IV]ID、或按照递增的优选次序与基序21具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或更高的序列同一性的基序。
78.根据权利要求70至77的任一项的方法,其中所述亚基eIF4E、eIF4G和eIF4A的至少一个的所述调节的表达通过引入和表达至少编码eIF4F亚基多肽之一的核酸,或至少这样的核酸的部分,或能够与这样的核酸杂交的核酸来实现。
79.根据权利要求70、71、74或75的方法,其中所述核酸编码eIF4G亚基多肽和/或其同种型,或是这样的核酸的部分,或是能够与这样的核酸杂交的核酸,其中该eIF4F亚基多肽优选为eIF4isoG亚基。
80.根据权利要求70、72或76的方法,其中所述核酸编码eIF4A亚基多肽和/或其同种型,或是这样的核酸的部分,或是能够与这样的核酸杂交的核酸,其该eIF4F亚基优选为eIF4A亚基。
81.根据权利要求70、73或77的方法,其中所述核酸编码eIF4E亚基多肽和/或其同种型,或是这样的核酸的部分,或是能够与这样的核酸杂交的核酸,其中该eIF4F亚基优选为eIF4isoE亚基。
82.根据权利要求70至81之任一项的方法,其中所述编码eIF4F亚基多肽的核酸或该核酸的部分或能够与该核酸杂交的核酸被过量表达,优选那些编码eIF4G和/或eIF4A和/或它们的同种型的核酸,特别是那些编码eIF4isoG和/或eIF4A的核酸。
83.根据权利要求70至82的任一项的方法,其中所述核酸序列编码表A4中所给出的任何多肽的直向同源物或旁系同源物。
84.根据权利要求70至83的任一项的方法,其中所述增强的产量相关性状包括相对于对照植物增加的产量,优选增加的生物量和/或增加的种子产量。
85.根据权利要求70至84的任一项的方法,其中在非胁迫条件下获得所述增强的产量相关性状。
86.根据权利要求70至85的任一项的方法,其中在干旱胁迫、盐胁迫或氮缺乏条件下获得所述增强的产量相关性状。
87.根据权利要求72至86的任一项的方法,其中所述核酸有效地连接至组成型启动子,优选连接至GOS2启动子,最优选连接至来自稻的GOS2启动子。
88.根据权利要求70至87的任一项的方法,其中所述编码至少一个eIF4F多肽亚基的核酸是植物来源的,优选来自双子叶植物,更优选来自十字花科,更优选来自拟南芥属(Arabidopsis),最优选来自拟南芥(Arabidopsis thaliana)。
89.可通过根据权利要求70至88的任一项的方法获得的植物或其部分,包括种子,其中所述植物或其部分包含至少编码一个eIF4F多肽亚基的重组核酸。
90.构建体,其包含:
(i)编码至少一个如权利要求70或71中定义的eIF4F多肽亚基的核酸;
(ii)能够驱动(i)的核酸序列表达的一个或多个控制序列;和任选地
(iii)转录终止序列。
91.根据权利要求90的构建体,其中所述控制序列之一是组成型启动子,优选GOS2启动子,最优选来自稻的GOS2启动子。
92.根据权利要求90或91的构建体在用于制备相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量的植物的方法中的用途。
93.利用根据权利要求90或91的构建体转化的植物、植物部分或植物细胞。
94.用于产生相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量的转基因植物的方法,其包括:
(i)向植物中引入和表达编码至少一个如权利要求70或71中定义的eIF4F多肽亚基的核酸;和
(ii)在促进植物生长和发育的条件下培养所述植物细胞。
95.相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量的转基因植物,或源于所述转基因植物的转基因植物细胞,所述增加的产量因至少编码至少一个如权利要求70或71中定义的eIF4F多肽亚基的核酸的被调节的表达而产生。
96.根据权利要求89、93或95的转基因植物或源于其的转基因植物细胞,其中所述植物是作物植物或单子叶植物或谷类植物,例如稻、玉米、小麦、大麦、粟、黑麦、黑小麦、高粱、二粒小麦、斯佩耳特小麦、裸麦、单粒小麦、埃塞俄比亚画眉草、买罗高梁和燕麦。
97.根据权利要求96的植物的可收获部分,其中所述可收获部分优选是枝条生物量和/或种子。
98.从根据权利要求96的植物和/或从根据权利要求97的植物的可收获部分产生的产品。
99.编码至少一个eIF4F多肽亚基的核酸在相对于对照植物增加植物的产量,特别是增加种子产量和/或枝条生物量中的用途。
100.分离的核酸分子,其选自:
(i)SEQ ID NO:306所示的核酸;
(ii)SEQ ID NO:306所示的核酸的互补序列;
(iii)编码SEQ ID NO:307所示多肽的核酸,优选地由于遗传密码的简并性结果,所述分离的核酸可以来源于SEQ ID NO:307所示的多肽序列并还优选地赋予相对于对照植物增强的产量相关性状;
(iv)按照递增的优选次序与表A4的核酸序列之任一具有至少30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性并优选地赋予相对于对照植物增强的产量相关性状的核酸;
(v)在严紧杂交条件下与(i)至(iv)的核酸分子杂交并优选地赋予相对于对照植物增强的产量相关性状的核酸分子;
(vi)编码至少一个eIF4F亚基多肽并优选地赋予相对于对照植物增强的产量相关性状的核酸,其中所述多肽按照递增的优选次序与SEQ IDNO:307所示的氨基酸序列或表A4中其它氨基酸序列之任一具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性。
101.分离的多肽,其选自:
(i)SEQ ID NO:307所示的氨基酸序列;
(ii)按照递增的优选次序与SEQ ID NO:307所示的氨基酸序列以及表A4中其它氨基酸序列之任一具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性并优选地赋予相对于对照植物增强的产量相关性状的氨基酸序列;
(iii)上(i)或(ii)所给出的任何氨基酸序列的衍生物。
102.用于相对于对照植物增强植物的产量相关性状的方法,包括调节编码富甘氨酸RNA结合蛋白(GR-RBP多肽)的核酸在植物中的表达,其中所述GR-RBP多肽包含RNA识别基序1(Pfam登录号PF00076、RRM_1)。
103.根据权利要求102的方法,其中所述GR-RBP多肽包含SEQID NO:828至SEQ ID NO:837中给出的一个或多个标签序列或基序。
104.根据权利要求102或103的方法,其中所述调节的表达通过向植物中引入和表达编码GR-RBP多肽的核酸来实现。
105.根据权利要求102至104的任一项的方法,其中所述编码GR-RBP多肽的核酸编码表A5所列的任一蛋白质,或是这样的核酸的部分,或是能够与这样的核酸杂交的核酸。
106.根据权利要求102至105的任一项的方法,其中所述核酸序列编码表A5中所给出的任何蛋白质的直向同源物或旁系同源物。
107.根据权利要求102至106的任一项的方法,其中所述增强的产量相关性状包括相对于对照植物增加的早期活力和/或增加的产量,优选增加的生物量和/或增加的种子产量。
108.根据权利要求102至107的任一项的方法,其中在干旱胁迫条件下获得所述增强的产量相关性状。
109.根据权利要求102至107的任一项的方法,其中在非胁迫条件下获得所述增强的产量相关性状。
110.根据权利要求104至109的任一项的方法,其中所述核酸有效地连接至组成型启动子,优选连接至GOS2启动子,最优选连接至来自稻的GOS2启动子。
111.根据权利要求102至110的任一项的方法,其中所述编码GR-RBP多肽的核酸是植物来源的,优选来自单子叶植物,再优选来自禾本科(Poaceae),更优选来自稻属(Oryza),最优选核酸来自稻(Oryzasativa)。
112.可通过根据权利要求102至111的任一项的方法获得的植物或其部分,包括种子,其中所述植物或其部分包含编码GR-RBP多肽的重组核酸。
113.构建体,其包含:
(i)编码如权利要求102或103中定义的GR-RBP多肽的核酸;
(ii)能够驱动(i)的核酸序列表达的一个或多个控制序列;和任选地
(iii)转录终止序列。
114.根据权利要求113的构建体,其中所述控制序列之一是组成型启动子,优选GOS2启动子,最优选来自稻的GOS2启动子。
115.根据权利要求113或114的构建体在用于制备相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量的植物的方法中的用途。
116.利用根据权利要求113或114的构建体转化的植物、植物部分或植物细胞。
117.用于产生相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量的转基因植物的方法,其包括:
(i)向植物中引入和表达编码如权利要求102或103中定义的GR-RBP多肽的核酸;和
(ii)在促进植物生长和发育的条件下培养所述植物细胞。
118.相对于对照植物具有增加的产量,特别是增加的早期活力、增加的生物量和/或增加的种子产量的转基因植物,或源于所述转基因植物的转基因植物细胞,所述增加的产量因编码如权利要求102或103中定义的GR-RBP多肽的核酸的被调节的表达而产生。
119.根据权利要求112、116或118的转基因植物或源于其的转基因植物细胞,其中所述植物是作物植物或单子叶植物或谷类植物,例如稻、玉米、小麦、大麦、粟、黑麦、黑小麦、高粱、二粒小麦、斯佩耳特小麦、裸麦、单粒小麦、埃塞俄比亚画眉草、买罗高梁和燕麦。
120.根据权利要求119的植物的可收获部分,其中所述可收获部分优选是枝条生物量和/或种子。
121.从根据权利要求119的植物和/或从根据权利要求120的植物的可收获部分产生的产品。
122.编码GR-RBP多肽的核酸在相对于对照植物增加植物的产量,特别是增加早期活力、种子产量和/或枝条生物量中的用途。
123.分离的核酸分子,其选自:
(i)SEQ ID NO:848、849、851、852、853、854、857、862、873、874、875、876、878、879、893、897、898、900、901、905、928、931、932、933、934、937之任一所示的核酸;
(ii)SEQ ID NO:848、849、851、852、853、854、857、862、873、874、875、876、878、879、893、897、898、900、901、905、928、931、932、933、934、937之任一所示的核酸的互补序列;
(iii)编码GR-RBP多肽的核酸,其中所述多肽按照递增的优选次序与SEQ ID NO:945、946、948、949、950、951、854、959、970、971、972、973、975、976、990、994、995、997、998、1002、1025、1028、1029、1030、1031、1034之任一所示的氨基酸序列具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的序列同一性,并包含标签序列3(SEQ ID NO:830)和标签序列4(SEQ ID NO:831)。
124.分离的多肽,其选自:
(i)SEQ ID NO:945、946、948、949、950、951、854、959、970、971、972、973、975、976、990、994、995、997、998、1002、1025、1028、1029、1030、1031、1034之任一所示的氨基酸序列;
(ii)按照递增的优选次序与SEQ ID NO:945、946、948、949、950、951、854、959、970、971、972、973、975、976、990、994、995、997、998、1002、1025、1028、1029、1030、1031、1034之任一所示的氨基酸序列具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的序列同一性、并包含标签序列3(SEQ ID NO:830)和标签序列4(SEQ ID NO:831)的氨基酸序列;
(iii)上(i)或(ii)所给出的任何氨基酸序列的衍生物。
CN2010800289562A 2009-04-29 2010-04-27 具有增强的产量相关性状的植物及其制备方法 Pending CN102459613A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510126199.7A CN104789573A (zh) 2009-04-29 2010-04-27 具有增强的产量相关性状的植物及其制备方法

Applications Claiming Priority (21)

Application Number Priority Date Filing Date Title
EP09100262 2009-04-29
EP09100262.6 2009-04-29
EP09100263 2009-04-29
EP09100259 2009-04-29
EP09100260.0 2009-04-29
EP09100260 2009-04-29
EP09100263.4 2009-04-29
EP09100257 2009-04-29
EP09100257.6 2009-04-29
EP09100259.2 2009-04-29
US18094609P 2009-05-26 2009-05-26
US18094509P 2009-05-26 2009-05-26
US18094209P 2009-05-26 2009-05-26
US61/180942 2009-05-26
US61/180946 2009-05-26
US61/180945 2009-05-26
US18169209P 2009-05-28 2009-05-28
US18168809P 2009-05-28 2009-05-28
US61/181688 2009-05-28
US61/181692 2009-05-28
PCT/EP2010/055579 WO2010125036A2 (en) 2009-04-29 2010-04-27 Plants having enhanced yield-related traits and a method for making the same

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN201510126199.7A Division CN104789573A (zh) 2009-04-29 2010-04-27 具有增强的产量相关性状的植物及其制备方法

Publications (1)

Publication Number Publication Date
CN102459613A true CN102459613A (zh) 2012-05-16

Family

ID=42243108

Family Applications (2)

Application Number Title Priority Date Filing Date
CN2010800289562A Pending CN102459613A (zh) 2009-04-29 2010-04-27 具有增强的产量相关性状的植物及其制备方法
CN201510126199.7A Pending CN104789573A (zh) 2009-04-29 2010-04-27 具有增强的产量相关性状的植物及其制备方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN201510126199.7A Pending CN104789573A (zh) 2009-04-29 2010-04-27 具有增强的产量相关性状的植物及其制备方法

Country Status (10)

Country Link
US (1) US20120090052A1 (zh)
EP (1) EP2424996A2 (zh)
CN (2) CN102459613A (zh)
AR (1) AR077914A1 (zh)
AU (1) AU2010243646A1 (zh)
BR (1) BRPI1014386A2 (zh)
CA (1) CA2760266A1 (zh)
DE (1) DE112010001805T5 (zh)
MX (1) MX2011011454A (zh)
WO (1) WO2010125036A2 (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103146712A (zh) * 2013-03-22 2013-06-12 南京农业大学 菊花bHLH转录因子CmbHLH1基因及其植物表达载体和应用
CN103451169A (zh) * 2012-06-01 2013-12-18 中国科学院上海生命科学研究院 一种调控木材发育的相关基因及其应用
CN104877993A (zh) * 2015-04-24 2015-09-02 浙江省农业科学院 两种植物eIF4A基因及其用于制备转基因耐水稻条纹病毒植物体的应用
CN105441475A (zh) * 2014-05-02 2016-03-30 中央研究院 具有增加微量元素含量的转基因植物及其生产方法
CN105821041A (zh) * 2012-06-01 2016-08-03 中国科学院上海生命科学研究院 一种调控木材发育的相关基因及其应用
WO2019024379A1 (zh) * 2017-07-31 2019-02-07 康码(上海)生物科技有限公司 新型融合蛋白的制备及其在提高蛋白质合成的应用
CN110003317A (zh) * 2019-04-29 2019-07-12 清华大学 eIFiso4G2蛋白在调控植物对ABA耐受性中的应用
CN110079547A (zh) * 2019-04-29 2019-08-02 清华大学 eIF4G蛋白在调控植物对ABA耐受性中的应用
CN110845622A (zh) * 2018-08-21 2020-02-28 康码(上海)生物科技有限公司 不同结构域缺失融合蛋白的制备及其在提高蛋白质合成的应用
CN111778169A (zh) * 2018-01-31 2020-10-16 康码(上海)生物科技有限公司 一种提高体外蛋白合成效率的方法
CN113046364A (zh) * 2021-04-06 2021-06-29 台州学院 水稻OsATL9基因在调控水稻抗性中的应用
CN114641574A (zh) * 2019-07-03 2022-06-17 英美烟草(投资)有限公司 用于改变植物中生物碱含量的方法

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104087588B (zh) * 2014-07-08 2016-06-22 安徽省农业科学院水稻研究所 响应环境水分胁迫的水稻干旱诱导型启动子POsDro4
WO2016050511A1 (en) * 2014-10-03 2016-04-07 Bayer Cropscience Nv Methods and means for increasing stress tolerance and biomass in plants
CN106754967B (zh) * 2017-01-19 2020-04-28 南京农业大学 一种水稻粒型基因OsLG1及其编码蛋白质和应用
UY38025A (es) * 2017-12-21 2019-07-31 Univ La Republica Métodos para mejorar la tolerancia al estrés abiótico en plantas y el rendimiento de las mismas
CN113163728B (zh) * 2018-11-28 2023-08-25 龟甲万株式会社 菜豆金色花叶病毒属病毒抗性番茄细胞的制作方法
CN110499326B (zh) * 2019-07-17 2021-06-04 山东农业大学 Rgga在调控作物农艺性状中的应用
CN114231542B (zh) * 2022-01-21 2023-02-24 沈阳农业大学 一种影响山新杨耐盐性的bHLH基因及其应用
WO2024023207A1 (en) * 2022-07-29 2024-02-01 Limagrain Europe Eif(iso)4e protein variants for resistance to maize viral diseases
CN116375838B (zh) * 2023-05-26 2023-08-15 西北农林科技大学深圳研究院 小麦翻译起始因子TaeIF4A及其应用

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002057469A2 (en) * 2001-01-19 2002-07-25 Expressive Research B.V. Modulating developmental transitions in plants
CN1478148A (zh) * 2000-12-02 2004-02-25 基诺麦因有限公司 可增强植物对渗透压的抵抗力的新转录因子
WO2008008396A2 (en) * 2006-07-12 2008-01-17 The Board Of Trustees Operating Dna encoding ring zine-finger protein and the use of the dna in vectors and bacteria and in plants
WO2009003977A2 (en) * 2007-06-29 2009-01-08 Basf Plant Science Gmbh Plants having enhanced yield-related traits and a method for making the same

Family Cites Families (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4962028A (en) 1986-07-09 1990-10-09 Dna Plant Technology Corporation Plant promotors
US5116742A (en) 1986-12-03 1992-05-26 University Patents, Inc. RNA ribozyme restriction endoribonucleases and methods
US4987071A (en) 1986-12-03 1991-01-22 University Patents, Inc. RNA ribozyme polymerases, dephosphorylases, restriction endoribonucleases and methods
US5004863B2 (en) 1986-12-03 2000-10-17 Agracetus Genetic engineering of cotton plants and lines
AU3756889A (en) 1988-06-01 1990-01-05 The Texas A & M University System Method for transforming plants via the shoot apex
WO1993022443A1 (en) 1992-04-24 1993-11-11 Sri International In vivo homologous sequence targeting in eukaryotic cells
NZ253963A (en) 1992-06-29 1997-08-22 Gene Shears Pty Ltd Nucleic acid molecule capable of blocking or interfering with viral replication and its use in transforming plant and animal life forms
US5401836A (en) 1992-07-16 1995-03-28 Pioneer Hi-Bre International, Inc. Brassica regulatory sequence for root-specific or root-abundant gene expression
WO1994012015A1 (en) 1992-11-30 1994-06-09 Chua Nam Hai Expression motifs that confer tissue- and developmental-specific expression in plants
WO1995003404A1 (en) 1993-07-22 1995-02-02 Gene Shears Pty Limited Dna virus ribozymes
RU2142998C1 (ru) 1993-11-19 1999-12-20 Биотекнолэджи Рисеч энд Дивелопмент Копэрейшн Химерный регуляторный участок для экспрессии генов в растениях (варианты), кластер для экспрессии гена (варианты), кластер для индуцибельной экспрессии чужеродного гена (варианты), способ экспрессии гена в растении (варианты), способ индуцибельной экспрессии чужеродного гена в растении (варианты) и плазмида (варианты)
EP0733059B1 (en) 1993-12-09 2000-09-13 Thomas Jefferson University Compounds and methods for site-directed mutations in eukaryotic cells
US6395547B1 (en) 1994-02-17 2002-05-28 Maxygen, Inc. Methods for generating polynucleotides having desired characteristics by iterative selection and recombination
US5605793A (en) 1994-02-17 1997-02-25 Affymax Technologies N.V. Methods for in vitro recombination
JPH11513256A (ja) 1995-10-06 1999-11-16 プラント ジエネテイツク システムズ エヌ.ブイ 種子粉砕
US7390937B2 (en) 1996-02-14 2008-06-24 The Governors Of The University Of Alberta Plants with enhanced levels of nitrogen utilization proteins in their root epidermis and uses thereof
GB9607517D0 (en) 1996-04-11 1996-06-12 Gene Shears Pty Ltd The use of DNA Sequences
GB9703146D0 (en) 1997-02-14 1997-04-02 Innes John Centre Innov Ltd Methods and means for gene silencing in transgenic plants
GB9710475D0 (en) 1997-05-21 1997-07-16 Zeneca Ltd Gene silencing
GB9720148D0 (en) 1997-09-22 1997-11-26 Innes John Centre Innov Ltd Gene silencing materials and methods
WO1999053050A1 (en) 1998-04-08 1999-10-21 Commonwealth Scientific And Industrial Research Organisation Methods and means for obtaining modified phenotypes
CN1268749C (zh) 1998-06-26 2006-08-09 爱阿华州立大学研究机构 用于改变植物中酶和乙酰辅酶a水平的材料和方法
US6555732B1 (en) 1998-09-14 2003-04-29 Pioneer Hi-Bred International, Inc. Rac-like genes and methods of use
US20080229439A1 (en) * 1999-05-06 2008-09-18 La Rosa Thomas J Nucleic acid molecules and other molecules associated with transcription in plants and uses thereof for plant improvement
US20040031072A1 (en) * 1999-05-06 2004-02-12 La Rosa Thomas J. Soy nucleic acid molecules and other molecules associated with transcription plants and uses thereof for plant improvement
EP1198985B1 (en) 1999-07-22 2010-09-08 National Institute Of Agrobiological Sciences Method for superrapid transformation of monocotyledon
JP2003507074A (ja) 1999-08-26 2003-02-25 ビーエーエスエフ プランド サイエンス ゲーエムベーハー 構成的植物v−atpアーゼプロモーターにより制御される植物遺伝子発現
ES2279339T3 (es) 2003-01-21 2007-08-16 Cropdesign N.V. Uso de la secuencia reguladora del gen gos2 del arroz para la expresion genica en plantas o celulas de plantas dicotiledoneas.
ATE362541T1 (de) 2003-02-04 2007-06-15 Cropdesign Nv Promotor aus reis
CN101415829B (zh) * 2006-03-31 2014-03-12 巴斯福植物科学有限公司 具有增强的产量相关性状的植物和用于产生该植物的方法
BRPI0911501A2 (pt) * 2008-04-29 2015-07-28 Monsanto Technology Llc Genes e usos para melhoramento de plantas.

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1478148A (zh) * 2000-12-02 2004-02-25 基诺麦因有限公司 可增强植物对渗透压的抵抗力的新转录因子
WO2002057469A2 (en) * 2001-01-19 2002-07-25 Expressive Research B.V. Modulating developmental transitions in plants
WO2008008396A2 (en) * 2006-07-12 2008-01-17 The Board Of Trustees Operating Dna encoding ring zine-finger protein and the use of the dna in vectors and bacteria and in plants
WO2009003977A2 (en) * 2007-06-29 2009-01-08 Basf Plant Science Gmbh Plants having enhanced yield-related traits and a method for making the same

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
薛永常等: "木质素合成酶C3H基因的生物信息学分析", 《生物信息学》 *

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105821041A (zh) * 2012-06-01 2016-08-03 中国科学院上海生命科学研究院 一种调控木材发育的相关基因及其应用
CN103451169A (zh) * 2012-06-01 2013-12-18 中国科学院上海生命科学研究院 一种调控木材发育的相关基因及其应用
CN105821041B (zh) * 2012-06-01 2018-11-30 中国科学院上海生命科学研究院 一种调控木材发育的相关基因及其应用
CN103451169B (zh) * 2012-06-01 2016-05-25 中国科学院上海生命科学研究院 一种调控木材发育的相关基因及其应用
CN103146712B (zh) * 2013-03-22 2014-10-08 南京农业大学 菊花bHLH转录因子CmbHLH1基因及其植物表达载体和应用
CN103146712A (zh) * 2013-03-22 2013-06-12 南京农业大学 菊花bHLH转录因子CmbHLH1基因及其植物表达载体和应用
CN105441475A (zh) * 2014-05-02 2016-03-30 中央研究院 具有增加微量元素含量的转基因植物及其生产方法
CN105441475B (zh) * 2014-05-02 2020-05-29 中央研究院 具有增加微量元素含量的转基因植物及其生产方法
CN104877993B (zh) * 2015-04-24 2018-01-16 浙江省农业科学院 两种植物eIF4A基因及其用于制备转基因耐水稻条纹病毒植物体的应用
CN104877993A (zh) * 2015-04-24 2015-09-02 浙江省农业科学院 两种植物eIF4A基因及其用于制备转基因耐水稻条纹病毒植物体的应用
WO2019024379A1 (zh) * 2017-07-31 2019-02-07 康码(上海)生物科技有限公司 新型融合蛋白的制备及其在提高蛋白质合成的应用
CN111778169A (zh) * 2018-01-31 2020-10-16 康码(上海)生物科技有限公司 一种提高体外蛋白合成效率的方法
CN110845622A (zh) * 2018-08-21 2020-02-28 康码(上海)生物科技有限公司 不同结构域缺失融合蛋白的制备及其在提高蛋白质合成的应用
CN110845622B (zh) * 2018-08-21 2021-10-26 康码(上海)生物科技有限公司 不同结构域缺失融合蛋白的制备及其在提高蛋白质合成的应用
CN110003317A (zh) * 2019-04-29 2019-07-12 清华大学 eIFiso4G2蛋白在调控植物对ABA耐受性中的应用
CN110079547A (zh) * 2019-04-29 2019-08-02 清华大学 eIF4G蛋白在调控植物对ABA耐受性中的应用
CN114641574A (zh) * 2019-07-03 2022-06-17 英美烟草(投资)有限公司 用于改变植物中生物碱含量的方法
CN113046364A (zh) * 2021-04-06 2021-06-29 台州学院 水稻OsATL9基因在调控水稻抗性中的应用
CN113046364B (zh) * 2021-04-06 2022-06-28 台州学院 水稻OsATL9基因在调控水稻抗性中的应用

Also Published As

Publication number Publication date
DE112010001805T5 (de) 2012-09-06
AU2010243646A1 (en) 2011-11-24
BRPI1014386A2 (pt) 2015-08-25
AR077914A1 (es) 2011-10-05
US20120090052A1 (en) 2012-04-12
WO2010125036A3 (en) 2010-12-23
EP2424996A2 (en) 2012-03-07
MX2011011454A (es) 2011-11-18
CN104789573A (zh) 2015-07-22
WO2010125036A2 (en) 2010-11-04
CA2760266A1 (en) 2010-11-04

Similar Documents

Publication Publication Date Title
EP2004829B1 (en) Plants having enhanced yield-related traits and a method for making the same
CN102459613A (zh) 具有增强的产量相关性状的植物及其制备方法
CN102365366A (zh) 具有增强的产量相关性状的植物及其制备方法
CN102143971A (zh) 通过过表达编码tfl-1 样蛋白的多核苷酸而具有增强的产量相关性状的植物及其制备方法
CN102656270A (zh) 具有增强的产量相关性状的植物和用于产生该植物的方法
EP2235183A2 (en) Plants having enhanced yield-related traits and a method for making the same
CN104024415A (zh) 具有增强的产量相关性状的植物及其制备方法
CN102827865A (zh) 具有增强的产率相关性状的植物及其制备方法
CN102686604A (zh) 具有增强的产量相关性状的植物和用于产生该植物的方法
US20110061126A1 (en) Plants having increased yield-related traits and a method for making the same
CN102686605A (zh) 具有增强的产量相关性状的植物及其制备方法
CN102257142A (zh) 具有增强的产量相关性状的植物及其制备方法
CN102300991A (zh) 具有增强的非生物胁迫耐受性和/或增强的产量相关性状的植物及其制备方法
CN102482333A (zh) 具有增强的产量相关性状的植物及其制备方法
CN103119170A (zh) 具有增强的产量相关性状的植物及其制备方法
CN103154254A (zh) 具有增强的产量相关性状的植物和产生该植物的方法
CN102892890A (zh) 具有增强的产量相关性状的植物和用于制备该植物的方法
CN102753693B (zh) 具有增强的产量相关性状的植物和用于产生该植物的方法
CN103702554A (zh) 具有一种或多种增强的产量相关性状的植物及其制备方法
CN103929947A (zh) 具有增强的产量相关性状的植物和用于产生该植物的方法
CN103298943A (zh) 产量相关性状增强的植物及其制备方法
CN102858984A (zh) 具有增强的产量相关性状的植物及其制备方法
MX2012010749A (es) Plantas que tienen mejores rasgos relacionados con el rendimiento y un metodo para producirlas.
CN103037682A (zh) 具有增强的产量相关性状的植物及其制备方法
CN101548016A (zh) 产率相关性状增强的植物及使用来自yabby蛋白家族的共有序列制备其的方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
AD01 Patent right deemed abandoned

Effective date of abandoning: 20151111

C20 Patent right or utility model deemed to be abandoned or is abandoned