CN102803291A - 具有增强的产量相关性状和/或增强的非生物胁迫耐受性的植物和制备其的方法 - Google Patents

具有增强的产量相关性状和/或增强的非生物胁迫耐受性的植物和制备其的方法 Download PDF

Info

Publication number
CN102803291A
CN102803291A CN2010800302158A CN201080030215A CN102803291A CN 102803291 A CN102803291 A CN 102803291A CN 2010800302158 A CN2010800302158 A CN 2010800302158A CN 201080030215 A CN201080030215 A CN 201080030215A CN 102803291 A CN102803291 A CN 102803291A
Authority
CN
China
Prior art keywords
plant
nucleic acid
polypeptide
sequence
seq
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2010800302158A
Other languages
English (en)
Other versions
CN102803291B (zh
Inventor
Y·海茨费尔德
A·I·桑兹莫林纳罗
V·弗兰卡德
C·勒佐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BASF Plant Science Co GmbH
Original Assignee
BASF Plant Science Co GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BASF Plant Science Co GmbH filed Critical BASF Plant Science Co GmbH
Publication of CN102803291A publication Critical patent/CN102803291A/zh
Application granted granted Critical
Publication of CN102803291B publication Critical patent/CN102803291B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/415Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Wood Science & Technology (AREA)
  • Biochemistry (AREA)
  • Zoology (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • Botany (AREA)
  • Physics & Mathematics (AREA)
  • Cell Biology (AREA)
  • Plant Pathology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Microbiology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Medicinal Chemistry (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)

Abstract

本发明一般涉及分子生物学领域并且涉及改善多种植物生长特征的方法,所述方法通过调节植物中编码LDOX(无色花色素双加氧酶)多肽的核酸、编码YRP5的核酸、编码CK1(I型酪蛋白激酶)多肽的核酸、编码bHLH12-样(碱性螺旋环螺旋组12)多肽的核酸、编码ADH2多肽的核酸或编码GCN5-样多肽的核酸的表达。本发明还涉及具有调节的编码LDOX多肽、或YRP5多肽、或CK1多肽、或bHLH12-样多肽、或ADH2多肽或GCN5-样多肽的核酸的表达的植物,所述植物相对于野生型植物或其他对照植物具有改善的生长特征。本发明还提供了用于本发明方法中的构建体。本发明还提供了用于实施本发明方法的迄今未知的CK1-编码核酸和迄今未知的bHLH12-样-编码核酸。

Description

具有增强的产量相关性状和/或增强的非生物胁迫耐受性的植物和制备其的方法
本发明一般涉及分子生物学领域,并且涉及通过调节植物中编码LDOX(无色花色素双加氧酶)多肽的核酸的表达来改善多种植物生长特征的方法。本发明还涉及具有调节的编码LDOX多肽的核酸的表达的植物,所述植物具有相对于对应的野生型植物或其他对照植物而言改善的生长特征。本发明还提供了用于本发明方法的构建体。
此外,本发明涉及通过调节植物中编码YRP5的核酸的表达来增强植物中非生物胁迫耐受性的方法。本发明还涉及具有调节的编码YRP5的核酸的表达的植物,所述植物具有相对于对应的野生型植物或其他对照植物而言增强的非生物胁迫耐受性。本发明还提供了用于本发明方法中的构建体。
本发明还涉及在植物中增强多种经济上重要的产量相关性状的方法。更具体地,本发明涉及通过调节植物中编码CK1(I型酪蛋白激酶)多肽的核酸的表达在植物中增强产量相关性状的方法。本发明还涉及具有调节的编码CK1多肽的核酸的表达的植物,所述植物具有相对于对照植物而言增强的产量相关性状。本发明还提供了迄今未知的编码CK1的核酸,以及包含其的构建体,用于实施本发明的方法。
本发明还涉及在植物中增强多种经济上重要的产量相关性状的方法。更具体地,本发明涉及通过调节植物中编码bHLH12-样(碱性螺旋环螺旋组12)多肽的核酸的表达在植物中增强产量相关性状的方法。本发明还涉及具有调节的编码bHLH12-样多肽的核酸的表达的植物,所述植物具有相对于对照植物而言增强的产量相关性状。本发明还提供了迄今未知的编码bHLH12-样的核酸,以及包含其的构建体,用于实施本发明的方法。
本发明还涉及植物中通过调节编码醇脱氢酶(ADH2)多肽的核酸的表达来增强植物中多种产量相关性状的方法。本发明还涉及具有调节的编码ADH2多肽的核酸的表达的植物,所述植物具有相对于对应的野生型植物或其他对照植物而言增强的产量相关性状。本发明还提供了用于本发明方法中的构建体。
本发明还涉及通过调节植物中编码CGN5-样多肽的核酸的表达来改善多种植物生长特征的方法。本发明还涉及具有调节的编码GCN5-样多肽的核酸的表达的植物,所述植物具有相对于对应的野生型植物或其他对照植物而言增强的生长特征。本发明还提供了用于本发明方法中的构建体。
持续增长的世界人口和农业用可耕地供应萎缩刺激了有关提高农业效率的研究。常规的作物及园艺学改良手段利用选择育种技术以鉴定具有受欢迎特征的植物。但是,此类选择育种技术具有几个缺陷,即这些技术一般耗费很多劳动并且产生这样的植物,其经常含有异源的遗传组分,其可能不总是导致从亲代植物中传递的受欢迎性状。分子生物学进展已经允许人类改良动物及植物的种质。植物的遗传工程使得可以分离和操作遗传物质(一般处于DNA或RNA形式)并且随后导入该遗传物质至植物中。此类技术具有产生具备多种经济学、农学或园艺学改良性状的作物或植物的能力。
具有特殊经济意义的性状是提高的产量。产量通常定义为来自作物的经济价值的可测量结果。该结果可以就数量和/或品质方面进行定义。产量直接取决于几个因素,例如器官的数目和大小、植物构造(例如枝的数目)、种子产生、叶衰老等。根发育、养分摄入量、胁迫耐受性和早期萌发势(earlyvigor)也可以是决定产量的重要因素。优化前述因素因而可以对提高作物产量有贡献。
种子产量是特别重要的性状,因为许多植物的种子对人与动物营养是重要的。作物如玉米、稻、小麦、卡诺拉油菜和大豆占超过一半的人类总热量摄入,无论通过直接消费种子本身或通过消费基于加工的种子而产生的肉产品。作物也是糖、油及工业加工中所用许多类型代谢物的来源。种子含有胚(新枝条和新根的来源)和胚乳(萌发期间及籽苗早期生长期间用于胚生长的营养来源)。种子发育涉及多种基因并且需要代谢物从根、叶和茎转移至正在生长的种子中。胚乳尤其同化糖类、油和蛋白质的代谢前体并且将它们合成为贮藏大分子以灌满籽粒(grain)。
植物生物量为饲料作物如苜蓿、青贮玉米和干草的产量。在籽粒作物中已使用了多种代表(proxy)。其中主要的是植物大小的估计值。根据物种和发育阶段,可以以多种方式测量植物大小,包括总植物干重、地上部分干重、地上部分鲜重、叶面积、茎体积、植物高度、莲座直径、叶长度、根长度、根量、分蘖数和叶数量。许多物种在给定发育阶段的植物不同部分的大小之间维持了保守的比例。上述异速生长关系用于从上述一种大小测量推测另一种(例如,Tittonell等人,2005Agric Ecosys & Environ 105:213)。在早期发育阶段的植物大小通常与发育晚期的植物大小相关。具有较大叶面积的较大的植物通常可以比较小的植物吸收更多的光和二氧化碳,从而在相同的时期可能获得更多重量(Fasoula & Tollenaar 2005Maydica 50:39)。除微环境的潜在连续性或遗传优势外,植物必须在一开始就获得较大的尺寸。对于植物的大小和生长速率而言存在强烈的遗传成分(例如,ter Steege等人,2005Plant Physiology 139:1078),并且迄今为止,在同一环境条件下,一系列不同基因型的植物大小可能与另一种环境条件下的大小相关(Hittalmani等人,2003Theoretical Applied Genetics107:679)。因此,使用标准的环境作为田间作物在不同地区和时间遇到的多样且变化的环境的代表。
对于许多作物的另一个重要性状是早期萌发势。改善早期萌发势是现代稻育种计划在温带和热带稻品种上的重要目标。长根在水栽稻中对于正确土壤固定是重要的。在稻直接播种至被淹没田地的情况下,以及在植物必须从水中迅速出苗的情况下,较长的枝条与萌发势相关。在实施条播(drill-seeding)的情况下,较长的中胚轴和胚芽鞘对于良好出幼苗是重要的。将早期萌发势人工改造到植物内的能力将在农业中是极其重要的。例如,不良的早期萌发势已经限制了基于玉米带种质(Corn Belt germplasm)在欧洲大西洋地区引种玉米(Zea mayes L.)杂种。
收获指数,种子产量与地上部分干重的比例,在许多环境条件下是相对稳定的,从而通常能够获得植物大小和籽粒产量之间强有力的相互关系(例如,Rebetzke等人,2002Crop Science 42:739)。这些方法是内在相关联的,因为大多数籽粒生物量取决于植物茎叶的现有的或储存的光合作用生产力(Gardener等人,1985 Physiology of Crop Plants.Iowa StateUniversity Press,第68-73页)。因此,即使在发育的早期阶段,选择植物的大小已用作未来潜在产量的提示(例如,Tittonell等人,2005 Agric Ecosys& Environ 105:213)。当测试遗传差异对胁迫耐受的影响时,将土壤性质、温度、水和养分的有效性,以及光强度标准化的能力,是温室或植物培养室环境相比田间的内在优势。然而,由于缺少风或昆虫而造成的低下的授粉,或者对于成熟的根或株冠生长不充足的空间所造成的对产量的人为限制,可以制约这些受控环境用于测试产量差异的应用。因此,在培养室或温室的标准化条件下,测量早期发育阶段的植物大小,是为潜在的遗传产量优势提供提示的标准实践。
又一个重要性状是改善的非生物胁迫耐受性。非生物胁迫是世界范围作物损失的主要原因,对于大多数主要作物植物而言降低平均产量超过50%(Wang等、Planta(2003)218:1-14)。非生物胁迫可以由干旱、盐度、极端温度、化学毒性和氧化胁迫引起。改善植物对非生物胁迫耐受性的能力将在世界范围对农民而言是巨大经济优势并且会允许在不利条件期间及在作物栽培否则是不可能的陆地上栽培作物。
作物产量因而可以通过优化前述因素之一而提高。
取决于最终用途,对某些产量性状的改良可能优先于其它产量性状。例如对于应用如饲料或木材生产或生物燃料资源而言,增加植物营养体部分可能是希望的,而对于应用如面粉、淀粉或油生产而言,种子参数的提高可能是特别希望的。即便在种子参数当中,某些参数可以更优先于其它参数,这取决于应用。多种机制可以对增加种子产量有贡献,无论形式为增加的种子大小或是增加的种子数目。
增加植物中产量(种子产量和/或生物量)的一种方法可以是通过修饰植物的内在生长机制如细胞周期或参与植物生长或参与防御机制的多种信号传导途径。
现已发现,在植物中可以通过调节植物中编码植物的LDOX多肽或CK1多肽或bHLH12-样多肽或GCN5-样多肽的核酸的表达来改善多种生长特征。
现在还发现在植物中可以通过调节植物中编码植物的ADH2多肽的核酸的表达来改善多种产量相关性状。
现在还发现在植物中可以通过调节植物中编码YRP5多肽的核酸的表达来增强多种非生物胁迫的耐受性。
背景
1.无色花色素双加氧酶(LDOX)多肽
黄酮类化合物代表植物次生代谢物的一大组,包含黄酮醇、异黄酮、原花色素和花色素苷。它们在植物生物学中扮演重要的角色,例如传粉者或种子散布动物的信号传导、植物激素信号传导、花粉管形成或UV保护。
在黄酮类化合物中,花色素苷是次生代谢物,除了具有其他功能外,其提供了花瓣、果皮和种皮的颜色。花色素苷是通过phenylpropanoid途径产生的,这一途径通过苯丙氨酸氨裂解酶(PAL)将苯丙氨酸转化为桂皮酸来起始。然后该途径分为不同的分支,一个是黄酮类化合物途径,其中查尔酮合酶(CHS)催化黄酮类化合物骨架行程并且随后导致黄酮醇、花青素和花色素苷合成。花色素苷合成的综述见Abrahams等人(Plant J.35,624-636,2003),在图1中复制。无色花色素双加氧酶(LDOX)是参与黄酮类化合物生物合成的后期的酶,其参与将白矢车菊苷元转化为花青素的酶促反应,所述花青素是花色素苷和表儿茶酸的前体。后者随后被聚合成原花色素。编码LDOX的基因是拟南芥属(Arabidopsis)中的多基因家族中的一部分。
现在已经显示了植物花色素苷产生是由广泛的生物和非生物胁迫物诱导的,所述胁迫物例如病原体攻击、创伤、UV光、低温、重金属污染和养分胁迫例如磷(Pi)限制(Steyn等人,New Phytologist 155,349-361,2002;Gould,J.Biomed.Biotechnol.2004,314-320,2004)。作为食品添加剂(天然色素),黄酮类化合物已经吸引了关注,并且可能作为抗氧化剂用于药物应用。它们还可以减少糖尿病或癌症的风险。
2.I型酪蛋白激酶(CK1)多肽
蛋白激酶的酪蛋白激酶1家族(EC2.7.11.1)是丝氨酸/苏氨酸-选择性酶,其作为大多数真核细胞类型的信号转导途径的调节子发挥功能。
发现酪蛋白激酶活性存在于大多数细胞类型中,并且与多个酶相关。相关基因产物的1型酪蛋白激酶家族现在被命名为例如“酪蛋白激酶1”。在非洲爪蟾属(Xenopus)和果蝇属(Drosophila)细胞中,已经提示酪蛋白激酶1在Wnt信号传导途径中起作用。CK1γ与细胞膜相关,并且结合LRP。发现CK1γ是通过LRP的Wnt信号传导中所需要的。Davidson等人2005.Nature Volume 438,页867-872。
在植物中,酪蛋白激酶已经与胞间连丝相关联(Lee 2005,Plant Cell.17;2817-2831)。
3.碱性螺旋环螺旋组12(bHLH12-样)多肽
碱性螺旋-环-螺旋蛋白质(bHLH)是一组真核转录因子,其在多种发育途径中产生决定作用的影响。这些转录因子表征为高度进化的保守性bHLH结构域,其介导特定的二聚作用。它们在发育的适当阶段促进失活的单体向反式激活的二聚体的转化。可以将bHLH蛋白质分类为不连续的类。根据二聚化、DNA结合和表达特征的一个此类细分,限定了7个组。I类蛋白质在组中形成二聚体或与II类蛋白质形成二聚体。II类蛋白质只能与I类因子形成异二聚体。III类因子被与bHLH结构域邻近的亮氨酸拉链的存在所表征。IV类因子可以形成同二聚体或与III类蛋白质形成异二聚体。V类和VI类蛋白质作为I类和II类因子的调节子作用,而VII类蛋白质具有PAS结构域。
bHLH结构域是本领域所熟知的,并且可以容易地被本领域技术人员所鉴定。该家族被bHLH标签结构域所定义,所述结构域由大约60个氨基酸与两个功能不同的区域组成。位于结构域N末端的碱性区域,参与DNA结合并且由大约15个氨基酸和大量的碱性残基组成。HLH区域,位于C末端,作为二聚化结构域发挥作用并且主要包含疏水残基,所述残基形成两个由可变序列和长度的环区域分开的两亲螺旋。
Heim等人在2003年将植物bHLH蛋白质基于结构相似性分为组和亚组。建议bHLH蛋白质在植物中行使类似的生物学功能(Heim等人2003,Mol.Biol.Evol.20(5):735-747.2003)。
近期,来自拟南芥的组XII的三个成员,AtbHLH044/BEE1,AtbHLH058/BEE2,和AtbHLH050/BEE3(BR增强表达)已经与油菜素类固醇信号传导相关联(Friedrichsen等人2002,Genetics 162:1445-1456)。这些紧密相关的bHLH多余地作用为早期油菜素类固醇(BR)信号传导途径中的正调节子,并且它们还影响已知的BR拮抗物脱落酸(ABA)的信号传导。
4.醇脱氢酶(ADH2)多肽
MDR(中间链脱氢酶/还原酶)超家族包括醇脱氢酶(ADH)家族。醇脱氢酶(EC:1.1.1.1)催化醇向其相应的乙醛或酮的可逆氧化,同时伴随有NAD:醇+NAD=醛或酮+NADH的还原。
目前已知三种结构和催化上不同类型的醇脱氢酶:
1.含锌的“长链”醇脱氢酶;
2.昆虫型“短链”醇脱氢酶;
3.含铁的醇脱氢酶
在植物中有两种类型的ADH:III类ADH(依赖于谷胱甘肽(glutathionone)的甲醛脱氢酶)和植物ADH。ADH2编码GSH-依赖型甲醛脱氢酶(FALDH),也已知为III类ADH。已经显示该酶是S-亚硝基谷胱甘肽还原酶(GSNOR)。见Rusterucci等人:Plant Physiol.2007March;143(3):1282-1292。Lee等人,2008(The Plant Cell,Vol.20:786-802)也报道了进化保守的GSH-依赖型甲酸脱氢酶(FALDH),其是III型醇脱氢酶,具有如GSNOR的活性。
5.GCN5-样多肽
Bhat,R.等人(The Plant Journal.2003,33,455-469)公开了组蛋白乙酰转移酶(HAT),GCN5在酵母和哺乳动物中的转录共激活中所起到的作用。为该目的,作者克隆并表达了玉米同源物Zmgcn5的模式,并且观察到用TSA抑制组蛋白脱乙酰化伴随着ZmGCN5乙酰基转移酶蛋白质的丰度减少,但是伴随着组蛋白H2A、H2B、H3和H4的mRNA的增加。升高的组蛋白mRNA水平并未表现在增加组蛋白蛋白质浓度上,表明来自TSA处理的高乙酰化的组蛋白可以被优先降解并且被从新合成的组蛋白所取代。ZmGCN5反义材料表现了内源ZmGCN5转录物的阻抑,并且序型分析表现出增加的H2A、H2B和H4的mRNA水平。
Benhamed,M.等人(The Plant Cell.2006,18,2893-2903)聚焦在生长和基因表达的光调节对于拟南芥组蛋白乙酰转移酶TAF1/HAF2的需求上,并且该组蛋白乙酰转移酶GCN5和组蛋白脱乙酰基酶HD1/HDA19也参与此类调节。作者已经观察到GCN5的突变导致长下胚轴表型和减少的光诱导基因表达,而HD1的突变诱导反作用。双突变体gcn5 hd1恢复了正常的光形态发生表型。相比之下,双突变体gcn5 taf1导致光调节的基因表达的进一步损失。gcn5减少组蛋白H3和H4的乙酰化,主要在核心启动子区域,而hd1增加了核心和更上游启动子区域的乙酰化。GCN5和TAF1都是靶标启动子的H3K9、H3K27和H4K12乙酰化所需要的,而H3K14乙酰化仅仅依赖于GCN5。他们已经得出结论GCN5与光响应启动子直接相关。
Bertrand C.等人(The Journal of Biological Chemistry.2003,278,3028246-28251)公开了通过表征拟南芥属基因中突变的GCN5基因(AtGCN5)在控制花分生组织活性中的调节功能。作者已经观察到除了对于植物发育的多效性作用,该突变还导致末端花的产生,并且需要AtGCN5来通过WUS/AG途径来调节花分生组织活性。
Benhamed,M.等人(The Plant Journal.2008,56,493-504)聚焦于拟南芥启动子区域。作者已经观察到拟南芥属组蛋白乙酰转移酶GCN5与40%测试的启动子相关。在大多数位点上,结合不依赖于GCN5溴结构域的完整性,但是对于与11%的启动子区域的结合,溴结构域的存在是需要的,并且与组蛋白H3的赖氨酸14的乙酰化相关联。他们还得出结论,在这些启动子中,除了其转录活性功能外,GCN5可能在引发非诱导条件下的可诱导基因的活化中起重要作用。
Nagy,Z.和Tora,L.(Oncogene.2007,26,5341-5357)公开了我们理解的来自后生动物生物体的两个组蛋白乙酰转移酶(AT)的功能的近期的进展:GCN5和PCAF以及它们在真核转录中的作用。还指出后生动物GCN5是至少两个类型的多蛋白复合物的亚基,所述多蛋白复合物之一具有2MDa的分子重量(SPT3-TAF9-GCN5乙酰转移酶/TATA结合蛋白质(TBP)-游离的-TAF复合物),并且另一种类型具有约700kDa的大小(ATAC复合物)。这些复合物具有总体的组蛋白乙酰化活性,以及基因座特异性的共激活子功能,和在非组蛋白底物上的AT活性。作者还得出结论,它们的生物学功能覆盖了广泛的工作,并且使得它们是细胞的正常功能所必不可少的,而且这些复合物的全局的和/或特异性的AT活性的失调导致细胞的癌性转化。
概述
1.无色花色素双加氧酶(LDOX)多肽
令人惊讶地,现在发现调节编码LDOX多肽的核酸的表达产生了相对于对照植物具有增强的产量相关性状,特别是增加的产量和增加的早期萌发势的植物。
根据一个实施方案,提供了相对于对照植物改善植物的产量相关性状的方法,所述方法包括在植物中调节编码LDOX多肽的核酸的表达。
2.YRP5多肽
令人惊讶地,现在发现调节编码YRP5多肽的核酸的表达产生了相对于对照植物具有增强的多种非生物胁迫耐受性的植物。
根据一个实施方案,提供了相对于对照植物的耐受性增强植物对多种非生物胁迫耐受性的方法,所述方法包括在植物中调节编码YRP5多肽的核酸的表达。
3.I型酪蛋白基因(CK1)多肽
令人惊讶地,现在发现调节编码CK1多肽的核酸的表达产生了相对于对照植物具有增强的产量相关性状的植物。
根据一个实施方案,提供了相对于对照植物增强植物的产量相关性状的方法,所述方法包括在植物中调节编码CK1多肽的核酸的表达。
4.碱性螺旋环螺旋组12(bHLH12-样)多肽
令人惊讶地,现在发现调节编码bHLH12样多肽的核酸的表达产生了相对于对照植物具有增强的产量相关性状的植物。
根据一个实施方案,提供了相对于对照植物增强植物的产量相关性状的方法,所述方法包括在植物中调节编码bHLH12样多肽的核酸的表达。
5.醇脱氢酶(ADH2)多肽
令人惊讶地,现在发现调节编码ADH2多肽的核酸的表达产生了相对于对照植物具有增强的产量相关性状,特别是(增加的种子产量)的植物。
根据一个实施方案,提供了相对于对照植物增强植物的产量相关性状的方法,所述方法包括在植物中调节编码ADH2多肽的核酸的表达。
6.GCN5-样多肽
令人惊讶地,现在发现调节编码GCN5-样多肽的核酸的表达产生了相对于对照植物具有增强的产量相关性状,特别是增加的产量的植物。
根据一个实施方案,提供了相对于对照植物改善植物的产量相关性状的方法,所述方法包括在植物中调节编码GCN5-样多肽的核酸的表达。
定义
多肽/蛋白质
术语“多肽”和“蛋白质”在本文中可相互交换地使用并且指由肽键连接起来的任意长度聚合物形式的氨基酸。
多核苷酸/核酸/核酸序列/核苷酸序列
术语“多核苷酸”、“核酸序列”、“核苷酸序列”、“核酸”、“核酸分子”在本文中可相互交换地使用并且指任意长度的聚合非分支形式的核苷酸,即核糖核苷酸或脱氧核糖核苷酸或这二者的组合。
同源物
蛋白质的“同源物”包括这样的肽、寡肽、多肽、蛋白质和酶,它们相对于非修饰的所讨论蛋白质具有氨基酸替换、缺失和/或插入并且与从中衍生它们的非修饰蛋白质具有相似的生物学活性和功能活性。
缺失指从蛋白质中移除一个或多个氨基酸。
插入指一个或多个氨基酸残基被导入蛋白质中的预定位点。插入可以包含氨基端融合和/或羧基端融合以及序列内插入单个或多个氨基酸。通常,在氨基酸序列内部的插入物比氨基端融合物或羧基端融合物小约1至10个残基级别。氨基端或羧基端融合蛋白或融合肽的例子包括如酵母双杂交系统中所用的转录激活物的结合结构域或激活结构域、噬菌体外壳蛋白、(组氨酸)-6-标签、谷胱甘肽S-转移酶-标签、蛋白A、麦芽糖结合蛋白、二氢叶酸还原酶、Tag·100表位、c-myc表位、FLAG-表位、lacZ、CMP(钙调蛋白结合肽)、HA表位、蛋白C表位和VSV表位。
取代指以具有相似特性(如相似的疏水性、亲水性、抗原性、形成或破坏α-螺旋结构或β-折叠结构的倾向性)的其他氨基酸替代蛋白质的氨基酸。氨基酸取代一般是单个残基的,不过根据给予多肽的功能性约束条件,可以是聚类的,并且可以范围从1至10个氨基酸;插入通常是约1至10个氨基酸残基级别。氨基酸取代优选地是保守性氨基酸取代。保守性取代表是本领域熟知的(见例如Creighton(1984)Proteins.W.H.Freeman andCompany(编著)和下表1)。
表1:保守性氨基酸取代的例子
  残基   保守性取代   残基   保守性取代
  Ala   Ser   Leu   Ile;Val
  Arg   Lys   Lys   Arg;Gln
  Asn   Gln;His   Met   Leu;Ile
  Asp   Glu   Phe   Met;Leu;Tyr
  Gln   Asn   Ser   Thr;Gly
  Cys   Ser   Thr   Ser;Val
  Glu   Asp   Trp   Tyr
  Gly   Pro   Tyr   Trp;Phe
  His   Ash;Gln   Val   Ile;Leu
  Ile   Leu,Val
氨基酸取代、缺失和/或插入可以使用本领域熟知的肽合成技术如固相肽合成法等或通过重组DNA操作轻易地进行。用于操作DNA序列以产生蛋白质的取代、插入或缺失变体的方法是本领域熟知的。例如,用于在DNA的预定位点处产生取代突变的技术是本领域技术人员熟知的并且包括M13诱变法、T7-Gen体外诱变法(USB,Cleveland,OH)、QuickChange位点定向诱变法(Stratagene,San Diego,CA)、PCR介导的位点定向诱变或其他位点定向诱变法。
衍生物
“衍生物”包括这样的肽、寡肽、多肽,其中与天然存在形式蛋白质(如目的蛋白)的氨基酸序列相比较,它们包含非天然存在的氨基酸残基对氨基酸的取代或非天然存在的氨基酸残基的添加。蛋白质的“衍生物”也包括这样的肽、寡肽、多肽,其中与所述多肽的天然存在形式的氨基酸序列相比,它们包含天然存在的改变(糖基化、酰化、异戊二烯化、磷酸化、肉豆蔻酰化、硫酸化等)的氨基酸残基或非天然存在的改变的氨基酸残基。与从中衍生出衍生物的氨基酸序列相比较,该衍生物可以也包含与所述氨基酸序列共价或非共价结合的一个或多个非氨基酸取代基或添加物(例如报道分子或其他配体),如所结合旨在促进检测该衍生物的报道分子,和相对于天然存在的蛋白质的氨基酸序列而言,包含非天然存在的氨基酸残基。此外,“衍生物”也包括天然存在形式蛋白质与标签肽如FLAG、HIS6或硫氧还蛋白(对于标签肽的综述,见Terpe,Appl.Microbiol.Biotechnol.60,523-533,2003)的融合物。
直向同源物/旁系同源物
直向同源物和旁系同源物包括用来描述基因祖先关系的进化概念。旁系同源物是相同物种内因祖先基因复制而来源的基因;直向同源物是来自不同生物的因物种形成而来源的基因,并且也衍生于共同的祖先基因。
结构域、基序/共有序列/标签
术语“结构域”指在进化相关性蛋白质的序列比对结果上的特定位置处保守的一组氨基酸。尽管在其他位置处的氨基酸可以在同源物之间不同,然而在特定位置处高度保守的氨基酸指示了很可能在蛋白质结构、稳定性或功能方面是必需的氨基酸。结构域因其在蛋白质同源物家族的比对序列中高保守程度而鉴定,故它们可以作为鉴定物用来确定所讨论的任意多肽是否属于先前已鉴定的多肽家族。
术语“基序”或“共有序列”或“标签”指在进化相关蛋白质的序列中短的保守区域。基序往往是结构域的高度保守部分,不过也可以仅包括该结构域的部分,或可以位于保守结构域之外(若基序的全部氨基酸位于定义的结构域之外)。
存在用于鉴别结构域的专门数据库,例如,SMART(Schultz等人,(1998)Proc.Natl.Acad.Sci.USA 95,5857-5864;Letunic等人,(2002)Nucleic acid Res 30,242-244)、InterPro(Mulder等人,(2003)Nucl.Acids.Res.31,315-318)、Prosite(Bucher和Bairoch(1994),A generalized profilesyntax for biomolecular sequences motifs and its function in automaticsequence interpretation.(In)ISMB-94;Proceedings 2nd InternationalConference on Intelligent Systems for Molecular Biology.Altman R.,Brutlag D.,Karp P.,Lathrop R.,Searls D.编著,第53-61页,AAAI Press,Menlo Park;Hulo等人,Nucl.Acids.Res.32:D134-D137,(2004))或Pfam(Bateman等人,Nucleic acid Research 30(1):276-280(2002))。在ExPAsy蛋白组学服务器(瑞士生物信息中心(Gasteiger等人,ExPASy:theproteomics server for in-depth protein knowledge and analysis,Nucleicacid Res.31:3784-3788(2003)))上可获得成套的蛋白质序列计算机分析的工具。还可以使用常规技术,例如通过序列比对,鉴别结构域或基序。
用于比对序列以进行比较的方法是本领域熟知的,此类方法包括GAP、BESTFIT、BLAST、FASTA和TFASTA。GAP使用Needleman和Wunsch算法((1970)J Mol Biol 48:443-453)以找到使匹配数最大化并使空位数最小化的两个序列的总体(即覆盖完整序列的)比对结果。BLAST算法(Altschul等人(1990)J Mol Biol 215:403-10)计算序列同一性百分数并在两个序列之间开展相似性的统计分析。用于开展BLAST分析的软件是通过国家生物技术信息中心(NCBI)可公开获得的。同源物可以使用例如ClustalW多重序列比对算法(1.83版本),以默认配对比对参数和百分数评分方法轻易地鉴定。相似性和同一性的总体百分数也可以使用MatGAT软件包中的可用方法之一确定(Campanella等,BMC Bioinformatics.2003年7月10日;4:29.MatGAT:使用蛋白质序列或DNA序列产生相似性/同一性矩阵的一种应用(an application that generates similarity/identitymatrices using protein or DNA sequences))。如本领域技术人员显而易见,可以进行少许手工编辑以优化保守基序之间的比对。此外,作为使用全长序列以鉴定同源物的替代,也可以使用特定结构域。利用上文提及的程序,使用默认参数可以在完整核酸或氨基酸序列范围或选定的结构域或保守基序范围内确定序列同一性值。对于局部比对,所述Smith-Waterman算法是特别有用的(Smith TF,Waterman MS(1981)J.Mol.Biol 147(1);195-7)。
交互性BLAST
通常,这包括第一BLAST,其中所述的第一BLAST包括将查询序列(例如使用实施例部分的表A中列出的任意序列)针对任意序列数据库,如可公开获得的NCBI数据库进行BLAST。当从核苷酸序列开始时,一般使用BLASTN或TBLASTX(使用标准默认值),并且当从蛋白质序列开始时,使用BLASTP或TBLASTN(使用标准默认值)。可以任选地筛选BLAST结果。筛选结果或非筛选结果的全长序列随后针对来自生物的序列进行反向BLAST(第二BLAST),其中查询序列从所述的生物中衍生。随后比较第一BLAST和第二BLAST的结果。若来自第一blast的高阶位命中是源自与衍生查询序列的物种相同的物种,则鉴定到旁系同源物,随后一个反向BLAST理想地在最高命中当中产生该查询序列;若在第一BLAST中的高阶位命中不是源自与衍生查询序列的物种相同的物种,则鉴定到直向同源物,并且在反向BLAST时,优选地产生属于最高命中当中的该查询序列。
高阶位命中是具有低E-值的那些命中。E-值越低,评分越显著(或换句话说,偶然发现该命中的几率越低)。E-值的计算是本领域熟知的。除了E-值外,比较过程也通过同一性百分数评分。同一性百分数指两个所比较的核酸(或多肽)序列之间特定长度范围内相同的核苷酸(或氨基酸)的数目。在大型家族的情况下,可以使用ClustalW,随后使用邻接树法,以帮助观察相关基因的聚类和鉴定直向同源物和旁系同源物。
杂交
如本文中所定义的术语“杂交”是其中基本上同源的互补核苷酸序列相互复性的过程。杂交过程可以完全在溶液中进行,即两种互补核酸均处于溶液中。杂交过程也可以用固定至基质如磁珠、琼脂糖凝胶(Sepharose)珠或任何其他树脂的互补核酸之一进行。杂交过程也可以用固定至固体支持物如硝酸纤维素膜或尼龙膜上或通过例如照相平版印刷术固定至例如硅玻璃支持物(后者称作核酸阵列或微阵列或称作核酸芯片)的互补核酸之一进行。为使杂交发生,核酸分子通常被热变性或化学变性,以使双链解链成两条单链和/或去除来自单链核酸的发夹或其他二级结构。
术语“严格性”指杂交发生的条件。杂交的严格性受诸条件如温度、盐浓度、离子强度和杂交缓冲液组成的影响。通常,低严格条件选择为在定义的离子强度和pH处,低于特定序列的热解链温度(Tm)约30℃。中等严格条件是当所述温度低于Tm 20℃时,并且高严格条件是当所述温度低于Tm 10℃时。高严格杂交条件一般用于分离与靶核酸序列具有高序列相似性的杂交序列。但是,核酸可以在序列上偏离且依旧编码基本上相同的多肽,原因是遗传密码的简并性。因而,有时候可能需要中等严格杂交条件以鉴定此类核酸分子。
Tm是在定义的离子强度和pH处的下述温度,其中50%的靶序列在所述温度与完全匹配的探针杂交。Tm取决于溶液条件和探针的碱基组成及长度。例如,较长的序列在更高温度上特异性地杂交。最大杂交速率在低于Tm约16℃直至32℃上获得。杂交溶液中一价阳离子的存在降低了两条核酸链之间的静电排斥作用,因而促进杂交体形成;这种作用对于直到0.4M的钠浓度是显而易见的(对于更高的浓度而言,可以忽略这种作用)。甲酰胺降低了DNA-DNA和DNA-RNA双链体的解链温度,每百分数的甲酰胺降低0.6至0.7℃,且添加50%甲酰胺允许在30至45℃杂交,尽管杂交速率将降低。碱基对错配降低了杂交速率和双链体的热稳定性。平均而言和对于大探针而言,Tm下降约1℃/每%碱基错配。根据杂交体的类型,Tm可以使用以下等式计算:
1)DNA-DNA杂交体(Meinkoth和Wahl,Anal.Biochem.,138:267-284,1984):
Tm=81.5℃+16.6×log10[Na+]a+0.41×%[G/Cb]-500×Lc]-1-0.61×%甲酰胺
2)DNA-RNA杂交体或RNA-RNA杂交体:
Tm=79.8+18.5(log10[Na+]a)+0.58(%G/Cb)+11.8(%G/Cb)2-820/Lc
3)寡DNA杂交体或寡RNAd杂交体:
对少于20个核苷酸而言:Tm=2(ln)
对20-35个核苷酸而言:Tm=22+1.46(ln)
a或者用于其他一价阳离子,但是仅在0.01-0.4M范围内是精确的。
b仅对于在30%-75%范围内的%GC是精确的。
cL=双链体的碱基对长度。
dOligo,寡核苷酸;ln,=引物的有效长度=2×(G/C数)+(A/T数)。
可以使用许多已知技术中任意一种技术控制非特异性结合,例如将膜以含有蛋白质的溶液封闭、添加异源RNA、异源DNA和SDS至杂交缓冲液,并且用RNA酶处理。对于非同源性探针,可以通过变换以下条件之一:(i)渐进地降低复性温度(例如从68℃至42℃)或(ii)渐进地降低甲酰胺浓度(例如从50%至0%)进行一系列杂交。技术人员了解可以在杂交期间变更并且将维持或改变所述严格条件的多个参数。
除了杂交条件之外,杂交特异性一般还取决于杂交后洗涤的功能。为除去因非特异性杂交引起的背景,样品用稀释的盐溶液洗涤。此类洗涤的关键因素包括最终洗涤溶液的离子强度和温度:盐浓度越低且洗涤温度越高,则洗涤的严格性越高。洗涤条件一般在杂交严格性处或低于所述杂交严格性而进行。阳性杂交产生至少两倍于背景信号的信号。通常,用于核酸杂交测定法或基因扩增检测方法的适宜严格条件如上所述。也可以选择严格性更高或更低的条件。技术人员了解可以在洗涤期间变更并且将维持或改变所述严格条件的多个参数。
例如,用于长度大于50个核苷酸的DNA杂交体的典型高严格杂交条件包括在65℃于1×SSC中或在42℃于1×SSC和50%甲酰胺中杂交,随后在65℃于0.3×SSC中洗涤。用于长度大于50个核苷酸的DNA杂交体的中等严格杂交条件的例子包括在50℃于4×SSC或在40℃于6×SSC和50%甲酰胺中杂交,随后在50℃于2×SSC中洗涤。杂交体的长度是杂交核酸的预期长度。当序列已知的核酸杂交时,可以通过比对序列并鉴定本文中所述的保守区而确定杂交体长度。1×SSC是0.15M NaCl和15mM柠檬酸钠;杂交溶液和洗涤溶液可以额外地包括5×Denhardt试剂、0.5-1.0%SDS、100μg/ml变性的片段化鲑精DNA、0.5%焦磷酸钠。
出于定义严格性的水平的目的,可以参考Sambrook等(2001)Molecular Cloning:a laboratory manual,第三版Cold Spring HarborLaboratory Press,CSH,New York或参考Current Protocols in MolecularBiology,John Wiley&Sons,N.Y.(1989和年度更新版)。
剪接变体
如本文中所用的术语“剪接变体”包括其中已经切除、替换、置换或添加所选内含子和/或外显子或其中已经缩短或加长内含子的核酸序列的变体。此类变体将是其中基本上保留蛋白质的生物学活性的一类变体;这可以通过选择性地保留蛋白质的功能性片段实现。此类剪接变体可以在自然界中找到或可以人工制备。用于预测和分离此类剪接变体的方法是本领域熟知的(见例如Foissac和Schiex,BMC Bioinformatics.2005;6:25)。
等位变体
等位基因或等位变体是给定基因位于相同染色体位置处的备选形式。等位变体包含单核苷酸多态性(SNP)和小型插入/缺失多态性(INDEL)。INDEL的大小通常小于100bp。SNP和INDEL形成大部分生物的天然存在多态性株系中的序列变体的最大集合。
内源基因
本文中对“内源的”基因的称谓不仅仅涉及如植物中以其天然形式(即没有人类任何干预)存在的所讨论基因,还指处于分离形式下的随后(再)导入植物(转基因)的相同基因(或基本上同源的核酸/基因)。例如,含有这种转基因的转基因植物可以出现转基因表达的大幅降低和/或内源基因表达的大幅降低。所述的分离基因可以从生物分离或可以是人造的,例如通过化学合成法人造的。
基因改组/定向进化
基因改组或定向进化由反复DNA改组,随后适当筛选和/或选择以产生编码具有改良生物学活性的蛋白质的核酸或其部分的变体而组成(Castle等人(2004)Science 304(5674):1151-4;美国专利5,811,238和6,395,547)。
构建体
额外的调控元件可以包括转录增强子以及翻译增强子。本领域技术人员将知道可能适用于实施本发明的终止子和增强子序列。如定义部分中描述,内含子序列也可以添加至5’非翻译区(UTR)或编码序列中,以增加细胞溶胶内聚集的成熟信使的数量。(除启动子、增强子、沉默子、内含子序列、3’UTR和/或5’UTR区域之外的)其他控制序列可以是蛋白质/或RNA稳定元件。此类序列将是已知的或可以由本领域技术人员轻易获得。
本发明的基因构建体还可以包括对于在特定细胞类型中维持和/或复制所需要的复制起点序列。一个例子是当需要基因构建体作为游离型遗传元件(例如质粒或粘粒分子)在细菌细胞中维持时的复制起点。优选的复制起点包括但不限于f1-ori和colE1。
为检测如用于本发明方法中的核酸序列的成功转移和/或选择包含这些核酸的转基因植物,有利的是使用标记基因(或报道基因)。因此,所述基因构建体可以任选地包含选择标记基因。选择标记在本文的“定义”部分中更详细地描述。一旦不再需要所述标记基因时,可以从转基因细胞中去掉或切除它们。用于移出标记的技术是本领域已知的,有用技术在上文定义部分中描述。
调控元件/控制序列/启动子
术语“调控元件”、“控制序列”和“启动子”均在本文中可相互交换地使用并且在广泛含义上意指能够实现与它们相连接的序列表达的调控性核酸序列。术语“启动子”一般指位于基因转录起点上游并参与识别和结合RNA聚合酶和其他蛋白质,因而指导有效连接的核酸转录的核酸控制序列。前述术语包括从经典真核基因组基因(包括对于精确转录启动所需的TATA盒,具有或没有CCAAT盒序列)衍生的转录调控序列和应答发育性刺激和/或外部刺激或以组织特异性方式而改变基因表达的其它调控元件(即上游激活序列、增强子和沉默子)。本术语还包括经典原核基因的转录调控序列,在此情况下它可以包括一个-35框序列和/或一个-10框转录调控序列。术语“调控元件”也包含赋予、激活或增强核酸分子在细胞、组织或器官中表达的人工融合分子或衍生物。
“植物启动子”包含介导植物细胞中编码序列节段表达的调控元件。因此,植物启动子不需要是植物来源的,而可以源自病毒或微生物,例如来自侵袭植物细胞的病毒。“植物启动子”也可以源自植物细胞,例如来自用在本发明方法中待表达并在本文中描述的核酸序列转化的植物。这也适用于其他“植物”调控信号,如“植物”终止子。在本发明方法中有用的核苷酸序列上游的启动子可以通过一个或多个核苷酸取代、插入和/或缺失进行修饰,但不影响启动子、可读框(ORF)或3’调控区如终止子或远离ORF存在的其他3’调控区的功能性或活性。还有可能的是:所述启动子的活性因其序列的修饰或被更活跃的启动子、甚至来自异源生物的启动子彻底替换而增加。为了在植物中表达,如上所述,核酸分子必须有效地连接至或包含在正确的时间点并以所需空间表达模式表达基因的合适启动子。
为了鉴定功能性等价启动子,候选启动子的启动子强度和/或表达模式可以例如通过将此启动子有效地与报道基因连接并分析该报道基因在植物多种组织中的表达水平和模式进行分析。熟知的合适报道基因包括例如β-葡糖醛酸酶或β-半乳糖苷酶。启动子活性通过测量β-葡糖醛酸酶或β-半乳糖苷酶的酶活性进行分析。启动子强度和/或表达模式随后可以与参考启动子(如在本发明方法中使用的一种启动子)的启动子强度和/或表达模式比较。备选地,启动子强度可以使用本领域已知方法如RNA印迹法及放射自显影图的密度计分析法、定量实时PCR或RT-PCR(Heid等,1996Genome Methods 6:986-994),通过量化mRNA水平或通过将本发明方法中所用核酸的mRNA水平与持家基因(如18S rRNA)的mRNA水平比较进行分析。通常“弱启动子”意指驱动编码序列在低水平表达的启动子。“低水平”意指在每个细胞约1/10,000转录物至约1/100,000转录物、至约1/500,0000转录物的水平上。相反,“强启动子”驱动编码序列在高水平、或在每个细胞约1/10转录物至约1/100转录物、至约1/1,000转录物上表达。通常,“中等强度启动子”是指驱动编码序列以低于强启动子水平表达的启动子,特别是所述水平在一切情况下低于在35S CaMV启动子控制下时所获得的水平。
有效地连接
如本文中所用的术语“有效地连接”指启动子序列与目的基因之间的功能性连接,从而该启动子序列能够起动该目的基因转录。
组成型启动子
“组成型启动子”指在生长和发育的大部分期间而无需在全部期间和在大多数环境条件下,在至少一种细胞、组织或器官中有转录活性的启动子。下表2a给出组成型启动子的例子。
表2a:组成型启动子的例子
遍在启动子
遍在启动子基本上在生物的全部组织或细胞中有活性。
发育调控型启动子
发育调控型启动子在某些发育阶段期间或在经历发育变化的植物的部分中有活性。
诱导型启动子
诱导型启动子在应答化学刺激(综述见Gatz 1997,Annu.Rev.PlantPhysiol.Plant Mol.Biol.,48:89-108)、环境刺激或物理刺激时具有诱导型或增加的转录启动作用,或可以是“胁迫诱导的”,即当植物暴露于多种胁迫条件时被激活,或是“病原体诱导的”,即当植物暴露于多种病原体时被激活。
器官特异性/组织特异性启动子
器官特异性或组织特异性启动子是能够偏好性地在某些器官或组织如叶、根、种子组织等中启动转录的启动子。例如,“根特异性启动子”是这样的启动子,该启动子优势地在植物根中具有转录活性,基本上在植物的任何其他部分中无活性,尽管在该植物其他这些部分中仍允许任意泄露表达。能够仅在某些细胞中启动转录的启动子在本文中称作“细胞特异性的”。
根特异性启动子的例子列于下表2b:
表2b:根特异性启动子的实例
Figure BDA0000128813510000221
Figure BDA0000128813510000231
种子特异性启动子是优势地在种子组织中有转录活性,但并非必需排他性地在种子组织中有转录活性(在泄露表达的情况下)。种子特异性启动子可以在种子发育期间和/或萌发期间有活性。种子特异性启动子可以是胚乳/糊粉/胚特异性的。种子特异性启动子的例子(胚乳/糊粉/胚特异性)示于下表2c-表2f中。种子特异性启动子的其他例子在Qing Qu和Takaiwa(Plant Biotechnol.J.2,113-125,2004)中给出,所述文献的公开内容如完整所述那样通过引用方式并入本文。
表2c:种子特异性启动子的例子
Figure BDA0000128813510000241
Figure BDA0000128813510000251
Figure BDA0000128813510000261
表2d:胚乳特异性启动子的例子
Figure BDA0000128813510000262
Figure BDA0000128813510000271
表2e:胚特异性启动子的例子:
  基因来源   参考文献
  稻OSH1   Sato等人,Proc.Natl.Acad.Sci.USA,93:8117-8122,1996
  KNOX   Postma-Haarsma等人,Plant Mol.Biol.39:257-71,1999
  PRO0151   WO 2004/070039
  PRO0175   WO 2004/070039
  PRO005   WO 2004/070039
  PRO0095   WO 2004/070039
表2f:糊粉特异性启动子的例子:
Figure BDA0000128813510000272
Figure BDA0000128813510000281
如本文中所定义的绿色组织特异性启动子是优势地在绿色组织中具有转录活性的启动子,在植物的任何其它部分内基本上无活性,尽管在该植物其他这些部分中仍允许任意泄露表达。
可以用于进行本发明方法的绿色组织特异性启动子的例子在下表2g中显示。
表2g:绿色组织特异性启动子的例子
Figure BDA0000128813510000282
组织特异性启动子的另一个例子是分生组织特异性启动子,其优势地在分生组织中具有转录活性,在植物的任何其它部分内基本上无活性,尽管在该植物其他这些部分中仍允许任意泄露表达。可以用于进行本发明方法的绿色分生组织特异性启动子的例子在下表2h中显示。
表2h:分生组织特异性启动子的例子
Figure BDA0000128813510000291
终止子
术语“终止子”包括作为转录单元末端处DNA序列的控制序列,所述的DNA序列产生初级转录物的3’加工和多聚腺苷化及转录终止的信号。所述终止子可以从天然基因、从多种其他植物基因或从T-DNA衍生。待添加的终止子可以从例如胭脂碱合酶或章鱼碱合酶基因或备选地从另一种植物基因或较不优选地从任何其他真核基因衍生。
选择标记(基因)/报道基因
“选择标记”、“选择标记基因”或“报道基因”包括对细胞赋予表型的任何基因,其中所述″选择标记″、″选择标记基因″或“报道基因”在所述细胞中表达旨在促进鉴定和/或选择用本发明的核酸构建体转染或转化的细胞。这些标记基因能够借助一系列不同原理而鉴定核酸分子的成功转移。合适的标记可以选自赋予抗生素抗性或除草剂抗性、导入新代谢性状或允许目视选择的标记。选择标记基因的例子包括赋予抗生素抗性的基因(如使新霉素和卡那霉素磷酸化的nptII或使潮霉素磷酸化的hpt或赋予针对例如博来霉素、链霉素、四环素、氯霉素、氨苄青霉素、庆大霉素、遗传霉素(Geneticin)(G418)、壮观霉素或杀稻瘟菌素的抗性的基因)、赋予除草剂抗性的基因(例如提供Basta
Figure BDA0000128813510000301
抗性的bar;提供草甘膦抗性的aroA或gox或赋予针对例如咪唑啉酮、膦丝菌素或磺脲类的抗性的基因)或提供代谢性状的基因(如允许植物使用甘露糖作为唯一碳源的manA,或利用木糖的木糖异构酶,或抗营养性标记如2-脱氧葡萄糖抗性)。目视标记基因的表达导致颜色(例如β-葡糖醛酸酶、GUS或β-半乳糖苷酶与其有色底物例如X-Gal)、发光(如萤光素/萤光素酶系统)或荧光(绿色荧光蛋白GFP和其衍生物)的形成。这个名单仅代表少数的可能标记。技术人员熟悉此类标记。取决于生物和选择方法,优选不同的标记。
已知当核酸稳定或瞬时地整合至植物细胞时,仅少数细胞摄取了外来DNA,并且根据需要,将其整合至细胞的基因组中,这取决于所用的表达载体和所用的转染技术。为鉴定并选择这些整合体,编码选择标记的基因(如上文所述的基因)通常连同目的基因一起导入宿主细胞。这些标记可以在这些基因例如通过常规方法缺失而无功能的突变体中使用。此外,编码选择标记的核酸分子可以在包含编码本发明多肽或在本发明方法中所用多肽的序列的相同载体上,或在独立的载体上导入宿主细胞。已经用所导入核酸稳定转染的细胞可以通过选择作用鉴定(例如具有整合的选择标记的细胞存活而其他细胞死亡)。
因为所述标记基因,尤其抗生素抗性基因和除草剂抗性基因一旦核酸已经成功地导入,则在转基因宿主细胞中是不再需要或不想要的,故而,用于导入核酸的本发明方法有利地使用能够去掉或切除这些标记基因的技术。一种这样的方法称作共转化法。共转化法同时使用两种载体用于转化,一种载体携带本发明的核酸而第二种载体携带标记基因。大比例的转化体接受或在植物情况下包含(多达40%或更多的转化体)这两种载体。在用农杆菌(Agrobacterium)转化的情况下,转化体通常仅接受载体的一部分,即侧翼存在T-DNA的序列,该序列通常代表表达盒。标记基因随后可以通过开展杂交从转化的植物中除去。在另一种方法中,整合至转座子的标记基因用来与目的核酸一起进行转化(称作Ac/Ds技术)。转化体可以与转座酶来源物杂交,或该转化体用导致转座酶表达的核酸构建体瞬时或稳定地转化。在一些情况下(大约10%),一旦转化已经成功发生,则转座子从宿主细胞的基因组中跳出并丢失。在其他许多情况下,转座子跳到不同位置。在这些情况下,必须通过开展杂交消除标记基因。在微生物学中,开发了有可能或促进检测这类事件的技术。又一个有利的方法依赖于所谓重组系统;此方法的优势在于可以用所述的重组系统实行杂交消除作用。最知名的该类型系统称作Cre/lox系统。Cre1是除去位于loxP序列之间序列的重组酶。若所述标记基因整合在loxP序列之间,则一旦转化已经成功发生,它因重组酶表达而被除去。其他重组系统是HIN/HIX、FLP/FRT和REP/STB系统(Tribble等,J.Biol.Chem.,275,2000:22255-22267;Velmurugan等,J.Cell Biol.,149,2000:553-566)。有可能将本发明核酸序列以位点特异性方式整合至植物基因组。这些方法自然也可以应用于微生物如酵母、真菌或细菌。
转基因的/转基因/重组
为本发明的目的,“转基因的”、“转基因”或“重组”例如就核酸序列而言,意指包含所述核酸序列的表达盒、基因构建体或载体,或用本发明核酸序列、表达盒或载体转化的生物,这些构建体均通过重组方法产生,其中
(a)编码在本发明方法中有用的蛋白质的核酸序列,或
(b)与本发明核酸序列有效连接的基因控制序列,例如启动子,或
(c)a)和b)
不位于其天然遗传环境中或已经通过重组方法被修饰,所述的修饰有可能采取例如取代、添加、倒位或插入一个或多个核苷酸残基的形式。天然遗传环境理解为意指原初植物中的天然基因组位点或染色体位点或存在于基因组文库中。在基因组文库的情况下,核酸序列的天然遗传环境优选地保留,至少部分保留。该环境分布在所述核酸序列的至少一侧并且具有至少50bp,优选至少500bp,特别优选至少1000bp,最优选至少5000bp序列长度。当天然存在的表达盒受非天然的合成(“人工”)方法(如诱变处理)被修饰时,天然存在的表达盒-例如所述核酸序列的天然启动子与编码在本发明方法中有用的多肽的相应核酸序列的天然存在组合,如上文所定义-变成转基因表达盒。合适方法例如在US 5,565,350或WO 00/15815中描述。
为本发明目的,如上所述,将转基因植物因此理解为意指在本发明方法中有用的核酸不处于所述植物基因组中所述核酸的天然基因座处,所述核酸有可能同源或异源地表达。但是,如所提及,转基因的还意指尽管本发明的或在本发明方法中有用的核酸处于植物基因组中所述核酸的天然位置处,然而其序列相对于天然序列而言已经被修饰,和/或所述天然序列的调控序列已经被修饰。转基因的优选地理解为意指本发明核酸在基因组的非天然基因座处表达,即,所述核酸的同源表达或优选异源表达发生。优选的转基因植物在本文中提及。
调节
就表达或基因表达而言,术语“调节”意指这样的过程,在所述过程中与对照植物相比较,表达水平因所述基因的表达而改变,表达水平可以增加或减少。原始、未调节的表达可以是结构性RNA(rRNA、tRNA)或mRNA的任何类型的表达,随后是翻译。术语“调节活性”意指本发明核酸序列或所编码蛋白质的表达的任何改变,这导致植物产量增加和/或生长增加。
表达
术语“表达”或“基因表达”意指某个特定基因或多个特定基因或特定基因构建体的转录。术语“表达”或“基因表达”尤其意指某个基因或诸基因或基因构建体转录成结构性RNA(rRNA、tRNA)或mRNA,而所述RNA随后翻译或不翻译成蛋白质。该过程包括DNA的转录和所得mRNA产物的加工。
增加的表达/过量表达
如本文中所用的术语“增加的表达”或“过量表达”意指相对于原有野生型表达水平为额外的任何形式的表达。
在本领域内充分记载了用于增加基因或基因产物表达的方法并且这些方法包括例如由适宜启动子驱动的过量表达、使用转录增强子或翻译增强子。充当启动子或增强子元件的分离核酸可以导入多核苷酸的非异源形式的适宜位置(一般在上游)中,从而上调编码目的多肽的核酸表达。例如,内源性启动子可以在体内通过突变、缺失和/或取代进行改变(见Kmiec,US 5,565,350;Zarling等,WO9322443),或可以将分离的启动子以相对于本发明基因的恰当方向及距离导入植物细胞,从而控制该基因的表达。
若需要多肽表达,通常希望的是在多核苷酸编码区的3’末端处包括多聚腺苷化区。所述多聚腺苷化区可以从天然基因、从多种其他植物基因或从T-DNA衍生。待添加的3’末端序列可以从例如胭脂碱合酶或章鱼碱合酶基因或备选地从另一种植物基因或较不优选地从任何其他真核基因衍生。
也可以将内含子序列添加至5’非翻译区(UTR)或部分编码序列的编码序列以增加细胞溶胶内聚集的成熟信使的数量。已经证实在植物和动物表达构建体的转录单位中包含可剪接内含子增加了mRNA水平及蛋白质水平上的基因表达至多到1000倍(Buchman和Berg(1988)Mol.Cell biol.8:4395-4405;Callis等(1987)Gens Dev 1:1183-1200)。此类内含子增强基因表达的作用一般在所述内含子置于转录单位的5’末端附近时最强烈。玉米内含子Adh1-S内含子1、2和6、Bronze-1内含子的用途是本领域已知的。对于总体信息,见:《玉米手册》,第116章,编者Freeling和Walbot,Springer,N.Y.(1994)。
减少的表达
本文中提及的“减少的表达”或“降低或基本消除表达”意指内源基因表达和/或多肽水平和/或多肽活性相对于对照植物的下降。与对照植物相比较,所述降低或基本消除以递增优选顺序是至少10%、20%、30%、40%或50%、60%、70%、80%、85%、90%或95%、96%、97%、98%、99%或更多降低。
为了降低或基本消除植物中内源基因的表达,需要核酸序列的基本上连续的核苷酸的足够长度。为了进行基因沉默,这个长度可以是短至20、19、18、17、16、15、14、13、12、11、10个或更少的核苷酸,或者该长度可以长至完整基因(包括部分或完整的5’和/或3’UTR)。基本上连续的核苷酸片段可以从编码目的蛋白的核酸(靶基因)或从能够编码目的蛋白的直向同源物、旁系同源物或同源物的任何核酸衍生。优选地,基本上连续的核苷酸的片段能够与靶基因(有义链或反义链)形成氢键,更优选地,基本上连续的核苷酸片段以增加的优选顺序与靶基因(有义链或反义链)具有50%、60%、70%、80%、85%、90%、95%、96%、97%、98%、99%、100%的序列同一性。编码(功能性)多肽的核酸序列不是用于降低或基本消除内源基因表达的本文中所讨论多种方法的必要条件。
表达的这种降低或基本消除可以使用常规工具和技术完成。用于降低或基本消除内源基因表达的优选方法是在植物中导入并表达基因构建体,其中将核酸(在此情况下,从目的基因或从能够编码任何一种目的蛋白的直向同源物、旁系同源物或同源物的任何核酸中衍生的一段基本上连续的核苷酸)克隆至所述基因构建体,作为被间隔序列(非编码性DNA)隔开的(部分或完全)反向重复序列。
在这种优选的方法中,使用核酸或其部分(在此情况下,所述部分是从目的基因或从能够编码目的蛋白的直向同源物、旁系同源物或同源物的任何核酸中衍生的一段基本上连续的核苷酸)的反向重复序列(其优选能够形成发夹结构),通过RNA介导的沉默作用降低或基本上消除内源基因的表达。在包含控制序列的表达载体中克隆所述反向重复序列。非编码性DNA核酸序列(间隔序列,例如基质附着区片段(MAR)、内含子、多接头等)位于形成所述反向重复序列的两个反向核酸之间。在反向重复序列转录后,形成具有(部分或完全)自我互补性结构的嵌合RNA。这种双链RNA结构称作发夹RNA(hpRNA)。hpRNA由植物加工成siRNA,该siRNA掺入RNA诱导的沉默复合体(RISC)。该RISC进一步切开所述mRNA转录物,从而大幅降低待翻译成多肽的mRNA转录物的数目。对于其他一般细节,见例如Grierson等人(1998)WO 98/53083;Waterhouse等人(1999)WO99/53050。
本发明方法的实施不依赖在植物中导入并表达所述核酸作为反向重复序列克隆到其中的基因构建体,不过可以使用几种熟知“基因沉默”方法的任何一种或多种方法来实现相同的作用。
用于降低内源基因表达的这样一种方法是RNA介导的基因表达沉默(下调)。在这种情况下,沉默作用由基本上与内源性靶基因相似的双链RNA序列(dsRNA)在植物中触发。这种dsRNA进一步由植物加工成约20个至约26个核苷酸,称作短干扰RNA(siRNA)。siRNA掺入RNA诱导的沉默复合体(RISC)中,其中所述的RISC切割内源性靶基因的mRNA转录物,从而大幅降低待翻译成多肽的mRNA转录物的数目。优选地,所述双链RNA序列对应于靶基因。
RNA沉默方法的另一个例子包括将核酸序列或其部分(在此情况下是从目的基因或从能够编码目的蛋白的直向同源物、旁系同源物或同源物的任何核酸中衍生的一段基本上连续的核苷酸)以有义方向导入植物。“有义方向”指与其mRNA转录物同源的DNA序列。因而,将所述核酸序列的至少一个拷贝导入植物。这种额外的核酸序列会降低内源基因表达,产生称为共抑制作用的现象。当一种核酸序列的几个额外拷贝导入植物时,基因表达的降低将更明显,因为高转录物水平与触发共抑制作用之间存在正相关。
RNA沉默方法的另一个例子包括使用反义核酸序列。“反义”核酸序列包含与编码蛋白质的“有义”核酸序列互补,即与双链cDNA分子的编码链互补,或与mRNA转录物序列互补的核苷酸序列。所述反义核酸序列优选地与待沉默的内源基因互补。此互补性可以位于基因的“编码区”中和/或基因的“非编码区”中。术语“编码区”指包含被翻译成氨基酸残基的密码子的核苷酸序列的区域。术语“非编码区”指被转录但不被翻译成氨基酸的分布在编码区侧翼的5’和3’序列(也称作5’和3’非翻译区)。
反义核酸序列可以根据Watson和Crick碱基对规则设计。反义核酸序列可以与完整核酸序列(在此情况下是从目的基因或从能够编码目的蛋白的直向同源物、旁系同源物或同源物的任何核酸中衍生的一段基本上连续的核苷酸)互补,不过也可以是仅与所述核酸序列的一部分(包括mRNA5’和3’UTR)反义的寡核苷酸。例如,所述反义寡核苷酸序列可以与编码多肽的mRNA转录物的翻译起点周围的区域互补。合适反义寡核苷酸序列的长度是本领域已知的并且可以从长度约50、45、40、35、30、25、20、15或10个核苷酸或更少的核苷酸开始。本发明的反义核酸序列可以使用化学合成和酶连接反应,利用本领域已知的方法构建。例如,反义核酸序列(例如反义寡核苷酸序列)可以使用天然存在的核苷酸或多种修饰的核苷酸化学地合成,其中设计所述的修饰核苷酸旨在增加分子的生物学稳定性或增加反义核酸序列与有义核酸序列之间所形成双链体的物理稳定性,例如,可以使用硫代磷酸酯衍生物和吖啶取代的核苷酸。可以用来产生反义核酸序列的修饰核苷酸的例子是本领域熟知的。已知的核苷酸修饰包括甲基化、环化和“加帽”用类似物(如肌苷)取代一个或多个天然存在的核苷酸。对核苷酸的其他修饰是本领域熟知的。
所述反义核酸序列可以使用表达载体以生物学方式产生,其中将一种核酸序列以反义方向亚克隆(即从所插入核酸转录出的RNA将与目的靶核酸呈反义方向)至所述表达载体。优选地,植物中反义核酸序列的产生借助稳定整合的核酸构建体进行,其中所述的核酸构建体包含启动子、有效连接的反义寡核苷酸和终止子。
本发明方法中用于沉默作用的核酸分子(无论导入植物中或原位(insitu)产生)与mRNA转录物和/或编码多肽的基因组DNA杂交或结合,从而抑制蛋白质的表达,例如通过抑制转录和/或翻译做到这一点。杂交可以通过常规核苷酸互补性以形成稳定双链体引起,或例如与DNA双链体结合的反义核酸序列的情形下,因双螺旋大沟内的特异性相互作用引起。反义核酸序列可以通过转化法或在特定组织部位处的直接注射法导入植物。或者,反义核酸序列可以受到修饰以靶向所选的细胞并且随后全身性施用例如,对于全身性施用,可以修饰反义核酸序列,从而它们与表达在所选细胞表面上的受体或抗原特异性地结合,例如通过将所述反义核酸序列连接至与细胞表面受体或抗原结合的肽或抗体连接而做到这一点。所述反义核酸序列也可以使用本文中所述的载体递送至细胞。
根据又一个方面,反义核酸序列是α-端基异构核酸序列。α端基异构核酸序列与互补RNA形成特定的双链杂交体,在所述双链杂交体中与常见的b-单元相反,所述链彼此平行(Gaultier等(1987)Nucl Ac Res 15:6625-6641)。反义核酸序列也可以包含2′-O-甲基核糖核苷酸(Inoue等(1987)Nucl Ac Res 15,6131-6148)或嵌合RNA-DNA类似物(Inoue等(1987)FEBSLett.215,327-330)。
内源基因表达的降低或基本上消除也可以使用核酶进行。核酶是具有核糖核酸酶活性的催化性RNA分子,能够切割与其具有互补区域的单链核酸序列,如mRNA。因此,核酶(例如锤头状核酶(在Haselhoff和Gerlach(1988)Nature 334,585-591中描述)可以用来催化性地切割编码多肽的mRNA转录物,因而大幅降低待翻译成多肽的mRNA转录物的数目。可以设计对核酸序列具有特异性的核酶(见例如:Cech等美国专利号4,987,071;和Cech等美国专利号5,116,742)。或者,与核酸序列相对应的mRNA转录物可以用来从RNA分子汇集物中选出具有特异核糖核酸酶活性的催化性RNA(Bartel和Szostak(1993)Science 261,1411-1418)。核酶用于植物中基因沉默的用途是本领域已知的(例如Atkins等(1994)WO94/00012;Lenne等(1995)WO 95/03404;Lutziger等(2000)WO 00/00619;Prinsen等(1997)WO 97/13865和Scott等(1997)WO 97/38116)。
基因沉默也可以通过插入诱变(例如T-DNA插入或转座子插入)或通过如Angell和Baulcombe((1999)Plant J.20(3):357-62)、(Amplicon VIGSWO 98/36083)或Baulcombe(WO 99/15682)及其他人描述的策略实现。
内源基因中存在突变和/或在随后导入植物的分离的基因/核酸中存在突变时,基因沉默也可以发生。所述降低或基本上消除可以由无功能的多肽引起。例如,多肽可以与多种相互作用性蛋白质结合;一种或多种突变和/或截短因而可以产生仍能够结合相互作用性蛋白质(如受体蛋白)但不能表现其正常功能的多肽(如信号配体)。
基因沉默的又一种方法是靶向与基因的调控区(例如启动子和/或增强子)互补的核酸序列以形成可阻止靶细胞中基因转录的三重螺旋结构。见Helene,C.,Anticancer Drug Res.6,569-84,1991;Helene等,Ann.N.Y.Acad.Sci.660,27-361992;和Maher,L.J.Bioassays 14,807-15,1992。
技术人员熟知其他方法,如使用针对内源性多肽的抗体以抑制其在植物中的功能,或干扰其中涉及某多肽的信号传导途径。尤其,可以考虑人造分子可用于抑制靶多肽的生物学功能,或用于干扰其中涉及所述靶多肽的信号传导途径。
或者,可以设立筛选程序以鉴定植物群体中基因的天然变体,其中所述的天然变体编码活性降低的多肽。也可以使用此类天然变体,例如来开展同源重组。
人工和/或天然的微RNA(miRNA)可以用来敲除基因表达和/或mRNA翻译。内源性miRNA是通常长19-24个核苷酸的单链小RNA。它们主要发挥调控基因表达和/或mRNA翻译的功能。大多数的植物微RNA(miRNA)与其靶序列完全互补或接近完全互补。但是,存在具有多达5个错配的天然靶。它们由Dicer家族的双链特异性RNA酶从具有特征性折返结构的较长非编码性RNA加工而来加工后,它们通过与RNA诱导的沉默复合体(RISC)的主要组分-Argonaute蛋白结合被掺入该复合体。miRNA充当RISC的特异性组分,因为它们与胞质内的靶核酸(大多是mRNA)发生碱基配对。后续调控事件包括靶mRNA切割和摧毁和/或翻译抑制。miRNA过量表达的作用因此往往反映为靶基因的mRNA水平减少。
可以按照遗传工程方式专门设计通常长21个核苷酸的人工微RNA(amiRNA)以负向地调控单个或多个目的基因的基因表达。选择植物的微RNA靶的决定因素是本领域熟知的。已经定义了用于靶识别的经验参数和可以使用它们来辅助特定amiRNA的设计(Schwab等,Dev.Cell 8,517-527,2005)。用于设计并产生amiRNA及其前体的便利工具也是公众可获得的(Schwab等,2006Plant Cell.200618(5):1121-33)。
为了最佳性能,用于降低植物中内源基因表达的基因沉默技术需要使用来自单子叶植物的核酸序列以转化单子叶植物,和使用来自双子叶植物的核酸序列以转化双子叶植物。优选地,来自任何给定植物物种的核酸序列导入相同物种。例如,来自稻的核酸序列转化至稻植物。但是,并非绝对要求待导入的核酸序列源自与该核酸序列待导入的植物相同的植物物种。只要内源性靶基因与待导入的核酸之间存在基本的同源性即可。
上文描述的是用于降低或基本上消除植物中内源基因表达的多种方法的例子。本领域技术人员会轻易地能够调整前述用于沉默的方法以至于例如通过利用合适启动子,实现降低完整植物中或其部分中内源基因的表达。
转化
如本文中提及的术语“导入”或“转化”包括外源性多核苷酸转移至宿主细胞,无论转化所用的方法是什么方法。能够后续克隆性增殖(无论通过器官发生或胚发生)的植物组织可以用本发明的基因构建体转化并且完整植物可以从中再生。所选的具体组织根据可用于并且最适于正在进行转化的具体物种的克隆性增殖系统变化。示例性靶组织包括叶盘、花粉、胚、子叶、下胚轴、大配子体、愈伤组织、现存分生组织(例如顶端分生组织、腋芽和根分生组织)和诱导性分生组织(例如子叶分生组织和下胚轴分生组织)。多核苷酸可以瞬时或稳定地导入宿主细胞并且可以非整合地维持,例如作为质粒。备选地,它可以整合至宿主基因组。所得的转化植物细胞随后可以用来按照本领域技术人员已知的方式再生出转化植物。
外来基因转移至植物基因组的过程称作转化。转化植物物种现在是极为常规的技术。有利地,几种转化方法中的任何方法可以用来将目的基因导入合适的祖先细胞。描述用于转化并从植物组织或植物细胞再生出植物的方法可以用于瞬时转化或稳定转化。转化方法包括使用脂质体、电穿孔法、增加游离DNA摄入的化学品、DNA直接注射至植物、粒子枪轰击法、使用病毒或花粉的转化法和显微投射法(microprojection)。转化方法可以选自用于原生质体的钙/聚乙二醇法(Krens,F.A.等,(1982)Nature 296,72-74;Negrutiu I等(1987)Plant Mol Biol 8:363-373);原生质体的电穿孔法(Shillito R.D.等(1985)Bio/Technol 3,1099-1102);对植物材料的微量注射法(Crossway A等,(1986)Mol.Gen Genet 202:179-185);DNA或RNA包被的粒子轰击法(Klein TM等,(1987)Nature 327:70)、(非整合性)病毒感染法等。包括转基因作物植物在内的转基因植物优选通过农杆菌介导的转化法产生。有利的转化方法是植物内(in planta)转化法。为此目的,例如有可能将农杆菌作用于植物种子或有可能用农杆菌接种植物分生组织。根据本发明,已经证明特别有利的是将转化的农杆菌悬液作用于完整植物或至少作用于花原基。随后继续培育该植物直至获得已处理植物的种子(Clough和Bent,Plant J.(1998)16,735-743)。用于农杆菌介导稻转化的方法包括用于稻转化的众知方法,如在以下任意文献中描述的那些方法:欧洲专利申请EP 1198985A1,Aldemita和Hodges(Planta 199:612-617,1996);Chan等(Plant Mol Biol 22(3):491-506,1993),Hiei等(Plant J 6(2):271-282,1994),其公开内容如充分所述那样通过引用的方式并入本文。在玉米转化的情况下,优选的方法如Ishida等(Nat.Biotechnol 14(6):745-50,1996)或Frame等(Plant Physiol 129(1):13-22,2002)描述,其公开内容如充分所述那样通过引用的方式并入本文。所述方法还例如由B.Jenes等,Techniques for Gene Transfer,在:Transgenic Plants,第1卷,Engineering and Utilization,编者S.D.Kung和R.Wu,AcademicPress(1993)128-143及在Potrykus Annu.Rev.Plant Physiol.Plant Molec.Biol.42(1991)205-225)描述。待表达的核酸或构建体优选地克隆至适于转化根癌农杆菌(Agrobacterium tumefaciens)的载体,例如pBin19(Bevan等,Nucl.Acids Res.12(1984)8711)。通过这种载体转化的农杆菌随后可以按照已知方式用于转化植物,例如作为模型使用的植物如拟南芥属植物(拟南芥在本发明范围不视为作物植物),或作物植物,例如烟草植物,所述方式例如是通过将擦伤的叶或切碎的叶浸泡在农杆菌溶液中并随后将它们在合适培养基中培育。借助根癌农杆菌转化植物例如由和Willmitzer在Nucl.Acid Res.(1988)16,9877中描述或尤其从F.F.White,Vectors forGene Transfer in Higher Plants;在Transgenic Plants,第1卷,Engineeringand Utilization,编者S.D.Kung和R.Wu,Academic Press,1993,第15-38页中获知。
除了转化随后必需再生成完整植物的体细胞之外,还可转化植物分生组织的细胞,并且尤其是发育成配子的那些细胞。在这种情况下,转化的配子遵循天然植物发育过程,从而产生转基因植物。因此,例如用农杆菌处理拟南芥属植物的种子并且从正在发育的植物中获得种子,其中一定比例的所述植物被转化并且因此是转基因的[Feldman,KA和MarksMD(1987)Mol Gen Genet 208:274-289;Feldmann K(1992),在:编者CKoncz,N-H Chua和J Shell,Methods in Arabidopsis Research.WordScientific,Singapore,第274-289页]。备选方法基于反复除去花序并将莲座丛中心内的切除部位与转化的农杆菌温育,因而同样可以在较晚的时间点上获得转化的种子(Chang(1994)Plant J.5:551-558;Katavic(1994)MolGen Genet,245:363-370)。但是,特别有效的方法是改良真空渗入法,如“花器浸蘸”法。在拟南芥属植物真空渗入法的情况下,在减压下用农杆菌悬液处理完整植物[Bechthold,N(1993)。C R Acad Sci Paris Life Sci,316:1194-1199],而在”花器浸蘸法”的情况下,将正在发育的花组织与经表面活性剂处理的农杆菌悬液短暂温育[Clough,SJ和Bent,AF(1998)ThePlant J.16,735-743]。在这两种情况下均收获某个比例的转基因种子,并且这些种子可以通过在如上所述的选择条件下培育与非转基因种子区分。此外,质体的稳定转化是有利的,因为质体在大部分作物中母系地遗传,这降低或消除了经过花粉的转基因流动风险。叶绿体基因组的转化一般通过在Klaus等,2004[Nature Biotechnology 22(2),225-229]中已示意性展示的方法实现。简而言之,将待转化的序列连同选择标记基因一起克隆至同源于叶绿体基因组的侧翼序列之间。这些同源侧翼序列指导进入原质体的位点特异性整合。已经对许多不同植物物种描述了质体转化并且Bock(2001)基础研究和植物生物技术中的转基因质体(Transgenic plastidsin basic research and plant biotechnology).J Mol Biol.2001年9月21日;312(3):425-38或Maliga,P(2003)质体转化技术商业化进展(Progresstowards commercialization of plastid transformation technology),TrendsBiotechnol.21,20-28进行了综述。其他生物技术进展最近已经以无标记质体转化体的形式进行报道,其中所述的无标记质体转化体可以通过瞬时共整合性标记基因产生(Klaus等,2004,Nature Biotechnology 22(2),225-229)。
遗传修饰的植物细胞可以通过技术人员熟悉的全部方法再生。合适的方法可以在上文提及的S.D.Kung和R.Wu,Potrykus或和Willmitzer的出版物中找到。
通常在转化后,对植物细胞或细胞群体选择一个或多个标记的存在性,其中所述标记由随同目的基因一起共转移的植物可表达基因编码,随后将转化材料再生成完整植物。为了选择转化植物,在所述转化中获得的植物材料原则上经历选择性条件,从而转化植物可以与非转化植物区分。例如,可以将以上述方式获得的种子播种,并且在初始培育期间后,通过喷洒进行合适的选择。另一种可能性在于根据需要消毒后,在使用合适选择剂的琼脂板上培育种子,从而仅转化的种子可以长成植物。备选地,对所述转化植物筛选选择标记(如上文所述的选择标记)的存在性。
在DNA转移和再生后,推定转化的植物也可以例如使用DNA印迹分析对目的基因的存在性、拷贝数和/或基因组构造进行评价。备选地或额外地,新导入的DNA的表达水平可以使用RNA印迹分析和/或蛋白质印迹分析或这两种分析法监测,这两项技术均是本领域普通技术人员熟知的。
产生的转化植物可以通过多种方法繁殖,如通过克隆繁殖法或经典育种技术。例如,第一世代(或T1)转化植物可以进行自交并且选择纯合的第二世代(或T2)转化体,并且T2植物随后可以通过经典育种技术进一步繁殖。产生的转化生物可以采取多种形式。例如,它们可以是转化细胞和非转化细胞的嵌合体;克隆性转化体(例如,被转化以含有表达盒的全部细胞);转化组织和非转化组织的移植体(例如在植物中,与未转化接穗嫁接的转化根状茎)。
T-DNA活化标签技术(T-DNA activation tagging)
T-DNA活化标签技术(Hayashi等Science(1992)1350-1353)涉及以启动子指导靶向的基因表达的方式在目的基因的基因组区域内或基因的编码区上游或下游10kb处插入通常含有启动子(也可以是翻译增强子或内含子)的T-DNA。一般,靶向基因的天然启动子对该靶向基因表达的调控被破坏,并且所述基因处于新导入的启动子控制下。该启动子一般嵌入T-DNA中。这种T-DNA随机地插入植物基因组,例如借助农杆菌感染,并且导致在插入的T-DNA附近的基因表达受到调节。所得的转基因植物因在导入的启动子附近的基因表达受到调节而显示显性表型。
TILLING
术语“TILLING”是“基因组中定向诱导的局部损伤法”的缩写并且指用于产生和/或鉴定核酸的诱变技术,其中所述的核酸编码具有改良表达和/或活性的蛋白质。TILLING还允许选择携带此类突变变体的植物。这些突变变体可以表现在强度或在位置或在时间方面改良的表达(例如若所述突变影响启动子)。这些突变变体可以显示比其天然形式基因所表现活性更高的活性。TILLING将高密度诱变与高通量筛选方法组合。在TILLING中一般遵循的步骤是:(a)EMS诱变(Redei GP和Koncz C(1992)在Methodsin Arabidopsis Research,Koncz C,Chua NH,Schell J,Singapore编辑,World Scientific Publishing Co,第16-82页;Feldmann等,(1994)在Meyerowitz EM,Somerville CR编辑,Arabidopsis.Cold Spring HarborLaboratory Press,Cold Spring Harbor,NY,第137-172页;Lightner J和Caspar T(1998)在J Martinez-Zapater,J Salinas编者,Methods onMolecular Biology第82卷.Humana Press,Totowa,NJ,第91-104页);(b)个体的DNA制备和汇集;(c)目的区域的PCR扩增;(d)变性和复性以使得异双链体形成;(e)DHPLC,其中异双链体在汇集物中的存在作为色谱图中一个额外的峰被检测到;(f)鉴定突变个体;和(g)对突变PCR产物的测序。用于TILLING的方法是本领域熟知的(McCallum等,(2000)NatBiotechnol 18:455-457;综述见Stemple(2004)Nat Rev Genet 5(2):145-50)。
同源重组
同源重组允许在基因组中定义的所选位置处导入选择的核酸。同源重组是在生物科学中例行用于低等生物如酵母或小立碗藓属(Physcomitrella)苔藓的标准技术。已经对模式植物(Offringa等(1990)EMBO J 9(10):3077-84)和作物植物例如稻(Terada等(2002)Nat Biotech 20(10):1030-4;Iida和Terada(2004)Curr Opin Biotech 15(2):132-8)描述了用于植物中开展同源重组的方法,并且存在与靶生物无关而通常适用的方法(Miller等,Nature Biotechnol.25,778-785,2007)。
产量相关性状
产量相关性状包含一个或多个产量、生物量、种子产量、早期萌发势、绿度指数(greenness index)、增加的生长速率、改善的农艺性状(例如改善的水利用效率(WUE)、氮利用效率(NUE)等)。
产量
术语“产量”通常意指经济价值的可测量结果,一般与特定作物、与面积并与时间段有关。单个植物部分基于它们的数目、大小和/或重量而直接有助于对产量,或实际产量是对于某种作物和一年的每平方米产量,这通过总产量(包括收获的和评估的产量)除以种植的平方米数而确定。术语植物的“产量”可以涉及该植物的营养生物量(根和/或枝条生物量)、涉及繁殖器官和/或涉及繁殖体(如种子)。
以玉米为例,产量增加可以表现为以下一个或多个指标:每平方米已建立的植物数目增加、每株植物穗数的增加、行数、每行籽粒数、籽粒重、千粒重、穗长度/直径的增加、种子饱满率(即饱满种子数除以种子总数并乘以100)增加,及其他。以稻为例,产量增加可以自身表现为下列一种或多种指标的增加:每平方米植物数、每株植物的圆锥花序数、圆锥花序长度、每圆锥花序的小穗数、每圆锥花序的花(小花)数目、种子饱满率(即饱满种子数除以种子总数并乘以100)增加、千粒重增加及其他。在稻中,淹没耐受性也导致增加的产量。
早期萌发势
“早期萌发势”指活跃、健康、充分平衡的生长,尤其是植物生长早期期间,并且可以因植物适应性增加引起,其中所述的植物适应性增加原因在于例如该植物更好地适应环境(即优化能量来源的用途和枝条与根之间的分配)。具有早期萌发势的植物也显示幼苗存活增加和作物建立更佳,这往往产生高度均一的田块(作物以均一方式生长,即大多数植物在基本上相同的时间达到各个发育期)和往往形成更好及更高的产量。因而,早期萌发势可以通过测量多种因子如千粒重(Thousand Kernel Weight)、萌发百分数、出苗百分数、幼苗生长、幼苗高度、根长度、根和枝条生物量和许多其他因素等确定。
增加的生长速率
增加的生长速率可以是植物的一个或多个部分(包括种子)特有的,或可以基本上遍及整个植物。具有提到的生长速率的植物可以具备较短的生活周期。植物的生活周期可以意指从干燥成熟种子成长直至植物已经产生与起始材料相似的干燥成熟种子的阶段所需要的时间。这个生活周期可以受以下因素影响,如萌发速度、早期萌发势、生长速率、绿度指数、开花时间和种子成熟速度。生长速率的增加可以在植物生活周期的一个或多个阶段上或在基本上整个植物生活周期期间发生。增加的生长速率在植物生活周期的早期期间可以反映增强的萌发势。生长速率的增加可以改变植物的收获周期,从而允许植物较晚播种和/或较早收获,而这本来是不可能的(相似效果可以随较早的开花时间获得)。若生长速率充分增加,则可以允许进一步播种相同植物物种的种子(例如播种并收获稻植物,随后播种并收获其他稻植物,全部稻植物均处于一个常规生长时期中)。类似地,若生长速率充分地增加,可以允许进一步播种不同植物物种的种子(例如播种并收获玉米植物,随后例如播种并任选收获大豆、马铃薯或任何其他合适的植物)。在一些作物植物的例子中,来自相同根状茎的额外收获次数也可以是可能的。改变植物的收获周期可以导致每平方米一年生物量生产增加(原因在于可以培育并收获任何具体植物的次数(即在一年中)增加)。生长速率的增加也可以允许转基因植物在比其野生型对应物更广泛的地理区域内培育,因为培育作物的地域限制往往由栽种时期(早季)或在收获时期(晚季)的不利环境条件决定。这类不利条件可以避开,若缩短收获周期。生长速率可以通过从生长曲线获得多个参数而确定,此类参数可以是:T-Mid(植物达到50%最大植物大小所花费的时间)和T-90(植物达到90%最大植物大小所花费的时间),以及其他。
胁迫耐受性
与对照植物相比较,无论所述植物处于非胁迫条件下或无论所述植物暴露于多种胁迫,产量和/或生长速率的增加均出现。植物一般通过生长得更慢而应答于胁迫暴露。在严重胁迫条件下,植物甚至可以完全停止生长。另一方面,轻度胁迫在本文中定义为植物所暴露的任何下述胁迫,其中所述的胁迫未导致植物完全停止生长,但同时不能恢复生长。与非胁迫条件下的对照植物相比较,轻度胁迫在本发明意义中导致受胁迫植物的生长降低小于40%、35%、30%或25%、更优选地小于20%或15%。由于农业实践(灌溉、施肥、杀虫剂处理)的进步,在栽培作物植物中并不经常遇到严重胁迫。因此,由轻度胁迫诱导的受损生长对于农业往往是不受欢迎的特征。轻度胁迫是植物所暴露的常见生物胁迫和/或非生物(环境)胁迫。非生物胁迫可以因干旱或过量的水、缺氧胁迫、盐胁迫、化学毒性、氧化胁迫和热、寒冷或冰冻温度所致。非生物胁迫可以是因水胁迫(尤其因为干旱)、盐胁迫、氧化胁迫或离子胁迫引起的渗透胁迫。生物胁迫一般是由病原体如细菌、病毒、真菌、线虫和昆虫引起的那些胁迫。
具体而言,本发明的方法可以在非胁迫条件下或在轻度干旱条件开展以产生相对于对照植物具有增加的产量的植物。如Wang等人(Planta(2003)218:1-14)中报道,非生物胁迫导致一系列不利地影响植物生长及生产量的形态学、生理学、生物化学和分子变化。干旱、盐度、极端温度和氧化胁迫已知是相互联系的并可以通过相似机制诱导生长损害及细胞损害。Rabbani等人(Plant Physiol(2003)133:1755-1767)描述了干旱胁迫与高盐度胁迫之间极高程度的“交互作用”。例如,干旱和/或盐化作用主要表现为渗透胁迫,从而导致细胞内稳态和离子分布的破坏。经常伴随高温或低温、盐度或干旱胁迫的氧化胁迫可以引起功能性蛋白和结构蛋白变性。因此,这些多样的环境胁迫常常激活相似的细胞信号传导途径和细胞应答,如产生胁迫蛋白、上调抗氧化物质、积累兼容性溶质和生长停滞。如本文中所用的术语“非胁迫”条件是允许植物最佳生长的那些环境条件。本领域技术人员清楚对于给定地点的正常土壤条件和气候条件。具有最佳生长条件的植物(在非胁迫条件下生长的),以增加的优选顺序,通常产生此类植物在给定环境中至少97%、95%、92%、90%、87%、85%、83%、80%、77%或75%的平均产生。可以基于收获和/或季节基础,计算平均产生。本领域技术人员知晓作物的平均产量生产。
养分缺乏可以是由缺少养分导致的,所述养分例如氮、磷酸盐和其它含磷化合物、钾、钙、镁、锰、铁和硼,及其它。
术语盐胁迫不限制为普通盐(NaCl),而可以是任何一种或多种NaCl、KCl、LiCl、MgCl2、CaCl2及其它。
增加/改善/增强
术语“增加”、“改善”或“增强”是相互可交换的并且在应用含义上应当意指与如本文中定义的对照植物相比较,至少3%、4%、5%、6%、7%、8%、9%或10%、优选至少15%或20%、更优选地25%、30%、35%或40%更多的产量和/或生长。
种子产量
增加的种子产量自身可以表现为以下一个或多个指标:a)种子生物量(种子总重量)增加,这可以基于单粒种子基础和/或每株植物和/或每平方米;b)增加的每株植物花数目;c)增加的(饱满)种子数;d)增加的种子饱满率(其表述为饱满种子数与种子总数之间的比率);e)增加的收获指数,其表述为可收获部分(如种子)产量与总生物量的比率;和f)增加的千粒重(TKW),这从计数的饱满种子数及其总重量中外推出来。增加的TKW可以因增加的种子大小和/或种子重量引起,并且也可以因胚和/或胚乳大小的增加引起。
种子产量的增加也可以表现为种子大小和/或种子体积的增长。此外,种子产量的增加自身也可以表现为种子面积和/或种子长度和/或种子宽度和/或种子周长的增加。增加的产量也可以产生改良的构造,或可以因改良的构造而出现。
绿度指数
从植物的数字图像计算如本文中所用的“绿度指数”。对属于图像上植物目标的每个像素计算绿色值与红色值的比率(在编码颜色的RGB模式中)。绿度指数表述为绿色/红色比超过给定阈值的像素百分数。在正常生长条件下,在盐胁迫生长条件下和在营养可用性降低的生长条件下,在开花前的最后成像中测量植物的绿度指数。相反,在干旱胁迫生长条件下,在干旱后的首次成像中测量植物的绿度指数。
标记辅助的育种
此类育种程序有时需要使用例如EMS诱变法通过对植物进行诱变处理而导入等位变异;备选地,所述程序可以从收集并非故意造成的所谓“自然”源性等位变体开始。随后进行等位变体的鉴定,例如通过PCR法。此后是步骤:选择所讨论和导致增加的产量的序列的优异等位变体。选择一般通过监测含有所讨论序列的不同等位变体的植物的生长性能而实施。生长性能可以在温室或在田间监测。其他任选步骤包括将其中鉴定到优异等位变体的植物与另一种植物杂交。这可能用来例如产生感兴趣的表型特征组合。
在(基因作图)中用作探针
编码目的蛋白质的核酸用于遗传地或物理地绘制基因的用途仅需要至少15个核苷酸长度的核酸序列。这些核酸可以用作限制性片段长度多态性(RFLP)标记。限制性消化的植物基因组DNA的Southern印迹物(Sambrook J,Fritsch EF和Maniatis T(1989)Molecular Cloning,ALaboratory Manual)可以用编码目的蛋白质的核酸探测。所得的条带图式随后可以使用计算机程序如MapMaker(Lander等人(1987)Genomics 1:174-181)进行遗传分析以构建遗传图。此外,该核酸可以用来探测含有一组个体的限制性核酸内切酶处理的基因组DNA的Southern印迹物,其中所述的一组个体代表具有定义的遗传杂交的亲代和子代。DNA多态性的分离是明显的并用来计算编码目的蛋白质的核酸在先前使用这个群体获得的遗传图中的位置(Botstein等人(1980)Am.J.Hum.Genet.32:314-331)。
在Bernatzky和Tanksley(1986)Plant Mol.Biol.Reporter 4:37-41中描述了植物基因来源的探针的产生及其在遗传作图中的用途。许多出版物描述了使用以上概述的方法学或其变例对特定cDNA克隆的遗传作图。例如,F2互交群、回交群、随机交配群、邻近纯合系和其他个体群体可以用于作图。此类方法学是本领域技术人员熟知的。
所述核酸探针也可以用于物理作图(即序列在物理图上的排列;见Hoheisel等在:Non-mammalian Genomic Analyasis:A Practical Guide,Academic press 1996,第319-346页及其中引用的参考文献)。
在另一个实施方案中,所述核酸探针可以在直接荧光原位杂交(FISH)作图法(Trask(1991)Trends Genet.7:149-154)中使用。尽管当前的FISH作图法支持使用大的克隆(几个kb至几百个kb;见Laan等人(1995)Genome Res.5:13-20),然而灵敏度的改善可以允许使用更短探针进行FISH作图。
用于遗传作图及物理作图的多种基于核酸扩增的方法可以使用所述核酸而实施。方法例子包括等位基因特异性扩增法(Kazazian(1989)J.Lab.Clin.Med 11:95-96)、PCR扩增片段的多态性(CAPS;Sheffield等人(1993)Genomics 16:325-332)、等位基因特异性连接(Landegren等人(1988)Science 241:1077-1080)、核苷酸延伸反应(Sokolov(1990)Nucleic acid Res.18:3671)、放射杂交作图(Walter等人(1997)Nat.Genet.7:22-28)和Happy作图法(Dear和Cook(1989)Nucleic acid Res.17:6795-6807)。对于这些方法,使用核酸的序列来设计并产生在扩增反应或在引物延伸反应中使用的引物对。此类引物的设计是本领域技术人员熟知的。在使用基于PCR遗传作图的方法中,可能需要在对应于当前核酸序列的区域中鉴定作图交叉的亲代之间的DNA序列差异。但是,这通常对作图法而言不是必需的。
植物
本文中所用的术语“植物”包括完整植物、植物的祖先及子代和包括种子、枝条、茎、叶、根(包括块茎)、花和组织、器官在内的植物部分,其中每种前述对象包含目的基因/核酸。术语“植物”也包括植物细胞、悬浮培养物、愈伤组织、胚、分生组织区、配子体、孢子体、花粉和小孢子,同样每种前述对象包含目的基因/核酸。
在本发明方法中特别有用的植物包括属于植物界(Viridiplantae)超家族、尤其单子叶和双子叶植物的全部植物,包括饲用或饲料豆科植物、观赏植物、粮食作物、树或灌木,其中所述植物选自包含以下物种的名单:槭树属物种(Acer spp.)、猕猴桃属物种(Actinidia spp.)、秋葵属物种(Abelmoschus spp.)、剑麻(Agave sisalana)、冰草属物种(Agropyron spp.)、匍匐剪股颖(Agrostis stolonifera)、葱属物种(Allium spp.)、苋属物种(Amaranthus spp.)、欧洲海滨草(Ammophila arenaria)、凤梨(Ananascomosus)、番荔枝属物种(Annona spp.)、旱芹(Apium graveolens)、蜘蛛兰属物种(Arachis spp.)、木波罗属物种(Artocarpus spp.)、石刁柏(Asparagusofficinalis)、燕麦属物种(Avena spp.)(例如燕麦(Avena sativa)、野燕麦(Avenafatua)、比赞燕麦(Avena byzantina)、野燕麦原变种(Avena fatua var.sativa)、杂种燕麦(Avena hybrida)、阳桃(Averrhoa carambola)、箣竹属(Bambusasp.)、冬瓜(Benincasa hispida)、巴西栗(Bertholletia excelsea)、甜菜(Betavulgaris)、芸苔属物种(Brassica spp.)(例如欧洲油菜(Brassica napus)、芜青物种(Brassica rapa ssp.)[卡诺拉油菜、油菜(oilseed rape)、蔓青(turniprape)])、Cadaba farinosa、大叶茶(Camellia sinensis)、美人蕉(Canna indica)、大麻(Cannabis sativa)、辣椒属物种(Capsicum spp.)、Carex elata、番木瓜(Carica papaya)、大果假虎刺(Carissa macrocarpa)、山核桃属物种(Caryaspp.)、红花(Carthamus tinctorius)、栗属物种(Castanea spp.)、美洲木棉(Ceiba pentandra)、苦苣(Cichorium endivia)、樟属物种(Cinnamomum spp.)、西瓜(Citrullus lanatus)、柑桔属物种(Citrus spp.)、椰子属物种(Cocos spp.)、咖啡属物种(Coffea spp.)、芋头(Colocasia esculenta)、非洲梧桐属物种(Colaspp.)、黄麻属(Corchorus sp.)、芫荽(Coriandrum sativum)、榛属物种(Corylusspp.)、山楂属物种(Crataegus spp.)、番红花(Crocus sativus)、南瓜属物种(Cucurbita spp.)、香瓜属物种(Cucumis spp.)、菜蓟属物种(Cynara spp.)、胡萝卜(Daucus carota)、山马蝗属物种(Desmodium spp.)、龙眼(Dimocarpuslongan)、薯蓣属物种(Dioscorea spp.)、柿树属物种(Diospyros spp.)、稗属物种(Echinochloa spp.)、油棕属(Elaeis)(例如油棕(Elaeis guineensis)、美洲油棕(Elaeis oleifera))、穇子(Eleusine coracana)、埃塞俄比亚画眉草(Eragrostis tef)、蔗茅属物种(Erianthus sp.)、枇杷(Eriobotrya japonica)、桉属物种(Eucalyptus sp.)、红仔果(Eugenia uniflora)、荞麦属物种(Fagopyrumspp.)、水青冈属物种(Fagus spp.)、苇状羊茅(Festuca arundinacea)、无花果(Ficus carica)、金桔属物种(Fortunella spp.)、草莓属物种(Fragaria spp.)、银杏(Ginkgo biloba)、大豆属(Glycine spp.)(例如大豆(Glycine max)、大豆(Soja hispida)或大豆(Soja max))、陆地棉(Gossypium hirsutum)、向日葵属(Helianthus spp.)(例如向日葵(Helianthus annuus))、长管萱草(Hemerocallisfulva)、木槿属物种(Hibiscus spp.)、大麦属(Hordeum spp.)(例如大麦(Hordeum vulgare))、甘薯(Iomoea batatas)、核桃属物种(Juglans spp.)、莴苣(Lactuca sativa)、山黧豆属物种(Lathyrus spp.)、兵豆(Lens culinaris)、亚麻(Linum usitatissimum)、荔枝(Litchi chinensis)、百脉根属物种(Lotusspp.)、棱角丝瓜(Luffa acutangula)、羽扇豆属物种(Lupinus spp.)、Luzulasylvatica、番茄属物种(Lycopersicon spp.)(例如番茄(Lycopersiconesculentum)、番茄(Lycopersicon lycopersicum)、番茄(Lycopersiconpyriforme))、硬皮豆属物种(Macrotyloma spp.)、苹果属物种(Malus spp.)、凹缘金虎尾(Malpighia emarginata)、牛油果(Mammea americana)、芒果(Mangifera indica)、木薯属物种(Manihot spp.)、人心果(Manilkara zapota)、苜蓿(Medicago sativa)、草木樨属物种(Melilotus spp.)、薄荷属物种(Menthaspp.)、芒(Miscanthus sinensis)、苦瓜属物种(Momordica spp.)、黑桑(Morusnigra)、芭蕉属物种(Musa spp.)、烟草属物种(Nicotiana spp.)、木犀榄属物种(Olea spp.)、仙人掌属物种(Opuntia spp.)、鸟足豆属物种(Ornithopusspp.)、稻属物种(Oryza spp.)(例如稻(Oryza sativa)、阔叶稻(Oryza latifolia))、稷(Panicum miliaceum)、柳枝稷(Panicum virgatum)、鸡蛋果(Passifloraedulis)、欧防风(Pastinaca sativa)、狼尾草属物种(Pennisetum sp.)、鳄梨属物种(Persea spp.)、欧芹(Petroselinum crispum)、虉草(Phalarisarundinacea)、菜豆属物种(Phaseolus spp.)、猫尾草(Phleum pratense)、刺葵属物种(Phoenix spp.)、南方芦苇(Phragmites australis)、酸浆属物种(Physalis spp.)、松属物种(Pinus spp.)、阿月浑子(Pistacia vera)、豌豆属物种(Pisum spp.)、早熟禾属物种(Poa spp.)、杨属物种(Populus spp.)、牧豆草属物种(Prosopis spp.)、李属物种(Prunus spp.)、番石榴属物种(Psidiumspp.)、石榴(Punica granatum)、西洋梨(Pyrus communis)、栎属物种(Quercusspp.)、萝卜(Raphanus sativus)、波叶大黄(Rheum rhabarbarum)、茶藨子属物种(Ribes spp.)、蓖麻(Ricinus communis)、悬钩子属物种(Rubus spp.)、甘蔗属物种(Saccharum spp.)、柳属物种(Salix sp.)、接骨木属物种(Sambucus spp.)、黑麦(Secale cereale)、胡麻属物种(Sesamum spp.)、白芥属物种(Sinapis sp.)、茄属(Solanum spp.)(例如马铃薯(Solanum tuberosum)、红茄(Solanum integrifolium)或番茄(Solanum lycopersicum))、两色蜀黍(Sorghum bicolor)、菠菜属物种(Spinacia spp.)、蒲桃属物种(Syzygium spp.)、万寿菊属物种(Tagetes spp.)、酸豆(Tamarindus indica)、可可树(Theobromacacao)、车轴草属物种(Trifolium spp.)、鸭茅状摩擦禾(Tripsacumdactyloides)、Triticosecale rimpaui、小麦属(Triticum spp.)(例如普通小麦(Triticum aestivum)、硬粒小麦(Triticum durum)、圆柱小麦(Triticumturgidum)、Triticum hybernum、马卡小麦(Triticum macha)、普通小麦(Triticum sativum)、一粒小麦(Triticum monococcum)或普通小麦(Triticumvulgare))、小金莲花(Tropaeolum minus)、金莲花(Tropaeolum majus)、越桔属物种(Vaccinium spp.)、野碗豆属物种(Vicia spp.)、豇豆属物种(Vignaspp.)、香堇(Viola odorata)、葡萄属物种(Vitis spp.)、玉米(Zea mays)、Zizaniapalustris、枣属物种(Ziziphus spp.)及其他。
对照植物
选择合适的对照植物是实验设计的例行部分并且可以包括相应的野生型植物或无目的基因的相应植物。对照植物一般是相同的植物物种或甚至是与待评估植物相同的品种。对照植物也可以是待评估植物的失效合子。失效合子是因分离而丢失转基因的个体。如本文中所用的“对照植物”不仅指完整植物,也指植物部分,包括种子和种子部分。
发明详述
令人惊讶的,现已发现调节编码LDOX多肽的核酸在植物中的表达,使植物相对于对照植物具有增强的产量相关性状。根据第一个实施方案,本发明提供了相对于对照植物,增强植物的产量相关性状的方法,包括调节编码LDOX多肽的核酸在植物中的表达,以及任选地选择具有增强的产量相关性状的植物。
此外,令人惊讶的,现已发现调节编码YRP5多肽的核酸在植物中的表达,使植物相对于对照植物具有增强的非生物胁迫耐受性。根据第一个实施方案,本发明提供了相对于对照植物,增强植物对多种非生物胁迫耐受性的方法,包括调节编码YRP5多肽的核酸在植物中的表达,以及任选地选择具有增强的非生物胁迫耐受性的植物。
此外,令人惊讶的,现已发现调节编码CK1多肽的核酸在植物中的表达,使植物相对于对照植物具有增强的产量相关性状。根据第一个实施方案,本发明提供了相对于对照植物,增强植物的产量相关性状的方法,包括调节编码CK1多肽的核酸在植物中的表达,以及任选地选择具有增强的产量相关性状的植物。
此外,令人惊讶的,现已发现调节编码bHLH12-样多肽的核酸在植物中的表达,使植物相对于对照植物具有增强的产量相关性状。根据第一个实施方案,本发明提供了相对于对照植物,增强植物的产量相关性状的方法,包括调节编码bHLH12-样多肽的核酸在植物中的表达,以及任选地选择具有增强的产量相关性状的植物。
此外,令人惊讶的,现已发现调节编码ADH2多肽的核酸在植物中的表达,使植物相对于对照植物具有增强的产量相关性状。根据第一个实施方案,本发明提供了相对于对照植物,增强植物的产量相关性状的方法,包括调节编码ADH2多肽的核酸在植物中的表达,以及任选地选择具有增强的产量相关性状的植物。
此外,令人惊讶的,现已发现调节编码GCN5-样多肽的核酸在植物中的表达,使植物相对于对照植物具有增强的产量相关性状。根据第一个实施方案,本发明提供了相对于对照植物,增强植物的产量相关性状的方法,包括调节编码GCN5-样多肽的核酸在植物中的表达,以及任选地选择具有增强的产量相关性状的植物。
用于调节(优选增加)编码LDOX多肽、或YRP5多肽、或CK1多肽、或bHLH12-样多肽、或ADH2多肽或GCN5-样多肽的核酸表达的优选的方法是通过在植物中导入和表达编码LDOX多肽、或YRP5多肽、或CK1多肽、或bHLH12-样多肽、或ADH2多肽或GCN5-样多肽的核酸。
关于LDOX多肽,下文中任何指代“用于本发明的方法的蛋白质”考虑意指如本文定义的LDOX多肽。下文中任何指代“用于本发明的方法的核酸”考虑意指能够编码此类LDOX多肽的核酸。待导入植物的核酸(从而用于实施本发明方法)是任何编码目前描述的蛋白质类型的核酸,后文也称为“LDOX核酸”或“LDOX基因”。
关于YRP5多肽,下文中任何指代“用于本发明的方法的蛋白质”考虑意指如本文定义的YRP5多肽。下文中任何指代“用于本发明的方法的核酸”考虑意指能够编码此类YRP5多肽的核酸。待导入植物的核酸(从而用于实施本发明方法)是任何编码目前描述的蛋白质类型的核酸,后文也称为“YRP5核酸”或“YRP5基因”。
关于CK1多肽,下文中任何指代“用于本发明的方法的蛋白质”考虑意指如本文定义的CK1多肽。下文中任何指代“用于本发明的方法的核酸”考虑意指能够编码此类CK1多肽的核酸。待导入植物的核酸(从而用于实施本发明方法)是任何编码目前描述的蛋白质类型的核酸,后文也称为“CK1核酸”或“CK1基因”。
关于bHLH12-样多肽,下文中任何指代“用于本发明的方法的蛋白质”考虑意指如本文定义的bHLH12-样多肽。下文中任何指代“用于本发明的方法的核酸”考虑意指能够编码此类bHLH12-样多肽的核酸。待导入植物的核酸(从而用于实施本发明方法)是任何编码目前描述的蛋白质类型的核酸,后文也称为“bHLH12-样核酸”或“bHLH12-样基因”。
关于ADH2多肽,下文中任何指代“用于本发明的方法的蛋白质”考虑意指如本文定义的ADH2多肽。下文中任何指代“用于本发明的方法的核酸”考虑意指能够编码此类ADH2多肽的核酸。待导入植物的核酸(从而用于实施本发明方法)是任何编码目前描述的蛋白质类型的核酸,后文也称为“ADH2核酸”或“ADH2基因”。
关于GCN5多肽,下文中任何指代“用于本发明的方法的蛋白质”考虑意指如本文定义的GCN5-样多肽。下文中任何指代“用于本发明的方法的核酸”考虑意指能够编码此类GCN5-样多肽的核酸。待导入植物的核酸(从而用于实施本发明方法)是任何编码目前描述的蛋白质类型的核酸,后文也称为“GCN5核酸”或“GCN5基因”。
如本文定义的“LDOX多肽”是指任何无色花色素双加氧酶多肽,其包含异青霉素N合酶结构域(PRINTS进入PR00682)和2OG-Fe(II)加氧酶结构域(PFAM进入PF03171)。
优选地,LDOX多肽包含一个或多个下列基序:
基序1,(SEQ ID NO:173):
W[VIY]T[VA]K[CP][HV]P[DHN][AS][IFL]I[VM][HN][IV]GD[QT]I[EQ]ILSN[GS][KT]YKS[VI][EL]HR[GV][LI]VN[KS][ED]K[VE]R[VI]S[WL]A[VF]F[CY][EN]
基序2,(SEQ ID NO:174):
[ED][DNE][LI][LG][AL][QC][LM][KR][IV]NYYP[KP]CP[RQ]P[ED]L[AT]LG[VL][ES][AP]H[ST]D[PMV][SG][AG][LM]T[FI][LI]L[PH][ND][DEM]
基序3,(SEQ ID NO:175):
WG[FV][FM][QH][VL]VNHG[IV][PSK]P[ED]L[MI][DE][RA][AV][RQ][EK][AVN][GW][RK][EA]FF[HE][LM]PV[NE][AE]KE[KT]Y[AS]N[DS][PQ]
基序4,(SEQ ID NO:176):
[DHG][AS][FL][VI]VN[IV]GD[QT][IL][EQ]IL[ST]N[GS][RT][Y F][KR]SV[LE]HR[VA][VIL]VN
基序5,(SEQ ID NO:177):
WGFFQ[VL]VNHG[VI][PKS]xEL[ILM][DE][RA]
其中x代表任何氨基酸,优选脯氨酸;
基序6,(SEQ ID NO:178):
LG[LV][GS][PA]H[TS]DP[GS]x[LMI]T[IL]L
其中x代表任何氨基酸,优选甘氨酸。
更优选的,LDOX多肽还包含至少一个下列基序
基序7(SEQ ID NO:179):
Pxx[YF][IV][KQR]
其中x代表任何氨基酸,优选在第2和3位分别是脯氨酸和精氨酸;
基序8(SEQ ID NO:180):
V[QE][SAT][LIV]
基序9(SEQ ID NO:181):
[EQ]GYG[ST]
括号之间的氨基酸残基代表该特定位置的备选。更优选地,LDOX多肽以增加的优选顺序包含至少2、至少3、至少4、至少5、至少6、至少7、至少8或全部9个基序。
可选的,LDOX蛋白的同源物以增加的优选顺序与SEQ ID NO:2表示的氨基酸具有至少25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的整体序列同一性,条件是同源蛋白包含上文列出的一个或多个保守基序。
利用全局比对算法确定整体序列同一性,例如GAP程序(GCGWisconsin Package,Accelrys)中的Needleman Wunsch算法,优选的使用缺省的参数,且优选的使用成熟蛋白质的序列(即,在不考虑分泌信号或转运肽的条件下)。与整体序列同一性相比,当仅考虑保守结构域或基序时,序列同一性通常较高。优选地,LDOX多肽中的基序与SEQ ID NO:173至SEQ ID NO:181中所示的基序(基序1至9)以增加的优选顺序具有至少70%,71%,72%,73%,74%,75%,76%,77%,78%,79%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%,或99%序列同一性。
优选地,当用于构建进化系统树,例如图4中描述的树时,多肽序列在LDOX多肽组中聚类,而不与任何其它组聚类;更优选地,多肽序列在LDOX多肽的亚组A中聚类,所述组包含SEQ ID NO:2中所示的氨基酸序列。
如本文所定义的“YRP5多肽”是指包含如SEQ ID NO:186和SEQ IDNO:188的任何所代表大的序列的直向同源物和旁系同源物的任何多肽。
YRP5多肽和其直向同源物和旁系同源物通常以增加的优选顺序与SEQ ID NO:186和SEQ ID NO:188之任一表示的氨基酸具有至少25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的整体序列同一性,条件是同源蛋白包含上文列出的保守基序。
利用全局比对算法确定整体序列同一性,例如GAP程序(GCGWisconsin Package,Accelrys)中的Needleman Wunsch算法,优选的使用缺省的参数,且优选的使用成熟蛋白质的序列(即,在不考虑分泌信号或转运肽的条件下)。与整体序列同一性相比,当仅考虑保守结构域或基序时,序列同一性通常较高。
优选的,当用于构建进化系统树,多肽序列与包含SEQ ID NO:186和SEQ ID NO:188所表示的氨基酸序列的YRP5多肽组聚类,而不与任何其他组聚类。用于构建和分析进化系统树的工具和技术是本领域所熟知的。
如本文所定义的,“CK1多肽”是指酪蛋白激酶1家族的任何蛋白质激酶(IUBMB酶命名法:EC 2.7.11.1)。酪蛋白激酶1蛋白质是本领域所熟知的。CK1多肽催化反应:ATP+蛋白质=ADP+磷蛋白。
备选地,可将“CK1多肽”定义为包含蛋白质基序的多肽,所述基序以增加的优选顺序与下列一个或多个基序的氨基酸序列具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性:
(i)基序10:HIPYRENKNLTGTARYAS(VM)NTHLG(IV)EQSRRDDLESLGYVL(ML)YFLRGSLPW(SEQ ID NO:273),
(ii)基序11:PSLEDLFN(YF)C(NSG)RK(FL)SLKTVLMLADQ(ML)INR(VI)E(YF)(VM)HS(KR)(SG)FLHRDIKP(SEQ ID NO:274),
(iii)基序12:C(KR)(SG)YP(ST)EFASYFHYCRSLRF(DE)D(KR)PDY(SA)YLKR(LI)FRDLFIREG(FY)QFDYVF(SEQ ID NO:275)
其中括号之间的氨基酸残基代表在该位置备选的氨基酸。
备选地,可以将“CK1多肽”定义为包含下列一个或多个基序的多肽:
(i)基序10:HIPYRENKNLTGTARYAS(VM)NTHLG(IV)EQSRRDDLESLGYVL(ML)YFLRGSLPW(SEQ ID NO:273),
(ii)基序11:PSLEDLFN(YF)C(NSG)RK(FL)SLKTVLMLADQ(ML)INR(VI)E(YF)(VM)HS(KR)(SG)FLHRDIKP(SEQ ID NO:274),
(iii)基序12:C(KR)(SG)YP(ST)EFASYFHYCRSLRF(DE)D(KR)PDY(SA)YLKR(LI)FRDLFIREG(FY)QFDYVF(SEQ ID NO:275)
其中括号间的氨基酸残基代表该位置的备选氨基酸,并且其中以减少的优选顺序,每个基序的1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24和25个氨基酸被任何其它氨基酸取代,优选地被保守氨基酸取代(根据表1)。
此外,“CK1多肽”包含
A.蛋白质基序,所述基序以增加的优选顺序与下列一个或多个基序的氨基酸序列具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性:
(i)基序13:KANQVY(IV)ID(YF)GLAKKYRDLQTH(KR)HIPYRENKNLTGTARYASVNTHLG(VI)EQ(SEQ ID NO:276),
(ii)基序14:CKSYPSEF(VTI)SYFHYCRSLRFEDKPDYSYLKRLFRDLFIREGYQFDYVFDW(SEQ ID NO:277),
(iii)基序15:PSLEDLFNYC(NS)RK(FL)(ST)LKTVLMLADQ(LM)INRVEYMHSRGFLHRDIKPDNFLM(SEQ ID NO:278)
其中括号之间的氨基酸残基代表在该位置备选的氨基酸;或
B.下列一个或多个基序的多肽:
(i)基序13:KANQVY(IV)ID(YF)GLAKKYRDLQTH(KR)HIPYRENKNLTGTARYASVNTHLG(VI)EQ(SEQ ID NO:276),
(ii)基序14:CKSYPSEF(VTI)SYFHYCRSLRFEDKPDYSYLKRLFRDLFIREGYQFDYVFDW(SEQ ID NO:277),
(iii)基序15:PSLEDLFNYC(NS)RK(FL)(ST)LKTVLMLADQ(LM)INRVEYMHSRGFLHRDIKPDNFLM(SEQ ID NO:278)
其中括号间的氨基酸残基代表该位置的备选氨基酸,并且其中以减少的优选顺序,每个基序的1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24和25个氨基酸被任何其它氨基酸取代,优选地被保守氨基酸取代(根据表1)。
基序10、11和12对应于代表植物来源的酪蛋白激酶多肽中的保守蛋白质区域的共有序列。基序13、14和15对应于植物来源的I型酪蛋白激酶(CK1)多肽中的保守蛋白质区域的共有序列。应当理解,本文所指的基序10、11、12、13、14和15包括同源基序的序列,其存在于特定的酪蛋白激酶1多肽中,优选表A3的任何酪蛋白激酶1多肽中,更优选SEQ IDNO:195中。鉴定多肽中与基序10至15同源的基序的方法是本领域所熟知的。例如,可以通过比对它们各自的氨基酸序列来将多肽与基序相比较来鉴定具有类似序列的区域,其中使用算法例如Blast(Altschul等人(1990)JMol Biol 215:403-10)。
可选的,CK1蛋白的同源物以增加的优选顺序与表A3中的任何多肽所表示的,优选SEQ ID NO:195表示的氨基酸序列具有至少25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的整体序列同一性。
利用全局比对算法确定整体序列同一性,例如GAP程序(GCGWisconsin Package,Accelrys)中的Needleman Wunsch算法,优选的使用缺省的参数,且优选的使用成熟蛋白质的序列(即,在不考虑分泌信号或转运肽的条件下)。与整体序列同一性相比,当仅考虑保守结构域或基序时,序列同一性通常较高。对于局部比对,Smith-Waterman算法是特别有用的(Smith TF,Waterman MS(1981)J.Mol.Biol 147(1);195-7)。
优选的,当用于构建进化系统树,用表A3中的序列构建时,多肽序列与CK1多肽组聚类而不与任何其他组聚类,所述组包含拟南芥AT5G44100.1、拟南芥_AT4G14340.1、欧洲油菜_BN06MC08360_427247978337、大麦_TA34160_4513、稻_LOC_Os02g56560.1,P.trichocarpa_scaffXIII.465,S.officinarum_TA30972_4547,玉米_TA179031_4577中任一所代表的氨基酸序列,更优选的拟南芥_AT5G44100.1(SEQ ID NO:195)所代表的氨基酸序列。
本发明还提供了迄今未知的编码CK1的核酸和CK1多肽。
根据本发明的另一个实施方案,因此提供了选自以下的分离的核酸分子:
(i)由SEQ ID NO:210、212、216、220、228和268中任一所表示的核酸;
(ii)由SEQ ID NO:210、212、216、220、228和268中任一所表示的核酸的互补序列;
(iii)编码由SEQ ID NO:211、213、217、221、229和269中任一项所表示的多肽的核酸,其优选作为遗传密码简并性的结果,所述分离的核酸可以衍生自由SEQ ID NO:211、213、217、221、229和269中任一项所表示的多肽序列并且还优选地赋予相对于对照植物增强的产量相关性状;
(iv)核酸,其以增加的优选顺序与表A3的任何核酸序列具有至少30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性,并且还优选地赋予相对于对照植物增强的产量相关性状;
(v)在严格杂交条件下与(i)至(iv)的核酸分子杂交并且优选地赋予相对于对照植物增强的产量相关性状的核酸分子;
(vi)编码CK1多肽并且优选地赋予相对于对照植物增强的产量相关性状的核酸,所述多肽以增加的优选顺序与SEQ ID NO:211、213、217、221、229和269中任一项所表示的氨基酸序列以及表A3中任何其它氨基酸序列具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性。
根据本发明的另一个实施方案,还提供了分离的多肽,所述多肽选自:
(i)SEQ ID NO:211、213、217、221、229和269中任一项所表示的氨基酸序列;
(ii)氨基酸序列,其与SEQ ID NO:211、213、217、221、229和269中任一项所表示的氨基酸序列以及表A3中任何其它氨基酸序列以增加的优选顺序具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性并且优选地赋予相对于对照植物增强的产量相关性状;
(iii)上述(i)或(ii)中给出的任何氨基酸序列的衍生物。
如本文定义的“bHLH12-样多肽”是指包含碱性结构域以及随后的HLH结构域的任何多肽(HMMPFam PF00010,ProfileScan PS50888,SMART SM00353),从而形成碱性螺旋-环-螺旋结构域(InterproIPR001092),并且包含下述的蛋白质基序,其以增加的优选顺序与下列一个或多个基序的氨基酸具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性:
基序16(SEQ ID NO:404):YIHVRARRG;
基序17(SEQ ID NO:405):(S/E)P(P/K)(K/E)DYIHVRARRGQ其中任何前4个氨基酸或最后的氨基酸可以被任何氨基酸取代,优选地基序17是(S/E)P(P/K)(K/E)DYIHVRARRGQ,其中任何前4个氨基酸或最后的氨基酸可以被保守氨基酸取代;
基序18(SEQ ID NO:406):
(R/N/C)QVE(F/N)LSMKL(S/A/T)(V/A)(N/S),其中在第1、5和11位的氨基酸可以被任何氨基酸取代,优选地基序18是(R/N/C)QVE(F/N)LSMKL(S/A/T)(V/A)(N/S),其中在第1、5和11位的氨基酸可以被保守氨基酸取代。
基序19(SEQ ID NO:407):AD--FVERAARYSC,其中“-”代表空位,其上没有氨基酸或为任何氨基酸,优选P或G。特别地,基序19可以是任何ADFVERAARYSC、ADXXFVERAARYSC、ADXFVERAARYSC,其中X可以是任何氨基酸,优选地P或G。
bHLH结构域是本领域熟知的,并且注册在蛋白质结构域数据库中,例如Interpro、ProfileScan、PFam和SMART。备选地,bHLH12-样多肽包含结构域bHLH结构域,其与SEQ ID NO:403(ATDSHSLAERVRREKISERMKFLQDLVPGCNKVTGKAVMLDEIINYV QSL)表示的bHLH结构域的氨基酸序列具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性。
备选地,bHLH12-样多肽包含SEQ ID NO:403:ATDSHSLAERVRREKISERMKFLQDLVPGCNKVTGKAVMLDEIINYVQS所表示的bHLH结构域,其中以减少的优选顺序,0、1、2、3、4或5个氨基酸可以被任何氨基酸,优选地被保守氨基酸所取代。
备选地,本发明的bHLH12-样核酸是编码多肽的任何核酸,所述多肽属于如Heim等人2003所定义的组XII(12),以及任何同源分子,优选其直向同源物或旁系同源物,优选具有等价的生物学功能,例如控制相同基因的表达。该定义所涵盖的核酸不需要起始于天然生物,但是可以具有任何来源,例如可以是化学合成的。本发明所涵盖的同源bHLH12-样核酸编码下述多肽,所述多肽当用于构建进化系统树时,用Heim等人(2003)的图4中所称的多肽序列构建时,与Heim等人(2003)的图4中的组XII的任何多肽聚类,优选在BEE3中,而不与任何其它组聚类。
被称为5-9-13构型的一种模式的氨基酸,可以在bHLH结构域的碱性区域的三个位置上发现(见Heim等人,2003(Mol.Biol.Evol.20(5):735-747的图4)。bHLH12-样多肽优选包括由氨基酸H-E-R所表示的5-9-13构型,位于bHLH结构域中,通常在结构域的碱性区域中。本领域的技术人员将认识到,尽管是最常见的构型,但是也可以允许其它构型。
本发明的bHLH12-样多肽优选地结合启动子,其包含至少1、2、3、4、5、6、7、8、10或更多个由SEQ ID NO:408(CANNTG)所表示的E-基序,其中N表示A、T、G或C中的任一项。
可选的,用于本发明方法的bHLH-样蛋白质的同源物以增加的优选顺序与表A4中的任一多肽,优选SEQ ID NO:280或SEQ ID NO:396表示的氨基酸具有至少25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的整体序列同一性,条件是同源蛋白是本文定义的bHLH12-样多肽。
利用全局比对算法确定整体序列同一性,例如GAP程序(GCGWisconsin Package、Accelrys)中的Needleman Wunsch算法,优选的使用缺省的参数,且优选的使用成熟蛋白质的序列(即,在不考虑分泌信号或转运肽的条件下)。与整体序列同一性相比,当仅考虑保守结构域或基序时,序列同一性通常较高。对于局部比对,Smith-Waterman算法是特别有用的(Smith TF,Waterman MS(1981)J.Mol.Biol 147(1);195-7)。
本发明还提供了迄今未知的编码bHLH12-样的核酸和bHLH12-样多肽。
根据本发明的另一个实施方案,因此提供了选自以下的分离的核酸分子:
(i)由SEQ ID NO:279和335中任一所表示的核酸;
(ii)由SEQ ID NO:279和335中任一所表示的核酸的互补序列;
(iii)编码由SEQ ID NO:280和336中任一项所表示的多肽的核酸,
其优选作为遗传密码简并性的结果,所述分离的核酸可以衍生自由SEQ ID NO:280和336中任一项所表示的多肽序列并且还优选地赋予相对于对照植物增强的产量相关性状;
(iv)核酸,其以增加的优选顺序与表A4的任何核酸序列具有至少30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性,并且还优选地赋予相对于对照植物增强的产量相关性状;
(v)在严格杂交条件下与(i)至(iv)的核酸分子杂交并且优选地赋予相对于对照植物增强的产量相关性状的核酸分子;
(vi)编码bHLH12-样多肽并且优选地赋予相对于对照植物增强的产量相关性状的核酸,所述多肽以增加的优选顺序与SEQ ID NO:280和336中任一项所表示的氨基酸序列以及表A4中任何其它氨基酸序列具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性。
根据本发明的另一个实施方案,还提供了分离的多肽,所述多肽选自:
(i)SEQ ID NO:280和336中任一项所表示的氨基酸序列;
(ii)氨基酸序列,其与SEQ ID NO:280和336中任一项所表示的氨基酸序列以及表A4中任何其它氨基酸序列以增加的优选顺序具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性并且优选地赋予相对于对照植物增强的产量相关性状;
上述(i)或(ii)中给出的任何氨基酸序列的衍生物。
本文定义的“ADH2多肽”是指包含结构域1和结构域2,以及任选地额外地结构域3的任何多肽:
(i)GROES结构域(结构域1):
AGEVRVKILFTALCHTDHYTWSGKDPEGLFPCILGHEAAGVVESVGEGVTEVQPGDHVIPCYQAECKECKFCKSGKTNLCGKVRGATGVGVMMNDMKSRFSVNGKPIYHFTGTSTFSQYTVVHDVSVAKI(SEQ IDNO:442),或以增加的优选顺序与结构域1具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或更多序列同一性的结构域;和
(ii)锌结合脱氢酶结构域(结构域2):
EAGSIVAVFGLGTVGLAVAEGAKAAGASRIIGIDIDNKKFDVAKNFGVTEFVNPKDHDKPIQQVLVDLTDGGVDYSFECIGNVSVMRAALECCHKDWGTSVIVGVAASGQEIATRPFQLVTGRVWKGTAFGGFKSRTQVPWLVD(SEQ ID NO:443),或与结构域2以增加的优选顺序具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或更多的序列同一性的结构域;以及任选地还有
(iii)DUF61结构域(结构域3):VDKYMNKEVK(SEQ ID NO:444)、或与结构域3以增加的优选顺序具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或更多的序列同一性的结构域。
此外,ADH多肽有时可包含任何一个或多个的基序20至30,或者与结构域III任何一个基序20至30以增加的优选顺序具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或更多的序列同一性。
基序20:HYTWSGKDP(SEQ ID NO:445);
基序21:PCYQAECK(SEQ ID NO:446);
基序22:GKTNLCGKVRGATGVGVMMND(SEQ ID NO:447);
基序23:YHFMGTSTFSQYTVVHDVSVAKINPQAPLDKVCLLGCGVPTGLG(SEQ ID NO:448);
基序24:WNTAKVEAGSIVAVFGLGTVGLAVAEG(SEQ ID NO:449);
基序25:GASRIIGIDIDNKKFDVAKNFGVTEFVN(SEQ ID NO:450);
基序26:KDHDKPIQLVLVDIAD(SEQ ID NO:451);
基序27:SVRRAAEEC(SEQ ID NO:452);
基序28:WGTSVIVGVAASGQEIATRPFQLVTGRVWKGTAFGGF(SEQ ID NO:453);
基序29:KVDEYITH(SEQ ID NO:454);
基序30:MLKGESIRCIITM(SEQ ID NO:455).
ADH2多肽以增加的优选顺序与SEQ ID NO:413或SEQ ID NO:415表示的氨基酸具有至少25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的整体序列同一性,并且优选地包含结构域1和2,以及任选地结构域3。
利用全局比对算法确定整体序列同一性,例如GAP程序(GCGWisconsin Package、Accelrys)中的Needleman Wunsch算法,优选的使用缺省的参数,且优选的使用成熟蛋白质的序列(即,在不考虑分泌信号或转运肽的条件下)。与整体序列同一性相比,当仅考虑保守结构域或基序时,序列同一性通常较高。对于局部比对,Smith-Waterman算法是特别有用的(Smith TF、Waterman MS(1981)J.Mol.Biol 147(1);195-7)。
优选的,当用于构建进化系统树,例如图12中描述的时,ADH2多肽序列与包含SEQ ID NO:413或SEQ ID NO:415所表示的氨基酸序列的ADH2多肽组聚类,而不与任何其它组聚类。
如本文定义的“GCN5-样多肽”是指包含PFam登录号PF00583和PF00439的两个结构域的任何多肽,其分别具有平均76和84个氨基酸。此外,GCN5-样多肽还包含下列基序:
基序31:
LKF[VL]C[YL]SNDGVD[EQ]HM[IV]WL[IV]GLKNIFARQLPNMPKEYIVRLVMDR[ST]HKS[MV]M(SEQ ID NO:501)或以增加的优选顺序与基序31具有至少49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%或更多序列同一性的基序。
基序32:
FGEIAFCAITADEQVKGYGTRLMNHLKQ[HY]ARD[AV]DGLTHFLTYADNNAVGY(SEQ ID NO:502)或以增加的优选顺序与基序32具有至少49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%或更多序列同一性的基序。
基序33:
H[AP]DAWPFKEPVD[SA]RDVPDYYDIIKDP[IM]DLKT[MI]S[KR]RV[ED]SEQYYVT LEMFVA(SEQ ID NO:503)或以增加的优选顺序与基序33具有至少49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%或更多序列同一性的基序。
优选地,本发明的GCN5-样多肽可以额外地包含任何一种或多种下列基序:
基序34:
LKF[LV]C[YL]SND G[VI]DEHM[IV]WL[IV]GLKNIFARQLPNMPKEYIVRLVMDR[TS]HKS[MV]M(SEQ ID NO:504)或以增加的优选顺序与基序34具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%或更多序列同一性的基序。
基序35:
FGEIAFCAITADEQVKGYGTRLMNHLKQHARD[AVM]DGLTHFLTYADNNAVGY(SEQ ID NO:505)或以增加的优选顺序与基序35具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%或更多序列同一性的基序。
基序36:
KQGFTKEI[THY][LF][DE]K[ED]RW[QH]GYIKDYDGGILMECKID[PQ]KLPY[TV]DL[AS]TMIRRQRQ(SEQ ID NO:506)或以增加的优选顺序与基序36具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%或更多序列同一性的基序。
在另一个优选的本发明的实施方案中,本发明的GCN5-样多肽可以额外地包含任何一种或多种下列基序:
基序37:
LKFVC[LY]SND[GDS][VI]DEHM[VM][WCR]LIGLKNIFARQLPNMPKEYIVRL[VL]M DR[SGK]HKSVM(SEQ ID NO:507)或以增加的优选顺序与基序37具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%或更多序列同一性的基序。
基序38:
CAITADEQVKGYGTRLMNHLKQ[HFY]ARD[MV]DGLTHFLTYADNNAVGYF[IV]K QGF(SEQ ID NO:508)或以增加的优选顺序与基序38具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%或更多序列同一性的基序。
基序39:
W[QH]G[YF]IKDYD GG[IL]LMECKID[PQ]KL[PS]YTDLS[TS]MIR[RQ]QR[QK]AIDE[KR]IRELSNC[HQ][IN](SEQ ID NO:509)或以增加的优选顺序与基序39具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%或更多序列同一性的基序。
在本发明最优选的实施方案中,本发明的GCN5-样多肽可以额外地包含任何一种或多种下列基序:
基序40:
FLCYSNDGVDEHMIWLVGLKNIFARQLPNMPKEYIVRLVMDRTHKSMMVI(SEQ ID NO:510)或以增加的优选顺序与基序40具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%或更多序列同一性的基序。
基序41:
MNHLKQHARDADGLTHFLTYADNNAVGY[FL]VKQGFTKEIT[LF]DKERWQGYIK(SEQ ID NO:511)或以增加的优选顺序与基序41具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%或更多序列同一性的基序。
基序42:
IR[ED]LSNCHIVY[SP]GIDFQKKEAGIPRR[LT][MI]KPEDI[PQ]GLREAGWTPDQ[WL]GHSK(SEQ ID NO:512)或以增加的优选顺序与基序42具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%或更多序列同一性的基序。
基序31、32和33对应于代表维管植物来源的GCN5-样多肽中的保守蛋白质区域的共有序列。基序34、35和36对应于代表高等维管植物来源的GCN5-样多肽中的保守蛋白质区域的共有序列。基序37、38和39对应于代表双子叶植物来源的GCN5-样多肽中的保守蛋白质区域的共有序列,以及最终,基序40、41和42对应于代表单子叶植物来源的GCN5-样多肽中的保守蛋白质区域的共有序列。
应当理解,本文所指的基序31、32、33、34、35和36包括同源基序的序列,其存在于特定的GCN5-样多肽中,优选表A6的任何GCN5-样多肽中,更优选SEQ ID NO:460中。鉴定多肽中与基序31至42同源的基序的方法是本领域所熟知的。例如,可以通过比对它们各自的氨基酸序列来将多肽与基序相比较来鉴定具有类似序列的区域,其中使用算法例如Blast(Altschul等人(1990)J Mol Biol 215:403-10)。
备选地,GCN5样多肽的同源物以增加的优选顺序与SEQ ID NO:460表示的氨基酸具有至少25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的整体序列同一性,条件是所述同源多肽包含一个或多个上文所示的保守基序。
利用全局比对算法确定整体序列同一性,例如GAP程序(GCGWisconsin Package、Accelrys)中的Needleman Wunsch算法,优选的使用缺省的参数,且优选的使用成熟蛋白质的序列(即,在不考虑分泌信号或转运肽的条件下)。与整体序列同一性相比,当仅考虑保守结构域或基序时,序列同一性通常较高。对于局部比对,Smith-Waterman算法是特别有用的(Smith TF、Waterman MS(1981)J.Mol.Biol 147(1);195-7)。
优选的,当用于构建进化系统树,例如图15中描述的时,GCN5的多肽序列与包含分别如SEQ ID NO:460所表示的氨基酸序列的GCN5多肽组聚类,而不与任何其它组聚类。
术语“结构域”、“标签”和“基序”定义在本文的“定义”章节中。存在用于鉴别结构域的专门数据库,例如,SMART(Schultz等人,(1998)Proc.Natl.Acad.Sci.USA 95,5857-5864;Letunic等人,(2002)Nucleic acidRes 30,242-244)、InterPro(Mulder等人,(2003)Nucl.Acids.Res.31,315-318)、Prosite(Bucher和Bairoch(1994),A generalized profile syntaxfor biomolecular sequences motifs and its function in automatic sequenceinterpretation.(In)ISMB-94;Proceedings 2nd International Conferenceon Intelligent Systems for Molecular Biology.Altman R.,Brutlag D.,KarpP.,Lathrop R.,Searls D.编著,第53-61页,AAAI Press,Menlo Park;Hulo等人,Nucl.Acids.Res.32:D134-D137,(2004))或Pfam(Bateman等人,Nucleic acid Research 30(1):276-280(2002))。在ExPAsy蛋白组学服务器(瑞士生物信息中心;Gasteiger等人,Nucleic acid Res.31:3784-3788(2003))上可获得成套的蛋白质序列计算机分析的工具。还可以使用常规技术,例如通过序列比对,鉴别结构域或基序。
用于比对序列以进行比较的方法是本领域熟知的,此类方法包括GAP、BESTFIT、BLAST、FASTA和TFASTA。GAP使用Needleman和Wunsch算法((1970)J Mol Biol 48:443-453)以找到使匹配数最大化并使空位数最小化的两个序列的总体(即覆盖完整序列的)比对结果。BLAST算法(Altschul等人(1990)J Mol Biol 215:403-10)计算序列同一性百分数并在两个序列之间开展相似性的统计分析。用于开展BLAST分析的软件是通过国家生物技术信息中心(NCBI)可公开获得的。同源物可以使用例如ClustalW多重序列比对算法(1.83版本),以默认配对比对参数和百分数评分方法轻易地鉴定。相似性和同一性的总体百分数也可以使用MatGAT软件包中的可用方法之一确定(Campanella等,BMC Bioinformatics.2003年7月10日;4:29.MatGAT:使用蛋白质序列或DNA序列产生相似性/同一性矩阵的一种应用(an application that generates similarity/identitymatrices using protein or DNA sequences))。如本领域技术人员显而易见,可以进行少许手工编辑以优化保守基序之间的比对。此外,作为使用全长序列以鉴定同源物的替代,也可以使用特定结构域。利用上文提及的程序,使用默认参数可以在完整核酸或氨基酸序列范围或选定的结构域或保守基序范围内确定序列同一性值。对于局部比对,所述Smith-Waterman算法是特别有用的(Smith TF,Waterman MS(1981)J.Mol.Biol 147(1);195-7)。
此外,LDOX多肽(至少以其天然形式)通常具有氧化还原酶活性。特别地,LDOX蛋白(EC 1.14.11.19)催化下列反应
用于测量LDOX活性的工具和技术是本领域已知的,参见例如Saito等人(Plant J.17,181-189,1999)或Pelletier等人(Plant Mol.Biol.40,45-54,1999)。其它细节在实施例6中提供。
此外,如实施例7和8所述的,当根据本发明的方法在稻中表达时,LDOX多肽使得植物在养分限制下生长时具有增加的产量相关性状,特别是增加的生物量、增加的种子产量和/或早期萌发势。
YRP5多肽,当在植物,特别是稻植物中表达时,为这些植物赋予了增强的对非生物胁迫的耐受性。
此外,CK1多肽(至少以其天然形式)通常具有酪蛋白激酶活性。用于测量酪蛋白激酶活性的工具和技术是本领域所熟知的。Lee等人PlantCell 2005,17,2817_31。
此外,如实施例部分所述的,当根据本发明的方法在稻中表达时,CK1多肽使得植物具有增加的产量相关性状,特别是增加的千粒重或增加的株冠重心。
此外,CK1多肽可以表现出优选的亚细胞定位,通常一个或多个的核、细胞质、叶绿体或线粒体的。蛋白质亚细胞定位预测的任务是重要的且深入研究的。了解蛋白质的定位帮助阐述蛋白质的功能。用于蛋白质定位的实验方法从免疫定位到利用绿色荧光蛋白(GFP)或β-葡糖醛酸糖苷酶(GUS)标记蛋白质。此类方法是准确的,但与计算机方法相比耗费劳动力。目前,在从序列数据计算机预测蛋白质定位中已有很大进步。除本领域技术人员普遍已知的算法外,还可利用瑞士生物信息中心提供的ExPASy蛋白组学工具,例如,PSort、TargetP、ChloroP、LocTree、Predotar、LipoP、MITOPROT、PATS、PTS1、SignalP、TMHMM等。本发明的CK1多肽优选地定位在植物细胞的胞间连丝。
此外,bHLH12-样多肽(至少以其天然形式)通常具有DNA结合活性。用于测量DNA结合活性的工具和技术是本领域熟知的,例如在Dombrecht等人(2007)Plant Cell 19,2225-2245,2007中。
优选地,本发明的bHLH12-样多肽结合包含E-框基序的启动子。E-框基序是本领域熟知的DNA基序并且包含由CANNTG(SEQ ID NO:408)所表示的回文核苷酸六聚体序列的变异。测定启动子中与E-框结合的方法是本领域熟知的。
此外,如实施例部分所述的,当根据本发明的方法在稻中表达时,bHLH12-样多肽使得植物具有增加的产量相关性状,优选选自增加的千粒重、增加的株冠重心和改变的优选增加的根/枝条生物量比例之一。
此外,bHLH12-样多肽可以表现出优选的亚细胞定位,通常一个或多个的核、细胞质、叶绿体或线粒体的。蛋白质亚细胞定位预测的任务是重要的且深入研究的。了解蛋白质的定位帮助阐述蛋白质的功能。用于蛋白质定位的实验方法从免疫定位到利用绿色荧光蛋白(GFP)或β-葡糖醛酸糖苷酶(GUS)标记蛋白质。此类方法是准确的,但与计算机方法相比耗费劳动力。目前,在从序列数据计算机预测蛋白质定位中已有很大进步。除本领域技术人员普遍已知的算法外,还可利用瑞士生物信息中心提供的ExPASy蛋白组学工具,例如,PSort、TargetP、ChloroP、LocTree、Predotar、LipoP、MITOPROT、PATS、PTS1、SignalP、TMHMM等。本发明的bHLH12-样多肽优选地定位在植物细胞的核。
此外,ADH2多肽(至少以其天然形式)通常具有S-亚硝基谷胱甘肽还原酶(GSNOR)活性。用于测量GSNOR活性的工具和技术是本领域熟知的。参见Rusterucci等人,2007。
此外,如实施例部分所述的,当根据本发明的方法在稻中表达时,ADH2多肽使得植物具有增加的产量相关性状,特别是增加的种子产量。
此外,GCN5-样多肽(至少以其天然形式)通常具有调节花分生组织的活性。用于测量花分生组织活性的工具和技术是本领域所熟知的。
此外,如实施例7和8所述的,当根据本发明的方法在稻中表达时,GCN5-样多肽使得植物具有增加的产量相关性状,特别是种子产量还有生物量。
此外,GCN5-样多肽可以表现出优选的亚细胞定位,通常一个或多个的核、细胞质、叶绿体或线粒体的。蛋白质亚细胞定位预测的任务是重要的且深入研究的。了解蛋白质的定位帮助阐述蛋白质的功能。用于蛋白质定位的实验方法从免疫定位到利用绿色荧光蛋白(GFP)或β-葡糖醛酸糖苷酶(GUS)标记蛋白质。此类方法是准确的,但与计算机方法相比耗费劳动力。目前,在从序列数据计算机预测蛋白质定位中已有很大进步。除本领域技术人员普遍已知的算法外,还可利用瑞士生物信息中心提供的ExPASy蛋白组学工具,例如,PSort、TargetP、ChloroP、LocTree、Predotar、LipoP、MITOPROT、PATS、PTS1、SignalP、TMHMM等。
在关于LDOX多肽的方面,本发明通过用SEQ ID NO:1所表示的核酸序列转化植物进行说明,其中所述的核酸序列编码SEQ ID NO:2的多肽序列。但是,本发明的实施不限于这些序列;本发明的方法可以有利地使用如本文中定义的任意编码LDOX的核酸或LDOX多肽实施。
编码LDOX多肽的核酸的例子在本文实施例部分的表A1中给出。此类核酸用于实施本发明的方法中。在实施例部分的表A1中给出的氨基酸序列是由SEQ ID NO:2所表示的LDOX多肽的直向同源物和旁系同源物的示例序列,术语“直向同源物”和“旁系同源物”如本文中定义。其他直向同源物和旁系同源物可以通过开展所谓交互性blast搜索轻易地鉴定。通常,这包括第一BLAST,其中所述的第一BLAST包括将查询序列(例如使用实施例部分的表A1中列出的任意序列)针对任意序列数据库,如可公开获得的NCBI数据库进行BLAST。当从核苷酸序列开始时,一般使用BLASTN或TBLASTX(使用标准默认值),并且当从蛋白质序列开始时,使用BLASTP或TBLASTN(使用标准默认值)。可以任选地筛选BLAST结果。筛选结果或非筛选结果的全长序列随后针对来自生物的序列进行反向BLAST(第二BLAST),其中查询序列从所述的生物中衍生(在查询序列是SEQ ID NO:1或SEQ ID NO:2的情况下,第二BLAST因而将针对拟南芥序列进行)。随后比较第一BLAST和第二BLAST的结果。若来自第一blast的高阶位命中是源自与衍生查询序列的物种相同的物种,则鉴定到旁系同源物,随后一个反向BLAST理想地在最高命中当中产生该查询序列;若在第一BLAST中的高阶位命中不是源自与衍生查询序列的物种相同的物种,则鉴定到直向同源物,并且在反向BLAST时,优选地产生属于最高命中当中的该查询序列。
在关于YRP5多肽的方面,本发明可以例如通过用编码SEQ IDNO:186的多肽序列的SEQ ID NO:185或编码SEQ ID NO:188的多肽序列的SEQ ID NO:187之任一所表示的核酸序列转化植物来实施,其中所述的核酸序列编码SEQ ID NO:2的多肽序列。但是,本发明的实施不限于这些序列;本发明的方法可以有利地使用如本文中定义的任意编码YRP5的核酸或YRP5多肽实施。
编码YRP5多肽的核酸的例子在本文实施例部分的表A2中给出。此类核酸用于实施本发明的方法中。在表A2中给出的氨基酸序列的直向同源物和旁系同源物可以使用常规工具和技术容易地获得,例如交互性blast搜索。通常,这包括第一BLAST,其中所述的第一BLAST包括将查询序列(例如使用实施例部分的表A2中列出的任意序列)针对任意序列数据库,如可公开获得的NCBI数据库进行BLAST。当从核苷酸序列开始时,一般使用BLASTN或TBLASTX(使用标准默认值),并且当从蛋白质序列开始时,使用BLASTP或TBLASTN(使用标准默认值)。可以任选地筛选BLAST结果。筛选结果或非筛选结果的全长序列随后针对来自生物的序列进行反向BLAST(第二BLAST),其中查询序列从所述的生物中衍生(在查询序列是SEQ ID NO:185或SEQ ID NO:186的情况下,第二BLAST因而将针对Populus trichocarpa序列进行;在查询序列是SEQ ID NO:187或SEQ IDNO:188的情况下,第二BLAST因而将针对拟南芥进行)。随后比较第一BLAST和第二BLAST的结果。若来自第一blast的高阶位命中是源自与衍生查询序列的物种相同的物种,则鉴定到旁系同源物,随后一个反向BLAST理想地在最高命中当中产生该查询序列;若在第一BLAST中的高阶位命中不是源自与衍生查询序列的物种相同的物种,则鉴定到直向同源物,并且在反向BLAST时,优选地产生属于最高命中当中的该查询序列。
在关于CK1多肽的方面,本发明通过用SEQ ID NO:194所表示的核酸序列转化植物进行说明,其中所述的核酸序列编码SEQ ID NO:195的多肽序列。但是,本发明的实施不限于这些序列;本发明的方法可以有利地使用如本文中定义的任意编码CK1的核酸或CK1多肽实施。
编码CK1多肽的核酸的例子在本文实施例部分的表A3中给出。此类核酸用于实施本发明的方法中。在实施例部分的表A3中给出的氨基酸序列是由SEQ ID NO:195所表示的CK1多肽的直向同源物和旁系同源物的示例序列,术语“直向同源物”和“旁系同源物”如本文中定义。其他直向同源物和旁系同源物可以通过开展所谓交互性blast搜索轻易地鉴定。通常,这包括第一BLAST,其中所述的第一BLAST包括将查询序列(例如使用实施例部分的表A3中列出的任意序列)针对任意序列数据库,如可公开获得的NCBI数据库进行BLAST。当从核苷酸序列开始时,一般使用BLASTN或TBLASTX(使用标准默认值),并且当从蛋白质序列开始时,使用BLASTP或TBLASTN(使用标准默认值)。可以任选地筛选BLAST结果。筛选结果或非筛选结果的全长序列随后针对来自生物的序列进行反向BLAST(第二BLAST),其中查询序列从所述的生物中衍生(在查询序列是SEQ ID NO:194或SEQ ID NO:195的情况下,第二BLAST因而将针对拟南芥属序列进行)。随后比较第一BLAST和第二BLAST的结果。若来自第一blast的高阶位命中是源自与衍生查询序列的物种相同的物种,则鉴定到旁系同源物,随后一个反向BLAST理想地在最高命中当中产生该查询序列;若在第一BLAST中的高阶位命中不是源自与衍生查询序列的物种相同的物种,则鉴定到直向同源物,并且在反向BLAST时,优选地产生属于最高命中当中的该查询序列。
在关于bHLH12-样多肽的方面,本发明通过用SEQ ID NO:279所表示的核酸序列转化植物进行说明,其中所述的核酸序列编码SEQ ID NO:280的多肽序列。但是,本发明的实施不限于这些序列;本发明的方法可以有利地使用如本文中定义的任意编码bHLH12-样的核酸或bHLH12-样多肽实施。
编码bHLH12-样多肽的核酸的例子在本文实施例部分的表A4中给出。此类核酸用于实施本发明的方法中。在实施例部分的表A4中给出的氨基酸序列是由SEQ ID NO:280所表示的bHLH12-样多肽的直向同源物和旁系同源物的示例序列,术语“直向同源物”和“旁系同源物”如本文中定义。其他直向同源物和旁系同源物可以通过开展所谓交互性blast搜索轻易地鉴定。通常,这包括第一BLAST,其中所述的第一BLAST包括将查询序列(例如使用实施例部分的表A4中列出的任意序列)针对任意序列数据库,如可公开获得的NCBI数据库进行BLAST。当从核苷酸序列开始时,一般使用BLASTN或TBLASTX(使用标准默认值),并且当从蛋白质序列开始时,使用BLASTP或TBLASTN(使用标准默认值)。可以任选地筛选BLAST结果。筛选结果或非筛选结果的全长序列随后针对来自生物的序列进行反向BLAST(第二BLAST),其中查询序列从所述的生物中衍生(在查询序列是SEQ ID NO:279或SEQ ID NO:280的情况下,第二BLAST因而将针对Populus trichocarpa序列进行)。随后比较第一BLAST和第二BLAST的结果。若来自第一blast的高阶位命中是源自与衍生查询序列的物种相同的物种,则鉴定到旁系同源物,随后一个反向BLAST理想地在最高命中当中产生该查询序列;若在第一BLAST中的高阶位命中不是源自与衍生查询序列的物种相同的物种,则鉴定到直向同源物,并且在反向BLAST时,优选地产生属于最高命中当中的该查询序列。
在关于ADH2多肽的方面,本发明通过用SEQ ID NO:412或SEQ IDNO:414所表示的核酸序列转化植物进行说明,其中所述的核酸序列编码SEQ ID NO:413或SEQ ID NO:415的多肽序列。但是,本发明的实施不限于这些序列;本发明的方法可以有利地使用如本文中定义的任意编码ADH2的核酸或ADH2多肽实施。
编码ADH2多肽的核酸的例子在本文实施例部分的表A5中给出。此类核酸用于实施本发明的方法中。在实施例部分的表A5中给出的氨基酸序列是由SEQ ID NO:413所表示的ADH2多肽的直向同源物和旁系同源物的示例序列,术语“直向同源物”和“旁系同源物”如本文中定义。其他直向同源物和旁系同源物可以通过开展所谓交互性blast搜索轻易地鉴定。通常,这包括第一BLAST,其中所述的第一BLAST包括将查询序列(例如使用实施例部分的表A5中列出的任意序列)针对任意序列数据库,如可公开获得的NCBI数据库进行BLAST。当从核苷酸序列开始时,一般使用BLASTN或TBLASTX(使用标准默认值),并且当从蛋白质序列开始时,使用BLASTP或TBLASTN(使用标准默认值)。可以任选地筛选BLAST结果。筛选结果或非筛选结果的全长序列随后针对来自生物的序列进行反向BLAST(第二BLAST),其中查询序列从所述的生物中衍生(在查询序列是SEQ ID NO:412、SEQ ID NO:413、SEQ ID NO:414或SEQ ID NO:415的情况下,第二BLAST因而将针对甘蔗属(Saccharum)序列进行)。随后比较第一BLAST和第二BLAST的结果。若来自第一blast的高阶位命中是源自与衍生查询序列的物种相同的物种,则鉴定到旁系同源物,随后一个反向BLAST理想地在最高命中当中产生该查询序列;若在第一BLAST中的高阶位命中不是源自与衍生查询序列的物种相同的物种,则鉴定到直向同源物,并且在反向BLAST时,优选地产生属于最高命中当中的该查询序列。
在关于GCN5多肽的方面,本发明通过用SEQ ID NO:459所表示的核酸序列转化植物进行说明,其中所述的核酸序列编码SEQ ID NO:460的多肽序列。但是,本发明的实施不限于这些序列;本发明的方法可以有利地使用如本文中定义的任意编码GCN5-样多肽的核酸或GCN5-样多肽实施。
编码GCN5-样多肽的核酸的例子在本文实施例部分的表A6中给出。此类核酸用于实施本发明的方法中。在实施例部分的表A6中给出的氨基酸序列是由SEQ ID NO:460所表示的GCN5-样多肽的直向同源物和旁系同源物的示例序列,术语“直向同源物”和“旁系同源物”如本文中定义。其他直向同源物和旁系同源物可以通过开展所谓交互性blast搜索轻易地鉴定。通常,这包括第一BLAST,其中所述的第一BLAST包括将查询序列(例如使用实施例部分的表A6中列出的任意序列)针对任意序列数据库,如可公开获得的NCBI数据库进行BLAST。当从核苷酸序列开始时,一般使用BLASTN或TBLASTX(使用标准默认值),并且当从蛋白质序列开始时,使用BLASTP或TBLASTN(使用标准默认值)。可以任选地筛选BLAST结果。筛选结果或非筛选结果的全长序列随后针对来自生物的序列进行反向BLAST(第二BLAST),其中查询序列从所述的生物中衍生。随后比较第一BLAST和第二BLAST的结果。若来自第一blast的高阶位命中是源自与衍生查询序列的物种相同的物种,则鉴定到旁系同源物,随后一个反向BLAST理想地在最高命中当中产生该查询序列;若在第一BLAST中的高阶位命中不是源自与衍生查询序列的物种相同的物种,则鉴定到直向同源物,并且在反向BLAST时,优选地产生属于最高命中当中的该查询序列。
高阶位命中是具有低E-值的那些命中。E-值越低,评分越显著(或换句话说,偶然发现该命中的几率越低)。E-值的计算是本领域熟知的。除了E-值外,比较过程也通过同一性百分数评分。同一性百分数指两个所比较的核酸(或多肽)序列之间特定长度范围内相同的核苷酸(或氨基酸)的数目。在大型家族的情况下,可以使用ClustalW,随后使用邻接树法,以帮助观察相关基因的聚类和鉴定直向同源物和旁系同源物。
蛋白质亚细胞定位预测的任务是重要的且深入研究的。了解蛋白质的定位帮助阐述蛋白质的功能。用于蛋白质定位的实验方法从免疫定位到利用绿色荧光蛋白(GFP)或β-葡糖醛酸糖苷酶(GUS)标记蛋白质。此类方法是准确的,但与计算机方法相比耗费劳动力。目前,在从序列数据计算机预测蛋白质定位中已有很大进步。除本领域技术人员普遍已知的算法外,还可利用瑞士生物信息中心提供的ExPASy蛋白组学工具,例如,PSort、TargetP、ChloroP、LocTree、Predotar、LipoP、MITOPROT、PATS、PTS1、SignalP、TMHMM等。
核酸变体也可用于实践本发明的方法。此类变体的实例包括编码实施例章节的表A1至A6给出的任一氨基酸序列的同源物和衍生物的核酸,术语“同源物”和“衍生物”如本文中所定义的。还可用于本发明方法的是编码实施例章节的表A1至A6给出的任一氨基酸序列的直向同源物和旁系同源物的同源物和衍生物的核酸。可用于本发明方法的同源物和衍生物具有与其来源的未修饰的蛋白质的基本相同的生物学和功能活性。用于实施本发明方法的其它变体是其中密码子选择被优化的变体或者其中移除了miRNA靶位点的变体。
用于实践本发明方法的其它核酸变体包括编码LDOX多肽、或YRP5多肽、或CK1多肽、或bHLH12-样多肽、或ADH2多肽或GCN5-样多肽的核酸的部分,与编码LDOX多肽、或YRP5多肽、或CK1多肽、或bHLH12-样多肽、或ADH2多肽或GCN5-样多肽的核酸杂交的核酸,编码LDOX多肽、或YRP5多肽、或CK1多肽、或bHLH12-样多肽、或ADH2多肽或GCN5-样多肽的核酸的剪接变体,编码LDOX多肽、或YRP5多肽、或CK1多肽、或bHLH12-样多肽、或ADH2多肽或GCN5-样多肽的核酸的等位变体,和通过基因改组(gene shuffling)获得的编码LDOX多肽、或YRP5多肽、或CK1多肽、或bHLH12-样多肽、或ADH2多肽或GCN5-样多肽的核酸的变体。术语杂交序列、剪接变体、等位变体和基因改组是如本文定义的。
编码LDOX多肽、或YRP5多肽、或CK1多肽、或bHLH12-样多肽、或ADH2多肽或GCN5-样多肽的核酸不需要是全长的核酸,因为本发明方法的实施不依赖使用全长核酸序列。根据本发明,提供了用于在植物中增强产量相关性状的方法,包括在植物中导入和表达实施例章节的表A1至A6给出的任一核酸序列的部分,或者编码实施例章节的表A1至A6给出的任意氨基酸序列的直向同源物、旁系同源物或同源物的核酸的部分。
核酸的一部分可以例如通过对所述核酸产生一个或多个缺失而制备。所述部分可以以分离的形式使用或它们可以与其他编码(或非编码)序列融合,例如旨在产生组合有几种活性的蛋白质。与其他编码序列融合时,在翻译时产生的所得多肽可以比对于该蛋白质部分所预测的多肽更大。
关于LDOX多肽,用于本发明方法的部分编码如本文定义的LDOX多肽,并具有与实施例章节的表A1给出的氨基酸序列基本相同的生物学活性。优选的,部分是实施例章节的表A1给出的任一的核酸的部分,或者是编码实施例章节的表A1给出的任一的氨基酸序列的直向同源物或旁系同源物的核酸的部分。优选的,部分是长度为至少500、550、600、650、700、750、800、850、900、950、1000、1050、1100个连续的核苷酸,连续的核苷酸是实施例章节的表A1给出的任一核酸序列的连续的核苷酸,或者是编码实施例章节的表A1给出的任一的氨基酸序列的直向同源物或旁系同源物的核酸的连续的核苷酸。最优选的,部分是SEQ ID NO:1的核酸的一部分。优选地,该部分编码氨基酸序列的片段,其中所述的氨基酸序列在构建进化系统树例如图4所描述的进化系统树中使用时,在LDOX多肽组中聚类,而不与任何其它组聚类;更优选地,多肽序列在LDOX多肽的亚组A中聚类,所述组包含SEQ ID NO:2中所示的氨基酸序列。
关于YRP5多肽,用于本发明方法的部分编码如本文定义的YRP5多肽,并具有与实施例章节的表A2给出的氨基酸序列基本相同的生物学活性。优选的,部分是实施例章节的表A2给出的任一的核酸的部分,或者是编码实施例章节的表A2给出的任一的氨基酸序列的直向同源物或旁系同源物的核酸的部分。优选的,部分是长度为至少1850、1900、1950、2000、2050、2100、2150、2200、2250、2300、2350、2400、2450、2500、2550、2600、2650、2700、2750、2800、2850、2900、2950、3000、3050、3100、3150、3200、3250、3300、3350、3400、3450、3500、3550、3600、3650或更多个连续的核苷酸,连续的核苷酸是实施例章节的表A2给出的任一核酸序列的连续的核苷酸,或者是编码实施例章节的表A2给出的任一的氨基酸序列的直向同源物或旁系同源物的核酸的连续的核苷酸。最优选的,部分是SEQ ID NO:185或SEQ ID NO:187的核酸的一部分。优选地,该部分编码氨基酸序列的片段,其中所述的氨基酸序列在构建进化系统树中使用时,与包含SEQ ID NO:186或SEQ ID NO:188所表示的氨基酸序列的YRP5多肽组聚类,而不与任何其他组聚类。
关于CK1多肽,用于本发明方法的部分编码如本文定义的CK1多肽,并具有与实施例章节的表A3给出的氨基酸序列基本相同的生物学活性。优选的,部分是实施例章节的表A3给出的任一的核酸的部分,或者是编码实施例章节的表A3给出的任一的氨基酸序列的直向同源物或旁系同源物的核酸的部分。优选的,部分是长度为至少100、200、300、400、500、550、600、650、700、750、800、850、900、950、1000个连续的核苷酸,连续的核苷酸是实施例章节的表A3给出的任一核酸序列的连续的核苷酸,或者是编码实施例章节的表A3给出的任一的氨基酸序列的直向同源物或旁系同源物的核酸的连续的核苷酸。最优选的,部分是SEQ ID NO:194的核酸的一部分。优选地,该部分编码蛋白质的片段,所述蛋白质以增加的优选顺序与表A3中的任何多肽所表示的,优选SEQ ID NO:195表示的氨基酸序列具有至少25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性。
关于bHLH12-样多肽,用于本发明方法的部分编码如本文定义的bHLH12-样多肽,并具有与实施例章节的表A4给出的氨基酸序列基本相同的生物学活性。优选的,部分是实施例章节的表A4给出的任一的核酸的部分,或者是编码实施例章节的表A4给出的任一的氨基酸序列的直向同源物或旁系同源物的核酸的部分。优选的,部分是长度为至少100、200、300、400、500、550、600、650、700、750、800、850、900、950、1000个连续的核苷酸,连续的核苷酸是实施例章节的表A4给出的任一核酸序列的连续的核苷酸,或者是编码实施例章节的表A4给出的任一的氨基酸序列的直向同源物或旁系同源物的核酸的连续的核苷酸。最优选的,部分是SEQ ID NO:279或SEQ ID NO:295的核酸的一部分。优选地,该部分编码下述多肽,所述多肽当用于构建进化系统树时,用Heim等人(2003)的图4中所称的多肽序列构建时,与Heim等人(2003)的图4中的组XII的任何多肽聚类,优选在BEE3中,而不与任何其它组聚类。
关于ADH2多肽,用于本发明方法的部分编码如本文定义的ADH2多肽,并具有与实施例章节的表A5给出的氨基酸序列基本相同的生物学活性。优选的,部分是实施例章节的表A5给出的任一的核酸的部分,或者是编码实施例章节的表A5给出的任一的氨基酸序列的直向同源物或旁系同源物的核酸的部分。优选的,部分以增加的优选顺序是长度为至少500、550、600、650、700、750、800、850、900、950、1000或更多个连续的核苷酸,连续的核苷酸是实施例章节的表A5给出的任一核酸序列的连续的核苷酸,或者是编码实施例章节的表A5给出的任一的氨基酸序列的直向同源物或旁系同源物的核酸的连续的核苷酸。最优选的,部分是SEQ IDNO:412或SEQ ID NO:414的核酸的一部分。优选地,该部分编码氨基酸序列的片段,其中所述的氨基酸序列当用于构建进化系统树,例如图12中描述的时,与包含SEQ ID NO:413或SEQ ID NO:415所表示的氨基酸序列的ADH2多肽组聚类,而不与任何其它组聚类。
关于GCN5多肽,用于本发明方法的部分编码如本文定义的GCN5-样多肽,并具有与实施例章节的表A6给出的氨基酸序列基本相同的生物学活性。优选的,部分是实施例章节的表A6给出的任一的核酸的部分,或者是编码实施例章节的表A6给出的任一的氨基酸序列的直向同源物或旁系同源物的核酸的部分。优选的,部分是长度为至少500、550、600、650、700、750、800、850、900、950、1000个连续的核苷酸,连续的核苷酸是实施例章节的表A6给出的任一核酸序列的连续的核苷酸,或者是编码实施例章节的表A6给出的任一的氨基酸序列的直向同源物或旁系同源物的核酸的连续的核苷酸。最优选的,部分是SEQ ID NO:459的核酸的一部分。优选地,该部分编码氨基酸序列的片段,其中所述的氨基酸序列当用于构建进化系统树,例如图15中描述的时,与包含如SEQ ID NO:460所表示的氨基酸序列的GCN5-样多肽组聚类,而不与任何其它组聚类。
可用于本发明方法的另一种核酸变体是在降低严格条件下,优选的是在严格条件下,能够与编码如本文定义的LDOX多肽、或YRP5多肽、或CK1多肽、或bHLH12-样多肽、或ADH2多肽或GCN5-样多肽的核酸,或者与如本文定义的部分杂交的核酸。
根据本发明,提供了用于在植物中增强产量相关性状的方法,包括在植物中导入和表达能够与实施例章节的表A1至A6给出的任一核酸杂交的核酸,或者包括在植物中导入和表达能够与编码实施例章节的表A1至A6给出的任意氨基酸序列的直向同源物、旁系同源物或同源物的核酸杂交的核酸。
关于LDOX多肽,在本发明方法中有用的杂交序列编码如本文中定义的LDOX多肽,其具有如实施例章节的表A1中所给出氨基酸序列基本上相同的生物学活性。优选地,该杂交序列能够与实施例章节的表A1中给出的任一核酸的互补序列或与这些序列中任意序列的一部分杂交,所述的一部分如上文定义,或其中所述杂交序列能够与下述核酸的互补序列杂交,其中所述的核酸编码在实施例章节的表A1中给出的任一氨基酸序列的直向同源物或旁系同源物。最优选地,该杂交序列能够与如SEQ ID NO:1所表示的核酸的互补序列或与其一部分杂交。
优选的,杂交序列编码具有这样的氨基酸序列的多肽,其中所述的氨基酸序列当全长且在构建进化系统树例如图4所描述的进化系统树中使用时,在LDOX多肽组中聚类,而不与任何其它组聚类;更优选地,多肽序列在LDOX多肽的亚组A中聚类,所述组包含SEQ ID NO:2中所示的氨基酸序列。
关于YRP5多肽,在本发明方法中有用的杂交序列编码如本文中定义的YRP5多肽,其具有如实施例章节的表A2中所给出氨基酸序列基本上相同的生物学活性。优选地,该杂交序列能够与表A2中给出的任一核酸的互补序列或与这些序列中任意序列的一部分杂交,所述的一部分如上文定义,或其中所述杂交序列能够与下述核酸的互补序列杂交,其中所述的核酸编码在表A2中给出的任一氨基酸序列的直向同源物或旁系同源物。最优选地,该杂交序列能够与如SEQ ID NO:185或SEQ ID NO:187所表示的核酸的互补序列或与其一部分杂交。
优选的,杂交序列编码具有这样的氨基酸序列的多肽,其中所述的氨基酸序列当全长且在构建进化系统树中使用时,与包含SEQ ID NO:186或SEQ ID NO:188所表示的氨基酸序列的YRP5多肽组聚类,而不与任何其他组聚类。
关于CK1多肽,在本发明方法中有用的杂交序列编码如本文中定义的CK1多肽,其具有如实施例章节的表A3中所给出氨基酸序列基本上相同的生物学活性。优选地,该杂交序列能够与实施例章节的表A3中给出的任一核酸的互补序列或与这些序列中任意序列的一部分杂交,所述的一部分如上文定义,或其中所述杂交序列能够与下述核酸的互补序列杂交,其中所述的核酸编码在实施例章节的表A3中给出的任一氨基酸序列的直向同源物或旁系同源物。最优选地,该杂交序列能够与如SEQ ID NO:194所表示的核酸的互补序列或与其一部分杂交。
优选的,杂交序列编码蛋白质,所述蛋白质以增加的优选顺序与表A3中的任何多肽所表示的,优选SEQ ID NO:195表示的氨基酸序列具有至少25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性。
关于bHLH12-样多肽,在本发明方法中有用的杂交序列编码如本文中定义的bHLH12-样多肽,其具有如实施例章节的表A4中所给出氨基酸序列基本上相同的生物学活性。优选地,该杂交序列能够与实施例章节的表A4中给出的任一核酸的互补序列或与这些序列中任意序列的一部分杂交,所述的一部分如上文定义,或其中所述杂交序列能够与下述核酸的互补序列杂交,其中所述的核酸编码在实施例章节的表A4中给出的任一氨基酸序列的直向同源物或旁系同源物。最优选地,该杂交序列能够与如SEQ IDNO:279所表示的核酸的互补序列或与其一部分杂交。
优选的,杂交序列编码蛋白质,其用于构建进化系统树时,用Heim等人(2003)的图4中所称的多肽序列构建时,与Heim等人(2003)的图4中的组XII的任何多肽聚类,优选在BEE3中,而不与任何其它组聚类。
关于ADH2多肽,在本发明方法中有用的杂交序列编码如本文中定义的ADH2多肽,其具有如实施例章节的表A5中所给出氨基酸序列基本上相同的生物学活性。优选地,该杂交序列能够与实施例章节的表A5中给出的任一核酸的互补序列或与这些序列中任意序列的一部分杂交,所述的一部分如上文定义,或其中所述杂交序列能够与下述核酸的互补序列杂交,其中所述的核酸编码在实施例章节的表A5中给出的任一氨基酸序列的直向同源物或旁系同源物。最优选地,该杂交序列能够与如SEQ ID NO:412或SEQ ID NO:414所表示的核酸的互补序列或与其一部分杂交。
优选的,杂交序列编码具有这样的氨基酸序列的多肽,其中所述的氨基酸序列当全长且当用于构建进化系统树,例如图12中描述的时,与包含SEQ ID NO:413或SEQ ID NO:415所表示的氨基酸序列的ADH2多肽组聚类,而不与任何其它组聚类。
关于GCN5多肽,在本发明方法中有用的杂交序列编码如本文中定义的GCN5-样多肽,其具有如实施例章节的表A6中所给出氨基酸序列基本上相同的生物学活性。优选地,该杂交序列能够与实施例章节的表A6中给出的任一核酸的互补序列或与这些序列中任意序列的一部分杂交,所述的一部分如上文定义,或其中所述杂交序列能够与下述核酸的互补序列杂交,其中所述的核酸编码在实施例章节的表A6中给出的任一氨基酸序列的直向同源物或旁系同源物。最优选地,该杂交序列能够与如SEQ ID NO:459所表示的核酸的互补序列或与其一部分杂交。
优选的,杂交序列编码具有这样的氨基酸序列的多肽,其中所述的氨基酸序列当全长且当用于构建进化系统树,例如图15中描述的时,与包含如SEQ ID NO:460所表示的氨基酸序列的GCN5-样多肽组聚类,而不与任何其它组聚类。
可用于本发明方法的另一种核酸变体是编码如上文定义的LDOX多肽、或YRP5多肽、或CK1多肽、或bHLH12-样多肽、或ADH2多肽或GCN5-样多肽的剪接变体,剪接变体是如本文定义的。
关于LDOX多肽、或CK1多肽、或bHLH12-样多肽、或ADH2多肽或GCN5-样多肽,根据本发明,提供了用于在植物中增强产量相关性状的方法,包括在植物中导入和表达在实施例章节的表A1、或表A3、或表A4、或表A5、或表A6中给出的任一核酸序列的剪接变体,或者编码在实施例章节的表A1、或表A3、或表A4、或表A5、或表A6中给出的任何氨基酸序列的直向同源物、旁系同源物或同源物的核酸的剪接变体。
关于YRP5多肽,根据本发明,提供了用于在植物中增强非生物胁迫耐受性的方法,包括在植物中导入和表达在表A2中给出的任一核酸序列的剪接变体,或者编码在实施例章节的表A2中给出的任何氨基酸序列的直向同源物、旁系同源物或同源物的核酸的剪接变体。
关于LDOX多肽,优选的剪接变体是由SEQ ID NO:1表示的核酸的剪接变体,或者是编码SEQ ID NO:2的直向同源物或旁系同源物的核酸的剪接变体。优选的,由剪接变体编码的氨基酸序列,在构建进化系统树例如图4所描述的进化系统树中使用时,在LDOX多肽组中聚类,而不与任何其它组聚类;更优选地,多肽序列在LDOX多肽的亚组A中聚类,所述组包含SEQ ID NO:2中所示的氨基酸序列。
关于YRP5多肽,优选的剪接变体是由任何SEQ ID NO:185或SEQ IDNO:187表示的核酸的剪接变体,或者是编码任何SEQ ID NO:186或SEQID NO:188的直向同源物或旁系同源物的核酸的剪接变体。优选的,由剪接变体编码的氨基酸序列,在构建进化系统树中使用时,与包含SEQ IDNO:186或SEQ ID NO:188所表示的氨基酸序列的YRP5多肽组聚类,而不与任何其他组聚类。
关于CK1多肽,优选的剪接变体是由SEQ ID NO:194表示的核酸的剪接变体,或者是编码SEQ ID NO:195的直向同源物或旁系同源物的核酸的剪接变体。优选的,由剪接变体编码的氨基酸序列,以增加的优选顺序与表A3中的任何多肽所表示的,优选SEQ ID NO:195表示的氨基酸序列具有至少25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性。
关于bHLH12-样多肽,优选的剪接变体是由SEQ ID NO:279表示的核酸的剪接变体,或者是编码SEQ ID NO:280的直向同源物或旁系同源物的核酸的剪接变体。优选的,由剪接变体编码的氨基酸序列,用于构建进化系统树时,用Heim等人(2003)的图4中所称的多肽序列构建时,与Heim等人(2003)的图4中的组XII的任何多肽聚类,优选在BEE3中,而不与任何其它组聚类。
关于ADH2多肽,优选的剪接变体是由SEQ ID NO:412或SEQ IDNO:414表示的核酸的剪接变体,或者是编码SEQ ID NO:413或SEQ IDNO:415的直向同源物或旁系同源物的核酸序列的剪接变体。优选的,由剪接变体编码的氨基酸序列,用于构建进化系统树,例如图12中描述的时,与包含SEQ ID NO:413或SEQ ID NO:415所表示的氨基酸序列的ADH2多肽组聚类,而不与任何其它组聚类。
关于GCN5多肽,优选的剪接变体是由SEQ ID NO:459表示的核酸的剪接变体,或者是编码SEQ ID NO:460的直向同源物或旁系同源物的核酸的剪接变体。优选的,由剪接变体编码的氨基酸序列,当用于构建进化系统树,例如图15中描述的时,与包含如SEQ ID NO:460所表示的氨基酸序列的GCN5-样多肽组聚类,而不与任何其它组聚类。
可用于实施本发明方法的另一种核酸变体是编码如上文定义的LDOX多肽、或YRP5多肽、或CK1多肽、或bHLH12-样多肽、或ADH2多肽或GCN5-样多肽的核酸的等位变体,等位变体是如本文定义的。
关于LDOX多肽、或CK1多肽、或bHLH12-样多肽、或ADH2多肽或GCN5-样多肽,根据本发明,提供了用于在植物中增强产量相关性状的方法,包括在植物中导入和表达在实施例章节的表A1、或表A3、或表A4、或表A5、或表A6中给出的任一核酸的等位变体,或者包括在植物中导入和表达编码在实施例章节的表A1、或表A3、或表A4、或表A5、或表A6中给出的任何氨基酸序列的直向同源物、旁系同源物或同源物的核酸的等位变体。
关于YRP5多肽,根据本发明,提供了用于在植物中增强非生物胁迫耐受性的方法,包括在植物中导入和表达在表A2中给出的任一核酸的等位变体,或者包括在植物中导入和表达编码在表A2中给出的任何氨基酸序列的直向同源物、旁系同源物或同源物的核酸的等位变体。
关于LDOX多肽,用于本发明方法的等位变体编码的多肽与SEQ IDNO:2的LDOX多肽和实施例章节的表A1描述的任何氨基酸具有基本相同的生物学活性。等位变体是天然存在的,本发明方法中涵盖了这些天然等位基因的应用。优选的,等位变体是SEQ ID NO:1的等位变体,或者是编码SEQ ID NO:2的直向同源物或旁系同源物的核酸的等位变体。优选地,等位变体编码的氨基酸序列,在构建进化系统树例如图4所描述的进化系统树中使用时,在LDOX多肽组中聚类,而不与任何其它组聚类;更优选地,多肽序列在LDOX多肽的亚组A中聚类,所述组包含SEQ IDNO:2中所示的氨基酸序列。
关于YRP5多肽,用于本发明方法的等位变体编码的多肽与任何SEQID NO:186的YRP5多肽或实施例章节的表A2描述的任何氨基酸具有基本相同的生物学活性。等位变体是天然存在的,本发明方法中涵盖了这些天然等位基因的应用。优选的,等位变体是任何SEQ ID NO:185或SEQ IDNO:187的等位变体,或者是编码SEQ ID NO:186或SEQ ID NO:188的直向同源物或旁系同源物的核酸的等位变体。优选地,等位变体编码的氨基酸序列,与包含SEQ ID NO:186或SEQ ID NO:188所表示的氨基酸序列的YRP5多肽聚类,而不与任何其他组聚类。
关于CK1多肽,用于本发明方法的等位变体编码的多肽与SEQ IDNO:195的CK1多肽和实施例章节的表A3描述的任何氨基酸具有基本相同的生物学活性。等位变体是天然存在的,本发明方法中涵盖了这些天然等位基因的应用。优选的,等位变体是SEQ ID NO:194的等位变体,或者是编码SEQ ID NO:195的直向同源物或旁系同源物的核酸的等位变体。优选地,等位变体编码的氨基酸序列,以增加的优选顺序与表A3中的任何多肽所表示的,优选SEQ ID NO:195表示的氨基酸序列具有至少25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性。
关于bHLH12-样多肽,用于本发明方法的等位变体编码的多肽与SEQID NO:280的bHLH12-样多肽和实施例章节的表A4描述的任何氨基酸具有基本相同的生物学活性。等位变体是天然存在的,本发明方法中涵盖了这些天然等位基因的应用。优选的,等位变体是SEQ ID NO:279的等位变体,或者是编码SEQ ID NO:280的直向同源物或旁系同源物的核酸的等位变体。优选地,等位变体编码的氨基酸序列,用于构建进化系统树时,用Heim等人(2003)的图4中所称的多肽序列构建时,与Heim等人(2003)的图4中的组XII的任何多肽聚类,优选在BEE3中,而不与任何其它组聚类。
关于ADH2多肽,用于本发明方法的等位变体编码的多肽与SEQ IDNO:413或SEQ ID NO:415的ADH2多肽和实施例章节的表A5描述的任何氨基酸具有基本相同的生物学活性。等位变体是天然存在的,本发明方法中涵盖了这些天然等位基因的应用。优选的,等位变体是SEQ ID NO:412或SEQ ID NO:414的等位变体,或者是编码SEQ ID NO:413或SEQ IDNO:415的直向同源物或旁系同源物的核酸的等位变体。优选地,等位变体编码的氨基酸序列,用于构建进化系统树,例如图12中描述的时,与包含SEQ ID NO:413或SEQ ID NO:415所表示的氨基酸序列的ADH2多肽聚类,而不与任何其它组聚类。
关于GCN5多肽,用于本发明方法的等位变体编码的多肽与SEQ IDNO:460的GCN5-样多肽和实施例章节的表A6描述的任何氨基酸具有基本相同的生物学活性。等位变体是天然存在的,本发明方法中涵盖了这些天然等位基因的应用。优选的,等位变体是SEQ ID NO:459的等位变体,或者是编码SEQ ID NO:460的直向同源物或旁系同源物的核酸的等位变体。优选地,等位变体编码的氨基酸序列,当用于构建进化系统树,例如图15中描述的时,与包含如SEQ ID NO:460所表示的氨基酸序列的GCN5-样多肽聚类,而不与任何其它组聚类。
基因改组或定向进化也可以用于产生编码如上文定义的LDOX多肽、或YRP5多肽、或CK1多肽、或bHLH12-样多肽、或ADH2多肽或GCN5-样多肽的核酸的变体;术语“基因改组”是如本文定义的。
关于LDOX多肽、或CK1多肽、或bHLH12-样多肽、或ADH2多肽或GCN5-样多肽,根据本发明,提供了用于在植物中增强产量相关性状的方法,包括在植物中导入和表达在实施例章节的表A1、或表A3、或表A4、或表A5、或表A6中给出的任一核酸序列的变体,或者包括在植物中导入和表达编码在实施例章节的表A1、或表A3、或表A4、或表A5、或表A6中给出的任何氨基酸序列的直向同源物、旁系同源物或同源物的核酸的变体,其中变体核酸是通过基因改组获得的。
关于YRP5多肽,根据本发明,提供了用于在植物中增强非生物胁迫耐受性的方法,包括在植物中导入和表达在实施例章节的表A2中给出的任一核酸序列的变体,或者包括在植物中导入和表达编码在实施例章节的表A2中给出的任何氨基酸序列的直向同源物、旁系同源物或同源物的核酸的变体,其中变体核酸是通过基因改组获得的。
关于LDOX多肽,优选地,通过基因改组获得的变体核酸编码的氨基酸序列,在构建进化系统树例如图4所描述的进化系统树中使用时,在LDOX多肽组中聚类,而不与任何其它组聚类;更优选地,多肽序列在LDOX多肽的亚组A中聚类,所述组包含SEQ ID NO:2中所示的氨基酸序列。
关于YRP5多肽,优选地,通过基因改组获得的变体核酸编码的氨基酸序列,用于构建进化系统树时,与包含SEQ ID NO:186或SEQ IDNO:188所表示的氨基酸序列的YRP5多肽组聚类,而不与任何其他组聚类。
关于CK1多肽,优选地,通过基因改组获得的变体核酸编码的氨基酸序列,以增加的优选顺序与表A3中的任何多肽所表示的,优选SEQ IDNO:195表示的氨基酸序列具有至少25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性。
关于bHLH12-样多肽,优选地,通过基因改组获得的变体核酸编码的氨基酸序列,用于构建进化系统树时,用Heim等人(2003)的图4中所称的多肽序列构建时,与Heim等人(2003)的图4中的组XII的任何多肽聚类,优选在BEE3中,而不与任何其它组聚类。
关于ADH2多肽,优选地,通过基因改组获得的变体核酸编码的氨基酸序列,用于构建进化系统树,例如图12中描述的时,与包含SEQ IDNO:413或SEQ ID NO:415所表示的氨基酸序列的ADH2多肽组聚类,而不与任何其它组聚类。
关于GCN5多肽,优选地,通过基因改组获得的变体核酸编码的氨基酸序列,当用于构建进化系统树,例如图15中描述的时,与包含如SEQ IDNO:460所表示的氨基酸序列的GCN5-样多肽组聚类,而不与任何其它组聚类。
此外,还可以通过定点诱变获得核酸序列。可利用一些方法实现定点诱变,最常见的是基于PCR的方法(Current Protocols in MolecularBiology.Wiley编著)。
编码LDOX多肽的核酸可以源自任何天然的或人工的来源,包括真菌或细菌。通过有意的人为操作,可以在组成和/或基因组环境上从其天然形式修饰核酸。优选地,LDOX多肽编码核酸是来自植物的,还优选的来自双子叶植物,更优选地来自十字花科(Brassicaceae),最优选地,核酸来自拟南芥。
编码YRP5多肽的核酸可以源自任何天然的或人工的来源。通过有意的人为操作,可以在组成和/或基因组环境上从其天然形式修饰核酸。优选地,YRP5多肽编码核酸是来自植物的,还优选的来自单子叶植物或双子叶植物,更优选地来自禾本科(Poaceae)或茄科(Solanaceae)。
编码CK1多肽的核酸可以源自任何天然的或人工的来源。通过有意的人为操作,可以在组成和/或基因组环境上从其天然形式修饰核酸。优选地,CK1多肽编码核酸是来自植物的,还优选的来自双子叶植物,还优选地来自十字花科(Brassicaceae),更优选地来自拟南芥属(Arabidopsis),最优选地来自拟南芥。
编码bHLH12-样多肽的核酸可以源自任何天然的或人工的来源。通过有意的人为操作,可以在组成和/或基因组环境上从其天然形式修饰核酸。优选地,bHLH12-样多肽编码核酸是来自植物的,还优选的来自双子叶植物,还优选地来自杨属(Populus),最优选地来自Populus trichocarpa。
编码ADH2多肽的核酸可以源自任何天然的或人工的来源。通过有意的人为操作,可以在组成和/或基因组环境上从其天然形式修饰核酸。优选地,ADH2多肽编码核酸是来自植物的,还优选的来自单子叶植物,更优选地来自禾本科(Poaceae),最优选地,核酸来自甘蔗(Saccharumofficinarum)。
编码GCN5-样的核酸可以源自任何天然的或人工的来源。通过有意的人为操作,可以在组成和/或基因组环境上从其天然形式修饰核酸。优选地,GCN5-样多肽编码核酸是来自植物的,还优选的来自单子叶植物,更优选地来自禾本科(Poaceae),最优选地,核酸来自稻(Oryza sativa)。
关于LDOX多肽,本发明方法的实施产生了具有增强的产量相关性状的植物。尤其,本发明方法的实施产生了相对于对照植物而言,具有增加的产量、尤其增加的种子产量和/或增强的根生长和/或增加的早期萌发势的植物。术语“产量”、“种子产量”和“早期萌发势”在本文的“定义”部分中更详细地描述。
关于CK1多肽或bHLH12-样多肽或ADH2多肽或GCN5多肽,本发明方法的实施产生了具有增强的产量相关性状的植物。尤其,本发明方法的实施产生了相对于对照植物而言,具有增加的产量、尤其增加的种子产量的植物。术语“产量”和“种子产量”在本文的“定义”部分中更详细地描述。
关于YRP5多肽,本发明方法的实施产生了具有增强的非生物胁迫耐受性的植物。
本文中提及增强的产量相关性状旨在表示,植物的一个或多个部分的生物量(重量)的增加,所述部分可以包括地上(可收获的)部分和/或地下(可收获的)部分。特别地,该可收获部分是种子、地上生物量和/或根,并且本发明方法的实施导致与对照植物的种子产量相比较具有增加的生物量和/或种子产量的植物。
以玉米为例,产量增加可以表现为如下一个或多个方面:每平方米建植的植物数的增加、每株植物的穗数的增加、行数、行粒数、粒重、千粒重、穗长度/直径的增加、种子饱满率(为饱满种子数除以种子总数并乘以100)的增加,等等。
以稻为例,产量增加可以表现为如下一个或多个方面的增加:每平方米的植物数、每株植物的圆锥花序数、圆锥花序长度、每圆锥花序的小穗数、每圆锥花序的花朵(小花)数、种子饱满率(为饱满种子数除以种子总数并乘以100)的增加、千粒重的增加,等等。在稻中,淹没耐受性也可导致增加的产量。
关于非生物胁迫,本发明提供了相对于对照植物而增强植物的胁迫耐受性的方法,该方法包括调节编码本文所定义的YRP5多肽的核酸在植物中的表达。
通常植物通过更加缓慢的生长来应答胁迫接触。在重度胁迫条件下,植物甚至可以完全停止生长。另一方面,轻度胁迫在文中定义为当植物接触时不导致植物完全停止生长且丧失重新开始生长的能力的任何胁迫。本发明意义上的轻度胁迫导致受胁迫植物的生长,与非胁迫条件下的对照植物相比,下降不到40%、35%、30%或25%、更优选下降不到20%或15%。由于农业实践(灌溉、施肥、农药处理)的发展,栽培的作物植物往往并不会遇到重度胁迫。因此,由轻度胁迫诱发的受损的生长通常成为农业中不期望的性质。轻度胁迫是植物接触的日常的生物和/或非生物(环境)胁迫。非生物胁迫可以因干旱或过量的水、缺氧胁迫、盐胁迫、化学毒性、氧化胁迫以及热、冷或冰冻温度而引起。非生物胁迫可以是由于水胁迫(特别是由于干旱)、盐胁迫、氧化胁迫或离子胁迫引起的渗透胁迫。生物胁迫一般是由病原体例如细菌、病毒、真菌、线虫和昆虫所引起的那些胁迫。
特别地,可在(轻度)干旱条件下进行本发明方法以产生相对于对照植物具有增强的干旱耐受性的植物,其本身可表现为相对于对照植物增加的产量。如Wang等(Planta(2003)218:1-14)所报道的那样,非生物胁迫引起一系列的形态学、生理学、生物化学和分子变化,对植物生长和生产力造成不利影响。已知干旱、盐度、极端温度和氧化胁迫相互联系,并可以通过相似的机制诱发生长和细胞损害。Rabbani等(Plant Physiol(2003)133:1755-1767)描述了干旱胁迫和高盐度胁迫之间存在着的特别高程度的“交叉对话”。例如,干旱和/或盐度主要表现为渗透胁迫,导致破坏细胞中的稳态和离子分布。氧化胁迫通常与高温或低温、盐度或干旱胁迫相伴,可以引起功能及结构蛋白质的变性。所以,这些多种多样的环境胁迫通常激活相似的细胞信号传递通路和细胞应答,如应激蛋白的产生、抗氧化剂的上调、可混溶溶质的累积以及生长阻抑。如本文中所用的术语“非胁迫”条件是允许植物最佳生长的那些环境条件。本领域技术人员知道给定位置的正常土壤条件和气候条件。具有最佳生长条件(在非胁迫条件下生长)的植物通常按照递增的优选次序产生这样的植物在给定的环境中的平均产量的至少97%、95%、92%、90%、87%、85%、83%、80%、77%或75%。可基于收获和/或季节,计算平均产量。本领域技术人员将知晓作物的平均产量产出。
实施本发明方法可以产生,相对于在相当条件下生长的对照植物,生长在(轻度)干旱条件下具有增强的干旱耐受性的植物。因此,根据本发明,提供了用于在(轻度)干旱条件下生长的植物中增强干旱耐受性的方法,所述方法包括调节编码YRP5多肽的核酸在植物中的表达。
实施本发明方法可以产生,相对于对照植物,生长在养分缺乏的条件下、特别是氮缺乏条件下对由养分缺乏引起的胁迫具有增强的耐受性的植物。因此,根据本发明,提供了增强对养分缺乏引起的胁迫的耐受性的方法,所述方法包括调节编码LDOX多肽、或YRP5多肽、或CK1多肽、或bHLH12-样多肽、或ADH2多肽或GCN5-样多肽的核酸在植物中的表达。养分缺乏可以因诸如氮、磷酸及其他含磷化合物、钾、钙、镁、锰、铁和硼等养分的缺乏所致。
实施本发明方法可以产生,相对于在相当条件下生长的对照植物,生长在盐胁迫条件下具有增强的盐耐受性的植物。因此,根据本发明,提供了用于在盐胁迫的条件下生长的植物中增强盐耐受性的方法,所述方法包括调节编码LDOX多肽、或YRP5多肽、或CK1多肽、或bHLH12-样多肽、或ADH2多肽或GCN5-样多肽的核酸在植物中的表达。术语盐胁迫不局限于食盐(NaCl),而可以是如下任何一种或多种:NaCl、KCl、LiCl、MgCl2、CaCl2等。
关于产量相关性状,本发明提供了相对于对照植物增加植物的产量,特别地种子产量,的方法,所述方法包括调节编码本文所定义的LDOX多肽、或CK1多肽、或bHLH12-样多肽、或ADH2多肽或GCN5-样多肽的核酸在植物中的表达。
由于本发明的转基因植物具有增加的产量,故相对于对照植物的生长速率,这些植物有可能在其生活周期的对应阶段(在其生活周期的至少部分期间)表现增加的生长速率。
增加的生长速率可以是植物的一个或多个部分(包括种子)特有的,或可以基本上遍及整个植物。具有提到的生长速率的植物可以具备较短的生活周期。植物的生活周期可以意指从干燥成熟种子成长直至植物已经产生与起始材料相似的干燥成熟种子的阶段所需要的时间。这个生活周期可以受以下因素影响,如萌发速度、早期萌发势、生长速率、绿度指数、开花时间和种子成熟速度。生长速率的增加可以在植物生活周期的一个或多个阶段上或在基本上整个植物生活周期期间发生。增加的生长速率在植物生活周期的早期期间可以反映增强的萌发势。生长速率的增加可以改变植物的收获周期,从而允许植物较晚播种和/或较早收获,而这本来是不可能的(相似效果可以随较早的开花时间获得)。若生长速率充分增加,则可以允许进一步播种相同植物物种的种子(例如播种并收获稻植物,随后播种并收获其他稻植物,全部稻植物均处于一个常规生长时期中)。类似地,若生长速率充分地增加,可以允许进一步播种不同植物物种的种子(例如播种并收获玉米植物,随后例如播种并任选收获大豆、马铃薯或任何其他合适的植物)。在一些作物植物的例子中,来自相同根状茎的额外收获次数也可以是可能的。改变植物的收获周期可以导致每平方米一年生物量生产增加(原因在于可以培育并收获任何具体植物的次数(即在一年中)增加)。生长速率的增加也可以允许转基因植物在比其野生型对应物更广泛的地理区域内培育,因为培育作物的地域限制往往由栽种时期(早季)或在收获时期(晚季)的不利环境条件决定。这类不利条件可以避开,若缩短收获周期。生长速率可以通过从生长曲线获得多个参数而确定,此类参数可以是:T-Mid(植物达到50%最大植物大小所花费的时间)和T-90(植物达到90%最大植物大小所花费的时间),以及其他。
根据本发明的优选特征,本发明方法的实施产生了相对于对照植物而言,具有增加的生长速率的植物。因此,根据本发明,提供了用于增加植物生长速率的方法,所述方法包括调节编码如本文定义的LDOX多肽、或CK1多肽、或bHLH12-样多肽、或ADH2多肽或GCN5-样多肽的核酸在植物中的表达。
与对照植物相比较,无论所述植物处于非胁迫条件下或无论所述植物暴露于多种胁迫,产量和/或生长速率的增加均出现。植物一般通过生长得更慢而应答于胁迫暴露。在严重胁迫条件下,植物甚至可以完全停止生长。另一方面,轻度胁迫在本文中定义为植物所暴露的任何下述胁迫,其中所述的胁迫未导致植物完全停止生长,但同时不能恢复生长。与非胁迫条件下的对照植物相比较,轻度胁迫在本发明意义中导致受胁迫植物的生长降低小于40%、35%、30%或25%,更优选地小于20%或15%。由于农业实践(灌溉、施肥、杀虫剂处理)的进步,在栽培作物植物中并不经常遇到严重胁迫。因此,由轻度胁迫诱导的受损生长对于农业往往是不受欢迎的特征。轻度胁迫是植物所暴露的常见生物胁迫和/或非生物(环境)胁迫。非生物胁迫可以因干旱或过量的水、缺氧胁迫、盐胁迫、化学毒性、氧化胁迫和热、寒冷或冰冻温度所致。非生物胁迫可以是因水胁迫(尤其因为干旱)、盐胁迫、氧化胁迫或离子胁迫引起的渗透胁迫。生物胁迫一般是由病原体如细菌、病毒、真菌、线虫和昆虫引起的那些胁迫。生物胁迫一般是由病原体如细菌、病毒、真菌、线虫和昆虫引起的那些胁迫。如本文使用的,术语“非胁迫”条件是允许植物的最佳生长的环境条件。本领域技术人员知晓给定地区的普通土壤条件和气候条件。如本文所使用的术语非胁迫条件包括植物所暴露的偶然的或每天轻度胁迫,如本文定义的,但是不包括严重胁迫。
本发明的方法可以在非胁迫条件下或在轻度干旱条件开展以产生相对于对照植物具有增加的产量的植物。如Wang等人(Planta(2003)218:1-14)中报道,非生物胁迫导致一系列不利地影响植物生长及生产量的形态学、生理学、生物化学和分子变化。干旱、盐度、极端温度和氧化胁迫已知是相互联系的并可以通过相似机制诱导生长损害及细胞损害。Rabbani等人(Plant Physiol(2003)133:1755-1767)描述了干旱胁迫与高盐度胁迫之间极高程度的“交互作用”。例如,干旱和/或盐化作用主要表现为渗透胁迫,从而导致细胞内稳态和离子分布的破坏。经常伴随高温或低温、盐度或干旱胁迫的氧化胁迫可以引起功能性蛋白和结构蛋白变性。因此,这些多样的环境胁迫常常激活相似的细胞信号传导途径和细胞应答,如产生胁迫蛋白、上调抗氧化物质、积累兼容性溶质和生长停滞。如本文中所用的术语“非胁迫”条件是允许植物最佳生长的那些环境条件。本领域技术人员清楚对于给定地点的正常土壤条件和气候条件。具有最佳生长条件的植物(在非胁迫条件下生长的),以增加的优选顺序,通常产生此类植物在给定环境中至少97%、95%、92%、90%、87%、85%、83%、80%、77%或75%的平均产生。可以基于收获和/或季节基础,计算平均产生。本领域技术人员知晓作物的平均产量生产。
实施本发明方法使得生长在非胁迫条件下或在轻度干旱条件下生长的植物相对于在相当条件下生长的对照植物具有增加的产量。因此,根据本发明,提供了用于在非胁迫条件下或在轻度干旱条件下生长的植物中增加产量的方法,所述方法包括调节编码LDOX多肽、或CK1多肽、或bHLH12-样多肽、或ADH2多肽或GCN5-样多肽的核酸在植物中的表达。
本发明包括可由根据本发明的方法获得的植物或其部分(包括种子)。所述植物或其部分含有编码如上文所定义的LDOX多肽、或YRP5多肽、或CK1多肽、或bHLH12-样多肽、或ADH2多肽、或GCN5-样多肽的核酸转基因。
本发明还提供遗传构建体和载体,以利于编码LDOX多肽、或YRP5多肽或CK1多肽或bHLH12-样多肽或ADH2多肽或GCN5-样多肽的核酸在植物中的引入和/或表达。可以将基因构建体插入适于转化进入植物并适于在转化的细胞中表达目的基因的载体(可商购获得)中。本发明还提供了如本文所定义的基因构建体在本发明方法中的用途。
更特别地,本发明提供这样的构建体,其含有:
(a)编码如上定义的LDOX多肽、或YRP5多肽或CK1多肽或bHLH12-样多肽或ADH2多肽或GCN5-样多肽的核酸;
(b)一个或多个能够驱动(a)中核酸序列表达的控制序列;和任选的
(c)转录终止序列。
优选地,编码LDOX多肽、或YRP5多肽或CK1多肽或bHLH12样多肽或ADH2多肽或GCN5-样多肽的核酸如上文所定义。术语“控制序列”和“终止序列”如本文所定义。
可以使用含有任何上述核酸的载体转化植物。技术人员充分知晓载体中必须存在的遗传元件,以便成功进行转化、选择并繁殖含目的序列的宿主细胞。目的序列将有效连接于一个或多个控制序列(至少连接于启动子)。
关于LDOX多肽、或YRP5多肽或CK1多肽或bHLH12-样多肽或GCN5-样多肽,有利地,可以使用任何类型的启动子,无论是天然的还是合成的启动子来驱动核酸序列的表达,但优选启动子是植物来源的。组成型启动子在本发明方法中特别有用。优选组成型启动子也是中等强度的遍在组成型启动子。有关各种启动子类型的定义,参见本文中“定义”部分。关于GCN5-样多肽,用于本发明方法的还为根-特异性启动子。
关于ADH2多肽,有利地,可以使用任何类型的启动子,无论是天然的还是合成的启动子来驱动核酸序列的表达,但是优选地,启动子是植物来源的。种子特异性启动子在方法中特别有用。有关各种启动子类型的定义,参见本文“定义”部分。
关于LDOX多肽,应当清楚,本发明的实施并不局限于SEQ ID NO:1所示的LDOX多肽编码核酸,而且本发明的实施也不局限于由组成型启动子所驱动的LDOX多肽编码核酸的表达。
所述组成型启动子优选是中等强度的启动子。更优选地,其为植物来源的启动子,例如GOS2启动子或基本相同长度且具有基本相同的表达模式的启动子(功能等价启动子),更优选启动子是来自稻的GOS2启动子。甚至更优选,组成型启动子由与SEQ ID NO:184基本上相似的核酸序列表示,最优选组成型启动子如SEQ ID NO:184所示。有关组成型启动子的其他实例参见本文中“定义”部分。
任选的,可以在引入植物的构建体中使用一个或多个终止子序列。优选,构建体包含含有与SEQ ID NO:184基本相似的稻GOS2启动子和编码LDOX多肽的核酸的表达盒。
关于YRP5多肽,应当清楚,本发明的实施并不局限于SEQ ID NO:185或SEQ ID NO:187所示的YRP5多肽编码核酸,而且本发明的实施也不局限于由组成型启动子所驱动的YRP5多肽编码核酸的表达。
所述组成型启动子优选是中等强度的启动子。更优选地,其为植物来源的启动子,例如GOS2启动子或基本相同长度且具有基本相同的表达模式的启动子(功能等价启动子),更优选启动子是来自稻的GOS2启动子。甚至更优选,组成型启动子由与SEQ ID NO:189基本上相似的核酸序列表示,最优选组成型启动子如SEQ ID NO:189所示。有关组成型启动子的其他实例参见本文中“定义”部分。
任选的,可以在引入植物的构建体中使用一个或多个终止子序列。优选,构建体包含含有与SEQ ID NO:189基本相似的(GOS2)启动子和编码YRP5多肽的核酸的表达盒。
关于CK1多肽,应当清楚,本发明的实施并不局限于SEQ ID NO:194所示的CK1多肽编码核酸,而且本发明的实施也不局限于由组成型启动子所驱动的CK1多肽编码核酸的表达。
所述组成型启动子优选是中等强度的启动子。更优选地,其为植物来源的启动子,例如GOS2启动子或基本相同长度且具有基本相同的表达模式的启动子(功能等价启动子),更优选启动子是来自稻的GOS2启动子。甚至更优选,组成型启动子由与SEQ ID NO:272基本上相似的核酸序列表示,最优选组成型启动子如SEQ ID NO:272所示。有关组成型启动子的其他实例参见本文中“定义”部分。
任选的,可以在引入植物的构建体中使用一个或多个终止子序列。优选,构建体包含含有与SEQ ID NO:272基本相似的GOS2启动子和编码CK1多肽的核酸的表达盒。
关于bHLH12-样多肽,应当清楚,本发明的实施并不局限于SEQ IDNO:279所示的bHLH12-样多肽编码核酸,而且本发明的实施也不局限于由组成型启动子所驱动的bHLH12-样多肽编码核酸的表达。
所述组成型启动子优选是中等强度的启动子。更优选地,其为植物来源的启动子,例如GOS2启动子或基本相同长度且具有基本相同的表达模式的启动子(功能等价启动子),更优选启动子是来自稻的GOS2启动子。甚至更优选,组成型启动子由与SEQ ID NO:357基本上相似的核酸序列表示,最优选组成型启动子如SEQ ID NO:357所示。有关组成型启动子的其他实例参见本文中“定义”部分。
任选的,可以在引入植物的构建体中使用一个或多个终止子序列。优选,构建体包含含有与SEQ ID NO:357基本相似的GOS2启动子和编码bHLH12-样多肽的核酸的表达盒。
关于ADH2多肽,应当清楚,本发明的实施并不局限于SEQ ID NO:412或SEQ ID NO:414所示的ADH2多肽编码核酸,而且本发明的实施也不局限于由种子特异性启动子所驱动的ADH2多肽编码核酸的表达。
所述种子特异性启动子优选来自稻。更优选地,种子特异性启动子由与SEQ ID NO:458基本类似的核酸序列所表示或者是基本相同长度且具有基本相同的表达模式的启动子(功能等价启动子),最优选种子特异性启动子如SEQ ID NO:458所示。有关种子特异性启动子的其他实例参见本文中“定义”部分。
任选的,可以在引入植物的构建体中使用一个或多个终止子序列。优选,构建体包含含有与SEQ ID NO:458基本相似的推定的蛋白酶抑制剂启动子和编码ADH2多肽的核酸的表达盒。
关于GCN5多肽,应当清楚,本发明的实施并不局限于SEQ ID NO:459所示的GCN5-样多肽编码核酸,而且本发明的实施也不局限于由组成型启动子或根-特异性启动子所驱动的GCN5-样多肽编码核酸的表达。
所述组成型启动子优选是中等强度的启动子。更优选地,其为植物来源的启动子,例如GOS2启动子或基本相同长度且具有基本相同的表达模式的启动子(功能等价启动子),更优选启动子是来自稻的GOS2启动子。甚至更优选,组成型启动子由与SEQ ID NO:513基本上相似的核酸序列表示,最优选组成型启动子如SEQ ID NO:513所示。有关组成型启动子的其他实例参见本文中“定义”部分。
任选的,可以在引入植物的构建体中使用一个或多个终止子序列。优选,构建体包含含有与SEQ ID NO:513基本相似的GOS2启动子和编码GCN5-样多肽的核酸的表达盒。
另外的调控元件可以包括转录和翻译的增强子。本领域技术人员会知道适合用于实施本发明的终止子和增强子的序列。如“定义”部分所说明的那样,也可以向5’非翻译区(UTR)或在编码序列中加入内含子序列,来增加在胞质中累积的成熟信使的量。其他控制序列(除启动子、增强子、沉默子、内含子序列、3’UTR和/或5’UTR区域之外)可以有蛋白质和/或RNA稳定元件。这类序列为本领域技术人员公知或者可以容易地获得。
本发明的遗传构建体可以还包括为在特定细胞类型中维持和/或复制所需的复制起点序列。一个实例是需要将遗传构建体作为染色体外遗传元件(如质粒或粘粒分子)在细菌细胞中维持的情况。优选的复制起点包括但不限于f1-ori和colE1。
为检测本发明方法中所用核酸序列的成功转移和/或选择含有这些核酸的转基因植物,最好使用标记基因(或报告基因)。因此,遗传构建体可以任选地含有可选择标记基因。可选择标记在本文“定义”部分有更详细的说明。一旦不再需要标记基因可从转基因细胞将其除去或切除。用于标记去除的技术在本领域内是已知的,有用的技术描述于上文中定义部分。
本发明还提供了产生相对于对照植物具有增强的产量相关性状的转基因植物的方法,包括在植物中引入和表达编码如前文所定义的LDOX多肽、或YRP5多肽或CK1多肽或bHLH12-样多肽或ADH2多肽或GCN5-样多肽的任何核酸。
更具体地,本发明提供了产生具有增强的产量相关性状,特别是增加的生物量、增加的种子产量和/或增加的早期萌发势的转基因植物的方法,所述方法包括:
(i)向植物或植物细胞中引入和表达编码LDOX多肽的核酸;和
(ii)在促进植物生长和发育的条件下培养所述植物细胞。
(i)中的核酸序列可以为任何能够编码如本文所定义的LDOX多肽的核酸。
更具体地,本发明提供了产生具有增强的非生物胁迫耐受性,特别是增加的(轻度)干旱耐受性的转基因植物的方法,所述方法包括:
(i)向植物或植物细胞中引入和表达YRP5多肽编码核酸;和
(ii)在非生物胁迫条件下培养所述植物细胞。
(i)中的核酸可以为任何能够编码如本文定义的YRP5多肽的核酸。
更具体地,本发明还提供了产生具有增强的产量相关性状,特别是增加的(种子)产量的转基因植物的方法,所述方法包括:
(i)向植物或植物细胞中引入和表达编码CK1多肽、或bHLH12-样多肽或ADH2多肽或GCN5-样多肽的核酸;和
(ii)在促进植物生长和发育的条件下培养所述植物细胞。
(i)中的核酸序列可以为任何能够编码如本文所定义的CK1多肽、或bHLH12-样多肽或ADH2多肽或GCN5-样多肽的核酸。
所述核酸可以直接导入植物细胞或导入植物自身(包括导入组织、器官或植物的任何其他部分)。根据本发明的优选特征,该核酸优选地通过转化作用导入植物。术语“转化”在本文的“定义”部分中更详细地描述。
遗传修饰的植物细胞可以通过技术人员熟悉的全部方法再生。合适的方法可以在上文提及的S.D.Kung和R.Wu,Potrykus或
Figure BDA0000128813510001071
和Willmitzer的出版物中找到。
通常在转化后,对植物细胞或细胞群体选择一个或多个标记的存在性,其中所述标记由随同目的基因一起共转移的植物可表达基因编码,随后将转化材料再生成完整植物。为了选择转化植物,在所述转化中获得的植物材料原则上经历选择性条件,从而转化植物可以与非转化植物区分。例如,可以将以上述方式获得的种子播种,并且在初始培育期间后,通过喷洒进行合适的选择。另一种可能性在于根据需要消毒后,在使用合适选择剂的琼脂板上培育种子,从而仅转化的种子可以长成植物。备选地,对所述转化植物筛选选择标记(如上文所述的选择标记)的存在性。
在DNA转移和再生后,推定转化的植物也可以例如使用DNA印迹分析对目的基因的存在性、拷贝数和/或基因组构造进行评价。备选地或额外地,新导入的DNA的表达水平可以使用RNA印迹分析和/或蛋白质印迹分析或这两种分析法监测,这两项技术均是本领域普通技术人员熟知的。
产生的转化植物可以通过多种方法繁殖,如通过克隆繁殖法或经典育种技术。例如,第一世代(或T1)转化植物可以进行自交并且选择纯合的第二世代(或T2)转化体,并且T2植物随后可以通过经典育种技术进一步繁殖。产生的转化生物可以采取多种形式。例如,它们可以是转化细胞和非转化细胞的嵌合体;克隆性转化体(例如,被转化以含有表达盒的全部细胞);转化组织和非转化组织的移植体(例如在植物中,与未转化接穗嫁接的转化根状茎)。
本发明明确地扩展至由本文中所述的任意方法产生的任意植物细胞或植物,并扩展至全部植物部分及其繁殖体。本发明进一步扩展以包括已经由前述任意方法产生的原代转化或转染细胞、组织、器官或完整植物的子代,唯一要求是子代表现与如本发明方法中的亲代产生的那些相同的基因型和/或表型特征。
本发明也包括含有编码如本文以上所定义的LDOX多肽、或YRP5多肽、或CK1多肽或bHLH12-样多肽或ADH2多肽或GCN5-样多肽的分离核酸的宿主细胞。本发明的优选宿主细胞是植物细胞。对于本发明方法中所用核酸或载体、表达盒或构建体或载体的宿主植物原则上有利地是能够合成在本发明方法中所使用多肽的全部植物。
本发明的方法有利地适用于任意植物。在本发明方法中特别有用的植物包括属于植物界超家族、尤其单子叶和双子叶植物的全部植物,包括饲用或饲料豆科植物、观赏植物、粮食作物、树或灌木。根据本发明的一个优选实施方案,所述植物是作物植物。作物植物的例子包括菊苣、胡萝卜、木薯、车轴草、大豆、甜菜(beet)、糖萝卜(sugar beet)、向日葵、卡诺拉油菜(canola)、苜蓿、油菜、亚麻、棉花、番茄、马铃薯和烟草。还优选地,所述植物是单子叶植物。单子叶植物的例子包括甘蔗。更优选地,所述植物是谷类。谷类的例子包括稻、玉米、小麦、大麦、谷子(millet)、裸麦(rye)、黑小麦(triticale)、高粱、二粒小麦、斯佩尔特小麦(spelt)、黑麦属(secale)、单粒小麦、埃塞俄比亚画眉草(teff)、蜀黍(milo)和燕麦。
本发明也扩展至植物的可收获部分如,但不限于种子、叶、果实、花、茎、根、根状茎、块茎和球茎,所述可收获部分包括编码LDOX多肽、或YRP5多肽、或CK1多肽或bHLH12-样多肽或ADH2多肽或GCN5-样多肽的重组核酸。本发明进一步涉及了源自、优选直接源自此种植物的可收获部分的产品,如干燥颗粒或粉末、油、脂肪和脂肪酸、淀粉或蛋白质。
根据本发明的优选的特征,受调节的表达是增加的表达。用于增加核酸或基因或基因产物的表达的方法良好的记载在本领域中,且定义章节中提供了实例。
如上所述,用于调节编码LDOX多肽、或YRP5多肽、或CK1多肽或bHLH12-样多肽或ADH2多肽或GCN5-样多肽的核酸的表达的优选的方法,是通过在植物中导入和表达编码LDOX多肽、或YRP5多肽、或CK1多肽或bHLH12-样多肽或ADH2多肽或GCN5-样多肽的核酸;然而,还可以利用其它普遍已知的技术获得实施方法的效果,即,增强产量相关性状,包括但不限于T-DNA活化标签、TILLING、同源重组。定义章节中提供了这些技术的说明。
本发明还涵盖了如本文所述的编码LDOX多肽、或CK1多肽或bHLH12-样多肽或ADH2多肽或GCN5-样多肽的核酸的用途,以及这些LDOX多肽在植物中增强任意上述产量相关性状的用途。
本发明还涵盖了如本文所述的编码YRP5多肽的核酸的用途,以及这些YRP5多肽在增强植物中任何前述非生物胁迫中的用途。
编码本文所述的LDOX多肽、或YRP5多肽、或CK1多肽或bHLH12-样多肽或ADH2多肽或GCN5-样多肽的核酸、或LDOX多肽、或YRP5多肽、或CK1多肽或bHLH12-样多肽或ADH2多肽或GCN5-样多肽自身,可用于鉴别DNA标记的育种程序中,所述标记与编码LDOX多肽、或YRP5多肽、或CK1多肽或bHLH12-样多肽或ADH2多肽或GCN5-样多肽的基因遗传连锁。核酸/基因、或者LDOX多肽、或YRP5多肽、或CK1多肽或bHLH12-样多肽或ADH2多肽或GCN5-样多肽,自身可用于定义分子标记。然后,该DNA或蛋白质标记可用于育种程序中选择如上文定义的在本发明方法中具有增强的产量相关性状和/或增强的非生物胁迫耐受性的植物。
编码LDOX多肽、或YRP5多肽、或CK1多肽或bHLH12-样多肽或ADH2多肽或GCN5-样多肽的基因/核酸的等位变体也可以用于标记辅助的育种程序中。此类育种程序有时需要使用例如EMS诱变法通过对植物进行诱变处理而导入等位变异;备选地,所述程序可以从收集并非故意造成的所谓“自然”源性等位变体开始。随后进行等位变体的鉴定,例如通过PCR法。此后是步骤:选择所讨论和导致增加的产量的序列的优异等位变体。选择一般通过监测含有所讨论序列的不同等位变体的植物的生长性能而实施。生长性能可以在温室或在田间监测。其他任选步骤包括将其中鉴定到优异等位变体的植物与另一种植物杂交。这可能用来例如产生感兴趣的表型特征组合。
编码LDOX多肽、或YRP5多肽、或CK1多肽或bHLH12-样多肽或ADH2多肽或GCN5-样多肽的核酸也可以作为探针用于遗传地或物理地绘制所述探针构成其一部分的基因并且用作与这些基因连锁的性状的标记。此类信息可以用于植物育种中,以开发具有所希望表型的品系。编码LDOX多肽、或YRP5多肽、或CK1多肽或bHLH12-样多肽或ADH2多肽或GCN5-样多肽的核酸的这种用途仅需要具有至少15个核苷酸长度的核酸序列。编码LDOX多肽、或YRP5多肽、或CK1多肽或bHLH12-样多肽或ADH2多肽或GCN5-样多肽的核酸可以用作限制性片段长度多态性(RFLP)标记。限制性消化的植物基因组DNA的Southern印迹物(Sambrook J,Fritsch EF和Maniatis T(1989)Molecular Cloning,ALaboratory Manual)可以用编码LDOX多肽、或YRP5多肽、或CK1多肽或bHLH12-样多肽或ADH2多肽或GCN5-样多肽的核酸探测。所得的条带图式随后可以使用计算机程序如MapMaker(Lander等人(1987)Genomics 1:174-181)进行遗传分析以构建遗传图。此外,该核酸可以用来探测含有一组个体的限制性核酸内切酶处理的基因组DNA的Southern印迹物,其中所述的一组个体代表具有定义的遗传杂交的亲代和子代。DNA多态性的分离是明显的并用来计算编码LDOX多肽、或YRP5多肽、或CK1多肽或bHLH12-样多肽或ADH2多肽或GCN5-样多肽的核酸在先前使用这个群体获得的遗传图中的位置(Botstein等人(1980)Am.J.Hum.Genet.32:314-331)。
在Bernatzky和Tanksley(1986)Plant Mol.Biol.Reporter 4:37-41中描述了植物基因来源的探针的产生及其在遗传作图中的用途。许多出版物描述了使用以上概述的方法学或其变例对特定cDNA克隆的遗传作图。例如,F2互交群、回交群、随机交配群、邻近纯合系和其他个体群体可以用于作图。此类方法学是本领域技术人员熟知的。
在Bernatzky和Tanksley(1986)Plant Mol.Biol.Reporter 4:37-41中描述了植物基因来源的探针的产生及其在遗传作图中的用途。许多出版物描述了使用以上概述的方法学或其变例对特定cDNA克隆的遗传作图。例如,F2互交群、回交群、随机交配群、邻近纯合系和其他个体群体可以用于作图。此类方法学是本领域技术人员熟知的。
核酸探针也可以用于物理作图(即序列在物理图上的排列;见Hoheisel等在:Non-mammalian Genomic Analyasis:A Practical Guide,Academicpress 1996,第319-346页及其中引用的参考文献)。
在另一个实施方案中,所述核酸探针可以在直接荧光原位杂交(FISH)作图法(Trask(1991)Trends Genet.7:149-154)中使用。尽管当前的FISH作图法支持使用大的克隆(几个kb至几百个kb;见Laan等人(1995)Genome Res.5:13-20),然而灵敏度的改善可以允许使用更短探针进行FISH作图。
用于遗传作图及物理作图的多种基于核酸扩增的方法可以使用所述核酸而实施。例子包括等位基因特异性扩增法(Kazazian(1989)J.Lab.Clin.Med 11:95-96)、PCR扩增片段的多态性(CAPS;Sheffield等人(1993)Genomics 16:325-332)、等位基因特异性连接(Landegren等人(1988)Science 241:1077-1080)、核苷酸延伸反应(Sokolov(1990)Nucleic acid Res.18:3671)、放射杂交作图(Walter等人(1997)Nat.Genet.7:22-28)和Happy作图法(Dear和Cook(1989)Nucleic acid Res.17:6795-6807)。对于这些方法,使用一种核酸的序列来设计并产生在扩增反应或在引物延伸反应中使用的引物对。此类引物的设计是本领域技术人员熟知的。在使用基于PCR遗传作图的方法中,可能需要在对应于当前核酸序列的区域中鉴定作图交叉的亲代之间的DNA序列差异。但是,这通常对作图法而言不是必需的。
如前文所述,本发明的方法产生了具有增强的产量相关性状和/或非生物胁迫耐受性的植物。这些性状也可以与经济上有利的其他性状组合,如其他的产量增强性状和/或其他非生物或生物胁迫耐受性增强性状、针对其他非生物胁迫和生物胁迫的耐受性、增强的产量相关性状、调节多种构造性特征和/或生物化学特征和/或生理学特征的性状。
项目
1.无色花色素双加氧酶(LDOX)多肽
1、相对于对照植物,在植物中增强产量相关性状的方法,包括在植物中调节编码无色花色素双加氧酶(LDOX)多肽的核酸的表达,其中所述LDOX多肽包含异青霉素N合酶结构域(PRINTS进入PR00682)和2OG-Fe(II)加氧酶结构域(PFAM进入PF03171)。
2、项1的方法,其中所述LDOX多肽包括一个或多个基序1至9(SEQID NO:173至SEQ ID NO:181)。
3、项1或2的方法,其中所述调节的表达通过在植物中导入和表达编码LDOX多肽的核酸来实现。
4、项1-3的任一项的方法,其中所述编码LDOX多肽的核酸编码表A1中列出的任一种蛋白质,或者是此类核酸的一部分,或者是能够与此类核酸杂交的核酸。
5、项1-4的任一项的方法,其中所述核酸序列编码表A1中给出的任意蛋白质的直向同源物或旁系同源物。
6、前述任一项的方法,其中所述增强的产量相关性状包括相对于对照植物增加的早期萌发势和增加的产量,优选的增加的生物量和/或增加的种子产量。
7、项1-6的任一项的方法,其中所述增强的产量相关性状是在氮缺乏的条件下获得的。
8、项3-7的任一项的方法,其中所述核酸与组成型启动子,优选的与GOS2启动子,最优选的与来自稻的GOS2启动子有效连接。
9、项1-8的任一项的方法,其中所述编码LDOX多肽的核酸是植物来源的,优选的来自双子叶植物,还优选的来自十字花科(Brassicaceae),更优选的来自拟南芥属(Arabidopsis),最优选的来自拟南芥(Arabidopsisthaliana)。
10、通过项1-9的任一项的方法可获得的植物或其部分,包括种子,其中所述植物或其部分包含编码LDOX多肽的重组核酸。
11、构建体,包含:
(i)编码如项1或2定义的LDOX多肽的核酸;
(ii)能够驱动(a)的核酸序列表达的一种或多种控制序列;和任选的
(iii)转录终止序列。
12、项11的构建体,其中一种所述控制序列是组成型启动子,优选的是GOS2启动子,最优选的是来自稻的GOS2启动子。
13、项11或12的构建体在方法中的用途,所述方法用于产生相对于对照植物具有增加的早期萌发势和增加的产量,特别是增加的生物量和/或增加的种子产量的植物。
14、用项11或12的构建体转化的植物、植物部分或植物细胞。
15、用于产生转基因植物的方法,所述转基因植物相对于对照植物具有增加的早期萌发势和增加的产量,特别是增加的生物量和/或增加的种子产量,包括:
(i)在植物中导入和表达编码如项1或2定义的LDOX多肽的核酸;和
(ii)在促进植物生长和发育的条件下培养植物细胞。
16、相对于对照植物,具有增加的早期萌发势和增加的产量,特别是增加的生物量和/或增加的种子产量的转基因植物或源自所述转基因植物的转基因植物细胞,所述转基因植物是由编码如项1或2定义的LDOX多肽的核酸的受调节的表达产生的。
17、项10、14或16的转基因植物,或源自它们的转基因植物细胞,其中所述植物是作物植物或单子叶植物或谷类,例如稻、玉米、小麦、大麦、谷子(millet)、裸麦(rye)、黑小麦(triticale)、高粱、二粒小麦(emmer)、斯佩尔特小麦(spelt)、黑麦属(secale)、单粒小麦、埃塞俄比亚画眉草(teff)、蜀黍(milo)和燕麦。
18、项17的植物的可收获的部分,其中所述可收获的部分优选的是枝条生物量、根生物量和/或种子。
19、源自项17的植物和/或项18的植物的可收获的部分的产物。
20、编码LDOX多肽的核酸在相对于对照植物,在植物中增加产量,特别是增加种子产量和/或枝条生物量中的用途。
2.YRP5多肽
1、在植物中增强非生物胁迫耐受性的方法,这是通过在植物中调节编码由SEQ ID NO:186或SEQ ID NO:188所表示的多肽或它们之一的直向同源物或旁系同源物的核酸的表达。
2、项1的方法,其中所述调节的表达通过在植物中导入和表达编码YRP2多肽的核酸来实现。
3、项1或2的方法,其中所述编码YRP5多肽的核酸编码表A2中列出的任一种蛋白质,或者是此类核酸的一部分,或者是能够与此类核酸杂交的核酸。
4、项1-3的任一项的方法,其中所述核酸序列编码表A2中给出的任意蛋白质的直向同源物或旁系同源物。
5、项3或4的方法,其中所述核酸与组成型启动子,优选的与GOS2启动子,最优选的与来自稻的GOS2启动子有效连接。
6、项1-5的任一项的方法,其中所述编码YRP5多肽的核酸是Populustrichocarpa或拟南芥(Arabidopsis thaliana)的。
7、通过项1-6的任一项的方法可获得的植物或其部分,包括种子,其中所述植物或其部分包含编码YRP5多肽的重组核酸。
8、构建体,包含:
(i)编码如项1或2定义的YRP5多肽的核酸;
(ii)能够驱动(a)的核酸序列表达的一种或多种控制序列;和任选的
(iii)转录终止序列。
9、项8的构建体,其中一种所述控制序列是组成型启动子,优选的是GOS2启动子,最优选的是来自稻的GOS2启动子。
10、项8或9的构建体在方法中的用途,所述方法用于产生相对于对照植物具有增加的非生物胁迫耐受性的植物。
11、用项8或9的构建体转化的植物、植物部分或植物细胞。
12、用于产生转基因植物的方法,所述转基因植物相对于对照植物具有增加的非生物胁迫耐受性,包括:
(i)在植物中导入和表达编码YRP5多肽的核酸;和
(ii)在促进非生物胁迫的条件下培养植物细胞。
13、相对于对照植物,具有非生物胁迫耐受性的转基因植物或源自所述转基因植物的转基因植物细胞,所述转基因植物是由编码YRP5多肽的核酸的受调节的表达产生的。
14、项7、11或13的转基因植物,或源自它们的转基因植物细胞,其中所述植物是作物植物或单子叶植物或谷类,例如稻、玉米、小麦、大麦、谷子(millet)、裸麦(rye)、黑小麦(triticale)、高粱、甘蔗、二粒小麦(emmer)、斯佩尔特小麦(spelt)、黑麦属(secale)、单粒小麦、埃塞俄比亚画眉草(teff)、蜀黍(milo)和燕麦。
15、项14的植物的可收获的部分,其中所述可收获的部分优选的是枝条生物量和/或种子。
16、源自项14的植物和/或项15的植物的可收获的部分的产物。
17、编码YRP5多肽的核酸在相对于对照植物增加产量,特别是增加非生物胁迫耐受性中的用途。
3.I型酪蛋白激酶(CK1)多肽
1、相对于对照植物,在植物中增强产量相关性状的方法,包括在植物中调节编码酪蛋白激酶1,CK1多肽的核酸的表达。
2、项1的方法,其中所述CK1多肽包含蛋白质基序,所述基序与下列一个或多个基序具有50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性:
(i)基序13:KANQVY(IV)ID(YF)GLAKKYRDLQTH(KR)HIPYRENKNLTGTARYASVNTHLG(VI)EQ(SEQ ID NO:276),
(ii)基序14:CKSYPSEF(VTI)SYFHYCRSLRFEDKPDYSYLKRLFRDLFIREGYQFDYVFDW(SEQ ID NO:277),
(iii)基序15:PSLEDLFNYC(NS)RK(FL)(ST)LKTVLMLADQ(LM)INRVEYMHSRGFLHRDIKPDNFLM(SEQ ID NO:278)
其中括号之间的氨基酸残基代表在该位置备选的氨基酸。
3、项1或2的方法,其中所述调节的表达通过在植物中导入和表达编码CK1多肽的核酸来实现。
4、项1-3的任一项的方法,其中所述编码CK1多肽的核酸编码表A3中列出的任一种蛋白质,或者是此类核酸的一部分,或者是能够与此类核酸杂交的核酸。
5、项1-4的任一项的方法,其中所述核酸序列编码表A3中给出的任意蛋白质的直向同源物或旁系同源物。
6、前述任一项的方法,其中所述增强的产量相关性状包括相对于对照植物增加的产量,优选的增加的生物量和/或增加的种子产量。
7、项1-6的任一项的方法,其中所述增强的产量相关性状在非胁迫条件下获得。
8、项1-6的任一项的方法,其中所述增强的产量相关性状是在干旱胁迫、盐胁迫或氮缺乏的条件下获得的。
9、项3-8的任一项的方法,其中所述核酸与组成型启动子,优选的与GOS2启动子,最优选的与来自稻的GOS2启动子有效连接。
10、项1-9的任一项的方法,其中所述编码CK1多肽的核酸是植物来源的,优选的来自双子叶植物,还优选的来自十字花科(Brassicaceae),更优选的来自拟南芥属(Arabidopsis),最优选的来自拟南芥(Arabidopsisthaliana)。
11、通过项1-10的任一项的方法可获得的植物或其部分,包括种子,其中所述植物或其部分包含编码CK1多肽的重组核酸。
12、构建体,包含:
(i)编码如项1或2定义的CK1多肽的核酸;
(ii)能够驱动(a)的核酸序列表达的一种或多种控制序列;和任选的
(iii)转录终止序列。
13、项12的构建体,其中一种所述控制序列是组成型启动子,优选的是GOS2启动子,最优选的是来自稻的GOS2启动子。
14、项12或13的构建体在方法中的用途,所述方法用于产生相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量的植物。
15、用项12或13的构建体转化的植物、植物部分或植物细胞。
16、用于产生转基因植物的方法,所述转基因植物相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量,包括:
(i)在植物中导入和表达编码如项1或2定义的CK1多肽的核酸;和
(ii)在促进植物生长和发育的条件下培养植物细胞。
17、相对于对照植物,具有增加的产量,特别是增加的生物量和/或增加的种子产量的转基因植物或源自所述转基因植物的转基因植物细胞,所述转基因植物是由编码如项1或2定义的CK1多肽的核酸的受调节的表达产生的。
18、项11、15或17的转基因植物,或源自它们的转基因植物细胞,其中所述植物是作物植物或单子叶植物或谷类,例如稻、玉米、小麦、大麦、谷子(millet)、裸麦(rye)、黑小麦(triticale)、高粱、二粒小麦(emmer)、斯佩尔特小麦(spelt)、黑麦属(secale)、单粒小麦、埃塞俄比亚画眉草(teff)、蜀黍(milo)和燕麦。
19、项18的植物的可收获的部分,其中所述可收获的部分优选的是枝条生物量和/或种子。
20、源自项18的植物和/或项19的植物的可收获的部分的产物。
21、编码CK1多肽的核酸在相对于对照植物,在植物中增加产量,特别是增加种子产量和/或枝条生物量中的用途。
22、选自以下的分离的核酸分子:
(i)由SEQ ID NO:210、212、216、220、228和268中任一所表示的核酸;
(ii)由SEQ ID NO:210、212、216、220、228和268中任一所表示的核酸的互补体;
(iii)编码由SEQ ID NO:211、213、217、221、229和269中任一项所表示的多肽的核酸,其优选作为遗传密码简并性的结果,所述分离的核酸可以衍生自由SEQ ID NO:211、213、217、221、229和269中任一项所表示的多肽序列并且还优选地赋予相对于对照植物增强的产量相关性状;
(iv)核酸,其以增加的优选顺序与表A3的任何核酸序列具有至少30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性,并且还优选地赋予相对于对照植物增强的产量相关性状;
(v)在严格杂交条件下与(i)至(iv)的核酸分子杂交并且优选地赋予相对于对照植物增强的产量相关性状的核酸分子;
(vi)编码钙网蛋白多肽并且优选地赋予相对于对照植物增强的产量相关性状的核酸,所述多肽以增加的优选顺序与SEQ ID NO:211、213、217、221、229和269中任一项所表示的氨基酸序列以及表A3中任何其它氨基酸序列具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性。
23、分离的多肽,所述多肽选自:
(iv)SEQ ID NO:211、213、217、221、229和269中任一项所表示的氨基酸序列;
(v)氨基酸序列,其与SEQ ID NO:211、213、217、221、229和269中任一项所表示的氨基酸序列以及表A3中任何其它氨基酸序列以增加的优选顺序具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性并且优选地赋予相对于对照植物增强的产量相关性状;
(vi)上述(i)或(ii)中给出的任何氨基酸序列的衍生物。
4.碱性螺旋环螺旋组12(bHLH12-样)多肽
1、相对于对照植物,在植物中增强产量相关性状的方法,包括在植物中调节编码碱性螺旋环螺旋组12,bHLH12-样多肽的核酸的表达。
2、项1的方法,其中所述bHLH12-样多肽包含蛋白质基序,所述基序与一个或多个的基序16至19(SEQ ID NO:404至407)具有50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性。
3、项1或2的方法,其中所述调节的表达通过在植物中导入和表达编码bHLH12-样多肽的核酸来实现。
4、项1-3的任一项的方法,其中所述编码bHLH12-样多肽的核酸编码表A4中列出的任一种蛋白质,或者是此类核酸的一部分,或者是能够与此类核酸杂交的核酸。
5、项1-4的任一项的方法,其中所述核酸序列编码表A4中给出的任意蛋白质的直向同源物或旁系同源物。
6、前述任一项的方法,其中所述增强的产量相关性状包括相对于对照植物增加的产量,优选的增加的生物量和/或增加的种子产量。
7、项1-6的任一项的方法,其中所述增强的产量相关性状在非胁迫条件下获得。
8、项1-6的任一项的方法,其中所述增强的产量相关性状是在干旱胁迫、盐胁迫或氮缺乏的条件下获得的。
9、项3-8的任一项的方法,其中所述核酸与组成型启动子,优选的与GOS2启动子,最优选的与来自稻的GOS2启动子有效连接。
10、项1-9的任一项的方法,其中所述编码bHLH12-样多肽的核酸是植物来源的,优选的来自双子叶植物,还优选的来自十字花科(Brassicaceae),更优选的来自拟南芥属(Arabidopsis),最优选的来自拟南芥(Arabidopsis thaliana)。
11、通过项1-10的任一项的方法可获得的植物或其部分,包括种子,其中所述植物或其部分包含编码bHLH12-样多肽的重组核酸。
12、构建体,包含:
(i)编码如项1或2定义的bHLH12-样多肽的核酸;
(ii)能够驱动(a)的核酸序列表达的一种或多种控制序列;和任选的
(iii)转录终止序列。
13、项12的构建体,其中一种所述控制序列是组成型启动子,优选的是GOS2启动子,最优选的是来自稻的GOS2启动子。
14、项12或13的构建体在方法中的用途,所述方法用于产生相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量的植物。
15、用项12或13的构建体转化的植物、植物部分或植物细胞。
16、用于产生转基因植物的方法,所述转基因植物相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量,包括:
(i)在植物中导入和表达编码如项1或2定义的bHLH12-样多肽的核酸;和
(ii)在促进植物生长和发育的条件下培养植物细胞。
17、相对于对照植物,具有增加的产量,特别是增加的生物量和/或增加的种子产量的转基因植物或源自所述转基因植物的转基因植物细胞,所述转基因植物是由编码如项1或2定义的bHLH12-样多肽的核酸的受调节的表达产生的。
18、项11、15或17的转基因植物,或源自它们的转基因植物细胞,其中所述植物是作物植物或单子叶植物或谷类,例如稻、玉米、小麦、大麦、谷子(millet)、裸麦(rye)、黑小麦(triticale)、高粱、二粒小麦(emmer)、斯佩尔特小麦(spelt)、黑麦属(secale)、单粒小麦、埃塞俄比亚画眉草(teff)、蜀黍(milo)和燕麦。
19、项18的植物的可收获的部分,其中所述可收获的部分优选的是枝条生物量和/或种子。
20、源自项18的植物和/或项19的植物的可收获的部分的产物。
21、编码bHLH12-样多肽的核酸在相对于对照植物,在植物中增加产量,特别是增加种子产量和/或枝条生物量中的用途。
22、选自以下的分离的核酸分子:
(i)由SEQ ID NO:279和335中任一所表示的核酸;
(ii)由SEQ ID NO:279和335中任一所表示的核酸的互补体;
(iii)编码由SEQ ID NO:280和336中任一项所表示的多肽的核酸,其优选作为遗传密码简并性的结果,所述分离的核酸可以衍生自由SEQ ID NO:280和336中任一项所表示的多肽序列并且还优选地赋予相对于对照植物增强的产量相关性状;
(iv)核酸,其以增加的优选顺序与表A4的任何核酸序列具有至少30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性,并且还优选地赋予相对于对照植物增强的产量相关性状;
(v)在严格杂交条件下与(i)至(iv)的核酸分子杂交并且优选地赋予相对于对照植物增强的产量相关性状的核酸分子;
(vi)编码bHLH12-样多肽并且优选地赋予相对于对照植物增强的产量相关性状的核酸,所述多肽以增加的优选顺序与SEQ ID NO:280和336中任一项所表示的氨基酸序列以及表A4中任何其它氨基酸序列具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性。
23、分离的多肽,所述多肽选自:
(i)SEQ ID NO:280和336中任一项所表示的氨基酸序列;
(ii)氨基酸序列,其与SEQ ID NO:280和336中任一项所表示的氨基酸片列以及表A4中任何其它氨基酸序列以增加的优选顺序具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性并且优选地赋予相对于对照植物增强的产量相关性状;
(iii)上述(i)或(ii)中给出的任何氨基酸序列的衍生物。
5.醇脱氢酶(ADH2)多肽
1、相对于对照植物,在植物中增强产量相关性状的方法,包括在植物中调节编码ADH2多肽的核酸的表达,其中所述ADH2多肽包含:
(i)GROES结构域(结构域1):
AGEVRVKILFTALCHTDHYTWSGKDPEGLFPCILGHEAAGVVESVGEGVTEVQPGDHVIPCYQAECKECKFCKSGKTNLCGKVRGATGVGVMMNDMKSRFSVNGKPIYHFTGTSTFSQYTVVHDVSVAKI,或以增加的优选顺序与结构域1具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或更多序列同一性的结构域;和
(ii)锌结合脱氢酶结构域(结构域2):
AGSIVAVFGLGTVGLAVAEGAKAAGASRIIGIDIDNKKFDVAKNFGVTEFVNPKDHDKPIQQVLVDLTDGGVDYSFECIGNVSVMRAALECCHKDWGTSVIVGVAASGQEIATRPFQLVTGRVWKGTAFGGFKSRTQVPWLVD,或与结构域2以增加的优选顺序具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或更多的序列同一性的结构域;以及任选地还有
(iii)DUF61结构域(结构域3):VDKYMNKEVK、或与结构域3以增加的优选顺序具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或更多的序列同一性的结构域。
2、项1的方法,其中所述ADH2多肽包含一个或多个的基序20至30,或者与下述结构域III任何一个基序20至30以增加的优选顺序具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或更多的序列同一性的基序:
基序20:HYTWSGKDP(SEQ ID NO:445);
基序21:PCYQAECK(SEQ ID NO:446);
基序22:GKTNLCGKVRGATGVGVMMND(SEQ ID NO:447);
基序23:YHFMGTSTFSQYTVVHDVSVAKINPQAPLDKVCLLGCGVPTGLG(SEQID NO:448);
基序24:WNTAKVEAGSIVAVFGLGTVGLAVAEG(SEQ ID NO:449);
基序25:GASRIIGIDIDNKKFDVAKNFGVTEFVN(SEQ ID NO:450);
基序26:KDH DKPIQLVLVDIAD(SEQ ID NO:451);
基序27:SVRRAAEEC(SEQ ID NO:452);
基序28:WGTSVIVGVAASGQEIATRPFQLVTGRVWKGTAFGGF(SEQ ID NO:453);
基序29:KVDEYITH(SEQ ID NO:454);
基序30:MLKGESIRCIITM(SEQ ID NO:455)。
3、项1或2的方法,其中所述调节的表达通过在植物中导入和表达编码ADH2多肽的核酸来实现。
4、项1-3的任一项的方法,其中所述编码ADH2多肽的核酸编码表A5中列出的任一种蛋白质,或者是此类核酸的一部分,或者是能够与此类核酸杂交的核酸。
5、项1-4的任一项的方法,其中所述核酸序列编码表A5中给出的任意蛋白质的直向同源物或旁系同源物。
6、前述任一项的方法,其中所述增强的产量相关性状包括相对于对照植物增加的产量,优选的增加的生物量和/或增加的种子产量。
7、项1-6的任一项的方法,其中所述增强的产量相关性状是在非胁迫的条件下获得的。
8、项3-7的任一项的方法,其中所述核酸与种子特异性启动子,优选的与启动子,最优选的与来自稻的推定的蛋白酶抑制剂启动子有效连接。
9、项1-8的任一项的方法,其中所述编码ADH2多肽的核酸是植物来源的,优选的来自单子叶植物,还优选的来自甘蔗属(Saccharum),最优选的来自甘蔗(Saccharum officinarum)。
10、通过项1-9的任一项的方法可获得的植物或其部分,包括种子,其中所述植物或其部分包含编码ADH2多肽的重组核酸。
11、构建体,包含:
(i)编码如项1或2定义的ADH2多肽的核酸;
(ii)能够驱动(a)的核酸序列表达的一种或多种控制序列;和任选的
(iii)转录终止序列。
12、项11的构建体,其中一种所述控制序列是种子特异性启动子,优选的是推定的蛋白酶抑制剂启动子,最优选的是来自稻的推定的蛋白酶抑制剂启动子。
13、项11或12的构建体在方法中的用途,所述方法用于产生相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量的植物。
14、用项11或12的构建体转化的植物、植物部分或植物细胞。
15、用于产生转基因植物的方法,所述转基因植物相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量,包括:
(i)在植物中导入和表达编码如项1或2定义的ADH2多肽的核酸;和
(ii)在促进植物生长和发育的条件下培养植物细胞。
16、相对于对照植物,具有增加的产量,特别是增加的生物量和/或增加的种子产量的转基因植物或源自所述转基因植物的转基因植物细胞,所述转基因植物是由编码如项1或2定义的ADH2多肽的核酸的受调节的表达产生的。
17、项10、14或16的转基因植物,或源自它们的转基因植物细胞,其中所述植物是作物植物或单子叶植物或谷类,例如稻、玉米、小麦、大麦、谷子(millet)、裸麦(rye)、黑小麦(triticale)、高粱、二粒小麦(emmer)、斯佩尔特小麦(spelt)、黑麦属(secale)、单粒小麦、埃塞俄比亚画眉草(teff)、蜀黍(milo)和燕麦。
18、项17的植物的可收获的部分,其中所述可收获的部分优选的是枝条生物量和/或种子。
19、源自项17的植物和/或项18的植物的可收获的部分的产物。
20、编码如项1或2中所定义的ADH2多肽的核酸在相对于对照植物,在植物中增加产量,特别是增加种子产量和/或生物量中的用途。
6.GCN5-样多肽
1、相对于对照植物,在植物中增强产量相关性状的方法,包括在植物中调节编码GCN5-样多肽的核酸的表达,其中所述多肽包含具有PFam登录号PF00583和PF00439的两个结构域。
2.根据项1的方法,其中所述GCN5多肽还包含下列基序:
(i)基序31:LKF[VL]C[YL]SNDGVD[EQ]HM[IV]WL[IV]GLKNIFARQLPNMPKEYIVRLVMDR[ST]HKS[MV]M(SEQ ID NO:501),
(ii)基序32:FGEIAFCAITADEQVKGYGTRLMNHLKQ[HY]ARD[AV]DGLTHFLTYADNNAVGY(SEQ ID NO:502),
(iii)基序33:H[AP]DAWPFKEPVD[SA]RDVPDYYDIIKDP[IM]DLKT[MI]S[KR]RV[ED]SEQYYVTLEMFVA(SEQ ID NO:503)。
3.根据项1或2的方法,其中所述GCN5多肽还包含任何一个或多个下列基序:
(i)基序34:LKF[LV]C[YL]SNDG[VI]DEHM[IV]WL[IV]GLKNIFARQLPNMPKEYIVRLVMDR[TS]HKS[MV]M(SEQ ID NO:504),
(ii)基序35:FGEIAFCAITADEQVKGYGTRLMNHLKQHARD[AVM]DGLTHFLTYADNNAVGY(SEQ ID NO:505),
(iii)基序36:KQGFTKEI[THY][LF][DE]K[ED]RW[QH]GYIKDYDGGILMECKID[PQ]KLPY[TV]DL[AS]TMIRRQRQ(SEQ ID NO:506)。
4.根据项1至3的任一项的方法,其中所述GCN5多肽还包含任何一个或多个下列基序:
(i)基序37:LKFVC[LY]SND[GDS][VI]DEHM[VM][WCR]LIGLKNIFARQLPNMPKEYIVRL[VL]MDR[SGK]HKSVM(SEQ ID NO:507),
(ii)基序38:CAITADEQVKGYGTRLMNHLKQ[HFY]ARD[MV]DGLTHFLTYADNNAVGYF[IV]KQGF(SEQ ID NO:508),
(iii)基序39:W[QH]G[YF]IKDYDGG[IL]LMECKID[PQ]KL[PS]YTDLS[TS]MIR[RQ]QR[QK]AIDE[KR]IRELS NC[HQ][IN](SEQ ID NO:509)。
5.根据项1至4的任一项的方法,其中所述GCN5多肽还包含任何一个或多个下列基序:
(i)基序40:FLCYSNDGVDEHMIWLVGLKNIFARQLPNMPKEYIVRLVMDRTHKSMMVI(SEQ ID NO:510),
(ii)基序41:MNHLKQHARDADGLTHFLTYADNNAVGY[FL]VKQGFTKEIT[LF]DKERWQGYIK(SEQ ID NO:511),
(iii)基序42:IR[ED]LSNCHIVY[SP]GIDFQKKEAGIPRR[LT][MI]KPEDI[PQ]GLREAGWTPDQ[WL]GHSK(SEQ ID NO:512)。
6、项1或2的方法,其中所述调节的表达通过在植物中导入和表达编码如任何前项所定义的GCN5多肽的核酸来实现。
7、项1-6的任一项的方法,其中所述编码GCN5多肽的核酸编码表A6中列出的任一种蛋白质,或者是此类核酸的一部分,或者是能够与此类核酸杂交的核酸。
8、项1-7的任一项的方法,其中所述核酸序列编码表A6中给出的任意蛋白质的直向同源物或旁系同源物。
9、前述任一项的方法,其中所述增强的产量相关性状包括相对于对照植物增加的产量,优选的增加的生物量和/或增加的种子产量。
10、项1-9的任一项的方法,其中所述增强的产量相关性状是在非胁迫条件下获得的。
11、项1至9的任一项的方法,其中所述增强的产量相关性状是在干旱胁迫、盐胁迫或氮缺乏条件下获得的。
12、项6-8的任一项的方法,其中所述核酸与组成型启动子,优选的与GOS2启动子,最优选的与来自稻的GOS2启动子有效连接。
13、项1-12的任一项的方法,其中所述编码GCN5多肽的核酸是植物来源的,优选的来自双子叶植物,还优选的来自十字花科(Brassicaceae),更优选的来自拟南芥属(Arabidopsis),最优选的来自拟南芥(Arabidopsisthaliana)。
14、通过项1-13的任一项的方法可获得的植物或其部分,包括种子,其中所述植物或其部分包含编码GCN5多肽的重组核酸。
15、构建体,包含:
(i)编码如项1至5定义的GCN5多肽的核酸;
(ii)能够驱动(a)的核酸序列表达的一种或多种控制序列;和任选的
(iii)转录终止序列。
16、项15的构建体,其中一种所述控制序列是组成型启动子,优选的是GOS2启动子,最优选的是来自稻的GOS2启动子。
17、项15或16的构建体在方法中的用途,所述方法用于产生相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量的植物。
18、用项15或16的构建体转化的植物、植物部分或植物细胞。
19、用于产生转基因植物的方法,所述转基因植物相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量,包括:
(i)在植物中导入和表达编码如项1至5定义的GCN5多肽的核酸;和
(ii)在促进植物生长和发育的条件下培养植物细胞。
20、相对于对照植物,具有增加的产量,特别是增加的生物量和/或增加的种子产量的转基因植物或源自所述转基因植物的转基因植物细胞,所述转基因植物是由编码如项1至5定义的GCN5多肽的核酸的受调节的表达产生的。
21、项18、19或21的转基因植物,或源自它们的转基因植物细胞,其中所述植物是作物植物或单子叶植物或谷类,例如稻、玉米、小麦、大麦、谷子(millet)、裸麦(rye)、黑小麦(triticale)、高粱、二粒小麦(emmer)、斯佩尔特小麦(spelt)、黑麦属(secale)、单粒小麦、埃塞俄比亚画眉草(teff)、蜀黍(milo)和燕麦。
22、项21的植物的可收获的部分,其中所述可收获的部分优选的是枝条生物量和/或种子。
23、源自项21的植物和/或项22的植物的可收获的部分的产物。
24、编码GCN5多肽的核酸在相对于对照植物,在植物中增加产量,特别是增加种子产量和/或枝条生物量中的用途。
附图描述
本发明将参考下列附图进行描述,其中
图1:拟南芥属中的花色素苷和PA合成途径(Abrahams等人,2003)。显示了自查尔酮合酶的花色素苷和PA途径。酶LDOX和BAN分别作用于白矢车菊苷元和花青素,以产生表儿茶酸。儿茶素合成(虚线)迄今未被在拟南芥属中得以证明。使用的缩写:CHS,查尔酮合酶;CHI,查尔酮异构化;F3H,黄烷酮3-β-羟化酶;F3’H,黄酮类化合物3’羟化酶;FLS,黄酮醇合酶;DFR,二氢黄酮醇4-还原酶;LDOX,无色花色素双加氧酶;BAN,花色素还原酶;UFGT,UDP葡萄糖-黄酮类化合物3-O-葡糖基转移酶。
图2表示了具有保守结构域异青霉素合酶(黑体)和2OG-Fe(II)加氧酶(斜体),和基序(下划线并编号)的SEQ ID NO:2的结构域结构。
图3显示了多个LDOX多肽的多重比对,标识符对应于在序列表中使用的那些。
图4显示了LDOX多肽的进化系统树。
图5显示了用于在稻中增加编码LDOX的核酸的表达的二元载体,所述核酸处于稻GOS2启动子(pGOS2)的控制下。
图6显示了用于在稻中增加编码YRP5的核酸的表达的二元载体,所述核酸处于稻GOS2启动子(pGOS2)的控制下。
图7显示了表A3的植物CK1多肽的多重比对。
图8显示了用于在稻中增加编码CK1的核酸的表达的二元载体,所述核酸处于稻GOS2启动子(pGOS)的控制下。
图9显示了表A4的植物bHLH12-样多肽的多重比对。显示的比对的多肽中基序16至19的位置和bHLH结构域。
图10显示了用于在稻中增加编码bHLH12-样的核酸的表达的二元载体,所述核酸处于稻GOS2启动子(pGOS2)的控制下。
图11显示了植物ADH2-样多肽的多重比对。
图12是Kavanagh等人Cell Mol Life Sci.2008Dec;65(24):3895-3906的图3的复制。
图13显示了用于在稻中增加编码ADH2的核酸的表达的二元载体,所述核酸处于稻推定的蛋白酶抑制剂启动子的控制下。
图14显示了脊椎动物、果蝇和酵母中GCN5的总体结构。显示了来自人(hs;Homo sapiens)、鸡(gg;原鸡(Gallus gallus))、斑马鱼(dr;鮐(Danio rerio)),河鲀鱼(tn;Tetraodon nigroviridis),黑腹果蝇(Drosophila melanogaster)(dm)和酵母(sc;酿酒酵母(Saccharomycescerevisiae))的GCN5的图示和结构域组织。以黑体显示AT结构域,阴影显示溴结构域(Bromo)。框上的数代表氨基酸位置。不同因子之间的同一性在水平线的右侧以%显示,代表配对比较。AT意思是“乙酰转移酶”。
图15代表对于不同进化枝所选择的GCN5蛋白质的进化系统树:单子叶植物进化枝、双子叶植物进化枝、高等维管植物进化枝、维管植物进化枝、植物进化枝和真核生物进化枝。使用MAFFT(Katoh和Toh(2008)Briefings in Bioinformatics 9:286-298)生成比对。使用QuickTree(Howe等人(2002),Bioinformatics 18(11):1546-7),100引导程序重复计算邻接树。使用Dendroscope(Huson等人(2007),BMC Bioinformatics 8(1):460)绘制圆形系统发育图。对主要的分支显示100引导程序重复的置信度。通过圆形表明主要分支的位置。
图16显示了用于在稻中增加编码GCN5的核酸的表达的二元载体,所述核酸处于稻GOS2启动子(pGOS2)的控制下。
实施例
本发明现在参考如下实施例进行描述,所述实施例仅是示意性的。以下实施例不意图完全限定或限制本发明的范围。
DNA操作:除非另外说明,重组DNA技术根据(Sambrook(2001)Molecular Cloning:a laboratory manual,第3版Cold Spring HarborLaboratory Press,CSH,New York)或Ausubel等人(1994),CurrentProtocols in Molecular Biology,Current Protocols第1卷和第2卷中描述的标准方案进行。用于植物分子研究工作的标准材料和方法在BIOS科学出版有限责任公司(BIOS Scientific Publications Ltd(英国))和Blackwell科学出版社(Blackwell Scientific Publications(英国))出版的R.D.D.Croy的Plant Molecular Biology Labfax(1993)中描述。
实施例1:鉴定在本发明方法中使用的核酸序列相关的序列
用数据库搜索工具如基本局部比对工具(BLAST)(Altschul等人(1990)J.Mol.Biol.215:403-410;和Altschul等人(1997)Nucleic Acids Res.25:3389-3402),在国家生物技术信息中心(NCBI)的Entrez核苷酸数据库中维护的那些序列中鉴定到与本发明方法中所用核酸序列相关的(全长cDNA、EST或基因组)序列。使用该程序通过将核酸序列或多肽序列与序列数据库比较并且计算匹配的统计显著性来找到序列之间的局部相似性区域。例如,由与本发明方法中所用核酸编码的多肽用于TBLASTN算法,采用默认设置和过滤程序以忽略低复杂性序列启动。这种分析的结果通过配对比较进行观察,并根据概率评分(E-值)进行评级,其中所述的评分反映特定比对结果因偶然发生的概率(E-值越低,命中的显著性越高)。除了E-值外,比较过程也可以通过同一性百分数评分。同一性百分数指两个所比较的核酸(或多肽)序列之间特定长度范围内相同的核苷酸(或氨基酸)的数目。在一些情况下,可以调整默认参数以修改搜索的严格性。例如,可以增加E-值以显示更少的严格匹配。以这种方式,可以鉴定几乎完美的短匹配。
1.1.无色花色素双加氧酶(LDOX)多肽
表A1提供了用于本发明方法中的核酸序列相关的核酸序列列表。这些序列是图4的进化系统树中亚组A的一部分。
表A1:LDOX多肽的实例:
Figure BDA0000128813510001331
Figure BDA0000128813510001341
在一些情形中,相关序列已经被研究机构暂时汇集和公开,例如TheInstitute for Genomic Research(TIGR;以TA起始)。真核基因直向同源物(The Eukaryotic Gene Orthologs(EGO))数据库被用来鉴别此类相关的序列,这是通过关键词搜索或者通过使用目的核酸序列或多肽序列的BLAST算法。在其它情形中,已经针对特定生物产生了特定核酸序列数据库,例如通过Joint Genome Institute。此外,有权使用私有数据库允许鉴定新的核酸和多肽序列。
1.2YRP5多肽
表A2提供了YRP5核酸序列的列表。
表A2:YRP5多肽的实例
Figure BDA0000128813510001351
在一些情形中,相关序列被研究机构暂时汇集和公开,例如TheInstitute for Genomic Research(TIGR;以TA起始)。真核基因直向同源物(The Eukaryotic Gene Orthologs(EGO))数据库被用来鉴别此类相关的序列,这是通过关键词搜索或者通过使用目的核酸序列或多肽序列的BLAST算法。在其它情形中,针对特定生物产生了特定核酸序列数据库,例如通过Joint Genome Institute。
1.3I型酪蛋白激酶(CK1)多肽
表A3提供了用于本发明方法中的核酸序列相关的同源核酸序列的列表。
表A3:CK1核酸及其编码的多肽的实例:
Figure BDA0000128813510001352
Figure BDA0000128813510001361
在一些情形中,相关序列已经被研究机构暂时汇集和公开,例如TheInstitute for Genomic Research(TIGR;以TA起始)。真核基因直向同源物(The Eukaryotic Gene Orthologs(EGO))数据库被用来鉴别此类相关的序列,这是通过关键词搜索或者通过使用目的核酸序列或多肽序列的BLAST算法。在其它情形中,已经针对特定生物产生了特定核酸序列数据库,例如通过Joint Genome Institute。此外,有权使用私有数据库允许鉴定新的核酸和多肽序列。
1.4碱性螺旋环螺旋组12(bHLH12-样)多肽
表A4提供了用于本发明方法中的核酸序列相关的同源核酸序列的列表。
表A4:bHLH12-样核酸及其编码的多肽的实例:
Figure BDA0000128813510001371
Figure BDA0000128813510001381
在一些情形中,相关序列已经被研究机构暂时汇集和公开,例如TheInstitute for Genomic Research(TIGR;以TA起始)。真核基因直向同源物(The Eukaryotic Gene Orthologs(EGO))数据库被用来鉴别此类相关的序列,这是通过关键词搜索或者通过使用目的核酸序列或多肽序列的BLAST算法。在其它情形中,已经针对特定生物产生了特定核酸序列数据库,例如通过Joint Genome Institute。此外,有权使用私有数据库允许鉴定新的核酸和多肽序列。
1.5醇脱氢酶(ADH2)多肽
表A5提供了用于本发明方法中的核酸序列相关的核酸序列列表。
表A5:ADH2多肽的实例:
Figure BDA0000128813510001391
在一些情形中,相关序列已经被研究机构暂时汇集和公开,例如TheInstitute for Genomic Research(TIGR;以TA起始)。真核基因直向同源物(The Eukaryotic Gene Orthologs(EGO))数据库被用来鉴别此类相关的序列,这是通过关键词搜索或者通过使用目的核酸序列或多肽序列的BLAST算法。在其它情形中,已经针对特定生物产生了特定核酸序列数据库,例如通过Joint Genome Institute。此外,有权使用私有数据库允许鉴定新的核酸和多肽序列。
1.6GCN5-样多肽
表A6提供了GCN5-样序列的列表。
表A6:GCN5-样多肽的实例
Figure BDA0000128813510001401
在一些情形中,相关序列已经被研究机构暂时汇集和公开,例如TheInstitute for Genomic Research(TIGR;以TA起始)。真核基因直向同源物(The Eukaryotic Gene Orthologs(EGO))数据库被用来鉴别此类相关的序列,这是通过关键词搜索或者通过使用目的核酸序列或多肽序列的BLAST算法。在其它情形中,已经针对特定生物产生了特定核酸序列数据库,例如通过Joint Genome Institute。此外,有权使用私有数据库允许鉴定新的核酸和多肽序列。
实施例2:用于本发明方法的多肽序列相关序列的比对
2.1无色花色素双加氧酶(LDOX)多肽
多肽序列的比对使用渐近比对的ClustalW算法实施((Thompson等人(1997)Nucleic Acids Res 25:4876-4882;Chenna等人(2003).NucleicAcids Res 31:3497-3500),具有标准设置(slow比对,相似性矩阵:Blosum62(如果比对多肽),空位开放罚分10,空位延伸罚分:0.2)。在图3中比对LDOX多肽。
该比对用于确定长约5至10个氨基酸的保守标签序列。优选地,使用蛋白质的保守区域,其通过比对中的相同残基和保守取代来识别。本领域技术人员熟悉鉴定此类保守区域。
对于进化系统树,使用MAFT(Katoh等人Toh(2008).Briefings inBioinformatics 9:286-298.)比对蛋白质。使用QuickTree1.1(Houwe等人(2002).Bioinformatics 18(11):1546-7)计算邻接树。使用Dendroscope2.0.1(Hudson等人(2007).Bioinformatics 8(1):460)绘制圆形树形图。使用每一聚类中的代表性成员来产生树。在LDOX蛋白质中可以识别4个亚组,而它们具有相同的生物学功能。SEQ ID NO:2在树中被标示为拟南芥_AT5G05600.1#1_PLN。
2.2YRP5多肽
利用渐近比对的ClustalW 2.0算法(Thompson等(1997)Nucleic AcidsRes 25:4876-4882;Chenna等(2003).Nucleic Acids Res 31:3497-3500),使用标准设置(slow比对,相似性矩阵:Gonnet(或Blosum 62(如果比对多肽),空位开放罚分10,空位延伸罚分:0.2)来进行多肽序列的比对。进行微小的手工编辑以进一步优化比对。
使用Vector NTI(Invitrogen)的AlignX程序中提供的邻接聚类算法,构建了YRP5多肽的进化系统树。
利用渐近比对的ClustalW 2.0算法(Thompson等(1997)Nucleic AcidsRes 25:4876-4882;Chenna等(2003).Nucleic Acids Res 31:3497-3500),使用标准设置(slow比对,相似性矩阵:Gonnet,空位开放罚分10,空位延伸罚分:0.2)来进行多肽序列的比对。进行微小的手工编辑以进一步优化比对。
2.3I型酪蛋白激酶(CK1)多肽
利用MAFFT比对程序(MAFFT(v6.704b))来实施多肽序列的比对,所述程序是基于快速Fourier转化的快速多重序列比对的方法,其中将氨基酸序列转变为由每个氨基酸残基的体积和极性值组成的序列,基本如Katoh等人Nucleic Acids Research,2002,Vol.30,No.14 3059-3066所述。
在图7中的CLUSTAL形式比对中比对和显示CK1多肽。
标明了高度保守的残基(*)和保守的残基(:)。
2.4碱性螺旋环螺旋组12(bHLH12-样)多肽
使用VNTI程序(Invitrogen)的Align包实施多肽序列的比对,使用默认参数。
在图9中的CLUSTAL形式比对中比对和显示bHLH12-样多肽。显示了表现出最高丰富的氨基酸的共有序列。共有序列中无氨基酸表明在该位置可以是任何氨基酸或无氨基酸。
2.5醇脱氢酶(ADH2)多肽
利用渐近比对的ClustalW 2.0算法(Thompson等(1997)Nucleic AcidsRes 25:4876-4882;Chenna等(2003).Nucleic Acids Res 31:3497-3500),使用标准设置(slow比对,相似性矩阵:Gonnet(或Blosum 62(如果比对多肽),空位开放罚分10,空位延伸罚分:0.2)来进行多肽序列的比对。进行微小的手工编辑以进一步优化比对。使用Vector NTI(Invitrogen)的AlignX程序中提供的邻接聚类算法,构建了ADH2多肽的进化系统树。
2.6.GCN5-样多肽
利用渐近比对的ClustalW 2.0算法(Thompson等(1997)Nucleic AcidsRes 25:4876-4882;Chenna等(2003).Nucleic Acids Res 31:3497-3500),使用标准设置(slow比对,相似性矩阵:Gonnet(或Blosum 62(如果比对多肽),空位开放罚分10,空位延伸罚分:0.2)来进行多肽序列的比对。
使用Vector NTI(Invitrogen)的AlignX程序中提供的邻接聚类算法,构建GCN5-样多肽(图15)的进化系统树。
实施例3:在实施本发明方法中有用的多肽序列之间的总体同一性百分数的计算
3.1无色花色素双加氧酶(LDOX)多肽
使用现有技术领域可获得的方法之一,即MatGAT(矩阵总体比对工具)软件(BMC Bioinformatics.2003 4:29.MatGAT:使用蛋白质序列或DNA序列产生相似性/同一性矩阵的一项应用(an application thatgenerates similarity/identity matrices using protein or DNA sequences),Campanella JJ,Bitincka L,Smalley J;该软件由Ledion Bitincka维护)确定在实施本发明方法中有用的全长多肽序列之间的总体相似性和同一性百分数。MatGAT软件对DNA序列或蛋白质序列产生相似性/同一性矩阵,无需数据的预先比对。该程序使用Myers和Miller总体比对算法(空位开口罚分12和空位延伸罚分2)执行一系列配对比对,使用例如Blosum 62(对于多肽而言)计算相似性和同一性并且随后将结果置于距离矩阵内。
比较中使用的参数是:
评分矩阵:Blosum62
第一空位:12
延伸空位:2
表B1中显示在多肽序列的全长范围内总体同一性的软件分析结果。
用于实施本发明方法的LDOX多肽序列之间的同一性百分数,与SEQID NO:2相比可以低至18.2%的氨基酸同一性;甚至在包含SEQ ID NO:2的进化系统树的亚组A中,序列同一性可以低至26.7%。
表B1:在多肽序列的全长范围内的总体相似性和同一性的MatGAT结果。
Figure BDA0000128813510001451
Figure BDA0000128813510001461
Figure BDA0000128813510001471
Figure BDA0000128813510001481
Figure BDA0000128813510001491
Figure BDA0000128813510001511
Figure BDA0000128813510001521
3.2YRP5多肽
使用现有技术领域可获得的方法之一,即MatGAT(矩阵总体比对工具)软件(BMC Bioinformatics.2003 4:29.MatGAT:使用蛋白质序列或DNA序列产生相似性/同一性矩阵的一项应用(an application that generatessimilarity/identity matrices using protein or DNA sequences),CampanellaJJ,Bitincka L,Smalley J;该软件由Ledion Bitincka维护)确定全长多肽序列之间的总体相似性和同一性百分数。MatGAT软件对DNA序列或蛋白质序列产生相似性/同一性矩阵,无需数据的预先比对。该程序使用Myers和Miller总体比对算法(空位开口罚分12和空位延伸罚分2)执行一系列配对比对,使用例如Blosum 62(对于多肽而言)计算相似性和同一性并且随后将结果置于距离矩阵内。在分割线下半部分显示序列相似性,和在对角分割线的上半部分显示序列同一性。
比较中使用的参数是:
评分矩阵:Blosum62
第一空位:12
延伸空位:2
也可以实施用于特定结构域的局部比对的MATGAT表格,或者特定结构域之间的%同一性/相似性的数据。
3.3I型酪蛋白激酶(CK1)多肽
使用现有技术领域可获得的方法之一,即MatGAT(矩阵总体比对工具)软件(BMC Bioinformatics.2003 4:29.MatGAT:使用蛋白质序列或DNA序列产生相似性/同一性矩阵的一项应用(an application thatgenerates similarity/identity matrices using protein or DNA sequences),Campanella JJ,Bitincka L,Smalley J;该软件由Ledion Bitincka维护)确定在实施本发明方法中有用的全长多肽序列之间的总体相似性和同一性百分数。MatGAT软件对DNA序列或蛋白质序列产生相似性/同一性矩阵,无需数据的预先比对。该程序使用Myers和Miller总体比对算法(空位开口罚分12和空位延伸罚分2)执行一系列配对比对,使用例如Blosum 62(对于多肽而言)计算相似性和同一性并且随后将结果置于距离矩阵内。在分割线下半部分显示序列相似性,和在对角分割线的上半部分显示序列同一性。
比较中使用的参数是:
评分矩阵:Blosum62
第一空位:12
延伸空位:2
表B2中显示在多肽序列的全长范围内总体同一性的软件分析结果。
与SEQ ID NO:195相比,表B2上的CK1多肽序列之间的同一性百分数的范围是从92%至94%。
Figure BDA0000128813510001561
3.4.碱性螺旋环螺旋组12(bHLH12-样)多肽
使用现有技术领域可获得的方法之一,即MatGAT(矩阵总体比对工具)软件(BMC Bioinformatics.2003 4:29.MatGAT:使用蛋白质序列或DNA序列产生相似性/同一性矩阵的一项应用(an application thatgenerates similarity/identity matrices using protein or DNA sequences),Campanella JJ,Bitincka L,Smalley J;该软件由Ledion Bitincka维护)确定在实施本发明方法中有用的全长多肽序列之间的总体相似性和同一性百分数。MatGAT软件对DNA序列或蛋白质序列产生相似性/同一性矩阵,无需数据的预先比对。该程序使用Myers和Miller总体比对算法(空位开口罚分12和空位延伸罚分2)执行一系列配对比对,使用例如Blosum 62(对于多肽而言)计算相似性和同一性并且随后将结果置于距离矩阵内。在表B3中,在分割线下半部分显示序列相似性,和在对角分割线的上半部分显示序列同一性。
比较中使用的参数是:
评分矩阵:Blosum62
第一空位:12
延伸空位:2
与SEQ ID NO:280相比,在表B3上的bHLH12-样多肽序列之间的同一性百分数范围从92%至94%。
Figure BDA0000128813510001581
3.5醇脱氢酶(ADH2)多肽
使用现有技术领域可获得的方法之一,即MatGAT(矩阵总体比对工具)软件(BMC Bioinformatics.2003 4:29.MatGAT:使用蛋白质序列或DNA序列产生相似性/同一性矩阵的一项应用(an application thatgenerates similarity/identity matrices using protein or DNA sequences),Campanella JJ,Bitincka L,Smalley J;该软件由Ledion Bitincka维护)确定在实施本发明方法中有用的全长ADH2多肽序列之间的总体相似性和同一性百分数。MatGAT软件对DNA序列或蛋白质序列产生相似性/同一性矩阵,无需数据的预先比对。该程序使用Myers和Miller总体比对算法(空位开口罚分12和空位延伸罚分2)执行一系列配对比对,使用例如Blosum62(对于多肽而言)计算相似性和同一性并且随后将结果置于距离矩阵内。在分割线下半部分显示序列相似性,和在对角分割线的上半部分显示序列同一性。
比较中使用的参数是:
评分矩阵:Blosum62
第一空位:12
延伸空位:2
3.6.GCN5-样多肽
使用现有技术领域可获得的方法之一,即MatGAT(矩阵总体比对工具)软件(BMC Bioinformatics.2003 4:29.MatGAT:使用蛋白质序列或DNA序列产生相似性/同一性矩阵的一项应用(an application thatgenerates similarity/identity matrices using protein or DNA sequences),Campanella JJ,Bitincka L,Smalley J;该软件由Ledion Bitincka维护)确定在实施本发明方法中有用的全长多肽序列之间的总体相似性和同一性百分数。MatGAT软件对DNA序列或蛋白质序列产生相似性/同一性矩阵,无需数据的预先比对。该程序使用Myers和Miller总体比对算法(空位开口罚分12和空位延伸罚分2)执行一系列配对比对,使用例如Blosum 62(对于多肽而言)计算相似性和同一性并且随后将结果置于距离矩阵内。在表B4中,在分割线下半部分显示序列相似性,和在对角分割线的上半部分显示序列同一性。
比较中使用的参数是:
评分矩阵:Blosum62
第一空位:12
延伸空位:2
与SEQ ID NO:460相比,在实施本发明方法中有用的GCN5-样多肽序列之间的同一性百分数可以低至26,90%氨基酸同一性。
表B4:在多肽序列的全长范围内的总体相似性和同一性的MatGAT结果。
  1   2   3   4   5   6   7   8   9   10   11
  1.大麦_AK252049   87,90   85,50   93,10   85,70   57,00   63,00   63,20   63,00   53,30   56,50
  2.稻_Os10g28040   90,70   85,20   89,70   58,50   64,50   64,60   63,30   55,00   57,50
  3.两色蜀黍_Sb01g021950.1   84,10   94,60   58,20   63,50   63,00   62,20   53,60   56,90
  4.Ta_GCN5   83,30   56,20   63,40   63,20   62,10   51,70   57,40
  5.玉米_AF440227   56,80   63,10   63,00   61,10   53,30   56,80
  6.拟南芥_AT3G54610.1   73,20   73,90   73,50   57,40   50,20
  7.大豆_Glyma03g31490.1   96,30   81,20   61,30   53,30
  8.大豆_Glyma19g34340.1   80,80   61,20   55,00
  9.P.trichocarpa_421007   60,40   52,10
  10.北美云杉_WS0277_C21   52,70
  11.江南卷柏_139448
  12.展叶剑叶藓_HAG1501
  13.雷氏衣藻_142398
  14C.vulgaris_43427
  15.O.lucimarinus_33057
  16.O.RCC809_28620
  17.O.taurii_34304
  18.酿酒酵母_GCN5
  19.D.discoidum_GCN5
  20.人_GCN5
  21.P.tricornutum_HAG15203
  12   13   14   15   16   17   18   19   20   21
  1.大麦_AK252049   56,80   38,10   42,00   38,70   40,40   40,40   36,60   35,20   35,90   32,30
  2.稻_LOC_Os10g28040.1   58,20   38,70   41,30   39,70   40,20   39,60   36,50   35,40   37,30   32,50
  3.两色蜀黍_Sb01g021950.1   57,00   38,30   42,40   39,90   40,50   39,70   37,40   35,00   36,70   32,50
  4.Ta_GCN5   58,10   39,60   43,80   40,70   41,70   41,40   37,20   36,10   36,70   32,80
  5.玉米_AF440227   56,10   37,80   41,60   39,50   39,90   39,20   36,20   35,70   36,90   33,10
  6.拟南芥_AT3G54610.1   49,30   35,20   37,30   35,80   36,40   35,00   35,40   29,90   32,50   30,80
  7.大豆_Glyma03g31490.1   55,00   36,80   41,50   37,30   39,40   37,70   36,60   32,20   34,10   30,60
  8.大豆_Glyma19g34340.1   55,00   36,70   41,00   37,50   39,60   37,90   36,80   32,40   33,90   30,40
  9.P.trichocarpa_421007   52,90   35,80   40,60   36,90   36,90   35,90   35,10   31,90   33,60   29,80
  10.北美云杉_WS0277_C21   50,70   33,40   35,10   33,20   33,10   32,60   30,70   29,00   30,60   26,90
  11.江南卷柏_139448   58,70   36,30   42,50   39,90   40,10   38,40   38,80   34,30   35,90   32,90
  12.展叶剑叶藓_HAG1501   37,40   39,10   40,50   42,10   39,70   36,40   33,30   31,60   31,80
  13.雷氏衣藻_142398   43,70   38,10   38,30   37,50   35,20   32,70   32,10   30,90
  14.C.vulgaris_43427   40,00   40,60   39,00   39,70   38,40   35,50   34,40
  15.O.lucimarinus_33057   77,20   75,80   38,10   38,60   33,70   31,20
  16.O.RCC809_28620   77,60   37,30   36,00   33,50   30,70
  17.O.taurii_34304   38,30   35,50   32,20   31,00
  18.醇酒酵母_GCN5   38,20   38,10   30,70
  1g.D.discoidum_GCN5   35,00   31,60
  20.人_GCN5   33,40
  21.P.tricomutum_HAG15203
实施例4:鉴定在实施本发明方法中有用的多肽序列中所包含的结构域
4.1无色花色素双加氧酶(LDOX)多肽
蛋白质家族、结构域和位点的集成资源(Integrated Resousce of ProteinFamilies,Domains and Sites)(InterPro)数据库是针对基于文本及基于序列的搜索法的常用特征标识数据库的集成界面。InterPro数据库合并了这些数据库,所述数据库使用不同的方法学及不同程度的有关充分表征的蛋白质的生物学信息以获得蛋白质特征标识。合作数据库包括SWISS-PROT、PROSITE、TrEMBL、PRINTS、ProDom和Pfam、Smart和TIGRFAM。Pfam是覆盖许多常见蛋白质结构域和家族的多重序列比对结果和隐匿马尔科夫模型(HMM)的庞大集合。Pfam在英国Sanger研究所服务器上维护。Interpro由英国欧洲生物信息学研究所维护。
如SEQ ID NO:2所示的多肽序列的InterPro扫描的结果示于表C1中。
表C1:如SEQ ID NO:2所示的多肽序列的InterPro扫描的结果(主要登录号)。
Figure BDA0000128813510001611
Figure BDA0000128813510001621
4.2YRP5多肽
蛋白质家族、结构域和位点的集成资源(Integrated Resousce of ProteinFamilies,Domains and Sites)(InterPro)数据库是针对基于文本及基于序列的搜索法的常用特征标识数据库的集成界面。InterPro数据库合并了这些数据库,所述数据库使用不同的方法学及不同程度的有关充分表征的蛋白质的生物学信息以获得蛋白质特征标识。合作数据库包括SWISS-PROT、PROSITE、TrEMBL、PRINTS、ProDom和Pfam、Smart和TIGRFAM。Pfam是覆盖许多常见蛋白质结构域和家族的多重序列比对结果和隐匿马尔科夫模型(HMM)的庞大集合。Pfam在英国Sanger研究所服务器上维护。Interpro由英国欧洲生物信息学研究所维护。
4.3I型酪蛋白激酶(CK1)多肽
蛋白质家族、结构域和位点的集成资源(Integrated Resousce of ProteinFamilies,Domains and Sites)(InterPro)数据库是针对基于文本及基于序列的搜索法的常用特征标识数据库的集成界面。InterPro数据库合并了这些数据库,所述数据库使用不同的方法学及不同程度的有关充分表征的蛋白质的生物学信息以获得蛋白质特征标识。合作数据库包括SWISS-PROT、PROSITE、TrEMBL、PRINTS、ProDom和Pfam、Smart和TIGRFAM。Pfam是覆盖许多常见蛋白质结构域和家族的多重序列比对结果和隐匿马尔科夫模型(HMM)的庞大集合。Pfam在英国Sanger研究所服务器上维护。Interpro由英国欧洲生物信息学研究所维护。
如SEQ ID NO:195所示的多肽序列的InterPro扫描的结果示于表C2中。
表C2:如SEQ ID NO:195所示的多肽序列的InterPro扫描的结果(主要登录号)。
Figure BDA0000128813510001631
4.4碱性螺旋环螺旋组12(bHLH12-样)多肽
蛋白质家族、结构域和位点的集成资源(Integrated Resousce of ProteinFamilies,Domains and Sites)(InterPro)数据库是针对基于文本及基于序列的搜索法的常用特征标识数据库的集成界面。InterPro数据库合并了这些数据库,所述数据库使用不同的方法学及不同程度的有关充分表征的蛋白质的生物学信息以获得蛋白质特征标识。合作数据库包括SWISS-PROT、PROSITE、TrEMBL、PRINTS、ProDom和Pfam、Smart和TIGRFAM。Pfam是覆盖许多常见蛋白质结构域和家族的多重序列比对结果和隐匿马尔科夫模型(HMM)的庞大集合。Pfam在英国Sanger研究所服务器上维护。Interpro由英国欧洲生物信息学研究所维护。
如SEQ ID NO:280所示的多肽序列的InterPro扫描的结果示于表C3中。
表C3:如SEQ ID NO:280所示的多肽序列的InterPro扫描的结果(主要登录号)。
Figure BDA0000128813510001641
4.5醇脱氢酶(ADH2)多肽
蛋白质家族、结构域和位点的集成资源(Integrated Resousce of ProteinFamilies,Domains and Sites)(InterPro)数据库是针对基于文本及基于序列的搜索法的常用特征标识数据库的集成界面。InterPro数据库合并了这些数据库,所述数据库使用不同的方法学及不同程度的有关充分表征的蛋白质的生物学信息以获得蛋白质特征标识。合作数据库包括SWISS-PROT、PROSITE、TrEMBL、PRINTS、ProDom和Pfam、Smart和TIGRFAM。Pfam是覆盖许多常见蛋白质结构域和家族的多重序列比对结果和隐匿马尔科夫模型(HMM)的庞大集合。Pfam在英国Sanger研究所服务器上维护。Interpro由英国欧洲生物信息学研究所维护。
如SEQ ID NO:413所示的多肽序列的InterPro扫描的结果示于表C4中。
特别地,鉴定了下列结构域:
IPR002085:醇脱氢酶超家族,含Zn
PTHR11695:醇脱氢酶相关
IPR002328:醇脱氢酶,含Zn,保守位点
PS00059:ADH_ZINC
IPR011032:GroES-样
SSF50129:GroES-样
IPR013149:醇脱氢酶,Zn_结合
PF00107:ADH_Zinc_N
IPR013154:醇脱氢酶,GroES-样
PF08240:ADH_N
IPR01418:醇脱氢酶,III类S-(羟甲基)谷胱甘肽脱氢酶
TIGR02818:adh_III_F_hyde:S-(羟甲基)谷胱甘肽
G3DSA:3.90.180.10(无描述)
PTHR11695:SF4:醇脱氢酶
表C4:如SEQ ID NO:413所示的多肽序列的InterPro扫描的结果(主要登录号)。
4.6GCN5-样多肽
蛋白质家族、结构域和位点的集成资源(Integrated Resousce of ProteinFamilies,Domains and Sites)(InterPro)数据库是针对基于文本及基于序列的搜索法的常用特征标识数据库的集成界面。InterPro数据库合并了这些数据库,所述数据库使用不同的方法学及不同程度的有关充分表征的蛋白质的生物学信息以获得蛋白质特征标识。合作数据库包括SWISS-PROT、PROSITE、TrEMBL、PRINTS、ProDom和Pfam、Smart和TIGRFAM。Pfam是覆盖许多常见蛋白质结构域和家族的多重序列比对结果和隐匿马尔科夫模型(HMM)的庞大集合。Pfam在英国Sanger研究所服务器上维护。Interpro由英国欧洲生物信息学研究所维护。
如SEQ ID NO:460所示的多肽序列的InterPro扫描的结果示于表C5中。
表C5:如SEQ ID NO:460所示的多肽序列的InterPro扫描的结果(主要登录号)。
Figure BDA0000128813510001671
实施例5:在实施本发明方法中有用的多肽序列的拓扑结构预测
5.1.无色花色素双加氧酶(LDOX)多肽
TargetP 1.1预测真核生物蛋白的亚细胞定位。基于任何氨基端前序列:叶绿体转运肽(cTP)、线粒体靶向肽(mTP)或分泌途径信号肽(SP)的预测存在性进行定位指派。作为最终预测基础的评分并不真正是概率,并且它们不是必需地加合成一体。但是,根据TargetP,具有最高评分的定位是最可能的,并且评分之间的关系(可靠性级别)可以指示该预测具有多大确定性。可靠性级别(RC)范围从1至5,其中1表示最可靠的预测。TargetP在丹麦技术大学(Technical University of Denmark)的服务器上维护。
对于预测含有氨基端前序列的序列而言,也可以预测潜在的切割位点。
可以选择许多参数,如生物组别(非植物或植物)、界点集合(无、预定义的界点集合或用户指定的界点集合)和切割位点预测的计算(是或否)。
在表D1中呈现如SEQ ID NO:2所表示的多肽序列的TargetP 1.1分析的结果。选择“植物”生物组别,未定义界点,并且对转运肽的预测长度提出要求。如SEQ ID NO:2所代表的多肽序列的亚细胞定位可以是细胞质或核的,未预测转运肽。
表D1:如SEQ ID NO:2所示的多肽序列的TargetP1.1分析。缩写:Len:长度;cTP:叶绿体转运肽;mTP:线粒体转运肽;SP:分泌通路信号肽;其它:其它亚细胞靶向;Loc:预测的定位;RC:可靠性级别;TPlen:预测的转运肽长度。
Figure BDA0000128813510001681
许多其他算法可以用来进行此类分析,包括:
●在丹麦技术大学服务器上维护的ChloroP 1.1;
●在澳大利亚布里斯班昆士兰大学生物科学研究所的服务器上维护的Protein Prowler亚细胞定位预测者1.2版;
●在加拿大阿伯特省埃德蒙顿市阿尔伯塔大学的服务器上维护的PENCE蛋白组分析专家PA-GOSUB 2.5;
●在丹麦技术大学服务器上维护的TMHMM;
●PSORT(URL:psort.org);
●PLOC(Park和Kanehisa,Bioinformatics,19,1656-1663,2003)。
5.2.YRP5多肽
TargetP 1.1预测真核生物蛋白的亚细胞定位。基于任何氨基端前序列:叶绿体转运肽(cTP)、线粒体靶向肽(mTP)或分泌途径信号肽(SP)的预测存在性进行定位指派。作为最终预测基础的评分并不真正是概率,并且它们不是必需地加合成一体。但是,根据TargetP,具有最高评分的定位是最可能的,并且评分之间的关系(可靠性级别)可以指示该预测具有多大确定性。可靠性级别(RC)范围从1至5,其中1表示最可靠的预测。TargetP在丹麦技术大学(Technical University of Denmark)的服务器上维护。对于预测含有氨基端前序列的序列而言,也可以预测潜在的切割位点。
可以选择许多参数,如生物组别(非植物或植物)、界点集合(无、预定义的界点集合或用户指定的界点集合)和切割位点预测的计算(是或否)。
许多其他算法可以用来进行此类分析,包括:
●在丹麦技术大学服务器上维护的ChloroP 1.1;
●在澳大利亚布里斯班昆士兰大学生物科学研究所的服务器上维护的Protein Prowler亚细胞定位预测者1.2版;
●在加拿大阿伯特省埃德蒙顿市阿尔伯塔大学的服务器上维护的PENCE蛋白组分析专家PA-GOSUB 2.5;
●在丹麦技术大学服务器上维护的TMHMM;
●PSORT(URL:psort.org);
●PLOC(Park和Kanehisa,Bioinformatics,19,1656-1663,2003)。
5.3.I型酪蛋白激酶(CK1)多肽
TargetP 1.1预测真核生物蛋白的亚细胞定位。基于任何氨基端前序列:叶绿体转运肽(cTP)、线粒体靶向肽(mTP)或分泌途径信号肽(SP)的预测存在性进行定位指派。作为最终预测基础的评分并不真正是概率,并且它们不是必需地加合成一体。但是,根据TargetP,具有最高评分的定位是最可能的,并且评分之间的关系(可靠性级别)可以指示该预测具有多大确定性。可靠性级别(RC)范围从1至5,其中1表示最可靠的预测。TargetP在丹麦技术大学(Technical University of Denmark)的服务器上维护。
对于预测含有氨基端前序列的序列而言,也可以预测潜在的切割位点。
可以选择许多参数,如生物组别(非植物或植物)、界点集合(无、预定义的界点集合或用户指定的界点集合)和切割位点预测的计算(是或否)。
许多其他算法可以用来进行此类分析,包括:
●在丹麦技术大学服务器上维护的ChloroP 1.1;
●在澳大利亚布里斯班昆士兰大学生物科学研究所的服务器上维护的Protein Prowler亚细胞定位预测者1.2版;
●在加拿大阿伯特省埃德蒙顿市阿尔伯塔大学的服务器上维护的PENCE蛋白组分析专家PA-GOSUB 2.5;
●在丹麦技术大学服务器上维护的TMHMM;
●PSORT(URL:psort.org);
●PLOC(Park和Kanehisa,Bioinformatics,19,1656-1663,2003)。
5.4.碱性螺旋环螺旋组12(bHLH12-样)多肽
TargetP 1.1预测真核生物蛋白的亚细胞定位。基于任何氨基端前序列:叶绿体转运肽(cTP)、线粒体靶向肽(mTP)或分泌途径信号肽(SP)的预测存在性进行定位指派。作为最终预测基础的评分并不真正是概率,并且它们不是必需地加合成一体。但是,根据TargetP,具有最高评分的定位是最可能的,并且评分之间的关系(可靠性级别)可以指示该预测具有多大确定性。可靠性级别(RC)范围从1至5,其中1表示最可靠的预测。TargetP在丹麦技术大学(Technical University of Denmark)的服务器上维护。
对于预测含有氨基端前序列的序列而言,也可以预测潜在的切割位点。
可以选择许多参数,如生物组别(非植物或植物)、界点集合(无、预定义的界点集合或用户指定的界点集合)和切割位点预测的计算(是或否)。
许多其他算法可以用来进行此类分析,包括:
●在丹麦技术大学服务器上维护的ChloroP 1.1;
●在澳大利亚布里斯班昆士兰大学生物科学研究所的服务器上维护的Protein Prowler亚细胞定位预测者1.2版;
●在加拿大阿伯特省埃德蒙顿市阿尔伯塔大学的服务器上维护的PENCE蛋白组分析专家PA-GOSUB 2.5;
●在丹麦技术大学服务器上维护的TMHMM;
●PSORT(URL:psort.org);
●PLOC(Park和Kanehisa,Bioinformatics,19,1656-1663,2003)。
5.5.醇脱氢酶(ADH2)多肽
TargetP 1.1预测真核生物蛋白的亚细胞定位。基于任何氨基端前序列:叶绿体转运肽(cTP)、线粒体靶向肽(mTP)或分泌途径信号肽(SP)的预测存在性进行定位指派。作为最终预测基础的评分并不真正是概率,并且它们不是必需地加合成一体。但是,根据TargetP,具有最高评分的定位是最可能的,并且评分之间的关系(可靠性级别)可以指示该预测具有多大确定性。可靠性级别(RC)范围从1至5,其中1表示最可靠的预测。TargetP在丹麦技术大学(Technical University of Denmark)的服务器上维护。
对于预测含有氨基端前序列的序列而言,也可以预测潜在的切割位点。
可以选择许多参数,如生物组别(非植物或植物)、界点集合(无、预定义的界点集合或用户指定的界点集合)和切割位点预测的计算(是或否)。
许多其他算法可以用来进行此类分析,包括:
●在丹麦技术大学服务器上维护的ChloroP 1.1;
●在澳大利亚布里斯班昆士兰大学生物科学研究所的服务器上维护的Protein Prowler亚细胞定位预测者1.2版;
●在加拿大阿伯特省埃德蒙顿市阿尔伯塔大学的服务器上维护的PENCE蛋白组分析专家PA-GOSUB 2.5;
●在丹麦技术大学服务器上维护的TMHMM;
●PSORT(URL:psort.org);
●PLOC(Park和Kanehisa,Bioinformatics,19,1656-1663,2003)。
5.6.GCN5-样多肽
TargetP 1.1预测真核生物蛋白的亚细胞定位。基于任何氨基端前序列:叶绿体转运肽(cTP)、线粒体靶向肽(mTP)或分泌途径信号肽(SP)的预测存在性进行定位指派。作为最终预测基础的评分并不真正是概率,并且它们不是必需地加合成一体。但是,根据TargetP,具有最高评分的定位是最可能的,并且评分之间的关系(可靠性级别)可以指示该预测具有多大确定性。可靠性级别(RC)范围从1至5,其中1表示最可靠的预测。TargetP在丹麦技术大学(Technical University of Denmark)的服务器上维护。
对于预测含有氨基端前序列的序列而言,也可以预测潜在的切割位点。
可以选择许多参数,如生物组别(非植物或植物)、界点集合(无、预定义的界点集合或用户指定的界点集合)和切割位点预测的计算(是或否)。
许多其他算法可以用来进行此类分析,包括:
●在丹麦技术大学服务器上维护的ChloroP 1.1;
●在澳大利亚布里斯班昆士兰大学生物科学研究所的服务器上维护的Protein Prowler亚细胞定位预测者1.2版;
●在加拿大阿伯特省埃德蒙顿市阿尔伯塔大学的服务器上维护的PENCE蛋白组分析专家PA-GOSUB 2.5;
●在丹麦技术大学服务器上维护的TMHMM;
●PSORT(URL:psort.org);
●PLOC(Park和Kanehisa,Bioinformatics,19,1656-1663,2003)。
实施例6:与用于实施本发明方法中的多肽序列相关的测定
6.1.无色花色素双加氧酶(LDOX)多肽
可以通过免疫测定或通过色谱和代谢物组技术定量酶促反应的产物来测量LDOX活性,如Pelletier等人(1999)所描述的。在Saito等人(Plant J.17,181-189,1999)中描述了酶促测定。根据标准步骤产生和纯化His-标签化或MBP-标签化的LDOX蛋白质。LDOX酶促活性的测定,简要地:
花色素形成:在30℃温育100μl反应混合物适当的时间,所述反应混合物包含20mM K-Pi(pH 7.0)、200mM NaCl、10mM麦芽糖、5mMDTT、4mM抗坏血酸钠、1mM 2-酮戊二酸、0.4mM FeSO4、1mM无色花色素和纯化的LDOX蛋白质。反应通过添加1μl 36%HCl来终止,随后,将形成的花色素(花葵素和花青素)用100μl的异戊醇提取,用于高效液相色谱(HPLC)分析。用YMC-ODS-A312柱(
Figure BDA0000128813510001731
6mm×150mm,YMC Co.Ltd.,Kyoto,Japan),使用甲醇/乙酸/水混合物(20∶15∶65)作为洗脱液,在1.0ml min-1的流速下,于40℃进行HPLC。在监控520nm的吸光度时,通过其峰面积,确定分别在5.5分钟和4.3分钟洗脱的花葵素和花青素的量。用花葵素和花青素的标准化材料获得定量校准曲线。通过95℃,在包含5%HCL的n-丁醇中热处理白天竺葵苷元和白矢车菊苷元10分钟来制备花色素的标准化曲线。
14CO2的释放。反应混合物(100μl)由下述组成:20mM K-Pi(pH 7.0)、200mM NaCl、10mM麦芽糖、5mM DTT、4mM抗坏血酸钠、1mM[1-14C]2-酮戊二酸(1.85GBq/mmol;50mCi mmol-1)(Du Pont/NENResearch Products)、0.4mM FeSO4、1mM无色花色素和纯化的LDOX蛋白质。将20μl的Soluene-350(0.5M氢氧化季铵/甲苯,Packard)浸没的滤纸(Whatman 3MM,1cm×2cm)置于包含反应混合物的微型管顶部,用于捕获释放的14CO2。在30℃温育后,通过添加1μl 36%的HCl终止反应,并将反应混合物保持另外30分钟来允许CO2产生至完全。在滤纸上的14C的量通过液体闪烁计数来确定。
6.2醇脱氢酶(ADH2)多肽
S-亚硝基谷胱甘肽还原酶(GSNOR)活性如Rusterucci等人PlantPhysiol.2007 March;143(3):1282-1292所述。
实施例7:在本发明方法中所用的核酸序列的克隆
7.1:无色花色素双加氧酶(LDOX)多肽
本发明方法中所用的核酸序列通过PCR,使用定制的拟南芥幼苗cDNA文库(在pCMV Sport 6.0内;Invitrogen,Paisley,UK)作为模板进行扩增。使用Hifi Taq DNA聚合酶,在标准条件下利用在50μl PCR混合物中的200ng模板进行PCR。所用的引物是prm04344(SEQ ID NO:182;有义,起始密码子为粗体字):5’-ggggacaagtttgtacaaaaaagcaggcttcacaatgaacaagaacaagattgat-3’和prm04345(SEQ ID NO:183,反向,互补):5’-ggggaccactttgtacaagaaagctgggtctttaagggaagaaataaaa g-3’,其中所述引物包括用于Gateway重组的AttB位点。也使用标准方法纯化扩增的PCR片段。随后进行Gateway方法的第一步骤,即BP反应,在此期间根据Gateway术语学,所述PCR片段与pDONR201质粒在体内重组以产生“进入克隆”,pLDOX。质粒pDONR201作为Gateway
Figure BDA0000128813510001741
技术的部分从Invitrogen购买。
包含SEQ ID NO:1的进入克隆随后在LR反应中与用于稻转化法的目的载体一起使用。这种载体含有在T-DNA边界内部的植物选择标记、筛选标记表达盒和意图与已经克隆在该进入克隆中的目的核酸序列发生LR体内重组的Gateway盒作为功能性元件。用于组成型特异性表达的稻GOS2启动子(SEQ ID NO:184)位于该Gateway盒上游。
在所述LR重组步骤后,所得表达载体pGOS2::LDOX(图4)根据本领域熟知的方法转化入农杆菌菌株LBA4044。
7.2:YRP5多肽
核酸序列通过PCR,使用cDNA文库(在pCMV Sport 6.0内;Invitrogen,Paisley,UK)作为模板进行扩增。使用Hifi Taq DNA聚合酶,在标准条件下利用在50μl PCR混合物中的200ng模板进行PCR。引物包括用于Gateway重组的AttB位点。也使用标准方法纯化扩增的PCR片段。随后进行Gateway方法的第一步骤,即BP反应,在此期间根据Gateway术语学,所述PCR片段与pDONR201质粒在体内重组以产生“进入克隆”。质粒pDONR201作为Gateway
Figure BDA0000128813510001742
技术的部分从Invitrogen购买。
包含SEQ ID NO:185或SEQ ID NO:187的进入克隆随后在LR反应中与用于稻转化法的目的载体一起使用。这种载体含有在T-DNA边界内部的植物选择标记、筛选标记表达盒和意图与已经克隆在该进入克隆中的目的核酸序列发生LR体内重组的Gateway盒作为功能性元件。用于组成型表达的稻GOS2启动子(SEQ ID NO:191)位于该Gateway盒上游。
在所述LR重组步骤后,所得表达载体pGOS2::YRP5(图6)根据本领域熟知的方法转化入农杆菌菌株LBA4044。
7.3:I型酪蛋白激酶(CK1)多肽
本发明方法中所用的核酸序列通过PCR,使用定制的拟南芥幼苗cDNA文库(在pCMV Sport 6.0内;Invitrogen,Paisley,UK)作为模板进行扩增。使用Hifi Taq DNA聚合酶,在标准条件下利用在50μl PCR混合物中的200ng模板进行PCR。所用的引物是prm(fwd)5’ggggacaagtttgtacaaaaaagcaggcttaaacaatggatcgtgtggttggtg 3’(SEQ ID NO:270)和prm(rev)5’ggggaccactttgtacaagaaagctgggttaaagccaagcctctcacttc 3’,(SEQ ID NO:271),其中所述引物包括用于Gateway重组的AttB位点。也使用标准方法纯化扩增的PCR片段。随后进行Gateway方法的第一步骤,即BP反应,在此期间根据Gateway术语学,所述PCR片段与pDONR201质粒在体内重组以产生“进入克隆”,pCK1。质粒pDONR201作为Gateway
Figure BDA0000128813510001751
技术的部分从Invitrogen购买。
包含SEQ ID NO:194的进入克隆随后在LR反应中与用于稻转化法的目的载体一起使用。这种载体含有在T-DNA边界内部的植物选择标记、筛选标记表达盒和意图与已经克隆在该进入克隆中的目的核酸序列发生LR体内重组的Gateway盒作为功能性元件。用于组成型特异性表达的稻GOS2启动子(SEQ ID NO:272)位于该Gateway盒上游。
在所述LR重组步骤后,所得表达载体pGOS2::CK1(图8)根据本领域熟知的方法转化入农杆菌菌株LBA4044。
7.4:碱性螺旋环螺旋组12(bHLH12-样)多肽
本发明方法中所用的核酸序列通过PCR,使用定制的Populustrichocarpa幼苗cDNA文库(在pCMV Sport 6.0内;Invitrogen,Paisley,UK)作为模板进行扩增。使用Hifi Taq DNA聚合酶,在标准条件下利用在50μl PCR混合物中的200ng模板进行PCR。所用的引物是prm(fwd)5’-ggggacaagtttgtacaaaaaagcaggcttaaacaatggaaagagataagttgtttg-3’(SEQ ID NO:409)和prm(rev)5’-ggggaccactttgtacaagaaagctgggtagggactgtttattggttaat-3’,(SEQ ID NO:410),其中所述引物包括用于Gateway重组的AttB位点。也使用标准方法纯化扩增的PCR片段。随后进行Gateway方法的第一步骤,即BP反应,在此期间根据Gateway术语学,所述PCR片段与pDONR201质粒在体内重组以产生“进入克隆”,pbHLH12-样。质粒pDONR201作为Gateway
Figure BDA0000128813510001761
技术的部分从Invitrogen购买。
包含SEQ ID NO:279的进入克隆随后在LR反应中与用于稻转化法的目的载体一起使用。这种载体含有在T-DNA边界内部的植物选择标记、筛选标记表达盒和意图与已经克隆在该进入克隆中的目的核酸序列发生LR体内重组的Gateway盒作为功能性元件。用于组成型特异性表达的稻GOS2启动子(SEQ ID NO:411)位于该Gateway盒上游。
在所述LR重组步骤后,所得表达载体pGOS2::bHLH12-样(图10)根据本领域熟知的方法转化入农杆菌菌株LBA4044。
7.5:醇脱氢酶(ADH2)多肽
本发明方法中所用的核酸序列通过PCR,使用定制的甘蔗属cDNA文库(在pCMV Sport 6.0内;Invitrogen,Paisley,UK)进行扩增。使用HifiTaq DNA聚合酶,在标准条件下利用在50μl PCR混合物中的200ng模板进行PCR。所用的引物是prm08126(SEQ ID NO:457;有义,起始密码子为粗体字):5’-ggggacaagtttgtacaaaaaagcaggcttaaacaatggcttcccccacc-3’和prm08127(SEQ ID NO:458,反向,互补):5’-ggggaccactttgtacaagaaagctgggtgacatatatgcaaacggctt-3’,其中所述引物包括用于Gateway重组的AttB位点。也使用标准方法纯化扩增的PCR片段。随后进行Gateway方法的第一步骤,即BP反应,在此期间根据Gateway术语学,所述PCR片段与pDONR201质粒在体内重组以产生“进入克隆”,pADH2。质粒pDONR201作为Gateway
Figure BDA0000128813510001762
技术的部分从Invitrogen购买。
包含SEQ ID NO:412的进入克隆随后在LR反应中与用于稻转化法的目的载体一起使用。这种载体含有在T-DNA边界内部的植物选择标记、筛选标记表达盒和意图与已经克隆在该进入克隆中的目的核酸序列发生LR体内重组的Gateway盒作为功能性元件。用于种子特异性表达的稻推定的蛋白酶抑制剂启动子(SEQ ID NO:456)位于该Gateway盒上游。
在所述LR重组步骤后,所得表达载体p蛋白酶抑制剂::ADH2(图13)根据本领域熟知的方法转化入农杆菌菌株LBA4044。
7.6:GCN5-样多肽
本发明方法中所用的核酸序列通过PCR,使用定制的稻幼苗cDNA文库(在pCMV Sport 6.0内;Invitrogen,Paisley,UK)作为模板进行扩增。使用Hifi Taq DNA聚合酶,在标准条件下利用在50μl PCR混合物中的200ng模板进行PCR。所用的引物prm 10643(SEQ ID NO:515;有义,起始密码子为粗体字):5’-ggggacaagtttgtacaaaaaagcaggcttaaacaatggacggcctcgcgg-3’和prm 10644(SEQ ID NO:516,反向,互补):5’-ggggaccactttgtacaagaaagctgggtaagtgactacccaatgcgccc-3’,其中所述引物包括用于Gateway重组的AttB位点。也使用标准方法纯化扩增的PCR片段。随后进行Gateway方法的第一步骤,即BP反应,在此期间根据Gateway术语学,所述PCR片段与pDONR201质粒在体内重组以产生“进入克隆”,pGCN5。质粒pDONR201作为Gateway
Figure BDA0000128813510001771
技术的部分从Invitrogen购买。
包含SEQ ID NO:459的进入克隆随后在LR反应中与用于稻转化法的目的载体一起使用。这种载体含有在T-DNA边界内部的植物选择标记、筛选标记表达盒和意图与已经克隆在该进入克隆中的目的核酸序列发生LR体内重组的Gateway盒作为功能性元件。用于组成型特异性表达的稻GOS2启动子(SEQ ID NO:513)位于该Gateway盒上游。
在所述LR重组步骤后,所得表达载体pGOS2::GCN5(图16)根据本领域熟知的方法转化入农杆菌菌株LBA4044。
以相同的方式,从Populus trichocarpa cDNA文库克隆SEQ IDNO:475,使用引物prm12019:ggggacaagtttgtacaaaaaagcaggcttaaacaatggacactcactctcactta(正向引物)和prm12020:ggggaccactttgtacaagaaagctgggtaatattgatctcctaagaactg(反向引物),并且将其引入到农杆菌LBA4044用于稻转化。
实施例8:植物转化
稻转化
使用含有所述表达载体的农杆菌来转化稻植物。将稻粳型栽培品种Nipponbare的成熟干燥种子脱壳。通过如下方式实施消毒:在70%乙醇中孵育1分钟,随后在0.2%HgCl2中孵育30分钟,随后用无菌蒸馏水洗涤6次15分钟。无菌的种子随后在含有2,4-D的培养基(愈伤组织诱导培养基)上萌发。在黑暗中孵育4周后,将胚发生的盾片衍生的愈伤组织切下并在相同的培养基上增殖。2周后,将所述愈伤组织通过在同一种培养基上传代培养另外2周进行繁殖或增殖。胚发生的愈伤组织片在新鲜培养基上传代培养3日,随后共培育(以助长细胞分裂活性)。
将含有所述表达载体的农杆菌菌株LBA4404用于共培育。农杆菌接种在含有适宜抗生素的AB培养基上并在28℃培养3日。随后收集细菌并在液体共培育培养基中悬浮至密度(OD600)约1。该悬液随后转移至培养皿内并将所述愈伤组织浸没于此悬液中15分钟。该愈伤组织随后在滤纸上蘸干并转移至固化的共培育培养基,并在25℃于黑暗中孵育3日。共培育的愈伤组织在含2,4-D的培养基上在28℃于黑暗中在选择剂存在下培育4周。在此期间,迅速生长的抗性愈伤组织团发育。将这种材料转移至再生培养基并在光照下孵育后,释放了胚发生潜能并且枝条在随后4至5周内发育。将枝条从愈伤组织上切下并且在含有植物生长素的培养基上孵育2至3周,将枝条从所述培养基转移至土壤。硬化的枝条在温室中于高湿度和短日照下培育。
对于一个构建体,产生大约35个独立的T0稻转化体。将原代转化体从组织培养箱转移至温室。在定量PCR分析验证T-DNA插入物的拷贝数后,仅保留针对所述选择剂显示抗性的单拷贝转基因植物用于收获T1种子。种子随后在移栽后3至5个月收获。该方法以超过50%的比例产生单基因座转化体(Aldemita和Hodges1996,Chan等1993,Hiei等1994)。
实施例9:转化其它作物
玉米转化
玉米(Zea mays)的转化用Ishida等人(1996).Nature Biotech 14(6):745-50所述方法的改良方法进行。在玉米中,转化是基因型依赖的并且仅特定基因型适合于转化和再生。近交系A188(明尼苏达大学)或以A188作为亲本的杂交体是用于转化的供体材料的良好来源,不过其他基因型也可以成功地使用。谷穗在授粉后大约11日(DAP)从玉米植物收获,此时不成熟胚的长度是大约1至1.2mm。不成熟的胚与含有所述表达载体的根癌农杆菌共培育,并且转基因植物通过器官发生过程回收。切下的胚在愈伤组织诱导培养基上、随后在玉米再生培养基上培育,其中所述的培养基含有选择剂(例如咪唑啉酮,不过可以使用不同的选择标记)。培养板在25℃于光照下孵育2-3周,或直至枝条发育。将源自每个胚的绿色枝条转移至玉米生根培养基并在25℃孵育2-3周,直至根发育。将生根的枝条移植至温室中的土壤内。从针对所述选择剂显示耐受性并且含有单拷贝T-DNA插入物的植物产生T1种子。
小麦转化
小麦的转化用Ishida等人(1996)Nature Biotech 14(6):745-50描述的方法进行。栽培品种Bobwhite(可从墨西哥CIMMYT获得)通常用于转化中。不成熟的胚与含有所述表达载体的根癌农杆菌培育,并且转基因植物通过器官发生过程回收。在与农杆菌培育后,所述胚在愈伤组织诱导培养基上、随后在玉米再生培养基上体外培育,其中所述的培养基含有选择剂(例如咪唑啉酮,不过可以使用不同的选择标记)。培养板在25℃于光照下孵育2-3周,或直至枝条发育。将源自每个胚的绿色枝条转移至生根培养基并在25℃孵育2-3周,直至根发育。将生根的枝条移植至温室中的土壤内。从针对所述选择剂显示耐受性并且含有单拷贝T-DNA插入物的植物产生T1种子。
大豆转化
根据对Texas A&M美国专利5,164,310中所述方法的改良方法转化大豆。几个商业大豆品种适合于通过这种方法转化。栽培品种Jack(从Illinois种子基金会可获得)通常用于转化。对大豆种子消毒以便体外播种。将下胚轴、胚根和一片子叶从7日龄年幼幼苗中切下。进一步培育上胚轴和剩余子叶以使辅助节发育。切下这些辅助节并与含有所述表达载体的根癌农杆菌孵育。在共培育处理之后,洗涤外植体并转移至选择培养基。切下再生的枝条并置于枝条伸长培养基上。将长度不超过1cm的枝条置于生根培养基上直至根发育。将生根的枝条移植至温室中的土壤内。从针对所述选择剂显示耐受性并且含有单拷贝T-DNA插入物的植物产生T1种子。
油菜/卡诺拉油菜转化
使用5-6日龄年幼幼苗的子叶柄和下胚轴作为用于组织培养的外植体并且根据Babic等人(1998,Plant Cell Rep 17:183-188)进行转化。商业品种Westar(Agriculture Canada)是用于转化的标准品种,不过其他品种也可以使用。对卡诺拉油菜种子进行表面消毒以便体外播种。从所述体外幼苗切下附带子叶的子叶叶柄外植体,并且通过将此叶柄外植体的切口末端浸入细菌悬液以(含有所述表达载体的)农杆菌接种。所述外植体随后在23℃,16小时光照下于含有3mg/l BAP、3%蔗糖、0.7%植物琼脂的MSBAP-3培养基上培养2日。与农杆菌共培育2日后,将所述叶柄外植体转移至含有3mg/l BAP、头孢噻肟、羧苄青霉素或特美汀(300mg/l)的MSBAP-3培养基上培养7日,并且随后在含有头孢噻肟、羧苄青霉素或特美汀和选择剂的MSBAP-3培养基上培养,直至枝条再生。当枝条长度是5-10mm时,切下这些枝条并转移至枝条伸长培养基(MSBAP-0.5,含有0.5mg/l BAP)。将长度大约2cm的枝条转移至生根培养基(MS0)用于根诱导。将生根的枝条(shoot)移植至温室中的土壤内。从针对所述选择剂显示耐受性并且含有单拷贝T-DNA插入物的植物产生T1种子。
苜蓿转化
使用(McKersie等,1999 Plant Physiol 119:839-847)的方法转化苜蓿((Medicago sativa))的再生性克隆。苜蓿的再生和转化是基因型依赖性的并且因而需要再生性植物。已经描述了获得再生性植物的方法。例如,这些再生性植物可以选自栽培品种Rangelander(Agriculture Canada)或如Brown DCW和A Atanassov(1985.Plant Cell Tissue Culture 4:111-112)所述的任何其他商业苜蓿品种。备选地,已经选择RA3品种(威斯康星大学)用于组织培养(Walker等,1978 Am J Bot 65:654-659)。叶柄外植体与含有所述表达载体的根癌农杆菌C58C1 pMP90(McKersie等,1999PlantPhysiol 119:839-847)或LBA4404的过夜培养物共培育。所述外植体在黑暗中于含有288mg/L Pro、53mg/L硫代脯氨酸、4.35g/L K2SO4和100μm乙酰丁香酮的SH诱导培养基上共培育3日。所述外植体在浓度减半的Murashige-Skoog培养基(Murashige和Skoog,1962)中洗涤并铺种在不含乙酰丁香酮而含有合适选择剂和抑止农杆菌生长的合适抗生素的相同SH诱导培养基上。几周后,将体细胞胚转移至不含生长调节剂、不含抗生素和含有50g/L蔗糖的BOi2Y发育培养基中。体细胞胚随后在浓度减半的Murashige-Skoog培养基上萌发。生根的幼苗移植至花钵内并且在温室中培育。从针对所述选择剂显示耐受性并且含有单拷贝T-DNA插入物的植物产生T1种子。
棉花转化
使用根癌农杆菌根据US5,159,135中描述的方法转化棉花。将棉花种子在3%次氯酸钠溶液中在20分钟的期间内表面灭菌,并且在具500μg/ml头孢噻肟的蒸馏水中洗涤。然后将种子转移至具有50μg/ml苯菌灵的SH培养基中用于萌发。将4-6日龄的幼苗的下胚轴移出,切割成0.5cm的片,放置在0.8%的琼脂上。使用农杆菌悬浮液(大约108个细胞每ml,自用目的基因和适当的选择标记转化的过夜培养物中稀释)用于接种下胚轴外植体。在室温和光照下3天后,将组织转移至固体培养基(1.6g/l Gelrite),其具有Murashige和Skoog盐(具有B5维生素(Gamborg等人,Exp.CellRes.50:151-158(1968))、0.1mg/l 2,4-D、0.1mg/l 6-糠胺嘌呤和750μg/mlMgCL2),并且具有50-100μg/ml的头孢噻肟和400-500μg/ml的羧苄西林以杀死剩余的细菌。在两个或三个月后(每4至6周继代培养)分离单个细胞系,然后将它们进一步培养在选择培养基上用于组织扩增(30℃,16小时光照期)。然后将转化的组织再培养在非选择性培养基中,经过2至3个月以产生体细胞胚。至少4mm长的健康样子的胚被转移至具有SH培养基的试管中,所述培养基在细的蛭石(vermiculite)中,补充有0.1mg/l的吲哚乙酸、6糠胺嘌呤和赤霉酸。将胚培养在30℃,光周期为16小时,并且将第2或3叶阶段的小植株转移到具有蛭石和养分的花盆中。将植物硬化并且随后移到温室中用于进一步培养。
实施例10:表型评价方法
10.1评价建立
产生大约35个独立的T0稻转化体。将原代转化体从组织培养室转移至温室以培育和收获T1种子。留下下述6个事件,其中所述事件的T1子代对所述转基因的存在/不存在以3∶1比例分离。对于这些事件中的每一个,通过监测目视标记表达而选出大约10株含有该转基因的T1幼苗(杂合子和纯合子)和大约10株缺少该转基因的T1幼苗(失效合子)。转基因植物和相应的失效合子以随机的位置并排培育。温室条件是短日照(12小时光照),在光照下28℃和在黑暗中22℃,和70%相对湿度。在非胁迫条件下生长的植物按规定间隔浇水以确保水和养分是非限制性的且满足植物对于完成生长和发育的需要。
在T2世代中,T1事件按照如对T1世代相同的评价方法进一步评估,不过每个事件采用更多个体。植物从播种期至成熟期数次通过数字成像室。在每个时间点上,从至少6个不同角度拍摄每株植物的数字图像(2048x1536像素,1600万颜色)。
干旱筛选
来自T2种子的植物在盆栽土壤中在正常条件下培育直至它们达到抽穗期。随后将它们转移至其中减少灌溉的“干燥”区域。将湿度探针插入随机选择的花钵内,以监测土壤水分含量(SWC)。当SWC低于某个阈值时,自动地对所述植物连续地再灌溉直至再次达到正常水平。随后将植物再次转移至正常条件。其余的培育(植物成熟、种子收获)与并不在非生物胁迫条件下培育的植物相同。如对正常条件下生长详述那样记录生长和产量参数。
氮使用效率筛选
源自T2种子的稻植物在盆栽土壤中于正常条件下培育,除了营养溶液之外。从移植至成熟期间用氮(N)含量降低、通常7至8倍之间降低的特定营养溶液浇灌所述花钵。其余的培育(植物成熟、种子收获)与并不在非生物胁迫下培育的植物相同。如对正常条件下的生长详述那样记录生长和产量参数。
盐胁迫筛选
植物在由椰子纤维和argex(3∶1比率)组成的基质上培育。在温室中移植小植物后,在头两周期间使用正常营养溶液。在这两周后,添加25mM盐(NaCl)至所述营养溶液,直至收获植物。随后测量种子相关参数。
10.2统计分析:F-检验
使用两因素ANOVA(变量分析)作为整体评价植物表型特征的统计模型。对于用本发明基因转化的全部事件的全部植物的全部所测量参数实施F检验。实施F检验以检查该基因对全部转化事件的影响并验证该基因的整体作用(又称作基因总体作用)。真实基因总体作用显著性的阈值对于所述F检验设置在5%概率水平上。显著性F检验值指出基因作用,这意味不仅仅是基因的存在或位置才造成表型上的差异。
当实施具有重叠事件的两个实验时,进行联合分析。这用于检验对这两个实验影响的一致性,并且若是一致的,则用于积累来自两个实验的证据以增加结论的可信度。所用方法是考虑数据的多重水平结构的混合模型法(即实验-事件-分离子)。通过比较针对卡方分布的似然比检验而获得P-值。
10.3测量的参数
生物量相关的参数测量
植物从播种期至成熟期数次通过数字成像室。在每个时间点上,从至少6个不同角度拍摄每株植物的数字图像(2048x1536像素,1600万颜色)。
植物地上部分面积(或叶生物量)通过计数来自植物地上部分的数字图像上区别于背景的像素总数而确定。该值对相同时间点上从不同角度拍摄的画面进行平均化并且转化成通过校正以平方mm表述的物理表面值。实验证实以这种方式测量的地上部分植物面积与地上植物部分的生物量相关。地上部分面积是植物已经实现其最大叶生物量的时间点上所测量的面积。早期萌发势是萌发后3周的植物(幼苗)地上部分的面积。根生物量的增加表示为总根生物量的增加(按照植物寿命期间观察到的根最大生物量进行测量),或表示为根/枝条指数的增加(按照在根和枝条活性生长期间根量和枝条量之间的比例进行测量)。
早期萌发势通过计数来自地上植物部分的区别于背景的像素总数确定。该值对相同时间点上从不同角度拍摄的画面进行平均化并且转化成通过校正以平方mm表述的物理表面值。下述结果针对萌发后3周的植物。
种子相关的参数测量
将成熟的原发圆锥花序收获、计数、装袋、加条形码标记并且随后在干燥箱内于37°干燥3日。随后将所述圆锥花序脱粒,并且收集和计数全部种子。饱满壳使用吹气装置与空壳分开。弃去空壳并且再次计数剩余部分。饱满壳在分析天平上称重。饱满种子数通过计数所述分离步骤后仍留下的饱满壳的数目来确定。种子总产量通过称量从一株植物收获的全部饱满壳而测量。每株植物的种子总数通过计数从一株植物收获的壳数目测量。千粒重(TKW)是从计数的饱满种子数量和它们的总重量外推出来的。收获指数(HI)在本发明中定义为种子总产量与地上部分面积(mm2)之间的比率,乘以系数106。如本发明定义的每圆锥花序的花总数是种子总数和成熟的初级圆锥花序的数量之间的比例。如本发明中定义的种子饱满率是饱满种子数对种子(或小花)总数的比例(表述为%)。
实施例11:转基因植物的表型评价结果
11.1无色花色素双加氧酶(LDOX)多肽
在T1世代中评估植物。在下文中显示在氮限制条件下的表达LDOX核酸的转基因稻植物的评估结果。观察到地上部分生物量(AreaMax)、早期萌发势(EmerVigor)、根生物量(RootMax和RootThickMax)、种子总数、第一圆锥花序数和千粒重的增加(表E1)。
表E1:转基因稻植物的数据概述;对于每个参数,针对T1世代显示总体百分数增加,对于每个参数,p值<0.05。
  参数   总体增加
  AreaMax   8.1
  EmerVigor   11.6
  RootMax   6.2
  nrtotalseed   39.4
  TKW   17.2
  第一圆锥花序数(firstpan)   80.6
  RootThickMax   13.9
11.2I型酪蛋白激酶(CK1)多肽
下文中显示了在上述氮使用效率筛选部分中描述的氮限制性生长条件下,T2世代中表达包含SEQ ID NO:194的最长可读框的核酸的转基因稻植物的评估结果(表E2)。关于转基因植物的产生,详见前文实施例。
表E2
Figure BDA0000128813510001851
在氮使用效率筛选部分下转基因稻植物的评价结果显示对于千粒重(TKW)和重心(GravityYMax)的增加,这与种子大小和重量的增加以及植物的株冠形状的改变有关,从而以使得株冠重心更高的方式改变了植物高度和/或叶角度。
11.3碱性螺旋环螺旋组12(bHLH12-样)多肽
转基因植物pGOS2::bHLH12-样(SEQ ID NO:280)的表型评价结果
下文中显示了在上述氮使用效率筛选部分中描述的氮限制性生长条件下,T2世代中表达包含SEQ ID NO:279的最长可读框的核酸的转基因稻植物的评估结果(表E3a)。关于转基因植物的产生,详见前文实施例。
表E3a
Figure BDA0000128813510001861
在氮使用效率筛选部分下转基因稻植物的评价结果显示对于千粒重(TKW)和重心(GravityYMax)的增加,这与种子大小和重量的增加以及植物的株冠形状的改变有关,从而以使得株冠重心更高的方式改变了植物高度和/或叶角度。
转基因植物PGOS2::pGOS2::bHLH12-样(SEQ ID NO:395)的表型评价
如上所述在上述氮使用效率筛选部分中描述的氮限制性生长条件下,产生T1世代中的转基因稻植物,通过转化包含与SEQ ID NO:395的最长可读框有效连接的GOS2启动子的遗传构建体。SEQ ID NO:395的最长可读框是通过PCT,根据上述实施例中的方法分离的,使用如下给出的引物:
fwd引物:ggggacaagtttgtacaaaaaagcaggcttaaacaatgaatgagaaggacgcca
rev引物:ggggaccactttgtacaagaaagctgggtcttgcttcagttgtggaatca
在氮使用效率筛选下的转基因稻植物的评价结果显示转基因植物相较于对照植物具有增加的产量性状。
转基因植物PGOS2::pGOS2::bHLH12-样(SEQ ID NO:399)的表型评
如上所述产生转基因稻植物,通过转化包含与SEQ ID NO:399的最长可读框有效连接的GOS2启动子的遗传构建体,所述SEQ ID NO:399的最长可读框是通过PCT,根据上述实施例中的方法分离的,使用如下给出的引物:
fwd引物:ggggacaagtttgtacaaaaaagcaggcttaaacaatggcgaatctctcttctgat
rev引物:ggggaccactttgtacaagaaagctgggtaaaacaaaagtcaaagggtcc
在正常生长条件下T1世代转基因稻植物的评价结果显示转基因植物相较于对照植物具有增加的产量相关性状;见表E3b。
表E3b:
  产量性状   与对照植物相比的%增加
  总种子重量(totalwgseeds)   29.8
  饱满率(fillrate)   30.7
  收获指数(harvestindex)   26.7
  饱满种子数(nrfilledseed)   27.4
  HeightMax   5.1
  GravityYMax   6.3
转基因植物PGOS2::pGOS2::bHLH12-样(SEQ ID NO:391)的表型评
如上所述在上述氮使用效率筛选部分中描述的氮限制性生长条件下,产生T1世代中的转基因稻植物,通过转化包含与SEQ ID NO:391的最长可读框有效连接的GOS2启动子的遗传构建体。SEQ ID NO:391的最长可读框是通过PCT,根据上述实施例中的方法分离的,使用如下给出的引物:
fwd引物:ggggacaagtttgtacaaaaaagcaggcttaaacaatgaatgagaaggacgcca
rev引物:ggggaccactttgtacaagaaagctgggtcttgcttcagttgtggaatca
在氮使用效率筛选下的转基因稻植物的评价结果显示转基因植物相较于对照植物具有增加的产量相关性状,特别是观察到下述增加:AreaMax(生物量,3个具有大于5%增加的阳性品系)、TKW(2个具有5%或更多增加的阳性品系),和HeightMax(植物高度,2个具有5%或更多增加的阳性品系)。
11.4醇脱氢酶(ADH2)多肽
下文中显示了在非胁迫条件下,T2世代中表达包含SEQ ID NO:412的最长可读框的核酸的转基因稻植物的评估结果。关于转基因植物的产生,详见前文实施例。
与对照植物相比观察到下列参数的增加:总种子重量、每圆锥花序的花数、饱满率、根生物量、植物高度和千粒重(TKW)。
11.5GCN5-样多肽
下文中显示了在非胁迫条件下,T2世代中表达包含SEQ ID NO:459的最长可读框的核酸的转基因稻植物的评估结果。
下文显示了在非胁迫条件下转基因稻植物的评价结果(表E4)。对于地上部分生物量(AreaMax)、总种子产量(种子总重量)、饱满种子数、饱满率、每圆锥花序的花数、收获植物、到开花时间(time to flower)(TimetoFlower)、每株植物的种子总数(nrtotalseed)、株冠重心(GravityYMax)、根系中厚根比例(RootThickMax)而言,观察到(至少——大于)5%的增加。
表E4:非胁迫条件
  参数   总体
  AreaMax   9.7
  TimetoFlower   6.4
  总种子重量(totalwgseeds)   14.2
  nitrotalseed   8.0
  饱满率(fillrate)   5.0
  收获指数(harvestindex)   5.3
  饱满种子数(nrfilledseed)   12.7
  每圆锥花序的花数(flowerperpan)   7.7
  GravityYMax   5.6
  RootThickMax   8.2
对于每个参数而言,如果其达到p≤0:05且大于5%阈值,显示总体百分数。
在非胁迫条件下生长转化了SEQ ID NO:475的稻植物,并且显示增加的产量(增加的种子产量以及增加的生物量,特别是增加的根生物量),细节如表E5所示。
表E5:在总共6个测试品系的4个最佳品系中产量的平均增加
  平均%增加
  总种子产量   12.8%
  种子总数   12.8%
  每圆锥花序的花数   12.1%
  饱满种子数   16.2%
  根最大   11.4%

Claims (127)

1.相对于对照植物,在植物中增强产量相关性状的方法,包括在植物中调节编码无色花色素双加氧酶(LDOX)多肽的核酸的表达,其中所述LDOX多肽包含异青霉素N合酶结构域(PRINTS进入PR00682)和2OG-Fe(II)加氧酶结构域(PFAM进入PF03171)。
2.权利要求1的方法,其中所述LDOX多肽包括一个或多个基序1至9(SEQ ID NO:173至SEQ ID NO:181)。
3.权利要求1或2的方法,其中所述调节的表达通过在植物中导入和表达编码LDOX多肽的核酸来实现。
4.权利要求1-3的任一项的方法,其中所述编码LDOX多肽的核酸编码表A1中列出的任一种蛋白质,或者是此类核酸的一部分,或者是能够与此类核酸杂交的核酸。
5.权利要求1-4的任一项的方法,其中所述核酸序列编码表A1中给出的任意蛋白质的直向同源物或旁系同源物。
6.前述任一权利要求的方法,其中所述增强的产量相关性状包括相对于对照植物增加的早期萌发势和增加的产量,优选的增加的生物量和/或增加的种子产量。
7.权利要求1-6的任一项的方法,其中所述增强的产量相关性状是在氮缺乏的条件下获得的。
8.权利要求3-7的任一项的方法,其中所述核酸与组成型启动子,优选的与GOS2启动子,最优选的与来自稻的GOS2启动子有效连接。
9.权利要求1-8的任一项的方法,其中所述编码LDOX多肽的核酸是植物来源的,优选的来自双子叶植物,还优选的来自十字花科(Brassicaceae),更优选的来自拟南芥属(Arabidopsis),最优选的来自拟南芥(Arabidopsis thaliana)。
10.通过权利要求1-9的任一项的方法可获得的植物或其部分,包括种子,其中所述植物或其部分包含编码LDOX多肽的重组核酸。
11.构建体,包含:
(i)编码如权利要求1或2定义的LDOX多肽的核酸;
(ii)能够驱动(a)的核酸序列表达的一种或多种控制序列;和任选的
(iii)转录终止序列。
12.权利要求11的构建体,其中一种所述控制序列是组成型启动子,优选的是GOS2启动子,最优选的是来自稻的GOS2启动子。
13.权利要求11或12的构建体在方法中的用途,所述方法用于产生相对于对照植物具有增加的早期萌发势和增加的产量,特别是增加的生物量和/或增加的种子产量的植物。
14.用权利要求11或12的构建体转化的植物、植物部分或植物细胞。
15.用于产生转基因植物的方法,所述转基因植物相对于对照植物具有增加的早期萌发势和增加的产量,特别是增加的生物量和/或增加的种子产量,包括:
(i)在植物中导入和表达编码如权利要求1或2定义的LDOX多肽的核酸;和
(ii)在促进植物生长和发育的条件下培养植物细胞。
16.相对于对照植物,具有增加的早期萌发势和增加的产量,特别是增加的生物量和/或增加的种子产量的转基因植物或源自所述转基因植物的转基因植物细胞,所述转基因植物是由编码如权利要求1或2定义的LDOX多肽的核酸的受调节的表达产生的。
17.权利要求10、14或16的转基因植物,或源自它们的转基因植物细胞,其中所述植物是作物植物或单子叶植物或谷类,例如稻、玉米、小麦、大麦、谷子(millet)、裸麦(rye)、黑小麦(triticale)、高粱、二粒小麦(emmer)、斯佩尔特小麦(spelt)、黑麦属(secale)、单粒小麦、埃塞俄比亚画眉草(teff)、蜀黍(milo)和燕麦。
18.权利要求17的植物的可收获的部分,其中所述可收获的部分优选的是枝条生物量、根生物量和/或种子。
19.源自权利要求17的植物和/或权利要求18的植物的可收获的部分的产物。
20.编码LDOX多肽的核酸在相对于对照植物,在植物中增加产量,特别是增加种子产量和/或枝条生物量中的用途。
21.在植物中增强非生物胁迫耐受性的方法,这是通过在植物中调节编码由SEQ ID NO:186或SEQ ID NO:188所表示的多肽或它们之一的直向同源物或旁系同源物的核酸的表达。
22.权利要求21的方法,其中所述调节的表达通过在植物中导入和表达编码YRP2多肽的核酸来实现。
23.权利要求21或22的方法,其中所述编码YRP5多肽的核酸编码表A2中列出的任一种蛋白质,或者是此类核酸的一部分,或者是能够与此类核酸杂交的核酸。
24.权利要求21-23的任一项的方法,其中所述核酸序列编码表A2中给出的任意蛋白质的直向同源物或旁系同源物。
25.权利要求23或24的方法,其中所述核酸与组成型启动子,优选的与GOS2启动子,最优选的与来自稻的GOS2启动子有效连接。
26.权利要求21-25的任一项的方法,其中所述编码YRP5多肽的核酸是Populus trichocarpa或拟南芥(Arabidopsis thaliana)的。
27.通过权利要求21-26的任一项的方法可获得的植物或其部分,包括种子,其中所述植物或其部分包含编码YRP5多肽的重组核酸。
28.构建体,包含:
(i)编码如权利要求21或22定义的YRP5多肽的核酸;
(ii)能够驱动(a)的核酸序列表达的一种或多种控制序列;和任选的
(iii)转录终止序列。
29.权利要求28的构建体,其中一种所述控制序列是组成型启动子,优选的是GOS2启动子,最优选的是来自稻的GOS2启动子。
30.权利要求28或29的构建体在方法中的用途,所述方法用于产生相对于对照植物具有增加的非生物胁迫耐受性的植物。
31.用权利要求28或29的构建体转化的植物、植物部分或植物细胞。
32.用于产生转基因植物的方法,所述转基因植物相对于对照植物具有增加的非生物胁迫耐受性,包括:
(i)在植物中导入和表达编码YRP5多肽的核酸;和
(ii)在促进非生物胁迫的条件下培养植物细胞。
33.相对于对照植物,具有非生物胁迫耐受性的转基因植物或源自所述转基因植物的转基因植物细胞,所述转基因植物是由编码YRP5多肽的核酸的受调节的表达产生的。
34.权利要求27、31或33的转基因植物,或源自它们的转基因植物细胞,其中所述植物是作物植物或单子叶植物或谷类,例如稻、玉米、小麦、大麦、谷子(millet)、裸麦(rye)、黑小麦(triticale)、高粱、甘蔗、二粒小麦(emmer)、斯佩尔特小麦(spelt)、黑麦属(secale)、单粒小麦、埃塞俄比亚画眉草(teff)、蜀黍(milo)和燕麦。
35.权利要求34的植物的可收获的部分,其中所述可收获的部分优选的是枝条生物量和/或种子。
36.源自权利要求34的植物和/或权利要求35的植物的可收获的部分的产物。
37.编码YRP5多肽的核酸在相对于对照植物增加产量,特别是增加非生物胁迫耐受性中的用途。
38.相对于对照植物,在植物中增强产量相关性状的方法,包括在植物中调节编码酪蛋白激酶1,CK1多肽的核酸的表达。
39.权利要求38的方法,其中所述CK1多肽包含蛋白质基序,所述基序与下列一个或多个基序具有50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性:
(i)基序13:KANQVY(IV)ID(YF)GLAKKYRDLQTH(KR)HIPYRENKNLTGTARYASVNTHLG(VI)EQ(SEQ ID NO:276),
(ii)基序14:CKSYPSEF(VTI)SYFHYCRSLRFEDKPDYSYLKRLFRDLFIREGYQFDYVFDW(SEQ ID NO:277),
(iii)基序15:PSLEDLFNYC(NS)RK(FL)(ST)LKTVLMLADQ(LM)INRVEYMHSRGFLHRDIKPDNFLM(SEQ ID NO:278)
其中括号之间的氨基酸残基代表在该位置备选的氨基酸。
40.权利要求38或39的方法,其中所述调节的表达通过在植物中导入和表达编码CK1多肽的核酸来实现。
41.权利要求38-40的任一项的方法,其中所述编码CK1多肽的核酸编码表A3中列出的任一种蛋白质,或者是此类核酸的一部分,或者是能够与此类核酸杂交的核酸。
42.权利要求38-41的任一项的方法,其中所述核酸序列编码表A3中给出的任意蛋白质的直向同源物或旁系同源物。
43.权利要求38-42的任一项的方法,其中所述增强的产量相关性状包括相对于对照植物增加的产量,优选的增加的生物量和/或增加的种子产量。
44.权利要求38-43的任一项的方法,其中所述增强的产量相关性状在非胁迫条件下获得。
45.权利要求38-43的任一项的方法,其中所述增强的产量相关性状是在干旱胁迫、盐胁迫或氮缺乏的条件下获得的。
46.权利要求40-45的任一项的方法,其中所述核酸与组成型启动子,优选的与GOS2启动子,最优选的与来自稻的GOS2启动子有效连接。
47.权利要求38-46的任一项的方法,其中所述编码CK1多肽的核酸是植物来源的,优选的来自双子叶植物,还优选的来自十字花科(Brassicaceae),更优选的来自拟南芥属(Arabidopsis),最优选的来自拟南芥(Arabidopsis thaliana)。
48.通过权利要求38-47的任一项的方法可获得的植物或其部分,包括种子,其中所述植物或其部分包含编码CK1多肽的重组核酸。
49.构建体,包含:
(i)编码如权利要求38或39定义的CK1多肽的核酸;
(ii)能够驱动(a)的核酸序列表达的一种或多种控制序列;和任选的
(iii)转录终止序列。
50.权利要求49的构建体,其中一种所述控制序列是组成型启动子,优选的是GOS2启动子,最优选的是来自稻的GOS2启动子。
51.权利要求49或50的构建体在方法中的用途,所述方法用于产生相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量的植物。
52.用权利要求49或50的构建体转化的植物、植物部分或植物细胞。
53.用于产生转基因植物的方法,所述转基因植物相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量,包括:
(i)在植物中导入和表达编码如权利要求38或39定义的CK1多肽的核酸;和
(ii)在促进植物生长和发育的条件下培养植物细胞。
54.相对于对照植物,具有增加的产量,特别是增加的生物量和/或增加的种子产量的转基因植物或源自所述转基因植物的转基因植物细胞,所述转基因植物是由编码如权利要求38或39定义的CK1多肽的核酸的受调节的表达产生的。
55.权利要求48、52或54的转基因植物,或源自它们的转基因植物细胞,其中所述植物是作物植物或单子叶植物或谷类,例如稻、玉米、小麦、大麦、谷子(millet)、裸麦(rye)、黑小麦(triticale)、高粱、二粒小麦(emmer)、斯佩尔特小麦(spelt)、黑麦属(secale)、单粒小麦、埃塞俄比亚画眉草(teff)、蜀黍(milo)和燕麦。
56.权利要求55的植物的可收获的部分,其中所述可收获的部分优选的是枝条生物量和/或种子。
57.源自权利要求55的植物和/或权利要求56的植物的可收获的部分的产物。
58.编码CK1多肽的核酸在相对于对照植物,在植物中增加产量,特别是增加种子产量和/或枝条生物量中的用途。
59.选自以下的分离的核酸分子:
(i)由SEQ ID NO:210、212、216、220、228和268中任一所表示的核酸;
(ii)由SEQ ID NO:210、212、216、220、228和268中任一所表示的核酸的互补体;
(iii)编码由SEQ ID NO:211、213、217、221、229和269中任一项所表示的多肽的核酸,其优选作为遗传密码简并性的结果,所述分离的核酸可以衍生自由SEQ ID NO:211、213、217、221、229和269中任一项所表示的多肽序列并且还优选地赋予相对于对照植物增强的产量相关性状;
(iv)核酸,其以增加的优选顺序与表A3的任何核酸序列具有至少30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性,并且还优选地赋予相对于对照植物增强的产量相关性状;
(v)在严格杂交条件下与(i)至(iv)的核酸分子杂交并且优选地赋予相对于对照植物增强的产量相关性状的核酸分子;
(vi)编码钙网蛋白多肽并且优选地赋予相对于对照植物增强的产量相关性状的核酸,所述多肽以增加的优选顺序与SEQ ID NO:211、213、217、221、229和269中任一项所表示的氨基酸序列以及表A3中任何其它氨基酸序列具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性。
60.分离的多肽,所述多肽选自:
(i)SEQ ID NO:211、213、217、221、229和269中任一项所表示的氨基酸序列;
(ii)氨基酸序列,其与SEQ ID NO:211、213、217、221、229和269中任一项所表示的氨基酸序列以及表A3中任何其它氨基酸序列以增加的优选顺序具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性并且优选地赋予相对于对照植物增强的产量相关性状;
(iii)上述(i)或(ii)中给出的任何氨基酸序列的衍生物。
61.相对于对照植物,在植物中增强产量相关性状的方法,包括在植物中调节编码碱性螺旋环螺旋组12,bHLH12-样多肽的核酸的表达。
62.权利要求61的方法,其中所述bHLH12-样多肽包含蛋白质基序,所述基序与一个或多个的基序16至19(SEQ ID NO:404至407)具有50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性。
63.权利要求61或62的方法,其中所述调节的表达通过在植物中导入和表达编码bHLH12-样多肽的核酸来实现。
64.权利要求61-63的任一项的方法,其中所述编码bHLH12-样多肽的核酸编码表A4中列出的任一种蛋白质,或者是此类核酸的一部分,或者是能够与此类核酸杂交的核酸。
65.权利要求61-64的任一项的方法,其中所述核酸序列编码表A4中给出的任意蛋白质的直向同源物或旁系同源物。
66.权利要求61-65的任一项的方法,其中所述增强的产量相关性状包括相对于对照植物增加的产量,优选的增加的生物量和/或增加的种子产量。
67.权利要求61-66的任一项的方法,其中所述增强的产量相关性状在非胁迫条件下获得。
68.权利要求61-66的任一项的方法,其中所述增强的产量相关性状是在干旱胁迫、盐胁迫或氮缺乏的条件下获得的。
69.权利要求63-68的任一项的方法,其中所述核酸与组成型启动子,优选的与GOS2启动子,最优选的与来自稻的GOS2启动子有效连接。
70.权利要求61-69的任一项的方法,其中所述编码bHLH12-样多肽的核酸是植物来源的,优选的来自双子叶植物,还优选的来自十字花科(Brassicaceae),更优选的来自拟南芥属(Arabidopsis),最优选的来自拟南芥(Arabidopsis thaliana)。
71.通过权利要求61-70的任一项的方法可获得的植物或其部分,包括种子,其中所述植物或其部分包含编码bHLH12-样多肽的重组核酸。
72.构建体,包含:
(i)编码如权利要求61或62定义的bHLH12-样多肽的核酸;
(ii)能够驱动(a)的核酸序列表达的一种或多种控制序列;和任选的
(iii)转录终止序列。
73.权利要求72的构建体,其中一种所述控制序列是组成型启动子,优选的是GOS2启动子,最优选的是来自稻的GOS2启动子。
74.权利要求72或73的构建体在方法中的用途,所述方法用于产生相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量的植物。
75.用权利要求72或73的构建体转化的植物、植物部分或植物细胞。
76.用于产生转基因植物的方法,所述转基因植物相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量,包括:
(i)在植物中导入和表达编码如权利要求61或62定义的bHLH12-样多肽的核酸;和
(ii)在促进植物生长和发育的条件下培养植物细胞。
77.相对于对照植物,具有增加的产量,特别是增加的生物量和/或增加的种子产量的转基因植物或源自所述转基因植物的转基因植物细胞,所述转基因植物是由编码如权利要求61或62定义的bHLH12-样多肽的核酸的受调节的表达产生的。
78.权利要求71、75或77的转基因植物,或源自它们的转基因植物细胞,其中所述植物是作物植物或单子叶植物或谷类,例如稻、玉米、小麦、大麦、谷子(millet)、裸麦(rye)、黑小麦(triticale)、高粱、二粒小麦(emmer)、斯佩尔特小麦(spelt)、黑麦属(secale)、单粒小麦、埃塞俄比亚画眉草(teff)、蜀黍(milo)和燕麦。
79.权利要求78的植物的可收获的部分,其中所述可收获的部分优选的是枝条生物量和/或种子。
80.源自权利要求78的植物和/或权利要求79的植物的可收获的部分的产物。
81.编码bHLH12-样多肽的核酸在相对于对照植物,在植物中增加产量,特别是增加种子产量和/或枝条生物量中的用途。
82.选自以下的分离的核酸分子:
(i)由SEQ ID NO:279和335中任一所表示的核酸;
(ii)由SEQ ID NO:279和335中任一所表示的核酸的互补体;
(iii)编码由SEQ ID NO:280和336中任一项所表示的多肽的核酸,其优选作为遗传密码简并性的结果,所述分离的核酸可以衍生自由SEQ ID NO:280和336中任一项所表示的多肽序列并且还优选地赋予相对于对照植物增强的产量相关性状;
(iv)核酸,其以增加的优选顺序与表A4的任何核酸序列具有至少30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性,并且还优选地赋予相对于对照植物增强的产量相关性状;
(v)在严格杂交条件下与(i)至(iv)的核酸分子杂交并且优选地赋予相对于对照植物增强的产量相关性状的核酸分子;
(vi)编码bHLH12-样多肽并且优选地赋予相对于对照植物增强的产量相关性状的核酸,所述多肽以增加的优选顺序与SEQ ID NO:280和336中任一项所表示的氨基酸序列以及表A4中任何其它氨基酸序列具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性。
83.分离的多肽,所述多肽选自:
(i)SEQ ID NO:280和336中任一项所表示的氨基酸序列;
(ii)氨基酸序列,其与SEQ ID NO:280和336中任一项所表示的氨基酸序列以及表A4中任何其它氨基酸序列以增加的优选顺序具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性并且优选地赋予相对于对照植物增强的产量相关性状;
(iii)上述(i)或(ii)中给出的任何氨基酸序列的衍生物。
84.相对于对照植物,在植物中增强产量相关性状的方法,包括在植物中调节编码ADH2多肽的核酸的表达,其中所述ADH2多肽包含:
a GROES结构域(结构域1):
AGEVRVKILFTALCHTDHYTWSGKDPEGLFPCILGHEAAGVVESVGEGVTEVQPGDHVIPCYQAECKECKFCKSGKTNLCGKVRGATGVGVMMNDMKSRFSVNGKPIYHFTGTSTFSQYTVVHDVSVAKI,或以增加的优选顺序与结构域1具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或更多序列同一性的结构域;和
b 锌结合脱氢酶结构域(结构域2):
AGSIVAVFGLGTVGLAVAEGAKAAGASRIIGIDIDNKKFDVAKNFGVTEFVNPKDHDKPIQQVLVDLTDGGVDYSFECIGNVSVMRAALECCHKDWGTSVIVGVAASGQEIATRPFQLVTGRVVVKGTAFGGFKSRTQVPWLVD,或与结构域2以增加的优选顺序具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或更多的序列同一性的结构域;以及任选地还有
c DUF61结构域(结构域3):VDKYMNKEVK、或与结构域3以增加的优选顺序具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或更多的序列同一性的结构域。
85.权利要求84的方法,其中所述ADH2多肽包含一个或多个的基序20至30,或者与下述结构域III任何一个基序20至30以增加的优选顺序具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或更多的序列同一性的基序:
基序20:HYTWSGKDP(SEQ ID NO:445);
基序21:PCYQAECK(SEQ ID NO:446);
基序22:GKTNLCGKVRGATGVGVMMND(SEQ ID NO:447);
基序23:YHFMGTSTFSQYTVVHDVSVAKINPQAPLDKVCLLGCGVPTGLG(SEQID NO:448);
基序24:WNTAKVEAGSIVAVFGLGTVGLAVAEG(SEQ ID NO:449);
基序25:GASRIIGIDIDNKKFDVAKNFGVTEFVN(SEQ ID NO:450);
基序26:KDHDKPIQLVLVDIAD(SEQ ID NO:451);
基序27:SVRRAAEEC(SEQ ID NO:452);
基序28:WGTSVIVGVAASGQEIATRPFQLVTGRVWKGTAFGGF(SEQ ID NO:453);
基序29:KVDEYITH(SEQ ID NO:454);
基序30:MLKGESIRCIITM(SEQ ID NO:455)。
86.权利要求84或85的方法,其中所述调节的表达通过在植物中导入和表达编码ADH2多肽的核酸来实现。
87.权利要求84-86的任一项的方法,其中所述编码ADH2多肽的核酸编码表A5中列出的任一种蛋白质,或者是此类核酸的一部分,或者是能够与此类核酸杂交的核酸。
88.权利要求84-87的任一项的方法,其中所述核酸序列编码表A5中给出的任意蛋白质的直向同源物或旁系同源物。
89.权利要求84-88的任一项的方法,其中所述增强的产量相关性状包括相对于对照植物增加的产量,优选的增加的生物量和/或增加的种子产量。
90.权利要求84-89的任一项的方法,其中所述增强的产量相关性状是在非胁迫的条件下获得的。
91.权利要求86-90的任一项的方法,其中所述核酸与种子特异性启动子,优选的与启动子,最优选的与来自稻的推定的蛋白酶抑制剂启动子有效连接。
92.权利要求84-91的任一项的方法,其中所述编码ADH2多肽的核酸是植物来源的,优选的来自单子叶植物,还优选的来自甘蔗属(Saccharum),最优选的来自甘蔗(Saccharum officinarum)。
93.通过权利要求84-92的任一项的方法可获得的植物或其部分,包括种子,其中所述植物或其部分包含编码ADH2多肽的重组核酸。
94.构建体,包含:
(i)编码如权利要求84或85定义的ADH2多肽的核酸;
(ii)能够驱动(a)的核酸序列表达的一种或多种控制序列;和任选的
(iii)转录终止序列。
95.权利要求94的构建体,其中一种所述控制序列是种子特异性启动子,优选的是推定的蛋白酶抑制剂启动子,最优选的是来自稻的推定的蛋白酶抑制剂启动子。
96.权利要求94或95的构建体在方法中的用途,所述方法用于产生相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量的植物。
97.用权利要求94或95的构建体转化的植物、植物部分或植物细胞。
98.用于产生转基因植物的方法,所述转基因植物相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量,包括:
(i)在植物中导入和表达编码如权利要求84或85定义的ADH2多肽的核酸;和
(ii)在促进植物生长和发育的条件下培养植物细胞。
99.相对于对照植物,具有增加的产量,特别是增加的生物量和/或增加的种子产量的转基因植物或源自所述转基因植物的转基因植物细胞,所述转基因植物是由编码如权利要求84或85定义的ADH2多肽的核酸的受调节的表达产生的。
100.权利要求93、97或99的转基因植物,或源自它们的转基因植物细胞,其中所述植物是作物植物或单子叶植物或谷类,例如稻、玉米、小麦、大麦、谷子(millet)、裸麦(rye)、黑小麦(triticale)、高粱、二粒小麦(emmer)、斯佩尔特小麦(spelt)、黑麦属(secale)、单粒小麦、埃塞俄比亚画眉草(teff)、蜀黍(milo)和燕麦。
101.权利要求100的植物的可收获的部分,其中所述可收获的部分优选的是枝条生物量和/或种子。
102.源自权利要求100的植物和/或权利要求101的植物的可收获的部分的产物。
103.编码如权利要求84或85中所定义的ADH2多肽的核酸在相对于对照植物,在植物中增加产量,特别是增加种子产量和/或生物量中的用途。
104.相对于对照植物,在植物中增强产量相关性状的方法,包括在植物中调节编码GCN5-样多肽的核酸的表达,其中所述多肽包含具有PFam登录号PF00583和PF00439的两个结构域。
105.根据权利要求104的方法,其中所述GCN5多肽还包含下列基序:
(i)基序31:LKF[VL]C[YL]SNDGVD[EQ]HM[IV]WL[IV]GLKNIFARQLPNMPKEYIVRLVMDR[ST]HKS[MV]M(SEQ ID NO:501),
(ii)基序32:FGEIAFCAITADEQVKGYGTRLMNHLKQ[HY]ARD[AV]DGLTHFLTYADNNAVGY(SEQ ID NO:502),
(iii)基序33:H[AP]DAWPFKEPVD[SA]RDVPDYYDIIKDP[IM]DLKT[MI]S[KR]RV[ED]SEQYYVTLEMFVA(SEQ ID NO:503)。
106.根据权利要求104或105的方法,其中所述GCN5多肽还包含任何一个或多个下列基序:
(i)基序34:LKF[LV]C[YL]SNDG[VI]DEHM[IV]WL[IV]GLKNIFARQLPNMPKEYIVRLVMDR[TS]HKS[MV]M(SEQ ID NO:504),
(ii)基序35:FGEIAFCAITADEQVKGYGTRLMNHLKQHARD[AVM]DGLTHFLTYADNNAVGY(SEQ ID NO:505),
(iii)基序36:KQGFTKEI[THY][LF][DE]K[ED]RW[QH]GYIKDYDGGILMECKID[PQ]KLPY[TV]DL[AS]TMIRRQRQ(SEQ ID NO:506)。
107.根据权利要求104至106的任一项的方法,其中所述GCN5多肽还包含任何一个或多个下列基序:
(i)基序37:LKFVC[LY]SND[GDS][VI]DEHM[VM][WCR]LIGLKNIFARQLPNMPKEYIVRL[VL]MDR[SGK]HKSVM(SEQ ID NO:507),
(ii)基序38:CAITADEQVKGYGTRLMNHLKQ[HFY]ARD[MV]DGLTHFLTYADNNAVGYF[IV]KQGF(SEQ ID NO:508),
G(iii)基序39:W[QH]G[YF]IKDYDGG[IL]LMECKID[PQ]KL[PS]YTDLS[TS]MIR[RQ]QR[QK]AIDE[KR]IRELS NC[HQ][IN](SEQ ID NO:509)。
108.根据权利要求104至107的任一项的方法,其中所述GCN5多肽还包含任何一个或多个下列基序:
(i)基序40:FLCYSNDGVDEHMIWLVGLKNIFARQLPNMPKEYIVRLVMDRTHKSMMVI(SEQ ID NO:510),
(ii)基序41:MNHLKQHARDADGLTHFLTYADNNAVGY[FL]VKQGFTKEIT[LF]DKERWQGYIK(SEQ ID NO:511),
(iii)基序42:IR[ED]LSNCHIVY[SP]GIDFQKKEAGIPRR[LT][MI]KPEDI[PQ]GLREAGWTPDQ[WL]GHSK(SEQ ID NO:512)。
109.权利要求104或105的方法,其中所述调节的表达通过在植物中导入和表达编码如任何前述权利要求所定义的GCN5多肽的核酸来实现。
110.权利要求104-109的任一项的方法,其中所述编码GCN5多肽的核酸编码表A6中列出的任一种蛋白质,或者是此类核酸的一部分,或者是能够与此类核酸杂交的核酸。
111.权利要求104-110的任一项的方法,其中所述核酸序列编码表A6中给出的任意蛋白质的直向同源物或旁系同源物。
112.权利要求104-111的任一项的方法,其中所述增强的产量相关性状包括相对于对照植物增加的产量,优选的增加的生物量和/或增加的种子产量。
113.权利要求104-112的任一项的方法,其中所述增强的产量相关性状是在非胁迫条件下获得的。
114.权利要求104至112的任一项的方法,其中所述增强的产量相关性状是在干旱胁迫、盐胁迫或氮缺乏条件下获得的。
115.权利要求109-111的任一项的方法,其中所述核酸与组成型启动子,优选的与GOS2启动子,最优选的与来自稻的GOS2启动子有效连接。
116.权利要求104-115的任一项的方法,其中所述编码GCN5多肽的核酸是植物来源的,优选的来自双子叶植物,还优选的来自十字花科(Brassicaceae),更优选的来自拟南芥属(Arabidopsis),最优选的来自拟南芥(Arabidopsis thaliana)。
117.通过权利要求104-116的任一项的方法可获得的植物或其部分,包括种子,其中所述植物或其部分包含编码GCN5多肽的重组核酸。
118.构建体,包含:
(i)编码如权利要求104至108定义的GCN5多肽的核酸;
(ii)能够驱动(a)的核酸序列表达的一种或多种控制序列;和任选的
(iii)转录终止序列。
119.权利要求118的构建体,其中一种所述控制序列是组成型启动子,优选的是GOS2启动子,最优选的是来自稻的GOS2启动子。
120.权利要求118或119的构建体在方法中的用途,所述方法用于产生相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量的植物。
121.用权利要求118或119的构建体转化的植物、植物部分或植物细胞。
122.用于产生转基因植物的方法,所述转基因植物相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量,包括:
(i)在植物中导入和表达编码如权利要求104至108定义的GCN5多肽的核酸;和
(ii)在促进植物生长和发育的条件下培养植物细胞。
123.相对于对照植物,具有增加的产量,特别是增加的生物量和/或增加的种子产量的转基因植物或源自所述转基因植物的转基因植物细胞,所述转基因植物是由编码如权利要求104至108定义的GCN5多肽的核酸的受调节的表达产生的。
124.权利要求121、122或123的转基因植物,或源自它们的转基因植物细胞,其中所述植物是作物植物或单子叶植物或谷类,例如稻、玉米、小麦、大麦、谷子(millet)、裸麦(rye)、黑小麦(triticale)、高粱、二粒小麦(emmer)、斯佩尔特小麦(spelt)、黑麦属(secale)、单粒小麦、埃塞俄比亚画眉草(teff)、蜀黍(milo)和燕麦。
125.权利要求124的植物的可收获的部分,其中所述可收获的部分优选的是枝条生物量和/或种子。
126.源自权利要求124的植物和/或权利要求125的植物的可收获的部分的产物。
127.编码GCN5多肽的核酸在相对于对照植物,在植物中增加产量,特别是增加种子产量和/或枝条生物量中的用途。
CN201080030215.8A 2009-05-06 2010-04-28 具有增强的产量相关性状和/或增强的非生物胁迫耐受性的植物和制备其的方法 Expired - Fee Related CN102803291B (zh)

Applications Claiming Priority (25)

Application Number Priority Date Filing Date Title
EP09159540 2009-05-06
EP09159540.5 2009-05-06
EP09160832.3 2009-05-20
EP09160832 2009-05-20
EP09160825.7 2009-05-20
EP09160835 2009-05-20
EP09160835.6 2009-05-20
EP09160825 2009-05-20
EP09161000.6 2009-05-25
EP09161000 2009-05-25
EP09161002 2009-05-25
EP09161002.2 2009-05-25
US18169709P 2009-05-28 2009-05-28
US18169409P 2009-05-28 2009-05-28
US61/181,694 2009-05-28
US61/181,697 2009-05-28
US21847609P 2009-06-19 2009-06-19
US21849409P 2009-06-19 2009-06-19
US21850509P 2009-06-19 2009-06-19
US21847109P 2009-06-19 2009-06-19
US61/218,471 2009-06-19
US61/218,476 2009-06-19
US61/218,494 2009-06-19
US61/218,505 2009-06-19
PCT/EP2010/055675 WO2010127969A1 (en) 2009-05-06 2010-04-28 Plants having enhanced yield-related traits and/or enhanced abiotic stress tolerance and a method for making the same

Publications (2)

Publication Number Publication Date
CN102803291A true CN102803291A (zh) 2012-11-28
CN102803291B CN102803291B (zh) 2015-11-25

Family

ID=42263381

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201080030215.8A Expired - Fee Related CN102803291B (zh) 2009-05-06 2010-04-28 具有增强的产量相关性状和/或增强的非生物胁迫耐受性的植物和制备其的方法

Country Status (10)

Country Link
US (1) US20120096593A1 (zh)
EP (1) EP2427480A1 (zh)
CN (1) CN102803291B (zh)
AR (1) AR079181A1 (zh)
AU (1) AU2010244546A1 (zh)
CA (1) CA2760754A1 (zh)
DE (1) DE112010002275T5 (zh)
MX (1) MX2011011646A (zh)
WO (1) WO2010127969A1 (zh)
ZA (1) ZA201108833B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103288944A (zh) * 2013-06-08 2013-09-11 清华大学 bHLH17蛋白及其编码基因和其应用
CN103524607A (zh) * 2013-10-14 2014-01-22 中国农业大学 小麦热胁迫相关蛋白TaGCN5及其编码基因和应用
CN104073512A (zh) * 2013-03-29 2014-10-01 中国科学院上海生命科学研究院 一种调控植物内源乙烯含量的方法
CN107151675A (zh) * 2016-03-03 2017-09-12 华中农业大学 乙酰化酶基因OsGCN5在调控水稻抗旱和根发育中的应用
CN111206035A (zh) * 2020-02-17 2020-05-29 河南科技学院 调节目的植物叶片衰老进程的基因及方法及其在棉花作物上的应用
CN113604485A (zh) * 2021-07-14 2021-11-05 西北农林科技大学 拟南芥AtGSNOR基因、蛋白及应用
CN113637679A (zh) * 2021-07-19 2021-11-12 河北农业大学 一种抗逆植物基因及应用
CN116042692A (zh) * 2022-09-30 2023-05-02 山东和正生态农业开发有限公司 一种萱草的遗传转化方法及其应用

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101921752B (zh) * 2010-07-29 2012-07-04 中国农业科学院作物科学研究所 大豆开花调节基因GmCIB6、其编码蛋白及应用
CN103339257A (zh) 2010-12-06 2013-10-02 巴斯夫植物科学有限公司 用于生产具有定义的特异性的合成的启动子的方法
AU2012222999A1 (en) * 2011-02-28 2013-09-19 Basf Plant Science Company Gmbh Plants having enhanced yield-related traits and producing methods thereof
WO2013077419A1 (ja) * 2011-11-22 2013-05-30 国立大学法人名古屋大学 植物体の子実増大機能を有する遺伝子及びその利用
US10323256B2 (en) 2011-12-09 2019-06-18 Ceres, Inc. Transgenic plants having altered biomass composition
CN110646425B (zh) * 2019-09-12 2022-01-28 厦门海晟融创信息技术有限公司 一种烟叶在线辅助定级方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001064928A2 (en) * 2000-03-01 2001-09-07 Research & Development Institute, Inc. Transgenic plants with increased seed yield, biomass and harvest index
US20070039067A1 (en) * 2004-09-30 2007-02-15 Ceres, Inc. Nucleotide sequences and polypeptides encoded thereby useful for modifying plant characteristics
CN1946848A (zh) * 2004-03-01 2007-04-11 克罗普迪塞恩股份有限公司 产量增加的植物及其制备方法
US20070214517A1 (en) * 2004-02-13 2007-09-13 Ceres, Inc. Sequence-determined DNA fragments and corresponding polypeptides encoded thereby
CN101056983A (zh) * 2004-09-13 2007-10-17 孟山都技术有限公司 用于植物的启动子分子

Family Cites Families (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4962028A (en) 1986-07-09 1990-10-09 Dna Plant Technology Corporation Plant promotors
US4987071A (en) 1986-12-03 1991-01-22 University Patents, Inc. RNA ribozyme polymerases, dephosphorylases, restriction endoribonucleases and methods
US5004863B2 (en) 1986-12-03 2000-10-17 Agracetus Genetic engineering of cotton plants and lines
US5116742A (en) 1986-12-03 1992-05-26 University Patents, Inc. RNA ribozyme restriction endoribonucleases and methods
EP0419533A1 (en) 1988-06-01 1991-04-03 THE TEXAS A&M UNIVERSITY SYSTEM Method for transforming plants via the shoot apex
WO1993022443A1 (en) 1992-04-24 1993-11-11 Sri International In vivo homologous sequence targeting in eukaryotic cells
RU94046396A (ru) 1992-06-29 1996-11-10 Джин Ширс Пти.Лтд. (AU) Нуклеиновая кислота, днк, вектор, способ получения растения или животного, способ получения клеток, способ создания животного, животное, трансгенное животное, трансгенное растение, плоды, черенки и семена, растительные клетки, способ вмешательства в репликацию вируса
US5401836A (en) 1992-07-16 1995-03-28 Pioneer Hi-Bre International, Inc. Brassica regulatory sequence for root-specific or root-abundant gene expression
JPH08503853A (ja) 1992-11-30 1996-04-30 チューア,ナム−ハイ 植物における組織−及び発生−特異的な発現を付与する発現モチーフ
JPH09505461A (ja) 1993-07-22 1997-06-03 ジーン シェアーズ プロプライアタリー リミティド Dnaウィルスリボザイム
RU2142998C1 (ru) 1993-11-19 1999-12-20 Биотекнолэджи Рисеч энд Дивелопмент Копэрейшн Химерный регуляторный участок для экспрессии генов в растениях (варианты), кластер для экспрессии гена (варианты), кластер для индуцибельной экспрессии чужеродного гена (варианты), способ экспрессии гена в растении (варианты), способ индуцибельной экспрессии чужеродного гена в растении (варианты) и плазмида (варианты)
AU691550B2 (en) 1993-12-09 1998-05-21 Thomas Jefferson University Compounds and methods for site-directed mutations in eukaryotic cells
US5605793A (en) 1994-02-17 1997-02-25 Affymax Technologies N.V. Methods for in vitro recombination
US6395547B1 (en) 1994-02-17 2002-05-28 Maxygen, Inc. Methods for generating polynucleotides having desired characteristics by iterative selection and recombination
JPH11513256A (ja) 1995-10-06 1999-11-16 プラント ジエネテイツク システムズ エヌ.ブイ 種子粉砕
US7390937B2 (en) 1996-02-14 2008-06-24 The Governors Of The University Of Alberta Plants with enhanced levels of nitrogen utilization proteins in their root epidermis and uses thereof
GB9607517D0 (en) 1996-04-11 1996-06-12 Gene Shears Pty Ltd The use of DNA Sequences
GB9703146D0 (en) 1997-02-14 1997-04-02 Innes John Centre Innov Ltd Methods and means for gene silencing in transgenic plants
GB9710475D0 (en) 1997-05-21 1997-07-16 Zeneca Ltd Gene silencing
GB9720148D0 (en) 1997-09-22 1997-11-26 Innes John Centre Innov Ltd Gene silencing materials and methods
EP2267138B1 (en) 1998-04-08 2016-06-08 Commonwealth Scientific and Industrial Research Organization Methods and means for obtaining modified phenotypes
EP1090124A2 (en) 1998-06-26 2001-04-11 Iowa State University Research Foundation, Inc. MATERIALS AND METHODS FOR THE ALTERATION OF ENZYME AND ACETYL CoA LEVELS IN PLANTS
US6555732B1 (en) 1998-09-14 2003-04-29 Pioneer Hi-Bred International, Inc. Rac-like genes and methods of use
CA2366104C (en) 1999-07-22 2010-07-06 Japan As Represented By Director General Of National Institute Of Agrobiological Resources, Ministry Of Agriculture, Forestry And Fisheries Ultra-fast transformation technique for monocotyledons
HUP0203693A2 (hu) 1999-08-26 2003-04-28 Basf Plant Science Gmbh. Növényi gén expressziója konstitutív növényi V-ATP-áz promoterek irányítása alatt
ATE350481T1 (de) 2003-01-21 2007-01-15 Cropdesign Nv Verwendung der regulatorischen sequenz des gos2- gens aus reis für die genexpression in dikotyledonen pflanzen oder pflanzenzellen
AU2004209624B2 (en) 2003-02-04 2007-12-13 Cropdesign N.V. Rice promoters
EP2436771B1 (en) * 2006-03-31 2015-08-19 BASF Plant Science GmbH Plants having enhanced yield-related traits and a method for making the same
EP2336332A3 (en) * 2008-04-29 2011-11-09 Monsanto Technology LLC Genes and uses for plant enhancement

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001064928A2 (en) * 2000-03-01 2001-09-07 Research & Development Institute, Inc. Transgenic plants with increased seed yield, biomass and harvest index
US20070214517A1 (en) * 2004-02-13 2007-09-13 Ceres, Inc. Sequence-determined DNA fragments and corresponding polypeptides encoded thereby
CN1946848A (zh) * 2004-03-01 2007-04-11 克罗普迪塞恩股份有限公司 产量增加的植物及其制备方法
CN101056983A (zh) * 2004-09-13 2007-10-17 孟山都技术有限公司 用于植物的启动子分子
US20070039067A1 (en) * 2004-09-30 2007-02-15 Ceres, Inc. Nucleotide sequences and polypeptides encoded thereby useful for modifying plant characteristics

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104073512A (zh) * 2013-03-29 2014-10-01 中国科学院上海生命科学研究院 一种调控植物内源乙烯含量的方法
CN103288944A (zh) * 2013-06-08 2013-09-11 清华大学 bHLH17蛋白及其编码基因和其应用
CN103288944B (zh) * 2013-06-08 2015-05-27 清华大学 bHLH17蛋白及其编码基因和其应用
CN103524607A (zh) * 2013-10-14 2014-01-22 中国农业大学 小麦热胁迫相关蛋白TaGCN5及其编码基因和应用
CN107151675A (zh) * 2016-03-03 2017-09-12 华中农业大学 乙酰化酶基因OsGCN5在调控水稻抗旱和根发育中的应用
CN111206035A (zh) * 2020-02-17 2020-05-29 河南科技学院 调节目的植物叶片衰老进程的基因及方法及其在棉花作物上的应用
CN113604485A (zh) * 2021-07-14 2021-11-05 西北农林科技大学 拟南芥AtGSNOR基因、蛋白及应用
CN113637679A (zh) * 2021-07-19 2021-11-12 河北农业大学 一种抗逆植物基因及应用
CN113637679B (zh) * 2021-07-19 2024-03-05 河北农业大学 一种抗逆植物基因及应用
CN116042692A (zh) * 2022-09-30 2023-05-02 山东和正生态农业开发有限公司 一种萱草的遗传转化方法及其应用

Also Published As

Publication number Publication date
US20120096593A1 (en) 2012-04-19
MX2011011646A (es) 2011-11-29
AU2010244546A1 (en) 2011-12-01
CN102803291B (zh) 2015-11-25
AR079181A1 (es) 2012-01-04
EP2427480A1 (en) 2012-03-14
ZA201108833B (en) 2013-02-27
AU2010244546A2 (en) 2012-03-08
DE112010002275T5 (de) 2013-06-20
WO2010127969A1 (en) 2010-11-11
CA2760754A1 (en) 2010-11-11

Similar Documents

Publication Publication Date Title
EP2004829B1 (en) Plants having enhanced yield-related traits and a method for making the same
RU2503721C2 (ru) Растения, имеющие усиленные признаки, связанные с урожайностью, и способ их получения
CN102131934B (zh) 具有增强的产量相关性状的植物及其制备方法
CN101965405B (zh) 具有增强的产量相关性状的植物和用于制备该植物的方法
CN102803291B (zh) 具有增强的产量相关性状和/或增强的非生物胁迫耐受性的植物和制备其的方法
CN102224247A (zh) 具有改良的产量相关性状的植物和用于制备该植物的方法
CN102666858A (zh) 具有增强的产量相关性状的植物和用于产生该植物的方法
CN102656270A (zh) 具有增强的产量相关性状的植物和用于产生该植物的方法
EP2391719A1 (en) Plants having enhanced yield-related traits and a method for making the same
WO2010000794A1 (en) Plants having enhanced yield-related traits and a method for making the same by overexpressing a polynucleotide encoding a tfl1-like protein
CN102686604A (zh) 具有增强的产量相关性状的植物和用于产生该植物的方法
CN102459614A (zh) 具有增强的产量相关性状的植物和用于产生该植物的方法
EP2268820A1 (en) Plants having enhanced yield-related traits and a method for making the same
CN102066569A (zh) 具有增强的产量相关性状的植物和产生所述植物的方法
WO2010020555A1 (en) Plants having enhanced yield-related traits and a method for making the same
CN102144033A (zh) 具有修饰的生长特征的植物及其制备方法
EP2173884A2 (en) Plants having increased yield-related traits and a method for making the same
EP2109677A1 (en) Plants having enhanced yield-related traits and a method for making the same
CN102099480A (zh) 具有增强的产量相关性状的植物和用于产生该植物的方法
CN102317312A (zh) 具有增强的产量相关性状和/或非生物胁迫耐受性的植物和用于制备此类植物的方法
WO2009016212A2 (en) Plants having enhanced yield-related traits and a method for making the same
CN102753693B (zh) 具有增强的产量相关性状的植物和用于产生该植物的方法
EP2171064A2 (en) Plants having enhanced yield-related traits and a method for making the same

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C53 Correction of patent of invention or patent application
CI03 Correction of invention patent

Correction item: Description

Correct: Add sequence table

False: Missing list

Number: 47

Page: full text

Volume: 31

CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20151125

Termination date: 20170428

CF01 Termination of patent right due to non-payment of annual fee