CN102656270A - 具有增强的产量相关性状的植物和用于产生该植物的方法 - Google Patents

具有增强的产量相关性状的植物和用于产生该植物的方法 Download PDF

Info

Publication number
CN102656270A
CN102656270A CN2010800365778A CN201080036577A CN102656270A CN 102656270 A CN102656270 A CN 102656270A CN 2010800365778 A CN2010800365778 A CN 2010800365778A CN 201080036577 A CN201080036577 A CN 201080036577A CN 102656270 A CN102656270 A CN 102656270A
Authority
CN
China
Prior art keywords
plant
nucleic acid
polypeptide
seq
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2010800365778A
Other languages
English (en)
Other versions
CN102656270B (zh
Inventor
Y·海茨费尔德
A·I·桑兹莫林纳罗
C·勒佐
V·弗兰卡德
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BASF Plant Science Co GmbH
Original Assignee
BASF Plant Science Co GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BASF Plant Science Co GmbH filed Critical BASF Plant Science Co GmbH
Priority to CN201510155059.2A priority Critical patent/CN104762316A/zh
Publication of CN102656270A publication Critical patent/CN102656270A/zh
Application granted granted Critical
Publication of CN102656270B publication Critical patent/CN102656270B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/415Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • C12N15/8271Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance
    • C12N15/8273Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for drought, cold, salt resistance
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A40/00Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
    • Y02A40/10Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture
    • Y02A40/146Genetically Modified [GMO] plants, e.g. transgenic plants

Abstract

本发明一般地涉及分子生物学领域,并涉及通过调节编码eRF1多肽、SCAMP样(分泌载体膜蛋白)多肽、PLATZ(植物富含AT序列和锌结合蛋白质)多肽、PLST样多肽或Glomalin(HSP60,陪伴蛋白CNP60)多肽的核酸在植物中的表达而增强产量相关性状的方法。本发明还涉及具有调节了编码所述多肽之核酸的表达的植物,所述植物相对于相应的野生型植物或其他对照植物而言具有增强的产量相关性状。本发明还提供可用于本发明方法的构建体。

Description

具有增强的产量相关性状的植物和用于产生该植物的方法
本发明一般地涉及分子生物学领域,并涉及通过调节编码eRF1多肽的核酸在植物中的表达而增强产量相关性状的方法。本发明还涉及具有调节了编码该eRF1多肽之核酸的表达的植物,所述植物相对于相应的野生型植物或其他对照植物而言具有增强的产量相关性状。本发明还提供可用于本发明方法的构建体。
本发明一般地涉及分子生物学领域,并涉及用于在植物中增强多种经济上重要的产量相关性状的方法。更具体地,本发明涉及通过调节编码SCAMP样(分泌载体膜蛋白)多肽的核酸在植物中的表达而增强产量相关性状的方法。本发明还涉及具有调节了编码SCAMP样多肽之核酸的表达的植物,所述植物相对于对照植物而言具有增强的产量相关性状。本发明还提供可用于实施本发明方法的迄今为止未知的SCAMP样编码核酸以及包含该核酸的构建体。
本发明一般地涉及分子生物学领域,并涉及通过调节编码肌原纤蛋白多肽的核酸在植物的质体中的表达而增强多种产量相关性状的方法。本发明还涉及具有调节了编码肌原纤蛋白之核酸在植物的质体中表达的植物,所述植物相对于相应的野生型植物或其他对照植物而言具有增强的产量相关性状。本发明还提供可用于本发明方法的构建体。
本发明一般地涉及分子生物学领域,并涉及通过调节编码PLATZ(植物富含AT序列和锌结合蛋白质)多肽的核酸在植物中的表达而改进多种植物生长特性的方法。本发明还涉及具有调节了编码PLATZ多肽之核酸的表达的植物,所述植物相对于相应的野生型植物或其他对照植物而言具有改进的生长特性。本发明还提供可用于本发明方法的构建体。
本发明一般地涉及分子生物学领域,并涉及通过调节编码PLST样多肽的核酸在植物中的表达而增强产量相关性状的方法。本发明还涉及具有调节了编码PLST样多肽之核酸的表达的植物,所述植物相对于相应的野生型植物或其他对照植物而言具有增强的产量相关性状。本发明还提供可用于本发明方法的构建体。
本发明一般地涉及分子生物学领域,并涉及通过调节编码Glomalin(HSP60,陪伴蛋白CNP60)多肽的核酸在植物中的表达而增强产量相关性状的方法。本发明还涉及具有调节了编码Glomalin多肽之核酸的表达的植物,所述植物相对于相应的野生型植物或其他对照植物而言具有增强的产量相关性状。本发明还提供可用于本发明方法的构建体。
持续增长的世界人口和农业用可耕地供应萎缩刺激了有关增加农业效率的研究。常规的作物及园艺学改进手段利用选择育种技术来鉴定具有受欢迎特性的植物。然而,此类选择育种技术具有几个缺陷,即这些技术一般耗费很多劳动并且产生这样的植物,其经常含有异源性遗传组分,这可能不总是导致从亲代植物中传递所希望的性状。分子生物学进展已经允许人类改进动物及植物的种质。植物的遗传工程使得可以分离和操作遗传物质(一般处于DNA或RNA形式)并且随后引入该遗传物质至植物中。此类技术具有产生具备多种经济学、农学或园艺学改进性状的作物或植物的能力。
具有特殊经济意义的性状是增加的产量特性。产量通常定义为作物产生的可测量的经济价值。这可以就数量和/或品质方面进行定义。产量直接取决于几个因素,例如器官的数目和大小、植物构造(例如枝的数目)、种子产生、叶衰老等。根发育、养分摄入量、胁迫耐性和早期萌发势(earlyvigor)也可以是决定产量的重要因素。因此,优化前述因素可以对增加作物产量有贡献。
种子产量是特别重要的性状,这是因为许多植物的种子对于人类和动物营养而言至关重要。诸如玉米、稻、小麦、卡诺拉(canola)和大豆等作物占人类总卡路里摄取量的一半以上,不论是通过种子本身的直接消耗,还是通过由加工的种子所饲养的肉类产品的消耗。它们也是工业加工所用的糖类、油类和多类代谢物的来源。种子含有胚(新的苗和根的来源)和胚乳(萌发和幼苗早期生长过程中胚生长的营养源)。种子的发育涉及许多基因,并且需要代谢物自根、叶和茎转移至正在生长的种子。特别是胚乳,同化糖类、油类和蛋白质的代谢前体,将其合成为贮存性高分子,以充盈籽粒。
植物生物量为饲料作物如苜蓿、青贮谷物和干草的产量。在谷物作物中使用产量的许多替代参数。其中首要的是估算植物大小。根据物种以及发育阶段的不同,可以通过许多方法测量植物大小,但是包括植物总干重、地上干重、地上鲜重、叶面积、茎体积、植物高度、莲座(rosette)直径、叶长、根长、根生物量、分蘖数和叶数。许多物种在给定的发育阶段维持植物不同部分大小间的保守比。利用这些异速生长关系而对这些有关大小的测量结果进行由此及彼的外推(如Tittonell等2005 Agric Ecosys &Environ 105:213)。早期发育阶段的植物大小通常将与晚期发育阶段的植物大小有关。具有更大叶面积的较大植物通常能够比较小的植物吸收更多的光和二氧化碳,因此很可能在同期增重更多(Fasoula & Tollenaar 2005Maydica 50:39)。除了植物所具有的最初达到较大大小的微环境或遗传优势的潜在延续,此为其附加效应。植物大小和生长速率存在着强遗传组分(如ter Steege等2005 Plant Physiology 139:1078),且因此对于多种多样化基因型植物在一种环境条件下的大小很可能与另一种环境条件下的大小有关(Hittalmani等2003Theoretical Applied Genetics 107:679)。以这种方式,使用标准环境作为田地中作物在不同时间和地点所遭遇的多样化动态环境的替代参数。
对于众多作物的另一个重要性状是早期萌发势。改进早期萌发势是现代稻育种计划在温带和热带稻栽培品种上的一个重要目标。长根在水栽稻中对于正确土壤固着是重要的。在将稻直接播种至涝田的情况下,以及在植物必须从水中迅速出苗的情况下,较长的苗与萌发势相关。在实施条播(drill-seeding)的情况下,较长的中胚轴和胚芽鞘对于良好的出苗是重要的。人工改造植物内早期萌发势的能力将在农业中是极其重要的。例如,不良的早期萌发势已经限制了基于玉米带生殖质(Corn Belt germplasm)的玉米(Zea mayes L.)杂种在欧洲大西洋地区的引种。
收获指数为种子产量与地上干重的比值,其在许多环境条件下相对稳定,因此在植物大小和谷物产量之间通常能够获得比较稳固的相关性(如Rebetzke等2002 Crop Science 42:739)。这些过程固有地联系在一起,因为谷物生物量的大多数取决于植物叶和茎当前或贮存的光合作用生产力(Gardener等1985 Physiology of Crop Plants.Iowa State University Press,第68-73页)。因此,对植物大小的选择,甚至是在发育早期阶段的选择,已经用作为未来潜在产量的指标(如Tittonell等,2005,Agric Ecosys &Environ 105:213)。当测试遗传差异对胁迫耐性的影响时,温室或植物培养室环境与田地相比具有固有的优势:即能够使土壤性能、温度、水和营养的可用性以及光强度标准化。不过,因缺乏风力或昆虫导致不良授粉,或由于空间不足以让成熟根或株冠生长等等,对产量造成的这些人工局限性会限制这些受控环境在测试产量差异中的应用。因此,在培养室或温室标准条件下测量早期发育阶段的植物大小,是提供潜在遗传产量优势指标的标准方法。
另外的重要性状是改进的非生物胁迫耐受性。非生物胁迫是世界范围作物损失的主要原因,对于大多数主要作物植物而言降低平均产量超过50%(Wang等、(2003)Planta 218:1-14)。非生物胁迫可以由干旱、盐度、极端温度、化学毒性、养分(大量元素和/或微量元素)过剩或者缺乏、辐射和氧化胁迫引起。改进植物对非生物胁迫(即干旱)耐受性的能力将在世界范围对农民具有极大的经济优势并且会允许在不利条件期间及在作物栽培否则是不可能的陆地上栽培作物。
作物产量因而可以通过优化前述因素之一而增加。
取决于最终用途,对某些产量性状的改进可能优先于其它产量性状。例如对于应用如饲料或木材生产或生物燃料资源而言,增加植物营养体部分可能是期望的,而对于应用如面粉、淀粉或油生产而言,增加种子参数可能是尤其希望的。即便在种子参数当中,某些参数可以更优先于其它参数,这取决于应用。多种机制可以对增加种子产量有贡献,无论形式为增加的种子大小或是增加的种子数目。
现已发现可以通过在植物中调节编码eRF1蛋白质样的核酸在植物中的表达而增强植物中的多种产量相关性状。
现已发现可以通过在植物中调节编码SCAMP样的核酸在植物中的表达而改进植物中的多种生长特性。
现已发现可以通过在植物中调节编码肌原纤蛋白多肽的核酸的表达而改进植物中的多种产量相关性状。
现已发现可以通过在植物中调节编码PLATZ(植物富含AT序列和锌结合蛋白质)的核酸在植物中的表达而改进植物中的多种生长特性。
现已发现可以通过在植物中调节编码PLST样蛋白质的核酸在植物中的表达而增强植物中的多种产量相关性状。
现已发现可以通过在植物中调节编码Glomalin(HSP60,陪伴蛋白CNP60)多肽的核酸在植物中的表达而改进植物中的多种产量相关性状。
背景
1.SCAMP样多肽
植物中的胞吞作用已经在最近几年期间积累了相当多的证据(Samaj等人,2004;Plant Physiol.135:1150-1161)。已经鉴定了基于网格蛋白的内化结构的一些组分,并积累了摄取细胞表面受体-配体复合物的数据(Russinova等人2004,Plant Cell 16:3216-3229)。最近,推测植物SCAMP蛋白可以在介导植物细胞的胞吞作用中发挥作用(Lam等人2007;ThePlant Cell,Vol.19:296-319)。最初,将SCAMP蛋白鉴定为哺乳动物外分泌腺中的分泌小泡组分,并后来发现其是真核细胞中普遍存在的蛋白质(Fernandez-Chacon和Sudhof,2000;J.Neurosci.20:7941-7950)。在高尔基体反面和内体再循环区室中都发现了SCAMP,并且它们集中在早期和再循环内体的能动群体内(Castle和Castle,2005J.Cell Sci.118:3769-3780)。其中,已经在稻(Oryza sativa)、拟南芥(Arabidopsis)和豌豆(Pisum sativum)中发现了植物SCAMP同源物,并认为其存在于许多其他植物物种中(Fernandez-Chacon和Sudhof,2000)。在植物中,SCAMP位于质膜和能动胞质细胞器(Lam等人2007)。
2.肌原纤蛋白多肽
在质体小球(PG)中最主要的蛋白质是肌原纤蛋白。肌原纤蛋白是质体相关的脂质结合蛋白质,其遍布于植物和蓝细菌中。主要在番茄和胡椒果实的色质体中表征了它们,并且已知它们在非生物胁迫期间(例如,受强光、冷冻和干旱胁迫),以及在病原体感染期间在质体中积累。肌原纤蛋白样蛋白质家族含有疏水结构域,其与脂质相关或者锚定在脂质内。肌原纤蛋白与类囊体的基质片层和色质体的含纤维类胡萝卜素(fibrilliccarotenoid)结构相关。纤维结构的模型预测肌原纤蛋白层屏蔽极性脂质和类胡萝卜素。此外,已知肌原纤蛋白在强光条件期间积累,并且肌原纤蛋白影响光合效率(参见Yang等人,Proc Natl Acad Sci U S A.2006年4月11日;103(15):6061-6066)。可利用的证据还有这些蛋白质在非胁迫条件下与多种脂质小球结合,以阻止质体球(plastoglobule)聚结(参见CAB摘要,Simkin等人,Recent Research Developments in Biochemistry,2004)。
拟南芥基因组具有13个肌原纤蛋白基因,经预测它们都编码质体定位的蛋白质(Laizet等人,2004)。Rey等人,(Plant J.2000年3月;21(5):483-94)公开了使用组成型启动子过表达肌原纤蛋白的转基因烟草(Nicotiana tabacum)植物。在弱光条件下没有观察到野生型植物和转基因植物之间的生长差异,但据报道,在更强的光照强度下,转基因植物显示出更长的主茎、增强的侧茎发育和加速的花发育。
3.PLATZ多肽
PLATZ蛋白质来自植物特异的DNA结合蛋白质家族。到目前为止,仅详细描述了一个成员(PLATZ1,Nagano等人,Nucl.Acids Res.29,4097-4105,2001)。PLATZ1与其他推定的PLATZ蛋白质之间的序列比较显示,存在具有保守的半胱氨酸和组氨酸残基的两个锌结合结构域。DNA结合活性需要锌的存在。PLATZ1显示出以非特异性方式与富含A/T的区域结合,并且能诱导GTP酶pra2和质体蓝素petE基因的表达(Nagano等人,2001)。虽然DNA结合蛋白质与DNA复制和基因表达的调节有关,但是还仍缺少对PLATZ蛋白质的作用的精确表征。
4.Glomalin多肽
最初,将Glomalin鉴定为由丛枝菌根真菌(arbuscular mycorrhizal)(如Glomus属物种)产生的大分子量糖蛋白。其分泌到环境中,并且推断其糖部分在螯合土壤中的铜和锌中发挥作用。Gadkar和Rillig(FEMSMicrobiol Lett.263,93-101,2006)显示,丛枝菌根真菌(Glomusintraradices)的glomalin是590个氨基酸的蛋白质,其具有3个氨基端糖基化位点和在羧基末端的一串GGM基序。基因组序列具有67、76和131bp长的3个内含子。该蛋白质与热休克蛋白60(hsp 60)同源;据报道,hsp60的植物同源物在使光合作用适应热胁迫中发挥作用,可能通过保护Rubisco活性酶免于热变性(Salvucci M.,E.,J Exp Bot.2008;59(7):1923-33)。然而,glomalin直向同源物在植物生物学中的精确作用仍有待阐明。
概述
1.eRF1多肽
目前令人惊讶地发现,调节编码eRF1多肽之核酸的表达产生相对于对照植物具有增强的产量相关性状,特别是增加的产量的植物。
根据一个实施方案,提供了相对于对照植物增强植物产量相关性状的方法,包括在植物中调节编码eRF1多肽之核酸的表达。
2.SCAMP样多肽
目前令人惊讶地发现,调节编码SCAMP样多肽之核酸的表达产生相对于对照植物具有增强的产量相关性状的植物。
根据一个实施方案,提供了相对于对照植物增强植物产量相关性状的方法,包括在植物中调节编码SCAMP样多肽之核酸的表达。
3.肌原纤蛋白多肽
目前令人惊讶地发现,调节编码肌原纤蛋白多肽之核酸在植物的质体中的表达产生相对于对照植物具有增强的产量相关性状的植物。
根据一个实施方案,提供了相对于对照植物增强产量相关性状的方法,包括调节编码肌原纤蛋白多肽之核酸在植物质体中的表达。
4.PLATZ多肽
目前令人惊讶地发现,调节编码PLATZ多肽之核酸的表达产生相对于对照植物具有增强的产量相关性状,特别是增加的产量的植物。
根据一个实施方案,提供了相对于对照植物改进植物产量相关性状的方法,包括在植物中调节编码PLATZ多肽之核酸的表达。
5.PLST样多肽
目前令人惊讶地发现,调节编码PLST样多肽之核酸的表达产生相对于对照植物具有增强的产量相关性状,特别是增加的产量的植物。
根据一个实施方案,提供了相对于对照植物增强植物产量相关性状的方法,包括在植物中调节编码PLST样多肽之核酸的表达。
6.Glomalin多肽
目前令人惊讶地发现,调节编码Glomalin多肽之核酸的表达产生相对于对照植物具有增强的产量相关性状,特别是增加的种子产量的植物。
根据一个实施方案,提供了相对于对照植物改进植物产量相关性状的方法,包括调节编码Glomalin多肽之核酸在植物中的表达。
定义
在整个本说明书中使用以下定义。
多肽/蛋白质
术语“多肽”和“蛋白质”在本文中可互换使用,指通过肽键连接在一起的处于任意长度的氨基酸聚合形式。
多核苷酸/核酸/核酸序列/核苷酸序列
术语“多核苷酸”、“核酸序列”、“核苷酸序列”、“核酸”、“核酸分子”在本文中可互换使用并且指任意长度聚合的无分支形式的核苷酸,即核糖核苷酸或脱氧核糖核苷酸或这二者组合。
同源物
蛋白质的“同源物”包括这样的肽、寡肽、多肽、蛋白质及酶,它们相对于非修饰的所讨论蛋白质具有氨基酸替换、缺失和/或插入并且与其所源自的非修饰蛋白质具有相似生物学活性和功能活性。
缺失指从蛋白质中移除一个或多个氨基酸。
插入指一个或多个氨基酸残基在蛋白质中预定位点内的引入。插入可以包含氨基端融合和/或羧基端融合以及单个或多个氨基酸的序列内插入。通常,在氨基酸序列内部的插入会比氨基端融合或羧基端融合小,约1-10个残基的级别。氨基端或羧基端融合蛋白或融合肽的例子包括如酵母双杂交系统中所用转录激活物的结合结构域或激活结构域、噬菌体外壳蛋白、(组氨酸)-6-标签、谷胱甘肽S-转移酶-标签、蛋白A、麦芽糖结合蛋白、二氢叶酸还原酶、Tag·100表位、c-myc表位、
Figure BDA0000136403840000091
-表位、lacZ、CMP(钙调蛋白结合肽)、HA表位、蛋白C表位和VSV表位。
替换指以具有相似特性(如相似疏水性、亲水性、抗原性、形成或破坏α-螺旋结构或β-折叠结构的倾向)的其它氨基酸替换蛋白质的氨基酸。氨基酸替换一般是单个残基的,不过可以是簇集性的,这取决于置于多肽的功能性约束,并且可以是1-10个氨基酸;插入通常会是约1-10个氨基酸残基级别。氨基酸替换优选地是保守性氨基酸替换。保守性替换表是本领域众所周知的(见例如Creighton(1984)Proteins.W.H.Freeman和Company(编著)和下表1)。
表1:保守性氨基酸替换的例子
  残基   保守性替换   残基   保守性替换
  Ala   Ser   Leu   Ile;Val
  Arg   Lys   Lys   Arg;Gln
  Asn   Gln;His   Met   Leu;Ile
  Asp   Glu   Phe   Met;Leu;Tyr
  Gln   Asn   Ser   Thr;Gly
  Cys   Ser   Thr   Ser;Val
  Glu   Asp   Trp   Tyr
  Gly   Pro   Tyr   Trp;Phe
  His   Asn;Gln   Val   Ile;Leu
  Ile   Leu,Val
氨基酸替换、缺失和/或插入可以使用本领域众所周知的肽合成技术如固相肽合成法等或通过重组DNA操作而容易地进行。用于操作DNA序列以产生蛋白质的替换、插入或缺失变体的方法是本领域众所周知的。例如,用于在DNA中的预定位点处产生替换突变的技术是本领域技术人员众所周知的并且包括M13诱变法、T7-Gen体外诱变法(USB,Clevelaand,OH)、QuickChange位点定向诱变法(Stratagene,San Diego,CA)、PCR-介导的位点定向诱变或其它位点定向诱变法。
衍生物
“衍生物”包括这样的肽、寡肽、多肽,其中与天然存在形式的蛋白质(如目的蛋白)的氨基酸序列相比,它们包含以非天然存在的氨基酸残基对氨基酸的替换或非天然存在的氨基酸残基的添加。蛋白质的“衍生物”也包含这样的肽、寡肽、多肽,其中与多肽的天然存在形式的氨基酸序列相比,它们包含天然存在的经改变(糖基化、酰化、异戊二烯化、磷酸化、肉豆蔻酰化、硫酸化等)的氨基酸残基或非天然的经改变的氨基酸残基。与衍生物所来源的氨基酸序列相比,该衍生物可以也包含与所述氨基酸序列共价或非共价结合的一个或多个非氨基酸取代基或添加(例如报道分子或其它配体),如为促进检测该衍生物而结合的报道分子,和与天然存在的蛋白质的氨基酸序列相对比的非天然存在的氨基酸残基。此外,“衍生物”还包括天然发生形式蛋白质与标签肽(如FLAG、HIS6或硫氧还蛋白)的融合物(标签肽的综述参阅Terpe,Appl.Microbiol.Biotechnol.60,523-533,2003)。
直向同源物/旁系同源物
直向同源物和旁系同源物包含用来描述基因祖先关系的进化概念。旁系同源物是相同物种内起源于先祖基因复制的基因;直向同源物是来自不同生物的起源于物种形成的基因,并且也来源于共同的先祖基因。
结构域,基序/共有序列/特征序列
术语“结构域”指依据进化相关蛋白质的序列比对结果而在特定位置处保守的一组氨基酸。尽管在其它位置处的氨基酸可以在同源物之间变动,然而在特定位置处的高度保守的氨基酸指示在蛋白质的结构、稳定性或功能方面可能是必需的氨基酸。结构域因通过在蛋白质同源物家族的比对序列中的高保守程度而被鉴定,它们可以用作鉴定物以确定任意的所讨论多肽是否属于先前已鉴定的多肽家族。
术语“基序”或“共有序列”或“特征序列”指在进化相关蛋白质的序列中的短保守区。基序往往是结构域的高度保守部分,不过也可以仅包括结构域的部分,或可以位于保守结构域之外(若基序的全部氨基酸位于定义的结构域之外)。
存在用于鉴定结构域的专门数据库,例如SMART(Schultz等(1998)Proc.Natl.Acad.Sci.USA 95,5857-5864;Letunic等(2002)Nucleic AcidsRes 30,242-244),InterPro(Mulder等,(2003)Nucl.Acids.Res.31,315-318),Prosite(Bucher和Bairoch(1994),A generalized profile syntaxfor biomolecular sequences motifs and its function in automatic sequenceinterpretation.(In)ISMB-94;Proceedings 2nd International Conferenceon Intelligent Systems for Molecular Biology.Altman R.,Brutlag D.,KarpP.,Lathrop R.,Searls D.编著,第53-61页,AAAI Press,Menlo Park;Hulo等,Nucl.Acids.Res.32:D134-D137,(2004)或者Pfam(Bateman等,NucleicAcids Research 30(1):276-280(2002))。用于计算机分析蛋白质序列的一组工具可获得自ExPASy蛋白组服务器(Swiss Institute of Bioinformatics(Gasteiger等,ExPASy:the proteomics server for in-depth proteinknowledge and analysis,Nucleic Acids Res.31:3784-3788(2003))。还可以使用常规技术(如序列比对)来鉴定结构域或基序。
比对序列以进行比较的方法为本领域所众所周知,这些方法包括GAP、BESTFIT、BLAST、FASTA和TFASTA。GAP利用Needleman和Wunsch((1970)J Mol Biol 48:443-453)的算法来寻找两序列间使匹配数最高并使空位数最少的全局比对(即在完整序列上)。BLAST算法(Altschul等(1990)J Mol Biol 215:403-10)在两序列间计算百分比序列同一性并进行相似性的统计学分析。用于进行BLAST分析的软件在国家生物技术信息中心(National Centre for Biotechnology Information(NCBI))向公众提供。可以使用例如默认配对比对参数的ClustalW多重序列比对算法(1.83版)和百分比评分法来容易地鉴定同源物。也可以使用MatGAT软件包(Campanella等,BMC Bioinformatics.2003 Jul 10;4:29.MatGAT:anapplication that generates similarity/identity matrices using protein orDNA sequence)中提供的一种方法确定全局的相似性和同一性百分比。本领域技术人员会意识到,可以进行少量手动编辑以优化保守性基序之间的比对。此外,还可以使用特定的结构域代替全长序列来鉴定同源物。序列同一性值可以是使用默认参数的上述程序在完整的核酸或氨基酸序列上或在所选择的结构域或保守的基序上测定的。对于局部比对,Smith-Waterman算法是特别有用的(Smith TF,Waterman MS(1981)J.Mol.Biol147(1);195-7)。
交互BLAST
通常,这包括以查询序列(例如,利用实施例章节表A2、A3、A4、A5和A6中所列的任一序列)针对任何序列数据库如可公共获得的NCBI数据库进行BLAST的首次BLAST。当从核苷酸序列开始时,通常使用BLASTN或TBLASTX(利用标准默认值),而当从蛋白质序列开始时,则使用BLASTP或TBLASTN(利用标准默认值)。BLAST结果可以任选地过滤。接着使用过滤的结果或者未过滤的结果的全长序列针对查询序列来源生物的序列进行反向BLAST(二次BLAST)。然后比较首次和二次BLAST的结果。如果首次BLAST中的高排名命中来自查询序列来源的相同物种,然后反向BLAST理想地导致查询序列处于最高命中之列,则找到了旁系同源物;如果首次BLAST中高排名命中不来自查询序列来源的相同物种,且优选地在反向BLAST时导致查询序列在最高命中之列,则找到了直向同源物。
高排名的命中是那些E值低的命中。E值越低,分值越具有显著性(或者换句话说,偶然发现此命中的几率越低)。E值的计算是本领域众所周知的。除了E值之外,还对比较进行同一性百分比评分。同一性百分比是指两比较核酸(或多肽)序列之间在特定长度上的相同核苷酸(或氨基酸)数。在大家族的情况下可以使用ClustalW,继之以邻接树来辅助相关基因的聚类可视化,和鉴定直向同源物和旁系同源物。
杂交
如本文中所定义的术语“杂交”是其中基本上同源的互补核苷酸序列彼此退火的过程。杂交过程可以完全在溶液中进行,即两种互补性核酸均处于溶液中。杂交过程也可以在互补性核酸之一固定到基质如磁珠、琼脂糖(Sepharose)珠或任何其它树脂的情况下发生。杂交过程也可以在互补性核酸之一固定至固相支持体如硝酸纤维素膜或尼龙膜上或通过例如照相平版印刷术固定至例如硅酸玻璃支持物(后者称作核酸阵列或微阵列或称作核酸芯片)上的情况下进行。为使杂交发生,通常将核酸分子热变性或化学变性以使双链解链成为两条单链和/或去除来自单链核酸的发夹或其它二级结构。
术语“严格性”指在其中发生杂交的条件。杂交的严格性受条件如温度、盐浓度、离子强度和杂交缓冲液组成影响。通常,将低严格性条件选择为在确定的离子强度及pH时低于特定序列热解链温度(Tm)约30℃。中等严格性条件是此时温度低于Tm约20℃,高严格性条件是此时温度低于Tm约10℃。高严格性杂交条件一般用于分离与靶核酸序列具有高序列相似性的杂交序列。然而,核酸可以在序列上偏离并且因遗传密码子的简并性而依旧编码基本上相同的多肽。因而有时候可能需要中等严格性杂交条件来鉴定此类核酸分子。
Tm是在确定的离子强度及pH下50%的靶序列与完全匹配的探针杂交时的温度。Tm取决于溶液条件和探针的碱基组成及长度。例如,较长的序列在较高温度下特异性地杂交。从低于Tm约16℃直至32℃获得最大杂交速率。一价阳离子在杂交溶液中的存在降低了两条核酸链间的静电排斥,因而促进杂交分子形成;这种作用对于高达0.4M的钠浓度是明显的(对于更高浓度,这种效应可以忽略)。甲酰胺降低DNA-DNA和DNA-RNA双链体的解链温度,每百分数甲酰胺降低0.6至0.7℃,并且添加50%甲酰胺允许在30至45℃进行杂交,虽然杂交速率会降低。碱基对错配降低了杂交速率及双链体的热稳定性。平均而言并且对于大的探针来说,每%碱基错配Tm下降约1℃。取决于杂交分子的类型,Tm可以使用下列等式计算:
1)DNA-DNA杂交分子(Meinkoth和Wahl,Anal.Biochem.,138:267-284,1984):
Tm=81.5℃+16.6xlog10[Na+]a+0.41x%[G/Cb]-500x[Lc]-1-0.61x%甲酰胺
2)DNA-RNA或RNA-RNA杂交分子:
Tm=79.8+18.5(log10[Na+]a)+0.58(%G/Cb)+11.8(%G/Cb)2-820/Lc
3)寡DNA或寡RNAd杂交分子:
对于<20个核苷酸:Tm=2(ln)
对于20-35个核苷酸:Tm=22+1.46(ln)
a或对于其它一价阳离子,但是仅在0.01-0.4M范围内是精确的。
b仅对于%GC在30%至75%范围内是精确的。
cL=双链体的长度(以碱基对计)。
doligo,寡核苷酸;ln,=引物的有效长度=2×(G/C数)+(A/T数)。
可以使用众多已知技术的任何一种来控制非特异性结合,如例如用含蛋白质的溶液封闭薄膜、添加异源性RNA、异源性DNA及SDS至杂交缓冲液并且用RNA酶处理。对于非同源性探针,一系列杂交可以通过改变以下条件之一进行:(i)逐渐降低退火温度(例如从68℃至42℃)或(ii)逐渐降低甲酰胺浓度(例如从50%至0%)。技术人员了解杂交期间可以加以改变和将维持或改变严格性条件的多种参数。
除杂交条件之外,杂交特异性一般还取决于杂交后洗涤的功能。为除去因非特异性杂交所致的背景,样品用稀释的盐溶液洗涤。此类洗涤的关键因素包括最终洗涤溶液的离子强度及温度:盐浓度越低并且洗涤温度越高,则洗涤的严格性越高。洗涤条件一般在杂交严格性上或低于杂交严格性而进行。阳性杂交产生至少两倍于背景信号的信号。通常,用于核酸杂交分析法或基因扩增检测方法的合适严格性条件如上所述。也可以选择更严格或更不严格的条件。技术人员了解洗涤期间可以加以改变和将维持或改变严格性条件的多种参数。
例如,用于长度大于50个核苷酸的DNA杂交分子的常见高严格性杂交条件包括在65℃于1×SSC中或在42℃于1×SSC和50%甲酰胺中杂交,随后在65℃于0.3×SSC中洗涤。用于长度大于50个核苷酸的DNA杂交分子的中等严格性杂交条件的例子包括在50℃于4×SSC中或在40℃于6×SSC和50%甲酰胺中杂交,随后在50℃于2×SSC中洗涤。杂交分子的长度是杂交核酸的预期长度。当序列已知的核酸杂交时,可以通过比对序列并鉴定本文中所述的保守区而确定杂交分子长度。1×SSC是0.15M NaCl和15mM柠檬酸钠;杂交溶液和洗涤溶液可以额外地包含5×Denhardt试剂、0.5-1.0%SDS、100μg/ml变性的片段化鲑精DNA、0.5%焦磷酸钠。
为了定义严格性水平的目的,可以参考Sambrook等(2001)MolecularCloning:a laboratory manual,第三版,Cold Spring Harbor LaboratoryPress,CSH,New York或参考Current Protocols in Molecular Biology,John Wiley & Sons,N.Y.(1989和每年更新版本)。
剪接变体
如本文中所用的术语“剪接变体”包含其中已经切除、替换、移位或添加所选内含子和/或外显子或其中内含子已经缩短或加长的核酸序列的变体。此类变体将是其中基本上保留了蛋白质的生物活性的一种变体;这可以通过选择性保留蛋白质的功能性片段而实现。此类剪接变体可以在自然界中找到或可以人工制造。用于预测和分离此类剪接变体的方法是本领域众所周知的(见例如Foissac和Schiex,(2005)BMC Bioinformatics.6:25)。
等位变体
等位基因或等位变体是给定基因的替代形式,位于相同染色体位置内。等位变体包含单核苷酸多态性(SNP)和小插入/缺失多态性(INDEL)。INDEL的尺寸通常小于100bp。SNP和INDEL形成在大部分生物的天然存在性多态性株系中序列变体的最大集合。
内源基因
本文中提及的“内源”基因不仅仅指如在植物中以其天然形式(即没有任何人类干预)存在的所讨论基因,还指处于分离形式随后(再)引入植物中的相同基因(或基本上同源的核酸/基因)(转基因)。例如,含有这种转基因的转基因植物可以遭遇转基因表达大幅降低和/或内源基因表达的大幅降低。分离的基因可从生物体分离,或可人工制造(例如通过化学合成)。
基因改组/定向进化
基因改组或定向进化的组成为:反复DNA改组,随后适当筛选和/或选择以产生编码具有修饰的生物学活性的蛋白质之核酸或其部分的变体(Castle等,(2004)Science 304(5674):1151-4;美国专利5,811,238和6,395,547)。
构建体
其它调节元件可包括转录及翻译增强子。本领域技术人员会了解适于在实施本发明中使用的终止子和增强子序列。如在定义部分所述,也可将内含子序列添加至5′非翻译区(UTR)或编码序列上,以增加在细胞质内积累的成熟信息的量。其它控制序列(除启动子、增强子、沉默子、内含子序列、3’UTR和/或5’UTR区之外)可以是蛋白质和/或RNA稳定元件。本领域技术人员会知道或可以容易地获得此类序列。
本发明的遗传构建体还可以包括在特定细胞类型中维持和/或复制需要的复制起点序列。一个例子是当需要将遗传构建体在细菌细胞中作为附加型遗传元件(例如质粒或粘粒分子)维持时。优选的复制起点包括但不限于f1-ori和colE1。
为检测如在本发明方法中所用核酸序列的成功转移和/或选择包含这些核酸序列的转基因植物,使用标记基因(或报告基因)是有利的。因而,遗传构建体可以任选地包含可选择标记基因。可选择标记在本文“定义”部分中有更详细的描述。一旦不再需要,可以从转基因细胞中去除或切除标记基因。用于标记基因去除的技术是本领域已知的,有用的技术在上文定义部分中描述。
调节元件/控制序列/启动子
术语“调节元件”、“控制序列”和“启动子”均在本文中可互换使用,并且在广义上意指能够影响与之连接的序列表达的调节性核酸序列。术语“启动子”一般指位于基因转录起点上游并参与识别及结合RNA聚合酶和其它蛋白质,因而指导有效连接的核酸转录的核酸控制序列。前述术语包括从典型的真核基因组基因(包括对于精确转录启动所需的TATA盒,具有或没有CCAAT盒序列)中衍生的转录调节序列和应答发育刺激和/或外部刺激或以组织特异性方式改变基因表达的额外调节元件(如,上游激活序列、增强子和沉默子)。本术语还包括典型的原核基因的转录调节序列,在此情况下它可以包括-35盒序列和/或-10盒转录调节序列。术语“调节元件”也包含赋予、激活或增强核酸分子在细胞、组织或器官中表达的合成的融合分子或衍生物。
“植物启动子”包含介导编码序列区段在植物细胞中表达的调节元件。因此,植物启动子不一定是植物来源的,而是可以源自病毒或微生物,例如来自侵袭植物细胞的病毒。“植物启动子”也可以源自植物细胞,例如来自用待于本发明方法中表达及在本文中描述的核酸序列所转化的植物。这也适用于其它“植物”调节性信号,如“植物”终止子。用于本发明方法中的核苷酸序列上游的启动子可以由一个或多个核苷酸替换、插入和/或缺失而受到修饰,但不干扰启动子、开放阅读框(ORF)或3′调节区(如终止子)或远离ORF的其它3′调节区的功能性或活性。启动子的活性还有可能因修饰该启动子的序列或由更具活性的启动子、甚至来自异源生物的启动子彻底替换该启动子而增加。为在植物中表达,如上所述,核酸分子必须有效连接至或包含合适的启动子,其中所述的启动子在正确时间点上并以所需要的空间表达模式表达基因。
为了鉴定功能等价启动子,可以分析候选启动子的启动子强度和/或表达模式,例如通过将该启动子与报告基因有效连接并测定该报告基因在多种植物组织中的表达水平和模式。合适的公知报告基因包括例如β-葡糖醛酸糖苷酶或β-半乳糖苷酶。通过测量β-葡糖醛酸糖苷酶或β-半乳糖苷酶的酶活性来测定启动子活性。接着可以将启动子强度和/或表达模式与参考启动子(如用于本发明方法中的)进行比较。或者,可以通过定量mRNA水平或者将本发明方法中所用核酸的mRNA水平与持家基因(如18S rRNA)的mRNA水平进行比较来测定启动子强度,其中使用本领域众所周知的技术,如通过放射自显影的光密度测定分析进行的Northern印迹、定量实时PCR或RT-PCR(Heid等,1996 Genome Methods 6:986-994)。通常,“弱启动子”指驱动编码序列低水平表达的启动子。“低水平”指每个细胞中约1/10,000的转录物至约1/100,000的转录物至约1/500,0000的转录物的水平。相反,“强启动子”驱动编码序列高水平表达,或者每个细胞中约1/10的转录物至约1/100的转录物至约1/1000的转录物的水平。通常,“中等强度启动子”指此类启动子,其驱动编码序列以低于强启动子的水平表达,特别是在所有情况下以低于35S CaMV启动子控制时获得的水平表达。
有效连接
如本文中所用的术语“有效连接”指启动子序列与目的基因之间功能性地连接,以至于启动子序列能够启动目的基因转录。
组成型启动子
“组成型启动子”指在至少一种细胞、组织或器官中在其大多数(但不一定是全部)生长和发育阶段并在大多数环境条件下有转录活性的启动子。下表2a给出了组成型启动子的例子。
表2a:组成型启动子的例子
Figure BDA0000136403840000181
Figure BDA0000136403840000191
遍在启动子
遍在启动子在生物的基本上全部组织或细胞中有活性。
发育调节性启动子
发育调节性启动子在某个发育期期间或在经历发育变化的植物部分内有活性。
诱导型启动子
诱导型启动子在应答化学品(综述见Gatz 1997,Annu.Rev.PlantPhysiol.Plant Mol.Biol.,48:89-108)、环境刺激或物理刺激时具有受诱导或增加的转录启动,或可以是“胁迫诱导型”,即当植物暴露于多种胁迫条件时受到激活,或是“病原体诱导型”,即当植物暴露于多种病原体时受到激活。
器官特异性/组织特异性启动子
器官特异性或组织特异性启动子是能够优先在某些器官或组织如叶、根、种子组织等内启动转录的启动子。例如,“根特异性启动子”是在植物根中优势地具有转录活性的启动子,在植物的任何其它部分内基本上无活性,尽管在植物的这些其它部分内允许任何泄露表达。能够仅在某些细胞中启动转录的启动子在本文中称作“细胞特异性”。
根特异性启动子的例子列于下表2b中:
表2b:根特异性启动子的例子
Figure BDA0000136403840000201
种子特异性启动子主要在种子组织中有转录活性,但不一定仅在种子组织中有(泄漏表达的情况)。种子特异性启动子可在种子发育和/或萌发过程中有活性。种子特异性启动子可以是胚乳/糊粉/胚特异性的。种子特异性启动子的实例(胚乳/糊粉/胚特异性的)在下表2c至表2f中显示。种子特异性启动子的其它实例在Qing Qu和Takaiwa(Plant Biotechnol.J.2,113-125,2004)中给出,其公开内容整体并入本文作为参考。
表2c:种子特异性启动子的例子
Figure BDA0000136403840000211
Figure BDA0000136403840000221
表2d:胚乳特异性启动子的例子
Figure BDA0000136403840000232
Figure BDA0000136403840000241
表2e:胚特异性启动子的例子:
  基因来源   参考文献
  稻OSH1   Sato等,Proc.Natl.Acad.Sci.USA,93:8117-8122,1996
  KNOX   Postma-Haarsma等,Plant Mol.Biol.39:257-71,1999
  PRO0151   WO 2004/070039
  PRO0175   WO 2004/070039
  PRO005   WO 2004/070039
  PRO0095   WO 2004/070039
表2f:糊粉特异性启动子的例子:
Figure BDA0000136403840000242
如本文中所定义的绿色组织特异性启动子是主要在绿色组织中具有转录活性的启动子,在植物的任何其它部分内基本上无活性,尽管在植物的这些其它部分内允许任何泄露表达。
可以用来实施本发明方法的绿色组织特异性启动子的例子在下表2g中显示。
表2g:绿色组织特异性启动的例子
Figure BDA0000136403840000251
组织特异性启动子的另一个例子是分生组织特异性启动子,其主要在分生性组织中具有转录活性,在植物的任何其它部分内基本上无活性,尽管在植物的这些其它部分内允许任何泄露表达。可用于实施本发明方法的绿色分生组织特异性启动子的例子示于下列的表2h。
表2h:分生组织特异性启动子的例子
Figure BDA0000136403840000252
终止子
术语“终止子”包括这样的控制序列,其是在转录单位末端的DNA序列,发出对初级转录物进行3’加工并多聚腺苷化以及终止转录的信号。终止子可以来自天然基因、来自多种其它植物基因或来自T-DNA。待添加的终止子可以来自例如胭脂碱合酶或章鱼碱合酶基因,或者来自另一植物基因或较不优选地来自任何其它真核基因。
可选择标记(基因)/报告基因
“可选择标记”、“可选择标记基因”或“报告基因”包括向细胞赋予表型的任何基因,其中在所述的细胞内表达所述基因以促进鉴定和/或选择用本发明的核酸构建体所转染或转化的细胞。这些标记基因能够通过一系列不同原理鉴定核酸分子的成功转移。合适的标记可以选自赋予抗生素抗性或除草剂抗性、引入新代谢性状或允许目视选择的标记。可选择标记基因的例子包括赋予抗生素抗性的基因(如使新霉素和卡那霉素磷酸化的nptII或使潮霉素磷酸化的hpt或赋予对例如博来霉素、链霉素、四环素、氯霉素、氨苄青霉素、庆大霉素、遗传霉素(Geneticin,G418)、壮观霉素或杀稻瘟素的抗性的基因)、赋予除草剂抗性的基因(例如提供
Figure BDA0000136403840000261
抗性的bar;提供草甘膦抗性的aroA或gox或赋予对例如咪唑啉酮、膦丝菌素或磺脲类的抗性的基因)或提供代谢性状的基因(如允许植物使用甘露糖作为唯一碳源的manA或利用木糖的木糖异构酶或抗营养标记如2-脱氧葡萄糖抗性)。视觉标记基因的表达导致形成颜色(例如β-葡糖醛酸糖苷酶、GUS或β-半乳糖苷酶与其有色底物例如X-Gal)、发光(如萤光素/萤光素酶系统)或荧光(绿色荧光蛋白GFP及其衍生物)。这个名单仅代表少数的可能标记。技术人员熟悉此类标记。取决于生物和选择方法,优选不同的标记。
已知当核酸稳定或瞬时整合至植物细胞时,仅小部分的细胞摄取外来DNA并且根据需要将其整合至细胞基因组,这取决于所用表达载体和使用的转染技术。为鉴定并选择这些整合子,通常将编码可选择标记(如上文所述之一)的基因连同目的基因一起引入宿主细胞。这些标记可以例如在其中这些基因因例如常规方法所致的缺失而无功能的突变体中使用。此外,编码可选择标记的核酸分子可以引入宿主细胞中,与编码本发明多肽或本发明方法中所用多肽的序列在同一载体上,或在单独的载体上。已经用引入的核酸稳定转染的细胞可以例如通过选择进行鉴定(例如具有整合的可选择标记的细胞存活而其它细胞死亡)。
因为一旦已经成功引入了核酸,则转基因宿主细胞中就不再需要或不希望有标记基因,尤其抗生素抗性基因和除草剂抗性基因,因此用于引入核酸的本发明方法有利地使用能够去掉或切除这些标记基因的技术。一种如此方法称作共转化法。共转化法使用同时用于转化的两种载体,一种载体携带本发明的核酸而另一种载体携带标记基因。高比例的转化体接受,或在植物的情况下,包含(高达40%或更多的转化体)这两种载体。在用农杆菌转化的情况下,转化体通常仅接受载体的一部分,即侧翼有T-DNA的序列,它通常代表表达盒。标记基因随后可以通过进行杂交而从转化的植物中去掉。在另一种方法中,整合至转座子的标记基因用来与想要的核酸一起进行转化(称作Ac/Ds技术)。转化体可以与转座酶来源植物杂交或转化体与导致转座酶表达的核酸构建体瞬时或稳定地转化。在一些情况下(大约10%),转座子在已经成功发生转化时跳出宿主细胞的基因组并丢失。在其它更多情况下,转座子跳至不同位置。在这些情况下,标记基因必须通过进行杂交而去除。在微生物学中,开发了实现或促进检测这类事件的技术。又一个有利的方法依赖于已知的重组系统;此方法的优势在于不必通过杂交去除。该类型的最知名系统称作Cre/lox系统。Cre1是去掉位于loxP序列之间序列的重组酶。若标记基因整合于loxP序列之间,则在已经成功发生转化时,通过重组酶表达去除标记基因。其它重组系统是HIN/HIX、FLP/FRT和REP/STB系统(Tribble等,J.Biol.Chem.,275,2000:22255-22267;Velmurugan等,J.Cell Biol.,149,2000:553-566)。有可能将本发明核酸序列以位点特异性方式整合至植物基因组。这些方法自然也可以应用至微生物如酵母、真菌或细菌。
转基因的/转基因/重组
为本发明目的,“转基因的”、“转基因”或“重组”就例如核酸序列而言意指包含此核酸序列的表达盒、基因构建体或载体或用本发明的核酸序列、表达盒或载体转化的生物,所有那些构建均通过重组方法产生,其中
(a)编码用于本发明方法中的蛋白质的核酸序列,或
(b)与本发明核酸序列有效连接的遗传控制序列,例如启动子,或
(c)a)和b)
不处于其天然遗传环境中或已经通过重组方法修饰,修饰有可能采用例如替换、添加、缺失、倒位或插入一个或多个核苷酸残基的形式。天然遗传环境理解为意指来源植物中或存在于基因组文库中的天然基因组基因座或染色体基因座。在基因组文库的情况下,核酸序列的天然遗传环境优选地得到保留,至少部分地得以保留。该环境分布在核酸序列的至少一侧并且具有至少50bp,优选至少500bp,特别优选至少1000bp,最优选至少5000bp的序列长度。天然存在的表达盒-例如核酸序列的天然启动子与编码本发明方法中所用多肽的对应核酸序列的天然存在的组合,如上文所定义-在这种表达盒通过非天然的合成(“人工”)方法(如例如诱变处理)修饰后,变成转基因表达盒。合适方法例如在US 5,565,350或WO 00/15815中描述。
为本发明目的,转基因植物因此如上理解为意指本发明方法中所用的核酸不位于所述植物基因组中该核酸的天然基因座内,所述核酸有可能同源或异源地表达。然而如所提及,转基因还意指尽管本发明核酸或在本发明方法中所用核酸处于植物基因组中该核酸的天然位置内,然而其序列相对于天然序列而言已经受到修饰,和/或所述天然序列的调节序列已经受到修饰。转基因优选地理解为意指本发明核酸在基因组中的非天然基因座内表达,即发生核酸的同源表达或优选异源表达。在本文中提到了优选的转基因植物。
调节
术语“调节”就表达或基因表达而言意指这样的过程,其中表达水平与对照植物相比因所述基因的表达而改变,表达水平可以是增加或减少。原先未受调节的表达可以是结构RNA(rRNA、tRNA)或mRNA的任何类型表达,随后是翻译。术语“调节活性”应当意指本发明核酸序列或所编码蛋白质的表达的任何变化,这导致植物增加的产量和/或增加的生长。
表达
术语“表达”或“基因表达”指转录一个或多个特定基因或特定的遗传构建体。特别地,术语“表达”或“基因表达”指将一个或多个基因或遗传构建体转录成结构RNA(rRNA、tRNA)或mRNA,包括或者不包括后者随后翻译成蛋白质。该过程包括转录DNA和加工所得的mRNA产物。
增加的表达/过表达
如本文中所用的术语“增加的表达”或“过表达”意指对于原有野生型表达水平是额外的任何形式表达。
在本领域内详细记载了用于增加基因或基因产物表达的方法并且它们包括例如,由适宜启动子驱动的过表达、使用转录增强子或翻译增强子。可以在非异源形式的多核苷酸的适宜位置(一般是上游)内引入作为启动子或增强子元件的分离核酸,以便上调编码目的多肽的核酸的表达。例如,内源性启动子可以通过突变、缺失和/或置换而在体内改变(见Kmiec,US5,565,350;Zarling等,WO9322443),或可以将分离的启动子以相对于本发明基因的正确方向及距离引入植物细胞,以便控制基因表达。
如果期望表达多肽,一般期望在多核苷酸编码区的3’末端包含多腺苷酸化区。多腺苷酸化区可来自该天然基因,来自多种其它植物基因,或者来自T-DNA。待被加入的3’末端序列可来自例如胭脂碱合酶或章鱼碱合酶基因,或者来自另一植物基因,或者较不优选地来自任何其它真核基因。
内含子序列也可添加至5′非翻译区(UTR)或部分编码性序列的编码序列上,以增加在细胞质内积累的成熟信息的量。已经证实可剪接内含子在植物表达构建体和动物表达构建体中转录单位内的包含在mRNA水平及蛋白质水平上增加基因表达至多达1000倍(Buchman和Berg(1988)Mol.Cell biol.8:4395-4405;Callis等(1987)Gens Dev 1:1183-1200)。基因表达的此类内含子增强作用一般在位于转录单元5′端附近时最强烈。使用玉米内含子Adh1-S内含子1、2和6、Bronze-1内含子是本领域已知的。对于一般信息,见:《玉米手册》,第116章,编者Freeling和Walbot,Springer,N.Y.(1994)。
降低的表达
本文中提及的“降低的表达”或者“降低或基本去除”的表达意指内源基因表达和/或多肽水平和/或多肽活性相对于对照植物的降低。与对照植物相比,降低或基本去除以递增优选顺序是至少10%、20%、30%、40%或50%、60%、70%、80%、85%、90%或95%、96%、97%、98%、99%或更多的降低。
为了降低或基本去除内源基因在植物中的表达,需要核酸序列的足够长度的基本上连续的核苷酸。为了开展基因沉默,这个长度可以是少至20、19、18、17、16、15、14、13、12、11、10个或更少的核苷酸,或者该长度可以多至整个基因(包括5’和/或3’UTR,部分或全体)。基本上连续的核苷酸片段可以来自编码目的蛋白质的核酸(靶基因)或来自能够编码目的蛋白质的直向同源物、旁系同源物或同源物的任何核酸。优选地,基本上连续的核苷酸片段能够与靶基因(有义链或反义链)形成氢键,更优选地,基本上连续的核苷酸片段以递增优选顺序与靶基因(有义链或反义链)具有50%、60%、70%、80%、85%、90%、95%、96%、97%、98%、99%、100%的序列同一性。编码(功能性)多肽的核酸序列不是本文中所讨论用于降低或基本去除内源基因表达的多种方法所需的。
表达的这种降低或基本去除可以使用常规工具和技术完成。用于降低或基本去除内源基因表达的优选方法是通过在植物中引入和表达遗传构建体,将被间隔物(非编码DNA)分隔的核酸作为反向重复序列(部分地或完全地)克隆入此构建体中(在此情况下该核酸是从目的基因或从任何核酸中衍生的一段基本上连续的核苷酸,其中所述的任何核酸能够编码任何目的蛋白质之一的直向同源物、旁系同源物或同源物)。
在这样的优选方法中,通过RNA介导的沉默降低或基本去除内源基因表达,其中使用核酸或其部分的反向重复序列(在此情况下是从目的基因或从任何核酸中衍生的一段基本上连续的核苷酸片段,其中所述的任何核酸能够编码目的蛋白质的直向同源物、旁系同源物或同源物),优选能够形成发夹结构。反向重复序列克隆在含有控制序列的表达载体中。非编码DNA核酸序列(间隔物,例如基质结合区片段(MAR)、内含子、聚合接头等等)位于形成反向重复序列的两个反向核酸之间。在反向重复序列转录后,形成带有自身互补结构(部分或完全的)的嵌合RNA。这个双链RNA结构被称为发夹RNA(hpRNA)。hpRNA由植物加工成siRNA,其整合入RNA诱导的沉默复合物(RISC)中。RISC进一步切割mRNA转录本,由此大量减少将被翻译成多肽的mRNA转录本的数量。对于更多一般性细节见例如,Grierson等(1998)WO 98/53083;Waterhouse等(1999)WO99/53050)。
本发明方法的实施不依赖于在植物中引入和表达遗传构建体(核酸作为反向重复序列克隆至该构建体中),也可使用数个众所周知的“基因沉默”方法中的任何一个或多个达到相同效果。
用于减少内源基因表达的一个此类方法是RNA介导的基因表达沉默(下调)。在此情况下,沉默由植物中的双链RNA序列(dsRNA)引发,该双链RNA序列与内源靶基因基本相似。这个dsRNA由植物进一步加工成约20至约26个核苷酸,被称为短干扰RNA(siRNA)。siRNA整合入RNA诱导的沉默复合物(RISC)中,该复合物切割内源靶基因的mRNA转录本,由此大量减少将被翻译成多肽的mRNA转录本的数量。优选地,双链RNA序列对应于靶基因。
RNA沉默方法的另一个例子包括以有义方向引入核酸序列或其部分(在此情况下是从目的基因或从任何核酸中衍生的一段基本上连续的核苷酸片段,其中所述的任何核酸能够编码目的蛋白质的直向同源物、旁系同源物或同源物)至植物内。“有义方向”指与其mRNA转录本同源的DNA序列。因此引入植物的将至少是核酸序列的一个拷贝。附加的核酸序列将减少内源基因的表达,引起通常所说的共抑制现象。因为高转录本水平和共抑制的引发之间正相关,如果数个附加拷贝的核酸序列引入植物中,基因表达的减少将更显著。
RNA沉默方法的另一个例子包括使用反义核酸序列。“反义”核酸序列包含与编码蛋白质的“有义”核酸序列互补的核苷酸序列,也就是,与双链cDNA分子的编码链互补或与mRNA转录本序列互补。反义核酸序列优选与将被沉默的内源基因互补。互补性可位于基因的“编码区”和/或“非编码区”。术语“编码区”指含有翻译成氨基酸残基的密码子的核苷酸序列区。术语“非编码区”指位于编码区侧翼的5′和3′序列,其将被转录却不被翻译成氨基酸(也称为5′和3′非翻译区)。
反义核酸序列可根据Watson和Crick碱基配对的规则进行设计。反义核酸序列可以与整个核酸序列互补(在这种情况下,基本上连续的核苷酸片段可以来自目的基因,或来自能够编码目的蛋白质的直向同源物、旁系同源物或同源物的任何核酸),也可以是寡核苷酸,其仅与核酸序列(包括mRNA 5’和3’UTR)的一部分是反义的。例如,反义寡核苷酸序列可以与编码多肽的mRNA转录本的翻译起始位点周围的区域互补。适合的反义寡核苷酸序列长度在本领域是已知的,可从约50、45、40、35、30、25、20、15或10核苷酸长度或更少起始。本发明的反义核酸序列可使用化学合成以及酶连接反应通过本领域已知的方法构建。例如,反义核酸序列(例如,反义寡核苷酸序列)可以使用天然存在的核苷酸或各种改进的核苷酸(为增加分子的生物稳定性或增加反义和有义核酸序列之间形成的双螺旋的物理稳定性而设计)进行化学合成,例如,可以使用硫代磷酸酯衍生物和吖啶取代的核苷酸。本领域众所周知可用于产生反义核酸序列的改进的核苷酸实例。已知的核苷酸改进包括甲基化、环化和‘帽’和一个或多个天然存在核苷酸用类似物如肌苷替换。核苷酸的其它改进是本领域众所周知的。
可使用表达载体生物学产生反义核酸序列,其中核酸序列以反义方向亚克隆进入该表达载体(即,转录自插入核酸的RNA与目的靶核酸是反义方向的)。优选地,植物中反义核酸序列通过稳定整合的核酸构建体(包含启动子、有效连接的反义寡核苷酸和终止子)产生。
本发明方法中用于沉默的核酸分子(无论引入植物或在原位产生)与mRNA转录本和/或编码多肽的基因组DNA杂交或结合,由此抑制蛋白质的表达,例如,通过抑制转录和/或翻译。杂交可以通过常规的核苷酸互补形成稳定的双螺旋,或例如,就结合至DNA双螺旋的反义核酸序列而言,通过双螺旋大沟中的特异性相互作用。反义核酸序列可通过转化或在特异组织位点直接注射引入植物中。备选地,可改进反义核酸序列以靶向被选细胞,随后全身性施用。例如,对于全身施用,可改进反义核酸序列,使它们与表达于被选细胞表面上的受体或抗原特异性结合,例如通过将反义核酸序列连接至与细胞表面受体或抗原结合的肽或抗体。也可使用本文所述的载体将反义核酸序列输送至细胞。
另一方面,反义核酸序列是一种a-异头物核酸序列。a-异头物核酸序列与互补的RNA形成特异性双链杂交,其中(与常见的b-单位相反)链相互之间平行(Gaultier等(1987)Nucl Ac Res 15:6625-6641)。反义核酸序列也可包含2′-o-甲基核糖核苷(Inoue等(1987)Nucl Ac Res 15,6131-6148)或嵌合的RNA-DNA类似物(Inoue等(1987)FEBS Lett.215,327-330)。
内源基因表达的降低或基本消除也可使用核酶实施。核酶是有核糖核酸酶活性的催化RNA分子,能切割单链的核酸序列,如mRNA,它们与切割的单链核酸序列具有互补区。因此,核酶(例如,锤头核酶(在Haselhoff和Gerlach(1988)Nature 334,585-591中描述)可用于催化切割编码多肽的mRNA转录本,由此基本上减少将要被翻译成多肽的mRNA转录本的数量。可以设计对核酸序列具有特异性的核酶(见例如:Cech等美国专利号4,987,071;和Cech等美国专利号5,116,742)。备选地,对应于核酸序列的mRNA转录本可用于从RNA分子库中选择具有特定核糖核酸酶活性的催化RNA(Bartel和Szostak(1993)Science 261,1411-1418)。使用核酶用于植物中基因沉默是本领域已知的。(例如,Atkins等(1994)WO 94/00012;Lenne等(1995)WO 95/03404;Lutziger等(2000)WO 00/00619;Prinsen等(1997)WO 97/13865和Scott等(1997)WO 97/38116)。
基因沉默也可以通过插入诱变(例如T-DNA插入或转座子插入)或通过如Angell和Baulcombe((1999)Plant J.20(3):357-62)、(Amplicon VIGSWO 98/36083)或Baulcombe(WO 99/15682)及其它人描述的策略而实现。
如果内源基因上有突变,和/或在随后引入植物中的分离的基因/核酸上有突变,也可以发生基因沉默。降低或基本上消除可由非功能性多肽引起。例如,多肽可结合至多种相互作用的蛋白质;因此一个或多个突变和/或截断可提供一种多肽,该多肽仍能结合至相互作用的蛋白质(如受体蛋白质),但不可显示其正常功能(如信号配体)。
基因沉默的另一种方法是通过靶向与基因调节区(例如启动子和/或增强子)互补的核酸序列以形成三重螺旋结构,该结构防止基因在靶细胞中转录。见Helene,C.,Anticancer Drug Res.6,569-84,1991;Helene等,Ann.N.Y.Acad.Sci.660,27-361992和Maher,L.J.Bioassays 14,807-15,1992。
其它方法,如使用针对内源性多肽的抗体以抑制此多肽在植物中的功能,或干扰所述多肽参与的信号途径,对于技术人员将是众所周知的。特别地,可预见人造分子可用于抑制靶多肽的生物学功能或用于干扰靶多肽参与的信号通路。
备选地,可以设立筛选程序以鉴定植物群体中基因的天然变体,该变体编码具有降低活性的多肽。此类天然变体也可用于例如实施同源重组。
人工和/或天然的微RNA(miRNA)可以用来敲除基因表达和/或mRNA翻译。内源性miRNA是通常19-24个核苷酸长度的单链小RNA。它们的主要功能是调节基因表达和/或mRNA翻译。大多数植物微RNA(miRNA)与它们的靶序列具有完全或近乎完全的互补性。然而,有的天然靶标多达五个错配。它们通过Dicer家族双链特异性核糖核酸酶从更长的非编码RNA(带有特征性折回结构)加工。加工后,通过结合到其主要组分(Argonaute蛋白质)将它们整合入RNA诱导的沉默复合物(RISC)中。由于它们与细胞质中的靶核酸(主要是mRNA)进行碱基配对,MiRNA用作RISC的特异性组分。随后的调节事件包括靶mRNA切割和破坏和/或翻译抑制。因此,miRNA过表达的影响常常反映在靶基因减少的mRNA水平中。
通常21个核苷酸长度的人工微RNA(amiRNA)可以遗传改造以特异性地负调节单个或多个目的基因的基因表达。植物微RNA靶的选择的决定因素是本领域众所周知的。用于靶识别的经验参数已经确定并且可以用来辅助设计特定的amiRNA(Schwab等,Dev.Cell 8:517-527,2005)。用于设计并产生amiRNA及其前体的便利工具也是公众可获得的(Schwab等,Plant Cell 18:1121-1133,2006)。
为优化性能,用于降低内源基因在植物中表达的基因沉默技术需要使用来自单子叶植物的核酸序列以转化单子叶植物,和使用来自双子叶植物的核酸序列以转化双子叶植物。优选地,将来自任何给定植物物种的核酸序列引入同一个物种内。例如,将来自稻的核酸序列转化至稻植物。然而,并非绝对要求待引入的核酸序列起源于与该核酸序列将要引入的植物相同的植物物种。只要内源性靶基因与待引入的核酸之间存在相当大的同源性就足够了。
上文描述的是用于降低或基本去除内源基因在植物中表达的多种方法的例子。本领域技术人员会轻易地能够调整前述用于沉默的方法以至于例如通过利用合适启动子而实现在整株植物或在其部分中降低内源基因的表达。
转化
如本文中所提及的术语“引入”或“转化”包括将外源性多核苷酸转移至宿主细胞内,无论用于转化的方法是什么。能够后续克隆性增殖(无论通过器官发生或胚胎发生)的植物组织可以用本发明的遗传构建体转化并且可以从中再生整株植物。选择的具体组织将取决于可用于并且最适于正进行转化的具体物种的克隆性增殖系统。示例性组织靶包括叶盘、花粉、胚、子叶、下胚轴、大配子体、愈伤组织、已有的分生组织(例如顶端分生组织、腋芽和根分生组织)和诱导的分生组织(例如子叶分生组织和下胚轴分生组织)。多核苷酸可以瞬时或稳定地引入宿主细胞并且可以非整合地维持,例如作为质粒。或者,多核苷酸可以整合至宿主基因组内。产生的转化植物细胞随后可以用来以本领域技术人员已知的方式再生出转化植物。
外来基因转移至植物基因组内称作转化。植物物种的转化现在是相当常规的技术。有利地,几种转化方法中的任一方法可以用来将目的基因引入合适的祖先细胞。用于从植物组织或植物细胞中转化并再生出植物所述的方法可以用于瞬时转化或用于稳定转化。转化方法包括使用脂质体、电穿孔法、增加游离DNA摄入的化学品、DNA直接注射至植物、粒子枪轰击法、使用病毒或花粉的转化法和显微注射。转化方法可以选自用于原生质体的钙/聚乙二醇法(Krens,F.A.等,(1982)Nature 296,72-74;NegrutiuI等(1987)Plant Mol Biol 8:363-373);原生质体的电穿孔法(Shillito R.D.等(1985)Bio/Technol 3,1099-1102);对植物材料的显微注射(Crossway A等,(1986)Mol.Gen Genet 202:179-185);包被有DNA或RNA的粒子轰击法(Klein TM等,(1987)Nature 327:70)、(非整合性)病毒感染法等。转基因植物,包括转基因作物植物,优选地通过农杆菌介导的转化法产生。有利的转化方法是在植物中(in planta)的转化法。为此目的,例如有可能使农杆菌作用于植物种子或有可能用农杆菌接种植物的分生组织。根据本发明已经证明使转化的农杆菌混悬液作用于完整植物或至少作用于花原基是特别有利的。植物随后继续培育直至获得所处理植物的种子(Clough和Bent,Plant J.(1998)16,735-743)。用于农杆菌介导的稻转化的方法包括用于稻转化的公知方法,如在任一以下文献中描述的那些方法:欧洲专利申请EP 1198985 A1,Aldemita和Hodges(Planta 199:612-617,1996);Chan等(Plant Mol Biol 22(3):491-506,1993),Hiei等(Plant J 6(2):271-282,1994),其公开内容在本文中引入作为参考,如同完全给出那样。在玉米转化的情况下,优选的方法如Ishida等(Nat.Biotechnol 14(6):745-50,1996)或Frame等(Plant Physiol 129(1):13-22,2002)描述,其公开内容在本文中如充分所述那样引入作为参考。所述方法通过举例方式进一步由B.Jenes等,Techniques for Gene Transfer,在:Transgenic Plants,第1卷,Engineering and Utilization,编者S.D.Kung和R.Wu,AcademicPress(1993)128-143及在Potrykus Annu.Rev.Plant Physiol.Plant Molec.Biol.42(1991)205-225)中描述。待表达的核酸或构建体优选地克隆至适于转化根癌农杆菌(Agrobacterium tumefaciens)的载体中,例如pBin19(Bevan等,Nucl.Acids Res.12(1984)8711)。由这种载体转化的农杆菌随后可以按照已知方式用于转化植物,例如作为模型使用的植物,如拟南芥(拟南芥属于本发明的范围,不视为作物植物)或作物植物如,例如烟草植物,例如通过在农杆菌溶液中浸泡擦伤的叶或切碎的叶并随后将它们在合适的培养基内培育。植物通过根癌农杆菌的转化例如由
Figure BDA0000136403840000361
和Willmitzer在Nucl.Acid Res.(1988)16,9877中描述或尤其从F.F.White,Vectors for GeneTransfer in Higher Plants;在Transgenic Plants,第1卷,Engineering andUtilization,编者S.D.Kung和R.Wu,Academic Press,1993,第15-38页中获知。
除了转化体细胞(其随后必须再生成完整植物)之外,还有可能转化植物分生组织的细胞及特别转化发育成配子的那些细胞。在这种情况下,转化的配子遵循天然的植物发育过程,产生转基因植物。因此,例如拟南芥种子用农杆菌处理并且从发育植物中获得种子,其中一定比例的所述植物受到转化并且因此是转基因的[Feldman,KA和Marks MD(1987)Mol GenGenet.208:274-289;Feldmann K(1992)。在:编者C Koncz,N-H Chua和J Shell,Methods in Arabidopsis Research.Word Scientific,Singapore,第274-289页]。替代性方法基于反复去掉花序并使莲座中心中的切除部位与转化的农杆菌孵育,因而转化的种子同样可以在较晚的时间点获得(Chang(1994)Plant J.5:551-558;Katavic(1994).Mol Gen Genet,245:363-370)。然而,尤其有效的方法是改进的真空渗入法,如“花浸染”法。在拟南芥真空渗入法的情况下,完整植物在减压下用农杆菌混悬液处理[Bechthold,N(1993).C R Acad Sci Paris Life Sci,316:1194-1199],而在“花浸染”法的情况下,正在发育的花组织与表面活性剂处理的农杆菌混悬液短暂孵育[Clough,SJ和Bent,AF(1998)The Plant J.16,735-743]。在两种情况下收获了一定比例的转基因种子,并且这些种子可以通过在如上所述的选择条件下培育而与非转基因种子区分。此外,质体的稳定转化是有利的,因为质体在大部分作物中以母体方式遗传,降低或消除了转基因经花粉流动风险。叶绿体基因组的转化一般通过已在Klaus等,2004[Nature Biotechnology 22(2),225-229]中示例性加以展示的方法实现。简而言之,待转化的序列连同可选择标记基因一起克隆至与叶绿体基因组同源的侧翼序列之间。这些同源的侧翼序列指导位点特异性整合至原质体系内。已经对众多不同植物物种描述了质体转化并且综述可以出自Bock(2001)在基础研究和植物生物技术中的转基因质体(Transgenicplastids in basic research and plant biotechnology).J Mol Biol.2001年9月21日;312(3):425-38或Maliga,P(2003)质体转化技术商业化进展(Progress towards commercialization of plastid transformationtechnology).Trends Biotechnol.21,20-28。进一步生物技术进展最近已经以无标记质体转化体的形式作了报道,所述无标记质体转化体可以通过瞬时共整合的标记基因产生(Klaus等,2004,Nature Biotechnology 22(2),225-229)。
遗传修饰的植物细胞能够通过技术人员熟悉的所有方法再生。合适的方法可见于上述S.D.Kung和R.Wu、Potrykus或者
Figure BDA0000136403840000381
和Willmitzer的出版物。
通常在转化以后,选出存在一个或多个标记的植物细胞或细胞群,所述标记由与目的基因共转移的植物可表达基因编码,继之将转化的材料再生成整个植物。为选择转化的植物,通常将在转化过程中获得的植物材料置于选择性条件下,从而可将转化的植物与非转化植物区分开来。例如,可以种植以上述方式获得的种子,并在最初的生长期之后,通过喷雾对其进行合适的选择。另一可能方案是使用合适的选择剂,将种子(适当时在灭菌之后)种在琼脂板上,从而仅转化的种子能够长成植物。备选地,针对转化的植物筛选可选择标记(如上文所述标记)的存在。
DNA转移和再生之后,还可评价推定转化的植物,例如用Southern分析,评价目的基因的存在、拷贝数和/或基因组构造。备选地或额外地,可用Northern和/或Western分析监测新引入的DNA的表达水平,这两种技术都是本领域普通技术人员所众所周知的。
产生的转化植物可以通过多种方式繁殖,如通过克隆繁殖或经典的育种技术。例如,第一代(或T1)转化的植物可自交,选择纯合的第二代(或T2)转化体,而T2植物可进一步通过经典育种技术繁殖。产生的转化生物体可以有多种形式。例如,它们可以是转化细胞和非转化细胞的嵌合体;克隆的转化体(例如所有细胞经转化含有表达盒);转化和非转化组织的嫁接体(例如在植物中,转化的根状茎嫁接到非转化的接穗上)。
T-DNA激活标签化
T-DNA激活标签化(Hayashi等Science(1992)1350-1353)涉及在目的基因的基因组区域内或基因编码区上游或下游10kb处以如此结构插入T-DNA(通常含有启动子,也可以是翻译增强子或内含子),使得启动子指导被靶定基因的表达。通常,由靶定基因的天然启动子对所述靶定基因表达的调节作用遭到破坏并且该基因处在新引入的启动子控制下。启动子一般嵌入在T-DNA中。这种T-DNA随机地插入植物基因组,例如通过农杆菌感染,并导致在所插入T-DNA附近的基因的经修饰的表达。因靠近所引入启动子的基因的经修饰的表达,产生的转基因植物表现显性表型。
TILLING
术语“TILLING”是“基因组内定向诱导的局部损伤”的缩写,指用于产生和/或鉴定核酸的诱变技术,其中所述的核酸编码具有修饰的表达和/或活性的蛋白质。TILLING还允许选择携带此类突变变体的植物。这些突变变体可以显示在强度方面或在位置方面或在时间方面经修饰的表达(例如若突变影响启动子)。这些突变变体可以显示比由处于其天然形式的基因所显出活性更高的活性。TILLING将高密度诱变与高通量筛选方法组合。一般在TILLING中遵循的步骤是:(a)EMS诱变(Redei GP和KonczC(1992)在Methods in Arabidopsis Research,Koncz C,Chua NH,SchellJ编辑,Singapore,World Scientific Publishing Co,第16-82页;Feldmann等,(1994)在Meyerowitz EM,Somerville CR编辑,Arabidopsis.ColdSpring Harb或Laboratory Press,Cold Spring Harbor,NY,第137-172页;Lightner J和Caspar T(1998)在J Martinez-Zapater,J Salinas编者,Methods on Molecular Biology第82卷.Humana Press,Totowa,NJ,第91-104页);(b)个体的DNA制备和汇集;(c)PCR扩增目的区;(d)变性和退火以允许形成异源双链体;(e)DHPLC,其中将异源双链体在汇集物中的存在检测为色谱图之一额外峰;(f)鉴定突变个体;和(g)对突变PCR产物测序。用于TILLING的方法是本领域众所周知的(McCallum等,(2000)Nat Biotechnol 18:455-457;综述见Stemple(2004)Nat Rev Genet 5(2):145-50)。
同源重组
同源重组允许选择的核酸在基因组中于确定的所选择位置内引入。同源重组是在生物科学中常规地用于低等生物如酵母或苔藓剑叶藓(Physcomitrella)的标准技术。用于在植物中开展同源重组的方法已经不仅对模式植物(Offringa等,(1990)EMBO J 9(10):3077-84)而且对作物植物例如稻(Terada等,(2002)Nat Biotech 20(10):1030-4;Iida和Terada(2004)Curr Opin Biotech 15(2):132-8)进行了描述,并且不论何种目标生物,都存在一般可用的方法(Miller等,Nature Biotechnol.25,778-785,2007)。
产量相关性状
产量相关性状包括下述一项或多项:早期开花时间;产量、生物量、种子产量、早期萌发势、绿度指数、增加的生长速率、改进的农学性状(如改进的用水效率(WUE)、氮利用效率(NUE)等)。
产量
术语“产量”通常意指经济价值的可测量结果,一般与指定作物、与面积并与时间段有关。单个植物部分基于它们的数目、大小和/或重量而直接对产量有贡献,或实际产量是对于某作物而言一年内每平方米的产量,这通过总产量(包括收获的和评价的产量)除以种植的平方米数而确定。在本文中可互换使用的术语植物的“产量”和“植物产量”可以与该植物的营养体生物量如根和/或苗生物量、繁殖器官和/或繁殖体例如种子有关。
以玉米为例,产量增加可以表现为下列一种或多种指标:每平方米中已建立植物数的增加、每株植物穗数的增加、行数、每行粒数、粒重、千粒重、玉米穗长度/直径的增加、种子饱满率的增加(其中种子饱满率是饱满种子数除以种子总数并乘以100)及其它。以稻为例,产量增加本身可以表现为下列一种或多种指标的增加:每平方米植物数、每株植物穗(panicle)数、穗长度、每穗小穗数、每穗花(小花)数、种子饱满率的增加(其中种子饱满率是饱满种子数除以种子总数并乘以100)、千粒重的增加及其它。在稻中,浸没耐受性也可以产生增加的产量。
早期开花时间
如本文中所用,具有“早期开花时间”的植物是比对照植物更早开始开花的植物。因此该术语指显示出更早开始开花的植物。植物的开花时间可以通过计数播种和第一个花序出现之间的天数(“开花时间”)评价。植物的“开花时间”可以例如使用如在WO 2007/093444中所述的方法测定。
早期萌发势
“早期萌发势”指活跃、健康、良好平衡的生长(特别是在植物生长早期期间),并可以因植物适合度增加而产生,其原因在于例如植物更好地适应其环境(即优化能源的使用和苗与根之间的分配)。具有早期萌发势的植物也显示增加的幼苗存活和更好的作物建立,这往往导致高度均匀的田块(作物整齐地生长,即大多数植物在基本上相同的时间上达到发育的各阶段)和往往更好及更高的产量。因而,早期萌发势可以通过测量多种因素如千粒重、萌发百分数、出苗百分数、幼苗生长、幼苗高度、根长度、根及苗生物量和众多其它因素而确定。
增加的生长速率
增加的生长速率可以对于植物的一个或多个部分(包括种子)是特异性的,或可以基本上遍及整株植物。具有增加的生长速率的植物可以具备较短的生活周期。植物的生活周期可以视为意指从干燥成熟种子成长至植物已经产生与起始材料相似的干燥成熟种子的阶段所需要的时间。这个生活周期可以受下列因素影响,如发芽的速度、早期萌发势、生长速率、绿度指数、开花时间和种子成熟速度。生长速率的增加可以在植物生活周期之一或多个阶段上或在基本上整个植物生活周期期间发生。在植物生活周期中的早期期间增加的生长速率可以反映增强的萌发势。生长速率的增加可以改变植物的收获周期,允许植物较晚播种和/或较早收获,否则这将不可能(相似的作用可以用较早的开花时间获得)。若生长速率充分地增加,可以允许再播种相同植物物种的种子(例如播种并收获稻植物,随后播种并收获其它稻植物,全部均在一个常规生长时段内)。类似地,若生长速率足够地增加,可以允许再播种不同植物物种的种子(例如播种并收获玉米植物,随后例如播种并任选收获大豆、马铃薯或任何其它合适植物)。从相同的根茎中收获额外次数在一些作物植物的情况中也是可能的。改变植物的收获周期可以导致每平方米的年生物量产量的增加(因任何特定植物可以生长并收获的次数(如在一年中)增加)。生长速率的增加也可以允许比其野生型对应物而言在更广泛的地理区域内培育转基因植物,因为对培育作物的区域限制往往由栽种时节(早季)或在收获时期(晚季)的不利环境条件所决定。若缩短收获周期,则可以避开这类不利条件。生长速率可以通过从生长曲线中得到多种参数而确定,此类参数可以是:T-Mid(植物达到其50%最大尺寸所花费的时间)和T-90(植物达到其90%最大尺寸所花费的时间),等等。
胁迫抗性
与对照植物相比,无论植物处于非胁迫条件下还是植物暴露于多种胁迫下,都发生产量和/或生长速率的增加。植物一般通过生长得更慢而对暴露于胁迫作出应答。在严重胁迫条件下,植物甚至可以完全停止生长。另一方面,轻微胁迫在本文中定义为植物暴露于其的任何胁迫,其中所述的胁迫未导致植物完全停止生长而没有恢复生长的能力。与非胁迫条件下的对照植物相比,轻微胁迫在本发明意义中导致受胁迫植物生长降低小于40%、35%、30%或25%,更优选小于20%或15%。由于农业实践(灌溉、施肥、杀虫剂处理)上的进步,在栽培作物植物中并不经常遇到严重胁迫。因此,由轻微胁迫诱导的受损生长往往是农业上不希望的特征。轻微胁迫是植物暴露的常见生物性和/或非生物性(环境)胁迫。非生物胁迫可以因干旱或水涝、厌氧胁迫、盐胁迫、化学毒性、氧化胁迫和热、寒冷或冰冻温度所致。非生物胁迫可以是由水胁迫(尤其因为干旱)、盐胁迫、氧化胁迫或离子胁迫引起的渗透胁迫。生物胁迫一般是由病原体如细菌、病毒、真菌、线虫和昆虫引起的那些胁迫。
尤其,本发明的方法可以在非胁迫条件下或在轻微干旱条件下实施以产生相对于对照植物而具有增加的产量的植物。如在Wang等(Planta(2003)218:1-14)中报道,非生物胁迫导致不利地影响植物生长及生产力的一系列形态学变化、生理学变化、生物化学变化和分子变化。已知干旱、盐度、极端温度和氧化胁迫是相互联系的并可以通过相似机制而诱导生长损害及细胞损害。Rabbani等(Plant Physiol(2003)133:1755-1767)描述了干旱胁迫与高盐度胁迫间极高程度的“交叉(cross talk)”。例如,干旱和/或盐化作用主要表现为渗透胁迫,导致细胞内稳态和离子分布的破坏。经常伴随高温或低温、盐度或干旱胁迫的氧化胁迫可以造成功能性蛋白和结构蛋白变性。因此,这些多样的环境胁迫常常激活相似的细胞信号途径和细胞应答,如产生胁迫蛋白质、上调抗氧化物质、积累相容性溶质和生长抑制。如本文中所用的术语“非胁迫”条件是允许植物最佳生长的环境条件。本领域技术人员清楚对于给定地点的正常土壤条件和气候条件。最佳生长下生长的植物(在非胁迫条件下生长)一般出产以递增优选顺序至少97%、95%、92%、90%、87%、85%、83%、80%、77%或75%的给定环境下这样植物的平均生产。平均生产可以收获和/或季节为基础进行计算。本领域技术人员清楚作物的平均产量生产。
营养缺乏可以由营养物(例如氮、磷和其它含磷化合物、钾、钙、镁、锰、铁或者硼以及其它)缺少引起。
术语盐胁迫不限于常见盐(NaCl),可以为以下一种或多种:NaCl、KCl、LiCl、MgCl2、CaCl2等。
增加/改进/增强
术语“增加”、“改进”或“增强”是可互换的并且应当在本申请含义上指与如本文中定义的对照植物相比至少3%、4%、5%、6%、7%、8%、9%或10%、优选至少15%或20%、更优选25%、30%、35%或40%更多的产量和/或生长。
种子产量
增加的种子产量本身可以表现为下列一种或多种指标:
a)种子生物量(种子总重量)增加,这可以基于单粒种子和/或每株植物和/或每平方米;
b)每株植物增加的花数;
c)增加的种子数和/或增加的饱满种子数;
d)增加的种子饱满率(其表述为饱满种子数除以种子总数的比率);
e)增加的收获指数,其表述为可收获部分(如种子)产量除以总生物量(即植物地上部分的生物量)的比率;和
f)增加的千粒重(TKW),其从计数的饱满种子数及其总重量外推而来。
增加的TKW可以因增加的种子大小和/或种子重量所致,并且也可以因胚和/或胚乳尺寸的增加所致。
种子产量的增加也可以表现为种子大小和/或种子体积的增加。此外,种子产量的增加本身也可以表现为种子面积和/或种子长度和/或种子宽度和/或种子周长的增加。
绿度指数
如本文所用的“绿度指数”根据植物的数字图像计算。对于图像中属于植物目标的每一个像素,计算绿色值相对于红色值(在用于编码颜色的RGB模型中)之比。绿度指数表达为绿红比超过给定阈值的像素百分比。在正常生长条件下、在盐胁迫生长条件下、及在养分利用度下降的生长条件下,测量开花前末次成像时的植物绿度指数。相反,在干旱胁迫生长条件下,测量干旱后首次成像时的植物绿度指数。
生物量
如本文中所用的术语“生物量”意图指植物的总重量。在定义生物量的情况下,在植物的一个或多个部分的生物量之间可以进行区分,所述植物的一个或多个部分可以包括:
-地上(可收获)部分例如但不限于苗生物量、种子生物量、叶生物量等和/或
-地下(可收获)部分,例如但不限于根生物量等,和/或
-营养生物量例如根生物量、苗生物量等,和/或
-繁殖器官,和/或
-繁殖体例如种子。
标记辅助的育种
这种育种程序有时需要通过使用例如EMS诱变法对植物作诱变处理而引入等位基因变异;备选地,该程序可以从非故意引起的所谓“自然”起源的等位变体集合开始。随后进行等位变体的鉴定,例如通过PCR法。此后是用于选择所讨论序列的优选等位变体且其导致增加的产量的步骤。一般通过监测含有所讨论序列的不同等位变体的植物的生长性能而实施选择。可以在温室中或田间监测生长性能。其它任选步骤包括将鉴定到有优选等位变体的植物与另一种植物杂交。这可以用来例如产生目标表型特征的组合。
探针在(遗传作图)中的用途
编码目的蛋白质的核酸用于遗传和物理作图,该基因仅需要具有至少15个核苷酸长度的核酸序列。这些核酸可以用作限制性片段长度多态性(RFLP)标记。限制性消化的植物基因组DNA的Southern印迹(SambrookJ,Fritsch EF和Maniatis T(1989)Molecular Cloning,A LaboratoryManual)可以用编码目的蛋白质的核酸序列来探测。产生的条带图谱随后可以使用计算机程序如MapMaker(Lander等(1987)Genomics 1:174-181)进行遗传分析以构建遗传图。此外,该核酸可以用来探测含有经限制性内切核酸酶处理的一组个体的基因组DNA的Southern印迹,其中所述的一组个体代表具有确定的遗传杂交的亲代和后代。DNA多态性的分离被标出并用来计算编码目的蛋白质的核酸在使用这个群体先前所获得的遗传图中的位置(Botstein等(1980)Am.J.Hum.Genet.32:314-331)。
在Bernatzky和Tanksley(1986)Plant Mol.Biol.Reporter 4:37-41中描述了植物基因衍生的探针的产生和其在遗传作图中的用途。众多出版物描述了使用以上所提及的方法学或其改进方法对特定cDNA克隆的遗传作图。例如,F2互交群、回交群、随机交配群、近等基因系和其它个体群体可以用于作图。此类方法学是本领域技术人员众所周知的。
所述核酸序列探针也可以用于物理作图(即序列在物理图上的排列;见Hoheisel等在:Non-mammalian Genomic Analyasis:A Practical Guide,Academic press 1996,第319-346页及其中引用的参考文献)。
在另一实施方案中,核酸探针可以在直接荧光原位杂交(FISH)作图(Trask(1991)Trends Genet.7:149-154)中使用。尽管当前的FISH作图法支持使用大型克隆(几个kb至几百个kb;见Laan等(1995)Genome Res.5:13-20),然而灵敏度的改进可以允许使用更短探针进行FISH作图。
用于遗传作图及物理作图的多种基于核酸序列扩增的方法可以使用所述核酸序列而实施。例子包括等位基因特异的扩增(Kazazian(1989)J.Lab.Clin.Med 11:95-96)、PCR扩增片段的多态性(CAPS;Sheffield等(1993)Genomics 16:325-332)、等位基因特异性连接(Landegren等(1988)Science241:1077-1080)、核苷酸延伸反应(Sokolov(1990)Nucleic Acid Res.18:3671)、放射杂交作图(Walter等(1997)Nat.Genet.7:22-28)和Happy作图(Dear和Cook(1989)Nucleic Acid Res.17:6795-6807)。对于这些方法,使用核酸的序列来设计并产生在扩增反应或在引物延伸反应中使用的引物对。此类引物的设计是本领域技术人员众所周知的。在使用基于PCR遗传作图的方法中,可能必须鉴定在对应于当前核酸序列的整个区域内作图亲代间的DNA序列差异。然而,这对于作图法而言通常不是必需的。
植物
如本文中所用的术语“植物”包括整株植物、植物的祖先及后代和植物部分,包括种子、苗、茎、叶、根(包括块茎)、花和组织及器官,其中每种所提及对象包含目的基因/核酸。术语“植物”也包括植物细胞、悬浮培养物、愈伤组织、胚、分生组织区、配子体、孢子体、花粉和小孢子,同样每种提及的对象包含目的基因/核酸。
特别用于本发明方法中的植物包括属于植物界(Viridiplantae)超家族的全部植物,尤其单子叶植物和双子叶植物,包括选自以下的饲用或饲料豆类、观赏植物、粮食作物、树或灌木:槭树属物种(Acer spp.)、猕猴桃属物种(Actinidia spp.)、秋葵属物种(Abelmoschus spp.)、剑麻(Agavesisalana)、冰草属物种(Agropyron spp.)、匍匐剪股颖(Agrostisstolonifera)、葱属物种(Allium spp.)、苋属物种(Amaranthus spp.)、欧洲海滨草(Ammophila arenaria)、凤梨(Ananas comosus)、番荔枝属物种(Annona spp.)、芹菜(Apium graveolens)、落花生属物种(Arachis spp.)、木波罗属物种(Artocarpus spp.)、石刁柏(Asparagus officinalis)、燕麦属物种(Avena spp.)(例如燕麦(Avena sativa)、野燕麦(Avena fatua)、比赞燕麦(Avena byzantina)、Avena fatua var.sativa、杂种燕麦(Avena hybrida))、阳桃(Averrhoa carambola)、箣竹属物种(Bambusa sp.)、冬瓜(Benincasahispida)、巴西栗(Bertholletia excelsea)、甜菜(Beta vulgaris)、芸苔属物种(Brassica spp.)(例如欧洲油菜(Brassica napus)、芜青物种(Brassica rapassp.)[芸苔(canola)、油菜(oilseed rape)、蔓青(turnip rape)])、Cadabafarinosa、茶(Camellia sinensis)、美人蕉(Canna indica)、大麻(Cannabissativa)、辣椒属物种(Capsicum spp.)、天麻苔草(Carex elata)、番木瓜(Caricapapaya)、大果假虎刺(Carissa macrocarpa)、山核桃属物种(Carya spp.)、红花(Carthamus tinctorius)、栗属物种(Castanea spp.)、美洲木棉(Ceibapentandra)、苦苣(Cichorium endivia)、樟属物种(Cinnamomum spp.)、西瓜(Citrullus lanatus)、柑桔属物种(Citrus spp.)、椰子属物种(Cocos spp.)、咖啡属物种(Coffea spp.)、芋头(Colocasia esculenta)、非洲梧桐属物种(Colaspp.)、黄麻属物种(Corchorus sp.)、芫荽(Coriandrum sativum)、榛属物种(Corylus spp.)、山楂属物种(Crataegus spp.)、番红花(Crocus sativus)、南瓜属物种(Cucurbita spp.)、香瓜属物种(Cucumis spp.)、菜蓟属物种(Cynaraspp.)、胡萝卜(Daucus carota)、山马蝗属物种(Desmodium spp.)、龙眼(Dimocarpus longan)、薯蓣属物种(Dioscorea spp.)、柿树属物种(Diospyrosspp.)、稗属物种(Echinochloa spp.)、油棕属(Elaeis)(例如油棕(Elaeisguineensis)、美洲油棕(Elaeis oleifera))、穇子(Eleusine coracana)、Eragrostistef、蔗茅属物种(Erianthus sp.)、枇杷(Eriobotrya japonica)、桉属物种(Eucalyptus sp.)、红仔果(Eugenia uniflora)、荞麦属物种(Fagopyrum spp.)、水青冈属物种(Fagus spp.)、苇状羊茅(Festuca arundinacea)、无花果(Ficuscarica)、金桔属物种(Fortunella spp.)、草莓属物种(Fragaria spp.)、银杏(Ginkgo biloba)、大豆属物种(Glycine spp.)(例如大豆(Glycine max)、大豆(Soja hispida)或大豆(Soja max))、陆地棉(Gossypium hirstum)、向日葵属物种(Helianthus spp.)(例如向日葵(Helianthus annuus))、长管萱草(Hemerocallis fulva)、木槿属物种(Hibiscus spp.)、大麦属物种(Hordeumspp.)(例如大麦(Hordeum vulgare))、甘薯(Ipomoea batatas)、核桃属物种(Juglans spp.)、莴苣(Lactuca sativa)、山黧豆属物种(Lathyrus spp.)、兵豆(Lens culinaris)、亚麻(Linum usitatissimum)、荔枝(Litchi chinensis)、百脉根属物种(Lotus spp.)、棱角丝瓜(Luffa acutangula)、羽扇豆属物种(Lupinus spp.)、Luzula sylvatica、番茄属物种(Lycopersicon spp.)(例如番茄(Lycopersicon esculentum)、Lycopersicon lycopersicum、Lycopersiconpyriforme)、硬皮豆属物种(Macrotyloma spp.)、苹果属物种(Malus spp.)、凹缘金虎尾(Malpighia emarginata)、牛油果(Mammea americana)、芒果(Mangifera indica)、木薯属物种(Manihot spp.)、人心果(Manilkarazapota)、紫苜蓿(Medicago sativa)、草木樨属物种(Melilotus spp.)、薄荷属物种(Mentha spp.)、芒(Miscanthus sinensis)、苦瓜属物种(Momordicaspp.)、黑桑(Morus nigra)、芭蕉属物种(Musa spp.)、烟草属物种(Nicotianaspp.)、木犀榄属物种(Olea spp.)、仙人掌属物种(Opuntia spp.)、鸟足豆属物种(Ornithopus spp.)、稻属物种(Oryza spp.)(例如稻、阔叶稻(Oryzalatifolia))、稷(Panicum miliaceum)、柳枝稷(Panicum virgatum)、鸡蛋果(Passiflora edulis)、欧防风(Pastinaca sativa)、狼尾草属物种(Pennisetumsp.)、鳄梨属物种(Persea spp.)、芹菜(Petroselinum crispum)、虉草(Phalarisarundinacea)、菜豆属物种(Phaseolus spp.)、猫尾草(Phleum pratense)、刺葵属物种(Phoenix spp.)、南方芦苇(Phragmites australis)、酸浆属物种(Physalis spp.)、松属物种(Pinus spp.)、阿月浑子(Pistacia vera)、豌豆属物种(Pisum spp.)、早熟禾属物种(Poa spp.)、杨属物种(Populus spp.)、牧豆草属物种(Prosopis spp.)、李属物种(Prunus spp.)、番石榴属物种(Psidiumspp.)、石榴(Punica granatum)、西洋梨(Pyrus communis)、栎属物种(Quercus spp.)、萝卜(Raphanus sativus)、波叶大黄(Rheumrhabarbarum)、茶藨子属物种(Ribes spp.)、蓖麻(Ricinus communis)、悬钩子属物种(Rubus spp.)、甘蔗属物种(Saccharum spp.)、柳属物种(Salixsp.)、接骨木属物种(Sambucus spp.)、黑麦(Secale cereale)、胡麻属物种(Sesamum spp.)、白芥属物种(Sinapis sp.)、茄属物种(Solanum spp.)(例如马铃薯(Solanum tuberosum)、红茄(Solanum integrifolium)或番茄(Solanum lycopersicum))、高粱(Sorghum bicolor)、菠菜属物种(Spinaciaspp.)、蒲桃属物种(Syzygium spp.)、万寿菊属物种(Tagetes spp.)、酸豆(Tamarindus indica)、可可树(Theobroma cacao)、车轴草属物种(Trifoliumspp.)、Tripsacum dactyloides、黑小麦物种(Triticale sp.)、Triticosecalerimpaui、小麦属物种(Triticum spp.)(例如普通小麦(Triticum aestivum)、硬粒小麦(Triticum durum)、圆柱小麦(Triticum turgidum)、Triticumhybernum、马卡小麦(Triticum macha)、普通小麦(Triticum sativum)、Triticum monococcum或普通小麦(Triticum vulgare))、小金莲花(Tropaeolum minus)、金莲花(Tropaeolum majus)、越桔属物种(Vacciniumspp.)、野碗豆属物种(Vicia spp.)、豇豆属物种(Vigna spp.)、香堇(Violaodorata)、葡萄属物种(Vitis spp.)、玉蜀黍(Zea mays)、Zizania palustris、枣属物种(Ziziphus spp.)等等。
对照植物
选择合适的对照植物是实验设置的常规部分并且可以包括对应的野生型植物或无目的基因的对应植物。对照植物一般是与待评价植物属于相同的植物物种或甚至是相同的品种。对照植物也可以是待评价植物的失效合子。失效合子是通过分离丢失转基因的个体。如本文中所用的“对照植物”不仅指整株植物,还指植物部分,包括种子及种子部分。
发明详述
意想不到的是,现在发现调节编码eRF1多肽之核酸在植物中的表达产生相对于对照植物而言具有增强的产量相关性状的植物。根据第一个实施方案,本发明提供了在植物中相对于对照植物而言增强产量相关性状的方法,包括调节植物中编码eRF1多肽之核酸的表达,和任选地选择具有增强的产量相关性状的植物。
本发明还提供了迄今未知的编码eRF1的核酸,以及eRF1多肽。
根据本发明另外的实施方案,从而提供了分离的核酸分子,选自:
(i)由以下核酸序列:具有SEQ ID NO:15的G.max_GM06MC33657_sm55b1032878;具有SEQ ID NO:17的H.vulgare_c64960768hv270303的任一表示的核酸;
(ii)由所述序列:具有SEQ ID NO:15的G.max_GM06MC33657_sm55b1032878;具有SEQ ID NO:17的H.vulgare_c64960768hv2703032598表示的核酸的互补序列;
(iii)编码由具有SEQ ID NO:16的G.max_GM06MC33657_sm55b1032878;具有SEQ ID NO:18的H.vulgare_c64960768hv270303的任一表示的多肽的核酸,优选地,由于遗传密码的简并性,所述分离的核酸可以衍生自由SEQ ID NO:16和18的任一表示的多肽序列,并且还优选地赋予相对于对照植物而言增强的产量相关性状。
(iv)核酸,所述核酸以递增的优先顺序与表A1的任一核酸序列具有至少30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性,并且另外优选地赋予相对于对照植物而言增强的产量相关性状;
(v)核酸分子,所述核酸分子在严格杂交条件下与(i)至(iv)项的核酸分子杂交,并优选地赋予相对于对照植物而言增强的产量相关性状。
(vi)编码eRF1多肽的核酸,所述eRF1多肽以递增的优先顺序与由SEQ ID NO:16和18的任一表示的氨基酸序列和表A1中的任一其它氨基酸序列具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性,并且优选地赋予相对于对照植物而言增强的产量相关性状。
根据本发明另外的实施方案,从而还提供了分离的多肽,选自:
(i)由SEQ ID NO:16和18的任一表示的氨基酸序列;
(ii)氨基酸序列,所述氨基酸序列以递增的优先顺序与由SEQ ID NO:16和18的任一表示的氨基酸序列和表A1中的任一其它氨基酸序列具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性,并且优选地赋予相对于对照植物而言增强的产量相关性状。
(iii)上述(i)或(ii)项中给出的任一氨基酸序列的衍生物。
此外,意想不到的是,现在发现调节编码SCAMP样多肽之核酸在植物中的表达产生相对于对照植物而言具有增强的产量相关性状的植物。根据第一个实施方案,本发明提供了在植物中相对于对照植物而言增强产量相关性状的方法,包括调节植物中编码SCAMP样多肽之核酸的表达,和任选地选择具有增强的产量相关性状的植物。
本发明还提供了迄今未知的编码SCAMP样的核酸,以及多肽。
根据本发明另外的实施方案,从而提供了分离的核酸分子,选自:(i)由SEQ ID NO:100、102、104、106、180、182、184、186、188、190和192的任一表示的核酸;
(ii)由(i)项SEQ ID NO:100、102、104、106、108、182、184、186、188、190和192的任一表示的核酸的互补序列;
(iii)编码由SEQ ID NO:101、103、105、107、181、183、185、187、189、191和193的任一表示的多肽的核酸;优选地,由于遗传密码的简并性,所述分离的核酸可以衍生自由SEQ ID NO:101、103、105、107、181、183、185、187、189、191和193的任一表示的多肽序列,并且另外优选地赋予相对于对照植物而言增强的产量相关性状。
(iv)核酸,所述核酸以递增的优先顺序与表A2的任一核酸序列具有至少30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性,并且另外优选地赋予相对于对照植物而言增强的产量相关性状;
(v)核酸分子,所述核酸分子在严格杂交条件下与(i)至(iv)项的核酸分子杂交,并优选地赋予相对于对照植物而言增强的产量相关性状。
(vi)编码多肽的核酸,所述多肽以递增的优先顺序与由SEQ ID NO:101、103、105、107、181、183、185、187、189、191和193的任一表示的氨基酸序列和表A2中的任一其它氨基酸序列具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性,并且优选地赋予相对于对照植物而言增强的产量相关性状。
根据本发明另外的实施方案,从而还提供了分离的多肽,选自:
(i)由SEQ ID NO:101、103、105、107、181、183、185、187、189、191和193的任一表示的氨基酸序列;
(ii)氨基酸序列,所述氨基酸序列以递增的优先顺序与由SEQ ID NO:101、103、105、107、181、183、185、187、189、191和193的任一表示的氨基酸序列和表A2中的任一其它氨基酸序列具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性,并且优选地赋予相对于对照植物而言增强的产量相关性状。
(iii)上述(i)或(ii)项中给出的任一氨基酸序列的衍生物。
此外,意想不到的是,现在发现调节编码肌原纤蛋白多肽之核酸在植物质体中的表达产生相对于对照植物而言具有增强的产量相关性状的植物。根据第一个实施方案,本发明提供了在植物中相对于对照植物而言增强产量相关性状的方法,包括调节植物质体中编码肌原纤蛋白多肽之核酸的表达,和任选地选择具有增强的产量相关性状的植物。
根据本发明另外的实施方案,从而提供了分离的核酸分子,选自:
(i)由以下核酸序列的任一表示的核酸:具有SEQ ID NO:206的B.napus_BN06MC20042_4649927919975;具有SEQ ID NO:220的G.max_GM06MC 19234_5969470918873;
(ii)由所述序列:具有SEQ ID NO:206的B.napus_BN06MC20042_4649927919975;具有SEQ ID NO:220的G.max_GM06MC19234_5969470918873表示的核酸的互补序列;
(iii)编码由SEQ ID NO:207;SEQ ID NO:221的任一表示的多肽的核酸,优选地,由于遗传密码的简并性,所述分离的核酸可以衍生自由SEQID NO:207和221的任一表示的多肽序列,并且还优选地赋予相对于对照植物而言增强的产量相关性状。
(iv)核酸,所述核酸以递增的优先顺序与表A3的任一核酸序列具有至少30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性,并且还优选地赋予相对于对照植物而言增强的产量相关性状;
(v)核酸分子,所述核酸分子在严格杂交条件下与(i)至(iv)项的核酸分子杂交,并优选地赋予相对于对照植物而言增强的产量相关性状。
(vi)编码肌原纤蛋白多肽的核酸,所述肌原纤蛋白多肽以递增的优先顺序与由SEQ ID NO:207和221的任一表示的氨基酸序列和表A3中的任一其它氨基酸序列具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性,并且优选地赋予相对于对照植物而言增强的产量相关性状。
根据本发明另外的实施方案,从而还提供了分离的多肽分子,选自:
(i)由SEQ ID NO:207和221的任一表示的氨基酸序列;
(ii)氨基酸序列,所述氨基酸序列以递增的优先顺序与由SEQ ID NO:207和221的任一表示的氨基酸序列和表A3中的任一其它氨基酸序列具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性,并且优选地赋予相对于对照植物而言增强的产量相关性状。
(iii)上述(i)或(ii)项中给出的任一氨基酸序列的衍生物。
此外,意想不到的是,现在发现调节编码PLATZ多肽之核酸在植物中的表达产生相对于对照植物而言具有增强的产量相关性状的植物。根据第一个实施方案,本发明提供了在植物中相对于对照植物而言增强产量相关性状的方法,包括调节植物中编码PLATZ多肽之核酸的表达,和任选地选择具有增强的产量相关性状的植物。
本发明还提供了迄今未知的编码PLATZ的核酸,以及PLATZ多肽。
根据本发明另外的实施方案,从而提供了分离的核酸分子,选自:
(i)由SEQ ID NO:354表示的核酸;
(ii)由SEQ ID NO:354表示的核酸的互补序列;
(iii)编码PLATZ多肽的核酸,所述PLATZ多肽以递增的优先顺序与由SEQ ID NO:355表示的氨基酸序列具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更多的序列同一性,并且以递增的优先顺序与在本文中所定义的基序的一个或多个具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更多的序列同一性。
根据本发明另外的实施方案,从而还提供了分离的多肽分子,选自:
(i)由SEQ ID NO:355表示的氨基酸序列;
(ii)氨基酸序列,所述氨基酸序列以递增的优先顺序与由SEQ ID NO:355表示的氨基酸序列具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更多的序列同一性,并且以递增的优先顺序与在本文中所定义的基序的一个或多个具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更多的序列同一性。
(iii)上述(i)或(ii)项中给出的任一氨基酸序列的衍生物。
此外,意想不到的是,现在发现调节编码PLST样多肽之核酸在植物中的表达产生相对于对照植物而言具有增强的产量相关性状的植物。根据第一个实施方案,本发明提供了在植物中相对于对照植物而言增强产量相关性状的方法,包括调节植物中编码PLST样多肽之核酸的表达,和任选地选择具有增强的产量相关性状的植物。
本发明还提供了迄今未知的编码PLST样的核酸,以及PLST样多肽。
根据本发明另外的实施方案,从而提供了分离的核酸分子,选自:(i)由以下核酸序列的任一表示的核酸:具有SEQ ID NO:414;SEQ ID NO:426;SEQ ID NO:428;SEQ ID NO:434;SEQ ID NO:438;
(ii)由所述具有SEQ ID NO:414;SEQ ID NO:426;SEQ ID NO:428;SEQ ID NO:434;SEQ ID NO:438的序列表示的核酸的互补序列;
(iii)编码由具有SEQ ID NO:415;SEQ ID NO:427;SEQ ID NO:429;SEQ ID NO:435;SEQ ID NO:439的任一表示的多肽的核酸,优选地,由于遗传密码的简并性,所述分离的核酸可以衍生自由SEQ ID NO:415;SEQ ID NO:427;SEQ ID NO:429;SEQ ID NO:435;SEQ ID NO:439的任一表示的多肽序列,并且另外优选地赋予相对于对照植物而言增强的产量相关性状。
(iv)核酸,所述核酸以递增的优先顺序与表A5的任一核酸序列具有至少30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性,并且另外优选地赋予相对于对照植物而言增强的产量相关性状;
(v)核酸分子,所述核酸分子在严格杂交条件下与(i)至(iv)项的核酸分子杂交,并优选地赋予相对于对照植物而言增强的产量相关性状。
(vi)编码PLST样多肽的核酸,所述PLST样多肽以递增的优先顺序与由SEQ ID NO:415;SEQ ID NO:427;SEQ ID NO:429;SEQ ID NO:435;SEQ ID NO:439的任一表示的氨基酸序列和表A5中的任一其它氨基酸序列具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性,并且优选地包含基序19至21和44至60和PF结构域,赋予相对于对照植物而言增强的产量相关性状。
根据本发明另外的实施方案,从而还提供了分离的多肽分子,选自:
(i)由SEQ ID NO:415;SEQ ID NO:427;SEQ ID NO:429;SEQ IDNO:435;SEQ ID NO:439的任一表示的氨基酸序列;
(ii)氨基酸序列,所述氨基酸序列以递增的优先顺序与由SEQ ID NO:415;SEQ ID NO:427;SEQ ID NO:429;SEQ ID NO:435;SEQ ID NO:439的任一表示的氨基酸序列和表A5中的任一其他氨基酸序列具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性,并且优选地包含基序19至21和44至60和PF结构域,赋予相对于对照植物而言增强的产量相关性状。
(iii)上述(i)或(ii)项中给出的任一氨基酸序列的衍生物。
此外,意想不到的是,现在发现调节编码Glomalin多肽之核酸在植物中的表达产生相对于对照植物而言具有增强的产量相关性状的植物。根据第一个实施方案,本发明提供了在植物中相对于对照植物而言增强产量相关性状的方法,包括调节植物中编码Glomalin多肽之核酸的表达,和任选地选择具有增强的产量相关性状的植物。
本发明还提供了迄今未知的编码Glomalin的核酸,以及Glomalin多肽。
根据本发明另外的实施方案,从而提供了分离的核酸分子,选自:
(i)由SEQ ID NO:568、SEQ ID NO:569或SEQ ID NO:570之一表示的核酸;
(ii)由SEQ ID NO:568、SEQ ID NO:569或SEQ ID NO:570之一表示的核酸的互补序列;
(iii)编码Glomalin多肽的核酸,所述Glomalin多肽以递增的优先顺序与由SEQ ID NO:592、SEQ ID NO:593或SEQ ID NO:594之一表示的氨基酸序列具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性,并且另外地或备选地包含一个或多个基序,所述基序以递增的优先顺序与基序31至43(SEQ ID NO:596至SEQ ID NO:608)之一比较具有两个、一个序列错配或者没有序列错配,并还优选地赋予相对于对照植物而言增强的产量相关性状。
(iv)核酸分子,所述核酸分子在高严格杂交条件下与(i)至(iii)项的核酸分子杂交,并优选地赋予相对于对照植物而言增强的产量相关性状。
根据本发明另外的实施方案,从而还提供了分离的多肽分子,选自:
(i)由SEQ ID NO:592、SEQ ID NO:593或SEQ ID NO:594之一表示的氨基酸序列;
(ii)氨基酸序列,所述氨基酸序列以递增的优先顺序与由SEQ ID NO:592、SEQ ID NO:593或SEQ ID NO:594之一表示的氨基酸序列具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性,并且另外地或备选地包含一个或多个基序,所述基序以递增的优先顺序与基序41至43(SEQID NO:596至SEQ ID NO:608)之一比较具有两个、一个序列错配或者没有序列错配,并另外优选地赋予相对于对照植物而言增强的产量相关性状。
(iii)上述(i)或(ii)项中给出的任一氨基酸序列的衍生物。
用于调节(优选增加)编码eRF1多肽之核酸的表达的优选的方法是通过在植物中引入和表达编码eRF1多肽之核酸。用于调节(优选增加)编码SCAMP样多肽之核酸的表达的另一优选方法是通过在植物中引入和表达编码SCAMP样多肽之核酸。用于调节(优选增加)编码肌原纤蛋白多肽之核酸的表达的又另一优选方法是通过在植物中引入和表达编码肌原纤蛋白多肽之核酸。用于调节(优选增加)编码PLATZ多肽之核酸的表达的另一优选方法是通过在植物中引入和表达编码PLATZ多肽之核酸。用于调节(优选增加)编码PLST样多肽之核酸的表达的还另一优选方法是通过在植物中引入和表达编码PLST样多肽之核酸。用于调节(优选增加)编码Glomalin多肽之核酸的表达的另一优选方法是通过在植物中引入和表达编码Glomalin多肽之核酸。
在一个实施方案中,“用于本发明方法的蛋白质”指本文所定义的eRF1多肽。在另一实施方案中,“用于本发明方法的核酸”指能够编码此eRF1多肽的核酸。在这种实施方案中,待引入植物(因此可用于实施本发明方法)的核酸是编码现将描述的蛋白质类型的任何核酸,下文也称为“eRF1核酸”或“eRF1基因”。
如本文中所定义,“eRF1多肽”指包含至少3个共有结构域-eRF1结构域1、eRF1结构域2和eRF1结构域3(PFam登录号分别为PF03463、PF03464和PF03465)的任一多肽。
优选地,eRF1多肽的eRF1结构域1以递增的优先顺序与位于SEQ IDNO 2的氨基酸6和140之间的序列具有至少49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或者更多的序列同一性。
优选地,eRF1多肽的eRF1结构域2以递增的优先顺序与位于SEQ IDNO 2的氨基酸144和278之间的序列具有至少49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或者更多的序列同一性。
优选地,eRF1多肽的eRF1结构域3以递增的优先顺序与位于SEQ IDNO 2的氨基酸281和418之间的序列具有至少49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或者更多的序列同一性。
本发明另外优选的eRF1多肽包含一个或多个以下多肽:分别具有SEQID NO:73、74和75的GGQ、NIKS和[GA][IMLV]LR[YW]。
备选地,用于本发明方法的eRF1多肽包含一个或多个序列基序,所述序列基序以递增的优先顺序与任一以下基序:
基序1:
FGTLSGNTREVLHKF[TS]VDLPKKHGRGGQSALRFARLRMEKRHNYVRK[TV]AE(SEQ ID NO:76);
基序2:
YN[KR]VPPNGLVLY[TC]GT[IV]VT[ED][DE]GKEKKV[TN]IDFEPF[KR]PIN[AT]SLYLCDNKFHTE(SEQ ID NO:77);
基序3:
ARGNGTSMISLI[MI]PP[RK]DQ[IV]SRVTKML[GA]DE[YF]GTASNIKSRVNR[QL]SVL[GS]AIT(SEQ ID NO:78)具有至少49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或者更多的序列同一性。
本文中以括号指出的氨基酸表示可以由任一其他氨基酸取代。
基序1至3在任一eRF1多肽中通常可见。
在本发明另一优选的实施方案中,本发明的eRF1多肽可以包含任意一个或多个序列基序,所述序列基序以递增的优先顺序与任一以下基序:
基序4:
F[TS]VDLPKKHGRGGQSALRFARLR[EM]EKRHNYVRKVAE[VL]A[VT]QNFITND[KR][PV]NV(SEQ ID NO:79);
基序5:
Y[NT][KR]VPPNGLV[VLI]YCG[TD][IV][ILM]T[ED][ED]GKE[KR]K[VM][NT]ID[FI]EPFKPINTSLYLCDNKFHTE(SEQ ID NO:80);
基序6:
ARGNGTSMISL[IV][IM]PPK[DG]Q[IV]S[RL]V[QA]KML[AT][DE]EYGTASNIKSRVNR[LQ]SVL[SG]AIT(SEQ ID NO:81)具有至少49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或者更多的序列同一性。
基序4、5和6对应于非链形植物(non-Streptophyta)来源的eRF1多肽中代表保守蛋白质区域的共有序列。
更优选地,本发明的eRF1多肽可以包含任意一个或多个以下序列基序,所述序列基序以递增的优先顺序与任一以下基序:
基序7:
VDLPKKHGRGGQSALRFARLRMEKRHNYVRKTAELATQF[YF]INPATSQPNV(SEQ ID NO:82)
基序8:
YNKVPPNGLVLYTGTIVT[ED]DGKEKKVTIDFEPF[KR]PINASLYLCDNKFHTE(SEQ ID NO:83)
基序9:
TSMISLIMPPRDQ[VI]SRVTKMLGDE[FY]GTASNIKSRVNRQSVLGAITSAQQR(SEQ ID NO:84)具有至少49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或者更多的序列同一性。
基序7、8和9对应于如下共有序列,所述共有序列代表拟南芥属于的链形植物簇的eRF1多肽中的保守蛋白质区域。
应当理解,本文所指的基序1、2、3、4、5、6、7、8和9代表在特定eRF1多肽中,优选在表A1的任一eRF1多肽中,更优选在SEQ ID NO:2中存在的同源基序的共有序列。本文中所定义的基序并不限于其各个序列,并且它们包括在任一eRF1中存在的同源基序。
鉴定与用于本发明方法的多肽中的基序1至9同源的基序的方法是本领域众所周知的。例如,可以使用算法例如Blast(Altschul等人(1990)J MolBiol 215:403-10),通过将它们的各个氨基酸序列比对而将多肽与基序比较,以鉴定具有类似序列的区域。
备选地,eRF1多肽的同源物以递增的优先顺序与由表A1的任一多肽,优选地由SEQ ID NO:2表示的氨基酸具有至少25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的整体序列同一性,只要同源多肽包括如上所述的保守基序。整体序列同一性使用全局比对算法,如GAP程序(GCGWisconsin Package,Accelrys)中的Needleman Wunsch算法,优选用默认参数并优选使用成熟蛋白质的序列(即,不考虑分泌信号或转运肽)来进行确定。与整体序列同一性相比,当仅考虑保守结构域或基序时,序列同一性通常较高。对于局部比对,Smith-Waterman算法是特别有用的(SmithTF,Waterman MS(1981)J.Mol.Biol 147(1);195-7)。
优选地,eRF1多肽的序列,当用于构建系统树(例如图1中描述的)时,与包含由SEQ ID NO:2表示的氨基酸序列的eRF1多肽的群聚簇。
在另一实施方案中,“用于本发明方法的蛋白质/多肽”指本文所定义的SCAMP样多肽。在另一实施方案中,“用于本发明方法的核酸”指能够编码此SCAMP样多肽的核酸。在此种实施方案中,待引入植物(因此可用于实施本发明方法)的核酸是编码现将描述的蛋白质类型的任何核酸,下文也称为“SCAMP样核酸”或“SCAMP样基因”。
如本文中所定义,“SCAMP样多肽”指包含SCAMP结构域(HMMPFam PF04144)的任一多肽。
优选地,SCAMP样多肽的SCAMP结构域以递增的优先顺序与表A2的任一多肽中存在的SCAMP结构域的氨基酸,优选与由位于SEQ ID NO:89的氨基酸91和265之间的序列表示的SCAMP结构域具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性。
更优选地,除SCAMP结构域外,用于本发明方法的SCAMP样多肽具有一个或多个,优选至少4个或3个、或2个、或1个跨膜结构域区域(TMR)。
多肽中的跨膜结构域区域(TMR),以及鉴定它们的方法是本领域众所周知的。在实施例部分中另外提供了此类方法的实例。
更优选地,用于本发明方法的SCAMP样多肽的TMR以递增的优先顺序与在表A2的任一多肽中,优选SEQ ID NO:89中存在的TMR的一个或多个的氨基酸具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性。
在SEQ ID NO:89中存在的TMR由以下序列表示:
  氨基端   跨膜区   羧基端   长度  SEQ ID NO:
  121   AFTTLLGLVGCLLWNIVAVTVAW   143   23  194
  151   IWLLSIIYFLAGVPGAYVLWYRP   173   23  195
  186   FGAFFFFYVFHIAFCGFAAVAPP   208   23  196
  227   TTNAAVGIMYFIGAGFFCIETLL   249   23  197
氨基端和羧基端列表示SEQ ID NO:89中跨膜结构域的氨基酸坐标。
另外更优选地,用于本发明方法的SCAMP样多肽包含至少2、1、0、3、4或5个重复或者三肽NPF(SEQ ID NO:198)。该三肽与胞吞作用期间SCAMP蛋白质通过结合来招募EH蛋白质的生物学作用有关。SCAMP多肽中NPF三肽优选地以递增的优先顺序位于氨基端、羧基端,以及氨基端和羧基端二者。
一般地和甚至更优选地,本发明的SCAMP样多肽共有常见的结构域结构,其包含具有多个NPF重复的胞质氨基端结构域、4个高度保守的跨膜区(TMR)和短的胞质羧基端尾巴。
本发明优选的SCAMP样多肽的氨基端尾巴以递增的优先顺序与在表A2的任一多肽中存在的氨基端尾巴,优选SEQ ID NO:89的氨基端尾巴和由MARHDPNPFADEEINPFANHTSVPPASNSYLKPLPPEPYDRGATVDIPLDSGNDLRAKEMELQAKENELKRKEQELKRREDAIARTGVVIEEKNWPEFFPLIHHDIPNEIPIHLQKIQYV(SEQ ID NO:199)表示的氨基酸具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性。
本发明优选的SCAMP样多肽的羧基端尾巴以递增的优先顺序与在表A2的任一多肽中存在的羧基端尾巴,优选SEQ ID NO:89的羧基端尾巴和由NIWVIQQVYAYFRGSGKAAEMKREA TKSTLMRAL(SEQ ID NO:200)表示的氨基酸具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性。
一般地,多肽包含E肽。E肽指保守的氨基酸基序,其以递增的优先顺序与LWYRPLYRAFRTDSA(SEQ ID NO:201)或LWYRPLYNAMRTESA(SEQ ID NO:202)表示的氨基酸具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的整体序列同一性。
备选地,本发明的SCAMP样核酸是任一这样的核酸,所述核酸编码表A2的任一多肽的同源物,优选其直向同源物或旁系同源物。优选此类同源物具有等同的(或类似的)生物学功能,例如在细胞分离时(例如果实脱落和裂开期间)发生的内吞过程期间招募EH蛋白质。
备选地,用于本发明方法的SCAMP样蛋白质的同源物以递增的优先顺序与由表A2的任一多肽表示的氨基酸,优选地与SEQ ID NO:89具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的整体序列同一性。
整体序列同一性使用全局比对算法,如GAP程序(GCG WisconsinPackage,Accelrys)中的Needleman Wunsch算法,优选用默认参数并优选的使用成熟蛋白质的序列(即,不考虑分泌信号或转运肽)来进行确定。与整体序列同一性相比,当仅考虑保守结构域或基序时,序列同一性通常较高。对于局部比对,Smith-Waterman算法是特别有用的(Smith TF,Waterman MS(1981)J.Mol.Biol 147(1);195-7)。
在另一实施方案中,“用于本发明方法的蛋白质”指本文所定义的肌原纤蛋白多肽。在另一实施方案中,“用于本发明方法的核酸”指能够编码此肌原纤蛋白多肽的核酸。在此种实施方案中,待引入植物(因此可用于实施本发明方法)的核酸是编码现将描述的蛋白质类型的任何核酸,下文也称为“肌原纤蛋白核酸”或“肌原纤蛋白基因”。
如本文中所定义,“肌原纤蛋白多肽”指包含以下的任一多肽:
(i)由PFAM登录号PF04755表示的PAP肌原纤蛋白结构域;和
(ii)由KFECQNESRGGLVRNVIKWSVPRLLEEN
EGATLIVTARFSSVSARNIYLKFEEIGLQNINISDDLQAVIAPAILPRSFLSLQILQFIRSFKARVPVTSPERHSVGGLYYLSYLDKNMLLGRAVGGGGVFIFTRAHTL(SEQ ID NO:253)表示的羧基端结构域,其可以含有表示1至15个残基之间的0至5个之间的空位,或者结构域,其以递增的优先顺序与(SEQID NO:253)具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的整体序列同一性;和任选地
(iii)在多肽的氨基端区域内的转运肽。
SEQ ID NO:253表示如出现在由SEQ ID NO:205表示的肌原纤蛋白中羧基端结构域的氨基酸序列。
根据本发明优选的特征,PAP肌原纤蛋白结构域由ENRKYELLNIIQDTQRGLVTTADQRSTIEEAMVVVEGFDAGKEIDLSKLDG TWQYTSAPDVLILFESAARLPFFQVGQIFQ(SEQ ID NO:252)表示,其可以含有表示1至15个残基之间的0至5个之间的空位,或者结构域,其以递增的优先顺序与SEQ ID NO:252具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的整体序列同一性的结构域。SEQ ID NO:252表示PAP肌原纤蛋白结构域的氨基酸序列,其出现在由SEQ ID NO:205表示的肌原纤蛋白中。
肌原纤蛋白多肽的另外特征是存在一个或多个以下结构域:
结构域X:NIYLQF[EQ]E[IA]S[VL]Q[ND]INISE[EQ]LQAL[IL]APA[IL]LPRSFL[SN]LQILQ[FA][LI][RK][TS]F[KR]AQ[VI]P(SEQ ID NO:254);
结构域Y:YYL[ST]YLD[RN][ND]MLLGR[AS]VGGGGV(SEQID NO:255);
结构域Z:[PA][IL]DL[AS]KLDGTWRLQYTSA[SP]DV(SEQ ID NO:256);或以递增的优先顺序与结构域X、Y和Z的任意一个或多个具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的整体序列同一性的结构域。
肌原纤蛋白通常以递增的优先顺序与由SEQ ID NO:205表示的氨基酸具有至少45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的整体序列同一性。整体序列同一性使用全局比对算法,如GAP程序(GCG Wisconsin Package,Accelrys)中的Needleman Wunsch算法,优选用默认参数并优选的使用成熟蛋白质的序列(即,不考虑分泌信号或转运肽)来进行确定。与整体序列同一性相比,当仅考虑保守结构域或基序时,序列同一性通常较高。对于局部比对,Smith-Waterman算法是特别有用的(Smith TF,Waterman MS(1981)J.Mol.Biol147(1);195-7)。
优选地,当多肽序列用于构建系统树时,例如图6中描述的,与包含由SEQ ID NO:205表示的氨基酸序列的肌原纤蛋白多肽的群聚簇,而不与任何其他群聚簇。
在另一实施方案中,“用于本发明方法的蛋白质”指本文所定义的PLATZ多肽。在另一实施方案中,“用于本发明方法的核酸”指能够编码此PLATZ多肽的核酸。在此种实施方案中,待引入植物(因此可用于实施本发明方法)的核酸是编码现将描述的蛋白质类型的任何核酸,下文也称为“PLATZ核酸”或“PLATZ基因”。
如本文中所定义,“PLATZ多肽”指包含PLATZ结构域(Pfamaccession PF04640;InterPro accession IPR006734);并包含具有共有序列C-x(2)-H-x(11)-C-x(2)-C-x(4-5)-C-x(2)-C-x(3-7)-H-x(2)-H(SEQ ID NO:262)的氨基端锌结合区和具有在中心区共有序列C-x(2)-C-x(10-11)-C-x(3)-C(SEQID NO:263)的锌结合区的任一多肽,如在Nagano等人(2001)中所述。换言之,如在本文中所定义,“PLATZ多肽”指包含PLATZ结构域(Pfamaccession PF04640;InterPro accession IPR006734);并包含具有由任一以下序列:CxxHxxxxxxxxxxxCxxCxxxxCxxCxxxHxxH(SEQ ID NO:645);CxxHxxxxxxxxxxxCxxCxxxxCxxCxxxxHxxH(SEQ ID NO:646);CxxHxxxxxxxxxxxCxxCxxxxCxxCxxxxxHxxH(SEQ ID NO:647);CxxHxxxxxxxxxxxCxxCxxxxCxxCxxxxxxHxxH(SEQ ID NO:648);CxxHxxxxxxxxxxxCxxCxxxxCxxCxxxxxxxHxxH(SEQ ID NO:649);CxxHxxxxxxxxxxxCxxCxxxxxCxxCxxxHxxH(SEQ ID NO:650);CxxHxxxxxxxxxxxCxxCxxxxxCxxCxxxxHxxH(SEQ ID NO:651);CxxHxxxxxxxxxxxCxxCxxxxxCxxCxxxxxHxxH(SEQ ID NO:652);CxxHxxxxxxxxxxxCxxCxxxxxCxxCxxxxxxHxxH  (SEQ ID NO:653);CxxHxxxxxxxxxxxCxxCxxxxxCxxCxxxxxxxHxxH(SEQ ID NO:654)给出的共有序列的氨基端锌结合区;和在中心区中具有共有序列CxxCxxxxxxxxxxCxxxC(SEQ ID NO:655)或CxxCxxxxxxxxxxx CxxxC(SEQ ID NO:656)的锌结合区的任一多肽,如在Nagano等人(2001)中所述。
优选地,用于本发明方法的PLATZ蛋白质包含一个或多个以下基序(由MEME定义;Bailey和Elkan,Proceedings of the Second InternationalConference on Intelligent Systems for Molecular Biology,第28-36页,AAAI Press,Menlo Park,California,1994,Bailey等人,Nucleic AcidsResearch,34,W369-W373,2006):
基序10(SEQ ID NO:264):[VI]QTY[TVI]INSA[KR]V[VI]FL[NK][QE]RPQ[SP]R
基序11(SEQ ID NO:265):HRSHR[LV][LI]Q[VI]RR[YS][VS]YHDV[VI]R[LV]x[DE][LI][QE]KL[IL]D[CI]
基序12(SEQ ID NO:266):[KR]NE[KC]N[IV]FCLDC
更优选地,PLATZ蛋白质包含一个或多个由MEME所定义的以下基序:
基序13(SEQ ID NO:267):HRSH[RP]LLQVRRYVYHDV[VI]RLEDL[EQ]KLIDCS
基序14(SEQ ID NO:268):FKG[SL]GN[SY]CT[TS]CDR[SI]LQEP[FY][HR][FHY]CS[LV][SG]CKV
基序15(SEQ ID NO:269):AWLE[AG]L[LY][TA][EDQ]KFFV[GA]C[SP]xHEx[AR][KR]KNEKN[IV][FC]C[LV]DC[CS][AT]SIC[PQ]HC。
最优选地,PLATZ蛋白质包含一个或多个如由MEME所定义的以下基序:
基序16(SEQ ID NO:270):RRYVYHDVVRLEDL[EQ]KLIDCS[NS]VQ[AS]YTINS[AS]KVVF[IL]KKRPQNRQFKG[SA]GN
基序17(SEQ ID NO:271):PAWLEALY[TA][QE]KFF[VA][GA]CS[YF]HE[HNT]AKKNEKN[IV]CCLDCC[TI]SICPHC[VL]P[SA]HR[FV]HR
基序18(SEQ ID NO:272):CTSCDRSLQEP[FY][IF]HCSL[GD]CKV[DE][FY][VI]L[KR][HQ][YK]KDLS[PA]YLR[PTR]C[KN][TS]L[QT]L[GS]PDF[FL]IP。
此外,优选地,PLATZ多肽以递增的优先顺序包含至少2个或者至少3个上述基序。
备选地或另外地,PLATZ蛋白质的同源物以递增的优先顺序与由SEQID NO:261表示的氨基酸具有至少25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的整体序列同一性,只要同源蛋白质包括如上所述的一个或多个保守基序。整体序列同一性使用全局比对算法,如GAP程序(GCGWisconsin Package,Accelrys)中的Needleman Wunsch算法,优选用默认参数并优选的使用成熟蛋白质的序列(即,不考虑分泌信号或转运肽)来进行确定。与整体序列同一性相比,当仅考虑保守结构域或基序时,序列同一性通常较高。优选地,PLATZ多肽中的基序以递增的优先顺序与由SEQ ID NO:264至SEQ ID NO:272(基序10-18)表示的基序具有至少70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性。
优选地,当多肽序列用于构建系统树时,例如图12中描述的,与包含由SEQ ID NO:261表示的氨基酸序列的PLATZ-A多肽的群,更优选地与PLATZ-A1蛋白质,最优选地与PLATZ-A1-α蛋白质聚簇,而不与任何其他PLATZ蛋白质的群聚簇。
在另一实施方案中,“用于本发明方法的蛋白质”指本文所定义的PLST样多肽。在另一实施方案中,“用于本发明方法的核酸”指能够编码此PLST样多肽的核酸。在此种实施方案中,待引入植物(因此可用于实施本发明方法)的核酸是编码现将描述的蛋白质类型的任何核酸,下文也称为“PLST样核酸”或“PLST样基因”。
如本文中所定义,“PLST样多肽”指包含至少一个PLST样共有结构域(Pfam登录号PF02298)的任一多肽。
优选地,PLST样多肽的PLST样结构域以递增的优先顺序与位于SEQID NO 411的氨基酸38至124之间的序列具有至少49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或者更多的序列同一性。
备选地,用于本发明方法的PLST样多肽包含一个或多个序列基序,所述序列基序以递增的优先顺序与任一以下基序:
基序19:[DH]SV[LI]QV[TS]KE[DA][YF][DK]SCNT[SK][NSD]P(SEQ ID NO:530);
基序20:[FHY]YF[IT]SGV[PK][GD][HN]C(SEQ ID NO:531);
基序21:Y[NT][QK]WA[ESK][KS]NRF[KQ][IV]GD[ST][LI][VL]F[KL]YP(SEQ ID NO:532);
基序44:[DHN][SND][VLM]xx[VL]xxxx[FYHN]xxCxxTx[NSD](SEQ ID NO :615);
基序45:[GD]xx[FY][FYI]x[SGC][GAIT](SEQ ID NO:616);并优选地位置3处所述x选自以下氨基酸:F、H、Y、V和A。
基序46:[GV][GDAE]xxxWx[VITLA]xxxxxxW[ASPV]xxxx[FL]xx[GDNS]Dxxxxx[FY](SEQ IDNO:617);
基序47:[GV][GDAE]xxxWx[VITLA]xxxxxxxW[ASPV]xxxx[FL]xx[GDNS]Dxxxxx[FY](SEQID NO:618);
基序48:[GV][GDAE]xxxWx[VITLA]xxxxxxxxW[ASPV]xxxx[FL]xx[GDNS]Dxxxxx[FY](SEQID NO:619);
基序49:[GV][GDAE]xxxWx[VITLA]xxxxxxxxxW[ASPV]xxxx[FL]xx[GDNS]Dxxxxx[FY](SEQ ID NO:620);
基序50:[GV][GDAE]xxxWx[VITLA]xxxxxxxxxxW[ASPV]xxxx[FL]xx[GDNS]Dxxxxx[FY](SEQ ID NO:621);
基序51[GV][GDAE]xxxWx[VITLA]xxxxxxxxxxxW[ASPV]xxxx[FL]xx[GDNS]Dxxxxx[FY](SEQ ID NO:622);
基序52:[GV][GDAE]xxxWx[VITLA]xxxxxxxxxxxxW[ASPV]xxxx[FL]xx[GDNS]Dxxxxx[FY](SEQ ID NO:623);
基序53:[GV][GDAE]xxxxWx[VITLA]xxxxxxW[ASPV]xxxx[FL]xx[GDNS]Dxxxxx[FY](SEQID NO:624);
基序54:[GV][GDAE]xxxxWx[VITLA]xxxxxxxW[ASPV]xxxx[FL]xx[GDNS]Dxxxxx[FY](SEQID NO:625);
基序55:[GV][GDAE]xxxxWx[VITLA]xxxxxxxxW[ASPV]xxxx[FL]xx[GDNS]Dxxxxx[FY](SEQ ID NO:626);
基序56:[GV][GDAE]xxxxWx[VITLA]xxxxxxxxxW[ASPV]xxxx[FL]xx[GDNS]Dxxxxx[FY](SEQ ID NO:627);
基序57:[GV][GDAE]xxxxWx[VITLA]xxxxxxxxxxW[ASPV]xxxx[FL]xx[GDNS]Dxxxxx[FY](SEQ ID NO:628);
基序58[GV][GDAE]xxxxWx[VITLA]xxxxxxxxxxxW[ASPV]xxxx[FL]xx[GDNS]Dxxxxx[FY](SEQ ID NO:629);
基序59[GV][GDAE]xxxxWx[VTLA]xxxxxxxxxxxxW[ASPV]xxxx[FL]xx[GDNS]Dxxxxx[FY](SEQ ID NO:630)
具有至少49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或者更多的序列同一性。
备选地,或者此外组合地,在另一实施方案中,用于本发明方法的PLST样多肽包含序列基序,所述序列基序以递增的优先顺序与以下基序:
基序60:[FHY][YF][FY][TAI]S[GAD]xx[GD][HRN]C(SEQ ID NO:631)具有至少49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或者更多的序列同一性。
这些基序是共有序列,并且在PLST样序列中并非总是相同的。应当注意,本文中方括号中标出的氨基酸代表特定位置的备选氨基酸。在本文给定序列中,“x”可以是任一不同的氨基酸。
在本发明另一优选的实施方案中,本发明的PLST样多肽可以包含任意一个或多个序列基序,所述序列基序以递增的优先顺序与任一以下基序:
基序22:[DN]GN[TS][LVK][FV][KN][LF][DT]R[SP]GP[FY]YF[IT]SG[VA][KP][GD][HN]CEK[GN][QE]K(SEQ ID NO:533);
基序23:[YL]N[QK]WA[EK][KS][NH]RF[KQ][IV]GD[ST]L[LV]F[LK]Y[PD](SEQ ID NO:534);
基序24;[KQ]DSV[LI]QVTKE[DA]YKSCNT[SK][DSN]PI(SEQ ID NO:535);
基序61:
[DNT][GDE][NDKH][TS][LVKM][FVYI]x[LIF]xxxGx[FYHV][YF][FYI][ITVA]S[GAD]xxxxxC(SEQ ID NO:632);
基序62:
[DNT][GDE][NDKH][TS][LVKM][FVYI]x[LIF]xxxGx[FYHV][YF][FYI][ITVA]S[GAD]xxxxxxC(SEQ ID NO:633);
基序63:
[DNT][GDE][NDKH][TS][LVKM][FVYI]x[LIF]xxxGx[FYHV][YF][FYI][ITVA]S[GAD]xxxxC(SEQ ID NO:667);
基序64:
[NSDT]xW[ASPV]xxx[RSNT][FLV]x[VILT][GN]Dx[LIV]x[FLW]x[YF](SEQ ID NO:634);
基序65:S[VALM][LIM]x[VL]xxxx[YF]xxC[NTKD][SKTDG]xx[PAHY](SEQ ID NO:635)。
具有至少49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或者更多的序列同一性。
基序22、23和24,以及基序61至65对应于共有序列,其代表在包含PLST样、P_Class(拟南芥和毛果杨(P.trichocarpa)属于其)和NDL的群的多肽中保守的蛋白质区域。
最优选地,本发明的PLST样多肽可以包含任意一个或多个序列基序,所述序列基序以递增的优先顺序与任一以下基序:
基序25:DSVI[QV]VT[EKA][EQ]S[YF][KN][SK]CNL[KST]DPIL[YF][MS]N[ND]GN[ST][LV]FN[LI][TD][RS]PGL[FY]YF[TI]SG[VA][PS]GHC[EQ][KR](SEQ ID NO:536);
基序26:P[PT]SA[DN]P[DQ][VL]YTKW[AS][KS][NS][HN][RN]FK[IL]GD[ST][LI]LFLYP(SEQ ID NO:537);
基序27:XVS[CS]Y[QE][YF]KVG[DG]LD[AGS]W(SEQ ID NO 538);
基序66:DS[VALM][LVIM][QVE][VL][STA]xxx[FY]xxC[NDQ]x[KST]xP[LVIQH][LATF][YFTKS][FSLM]x[ND][GE][NDK][ST]x[FYI]x[LIF][TDSE](SEQ ID NO:636);
基序67:[YF]xxW[APV][KSG]xxx[FLV][KART][LIV][GN]D[SAT][LI]xFxY(SEQ ID NO:6377);
基序68:[YF]x[VA]G[DAGE]xx[GAS]Wx[VAI]P(SEQ ID NO:638)。具有至少49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或者更多的序列同一性。
基序25、26和27,以及基序66至68对应于共有序列,其代表在属于PLST样的多肽和拟南芥属于的P_Class群多肽中最保守的蛋白质区域。
在本发明最优选的实施方案中,本发明的PLST样多肽可以包含任意一个或多个序列基序,所述序列基序以递增的优先顺序与任一以下基序:
基序28:HN[FL]K[IL]GDSLLFLYPPSQDSVIQVTA[QE][SAN][YF][KN]SC[ND]L[KS]DPILYMN[DN]GNSLFN[IL]T(SEQ ID NO:539);
基序29:GDFYFTSG[AVE]PGHC[EQ]K[SK]QKLH[IV](SEQ ID NO:540);
基序30:VSCYQYKVGDLD[AS]WGIPTSA[NK](SEQ ID NO:541);
基序69:
[FLV]x[LIV]GD[SA][LIV][LFW]FLY[PL]PS[QE]DS[LMAV][LIV]Q[VL][TA]x2[ASN][FY](SEQID NO:639);
基序70:C[NDQ]X[SKT][DNS]P[LVI][LAT]X[MFL]X[ND]GN[ST][LAV][NK][LFI][ST](SEQ IDNO:640);
基序71:Gxx[FHY][YF][FY][TAI]S[GAD]xxG[HR]Cx[KR]x[QS][KR][LAI](SEQ ID NO:641);
基序72:[YF][KQ]VG[DAGN]L[DQN][AS]W[GAN][VAI]P[TIPS](SEQ ID NO:642);
基序73:GD[SA][LIV][LFW]FLY[PL]PS[QE](SEQ ID NO:643);
基序74:LY[PL]PS[QE](SEQ ID NO:644)具有至少49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或者更多的序列同一性。
应当理解,如本文中所述,由MEME(Timothy L.Bailey和CharlesElkan,“Fitting a mixture model by expectation maximization to discovermotifs in biopolymers”,Proceedings of the Second InternationalConference on Intelligent Systems for Molecular Biology,第28-36页,AAAIPress,Menlo Park,California,1994)测定的基序19、20、21、22、23、24、25、26、27、28、29和30表示在PLST样多肽中,优选地在表A5的PLST样多肽中,最优选地在SEQ ID NO:411中存在的基序的共有序列。本文中定义的基序并不限于其各个序列,并且它们包括在任一PLST样中显示的同源基序。
应当理解,如本文中所述,由MEME(Timothy L.Bailey和CharlesElkan,“Fitting a mixture model by expectation maximization to discovermotifs in biopolymers”,Proceedings of the Second InternationalConference on Intelligent Systems for Molecular Biology,第28-36页,AAAIPress,Menlo Park,California,1994)测定的基序44至74表示在PLST样多肽中,优选在表A5的PLST样多肽中,更优选在SEQ ID NO:411中存在的基序的共有序列。本文中定义的基序并不限于其各个序列,并且它们包括在任一PLST样中显示的同源基序。
鉴定与用于本发明方法的多肽中的基序19至30和/或基序44至74同源的基序的方法是本领域众所周知的。例如,可以使用算法例如Blast(Altschul等人(1990)J Mol Biol 215:403-10),通过将它们的各个氨基酸序列比对将多肽与基序比较,以鉴定具有类似序列的区域。
备选地,PLST样多肽的同源物以递增的优先顺序与由表A5的任一多肽,优选地由SEQ ID NO:411表示的氨基酸具有至少25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的整体序列同一性,只要同源多肽包括如上所述的保守基序。整体序列同一性使用全局比对算法,如GAP程序(GCG Wisconsin Package,Accelrys)中的Needleman Wunsch算法,优选用默认参数并优选的使用成熟蛋白质的序列(即,不考虑分泌信号或转运肽)来进行确定。与整体序列同一性相比,当仅考虑保守结构域或基序时,序列同一性通常较高。对于局部比对,Smith-Waterman算法是特别有用的(Smith TF,Waterman MS(1981)J.Mol.Biol 147(1);195-7)。
优选地,PLST样多肽的序列,当用于构建系统树时,例如图15中描述的,与包含由SEQ ID NO:411表示的氨基酸序列的PLST样多肽的群聚簇。
在另一实施方案中,“用于本发明方法的蛋白质”指本文所定义的Glomalin多肽。在另一实施方案中,“用于本发明方法的核酸”指能够编码此Glomalin多肽的核酸。在此种实施方案中,待引入植物(因此可用于实施本发明方法)的核酸是编码现将描述的蛋白质类型的任何核酸,下文也称为“Glomalin核酸”或“Glomalin基因”。
如本文中所定义,“Glomalin多肽”指包含Cpn60_TCP1结构域(Pfamaccession PF00118)和另外包含基序31、32和33或者具有与基序31至33不多于2个错配的基序的任一热休克蛋白60(HSP60多肽)。
基序31(SEQ ID NO:596):DDT(I/V/L)(I/V)L(D/H)G(G/A/L)G(N/D/E)K(A/T/K/Q)X(I/L)(E/D)(E/D)其中X为任一氨基酸,优选地为I、A、S、G、L、Q、T之一。
基序32(SEQ ID NO:597):(T/A)(S/A/N/E)N(F/E/D)(D/G)(E/Q)(K/R)(V/I/R)GV(Q/E)
基序33(SEQ ID NO:598):(E/Q)X(N/D)X(N/S/D)(I/L/F/M)G(Y/F/C)DAA(K/R)(A/G/D)(E/K/T)Y(V/L)(D/H)M,其中位置2的X为任一氨基酸,优选地为A、T、S、D、E之一,位置4的X为任一氨基酸,优选地为L、P、T、C之一。
另外地或备选地,Glomalin多肽包含基序34至43的一个或多个。
基序34(SEQ ID NO:599):L(Q/R/K)GV(E/S/N)(Q/E/D)(V/L)A(D/E)AV(K/Q)VTMGPKGR(T/H/N)V(V/I)(I/L)EXS,其中X为任一氨基酸,优选地为Q、S、R、K、G之一,最优选地为Q。
基序35(SEQ ID NO:600):KDGVTVAK(A/S)(I/V)(E/S/KN)F
基序36(SEQ ID NO:601):(KQ)(N/S)(I/V)GA(S/E/D/N)LVK(S/Q)VA(S/N/E/D)(S/A)TN
基序37(SEQ ID NO:602):TT(C/A)AT(V/I)L(T/A)(R/K/Q)AI(F/L)XEGCK(S/A)V(A/S)AG(M/V)(N/S)AMDLR,其中X为任一氨基酸,优选地为V、A、T、S、I之一。
基序38(SEQ ID NO:603):TISANG
基片39(SEQ ID NO:604):GK(E/H/D)GVIT(V/I)XDG(K/N)T(L/M),其中X为任一氨基酸,优选地为S、A、Q、T、V之一。
基序40(SEQ ID NO:605):RGY(I/T)SPYF(V/I)T(N/D)
基序41(SEQ ID NO:606):PLLI(V/I)(A/S)ED(V/L/I)(E/D)
基序42(SEQ ID NO:607):K(A/S)PGFG(E/D)(N/S)R
基序43(SEQ ID NO:608,位于蛋白质序列的羧基端末端):GMGG
更优选地,Glomalin多肽以递增的优先顺序包含至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少11个、至少12个或者全部13个基序。此外,glomalin优选地不具有分泌信号。
另外地或备选地备选地,Glomalin蛋白质的同源物以递增的优先顺序与由SEQ ID NO:546表示的氨基酸具有至少25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的整体序列同一性,只要同源多肽包括如上所述的保守基序任一或多个。整体序列同一性使用全局比对算法,如GAP程序(GCG Wisconsin Package,Accelrys)中的Needleman Wunsch算法,优选用默认参数并优选的使用成熟蛋白质的序列(即,不考虑分泌信号或转运肽)来进行确定。与整体序列同一性相比,当仅考虑保守结构域或基序时,序列同一性通常较高。优选地,Glomalin多肽中的基序以递增的优先顺序与由SEQ ID NO:596至SEQ ID NO:608(基序31至43)表示的基序具有至少70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性。
优选地,多肽序列,当用于构建系统树时,例如图19中描述的,与包含由SEQ ID NO:546表示的氨基酸序列的Glomalin多肽的群聚簇,而不与其他任何群聚簇。
术语“结构域”、“特征序列”和“基序”在本文“定义”章节中定义。存在用于鉴定结构域的专门数据库,例如SMART(Schultz等(1998)Proc.Natl.Acad.Sci.USA 95,5857-5864;Letunic等(2002)Nucleic Acids Res30,242-244),InterPro(Mulder等,(2003)Nucl.Acids.Res.31,315-318),Prosite(Bucher和Bairoch(1994),A generalized profile syntax forbiomolecular sequences motifs and its function in automatic sequenceinterpretation.(In)ISMB-94;Proceedings 2nd International Conferenceon Intelligent Systems for Molecular Biology.Altman R.,Brutlag D.,KarpP.,Lathrop R.,Searls D.编著,第53-61页,AAAI Press,Menlo Park;Hulo等,Nucl.Acids.Res.32:D134-D137,(2004)或者Pfam(Bateman等,NucleicAcids Research 30(1):276-280(2002))。用于计算机分析蛋白质序列的一组工具可获得自ExPASy蛋白组服务器(Swiss Institute of Bioinformatics(Gasteiger等,ExPASy:the proteomics server for in-depth proteinknowledge and analysis,Nucleic Acids Res.31:3784-3788(2003))。还可以使用常规技术(如序列比对)来鉴定结构域或基序。
关于PLATZ多肽,本文表A4中的PLATZ-A1-α多肽的比对示于图11中。这样的比对用于鉴定如本文定义的PLATZ多肽间最保守的结构域或者基序。一个这样的结构域是PLATZ结构域,在图10中以黑斜体标出。此类基序的实例是SEQ ID NO:264至SEQ ID NO:272,在图10中以各个基序号标记。
比对序列以进行比较的方法为本领域所众所周知,这些方法包括GAP、BESTFIT、BLAST、FASTA和TFASTA。GAP利用Needleman和Wunsch((1970)J Mol Biol 48:443-453)的算法来寻找两序列间使匹配数最高并使空位数最少的全局比对(即在完整序列上)。BLAST算法(Altschul等(1990)J Mol Biol 215:403-10)在两序列间计算百分比序列同一性并进行相似性的统计学分析。用于进行BLAST分析的软件在美国国家生物技术信息中心(National Centre for Biotechnology Information(NCBI))向公众提供。可以使用例如默认配对比对参数的ClustalW多重序列比对算法(1.83版)和百分比评分法来容易地鉴定同源物。也可以使用MatGAT软件包(Campanella等,BMC Bioinformatics.2003 Jul 10;4:29.MatGAT:anapplication that generates similarity/identity matrices using protein orDNA sequence)中提供的一种方法确定全局的相似性和同一性百分比。本领域技术人员会意识到,可以进行少量手动编辑以优化保守性基序之间的比对。此外,还可以使用特定的结构域代替全长序列来鉴定同源物。序列同一性值可以是使用默认参数的上述程序在完整的核酸或氨基酸序列上或在所选择的结构域或保守的基序上测定的。对于局部比对,Smith-Waterman算法是特别有用的(Smith TF,Waterman MS(1981)J.Mol.Biol147(1);195-7)。
关于PLATZ多肽,实施例3在表B3中描述了多种PLATZ多肽之间的同一性百分比,特别是SEQ ID NO:261(表示为Pt583639)与其他PLATZ-A1-α多肽之间的同一性百分比,其可以低至70%。通常,PLATZ-A1-α多肽的群内的同一性百分比为55%或者更高。
蛋白质亚细胞定位预测的工作是重要的并且已经进行了充分的研究。知晓蛋白质的定位有助于阐明其功能。用于蛋白质定位的实验方法涉及从免疫定位到使用绿色荧光蛋白(GFP)或者β-葡糖醛酸糖苷酶(GUS)的蛋白质标记的范围。与计算方法相比,尽管这些方法劳动量大,但是却是精确的。近来从数据库计算预测蛋白质定位取得了极大的进展。本领域技术人员众所周知的算法可获得自由瑞士信息学协会(Swiss Institute forBioinformatics)管理的ExPASy蛋白质组学工具,例如PSort、TargetP、ChloroP、LocTree、Predotar、LipoP、MITOPROT、PATS、PTS1、SignalP、TMHMM以及其他。
关于PLATZ多肽、PLATZ蛋白质,作为DNA结合蛋白质,可能具有核定位。
此外,eRF1多肽(至少以其天然形态)通常具有调节花分生组织活性的作用。用于测量花分生组织活性的工具和技术是本领域众所周知的。
另外,如实施例部分所述,当根据本发明方法在稻中表达时,eRF1多肽产生具有增强的产量相关性状,特别是增加的种子产量以及生物量的植物。
此外,eRF1多肽可以显示出优选的亚细胞定位,通常为核、胞质、叶绿体或者线粒体的一种或多种。蛋白质亚细胞定位预测的工作是重要的并且已经进行了充分的研究。知晓蛋白质的定位有助于阐明其功能。用于蛋白质定位的实验方法涉及从免疫定位到使用绿色荧光蛋白(GFP)或者β-葡糖醛酸糖苷酶(GUS)的蛋白质标记的范围。与计算方法相比,尽管这些方法劳动量大,但是却是精确的。近来从数据库计算预测蛋白质定位取得了极大的进展。本领域技术人员熟知的算法可获得自由瑞士信息学协会(Swiss Institute for Bioinformatics)管理的ExPASy蛋白质组学工具,例如PSort、TargetP、ChloroP、LocTree、Predotar、LipoP、MITOPROT、PATS、PTS1、SignalP、TMHMM以及其他。
此外,SCAMP样多肽(至少以其天然形态)通常具有EH蛋白质结合活性。用于测量EH蛋白质结合活性的工具和技术是本领域众所周知的。
另外,如实施例部分所述,当根据本发明方法在稻中表达时,SCAMP样多肽产生具有增强的产量相关性状的植物,特别是增加在氮缺乏生长条件下生长的植物的种子和/或生物量产量,如在实施例部分中所述的那些植物。
此外,SCAMP样多肽可以显示出优选的亚细胞定位,通常为核、胞质、叶绿体或者线粒体的一种或多种。蛋白质亚细胞定位预测的工作是重要的并且已经进行了充分的研究。知晓蛋白质的定位有助于阐明其功能。用于蛋白质定位的实验方法涉及从免疫定位到使用绿色荧光蛋白(GFP)或者β-葡糖醛酸糖苷酶(GUS)的蛋白质标记的范围。与计算方法相比,尽管这些方法劳动量大,但是却是精确的。近来从数据库计算预测蛋白质定位取得了极大的进展。本领域技术人员熟知的算法可获得自由瑞士信息学协会(Swiss Institute for Bioinformatics)管理的ExPASy蛋白质组学工具,例如PSort、TargetP、ChloroP、LocTree、Predotar、LipoP、MITOPROT、PATS、PTS1、SignalP、TMHMM以及其他。优选地,本发明的SCAMP多肽与膜连接,优选与内质网的膜连接。
在本发明的另一优选的实施方案中,本发明的SCAMP多肽与膜连接。将多肽与膜连接(也称为将多肽锚定在膜上)或者增加细胞中多肽与膜连接的部分的方法是本领域众所周知的。例如,GPI(糖基-磷脂酰肌醇)(GPI)部分基序可以以递增的优先顺序与SCAMP多肽的氨基端、羧基端、中心部分连接(通常共价地连接)(Bertozzi等人,Biochemistry。2008年7月8日;47(27):6991-7000)。备选地,SCAMP多肽可以富含脯氨酸和/或丙氨酸残基。此类残基通常在细胞上被糖修饰,并随后隐蔽(sequester)在膜(主要是质膜)中(Kjellbom P,Snogerup L,
Figure BDA0000136403840000821
C,Reuzeau C,McCabe PF,Pennell RI。Plant J.1997年11月;12(5):189-96)。
如实施例部分所述,当根据本发明方法在稻中表达时,肌原纤蛋白多肽产生具有增强的产量相关性状的植物。
肌原纤蛋白多肽通常在叶绿体中显示出优选的亚细胞定位。蛋白质亚细胞定位预测的工作是重要的并且已经进行了充分的研究。知晓蛋白质的定位有助于阐明其功能。用于蛋白质定位的实验方法涉及从免疫定位到使用绿色荧光蛋白(GFP)或者β-葡糖醛酸糖苷酶(GUS)的蛋白质标记的范围。与计算方法相比,尽管这些方法劳动量大,但是却是精确的。近来从数据库计算预测蛋白质定位取得了极大的进展。本领域技术人员熟知的算法可获得自由瑞士信息学协会(Swiss Institute for Bioinformatics)管理的ExPASy蛋白质组学工具,例如PSort、TargetP、ChloroP、LocTree、Predotar、LipoP、MITOPROT、PATS、PTS1、SignalP、TMHMM以及其他。
此外,PLATZ多肽(至少以其天然形态)通常具有锌依赖的DNA结合活性。用于测量DNA结合活性的工具和技术是本领域众所周知的(参见例如Nagano等人,2001)。在实施例部分提供了另外的详细说明。
另外,如实施例部分所述,当根据本发明方法在稻中表达时,PLATZ多肽产生具有增强的产量相关性状的植物,特别是增加的种子产量,例如增加的种子总重量和/或增加的饱满率和/或增加的千粒重;和/或增加的收获指数;和/或增加的地上生物量(在本文中也称为areamax)和/或快速的早期发育等。
另外,如实施例部分所述,当根据本发明方法在稻中表达时,PLST样多肽产生具有增强的产量相关性状,特别是增加的种子产率以及生物量的植物。
此外,PLST样多肽可以显示出优选的亚细胞定位,通常为核、胞质、叶绿体或者线粒体的一种或多种。蛋白质亚细胞定位预测的工作是重要的并且已经进行了充分的研究。知晓蛋白质的定位有助于阐明其功能。用于蛋白质定位的实验方法涉及从免疫定位到使用绿色荧光蛋白(GFP)或者β-葡糖醛酸糖苷酶(GUS)的蛋白质标记的范围。与计算方法相比,尽管这些方法劳动量大,但是却是精确的。近来从数据库计算预测蛋白质定位取得了极大的进展。本领域技术人员熟知的算法可获得自由瑞士信息学协会(Swiss Institute for Bioinformatics)管理的ExPASy蛋白质组学工具,例如PSort、TargetP、ChloroP、LocTree、Predotar、LipoP、MITOPROT、PATS、PTS1、SignalP、TMHMM以及其他。
此外,Glomalin多肽(至少以其天然形态)通常拯救温度敏感型突变株(Hemmingsen等人,Nature 333,330-334,1988,Salvucci,J.Exp.Bot.59,1923-1933,2008)。
另外,如实施例部分所述,当根据本发明方法在稻中表达时,Glomalin多肽产生具有增强的产量相关性状,特别是增加的收获指数的植物。
关于eRF1多肽,本发明通过用SEQ ID NO:1表示的核酸序列转化植物进行了示例,上述核酸序列编码SEQ ID NO:2的多肽序列。然而,本发明的实施不限于这些序列;本发明的方法可有利的通过使用本文定义的任何eRF1多肽编码核酸或eRF1多肽来实施。
编码eRF1多肽的核酸的实例在本文实施例章节表A1中给出。这样的核酸可用于实施本发明的方法。实施例章节表A1中给出的氨基酸序列为SEQ ID NO:2所示eRF1多肽的直向同源物和旁系同源物的示例序列,术语“直向同源物”和“旁系同源物”如本文所定义。可以通过进行所谓的交互blast检索容易地找到更多直向同源物和旁系同源物。通常,这包括以查询序列(例如,利用实施例章节表A1中所列的任一序列)针对任何序列数据库如可公共获得的NCBI数据库进行BLAST的首次BLAST。当从核苷酸序列开始时,通常使用BLASTN或TBLASTX(利用标准默认值),而当从蛋白质序列开始时,则使用BLASTP或TBLASTN(利用标准默认值)。BLAST结果可以任选地过滤。接着使用过滤的结果或者未过滤的结果的全长序列针对查询序列来源生物的序列进行反向BLAST(二次BLAST)。然后比较首次和二次BLAST的结果。如果首次BLAST中的高排名命中来自查询序列来源的相同物种,然后反向BLAST理想地导致查询序列处于最高命中之列,则找到了旁系同源物;如果首次BLAST中高排名命中不来自查询序列来源的相同物种,且优选地在反向BLAST时导致查询序列在最高命中之列,则找到了直向同源物。
关于SCAMP样多肽,本发明通过用SEQ ID NO:88表示的核酸序列转化植物进行了示例,上述核酸序列编码SEQ ID NO:89的多肽序列。然而,本发明的实施不限于这些序列;本发明的方法可有利的通过使用本文定义的任何SCAMP样编码核酸或SCAMP样多肽来实施。
编码SCAMP样多肽的核酸的实例在本文实施例章节表A2中给出。这样的核酸可用于实施本发明的方法。实施例章节表A2中给出的氨基酸序列为SEQ ID NO:89所示SCAMP样多肽的直向同源物和旁系同源物的示例序列,术语“直向同源物”和“旁系同源物”如本文所定义。可以通过进行所谓的交互blast检索容易地找到更多直向同源物和旁系同源物。通常,这包括以查询序列(例如,利用实施例章节表A2中所列的任一序列)针对任何序列数据库如可公共获得的NCBI数据库进行BLAST的首次BLAST。当从核苷酸序列开始时,通常使用BLASTN或TBLASTX(利用标准默认值),而当从蛋白质序列开始时,则使用BLASTP或TBLASTN(利用标准默认值)。BLAST结果可以任选地过滤。接着使用过滤的结果或者未过滤的结果的全长序列针对查询序列来源生物的序列进行反向BLAST(二次BLAST)(在查询序列为SEQ ID NO:88或SEQ ID NO:89的情况下,二次BLAST将因此会针对拟南芥序列)。然后比较首次和二次BLAST的结果。如果首次BLAST中的高排名命中来自查询序列源自的相同物种,然后反向BLAST理想地导致查询序列处于最高命中之列,则找到了旁系同源物;如果首次BLAST中高排名命中不来自查询序列源自的相同物种,且优选地在反向BLAST时导致查询序列在最高命中之列,则找到了直向同源物。
关于肌原纤蛋白多肽,本发明通过用SEQ ID NO:204表示的核酸序列转化植物进行了示例,上述核酸序列编码SEQ ID NO:205的多肽序列。然而,本发明的实施不限于这些序列;本发明的方法可有利的通过使用本文定义的任何肌原纤蛋白编码核酸或肌原纤蛋白多肽来实施。
编码肌原纤蛋白多肽的核酸的实例在本文实施例章节表A3中给出。这样的核酸可用于实施本发明的方法。实施例章节表A3中给出的氨基酸序列为SEQ ID NO:205所示肌原纤蛋白多肽的直向同源物和旁系同源物的示例序列,术语“直向同源物”和“旁系同源物”如本文所定义。可以通过进行所谓的交互blast检索容易地找到更多直向同源物和旁系同源物。通常,这包括以查询序列(例如,利用实施例章节表A3中所列的任一序列)针对任何序列数据库如可公共获得的NCBI数据库进行BLAST的首次BLAST。当从核苷酸序列开始时,通常使用BLASTN或TBLASTX(利用标准默认值),而当从蛋白质序列开始时,则使用BLASTP或TBLASTN(利用标准默认值)。BLAST结果可以任选地过滤。接着使用过滤的结果或者未过滤的结果的全长序列针对查询序列来源生物的序列进行反向BLAST(二次BLAST)(在查询序列为SEQ ID NO:204或SEQ ID NO:205的情况下,二次BLAST将因此会针对番茄序列)。然后比较首次和二次BLAST的结果。如果首次BLAST中的高排名命中来自查询序列源自的相同物种,然后反向BLAST理想地导致查询序列处于最高命中之列,则找到了旁系同源物;如果首次BLAST中高排名命中不来自查询序列源自的相同物种,且优选地在反向BLAST时导致查询序列在最高命中之列,则找到了直向同源物。
关于PLATZ多肽,本发明通过用SEQ ID NO:260表示的核酸序列转化植物进行了示例,上述核酸序列编码SEQ ID NO:261的多肽序列。然而,本发明的实施不限于这些序列;本发明的方法可有利的通过使用本文定义的任何PLATZ编码核酸或PLATZ多肽来实施。例如,在另一实施方案中,本发明通过用SEQ ID NO:356表示的核酸序列转化植物进行了示例,上述核酸序列编码SEQ ID NO:357的多肽序列。
编码PLATZ多肽的核酸的实例在本文实施例章节表A4中给出。这样的核酸可用于实施本发明的方法。实施例章节表A4中给出的氨基酸序列为SEQ ID NO:261所示PLATZ多肽的直向同源物和旁系同源物的示例序列,术语“直向同源物”和“旁系同源物”如本文所定义。可以通过进行所谓的交互blast检索容易地找到更多直向同源物和旁系同源物。通常,这包括以查询序列(例如,利用实施例章节表A4中所列的任一序列)针对任何序列数据库如可公共获得的NCBI数据库进行BLAST的首次BLAST。当从核苷酸序列开始时,通常使用BLASTN或TBLASTX(利用标准默认值),而当从蛋白质序列开始时,则使用BLASTP或TBLASTN(利用标准默认值)。BLAST结果可以任选地过滤。接着使用过滤的结果或者未过滤的结果的全长序列针对查询序列来源生物的序列进行反向BLAST(二次BLAST)(在查询序列为SEQ ID NO:260或SEQ ID NO:261的情况下,二次BLAST将因此会针对杨树(poplar)序列)。然后比较首次和二次BLAST的结果。如果首次BLAST中的高排名命中来自查询序列源自的相同物种,然后反向BLAST理想地导致查询序列处于最高命中之列,则找到了旁系同源物;如果首次BLAST中高排名命中不来自查询序列源自的相同物种,且优选地在反向BLAST时导致查询序列在最高命中之列,则找到了直向同源物。
关于PLST样多肽,本发明通过用SEQ ID NO:410表示的核酸序列转化植物进行了示例,上述核酸序列编码SEQ ID NO:411的多肽序列。然而,本发明的实施不限于这些序列;本发明的方法可有利的通过使用本文定义的任何PLST样编码核酸或PLST样多肽来实施。
编码PLST样多肽的核酸的实例在本文实施例章节表A5中给出。这样的核酸可用于实施本发明的方法。实施例章节表A5中给出的氨基酸序列为SEQ ID NO:411所示PLST样多肽的直向同源物和旁系同源物的示例序列,术语“直向同源物”和“旁系同源物”如本文所定义。可以通过进行所谓的交互blast检索容易地找到更多直向同源物和旁系同源物。通常,这包括以查询序列(例如,利用实施例章节表A5中所列的任一序列)针对任何序列数据库如可公共获得的NCBI数据库进行BLAST的首次BLAST。当从核苷酸序列开始时,通常使用BLASTN或TBLASTX(利用标准默认值),而当从蛋白质序列开始时,则使用BLASTP或TBLASTN(利用标准默认值)。BLAST结果可以任选地过滤。接着使用过滤的结果或者未过滤的结果的全长序列针对查询序列来源生物的序列进行反向BLAST(二次BLAST)。然后比较首次和二次BLAST的结果。如果首次BLAST中的高排名命中来自查询序列源自的相同物种,然后反向BLAST理想地导致查询序列处于最高命中之列,则找到了旁系同源物;如果首次BLAST中高排名命中不来自查询序列源自的相同物种,且优选地在反向BLAST时导致查询序列在最高命中之列,则找到了直向同源物。
关于Glomalin多肽,本发明通过用SEQ ID NO:545表示的核酸序列转化植物进行了示例,上述核酸序列编码SEQ ID NO:546的多肽序列。然而,本发明的实施不限于这些序列;本发明的方法可有利的通过使用本文定义的任何Glomalin编码核酸或Glomalin多肽来实施。
编码Glomalin多肽的核酸的实例在本文实施例章节表A6中给出。这样的核酸可用于实施本发明的方法。实施例章节表A6中给出的氨基酸序列为SEQ ID NO:546所示Glomalin多肽的直向同源物和旁系同源物的示例序列,术语“直向同源物”和“旁系同源物”如本文所定义。可以通过进行如在定义部分中所述的所谓的交互blast检索容易地找到更多直向同源物和旁系同源物;其中在查询序列为SEQ ID NO:545或SEQ ID NO:546的情况下,二次BLAST(反向BLAST)会针对稻序列。
高排名的命中是那些E值低的命中。E值越低,分值越具有显著性(或者换句话说,偶然发现此命中的几率越低)。E值的计算是本领域众所周知的。除了E值之外,还对比较进行同一性百分比评分。同一性百分比是指两比较核酸(或多肽)序列之间在特定长度上的相同核苷酸(或氨基酸)数。在大家族的情况下可以使用ClustalW,继之以邻接树来辅助相关基因的聚类可视化,和鉴定直向同源物和旁系同源物。
核酸变体也可用于实施本发明的方法。这类核酸变体的例子包括编码实施例章节表A1至A6中给出的任一氨基酸序列的同源物和衍生物的核酸序列,其中术语“同源物”和“衍生物”如本文所定义。同样可用于本发明方法的有编码实施例章节表A1至A6中给出的任一氨基酸序列的直向同源物或旁系同源物的同源物和衍生物的核酸。用于本发明方法的同源物和衍生物与其源自的未修饰蛋白质具有基本上相同的生物活性和功能活性。在实施本发明方法中有用的其他变体是这样的变体,其中已经优化了密码子使用或者其中移除了miRNA靶向位点。
可用于实施本发明方法的其它核酸变体包括编码eRF1多肽或SCAMP样多肽、或肌原纤蛋白多肽、或PLATZ多肽、或PLST样多肽、或Glomalin多肽的核酸的部分,与编码eRF1多肽或SCAMP样多肽、或肌原纤蛋白多肽、或PLATZ多肽、或PLST样多肽、或Glomalin多肽的核酸杂交的核酸,编码eRF1多肽或SCAMP样多肽、或肌原纤蛋白多肽、或PLATZ多肽、或PLST样多肽、或Glomalin多肽的核酸的剪接变体,编码eRF1多肽或SCAMP样多肽、或肌原纤蛋白多肽、或PLATZ多肽、或PLST样多肽、或Glomalin多肽的核酸的等位变体,以及通过基因改组获得的eRF1多肽或SCAMP样多肽、或肌原纤蛋白多肽、或PLATZ多肽、或PLST样多肽、或Glomalin多肽编码核酸的变体。术语杂交序列、剪接变体、等位变体和基因改组如本文所述。
编码eRF1多肽或SCAMP样多肽、或肌原纤蛋白多肽、或PLATZ多肽、或PLST样多肽、或Glomalin多肽的核酸无需是全长核酸,因为本发明方法的实施不依赖于全长核酸序列的使用。根据本发明,提供了增强植物中产量相关性状的方法,包括在植物中引入和表达实施例章节表A1至A6中给出的任一核酸序列的部分、或者编码实施例章节表A1至A6中给出的任一氨基酸序列之直向同源物、旁系同源物或同源物的核酸的部分。
例如,可以通过对核酸进行一个或多个缺失来制备所述核酸的部分。部分可以以分离的形式使用,或者可将其与其它编码(或非编码)序列融合,以便例如产生组合了若干活性的蛋白质。当与其它编码序列融合时,经翻译后所产生的多肽可能比针对该蛋白质部分所预测到的要大。
关于eRF1多肽,可用于本发明方法的部分编码如本文所定义的eRF1多肽,并与实施例章节表A1中给出的氨基酸序列具有基本上相同的生物活性。优选部分是实施例章节表A1中给出的任一核酸的部分,或是编码实施例章节表A1中给出的任一氨基酸序列之直向同源物或旁系同源物的核酸的部分。优选该部分长度为至少500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、1300、1350个连续核苷酸,所述连续核苷酸是实施例章节表A1中给出的任一核酸序列或者编码实施例章节表A1中给出的任一氨基酸序列之直向同源物或旁系同源物的核酸。最优选该部分是核酸SEQ ID NO:1的一部分。优选该部分编码这样的氨基酸序列的片段,所述氨基酸序列当用于构建系统树(例如图1所示的系统发生树)时,与包含由SEQ ID NO:2表示的氨基酸序列的eRF1多肽的群聚簇,而非与其他群聚簇。
关于SCAMP样多肽,可用于本发明方法的部分编码如本文所定义的SCAMP样多肽,并与实施例章节表A2中给出的氨基酸序列具有基本上相同的生物活性。优选部分是实施例章节表A2中给出的任一核酸的部分,或是编码实施例章节表A2中给出的任一氨基酸序列之直向同源物或旁系同源物的核酸的部分。优选该部分长度为至少100、200、300、400、500、550、600、650、700、750、800、850、900、950、1000个连续核苷酸,所述连续核苷酸是实施例章节表A2中给出的任一核酸序列或者是编码实施例章节表A2中给出的任一氨基酸序列之直向同源物或旁系同源物的核酸。最优选该部分是核酸SEQ ID NO:88的一部分。优选该部分编码这样的氨基酸序列的片段,所述氨基酸序列包含如本文中所定义的SCAMP结构域。
关于肌原纤蛋白多肽,可用于本发明方法的部分编码如本文所定义的肌原纤蛋白多肽,并与实施例章节表A3中给出的氨基酸序列具有基本上相同的生物活性。优选部分是实施例章节表A3中给出的任一核酸的部分,或是编码实施例章节表A3中给出的任一氨基酸序列之直向同源物或旁系同源物的核酸的部分。优选该部分长度为至少500、550、600、650、700、750、800、850、900、950、1000个连续核苷酸,所述连续核苷酸是实施例章节表A3中给出的任一核酸序列或者是编码实施例章节表A3中给出的任一氨基酸序列之直向同源物或旁系同源物的核酸。最优选该部分是核酸SEQ ID NO:204的一部分。优选该部分编码这样的氨基酸序列的片段,所述氨基酸序列当用于构建系统树(例如图6所示的系统发生树)时,与包含由SEQ ID NO:205表示的氨基酸序列的肌原纤蛋白多肽的群聚簇,而非与其他群聚簇。
关于PLATZ多肽,可用于本发明方法的部分编码如本文所定义的PLATZ多肽,并与实施例章节表A4中给出的氨基酸序列具有基本上相同的生物活性。优选部分是实施例章节表A4中给出的任一核酸的部分,或是编码实施例章节表A4中给出的任一氨基酸序列之直向同源物或旁系同源物的核酸的部分。优选该部分长度为至少300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100个连续核苷酸,所述连续核苷酸是实施例章节表A4中给出的任一核酸序列或者是编码实施例章节表A4中给出的任一氨基酸序列之直向同源物或旁系同源物的核酸。最优选该部分是核酸SEQ ID NO:260的一部分。优选该部分编码这样的氨基酸序列的片段,所述氨基酸序列包含PLATZ结构域和一个或多个如上所定义的基序,并且当用于构建系统树(例如图12所示的系统发生树)时,与包含由SEQ ID NO:261表示的氨基酸序列的PLATZ-A多肽的群,更优选地与PLATZ-A1蛋白质的群,最优选地与PLATZ-A1-α蛋白质的群聚簇,而非与其他PLATZ蛋白质的群聚簇。
关于PLST样多肽,可用于本发明方法的部分编码如本文所定义的PLST样多肽,并与实施例章节表A5中给出的氨基酸序列具有基本上相同的生物活性。优选部分是实施例章节表A5中给出的任一核酸的部分,或是编码实施例章节表A5中给出的任一氨基酸序列之直向同源物或旁系同源物的核酸的部分。优选该部分长度为至少100、150、200、250、300、350、400、450、500、550、600、650、700个连续核苷酸,所述连续核苷酸是实施例章节表A5中给出的任一核酸序列或者编码实施例章节表A5中给出的任一氨基酸序列之直向同源物或旁系同源物的核酸。最优选该部分具有基序1至12的一个或多个和PF结构域,并且是核酸SEQ ID NO:410的一部分。优选该部分编码这样的氨基酸序列的片段,所述氨基酸序列当用于构建系统树(例如图19所示的系统发生树)时,与包含由SEQ ID NO:411表示的氨基酸序列的PLST样多肽的群聚簇,而非与其他群聚簇。
关于Glomalin多肽,可用于本发明方法的部分编码如本文所定义的Glomalin多肽,并与实施例章节表A6中给出的氨基酸序列具有基本上相同的生物活性。优选部分是实施例章节表A6中给出的任一核酸的部分,或是编码实施例章节表A6中给出的任一氨基酸序列之直向同源物或旁系同源物的核酸的部分。优选该部分长度为至少450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、1300、1350、1400、1450、1500、1550、1600、1650、1700、1750、1800、1850、1900个连续核苷酸,所述连续核苷酸是实施例章节表A6中给出的任一核酸序列或者是编码实施例章节表A6中给出的任一氨基酸序列之直向同源物或旁系同源物的核酸。最优选该部分是核酸SEQ ID NO:545的一部分。优选该部分编码这样的氨基酸序列的片段,所述氨基酸序列包含Cpn60_TCP1结构域(Pfam accession PF00118),或者所述氨基酸序列当用于构建系统树(例如图19所示的系统发生树)时,与包含由SEQ ID NO:546表示的氨基酸序列的Glomalin多肽的群聚簇,而非与其他群聚簇。
可用于本发明方法中的另一种核酸变体是能够在降低的严格性条件下、优选在严格条件下与编码如本文中所定义的eRF1多肽、或SCAMP样多肽、或肌原纤蛋白多肽、或PLATZ多肽、或PLST样多肽、或Glomalin多肽的核酸杂交,或与如本文中所定义的部分进行杂交的核酸。
根据本发明,提供用于增强植物中产量相关性状的方法,包括在植物中引入并表达能够与实施例章节表A1至A6中给出的任何一种核酸杂交的核酸,或包括在植物中引入并表达这样的核酸,其能够与编码在实施例章节表A1至A6中给出的任一氨基酸序列之直向同源物、旁系同源物或同源物的核酸序列杂交。
关于eRF1多肽,可用于本发明方法的杂交序列编码如本文所定义的eRF1多肽,与实施例章节表A1中给出的氨基酸序列具有基本上相同的生物活性。优选杂交序列能够与实施例章节表A1中给出的任一核酸的互补序列杂交、或与任一这些序列的部分杂交,其中部分如上文所定义,或者杂交序列能够与编码实施例章节表A1中给出的任一氨基酸序列之直向同源物或旁系同源物的核酸的互补序列杂交。最优选杂交序列能够与SEQ IDNO:1所示核酸的互补序列或其部分杂交。
优选地,杂交序列编码具有这样的氨基酸序列的多肽,所述氨基酸序列当全长用于构建系统树时,(例如图1所示的系统发生树)时,与包含由SEQ ID NO:2表示的氨基酸序列的eRF1多肽的群聚簇,而非与其他群聚簇。
关于SCAMP样多肽,可用于本发明方法的杂交序列编码如本文所定义的SCAMP样多肽,与实施例章节表A2中给出的氨基酸序列具有基本上相同的生物活性。优选杂交序列能够与实施例章节表A2中给出的任一核酸的互补序列杂交、或与任一这些序列的部分杂交,其中部分如上文所定义,或者杂交序列能够与编码实施例章节表A2中给出的任一氨基酸序列之直向同源物或旁系同源物的核酸的互补序列杂交。最优选杂交序列能够与SEQ ID NO:88所示核酸的互补序列或其部分杂交。
优选杂交序列编码具有这样的氨基酸序列的多肽,所述氨基酸序列包含如本文中所定义的SCAMP结构域。
关于肌原纤蛋白多肽,可用于本发明方法的杂交序列编码如本文所定义的肌原纤蛋白多肽,与实施例章节表A3中给出的氨基酸序列具有基本上相同的生物活性。优选杂交序列能够与实施例章节表A3中给出的任一核酸的互补序列杂交、或与任一这些序列的部分杂交,其中部分如上文所定义,或者杂交序列能够与编码实施例章节表A3中给出的任一氨基酸序列之直向同源物或旁系同源物的核酸的互补序列杂交。最优选杂交序列能够与SEQ ID NO:204所示核酸的互补序列或其部分杂交。
优选地,杂交序列编码具有这样的氨基酸序列的多肽,所述氨基酸序列当全长用于构建系统树时,(例如图6所示的系统发生树)时,与包含由SEQ ID NO:205表示的氨基酸序列的肌原纤蛋白多肽的群聚簇,而非与其他群聚簇。
关于PLATZ多肽,可用于本发明方法的杂交序列编码如本文所定义的PLATZ多肽,与实施例章节表A4中给出的氨基酸序列具有基本上相同的生物活性。优选杂交序列能够与实施例章节表A4中给出的任一核酸的互补序列杂交、或与任一这些序列的部分杂交,其中部分如上文所定义,或者杂交序列能够与编码实施例章节表A4中给出的任一氨基酸序列之直向同源物或旁系同源物的核酸的互补序列杂交。最优选杂交序列能够与SEQ ID NO:260所示核酸的互补序列或其部分杂交。
优选地,杂交序列编码具有这样的氨基酸序列的多肽,所述氨基酸序列包含PLATZ结构域和一个或多个如上所定义的基序,并且当用于构建系统树(例如图12所示的系统发生树)时,与包含由SEQ ID NO:261表示的氨基酸序列的PLATZ-A多肽的群,更优选地与PLATZ-A1蛋白质的群,最优选地与PLATZ-A1-α蛋白质的群聚簇,而非与其他PLATZ蛋白质的群聚簇。
关于PLST样多肽,可用于本发明方法的杂交序列编码如本文所定义的PLST样多肽,与实施例章节表A5中给出的氨基酸序列具有基本上相同的生物活性。优选杂交序列能够与实施例章节表A5中给出的任一核酸的互补序列杂交、或与任一这些序列的部分杂交,其中部分如上文所定义,或者杂交序列能够与编码实施例章节表A5中给出的任一氨基酸序列之直向同源物或旁系同源物的核酸的互补序列杂交。最优选杂交序列能够与SEQ ID NO:410所示核酸的互补序列或其部分杂交。
优选地,杂交序列编码具有这样的氨基酸序列的多肽,所述氨基酸序列当全长并用于构建系统树(例如图15所示的系统发生树)时,具有基序1至12的一个或多个和PF结构域,并与包含由SEQ ID NO:411表示的氨基酸序列的PLST样多肽的群聚簇,而非与其他群聚簇。
关于Glomalin多肽,可用于本发明方法的杂交序列编码如本文所定义的Glomalin多肽,与实施例章节表A6中给出的氨基酸序列具有基本上相同的生物活性。优选杂交序列能够与实施例章节表A6中给出的任一核酸的互补序列杂交、或与任一这些序列的部分杂交,其中部分如上文所定义,或者杂交序列能够与编码实施例章节表A6中给出的任一氨基酸序列之直向同源物或旁系同源物的核酸的互补序列杂交。最优选杂交序列能够与SEQ ID NO:545所示核酸的互补序列或其部分杂交。优选的,杂交序列编码具有这样的氨基酸序列的多肽,所述氨基酸序列包含Cpn60_TCP1结构域(Pfam accession PF00118),或者当用于构建系统树时,(例如图19所示的系统发生树)时,与包含SEQ ID NO:546所示的氨基酸序列的Glomalin多肽的群聚簇,而非与其他群聚簇。
可用于本发明方法中的另一种核酸变体是编码如上文所定义的eRF1多肽、或SCAMP样多肽、或肌原纤蛋白多肽、或PLATZ多肽、或PLST样多肽、或Glomalin多肽的剪接变体,剪接变体如本文所定义。根据本发明,提供用于增强植物中产量相关性状的方法,包括在植物中引入并表达在实施例章节表A1至A6中给出的任何一种核酸序列的剪接变体,或下述核酸的剪接变体,其中所述的核酸编码在实施例章节表A1至A6中给出的任一氨基酸序列之直向同源物、旁系同源物或同源物。
关于eRF1多肽,优选剪接变体是SEQ ID NO:1所示核酸的剪接变体,或编码SEQ ID NO:2之直向同源物或旁系同源物的核酸的剪接变体。优选地,由剪接变体编码的氨基酸序列,当用于构建系统树(例如图1所示的系统发生树)时,与包含SEQ ID NO:2所示的氨基酸序列的eRF1多肽的群聚簇,而非与其他群聚簇。
关于SCAMP样多肽,优选剪接变体是SEQ ID NO:88所示核酸的剪接变体,或编码SEQ ID NO:89之直向同源物或旁系同源物的核酸的剪接变体。优选地,由剪接变体编码的氨基酸序列包含如本文中所定义的SCAMP结构域。
关于肌原纤蛋白多肽,优选剪接变体是SEQ ID NO:204所示核酸的剪接变体,或编码SEQ ID NO:205之直向同源物或旁系同源物的核酸的剪接变体。优选地,由剪接变体编码的氨基酸序列,当用于构建系统树(例如图6所示的系统发生树)时,与包含SEQ ID NO:205所示的氨基酸序列的肌原纤蛋白多肽的群聚簇,而非与其他群聚簇。
关于PLATZ多肽,优选剪接变体是SEQ ID NO:260所示核酸的剪接变体,或编码SEQ ID NO:261之直向同源物或旁系同源物的核酸的剪接变体。优选地,由剪接变体编码的氨基酸序列包含PLATZ结构域和一个或多个如上所定义的基序,并且当用于构建系统树(例如图12所示的系统发生树)时,与包含由SEQ ID NO:261表示的氨基酸序列的PLATZ-A多肽的群,更优选地与PLATZ-A1蛋白质的群,最优选地与PLATZ-A1-α蛋白质的群聚簇,而非与其他PLATZ蛋白质的群聚簇。
关于PLST样多肽,优选剪接变体是SEQ ID NO:410所示核酸的剪接变体,或编码SEQ ID NO:411之直向同源物或旁系同源物的核酸的剪接变体。优选地,由剪接变体编码的氨基酸序列,当用于构建系统树(例如图15所示的系统发生树)时,具有基序19至30的一个或多个和PF结构域,并与包含SEQ ID NO:411所示的氨基酸序列的PLST样多肽的群聚簇,而非与其他群聚簇。
关于Glomalin多肽,优选剪接变体是SEQ ID NO:545所示核酸的剪接变体,或编码SEQ ID NO:546之直向同源物或旁系同源物的核酸的剪接变体。优选地,由剪接变体编码的氨基酸序列包含Cpn60_TCP1结构域(Pfam accession PF00118),或者当用于构建系统树(例如图19所示的系统发生树)时,与包含SEQ ID NO:546所示的氨基酸序列的Glomalin多肽的群聚簇,而非与其他群聚簇。
可用于本发明方法中的另一种核酸变体是编码如上文所定义的eRF1多肽、或SCAMP样多肽、或肌原纤蛋白多肽、或PLATZ多肽、或PLST样多肽、或Glomalin多肽的核酸的等位变体,等位变体如本文所定义。
根据本发明,提供用于增强植物中产量相关性状的方法,包括在植物中引入并表达在实施例章节表A1至A6中给出的任何一种核酸的等位变体,或包括在植物中引入并表达下述核酸的等位变体,其中所述的核酸编码在实施例章节表A1至A6中给出的任一氨基酸序列之直向同源物、旁系同源物或同源物。
关于eRF1多肽,可用于本发明方法的等位变体编码的多肽与SEQ IDNO:2的eRF1样多肽及实施例章节表A1中所示任一氨基酸具有基本上相同的生物活性。等位变体天然存在,并且这些天然等位基因的使用包含于本发明的方法中。优选地,等位变体为SEQ ID NO:1的等位变体,或编码SEQ ID NO:2之直向同源物或旁系同源物的核酸的等位变体。优选地,由等位变体编码的氨基酸序列,当用于构建系统树(例如图1所示的系统发生树)时,与包含SEQ ID NO:2所示的氨基酸序列的eRF1多肽的群聚簇,而非与其他群聚簇。
关于SCAMP样多肽,可用于本发明方法的等位变体编码的多肽与SEQ ID NO:89的SCAMP样多肽及实施例章节表A2中所示任一氨基酸具有基本上相同的生物活性。等位变体天然存在,并且这些天然等位基因的使用包含于本发明的方法中。优选地,等位变体为SEQ ID NO:88的等位变体,或编码SEQ ID NO:89之直向同源物或旁系同源物的核酸的等位变体。优选地,由等位变体编码的氨基酸序列包含如本文中所定义的SCAMP结构域。
关于肌原纤蛋白多肽,可用于本发明方法的等位变体编码的多肽与SEQ ID NO:205的肌原纤蛋白多肽及实施例章节表A3中所示任一氨基酸具有基本上相同的生物活性。等位变体天然存在,并且这些天然等位基因的使用包含于本发明的方法中。优选地,等位变体为SEQ ID NO:204的等位变体,或编码SEQ ID NO:205之直向同源物或旁系同源物的核酸的等位变体。优选地,由等位变体编码的氨基酸序列,当用于构建系统树(例如图6所示的系统发生树)时,与包含SEQ ID NO:205所示的氨基酸序列的肌原纤蛋白多肽聚簇,而非与其他群聚簇。
关于PLATZ多肽,可用于本发明方法的等位变体编码的多肽与SEQID NO:261的PLATZ多肽及实施例章节表A4中所示任一氨基酸具有基本上相同的生物活性。等位变体天然存在,并且这些天然等位基因的使用包含于本发明的方法中。优选地,等位变体为SEQ ID NO:260的等位变体,或编码SEQ ID NO:261之直向同源物或旁系同源物的核酸的等位变体。优选地,由等位变体编码的氨基酸序列包含PLATZ结构域和一个或多个如上所定义的基序,并且当用于构建系统树(例如图12所示的系统发生树)时,与包含由SEQ ID NO:261表示的氨基酸序列的PLATZ-A多肽的群,更优选地与PLATZ-A1蛋白质的群,最优选地与PLATZ-A1-α蛋白质的群聚簇,而非与其他PLATZ蛋白质的群聚簇。
关于PLST样多肽,可用于本发明方法的等位变体编码的多肽与SEQID NO:411的PLST样多肽及实施例章节表A5中所示任一氨基酸具有基本上相同的生物活性。等位变体天然存在,并且这些天然等位基因的使用包含于本发明的方法中。优选地,等位变体为SEQ ID NO:410的等位变体,或编码SEQ ID NO:411之直向同源物或旁系同源物的核酸的等位变体。优选地,由等位变体编码的氨基酸序列,当用于构建系统树(例如图14所示的系统发生树)时,具有基序19至30的一个或多个和PF结构域,并与包含SEQ ID NO:411所示的氨基酸序列的PLST样多肽聚簇,而非与其他群聚簇。
关于Glomalin多肽,可用于本发明方法的等位变体编码的多肽与SEQID NO:546的Glomalin多肽及实施例章节表A6中所示任一氨基酸具有基本上相同的生物活性。等位变体天然存在,并且这些天然等位基因的使用包含于本发明的方法中。优选地,等位变体为SEQ ID NO:545的等位变体,或编码SEQ ID NO:546之直向同源物或旁系同源物的核酸的等位变体。优选地,由等位变体编码的氨基酸序列包含Cpn60_TCP1结构域(Pfamaccession PF00118),或者当用于构建系统树(例如图19所示的系统发生树)时,与包含SEQ ID NO:546所示的氨基酸序列的Glomalin多肽的群聚簇,而非与其他群聚簇。
基因改组或定向进化也可用于产生上文所定义的eRF1多肽、或SCAMP样多肽、或肌原纤蛋白多肽、或PLATZ多肽、或PLST样多肽、或Glomalin多肽的编码核酸的变体;其中术语“基因改组”如本文所定义。
根据本发明,提供了在植物中增强产量相关性状的方法,包括在植物中引入和表达实施例章节表A1至A6中给出的任一核酸序列的变体,或者包括在植物中引入和表达编码实施例章节表A1至A6中给出的任一氨基酸序列之直向同源物、旁系同源物或同源物的核酸的变体,其中所述变体核酸通过基因改组获得。
关于eRF1多肽,优选通过基因改组获得的变体核酸编码下述氨基酸序列,所述氨基酸序列当用于构建系统树(例如图1所示的系统发生树)时,与包含SEQ ID NO:2所示的氨基酸序列的eRF1多肽的群聚簇,而非与其他群聚簇。
关于SCAMP样多肽,优选通过基因改组获得的变体核酸编码下述氨基酸序列,所述氨基酸序列包含如本文中所定义的SCAMP结构域。
关于肌原纤蛋白多肽,优选通过基因改组获得的变体核酸编码下述氨基酸序列,所述氨基酸序列当用于构建系统树(例如图6所示的系统发生树)时,与包含SEQ ID NO:205所示的氨基酸序列的肌原纤蛋白多肽的群聚簇,而非与其他群聚簇。
关于PLATZ多肽,优选通过基因改组获得的变体核酸编码下述氨基酸序列,所述氨基酸序列包含PLATZ结构域和一个或多个如上所定义的基序,并且当用于构建系统树(例如图12所示的系统发生树)时,与包含由SEQ ID NO:261表示的氨基酸序列的PLATZ-A多肽的群,更优选地与PLATZ-A1蛋白质的群,最优选地与PLATZ-A1-α蛋白质的群聚簇,而非与其他PLATZ蛋白质的群聚簇。
关于PLST样多肽,优选通过基因改组获得的变体核酸编码下述氨基酸序列,所述氨基酸序列当用于构建系统树(例如图15所示的系统发生树)时,与包含SEQ ID NO:411所示的氨基酸序列的PLST样多肽的群聚簇,而非与其他群聚簇。
关于Glomalin多肽,优选通过基因改组获得的变体核酸编码下述氨基酸序列,所述氨基酸序列包含Cpn60_TCP1结构域(Pfam accessionPF00118),或者当用于构建系统树(例如图19所示的系统发生树)时,与包含SEQ ID NO:546所示的氨基酸序列的Glomalin多肽的群聚簇,而非与其他群聚簇。
此外,还可利用定点诱变获得核酸变体。若干方法可用来实现定点诱变,最常见的是基于PCR的方法(Current Protocols in Molecular Biology.Wiley编辑)。
编码eRF1多肽的核酸可以来自任何天然或人工来源。可以通过有目的的人工操作对其进行修饰,使之不同于其在组合物和/或基因组环境中的天然形式。优选eRF1多肽编码核酸来自植物,还优选来自单子叶植物,更优选来自禾本科,最优选该核酸来自稻。
编码SCAMP样多肽的核酸可以来自任何天然或人工来源。可以通过有目的的人工操作对其进行修饰,使之不同于其在组合物和/或基因组环境中的天然形式。优选SCAMP样多肽编码核酸来自植物,还优选来自双子叶植物,更优选来自十字花科,最优选该核酸来自拟南芥。
可以将任一前述肌原纤蛋白多肽序列靶向质体。优选的质体是叶绿体。用于靶向质体的方法是本领域众所周知的,并且包括但不限于使用转运肽。下表3显示了适合用于任一肌原纤蛋白多肽靶向质体的转运肽的实例。肌原纤蛋白多肽可以不以其天然形式靶向质体或者可以靶向不同的质体。此外,肌原纤蛋白可以通过不同的转运肽(例如,其天然转运肽)以其天然形式靶向质体。
表3:用于靶向氨基酸到质体的转运肽序列的实例
编码肌原纤蛋白多肽的核酸可以来自任何天然或人工来源。可以通过有目的的人工操作对其进行修饰,使之不同于其在组合物和/或基因组环境中的天然形式。优选肌原纤蛋白多肽编码核酸来自植物,还优选来自双子叶植物,更优选来自茄科(Solanaceae),另外优选地,该核酸来自番茄属(Lycopersicon),还优选地来自番茄属物种,最优选核酸来自番茄。
编码PLATZ多肽的核酸可以来自任何天然或人工来源。可以通过有目的的人工操作对其进行修饰,使之不同于其在组合物和/或基因组环境中的天然形式。优选PLATZ多肽编码核酸来自植物,还优选来自双子叶植物,更优选来自杨柳科(Salicaceae),最优选核酸来自杨属物种(Populussp)。
编码PLST样多肽的核酸可以来自任何天然或人工来源。可以通过有目的的人工操作对其进行修饰,使之不同于其在组合物和/或基因组环境中的天然形式。优选PLST样多肽编码核酸来自植物,还优选来自双子叶植物,更优选来自杨柳科,最优选核酸来自毛果杨(Populus trichocarpa)。
编码Glomalin多肽的核酸可以来自任何天然或人工来源。可以通过有目的的人工操作对其进行修饰,使之不同于其在组合物和/或基因组环境中的天然形式。优选Glomalin多肽编码核酸来自植物,还优选来自单子叶植物,更优选来自禾本科,最优选核酸来自稻。
本发明方法的实施产生具有增强的产量相关性状的植物。尤其本发明方法的实施产生相对于对照植物而具有增加的产量、尤其增加的种子产量的植物。在本文中的“定义”部分中更详细地描述了术语“产量”和“种子产量”。
在本文中对增强的产量相关性状的提及意指植物的一个或多个部分的生物量(重量)增加,所述的部分可以包括地上(可收获)部分和/或地下(可收获)部分。尤其,此类可收获部分是生物量和/或种子,并且本发明方法的实施产生相对于对照植物的种子产量而具有增加的生物量和/或增加的种子产量的植物。
以玉米为例,产量增加可以表现为下列一种或多种指标:每平方米中已建立植物数的增加、每株植物穗数的增加、行数、每行粒数、粒重、千粒重、穗长度/直径的增加、种子饱满率的增加(其中种子饱满率是饱满种子数除以种子总数并乘以100的值)及其它。
以稻为例,产量增加本身可以表现为下列一种或多种指标的增加:每平方米植物数、每株植物穗数、每穗小穗数、每穗花(小花)数(其表示为饱满种子数与原穗数的比率)、种子饱满率的增加(其中种子饱满率是饱满种子数除以种子总数并乘以100的值)、千粒重的增加及其它。
本发明提供了增加植物相对于对照植物的产量、特别是生物量和/或种子产量的方法,所述方法包括调节植物和/或植物质体中如本文所定义的eRF1多肽、或SCAMP样多肽、或肌原纤蛋白多肽、或PLATZ多肽、或PLST样多肽、或Glomalin多肽的编码核酸的表达。
由于本发明的转基因植物具有增加的产量特性和/或产量,因而相对于对照植物的生长速率,这些植物有可能在其生活周期中的对应阶段上表现增加的生长速率(在其生活周期的至少部分期间)。
增加的生长速率可以对于植物的一个或多个部分(包括种子)是特异性的,或可以基本上遍及整株植物。具有增加的生长速率的植物可以具备较短的生活周期。植物的生活周期可以视为意指从干燥成熟种子成长至植物已经产生与起始材料相似的干燥成熟种子的阶段所需要的时间。这个生活周期可以受下列因素影响,如发芽的速度、早期萌发势、生长速率、绿度指数、开花时间和种子成熟速度。生长速率的增加可以在植物生活周期之一或多个阶段上或在基本上整个植物生活周期期间发生。在植物生活周期中的早期期间增加的生长速率可以反映增强的萌发势。生长速率的增加可以改变植物的收获周期,允许植物较晚播种和/或较早收获,否则这将不可能(相似的作用可以用较早的开花时间获得)。若生长速率充分地增加,可以允许再播种相同植物物种的种子(例如播种并收获稻植物,随后播种并收获其它稻植物,全部均在一个常规生长时段内)。类似地,若生长速率足够地增加,可以允许再播种不同植物物种的种子(例如播种并收获玉米植物,随后例如任选播种并收获大豆、马铃薯或任何其它合适植物)。从相同的根茎中收获额外次数在一些作物植物的情况中也是可能的。改变植物的收获周期可以导致每平方米的年生物量产量的增加(因任何特定植物可以生长并收获的次数(如在一年中)增加)。生长速率的增加也可以允许比其野生型对应物而言在更广泛的地理区域内培育转基因植物,因为对培育作物的区域限制往往由栽种时节(早季)或在收获时期(晚季)的不利环境条件所决定。若缩短收获周期,则可以避开这类不利条件。生长速率可以通过从生长曲线中得到多种参数而确定,此类参数可以是:T-Mid(植物达到其50%最大尺寸所花费的时间)和T-90(植物达到其90%最大尺寸所花费的时间),等等。
根据本发明的优选特征,本发明方法的实施产生相对于对照植物而具有增加的生长速率的植物。因而根据本发明,提供增加植物生长速率的方法,所述方法包括调节如本文中所定义的编码eRF1多肽的核酸在植物中的表达。
与对照植物相比,无论植物处于非胁迫条件下还是植物暴露于多种胁迫下,都发生产量和/或生长速率的增加。植物一般通过生长得更慢而对暴露于胁迫作出应答。在严重胁迫条件下,植物甚至可以完全停止生长。另一方面,轻微胁迫在本文中定义为植物暴露于其的任何胁迫,其中所述的胁迫未导致植物完全停止生长而没有恢复生长的能力。与非胁迫条件下的对照植物相比,轻微胁迫在本发明意义中导致受胁迫植物生长降低小于40%、35%、30%或25%,更优选小于20%或15%。由于农业实践(灌溉、施肥、杀虫剂处理)上的进步,在栽培作物植物中并不经常遇到严重胁迫。因此,由轻微胁迫诱导的受损生长往往是农业上不希望的特征。轻微胁迫是植物暴露的常见生物性和/或非生物性(环境)胁迫。非生物胁迫可以因干旱或水涝、厌氧胁迫、盐胁迫、化学毒性、氧化胁迫和热、寒冷或冰冻温度所致。非生物胁迫可以是由水胁迫(尤其因为干旱)、盐胁迫、氧化胁迫或离子胁迫引起的渗透胁迫。生物胁迫一般是由病原体如细菌、病毒、真菌、线虫和昆虫引起的那些胁迫。如本文中所用的术语“非胁迫”条件是允许植物最佳生长的环境条件。本领域技术人员清楚对于给定地点的正常土壤条件和气候条件。如本文中所用的术语非胁迫,包括如本文中所定义,植物暴露的偶尔或每天的轻微胁迫,但是不包括严重胁迫。
尤其,本发明的方法可以在非胁迫条件下或者轻微干旱的条件下实施以产生相对于对照植物而言具有增加的产量特性的植物。如在Wang等(Planta(2003)218:1-14)中报道,非生物胁迫导致不利地影响植物生长及生产力的一系列形态学变化、生理学变化、生物化学变化和分子变化。已知干旱、盐浓度、极端温度和氧化胁迫是相互联系的并可以通过相似机制而诱导生长损害及细胞损害。Rabbani等(Plant Physiol(2003)133:1755-1767)描述了干旱胁迫与高盐度胁迫间极高程度的“交叉对话(cross talk)”。例如,干旱和/或盐化作用主要表现为渗透胁迫,导致细胞内稳态和离子分布的破坏。经常伴随高温或低温、盐浓度或干旱胁迫的氧化胁迫可以造成功能性蛋白和结构蛋白变性。因此,这些多样的环境胁迫常常激活相似的细胞信号途径和细胞应答,如产生胁迫蛋白质、上调抗氧化物质、积累相容性溶质和生长抑制。如本文中所用的术语“非胁迫”条件是允许植物最佳生长的环境条件。本领域技术人员清楚对于给定地点的正常土壤条件和气候条件。最佳生长下生长的植物(在非胁迫条件下生长)一般出产以递增优选顺序至少97%、95%、92%、90%、87%、85%、83%、80%、77%或75%的给定环境下这样植物的平均生产。平均生产可以收获和/或季节为基础进行计算。本领域技术人员清楚作物的平均产量生产。
实施本发明方法产生在非胁迫条件下或者轻微干旱的条件下相对于在相当条件下培育的对照植物而言具有增加的产量特性和/或产量的植物。因此,根据本发明,提供了增加在非胁迫条件下或者轻微干旱的条件下培育的植物的产量的方法,所述方法包括在植物中和/或植物质体中调节编码eRF1多肽、或SCAMP样多肽、或肌原纤蛋白多肽、或PLATZ多肽、或PLST样多肽、或Glomalin多肽的核酸的表达。
实施本发明方法产生在营养缺乏条件下,特别是氮缺乏条件下相对于在相当条件下培育的对照植物而言具有增加的产量特性的植物。因此,根据本发明,提供了增加在营养缺乏条件件下培育的植物的产量的方法,该方法包括在植物中调节编码eRF1多肽、或SCAMP样多肽、或肌原纤蛋白多肽、或PLST样多肽、或Glomalin多肽的核酸的表达。营养缺乏可以由营养物(例如氮、磷和其它含磷化合物、钾、钙、镁、锰、铁或者硼以及其它)缺少引起。
对于PLATZ多肽,实施本发明方法产生在营养缺乏条件下,特别是氮缺乏条件下相对于在相当条件下培育的对照植物而言具有增加的产量的植物。由于养分利用效率对植物产量和产品质量有显著影响,因此在田间倾倒了大量肥料来优化植物生长和质量。植物的生产力一般受限于三种主要养分:磷、钾和氮,在植物生长的这三者中,氮通常是植物生长的限速元素。因此,植物生长所需的主要营养元素是氮(N)。这是可见于活细胞中的多种重要化合物的组分,所述化合物包括氨基酸、蛋白质(酶)、核酸和叶绿素。植物干物质的1.5%至2%以及总植物蛋白质的约16%是氮。因此,氮的利用度是作物植物生长和生产的主要限制因素(Frink等(1999)ProcNatl Acad Sci USA 96(4):1175-1180),并也对蛋白质积累和氨基酸组成有重大影响。因此,在氮有限条件下培养时具有增加的产量相关性状的作物植物是很有意义的。因此,根据本发明,提供了增加在营养缺乏条件下培育的植物的产量的方法,该方法包括在植物中调节编码PLATZ多肽的核酸的表达。营养缺乏可以由营养物(例如氮、磷和其它含磷化合物、钾、钙、镁、锰、铁或者硼以及其它)缺少引起。
实施本发明方法产生在盐胁迫下相对于在相当条件下培育的对照植物而言具有增加的产量特性的植物。因此,根据本发明,提供了增加在盐胁迫条件下培育的植物的产量的方法,该方法包括在植物中调节编码eRF1多肽、或SCAMP样多肽、或肌原纤蛋白多肽、或PLATZ多肽、或PLST样多肽、或Glomalin多肽的核酸的表达。术语盐胁迫不限于常见盐(NaCl),而是可以为由以下一种或多种引起的任何胁迫:NaCl、KCl、LiCl、MgCl2、CaCl2等。
本发明包括可由根据本发明的方法获得的植物或其部分(包括种子)。所述植物或其部分包含编码如上文所定义的eRF1多肽、或SCAMP样多肽、或肌原纤蛋白多肽、或PLATZ多肽、或PLST样多肽、或Glomalin多肽的核酸转基因。
本发明还提供遗传构建体和载体,以利于在植物中引入和/或表达编码eRF1多肽、或SCAMP样多肽、或肌原纤蛋白多肽、或PLATZ多肽、或PLST样多肽、或Glomalin多肽的核酸。可以将遗传构建体插入适于转化进入植物并适于在转化的细胞中表达目的基因的载体中,该载体可以是可商购的载体。本发明还提供了如本文所定义的遗传构建体在本发明方法中的用途。
更具体地,本发明提供这样的构建体,其含有:
(a)编码如上文所定义的eRF1多肽、或SCAMP样多肽、或肌原纤蛋白多肽、或PLATZ多肽、或PLST样多肽、或Glomalin多肽的核酸;
(b)一个或多个能够驱动(a)中核酸序列表达的控制序列;和任选的
(c)转录终止序列。
优选地,编码eRF1多肽、或SCAMP样多肽、或肌原纤蛋白多肽、或PLATZ多肽、或PLST样多肽、或Glomalin多肽的核酸是如上文所定义的。术语“控制序列”和“终止序列”是如本文所定义的。
可以使用含有任何上述核酸的载体转化植物。技术人员充分知晓载体中必须存在的遗传元件,以便成功进行转化、选择并繁殖含目的序列的宿主细胞。将目的序列有效连接于一个或多个控制序列(至少连接于启动子)。
有利地,任何类型的启动子,不论天然的或合成的,均可用于驱动核酸序列的表达,但是优选启动子是植物来源的。组成型启动子在方法中是特别有用的。优选组成型启动子也是中等强度的遍在组成型启动子。多种启动子类型的定义参见本文的“定义”部分。对于eRF1多肽和/或PLST样多肽,也在本发明中有用的是根特异性启动子。
对于Glomalin多肽,有利地,任何类型的启动子,不论天然的或合成的,均可用于驱动核酸序列的表达,但是优选启动子是植物来源的。多种启动子类型的定义参见本文的“定义”部分。根特异性启动子在方法中是特别有用的。优选根特异性启动子是RCc3启动子(Plant Mol Biol.1995年1月;27(2):237-48),更优选RCc3启动子来自稻,还优选RCc3启动子是由与SEQ ID NO:611基本相似的核酸序列所表示的,最优选组成型启动子如SEQ ID NO:611所示。也可以用于执行本发明方法的其他根特异性启动子的实例见如上“定义”部分表2b中所示。
组成型启动子在本发明方法中也是有用的;优选组成型启动子也是中等强度的遍在组成型启动子,例如GOS2启动子,更优选来自稻的GOS2启动子。还优选组成型启动子是由与SEQ ID NO:612基本相似的核酸序列所表示的,最优选组成型启动子如SEQ ID NO:612所示。组成型启动子的其它实例见本文“定义”部分。
关于eRF1多肽,应该明白,本发明的适用范围不限于SEQ ID NO:1所示eRF1多肽的编码核酸,本发明的适用范围也不限于由组成型启动子驱动时或者由根特异性启动子驱动时编码eRF1多肽的核酸的表达。
组成型启动子优选是中等强度的启动子,更优选的选自植物来源的启动子,例如GOS2启动子,更优选来自稻的GOS2启动子。还优选组成型启动子是由与SEQ ID NO:85基本相似的核酸序列所表示的,最优选组成型启动子如SEQ ID NO:85所示。组成型启动子的其它实例见本文“定义”部分。
任选地,可在引入植物的构建体中使用一个或多个终止子序列。优选的,构建体包括包含GOS2启动子(与SEQ ID NO:85基本相似)和编码eRF1多肽的核酸的表达盒。
关于SCAMP样多肽,应该明白,本发明的适用范围不限于SEQ IDNO:88所示SCAMP样多肽的编码核酸,本发明的适用范围也不限于由组成型启动子驱动时编码SCAMP样多肽的核酸的表达。
组成型启动子优选是中等强度的启动子,更优选的选自植物来源的启动子,例如GOS2启动子,更优选来自稻的GOS2启动子。还优选组成型启动子是由与SEQ ID NO:203基本相似的核酸序列所表示的,最优选组成型启动子如SEQ ID NO:203所示。组成型启动子的其它实例见本文“定义”部分。
任选地,可在引入植物的构建体中使用一个或多个终止子序列。优选的,构建体包括包含GOS2启动子(与SEQ ID NO:203基本相似)和编码SCAMP样多肽的核酸的表达盒。
关于肌原纤蛋白多肽,应该明白,本发明的适用范围不限于SEQ IDNO:204所示肌原纤蛋白多肽的编码核酸,本发明的适用范围也不限于由组成型启动子驱动时编码肌原纤蛋白多肽的核酸的表达。
组成型启动子优选是中等强度的启动子,更优选的选自植物来源的启动子,例如GOS2启动子,更优选来自稻的GOS2启动子。还优选组成型启动子是由与SEQ ID NO:257基本相似的核酸序列所表示的,最优选组成型启动子如SEQ ID NO:257所示。组成型启动子的其它实例见本文“定义”部分。
任选地,可在引入植物的构建体中使用一个或多个终止子序列。优选的,构建体包括包含GOS2启动子(与SEQ ID NO:257基本相似)和编码肌原纤蛋白多肽的核酸的表达盒。
关于PLATZ多肽,应该明白,本发明的适用范围不限于SEQ ID NO:260所示PLATZ多肽的编码核酸,本发明的适用范围也不限于由组成型启动子驱动时编码PLATZ多肽的核酸的表达。
组成型启动子优选选自植物来源的启动子,例如GOS2启动子,更优选来自稻的GOS2启动子。还优选组成型启动子是由与SEQ ID NO:273基本相似的核酸序列所表示的,最优选组成型启动子如SEQ ID NO:273所示。组成型启动子的其它实例见本文“定义”部分。
任选地,可在引入植物的构建体中使用一个或多个终止子序列。优选的,构建体包括包含GOS2启动子(与SEQ ID NO:273基本相似)和编码PLATZ多肽的核酸的表达盒。
关于PLST样多肽,应该明白,本发明的适用范围不限于SEQ ID NO:410所示PLST样多肽的编码核酸,本发明的适用范围也不限于由组成型启动子驱动时编码PLST样多肽的核酸的表达。
组成型启动子优选是中等强度的启动子,更优选的选自植物来源的启动子,例如GOS2启动子,更优选来自稻的GOS2启动子。还优选组成型启动子是由与SEQ ID NO:542基本相似的核酸序列所表示的,最优选组成型启动子如SEQ ID NO:542所示。组成型启动子的其它实例见本文“定义”部分。
任选地,可在引入植物的构建体中使用一个或多个终止子序列。优选的,构建体包括包含GOS2启动子(与SEQ ID NO:542基本相似)和编码PLST样多肽的核酸的表达盒。
关于Glomalin多肽,应该明白,本发明的适用范围不限于SEQ ID NO:545所示Glomalin多肽的编码核酸,本发明的适用范围也不限于由根特异性启动子驱动时或者由组成型启动子驱动时编码Glomalin多肽的核酸的表达。
任选地,可在引入植物的构建体中使用一个或多个终止子序列。优选的,构建体包括包含RCc3启动子(与SEQ ID NO:611基本相似)和编码Glomalin多肽的核酸的表达盒。
根据本发明优选的特征,调节的表达是增加的表达。在本领域内详细记载了用于增加核酸或基因或者基因产物表达的方法,并且在定义部分提供了实例。
其它调节元件可包括转录及翻译增强子。本领域技术人员会了解适于在实施本发明中使用的终止子和增强子序列。如在定义部分所述,也可将内含子序列添加至5′非翻译区(UTR)或编码序列上,以增加在细胞质内积累的成熟信息的量。其它控制序列(除启动子、增强子、沉默子、内含子序列、3’UTR和/或5’UTR区之外)可以是蛋白质和/或RNA稳定元件。本领域技术人员会知道或可以容易地获得此类序列。
本发明的遗传构建体还可以包括在特定细胞类型中维持和/或复制需要的复制起点序列。一个例子是当需要将遗传构建体在细菌细胞中作为附加型遗传元件(例如质粒或粘粒分子)维持时。优选的复制起点包括但不限于f1-ori和colE1。
为检测如在本发明方法中所用核酸序列的成功转移和/或选择包含这些核酸序列的转基因植物,使用标记基因(或报告基因)是有利的。因而,遗传构建体可以任选地包含可选择标记基因。可选择标记在本文“定义”部分中有更详细的描述。一旦不再需要,可以从转基因细胞中去除或切除标记基因。用于标记基因去除的技术是本领域已知的,有用的技术在上文“定义”部分中描述。
本发明还提供产生与对照植物相比具有增强的产量相关性状的转基因植物的方法,其包括在植物和/或植物质体中引入和表达编码上文所定义的eRF1多肽、或SCAMP样多肽、或肌原纤蛋白多肽、或PLATZ多肽、或PLST样多肽、或Glomalin多肽的任何核酸。
更具体地,本发明提供了产生具有增强的产量相关性状(特别是增加的种子产量以及生物量)的转基因植物的方法,所述方法包括:
(i)向植物或植物细胞中引入和表达eRF1多肽、或SCAMP样多肽、或肌原纤蛋白多肽、或PLATZ多肽、或PLST样多肽、或Glomalin多肽的编码核酸;和
(ii)在促进植物生长和发育的条件下培养植物细胞。
(i)的核酸可以是任何能编码如本文所定义的eRF1多肽、或SCAMP样多肽、或肌原纤蛋白多肽、或PLATZ多肽、或PLST样多肽、或Glomalin多肽的核酸。
可以将核酸直接引入植物细胞或植物本身(包括引入植物的组织、器官或任何其它部分)。根据本发明优选的特征,优选通过转化将核酸引入植物。术语“转化”在本文“定义”部分有更详细的说明。
遗传修饰的植物细胞能够通过技术人员熟悉的所有方法再生。合适的方法可见于上述S.D.Kung和R.Wu、Potrykus或者和Willmitzer的出版物。
通常在转化以后,选出存在一个或多个标记的植物细胞或细胞群,所述标记由与目的基因共转移的植物可表达基因编码,继之将转化的材料再生成整个植物。为选择转化的植物,通常将在转化过程中获得的植物材料置于选择性条件下,从而可将转化的植物与非转化植物区分开来。例如,可以种植以上述方式获得的种子,并在最初的生长期之后,通过喷雾对其进行合适的选择。另一可能方案是使用合适的选择剂,将种子(适当时在灭菌之后)种在含有合适选择剂琼脂板上,从而仅转化的种子能够长成植物。备选地,针对转化的植物筛选可选择标记(如上文所述标记)的存在。
DNA转移和再生之后,还可评价推定转化的植物,例如用Southern分析,评价目的基因的存在、拷贝数和/或基因组构造。备选地或另外地,可用Northern和/或Western分析监测新引入的DNA的表达水平,这两种技术都是本领域普通技术人员所熟知的。
产生的转化植物可以通过多种方式繁殖,如通过克隆繁殖或经典的育种技术。例如,第一代(或T1)转化的植物可自交,选择纯合的第二代(或T2)转化体,而T2植物可进一步通过经典育种技术繁殖。产生的转化生物体可以有多种形式。例如,它们可以是转化细胞和非转化细胞的嵌合体;克隆的转化体(例如所有细胞经转化含有表达盒);转化和非转化组织的嫁接体(例如在植物中,转化的根状茎嫁接到非转化的接穗上)。
本发明显然延及由本文所述任何方法产生的任何植物细胞或植物,以及所有的植物部分及其繁殖体。本发明还延及由任何上述方法产生的原代转化或转染的细胞、组织、器官或整个植物的后代,唯一的要求是所述后代呈现出与在本发明方法中亲本产生的基因型和/或表型特征相同的基因型和/或表型特征。
本发明也包括含有分离的编码如上文所定义的eRF1多肽、或SCAMP样多肽、或肌原纤蛋白多肽、或PLATZ多肽、或PLST样多肽、或Glomalin多肽的核酸的宿主细胞。根据本发明优选的宿主细胞是植物细胞。对于用于本发明方法的核酸或载体、表达盒或构建体或载体,其宿主植物原则上有利地为能够合成在本发明方法中使用的多肽的所有植物。
本发明方法有利地适用于任何植物。特别用于本发明方法中的植物包括属于植物界超家族的全部植物,尤其是单子叶植物和双子叶植物,包括饲用或饲料豆类、观赏植物、粮食作物、树或灌木。根据本发明优选的实施方案,植物是作物植物。作物植物的例子包括大豆、向日葵、芸苔、苜蓿、油菜(rapeseed)、亚麻子、棉花、番茄、马铃薯和烟草。还优选地,植物是单子叶植物。单子叶植物的例子包括甘蔗。更优选地,植物是谷物。谷物的例子包括稻、玉米、小麦、大麦、粟、黑麦、黑小麦、高粱、野小麦(emmer)、德国小麦(spelt)、黑麦属、一粒系小麦(einkorn)、teff、蜀黍(milo)和燕麦。
本发明也延及植物的可收获部分,该植物可收获部分包含编码eRF1多肽、或SCAMP样多肽、或肌原纤蛋白多肽、或PLATZ多肽、或PLST样多肽、或Glomalin多肽的重组核酸,这样的可收获部分包括,但不限于种子、叶、果实、花、茎、根、根茎、块茎和鳞茎。本发明进一步涉及来自、优选直接来自该植物的可收获部分的产物,如干燥颗粒或粉末、油、脂肪及脂肪酸、淀粉或蛋白质。
根据本发明优选的特征,调节的表达是增加的表达。在本领域内详细记载了用于增加核酸或基因或者基因产物表达的方法,并且在定义部分提供了实例。
如上所述,用于调节编码eRF1多肽、或SCAMP样多肽、或肌原纤蛋白多肽、或PLATZ多肽、或PLST样多肽、或Glomalin多肽的核酸表达的优选方法是通过在植物中引入并表达编码eRF1多肽、或SCAMP样多肽、或肌原纤蛋白多肽、或PLATZ多肽、或PLST样多肽、或Glomalin多肽的核酸;然而实施该方法的效果(也就是增强产量相关性状)也可使用其它已知技术来实现,包括但不限于T-DNA激活标签、TILLING、同源重组。在定义部分提供了这些技术的描述。
本发明也包括编码如本文中所述的eRF1多肽、或SCAMP样多肽、或肌原纤蛋白多肽、或PLATZ多肽、或PLST样多肽、或Glomalin多肽的核酸的用途和这些eRF1多肽、或SCAMP样多肽、或肌原纤蛋白多肽、或PLATZ多肽、或PLST样多肽、或Glomalin多肽的用途,用于增强植物中的任何前述的产量相关性状。
编码本文中所述eRF1多肽、或SCAMP样多肽、或肌原纤蛋白多肽、或PLATZ多肽、或PLST样多肽、或Glomalin多肽的核酸、或者eRF1多肽、或SCAMP样多肽、或肌原纤蛋白多肽、或PLATZ多肽、或PLST样多肽、或Glomalin多肽本身可以用于育种程序中,其中鉴定到可以与eRF1多肽、或SCAMP样多肽、或肌原纤蛋白多肽、或PLATZ多肽、或PLST样多肽、或Glomalin多肽编码基因遗传连锁的DNA标记。所述核酸/基因或eRF1多肽、或SCAMP样多肽、或肌原纤蛋白多肽、或PLATZ多肽、或PLST样多肽、或Glomalin多肽本身可以用来定义分子标记。这种DNA或蛋白质标记随后可以在育种程序中用来选择具有本发明方法中如上文所定义的增强的产量相关性状的植物。
编码eRF1多肽、或SCAMP样多肽、或肌原纤蛋白多肽、或PLATZ多肽、或PLST样多肽、或Glomalin多肽的基因/核酸的等位变体也可以用于标记辅助的育种程序中。这种育种程序有时需要通过使用例如EMS诱变法对植物作诱变处理而引入等位基因变异;备选地,该程序可以从非故意引起的所谓“自然”起源的等位变体集合开始。随后进行等位变体的鉴定,例如通过PCR法。此后是用于选择所讨论序列的优选等位变体且其导致增加的产量性状的步骤。一般通过监测含有所讨论序列的不同等位变体的植物的生长性能而实施选择。可以在温室中或田间监测生长性能。其它任选步骤包括将鉴定到有优选等位变体的植物与另一种植物杂交。这可以用来例如产生目标表型特征的组合。
编码eRF1多肽、或SCAMP样多肽、或肌原纤蛋白多肽、或PLATZ多肽、或PLST样多肽、或Glomalin多肽的核酸序列也可以用作探针以便对基因进行遗传作图和物理作图,所述探针作为所述基因的一部分,及用作与那些基因关联的性状的标记。此类信息可以用于植物育种中,以便开发具有想要表型的株系。编码eRF1多肽、或SCAMP样多肽、或肌原纤蛋白多肽、或PLATZ多肽、或PLST样多肽、或Glomalin多肽的核酸的这种用途仅需要具有至少15个核苷酸长度的核酸序列。编码eRF1多肽、或SCAMP样多肽、或肌原纤蛋白多肽、或PLATZ多肽、或PLST样多肽、或Glomalin多肽的核酸可以用作限制性片段长度多态性(RFLP)标记。限制性消化的植物基因组DNA的Southern印迹(Sambrook J,Fritsch EF和Maniatis T(1989)Molecular Cloning,A Laboratory Manual)可以用编码eRF1多肽、或SCAMP样多肽、或肌原纤蛋白多肽、或PLATZ多肽、或PLST样多肽、或Glomalin多肽的核酸序列来探测。产生的条带图谱随后可以使用计算机程序如MapMaker(Lander等(1987)Genomics 1:174-181)进行遗传分析以构建遗传图。此外,该核酸序列可以用来探测含有经限制性内切核酸酶处理的一组个体的基因组DNA的Southern印迹,其中所述的一组个体代表具有确定的遗传杂交的亲代和后代。DNA多态性的分离被标出并用来计算编码eRF1多肽、或SCAMP样多肽、或肌原纤蛋白多肽、或PLATZ多肽、或PLST样多肽、或Glomalin多肽的核酸在使用这个群体先前所获得的遗传图中的位置(Botstein等(1980)Am.J.Hum.Genet.32:314-331)。
在Bernatzky和Tanksley(1986)Plant Mol.Biol.Reporter 4:37-41中描述了植物基因衍生的探针的产生和其在遗传作图中的用途。众多出版物描述了使用以上所提及的方法学或其改进方法对特定cDNA克隆的遗传作图。例如,F2互交群、回交群、随机交配群、近等基因系和其它个体群体可以用于作图。此类方法学是本领域技术人员众所周知的。
所述核酸序列探针也可以用于物理作图(即序列在物理图上的排列;见Hoheisel等在:Non-mammalian Genomic Analyasis:A Practical Guide,Academic press 1996,第319-346页及其中引用的参考文献)。
在另一实施方案中,核酸探针可以在直接荧光原位杂交(FISH)作图(Trask(1991)Trends Genet.7:149-154)中使用。尽管当前的FISH作图法支持使用大型克隆(几个kb至几百个kb;见Laan等(1995)Genome Res.5:13-20),然而灵敏度的改进可以允许使用更短探针进行FISH作图。
用于遗传作图及物理作图的多种基于核酸序列扩增的方法可以使用所述核酸序列而实施。例子包括等位基因特异的扩增(Kazazian(1989)J.Lab.Clin.Med 11:95-96)、PCR扩增片段的多态性(CAPS;Sheffield等(1993)Genomics 16:325-332)、等位基因特异性连接(Landegren等(1988)Science241:1077-1080)、核苷酸延伸反应(Sokolov(1990)Nucleic Acid Res.18:3671)、放射杂交作图(Walter等(1997)Nat.Genet.7:22-28)和Happy作图(Dear和Cook(1989)Nucleic Acid Res.17:6795-6807)。对于这些方法,使用核酸的序列来设计并产生在扩增反应或在引物延伸反应中使用的引物对。此类引物的设计是本领域技术人员众所周知的。在使用基于PCR遗传作图的方法中,可能必须鉴定在对应于当前核酸序列的整个区域内作图亲代间的DNA序列差异。然而,这对于作图法而言通常不是必需的。
本发明方法产生具有如前文所述的增强的产量相关性状的植物。这些性状也可以与其它经济有利的性状组合,如其它的产量增强性状、对其它非生物胁迫和生物胁迫的耐性、调节多种构造性特征和/或生物化学特征和/或生理学特征的性状。
项目
1.eRF1多肽
在一个方面,本发明的特征在于一个或多个以下项目:
1.用于在植物中相对于对照植物增强产量相关性状的方法,包括调节编码eRF1多肽的核酸在植物中的表达,其中所述多肽包含至少3个共有结构域,eRF1结构域1、eRF1结构域2和eRF1结构域3(Pfam登录号分别为PF03463、PF03464和PF03465)。
2.项目1的方法,其中eRF1多肽的eRF1结构域1以递增的优先顺序与位于SEQ ID NO 2的氨基酸6至140之间的序列具有至少49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或者更多的序列同一性。
3.项目1的方法,其中eRF1多肽的eRF1结构域2以递增的优先顺序与位于SEQ ID NO 2的氨基酸144至278之间的序列具有至少49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或者更多的序列同一性。
4.项目1的方法,其中eRF1多肽的eRF1结构域3以递增的优先顺序与位于SEQ ID NO 2的氨基酸281至418之间的序列具有至少49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或者更多的序列同一性。
5.项目1-4的任一项的方法,其中本发明的eRF1多肽包含一个或多个以下肽:分别具有SEQ ID NO:73、74和75的GGQ、NIKS和[GA][IMLV]LR[YW]。
6.项目1的方法,其中所述eRF1多肽还可以包含序列基序,所述序列基序以递增的优先顺序与任一以下基序:
(i)基序1:FGTLSGNTREVLHKF[TS]VDLPKKHGRGGQSALRFARLRMEKRHNYVRK[TV]AE(SEQ ID NO:76),
(ii)基序2:YN[KR]VPPNGLVLY[TC]GT[IV]VT[ED][DE]GKEKKV[TN]IDFEPF[KR]PIN[AT]SLYLCDNKFHTE(SEQ ID NO:77),
(iii)基序3:ARGNGTSMISLI[MI]PP[RK]DQ[IV]SRVTKML[GA]DE[YF]GTASNI KSRVNR[QL]SVL[GS]AIT(SEQ ID NO:78)具有至少49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或者更多的序列同一性。
7.项目1-6的任一项的方法,其中所述eRF1多肽还可以包含任意一个或多个序列基序,所述序列基序以递增的优先顺序与任一以下基序:
(i)基序4:[TS]VDLPKKHGRGGQSALRFARLR[EM]EKRHNYVRKVAE[VL]A[VT]QNFITND[KR][PV]NV(SEQ ID NO:79),
(ii)基序5:Y[NT][KR]VPPNGLV[VLI]YCG[TD][IV][ILM]T[ED][ED]GKE[KR]K[VM][NT]ID[FI]EPFKPINTSLYLCDNKFHTE(SEQ ID NO:80),
(iii)基序6:ARGNGTSMISL[IV][IM]PPK[DG]Q[IV]S[RL]V[QA]KML[AT][DE]EYGTASNIKSRVNR[LQ]SVL[SG]AIT(SEQ ID NO:81)
具有至少49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或者更多的序列同一性。
8.项目6-7的任一项的方法,其中所述eRF1多肽还可以包含任意一个或多个序列基序,所述序列基序以递增的优先顺序与任一以下基序:
(i)基序7:VDLPKKHGRGGQSALRFARLRMEKRHNYVRKTAELATQF[YF]INPATSQPNV(SEQ ID NO:82),
(ii)基序8:YNKVPPNGLVLYTGTIVT[ED]DGKEKKVTIDFEPF[KR]PINASLYLCDNKFHTE(SEQ ID NO:83),
(iii)基序9:TSMISLIMPPRDQ[VI]SRVTKMLGDE[FY]GTASNIKSRVNRQSVLGAITSAQQR(SEQ ID NO:84)具有至少49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或者更多的序列同一性。
9.项目1-8的任一项的方法,其中eRF1多肽的同源物以递增的优先顺序与由表A1的任一多肽,优选地由SEQ ID NO:2表示的氨基酸具有至少25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的整体序列同一性。
10.项目1-9的任一项的方法,其中所述受调控的表达通过在植物中引入和表达如前述项目任一项所述的eRF1多肽之编码核酸而实现。
11.项目1-10的任一项的方法,其中所述编码eRF1多肽之核酸编码表A1中列举的任一蛋白质,或者是此类核酸的一部分,或者是能够与此类核酸杂交的核酸。
12.项目1-11的任一项的方法,其中所述核酸序列编码表A1给出的任一蛋白质的直向同源物或旁系同源物。
13.任一前述项目的方法,其中所述增强的产量相关性状包括相对于对照植物增加的产量,优选增加的生物量和/或增加的种子产量。
14.项目1-13的任一项的方法,其中所述增强的产量相关性状是在非胁迫条件下获得的。
15.项目1-14的任一项的方法,其中所述增强的产量相关性状是在干旱胁迫、盐胁迫或氮缺乏条件下获得的。
16.项目10-12的任一项的方法,其中所述核酸与组成型启动子,优选GOS2启动子,最优选来自稻的GOS2启动子有效连接。
17.项目1-16的任一项的方法,其中所述eRF1多肽之编码核酸是植物来源的,优选来自双子叶植物,进一步优选来自十字花科,更优选来自拟南芥属,最优选来自拟南芥。
18.通过项目1-17的任一项方法可获得的植物或其部分,包括种子,其中所述植物或其部分包含编码eRF1多肽的重组核酸。
19.构建体,包含:
(i)编码如项目1-9定义的eRF1多肽的核酸;
(ii)能够驱动(i)的核酸序列表达的一个或多个控制序列;和任选的
(iii)转录终止序列。
20.项目19的构建体,其中所述控制序列之一是组成型启动子,优选GOS2启动子,最优选来自稻的GOS2启动子。
21.项目19或20的构建体在用于制造相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量的植物的方法中的用途。
22.用项目19或20的构建体转化的植物、植物部分或植物细胞。
23.用于生产相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量的转基因植物的方法,包括:
(i)在植物中引入和表达如项目1-9定义的eRF1多肽之编码核酸;和
(ii)在促进植物生长和发育的条件下培养植物细胞。
24.相对于对照植物,具有增加的产量,特别是增加的生物量和/或增加的种子产量的转基因植物或者源自所述转基因植物的转基因植物细胞,获得自如项目1-9定义的eRF1多肽之编码核酸受调控的表达。
25.项目18、22或24的转基因植物,或源自它的转基因植物细胞,其中所述植物是作物植物或单子叶或谷物,例如稻、玉米、小麦、大麦、粟、黑麦、黑小麦、高粱、野小麦、德国小麦、黑麦属、一粒系小麦、teff、蜀黍和燕麦。
26.项目25的植物的可收获部分,其中所述可收获部分优选是苗生物量和/或种子。
27.来自项目25的植物和/或项目26的植物的可收获部分的产物。
28.eRF1多肽之编码核酸在相对于对照植物,在植物中增加产量,特别是增加的种子产量和/或苗生物量的用途。
29.分离的核酸分子,选自:
(i)由以下核酸序列的任一表示的核酸:具有SEQ ID NO:15的G.max_GM06MC33657_sm55b1032878;具有SEQ ID NO:17的H.vulgare_c64960768hv2703032598;
(ii)由所述序列表示的核酸的互补序列:所述序列具有SEQ ID NO:15的G.max_GM06MC33657_sm55b1032878;具有SEQ ID NO:17的H.vulgare_c64960768hv2703032598;
(iii)编码由SEQ ID NO:16;SEQ ID NO:18的任一表示的多肽的核酸,优选地,由于遗传密码的简并性,所述分离的核酸可以衍生自由SEQID NO:16和18的任一表示的多肽序列,并且另外优选地赋予相对于对照植物而言增强的产量相关性状;
(iv)核酸,所述核酸以递增的优先顺序与表A1的任一核酸序列具有至少30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性,并且另外优选地赋予相对于对照植物而言增强的产量相关性状;
(v)核酸分子,所述核酸分子在严格杂交条件下与(i)至(iv)项的核酸分子杂交,并优选地赋予相对于对照植物而言增强的产量相关性状;
(vi)编码eRF1多肽的核酸,所述eRF1多肽以递增的优先顺序与由SEQ ID NO:16和18的任一表示的氨基酸序列和表A1中的任一其它氨基酸序列具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性,并且优选地赋予相对于对照植物而言增强的产量相关性状。
30.本发明另外的实施方案,从而还提供了分离的多肽,选自:
(i)由SEQ ID NO:16和18的任一表示的氨基酸序列;
(ii)氨基酸序列,所述氨基酸序列以递增的优先顺序与由SEQ ID NO:16和18的任一表示的氨基酸序列和表A1中的任一其它氨基酸序列具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性,并且优选地赋予相对于对照植物而言增强的产量相关性状。
(iii)上述(i)或(ii)项中给出的任一氨基酸序列的衍生物。
2.SCAMP样多肽
在另一方面,本发明的特征在于一个或多个以下项目:
1.用于在植物中相对于对照植物增强产量相关性状的方法,包括调节编码SCAMP样多肽的核酸在植物中的表达,其中所述SCAMP样多肽包含SCAMP结构域。
2.项目1的方法,其中所述SCAMP结构域以递增的优先顺序与表A2的任一多肽中存在的SCAMP结构域的氨基酸,优选地与位于SEQ IDNO 89的氨基酸91至265之间的序列表示的SCAMP结构域具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性。
3.项目1或2的方法,其中所述受调控的表达通过在植物中引入和表达SCAMP样多肽之编码核酸而实现。
4.项目1-3的任一项的方法,其中所述编码SCAMP样多肽之核酸编码表A2中列举的任一蛋白质,或者是此类核酸的一部分,或者是能够与此类核酸杂交的核酸。
5.项目1-4的任一项的方法,其中所述核酸序列编码表A2给出的任一蛋白质的直向同源物或旁系同源物。
6.任一前述项目的方法,其中所述增强的产量相关性状包括相对于对照植物增加的产量,优选增加的生物量和/或增加的种子产量。
7.项目1-6的任一项的方法,其中所述增强的产量相关性状是在非胁迫条件下获得的。
8.项目1-6的任一项的方法,其中所述增强的产量相关性状是在干旱胁迫、盐胁迫或氮缺乏条件下获得的。
9.项目3-8的任一项的方法,其中所述核酸与组成型启动子,优选GOS2启动子,最优选来自稻的GOS2启动子有效连接。
10.项目1-9的任一项的方法,其中所述LBD多肽之编码核酸是植物来源的,优选来自双子叶植物,进一步优选来自十字花科,更优选来自拟南芥属,最优选来自拟南芥。
11.通过项目1-10的任一项方法可获得的植物或其部分,包括种子,其中所述植物或其部分包含编码SCAMP样多肽的重组核酸。
12.构建体,包含:
(i)编码如项目1或2定义的SCAMP样多肽的核酸;
(ii)能够驱动(i)的核酸序列表达的一个或多个控制序列;和任选的
(iii)转录终止序列。
13.项目12的构建体,其中所述控制序列之一是组成型启动子,优选GOS2启动子,最优选来自稻的GOS2启动子。
14.项目12或13的构建体在用于制造相对于对照植物具有增加的产量,特别是增加生物量和/或增加的种子产量的植物的方法中的用途。
15.用项目12或13的构建体转化的植物、植物部分或植物细胞。
16.用于生产相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量的转基因植物的方法,包括:
(i)在植物中引入和表达如项目1或2定义的SCAMP样多肽之编码核酸;和
(ii)在促进植物生长和发育的条件下培养植物细胞。
17.相对于对照植物,具有增加的产量,特别是增加的生物量和/或增加的种子产量的转基因植物或者源自所述转基因植物的转基因植物细胞,获得自如项目1或2定义的SCAMP样多肽之编码核酸受调控的表达。
18.项目11、15或17的转基因植物,或源自它的转基因植物细胞,其中所述植物是作物植物或单子叶或谷物,例如稻、玉米、小麦、大麦、粟、黑麦、黑小麦、高粱、野小麦、德国小麦、黑麦属、一粒系小麦、teff、蜀黍和燕麦。
19.项目18的植物的可收获部分,其中所述可收获部分优选是苗生物量和/或种子。
20.来自项目18的植物和/或项目19的植物的可收获部分的产物。
21.SCAMP样多肽之编码核酸在相对于对照植物,在植物中增加产量,特别是增加种子产量和/或苗生物量的用途。
22.分离的核酸分子,选自:
(i)由SEQ ID NO:100、102、104、106、180、182、184、186、188、190和192的任一表示的核酸;
(ii)由(i)项SEQ ID NO:100、102、104、106、180、182、184、186、188、190和192的任一表示的核酸的互补序列;
(iii)编码由SEQ ID NO:101、103、105、107、109、183、185、187、189、191和193的任一表示的多肽的核酸;优选地,由于遗传密码的简并性,所述分离的核酸可以衍生自由SEQ ID NO:101、103、105、107、181、183、185、187、189、191和193的任一表示的多肽序列,并且另外优选地赋予相对于对照植物而言增强的产量相关性状;
(iv)核酸,所述核酸以递增的优先顺序与表A2的任一核酸序列具有至少30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性,并且另外优选地赋予相对于对照植物而言增强的产量相关性状;
(v)核酸分子,所述核酸分子在严格杂交条件下与(i)至(iv)项的核酸分子杂交,并优选地赋予相对于对照植物而言增强的产量相关性状。
(vi)编码多肽的核酸,所述多肽以递增的优先顺序与由SEQ ID NO:101、103、105、107、181、183、185、187、189、191和193的任一表示的氨基酸序列和表A2中的任一其它氨基酸序列具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性,并且优选地赋予相对于对照植物而言增强的产量相关性状。
23.分离的多肽,选自
(i)由SEQ ID NO:101、103、105、107、181、183、185、187、189、191和193的任一表示的氨基酸序列;
(ii)氨基酸序列,所述氨基酸序列以递增的优先顺序与由SEQ ID NO:101、103、105、107、181、183、185、187、189、191和193的任一表示的氨基酸序列和表A2中的任一其它氨基酸序列具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性,并且优选地赋予相对于对照植物而言增强的产量相关性状。
(iii)上述(i)或(ii)项中给出的任一氨基酸序列的衍生物。
3.肌原纤蛋白多肽
在另一方面,本发明的特征在于一个或多个以下项目:
1.用于在植物中相对于对照植物而言增强产量相关性状的方法,包括调节植物中编码肌原纤蛋白多肽之核酸的表达,所述肌原纤蛋白多肽包括:
(i)由PFAM登录号PF04755表示的PAP肌原纤蛋白结构域;和
(ii)由KFECQNESRGGLVRNVIKWSVPRLLE
ENEGATLIVTARFSSVSARNIYLKFEEIGLQNINISDDLQAVIAPAILPRSFLSLQILQFIRSFKARVPVTSPERHSVGGLYYLSYLDKNMLLGRAVGGGGVFIFTRAHTL(SEQ ID NO:253)表示的羧基端结构域,其可以含有表示1至15个之间的残基的0至5个之间的空位,或者以递增的优先顺序与(SEQ ID NO:253)具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的整体序列同一性的结构域;和任选地
(iii)在多肽的氨基端区域内的转运肽。
2.项目1的方法,其中所述PAP肌原纤蛋白结构域由ENRKYELLNIIQDTQRGLVTTADQRSTIEEAMVVVEGFDAGKEIDLSKLDGTWQYTSAPDVLILFESAARLPFFQVGQIFQ SEQ ID NO:252表示,其可以含有表示1至15个之间的残基的0至5个之间的空位,或者以递增的优先顺序与SEQID NO:252具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的整体序列同一性的结构域。
3.项目1或2的方法,其中所述肌原纤蛋白多肽包含以下结构域的一个或多个:
结构域X:NIYLQF[EQ]E[IA]S[VL]Q[ND]INISE[EQ]LQAL[IL]APA[IL]LPRSFL[SN]LQILQ[FA][LI][RK][TS]F[KR]AQ[VI]P;
结构域Y:YYL[ST]YLD[RN][ND]MLLGR[AS]VGGGGV;
结构域Z:[PA][IL]DL[AS]KLDGTWRLQYTSA[SP]DV;或
以递增的优先顺序与结构域X、Y和Z的任意一个或多个具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的整体序列同一性的结构域。
4.项目1-3的任一项的方法,其中所述受调控的表达通过在植物中引入和表达肌原纤蛋白多肽之编码核酸而实现。
5.项目1-4的任一项的方法,其中所述编码肌原纤蛋白多肽之核酸编码表A3中列举的任一蛋白质,或者是此类核酸的一部分,或者是能够与此类核酸杂交的核酸。
6.项目1-5的任一项的方法,其中所述核酸序列编码表A3给出的任一蛋白质的直向同源物或旁系同源物。
7.任一前述项目的方法,其中所述增强的产量相关性状包括相对于对照植物增加的产量,优选的种子产量。
8.项目1-7的任一项的方法,其中所述增强的产量相关性状是在非胁迫条件下获得的。
9.项目4-8的任一项的方法,其中所述核酸与组成型启动子,优选GOS2启动子,最优选来自稻的GOS2启动子有效连接。
10.项目1-9的任一项的方法,其中所述肌原纤蛋白多肽之编码核酸是植物来源的,优选来自双子叶植物,更优选来自茄科(Solanaceae),还优选该核酸来自番茄属(Lycopersicon),进一步优选地来自番茄属物种,最优选核酸来自番茄。
11.通过项目1-10的任一项方法可获得的植物或其部分,包括种子,其中所述植物或其部分包含编码肌原纤蛋白多肽的重组核酸。
12.构建体,包含:
(i)编码如项目1-3定义的肌原纤蛋白多肽的核酸;
(ii)能够驱动(i)的核酸序列表达的一个或多个控制序列;和任选的
(iii)转录终止序列。
13.项目12的构建体,其中所述控制序列之一是组成型启动子,优选GOS2启动子,最优选来自稻的GOS2启动子。
14.项目12或13的构建体在用于制造相对于对照植物具有增加的产量,特别是增加的种子产量的植物的方法中的用途。
15.用项目12或13的构建体转化的植物、植物部分或植物细胞。
16.用于生产相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量的转基因植物的方法,包括:
(i)在植物中引入和表达如项目1-3定义的肌原纤蛋白多肽之编码核酸;和
(ii)在促进植物生长和发育的条件下培养植物细胞。
17.相对于对照植物,具有增加的产量,特别是增加的种子产量的转基因植物或者源自所述转基因植物的转基因植物细胞,获得自如项目1-3定义的肌原纤蛋白多肽之编码核酸受调控的表达。
18.项目11、15或17的转基因植物,或源自它的转基因植物细胞,其中所述植物是作物植物或单子叶或谷物,例如稻、玉米、小麦、大麦、粟、黑麦、黑小麦、高粱、野小麦、德国小麦、黑麦属、一粒系小麦、teff、蜀黍和燕麦。
19.项目18的植物的可收获部分,其中所述可收获部分优选是种子。
20.来自项目18的植物和/或项目19的植物的可收获部分的产物。
21.肌原纤蛋白多肽之编码核酸在相对于对照植物,在植物中增加产量,特别是增加种子产量的用途。
22.分离的核酸分子,选自:
(i)由以下核酸序列的任一表示的核酸:具有SEQ ID NO:206的B.napus_BN06MC20042_4649927919975;具有SEQ ID NO:220的G.max_GM06MC19234_5969470918873;
(ii)由所述序列表示的核酸的互补序列:所述序列具有SEQ ID NO:206的B.napus_BN06MC20042_4649927919975;具有SEQ ID NO:220的G.max_GM06MC19234_5969470918873;
(iii)编码由SEQ ID NO:207;SEQ ID NO:221的任一表示的多肽的核酸,优选地,由于遗传密码的简并性,所述分离的核酸可以衍生自由SEQID NO:207和221的任一表示的多肽序列,并且另外优选地赋予相对于对照植物而言增强的产量相关性状;
(iv)核酸,所述核酸以递增的优先顺序与表A3的任一核酸序列具有至少30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性,并且另外优选地赋予相对于对照植物而言增强的产量相关性状;
(v)核酸分子,所述核酸分子在严格杂交条件下与(i)至(iv)项的核酸分子杂交,并优选地赋予相对于对照植物而言增强的产量相关性状;
(vi)编码肌原纤蛋白多肽的核酸,所述肌原纤蛋白多肽以递增的优先顺序与由SEQ ID NO:207和221的任一表示的氨基酸序列和表A3中的任一其它氨基酸序列具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性,并且优选地赋予相对于对照植物而言增强的产量相关性状。
23.根据本发明另外的实施方案,从而还提供了分离的多肽分子,选自:
(i)由SEQ ID NO:207和221的任一表示的氨基酸序列;
(ii)氨基酸序列,所述氨基酸序列以递增的优先顺序与由SEQ ID NO:207和221的任一表示的氨基酸序列和表A3中的任一其它氨基酸序列具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性,并且优选地赋予相对于对照植物而言增强的产量相关性状。
(iii)上述(i)或(ii)项中给出的任一氨基酸序列的衍生物。
4.PLATZ多肽
在另一方面,本发明的特征在于一个或多个以下项目:
1.用于在植物中相对于对照植物而言增强产量相关性状的方法,包括调节植物中编码PLATZ多肽之核酸的表达,其中所述PLATZ多肽包含PLATZ结构域。
2.项目1的方法,其中所述PLATZ多肽包含基序10至18(SEQ IDNO:264至SEQ ID NO:272)的一个或多个。
3.项目1或2的任一项的方法,其中所述受调控的表达通过在植物中引入和表达PLATZ多肽之编码核酸而实现。
4.项目1-3的任一项的方法,其中所述编码PLATZ多肽之核酸编码表A4中列举的任一蛋白质,或者是此类核酸的一部分,或者是能够与此类核酸杂交的核酸。
5.项目1-4的任一项的方法,其中所述核酸序列编码表A4给出的任一蛋白质的直向同源物或旁系同源物。
6.任一前述项目的方法,其中所述增强的产量相关性状包括相对于对照植物增加的产量,优选增加的生物量和/或增加的种子产量。
7.项目1-6的任一项的方法,其中所述增强的产量相关性状是在非胁迫条件下获得的。
8.项目3-7的任一项的方法,其中所述核酸与组成型启动子,优选GOS2启动子,最优选来自稻的GOS2启动子有效连接。
9.项目1-8的任一项的方法,其中所述PLATZ多肽之编码核酸是植物来源的,优选来自双子叶植物,进一步优选来自杨柳科,最优选地来自杨属。
10.通过项目1-9的任一项方法可获得的植物或其部分,包括种子,其中所述植物或其部分包含编码PLATZ多肽的重组核酸。
11.构建体,包含:
(i)编码如项目1或2定义的PLATZ多肽的核酸;
(ii)能够驱动(i)的核酸序列表达的一个或多个控制序列;和任选的
(iii)转录终止序列。
12.项目11的构建体,其中所述控制序列之一是组成型启动子,优选GOS2启动子,最优选来自稻的GOS2启动子。
13.项目11或12的构建体在用于制造相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量的植物的方法中的用途。
14.用项目11或12的构建体转化的植物、植物部分或植物细胞。
15.用于生产相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量的转基因植物的方法,包括:
(i)在植物中引入和表达如项目1或2定义的PLATZ多肽之编码核酸;和
(ii)在促进植物生长和发育的条件下培养植物细胞。
16.相对于对照植物,具有增加的产量,特别是增加的生物量和/或增加的种子产量的转基因植物或者源自所述转基因植物的转基因植物细胞,获得自如项目1或2定义的PLATZ多肽之编码核酸受调控的表达。
17.项目10、14或16的转基因植物,或源自它的转基因植物细胞,其中所述植物是作物植物或单子叶或谷物,例如稻、玉米、小麦、大麦、粟、黑麦、黑小麦、高粱、野小麦、德国小麦、黑麦属、一粒系小麦、teff、蜀黍和燕麦。
18.项目17的植物的可收获部分,其中所述可收获部分优选是苗生物量和/或种子。
19.来自项目17的植物和/或项目18的植物的可收获部分的产物。
20.PLATZ多肽之编码核酸在相对于对照植物,在植物中增加产量,特别是增加种子产量和/或苗生物量的用途。
21.分离的核酸分子,选自:
(i)由SEQ ID NO:354表示的核酸;
(ii)由SEQ ID NO:354表示的核酸的互补序列;
(iii)编码PLATZ多肽的核酸,所述PLATZ多肽以递增的优先顺序与由SEQ ID NO:355表示的氨基酸序列具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更多的序列同一性,并且以递增的优先顺序与在上文所定义的基序的一个或多个具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更多的序列同一性。
22.分离的多肽,选自:
(i)由SEQ ID NO:355表示的氨基酸序列;
(ii)氨基酸序列,所述氨基酸序列以递增的优先顺序与由SEQ ID NO:355表示的氨基酸序列具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更多的序列同一性,并且以递增的优先顺序与在上文所定义的基序的一个或多个具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更多的序列同一性。
(iii)上述(i)或(ii)项中给出的任一氨基酸序列的衍生物。
5.PLST样多肽
在另一方面,本发明的特征在于一个或多个以下项目:
1.用于在植物中相对于对照植物而言增强产量相关性状的方法,包括调节植物中编码PLST样多肽之核酸的表达,其中所述PLST样多肽至少包含PLST共有结构域(PFam登录号PF02298)。
2.项目1的方法,其中PLST样多肽的PLST结构域以递增的优先顺序与位于SEQ ID NO 411的氨基酸38至124之间的序列具有至少49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或者更多的序列同一性。
3.项目1或2的任一项的方法,其中所述PLST样多肽可以包含序列基序,所述序列基序以递增的优先顺序与任一以下基序:
(i)基序19:[DH]SV[LI]QV[TS]KE[DA][YF][DK]SCNT[SK][NSD]P(SEQ ID NO:530)
(ii)基序20:[FHY]YF[IT]SGV[PK][GD][HN]C(SEQ ID NO:531)
(iii)基序21:Y[NT][QK]WA[ESK][KS]NRF[KQ][IV]GD[ST][LI][VL]F[KL]YP(SEQ IDNO:532)
具有至少49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或者更多的序列同一性。
4.项目1至3的任一项的方法,其中所述PLST样多肽可以包含任意一个或多个序列基序,所述序列基序以递增的优先顺序与任一以下基序:
(i)基序22:[DN]GN[TS][LVK][FV][KN][LF][DT]R[SP]GP[FY]YF[IT]SG[VA][KP][GD][HN]CEK[GN][QE]K(SEQ ID NO:533)
(ii)基序23:[YL]N[QK]WA[EK][KS][NH]RF[KQ][IV]GD[ST]L[LV]F[LK]Y[PD](SEQID NO:534)
(iii)基序24:[KQ]DSV[LI]QVTKE[DA]YKSCNT[SK][DSN]PI(SEQ ID NO:535)
具有至少49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或者更多的序列同一性。
5.项目1至4的任一项的方法,其中所述PLST样多肽可以包含任意一个或多个序列基序,所述序列基序以递增的优先顺序与任一以下基序:
(i)基序25:DSVI[QV]VT[EKA][EQ]S[YF][KN][SK]CNL[KST]DPIL[YF][MS]N[ND]GN[ST][LV]FN[LI][TD][RS]PGL[FY]YF[TI]SG[VA][PS]GHC[EQ][KR](SEQ ID NO:536)
(ii)基序26:P[PT]SA[DN]P[DQ][VL]YTKW[AS][KS][NS][HN][RN]FK[IL]GD[ST][LI]LFLYP(SEQ ID NO:537)
(iii)基序27:XVS[CS]Y[QE][YF]KVG[DG]LD[AGS]W(SEQ ID NO:538)
具有至少49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或者更多的序列同一性。
6.项目1至5的任一项的方法,其中所述PLST样多肽可以包含任意一个或多个序列基序,所述序列基序以递增的优先顺序与任一以下基序:
(i)基序28:HN[FL]K[IL]GDSLLFLYPPSQDSVIQVTA[QE][SAN][YF][KN]SC[ND]L[KS]DPILYMN[DN]GNSLFN[IL]T(SEQ ID NO:539)
(ii)基序29:GDFYFTSG[AVE]PGHC[EQ]K[SK]QKLH[IV](SEQ ID NO:540)
(iii)基序30:VSCYQYKVGDLD[AS]WGIPTSA[NK](SEQ ID NO:541)
具有至少49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或者更多的序列同一性。
7.项目1至6的任一项的方法,其中PLST样多肽的同源物以递增的优先顺序与由表A5的任一多肽,优选地由SEQ ID NO:411表示的氨基酸具有至少25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的整体序列同一性。
8.项目1-7的任一项的方法,其中所述受调控的表达通过在植物中引入和表达如任一前述项目的PLST样多肽之编码核酸而实现。
9.项目1-8的任一项的方法,其中所述编码PLST样多肽之核酸编码表A5中列举的任一蛋白质,或者是此类核酸的一部分,或者是能够与此类核酸杂交的核酸。
10.项目1-9的任一项的方法,其中所述核酸序列编码表A5给出的任一蛋白质的直向同源物或旁系同源物。
11.任一前述项目的方法,其中所述增强的产量相关性状包括相对于对照植物增加的产量,优选增加的种子产量。
12.项目1-11的任一项的方法,其中所述增强的产量相关性状是在非胁迫条件下获得的。
13.项目1-11的任一项的方法,其中所述增强的产量相关性状是在干旱胁迫、盐胁迫或氮缺乏条件下获得的。
14.项目8-10的任一项的方法,其中所述核酸与组成型启动子,优选GOS2启动子,最优选来自稻的GOS2启动子有效连接。
15.项目1-14的任一项的方法,其中所述PLST样多肽之编码核酸是植物来源的。
16.项目15的方法,其中所述PLST样多肽之编码核酸来自双子叶植物,进一步优选来自杨柳科,最优选核酸来自毛果杨。
17.通过项目1-16的任一项方法可获得的植物或其部分,包括种子,其中所述植物或其部分包含编码PLST样多肽的重组核酸。
18.构建体,包含:
(i)编码如项目1-7定义的PLST样多肽的核酸;
(ii)能够驱动(a)的核酸序列表达的一个或多个控制序列;和任选的
(iii)转录终止序列。
19.项目18的构建体,其中所述控制序列之一是组成型启动子,优选GOS2启动子,最优选来自稻的GOS2启动子。
20.项目18或19的构建体在用于制造相对于对照植物具有增加的产量,特别是增加的种子产量的植物的方法中的用途。
21.用项目18或19的构建体转化的植物、植物部分或植物细胞。
22.用于生产相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量的转基因植物的方法,包括:
(i)在植物中引入和表达如项目1-7定义的PLST样多肽之编码核酸;和
(ii)在促进植物生长和发育的条件下培养植物细胞。
23.相对于对照植物,具有增加的产量,特别是增加的生物量和/或增加的种子产量的转基因植物或者源自所述转基因植物的转基因植物细胞,获得自如项目1-7定义的PLST样多肽之编码核酸受调控的表达。
24.项目17、21或23的转基因植物,或源自它的转基因植物细胞,其中所述植物是作物植物或单子叶或谷物,例如稻、玉米、小麦、大麦、粟、黑麦、黑小麦、高粱、野小麦、德国小麦、黑麦属、一粒系小麦、teff、蜀黍和燕麦。
25.项目24的植物的可收获部分,其中所述可收获部分优选是种子。
26.来自项目24的植物和/或项目25的植物的可收获部分的产物。
27.PLST样多肽之编码核酸在相对于对照植物,在植物中增加产量,特别是增加种子产量的用途。
28.分离的核酸分子,选自:
(i)由SEQ ID NO:414;SEQ ID NO:426;SEQ ID NO:428;SEQ IDNO:434;SEQ ID NO:438表示的核酸;
(ii)由SEQ ID NO:414;SEQ ID NO:426;SEQ ID NO:428;SEQ IDNO:434;SEQ ID NO:438表示的核酸的互补序列;
(iii)编码由SEQ ID NO:415;SEQ ID NO:427;SEQ ID NO:429;SEQ ID NO:435;SEQ ID NO:439的任一表示的PLST样多肽的核酸,优选地,由于遗传密码的简并性,所述分离的核酸可以衍生自由SEQ ID NO:415;SEQ ID NO:427;SEQ ID NO:429;SEQ ID NO:435;SEQ ID NO:439的任一表示的多肽序列,并且另外优选地赋予相对于对照植物而言增强的产量相关性状;
(iv)核酸,所述核酸以递增的优先顺序与表A5的任一核酸序列具有至少50%,55%,60%,65%,70%,75%,80%,85%,90%,95%,96%,97%,98%,99%或更多的序列同一性,并且另外优选地赋予相对于对照植物而言增强的产量相关性状;
(v)核酸分子,所述核酸分子在严格杂交条件下与(i)至(iv)项的核酸分子杂交,并优选地赋予相对于对照植物而言增强的产量相关性状。
(vi)编码PLST样多肽的核酸,所述PLST样多肽以递增的优先顺序与由SEQ ID NO:415;SEQ ID NO:427;SEQ ID NO:429;SEQ ID NO:435;SEQ ID NO:439的任一表示的氨基酸序列和表A5中的任一其它氨基酸序列具有至少50%,55%,60%,65%,70%,75%,80%,85%,90%,95%,96%,97%,98%,99%或更多的序列同一性,并且优选地赋予相对于对照植物而言增强的产量相关性状。
29.根据本发明另外的实施方案,从而还提供了分离的多肽分子,选自:.
(i)由SEQ ID NO:415;SEQ ID NO:427;SEQ ID NO:429;SEQ IDNO:435;SEQ ID NO:439表示的氨基酸序列;
(ii)氨基酸序列,所述氨基酸序列以递增的优先顺序与SEQ ID NO:Y表示的氨基酸序列具有至少50%,55%,60%,65%,70%,75%,80%,85%,90%,95%,96%,97%,98%,99%或更多的序列同一性,以及以递增的优先顺序与SEQ ID NO:415;SEQ ID NO:427;SEQ ID NO:429;SEQ ID NO:435;SEQ ID NO:439具有至少50%,55%,60%,65%,70%,75%,80%,85%,90%,95%,96%,97%,98%,99%或更多的序列同一性。
(iii)上述(i)或(ii)项中给出的任一氨基酸序列的衍生物。
6.Glomalin多肽
在另一方面,本发明的特征在于一个或多个以下项目:
1.用于在植物中相对于对照植物而言增强产量相关性状的方法,包括调节植物中编码Glomalin多肽之核酸的表达,其中所述Glomalin多肽包含Cpn60_TCP1结构域。
2.项目1的方法,其中所述Glomalin多肽包含基序31至43(SEQ IDNO:596至SEQ ID NO:608)的一个或多个。
3.项目1或2的方法,其中所述受调控的表达通过在植物中引入和表达Glomalin多肽之编码核酸而实现。
4.项目1-3的任一项的方法,其中所述编码Glomalin多肽之核酸编码表A6中列举的任一蛋白质,或者是此类核酸的一部分,或者是能够与此类核酸杂交的核酸。
5.项目1-4的任一项的方法,其中所述核酸序列编码表A6给出的任一蛋白质的直向同源物或旁系同源物。
6.任一前述项目的方法,其中所述增强的产量相关性状包括相对于对照植物增加的产量,优选增加的种子产量。
7.项目1-6的任一项的方法,其中所述增强的产量相关性状是在非胁迫条件下获得的。
8.项目3-7的任一项的方法,其中所述核酸与根特异性启动子,优选RCc3启动子,最优选来自稻的RCc3启动子有效连接。
9.项目1-8的任一项的方法,其中所述Glomalin多肽之编码核酸是植物来源的,优选来自双子叶植物,进一步优选来自禾本科,更优选来自稻属,最优选来自稻。
10.通过项目1-9的任一项方法可获得的植物或其部分,包括种子,其中所述植物或其部分包含编码Glomalin多肽的重组核酸。
11.构建体,包含:
(i)编码如项目1或2定义的Glomalin多肽的核酸;
(ii)能够驱动(a)的核酸序列表达的一个或多个控制序列;和任选的
(iii)转录终止序列。
12.项目11的构建体,其中所述控制序列之一是组成型启动子,优选RCc3启动子,最优选来自稻的RCc3启动子。
13.项目11或12的构建体在用于制造相对于对照植物具有增加的产量,特别是增加的种子产量的植物的方法中的用途。
14.用项目11或12的构建体转化的植物、植物部分或植物细胞。
15.用于生产相对于对照植物具有增加的产量,特别是增加的种子产量的转基因植物的方法,包括:
(i)在植物中引入和表达如项目1或2定义的Glomalin多肽之编码核酸;和
(ii)在促进植物生长和发育的条件下培养植物细胞。
16.相对于对照植物,具有增加的产量,特别是增加的种子产量的转基因植物或者源自所述转基因植物的转基因植物细胞,获得自如项目1或2定义的Glomalin多肽之编码核酸受调控的表达。
17.项目10、14或16的转基因植物,或源自它的转基因植物细胞,其中所述植物是作物植物或单子叶或谷物,例如稻、玉米、小麦、大麦、粟、黑麦、黑小麦、高粱、野小麦、德国小麦、黑麦属、一粒系小麦、teff、蜀黍和燕麦。
18.项目17的植物的可收获部分,其中所述可收获部分优选是种子。
19.来自项目18的植物和/或项目18的植物的可收获部分的产物。
20.Glomalin多肽之编码核酸在相对于对照植物,在植物中增加产量,特别是增加种子产量的用途。
附图说明
现将参考以下附图描述本发明,其中:
图1表示不同簇的选择的eRF1蛋白质的系统发生树:显示了链形植物来源和非链形植物来源的蛋白质。SPT=链形植物,CHL=绿藻门(chlorophyta),STR=原生藻菌原生藻菌(Stramenopile),BAC=细菌,FUNGI=真菌,HUM=人类,PROT=原生动物。使用MAFFT(Katoh和Toh(2008)Briefings in Bioinformatics 9:286-298)进行比对。使用QuickTree(Howe等人(2002),Bioinformatics 18(11):1546-7),100次自引重复计算邻接树。使用Dendroscope(Huson等人(2007),BMCBioinformatics 8(1):460)绘制环形系统发生图。显示了主要分支的100次自引重复的置信度。用圆圈标出了主要分支的位置。
图2表示用于增加在稻GOS2启动子(pGOS2)控制下的eRF1编码核酸在稻中表达的二元载体。
图3表示SCAMP多肽的多重比对。
图4表示用于增加在稻GOS2启动子(pGOS2)控制下的SCAMP样编码核酸在稻中表达的二元载体。
图5显示用AlignX(来自Vector NTI 10.3,Invitrogen Corporation)多重序列比对实施的肌原纤蛋白多肽序列的多重比对。将保守的PAP肌原纤蛋白PF04755在共有序列下标记为X。将保守的羧基端结构域在共有序列下也标记为X。
图6显示使用在来自Vector NTI(Invitrogen)的AlignX程序中提供的邻接聚类算法构建的肌原纤蛋白多肽的系统发生树。
图7来自Ytterberg等人,2006(Plant Physiology,2006年3月,第140卷,第984-997页)显示质体球(PG)及其蛋白质组的可能构造(proposedorganization)(A)和功能作用(B)的图解。PG由单层脂质和隐蔽的不同亲水小分子如醌类和生育酚类组成。结构蛋白(肌原纤蛋白)和酶连接于或者嵌入单层中,但蛋白质缺少跨膜结构域(A)。PG功能整合(Integration)在质体代谢(B)中。
图8表示由MEME算法测定的3个保守结构域X、Y和Z的序列标识(sequence logos)。序列标识是氨基酸多重序列比对的图标形式,其由符号的堆栈(stack)组成,序列中的每一位置为一个堆栈。堆栈的总高度表示该位置处的序列保守性,而堆栈内符号的高度表示每一氨基酸或核酸在该位置处的相对频率。
图9表示用于增加在稻GOS2启动子(pGOS2)控制下的肌原纤蛋白编码核酸在稻中表达的二元载体。
图10表示SEQ ID NO:261的结构域结构,标出了保守基序10至18和PLATZ结构域(黑体斜体)。
图11表示使用用于慢比对(slow alignment)默认设置的ClustalW的多种PLATZ-A1-α多肽的多重比对。
图12显示PLATZ多肽的系统发生树,使用MAFFT(Katoh和Toh(2008)Briefings in Bioinformatics 9:286-298)进行比对。使用QuickTree(Howe等人(2002),Bioinformatics 18(11):1546-7),100次自引重复计算邻接树。使用Dendroscope(Huson等人(2007),BMC Bioinformatics 8(1):460)绘制环形系统发生图。显示了主要分支的100次自引重复后的置信度。用圆圈标出了主要分支的位置。在进化支PLATZ-A1-α中,SEQ ID NO:261表示为P.trichocarpa_583639。
图13表示用于增加在稻GOS2启动子(pGOS2)控制下的PLATZ编码核酸在稻中表达的二元载体。
图14表示SEQ ID NO 411,标出了PF 02298结构域和基序19至30.
图15表示针对不同簇的选择的PLST样蛋白质的系统发生树:P-class=质体蓝素样,NDL=结瘤素样,Z=其他,PLST=PLST群。使用MAFFT(Katoh和Toh(2008)Briefings in Bioinformatics 9:286-298)进行比对。使用QuickTree(Howe等人(2002),Bioinformatics 18(11):1546-7),100次自引重复计算邻接树。使用Dendroscope(Huson等人(2007),BMC Bioinformatics 8(1):460)绘制环形系统发生图。显示了主要分支的100次自引重复后的置信度。用圆圈标出了主要分支的位置。
图16表示用于增加在稻GOS2启动子(pGOS2)控制下的PLST样编码核酸在稻中表达的二元载体。
图17表示SEQ ID NO:546的结构域结构,标出了保守基序31至43,并以黑体显示了Cpn60_TCP1结构域。
图18表示多种Glomalin多肽的多重比对。星号表示多种蛋白质序列之间相同的氨基酸,冒号表示高度保守的氨基酸替换,和圆点表示较不保守的氨基酸替换;在其他位置上不存在序列保守性。当使用保守氨基酸时,这些比对可以用于定义另外的基序。
图19显示Glomalin多肽的系统发生树。来自杨树的序列XM_002297581表示外类群(outgroup)。其他序列表示Glomalin序列的簇。
图20表示用于增加在稻RCc3启动子(pRC3)控制下的Glomalin编码核酸在稻中表达的二元载体。
实施例
现将参考以下仅用于说明的实施例来描述本发明。以下实施例不旨在限定本发明的范围。
DNA操作:除非另有说明,根据(Sambrook(2001)Molecular Cloning:a laboratory manual,第三版,Cold Spring Harbor Laboratory Press,CSH,New York)或Ausubel等(1994),Current Protocols in MolecularBiology,Current Protocols第1卷和第2卷中所述标准方案进行重组DNA技术。用于植物分子工作的标准材料和方法描述于BIOS ScientificPublications Ltd(UK)和Blackwell Scientific Publications(UK)出版的由R.D.D Croy编著的Plant Molecular Biology Labfax(1993)中。
实施例1:鉴定与本发明方法中使用的核酸序列相关的序列。
使用数据库序列检索工具,如基本局部比对工具(BLAST)(Altschul等(1990)J.Mol.Biol.215:403-410;和Altschul等(1997)Nucleic Acids Res.25:3389-3402)在美国国家生物技术信息中心(NCBI)的Entrez核苷酸数据库中所维护的那些序列内鉴定到与eRF1序列相关的序列(全长cDNA、EST或基因组)。该程序用来通过核酸序列或多肽序列与序列数据库比较并通过计算匹配的统计学显著性而找到序列间具有局部相似性的区域。例如,在本发明中使用的核酸所编码的多肽用于TBLASTN算法,采用默认设置并关闭忽略低复杂度序列的过滤。分析的结果通过配对性比较显示,并根据概率评分(E-值)排序,其中该评分反映特定比对结果因偶然而发生的概率(E-值越低,命中的显著性越高)。除了E-值外,比较还通过同一性百分数进行记分。同一性百分数指两个所比较核酸(或多肽)序列之间在特定长度范围内的相同核苷酸(或氨基酸)数目。在一些例子中,可以调整缺省参数以修改检索的严格性。例如可以提高E值以显示较低严格性的匹配。这样,可以鉴定短的近似精确的匹配。
1.1 eRF1多肽
表A1提供了与SEQ ID NO:1和SEQ ID NO:2相关的核酸和多肽序列的列表。
表A1:eRF1核酸和多肽的实例:
Figure BDA0000136403840001421
Figure BDA0000136403840001431
在一些情况下,相关序列已经由研究协会例如基因组研究协会(TheInstitute for Genomic Research,TIGR;以TA开头)暂时组装并对公众公开。还可以使用真核基因直向同源物(Eukaryotic Gene Orthologs,EGO)数据库鉴定这类相关序列,用目的核酸或多肽序列进行关键词搜索或通过使用BLAST算法进行。在其他一些情况下,针对具体的生物已经创建了具体的核酸序列数据库,例如由联合基因组协会(Joint Genome Institute)创建的那些。另外,使用专利数据库允许鉴定新的核酸和多肽序列。
1.2 SCAMP样多肽
表A2提供了与SEQ ID NO:88和SEQ ID NO:89相关的核酸和多肽序列的列表。
表A2:SCAMP样核酸和多肽的实例:
Figure BDA0000136403840001441
在一些情况下,相关序列已经由研究协会例如基因组研究协会(TIGR;以TA开头)暂时组装并对公众公开。还可以使用真核基因直向同源物(EGO)数据库鉴定这类相关序列,用目的核酸或多肽序列进行关键词搜索或通过使用BLAST算法进行。在其他一些情况下,针对具体的生物已经创建了具体的核酸序列数据库,例如由联合基因组协会创建的那些。另外,使用专利数据库允许鉴定新的核酸和多肽序列。
1.3.肌原纤蛋白多肽
表A3提供了与SEQ ID NO:204和SEQ ID NO:205相关的核酸和多肽序列的列表。
表A3:肌原纤蛋白核酸和多肽的实例:
Figure BDA0000136403840001451
可以将研究协会例如基因组研究协会(TIGR;以TA开头)、真核基因直向同源物(EGO)数据库和联合基因组协会的数据库用于鉴定另外的肌原纤蛋白序列,用目的核酸或多肽序列进行关键词搜索或通过使用BLAST算法进行。
1.4.PLATZ多肽
表A4提供了与SEQ ID NO:260和SEQ ID NO:261相关的核酸和多肽序列的列表。
表A4:PLATZ核酸和多肽的实例:
Figure BDA0000136403840001461
Figure BDA0000136403840001471
Figure BDA0000136403840001481
在一些情况下,相关序列已经由研究协会例如基因组研究协会(TIGR;以TA开头)暂时组装并对公众公开。还可以使用真核基因直向同源物(EGO)数据库鉴定这类相关序列,用目的核酸或多肽序列进行关键词搜索或通过使用BLAST算法进行。在其他一些情况下,针对具体的生物已经创建了具体的核酸序列数据库,例如由联合基因组协会(Joint GenomeInstitute)创建的那些。另外,使用专利数据库允许鉴定新的核酸和多肽序列。
1.5.PLST样多肽
表A5提供了与SEQ ID NO:410和SEQ ID NO:411相关的核酸和多肽序列的列表。
表A5:PLST样核酸和多肽的实例:
Figure BDA0000136403840001482
Figure BDA0000136403840001491
在一些情况下,相关序列已经由研究协会例如基因组研究协会(TIGR;以TA开头)暂时组装并对公众公开。还可以使用真核基因直向同源物(EGO)数据库鉴定这类相关序列,用目的核酸或多肽序列进行关键词搜索或通过使用BLAST算法进行。在其他一些情况下,针对具体的生物已经创建了具体的核酸序列数据库,例如由联合基因组协会(Joint GenomeInstitute)创建的那些。另外,使用专利数据库允许鉴定新的核酸和多肽序列。
1.6.Glomalin多肽
表A6提供了与SEQ ID NO:545和SEQ ID NO:546相关的核酸和多肽序列的列表。
表A6:Glomalin核酸和多肽的实例:
Figure BDA0000136403840001501
在一些情况下,相关序列已经由研究协会例如基因组研究协会(TIGR;以TA开头)暂时组装并对公众公开。还可以使用真核基因直向同源物(EGO)数据库鉴定这类相关序列,用目的核酸或多肽序列进行关键词搜索或通过使用BLAST算法进行。在其他一些情况下,针对具体的生物已经创建了具体的核酸序列数据库,例如由联合基因组协会(Joint GenomeInstitute)创建的那些。另外,使用专利数据库允许鉴定新的核酸和多肽序列。
实施例2:与本发明方法中使用的多肽序列相关的序列比对
2.1 eRF1多肽
使用逐步比对的ClustalW 2.0算法(Thompson等人(1997)NucleicAcids Res 25:4876-4882;Chenna等(2003).Nucleic Acids Res31:3497-3500)实施多肽序列的比对,采用标准设定(慢比对,相似矩阵:Gonnet或Blosum 62(如果比对多肽),空位开放罚分10,空位延伸罚分0.2。
使用在来自Vector NTI(Invitrogen)的AlignX程序中提供的邻接聚类算法构建eRF1多肽的系统发生树(图1)。
2.2.SCAMP样多肽
使用逐步比对的ClustalW 1.8算法(Thompson等人(1997)NucleicAcids Res 25:4876-4882;Chenna等(2003).Nucleic Acids Res31:3497-3500)实施多肽序列的比对,采用标准设定:空位开放罚分10,空位延伸罚分0.2。进行少量人工编辑以进一步优化比对。SCAMP样多肽比对在图3中。
2.3.肌原纤蛋白多肽
采用标准设定,使用来自Vector NTI(Invitrogen)的AlignX程序实施多肽序列的比对。进行少量人工编辑以进一步优化比对。肌原纤蛋白多肽比对在图5中。
使用在来自Vector NTI(Invitrogen)的AlignX程序中提供的邻接聚类算法构建肌原纤蛋白多肽的系统发生树(图6)。
2.4.PLATZ多肽
使用逐步比对的ClustalW 2.0算法(Thompson等人(1997)NucleicAcids Res 25:4876-4882;Chenna等(2003).Nucleic Acids Res31:3497-3500)实施多肽序列的比对,采用标准设定(慢比对,相似矩阵:Gonnet,空位开放罚分10,空位延伸罚分0.2。进行少量人工编辑以进一步优化比对。PLATZ多肽比对在图11中。
该比对可以用于测定约5至10个氨基酸长度的保守特征序列。优选地使用蛋白质的保守区,由星号(相同残基)、冒号(高保守替换)和圆点(保守替换)指出该保守区。
使用MAFFT(Katoh和Toh(2008)Briefings in Bioinformatics 9:286-298)构建PLATZ多肽的系统发生树(图12)。使用QuickTree(Howe等人(2002),Bioinformatics 18(11):1546-7),100次自引重复计算邻接树。使用Dendroscope(Huson等人(2007),BMC Bioinformatics 8(1):460)绘制环形系统发生图。显示了主要分支的100次自引重复后的置信度。
2.5.PLST样多肽
使用逐步比对的ClustalW 2.0算法(Thompson等人(1997)NucleicAcids Res 25:4876-4882;Chenna等(2003).Nucleic Acids Res31:3497-3500)实施多肽序列的比对,采用标准设定(慢比对,相似矩阵:Gonnet或Blosum 62(如果比对多肽),空位开放罚分10,空位延伸罚分0.2。
用在来自Vector NTI(Invitrogen)的AlignX程序中提供的邻接聚类算法构建PLST样多肽的系统发生树(图15)。
2.6.Glomalin多肽
使用逐步比对的ClustalW 2.0算法(Thompson等人(1997)NucleicAcids Res 25:4876-4882;Chenna等(2003).Nucleic Acids Res31:3497-3500)实施多肽序列的比对,采用标准设定(慢比对,相似矩阵:Gonnet,空位开放罚分10,空位延伸罚分0.2。进行少量人工编辑以进一步优化比对。Glomalin多肽比对在图18中。
用在来自Vector NTI(Invitrogen)的AlignX程序中提供的邻接聚类算法构建Glomalin多肽的系统发生树(图19)。
实施例3:计算在用于实施本发明方法的多肽序列之间的全局百分比同一性
3.1.eRF1多肽
使用本领域可获得的方法之一MatGAT(矩阵全局比对工具)软件(BMC Bioinformatics.20034:29.MatGAT:an application that generatessimilarity/identity matrices using protein or DNA sequences.CampanellaJJ,Bitincka L,Smalley J;软件由Ledion Bitincka提供)确定用于实施本发明方法的全长多肽序列之间全局相似性百分数和同一性百分数。MatGAT软件为DNA序列或蛋白质序列产生相似性/同一性矩阵,无需数据的预比对。该程序使用Myers和Miller全局比对算法(空位开放罚分12和空位延伸罚分2)执行一系列逐对比对,使用例如Blosum 62(对于多肽)计算相似性和同一性并且随后将结果置于距离矩阵中。序列相似性在分界线的下半部分中显示,序列同一性在对角分界线的上半部分中显示。
比较中所用的参数是:
评分矩阵:Blosum62
第一空位:12
延伸空位:2
多肽序列全长上的全局相似性和同一性软件分析结果在表B1中显示。同一性百分数以黑体在对角线之上给出并且相似性百分数在对角线之下给出(正常字体)。
在实施本发明方法中有用的eRF1多肽序列之间的百分比同一性可低至与SEQ ID NO:2相比为49%的氨基酸同一性。
Figure BDA0000136403840001541
3.2.SCAMP样多肽
使用本领域可获得的方法之一MatGAT(矩阵全局比对工具)软件(BMC Bioinformatics.2003 4:29.MatGAT:an application thatgenerates similarity/identity matrices using protein or DNA sequences.Campanella JJ,Bitincka L,Smalley J;软件由Ledion Bitincka提供)确定用于实施本发明方法的全长多肽序列之间全局相似性百分数和同一性百分数。MatGAT软件为DNA序列或蛋白质序列产生相似性/同一性矩阵,无需数据的预比对。该程序使用Myers和Miller全局比对算法(空位开放罚分12和空位延伸罚分2)执行一系列逐对比对,使用例如Blosum 62(对于多肽)计算相似性和同一性并且随后将结果置于距离矩阵中。序列相似性在分界线的下半部分中显示,序列同一性在对角分界线的上半部分中显示。
比较中通常所用的参数是:
评分矩阵:Blosum62
第一空位:12
延伸空位:2
3.3.肌原纤蛋白多肽
使用MatGAT(矩阵全局比对工具)软件(BMC Bioinformatics.20034:29.MatGAT:an application that generates similarity/identitymatrices using protein or DNA sequences.Campanella JJ,Bitincka L,Smalley J;软件由Ledion Bitincka提供)确定用于实施本发明方法的全长多肽序列之间全局相似性百分数和同一性百分数。MatGAT软件为DNA序列或蛋白质序列产生相似性/同一性矩阵,无需数据的预比对。该程序使用Myers和Miller全局比对算法(空位开放罚分12和空位延伸罚分2)执行一系列逐对比对,使用例如Blosum 62(对于多肽)计算相似性和同一性并且随后将结果置于距离矩阵中。序列相似性在分界线的下半部分中显示,序列同一性在对角分界线的上半部分中显示。
比较中所用的参数是:
评分矩阵:Blosum62
第一空位:12
延伸空位:2
多肽序列全长上的全局相似性和同一性软件分析结果在表B2中显示。同一性百分数在对角线之上给出并且相似性百分数在对角线之下给出。
Figure BDA0000136403840001581
还可以制作关于特定结构域例如在PAP肌原纤蛋白结构域上或者在羧基端结构域上的局部比对,或者在特定结构域之间的同一性/相似性百分数的数据的MATGAT表格。
3.4.PLATZ多肽
使用本领域可获得的方法之一MatGAT(矩阵全局比对工具)软件(BMC Bioinformatics.20034:29.MatGAT:an application thatgenerates similarity/identity matrices using protein or DNA sequences.Campanella JJ,Bitincka L,Smalley J;软件由Ledion Bitincka提供)确定用于实施本发明方法的全长多肽序列之间全局相似性百分数和同一性百分数。MatGAT软件为DNA序列或蛋白质序列产生相似性/同一性矩阵,无需数据的预比对。该程序使用Myers和Miller全局比对算法(空位开放罚分12和空位延伸罚分2)执行一系列逐对比对,使用例如Blosum 62(对于多肽)计算相似性和同一性并且随后将结果置于距离矩阵中。序列相似性在分界线的下半部分中显示,序列同一性在对角分界线的上半部分中显示。
比较中所用的参数是:
评分矩阵:Blosum62
第一空位:12
延伸空位:2
多肽序列全长上的全局相似性和同一性软件分析结果在表B3中显示。同一性百分数以黑体在对角线之上给出并且相似性百分数在对角线之下给出(正常字体)。
在实施本发明方法中有用的PLATZ-A1-α多肽序列之间的百分比同一性可低至与SEQ ID NO:261相比为65%的氨基酸同一性。
Figure BDA0000136403840001601
3.5.PLST样多肽
使用本领域可获得的方法之一MatGAT(矩阵全局比对工具)软件(BMC Bioinformatics.20034:29.MatGAT:an application thatgenerates similarity/identity matrices using protein or DNA sequences.Campanella JJ,Bitincka L,Smalley J;软件由Ledion Bitincka提供)确定用于实施本发明方法的全长多肽序列之间全局相似性百分数和同一性百分数。MatGAT软件为DNA序列或蛋白质序列产生相似性/同一性矩阵,无需数据的预比对。该程序使用Myers和Miller全局比对算法(空位开放罚分12和空位延伸罚分2)执行一系列逐对比对,使用例如Blosum 62(对于多肽)计算相似性和同一性并且随后将结果置于距离矩阵中。序列相似性在分界线的下半部分中显示,序列同一性在对角分界线的上半部分中显示。
比较中所用的参数是:
评分矩阵:Blosum62
第一空位:12
延伸空位:2
多肽序列全长上的全局相似性和同一性软件分析结果在表B4中显示。同一性百分数以黑体在对角线之上给出并且相似性百分数在对角线之下给出(正常字体)。
在实施本发明方法中有用的PLST样多肽序列之间的百分比同一性可低至与SEQ ID NO:411相比为49%的氨基酸同一性。
Figure BDA0000136403840001621
3.6.Glomalin多肽
使用本领域可获得的方法之一MatGAT(矩阵全局比对工具)软件(BMC Bioinformatics.2003 4:29.MatGAT:an application thatgenerates similarity/identity matrices using protein or DNA sequences.Campanella JJ,Bitincka L,Smalley J;软件由Ledion Bitincka提供)确定用于实施本发明方法的全长多肽序列之间全局相似性百分数和同一性百分数。MatGAT软件为DNA序列或蛋白质序列产生相似性/同一性矩阵,无需数据的预比对。该程序使用Myers和Miller全局比对算法(空位开放罚分12和空位延伸罚分2)执行一系列逐对比对,使用例如Blosum 62(对于多肽)计算相似性和同一性并且随后将结果置于距离矩阵中。序列相似性在分界线的下半部分中显示,序列同一性在对角分界线的上半部分中显示。
比较中所用的参数是:
评分矩阵:Blosum62;第一空位:12;延伸空位:2
多肽序列全长上的全局相似性和同一性软件分析结果在表B中显示。同一性百分数以黑体在对角线之上给出并且相似性百分数在对角线之下给出(正常字体)。
在实施本发明方法中有用的Glomalin多肽序列之间的序列同一性(以%表示)与SEQ ID NO:546相比一般高于50%。
Figure BDA0000136403840001641
Figure BDA0000136403840001651
Figure BDA0000136403840001661
实施例4:鉴定用于实施本发明方法的多肽序列中包含的结构域
4.1.eRF1多肽
蛋白质家族、结构域和位点集成资源(Integrated Resouce ofProtein Families,domain and Site,InterPro)数据库是基于文本和序列进行检索的通常所用特征序列数据库的集成界面。InterPro数据库组合了这些数据库,所述的数据库使用不同方法学和不同程度的有关已充分表征蛋白质的生物学信息以得到蛋白质特征序列。合作数据库包括SWISS-PROT、PROSITE、TrEMBL、PRINTS、ProDom和Pfam、Smart和TIGRFAMs。Pfam是覆盖许多常见蛋白质结构域和家族的,多重序列比对和隐藏的马尔可夫模型(hidden Markov models)的大集合。Pfam由大不列颠联合王国的Sanger研究所的服务器所维护。Interpro由大不列颠联合王国的欧洲生物信息研究所维护。
如SEQ ID NO:2所表示的多肽序列的InterPro扫描结果在表C1中示出。
表C1:SEQ ID NO:2所示多肽序列的InterPro扫描结果(主要登录号)。
Figure BDA0000136403840001671
Figure BDA0000136403840001681
4.2.SCAMP样多肽
Pfam是覆盖许多常见蛋白质结构域和家族的,多重序列比对和隐藏的马尔可夫模型的大集合。Pfam由大不列颠联合王国的Sanger研究所的服务器上维护。
如SEQ ID NO:89所表示的多肽序列的保守HMM Pfam结构域的Pfam扫描结果在表C2中示出。
表C2:SEQ ID NO:89所示多肽序列的InterPro扫描结果(主要登录号)
Figure BDA0000136403840001682
4.3.肌原纤蛋白多肽
蛋白质家族、结构域和位点集成资源(Integrated Resouce ofProtein Families,domain and Site,InterPro)数据库是基于文本和序列进行检索的通常所用特征序列数据库的集成界面。InterPro数据库组合了这些数据库,所述的数据库使用不同方法学和不同程度的有关已充分表征蛋白质的生物学信息以得到蛋白质特征序列。合作数据库包括SWISS-PROT、PROSITE、TrEMBL、PRINTS、ProDom和Pfam、Smart和TIGRFAMs。Pfam是覆盖许多常见蛋白质结构域和家族的,多重序列比对和隐藏的马尔可夫模型(hidden Markov models)的大集合。Pfam由大不列颠联合王国的Sanger研究所的服务器上维护。Interpro由大不列颠联合王国的欧洲生物信息研究所维护。
如SEQ ID NO:205所表示的多肽序列的InterPro扫描结果在表C3中示出。
表C3:SEQ ID NO:205所示多肽序列的InterPro扫描结果(主要登录号)
Figure BDA0000136403840001691
4.4.PLATZ多肽
蛋白质家族、结构域和位点集成资源(Integrated Resouce ofProtein Families,domain and Site,InterPro)数据库是基于文本和序列进行检索的通常所用特征序列数据库的集成界面。InterPro数据库组合了这些数据库,所述的数据库使用不同方法学和不同程度的有关已充分表征蛋白质的生物学信息以得到蛋白质特征序列。合作数据库包括SWISS-PROT、PROSITE、TrEMBL、PRINTS、ProDom和Pfam、Smart和TIGRFAMs。Pfam是覆盖许多常见蛋白质结构域和家族的,多重序列比对和隐藏的马尔可夫模型(hidden Markov models)的大集合。Pfam由大不列颠联合王国的Sanger研究所的服务器上维护。Interpro由大不列颠联合王国的欧洲生物信息研究所维护。
如SEQ ID NO:261所表示的多肽序列的InterPro扫描结果在表C4中示出。
表C4:SEQ ID NO:261所示多肽序列的InterPro扫描结果(主要登录号)
Figure BDA0000136403840001692
4.5.PLST样多肽
蛋白质家族、结构域和位点集成资源(Integrated Resouce ofProtein Families,domain and Site,InterPro)数据库是基于文本和序列进行检索的通常所用特征序列数据库的集成界面。InterPro数据库组合了这些数据库,所述的数据库使用不同方法学和不同程度的有关已充分表征蛋白质的生物学信息以得到蛋白质特征序列。合作数据库包括SWISS-PROT、PROSITE、TrEMBL、PRINTS、ProDom和Pfam、Smart和TIGRFAMs。Pfam是覆盖许多常见蛋白质结构域和家族的,多重序列比对和隐藏的马尔可夫模型(hidden Markov models)的大集合。Pfam由大不列颠联合王国的Sanger研究所的服务器上维护。Interpro由大不列颠联合王国的欧洲生物信息研究所维护。
如SEQ ID NO:411所表示的多肽序列的InterPro扫描结果在表C5中示出。
表C5:SEQ ID NO:411所示多肽序列的InterPro扫描结果(主要登录号)
Figure BDA0000136403840001701
4.6.Glomalin多肽
蛋白质家族、结构域和位点集成资源(Integrated Resouce ofProtein Families,domain and Site,InterPro)数据库是基于文本和序列进行检索的通常所用特征序列数据库的集成界面。InterPro数据库组合了这些数据库,所述的数据库使用不同方法学和不同程度的有关已充分表征蛋白质的生物学信息以得到蛋白质特征序列。合作数据库包括SWISS-PROT、PROSITE、TrEMBL、PRINTS、ProDom和Pfam、Smart和TIGRFAMs。Pfam是覆盖许多常见蛋白质结构域和家族的,多重序列比对和隐藏的马尔可夫模型(hidden Markov models)的大集合。Pfam由大不列颠联合王国的Sanger研究所的服务器上维护。Interpro由大不列颠联合王国的欧洲生物信息研究所维护。
如SEQ ID NO:546所表示的多肽序列的InterPro扫描结果在表C6中示出。
表C6:SEQ ID NO:546所示多肽序列的InterPro扫描结果(主要登录号)。
Figure BDA0000136403840001711
Figure BDA0000136403840001712
此外,SEQ ID NO:546具有3个N-糖基化位点(Prosite PS00001):110-NATN-113,113-NDTA-116和432-NATK-435。
实施例5:用于实施本发明方法的多肽序列的拓扑学预测
5.1.eRF1多肽
TargetP 1.1预测真核蛋白质的亚细胞定位。位置分配是基于经预测存在的任何N端前序列:叶绿体转运肽(cTP)、线粒体靶向肽(mTP)或分泌途径信号肽(SP)。最终预测所依据的评分并不是真正的概率,并且它们未必加起来等于一。然而,具有最高评分的位置根据TargetP是最有可能的,并且评分之间的关系(可靠性类别)可以是预测的肯定性的一个指标。可靠性类别(RC)范围从1至5,其中1表示最强预测。TargetP在丹麦技术大学(Technical University of Denmark)的服务器上维护。
对于预测含有N端前序列的序列,也可以预测潜在的切割位点。
选择了众多参数,如生物群(非植物或植物)、临界设置(cutoff set)(无、临界的预定义设置或临界的用户指定设置)和对切割位点预测的计算(是或否)。
众多其它算法可以用来执行此类分析,包括:
·在丹麦技术大学服务器上维护的ChloroP 1.1;
·在澳大利亚布里斯班昆士兰大学分子生物科学研究所(Institute forMolecular Bioscience,University of Queensland,Brisbane,Australia)的服务器上维护的蛋白质Prowler亚细胞定位预测程序(Protein ProwlerSubcellular Localisation Predictor)第1.2版;
·在加拿大阿尔伯塔省埃德蒙顿市阿尔伯塔大学(University ofAlberta,Edmonton,Alberta,Canada)的服务器上维护的PENCEProteome Analyst PA-GOSUB 2.5;
·在丹麦技术大学服务器上维护的TMHMM;
·PSORT(URL:psort.org)。
·PLOC(Park和Kanehisa,Bioinformatics,19,1656-1663,2003)。
5.2.SCAMP样多肽
TargetP 1.1预测真核蛋白质的亚细胞定位。位置分配是基于经预测存在的任何N端前序列:叶绿体转运肽(cTP)、线粒体靶向肽(mTP)或分泌途径信号肽(SP)。最终预测所依据的评分并不是真正的概率,并且它们未必加起来等于一。然而,具有最高评分的位置根据TargetP是最有可能的,并且评分之间的关系(可靠性类别)可以是预测的肯定性的一个指标。可靠性类别(RC)范围从1至5,其中1表示最强预测。TargetP在丹麦技术大学的服务器上维护。
对于预测含有N端前序列的序列,也可以预测潜在的切割位点。
众多其它算法可以用来执行此类分析,包括:
·在丹麦技术大学服务器上维护的ChloroP 1.1;
·在澳大利亚布里斯班昆士兰大学分子生物科学研究所的服务器上维护的蛋白质Prowler亚细胞定位预测程序第1.2版;
·在加拿大阿尔伯塔省埃德蒙顿市阿尔伯塔大学的服务器上维护的PENCE Proteome Analyst PA-GOSUB 2.5;
·在丹麦技术大学服务器上维护的TMHMM;
·PSORT(URL:psort.org)。
·PLOC(Park和Kanehisa,Bioinformatics,19,1656-1663,2003)。
5.3.肌原纤蛋白多肽
TargetP 1.1预测真核蛋白质的亚细胞定位。位置分配是基于经预测存在的任何N端前序列:叶绿体转运肽(cTP)、线粒体靶向肽(mTP)或分泌途径信号肽(SP)。最终预测所依据的评分并不是真正的概率,并且它们未必加起来等于一。然而,具有最高评分的位置根据TargetP是最有可能的,并且评分之间的关系(可靠性类别)可以是预测的肯定性的一个指标。可靠性类别(RC)范围从1至5,其中1表示最强预测。TargetP在丹麦技术大学的服务器上维护。
对于预测含有N端前序列的序列,也可以预测潜在的切割位点。选择了众多参数,如生物群(非植物或植物)、临界设置(cutoff set)(无、临界的预定义设置或临界的用户指定设置)和对切割位点预测的计算(是或否)。
众多其它算法可以用来执行此类分析,包括:
·在丹麦技术大学服务器上维护的ChloroP 1.1;
·在澳大利亚布里斯班昆士兰大学分子生物科学研究所的服务器上维护的蛋白质Prowler亚细胞定位预测程序第1.2版;
·在加拿大阿尔伯塔省埃德蒙顿市阿尔伯塔大学的服务器上维护的PENCE Proteome Analyst PA-GOSUB 2.5;
·在丹麦技术大学服务器上维护的TMHMM;
·PSORT(URL:psort.org)。
·PLOC(Park和Kanehisa,Bioinformatics,19,1656-1663,2003)。
5.4.PLATZ多肽
TargetP 1.1预测真核蛋白质的亚细胞定位。位置分配是基于经预测存在的任何N端前序列:叶绿体转运肽(cTP)、线粒体靶向肽(mTP)或分泌途径信号肽(SP)。最终预测所依据的评分并不是真正的概率,并且它们未必加起来等于一。然而,具有最高评分的位置根据TargetP是最有可能的,并且评分之间的关系(可靠性类别)可以是预测的肯定性的一个指标。可靠性类别(RC)范围从1至5,其中1表示最强预测。TargetP在丹麦技术大学的服务器上维护。
对于预测含有N端前序列的序列,也可以预测潜在的切割位点。
选择了众多参数,如生物群(非植物或植物)、临界设置(cutoff set)(无、临界的预定义设置或临界的用户指定设置)和对切割位点预测的计算(是或否)。
如SEQ ID NO:261所表示的多肽序列的TargetP 1.1分析的结果在表D1中显示。已经选择“植物”生物群,未定义临界值并且需要转运肽的预测长度。SEQ ID NO:261所示多肽序列的亚细胞定位预测可以是在细胞质或者细胞核,没有预测到转运肽。
表D1:SEQ ID NO:261所示多肽序列的TargetP 1.1分析。缩写:Len,长度;cTP,叶绿体转运肽;mTP,线粒体转运肽,SP,分泌途径信号肽,其他,其他亚细胞靶向,Loc,预测的定位;RC,可靠性类别;TPlen,预测的转运肽长度。
Figure BDA0000136403840001751
众多其它算法可以用来执行此类分析,包括:
·在丹麦技术大学服务器上维护的ChloroP 1.1;
·在澳大利亚布里斯班昆士兰大学分子生物科学研究所的服务器上维护的蛋白质Prowler亚细胞定位预测程序第1.2版;
·在加拿大阿尔伯塔省埃德蒙顿市阿尔伯塔大学的服务器上维护的PENCE Proteome Analyst PA-GOSUB 2.5;
·在丹麦技术大学服务器上维护的TMHMM;
·PSORT(URL:psort.org)。
·PLOC(Park和Kanehisa,Bioinformatics,19,1656-1663,2003)。
5.5.PLST样多肽
TargetP 1.1预测真核蛋白质的亚细胞定位。位置分配是基于经预测存在的任何N端前序列:叶绿体转运肽(cTP)、线粒体靶向肽(mTP)或分泌途径信号肽(SP)。最终预测所依据的评分并不是真正的概率,并且它们未必加起来等于一。然而,具有最高评分的位置根据TargetP是最有可能的,并且评分之间的关系(可靠性类别)可以是预测的肯定性的一个指标。可靠性类别(RC)范围从1至5,其中1表示最强预测。TargetP在丹麦技术大学的服务器上维护。
对于预测含有N端前序列的序列,也可以预测潜在的切割位点。
TargetP 1.1预测结果
查询序列数:1
包括了切割位点预测。
使用PLANT网络(PLANT network)。
Figure BDA0000136403840001752
选择了众多参数,如生物群(非植物或植物)、临界设置(cutoff set)(无、临界的预定义设置或临界的用户指定设置)和对切割位点预测的计算(是或否)。
众多其它算法可以用来执行此类分析,包括:
·在丹麦技术大学服务器上维护的ChloroP 1.1;
·在澳大利亚布里斯班昆士兰大学分子生物科学研究所的服务器上维护的蛋白质Prowler亚细胞定位预测程序第1.2版;
·在加拿大阿尔伯塔省埃德蒙顿市阿尔伯塔大学的服务器上维护的PENCE Proteome Analyst PA-GOSUB 2.5;
·在丹麦技术大学服务器上维护的TMHMM;
·PSORT(URL:psort.org)。
·PLOC(Park和Kanehisa,Bioinformatics,19,1656-1663,2003)。
5.6.Glomalin多肽
TargetP 1.1预测真核蛋白质的亚细胞定位。位置分配是基于经预测存在的任何N端前序列:叶绿体转运肽(cTP)、线粒体靶向肽(mTP)或分泌途径信号肽(SP)。最终预测所依据的评分并不是真正的概率,并且它们未必加起来等于一。然而,具有最高评分的位置根据TargetP是最有可能的,并且评分之间的关系(可靠性类别)可以是预测的肯定性的一个指标。可靠性类别(RC)范围从1至5,其中1表示最强预测。TargetP在丹麦技术大学的服务器上维护。
对于预测含有N端前序列的序列,也可以预测潜在的切割位点。
选择了众多参数,如生物群(非植物或植物)、临界设置(cutoff set)(无、临界的预定义设置或临界的用户指定设置)和对切割位点预测的计算(是或否)。
如SEQ ID NO:546所表示的多肽序列的TargetP 1.1分析的结果在表D2中显示。已经选择“植物”生物群,未定义临界值并且需要转运肽的预测长度。SEQ ID NO:546所示多肽序列的亚细胞定位最可能是在线粒体(其与来自PSORT的结果一致),但也可能在叶绿体。
表D2:SEQ ID NO:546所示多肽序列的TargetP 1.1分析。缩写:Len,长度;cTP,叶绿体转运肽;mTP,线粒体转运肽,SP,分泌途径信号肽,其他,其他亚细胞靶向,Loc,预测的定位;RC,可靠性类别;TPlen,预测的转运肽长度。
Figure BDA0000136403840001771
众多其它算法可以用来执行此类分析,包括:
·在丹麦技术大学服务器上维护的ChloroP 1.1;
·在澳大利亚布里斯班昆士兰大学分子生物科学研究所的服务器上维护的蛋白质Prowler亚细胞定位预测程序第1.2版;
·在加拿大阿尔伯塔省埃德蒙顿市阿尔伯塔大学的服务器上维护的PENCE Proteome Analyst PA-GOSUB 2.5;
·在丹麦技术大学服务器上维护的TMHMM;
·PSORT(URL:psort.org)。
·PLOC(Park和Kanehisa,Bioinformatics,19,1656-1663,2003)。
实施例6:与用于实施本发明方法的多肽序列相关的测定
6.1.PLATZ多肽
PLATZ蛋白质结合DNA的测定描述于Nagano等人(2001)中。简言之,在含2μg的聚(dI-dC)-聚(dI-dC)、牛血清白蛋白(500μg/μl)和竞争剂DNA的结合缓冲液(20μl)中,使用来源于豌豆pra2转录起始位点下游-734至-667区域的[γ-32P]ATP标记探针实施标准的电泳迁移率变动分析(EMSA)。使用重组产生并随后纯化的PLATZ蛋白质,蛋白质-DNA复合物通过用32P标记的探针在25℃温育该混合物20分钟形成。在4℃,在5%的聚丙烯酰胺Tris-硼酸盐/EDTA凝胶中进行电泳。干燥后,将凝胶进行放射自显影。PLATZ蛋白质结合DNA需要锌离子可以通过添加0-5mM浓度的1,10-邻二氮杂菲得到测试。
实施例7:用于本发明方法的核酸序列的克隆
7.1.eRF1多肽
通过PCR,使用定制的稻幼苗cDNA文库(在pCMV Sport 6.0中;Invitrogen,Paisley,英国)作为模板,扩增在本发明方法中使用的核酸序列。在标准条件中使用Hifi Taq DNA聚合酶,使用在50μl PCR混合物中的200ng模板实施PCR。
使用的引物为:prm09556(fw)(SEQ ID NO:86;正义,起始密码子为黑体):5’-
Figure BDA0000136403840001781
Figure BDA0000136403840001782
ggacaagtttgtacaaaaaagcaggcttaaacaatgggagacaaaaacgatgac-3’和prm09557(rev)(SEQ ID NO:87;反义,互补的):5’-ggggaccactttgtacaagaaagctgggttttgattgattgtca ttccga-3’,其包含用于Gateway重组的AttB位点。并使用标准方法纯化扩增的PCR片段。随后实施Gateway方法的第一步骤,即BP反应,在此期间PCR片段与pDONR201质粒发生体内重组以产生根据Gateway命名的“进入克隆”,peRF1。质粒pDONR201作为
Figure BDA0000136403840001783
技术的部分从Invitrogen购买。
含有SEQ ID NO:1的进入克隆随后在LR反应中与一种用于稻转化的目的载体一起使用。这种载体在T-DNA边界内含有作为功能性元件的:植物可选择标记;可筛选标记表达盒;和意图与已经克隆于所述进入克隆内的目的核酸序列用于LR体内重组的Gateway盒。用于组成型特异表达的稻GOS2启动子(SEQ ID NO:85)位于这种Gateway盒的上游。
LR重组步骤之后,获得的表达载体pGOS2::eRF1(图2)根据本领域众所周知的方法转化至农杆菌菌株LBA4044中。
7.2.SCAMP样多肽
通过PCR,使用定制的拟南芥幼苗cDNA文库(在pCMV Sport 6.0中;Invitrogen,Paisley,英国)作为模板,扩增在本发明方法中使用的核酸序列。在标准条件中使用Hifi Taq DNA聚合酶,使用在50μl PCR混合物中的200ng模板实施PCR。使用的引物为:prm13820(SEQ IDNO:657;正义):5’-ggggacaagtttgtacaaaaaagcaggcttaaacaatggcacgacacgatccta-3’和prm13821(SEQ ID NO:658;反义,互补的):5’-ggggaccactttgtacaagaaagctgggttgatttcttcatagtgcacgc-3’,其包含用于Gateway重组的AttB位点。并使用标准方法纯化扩增的PCR片段。随后实施Gateway方法的第一步骤,即BP反应,在此期间PCR片段与pDONR201质粒发生体内重组以产生根据Gateway命名的“进入克隆”,pSCAMP。质粒pDONR201作为
Figure BDA0000136403840001791
技术的部分从Invitrogen购买。
含有SEQ ID NO:88的进入克隆随后在LR反应中与一种用于稻转化的目的载体一起使用。这种载体在T-DNA边界内含有作为功能性元件的:植物可选择标记;可筛选标记表达盒和意图与已经克隆于所述进入克隆内的目的核酸序列用于LR体内重组的Gateway盒。用于组成型特异表达的稻GOS2启动子(SEQ ID NO:203)位于这种Gateway盒的上游。
LR重组步骤之后,获得的表达载体pGOS2::SCAMP-LIKE(图4)根据本领域众所周知的方法转化至农杆菌菌株LBA4044中。
通过PCR,使用定制的拟南芥幼苗cDNA文库作为模板,扩增在本发明方法中使用的另外的核酸序列。在标准条件中使用Hifi Taq DNA聚合酶,使用在50μl PCR混合物中的200ng模板实施PCR。使用的引物为:prm13818(SEQ ID NO:659;正义):5’-ggggacaagtttgtacaaaaaagcaggcttaaacaatgaatcgccaccacgat-3’和prm13819(SEQ ID NO:660;反义,互补的):5’-ggggaccactttgtacaagaaagctgggttctccttttcacttgtttccc-3’,其包含用于Gateway重组的AttB位点。并使用标准方法纯化扩增的PCR片段。随后实施Gateway方法的第一步骤,即BP反应,在此期间PCR片段与pDONR201质粒发生体内重组以产生根据Gateway命名的“进入克隆”,pSCAMP。质粒pDONR201作为
Figure BDA0000136403840001792
技术的部分从Invitrogen购买。
含有SEQ ID NO:663的进入克隆随后在LR反应中与一种用于稻转化的目的载体一起使用。这种载体在T-DNA边界内含有作为功能性元件的:植物可选择标记;可筛选标记表达盒和意图与已经克隆于所述进入克隆内的目的核酸序列用于LR体内重组的Gateway盒。用于组成型特异表达的稻GOS2启动子(SEQ ID NO:203)位于这种Gateway盒的上游。
LR重组步骤之后,获得的表达载体pGOS2::SCAMP-LIKEx根据本领域众所周知的方法转化至农杆菌菌株LBA4044中。
通过PCR,使用定制的拟南芥幼苗cDNA文库作为模板,扩增在本发明方法中使用的另一核酸序列。在标准条件中使用Hifi Taq DNA聚合酶,使用在50μl PCR混合物中的200ng模板实施PCR。使用的引物为:prm13816(SEQ ID NO:661;正义):5’-ggggacaagtttgtacaaaaaagcaggcttaaacaatggctaatcgttatgatcca-3’和prm13817(SEQ ID NO:662;反义,互补的):5’-ggggaccactttgtacaagaaagctgggtcaaggagaactctca aacagc-3’,其包含用于Gateway重组的AttB位点。并使用标准方法纯化扩增的PCR片段。随后实施Gateway方法的第一步骤,即BP反应,在此期间PCR片段与pDONR201质粒发生体内重组以产生根据Gateway命名的“进入克隆”,pSCAMP。质粒pDONR201作为
Figure BDA0000136403840001801
技术的部分从Invitrogen购买。
含有SEQ ID NO:665的进入克隆随后在LR反应中与一种用于稻转化的目的载体一起使用。这种载体在T-DNA边界内含有作为功能性元件的:植物可选择标记;可筛选标记表达盒和意图与已经克隆于所述进入克隆内的目的核酸序列用于LR体内重组的Gateway盒。用于组成型特异表达的稻GOS2启动子(SEQ ID NO:203)位于这种Gateway盒的上游。
LR重组步骤之后,获得的表达载体pGOS2::SCAMP-LIKEy根据本领域众所周知的方法转化至农杆菌菌株LBA4044中。
7.3.肌原纤蛋白多肽
通过PCR,使用番茄(番茄(Solanum lycopersicum))cDNA文库作为模板,扩增在本发明方法中使用的核酸序列。在标准条件中使用Hifi Taq DNA聚合酶,使用在50μl PCR混合物中的200ng模板实施PCR。使用的引物为:prm10420(SEQ ID NO:258;正义,起始密码子为黑体):5’-ggggacaagtttgtacaaaaaagcaggcttaaacaatgatttcagcaggtttcg-3’和prm10421(SEQ ID NO:259;反义,互补的):5’-ggggaccactttgtacaagaaagctgggtggctggttag caaataagagt-3’,其包含用于Gateway重组的AttB位点。并使用标准方法纯化扩增的PCR片段。随后实施Gateway方法的第一步骤,即BP反应,在此期间PCR片段与pDONR201质粒发生体内重组以产生根据Gateway命名的“进入克隆”,pfibrillin。质粒pDONR201作为
Figure BDA0000136403840001811
技术的部分从Invitrogen购买。
含有SEQ ID NO:204的进入克隆随后在LR反应中与一种用于稻转化的目的载体一起使用。这种载体在T-DNA边界内含有作为功能性元件的:植物可选择标记;可筛选标记表达盒和意图与已经克隆于所述进入克隆内的目的核酸序列用于LR体内重组的Gateway盒。用于组成型特异表达的稻GOS2启动子(SEQ ID NO:257)位于这种Gateway盒的上游。
LR重组步骤之后,获得的表达载体pGOS2::fibrillin(图9)根据本领域众所周知的方法转化至农杆菌菌株LBA4044中。
7.4.PLATZ多肽
实施例A
在该实施例中,通过PCR,使用定制的杨属物种幼苗cDNA文库(在pCMV Sport 6.0中;Invitrogen,Paisley,英国)作为模板,扩增在本发明方法中使用的核酸序列。在标准条件中使用Hifi Taq DNA聚合酶,使用在50μl PCR混合物中的200ng模板实施PCR。使用的引物为:prm13426(SEQ ID NO:274;正义,起始密码子为黑体):5’-
Figure BDA0000136403840001821
ggggacaagtttgtacaaaaaagcaggcttaaacaatgggaactcaaaagcctgcat-3’和prm13427(SEQ ID NO:275;反义,互补的):5’-
Figure BDA0000136403840001822
ggggaccactttgtacaagaaagctgggtttttcctaacataaaggagatcgatga-3’,其包含用于Gateway重组的AttB位点。并使用标准方法纯化扩增的PCR片段。随后实施Gateway方法的第一步骤,即BP反应,在此期间PCR片段与pDONR201质粒发生体内重组以产生根据Gateway命名的“进入克隆”,pPLATZ。质粒pDONR201作为
Figure BDA0000136403840001823
技术的部分从Invitrogen购买。
含有SEQ ID NO:260的进入克隆随后在LR反应中与一种用于稻转化的目的载体一起使用。这种载体在T-DNA边界内含有作为功能性元件的:植物可选择标记;可筛选标记表达盒和意图与已经克隆于所述进入克隆内的目的核酸序列用于LR体内重组的Gateway盒。用于组成型表达的稻GOS2启动子(SEQ ID NO:273)位于这种Gateway盒的上游。
LR重组步骤之后,获得的表达载体pGOS2::PLATZ(图13)根据本领域众所周知的方法转化至农杆菌菌株LBA4044中。
实施例B
在另一实施例中,通过PCR,使用定制的拟南芥幼苗cDNA文库作为模板,扩增另一个核酸序列。在标准条件中使用Hifi Taq DNA聚合酶,使用在50μl PCR混合物中的200ng模板实施PCR。使用的引物为:prm17901(SEQ ID NO:613;正义):
Figure BDA0000136403840001824
ggggacaagtttgtacaaaaaagca ggcttaaacaatggttagagaaggtgaagaa-3’和prm17902(SEQ ID NO:614;反义,互补的):5’-ggggaccactttgtacaagaaagctgggttatgatttttgcctatggtta-3’,其包含用于Gateway重组的AttB位点。使用标准方法纯化扩增的PCR片段。随后实施Gateway方法的第一步骤,即BP反应,在此期间PCR片段与pDONR201质粒发生体内重组以产生根据Gateway命名的另一个“进入克隆”,pPLATZAt。质粒pDONR201作为
Figure BDA0000136403840001831
技术的部分从Invitrogen购买。
含有SEQ ID NO:356的进入克隆随后在LR反应中与一种用于稻转化的目的载体一起使用。这种载体在T-DNA边界内含有作为功能性元件的:植物可选择标记;可筛选标记表达盒和意图与已经克隆于所述进入克隆内的目的核酸序列用于LR体内重组的Gateway盒。用于组成型表达的稻GOS2启动子(SEQ ID NO:273)位于这种Gateway盒的上游。
LR重组步骤之后,获得的表达载体pGOS2::PLATZAt根据本领域众所周知的方法转化至农杆菌菌株LBA4044中。
7.5.PLST样多肽
通过PCR,使用定制的杨属物种幼苗cDNA文库(在pCMV Sport6.0中;Invitrogen,Paisley,英国)作为模板,扩增在本发明方法中使用的核酸序列。在标准条件中使用Hifi Taq DNA聚合酶,使用在50μlPCR混合物中的200ng模板实施PCR。
使用的引物为prm13192(fw)(SEQ ID NO:543;正义,起始密码子为黑体):5’-
Figure BDA0000136403840001832
ggggacaagtttgtacaaaaa agcaggcttaaacaatggtcaatcttagaagtcct-3’和prm13193(rev)(SEQ ID NO:544;反义,互补的):5’-
Figure BDA0000136403840001833
ggggaccactttgtacaagaaagctgggtctcatctgggttcttg taata-3’,其包含用于Gateway重组的AttB位点。使用标准方法纯化扩增的PCR片段。随后实施Gateway方法的第一步骤,即BP反应,在此期间PCR片段与pDONR201质粒发生体内重组以产生根据Gateway命名的“进入克隆”,pPLST-like。质粒pDONR201作为
Figure BDA0000136403840001834
技术的部分从Invitrogen购买。
含有SEQ ID NO:410的进入克隆随后在LR反应中与一种用于稻转化的目的载体一起使用。这种载体在T-DNA边界内含有作为功能性元件的:植物可选择标记;可筛选标记表达盒和意图与已经克隆于所述进入克隆内的目的核酸序列用于LR体内重组的Gateway盒。用于组成型特异表达的稻GOS2启动子(SEQ ID NO:542)位于这种Gateway盒的上游。
LR重组步骤之后,获得的表达载体pGOS2::PLST-like(图2)根据本领域众所周知的方法转化至农杆菌菌株LBA4044中。
7.6.Glomalin多肽
通过PCR,使用定制的稻幼苗cDNA文库(在pCMV Sport 6.0中;Invitrogen,Paisley,英国)作为模板,扩增核酸序列。在标准条件中使用Hifi Taq DNA聚合酶,使用在50μl PCR混合物中的200ng模板实施PCR。使用的引物为:prm13455(SEQ ID NO:609;正义,起始密码子为黑体):5’-ggggacaagtttgtacaaaaaagcaggcttaaacaatgtaccgcgcggc-3’和prm13456(SEQ ID NO:610;反义,互补的):5’-ggggaccactttgtacaagaaagctgggtttagtaatccattccac ccat-3’,其包含用于Gateway重组的AttB位点。并使用标准方法纯化扩增的PCR片段。随后实施Gateway方法的第一步骤,即BP反应,在此期间PCR片段与pDONR201质粒发生体内重组以产生根据Gateway命名的“进入克隆”,pGlomalin。质粒pDONR201作为
Figure BDA0000136403840001841
技术的部分从Invitrogen购买。
含有SEQ ID NO:545的进入克隆随后在LR反应中与一种用于稻转化的目的载体一起使用。这种载体在T-DNA边界内含有作为功能性元件的:植物可选择标记;可筛选标记表达盒和意图与已经克隆于所述进入克隆内的目的核酸序列用于LR体内重组的Gateway盒。用于根特异表达的稻RCc3启动子(SEQ ID NO:611)位于这种Gateway盒的上游。
LR重组步骤之后,获得的表达载体pRCc3::Glomalin(图19)根据本领域众所周知的方法转化至农杆菌菌株LBA4044中。
实施例8:植物转化
稻转化
含有表达载体的农杆菌用来转化稻植物。将稻的日本栽培品种Nipponbare的成熟干燥种子脱壳。通过在70%乙醇中孵育一分钟,随后在0.2%HgCl2中30分钟,随后用无菌蒸馏水洗涤6次15分钟而实施消毒。消毒的种子随后在含有2,4-D的培养基(俞伤组织诱导培养基)上萌发。在黑暗中孵育4周后,将胚胎发生的,来自小盾片的愈伤组织切下并在同一种培养基上增殖。2周后,愈伤组织通过在同一种培养基上继代培养另外2周而繁殖或增殖。胚发生性愈伤组织片在新鲜培养基上继代培养3日,之后共培育(以增强细胞分裂活性)。
含有表达载体的农杆菌菌株LBA4404用于共培育。农杆菌接种在含有适宜抗生素的AB培养基上并在28℃培养3日。随后将细菌收集并重悬在液体共培育培养基中至密度(OD600)约1。将混悬液随后转移至培养皿并将愈伤组织在该混悬液内浸泡15分钟。愈伤组织随后在滤纸上吸干并转移至固化的共培育培养基上并且在黑暗中于25℃孵育3日。共培育的愈伤组织在黑暗中于28℃在选择剂存在下于含有2,4-D的培养基上培育4周。在此时段期间,形成迅速生长的抗性愈伤组织岛。在这种材料转移至再生培养基并在光照下培育后,胚发生潜力释放并且苗在随后4至5周发育。将苗从愈伤组织中切下并且在含有生长素的培养基上培育2至3周,将苗从所述的培养基上转移至土壤。硬化的苗在高湿度和短日照下于温室中培育。
对一个构建体而言产生约35个独立的T0稻转化体。原代转化体从组织培养箱转移至温室。在定量PCR分析以验证T-DNA插入物的拷贝数后,仅保留表现选择剂耐受性的单拷贝转基因植物用于收获T1种子。种子随后在移植后3至5月收获。本方法以超过50%的比率产生单一基因座转化体(Aldemita和Hodges1996,Chan等1993,Hiei等1994)。
实施例9:其他作物的转化
玉米转化
玉米(玉蜀黍)的转化根据Ishida等(1996.Nature Biotech 14(6):745-50)描述方法的改进方法进行。在玉米中的转化是基因型依赖的并且仅特定的基因型可适用于转化和再生。近交系A188(明尼苏达大学)或以A188作为亲本的杂种是用于转化的供体材料的良好来源,但是其它基因型也可以成功地使用。在授粉后(DAP)大约11日从玉米植物中收获玉米穗,此时不成熟胚的长度是大约1至1.2mm。不成熟胚与含有表达载体的根癌农杆菌共培育并且转基因植物通过器官发生而回收。切下的胚在愈伤组织诱导培养基上、随后在玉米再生培养基上培育,其中所述的再生培养基含有选择剂(例如咪唑啉酮,但可以使用多种选择标记)。培养板在25℃于光照下培养2-3周,或直至苗发育。将绿色苗从每个胚转移至玉米生根培养基并在25℃培养2-3周,直至根发育。将生根的苗移植至温室的土壤中。从表现选择剂耐受的并含有单拷贝的T-DNA插入物的植物中产生T1种子。
小麦转化
小麦的转化用Ishida等(1996)Nature Biotech 14(6):745-50描述的方法进行。通常在转化中使用(可从墨西哥CIMMYT获得的)栽培品种Bobwhite。不成熟胚与含有表达载体的根癌农杆菌共培育并且转基因植物通过器官发生而回收。在与农杆菌孵育后,胚在愈伤组织诱导培养基上、随后在再生培养基上体外培育,其中所述的再生培养基含有选择剂(例如咪唑啉酮,但可以使用多种选择标记)。培养平板在25℃于光照下培养2-3周,或直至苗发育。将绿色苗从每个胚转移至生根培养基并在25℃培养2-3周,直至根发育。将生根的苗移植至温室的土壤中。从表现选择剂耐受的并含有单拷贝的T-DNA插入物的植物中产生T1种子。
大豆转化
根据对Texas A&M美国专利5,164,310中所述方法的改进方法转化大豆。几个商业大豆品种对于通过这种方法的转化是可行的。栽培品种Jack(从Illinois种子基金会可获得)通常用于转化。对大豆种子消毒以便体外播种。从7日龄幼苗中切下下胚轴、胚根和一片子叶。进一步培育上胚轴和余下的子叶以发育腋生节。将这些腋生节切下并与含有表达载体的根癌农杆菌孵育。在共培育处理之后,将外植体洗涤并转移至选择培养基。将再生的苗切下并置于苗伸长培养基上。将长度不超过1cm的苗置于生根培养基上直至根发育。将生根的苗移植至温室的土壤中。从表现选择剂耐受的并含有单拷贝T-DNA插入物的植物中产生T1种子。
油菜/芸苔转化
使用5-6日龄幼苗的子叶柄和下胚轴作为用于组织培育的外植体并且根据Babic等(1998,Plant Cell Rep 17:183-188)转化。商业栽培品种Westar(Agriculture Canada)是用于转化的标准品种,但是也可以使用其它品种。对芸苔种子作表面消毒以便体外播种。从体外幼苗中切下具有附着子叶的子叶柄外植体,并通过叶柄外植体的切口端浸入细菌混悬液而接种(含有表达载体的)农杆菌。外植体随后在含有3mg/l BAP、3%蔗糖、0.7%植物琼脂(Phytagar)的MSBAP-3培养基上在23℃,16小时光照下培养2天。在与农杆菌共培育2日后,将叶柄外植体转移至含有的3mg/l BAP、头孢噻肟、羧苄青霉素或特美汀(300mg/l)的MSBAP-3培养基上持续7日,并且随后在含头孢噻肟、羧苄青霉素或特美汀和选择剂的MSBAP-3培养基上培养,直至苗再生。当苗具有5-10mm长度时,将苗切下并转移至苗伸长培养基(含0.5mg/l BAP的MSBAP-0.5)。将长度大约2cm的苗转移至用于根诱导的生根培养基(MS0)。将生根的苗移植至温室的土壤中。从表现选择剂耐受性并含有单拷贝T-DNA插入物的植物中产生T1种子。
苜蓿转化
紫苜蓿(Medicago sativa)的再生性克隆使用(McKersie等,1999Plant Physiol 119:839-847)的方法加以转化。苜蓿的再生和转化是基因型依赖性的并且因而需要再生植物。已经描述了获得再生性植物的方法。例如,这些再生性植物可以选自栽培品种Rangelander(AgricultureCanada)或如Brown DCW与A Atanassov(1985.Plant Cell Tissue OrganCulture 4:111-112)描述的任何其它商业苜蓿品种。备选地,RA3品种(威斯康星大学(University of Wisconsin))已经被选择用于组织培养中(Walker等,1978 Am J Bot 65:654-659)。将叶柄外植体与含有表达载体的根癌农杆菌C58C1 pMP90(McKersie等,1999 Plant Physiol119:839-847)或LBA4404的过夜培养物共培育。外植体在黑暗中在含有288mg/L Pro、53mg/L硫代脯氨酸、4.35g/L K2SO4和100μm乙酰丁香酮的SH诱导培养基上共培育3天。外植体在半强度(half-strength)Murashige-Skoog培养基(Murashige和Skoog,1962)中洗涤并平板接种在不含乙酰丁香酮而含有合适选择剂和合适抗生素以抑止农杆菌生长的相同SH诱导培养基上。在数周后,将体细胞胚转移至不含生长调节剂、不含抗生素而含有50g/L蔗糖的BOi2Y发育培养基中。体细胞胚随后在半强度Murashige-Skoog培养基上萌发。将生根的幼苗移植至花盆内并且在温室中培育。从表现选择剂耐受性并含有单拷贝T-DNA插入物的植物中产生T1种子。
棉花转化
根据US 5,159,135中所述的方法使用根癌农杆菌转化棉花。将棉花种子在3%次氯酸钠溶液中表面灭菌20分钟,并以含有500μg/ml头孢噻肟的蒸馏水洗涤。接着将种子转移至含有50μg/ml苯菌灵的SH培养基中进行萌发。取下4至6日龄幼苗的下胚轴,剪成0.5cm的片并置于0.8%琼脂上。用农杆菌悬液(约108个细胞/ml,从转化有目的基因和适当选择标记的过夜培养物稀释而成)接种下胚轴外植体。室温光照3天后,将组织转移至固体培养基(1.6g/l Gelrite),其带有包含B5维生素的Murashige和Skoog盐(Gamborg等,Exp.Cell Res.50:151-158(1968)),0.1mg/l 2,4-D,0.1mg/l 6-糠胺嘌呤和750μg/ml MgCL2,并含有50至100μg/ml头孢噻肟和400-500μg/ml羧苄青霉素以杀死残余细菌。2至3个月(每4至6周继代培养)后分离单个细胞系,并在选择培养基上进一步培养进行组织扩增(30℃,16小时光周期)。接着在非选择培养基上将转化组织再培养2至3个月,以产生体细胞胚。将至少4mm长的表观健康的胚转移至管中,其中含有细蛭石中的SH培养基,并补充有0.1mg/l吲哚乙酸、6糠胺嘌呤和赤霉酸。以16小时光周期在30℃下培养胚,并将2至3叶期的小植株转移至含有蛭石和养分的盆中。植物变硬并接着移至温室中进一步培养。
实施例10:表型评价方法
10.1评价设置
产生大约35个独立的T0稻转化体。原代转化体从组织培养箱转移至温室用于生长和收获T1种子。留下T1后代对转基因的存在/不存在以3∶1比例分离的6个事件。对于这些事件中的每一事件,通过监测目视标记表达而选择含有转基因的大约10株T1幼苗(杂合子和纯合子)和缺少转基因的大约10株T1幼苗(失效合子)。转基因植物和对应的失效合子在随机位置上并排培育。温室条件是短日照(12小时光照),在光照下28℃和在黑暗中22℃以及相对湿度70%。定期给生长于非胁迫条件下的植物浇水,以确保水和养分不受限制,从而满足植物完成生长和发育的需要。
4个T1事件在T2世代中按照如用于T1世代的相同评价方法作进一步评价,但每个事件采用更多的个体。使植物从播种期直至成熟期通过数字成像箱数次。在每一时间点上,对每株植物从至少6个不同角度拍摄数字图像(2048×1536像素,1600万颜色)。
干旱筛选
在正常培养条件下在盆土中培养来自T2种子的植物,直至到达抽穗阶段。接着将其转移至停止浇水的“干旱”部分。在随机选择的盆中插入湿度探测器,以检测土壤含水量(SWC)。当SWC降至一定阈值之下时,自动对植物持续再浇水直至再次达到正常水平。接着将植物再转移至正常条件。其余培养(植物成熟、种子收获)与不在非生物胁迫条件下培育的植物相同。如正常条件下培养所详细描述的那样记录生长和收获参数。
氮使用效能筛选
在除营养液以外均为正常的条件下在盆土中培养来自T2种子的稻植物。从移植到成熟均使用特定的营养液对盆浇水,其中含有降低的氮(N)含量,通常降低7至8倍。其余培养(植物成熟、种子收获)与不在非生物胁迫条件下培育的植物相同。如正常条件下培养所详细描述的那样记录生长和收获参数。
盐胁迫筛选
在由椰子纤维和argex(3∶1比例)构成的基质上培养植物。在将小植株移植到温室后的前两周使用正常营养液。前两周之后,向营养液中加入25mM盐(NaCl),直至收获植物。随后测量种子相关参数。
10.2统计分析:F检验
使用双因子ANOVA(方差分析)作为统计模型用于植物表型特征的整体评价。对用本发明基因转化的全部事件的全部植物的所有测量参数实施F检验。实施F检验以检查基因对于全部转化事件的作用并验证基因的整体作用(又称作全局基因作用)。用于真实全局基因作用的显著性的阈值对于F检验设置在5%概率水平上。显著性F检验值标示基因作用,意味着不仅仅基因的存在或位置才造成表型上的差异。
当实施的是具有相互重叠事件的两个实验时,对此进行组合分析。这可用来检验两次实验效果的一致性,如果一致,可积累两个实验的证据以提高结论的置信度。所用的方法是混合模型法,考虑了数据的多级结构(即实验-事件-分离子)。通过比较似然比检验与卡方分布获得P值。
10.3测量的参数
生物量相关的参数测量
从播种期直至成熟期,使植物通过数字成像箱数次。在每一时间点上,对每株植物从至少6个不同角度拍摄数字图像(2048×1536像素,1600万颜色)。
植物地上部分面积(或叶生物量)通过计数在来自植物地上部分的数字图像上区别于背景的像素的总数而测定。该值对在相同时间点上从不同角度拍摄的画面进行平均化并且通过校正转化成以平方毫米表达的物理表面值。实验证实以这种方式测量的地上部分植物面积与地上植物部分的生物量相关。地上部分面积是在植物已经达到其最大叶生物量的时间点上所测量的面积。早期萌发势是萌发后3周的植物(幼苗)地上部分面积。根生物量的增加被表述为总根生物量(测量为植物寿命中观察到的根的最大的生物量)的增加;或者表述为根/苗指数(测量为根和苗活性生长期中根质量和苗质量的比例)的提高。
根生物量可以使用如在WO 2006/029987中公开的方法测定。
早期萌发势是涉及植物发育时间的参数。早期萌发势通过计数在来自植物地上部分的区别于背景的像素的总数而测定。该值对在相同时间点上从不同角度拍摄的画面进行平均化并且通过校正转化成以平方毫米表达的物理表面值。以下描述的结果是针对萌发后三周的植物。
植物的“开花时间”可以使用如在WO 2007/093444中公开的方法测定。
种子相关参数的测量
将成熟的原穗(primary panicle)收获、计数、装袋、加条形码标记并且随后在干燥箱内在37℃干燥3日。随后将穗脱粒并且收集及计数全部种子。使用吹气装置分开饱满粒(husk)与空粒。弃去空粒并再次对剩余部分计数。饱满粒在分析天平上称重。饱满种子数通过计数分离步骤后保留下来的饱满粒数而确定。种子总产量通过称量从植物中收获的全部饱满粒而测量。每株植物种子总数通过计数从植物中收获的粒数而测量。根据计数的饱满种子数及其总重量外推得出千粒重(TKW)。收获指数(HI)在本发明中定义为种子总产量和地上面积(mm2)之间的比值再乘以因子106。每个穗的花总数在本发明中定义为种子总数与成熟的原穗数之间的比率。种子饱满率在本发明中定义为饱满种子数占种子(或小花)总数的比例(以a%表示)。
实施例11:转基因植物的表型评价结果
11.1.eRF1多肽
在非胁迫条件下,表达包含SEQ ID NO:1中最长开放阅读框的核酸的T2代植物中转基因稻植物的评估结果显示如下。
在非胁迫条件下评估转基因稻植物的结果显示如下(表E1)。观察到地上生物量(AreaMax)、出苗萌发势(EmerVigor)、每株植物产量(totalwgseeds)、每株植物的种子总数(nrtotalseed)、在第一次清除(flush)中的穗数(firstpan)、植物的饱满种子数(nrfilledseed)、收获指数(为totalwgseeds/AreaMax,harvestindex)至少5%的增加至超过5%的增加。
表E1:非胁迫条件
表E1:非胁迫
条件
  参数   整体
  AreaMax   11.3
  EmerVigor   20.0
  totalwgseeds   14.6
  nrtotalseed   12.2
  firstpan   11.4
  nrfilledseed   14.6
对于每一参数,显示了整体百分比,只要其达到p≤0:05并大于5%阈值。
11.2.SCAMP样多肽
在稻GOS2启动子的控制下并在氮使用效能筛选条件下培养、表达包含SEQ ID NO:88的最长开放阅读框的核酸的T1代转基因稻植物的评估结果显示如下(表E2A)。关于转基因植物产生的详细内容参见前面的实施例。
对于地上生物量(AreaMax)、根生物量(RootMax)、萌发势(Emervigor,早期萌发势)、总种子产量(totalwgseeds)、饱满种子数(nrfilledseed)、饱满率、每株植物的种子总数(nrtotalseed)、收获指数(harvestindex)和原穗数(firstpan),与对照植物比较,观察到至少5%的增加至超过5%的增加。
表E2A:
Figure BDA0000136403840001931
在稻GOS2启动子的控制下并在氮使用效能筛选条件下培养的、表达包含SEQ ID NO:663的最长开放阅读框的核酸的T1代转基因稻植物的评估结果显示如下。关于转基因植物产生的详细内容参见前面的实施例。
对于3个株系开花前的绿度(GNbfFlow)、对于2个株系重力产量最大值(Gravity Yield Max)(GravityYMax),与对照植物比较,观察到了至少5%的增加。此外,在至少一个株系中对于饱满率、千粒重(TKW)、饱满种子数(nrfilledseed)、每穗的花(flowerperpan)和植物的最大高度,即植物的最高端,我们观察到了至少5%的增加。
在稻GOS2启动子的控制下并在氮使用效能筛选条件下培养的表达包含SEQ ID NO:665的最长开放阅读框的核酸的T1代转基因稻植物的评估结果显示如下(表E2B)。关于转基因植物产生的详细内容参见前面的实施例。
对于地上生物量(Rootbiomass(RootMax))、总种子产量(totalwgseeds)、收获指数(harvestindex)、千粒重(TKW)和饱满种子数(nrfilledseed),与对照植物比较,观察到至少5%的增加至超过5%的增加。
表E2B:
11.3.肌原纤蛋白多肽
在下表中显示的每一参数给出了具有p<0.05的p值的整体百分比差异。与对照植物(对应于无义纯合子)比较,评价的结果显示出总种子重量、种子饱满率、收获指数和饱满种子数的增加。
表E3:T1代
  参数   整体
  总种子重量   17.9%
  饱满率   9.6%
  收获指数   10.5%
  饱满种子数   15.1%
表E4:T2代
  参数   整体
  总种子重量   12.3%
  饱满率   8.5%
  收获指数   9.8%
  饱满种子数   9.8%
11.4.PLATZ多肽
实施例A
在非胁迫条件下,表达SEQ ID NO:260(参见上文7.4部分-实施例A)的PLATZ核酸的T1代转基因稻植物的评价结果显示如下。对于地上生物量(AreaMax)和根生物量(RootThickMax)、总种子重量(totalwgseeds)、收获指数、千粒重(TKW)观察到了增加(表E5A)。
表E5A:转基因稻植物的数据概述;对于每一参数,显示了相对于对照植物的整体百分比增加,对于每一参数,p值≤0.05。
  参数   整体增加
  AreaMax   12.6
  totalwgseeds   19.8
  harvestindex   7.6
  TKW   17.9
  RootThickMax   5.9
实施例B
在非胁迫条件下,表达SEQ ID NO:356(参见上文7.4部分-实施例B)的PLATZ核酸的T1代植物中转基因稻植物的评价结果显示如下。观察到了产量相关参数的增加,例如饱满种子与总种子数比例的增加(fillrate)和增加的千粒重(TKW)。转基因植物与对照植物比较还表现出更快的早期发育(表E5B)。后面的参数在表E5B中由AreaEmer显示,并以百分比表示植物产生30%的终生物量需要的时间与植物产生90%的终生物量需要的时间之间的比率。
表E5B:转基因稻植物的数据概述;对于每一参数,显示了相对于对照植物的整体百分比增加,对于每一参数,p值≤0.05。
  参数   整体增加
  Fillrate   5.7%
  TKW   3.5%
  AreaEmer   5.3%
此外,在非生物胁迫例如干旱胁迫、营养胁迫、盐胁迫条件下培养的表达PLATZ蛋白质的植物显示出改进的产量相关性状,包括增加的生物量,例如地上和/或地下生物量的增加;增加的如在定义部分中定义的种子产量;改善的早期萌发势的一种或多种。
11.5.PLST样多肽
在非胁迫条件下,表达包含SEQ ID NO:410中最长开放阅读框的核酸的T2代转基因稻植物的评价结果显示如下。
在干旱条件下评价表达SEQ ID NO:411所示的PLST样多肽的转基因稻植物的结果显示如下(表E6)。观察到总种子重量(totalwgseeds)、饱满种子与总种子数的比率(fillrate)、收获指数(totalwgseeds/AreaMax)(harvestindex)和饱满种子数(nrfilledseed)大于5%的增加。
表E6:在干旱胁迫条件下培养的转基因稻植物的数据概述;显示了整体增加,并且对于每一参数,p值≤0.05。
  参数   整体
  totalwgseeds   19.2
  fillrate   27.2
  harvestindex   21.6
  nrfilledseed   17.1
11.6.Glomalin多肽
在根特异性RCc3启动子的控制下,表达Glomalin基因的转基因稻植物具有增加的种子产量,尤其是增加的千粒重(整体增加2.8%,p值为0.035)。6株株系中的3株还具有增加的收获指数。

Claims (145)

1.用于在植物中相对于对照植物而言增强产量相关性状的方法,包括调节植物中编码PLATZ多肽之核酸的表达,其中所述PLATZ多肽包含PLATZ结构域。
2.权利要求1的方法,其中所述PLATZ多肽包含基序10至18(SEQID NO:264至SEQ ID NO:272)的一个或多个。
3.权利要求1或2的方法,其中所述受调控的表达通过在植物中引入和表达PLATZ多肽之编码核酸而实现。
4.权利要求1-3的任一项的方法,其中所述编码PLATZ多肽之核酸编码表A4中列举的任一蛋白质,或者是此类核酸的一部分,或者是能够与此类核酸杂交的核酸。
5.权利要求1-4的任一项的方法,其中所述核酸序列编码表A4给出的任一蛋白质的直向同源物或旁系同源物。
6.权利要求1-5的任一项的方法,其中所述增强的产量相关性状包括相对于对照植物增加的产量,优选增加的生物量和/或增加的种子产量。
7.权利要求1-6的任一项的方法,其中所述增强的产量相关性状是在非胁迫条件下获得的。
8.权利要求3-7的任一项的方法,其中所述核酸与组成型启动子,优选GOS2启动子,最优选来自稻的GOS2启动子有效连接。
9.权利要求1-8的任一项的方法,其中所述PLATZ多肽之编码核酸是植物来源的,优选来自双子叶植物,进一步优选来自杨柳科(Salicaceae),最优选地来自杨属(Populus)。
10.通过权利要求1-9的任一项方法获得的植物或其部分,包括种子,其中所述植物或其部分包含编码PLATZ多肽的重组核酸。
11.构建体,包含:
(i)编码如权利要求1或2定义的PLATZ多肽的核酸;
(ii)能够驱动(i)的核酸序列表达的一个或多个控制序列;和任选的
(iii)转录终止序列。
12.权利要求11的构建体,其中所述控制序列之一是组成型启动子,优选GOS2启动子,最优选来自稻的GOS2启动子。
13.权利要求11或12的构建体在用于制造相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量的植物的方法中的用途。
14.用权利要求11或12的构建体转化的植物、植物部分或植物细胞。
15.用于生产相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量的转基因植物的方法,包括:
(i)在植物中引入和表达如权利要求1或2定义的PLATZ多肽之编码核酸;和
(ii)在促进植物生长和发育的条件下培养植物细胞。
16.相对于对照植物,具有增加的产量,特别是增加的生物量和/或增加的种子产量的转基因植物或者源自所述转基因植物的转基因植物细胞,获得自如权利要求1或2定义的PLATZ多肽之编码核酸受调控的表达。
17.权利要求10、14或16的转基因植物,或源自它的转基因植物细胞,其中所述植物是作物植物或单子叶或谷物,例如稻、玉米、小麦、大麦、粟、黑麦、黑小麦、高粱、野小麦、德国小麦、黑麦属、一粒系小麦、teff、蜀黍和燕麦。
18.权利要求17的植物的可收获部分,其中所述可收获部分优选是苗生物量和/或种子。
19.来自权利要求17的植物和/或权利要求92的植物的可收获部分的产物。
20.PLATZ多肽之编码核酸在相对于对照植物,在植物中增加产量,特别是增加种子产量和/或苗生物量的用途。
21.分离的核酸分子,选自:
(i)由SEQ ID NO:354表示的核酸;
(ii)由SEQ ID NO:354表示的核酸的互补序列;
(iii)编码PLATZ多肽的核酸,所述PLATZ多肽以递增的优先顺序与由SEQ ID NO:355表示的氨基酸序列具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更多的序列同一性,并且以递增的优先顺序与在上文所定义的基序的一个或多个具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更多的序列同一性。
22.分离的多肽,选自:
(i)由SEQ ID NO:355表示的氨基酸序列;
(ii)氨基酸序列,所述氨基酸序列以递增的优先顺序与由SEQ ID NO:355表示的氨基酸序列具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更多的序列同一性,并且以递增的优先顺序与上文所定义的基序的一个或多个具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更多的序列同一性。
(iii)上述(i)或(ii)项中给出的任一氨基酸序列的衍生物。
23.用于在植物中相对于对照植物增强产量相关性状的方法,包括调节编码eRF1多肽的核酸在植物中的表达,其中所述多肽包含至少3个共有结构域,eRF1结构域1、eRF1结构域2和eRF1结构域3,其分别具有Pfam登录号PF03463、PF03464和PF03465。
24.权利要求23的方法,其中eRF1多肽的eRF1结构域1以递增的优先顺序与位于SEQ ID NO 2的氨基酸6至140之间的序列具有至少49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或者更多的序列同一性。
25.权利要求23的方法,其中eRF1多肽的eRF1结构域2以递增的优先顺序与位于SEQ ID NO 2的氨基酸144至278之间的序列具有至少49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或者更多的序列同一性。
26.权利要求23的方法,其中eRF1多肽的eRF1结构域3以递增的优先顺序与位于SEQ ID NO 2的氨基酸281至418之间的序列具有至少49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或者更多的序列同一性。
27.权利要求23-26的任一项的方法,其中本发明的eRF1多肽包含一个或多个以下肽:分别具有SEQ ID NO:73、74和75的GGQ、NIKS和[GA][IMLV]LR[YW]。
28.权利要求23的方法,其中所述eRF1多肽还可以包含序列基序,所述序列基序以递增的优先顺序与任一以下基序:
(i)基序1:FGTLSGNTREVLHKF[TS]VDLPKKHGRGGQSALRFARLRMEKRHNYVRK[TV]AE(SEQ ID NO:76),
(ii)基序2:YN[KR]VPPNGLVLY[TC]GT[IV]VT[ED][DE]GKEKKV[TN]IDFEPF[KR]PIN[AT]SLYLCDNKFHTE(SEQ ID NO:77),
(iii)基序3:ARGNGTSMISLI[MI]PP[RK]DQ[IV]SRVTKML[GA]DE[YF]GTASNI KSRVNR[QL]SVL[GS]AIT(SEQ ID NO:78)
具有至少49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或者更多的序列同一性。
29.权利要求23-28的任一项的方法,其中所述eRF1多肽还可以包含任意一个或多个序列基序,所述序列基序以递增的优先顺序与任一以下基序:
(i)基序4:[TS]VDLPKKHGRGGQSALRFARLR[EM]EKRHNYVRKVAE[VL]A[VT]QNFITND[KR][PV]NV(SEQ ID NO:79),
(ii)基序5:Y[NT][KR]VPPNGLV[VLI]YCG[TD][IV][ILM]T[ED][ED]GKE[KR]K[VM][NT]ID[FI]EPFKPINTSLYLCDNKFHTE(SEQ ID NO:80),
(iii)基序6:ARGNGTSM ISL[IV][IM]PPK[DG]Q[IV]S[RL]V[QA]KM L[AT][DE]EYGTASNIKSRVNR[LQ]SVL[SG]AIT(SEQ ID NO:81)
具有至少49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或者更多的序列同一性。
30.权利要求28-29的任一项的方法,其中所述eRF1多肽还可以包含任意一个或多个序列基序,所述序列基序以递增的优先顺序与任一以下基序:
(i)基序7:VDLPKKHGRGGQSALRFARLRMEKRHNYVRKTAELATQF[YF]INPATSQPNV(SEQ ID NO:82),
(ii)基序8:YNKVPPNGLVLYTGTIVT[ED]DGKEKKVTIDFEPF[KR]PINASLYLCDNKFHTE(SEQ ID NO:83),
(iii)基序9:TSMISLIMPPRDQ[VI]SRVTKMLGDE[FY]GTASNIKSRVNRQSVLGAITSAQQR(SEQ ID NO:84)
具有至少49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或者更多的序列同一性。
31.权利要求23-30的任一项的方法,其中eRF1多肽的同源物以递增的优先顺序与由表A1的任一多肽,优选地由SEQ ID NO:2表示的氨基酸具有至少25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的整体序列同一性。
32.权利要求23-31的任一项的方法,其中所述受调控的表达通过在植物中引入和表达任一前述权利要求所定义的eRF1多肽之编码核酸而实现。
33.权利要求23-32的任一项的方法,其中所述编码eRF1多肽之核酸编码表A1中列举的任一蛋白质,或者是此类核酸的一部分,或者是能够与此类核酸杂交的核酸。
34.权利要求23-33的任一项的方法,其中所述核酸序列编码表A1给出的任一蛋白质的直向同源物或旁系同源物。
35.任一前述权利要求的方法,其中所述增强的产量相关性状包括相对于对照植物增加的产量,优选增加的生物量和/或增加的种子产量。
36.权利要求23-35的任一项的方法,其中所述增强的产量相关性状是在非胁迫条件下获得的。
37.权利要求23-36的任一项的方法,其中所述增强的产量相关性状是在干旱胁迫、盐胁迫或氮缺乏条件下获得的。
38.权利要求32-34的任一项的方法,其中所述核酸与组成型启动子,优选GOS2启动子,最优选来自稻的GOS2启动子有效连接。
39.权利要求23-38的任一项的方法,其中所述eRF1多肽之编码核酸是植物来源的,优选来自双子叶植物,进一步优选来自十字花科,更优选来自拟南芥属(Arabidopsis),最优选来自拟南芥(Arabidopsisthaliana)。
40.通过权利要求23-39的任一项方法可获得的植物或其部分,包括种子,其中所述植物或其部分包含编码eRF1多肽的重组核酸。
41.构建体,包含:
(i)编码如权利要求23-31定义的eRF1多肽的核酸;
(ii)能够驱动(i)的核酸序列表达的一个或多个控制序列;和任选的
(iii)转录终止序列。
42.权利要求41的构建体,其中所述控制序列之一是组成型启动子,优选GOS2启动子,最优选来自稻的GOS2启动子。
43.权利要求41或42的构建体在用于制造相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量的植物的方法中的用途。
44.用权利要求41或42的构建体转化的植物、植物部分或植物细胞。
45.用于生产相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量的转基因植物的方法,包括:
(i)在植物中引入和表达如权利要求23-31定义的eRF1多肽之编码核酸;和
(ii)在促进植物生长和发育的条件下培养植物细胞。
46.相对于对照植物,具有增加的产量,特别是增加的生物量和/或增加的种子产量的转基因植物或者源自所述转基因植物的转基因植物细胞,获得自如权利要求23-31定义的eRF1多肽之编码核酸受调控的表达。
47.权利要求40、44或46的转基因植物,或源自它的转基因植物细胞,其中所述植物是作物植物或单子叶或谷物,例如稻、玉米、小麦、大麦、粟、黑麦、黑小麦、高粱、野小麦、德国小麦、黑麦属、一粒系小麦、teff、蜀黍和燕麦。
48.权利要求47的植物的可收获部分,其中所述可收获部分优选是苗生物量和/或种子。
49.来自权利要求47的植物和/或权利要求48的植物的可收获部分的产物。
50.eRF1多肽之编码核酸相对于对照植物,在植物中增加产量性状,特别是增加种子产量和/或苗生物量的用途。
51.分离的核酸分子,选自:
(i)由以下核酸序列的任一表示的核酸:具有SEQ ID NO:15的G.max_GM06MC33657_sm55b1032878;具有SEQ ID NO:17的H.vulgare_c64960768hv2703032598;
(ii)由下述序列表示的核酸的互补序列:所述序列具有SEQ ID NO:15的G.max_GM06MC33657_sm55b1032878;具有SEQ ID NO:17的H.vulgare_c64960768hv2703032598;
(iii)编码由SEQ ID NO:16;SEQ ID NO:18的任一表示的多肽的核酸,优选地,由于遗传密码的简并性,所述分离的核酸可以衍生自由SEQ ID NO:16和18的任一表示的多肽序列,并且另外优选地赋予相对于对照植物而言增强的产量相关性状;
(iv)核酸,所述核酸以递增的优先顺序与表A1的任一核酸序列具有至少30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性,并且另外优选地赋予相对于对照植物而言增强的产量相关性状;
(v)核酸分子,所述核酸分子在严格杂交条件下与(i)至(iv)项的核酸分子杂交,并优选地赋予相对于对照植物而言增强的产量相关性状;
(vi)编码eRF1多肽的核酸,所述eRF1多肽以递增的优先顺序与由SEQ ID NO:16和18的任一表示的氨基酸序列和表A1中的任一其它氨基酸序列具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性,并且优选地赋予相对于对照植物而言增强的产量相关性状。
52.本发明另外的实施方案,从而还提供了分离的多肽,选自:
(i)由SEQ ID NO:16和18的任一表示的氨基酸序列;
(ii)氨基酸序列,所述氨基酸序列以递增的优先顺序与由SEQ ID NO:16和18的任一表示的氨基酸序列和表A1中的任一其它氨基酸序列具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性,并且优选地赋予相对于对照植物而言增强的产量相关性状。
(iii)上述(i)或(ii)项中给出的任一氨基酸序列的衍生物。
53.用于在植物中相对于对照植物增强产量相关性状的方法,包括调节编码SCAMP样多肽的核酸在植物中的表达,其中所述SCAMP样多肽包含SCAMP结构域。
54.权利要求53的方法,其中所述SCAMP结构域以递增的优先顺序与表A2的任一多肽中存在的SCAMP结构域的氨基酸,优选地与位于SEQ ID NO 89的氨基酸91至265之间的序列表示的SCAMP结构域具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性。
55.权利要求53或54的方法,其中所述受调控的表达通过在植物中引入和表达SCAMP样多肽之编码核酸而实现。
56.权利要求53-55的任一项的方法,其中所述编码SCAMP样多肽之核酸编码表A2中列举的任一蛋白质,或者是此类核酸的一部分,或者是能够与此类核酸杂交的核酸。
57.权利要求53-56的任一项的方法,其中所述核酸序列编码表A2给出的任一蛋白质的直向同源物或旁系同源物。
58.权利要求53-57的任一项的方法,其中所述增强的产量相关性状包括相对于对照植物增加的产量,优选增加的生物量和/或增加的种子产量。
59.权利要求53-58的任一项的方法,其中所述增强的产量相关性状是在非胁迫条件下获得的。
60.权利要求53-58的任一项的方法,其中所述增强的产量相关性状是在干旱胁迫、盐胁迫或氮缺乏条件下获得的。
61.权利要求55-60的任一项的方法,其中所述核酸与组成型启动子,优选GOS2启动子,最优选来自稻的GOS2启动子有效连接。
62.权利要求53-61的任一项的方法,其中所述LBD多肽之编码核酸是植物来源的,优选来自双子叶植物,进一步优选来自十字花科,更优选来自拟南芥属,最优选来自拟南芥。
63.通过权利要求53-62的任一项方法可获得的植物或其部分,包括种子,其中所述植物或其部分包含编码SCAMP样多肽的重组核酸。
64.构建体,包含:
(i)编码如权利要求53或54定义的SCAMP样多肽的核酸;
(ii)能够驱动(i)的核酸序列表达的一个或多个控制序列;和任选的
(iii)转录终止序列。
65.权利要求64的构建体,其中所述控制序列之一是组成型启动子,优选GOS2启动子,最优选来自稻的GOS2启动子。
66.权利要求64或65的构建体在用于制造相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量的植物的方法中的用途。
67.用权利要求64或65的构建体转化的植物、植物部分或植物细胞。
68.用于生产相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量的转基因植物的方法,包括:
(i)在植物中引入和表达如权利要求53或54定义的SCAMP样多肽之编码核酸;和
(ii)在促进植物生长和发育的条件下培养植物细胞。
69.相对于对照植物,具有增加的产量,特别是增加的生物量和/或增加的种子产量的转基因植物或者源自所述转基因植物的转基因植物细胞,获得自如权利要求53或54定义的SCAMP样多肽之编码核酸受调控的表达。
70.权利要求63、67或69的转基因植物,或源自它的转基因植物细胞,其中所述植物是作物植物或单子叶或谷物,例如稻、玉米、小麦、大麦、粟、黑麦、黑小麦、高粱、野小麦、德国小麦、黑麦属、一粒系小麦、teff、蜀黍和燕麦。
71.权利要求70的植物的可收获部分,其中所述可收获部分优选是苗生物量和/或种子。
72.来自权利要求70的植物和/或权利要求71的植物的可收获部分的产物。
73.SCAMP样多肽之编码核酸在相对于对照植物,在植物中增加产量,特别是增加种子产量和/或苗生物量的用途。
74.分离的核酸分子,选自:
(i)由SEQ ID NO:100、102、104、106、180、182、184、186、188、190和192的任一表示的核酸;
(ii)由(i)项SEQ ID NO:100、102、104、106、180、182、184、186、188、190和192的任一表示的核酸的互补序列;
(iii)编码由SEQ ID NO:101、103、105、107、181、183、185、187、189、191和193的任一表示的多肽的核酸;优选地,由于遗传密码的简并性,所述分离的核酸可以衍生自由SEQ ID NO:101、103、105、107、181、183、185、187、189、191和193的任一表示的多肽序列,并且另外优选地赋予相对于对照植物而言增强的产量相关性状;
(iv)核酸,所述核酸以递增的优先顺序与表A2的任一核酸序列具有至少30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性,并且另外优选地赋予相对于对照植物而言增强的产量相关性状;
(v)核酸分子,所述核酸分子在严格杂交条件下与(i)至(iv)项的核酸分子杂交,并优选地赋予相对于对照植物而言增强的产量相关性状。
(vi)编码多肽的核酸,所述多肽以递增的优先顺序与由SEQ ID NO:101、103、105、107、181、183、185、187、189、191和193的任一表示的氨基酸序列和表A2中的任一其它氨基酸序列具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性,并且优选地赋予相对于对照植物而言增强的产量相关性状。
75.分离的多肽,选自
(i)由SEQ ID NO:101、103、105、107、181、183、185、187、189、191和193的任一表示的氨基酸序列;
(ii)氨基酸序列,所述氨基酸序列以递增的优先顺序与由SEQ ID NO:101、103、105、107、181、183、185、187、189、191和193的任一表示的氨基酸序列和表A2中的任一其它氨基酸序列具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性,并且优选地赋予相对于对照植物而言增强的产量相关性状。
(iii)上述(i)或(ii)项中给出的任一氨基酸序列的衍生物。
76.用于在植物中相对于对照植物而言增强产量相关性状的方法,包括调节植物中编码肌原纤蛋白多肽之核酸的表达,所述肌原纤蛋白多肽包括:
(i)由PFAM登录号PF04755表示的PAP肌原纤蛋白结构域;和
(ii)由KFECQNESRGGLVRNVIKWSVPRLLEENEGATLIVTARFSSVSARNIYLKFEEIGLQNINISDDLQAVIAPAILPRSFLSLQILQFIRSFKARVPVTSPERHSVGGLYYLSYLDKNMLLGRAVGGGGVFIFTRAHTL(SEQ ID NO:253)表示的羧基端结构域,其可以含有表示1至15个之间的残基的0至5个之间的空位,或者以递增的优先顺序与(SEQ IDNO:253)具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的整体序列同一性的结构域;和任选地
(iii)在多肽的氨基端区域内的转运肽。
77.权利要求76的方法,其中所述PAP肌原纤蛋白结构域由ENRKYELLNIIQDTQRGLVTTADQRSTIEEAMVVVEGFDAGKEIDLSKLDGTWQYTSAPDVLILFESAARLPFFQVGQIFQ(SEQ ID NO:252)表示,其可以含有表示1至15个之间的残基的0至5个之间的空位,或者以递增的优先顺序与SEQ ID NO:252具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的整体序列同一性的结构域。
78.权利要求76或77的方法,其中所述肌原纤蛋白多肽包含一个或多个以下结构域的一个或多个:
-结构域X:NIYLQF[EQ]E[IA]S[VL]Q[ND]INISE[EQ]LQAL[IL]APA[IL]LPRSFL[SN]LQILQ[FA][LI][RK][TS]F[KR]AQ[VI]P;
-结构域Y:YYL[ST]YLD[RN][ND]MLLGR[AS]VGGGGV;
-结构域Z:[PA][IL]DL[AS]KLDGTWRLQYTSA[SP]DV;或
-以递增的优先顺序与结构域X、Y和Z的任意一个或多个具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的整体序列同一性的结构域。
79.权利要求76-78的任一项的方法,其中所述受调控的表达通过在植物中引入和表达肌原纤蛋白多肽之编码核酸而实现。
80.权利要求76-79的任一项的方法,其中所述编码肌原纤蛋白多肽之核酸编码表A3中列举的任一蛋白质,或者是此类核酸的一部分,或者是能够与此类核酸杂交的核酸。
81.权利要求76-80的任一项的方法,其中所述核酸序列编码表A3给出的任一蛋白质直向同源物或旁系同源物。
82.权利要求76-81的任一项的方法,其中所述增强的产量相关性状包括相对于对照植物增加的产量,优选的种子产量。
83.权利要求76-82的任一项的方法,其中所述增强的产量相关性状是在非胁迫条件下获得的。
84.权利要求79-83的任一项的方法,其中所述核酸与组成型启动子,优选GOS2启动子,最优选来自稻的GOS2启动子有效连接。
85.权利要求76-84的任一项的方法,其中所述肌原纤蛋白多肽之编码核酸是植物来源的,优选来自双子叶植物,更优选来自茄科(Solanaceae),另外优选地,该核酸来自番茄属(Lycopersicon),还优选地来自番茄属物种,最优选核酸来自番茄。
86.通过权利要求76-85的任一项方法可获得的植物或其部分,包括种子,其中所述植物或其部分包含编码肌原纤蛋白多肽的重组核酸。
87.构建体,包含:
(i)编码如权利要求76-78任一项定义的肌原纤蛋白多肽的核酸;
(ii)能够驱动(i)的核酸序列表达的一个或多个控制序列;和任选的
(iii)转录终止序列。
88.权利要求87的构建体,其中所述控制序列之一是组成型启动子,优选GOS2启动子,最优选来自稻的GOS2启动子。
89.权利要求87或88的构建体在用于制造相对于对照植物具有增加的产量,特别是增加的种子产量的植物的方法中的用途。
90.用权利要求87或88的构建体转化的植物、植物部分或植物细胞。
91.用于生产相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量的转基因植物的方法,包括:
(i)在植物中引入和表达如权利要求76-78任一项定义的肌原纤蛋白多肽之编码核酸;和
(ii)在促进植物生长和发育的条件下培养植物细胞。
92.相对于对照植物,具有增加的产量,特别是增加的种子产量的转基因植物或者源自所述转基因植物的转基因植物细胞,获得自如权利要求76-78任一项定义的肌原纤蛋白多肽之编码核酸受调控的表达。
93.权利要求86、90或92的转基因植物,或源自它的转基因植物细胞,其中所述植物是作物植物或单子叶或谷物,例如稻、玉米、小麦、大麦、粟、黑麦、黑小麦、高粱、野小麦、德国小麦、黑麦属、一粒系小麦、teff、蜀黍和燕麦。
94.权利要求93的植物的可收获部分,其中所述可收获部分优选是种子。
95.来自权利要求93的植物和/或权利要求94的植物的可收获部分的产物。
96.肌原纤蛋白多肽之编码核酸在相对于对照植物,增加产量,特别是增加种子产量的用途。
97.用于在植物中相对于对照植物而言增强产量相关性状的方法,包括调节植物中编码PLST样多肽之核酸的表达,其中所述PLST样多肽至少包含PFam登录号为PF02298的PLST共有结构域。
98.权利要求97的方法,其中PLST样多肽的PLST样结构域以递增的优先顺序与位于SEQ ID NO 411的氨基酸38至124之间的序列具有至少49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或者更多的序列同一性。
99.权利要求97或98的任一项的方法,其中所述PLST样多肽可以包含序列基序,所述序列基序以递增的优先顺序与任一以下基序:
(i)基序19:[DH]SV[LI]QV[TS]KE[DA][YF][DK]SCNT[SK][NSD]P(SEQ ID NO:530);
(ii)基序20:[FHY]YF[IT]SGV[PK][GD][HN]C(SEQ ID NO:531);
(iii)基序21:Y[NT][QK]WA[ESK][KS]NRF[KQ][IV]GD[ST][LI][VL]F[KL]YP(SEQ ID NO:532)
具有至少49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或者更多的序列同一性。
100.权利要求97至99的任一项的方法,其中所述PLST样多肽可以包含任意一个或多个序列基序,所述序列基序以递增的优先顺序与任一以下基序:
(i)基序22:[DN]GN[TS][LVK][FV][KN][LF][DT]R[SP]GP[FY]YF[IT]SG[VA][KP][GD][HN]CEK[GN][QE]K(SEQ ID NO:533);
(ii)基序23:[YL]N[QK]WA[EK][KS][NH]RF[KQ][IV]GD[ST]L[LV]F[LK]Y[PD](SEQ IDNO:534);
(iii)基序24:[KQ]DSV[LI]QVTKE[DA]YKSCNT[SK][DSN]PI(SEQ ID NO:535)
具有至少49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或者更多的序列同一性。
101.权利要求97至100的任一项的方法,其中所述PLST样多肽可以包含任意一个或多个序列基序,所述序列基序以递增的优先顺序与任一以下基序:
(i)基序25:DSVI[QV]VT[EKA][EQ]S[YF][KN][SK]CNL[KST]DPIL[YF][MS]N[ND]GN[ST][LV]FN[LI][TD][RS]PGL[FY]YF[TI]SG[VA][PS]GHC[EQ][KR](SEQ ID NO:536)
(ii)基序26:P[PT]SA[DN]P[DQ][VL]YTKW[AS][KS][NS][HN][RN]FK[IL]GD[ST][LI]LFLYP(SEQ ID NO:537)
(iii)基序27:XVS[CS]Y[QE][YF]KVG[DG]LD[AGS]W(SEQ ID NO:538)
具有至少49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或者更多的序列同一性。
102.权利要求97至101的任一项的方法,其中所述PLST样多肽可以包含任意一个或多个序列基序,所述序列基序以递增的优先顺序与任一以下基序:
(i)基序28:HN[FL]K[IL]GDSLLFLYPPSQDSVIQVTA[QE][SAN][YF][KN]SC[ND]L[KS]DPILYMN[DN]GNSLFN[IL]T(SEQ ID NO:539)
(ii)基序29:GDFYFTSG[AVE]PGHC[EQ]K[SK]QKLH[IV](SEQ ID NO:540)
(iii)基序30:VSCYQYKVGDLD[AS]WGIPTSA[NK](SEQ ID NO:541)
具有至少49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或者更多的序列同一性。
103.权利要求97至102的任一项的方法,其中PLST样多肽的同源物以递增的优先顺序与由表A5的任一多肽,优选地由SEQ ID NO:411表示的氨基酸具有至少25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的整体序列同一性。
104.权利要求97-103的任一项的方法,其中所述受调控的表达通过在植物中引入和表达任一项前述权利要求定义的PLST样多肽之编码核酸而实现。
105.权利要求97-104的任一项的方法,其中所述编码PLST样多肽之核酸编码表A5中列举的任一蛋白质,或者是此类核酸的一部分,或者是能够与此类核酸杂交的核酸。
106.权利要求97-105的任一项的方法,其中所述核酸序列编码表A5给出的任一蛋白质的直向同源物或旁系同源物。
107.权利要求97-106的任一项的方法,其中所述增强的产量相关性状包括相对于对照植物增加的产量,优选增加的种子产量。
108.权利要求97-107的任一项的方法,其中所述增强的产量相关性状是在非胁迫条件下获得的。
109.权利要求97-107的任一项的方法,其中所述增强的产量相关性状是在干旱胁迫、盐胁迫或氮缺乏条件下获得的。
110.权利要求104-106的任一项的方法,其中所述核酸与组成型启动子,优选GOS2启动子,最优选来自稻的GOS2启动子有效连接。
111.权利要求97-110的任一项的方法,其中所述PLST样多肽之编码核酸是植物来源的。
112.权利要求111的方法,其中所述PLST样多肽之编码核酸来自双子叶植物,进一步优选来自杨柳科,最优选核酸来自毛果杨。
113.通过权利要求97-112的任一项方法可获得的植物或其部分,包括种子,其中所述植物或其部分包含编码PLST样多肽的重组核酸。
114.构建体,包含:
(i)编码如权利要求97-103定义的PLST样多肽的核酸;
(ii)能够驱动(i)的核酸序列表达的一个或多个控制序列;和任选的
(iii)转录终止序列。
115.权利要求114的构建体,其中所述控制序列之一是组成型启动子,优选GOS2启动子,最优选来自稻的GOS2启动子。
116.权利要求114或115的构建体在用于制造相对于对照植物具有增加的产量,特别是增加的种子产量的植物的方法中的用途。
117.用权利要求114或115的构建体转化的植物、植物部分或植物细胞。
118.用于生产相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量的转基因植物的方法,包括:
(i)在植物中引入和表达如权利要求97-103定义的PLST样多肽之编码核酸;和
(ii)在促进植物生长和发育的条件下培养植物细胞。
119.相对于对照植物,具有增加的产量,特别是增加的生物量和/或增加的种子产量的转基因植物或者源自所述转基因植物的转基因植物细胞,获得自如权利要求97-103定义的PLST样多肽之编码核酸受调控的表达。
120.权利要求113、117或119的转基因植物,或源自它的转基因植物细胞,其中所述植物是作物植物或单子叶或谷物,例如稻、玉米、小麦、大麦、粟、黑麦、黑小麦、高粱、野小麦、德国小麦、黑麦属、一粒系小麦、teff、蜀黍和燕麦。
121.权利要求120的植物的可收获部分,其中所述可收获部分优选是种子。
122.来自权利要求120的植物和/或权利要求121的植物的可收获部分的产物。
123.PLST样多肽之编码核酸在相对于对照植物,在植物中增加产量,特别是增加种子产量的用途。
124.分离的核酸分子,选自:
(i)由SEQ ID NO:414;SEQ ID NO:426;SEQ ID NO:428;SEQ IDNO:434;SEQ ID NO:438表示的核酸;
(ii)由SEQ ID NO:414;SEQ ID NO:426;SEQ ID NO:428;SEQID NO:434;SEQ ID NO:438表示的核酸的互补序列;
(iii)编码由SEQ ID NO:415;SEQ ID NO:427;SEQ ID NO:429;SEQ ID NO:435;SEQ ID NO:439的任一表示的PLST样多肽的核酸,优选地,由于遗传密码的简并性,所述分离的核酸可以衍生自由SEQ IDNO:的任一表示的多肽序列,并且另外优选地赋予相对于对照植物而言增强的产量相关性状;
(iv)核酸,所述核酸以递增的优先顺序与表A5的任一核酸序列具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更多的序列同一性,并且另外优选地赋予相对于对照植物而言增强的产量相关性状;
(v)核酸分子,所述核酸分子在严格杂交条件下与(i)至(iv)项的核酸分子杂交,并优选地赋予相对于对照植物而言增强的产量相关性状。
(vi)编码PLST样多肽的核酸,所述PLST样多肽以递增的优先顺序与由SEQ ID NO:415;SEQ ID NO:427;SEQ ID NO:429;SEQ IDNO:435;SEQ ID NO:439的任一表示的氨基酸序列和表A5中的任一其它氨基酸序列具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更多的序列同一性,并且优选地赋予相对于对照植物而言增强的产量相关性状。
125.根据本发明另外的实施方案,从而还提供了分离的多肽分子,选自:
(i)由SEQ ID NO:415;SEQ ID NO:427;SEQ ID NO:429;SEQ IDNO:435;SEQ ID NO:439表示的氨基酸序列;
(ii)氨基酸序列,所述氨基酸序列以递增的优先顺序与SEQ ID NO:Y表示的氨基酸序列具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更多的序列同一性,并且以递增的优先顺序与SEQ ID NO:415;SEQ ID NO:427;SEQID NO:429;SEQ ID NO:435;SEQ ID NO:439具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更多的序列同一性。
(iii)上述(i)或(ii)项中给出的任一氨基酸序列的衍生物。
126.用于在植物中相对于对照植物而言增强产量相关性状的方法,包括调节植物中编码Glomalin多肽之核酸的表达,其中所述Glomalin多肽包含Cpn60_TCP1结构域。
127.权利要求126的方法,其中所述Glomalin多肽包含基序31至43(SEQ ID NO:596至SEQ ID NO:608)的一个或多个。
128.权利要求126或127的方法,其中所述受调控的表达通过在植物中引入和表达Glomalin多肽之编码核酸而实现。
129.权利要求126-128的任一项的方法,其中所述编码Glomalin多肽之核酸编码表A6中列举的任一蛋白质,或者是此类核酸的一部分,或者是能够与此类核酸杂交的核酸。
130.权利要求126-129的任一项的方法,其中所述核酸序列编码表A6给出的任一蛋白质的直向同源物或旁系同源物。
131.权利要求126-130的任一项的方法,其中所述增强的产量相关性状包括相对于对照植物增加的产量,优选增加的种子产量。
132.权利要求126-131的任一项的方法,其中所述增强的产量相关性状是在非胁迫条件下获得的。
133.权利要求128-132的任一项的方法,其中所述核酸与根特异性启动子,优选RCc3启动子,最优选来自稻的RCc3启动子有效连接。
134.权利要求126-133的任一项的方法,其中所述Glomalin多肽之编码核酸是植物来源的,优选来自双子叶植物,进一步优选来自禾本科(Poaceae),更优选来自稻属,最优选来自稻。
135.通过权利要求126-134的任一项方法可获得的植物或其部分,包括种子,其中所述植物或其部分包含编码Glomalin多肽的重组核酸。
136.构建体,包含:
(i)编码如权利要求126或127定义的Glomalin多肽的核酸;
(ii)能够驱动(i)的核酸序列表达的一个或多个控制序列;和任选的
(iii)转录终止序列。
137.权利要求136的构建体,其中所述控制序列之一是组成型启动子,优选RCc3启动子,最优选来自稻的RCc3启动子。
138.权利要求136或137的构建体在用于制造相对于对照植物具有增加的产量,特别是增加的种子产量的植物的方法中的用途。
139.用权利要求136或137的构建体转化的植物、植物部分或植物细胞。
140.用于生产相对于对照植物具有增加的产量,特别是增加的种子产量的转基因植物的方法,包括:
(i)在植物中引入和表达如权利要求126或127定义的Glomalin多肽之编码核酸;和
(ii)在促进植物生长和发育的条件下培养植物细胞。
141.相对于对照植物,具有增加的产量,特别是增加的种子产量的转基因植物或者源自所述转基因植物的转基因植物细胞,获得自如权利要求126或127定义的Glomalin多肽之编码核酸受调控的表达。
142.权利要求135、139或141的转基因植物,或源自它的转基因植物细胞,其中所述植物是作物植物或单子叶或谷物,例如稻、玉米、小麦、大麦、粟、黑麦、黑小麦、高粱、野小麦、德国小麦、黑麦属、一粒系小麦、teff、蜀黍和燕麦。
143.权利要求142的植物的可收获部分,其中所述可收获部分优选是种子。
144.来自权利要求142的植物和/或权利要求143的植物的可收获部分的产物。
145.Glomalin多肽之编码核酸在相对于对照植物,在植物中增加产量,特别是增加种子产量的用途。
CN201080036577.8A 2009-06-19 2010-06-10 具有增强的产量相关性状的植物和用于产生该植物的方法 Expired - Fee Related CN102656270B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510155059.2A CN104762316A (zh) 2009-06-19 2010-06-10 具有增强的产量相关性状的植物和用于产生该植物的方法

Applications Claiming Priority (25)

Application Number Priority Date Filing Date Title
EP09163257.0 2009-06-19
EP09163277.8 2009-06-19
EP09163277 2009-06-19
EP09163257 2009-06-19
EP09163287.7 2009-06-19
EP09163287 2009-06-19
US22338909P 2009-07-07 2009-07-07
US22342909P 2009-07-07 2009-07-07
US22343109P 2009-07-07 2009-07-07
US61/223389 2009-07-07
US61/223429 2009-07-07
US61/223431 2009-07-07
US22630709P 2009-07-17 2009-07-17
EP09165779 2009-07-17
US61/226307 2009-07-17
EP09165779.1 2009-07-17
US22744809P 2009-07-22 2009-07-22
EP09166083 2009-07-22
EP09166083.7 2009-07-22
US61/227448 2009-07-22
US22780309P 2009-07-23 2009-07-23
US61/227803 2009-07-23
EP09166200 2009-07-23
EP09166200.7 2009-07-23
PCT/EP2010/058129 WO2011006717A2 (en) 2009-06-19 2010-06-10 Plants having enhanced yield-related traits and a method for making the same

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN201510155059.2A Division CN104762316A (zh) 2009-06-19 2010-06-10 具有增强的产量相关性状的植物和用于产生该植物的方法

Publications (2)

Publication Number Publication Date
CN102656270A true CN102656270A (zh) 2012-09-05
CN102656270B CN102656270B (zh) 2015-05-13

Family

ID=43449877

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201510155059.2A Pending CN104762316A (zh) 2009-06-19 2010-06-10 具有增强的产量相关性状的植物和用于产生该植物的方法
CN201080036577.8A Expired - Fee Related CN102656270B (zh) 2009-06-19 2010-06-10 具有增强的产量相关性状的植物和用于产生该植物的方法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN201510155059.2A Pending CN104762316A (zh) 2009-06-19 2010-06-10 具有增强的产量相关性状的植物和用于产生该植物的方法

Country Status (10)

Country Link
US (1) US9683023B2 (zh)
EP (2) EP2443240A2 (zh)
CN (2) CN104762316A (zh)
AR (1) AR079398A1 (zh)
AU (1) AU2010272805A1 (zh)
BR (1) BRPI1011353A2 (zh)
CA (1) CA2764732A1 (zh)
EA (1) EA201270035A1 (zh)
MX (1) MX2011013544A (zh)
WO (1) WO2011006717A2 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109422803A (zh) * 2017-08-31 2019-03-05 中国科学院上海生命科学研究院 调节植物粒形、千粒重及穗粒数的基因及其应用
CN110777150A (zh) * 2018-07-25 2020-02-11 中国科学院遗传与发育生物学研究所 蛋白GmPLATZ在调控植物种子产量中的应用
CN114478730A (zh) * 2022-02-28 2022-05-13 安徽农业大学 小麦TaVQ14蛋白及其编码基因与应用
CN114480418A (zh) * 2022-01-24 2022-05-13 上海交通大学 温敏雄性不育基因hsp60-3b及其应用和育性恢复的方法

Families Citing this family (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8367881B2 (en) 2011-05-09 2013-02-05 Cool Planet Biofuels, Inc. Method for biomass fractioning by enhancing biomass thermal conductivity
US10696603B2 (en) 2011-06-06 2020-06-30 Carbon Technology Holdings, LLC Mineral solubilizing microorganism infused biochars
US8317891B1 (en) 2011-06-06 2012-11-27 Cool Planet Biofuels, Inc. Method for enhancing soil growth using bio-char
US10173937B2 (en) 2011-06-06 2019-01-08 Cool Planet Energy Systems, Inc. Biochar as a microbial carrier
US10322389B2 (en) 2014-10-01 2019-06-18 Cool Planet Energy Systems, Inc. Biochar aggregate particles
US10118870B2 (en) 2011-06-06 2018-11-06 Cool Planet Energy Systems, Inc. Additive infused biochar
US11214528B2 (en) 2011-06-06 2022-01-04 Carbon Technology Holdings, LLC Treated biochar for use in water treatment systems
US9216916B2 (en) 2013-10-25 2015-12-22 Cool Planet Energy Systems, Inc. System and method for purifying process water produced from biomass conversion to fuels
US8568493B2 (en) 2011-07-25 2013-10-29 Cool Planet Energy Systems, Inc. Method for producing negative carbon fuel
US9809502B2 (en) 2011-06-06 2017-11-07 Cool Planet Energy Systems, Inc. Enhanced Biochar
US10392313B2 (en) 2011-06-06 2019-08-27 Cool Planet Energy Systems, Inc. Method for application of biochar in turf grass and landscaping environments
US10252951B2 (en) 2011-06-06 2019-04-09 Cool Planet Energy Systems, Inc. Biochars and biochar treatment processes
US10640429B2 (en) 2011-06-06 2020-05-05 Cool Planet Energy System, Inc. Methods for application of biochar
US9980912B2 (en) 2014-10-01 2018-05-29 Cool Planet Energy Systems, Inc. Biochars for use with animals
US11279662B2 (en) 2011-06-06 2022-03-22 Carbon Technology Holdings, LLC Method for application of biochar in turf grass and landscaping environments
US9493379B2 (en) 2011-07-25 2016-11-15 Cool Planet Energy Systems, Inc. Method for the bioactivation of biochar for use as a soil amendment
US10233129B2 (en) 2011-06-06 2019-03-19 Cool Planet Energy Systems, Inc. Methods for application of biochar
US10550044B2 (en) 2011-06-06 2020-02-04 Cool Planet Energy Systems, Inc. Biochar coated seeds
US10059634B2 (en) 2011-06-06 2018-08-28 Cool Planet Energy Systems, Inc. Biochar suspended solution
BR112014012871B1 (pt) 2011-11-28 2021-03-23 Evogene Ltd. Método para aumento da eficiência no uso de nitrogênio, produção, biomassa, taxa de crescimento, vigor, e/ou tolerância à deficiência de nitrogênio de uma planta, e, construto de ácido nucleico isolado
US11053171B2 (en) 2014-10-01 2021-07-06 Carbon Technology Holdings, LLC Biochars for use with animals
WO2016054431A1 (en) 2014-10-01 2016-04-07 Cool Planet Energy Systems, Inc. Biochars and biochar treatment processes
US10870608B1 (en) 2014-10-01 2020-12-22 Carbon Technology Holdings, LLC Biochar encased in a biodegradable material
US11097241B2 (en) 2014-10-01 2021-08-24 Talipot Cool Extract (Ip), Llc Biochars, biochar extracts and biochar extracts having soluble signaling compounds and method for capturing material extracted from biochar
US10472297B2 (en) 2014-10-01 2019-11-12 Cool Planet Energy System, Inc. Biochars for use in composting
US11426350B1 (en) 2014-10-01 2022-08-30 Carbon Technology Holdings, LLC Reducing the environmental impact of farming using biochar
MX2020006266A (es) 2017-12-15 2021-01-20 Talipot Cool Extract Ip Llc Biocarbones y extractos de biocarbón que tienen compuestos de señalización solubles y método de captura de material extracto de biocarbón.
WO2020257882A1 (en) * 2019-06-28 2020-12-30 Commonwealth Scientific And Industrial Research Organisation Controlling plant flowering
CN112734186B (zh) * 2020-12-30 2023-10-13 中南大学 列车车厢空气微生物污染实时评估方法、系统及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040031072A1 (en) * 1999-05-06 2004-02-12 La Rosa Thomas J. Soy nucleic acid molecules and other molecules associated with transcription plants and uses thereof for plant improvement
WO2004031349A2 (en) * 2002-09-18 2004-04-15 Mendel Biotechnology, Inc. Polynucleotides and polypeptides in plants
WO2009056566A2 (en) * 2007-10-29 2009-05-07 Basf Plant Science Gmbh Plants having enhanced yield-related traits and a method for making the same

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4987071A (en) 1986-12-03 1991-01-22 University Patents, Inc. RNA ribozyme polymerases, dephosphorylases, restriction endoribonucleases and methods
US5004863B2 (en) 1986-12-03 2000-10-17 Agracetus Genetic engineering of cotton plants and lines
US5116742A (en) 1986-12-03 1992-05-26 University Patents, Inc. RNA ribozyme restriction endoribonucleases and methods
AU3756889A (en) 1988-06-01 1990-01-05 The Texas A & M University System Method for transforming plants via the shoot apex
WO1993022443A1 (en) 1992-04-24 1993-11-11 Sri International In vivo homologous sequence targeting in eukaryotic cells
NZ253963A (en) 1992-06-29 1997-08-22 Gene Shears Pty Ltd Nucleic acid molecule capable of blocking or interfering with viral replication and its use in transforming plant and animal life forms
WO1995003404A1 (en) 1993-07-22 1995-02-02 Gene Shears Pty Limited Dna virus ribozymes
EP0733059B1 (en) 1993-12-09 2000-09-13 Thomas Jefferson University Compounds and methods for site-directed mutations in eukaryotic cells
US6395547B1 (en) 1994-02-17 2002-05-28 Maxygen, Inc. Methods for generating polynucleotides having desired characteristics by iterative selection and recombination
US5605793A (en) 1994-02-17 1997-02-25 Affymax Technologies N.V. Methods for in vitro recombination
JPH11513256A (ja) 1995-10-06 1999-11-16 プラント ジエネテイツク システムズ エヌ.ブイ 種子粉砕
GB9607517D0 (en) 1996-04-11 1996-06-12 Gene Shears Pty Ltd The use of DNA Sequences
GB9703146D0 (en) 1997-02-14 1997-04-02 Innes John Centre Innov Ltd Methods and means for gene silencing in transgenic plants
GB9710475D0 (en) 1997-05-21 1997-07-16 Zeneca Ltd Gene silencing
GB9720148D0 (en) 1997-09-22 1997-11-26 Innes John Centre Innov Ltd Gene silencing materials and methods
WO1999053050A1 (en) 1998-04-08 1999-10-21 Commonwealth Scientific And Industrial Research Organisation Methods and means for obtaining modified phenotypes
CN1268749C (zh) 1998-06-26 2006-08-09 爱阿华州立大学研究机构 用于改变植物中酶和乙酰辅酶a水平的材料和方法
US6555732B1 (en) 1998-09-14 2003-04-29 Pioneer Hi-Bred International, Inc. Rac-like genes and methods of use
US20070011783A1 (en) 1999-05-06 2007-01-11 Jingdong Liu Nucleic acid molecules and other molecules associated with plants and uses thereof for plant improvement
US20090087878A9 (en) 1999-05-06 2009-04-02 La Rosa Thomas J Nucleic acid molecules associated with plants
EP1198985B1 (en) 1999-07-22 2010-09-08 National Institute Of Agrobiological Sciences Method for superrapid transformation of monocotyledon
US20110131679A2 (en) 2000-04-19 2011-06-02 Thomas La Rosa Rice Nucleic Acid Molecules and Other Molecules Associated with Plants and Uses Thereof for Plant Improvement
US20040216190A1 (en) 2003-04-28 2004-10-28 Kovalic David K. Nucleic acid molecules and other molecules associated with plants and uses thereof for plant improvement
US7989676B2 (en) 2006-08-31 2011-08-02 Ceres, Inc. Nucleotide sequences and corresponding polypeptides conferring modulated plant characteristics
CA2579804C (en) 2004-09-16 2013-12-10 Cropdesign N.V. Root evaluation
EP1820391A1 (en) 2006-02-17 2007-08-22 CropDesign N.V. Method and apparatus to determine the start of flowering in plants
EP2078090A2 (en) 2007-06-29 2009-07-15 BASF Plant Science GmbH Plants having enhanced yield-related traits and a method for making the same

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040031072A1 (en) * 1999-05-06 2004-02-12 La Rosa Thomas J. Soy nucleic acid molecules and other molecules associated with transcription plants and uses thereof for plant improvement
WO2004031349A2 (en) * 2002-09-18 2004-04-15 Mendel Biotechnology, Inc. Polynucleotides and polypeptides in plants
WO2009056566A2 (en) * 2007-10-29 2009-05-07 Basf Plant Science Gmbh Plants having enhanced yield-related traits and a method for making the same

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
TUSKAN, G.A., 等: "predicted protein [Populus trichocarpa]", 《NCIB REFERENCE SEQUENCE:XP_002331005.1》 *
YUKIO NAGANO, 等: "A novel class of plant-specific zinc-dependent DNA-binding protein that binds to A/T-rich DNA sequence", 《NUCLEIC ACIDS RESEARCH》 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109422803A (zh) * 2017-08-31 2019-03-05 中国科学院上海生命科学研究院 调节植物粒形、千粒重及穗粒数的基因及其应用
CN109422803B (zh) * 2017-08-31 2021-11-30 中国科学院分子植物科学卓越创新中心 调节植物粒形、千粒重及穗粒数的基因及其应用
CN110777150A (zh) * 2018-07-25 2020-02-11 中国科学院遗传与发育生物学研究所 蛋白GmPLATZ在调控植物种子产量中的应用
CN110777150B (zh) * 2018-07-25 2021-08-10 中国科学院遗传与发育生物学研究所 蛋白GmPLATZ在调控植物种子产量中的应用
CN114480418A (zh) * 2022-01-24 2022-05-13 上海交通大学 温敏雄性不育基因hsp60-3b及其应用和育性恢复的方法
CN114480418B (zh) * 2022-01-24 2023-08-25 上海交通大学 温敏雄性不育基因hsp60-3b及其应用和育性恢复的方法
CN114478730A (zh) * 2022-02-28 2022-05-13 安徽农业大学 小麦TaVQ14蛋白及其编码基因与应用
CN114478730B (zh) * 2022-02-28 2024-01-12 安徽农业大学 小麦TaVQ14蛋白及其编码基因与应用

Also Published As

Publication number Publication date
US9683023B2 (en) 2017-06-20
CA2764732A1 (en) 2011-01-20
CN102656270B (zh) 2015-05-13
AU2010272805A2 (en) 2013-09-26
EP2443240A2 (en) 2012-04-25
AR079398A1 (es) 2012-01-25
EP2955229A1 (en) 2015-12-16
CN104762316A (zh) 2015-07-08
EA201270035A1 (ru) 2012-09-28
WO2011006717A3 (en) 2012-05-10
AU2010272805A1 (en) 2012-01-19
BRPI1011353A2 (pt) 2017-05-23
US20120144532A1 (en) 2012-06-07
MX2011013544A (es) 2012-02-21
WO2011006717A2 (en) 2011-01-20

Similar Documents

Publication Publication Date Title
CN102656270B (zh) 具有增强的产量相关性状的植物和用于产生该植物的方法
RU2503721C2 (ru) Растения, имеющие усиленные признаки, связанные с урожайностью, и способ их получения
CN101965405B (zh) 具有增强的产量相关性状的植物和用于制备该植物的方法
CN102365366A (zh) 具有增强的产量相关性状的植物及其制备方法
CN102459614A (zh) 具有增强的产量相关性状的植物和用于产生该植物的方法
CN102666858A (zh) 具有增强的产量相关性状的植物和用于产生该植物的方法
CN102186877A (zh) 具有增强的产量相关性状的植物和用于产生该植物的方法
CN102676575A (zh) 具有增强的产量相关性状的植物和用于产生该植物的方法
CN102686604A (zh) 具有增强的产量相关性状的植物和用于产生该植物的方法
CN103249836A (zh) 具有增强的产量相关性状的植物和用于产生该植物的方法
CN102459613A (zh) 具有增强的产量相关性状的植物及其制备方法
CN102066568A (zh) 具有增强的产量相关性状的植物和用于产生该植物的方法
EP2173884A2 (en) Plants having increased yield-related traits and a method for making the same
CN102131934A (zh) 具有增强的产量相关性状的植物及其制备方法
CN102686605A (zh) 具有增强的产量相关性状的植物及其制备方法
CN102099480A (zh) 具有增强的产量相关性状的植物和用于产生该植物的方法
CN102648282A (zh) 具有增强的产量相关性状的植物和用于产生该植物的方法
CN102803291A (zh) 具有增强的产量相关性状和/或增强的非生物胁迫耐受性的植物和制备其的方法
CN102317312A (zh) 具有增强的产量相关性状和/或非生物胁迫耐受性的植物和用于制备此类植物的方法
CN102257142A (zh) 具有增强的产量相关性状的植物及其制备方法
CN102300991A (zh) 具有增强的非生物胁迫耐受性和/或增强的产量相关性状的植物及其制备方法
CN102482333A (zh) 具有增强的产量相关性状的植物及其制备方法
CN102272309A (zh) 具有增强的非生物胁迫耐受性和/或增强的产量相关性状的植物及其制备方法
CN103154254A (zh) 具有增强的产量相关性状的植物和产生该植物的方法
CN103068992A (zh) 具有增强的产量相关性状的植物和用于制备该植物的方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20150513

Termination date: 20170610

CF01 Termination of patent right due to non-payment of annual fee