CN102365366A - 具有增强的产量相关性状的植物及其制备方法 - Google Patents

具有增强的产量相关性状的植物及其制备方法 Download PDF

Info

Publication number
CN102365366A
CN102365366A CN2010800147400A CN201080014740A CN102365366A CN 102365366 A CN102365366 A CN 102365366A CN 2010800147400 A CN2010800147400 A CN 2010800147400A CN 201080014740 A CN201080014740 A CN 201080014740A CN 102365366 A CN102365366 A CN 102365366A
Authority
CN
China
Prior art keywords
plant
nucleic acid
polypeptide
coding
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2010800147400A
Other languages
English (en)
Inventor
Y·海茨费尔德
A·I·桑兹莫林纳罗
S·范德纳比利
C·勒佐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BASF Plant Science Co GmbH
Original Assignee
BASF Plant Science Co GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BASF Plant Science Co GmbH filed Critical BASF Plant Science Co GmbH
Publication of CN102365366A publication Critical patent/CN102365366A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/415Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • C12N15/8271Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • C12N15/8271Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance
    • C12N15/8273Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for drought, cold, salt resistance
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A40/00Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
    • Y02A40/10Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture
    • Y02A40/146Genetically Modified [GMO] plants, e.g. transgenic plants

Abstract

本发明公开具有增强的产量相关性状的植物及其制备方法。本发明一般地涉及分子生物学领域,涉及增强植物中多种经济上重要的产量相关性状的方法。更具体地,本发明涉及通过调节编码HSFA4或HSFA5(A4或A5类的热休克因子)多肽的核酸在植物中的表达来增强产量相关性状的方法。本发明还涉及具有经调节的HSFA4或HSFA5多肽编码核酸表达的植物,所述植物相对于对照植物具有增强的产量相关性状。本发明还提供了可以用于实施本发明方法的包含所述核酸的构建体。此外,本发明一般地涉及分子生物学领域,涉及通过调节编码寡肽转运蛋白(OPT4样)多肽的核酸在植物中的表达来增强多种产量相关性状的方法。本发明还涉及具有经调节的OPT4样多肽编码核酸表达的植物,所述植物相对于相应的野生型植物或其他对照植物具有增强的产量相关性状。本发明还提供可以用于本发明方法的构建体。本发明还提供迄今未知的OPT4样编码核酸、和可以用于实施本发明方法的包含所述核酸的构建体。此外,本发明一般地涉及分子生物学领域,涉及通过调节编码叶间期2样(PLA2样)多肽的核酸在植物中的表达来增强多种产量相关性状的方法。本发明还涉及具有经调节的PLA2样多肽编码核酸表达的植物,所述植物相对于相应的野生型植物或其他对照植物具有增强的产量相关性状。本发明还提供了可以用于本发明方法的构建体。此外,本发明一般地涉及分子生物学领域,涉及通过调节编码Wuschel相关同源框1样(WOX1样)多肽的核酸在植物中的表达来增强产量相关性状的方法。本发明还涉及具有经调节的WOX1样多肽编码核酸表达的植物,所述植物相对于相应的野生型植物或其他对照植物具有增强的产量相关性状。本发明还提供了可以用于本发明方法的构建体。

Description

具有增强的产量相关性状的植物及其制备方法
技术领域
本发明一般地涉及分子生物学领域,涉及增强植物中多种经济上重要的产量相关性状的方法。更具体地,本发明涉及通过调节编码HSFA4或HSFA5(A4或A5类的热休克因子)多肽的核酸在植物中的表达来增强产量相关性状的方法。本发明还涉及具有经调节的HSFA4或HSFA5多肽编码核酸表达的植物,所述植物相对于对照植物具有增强的产量相关性状。本发明还提供了可以用于实施本发明方法的包含所述核酸的构建体。
此外,本发明一般地涉及分子生物学领域,涉及通过调节编码寡肽转运蛋白(OPT4样)多肽的核酸在植物中的表达来增强多种产量相关性状的方法。本发明还涉及具有经调节的OPT4样多肽编码核酸表达的植物,所述植物相对于相应的野生型植物或其他对照植物具有增强的产量相关性状。本发明还提供了可以用于本发明方法的构建体。本发明还提供了迄今未知的OPT4样编码核酸、和可以用于实施本发明方法的包含所述核酸的构建体。
此外,本发明一般地涉及分子生物学领域,涉及通过调节编码叶间期2样(plastochron2-like,PLA2样)多肽的核酸在植物中的表达来增强多种产量相关性状的方法。本发明还涉及具有经调节的PLA2样多肽编码核酸表达的植物,所述植物相对于相应的野生型植物或其他对照植物具有增强的产量相关性状。本发明还提供了可以用于本发明方法的构建体。
此外,本发明一般地涉及分子生物学领域,涉及通过调节编码Wuschel相关同源框1样(WOX1样)多肽的核酸在植物中的表达来增强产量相关性状的方法。本发明还涉及具有经调节的WOX1样多肽编码核酸表达的植物,所述植物相对于相应的野生型植物或其他对照植物具有增强的产量相关性状。本发明还提供了可以用于本发明方法的构建体。
背景技术
不断增长的世界人口和逐渐减少的农业可用耕地推动了提高农业效率研究之势。传统的作物和园艺学改良方法利用选育技术来鉴定具有期望特征的植物。然而,此类选育技术有若干缺陷,即这些技术一般为劳动密集型的,而且产生的植物通常含有异质的遗传组分,这些异质的遗传组分可能不总是导致期望的性状自亲本植物传递。分子生物学的进展已经使人类能够修饰动物和植物的种质。植物遗传工程需要分离和操作遗传物质(一般为DNA或RNA的形式)以及随后将遗传物质引入植物。此类技术有能力输送具有多种改良的经济、农业或园艺性状的作物或植物。
具有特别经济利益的性状是增加的产量。产量通常定义为作物的可测量的具有经济价值的产出。这可以以数量和/或质量的方式进行定义。产量直接取决于若干因素,例如器官的数量和大小、植物构造(例如,分枝的数量)、种子生产、叶子衰老等等。根的发育、营养吸收、胁迫耐受性和早期活力也可以是决定产量的重要因素。因此优化上述因素可以促进作物产量的增加。
种子产量是特别重要的性状,这是因为许多植物的种子对于人类和动物营养而言至关重要。诸如玉米、稻、小麦、芸苔(canola)和大豆等作物占人类总卡路里摄取量的一半以上,或是通过对种子本身的直接消耗,或是通过对饲养自加工的种子的肉类产品的消耗。它们也可以是工业加工中所用的糖类、油类和多类代谢物的来源。种子含有胚(新的枝条和根的来源)和胚乳(萌发期和幼苗早期生长过程中胚生长的营养源)。种子的发育涉及许多基因,并且需要代谢物自根、叶和茎转移至正在生长的种子。特别是胚乳可以同化糖类、油类和蛋白质的代谢前体,将其合成为贮存高分子,以充盈籽粒。
对于饲料作物如苜蓿、青贮谷物和干草,植物生物量为产量。在粮食作物中,许多产量替代参数(proxy)被使用。其中主要的是估算植物大小。根据物种以及发育阶段的不同,可以通过许多方法测量植物大小,包括植物总干重、地上干重、地上鲜重、叶面积、茎体积、植物高度、莲座(rosette)直径、叶长、根长、根质量、分蘖数和叶数。许多物种在给定的发育阶段在植物不同部分的大小之间维持保守的比例。利用这些比速增长关系可以从这些尺寸测量结果中的一个外推至另一个(如Tittonell等2005 AgricEcosys & Environ 105:213)。早期发育阶段时的植物大小通常将与发育后期的植物大小有关。具有更大叶面积的较大植物通常能够比较小的植物吸收更多的光和二氧化碳,因此很可能在同期增重更多(Fasoula & Tollenaar2005 Maydica 50:39)。这还不包括植物为最初实现该较大大小所已经具有的微环境或遗传优势的潜在延续。对于植物大小和生长速率,存在着强遗传组分(如ter Steege等2005 Plant Physiology 139:1078),因此对于许多不同基因型,植物在一种环境条件下的大小很可能与另一种环境条件下的大小有关(Hittalmani等2003 Theoretical Applied Genetics 107:679)。由此,可以使用标准环境作为田间作物在不同地点和时间所遭遇到的多样动态环境的替代。
对于许多作物而言,另一重要的性状是早期活力。提高早期活力是温带和热带稻类栽培种的现代稻类育种项目的重要目标。长根对于水栽稻的土壤锚固至关重要。在直接向涝地里播种稻米的情况下,以及在植物必须迅速透水出苗的情况下,较长的枝条均与活力有关。在进行条播的情况下,较长的中胚轴和胚芽鞘对于优良的出苗至关重要。改造植物早期活力的能力在农业上将具有极其重要的意义。例如,一直以来早期活力弱限制了在欧洲大西洋地区引入基于玉米带种质的玉米(玉蜀黍,Zea mays L.)杂交种。
收获指数为种子产量与地上干重的比值,其在许多环境条件下相对稳定,因此在植物大小和粮食产量之间通常能够获得比较稳靠的相关性(例如Rebetzke等2002 Crop Science 42:739)。这些程序固有地联系在一起,因为大多数粮食生物量取决于植物叶和茎当前或贮存的光合作用生产力(Gardener等1985 Physiology of Crop Plants.Iowa State University Press,68-73页)。因此,对植物大小的选择,甚至是在发育早期阶段的选择,已经用作为未来潜在产量的指标(如Tittonell等2005 Agric Ecosys & Environ105:213)。当测试遗传差异对胁迫耐受性的影响时,温室或植物培养室与田地相比具有固有的优势:即能够使土壤性能、温度、水和养分可利用率以及光强度标准化。不过,因不良授粉(由缺乏风力或昆虫导致)或因空间不足以让成熟根或冠层生长等等而对产量造成的人为局限性,会限制这些受控环境在测试产量差异中的应用。因此,在培养室或温室中在标准条件下测量早期发育阶段的植物大小,是指示潜在遗传产量优势的标准方法。
再一重要的性状为提高的非生物胁迫耐受性。非生物胁迫是全世界作物损失的主要原因,使大多数主要作物植物平均产量降低50%以上(Wang等,Planta(2003)218:1-14)。非生物胁迫可以因为干旱、盐度、极端温度、化学毒性、营养物(大量元素和/或微量元素)的过剩或不足、辐射及氧化胁迫引起。提高非生物胁迫植物耐受性的能力将对全世界农场主带来重大的经济利益,并将使人们能够在否则将不可能进行作物栽培的地区和不利条件下进行作物栽培。
因此通过优化上述因素之一可以增加作物产量。
视最终用途而定,对某些产量性状的修饰可能优于对其他产量性状的修饰。例如,对于诸如饲料或木材生产或者生物燃料源等应用,可能期望植物营养部分的增加,而对于诸如面粉、淀粉或油料生产等应用,可能特别期望种子参数的增强。即便是在种子参数之中,取决于应用,一些参数也可能优于其它参数。多种机制可以促成增加的种子产量,无论是以增加的种子大小还是以增加的种子数量的形式。
增强植物产量(种子产量和/或生物量)的一种方法可以是修饰植物的内在生长机制,如细胞周期或者参与植物生长或防御机制的多种信号传递路径。
发明概述
现已发现,可通过在植物中调节HSFA4或HSFA5(A4或A5类的热休克因子)编码核酸在植物中的表达来改善植物的多种生长特征。
现已发现,可通过调节OPT4样多肽编码核酸在植物中的表达来增强植物的多种产量相关性状。
现已发现,可通过在植物中调节PLA2样多肽编码核酸在植物中的表达来改善植物的多种生长特征。
现已发现,可通过调节WOX1样多肽编码核酸在植物中的表达来改善植物的多种生长特征。
背景
1.热应激转录因子(HSF)
热应激转录因子(HSF)响应热胁迫和许多化学传感物介导基因表达的激活。它们结合存在于靶基因的启动子中的特定基序。启动子中的结合基序称为热应激元件(HSE)并且特征在于回文序列:5’AGAAnnTTCT3’,其中nn表示可变数目的任意核苷酸。
HSF拥有模块结构,具有N端DNA结合结构域、和C端具有共有序列FWXX(F/L)(F/I/L)的激活基序(AHA基序)及核输出所必需的一簇碱性氨基酸残基。此外,HSF中的核定位信号参与核输入。在正常生理温度下,HSF是同源三聚体细胞质蛋白,但热休克导致HSF重定位至细胞核。
与其他真核生物不同,植物中的HSF家族显示强多样化,具有高度限定的表达模式。基于寡聚化结构域的结构,植物热休克因子被分为3类,A、B和C类。植物HSF的系统发生关系进一步确定了各类中的HSF之间的进化关系。在A类中已鉴定了多达9个进化枝(Koskull-Doring等,2007,Trends in Plant Science第12卷,No.101360-1385)。相同进化枝内的基因共有高度结构相似性并且被认为具有等同的生物功能。HSFA4和HSFA5属于A类的紧密相关的两个进化枝。在番茄和拟南芥中已证实HSFA4进化枝的成员用作热基因表达的有力激活物,而HSFA5进化枝的成员抑制HSFA4活性(Baniwal等;2007Plant Cell 282,3605-3613)。
2.寡肽转运蛋白(OPT)
所有的活生物体都依赖于大量的转运蛋白来存活。物质的转运是诸如生物合成、生殖、细胞间通讯、呼吸、光合作用、病原体防御和营养物代谢等过程所必需的。在植物中,已鉴定了许多转运蛋白家族,其具有与植物存活的上述方面相关的功能。Vasconcelos等.,2008(The Plant GenomeNovember第1卷,No.2).
可将肽转运蛋白分为3类:ATP结合盒(ABC)超家族、肽转运蛋白超家族(PTR)和寡肽转运蛋白(OPT)家族。这3个家族之间的差异主要在于它们转运的底物类型和它们的特异性。
植物ABC蛋白主要是泵,其使用ATP水解的能量来驱动不同底物例如肽、脂质、重金属螯合剂、多糖、生物碱、类固醇、无机酸和谷胱甘肽缀合物的转运。
已证实PTR家族成员转运二肽和三肽以及硝酸盐。
转运蛋白的OPT家族首先是在栗酒裂殖酵母(Schizosaccharomycespombe)中鉴定的,自那以后也已在细菌、植物和古细菌中但未在动物中发现之。OPT已被进一步分成不同亚家族,其中原核生物蛋白质松散地聚类在一个分枝中,而真核生物蛋白质分成4簇:两个植物簇和两个真菌簇。两个植物簇是黄色条纹(yellow stripe)(YS)和肽转运(PT)进化枝。YS进化枝包括YSL(黄色条纹样)基因,描述于拟南芥、稻和玉蜀黍(Zea mays L)中。
若干YSL基因参与结合至烟草胺(nicotianamine)(NA)的金属的转运。已表征了拟南芥、稻和芥菜(Brassica juncea(L.)Czern)中属于PT进化枝的植物OPT(PT-OPTs),它们已经被提示牵涉胚胎发育、重金属解毒、种子萌发以及长距离氮分配。已显示拟南芥PT-OPT在植物的不同部分,包括维管组织,中表达,推测它们在该处促成肽的长距离转运。Vasconcelos等.,2008。Koh等,2002(Plant Physiology,January 2002,第128卷,pp.21-29)报导了拟南芥中的OPT家族,揭示了9个OPT直向同源物(AtOPT1至AtOPT9)。作者发现在所有OPT成员中高度保守的2个基序-NPG和KIPPR。
令人惊讶地,现已发现调节编码OPT4样多肽的核酸的表达可以产生相对于对照植物具有增强的产量相关性状的植物。
3.叶间期(plastochron)(PLA)
PLA2是参与调控叶的发生方式和成熟速度的RNA结合蛋白。其是来自玉米的TE1的稻直向同源物。Kawakatsu等.,2006(The Plant Cell,Vol.18,612-625,March 2006).
PLA1是细胞色素P450,也参与调控叶的发生方式和成熟速度。其与PLA2没有结构关系,并且不属于相同的调控途径。
令人惊讶地,现已发现调节编码PLA2样多肽的核酸的表达可以产生相对于对照植物具有增强的产量相关性状的植物。
4.WUSCHEL-相关同源框1(WOX1)
WUSCHEL-相关同源框1(WOX1)在心期和鱼雷期在子叶的起始的维管原基中表达。WUSCHEL-相关直向同源物参与中央茎端分生组织的维持。已在拟南芥中鉴定了16个WUS/WOX基因。
概述
1.HSF多肽
令人惊讶地,现已发现,调节编码HSFA4或HSFA5多肽的核酸的表达可以产生相对于对照植物具有增强的产量相关性状的植物。
根据一个实施方案,本发明提供用于相对于对照植物增强植物产量相关性状的方法,包括调节编码HSFA4或HSFA5多肽的核酸在植物中的表达。
2.OPT4样多肽
根据一个实施方案,本发明提供用于相对于对照植物增强植物产量相关性状的方法,包括调节编码OPT4样多肽的核酸在植物中的表达。
根据本发明的另一个实施方案,本发明提供了迄今未知的OPT4样编码核酸、和可以用于实施本发明方法的包含所述核酸的构建体。
3.PLA2样多肽
令人惊讶地,现已发现,调节编码PLA2样多肽的核酸的表达可以产生相对于对照植物具有增强的产量相关性状的植物。
根据一个实施方案,本发明提供用于相对于对照植物增强产量相关性状的方法,包括调节编码PLA2样多肽的核酸在植物中的表达。
4.WOX1样多肽
令人惊讶地,现已发现,调节编码WOX1样多肽的核酸的表达可以产生相对于对照植物具有增强的产量相关性状的植物。
根据一个实施方案,本发明提供用于相对于对照植物增强产量相关性状的方法,包括调节编码WOX1样多肽的核酸在植物中的表达。
定义
多酞/蛋白质
术语“多肽”和“蛋白质”在文中可互换使用,是指通过肽键连接起来的、任意长度的氨基酸的聚合物。
多核苷酸/核酸/核酸序列/核苷酸序列
术语“多核苷酸”、“核酸序列”、“核苷酸序列”、“核酸”、“核酸分子”在文中可互换使用,是指任何长度的无支链形式的核苷酸聚合物,所述核苷酸可以为核糖核苷酸或脱氧核糖核苷酸或者两者的组合。
同源物
蛋白质的“同源物”包括肽、寡肽、多肽、蛋白质和酶,其相对于所讨论的未修饰蛋白质具有氨基酸取代、缺失和/或插入,并且与其源自的未修饰蛋白质具有相似的生物活性和功能活性。
缺失是指从蛋白质中除去一个或多个氨基酸。
插入是指在蛋白质的预定位置引入一个或多个氨基酸残基。插入可以包括N-末端和/或C-末端融合,以及单个或多个氨基酸的序列内插入。一般,氨基酸序列内的插入将小于N-或C-末端的融合,约1到10个残基左右。N-或C-末端融合蛋白或肽的实例包括在酵母双杂交系统中应用的转录激活因子的结合结构域或激活结构域、噬菌体外壳蛋白、(组氨酸)-6-标签、谷胱甘肽S-转移酶标签、蛋白质A、麦芽糖结合蛋白、二氢叶酸还原酶、Tag·100表位、c-myc表位、
Figure BDA0000095416500000091
表位、lacZ、CMP(钙调蛋白结合肽)、HA表位、蛋白质C表位和VSV表位。
取代是指蛋白质中的氨基酸用具有相似特性(如相似的疏水性、亲水性、抗原性、形成或打破α螺旋结构或β片层结构的倾向)的其他氨基酸替换。氨基酸取代一般是单残基的取代,但是视施加于多肽上的功能性限制而定也可以是成簇取代,并且可以是1到10个氨基酸;插入通常在大约1到10个氨基酸残基的数量级。氨基酸取代优选为保守氨基酸取代。保守取代表在本领域公知(参见例如Creighton(1984)Proteins.W.H.Freemanand Company(编辑)和下表1)。
表1:保守氨基酸取代的实例
  残基   保守取代   残基   保守取代
  Ala   Ser   Leu   Ile;Val
  Arg   Lys   Lys   Arg;Gln
  Asn   Gln;His   Met   Leu;Ile
  Asp   Glu   Phe   Met;Leu;Tyr
  Gln   Asn   Ser   Thr;Gly
  Cys   Ser   Thr   Ser;Val
  Glu   Asp   Trp   Tyr
  Gly   Pro   Tyr   Trp;Phe
  His   Asn;Gln   Val   Ile;Leu
  Ile   Leu;Val
可通过本领域公知的肽合成技术,如固相肽合成法等,或通过重组DNA操作,容易地进行氨基酸取代、缺失和/或插入。用于产生蛋白质的取代、插入或缺失变体的DNA序列操作方法在本领域公知。例如,本领域的技术人员公知在DNA预定位置进行取代突变的技术,包括M13诱变、T7-Gen体外诱变(USB,Cleveland,OH)、QuickChange定点诱变(Stratagene,San Diego,CA)、PCR介导的定点诱变或其他定点诱变方案。
衍生物
“衍生物”包括肽、寡肽、多肽,与蛋白质如目的蛋白质的天然形式的氨基酸序列相比,其可以包括用非天然氨基酸残基进行的氨基酸取代、或者添加非天然氨基酸残基。蛋白质的“衍生物”还包括肽、寡肽、多肽,与多肽的天然形式的氨基酸序列相比,其可以包括天然改变的(糖基化、酰基化、异戊烯化、磷酸化、肉豆蔻酰化、硫酸化等)或非天然改变的氨基酸残基。衍生物与其源自的氨基酸序列相比,还可以包括一个或多个非氨基酸取代或添加,例如共价或非共价地结合于氨基酸序列的报告分子或其他配体,例如与氨基酸序列结合以有利于其检测的报告分子,以及相对于天然蛋白质的氨基酸序列而言非天然的氨基酸残基。此外,“衍生物”还可以包括天然形式的蛋白质与标签肽(tagging peptide)例如FLAG、HIS6或硫氧还蛋白的融合物(关于标签肽的综述,参见Terpe,Appl.Microbiol.Biotechnol.60,523-533,2003)。
直向同源物/旁系同源物
直向同源物和旁系同源物涵盖用于描述基因的祖先关系的进化概念。旁系同源物为相同物种内的基因,其起源自祖先基因的复制;而直向同源物为来自不同生物体的基因,其通过物种形成起源,并且也源自于共同的祖先基因。
结构域、基序/共有序列/标签序列(Signature)
术语“结构域”是指在进化相关蛋白质的序列比对中,在特定位置上保守的一组氨基酸。尽管其他位置上的氨基酸可能因同源物不同而改变,但是在特定位置上高度保守的氨基酸则意味着对于蛋白质结构、稳定性或功能而言很可能是必不可少的氨基酸。“结构域”通过在蛋白质同源物家族的比对序列中其高度的保守性而鉴定,其能够用作为标识符以确定任何所讨论的多肽是否属于先前鉴定到的多肽家族。
术语“基序”或“共有序列”或“标签序列”是指进化相关蛋白质序列中短的保守区域。基序常常是结构域的高度保守的部分,但也可以包括仅仅部分的结构域,或者可以是位于保守结构域之外(若基序的所有氨基酸都落在所定义的结构域之外的话)。
存在用于鉴定结构域的专家数据库,例如SMART(Schultz等(1998)Proc.Natl.Acad.Sci.USA 95,5857-5864;Letunic等(2002)Nucleic AcidsRes 30,242-244)、InterPro(Mulder等,(2003)Nucl.Acids.Res.31,315-318)、Prosite(Bucher和Bairoch(1994),A generalized profile syntaxfor biomolecular sequences motifs and its function in automatic sequenceinterpretation.(In)ISMB-94;第二届分子生物学智能系统国际会议记录(Proceedings 2nd International Conference on Intelligent Systems forMolecular Biology)Altman R.,Brutlag D.,Karp P.,Lathrop R.,Searls D.编辑,53-61页,AAAIPress,Menlo Park;Hulo等,Nucl.Acids.Res.32:D134-D137,(2004))或者Pfam(Bateman等,Nucleic Acids Research 30(1):276-280(2002))。进行蛋白质序列芯片(in silico)分析的一组工具可以从ExPASy蛋白质组学服务器获得(瑞士生物信息学研究所(Swiss Institute ofBioinformatics)(Gasteiger等ExPASy:the proteomics server for in-depthprotein knowledge and analysis.Nucleic Acids Res 31:3784-3788(2003))。结构域或基序也可以利用常规技术例如通过序列比对来鉴定。
为比较而进行序列比对的方法是本领域公知的,此类方法包括GAP、BESTFIT、BLAST、FASTA和TFASTA。GAP使用Needleman和Wunsch的算法((1970)J.Mol.Biol.48:443-453)来寻找两序列之间匹配数最大化且空位数最小化的全局(即跨越完整序列)的比对。BLAST算法(Altschul等(1990)J Mol Biol 215:403-10)计算序列同一性百分比,并对两序列之间的相似性进行统计学分析。执行BLAST分析的软件可通过美国国家生物技术信息中心(NCBI)公开地获得。同源物可以例如,使用ClustalW多重序列比对算法(1.83版),采用默认的成对比对参数以及百分比的记分方法而容易地鉴定。利用可获自MatGAT软件包(Campanella等,(2003)BMCBioinformatics,10:29.2003 Jul 10;4:29.MatGAT:an application thatgenerates similarity/identity matrices using protein or DNA sequences)的方法之一,也可以确定全局相似性和同一性百分比。可以进行微小的人工编辑以优化保守基序之间的比对,这对于所属领域的技术人员而言将是显而易见的。此外,除了利用全长序列进行同源物鉴定以外,还可以利用特定的结构域。可以利用上述程序采用默认参数针对完整核酸或氨基酸序列或者选择的结构域或保守基序来确定序列同一性值。对于局部比对,Smith-Waterman算法是特别有用的(Smith TF,Waterman MS(1981)J.Mol.Biol 147(1);195-7)。
交互BLAST
通常,这包括一次BLAST,即以查询序列(例如,利用实施例部分表A中所列的任何序列)针对任何序列数据库如可公共获得的NCBI数据库进行BLAST。当从核苷酸序列开始时,通常使用BLASTN或TBLASTX(利用标准默认值),而当从蛋白质序列开始时,则使用BLASTP或TBLASTN(利用标准默认值)。BLAST结果可以任选地过滤。接着使用过滤的结果或者未过滤的结果中的全长序列针对查询序列来源生物的序列进行反向BLAST(二次BLAST)。然后比较一次和二次BLAST的结果。如果一次BLAST中分值靠前的命中事件来自查询序列源自的相同物种,而理想地反向BLAST导致查询序列在最高命中事件中,则鉴定到了旁系同源物;如果一次BLAST中分值靠前的命中事件不是来自查询序列源自的相同物种,且优选地反向BLAST导致查询序列处于最高命中事件之列,则找到了直向同源物。
分值靠前的命中事件是E值低的命中事件。E值越低,分值越具有显著性(或者换句话说,偶然发现此命中事件的几率越低)。E值的计算是本领域众所周知的。除了E值之外,还可以对比较进行同一性百分比记分。同一性百分比是指两比较核酸(或多肽)序列之间在特定长度上的相同核苷酸(或氨基酸)数。在大家族的情况下,可以使用ClustalW,继之以邻接树来辅助对相关基因的聚类进行可视化和鉴定直向同源物和旁系同源物。
杂交
本文定义的术语“杂交”指其中基本同源互补的核苷酸序列彼此退火的过程。杂交过程能够完全在溶液中发生,即互补的核酸都处在溶液中。杂交过程也能够这样进行,即互补核酸之一固定于基质,如磁珠、琼脂糖珠或任何其它树脂上。此外,杂交过程也能够这样进行,即其中互补核酸之一固定在固相支持物如硝酸纤维素或尼龙膜上,或者通过例如照相平板印刷术固定在例如硅质玻璃支持物上(后者称为核酸阵列或微阵列,或称为核酸芯片)。为了使杂交发生,通常使核酸分子热变性或化学变性,以使双链解链成两条单链,和/或除去单链核酸中的发夹结构或其它二级结构。
术语“严格性”是指进行杂交的条件。杂交的严格性受诸如温度、盐浓度、离子强度和杂交缓冲液组成等条件的影响。通常,在确定的离子强度和pH,对于特定序列而言,低严格条件选择为比热解链温度(Tm)低大约30℃。中等严格条件为温度比Tm低20℃,而高严格条件为温度比Tm低10℃。高严格杂交条件通常用于分离与靶核酸序列具有高序列相似性的杂交序列。不过,由于遗传密码的简并性,核酸可以在序列上有偏差而依然编码基本上相同的多肽。因此有时可能需要中等严格杂交条件来鉴定这样的核酸分子。
Tm是在确定的离子强度和pH值时,50%的靶序列与完美匹配的探针杂交的温度。Tm取决于溶液条件和探针的碱基组成及长度。例如,较长的序列在较高温度特异性杂交。在低于Tm值大约16℃到32℃获得最大杂交速率。在杂交溶液中存在一价阳离子会减少两核酸链之间的静电排斥作用,从而促进杂交体形成;当钠浓度不超过0.4M时,这一作用明显(对于更高的浓度,此效应可以忽略不计)。每个百分点的甲酰胺可使DNA-DNA和DNA-RNA双链体的解链温度降低0.6到0.7℃,加入50%甲酰胺能够使杂交在30到45℃进行,尽管这将降低杂交速率。碱基对错配降低杂交速率和双链体的热稳定性。平均而言,对于大的探针,每个百分点碱基错配使Tm值下降约1℃。取决于杂交体的类型,Tm值可以利用下列公式计算:
1)DNA-DNA杂交体(Meinkoth和Wahl,Anal.Biochem.,138:267-284,1984):
Tm=81.5℃+16.6×log10[Na+]a+0.41×%[G/Cb]-500×[Lc]-1-0.61×%甲酰胺
2)DNA-RNA或RNA-RNA杂交体:
Tm=79.8+18.5(log10[Na+]a)+0.58(%G/Cb)+11.8(%G/Cb)2-820/Lc
3)寡DNA或寡RNAd杂交体:
<20个核苷酸:Tm=2(ln)
20-35个核苷酸:Tm=22+1.46(ln)
a或用于其它一价阳离子,但是仅在0.01-0.4M范围内准确。
b仅对于在30%到75%范围内的%GC是准确的。
cL=双链体的碱基对长度。
d寡,寡核苷酸;ln,=引物的有效长度=2×(G/C数)+(A/T数)。
非特异性结合可以通过许多已知技术中的任一种来控制,例如用含蛋白质的溶液封闭膜,在杂交缓冲液中添加异源RNA、DNA和SDS,以及用RNA酶处理。对于非同源探针,可以通过改变如下条件之一来进行一系列杂交:(i)逐渐降低退火温度(例如从68℃降至42℃),或(ii)逐渐降低甲酰胺浓度(例如从50%降至0%)。熟练技术人员知晓可以在杂交过程中改变而保持或者改变严格条件的各种参数。
除杂交条件外,杂交特异性通常还是杂交后洗涤的函数。为了除去非特异杂交产生的背景,用稀释的盐溶液洗涤样品。这类洗涤的关键因素包括最终洗涤溶液的离子强度和温度:盐浓度越低、洗涤温度越高,洗涤的严格性就越高。洗涤条件通常在等于或低于杂交严格性的条件下进行。阳性杂交给出至少为背景两倍的信号。一般,适用于核酸杂交测定或基因扩增检测操作的适宜严格条件如上文所示设置。也可以选择更高或更低的严格条件。熟练技术人员知晓可以在洗涤过程中改变从而保持或者改变严格条件的各种参数。
例如,长于50个核苷酸的DNA杂交体的典型的高严格杂交条件包括在1×SSC中于65℃杂交或者在1×SSC和50%甲酰胺中于42℃杂交,接着在0.3×SSC中于65℃洗涤。长于50个核苷酸的DNA杂交体的中等严格杂交条件的实例包括在4×SSC中于50℃杂交或者在6×SSC和50%甲酰胺中于40℃杂交,接着在2×SSC中于50℃洗涤。杂交体的长度是杂交核酸的预期长度。当已知序列的核酸进行杂交时,杂交体的长度可以通过比对序列并鉴定本文所述的保守区域来确定。1×SSC是0.15M NaCl和15mM柠檬酸钠;杂交溶液和洗涤溶液可以另外地包括5×Denhardt试剂、0.5-1.0%SDS、100μg/ml片段化的变性鲑精DNA、0.5%焦磷酸钠。
为了定义严格性水平,可以参考Sambrook等(2001)的《分子克隆:实验室手册》,第三版,冷泉港实验室出版,冷泉港,纽约,或者CurrentProtocols in Molecular Biology,John Wiley & Sons,N.Y.(1989及年度更新资料)。
剪接变体
本文所用的术语“剪接变体”包括这样的核酸序列变体,其中选择的内含子和/或外显子已被切除、替换、置换或添加,或者其中内含子已被缩短或增长。这样的变体基本上保持了蛋白质的生物活性;这可以通过选择性地保留蛋白质的功能性区段来实现。这样的剪接变体可以是天然的或人工的。预测和分离这类剪接变体的方法是本领域众所周知的(参见例如Foissac和Schiex(2005)BMC Bioinformatics 6:25)。
等位基因变体
等位基因或等位基因变体为位于相同的染色体位置的给定基因的可选形式。等位基因变体包括单核苷酸多态性(SNP),以及小型插入/缺失多态性(INDEL)。INDEL的大小通常小于100bp。在大多数生物体的天然多态性品系中SNP和INDEL形成最大的一组序列变体。
内源基因
本文述及“内源”基因不仅指见于植物之中的天然形式的所讨论基因(即未经人为干预),而且指随后(重新)引入到植物中的分离形式的所述基因(或基本上同源的核酸/基因)(转基因)。例如,含有这样的转基因的转基因植物可遭遇该转基因表达的实质性下降和/或该内源基因表达的实质性下降。该分离的基因可从生物体分离或可以例如通过化学合成进行人造。
基因改组/定向进化
基因改组或定向进化是重复进行DNA改组以及继之的适当筛选和/或选择,以产生编码具有修饰生物活性的蛋白质的核酸或其部分的变体(Castle等(2004)Science 304(5674):1151-4;美国专利5,811,238和6,395,547)。
构建体
另外的调控元件可以包括转录和翻译的增强子。本领域技术人员会知道适合用于实施本发明的终止子和增强子的序列。如“定义”部分所说明的那样,也可以向5’非翻译区(UTR)或在编码序列中加入内含子序列,来增加在胞质中累积的成熟信使的量。其他控制序列(除启动子、增强子、沉默子、内含子序列、3’UTR和/或5’UTR区域之外)可以有蛋白质和/或RNA稳定元件。这类序列为本领域技术人员公知或者可以容易地获得。
本发明的遗传构建体可以还包括为在特定细胞类型中维持和/或复制所需的复制起点序列。一个实例是需要将遗传构建体作为染色体外遗传元件(如质粒或粘粒分子)在细菌细胞中维持的情况。优选的复制起点包括但不限于f1-ori和colE1。
为检测本发明方法中所用核酸序列的成功转移和/或选择含有这些核酸的转基因植物,最好使用标记基因(或报告基因)。因此,遗传构建体可以任选地含有可选择标记基因。可选择标记在本文“定义”部分有更详细的说明。一旦不再需要标记基因可从转基因细胞将其除去或切除。用于标记去除的技术在本领域内是已知的,有用的技术描述于上文中定义部分。
调控元件/控制序列/启动子
术语“调控元件”、“控制序列”和“启动子”在文中均可互换使用,取其广义,是指能够影响与之相连的序列表达的调控性核酸序列。术语“启动子”通常是指位于基因转录起点上游的核酸控制序列,其参与识别和结合RNA聚合酶及其他蛋白质,由此指导有效连接的核酸进行转录。上述术语包括源自经典真核生物基因组基因的转录调控序列(包括对于精确的转录起始是必需的TATA盒,带或不带CCAAT盒序列),以及其他调控元件(即上游激活序列、增强子和沉默子)——它们通过应答发育刺激和/或外部刺激或以组织特异的方式改变基因表达。该术语还包括经典原核生物基因的转录调控序列,在此情况下可以包括-35盒序列和/或-10盒转录调控序列。术语“调控元件”也涵盖合成的融合分子或衍生物,其赋予、激活或增强细胞、组织或器官中核酸序列分子的表达。
“植物启动子”包括可以介导编码序列区段在植物细胞中表达的调控元件。因此,植物启动子不必是植物来源的,还可来源于病毒或微生物,例如来自攻击植物细胞的病毒。“植物启动子”还可来源于植物细胞,例如,来源于待用欲在本发明方法中表达的以及本文所述的核酸序列转化的植物。这对于其他“植物”调控信号同样适用,例如“植物”终止子。位于可用于本发明方法的核苷酸序列上游的启动子可以通过一个或多个核苷酸取代、插入和/或缺失进行修饰,而不干扰启动子、开放读框(ORF)或者3’调控区如终止子或远离ORF的其他3’调控区的功能或活性。此外,还可以通过修饰启动子的序列而增加其活性,或者将其完全替换为活性更强的启动子、甚至是来自异源生物体的启动子。为在植物中表达,核酸分子必须,如上文所述的那样,有效连接于或者包含适宜的启动子,所述启动子将在恰当的时间点以所需的空间表达模式表达所述基因。
为鉴定功能上等同的启动子,可以例如通过将候选启动子与报告基因有效连接、测定所述报告基因在植物多种组织中的表达水平和模式,来分析候选启动子的启动子强度和/或表达模式。公知的适宜报告基因包括例如β-葡糖醛酸糖苷酶或β-半乳糖苷酶。通过测量β-葡糖醛酸糖苷酶或β-半乳糖苷酶的酶活来测定启动子活性。然后可以将该启动子强度和/或表达模式与参照启动子(如本发明方法中所用的启动子)相比较。可选地,可以利用本领域公知的方法,如Northern印迹(RNA分析)结合放射自显影图的密度计量分析、定量实时PCR或RT-PCR(Heid等,1996 Genome Methods 6:986-994),通过定量mRNA水平或者将本发明方法所用核酸的mRNA水平与持家基因如18S rRNA的mRNA水平进行比较,来测定启动子强度。通常,“弱启动子”表示驱动编码序列低水平表达的启动子。“低水平”表示每个细胞约1/10,000个转录物到约1/100,000个转录物、到约1/500,0000个转录物的水平。相反,“强启动子”驱动编码序列高水平表达,或者说每个细胞约1/10个转录物到约1/100个转录物、到约1/1000个转录物。一般,“中等强度启动子”表示以低于强启动子的水平,尤其是以在所有情况下都低于在35S CaMV启动子控制下所获得水平的水平,驱动编码序列表达的启动子。
有效连接
本文所用的术语“有效连接”是指启动子序列和目的基因之间的功能性连接,从而启动子序列能够起始目的基因的转录。
组成型启动子
“组成型启动子”是指在生长和发育的大多数但不必然是所有阶段,在大多数环境条件下,在至少一种细胞、组织或器官中具有转录活性的启动子。下表2a给出了组成型启动子的实例。
表2a:组成型启动子的实例
Figure BDA0000095416500000191
遍在启动子
遍在启动子基本上在生物体所有的组织或细胞中都有活性。
发育调控型启动子
发育调控型启动子在某些发育阶段或在经历发育改变的植物部分有活性。
诱导型启动子
诱导型启动子响应化学品(综述参见Gatz 1997,Annu.Rev.PlantPhysiol.Plant Mol.Biol.,48:89-108)、环境或物理刺激而诱导或增加转录起始,或者可以是“胁迫诱导型”,即当植物接触多种胁迫条件时被激活,或者是“病原体诱导型”,即当植物接触多种病原体时被激活。
器官特异性/组织特异性启动子
器官特异性或组织特异性的启动子是能够在某些器官或组织(如叶、根、种子组织等)中优先起始转录的启动子。例如,“根特异性启动子”是主要在植物根中,基本上排除在植物的任何其他部分中,具有转录活性的启动子,但仍允许在这些其他植物部分中的任何渗漏表达。能够仅在某些细胞中起始转录的启动子在文中称为“细胞特异性”启动子。
根特异性启动子的实例列于下表2b。
表2b:根特异性启动子的实例
Figure BDA0000095416500000211
种子特异性启动子主要在种子组织中,但不必仅在种子组织中(渗漏表达的情况下),具有转录活性。种子特异性启动子可以在种子发育和/或萌发期间具有活性。种子特异性启动子可以是胚乳/糊粉层/胚特异性的。种子特异性启动子(胚乳/糊粉层/胚特异性的)的实例列于下表2c至表2f中。种子特异性启动子的更多实例在Qing Qu和Takaiwa(Plant Biotechnol.J.2,113-125,2004)中给出,其公开内容作为参考并入本文,如同充分阐述的那样。
表2c:种子特异性启动子的实例
Figure BDA0000095416500000221
Figure BDA0000095416500000231
表2d:胚乳特异性启动子的实例
Figure BDA0000095416500000251
表2e:胚特异性启动子的实例
  基因来源   参考文献
  稻OSH1   Sato等,Proc.Natl.Acad.Sci.USA,93:8117-8122,1996
  KNOX   Postma-Haarsma等,Plant Mol.Biol.39:257-71,1999
  PRO0151   WO 2004/070039
  PRO0175   WO 2004/070039
  PRO005   WO 2004/070039
  PRO0095   WO 2004/070039
表2f:糊粉特异性启动子的实例
Figure BDA0000095416500000252
如文中所定义的绿色组织特异性启动子是主要在绿色组织中,基本上排除在任何其他植物部分中,具有转录活性的启动子,但仍允许在这些其他植物部分中的任何渗漏表达。
可以用来实施本发明方法的绿色组织特异性启动子的实例示于下表2g。
表2g:绿色组织特异性启动子的实例
Figure BDA0000095416500000261
组织特异性启动子的另一实例是分生组织特异性启动子,其主要在分生组织中,基本上排除在任何其他植物部分中,具有转录活性,但仍允许在这些其他植物部分的任何渗漏表达。可以用来实施本发明方法的绿色分生组织特异性启动子的实例示于下表2h。
表2h:分生组织特异性启动子的实例
Figure BDA0000095416500000262
终止子
术语“终止子”包括这样的控制序列,其为位于转录单位末端的DNA序列,发送初级转录物进行3’加工和多聚腺苷酸化以及终止转录的信号。终止子可以源自天然基因、多种其他植物基因、或T-DNA。例如,待加入的终止子可以源自胭脂碱合酶或章鱼碱合酶基因、或可选地源自其它植物基因、或次优选地源自任何其它真核基因。
可选择标记(基因)/报告基因
“可选择标记”、“可选择标记基因”或“报告基因”包括赋予细胞表型的任何基因,其中该表型在细胞中的表达有利于鉴定和/或选择经本发明的核酸构建体转染或转化的细胞。这些标记基因通过一系列不同的原理使得能够鉴定核酸分子的成功转移。适宜的标记可以选自赋予抗生素或除草剂抗性、引入新的代谢性状或允许可视选择的标记。可选择标记基因的实例包括赋予抗生素抗性的基因(例如磷酸化新霉素和卡那霉素的nptII,或磷酸化潮霉素的hpt,或赋予抗例如博来霉素、链霉素、四环素、氯霉素、氨苄青霉素、庆大霉素、遗传霉素(G418)、壮观霉素或杀稻瘟素抗性的基因)、赋予除草剂抗性的基因(例如提供抗抗性的bar;提供抗草甘膦抗性的aroA或gox,或赋予抗例如咪唑啉酮、膦丝菌素或磺胺脲抗性的基因)、或者提供代谢性状的基因(如允许植物使用甘露糖作为唯一碳源的manA,或有关木糖利用的木糖异构酶,或抗营养标记如对2-脱氧葡萄糖的抗性)。可视标记基因的表达导致形成颜色(例如β-葡糖醛酸糖苷酶GUS,或β-半乳糖苷酶及其有色底物,例如X-Gal)、发光(如萤光素/萤光素酶系统)或荧光(绿色荧光蛋白GFP及其衍生物)。这仅仅是一小部分可能标记的名单。技术人员熟悉此类标记。取决于生物体和选择方法,优选不同的标记。
已知对于核酸在植物细胞中的稳定或瞬时整合,取决于所用的表达载体和所用的转染技术,仅少数细胞可以摄入该外来DNA,以及,如果期望的话,整合进其基因组。为鉴定并选择这些整合体,通常将编码可选择标记(例如上文所述的那些)的基因与目的基因一起引入宿主细胞中。这些标记能够在例如突变体中使用,所述突变体中原有的这些基因例如通过常规方法缺失而没有功能。此外,编码可选择标记的核酸分子可与编码本发明多肽的或用于本发明方法的序列包含在同一个载体中,或者在分开的载体中引入宿主细胞。已经稳定转染了所引入的核酸的细胞可以例如通过选择(例如,整合有可选择标记的细胞存活而其他细胞死去)予以鉴定。
由于一旦成功引入了核酸后将不再需要或不期望转基因宿主细胞中存在标记基因,特别是抗生素和除草剂抗性基因,所以根据本发明用于引入核酸的方法最好采用能够除去或切除这些标记基因的技术。一种这样的方法是称为共转化的方法。共转化法采用两个载体同时进行转化,一个载体携带根据本发明的核酸,而第二个携带标记基因。很大比例的转化体接收或者对于植物而言(高达40%或以上的转化体)含有两个载体。对于农杆菌转化,转化体通常只接收载体的一部分,即被T-DNA侧翼包围的序列,其通常是表达盒。随后可通过杂交从转化植物中除去标记基因。在另一种方法中,利用整合在转座子中的标记基因与期望的核酸一起进行转化(称为Ac/Ds技术)。转化体可与转座酶来源杂交,或者用赋予转座酶表达的核酸构建体来瞬时或稳定转化转化体。在有些情况下(约10%),一旦成功进行了转化,转座子会跳离宿主细胞基因组并丢失。在另外一些情况下,转座子会跳至不同的位置。在这些情况下,必须通过杂交以消除标记基因。在微生物学领域,已经研发了使得可以或便于检测此类事件的技术。另一有利的方法有赖于所谓的重组系统;其优势在于可以免除杂交消除。最著名的这类系统是称为Cre/lox系统的系统。Cre1为重组酶,其切除位于loxP序列之间的序列。如果标记基因整合在loxP序列之间,一旦转化成功后,其会因Cre1重组酶的表达而得以切除。其他重组系统有HIN/HIX、FLP/FRT和REP/STB系统(Tribble等,J.Biol.Chem.,275,2000:22255-22267;Velmurugan等,J.Cell Biol.,149,2000:553-566)。根据本发明的核酸序列可以位点特异性地整合进植物基因组。这些方法自然也可以应用于微生物如酵母、真菌或细菌。
转基因的/转基因/重组
出于本发明的目的,就例如本发明的核酸序列、含有所述核酸序列的表达盒、基因构建体或载体、或用所述核酸序列、表达盒或载体转化的生物体而言,“转基因的”、“转基因”或“重组”是指所有这些构建体通过重组方法产生,其中:
(a)编码可用于本发明方法的蛋白质的核酸序列,或
(b)有效连接于本发明核酸序列的遗传控制序列,例如启动子,或
(c)(a)和(b)
不存在于其天然遗传环境中,或者已通过重组方法修饰,该修饰可以采取的形式为例如一个或多个核苷酸残基的取代、添加、缺失、倒位或插入。天然遗传环境应理解为原始植物中天然的基因组或染色体座位或者存在于基因组文库之中。在基因组文库的情况下,优选保持、至少是部分地保持核酸序列的天然遗传环境。该环境至少位于核酸序列的一侧,长度至少为50bp、优选至少500bp、特别优选至少1000bp、最优选至少5000bp。当天然存在的表达盒——例如编码可用于本发明方法的多肽的相应核酸序列与该核酸序列的天然启动子之间的天然组合——经非天然的合成(“人工”)方法例如诱变处理而被修饰时,此表达盒变成转基因表达盒。合适的方法描述在例如,US 5,565,350或WO 00/15815中。
因此,如上文所述,用于本发明目的的转基因植物应理解为指:在所述植物的基因组中,本发明方法中所用的核酸不在其天然基因座上,其中所述核酸可以进行同源或异源表达。不过,正如所提到的那样,转基因也表示:尽管在植物基因组中根据本发明的或本发明方法中所用的核酸在其天然位置上,但是所述序列已相对于天然序列而被修饰,和/或天然序列的调控序列已被修饰。转基因优选理解为表示:根据本发明的核酸在基因组中非天然的座位上表达,即同源表达,或者优选发生核酸的异源表达。优选的转基因植物在文中述及。
调节
与表达或基因表达相关的术语“调节”是指与对照植物相比,所述基因表达的表达水平被改变的过程,其中表达水平可增加或降低。原始未调节的表达可以是结构RNA(rRNA、tRNA)或随后进行翻译的mRNA的任何类型的表达。术语“调节活性”应理解为本发明核酸序列或编码蛋白质的任何表达改变,该改变导致植物产量增加和/或生长增加。
表达
术语“表达”或“基因表达”是指特定基因或特定基因构建体的转录。术语“表达”或“基因表达”特别地是指基因(一个或多个)或基因构建体至结构RNA(rRNA、tRNA)或mRNA的转录,有或无后者至蛋白质的随后翻译。该过程包括DNA的转录和所获得的mRNA产物的加工。
增加的表达/过表达
如本文所用的术语“增加的表达”或“过表达”表示超出原始野生型表达水平的任何形式的表达。
增加基因或基因产物表达的方法在本领域有充分的文献记载,且包括,例如由适当的启动子驱动的过表达、转录增强子或翻译增强子的使用。可以将用作启动子或增强子元件的分离的核酸引入非异源形式的多核苷酸的适当位置(一般是上游),从而上调编码目的多肽的核酸序列的表达。例如,可以通过突变、缺失和/或取代,在体内改变内源启动子(见Kmiec,US5,565,350;Zarling等,WO9322443),或者可以将分离的启动子在相对于本发明基因的适当方向和距离引入植物细胞中,从而控制基因的表达。
如果期望多肽表达,通常期望在多核苷酸编码区的3’末端纳入多聚腺苷酸化区域。多聚腺苷酸化区域可以源自天然基因、多种其它植物基因或T-DNA。例如,待加入的3’末端序列可以源自胭脂碱合酶或章鱼碱合酶基因、或可选地源自其他植物基因、或次优选地源自任何其它真核基因。
也可以在5’非翻译区(UTR)或部分编码序列的编码序列中加入内含子序列,来增加在胞质中累积的成熟信使的量。已显示,在植物和动物表达构建体的转录单位中纳入可剪接内含子,可以在mRNA和蛋白质水平使基因表达增加高达1000倍(Buchman和Berg(1988)Mol.Cell biol.8:4395-4405;Callis等(1987)Genes Dev.1:1183-1200)。通常内含子放置在转录单位5’末端附近时,增强基因表达的作用最大。玉蜀黍内含子Adh1-S内含子1、2和6,Bronze-1内含子的使用是本领域公知的。一般信息请参见The Maize Handbook,第116章,Freeling和Walbot编辑,Springer,N.Y.(1994)。
降低的表达
本文述及“降低的表达”或者表达“减小或基本上消除”应理解为表示,内源基因表达和/或多肽水平和/或多肽活性相对于对照植物降低。所述减小或基本上消除按照递增的优选顺序为,与对照植物相比,减小至少10%、20%、30%、40%或50%、60%、70%、80%、85%、90%或95%、96%、97%、98%、99%或更多。
为减小或基本上消除植物中内源基因的表达,需要一段足够长度的、基本上连续核苷酸的核酸序列。为进行基因沉默,这可以少至20、19、18、17、16、15、14、13、12、11、10或更少的核苷酸,可选地,这可以多至完整的基因(包括部分或完整的5’和/或3’UTR)。此基本上连续的核苷酸链可以源自编码目的蛋白质的核酸(靶基因),或者源自能够编码目的蛋白质的直向同源物、旁系同源物或同源物的任何核酸。优选地,基本上连续的核苷酸链能够与靶基因(有义链或反义链)形成氢键,更优选地,基本上连续的核苷酸链按照递增的优选顺序与靶基因(有义链或反义链)50%、60%、70%、80%、85%、90%、95%、96%、97%、98%、99%、100%序列相同。对于本文所讨论的用于减小或基本上消除内源基因表达的各种方法而言,编码(功能性)多肽的核酸序列并非必需的。
减小或基本上消除表达可以利用常规工具和技术来实现。减小或基本上消除内源基因表达的一个优选方法是通过向植物中引入和表达基因构建体,其中,核酸(在此情况中,源自目的基因、或者源自能够编码任一目的蛋白质的直向同源物、旁系同源物或同源物的任何核酸的、一段基本上连续核苷酸的链)以被间隔子(非编码DNA)分隔开的、(部分或完全地)反向重复的形式克隆在该构建体中。
在这样的优选方法中,利用核酸或其部分(在此情况中,源自目的基因、或者源自能够编码目的蛋白质的直向同源物、旁系同源物或同源物的任何核酸的、一段基本上连续核苷酸的链)的反向重复(优选能够形成发夹结构),通过RNA介导的沉默,实现减小或基本上消除内源基因的表达。将该反向重复序列克隆进包含控制序列的表达载体中。非编码DNA核酸序列(间隔子,例如基质附着区片段(MAR)、内含子、多接头等)位于形成该反向重复的两个反向核酸之间。该反向重复序列转录后,形成具有(部分或完全)自我互补结构的嵌合RNA。该双链RNA结构称为发夹RNA(hpRNA)。hpRNA被植物加工成可以整合入RNA诱导的沉默复合物(RISC)中的siRNA。RISC进而切割mRNA转录物,从而显著减少待翻译成多肽的mRNA转录物的数量。关于其他一般细节,参见例如Grierson等(1998)WO 98/53083;Waterhouse等(1999)WO 99/53050)。
本发明的方法的实施不依赖于向植物中引入和表达其中以反向重复形式克隆了核酸分子的基因构建体,而是可以使用几种公知的“基因沉默”法中的任一个或多个来实现相同的效应。
用于减小内源基因表达的一个这样的方法是RNA介导的基因表达的沉默(下调)。在该情况下沉默在植物中由双链RNA序列(dsRNA)触发,所述双链RNA序列基本上与靶内源基因相似。该dsRNA被植物进一步加工成称为短干扰RNA(siRNA)的大约20至大约26个核苷酸。siRNA整合入RNA诱导的沉默复合物(RISC),该复合物切割内源靶基因的mRNA转录物,从而实质性减少待翻译成多肽的mRNA转录物的数量。优选,双链RNA序列相应于靶基因。
RNA沉默法的另一实例包括以有义取向,向植物中引入核酸序列或其部分(在这种情况下,源自目的基因、或者源自能够编码目的蛋白质的直向同源物、旁系同源物或同源物的任何核酸的、一段基本上连续核苷酸的链)。“有义取向”是指与其mRNA转录物同源的DNA序列。从而至少一个拷贝的核酸序列被引入植物。该额外的核酸序列将减小内源基因的表达,从而产生称为共抑制的现象。如果将几个额外拷贝的核酸序列引入植物,则基因表达的减小将更明显,因为在高转录水平与共抑制的触发之间存在正相关。
RNA沉默法的另一实例包括使用反义核酸序列。“反义”核酸序列包含这样的核苷酸序列,所述核苷酸序列与编码蛋白质的“有义”核酸序列互补,即与双链cDNA分子的编码链互补或与mRNA转录物序列互补。反义核酸序列优选与待沉默的内源基因互补。互补性可位于基因的“编码区”和/或“非编码区”中。术语“编码区”是指包含将翻译成氨基酸残基的密码子的核苷酸序列的区域。术语“非编码区”是指连接在编码区侧翼的5′和3′序列,其可被转录但不被翻译成氨基酸(也称为5′和3′非翻译区)。
可根据沃尔森和克里克碱基配对法则设计反义核酸序列。反义核酸序列可与整个核酸序列(在这种情况下,源自目的基因、或者源自能够编码目的蛋白质的直向同源物、旁系同源物或同源物的任何核酸的、一段基本上连续核苷酸的链)互补,但也可以是仅对核酸序列的部分(包括mRNA 5’和3’UTR)反义的寡核苷酸。例如,反义寡核苷酸序列可与围绕编码多肽的mRNA转录物的翻译起始位点的区域互补。适宜的反义寡核苷酸序列的长度在本领域内是已知的并且可以开始于长大约50、45、40、35、30、25、20、15或10个核苷酸或更少。可使用本领域内已知的方法,使用化学合成和酶促连接反应,构建根据本发明的反义核酸序列。例如,反义核酸序列(例如,反义寡核苷酸序列)可使用天然存在的核苷酸或各种修饰核苷酸来化学合成,所述修饰核苷酸经设计用以增加分子的生物学稳定性或增加反义与有义核酸序列之间形成的双链体的物理稳定性,例如可使用硫代磷酸酯衍生物和吖啶取代的核苷酸。可用于产生反义核酸序列的修饰核苷酸的实例在本领域是公知的。已知的核苷酸修饰包括甲基化、环化和“加帽”和用类似物例如肌苷对一个或多个天然存在的核苷酸的取代。核苷酸的其他修饰在本领域是公知的。
可使用已将核酸序列以反义取向(即,从插入的核酸转录的RNA针对目的靶核酸是反义取向)亚克隆入其中的表达载体,生物学地产生反义核酸序列。优选,植物中,通过稳定地整合的包含启动子、有效连接的反义寡核苷酸和终止子的核酸构建体,产生反义核酸序列。
用于在本发明的方法中进行沉默的核酸分子(无论引入植物的还是原位产生的)与编码多肽的mRNA转录物和/或基因组DNA杂交或结合,从而例如通过抑制转录和/或翻译来抑制蛋白质的表达。杂交可通过常规核苷酸互补性以形成稳定的双链体或者,例如在结合DNA双链体的反义核酸序列的情况下,通过双螺旋的大沟中的特定相互作用而产生。可通过转化或在特定组织位置直接注射,将反义核酸序列引入植物。可选地,可修饰反义核酸序列以靶向选择的细胞,然后全身性施用。例如,为了进行全身性施用,可以修饰反义核酸序列,以便其特异性结合选择的细胞表面上表达的受体或抗原(例如,通过将反义核酸序列连接至结合细胞表面受体或抗原的肽或抗体)。还可使用本文中描述的载体将反义核酸序列递送至细胞。
根据另一个方面,反义核酸序列是α-异头物核酸序列。α-异头物核酸序列与互补RNA形成特定的双链杂交体,其中与常见的b单元(b-units)不同,链走向彼此平行(Gaultier等(1987)Nucl Ac Res 15:6625-6641)。反义核酸序列还可包含2′-o-甲基核糖核苷酸(Inoue等(1987)Nucl Ac Res15,6131-6148)或嵌合RNA-DNA类似物(Inoue等(1987)FEBS Lett.215,327-330)。
还可使用核酶减少或基本上消除内源基因的表达。核酶是具有核糖核酸酶活性的催化性RNA分子,该分子能够切割与其具有互补区的单链核酸序列例如mRNA。因此,核酶(例如,锤头核酶(Haselhoff和Gerlach(1988)Nature 334,585-591)中描述的)可用于催化切割编码多肽的mRNA转录物,从而显著减少待翻译成多肽的mRNA的数量。可设计具有对于核酸序列的特异性的核酶(参见例如:Cech等美国专利号4,987,071;和Cech等美国专利号5,116,742)。可选择地,可以使用相应于核酸序列的mRNA转录物,从RNA分子库中选择具有特定核糖核酸酶活性的催化性RNA(Bartel和Szostak(1993)Science 261,1411-1418)。核酶用于在植物中进行基因沉默的用途在本领域是已知的(例如,Atkins等(1994)WO 94/00012;Lenne等(1995)WO 95/03404;Lutziger等(2000)WO 00/00619;Prinsen等(1997)WO 97/13865和Scott等(1997)WO 97/38116)。
基因沉默还可以通过插入诱变(例如,T-DNA插入或转座子插入)或通过Angell和Baulcombe((1999)Plant J 20(3):357-62)、(Amplicon VIGSWO 98/36083)或Baulcombe(WO 99/15682)等所述的策略来实现。
如果在内源基因上存在突变和/或在随后引入植物的分离基因/核酸上存在突变,那么基因沉默也可发生。减少或基本上消除可通过非功能性多肽引起。例如,多肽可能结合多种相互作用的蛋白质;因此,可以通过一个或多个突变和/或截短,提供仍然能够结合相互作用的蛋白质(例如受体蛋白)但不能展示其正常功能(例如信号转导配体)的多肽。
进行基因沉默的另一个方法是通过用与基因的调控区(例如启动子和/或增强子)互补的核酸序列来打靶以形成三螺旋结构,所述结构阻止基因在靶细胞中的转录。参见Helene,C.,Anticancer Drug Res.6,569-84,1991;Helene等,Ann.N.Y.Acad.Sci.660,27-361992;和Maher,L.J.Bioassays14,807-15,1992。
其他方法,例如应用针对内源多肽的抗体在植物原位(in planta)抑制其功能、或干扰多肽所参与的信号传递通路,对于技术人员是公知的。特别地,可预期人造分子可用于抑制靶多肽的生物功能,或用于干扰其中靶多肽参与的信号转导途径。
可选择地,可设置筛选程序以鉴定植物群体中基因的天然变体,该变体编码具有减少的活性的多肽。这样的天然变体也可用于例如进行同源重组。
人工和/或天然微小RNA(miRNA)可以用来敲除基因表达和/或mRNA翻译。内源miRNA为单链小RNA,一般长度19-24个核苷酸。它们主要用于调控基因表达和/或mRNA翻译。大多数植物microRNA(miRNA)具有与其靶序列完全或几乎完全的互补性。然而,存在具有达到5个错配的天然靶。miRNA利用Dicer家族的双链特异性RNA酶从具有特征性折回结构的更长的非编码RNA加工而来。一旦加工后,它们通过结合RNA诱导的沉默复合物(RISC)的主要成分Argonaute蛋白,而掺入到RNA诱导沉默复合物中。MiRNA充当RISC的特异性组件,因为它们与细胞质中的靶核酸(大多数为mRNA)碱基配对。随后的调控事件包括靶mRNA切割和破坏和/或翻译抑制。因此,miRNA过表达的效应常反映为靶基因的降低的mRNA水平。
人工微小RNA(amiRNA)一般长度21个核苷酸,可以特异地遗传改造以负调控单个或多个目的基因的基因表达。植物微小RNA靶标选择的决定因素在本领域公知。已经定义了靶标识别的经验参数,并且可用来辅助设计特异性amiRNA(Schwab等,(2005)Dev Cell 8:517-527,2005)。设计和生成amiRNA及其前体的便利工具也是公众可获得的(Schwab等,(2006)Plant Cell 18(5):1121-1133,2006)。
为优化性能,用来减小植物中内源基因表达的基因沉默技术需要应用来自单子叶植物的核酸序列转化单子叶植物,而使用来自双子叶植物的核酸序列转化双子叶植物。优选,将来自任何给定植物物种的核酸序列引入到相同物种中。例如,来自稻的核酸序列转化到稻植物中。然而,待引入的核酸序列来源于与其待引入的植物相同的植物物种并非是绝对必需的。内源靶基因与待引入的核酸之间基本上同源就足够了。
上文描述了减小或基本上消除植物中内源基因表达的多种方法的实例。本领域技术人员将能够容易地调整上述沉默方法,以便例如通过应用适当的启动子而实现内源基因在整株植物或其部分中的表达减小。
转化
本文述及的术语“引入”或“转化”包括将外源多核苷酸转移进宿主细胞,不考虑转移所用的方法。能够随后通过器官发生或者胚胎发生进行克隆增殖的植物组织都可以使用本发明的遗传构建体转化,并从其再生整个植物。具体的组织选择将因可用于和最适于待转化的具体物种的克隆增殖系统而变。示例性的组织靶标包括叶盘、花粉、胚、子叶、下胚轴、雌配子、愈伤组织、既有的分生组织(例如顶端分生组织、腋芽和根分生组织),以及诱导的分生组织(例如子叶分生组织和下胚轴分生组织)。可以将多核苷酸瞬时地或稳定地引入宿主细胞,并且可以,例如作为质粒以非整合的状态维持。可选地,其可以整合进入宿主基因组。得到的转化植物细胞可以接着以本领域技术人员已知的方式再生为转化的植物。
外来基因转移进入植物基因组中称为转化。植物物种的转化目前是一种相当常规的技术。有利地,可以使用若干转化方法的任一种向适当的祖先细胞引入目的基因。可以利用公开的转化方法以及由植物组织或植物细胞再生植物的方法来进行瞬时或稳定转化。转化方法包括应用脂质体、电穿孔、增加游离DNA摄取的化学物质、直接向植物注射DNA、粒子枪轰击、用病毒或花粉转化和微粒轰击。方法可以选自用于原生质体的钙/聚乙二醇方法(Krens,F.A.等,(1882)Nature 296,72-74;Negrutiu I.等,(1987)Plant Mol.Biol.8:363-373);原生质体的电穿孔法(Shillito R.D.等,(1985)Bio/Technol 3,1099-1102);植物材料的显微注射(Crossway A.等,(1986)Mol.Gen Genet 202:179-185);DNA或RNA包被的粒子轰击(Klein T.M.等,(1987)Nature 327:70);用(非整合型)病毒感染,等等。优选通过农杆菌介导的转化,产生转基因植物,包括转基因作物植物。有利的转化法是植物原位转化。为此,可以例如使农杆菌作用于植物种子,或用农杆菌接种植物分生组织。已经证明,根据本发明尤为有利的是使转化的农杆菌悬液作用于完整植株或至少花原基。随后培养植物,直至获得所处理植物的种子(Clough和Bent,Plant J.(1998)16,735-743)。农杆菌介导的稻转化方法包括公知的稻转化方法,例如在任一如下文献中描述的那些:欧洲专利申请EP 1198985 A1,Aldemita和Hodges(Planta,199:612-617,1996);Chan等(Plant Mol.Biol.22(3)491-506,1993),Hiei等(Plant J.6(2):271-282,1994),其公开内容并入本文作为参考,如同充分阐述的那样。至于玉米转化,优选的方法如Ishida等(Nat.Biotechnol.14(6):745-50,1996)或Frame等(Plant Physiol.129(1):13-22,2002)中所述,其公开内容并入本文作为参考,如同充分阐述的那样。作为举例说明,所述方法还由B.Jenes等,Techniques for Gene Transfer,在Transgenic Plants,卷1,Engineeringand Utilization,编辑S.D.Kung和R.Wu,Academic Press(1993)128-143以及Potrykus Annu.Rev.Plant Physiol.Plant Molec.Biol.42(1991)205-225)中进一步描述。优选将待表达的核酸或构建体克隆到载体中,所述载体适用于转化根癌农杆菌(Agrobacterium tumefaciens),例如pBin19(Bevan等,Nucl.Acids Res.12(1984)8711)。然后以已知的方式利用由这样的载体转化的农杆菌来转化植物,例如模式植物,像拟南芥属植物(拟南芥(Arabidopsis thaliana)在本发明范围内不视为作物植物);或者作物植物,例如烟草植物,例如通过将擦伤的叶子或切碎的叶子浸在农杆菌溶液中,然后在合适的培养基中培养之。通过根癌农杆菌的植物转化由例如,和Willmitzer在Nucl.Acid Res.(1988)16,9877中描述,或者尤其可以参见F.F.White,Vectors for Gene Transfer in Higher Plants在Transgenic Plants,卷1,Engineering and Utilization,编辑S.D.Kung和R.Wu,Academic Press,1993,第15-38页。
除了转化之后不得不再生为完整植株的体细胞,还可以转化植物分生组织的细胞,特别是可以发育成配子的那些细胞。在这种情况下,转化的配子循着天然植物的发育而产生转基因植物。因此,例如,用农杆菌处理拟南芥的种子,并从发育中的植物获得种子,其中一定比例的植物被转化因而是转基因的[Feldman,KA和Marks MD(1987).Mol Gen Genet208:274-289;Feldmann K(1992).在C Koncz,N-H Chua和J Shell编辑Methods in Arabidopsis Research.Word Scientific,Singapore,第274-289页]。可选的方法基于花序的反复去除以及莲座中心切割部位与转化农杆菌一起进行的孵育,由此在随后的时间点同样能够获得转化的种子(Chang(1994).Plant J.5:551-558;Katavic(1994).Mol Gen Genet,245:363-370)。然而,特别有效的方法是改良的真空浸润法,如“浸花法”(floral dip)。对于拟南芥的真空浸润,减压下用农杆菌悬液处理完整植株[Bechthold,N(1993).C R Acad Sci Paris Life Sci,316:1194-1199],而对于“浸花法”,将发育中的花组织与表面活性剂处理的农杆菌悬液短暂孵育[Clough,SJ和Bent,AF(1998).The Plant J.16,735-743]。在两种情况下均收获一定比例的转基因种子,且可通过在上述选择性条件下培养而将这些种子与非转基因种子区分开来。另外,质体的稳定转化是有利的,因为质体在多数作物中为母系遗传,从而降低或消除了转基因通过花粉流失的风险。叶绿体基因组的转化通常通过Klaus等,2004[Nature Biotechnology 22(2),225-229]系统展示的方法实现。简言之,将待转化的序列与可选择的标记基因一起克隆到同源于叶绿体基因组的侧翼序列之间。这些同源侧翼序列指导转基因位点特异性整合到质体基因组中。质体转化已在许多不同的植物物种中描述,且综述由Bock(2001)Transgenic plastids in basic research and plantbiotechnology.J Mol Biol.2001年9月21日;312(3):425-38或Maliga,P(2003)Progress towards commercialization of plastid transformationtechnology.Trends Biotechnol.21,20-28给出。最近报道了其他生物技术进步,无标记的质体转化体,这可通过瞬时共整合的标记基因产生(Klaus等,2004,Nature Biotechnology 22(2),225-229)。
遗传修饰的植物细胞能够通过技术人员熟悉的所有方法再生。合适的方法可见于上述S.D.Kung和R.Wu、Potrykus或者
Figure BDA0000095416500000391
和Willmitzer的出版物。
通常在转化以后,选出存在一个或多个标记的植物细胞或细胞群,所述标记由与目的基因共转移的植物可表达基因编码,接着使转化的材料再生成整个植物。为选择转化的植物,通常将在转化中获得的植物材料置于选择性条件下,从而可将转化的植物与未转化的植物区分开来。例如,可以种植以上述方式获得的种子,并在最初的生长期之后,通过喷雾对其进行合适的选择。另一可能性方案是在使用合适的选择剂的琼脂板上生长种子(酌情在灭菌后),从而仅转化的种子能够长成植物。可选地,针对可选择标记例如上文所述标记的存在,筛选转化的植物。
DNA转移和再生之后,还可例如用Southern分析(DNA印迹),评价推定转化的植物,评价目的基因的存在、拷贝数和/或基因组构造。可选的或额外地,可用Northern和/或Western分析(蛋白质印迹)监测新引入的DNA的表达水平,这两种技术都是本领域普通技术人员所公知的。
产生的转化植物可以通过多种方式繁殖,如通过克隆繁殖或经典的育种技术。例如,第一代(或T1)转化的植物可自交,选择纯合的第二代(或T2)转化体,而T2植物可进一步通过经典育种技术繁殖。产生的转化生物体可以呈多种形式。例如,它们可以是转化细胞和非转化细胞的嵌合体;克隆的转化体(例如所有细胞已转化而含有表达盒);转化的和非转化的组织的嫁接体(例如在植物中,转化的砧木嫁接到非转化的接穗上)。
T-DNA激活标记
T-DNA激活标记(Hayashi等Science(1992)1350-1353)包括将T-DNA[通常含有启动子(也可以是翻译增强子或内含子)]插入在目的基因的基因组区或基因编码区上游或下游10kb处,从而在构型上使启动子能够指导靶基因的表达。通常破坏天然启动子对靶基因表达的调控,而使基因落入新引入的启动子的控制下。启动子一般包含于T-DNA中。此T-DNA可以例如通过农杆菌感染而随机插入植物基因组中,并导致所插入T-DNA附近的基因的表达被修饰。得到的转基因植物由于位于引入的启动子附近的基因的修饰表达而表现出显性表型。
TILLING
术语“TILLING”为“靶向诱导的基因组局部损伤”(Targeted InducedLocal Lesions In Genomes)的缩写,是一种用于生成和/或鉴定编码具有修饰的表达和/或活性的蛋白质的核酸的诱变技术。TILLING还允许选择携带此类突变变体的植物。这些突变变体可以在强度、位置或时间(例如,如果突变影响启动子的话)上呈现出修饰的表达。这些突变变体可以比其天然形式基因呈现更高的活性。TILLING将高密度诱变和高通量筛选方法结合在一起。TILLING一般遵循的步骤有:(a)EMS诱变(Redei GP和Koncz C,(1992)In Methods in Arabidopsis Research,Koncz C,Chua NH,Schell J编辑,新加坡,World Scientific Publishing Co,第16-82页;Feldmann等,(1994)In Meyerowitz EM,Somerville CR编辑,Arabidopsis.冷泉港实验室出版社,冷泉港,纽约,第137-172页;Lightner J和Caspar T,(1998)InJ Martinez-Zapater,J Salinas编辑,Methods on Molecular Biology,82卷Humana Press,Totowa,NJ,第91-104页);(b)DNA制备和个体合并;(c)目的区域的PCR扩增;(d)变性和退火以形成杂双链体;(e)DHPLC,其中合并物中存在的杂双链体在色谱图上检测为额外的峰;(f)突变个体的鉴定;和(g)突变PCR产物的测序。TILLING的方法是本领域公知的(McCallum等(2002)Nat Biotechnol 18:455-457,由Stemple综述(2004)NatRev Genet 5(2):145-50)。
同源重组
同源重组允许向基因组中的规定选定位置引入所选的核酸。同源重组是生物科学中常规用于低等生物体如酵母或剑叶藓(physcomitrella)的标准技术。在植物中进行同源重组的方法已经不仅在模式植物中描述(Offringa等(1990)EMBO J.9(10):3077-84),而且也在作物植物,如稻中描述(Terada等(2002)Nat Biotech 20(10):1030-4;Iida和Terada(2004)Curr Opin Biotechnol 15(2):132-8),并且存在无论靶生物种类的通常可应用的方法(Miller等,Nature Biotechnol.25,778-785,2007)。
产量相关性状
产量相关性状包括如下之一或多种:产量、生物量、种子产量、早期活力、绿度指数、增加的生长速率、改善的农艺性状(例如,提高的水利用效率(WUE),氮利用效率(NUE)等)。
产量
术语“产量”通常表示具有经济价值的可测量产出,其一般是与规定的作物、面积和/或时期相关的。各植物部分基于其数量、大小和/或重量对产量直接做出贡献,或者实际产量是年作物每平方米的产量,用总产量(既包括收获的产量也包括估定的产量)除以种植的平方米来确定。术语植物的“产量”可能与该植物的营养性生物质(根和/或枝条生物质)、繁殖器官、和/或繁殖体(如种子)相关。
以玉米为例,产量增加可以表现为如下一个或多个方面:每平方米建植的植物数的增加、每株植物的穗数的增加、行数、行粒数、粒重、千粒重、穗长度/直径的增加、种子饱满率(为饱满种子数除以种子总数并乘以100)的增加,等等。以稻为例,产量增加可以表现为如下一个或多个方面的增加:每平方米的植物数、每株植物的圆锥花序数、圆锥花序长度、每圆锥花序的小穗数、每圆锥花序的花朵(小花)数、种子饱满率(为饱满种子数除以种子总数并乘以100)的增加、千粒重的增加,等等。在稻中,耐淹性也可以导致增加的产量。
早期活力
“早期活力”是指活跃健康充分均衡的生长(特别是在植物生长的早期阶段),其可以因植物适应性(fitness)增强引起,例如,由于植物更好地适应其环境(即,优化能源资源的利用以及在枝条和根之间的分配)引起。具有早期活力的植物也显示出增加的幼苗存活和更佳的作物齐苗,这往往产生高均匀度的田地(作物以齐整的方式生长,即大多数植物基本上同时达到各发育阶段),以及往往是更优更高的产量。因此,早期活力可以通过测量多种因素来确定,如千粒重、萌发率、出苗率、幼苗生长、幼苗高度、根长度、根和枝条生物量,等等。
增加的生长速率
增加的生长速率可以特异于植物的一个或多个部分(包括种子),或者可以基本上遍及整株植物。具有增加生长速率的植物可以具有更短的生命周期。植物的生命周期可以理解为指,从成熟干种子生长至植物已经产生类似于起始材料的成熟干种子的阶段所需的时间。此生命周期可以受到诸如萌发速度、早期活力、生长速率、绿度指数、开花时间和种子成熟速度等因素的影响。生长速率的增加可以发生在植物生命周期的一个或多个阶段,或者发生在基本上整个植物生命周期的过程中。在植物生命周期的早期阶段,生长速率的增加可以反映出增强的活力。生长速率的增加可以改变植物的收获周期,使植物能够比原可能的情况更晚播种和/或更快收获(类似的效果可以通过较早的开花时间获得)。如果生长速率充分增加,可以允许再次播种同种植物物种的种子(例如完全在一个常规的生长期内,播种和收获稻类植物、接着再次播种和收获稻类植物)。与此类似,如果生长速率充分地增加,可以允许再播种不同植物物种的种子(例如播种和收获玉米植物,随后,例如,播种和任选的收获大豆、马铃薯或任何其他适宜的植物)。在一些作物植物的情况下也可能从同一砧木收获增加的次数。改变植物的收获周期可以导致每平方米年生物量产量的增加(这是由于(比方说在一年中)任何特定植物可以生长和收获的次数增加)。与野生型对应物相比,生长速率的增加还允许在更广阔的地域栽培转基因植物,这是因为种植作物的地域限制常由种植时(早季)或收获时(晚季)不利的环境条件所决定。如果缩短收获周期,就可以避免这类不利条件。可以通过自生长曲线获得多种参数,确定生长速率,这类参数可以是:T-Mid(植物达到其最大大小的50%所需的时间)和T-90(植物达到其最大大小的90%所需的时间)等等。
胁迫抗性
相对于对照植物,产量和/或生长速率的增加可以发生在植物处于非胁迫条件下或发生在植物暴露于各种胁迫的情况下。通常植物通过更加缓慢的生长来应答胁迫接触。在重度胁迫条件下,植物甚至可以完全停止生长。另一方面,轻度胁迫在文中定义为当植物接触时不导致植物完全停止生长且丧失重新开始生长的能力的任何胁迫。本发明意义上的轻度胁迫导致受胁迫植物的生长,与非胁迫条件下的对照植物相比,下降不到40%、35%、30%或25%、更优选下降不到20%或15%。由于农业实践(灌溉、施肥、农药处理)的发展,栽培的作物植物往往并不会遇到重度胁迫。因此,由轻度胁迫诱发的受损的生长通常成为农业中不期望的性质。轻度胁迫是植物接触的日常的生物和/或非生物(环境)胁迫。非生物胁迫可以因干旱或过量的水、缺氧胁迫、盐胁迫、化学毒性、氧化胁迫以及热、冷或冰冻温度而引起。非生物胁迫可以是由于水胁迫(特别是由于干旱)、盐胁迫、氧化胁迫或离子胁迫引起的渗透胁迫。生物胁迫一般是由病原体例如细菌、病毒、真菌、线虫和昆虫所引起的那些胁迫。
特别地,可在非胁迫条件下或在轻度干旱条件下进行本发明方法以产生相对于对照植物具有增加的产量的植物。如Wang等(Planta(2003)218:1-14)所报道的那样,非生物胁迫引起一系列的形态学、生理学、生物化学和分子变化,对植物生长和生产力造成不利影响。已知干旱、盐度、极端温度和氧化胁迫相互联系,并可以通过相似的机制诱发生长和细胞损害。Rabbani等(Plant Physiol(2003)133:1755-1767)描述了干旱胁迫和高盐度胁迫之间存在着的特别高程度的“交叉对话”。例如,干旱和/或盐度主要表现为渗透胁迫,导致破坏细胞中的稳态和离子分布。氧化胁迫通常与高温或低温、盐度或干旱胁迫相伴,可以引起功能及结构蛋白质的变性。所以,这些多种多样的环境胁迫通常激活相似的细胞信号传递通路和细胞应答,如应激蛋白的产生、抗氧化剂的上调、可混溶溶质的累积以及生长阻抑。如本文中所用的术语“非胁迫”条件是允许植物最佳生长的那些环境条件。本领域技术人员知道给定位置的正常土壤条件和气候条件。具有最佳生长条件(在非胁迫条件下生长)的植物通常按照递增的优选次序产生这样的植物在给定的环境中的平均产量的至少97%、95%、92%、90%、87%、85%、83%、80%、77%或75%。可基于收获和/或季节,计算平均产量。本领域技术人员将知晓作物的平均产量产出。
养分缺乏可以因诸如氮、磷酸及其他含磷化合物、钾、钙、镁、锰、铁和硼等养分的缺乏所致。
术语盐胁迫不局限于氯化钠(NaCl),而可以是如下之一种或多种:NaCl、KCl、LiCl、MgCl2、CaCl2等等。
增加/提高/增强
术语“增加”、“提高”或“增强”可互换,且在本申请意义上表示与文中所定义的对照植物相比,产量和/或生长多出至少3%、4%、5%、6%、7%、8%、9%或10%,优选至少15%或20%,更优选25%、30%、35%或40%。
种子产量
增加的种子产量自身可表现为如下一项或多项:a)种子生物量(种子总重量)的增加,这可以是基于单粒种子和/或每植株和/或每平方米的增加;b)每植株花数的增加;c)增加的(饱满)种子数;d)增加的种子饱满率(其表达为饱满种子数与种子总数的比率);e)增加的收获指数,其表达为可收获部分如种子的产量除以总生物量的比率;f)增加的千粒重(TKW),这通过计数饱满种子数和它们的总重量外推得到。TKW增加可来自于种子大小和/或种子重量的增加,并且也可来自胚和/或胚乳大小的增加。
种子产量的增加也可表现为种子大小和/或种子体积的增加。此外,种子产量的增加自身也可表现为种子面积和/或种子长度和/或种子宽度和/或种子周长的增加。增加的产量也可以导致改变的构造,或可以因改变的构造而发生。
绿度指数
如本文所用的“绿度指数”根据植物的数字图像计算。对于图像中属于植物目标的每一个像素,计算绿值相对于红值之比(在RGB模型中用于色度编码)。绿度指数表达为绿红比超过给定阈值的像素百分比。在正常生长条件下、在盐胁迫生长条件下、在养分可利用度下降的生长条件下,在开花前的末次成像中测量植物绿度指数。相反,在干旱胁迫生长条件下,在干旱后的首次成像中测量植物绿度指数。
标记辅助育种
这类育种程序有时需要使用例如EMS诱变,通过植物诱变处理引入等位基因变异;可选的,此类程序可以起始于一系列无意产生的所谓“天然”起源的等位基因变体。然后通过例如PCR进行等位基因变体的鉴定。随后是选择步骤,用以选择所讨论序列的较好等位基因变体,该变体提供增加的产量。一般通过监测含有所讨论序列的不同等位基因变体的植物的生长行为来进行选择。可以在温室或田地中监测生长行为。更多任选的步骤包括使经鉴定含有较好等位基因变体的植物与另一植物杂交。例如,可使用这种方法产生感兴趣表型特征的组合。
在(遗传作图)中用作探针
利用编码目的蛋白质的核酸进行基因的遗传和物理作图仅需要长度至少15个核苷酸的核酸序列。此类核酸可以用作限制性片段长度多态性(RFLP)标记。可以用编码目的蛋白质的核酸探测限制酶切消化的植物基因组DNA的Southern印迹(Sambrook J,Fritsch EF和Maniatis T(1989)《分子克隆:实验室手册》)。随后使用计算机程序如MapMaker(Lander等(1987)Genomics 1:174-181)对产生的带型进行遗传分析,以构建遗传图谱。另外,可以使用所述核酸探测含有一组如下个体的限制性内切酶处理的基因组DNA的Southern印迹,所述该组个体为规定的遗传杂交的亲本和子代。记录DNA多态性的分离,并用于计算编码目的蛋白质的核酸在先前用此群体所获得的遗传图谱中的位置(Botstein等(1980)Am.J.Hum.Genet.32:314-331)。
有关在遗传作图中使用的植物基因衍生探针的产生和使用,描述于Bernatzky和Tanksley(1986)Plant Mol.Biol.Reporter 4:37-41中。众多出版物中描述过用上述方法或其变通形式对特定cDNA克隆进行的遗传作图。例如,可以使用F2杂交群体、回交群体、随机交配群体、近等基因系和其它个体组作图。这类方法是本领域技术人员公知的。
核酸探针也可以用来进行物理作图(即在物理图谱上安置序列;参见Hoheisel等In:Non-mammalian Genomic Analysis:A Practical Guide,Academic press 1996,第319-346页,及其中引用的参考文献)。
在另一个实施方案中,核酸探针可用于直接荧光原位杂交(FISH)作图(Trask(1991)Trends Genet.7:149-154)。尽管目前FISH作图的方法倾向使用大的克隆(几个kb到几百个kb;参见Laan等(1995)Genome Res.5:13-20),但是灵敏性的提高可以允许在FISH作图中应用较短的探针。
用于遗传和物理作图的多种基于核酸扩增的方法可以使用所述核酸序列进行。实例包括等位基因特异性扩增(Kazazian(1989)J.Lab.Clin.Med11:95-96)、PCR扩增片段的多态性(CAPS;Sheffield等(1993)Genomics16:325-332)、等位基因特异性连接(Landegren等(1988)Science 241:1077-1080)、核苷酸延伸反应(Sokolov(1990)Nucleic Acid Res.18:3671)、放射杂交作图(Walter等(1997)Nat.Genet.7:22-28)和Happy作图(Dear和Cook(1989)Nucleic Acid Res.17:6795-6807)。为实施这些方法,使用核酸的序列设计和产生用于扩增反应或引物延伸反应的引物对。这类引物的设计是本领域技术人员公知的。在采用基于PCR的遗传作图的方法中,可能需要鉴定作图杂交的亲本之间在相应于本发明核酸序列的区域中的DNA序列差异。然而,这对作图方法通常不是必要的。
植物
本文所用术语“植物”涵盖整株植物、植物的祖先和后代以及植物部分,包括种子、枝条、茎、叶、根(包括块茎)、花以及组织和器官,其中上述每一种都含有目的基因/核酸。术语“植物”也涵盖植物细胞、悬浮培养物、愈伤组织、胚、分生组织区、配子体、孢子体、花粉和小孢子,同样其中上述每一种都含有目的基因/核酸。
尤其可用于本发明方法的植物包括属于植物界(Viridiplantae)超家族的所有植物,尤其是单子叶植物和双子叶植物,包括饲料或饲料豆科植物、观赏植物、粮食作物、乔木或灌木,选自包括如下的列表:槭树属物种(Acerspp.)、猕猴桃属物种(Actinidia spp.)、秋葵属物种(Abelmoschus spp.)、剑麻(Agave sisalana)、冰草属物种(Agropyron spp.)、匍茎剪股颖(Agrostisstolonifera)、葱芹属物种(Allium spp.)、苋属物种(Amaranthus spp.)、滨草(Ammophila arenaria)、凤梨(Ananas comosus)、番荔枝属物种(Annonaspp.)、芹菜(Apium graveolens)、落花生属物种(Arachis spp.)、木波罗属物种(Artocarpus spp.)、石刁柏(Asparagus officinalis)、燕麦属物种(Avenaspp.)(如燕麦(Avena sativa)、野燕麦(Avena fatua)、比赞燕麦(Avenabyzantina)、Avena fatua var.sativa、杂种燕麦(Avena hybrida))、阳桃(Averrhoa carambola)、筋竹属物种(Bambusa sp.)、冬瓜(Benincasahispida)、巴西栗(Bertholletia excelsea)、甜菜(Beta vulgaris)、芸苔属物种(Brassica spp.)(如欧洲油菜(Brassica napus)、甘蓝型油菜(Brassica rapassp.)[芸苔、油菜籽油菜、芜菁])、Cadaba farinosa、大叶茶(Camelliasinensis)、美人蕉(Canna indica)、大麻(Cannabis sativa)、辣椒属物种(Capsicum spp.)、苔草(Carex elata)、番木瓜(Carica papaya)、大果假虎刺(Carissa macrocarpa)、山核桃属物种(Carya spp.)、红花(Carthamustinctorius)、栗属物种(Castanea spp.)、Ceiba pentandra、苦苣(Cichoriumendivia)、樟属物种(Cinnamomum spp.)、西瓜(Citrullus lanatus)、柑橘属物种(Citrus spp.)、椰子属物种(Cocos spp.)、咖啡属物种(Coffea spp.)、芋(Colocasia esculenta)、可拉属物种(Cola spp.)、黄麻属物种(Corchorus sp.)、芫荽(Coriandrum sativum)、榛属物种(Corylus spp.)、山楂属物种(Crataegus spp.)、番红花(Crocus sativus)、南瓜属物种(Cucurbita spp.)、香瓜属物种(Cucumis spp.)、菜蓟属物种(Cynara spp.)、胡萝卜(Daucuscarota)、山马蟥属物种(Desmodium spp.)、龙眼(Dimocarpus longan)、薯蓣属物种(Dioscorea spp.)、柿树属物种(Diospyros spp.)、稗属物种(Echinochloa spp.)、油棕属(Elaeis)(如非洲油棕(Elaeis guineensis)、美洲油棕(Elaeis oleifera))、穇子(Eleusine coracana)、埃塞俄比亚画眉草(Eragrostis tef)、蔗茅属物种(Erianthus sp.)、枇杷(Eriobotrya japonica)、桉属物种(Eucalyptus sp)、红仔果(Eugenia uniflora)、荞麦属物种(Fagopyrum spp.)、山毛榉属物种(Fagus spp.)、苇状羊茅(Festucaarundinacea)、无花果(Ficus carica)、金桔属物种(Fortunella spp.)、草莓属物种(Fragaria spp.)、银杏(Ginkgo biloba)、大豆属物种(Glycine spp.)(如大豆(Glycine max)、黄豆(Soja hispida)或大豆(Soja max))、陆地棉(Gossypium hirsutum)、向日葵属物种(Helianthus spp.)(如向日葵(Helianthus annus))、萱草(Hemerocallis fulva)、木槿属物种(Hibiscus spp.)、大麦属物种(Hordeum spp.)(如大麦(Hordeum vulgare))、甘薯(Ipomoeabatatas)、核桃属物种(Juglans spp.)、莴苣(Lactuca sativa)、山黧豆属物种(Lathyrus spp.)、兵豆(Lens culinaris)、亚麻(Linum usitatissimum)、荔枝(Litchi chinensis)、百脉根属物种(Lotus spp.)、棱角丝瓜(Luffa acutangula)、羽扇豆属物种(Lupinus spp.)、地杨梅(Luzula sylvatica)、番茄属物种(Lycopersicon spp.)(如番茄(Lycopersicon esculentum、Lycopersiconlycopersicum、Lycopersicon pyriforme)、硬皮豆属物种(Macrotylomaspp.)、苹果属物种(Malus spp.)、西印度樱桃(Malpighia emarginata)、曼密苹果(Mammea americana)、芒果(Mangifera indica)、木薯属物种(Manihotspp.)、人心果(Manilkara zapota)、紫花苜蓿(Medicago sativa)、草木樨属物种(Melilotus spp.)、薄荷属物种(Mentha spp.)、芒(Miscanthus sinensis)、苦瓜属物种(Momordica spp.)、黑桑(Morus nigra)、芭蕉属物种(Musaspp.)、烟草属物种(Nicotiana spp.)、木犀榄属物种(Olea spp.)、仙人掌属物种(Opuntia spp.)、Ornithopus spp.、稻属物种(Oryza spp.)(如稻(Oryzasativa),阔叶稻(Oryza latifolia))、黍糜(Panicum miliaceum)、柳枝稷(Panicum virgatum)、鸡蛋果(Passiflora edulis)、欧防风(Pastinaca sativa)、狼尾草属物种(Pennisetum sp.)、鳄梨属物种(Persea spp.)、香芹(Petroselinum crispum)、虉草(Phalaris arundinacea)、菜豆属物种(Phaseolus spp.)、梯牧草(Phleum pratense)、刺葵属物种(Phoenix spp.)、南方芦苇(Phragmites australis)、酸浆属物种(Physalis spp.)、松属物种(Pinus spp.)、阿月浑子(Pistacia vera)、豌豆属物种(Pisum spp.)、早熟禾属物种(Poa spp.)、杨属物种(Populus spp.)、牧豆树属物种(Prosopis spp.)、李属物种(Prunus spp.)、番石榴属物种(Psidium spp.)、石榴(Punicagranatum)、西洋梨(Pyrus communis)、栎属物种(Quercus spp.)、萝卜(Raphanus sativus)、波叶大黄(Rheum rhabarbarum)、茶藨子属物种(Ribesspp.)、蓖麻(Ricinus communis)、悬钩子属物种(Rubus spp.)、甘蔗属物种(Saccharum spp.)、柳属物种(Salix sp.)、接骨木属物种(Sambucus spp.)、黑麦(Secale cereale)、胡麻属物种(Sesamum spp.)、白芥属物种(Sinapis sp.)、茄属物种(Solanum spp.)(如马铃薯(Solanum tuberosum)、红茄(Solanumintegrifolium)或番柿(Solanum lycopersicum))、两色蜀黍(Sorghumbicolor)、菠菜属物种(Spinacia spp.)、蒲桃属物种(Syzygium spp.)、万寿菊属物种(Tagetes spp.)、酸豆(Tamarindus indica)、可可树(Theobromacacao)、车轴草属物种(Trifolium spp.)、鸭茅状磨擦禾(Tripsacumdactyloides)、小黑麦(Triticosecale rimpaui)、小麦属物种(Triticum spp.)(如小麦(Triticum aestivum)、硬粒小麦(Triticum durum)、圆锥小麦(Triticumturgidum)、Triticum hybernum、马卡小麦(Triticum macha)、面包小麦(Triticum sativum)、一粒小麦(Triticum monococcum)或普通小麦(Triticum vulgare))、小金莲花(Tropaeolum minus)、旱金莲(Tropaeolummajus)、越桔属物种(Vaccinium spp.)、野豌豆属物种(Vicia spp.)、豇豆属物种(Vigna spp.)、香堇菜(Viola odorata)、葡萄属物种(Vitis spp.)、玉蜀黍(Zea mays)、北美洲野生稻(Zizania palustris)、枣属物种(Ziziphus spp.)等等。
对照植物
选择适宜的对照植物是实验设置的常规部分,并且可以包括相应的野生型植物或不含目的基因的相应植物。对照植物一般与待评估植物为相同的植物物种,或者甚至为同一品种。对照植物还可以是待评估植物的无效合子。无效合子是因分离而失去转基因的个体。如本文所用的“对照植物”不仅指完整植物,而且还指植物部分,包括种子和种子部分。
发明详述
现已令人惊讶地发现,在植物中调节编码HSFA4或HSFA5多肽的核酸的表达可以产生相对于对照植物具有增强的产量相关性状的植物。根据第一实施方案,本发明提供了相对于对照植物增强植物的产量相关性状的方法,包括调节编码HSFA4或HSFA5多肽的核酸在植物中的表达和/或调节HSFA4蛋白的水平和/或活性以及任选地选择具有增强的产量相关性状的植物。
此外,现已令人惊讶地发现,在植物中调节编码OPT4样多肽的核酸的表达可以产生相对于对照植物具有增强的产量相关性状的植物。
本发明还提供了迄今未知的OPT4样核酸和多肽序列。
提供了分离的核酸分子,其包含:
(a)SEQ ID NO:189或SEQ ID NO:191所示的核酸;
(b)SEQ ID NO:189或SEQ ID NO:191所示的核酸的互补序列;
(c)编码OPT4样多肽的核酸,所述多肽包含基序1:NPG和基序II:KIPPR,并且按照递增的优选次序与SEQ ID NO:190或SEQ ID NO:192所示的氨基酸序列具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的序列同一性。
还提供了分离的多肽,其包含:
(a)SEQ ID NO:190或SEQ ID NO:192所示的氨基酸序列;
(b)包含基序I:NPG和基序II:KIPPR的氨基酸序列,所述氨基酸序列按照递增的优选次序与SEQ ID NO:190或SEQ ID NO:192所示的氨基酸序列具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的序列同一性;
(c)上文(i)或(ii)所给出的任何氨基酸序列的衍生物。
根据一个实施方案,本发明提供了相对于对照植物增强植物的产量相关性状的方法,包括调节编码OPT4样多肽的核酸在植物中的表达和任选地选择具有增强的产量相关性状的植物。
此外,现已令人惊讶地发现,在植物中调节编码PLA2样多肽的核酸的表达可以产生相对于对照植物具有增强的产量相关性状的植物。根据第一实施方案,本发明提供了相对于对照植物增强植物的产量相关性状的方法,包括调节编码PLA2样多肽的核酸在植物中的表达和任选地选择具有增强的产量相关性状的植物。
现已令人惊讶地发现,在植物中调节编码WOX1样多肽的核酸的表达可以产生相对于对照植物具有增强的产量相关性状的植物。根据第一实施方案,本发明提供了相对于对照植物增强植物的产量相关性状的方法,包括调节编码WOX1样多肽的核酸在植物中的表达和任选地选择具有增强的产量相关性状的植物。
用于调节编码HSFA4或HSFA5多肽、或OPT4样多肽、或PLA2样多肽或WOX1样多肽的核酸的表达的一个优选方法是,向植物中引入和表达编码HSFA4或HSFA5多肽、或OPT4样多肽、或PLA2样多肽或WOX1样多肽或其部分的核酸。
关于HSD多肽,在一个优选实施方案中,编码HSFA5的核酸的表达的调节包括增加所述核酸的表达。
在另一个优选实施方案中,编码HSFA4的核酸的表达的调节包括减少或降低或基本上消除所述核酸的表达。
在一个优选实施方案中,用于在所述植物中减少或降低或基本上消除内源HSFA4基因的表达和/或HSFA4蛋白的水平和/或活性的方法包括,引入和表达寡核苷酸,所述寡核苷酸按照递增的优选次序与内源HSFA4基因,优选表A1的任一HSFA4核酸,更优选SEQ ID NO:37所示的核酸,的任何给定的连续15-20,20-50,50-100,100-200,200-250或更多个核苷酸基本上相同。
关于HSF多肽,下文中对“用于本发明方法的蛋白质”的任何提及,均旨在指如本文中定义的HSFA4或HSFA5多肽。下文中对“用于本发明方法的核酸”的任何提及,均旨在指能够编码这样的HSFA4或HSFA5多肽的核酸。待引入植物中(并因此可以用于实施本发明方法)的核酸是编码现将进行描述的此类蛋白质的任何核酸,在下文中也称为“HSFA4或HSFA5核酸”或“HSFA4或HSFA5基因”。
关于OPT4样多肽,下文中对“用于本发明方法的蛋白质”的任何提及,均旨在指如本文中定义的OPT4样多肽。下文中对“用于本发明方法的核酸”的任何提及,均旨在指能够编码这样的OPT4样多肽的核酸。待引入植物中(并因此可以用于实施本发明方法)的核酸是编码现将进行描述的此类蛋白质的任何核酸,在下文中也称为“OPT4样核酸”或“OPT4样基因”。
关于PLA2样多肽,下文中对“用于本发明方法的蛋白质”的任何提及,均旨在指如本文中定义的PLA2样多肽。下文中对“用于本发明方法的核酸”的任何提及,均旨在指能够编码这样的PLA2样多肽的核酸。待引入植物中(并因此可以用于实施本发明方法)的核酸是编码现将进行描述的此类蛋白质的任何核酸,在下文中也称为“PLA2样核酸”或“PLA2样基因”。
关于WOX1样多肽,下文中对“用于本发明方法的蛋白质”的任何提及,均旨在指如本文中定义的WOX1样多肽。下文中对“用于本发明方法的核酸”的任何提及,均旨在指能够编码这样的WOX1样多肽的核酸。待引入植物中(并因此可以用于实施本发明方法)的核酸是编码现将进行描述的此类蛋白质的任何核酸,在下文中也称为“WOX1样核酸”或“WOX1样基因”。
如本文中定义的“A4和A5类热休克因子(HSFA4和HSFA5)多肽”是指包含结构域或基序的任何多肽,所述结构域或基序按照递增的优选次序与
i)SEQ ID NO:47至SEQ ID NO:70(DNA结合结构域);和
ii)SEQ ID NO:71至SEQ ID NO:94(寡聚化结构域);和
iii)SEQ ID NO:95至SEQ ID NO:118(活化AHA基序);和
iv)其中所述多肽是HSFA5多肽:
a.SEQ ID NO:119至SEQ ID NO:127(HSF5A基序I);和/或
b.SEQ ID NO:128至SEQ ID NO:136(HSF5A基序II);和
v)其中所述多肽是HSF4A多肽:
a.SEQ ID NO:137至SEQ ID NO:151(HSF4A基序I)所示的氨基酸具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的全序列同一性。
此外,用于本发明方法的热休克因子能够结合热应激诱导型基因的启动子中的热休克元件。启动子中的热休克元件包含回文序列,由一个或多个,优选至少2、5、10、15、20、25、30、35、40、45、50、55、60、70、80、90和100个核苷酸分隔开的AGAA和TTCT。
优选,热休克因子包含由Interpro登录号IPR000232和/或Pfam登录号PF00447表征的HSF DNA结合结构域。
可选地,HSFA4或HSFA5蛋白的同源物按照递增的优选次序与SEQID NO:2(对于HSFA5同源物)或SEQ ID NO:38(对于HSFA4同源物)所示的氨基酸具有至少25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的全序列同一性,条件是同源蛋白质包含上文所列的保守基序。可以使用全局比对算法,例如程序GAP(GCG Wisconsin Package,Accelrys)中的Needleman Wunsch算法,优选利用缺省参数和优选利用成熟蛋白质的序列(即,不考虑分泌信号或转运肽),确定全序列同一性。与全序列同一性相比,当只考虑保守结构域或基序时,序列同一性通常更高。对于局部比对,Smith-Waterman算法是特别有用的(Smith TF,Waterman MS(1981)J.Mol.Biol 147(1);195-7)。
优选,所述多肽序列,当用于构建拟南芥、番茄和稻HSF的系统发生树,例如Koskill-Doring等.2007中和图2中描述的系统发生树时,聚类在由AtA4a,AtA4b,AtA4c,OsA4b,OsA4d和LeA4b多肽(对于HSFA4多肽)确定的A4进化枝中或聚类在由AtA5,OsA5和LeA5多肽(对于HSFA5多肽)确定的A5进化枝中。
如本文中定义的“OPT4样多肽”是指包含如下定义的基序I和基序II的任何多肽。
基序I:NPG
基序II:KIPPR
优选,OPT4样多肽,当用于构建系统发生树,例如图5中描述的系统发生树时,与由进化枝I、II、III或IV定义的OPT4样多肽的组,最优选与包含SEQ ID NO:156所示的氨基酸序列的进化枝聚类。
OPT4样多肽通常具有OPT(寡肽转运蛋白)活性。此活性可如Osawa等.,2006(Biochem J.2006 Jan 1;393(Pt 1):267-75)中所述进行测量。
OPT4样多肽的另一特征是它们是膜定位蛋白。
可选地或此外,OPT4样蛋白按照递增的优选次序与SEQ ID NO:156所示的氨基酸或本文实施例部分表A2提供的任何多肽序列具有至少25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的全序列同一性。可以使用全局比对算法,例如程序GAP(GCG Wisconsin Package,Accelrys)中的Needleman Wunsch算法,优选利用缺省参数和优选利用成熟蛋白质的序列(即,不考虑分泌信号或转运肽),确定全序列同一性。与全序列同一性相比,当只考虑保守结构域或基序时,序列同一性通常更高。对于局部比对,Smith-Waterman算法是特别有用的(Smith TF,Waterman MS(1981)J.Mol.Biol 147(1);195-7)。
如本文中定义的“PLA2样多肽”是指包含RNA识别基序2和基序III:T[TS][VL][MI][IV][KR]NIPN的任何多肽。
优选基序III为:TTVMIKNIPN。
PLA2样多肽可额外地包含基序IV和/或基序V。
基序IV:SP[PA]RDG
优选基序IV为:SPPRDG
基序V:NK[CS]NVGYGFVN[ML]TSP[QE]A
优选基序V为:NKCNVGYGFVNMTSPQA
可选地或此外,PLA2样蛋白按照递增的优选次序与SEQ ID NO:253所示的氨基酸具有至少25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的全序列同一性并且包含RNA识别基序2和基序III:T[TS][VL][MI][IV][KR]NIPN。优选,PLA2样蛋白还包含基序IV和/或V。
可以使用全局比对算法,例如程序GAP(GCG Wisconsin Package,Accelrys)中的Needleman Wunsch算法,优选利用缺省参数和优选利用成熟蛋白质的序列(即,不考虑分泌信号或转运肽),确定全序列同一性。与全序列同一性相比,当只考虑保守结构域或基序时,序列同一性通常更高。对于局部比对,Smith-Waterman算法是特别有用的(Smith TF,Waterman MS(1981)J.Mol.Biol 147(1);195-7)。
优选,所述多肽序列,当用于构建系统发生树,例如图8中描述的系统发生树时,与进化枝C或进化枝D的序列,优选与PLA2进化枝或PLA2b进化枝,最优选与SEQ ID NO:253所示的氨基酸序列聚类。
如本文中定义的“WOX1样多肽”是指包含同源域的任何多肽,所述同源域由基序VI:WNPTPEQLRTLEDLYRRGTRAPSTDQIQDITAQLRRYGRIEGKNVFYWFQNHKARERQK或按照递增的优选次序与基序VI具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的序列同一性的基序表示。
此外,WOX1样多肽可以包含如下一个或多个基序:
基序VII:KNWAPS或按照递增的优选次序与基序VII具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的序列同一性的基序。
基序VIII:QTLQPFPLR或按照递增的优选次序与基序VIII具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的序列同一性的基序。基序VIII为WUS样基序但不具有与EAR基序接近的LELxL阻遏物基序。
基序IX:FEFLPLKH或按照递增的优选次序与基序IX具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的序列同一性的基序。
可选地,WOX1样蛋白的同源物按照递增的优选次序与SEQ ID NO:374所示的氨基酸具有至少25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的全序列同一性并且包含如上定义的基序I和优选地基序VII、VIII和IX的任一个或多个。
可以使用全局比对算法,例如程序GAP(GCG Wisconsin Package,Accelrys)中的Needleman Wunsch算法,优选利用缺省参数和优选利用成熟蛋白质的序列(即,不考虑分泌信号或转运肽),确定全序列同一性。与全序列同一性相比,当只考虑保守结构域或基序时,序列同一性通常更高。对于局部比对,Smith-Waterman算法是特别有用的(Smith TF,Waterman MS(1981)J.Mol.Biol 147(1);195-7)。
优选地,所述多肽序列,当用于构建系统发生树,例如图11中描述的系统发生树时,与包含SEQ ID NO:374所示的氨基酸序列的WOX1样多肽的组而非任何其他组聚类。
术语“结构域”、“标签序列”和“基序”在本文“定义”部分定义。存在用于鉴定结构域的专家数据库,例如SMART(Schultz等(1998)Proc.Natl.Acad.Sci.USA 95,5857-5864;Letunic等(2002)Nucleic Acids Res 30,242-244)、InterPro(Mulder等,(2003)Nucl.Acids.Res.31,315-318)、Prosite(Bucher和Bairoch(1994),A generalized profile syntax forbiomolecular sequences motifs and its function in automatic sequenceinterpretation.(In)ISMB-94;第二届分子生物学智能系统国际会议记录(Proceedings 2nd International Conference on Intelligent Systems forMolecular Biology)Altman R.,Brutlag D.,Karp P.,Lathrop R.,Searls D.编辑,53-61页,AAAIPress,Menlo Park;Hulo等,Nucl.Acids.Res.32:D134-D137,(2004))或者Pfam(Bateman等,Nucleic Acids Research 30(1):276-280(2002))。进行蛋白质序列芯片(in silico)分析的一组工具可以从ExPASy蛋白质组学服务器获得(瑞士生物信息学研究所(Swiss Institute ofBioinformatics)(Gasteiger等ExPASy:the proteomics server for in-depthprotein knowledge and analysis.Nucleic Acids Res 31:3784-3788(2003))。结构域或基序也可以利用常规技术例如通过序列比对来鉴定。
为比较而进行序列比对的方法是本领域公知的,此类方法包括GAP、BESTFIT、BLAST、FASTA和TFASTA。GAP使用Needleman和Wunsch的算法((1970)J.Mol.Biol.48:443-453)来寻找两序列之间匹配数最大化且空位数最小化的全局(即跨越完整序列)的比对。BLAST算法(Altschul等(1990)J Mol Biol 215:403-10)计算序列同一性百分比,并对两序列之间的相似性进行统计学分析。执行BLAST分析的软件可通过美国国家生物技术信息中心(NCBI)公开地获得。同源物可以例如,使用ClustalW多重序列比对算法(1.83版),采用默认的成对比对参数以及百分比的记分方法而容易地鉴定。利用可获自MatGAT软件包(Campanella等,(2003)BMCBioinformatics.10:29.2003 Jul 10;4:29.MatGAT:an application thatgenerates similarity/identity matrices using protein or DNA sequences)的方法之一,也可以确定全局相似性和同一性百分比。可以进行微小的人工编辑以优化保守基序之间的比对,这对于所属领域的技术人员而言将是显而易见的。此外,除了利用全长序列进行同源物鉴定以外,还可以利用特定的结构域。可以利用上述程序采用默认参数针对完整核酸或氨基酸序列或者选择的结构域或保守基序来确定序列同一性值。对于局部比对,Smith-Waterman算法是特别有用的(Smith TF,Waterman MS(1981)J.Mol.Biol 147(1);195-7)。
此外,HSFA4和HSFA5多肽通常具有DNA结合活性,能够结合可以是天然或合成来源的启动子中的热应激元件。测量DNA结合活性的工具和技术在本领域内是公知的。HSFA4和HSFA5多肽的活性可基本上如Baniwal等.2007中所述进行评估。此外,HSFA4和HSFA5多肽显示蛋白质结合活性,从而HSFA4能够结合HSFA5。用于测定蛋白质之间的物理相互作用的方法在本领域内是公知的。HSFA4与HSFA5多肽之间的结合可基本上如Baniwal等;2007所述来测定。
此外,HSFA4或HSFA5多肽,当如实施例部分中所述的按照本发明方法在稻中表达时,产生具有增强的产量相关性状的植物,所述性状优选选自增加的种子总重量(totalwgseeds)、饱满种子数(nrfilledseed)、种子饱满率(fillrate)、收获指数(harvestindex)、千粒重和一级圆锥花序数。
Figure BDA0000095416500000601
此外,HSFA4或HSFA5多肽可显示优选的亚细胞定位,通常在细胞核、细胞质、叶绿体或线粒体之一个或多个中。预测蛋白质亚细胞定位的任务非常重要并进行了充分研究。知晓蛋白质的定位有助于阐释其功能。用于蛋白质定位的实验方法范围广泛,从免疫定位到利用绿色荧光蛋白(GFP)或β-葡糖醛酸糖苷酶(GUS)标记蛋白质。与计算方法相比,此类方法虽然劳动量大但精确。最近在根据序列数据计算预测蛋白质定位方面取得了很大进步。从瑞士生物信息学研究所托管的ExPASy蛋白质组学工具可获得本领域技术人员公知的算法,例如PSort、TargetP、ChloroP、LocTree、Predotar、LipoP、MITOPROT、PATS、PTS1、SignalP、TMHMM和其他。
优选,用于本发明方法的HSFA4或HSFA5多肽在热处理包含该HSF的细胞时定位至细胞核。
此外,OPT4样多肽,当如实施例部分所述根据本发明的方法在稻中表达时,产生具有增强的产量相关性状的植物。
此外,PLA2样多肽,当如实施例部分中所述根据本发明的方法在稻中表达时,产生具有增强的植物相关性状,特别是增加的种子产量的植物。
此外,PLA2样多肽可显示优选的亚细胞定位,典型地是叶绿体定位。用于蛋白质定位的实验方法范围广泛,从免疫定位到利用绿色荧光蛋白(GFP)或β-葡糖醛酸糖苷酶(GUS)标记蛋白质。与计算方法相比,此类方法虽然劳动量大但精确。最近在根据序列数据计算预测蛋白质定位方面取得了很大进步。从瑞士生物信息学研究所托管的ExPASy蛋白质组学工具可获得本领域技术人员公知的一些算法,例如PSort、TargetP、ChloroP、LocTree、Predotar、LipoP、MITOPROT、PATS、PTS1、SignalP、TMHMM和其他。
此外,WOX1样多肽,当如实施例部分中所述根据本发明的方法在稻中表达时,产生具有增强的产量相关性状,特别是增加的种子产量的植物。
此外,WOX1样多肽可显示优选的亚细胞定位,通常为细胞核、细胞质、叶绿体或线粒体中的一种或多种。最近在根据序列数据计算预测蛋白质定位方面取得了很大进步。从瑞士生物信息学研究所托管的ExPASy蛋白质组学工具可获得本领域技术人员公知的一些算法,例如PSort、TargetP、ChloroP、LocTree、Predotar、LipoP、MITOPROT、PATS、PTS1、SignalP、TMHMM和其他。
关于HSF多肽,本发明以编码SEQ ID NO:2的多肽序列的SEQ IDNO:1所示核酸序列转化植物来进行举例说明。然而,本发明的实施并不局限于这些序列;本发明的方法可以有利地利用本文所定义的任何HSFA4或HSFA5编码核酸或HSFA4或HSFA5多肽来实施。
编码HSFA4或HSFA5多肽的核酸的实例在本文实施例部分表A1中给出。这样的核酸可用于实施本发明的方法。实施例部分表A1所给出的氨基酸序列为SEQ ID NO:20、22、24、26、28、30、32、34、36、38、40、42、44、46之任一所示的HSFA4多肽或SEQ ID NO:2、4、6、8、10、12、14、16和18之任一所示的HSFA5多肽的直向同源物和旁系同源物的示例序列,其中术语“直向同源物”和“旁系同源物”如本文所定义。其他的直向同源物和旁系同源物可以通过进行所谓的交互BLAST搜索,容易地找到。通常,这包括一次BLAST,即以查询序列(例如,利用实施例部分表A1中所列的任何序列)针对任何序列数据库如可公共获得的NCBI数据库进行BLAST。当从核苷酸序列开始时,通常使用BLASTN或TBLASTX(利用标准默认值),而当从蛋白质序列开始时,则使用BLASTP或TBLASTN(利用标准默认值)。BLAST结果可以任选地过滤。接着使用过滤的结果或者未过滤的结果中的全长序列针对查询序列来源生物的序列进行反向BLAST(二次BLAST)(在查询序列为SEQ ID NO:1或SEQ IDNO:2的情况下,二次BLAST因此将会针对蒺藜苜蓿(Medicago truncatula)序列进行)。然后比较一次和二次BLAST的结果。如果一次BLAST中分值靠前的命中事件来自查询序列源自的相同物种,而理想地反向BLAST导致查询序列在最高命中事件中,则鉴定到了旁系同源物;如果一次BLAST中分值靠前的命中事件不是来自查询序列源自的相同物种,且优选地反向BLAST导致查询序列处于最高命中事件之列,则找到了直向同源物。
关于OPT4样多肽,本发明以编码SEQ ID NO:156的多肽序列的SEQID NO:155所示核酸序列转化植物来进行举例说明。然而,本发明的实施并不局限于这些序列;本发明的方法可以有利地利用本文所定义的任何OPT4样编码核酸或OPT4样多肽来实施。
编码OPT4样多肽的核酸的实例在本文实施例部分表A2中给出。这样的核酸可用于实施本发明的方法。实施例部分表A2所给出的氨基酸序列为SEQ ID NO:156所示OPT4样多肽的直向同源物和旁系同源物的示例序列,其中术语“直向同源物”和“旁系同源物”如本文所定义。其他的直向同源物和旁系同源物可以通过进行所谓的交互BLAST搜索,容易地找到。通常,这包括一次BLAST,即以查询序列(例如,利用实施例部分表A2中所列的任何序列)针对任何序列数据库如可公共获得的NCBI数据库进行BLAST。当从核苷酸序列开始时,通常使用BLASTN或TBLASTX(利用标准默认值),而当从蛋白质序列开始时,则使用BLASTP或TBLASTN(利用标准默认值)。BLAST结果可以任选地过滤。接着使用过滤的结果或者未过滤的结果中的全长序列针对查询序列来源生物的序列进行反向BLAST(二次BLAST)(在查询序列为SEQ ID NO:155或SEQ ID NO:156的情况下,二次BLAST因此将会针对拟南芥(Arabidopsis)序列进行)。然后比较一次和二次BLAST的结果。如果一次BLAST中分值靠前的命中事件来自查询序列源自的相同物种,而理想地反向BLAST导致查询序列在最高命中事件中,则鉴定到了旁系同源物;如果一次BLAST中分值靠前的命中事件不是来自查询序列源自的相同物种,且优选地反向BLAST导致查询序列处于最高命中事件之列,则找到了直向同源物。
关于PLA2样多肽,本发明以编码SEQ ID NO:253的多肽序列的SEQID NO:252所示核酸序列转化植物来进行举例说明。然而,本发明的实施并不局限于这些序列;本发明的方法可以有利地利用本文所定义的任何PLA2样编码核酸或PLA2样多肽来实施。
编码PLA2样多肽的核酸的实例在本文实施例部分表A3中给出。这样的核酸可用于实施本发明的方法。实施例部分表A3所给出的氨基酸序列为SEQ ID NO:253所示PLA2样多肽的直向同源物和旁系同源物的示例序列,其中术语“直向同源物”和“旁系同源物”如本文所定义。其他的直向同源物和旁系同源物可以通过进行所谓的交互BLAST搜索,容易地找到。通常,这包括一次BLAST,即以查询序列(例如,利用实施例部分表A3中所列的任何序列)针对任何序列数据库如可公共获得的NCBI数据库进行BLAST。当从核苷酸序列开始时,通常使用BLASTN或TBLASTX(利用标准默认值),而当从蛋白质序列开始时,则使用BLASTP或TBLASTN(利用标准默认值)。BLAST结果可以任选地过滤。接着使用过滤的结果或者未过滤的结果中的全长序列针对查询序列来源生物的序列进行反向BLAST(二次BLAST)(在查询序列为SEQ ID NO:252或SEQ ID NO:253的情况下,二次BLAST因此将会针对杨树(poplar)序列进行)。然后比较一次和二次BLAST的结果。如果一次BLAST中分值靠前的命中事件来自查询序列源自的相同物种,而理想地反向BLAST导致查询序列在最高命中事件中,则鉴定到了旁系同源物;如果一次BLAST中分值靠前的命中事件不是来自查询序列源自的相同物种,且优选地反向BLAST导致查询序列处于最高命中事件之列,则找到了直向同源物。
关于WOX1样多肽,本发明以编码SEQ ID NO:374的多肽序列的SEQ ID NO:373所示核酸序列转化植物来进行举例说明。然而,本发明的实施并不局限于这些序列;本发明的方法可以有利地利用本文所定义的任何WOX1样编码核酸或WOX1样多肽来实施。
编码WOX1样多肽的核酸的实例在本文实施例部分表A4中给出。这样的核酸可用于实施本发明的方法。实施例部分表A4所给出的氨基酸序列为SEQ ID NO:374所示WOX1样多肽的直向同源物和旁系同源物的示例序列,其中术语“直向同源物”和“旁系同源物”如本文所定义。其他的直向同源物和旁系同源物可以通过进行所谓的交互BLAST搜索,容易地找到。通常,这包括一次BLAST,即以查询序列(例如,利用实施例部分表A4中所列的任何序列)针对任何序列数据库如可公共获得的NCBI数据库进行BLAST。当从核苷酸序列开始时,通常使用BLASTN或TBLASTX(利用标准默认值),而当从蛋白质序列开始时,则使用BLASTP或TBLASTN(利用标准默认值)。BLAST结果可以任选地过滤。接着使用过滤的结果或者未过滤的结果中的全长序列针对查询序列来源生物的序列进行反向BLAST(二次BLAST)(在查询序列为SEQ ID NO:373或SEQ ID NO:374的情况下,二次BLAST因此将会针对杨树(poplar)序列进行)。然后比较一次和二次BLAST的结果。如果一次BLAST中分值靠前的命中事件来自查询序列源自的相同物种,而理想地反向BLAST导致查询序列在最高命中事件中,则鉴定到了旁系同源物;如果一次BLAST中分值靠前的命中事件不是来自查询序列源自的相同物种,且优选地反向BLAST导致查询序列处于最高命中事件之列,则找到了直向同源物。
分值靠前的命中事件是E值低的命中事件。E值越低,分值越具有显著性(或者换句话说,偶然发现此命中事件的几率越低)。E值的计算是本领域众所周知的。除了E值之外,还可以对比较进行同一性百分比记分。同一性百分比是指两比较核酸(或多肽)序列之间在特定长度上的相同核苷酸(或氨基酸)数。在大家族的情况下,可以使用ClustalW,继之以邻接树来辅助对相关基因的聚类进行可视化和鉴定直向同源物和旁系同源物。
预测蛋白质亚细胞定位的任务非常重要并进行了充分研究。知晓蛋白质的定位有助于阐释其功能。用于蛋白质定位的实验方法范围广泛,从免疫定位到利用绿色荧光蛋白(GFP)或β-葡糖醛酸糖苷酶(GUS)标记蛋白质。与计算方法相比,此类方法虽然劳动量大但精确。最近在根据序列数据计算预测蛋白质定位方面取得了很大进步。从瑞士生物信息学研究所托管的ExPASy蛋白质组学工具可获得本领域技术人员公知的算法,例如PSort、TargetP、ChloroP、LocTree、Predotar、LipoP、MITOPROT、PATS、PTS1、SignalP、TMHMM和其他。
核酸变体也可用于实施本发明的方法。这类变体的实例包括编码实施例部分表A1至A4中给出的任一氨基酸序列的同源物和衍生物的核酸,其中“同源物”和“衍生物”如本文所定义。同样可用于本发明方法的有,编码实施例部分表A1至表A4所给出的任一氨基酸序列的直向同源物或旁系同源物的同源物和衍生物的核酸。可用于本发明方法的同源物和衍生物与其源自的未修饰蛋白质具有基本上相同的生物活性和功能活性。
可用于实施本发明方法的其他核酸变体包括编码HSFA4或HSFA5多肽、或OPT4样多肽、或PLA2样多肽、或WOX1样多肽的核酸的部分、与编码HSFA4或HSFA5多肽、或OPT4样多肽、或PLA2样多肽、或WOX1样多肽的核酸杂交的核酸、编码HSFA4或HSFA5多肽、或OPT4样多肽、或PLA2样多肽、或WOX1样多肽的核酸的剪接变体、编码HSFA4或HSFA5多肽、或OPT4样多肽、或PLA2样多肽、或WOX1样多肽的核酸的等位基因变体,以及通过基因改组获得的编码HSFA4或HSFA5多肽、或OPT4样多肽、或PLA2样多肽、或WOX1样多肽的核酸的变体。术语杂交序列、剪接变体、等位基因变体和基因改组如本文所述。
编码HSFA4或HSFA5多肽、或OPT4样多肽、或PLA2样多肽、或WOX1样多肽的核酸无需是全长核酸,因为本发明方法的实施不依赖于全长核酸序列的使用。根据本发明,提供了增强植物产量相关性状的方法,包括在植物中引入和表达实施例部分表A1至A4所给出的任一核酸序列的部分、或者编码实施例部分表A1至A4所给出的任一氨基酸序列的直向同源物、旁系同源物或同源物的核酸的部分。
可以例如,通过对核酸进行一个或多个缺失来制备核酸的“部分”。“部分”可以以分离的形式使用,或者可将其与其他编码(或非编码)序列融合,以便例如,产生组合了几种活性的蛋白质。当与其他编码序列融合时,经翻译后所产生的多肽可能比针对该蛋白质部分预测的大小要大。
关于HSF多肽,可用于本发明方法的部分编码如本文所定义的HSFA4或HSFA5多肽,并与实施例部分表A1所给出的氨基酸序列具有基本上相同的生物活性。优选“部分”是实施例部分表A1所给出的任一核酸的部分,或是编码实施例部分表A1所给出的任一氨基酸序列的直向同源物或旁系同源物的核酸的部分。优选“部分”为长度至少15,30,50,100,200,300,400,500,550,600,650,700,750,800,850,900,950,1000个连续核苷酸,该连续核苷酸来自实施例部分表A1所给出的任一核酸序列,或编码实施例部分表A1所给出任一氨基酸序列的直向同源物或旁系同源物的核酸。最优选“部分”是SEQ ID NO:1、SEQ ID NO:23,35和37所示的任一核酸的部分。优选,“部分”编码氨基酸序列的片段,当用于构建拟南芥、番茄和稻HSF的系统发生树,例如在Koskill-Doring等.2007中和图2中描述的系统发生树时,其聚类在由AtA4a、AtA4b、AtA4c、OsA4b、OsA4d和LeA4b多肽(对于HSFA4多肽的部分)确定的A4进化枝中或聚类在由AtA5和LeA5和OsA5多肽(对于HSFA5多肽的部分)确定的A5进化枝中。
关于OPT4样多肽,可用于本发明方法的部分编码如本文所定义的OPT4样多肽,并与实施例部分表A2所给出的氨基酸序列具有基本上相同的生物活性。优选“部分”是实施例部分表A2所给出的任一核酸的部分,或是编码实施例部分表A2所给出的任一氨基酸序列的直向同源物或旁系同源物的核酸的部分。优选“部分”为长度至少1500、1600、1700、1800、1900、2000、2100、2200、2300、2400、2500、2600、2700、2800或更多个连续核苷酸,该连续核苷酸来自实施例部分表A2所给出的任一核酸序列,或编码实施例部分表A2所给出任一氨基酸序列的直向同源物或旁系同源物的核酸。最优选“部分”是SEQ ID NO:155所示核酸的部分。优选,“部分”编码氨基酸序列的片段,当将其用于构建系统发生树例如图5中描述的系统发生树时,其与由进化枝I、II、III或IV定义的OPT4样多肽组,最优选与包含SEQ ID NO:156所示氨基酸序列的进化枝聚类。
关于PLA2样多肽,可用于本发明方法的部分编码如本文所定义的PLA2样多肽,并与实施例部分表A3所给出的氨基酸序列具有基本上相同的生物活性。优选“部分”是实施例部分表A3所给出的任一核酸的部分,或是编码实施例部分表A3所给出的任一氨基酸序列的直向同源物或旁系同源物的核酸的部分。优选“部分”为长度至少2500、2750、3000、3250、3500、3750、4000、4250、4500、4750个连续核苷酸,该连续核苷酸来自实施例部分表A3所给出的任一核酸序列,或编码实施例部分表A3所给出任一氨基酸序列的直向同源物或旁系同源物的核酸。最优选“部分”是SEQID NO:252所示核酸的部分。优选,“部分”编码氨基酸序列的片段,当将其用于构建系统发生树例如图8中描述的系统发生树时,其与进化枝C或进化枝D的序列,优选与PLA2进化枝或PLA2b进化枝,最优选与SEQID NO:253所示氨基酸序列聚类。
关于WOX1样多肽,可用于本发明方法的部分编码如本文所定义的WOX1样多肽,并与实施例部分表A4所给出的氨基酸序列具有基本上相同的生物活性。优选“部分”是实施例部分表A4所给出的任一核酸的部分,或是编码实施例部分表A所给出的任一氨基酸序列的直向同源物或旁系同源物的核酸的部分。优选“部分”为长度至少1000、1100、1200、1300、1400、1500、1600、1700、1800个连续核苷酸,该连续核苷酸来自实施例部分表A4所给出的任一核酸序列,或编码实施例部分表A4所给出任一氨基酸序列的直向同源物或旁系同源物的核酸。最优选“部分”是SEQ ID NO:373所示核酸的部分。优选,“部分”编码氨基酸序列的片段,当将其用于构建系统发生树例如图11中描述的系统发生树时,其与包含SEQ ID NO:374所示的氨基酸序列的WOX1样多肽的组而非与任何其他组聚类。
可以用于本发明方法的另一核酸变体是这样的核酸,所述核酸能够在降低的严格条件下,优选在严格条件下与编码本文中定义的HSFA4或HSFA5多肽、或OPT4样多肽、或PLA2样多肽、或WOX1样多肽的核酸,或者与本文中定义的部分杂交。
根据本发明,提供了增强植物的产量相关性状的方法,包括向植物中引入和表达能够与实施例部分表A1至A4所给出的任一核酸杂交的核酸,或包括向植物中引入和表达能够与编码实施例部分表A1至A4所给出的任何核酸序列的直向同源物、旁系同源物或同源物的核酸杂交的核酸。
关于HSF多肽,用于本发明方法的杂交序列编码本文中定义的HSFA4或HSFA5多肽,所述多肽与实施例部分表A1所给出的氨基酸序列具有基本上相同的生物活性。优选,杂交序列能够与实施例部分表A1所给出的任一核酸的互补序列杂交,或与这些序列之任一的部分杂交,其中“部分”如上文所定义,或者所述杂交序列能够与编码实施例部分表A1所给出的任一氨基酸序列的直向同源物或旁系同源物的核酸的互补序列杂交。最优选,所述杂交序列能够与SEQ ID NO:1所示的核酸的互补序列或与其部分杂交。
优选,所述杂交序列编码具有氨基酸序列的多肽,所述氨基酸序列,当全长用于构建拟南芥、番茄和稻HSF的系统发生树例如Koskill-Doring等.2007中描述的和图2中描述的系统发生树时,其聚类在由AtA4a、AtA4b、AtA4c、OsA4b、OsA4d和LeA4b多肽(对于HSFA4多肽的序列)定义的A4进化枝中或聚类在由AtA5和LeA5和OsA5多肽(对于HSFA5多肽的序列)定义的A5进化枝中。
关于OPT4样多肽,用于本发明方法的杂交序列编码本文中定义的OPT4样多肽,所述多肽与实施例部分表A2所给出的氨基酸序列具有基本上相同的生物活性。优选,杂交序列能够与实施例部分表A2所给出的任一核酸的互补序列杂交,或与这些序列之任一的部分杂交,其中“部分”如上文所定义,或者所述杂交序列能够与编码实施例部分表A2所给出的任一氨基酸序列的直向同源物或旁系同源物的核酸的互补序列杂交。最优选,所述杂交序列能够与SEQ ID NO:155所示的核酸的互补序列或与其部分杂交。
优选,所述杂交序列编码氨基酸序列的片段,当将其用于构建系统发生树例如图5中描述的系统发生树时,其与由进化枝I、II、III或IV定义的OPT4样多肽组,最优选与包含SEQ ID NO:156所示氨基酸序列的进化枝聚类。
关于PLA2样多肽,用于本发明方法的杂交序列编码本文中定义的PLA2样多肽,所述多肽与实施例部分表A3所给出的氨基酸序列具有基本上相同的生物活性。优选,杂交序列能够与实施例部分表A3所给出的任一核酸的互补序列杂交,或与这些序列之任一的部分杂交,其中“部分”如上文所定义,或者所述杂交序列能够与编码实施例部分表A3所给出的任一氨基酸序列的直向同源物或旁系同源物的核酸的互补序列杂交。最优选,所述杂交序列能够与SEQ ID NO:252所示的核酸的互补序列或与其部分杂交。
优选,所述杂交序列编码具有氨基酸序列的多肽,所述氨基酸序列,当全长用于构建系统发生树例如图8中描述的系统发生树时,与进化枝C或进化枝D的序列,优选与PLA2进化枝或PLA2b进化枝,最优选与SEQID NO:253所示的氨基酸序列聚类。
关于WOX1样多肽,用于本发明方法的杂交序列编码本文中定义的WOX1样多肽,所述多肽与实施例部分表A4所给出的氨基酸序列具有基本上相同的生物活性。优选,杂交序列能够与实施例部分表A4所给出的任一核酸的互补序列杂交,或与这些序列之任一的部分杂交,其中“部分”如上文所定义,或者所述杂交序列能够与编码实施例部分表A4所给出的任一氨基酸序列的直向同源物或旁系同源物的核酸的互补序列杂交。最优选,所述杂交序列能够与SEQ ID NO:373所示的核酸的互补序列或与其部分杂交。
优选,所述杂交序列编码具有氨基酸序列的多肽,所述氨基酸序列,当全长用于构建系统发生树例如图11中描述的系统发生树时,与包含SEQID NO:374所示的氨基酸序列的WOX1样多肽的组而非与任何其他组聚类。
可以用于本发明方法的另一核酸变体是编码上文中定义的HSFA4或HSFA5多肽、或OPT4样多肽、或PLA2样多肽、或WOX1样多肽的剪接变体,剪接变体如本文中定义。
根据本发明,提供了用于增强植物的产量相关性状的方法,包括向植物中引入和表达实施例部分表A1至A4所给出的任一核酸序列的剪接变体,或编码实施例部分表A1至A4所给出的任何氨基酸序列的直向同源物、旁系同源物或同源物的核酸的剪接变体。
关于HSF多肽,优选剪接变体是如SEQ ID NO:1所示的核酸的剪接变体,或编码SEQ ID NO:2的直向同源物或旁系同源物的核酸的剪接变体。优选,由剪接变体编码的氨基酸序列,当用于构建拟南芥、番茄和稻HSF的系统发生树例如Koskill-Doring等.2007中描述的和图2中描述的系统发生树时,其聚类在由AtA4a、AtA4b、AtA4c、OsA4b、OsA4d和LeA4b多肽(对于HSFA4多肽的序列)定义的A4进化枝中或聚类在由AtA5和LeA5和OsA5多肽(对于HSFA5多肽的序列)定义的A5进化枝中。
关于OPT4样多肽,优选剪接变体是如SEQ ID NO:155所示的核酸的剪接变体,或编码SEQ ID NO:156的直向同源物或旁系同源物的核酸的剪接变体。优选,由剪接变体编码的氨基酸序列,当用于构建系统发生树例如图5中描述的系统发生树时,其与由进化枝I、II、III或IV定义的OPT4样多肽组,最优选与包含SEQ ID NO:156所示氨基酸序列的进化枝聚类。
关于PLA2样多肽,优选剪接变体是如SEQ ID NO:252所示的核酸的剪接变体,或编码SEQ ID NO:253的直向同源物或旁系同源物的核酸的剪接变体。优选,由所述剪接变体编码的氨基酸序列,当用于构建系统发生树例如图8中描述的系统发生树时,与进化枝C或进化枝D的序列,优选与PLA2进化枝或PLA2b进化枝,最优选与SEQ ID NO:253所示的氨基酸序列聚类。
关于WOX1样多肽,优选剪接变体是如SEQ ID NO:373所示的核酸的剪接变体,或编码SEQ ID NO:374的直向同源物或旁系同源物的核酸的剪接变体。优选,由所述剪接变体编码的氨基酸序列,当用于构建系统发生树例如图11中描述的系统发生树时,与包含SEQ ID NO:374所示的氨基酸序列的WOX1样多肽的组而非与任何其他组聚类。
可用于本发明方法的另一核酸变体为编码前文所定义的HSFA4或HSFA5多肽、或OPT4样多肽、或PLA2样多肽、或WOX1样多肽的核酸的等位基因变体,等位基因变体如本文所定义。
根据本发明,提供了增强植物产量相关性状的方法,包括在植物中引入和表达实施例部分表A1至A4所给出的任一核酸的等位基因变体,或包括在植物中引入和表达编码实施例部分表A1至A4所给出的任一氨基酸序列的直向同源物、旁系同源物或同源物的核酸的等位基因变体。
关于HSF多肽,由可用于本发明方法的等位基因变体编码的多肽与SEQ ID NO:2的HSF多肽及实施例部分表A1中描述的任何氨基酸序列具有基本上相同的生物活性。等位基因变体天然存在,并且对这些天然等位基因的应用包含于本发明的方法中。优选等位基因变体为SEQ ID NO:1的等位基因变体,或编码SEQ ID NO:2的直向同源物或旁系同源物的核酸的等位基因变体。优选,由等位基因变体编码的氨基酸序列,当用于构建拟南芥、番茄和稻HSF的系统发生树例如Koskill-Doring等.2007中描述的和图2中描述的系统发生树时,其聚类在由AtA4a、AtA4b、AtA4c、OsA4b、OsA4d和LeA4b多肽(对于HSFA4多肽的序列)定义的A4进化枝中或聚类在由AtA5和LeA5和OsA5多肽(对于HSFA5多肽的序列)定义的A5进化枝中。
关于OPT4样多肽,由可用于本发明方法的等位基因变体编码的多肽与SEQ ID NO:156的OPT4样多肽及实施例部分表A2中描述的任何氨基酸序列具有基本上相同的生物活性。等位基因变体天然存在,并且对这些天然等位基因的应用包含于本发明的方法中。优选等位基因变体为SEQ IDNO:155的等位基因变体,或编码SEQ ID NO:156的直向同源物或旁系同源物的核酸的等位基因变体。优选,由等位基因变体编码的氨基酸序列,当用于构建系统发生树例如图5中描述的系统发生树时,其与由进化枝I、II、III或IV定义的OPT4样多肽组,最优选与包含SEQ ID NO:156所示氨基酸序列的进化枝聚类。
关于PLA2样多肽,由可用于本发明方法的等位基因变体编码的多肽与SEQ ID NO:253的PLA2样多肽及实施例部分表A3中描述的任何氨基酸序列具有基本上相同的生物活性。等位基因变体天然存在,并且对这些天然等位基因的应用包含于本发明的方法中。优选等位基因变体为SEQ IDNO:252的等位基因变体,或编码SEQ ID NO:253的直向同源物或旁系同源物的核酸的等位基因变体。优选,由等位基因变体编码的氨基酸序列,当用于构建系统发生树例如图8中描述的系统发生树时,与进化枝C或进化枝D的序列,优选与PLA2进化枝或PLA2b进化枝,最优选与SEQ IDNO:253所示的氨基酸序列聚类。
关于WOX1样多肽,由可用于本发明方法的等位基因变体编码的多肽与SEQ ID NO:374的WOX1样多肽及实施例部分表A4中描述的任何氨基酸序列具有基本上相同的生物活性。等位基因变体天然存在,并且对这些天然等位基因的应用包含于本发明的方法中。优选等位基因变体为SEQID NO:373的等位基因变体,或编码SEQ ID NO:374的直向同源物或旁系同源物的核酸的等位基因变体。优选,由等位基因变体编码的氨基酸序列,当用于构建系统发生树例如图11中描述的系统发生树时,与包含SEQID NO:374所示的氨基酸序列的WOX1样多肽的组而非与任何其他组聚类。
基因改组或定向进化也可用于产生编码上文所定义的HSFA4或HSFA5多肽、或OPT4样多肽、或PLA2样多肽、或WOX1样多肽的核酸的变体;其中术语“基因改组”如本文所定义。
根据本发明,提供了用于增强植物的产量相关性状的方法,包括向植物中引入和表达实施例部分的表A1至A4所给出的任一核酸序列的变体,或包括向植物中引入和表达编码实施例部分的表A1至A4所给出的任何氨基酸序列的直向同源物、旁系同源物或同源物的核酸的变体,其中所述变体核酸通过基因改组获得。
关于HSF多肽,优选,由通过基因改组获得的变体核酸编码的氨基酸序列,当用于构建拟南芥、番茄和稻HSF的系统发生树例如Koskill-Doring等.2007之图2中描述的和图2中描述的系统发生树时,其聚类在由AtA4a、AtA4b、AtA4c、OsA4b、OsA4d和LeA4b多肽(对于HSFA4多肽的序列)定义的A4进化枝中或聚类在由AtA5和LeA5和OsA5多肽(对于HSFA5多肽的序列)定义的A5进化枝中。
关于OPT4样多肽,优选,由通过基因改组获得的变体核酸编码的氨基酸序列,当用于构建系统发生树例如图5中描述的系统发生树时,其与由进化枝I、II、III或IV定义的OPT4样多肽组,最优选与包含SEQ IDNO:156所示氨基酸序列的进化枝聚类。
关于PLA2样多肽,优选,由通过基因改组获得的变体核酸编码的氨基酸序列,当用于构建系统发生树例如图8中描述的系统发生树时,与进化枝C或进化枝D的序列,优选与PLA2进化枝或PLA2b进化枝,最优选与SEQ ID NO:253所示的氨基酸序列聚类。
关于WOX1样多肽,优选,由通过基因改组获得的变体核酸编码的氨基酸序列,当用于构建系统发生树例如图11中描述的系统发生树时,与包含SEQ ID NO:374所示的氨基酸序列的WOX1样多肽的组而非与任何其他组聚类。
此外,还可利用定点诱变获得核酸变体。若干方法可用来实现定点诱变,最常见的是基于PCR的方法(Current Protocols in Molecular Biology.Wiley编辑)。
编码HSFA4或HSFA5多肽的核酸可以源自任何天然或人工来源。该核酸可以通过有意的人为操作而在组成和/或基因组环境上不同于其天然形式。优选,编码HSFA5多肽的核酸可以来自植物,更优选来自双子叶植物,更优选来自豆科,最优选核酸来自蒺藜苜蓿。优选,编码HSFA4多肽的核酸可以来自植物,更优选来自与待使用本发明方法的植物为相同属或科的植物。因此,例如,当在稻植物中实现增强的产量相关性状时,HSFA4多肽编码核酸优选来自单子叶植物,更优选来自禾本科(Poaceae),最优选核酸来自稻(Oryza sativa)。
编码OPT4样多肽的核酸可以源自任何天然或人工来源。该核酸可以通过有意的人为操作而在组成和/或基因组环境上不同于其天然形式。优选,编码OPT4样多肽的核酸可以来自植物,更优选来自双子叶植物,更优选来自十字花科(Brassicaceae),最优选核酸来自拟南芥(Arabidopsisthaliana)。
编码PLA2样多肽的核酸可以源自任何天然或人工来源。该核酸可以通过有意的人为操作而在组成和/或基因组环境上不同于其天然形式。优选,编码PLA2样多肽的核酸可以来自植物,更优选来自单子叶植物,更优选来自杨科(Poplar),最优选核酸来自毛果杨(Populus trichocarpa)。
编码WOX1样多肽的核酸可以源自任何天然或人工来源。该核酸可以通过有意的人为操作而在组成和/或基因组环境上不同于其天然形式。优选,编码WOX1样多肽的核酸可以来自植物,更优选来自双子叶植物,更优选来自杨科(Populus),最优选核酸来自毛果杨。
本发明方法的实施产生具有增强的产量相关性状的植物。尤其是,本发明方法的实施产生与对照植物相比较具有增加的产量,特别是增加的种子产量的植物。术语“产量”和“种子产量”在本文“定义”部分有更详细的说明。
本文中提及增强的产量相关性状,旨在表示植物的一个或多个部分的生物量(重量)的增加,所述部分可以包括地上(可收获的)部分和/或地下(可收获的)部分。特别地,该可收获部分是种子,并且本发明方法的实施导致与对照植物的种子产量相比较具有增加的种子产量的植物。
以玉米为例,产量增加可以表现为如下一个或多个方面:每平方米建植的植物数的增加、每株植物的穗数的增加、行数、行粒数、粒重、千粒重、穗长度/直径的增加、种子饱满率(为饱满种子数除以种子总数并乘以100)的增加,等等。以稻为例,产量增加可以表现为如下一个或多个方面的增加:每平方米的植物数、每株植物的圆锥花序数、每圆锥花序的小穗数、每圆锥花序的花朵(小花)数(表达为饱满种子数占一级圆锥花序数(primary panicles)的比率)、种子饱满率(为饱满种子数除以种子总数并乘以100)的增加、千粒重的增加,等等。
本发明提供了相对于对照植物增加植物的产量,特别地种子产量,的方法,所述方法包括调节编码本文所定义的HSFA4或HSFA5多肽、或OPT4样多肽、或PLA2样多肽、或WOX1样多肽的核酸在植物中的表达。
由于本发明的转基因植物具有增强的产量,故,相对于对照植物在其生命周期的相应阶段的生长速率而言,这些植物可能呈现增加的生长速率(至少在其部分生命周期中)。
增加的生长速率可以特异于植物的一个或多个部分(包括种子),或者可以基本上遍及整株植物。具有增加生长速率的植物可以具有更短的生命周期。植物的生命周期可以理解为指,从成熟干种子生长至植物已经产生类似于起始材料的成熟干种子的阶段所需的时间。此生命周期可以受到诸如萌发速度、早期活力、生长速率、绿度指数、开花时间和种子成熟速度等因素的影响。生长速率的增加可以发生在植物生命周期的一个或多个阶段,或者发生在基本上整个植物生命周期的过程中。在植物生命周期的早期阶段生长速率的增加可以反映为增强的活力。生长速率的增加可以改变植物的收获周期,使植物能够比原可能的情况更晚播种和/或更快收获(类似的效果可以通过较早的开花时间获得)。如果生长速率充分增加,可以允许再次播种同种植物物种的种子(例如完全在一个常规的生长期内,播种和收获稻类植物、接着再次播种和收获稻类植物)。与此类似,如果生长速率充分地增加,可以允许再播种不同植物物种的种子(例如播种和收获玉米植物,随后,例如,播种和任选的收获大豆、马铃薯或任何其他适宜的植物)。在一些作物植物的情况下也可能从同一砧木收获增加的次数。改变植物的收获周期可以导致每平方米年生物量产量的增加(这是由于(比方说在一年中)任何特定植物可以生长和收获的次数增加)。与野生型对应物相比,生长速率的增加还允许在更广阔的地域栽培转基因植物,这是因为种植作物的地域限制常由种植时(早季)或收获时(晚季)不利的环境条件所决定。如果缩短收获周期,就可以避免这类不利条件。可以通过自生长曲线获得多种参数,确定生长速率,这类参数可以是:T-Mid(植物达到其最大大小的50%所需的时间)和T-90(植物达到其最大大小的90%所需的时间)等等。
根据本发明优选的方面,实施本发明方法产生相对于对照植物具有增加的生长速率的植物。因此,本发明提供了增加植物生长速率的方法,所述方法包括调节编码本文所定义的HSFA4或HSFA5多肽、或OPT4样多肽、或PLA2样多肽、或WOX1样多肽的核酸在植物中的表达。
相对于对照植物而言产量和/或生长速率的增强可以发生在植物处于非胁迫条件下或发生在植物暴露于各种胁迫的情况下。通常植物通过更加缓慢的生长来应答胁迫接触。在重度胁迫条件下,植物甚至可以完全停止生长。另一方面,轻度胁迫在文中定义为当植物接触时不导致植物完全停止生长且丧失重新开始生长的能力的任何胁迫。本发明意义上的轻度胁迫导致受胁迫植物的生长,与非胁迫条件下的对照植物相比,下降不到40%、35%、30%或25%、更优选下降不到20%或15%。由于农业实践(灌溉、施肥、农药处理)的发展,栽培的作物植物往往并不会遇到重度胁迫。因此,由轻度胁迫诱发的受损的生长通常成为农业中不期望的性质。轻度胁迫是植物接触的日常的生物和/或非生物(环境)胁迫。非生物胁迫可以因干旱或过量的水、缺氧胁迫、盐胁迫、化学毒性、氧化胁迫以及热、冷或冰冻温度而引起。非生物胁迫可以是由于水胁迫(特别是由于干旱)、盐胁迫、氧化胁迫或离子胁迫引起的渗透胁迫。生物胁迫一般是由病原体例如细菌、病毒、真菌、线虫和昆虫所引起的那些胁迫。生物胁迫通常是由病原体,例如细菌、病毒、真菌、线虫和昆虫等引起的胁迫。术语“非胁迫”条件如本文中所使用的是指允许植物最佳生长的那些环境条件。本领域技术人员知道给定位置的正常土壤条件和气候条件。术语非胁迫条件在本文中涵盖植物接触到的偶尔或日常的轻度胁迫(如本文中所定义),但不包括重度胁迫。
特别地,可在非胁迫条件下或在轻度干旱条件下进行本发明方法以产生相对于对照植物具有增加的产量的植物。如Wang等(Planta(2003)218:1-14)所报道的那样,非生物胁迫引起一系列的形态学、生理学、生物化学和分子变化,对植物生长和生产力造成不利影响。已知干旱、盐度、极端温度和氧化胁迫相互联系,并可以通过相似的机制诱发生长和细胞损害。Rabbani等(Plant Physiol(2003)133:1755-1767)描述了干旱胁迫和高盐度胁迫之间存在着的特别高程度的“交叉对话”。例如,干旱和/或盐度主要表现为渗透胁迫,导致破坏细胞中的稳态和离子分布。氧化胁迫通常与高温或低温、盐度或干旱胁迫相伴,可以引起功能及结构蛋白质的变性。所以,这些多种多样的环境胁迫通常激活相似的细胞信号传递通路和细胞应答,如应激蛋白的产生、抗氧化剂的上调、可混溶溶质的累积以及生长阻抑。如本文中所用的术语“非胁迫”条件是允许植物最佳生长的那些环境条件。本领域技术人员知道给定位置的正常土壤条件和气候条件。具有最佳生长条件(在非胁迫条件下生长)的植物通常按照递增的优选次序产生这样的植物在给定的环境中的平均产量的至少97%、95%、92%、90%、87%、85%、83%、80%、77%或75%。可基于收获和/或季节,计算平均产量。本领域技术人员将知晓作物的平均产量产出。
实施本发明方法产生,在非胁迫条件下或在轻度干旱条件下生长时相对于在相当条件下生长的对照植物具有增加的产量的植物。因此,根据本发明,提供了用于在非胁迫条件下或轻度干旱条件下生长的植物中增加产量的方法,所述方法包括调节编码HSFA4或HSFA5多肽、或OPT4样多肽、或PLA2样多肽、或WOX1样多肽的核酸在植物中的表达。
实施本发明方法产生,生长在养分缺乏的条件下、特别是氮缺乏条件下,相对于在相当条件下生长的对照植物,具有增加的产量的植物。因此,根据本发明,提供了用于在养分缺乏条件下生长的植物中增加产量的方法,所述方法包括调节编码HSFA4或HSFA5多肽、或OPT4样多肽、或PLA2样多肽、或WOX1样多肽的核酸在植物中的表达。养分缺乏可以因诸如氮、磷酸及其他含磷化合物、钾、钙、镁、锰、铁和硼等养分的缺乏所致。
实施本发明方法产生,生长在盐胁迫的条件下,相对于在相当条件下生长的对照植物,具有增加的产量的植物。因此,根据本发明,提供了用于在盐胁迫的条件下生长的植物中增加产量的方法,所述方法包括调节编码HSFA4或HSFA5多肽、或OPT4样多肽、或PLA2样多肽、或WOX1样多肽的核酸在植物中的表达。术语盐胁迫不局限于氯化钠(NaCl),而可以是如下一种或多种盐:NaCl、KCl、LiCl、MgCl2、CaCl2等。
本发明包括可由根据本发明的方法获得的植物或其部分(包括种子)。所述植物或其部分含有编码如上文所定义的HSFA4或HSFA5多肽、或OPT4样多肽、或PLA2样多肽、或WOX1样多肽的核酸转基因。
本发明还提供遗传构建体和载体,以利于编码HSFA4或HSFA5多肽、或OPT4样多肽、或PLA2样多肽、或WOX1样多肽的核酸在植物中的引入和/或表达。可以将基因构建体插入适于转化进入植物并适于在转化的细胞中表达目的基因的载体(可商购获得)中。本发明还提供了如本文所定义的基因构建体在本发明方法中的用途。
更特别地,本发明提供这样的构建体,其含有:
(a)编码如上文所定义的HSFA4或HSFA5多肽、或OPT4样多肽、或PLA2样多肽、或WOX1样多肽的核酸;
(b)一个或多个能够驱动(a)中核酸序列表达的控制序列;和任选的
(c)转录终止序列。
优选地,编码HSFA4或HSFA5多肽、或OPT4样多肽、或PLA2样多肽、或WOX1样多肽的核酸如上文所定义。术语“控制序列”和“终止序列”如本文所定义。
可以使用含有任何上述核酸的载体转化植物。技术人员充分知晓载体中必须存在的遗传元件,以便成功进行转化、选择并繁殖含目的序列的宿主细胞。目的序列将有效连接于一个或多个控制序列(至少连接于启动子)。
有利地,可以使用任何类型的天然或合成启动子来驱动核酸序列的表达,但优选启动子是植物来源的。组成型启动子在本发明方法中特别有用,优选组成型启动子也是中等强度的遍在启动子。有关各种启动子类型的定义,参见本文中“定义”部分。
关于HSF多肽,应当清楚,本发明的实施并不局限于SEQ ID NO:1所示的HSF多肽编码核酸,而且本发明的实施也不局限于由组成型启动子所驱动的HSFA4或HSFA5多肽编码核酸的表达。
所述组成型启动子优选是中等强度的启动子,更优选选自植物来源的启动子,例如GOS2启动子,更优选启动子是来自稻的GOS2启动子。更优选组成型启动子为与SEQ ID NO:154基本上相似的核酸序列,最优选组成型启动子如SEQ ID NO:154所示。有关组成型启动子的其他实例,参见本文中“定义”部分。
任选的,可以在引入植物的构建体中使用一个或多个终止子序列。优选,构建体包含表达盒,所述表达盒包含与SEQ ID NO:154基本上相似的GOS2启动子和编码HSFA4或HSFA5多肽的核酸。
关于OPT4样多肽,应当清楚,本发明的实施并不局限于SEQ ID NO:155所示的OPT4样多肽编码核酸,而且本发明的实施也不局限于由组成型启动子所驱动的OPT4样多肽编码核酸的表达。
所述组成型启动子优选是中等强度的启动子,更优选选自植物来源的启动子,例如GOS2启动子,更优选启动子是来自稻的GOS2启动子。更优选组成型启动子为与SEQ ID NO:249基本上相似的核酸序列,最优选组成型启动子如SEQ ID NO:249所示。有关组成型启动子的其他实例,参见本文中“定义”部分。
任选的,可以在引入植物的构建体中使用一个或多个终止子序列。优选,构建体包含表达盒,所述表达盒包含与SEQ ID NO:249基本上相似的GOS2启动子和编码SEQ ID NO:155所示的OPT4样多肽的核酸或表A2中提供的任一核酸。
关于PLA2样多肽,应当清楚,本发明的实施并不局限于SEQ ID NO:252所示的PLA2样多肽编码核酸,而且本发明的实施也不局限于由组成型启动子所驱动的PLA2样多肽编码核酸的表达。
所述组成型启动子优选是中等强度的启动子,更优选选自植物来源的启动子,例如GOS2启动子,更优选启动子是来自稻的GOS2启动子。更优选组成型启动子为与SEQ ID NO:370基本上相似的核酸序列,最优选组成型启动子如SEQ ID NO:370所示。有关组成型启动子的其他实例,参见本文中“定义”部分。
任选的,可以在引入植物的构建体中使用一个或多个终止子序列。优选,构建体包含表达盒,所述表达盒包含与SEQ ID NO:370基本上相似的GOS2启动子和编码PLA2样多肽的核酸。
关于WOX1样多肽,应当清楚,本发明的实施并不局限于SEQ ID NO:373所示的WOX1样多肽编码核酸,而且本发明的实施也不局限于由组成型启动子所驱动的WOX1样多肽编码核酸的表达。
所述组成型启动子优选是中等强度的启动子,更优选选自植物来源的启动子,例如GOS2启动子,更优选启动子是来自稻的GOS2启动子。更优选组成型启动子为与SEQ ID NO:477基本上相似的核酸序列,最优选组成型启动子如SEQ ID NO:477所示。有关组成型启动子的其他实例,参见本文中“定义”部分。
任选的,可以在引入植物的构建体中使用一个或多个终止子序列。优选,构建体包含表达盒,所述表达盒包含与SEQ ID NO:477基本上相似的GOS2启动子和编码WOX1样多肽的核酸。
另外的调控元件可以包括转录和翻译的增强子。本领域技术人员会知道适合用于实施本发明的终止子和增强子的序列。如“定义”部分所说明的那样,也可以向5’非翻译区(UTR)或在编码序列中加入内含子序列,来增加在胞质中累积的成熟信使的量。其他控制序列(除启动子、增强子、沉默子、内含子序列、3’UTR和/或5’UTR区之外)可以有蛋白质和/或RNA稳定元件。这类序列为本领域技术人员公知或者可以容易地获得。
本发明的遗传构建体可以还包括为在特定细胞类型中维持和/或复制所需的复制起点序列。一个实例是需要将遗传构建体作为染色体外遗传元件(如质粒或粘粒分子)在细菌细胞中维持的情况。优选的复制起点包括但不限于f1-ori和colE1。
为检测本发明方法中所用核酸序列的成功转移和/或选择含有这些核酸的转基因植物,最好使用标记基因(或报告基因)。因此,遗传构建体可以任选地含有可选择标记基因。可选择标记在本文“定义”部分有更详细的说明。一旦不再需要标记基因,可从转基因细胞中将其除去或切除。用于标记去除的技术在本领域内是已知的,有用的技术描述于上文中定义部分。
本发明还提供了产生相对于对照植物具有增强的产量相关性状的转基因植物的方法,包括在植物中引入和表达编码如前文所定义的HSFA4或HSFA5多肽、或OPT4样多肽、或PLA2样多肽、或WOX1样多肽的任何核酸。
更具体地,本发明提供了产生具有增强的产量相关性状的转基因植物的方法,所述方法包括:
(i)向植物或植物细胞中引入和表达编码HSFA4或HSFA5多肽的核酸;和
(ii)在促进植物生长和发育的条件下培养所述植物细胞。
(i)中的核酸可以为任何能够编码如本文定义的HSFA4或HSFA5多肽的核酸。
更具体地,本发明提供了产生具有增强的产量相关性状,特别是增加的(种子)产量的转基因植物的方法,所述方法包括:
(i)向植物或植物细胞中引入和表达编码OPT4样多肽或PLA2样多肽或WOX1样多肽的核酸;和
(ii)在促进植物生长和发育的条件下培养所述植物细胞。
(i)中的核酸可以为任何能够编码如本文定义的OPT4样多肽或PLA2样多肽或WOX1样多肽的核酸。
可以将核酸直接引入植物细胞或植物本身(包括引入植物的组织、器官或任何其它部分)。根据本发明优选的方面,优选通过转化将核酸引入植物。术语“转化”在本文“定义”部分有更详细的说明。
遗传修饰的植物细胞可以通过技术人员熟悉的所有方法再生。合适的方法可见于上述S.D.Kung和R.Wu、Potrykus或者和Willmitzer的出版物。
通常在转化以后,选出存在一个或多个标记的植物细胞或细胞群,所述标记由与目的基因共转移的植物可表达基因编码,接着使转化的材料再生成整个植物。为选择转化的植物,通常将在转化中获得的植物材料置于选择性条件下,从而可将转化的植物与未转化的植物区分开来。例如,可以种植以上述方式获得的种子,并在最初的生长期之后,通过喷雾对其进行合适的选择。另一可能性方案是在使用合适的选择剂的琼脂板上生长种子(酌情在灭菌后),从而仅转化的种子能够长成植物。可选地,针对转化的植物筛选可选择标记例如上文所述标记的存在。
DNA转移和再生之后,还可例如用Southern分析(DNA印迹),评价推定转化的植物,评价目的基因的存在、拷贝数和/或基因组构造。可选的或额外地,可用Northern和/或Western分析(蛋白质印迹)监测新引入的DNA的表达水平,这两种技术都是本领域普通技术人员所公知的。
产生的转化植物可以通过多种方式繁殖,如通过克隆繁殖或经典的育种技术。例如,第一代(或T1)转化的植物可自交,选择纯合的第二代(或T2)转化体,而T2植物可进一步通过经典育种技术繁殖。产生的转化生物体可以呈多种形式。例如,它们可以是转化细胞和非转化细胞的嵌合体;克隆的转化体(例如所有细胞已转化而含有表达盒);转化的和非转化的组织的嫁接体(例如在植物中,转化的砧木嫁接到非转化的接穗上)。
本发明显然延及由本文所述任何方法产生的任何植物细胞或植物,以及其所有的植物部分及繁殖体。本发明还延及由任何上述方法产生的原代转化或转染的细胞、组织、器官或整个植物的后代,所述后代的唯一要求是与根据本发明方法所产生的亲本呈现相同的基因型和/或表型特征。
本发明显然延及由本文所述任何方法产生的任何植物细胞或植物,以及其所有的植物部分及繁殖体。本发明还延及由任何上述方法产生的原代转化或转染的细胞、组织、器官或整个植物的后代,所述后代的唯一要求是与根据本发明方法所产生的亲本呈现相同的基因型和/或表型特征。
本发明也包括包含编码上文所定义的HSFA4或HSFA5多肽、或OPT4样多肽、或PLA2样多肽、或WOX1样多肽的分离核酸的宿主细胞。根据本发明优选的宿主细胞是植物细胞。对于在本发明方法中使用的核酸或载体、表达盒或构建体或载体,宿主植物原则上有利地为能够合成用于本发明方法的多肽的所有植物。
本发明方法有利地适用于任何植物。尤其可用于本发明方法的植物包括属于植物界超家族的所有植物,尤其是单子叶植物和双子叶植物,包括饲料或牧草豆科植物、观赏植物、粮食作物、乔木或灌木。根据本发明优选的实施方案,植物为作物植物。作物植物的实例包括大豆、向日葵、芸苔、苜蓿、油菜籽、亚麻籽(linseed)、棉花、番茄、马铃薯和烟草。还优选植物是单子叶植物。单子叶植物的实例包括甘蔗。更优选植物是谷类。谷类的实例包括稻、玉米、小麦、大麦、粟、黑麦、黑小麦、高粱、二粒小麦、斯佩耳特小麦(spelt)、黑麦、单粒小麦、埃塞俄比亚画眉草、买罗高粱(milo)和燕麦。
本发明也延及植物的可收获部分,例如但不限于:种子、叶、果实、花、茎、根、根茎、块茎和球茎,所述可收获部分含有编码HSFA4或HSFA5多肽、或OPT4样多肽、或PLA2样多肽、或WOX1样多肽的重组核酸。本发明还涉及由这样的植物的可收获部分衍生的、优选直接衍生的产品,如干丸(pellets)或粉、油类、脂肪和脂肪酸、淀粉或蛋白质。
根据本发明的优选方面,表达的调节是表达的增加。增加核酸或基因或基因产物表达的方法在本领域有充分的文献记载,并且实例在“定义”部分提供。
如上文所述,调节编码HSFA4或HSFA5多肽、或OPT4样多肽、或PLA2样多肽、或WOX1样多肽的核酸表达的一个优选方法是,在植物中引入和表达编码HSFA4或HSFA5多肽、或OPT4样多肽、或PLA2样多肽、或WOX1样多肽的核酸;然而,实施所述方法的效果,即增强产量相关性状,也可以利用其他众所周知的技术实现,包括但不限于:T-DNA激活标记、TILLING、同源重组。这些技术的说明在“定义”部分提供。
本发明还包括在增强植物的任一上述产量相关性状中编码如本文所述的HSFA4或HSFA5多肽、或OPT4样多肽、或PLA2样多肽、或WOX1样多肽的核酸的用途,以及这些HSFA4或HSFA5多肽、或OPT4样多肽、或PLA2样多肽、或WOX1样多肽的用途。
可以在育种程序中使用编码本文所述的HSFA4或HSFA5多肽、或OPT4样多肽、或PLA2样多肽、或WOX1样多肽的核酸、或所述HSFA4或HSFA5多肽、或OPT4样多肽、或PLA2样多肽、或WOX1样多肽本身,其中鉴定可以与编码HSFA4或HSFA5多肽、或OPT4样多肽、或PLA2样多肽、或WOX1样多肽的基因遗传连锁的DNA标记。可以使用所述核酸/基因或所述HSFA4或HSFA5多肽、或OPT4样多肽、或PLA2样多肽、或WOX1样多肽本身来定义分子标记。接着可以在育种程序中使用此DNA或蛋白质标记,以在本发明方法中选择具有如上文所定义的增强的产量相关性状的植物。
编码HSFA4或HSFA5多肽的核酸/基因的等位基因变体也可以用于标记辅助的育种程序。这类育种程序有时需要使用例如EMS诱变,通过植物诱变处理引入等位基因变异;可选的,此类程序可以起始于一系列无意产生的所谓“天然”起源的等位基因变体。然后通过例如PCR进行等位基因变体的鉴定。随后是选择步骤,用以选择所讨论序列的较好等位基因变体,该变体提供增强的产量。一般通过监测含有所讨论序列的不同等位基因变体的植物的生长行为来进行选择。可以在温室或田地中监测生长行为。更多任选的步骤包括使经鉴定含有较好等位基因变体的植物与另一植物杂交。例如,可使用这种方法产生感兴趣表型特征的组合。
编码HSFA4或HSFA5多肽、或OPT4样多肽、或PLA2样多肽、或WOX1样多肽的核酸还可以用作探针,对包含其的基因进行遗传和物理作图,以及用作与这些基因连锁的性状的标记。这样的信息可以在植物育种中使用,以培育具有所期望表型的株系。编码HSFA4或HSFA5多肽、或OPT4样多肽、或PLA2样多肽、或WOX1样多肽的核酸的这类应用仅需要长度至少15个核苷酸的核酸序列。编码HSFA4或HSFA5多肽、或OPT4样多肽、或PLA2样多肽、或WOX1样多肽的核酸可以用作限制性片段长度多态性(RFLP)标记。可以用HSFA4或HSFA5多肽、或OPT4样多肽、或PLA2样多肽、或WOX1样多肽编码核酸探测限制酶切消化的植物基因组DNA的Southern印迹(Sambrook J,Fritsch EF和Maniatis T(1989)《分子克隆:实验室手册》)。随后使用计算机程序如MapMaker(Lander等(1987)Genomics 1:174-181)对产生的带型进行遗传分析,以构建遗传图谱。另外,所述核酸可用于探测含有一组如下个体的限制性内切酶处理的基因组DNA的Southern印迹,所述该组个体为规定的遗传杂交的亲本和子代。记录DNA多态性的分离,并用于计算编码HSFA4或HSFA5多肽、或OPT4样多肽、或PLA2样多肽、或WOX1样多肽的核酸在先前用此群体所获得的遗传图谱中的位置(Botstein等(1980)Am.J.Hum.Genet.32:314-331)。
有关在遗传作图中使用的植物基因衍生探针的产生和使用,描述于Bernatzky和Tanksley(1986)Plant Mol.Biol.Reporter 4:37-41中。众多出版物中描述过用上述方法或其变通形式对特定eDNA克隆进行的遗传作图。例如,可以使用F2杂交群体、回交群体、随机交配群体、近等基因系和其它个体组作图。这类方法是本领域技术人员公知的。
核酸探针也可以用来进行物理作图(即在物理图谱上安置序列;参见Hoheisel等In:Non-mammalian Genomic Analysis:A Practical Guide,Academic press 1996,第319-346页,及其中引用的参考文献)。
在另一个实施方案中,核酸探针可用于直接荧光原位杂交(FISH)作图(Trask(1991)Trends Genet.7:149-154)。尽管目前FISH作图的方法倾向使用大的克隆(几个kb到几百个kb;参见Laan等(1995)Genome Res.5:13-20),但是灵敏性的提高可以允许在FISH作图中应用较短的探针。
用于遗传和物理作图的多种基于核酸扩增的方法可以使用所述核酸进行。实例包括等位基因特异性扩增(Kazazian(1989)J.Lab.Clin.Med11:95-96)、PCR扩增片段的多态性(CAPS;Sheffield等(1993)Genomics16:325-332)、等位基因特异性连接(Landegren等(1988)Science 241:1077-1080)、核苷酸延伸反应(Sokolov(1990)Nucleic Acid Res.18:3671)、放射杂交作图(Walter等(1997)Nat.Genet.7:22-28)和Happy作图(Dear和Cook(1989)Nucleic Acid Res.17:6795-6807)。为实施这些方法,使用核酸的序列设计和产生用于扩增反应或引物延伸反应的引物对。这类引物的设计是本领域技术人员公知的。在采用基于PCR的遗传作图的方法中,可能需要鉴定作图杂交的亲本之间在相应于本发明核酸序列的区域中的DNA序列差异。然而,这对作图方法通常不是必要的。
本发明方法导致具有如前文所述增强的产量相关性状的植物。这些性状还可以组合其它经济上有利的性状,例如其它产量增强性状、对其他非生物和生物胁迫的耐受性、改变各种构造特征和/或生物化学和/或生理学特征的性状。
项目
1.HSF多肽
1.用于相对于对照植物增强植物的产量相关性状的方法,包括调节编码HSFA4或HSFA5多肽的核酸在植物中的表达,所述多肽包含按照递增的优选次序与
(i)SEQ ID NO:47至SEQ ID NO:70(DNA结合结构域);和
(ii)SEQ ID NO:71至SEQ ID NO:94(寡聚化结构域);和
(iii)SEQ ID NO:95至SEQ ID NO:118(活化AHA基序);和
(iv)其中所述多肽是HSFA5多肽:
i.SEQ ID NO:119至SEQ ID NO:127(HSF5A基序I);和/或
ii.SEQ ID NO:128至SEQ ID NO:136(HSF5A基序II);和
(v)其中所述多肽是HSF4A多肽:
i.SEQ ID NO:137至SEQ ID NO:151(HSF4A基序I)所示的氨基酸具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的全序列同一性的结构域或基序。
2.根据项1的方法,其中所述调节的表达通过向植物中引入和表达编码HSFA4或HSFA5多肽的核酸来实现。
3.根据项1或2的方法,包括减少所述编码HSFA4的核酸的表达。
4.根据项1或2的方法,包括增加所述编码HSFA5的核酸的表达。
5.根据项1至4的任一项的方法,其中所述编码HSFA4或HSFA5多肽的核酸编码表A1所列的任一蛋白质,或是这样的核酸的部分、或是能够与这样的核酸杂交的核酸。
6.根据项1至5的任一项的方法,其中所述核酸序列编码表A1中所给出的任何蛋白质的直向同源物或旁系同源物。
7.根据任何前述项的方法,其中所述增强的产量相关性状包括相对于对照植物增加的产量,优选增加的生物量和/或增加的种子产量。
8.根据项1至7的任一项的方法,其中在非胁迫条件下获得所述增强的产量相关性状。
9.根据项1至7的任一项的方法,其中在干旱胁迫、盐胁迫或氮缺乏条件下获得所述增强的产量相关性状。
10.根据项2至9的任一项的方法,其中所述核酸有效地连接至组成型启动子,优选连接至GOS2启动子,最优选连接至来自稻的GOS2启动子。
11.根据项1至10的任一项的方法,其中所述编码HSFA4或HSFA5多肽的核酸是植物来源的,优选来自双子叶植物,更优选来自十字花科,更优选来自拟南芥属(Arabidopsis),最优选来自拟南芥(Arabidopsisthaliana)。
12.可通过根据项1至11的任一项的方法获得的植物或其部分,包括种子,其中所述植物或其部分包含编码HSFA4或HSFA5多肽的重组核酸。.
13.构建体,其包含:
(i)编码HSFA4或HSFA5多肽的核酸;
(ii)能够驱动(i)的核酸序列表达的一个或多个控制序列;和任选地
(iii)转录终止序列。
14.根据项13的构建体,其中所述控制序列之一是组成型启动子,优选GOS2启动子,最优选来自稻的GOS2启动子。
15.根据项13或14的构建体在用于制备相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量的植物的方法中的用途。
16.利用根据项13或14的构建体转化的植物、植物部分或植物细胞。
17.用于产生相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量的转基因植物的方法,其包括:
(i)向植物中引入和表达编码HSFA4或HSFA5多肽的核酸;和
(ii)在促进植物生长和发育的条件下培养所述植物细胞。
18.相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量的转基因植物,或源自所述转基因植物的转基因植物细胞,所述增加的产量因编码HSFA4或HSFA5多肽的核酸的被调节的表达而产生。
19.根据项12、16或18的转基因植物或源自其的转基因植物细胞,其中所述植物是作物植物或单子叶植物或谷类植物,例如稻、玉米、小麦、大麦、粟、黑麦、黑小麦、高粱、二粒小麦、斯佩耳特小麦、黑麦(secale)、单粒小麦、埃塞俄比亚画眉草、买罗高梁和燕麦。
20.根据项19的植物的可收获部分,其中所述可收获部分优选是枝条生物质和/或种子。
21.从根据项19的植物和/或从根据项20的植物的可收获部分得到的产品。
22.编码HSFA4或HSFA5多肽的核酸在相对于对照植物增加植物的产量,特别是在增加种子产量和/或枝条生物量中的用途。
2.OPT4样多肽
1.分离的核酸分子,其包含
(a)SEQ ID NO:189或SEQ ID NO:191所示的核酸;
(b)SEQ ID NO:189或SEQ ID NO:191所示的核酸的互补序列;
(c)编码OPT4样多肽的核酸,所述多肽包含基序1:NPG和基序II:KIPPR并且按照递增的优选次序与SEQ ID NO:190或SEQ ID NO:192所示的氨基酸序列具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的序列同一性。
2.分离的多肽,其包含:
(a)SEQ ID NO:190或SEQ ID NO:192所示的氨基酸序列;
(b)包含基序I:NPG和基序II:KIPPR的氨基酸序列,所述氨基酸序列按照递增的优选次序与SEQ ID NO:190或SEQ ID NO:192所示的氨基酸序列具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的序列同一性;
(c)上文(i)或(ii)所给出的任何氨基酸序列的衍生物。
3.用于相对于对照植物增强植物的产量相关性的方法,包括调节编码包含基序I:NPG和基序II:KIPPR的OPT4样多肽的核酸在植物中的表达。
4.根据项3的方法,其中所述OPT4样多肽,当用于构建系统发生树例如图2中描述的系统发生树时,其与由进化枝I、II、III或IV定义的OPT4样多肽组,最优选与包含SEQ ID NO:156所示氨基酸序列的进化枝聚类。
5.根据项3或4的方法,其中所述调节的表达通过向植物中引入和表达编码OPT4样多肽的核酸来实现。
6.根据项3至5的任一项的方法,其中所述编码OPT4样多肽的核酸编码表A2所列的任一蛋白质,或是这样的核酸的部分,或是能够与这样的核酸杂交的核酸。
7.根据项3至6的任一项的方法,其中所述核酸序列编码表A2中所给出的任何蛋白质的直向同源物或旁系同源物。
8.根据任何前述项的方法,其中所述增强的产量相关性状包括相对于对照植物增加的产量,优选增加的生物量和/或增加的种子产量。
9.根据项3至8的任一项的方法,其中在氮缺乏条件下获得所述增强的产量相关性状。
10.根据项3至9的任一的方法,其中所述核酸有效地连接至组成型启动子,优选连接至GOS2启动子,最优选连接至来自稻的GOS2启动子。
11.根据项3至10的任一的方法,其中所述编码OPT4样多肽的核酸是植物来源的,优选来自双子叶植物,更优选来自十字花科,更优选来自拟南芥属,最优选来自拟南芥。
12.可通过根据项3至11的任一项的方法获得的植物或其部分,包括种子,其中所述植物或其部分包含编码OPT4样多肽的重组核酸。
13.构建体,其包含:
(i)编码如项2至4中定义的OPT4样多肽的核酸;
(ii)能够驱动(i)的核酸序列表达的一个或多个控制序列;和任选地
(iii)转录终止序列。
14.根据项13的构建体,其中所述控制序列之一是组成型启动子,优选GOS2启动子,最优选来自稻的GOS2启动子。
15.根据项13或14的构建体在用于制备相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量的植物的方法中的用途。
16.利用根据项13或14的构建体转化的植物、植物部分或植物细胞。
17.用于产生相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量的转基因植物的方法,其包括:
(i)向植物中引入和表达编码如项2至4的任一项中定义的OPT4样多肽的核酸;和
(ii)在促进植物生长和发育的条件下培养所述植物细胞。
18.相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量的转基因植物,或源于所述转基因植物的转基因植物细胞,所述增加的产量因编码如项2至4的任一项中定义的OPT4样多肽的核酸的被调节的表达而产生
19.根据项12、16或18的转基因植物或源于其的转基因植物细胞,其中所述植物是作物植物或单子叶植物或谷类植物,例如稻、玉米、小麦、大麦、粟、黑麦(rye)、黑小麦、高粱、二粒小麦、斯佩耳特小麦、黑麦(secale)、单粒小麦、埃塞俄比亚画眉草、买罗高梁和燕麦。
20.根据项19的植物的可收获部分,其中所述可收获部分优选是枝条生物质和/或种子。
21.从根据项19的植物和/或从根据项20的植物的可收获部分产生的产品。
22.编码OPT4样多肽的核酸在相对于对照植物增加植物的产量,特别是增加种子产量和/或枝条生物量中的用途。
3.PLA2样多肽
1.用于相对于对照植物增强植物的产量相关性的方法,包括调节编码PLA2样多肽的核酸在植物中的表达,所述多肽包含RNA识别基序2和基序III:T[TS][VL][MI][IV][KR]NIPN。
2.根据项1的方法,其中所述PLA2样多肽包含基序IV:SP[PA]RDG和/或基序V:NK[CS]NVGYGFVN[ML]TSP[QE]A。
3.根据项1或2的方法,其中所述调节的表达通过向植物中引入和表达编码PLA2样多肽的核酸来实现。
4.根据项1至3的任一项的方法,其中述编码PLA2样多肽的核酸编码表A3所列的任一蛋白质,或是这样的核酸的部分,或是能够与这样的核酸杂交的核酸。
5.根据项1至4的任一项的方法,其中所述核酸序列编码表A3中所给出的任何蛋白质的直向同源物或旁系同源物。
6.根据任何前述项的方法,其中所述增强的产量相关性状包括相对于对照植物增加的产量,特别是增加的生物量和/或增加的种子产量。
7.根据项1至6的任一的方法,其中在非胁迫条件下获得所述增强的产量相关性状。
8.根据项1至6的任一的方法,其中在氮胁迫条件下获得所述增强的产量相关性状。
9.根据项3至8的任一的方法,其中所述核酸有效地连接至组成型启动子,优选连接至GOS2启动子,最优选连接至来自稻的GOS2启动子。
10.根据项1至9的任一的方法,其中所述编码PLA2样多肽的核酸是植物来源的,优选来自双子叶植物,更优选来自杨属,更优选来自毛果杨。
11.可通过根据项1至10的任一项的方法获得的植物或其部分,包括种子,其中所述植物或其部分包含编码PLA2样多肽的重组核酸。
12.构建体,其包含:
(i)编码如项1或2中定义的PLA2样多肽的核酸;
(ii)能够驱动(i)的核酸序列表达的一个或多个控制序列;和任选地
(iii)转录终止序列。
13.根据项12的构建体,其中所述控制序列之一是组成型启动子,优选GOS2启动子,最优选来自稻的GOS2启动子。
14.根据项13或14的构建体在用于制备相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量的植物的方法中的用途。
15.利用根据项12或13的构建体转化的植物、植物部分或植物细胞。
16.用于产生相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量的转基因植物的方法,其包括:
(i)向植物中引入和表达编码如项1或2中定义的PLA2样多肽的核酸;和
(ii)在促进植物生长和发育的条件下培养所述植物细胞。
17.相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量的转基因植物,或源于所述转基因植物的转基因植物细胞,所述增加的产量因编码如项1或2中定义的PLA2样多肽的核酸的被调节的表达而产生。
18.根据项11、15或17的转基因植物,或源于其的转基因植物细胞,其中所述植物是作物植物或单子叶植物或谷类植物例如稻、玉米、小麦、大麦、粟、黑麦(rye)、黑小麦、高粱、二粒小麦、斯佩耳特小麦、黑麦(secale)、单粒小麦、埃塞俄比亚画眉草、买罗高梁、甘蔗和燕麦。
19.根据项18的植物的可收获部分,其中所述可收获部分优选是枝条生物质和/或种子。
20.从根据项18的植物和/或从根据项19的植物的可收获部分产生的产品。
21.编码PLA2样多肽的核酸在相对于对照植物增加植物的产量,特别是增加种子产量和/或枝条生物量中的用途。
4.WOX1样多肽
1.用于相对于对照植物增强植物的产量相关性状的方法,包括调节编码WOX1样多肽的核酸在植物中的表达,其中所述WOX1样多肽包含由基序VI:WNPTPEQLRTLEDLYRRGTRAPSTDQIQDITAQLRRYGRIEGKNVFYWFQNHKARERQK、或按照递增的优选次序与基序I具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的序列同一性的基序所代表的同源域。
2.根据项1的方法,其中所述WOX1样多肽包含下列基序的一个或多个:
(a)基序VII:KNWAPS或按照递增的优选次序与基序VII具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的序列同一性的基序;
(b)基序VIII:QTLQPFPLR或按照递增的优选次序与基序VIII具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的序列同一性的基序,其中基序VIII为WUS样基序但不具有与EAR基序接近的LELxL阻遏物基序;
(c)基序IX:FEFLPLKH或按照递增的优选次序与基序IX具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的序列同一性的基序。
3.根据项1或2的方法,其中所述调节的表达通过向植物中引入和表达编码WOX1样多肽的核酸来实现。
4.根据项1至3的任一项的方法,其中所述编码WOX1样多肽的核酸编码表A4所列的任一蛋白质,或是这样的核酸的部分,或是能够与这样的核酸杂交的核酸。
5.根据项1至4的任一项的方法,其中所述核酸序列编码表A4中所给出的任何蛋白质的直向同源物或旁系同源物。
6.根据任何前述项的方法,其中所述增强的产量相关性状包括相对于对照植物增加的产量,优选增加的生物量和/或增加的种子产量。
7.根据项1至6的任一的方法,其中在非胁迫条件下获得所述增强的产量相关性状。
8.根据项3至7的任一的方法,其中所述核酸有效地连接至组成型启动子,优选连接至GOS2启动子,最优选连接至来自稻的GOS2启动子。
9.根据项1至8的任一的方法,其中所述编码WOX1样多肽的核酸是植物来源的,优选来自双子叶植物,更优选来自杨属,更优选来自毛果杨。
10.可通过根据项1至9的任一项的方法获得的植物或其部分,包括种子,其中所述植物或其部分包含编码WOX1样多肽的重组核酸。
11.构建体,其包含:
(i)编码如项1或2中定义的WOX1样多肽的核酸;
(ii)能够驱动(i)的核酸序列表达的一个或多个控制序列;和任选地
(iii)转录终止序列。
12.根据项11的构建体,其中所述控制序列之一是组成型启动子,优选GOS2启动子,最优选来自稻的GOS2启动子。
13.根据项11或12的构建体在用于制备相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量的植物的方法中的用途。
14.利用根据项11或12的构建体转化的植物、植物部分或植物细胞。
15.用于产生相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量的转基因植物的方法,其包括:
(i)向植物中引入和表达编码如项1或2中定义的WOX1样多肽的核酸;和
(ii)在促进植物生长和发育的条件下培养所述植物细胞。
16.相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量的转基因植物,或源于所述转基因植物的转基因植物细胞,所述增加的产量因编码如项1或2中定义的WOX1样多肽的核酸的被调节的表达而产生。
17.根据项10、14或16的转基因植物,或源于其的转基因植物细胞,其中所述植物是作物植物或单子叶植物或谷类植物,例如稻、玉米、小麦、大麦、粟、黑麦(rye)、黑小麦、高粱、二粒小麦、斯佩耳特小麦、黑麦(secale)、单粒小麦、埃塞俄比亚画眉草、买罗高梁和燕麦。
18.根据项17的植物的可收获部分,其中所述可收获部分优选是枝条生物质和/或种子。
19.从根据项17的植物和/或从根据项18的植物的可收获部分产生的产品。
20.编码WOX1样多肽的核酸在相对于对照植物增加植物的产量,特别是增加种子产量和/或枝条生物量中的用途。
附图说明
现参考以下附图描述本发明,其中:
图1显示HSF多肽的多重比对。
图2显示如Koskull-Doring等.2007的图2中描述的植物HSF的系统发生树。
图3显示双元载体,用于在稻GOS2启动子(pGOS2)控制之下增加HSFA5编码核酸在稻(Oryza sativa)中的表达。
图4显示多重比对。使用MUSCLE 3.7,利用其缺省参数,比对蛋白质(Edgar,Robert C.(2004),MUSCLE:multiple sequence alignment withhigh accuracy and high throughput,Nucleic Acids Research 32(5),1792-97.)。
图5显示OPT4样多肽序列的环状系统发生图。使用CLUSTALW(Thompson,J.D.,Higgins,D.G.和Gibson,T.J.(1994)CLUSTAL W:improving the sensitivity of progressive multiple sequence alignmentsthrough sequence weighting,position specific gap penalties and weightmatrix choice.Nucl.Acids Res.22:4673-4680.)来计算邻接树。针对100次自展重复(bootstrap repeptitions),显示主分枝的支持率。环状系统发生图使用Dendroscope(Daniel H Huson,Daniel C Richter,Christian Rausch,Tobias Dezulian,Markus Franz和Regula Rupp.Dendroscope:Aninteractive viewer for large phylogenetic trees.BMC Bioinformatics.2007Nov 22;8(1):460.)来进行绘制。YSP转运蛋白家族用作外群(outgroup)。
图6显示双元载体,用于在稻GOS2启动子(pGOS2)控制之下增加OPT4样编码核酸在稻(Oryza sativa)中的表达。
图7显示多重比对。使用MUSCLE 3.7,利用其缺省参数(Edgar,Robert C.(2004),MUSCLE:multiple sequence alignment with highaccuracy and high throughput,Nucleic Acids Research 32(5),1792-97.),比对蛋白质。
图8显示所选择的PLA2样蛋白质的环状系统发生图。使用MUSCLE(Edgar(2004),Nucleic Acids Research 32(5):1792-97)比对蛋白质。使用QuickTree(Howe等.(2002),Bioinformatics 18(11):1546-7)计算邻接树。显示在100次自展重复后主分枝的支持率。使用Dendroscope(Huson等.(2007),BMC Bioinformatics 8(1):460)绘制环状系统发生图。
图9显示双元载体,用于在稻GOS2启动子(pGOS2)控制之下增加PLA2样编码核酸在稻(Oryza sativa)中的表达。
图10显示WOX1样多肽序列的比对。使用ClustalW 2.0渐近比对算法(Thompson等.(1997)Nucleic Acids Res 25:4876-4882;Chenna等.(2003).Nucleic Acids Res 31:3497-3500),利用标准设置(慢比对,相似性矩阵:Gonnet,空位开放罚分10,空位延伸罚分:0.2)进行比对。进行少量人工编辑以进一步优化比对。
图11显示使用Vector NTI(Invitrogen)的AlignX程序中提供的邻接聚类算法构建的WOX1样多肽的系统发生树。
图12显示双元载体,用于在稻GOS2启动子(pGOS2)控制之下增加WOX1样编码核酸在稻(Oryza sativa)中的表达。
实施例
现参考以下实施例描述本发明,所述实施例仅意在举例说明。如下实施例并非旨在完全限定或以其他方式限制本发明的范围。
DNA操作:除非另外说明,重组DNA技术根据描述于(Sambrook(2001)《分子克隆:实验室手册》,第三版,冷泉港实验室出版,冷泉港,纽约)或者Ausubel等(1994),Current Protocols in Molecular Biology,CurrentProtocols第一卷和第二卷的标准方案进行。用于植物分子工作的标准材料和方法由R.D.D.Croy描述于Plant Molecular Biology Labfase(1993),由BIOS Scientific Publications Ltd(UK)和Blackwell Scientific Publications(UK)出版。
实施例1:鉴定与本发明方法所用核酸序列相关的序列
1.1.HSF多肽
在例如美国国家生物技术信息中心(NCBI)、基因组研究机构(TIGR;始于TA)和联合基因组研究机构的Entrez核苷酸数据库所保持的序列中,鉴定与用于本发明方法的核酸序列相关的序列(全长cDNA、EST或基因组序列)。为此,利用了数据库序列搜索工具,例如基本局部比对工具(BLAST)(Altschul等(1990)J.Mol.Biol.215:403-410;和Altschul等(1997)NucleicAcids Res.25:3389-3402)。该程序通过将核酸或多肽序列与序列数据库进行比较,以及通过计算匹配的统计学显著性,用于寻找序列之间的局部相似的区域。例如,在TBLASTN算法中,利用本发明所用的核酸编码的多肽,其中使用默认设置,开启过滤器以忽略低复杂度序列。分析的输出视窗为两两比较,并根据概率分值(E值)排序,其中分值反映特定比对偶然发生的概率(E值越低,命中事件的显著性越高)。除了E值之外,还对比较进行同一性百分比记分。同一性百分比是指两比较核酸(或多肽)序列之间在特定长度上的相同核苷酸(或氨基酸)数。在一些情况下,可调整缺省参数来改变搜索的严格性。例如增加E值以显示不太严格的匹配。这样,可鉴定到短的几乎完全的匹配。
表A1提供了与可以用于本发明方法中的核酸序列相关的核酸序列的列表。
表A1:HSFA4和HSFA5多肽的实例
Figure BDA0000095416500000981
1.2.OPT4样多肽
利用了数据库序列搜索工具,例如基本局部比对工具(BLAST)(Altschul等(1990)J.Mol.Biol.215:403-410;和Altschul等(1997)NucleicAcids Res.25:3389-3402),在美国国家生物技术信息中心(NCBI)的Entrez核苷酸数据库所保持的序列中,鉴定了与SEQ ID NO:155的核酸序列相关的序列(全长cDNA、EST或基因组序列)。该程序通过将核酸或多肽序列与序列数据库进行比较,以及通过计算匹配的统计学显著性,用于寻找序列之间的局部相似的区域。例如,在TBLASTN算法中,利用了SEQ IDNO:156的多肽序列,其中使用默认设置,开启过滤器以忽略低复杂度序列。分析的输出视窗为两两比较,并根据概率分值(E值)排序,其中分值反映特定比对偶然发生的概率(E值越低,命中事件的显著性越高)。除了E值之外,还对比较进行同一性百分比记分。同一性百分比是指两比较核酸(或多肽)序列之间在特定长度上的相同核苷酸(或氨基酸)数。在一些情况下,可调整缺省参数来改变搜索的严格性。例如增加E值以显示不太严格的匹配。这样,可鉴定到短的几乎完全的匹配。
表A2:OPT4样核酸和多肽序列的实例:
Figure BDA0000095416500000991
Figure BDA0000095416500001001
在一些情况下,相关序列已经由研究机构如基因组研究机构(Institutefor Genomic Research,TIGR;始于TA)尝试性地进行了装配并向公众公开。可以通过关键词搜索,或是采用BLAST算法,运用目的核酸序列或多肽序列,利用真核基因直向同源物(Eukaryotic Gene Orthologs,EGO)数据库来鉴定这样的相关序列。在其他情况下,已经针对特定的生物创建了特定的核酸序列数据库,例如由联合基因组研究所(Joint Genome Institute)创建。
1.3.PLA2样多肽
利用了数据库序列搜索工具,例如基本局部比对工具(BLAST)(Altschul等(1990)J.Mol.Biol.215:403-410;和Altschul等(1997)NucleicAcids Res.25:3389-3402),在美国国家生物技术信息中心(NCBI)的Entrez核苷酸数据库所保持的序列中,鉴定了与SEQ ID NO:252和SEQ ID NO:253相关的序列(全长cDNA、EST或基因组序列)。该程序通过将核酸或多肽序列与序列数据库进行比较,以及通过计算匹配的统计学显著性,用于寻找序列之间的局部相似的区域。例如,用于本发明的核酸编码的多肽被用于TBLASTN算法中,其中使用默认设置,开启过滤器以忽略低复杂度序列。分析的输出视窗为两两比较,并根据概率分值(E值)排序,其中分值反映特定比对偶然发生的概率(E值越低,命中事件的显著性越高)。除了E值之外,还对比较进行同一性百分比记分。同一性百分比是指两比较核酸(或多肽)序列之间在特定长度上的相同核苷酸(或氨基酸)数。在一些情况下,可调整缺省参数来改变搜索的严格性。例如增加E值以显示不太严格的匹配。这样,可鉴定到短的几乎完全的匹配。
表A3提供了与SEQ ID NO:252和SEQ ID NO:253相关的核酸序列的列表。
表A3:PLA2样多肽和核酸序列的实例:
Figure BDA0000095416500001031
在一些情况下,相关序列已经由研究机构如基因组研究机构(Institutefor Genomic Research,TIGR;始于TA)尝试性地进行了装配并向公众公开。可以通过关键词搜索,或是采用BLAST算法,运用目的核酸序列或多肽序列,利用真核基因直向同源物(Eukaryotic Gene Orthologs,EGO)数据库来鉴定这样的相关序列。在其他情况下,已经针对特定的生物创建了特定的核酸序列数据库,例如由联合基因组研究所(Joint Genome Institute)创建。此外,对私有数据库的使用也已允许鉴定新型核酸和多肽序列。
1.4.WOX1样多肽
利用了数据库序列搜索工具,例如基本局部比对工具(BLAST)(Altschul等(1990)J.Mol.Biol.215:403-410;和Altschul等(1997)NucleicAcids Res.25:3389-3402),在美国国家生物技术信息中心(NCBI)的Entrez核苷酸数据库所保持的序列中,鉴定了与SEQ ID NO:373的核酸序列相关的序列(全长cDNA、EST或基因组序列)。该程序通过将核酸或多肽序列与序列数据库进行比较,以及通过计算匹配的统计学显著性,用于寻找序列之间的局部相似的区域。例如,用于本发明的核酸编码的多肽被用于TBLASTN算法中,其中使用默认设置,开启过滤器以忽略低复杂度序列。分析的输出视窗为两两比较,并根据概率分值(E值)排序,其中分值反映特定比对偶然发生的概率(E值越低,命中事件的显著性越高)。除了E值之外,还对比较进行同一性百分比记分。同一性百分比是指两比较核酸(或多肽)序列之间在特定长度上的相同核苷酸(或氨基酸)数。在一些情况下,可调整缺省参数来改变搜索的严格性。例如增加E值以显示不太严格的匹配。这样,可鉴定到短的几乎完全的匹配。
表A4提供了与本发明方法中所使用的核酸序列相关的核酸序列的列表。
表A4:WOX1样多肽和核酸序列的实例:
Figure BDA0000095416500001051
在一些情况下,相关序列已经由研究机构如基因组研究机构(Institutefor Genomic Research,TIGR;始于TA)尝试性地进行了装配并向公众公开。可以通过关键词搜索,或是采用BLAST算法,运用目的核酸序列或多肽序列,利用真核基因直向同源物(Eukaryotic Gene Orthologs,EGO)数据库来鉴定这样的相关序列。在其他情况下,已经针对特定的生物创建了特定的核酸序列数据库,例如由联合基因组研究所(Joint Genome Institute)创建。此外,对私有数据库的使用也已允许鉴定新型核酸和多肽序列。
实施例2:比对与本发明方法所用的多肽序列相关的序列
2.1.HSF多肽
多肽序列的比对利用Clustal W 2.0渐近比对算法(Thompson等(1997)Nucleic Acids Res 25:4876-4882;Chenna等(2003).Nucleic Acids Res31:3497-3500),使用标准设置(慢比对,相似性矩阵:Gonnet(或Blosum62(如果比对多肽))、空位开放罚分10,空位延伸罚分0.2))来进行。进行微小的手工编辑以进一步优化比对。HSFA5多肽在图1中进行比对。
植物来源的HSF多肽的系统发生树复制自Koskill-Doring等.2007(图2)。
多肽序列的比对利用Clustal W 2.0渐近比对算法(Thompson等(1997)Nucleic Acids Res 25:4876-4882;Chenna等(2003).Nucleic Acids Res31:3497-3500),使用标准设置(慢比对,相似性矩阵:Gonnet,空位开放罚分10,空位延伸罚分0.2)来进行。进行微小的手工编辑以进一步优化比对。
2.2.OPT4样多肽
如图4中所描述的进行了多肽序列的比对并且如附图说明中所述构建了图5中显示的OPT4样多肽的系统发生树。
2.3.PLA2样多肽
如图7中所描述的进行了多肽序列的比对并且如附图说明中所述构建了图8中显示的PLA2样多肽的系统发生树。
2.4.WOX1样多肽
多肽序列的比对利用Clustal W 2.0渐近比对算法(Thompson等(1997)Nucleic Acids Res 25:4876-4882;Chenna等(2003).Nucleic Acids Res31:3497-3500),使用标准设置(慢比对,相似性矩阵:Gonnet(或Blosum62(如果比对多肽))、空位开放罚分10,空位延伸罚分0.2))来进行。进行微小的手工编辑以进一步优化比对。WOX1样多肽在图10中进行比对。
使用Vector NTI(Invitrogen)的AlignX程序中提供的邻接聚类算法,构建了WOX1样多肽的系统发生树(图11)。
实施例3:计算可以用于实施本发明方法的多肽序列之间的全局同一性百分比
3.1.HSF多肽
可以用于实施本发明方法的全长多肽序列之间的全局相似性和同一性百分比,利用本领域可用方法之一即MatGAT(矩阵全局比对工具)软件(BMC Bioinformatics.20034:29.MatGAT:an application that generatessimilarity/identity matrices using protein or DNA sequences.CampanellaJJ,Bitincka L,Smalley J;软件由Ledion Bitincka托管)来确定。MatGAT软件无需对数据进行预比对,即可产生DNA或蛋白质序列的相似性/同一性矩阵。该程序利用Myers和Miller全局比对算法(空位开放罚分为12,而空位延伸罚分为2)进行一系列的两两比对,利用例如Blosum 62(对于多肽而言)计算相似性和同一性,然后将结果排列成距离矩阵。序列相似性示于对角线下半部,而序列同一性示于对角线上半部。
比较所用的参数为:
记分矩阵:Blosum 62
首个空位:12
延伸空位:2
多肽序列全长范围的全局相似性和同一性的软件分析结果示于表B。同一性百分比以粗体示于对角线上方,而相似性百分比示于对角线下方(正面)。
与SEQ ID NO:2相比较,可以用于本发明方法的HSFA5多肽序列之间的同一性百分比可低至33.1%氨基酸同一性。
表B1:多肽序列全长范围的全局相似性和同一性的MatGAT结果。
  1   2   3   4   5   6   7   8   9   10   11   12
  1.A.thaliana_AT4G18880.1   59   36   53   54   53   53   52   39   36   57   38
  2.A.thaliana_AT5G45710.1   70   34   50   50   51   51   49   41   34   53   38
  3.---2468   55   50   37   37   37   38   36   41   100   37   37
  4.G.max_Gm0003x00186   72   65   55   95   69   69   76   41   37   66   39
  5.G.max_Gm0022x00353   74   65   55   99   67   67   74   42   37   65   40
  6.G.max_Gm0030x00291   72   68   55   83   82   94   63   40   37   60   40
  7.G.max_Gm0070x00147   73   67   54   84   83   97   62   41   38   61   41
  8.M.truncatula_AC152407_1.4   70   64   53   86   85   79   79   39   36   61   36
  9.O.sativa_LOC_Os01g54550.1   61   57   61   59   59   60   59   57   41   42   41
  10.O.sativa_LOC_Os05g45410.1   55   50   100   55   55   55   54   53   61   37   37
  11.P.trichocarpa_scaff_XI.679   75   67   56   81   81   78   78   78   62   56   42
  12.P.trichocarpa_scaff_XIV.882   60   55   58   60   61   59   59   59   61   58   63
  13.S.lycopersicum_TA44843_4081   69   64   52   74   75   73   72   72   60   52   77   59
  14.S.lycopersicum_TA47501_4081   61   60   54   61   60   62   60   62   56   54   62   61
  15.A.thaliana_AT4G13980.1   51   46   51   51   51   51   51   52   55   51   52   52
  16.---49571   52   44   52   50   49   50   50   51   49   52   50   50
  17.G.max_Gm0003x00291   49   45   53   52   50   51   51   53   53   53   51   53
  18.G.max_Gm0022x00445   51   45   53   51   50   52   51   53   52   53   52   55
  19.M.truncatula_AC146585_2.5   52   44   52   50   49   50   50   51   49   52   50   50
  20.M.truncatula_AC187466_52.4   50   45   50   48   47   47   49   47   49   50   50   50
  21.O.sativa_LOC_Os02g29340.1   49   47   52   51   51   50   49   50   52   52   51   51
  22.P.trichocarpa_scaff_88.24   51   44   53   51   51   53   52   51   52   53   50   52
  23.P.trichocarpa_scaff_I.2223   49   44   54   50   50   51   51   51   53   54   50   52
  13   14   15   16   17   18   19   20   21   22   23
  1.A.thaliana_AT4G18880.1   47.7   39.9   33.7   32.7   30.5   30.8   32.7   30.6   32.2   33   32
  2.A.thaliana_AT5G45710.1   44   42   31.9   29.9   30.2   29.5   29.9   29   31.7   30   31
  3.---2468   36.1   36.2   33.2   34.8   33   32.8   34.8   30.6   36.8   31   34
  4.G.max_Gm0003x00186   51.4   41.6   32   32.8   32.3   32.7   32.8   32.1   34.1   33   34
  5.G.max_Gm0022x00353   53.1   40.4   32.1   31.6   32   32   31.6   32   34.2   33   34
  6.G.max_Gm0030x00291   52.2   42.5   34   36   34.9   37.5   36   31   34.8   35   34
  7.G.max_Gm0070x00147   51.2   41.4   35.1   35.2   35.2   35.2   35.2   31.3   34.6   35   34
  8.M.truncatula_AC152407_1.4   50.9   42   33.1   33.7   34.7   34   33.7   32.3   33.3   34   34
  9.O.sativa_LOC_Os01g54550.1   39.6   39.8   33.7   33.9   34.7   35.3   33.9   30.1   35.8   35   36
  10.O.sativa_LOC_Os05g45410.1   36.1   36.2   33.2   34.8   33   32.8   34.8   30.6   36.8   31   34
  11.P.trichocarpa_scaff_XI.679   58.6   40.7   34.5   33   32.9   33.4   33   29.8   34.1   33   35
  12.P.trichocarpa_scaff_XIV.882   39.3   44   30.5   32.9   32.2   32.9   32.9   29.7   34.5   33   31
  13.S.lycopersicum_TA44843_4081   40   34.4   33.7   35.2   34.7   33.7   31.5   33.1   34   35
  14.S.lycopersicum_TA47501_4081   60.8   31.2   33.1   33.6   34.5   33.1   30   34.1   33   33
  15.A.thaliana_AT4G13980.1   51.1   50   52.4   55.1   55.1   52.4   43.9   47.7   56   58
  16.---49571   50.9   49.7   67.8   73.4   74.4   100   66.4   44.5   58   59
  17.G.max_Gm0003x00291   50.9   49.3   73.5   83.2   95.8   73.4   62.8   47.2   66   66
  18.G.max_Gm0022x00445   50.7   49.9   73.2   83.4   97.9   74.4   63.2   46.5   66   65
  19.M.truncatula_AC146585_2.5   50.9   49.7   67.8   100   83.2   83.4   66.4   44.5   58   59
  20.M.truncatula_AC187466_52.4   48.7   47.4   61.4   78.6   75.8   76.3   78.6   38.4   49   52
  21.O.sativa_LOC_Os02g29340.1   49.1   49.5   64.2   62.6   67   67.3   62.6   60   47   48
  22.P.trichocarpa_scaff_88.24   48.5   50.7   72.6   72.5   80   79.6   72.5   67.6   66   86
  23.P.trichocarpa_scaff_1.2223   49.6   49.2   73.5   73.9   81   80.4   73.9   69.6   66.1   91
3.2.OPT4样多肽
全长OPT4样多肽序列之间的全局相似性和同一性百分比,可以利用MatGAT(矩阵全局比对工具)软件(BMC Bioinformatics.20034:29.MatGAT:an application that generates similarity/identity matrices usingprotein or DNA sequences.Campabella JJ,Bitincka L,Smalley J;软件由Ledion Bitincka托管)来确定。MatGAT软件无需对数据进行预比对,即可产生DNA或蛋白质序列的相似性/同一性矩阵。该程序利用Myers和Miller全局比对算法(空位开放罚分为12,而空位延伸罚分为2)进行一系列的两两比对,利用例如Blosum 62(对于多肽而言)计算相似性和同一性,然后将结果排列成距离矩阵。
比较所用的参数为:
记分矩阵:Blosum 62
首个空位:12
延伸空位:2
还可以获得有关特定结构域的局部比对的MATGAT表,或有关特定结构域之间的同一性/相似性百分比的数据。
3.3.PLA2样多肽
全长PLA2样多肽序列之间的全局相似性和同一性百分比,可以利用MatGAT(矩阵全局比对工具)软件(BMC Bioinformatics.20034:29.MatGAT:an application that generates similarity/identity matrices usingprotein or DNA sequences.Campanella JJ,Bitincka L,Smalley J;软件由Ledion Bitincka托管)来确定。MatGAT软件无需对数据进行预比对,即可产生DNA或蛋白质序列的相似性/同一性矩阵。该程序利用Myers和Miller全局比对算法(空位开放罚分为12,而空位延伸罚分为2)进行一系列的两两比对,利用例如Blosum 62(对于多肽而言)计算相似性和同一性,然后将结果排列成距离矩阵。
比较所用的参数为:
记分矩阵:Blosum 62
首个空位:12
延伸空位:2
还可以获得有关特定结构域的局部比对的MATGAT表,或有关特定结构域之间的同一性/相似性百分比的数据。
3.4.WOX1样多肽
全长WOX1样多肽序列之间的全局相似性和同一性百分比,可以利用MatGAT(矩阵全局比对工具)软件(BMC Bioinformatics.20034:29.MatGAT:an application that generates similarity/identity matrices usingprotein or DNA sequences.Campanella JJ,Bitincka L,Smalley J;软件由Ledion Bitincka托管)来确定。MatGAT软件无需对数据进行预比对,即可产生DNA或蛋白质序列的相似性/同一性矩阵。该程序利用Myers和Miller全局比对算法(空位开放罚分为12,而空位延伸罚分为2)进行一系列的两两比对,利用例如Blosum 62(对于多肽而言)计算相似性和同一性,然后将结果排列成距离矩阵。序列相似性示于对角线下半部,而序列同一性示于对角线上半部。
比较所用的参数为:
记分矩阵:Blosum 62
首个空位:12
延伸空位:2
还可以获得有关特定结构域的局部比对的MATGAT表,或有关特定结构域之间的同一性/相似性百分比的数据。
实施例4:鉴定可以用于实施本发明方法的多肽序列中所含的结构域
4.1.HSF多肽
蛋白质家族、结构域和位点整合资源(Integrated Resource of ProteinFamilies,Domains and Sites(InterPro))数据库是进行基于文本以及序列的搜索的、常用标签数据库的一个整合界面。InterPro数据库将这些数据库结合起来,这些数据库利用不同的方法学和有关充分表征的蛋白质的不同程度的生物信息来产生蛋白质标签。合作数据库包括SWISS-PROT、PROSITE、TrEMBL、PRINTS、ProDom和Pfam、Smart和TIGRFAMs。Pfam是覆盖许多常见蛋白质结构域和家族的、多重序列比对和隐马尔可夫模型的大集合。Pfam由位于英国的桑格研究所服务器(Sanger Instituteserver)托管。Interpro由位于英国的欧洲生物信息学研究所(EuropeanBioinformatics Institute)托管。
InterPro扫描SEQ ID NO:2多肽序列以寻找保守结构域。
4.2.OPT4样多肽
蛋白质家族、结构域和位点整合资源(Integrated Resource of ProteinFamilies,Domains and Sites(InterPro))数据库是进行基于文本以及序列的搜索的、常用标签数据库的一个整合界面。InterPro数据库将这些数据库结合起来,这些数据库利用不同的方法学和有关充分表征的蛋白质的不同程度的生物信息来产生蛋白质标签。合作数据库包括SWISS-PROT、PROSITE、TrEMBL、PRINTS、ProDom和Pfam、Smart和TIGRFAMs。Pfam是覆盖许多常见蛋白质结构域和家族的、多重序列比对和隐马尔可夫模型的大集合。Pfam由位于英国的桑格研究所服务器(Sanger Instituteserver)托管。Interpro由位于英国的欧洲生物信息学研究所(EuropeanBioinformatics Institute)托管。
SEQ ID NO:156所示的多肽序列的InterPro扫描结果示于表C1中。
表C1:SEQ ID NO:156所示多肽序列的InterPro扫描结果(主登录号).
Figure BDA0000095416500001121
4.3.PLA2样多肽
蛋白质家族、结构域和位点整合资源(Integrated Resource of ProteinFamilies,Domains and Sites(InterPro))数据库是进行基于文本以及序列的搜索的、常用标签数据库的一个整合界面。InterPro数据库将这些数据库结合起来,这些数据库利用不同的方法学和有关充分表征的蛋白质的不同程度的生物信息来产生蛋白质标签。合作数据库包括SWISS-PROT、PROSITE、TrEMBL、PRINTS、ProDom和Pfam、Smart和TIGRFAMs。Pfam是覆盖许多常见蛋白质结构域和家族的、多重序列比对和隐马尔可夫模型的大集合。Pfam由位于英国的桑格研究所服务器(Sanger Instituteserver)托管。Interpro由位于英国的欧洲生物信息学研究所(EuropeanBioinformatics Institute)托管。
SEQ ID NO:253所示多肽序列的InterPro扫描结果示于表C2。
表C2:SEQ ID NO:253所示多肽序列的InterPro扫描结果(主登录号)。
Figure BDA0000095416500001131
4.4.WOX1样多肽
蛋白质家族、结构域和位点整合资源(Integrated Resource of ProteinFamilies,Domains and Sites(InterPro))数据库是进行基于文本以及序列的搜索的、常用标签数据库的一个整合界面。InterPro数据库将这些数据库结合起来,这些数据库利用不同的方法学和有关充分表征的蛋白质的不同程度的生物信息来产生蛋白质标签。合作数据库包括SWISS-PROT、PROSITE、TrEMBL、PRINTS、ProDom和Pfam、Smart和TIGRFAMs。Pfam是覆盖许多常见蛋白质结构域和家族的、多重序列比对和隐马尔可夫模型的大集合。Pfam由位于英国的桑格研究所服务器(Sanger Instituteserver)托管。Interpro由位于英国的欧洲生物信息学研究所(EuropeanBioinformatics Institute)托管。
实施例5:用于实施本发明方法的多肽序列的拓扑学预测
5.1.HSF多肽
TargetP 1.1预测真核蛋白质的亚细胞定位。位置分配所基于的是如下任一N-端前序列的预测性存在:叶绿体转运肽(cTP)、线粒体靶向肽(mTP)或分泌途径信号肽(SP)。最终预测所基于的分值并非真正的概率,且加起来并不必为1。不过,根据TargetP,得分最高的定位是最可能的,且分值之间的关系(可靠性级别)可作为所述预测的可靠性的指标。可靠性级别(RC)范围从1到5,其中1表示最强的预测。TargetP由丹麦技术大学(TechnicalUniversity of Denmark)的服务器维护。
对于经预测包含N末端前序列的序列,还可预测潜在切割位点。
可以选择许多参数,例如生物组别(非植物或植物)、截断值设置(无、预定的截断值设置、或用户指定的截断值设置)和预测切割位点的计算(是或否)。例如,可以选择“植物”生物组别,规定无截断值,要求预测长度的转运肽。SEQ ID NO:2所示多肽序列的亚细胞定位可以是细胞质或细胞核,未预测到转运肽。
许多其他算法可用于实施此类分析,包括:
·在丹麦技术大学的服务器上托管的ChloroP 1.1;
·在澳大利亚布里斯班的昆士兰大学分子生物科学学院(Institute for Molecular Bioscience)的服务器上托管的ProteinProwler Subcellular Localisation Predictor 1.2版;
·在Edmonton,Alberta,Canada的阿尔伯特大学(Universityof Alberta)的服务器上托管的PENCE Proteome Analyst PA-GOSUB2.5;
·在丹麦技术大学的服务器上托管的TMHMM;
·PSORT(URL:psort.org)
·PLOC(Park和Kanehisa,Bioinformatics,19,1656-1663,2003)。
5.2.OPT4样多肽
TargetP 1.1预测真核蛋白质的亚细胞定位。位置分配所基于的是如下任一N-端前序列的预测性存在:叶绿体转运肽(cTP)、线粒体靶向肽(mTP)或分泌途径信号肽(SP)。最终预测所基于的分值并非真正的概率,且加起来并不必为1。不过,根据TargetP,得分最高的定位是最可能的,且分值之间的关系(可靠性级别)可作为所述预测的可靠性的指标。可靠性级别(RC)范围从1到5,其中1表示最强的预测。TargetP由丹麦技术大学(TechnicalUniversity of Denmark)的服务器维护。
对于经预测包含N末端前序列的序列,还可预测潜在切割位点。
可以选择许多参数,例如生物组别(非植物或植物)、截断值设置(无、预定的截断值设置、或用户指定的截断值设置)和预测切割位点的计算(是或否)。
许多其他算法可用于实施此类分析,包括:
·在丹麦技术大学的服务器上托管的ChloroP 1.1;
·在澳大利亚布里斯班的昆士兰大学分子生物科学学院(Institute for Molecular Bioscience)的服务器上托管的ProteinProwler Subcellular Localisation Predictor 1.2版;
·在Edmonton,Alberta,Canada的阿尔伯特大学(Universityof Alberta)的服务器上托管的PENCE Proteome Analyst PA-GOSUB2.5;
·在丹麦技术大学的服务器上托管的TMHMM;
·PSORT(URL:psort.org)
·PLOC(Park和Kanehisa,Bioinformatics,19,1656-1663,2003)。
5.3.PLA2样多肽
TargetP 1.1预测真核蛋白质的亚细胞定位。位置分配所基于的是如下任一N-端前序列的预测性存在:叶绿体转运肽(cTP)、线粒体靶向肽(mTP)或分泌途径信号肽(SP)。最终预测所基于的分值并非真正的概率,且加起来并不必为1。不过,根据TargetP,得分最高的定位是最可能的,且分值之间的关系(可靠性级别)可作为所述预测的可靠性的指标。可靠性级别(RC)范围从1到5,其中1表示最强的预测。TargetP由丹麦技术大学(TechnicalUniversity of Denmark)的服务器维护。
对于经预测包含N末端前序列的序列,还可预测潜在切割位点。
可以选择许多参数,例如生物组别(非植物或植物)、截断值设置(无、预定的截断值设置、或用户指定的截断值设置)和预测切割位点的计算(是或否)。
许多其他算法可用于实施此类分析,包括:
·在丹麦技术大学的服务器上托管的ChloroP 1.1;
·在澳大利亚布里斯班的昆士兰大学分子生物科学学院(Institute for Molecular Bioscience)的服务器上托管的ProteinProwler Subcellular Localisation Predictor 1.2版;
·在Edmonton,Alberta,Canada的阿尔伯特大学(Universityof Alberta)的服务器上托管的PENCE Proteome Analyst PA-GOSUB2.5;
·在丹麦技术大学的服务器上托管的TMHMM;
·PSORT(URL:psort.org)
·PLOC(Park和Kanehisa,Bioinformatics,19,1656-1663,2003)。
5.4.WOX1样多肽
TargetP 1.1预测真核蛋白质的亚细胞定位。位置分配所基于的是如下任一N-端前序列的预测性存在:叶绿体转运肽(cTP)、线粒体靶向肽(mTP)或分泌途径信号肽(SP)。最终预测所基于的分值并非真正的概率,且加起来并不必为1。不过,根据TargetP,得分最高的定位是最可能的,且分值之间的关系(可靠性级别)可作为所述预测的可靠性的指标。可靠性级别(RC)范围从1到5,其中1表示最强的预测。TargetP由丹麦技术大学(TechnicalUniversity of Denmark)的服务器维护。对于经预测包含N末端前序列的序列,还可预测潜在切割位点。
可以选择许多参数,例如生物组别(非植物或植物)、截断值设置(无、预定的截断值设置、或用户指定的截断值设置)和预测切割位点的计算(是或否)。
许多其他算法可用于实施此类分析,包括:
·在丹麦技术大学的服务器上托管的ChloroP 1.1;
·在澳大利亚布里斯班的昆士兰大学分子生物科学学院(Institute for Molecular Bioscience)的服务器上托管的ProteinProwler Subcellular Localisation Predictor 1.2版;
·在Edmonton,Alberta,Canada的阿尔伯特大学(Universityof Alberta)的服务器上托管的PENCE Proteome Analyst PA-GOSUB2.5;
·在丹麦技术大学的服务器上托管的TMHMM;
·PSORT(URL:psort.org)
·PLOC(Park和Kanehisa,Bioinformatics,19,1656-1663,2003)。
实施例6:与用于实施本发明方法的多肽序列相关的测定法
6.1.HSF多肽
可基本上如Baniwal等.2007所定义的测定SEQ ID NO:2所示的HSFA5多肽的活性。简而言之,可以在体内,例如在原生质体中,使用阻遏物报告基因测定试验,分析HSFA5多肽与DNA分子的结合。阻遏物报告基因包含位于花椰菜花叶病毒35S启动子TATA盒紧下游的多个Hsf结合位点。结合阻断35S启动子的功能,从而减少报告GUS基因的转录。使用标准方法监控GUS活性。
6.2.OPT4样多肽
Osawa等.,(.Biochem J.2006 Jan 1;393(Pt 1):267-75.)提供了用于OPT4样活性的测定试验。
实施例7:用于本发明方法的核酸序列的克隆
7.1.HSF多肽
使用客户定制的蒺藜苜蓿幼苗cDNA文库(在pCMV Sport 6.0中;Invitrogen,Paisley,UK)作为模板,通过PCR扩增用于本发明方法的核酸序列。在标准条件下使用Hifi Taq DNA聚合酶,在50μl PCR mix中使用200ng模板进行PCR。
使用的引物是:5-ggggacaagtttgtacaaaaaagcaggcttaaacaatgaattctgcaccacaatcc-3’(SEQ ID NO:152;有义)和5’-ggggaccactttgtacaagaaagctgggtagacagcatgctcaaaggg-3’(SEQ ID NO:153;反向,互补),包括用于Gateway重组的AttB位点。也使用标准方法纯化扩增的PCR片段。接着进行Gateway操作的第一步,即BP反应,在此期间PCR片段与pDONR201质粒体内重组以产生Gateway术语所称的“进入(entry)克隆”,pHSFA5。作为
Figure BDA0000095416500001181
技术一部分的质粒pDONR201购自英骏公司(Invitrogen)。
含有SEQ ID NO:1的进入克隆随后与用于稻转化的Destination载体一起用于LR反应。此载体在T-DNA边界内包含如下功能性元件:植物可选择的标记;可筛选的标记表达盒;和旨在与已克隆到进入克隆中的目的核酸序列进行LR体内重组的Gateway盒。用于组成型特异表达的稻GOS2启动子(SEQ ID NO:154)位于此Gateway盒的上游。
在LR重组步骤之后,根据本领域公知的方法,将所产生的表达载体pGOS2::HSFA5(图3)转化进农杆菌菌株LBA4044。
7.2.OPT4样多肽
使用客户定制的拟南芥幼苗cDNA文库(在pCMV Sport 6.0中;Invitrogen,Paisley,UK)作为模板,通过PCR扩增用于本发明方法的核酸序列。在标准条件下使用Hifi Taq DNA聚合酶,在50μl PCR mix中使用200ng模板进行PCR。
使用的引物是:prm09267(SEQ ID NO:250;有义,起始密码子粗体):5’-ggggacaagtttgtacaaaaaagcaggcttaaacaatggccaccgccgac-3’和prm09268(SEQ ID NO:251;反向,互补):5’-ggggaccactttgtacaagaaagctgggtcacaccaatggatcctttaagat-3’,包括用于Gateway重组的AttB位点。也使用标准方法纯化扩增的PCR片段。接着进行Gateway操作的第一步,即BP反应,在此期间PCR片段与pDONR201质粒体内重组以产生Gateway术语所称的“进入(entry)克隆”,pOPT4_ike。作为
Figure BDA0000095416500001191
技术一部分的质粒pDONR201购自英骏公司(Invitrogen)。
含有SEQ ID NO:155的进入克隆随后与用于稻转化的Destination载体一起用于LR反应。此载体在T-DNA边界内包含如下功能性元件:植物可选择的标记;可筛选的标记表达盒;和旨在与已克隆到进入克隆中的目的核酸序列进行LR体内重组的Gateway盒。用于组成型特异表达的稻GOS2启动子(SEQ ID NO:249)位于此Gateway盒的上游。
在LR重组步骤之后,根据本领域公知的方法,将所产生的表达载体pGOS2::OPT4-like(图6)转化进农杆菌菌株LBA4044。
7.3.PLA2样多肽
使用毛果杨cDNA文库(在pCMV Sport 6.0中;Invitrogen,Paisley,UK)作为模板,通过PCR扩增用于本发明方法的核酸序列。在标准条件下使用Hifi Taq DNA聚合酶,在50μl PCR mix中使用200ng模板进行PCR。
使用的引物是:prm12472(SEQ ID NO:371;有义,起始密码子粗体):5’-ggggacaagtttgtacaaaaaagcaggcttaaacaatgaatggaaaggaaatttac-3’和prm12472(SE Q ID NO:372;反义,互补):5’-ggggaccactttgtacaagaaa gctgggtactcctatcgtctagttgctg-3’,包括用于Gateway重组的AttB位点。也使用标准方法纯化扩增的PCR片段。接着进行Gateway操作的第一步,即BP反应,在此期间PCR片段与pDONR201质粒体内重组以产生Gateway术语所称的“进入(entry)克隆”,pPLA2_ike。作为技术一部分的质粒pDONR201购自英骏公司(Invitrogen)。
含有SEQ ID NO:252的进入克隆随后与用于稻转化的Destination载体一起用于LR反应。此载体在T-DNA边界内包含如下功能性元件:植物可选择的标记;可筛选的标记表达盒;和旨在与已克隆到进入克隆中的目的核酸序列进行LR体内重组的Gateway盒。用于组成型特异表达的稻GOS2启动子(SEQ ID NO:370)位于此Gateway盒的上游。
在LR重组步骤之后,根据本领域公知的方法,将所产生的表达载体pGOS2::PLA2-like(图9)转化进农杆菌菌株LBA4044。
7.4.WOX1样多肽
使用杨树cDNA文库(在pCMV Sport 6.0中;Invitrogen,Paisley,UK)作为模板,通过PCR扩增用于本发明方法的核酸序列。在标准条件下使用Hifi Taq DNA聚合酶,在50μl PCR mix中使用200ng模板进行PCR。
使用的引物是:prm11930(SEQ ID NO:478;有义,起始密码子粗体):5’-ggggacaagtttgtacaaaaaagcaggcttaaacaatgtggatgatgggttataat-3’和prm11931(SEQ ID NO:479;反义,互补):5’-ggggaccactttgtacaagaaagctgggtctttggatggtcatcattagt-3’,包括用于Gateway重组的AttB位点。也使用标准方法纯化扩增的PCR片段。接着进行Gateway操作的第一步,即BP反应,在此期间PCR片段与pDONR201质粒体内重组以产生Gateway术语所称的“进入(entry)克隆”,pWOX1_ike。作为
Figure BDA0000095416500001202
技术一部分的质粒pDONR201购自英骏公司(Invitrogen)。
含有SEQ ID NO:373的进入克隆随后与用于稻转化的Destination载体一起用于LR反应。此载体在T-DNA边界内包含如下功能性元件:植物可选择的标记;可筛选的标记表达盒;和旨在与已克隆到进入克隆中的目的核酸序列进行LR体内重组的Gateway盒。用于组成型特异表达的稻GOS2启动子(SEQ ID NO:477)位于此Gateway盒的上游。
在LR重组步骤之后,根据本领域公知的方法,将所产生的表达载体pGOS2::WOX1-like(图12)转化进农杆菌菌株LBA4044。
实施例8:植物转化
稻转化
用含表达载体的农杆菌转化稻(Oryza sativa)植物。使梗稻栽培种日本晴(Nipponbare)的成熟干种子脱壳。通过在70%乙醇中孵育1分钟,接着在0.2%HgCl2中孵育30分钟,接着用无菌蒸馏水洗6次,每次15分钟进行消毒。然后使消毒的种子在含有2,4-D的培养基(愈伤组织诱导培养基)上萌发。在黑暗中孵育四周之后,切下盾片来源的胚发生愈伤组织,并在相同的培养基中增殖。两周之后,通过在相同培养基中传代培养另外2周来扩增或者增殖愈伤组织。在共培养之前3天,在新鲜培养基上传代培养胚发生愈伤组织块(以加强细胞分裂活性)。
含有表达载体的农杆菌菌株LBA4404用于共培养。农杆菌接种于含有合适抗生素的AB培养基上,并在28℃培养3天。接着收集细菌并悬浮在液体共培养培养基中至光密度(OD600)约为1。接着将悬浮液转移至培养皿,并将愈伤组织浸于悬浮液中15分钟。随后将愈伤组织在滤纸上沾干,转移至固化的共培养培养基中,并在黑暗中于25℃孵育3天。在选择剂的存在下,共培养的愈伤组织在含有2,4-D的培养基上于28℃暗培养四周。在此期间,发育出快速生长的抗性愈伤组织岛。将此材料转移至再生培养基并在光照下孵育之后,释放了胚发生潜力,在接下来的四至五周发育出芽。将芽从愈伤组织切下,并在含生长素的培养基中孵育2到3周,将其从培养基转移至土壤。变硬的芽在高湿度和短白昼条件下在温室中培养。
一个构建体产生约35个独立的T0稻转化体。将原代转化体从组织培养室转移到温室。在定量PCR分析验证T-DNA插入物的拷贝数后,只保留对选择剂表现出耐受性的单拷贝转基因植物用以收获T1种子。在移植后三至五个月收获种子。该方法以超过50%的比率产生了单基因座转化体(Aldemita和Hodges 1996,Chan等,1993,Hiei等,1994)。
实施例9:其他作物的转化
玉米转化
用Ishida等(1996)Nature Biotech 14(6):745-50所述方法的改良方案进行玉米(玉蜀黍)转化。在玉米中转化是基因型依赖性的,并且只有特定的基因型适于转化和再生。近交系A188(明尼苏达大学)或以A188为亲本的杂种是转化供体材料的优良来源,但是也可以成功使用其它基因型。授粉后约11天(DAP),当未成熟胚的长度是约1至1.2mm时,从玉米植物收获穗。共培养未成熟胚和含有表达载体的根癌农杆菌,并通过器官发生回收转基因植物。切离的胚依次生长在含有选择剂(例如咪唑啉酮,但可使用多种选择标记)的愈伤组织诱导培养基、和玉米再生培养基上。培养板在光照下于25℃孵育2-3周,或直到芽发育。从每个胚中将绿芽转移到玉米生根培养基上并在25℃孵育2-3周,直到根发育。将生根的芽移植到温室的土壤中。从表现出对选择剂具有耐受性且含有单拷贝T-DNA插入片段的植物产生T1种子。
小麦转化
运用Ishida等(1996)Nature Biotech 14(6):745-50描述的方法,进行小麦的转化。栽培种Bobwhite(可从CIMMYT,Mexico(墨西哥)获得)常用来进行转化。共培养未成熟胚和含有表达载体的根癌农杆菌,并通过器官发生回收转基因植株。与农杆菌孵育后,胚依次体外生长在含有选择试剂(例如咪唑啉酮,但可使用多种选择标记)的愈伤组织诱导培养基,和再生培养基上。培养板在光照下于25℃孵育2-3周,或直到芽发育。从每个胚中将绿芽转移到生根培养基上并在25℃孵育2-3周,直到根发育。将生根的芽移植到温室的土壤中。从表现出对选择剂具有耐受性且含有单拷贝T-DNA插入片段的植物产生T1种子。
大豆转化
根据Texas A&M专利US 5,164,310所述方法的改良方案转化大豆。若干商业大豆品种可以通过该方法转化。栽培种Jack(可以得自伊利诺斯种子公司(the Illinois Seed foundation))常用来进行转化。对大豆种子消毒以进行体外播种。从七日龄幼苗中切出下胚轴、胚根和一个子叶。进一步培养上胚轴和剩下的子叶以发育腋结。切离这些腋结并与含有表达载体的根癌农杆菌孵育。在共培养处理后,洗涤外植体并转移到选择培养基中。切离再生的芽,置于芽伸长培养基中。将长度不超过1cm的芽置于生根培养基中直到发育出根。将生根的芽移植到温室的土壤中。从对选择剂表现出耐受性且含有单拷贝T-DNA插入片段的植物产生T1种子。
油菜籽/芸苔转化
利用5-6日龄幼苗的子叶柄和下胚轴作为外植体进行组织培养并根据Babic等(1998,Plant Cell Rep 17:183-188)进行转化。商业栽培种Westar(加拿大农业(Agriculture Canada))是用作转化的标准品种,但是也可以使用其它品种。对芸苔种子表面消毒以进行体外播种。从体外幼苗中切离附着有子叶的子叶柄外植体,并通过将子叶柄外植体的切割端浸入细菌悬浮液中来接种农杆菌(含有表达载体)。随后外植体在含有3mg/l BAP、3%蔗糖、0.7%植物琼脂(Phytagar)的MSBAP-3培养基中于23℃、16小时光照培养2天。与农杆菌共培养2天后,将子叶柄外植体转移到含有3mg/l BAP、头孢噻肟、羧苄青霉素或特美汀(300mg/l)的MSBAP-3培养基中7天,然后在含有头孢噻肟、羧苄青霉素或特美汀和选择剂的MSBAP-3培养基上培养直到芽再生。当芽长5-10mm时,将其切下并转移到芽伸长培养基(MSBAP-0.5,含有0.5mg/l BAP)中。将约2cm长的芽转移到生根培养基(MS0)中进行根诱导。将生根的芽移植到温室的土壤中。从对选择剂表现出耐受性且含有单拷贝T-DNA插入片段的植物产生T1种子。
苜蓿转化
利用(McKersie等1999 Plant Physiol 119:839-847)的方法转化苜蓿(紫花苜蓿(Medicago sativa))的再生克隆。苜蓿的再生和转化是基因型依赖性的,因此需要再生植株。获得再生植株的方法已有描述。例如,这些可以选自栽培种Rangelander(加拿大农业(Agriculture Canada))或如BrownDCW和A Atanassov(1985.Plant Cell Tissue Organ Culture 4:111-112)所述的任何其它商业苜蓿品种。可选的,选择RA3品种(威斯康辛大学(University of Wisconsin))用于组织培养(Walker等,1978Am J Bot65:654-659)。子叶柄外植体与含有表达载体的根癌农杆菌C58C1 pMP90(McKersie等,1999 Plant Physiol 119:839-847)或LBA4404的过夜培养物进行共培养。外植体在含有288mg/L Pro、53mg/L硫代脯氨酸、4.35g/LK2SO4和100μm乙酰丁香酮的SH诱导培养基上在黑暗中共培养3天。外植体在半强度Murashige-Skoog培养基(Murashige和Skoog,1962)中洗涤,并置于相同的SH诱导培养基中,但该培养基不含乙酰丁香酮而含有合适的选择剂和合适的抗生素以抑制农杆菌生长。数周后,体细胞胚转移到不含生长调节剂、不含抗生素、含有50g/L蔗糖的BOi2Y发育培养基中。体细胞胚随后在半强度Murashige-Skoog培养基上萌发。生根的幼苗移植到花盆中并在温室中生长。从对选择剂表现出耐受性且含有单拷贝T-DNA插入片段的植物产生T1种子。
棉花转化
按照US 5,159,135中描述的方法使用根癌农杆菌转化棉花。于3%次氯酸钠溶液中20分钟,对棉花种子表面消毒,并且在具有500μg/ml头孢噻肟的蒸馏水中进行洗涤。然后将种子转移至具有50μg/ml苯菌灵(benomyl)的SH培养基中进行萌发。从4至6日龄的幼苗中取出下胚轴,切成0.5厘米的小块,置于0.8%琼脂上。将农杆菌悬浮液(每ml大约108个细胞,从用目的基因和适当的选择标记转化的过夜培养物稀释的)用于接种下胚轴外植体。在室温和光照下3天后,将组织转移至具有Murashige和Skoog盐和B5维生素(Gamborg等,Exp.Cell Res.50:151-158(1968))、0.1mg/l2,4-D、0.1mg/l 6-糠氨基嘌呤(6-furfurylaminopurine)和750μg/mlMgCL2、以及50至100μg/ml头孢噻肟和400-500μg/ml羧苄青霉素(以杀死残留细菌)的固体培养基(1.6g/l Gelrite)。在2至3个月(每4至6周进行一次传代培养)后分离单细胞系并且将其在选择培养基上进一步培养以进行组织扩增(30℃,16小时光周期)。接着将转化的组织在非选择培养基上进一步培养2至3个月以产生体细胞胚。将至少4mm长的健康外貌的胚转移至具有SH培养基(于细小蛭石中)的试管中,所述培养基补充有0.1mg/l吲哚乙酸、6-糠氨基嘌呤和赤霉酸。将胚在30℃和16小时的光周期下进行培养,将2至3叶期的小植株转移入具有蛭石和营养物的花盆。植物变硬,然后转移至温室以进一步栽培。
实施例10:表型评估方法
10.1评估设置
产生大约35个独立的T0稻转化体。原代转化体由组织培养室转移到温室进行生长并收获T1种子。保留其中T1代发生转基因的存在/缺乏的3∶1分离的事件。对于每一个此类事件,通过监测可视标记的表达,选出大约10个含转基因(杂合子和纯合子)的T1幼苗、以及大约10个缺少转基因(无效合子)的T1幼苗。转基因植物和相应的无效合子在随机位置上并排生长。温室条件为短白昼(12小时光照),日间28℃,夜间22℃,相对湿度70%。对在非胁迫条件下生长的植物定期浇水,以确保水和养分是非限制性的以及满足完成生长和发育的植物需要。
按照与T1代相同的评估程序,对T1事件在T2代中进行了进一步的评估,但是每个事件采用了更多的个体。从播种期到成熟期,植物数次通过数码成像箱。在每个时间点上对每株植物从至少6个不同的角度获取数码图像(2048×1536像素,1千6百万色)。
干旱筛选
在正常条件下在花盆土中培养来自T2种子的植物,直到进入抽穗期。然后将其转移到“干”区,停止灌溉。向随机选择的花盆中插入湿度探测仪,以监测土壤水含量(SWC)。当SWC降至一定的阈值时,自动向植物持续补水,直到再次达到正常水平。然后将植物再次重新转移到正常条件下。其余的栽培(植物成熟、种子收获)与不在非生物胁迫条件下培养的植物相同。如针对在正常条件下生长所详述的那样,记录了生长和产量参数。
氮利用效率筛选
在除营养液以外为正常的条件下在花盆土中栽培来自T2种子的稻植物。从植物移植到成熟,用特定的营养液对花盆进行灌溉,所述营养液含有减小的氮(N)含量,通常少7到8倍。其余的栽培(植物成熟、种子收获)与不在非生物胁迫条件下培养的植物相同。如对正常条件下生长所详细描述的那样,记录了生长和产量参数。
盐胁迫筛选
植物生长在由椰壳纤维和argex(3∶1)制成的基质上。在小植株移植到温室后的头两周期间应用正常营养液。过了头两周之后,向营养液中添加25mM盐(NaCl),直至收获植物。然后测量种子相关参数。
10.2统计学分析:F检验
利用双因素ANOVA(方差分析)作为统计模型,对植物表型特征进行总体评估。对用本发明基因转化的所有事件的所有植株的所有测量参数进行了F检验。进行F检验以检查基因在所有转化事件上的效应,并检验基因的总体效应,亦称为“整体基因效应”。真实整体基因效应的显著性阈值设置为F检验的5%概率水平。显著性F检验值指示存在基因效应,这意味着引起表型上差异的不仅仅是基因的存在或位置。
因为进行了具有重叠事件的两个实验,故进行组合分析。这可以用于检查效应在两个实验中的一致性,并且如果确是如此的话,积累来自两个实验的证据以增加结论的可靠性。所使用的方法是考虑数据的多层次结构(即实验-事件-分离子)的混合模型法。通过将似然比检验与卡方分布相比较来获得P值。
10.3测量的参数
生物量相关参数测量
从播种期到成熟期,植物数次通过数码成像箱。在每个时间点上对每株植物从至少6个不同的角度获取数码图像(2048×1536像素,1千6百万色)。
植物地上面积(或者说叶生物量)通过计数数码图像中区别于背景的地上植物部分的像素总数而确定。此值取同一时间点从不同的角度拍摄的照片的平均值,并通过校准转换为以平方毫米表示的物理表面值。实验表明通过这种方法测量的地上植物面积与植物地上部分的生物量相关。该地上面积是在植物达到其最大叶生物量的时间点测量的面积。早期活力是萌发后三周的植物(幼苗)地上面积。根生物量增加表达为根总生物量(测量为在植物一生中观察到的最大根生物量)的增加;或者表达为根/枝条指数(测量为在根和枝条活跃生长期中根生物量和枝条生物量之间的比值)的增加。
通过计数区别于背景的地上植物部分的像素总数,测定了早期活力。此值取同一时间点从不同的角度拍摄的照片的平均值,并通过校准转换为以平方毫米表示的物理表面值。下面描述的结果是针对萌发后3周的植物的。
种子相关参数测量
收获成熟的一级圆锥花序(primary panicles)、计数、装袋、贴上条形码标记,然后在烤箱中于37℃干燥三天。随后使圆锥花序脱粒,收集并计数所有的种子。使用鼓风装置使饱满谷壳和空壳分开。弃去空壳,再次计数剩下的部分。在分析天平上称重饱满的谷壳。通过计数在分离步骤之后剩下的饱满谷壳数,确定饱满种子数。通过称重从植物收获的所有饱满谷壳来测量种子总产量。通过计数从植物收获的谷壳数来测量每株植物的种子总数。根据计数的饱满种子数及其总重量外推得出千粒重(TKW)。收获指数(HI)在本发明中定义为种子总产量和地上面积(mm2)之间的比值再乘以因子106。每圆锥花序的花总数在本发明中定义为种子总数与成熟一级圆锥花序数之间的比率。种子饱满率在本发明中定义为饱满种子数占种子(或小花)总数的比例(以%表示)。
实施例11:转基因植物的表型评估结果
11.1.HSF多肽
GOS2::HSFA5
评估在干旱筛选下在稻GOS2启动子控制下以有义方向表达包含SEQID NO:1的最长开放阅读框的核酸的T1代转基因稻植物,评估结果见下。关于转基因植物产生的细节,参见之前的实施例。在种子总重量(totalwgseeds)、饱满种子数(nrfilledseed)、种子饱满率(fillrate)、收获指数(harvestindex)和千粒重上,观察到了增加(表D1)。
表D1.
Figure BDA0000095416500001281
评估在非胁迫条件下在稻GOS2启动子控制下以有义方向表达包含SEQ ID NO:1的最长开放阅读框的核酸的T1代转基因稻植物,评估结果显示,与对照无效合子植物相比,一级圆锥花序数的9%增加。
11.2.OPT4样多肽
在减小的氮可利用率的条件下,利用在GOS2启动子控制之下的SEQID NO:155的OPT4基因转化的植物,相对于对照植物(相应的无效合子),在地上面积、种子总重量、千粒重(TKW)、根粗度和种子总数上显示了增加。
11.3.PLA2样多肽
评估在非胁迫条件下表达编码SEQ ID NO:253的PLA2样多肽的核酸的T2代转基因稻植物,评估结果见下表D。当在非胁迫条件下生长时,在种子总重量、饱满种子数、收获指数、千粒重(TKW)和GravityYMax(与植物高度高度相关)上,观察到了至少5%的增加。
表D2:表达编码PLA2样多肽的核酸的转基因稻植物的数据总结。对于每一个参数,来自F检验的p值为p≤0.05且高于5%阈值,并显示总体百分比增加。
 参数   总体
 种子总重量   27.8%
 饱满种子数   16.0%
 收获指数   21.2%
 千粒重(TKW)   10.9%
 GravityYMax   5.4%
上表总结了,相对于对照植物(相应的无效合子),获自在非胁迫条件下生长的、转化了在GOS2启动子控制下的PLA2样基因(SEQ ID NO:252)的植物的数据。
在氮胁迫条件下表达PLA2样核酸的转基因稻植物的评估结果显示于下表D3。在种子总重量、收获指数、千粒重(TKW)和与植物高度高度相关的GravityYMax上,观察到了增加。
表D3:在氮胁迫条件下生长的转基因稻植物的数据总结。对于每一个参数,来自F检验的p值为p≤0.05且高于5%阈值,并显示总体百分比增加。
 参数   总体
 种子总重量   12.7%
 收获指数   8.1%
 千粒重(TKW)   9.5%
 GravityYMax   4.0%
11.4.WOX1样多肽
产生了大约35个独立的T0稻转化体。原代转化体由组织培养室转移到温室进行生长并收获T1种子。保留其中T1代发生转基因的存在/缺乏的3∶1分离的6个事件。对于每一个此类事件,通过监测可视标记的表达,选出大约10个含转基因(杂合子和纯合子)的T1幼苗、以及大约10个缺少转基因(无效合子)的T1幼苗。转基因植物和相应的无效合子在随机位置上并排生长。温室条件为短白昼(12小时光照),日间28℃,夜间22℃,相对湿度70%。对在非胁迫条件下生长的植物定期浇水,以确保水和养分是非限制性的以及满足完成生长和发育的植物需要。
按照与T1代相同的评估程序,对4个T1事件在T2代中进行了进一步的评估,但是每个事件采用了更多的个体。从播种期到成熟期,植物数次通过数码成像箱。在每个时间点上对每株植物从至少6个不同的角度获取数码图像(2048×1536像素,1千6百万色)。
在非胁迫条件下,如上所述的,用处于GOS2启动子控制之下的SEQID NO:373的WOX1样基因转化的植物,与对照植物(相应的无效合子)相比较,在地上面积、种子总重量、千粒重(TKW)、根生物量以及植株高度和种子饱满率上,显示出了增加。

Claims (85)

1.用于相对于对照植物增强植物的产量相关性状的方法,包括调节编码HSFA4或HSFA5多肽的核酸在植物中的表达,所述多肽包含按照递增的优选次序与
(i)SEQ ID NO:47至SEQ ID NO:70(DNA结合结构域);和
(ii)SEQ ID NO:71至SEQ ID NO:94(寡聚化结构域);和
(iii)SEQ ID NO:95至SEQ ID NO:118(活化AHA基序);和
(iv)其中所述多肽是HSFA5多肽:
i.SEQ ID NO:119至SEQ ID NO:127(HSF5A基序I);和/或
ii.SEQ ID NO:128至SEQ ID NO:136(HSF5A基序II);和
(v)其中所述多肽是HSF4A多肽:
i.SEQ ID NO:137至SEQ ID NO:151(HSF4A基序I)所示的氨基酸具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的全序列同一性的结构域或基序。
2.根据权利要求1的方法,其中所述调节的表达通过向植物中引入和表达编码HSFA4或HSFA5多肽的核酸来实现。
3.根据权利要求1或2的方法,包括减少所述编码HSFA4的核酸的表达。
4.根据权利要求1或2的方法,包括增加所述编码HSFA5的核酸的表达。
5.根据权利要求1至4之任一项的方法,其中所述编码HSFA4或HSFA5多肽的核酸编码表A所列之任一项蛋白质,或是这样的核酸的部分、或是能够与这样的核酸杂交的核酸。
6.根据权利要求1至5之任一项的方法,其中所述核酸序列编码表A中所给出的任何蛋白质的直向同源物或旁系同源物。
7.根据任何前述权利要求的方法,其中所述增强的产量相关性状包括相对于对照植物增加的产量,优选增加的生物量和/或增加的种子产量。
8.根据权利要求1至7之任一项的方法,其中在非胁迫条件下获得所述增强的产量相关性状。
9.根据权利要求1至7之任一项的方法,其中在干旱胁迫、盐胁迫或氮缺乏条件下获得所述增强的产量相关性状。
10.根据权利要求2至9之任一项的方法,其中所述核酸有效地连接至组成型启动子,优选连接至GOS2启动子,最优选连接至来自稻的GOS2启动子。
11.根据权利要求1至10之任一项的方法,其中所述编码HSFA4或HSFA5多肽的核酸是植物来源的,优选来自双子叶植物,更优选来自十字花科,更优选来自拟南芥属(Arabidopsis),最优选来自拟南芥(Arabidopsisthaliana)。
12.可通过根据权利要求1至11之任一项的方法获得的植物或其部分,包括种子,其中所述植物或其部分包含编码HSFA4或HSFA5多肽的重组核酸。
13.构建体,其包含:
(i)编码HSFA4或HSFA5多肽的核酸;
(ii)能够驱动(i)的核酸序列表达的一个或多个控制序列;和任选地
(iii)转录终止序列。
14.根据权利要求13的构建体,其中所述控制序列之一是组成型启动子,优选GOS2启动子,最优选来自稻的GOS2启动子。
15.根据权利要求13或14的构建体在用于制备相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量的植物的方法中的用途。
16.利用根据权利要求13或14的构建体转化的植物、植物部分或植物细胞。
17.用于产生相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量的转基因植物的方法,其包括:
(i)向植物中引入和表达编码HSFA4或HSFA5多肽的核酸;和
(ii)在促进植物生长和发育的条件下培养所述植物细胞。
18.相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量的转基因植物,或源自所述转基因植物的转基因植物细胞,所述增加的产量因编码HSFA4或HSFA5多肽的核酸的被调节的表达而产生。
19.根据权利要求12、16或18的转基因植物或源自其的转基因植物细胞,其中所述植物是作物植物或单子叶植物或谷类植物,例如稻、玉米、小麦、大麦、粟、黑麦(rye)、黑小麦、高粱、二粒小麦、斯佩耳特小麦、黑麦(secale)、单粒小麦、埃塞俄比亚画眉草、买罗高梁和燕麦。
20.根据权利要求19的植物的可收获部分,其中所述可收获部分优选是枝条生物质和/或种子。
21.从根据权利要求19的植物和/或从根据权利要求20的植物的可收获部分得到的产品。
22.编码HSFA4或HSFA5多肽的核酸在相对于对照植物增加植物的产量,特别是在增加种子产量和/或枝条生物量中的用途。
23.分离的核酸分子,其包含
(a)SEQ ID NO:189或SEQ ID NO:191所示的核酸;
(b)SEQ ID NO:189或SEQ ID NO:191所示的核酸的互补序列;
(c)编码OPT4样多肽的核酸,所述多肽包含基序1:NPG和基序II:KIPPR并且按照递增的优选次序与SEQ ID NO:190或SEQ ID NO:192所示的氨基酸序列具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的序列同一性。
24.分离的多肽,其包含:
(a)SEQ ID NO:190或SEQ ID NO:192所示的氨基酸序列;
(b)包含基序I:NPG和基序II:KIPPR的氨基酸序列,所述氨基酸序列按照递增的优选次序与SEQ ID NO:190或SEQ ID NO:192所示的氨基酸序列具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的序列同一性;
(c)上面(a)或(b)所给出的任何氨基酸序列的衍生物。
25.用于相对于对照植物增强植物的产量相关性的方法,包括调节编码包含基序I:NPG和基序II:KIPPR的OPT4样多肽的核酸在植物中的表达。
26.根据权利要求25的方法,其中所述OPT4样多肽,当用于构建系统发生树例如图5中描述的系统发生树时,与由进化枝I、II、III或IV定义的OPT4样多肽组,最优选与包含SEQ ID NO:156所示氨基酸序列的进化枝聚类。
27.根据权利要求25或26的方法,其中所述调节的表达通过向植物中引入和表达编码OPT4样多肽的核酸来实现。
28.根据权利要求25至27之任一项的方法,其中所述编码OPT4样多肽的核酸编码表A2所列之任一蛋白质,或是这样的核酸的部分,或是能够与这样的核酸杂交的核酸。
29.根据权利要求25至28之任一项的方法,其中所述核酸序列编码表A2中所给出的任何蛋白质的直向同源物或旁系同源物。
30.根据权利要求25至29之任一项的方法,其中所述增强的产量相关性状包括相对于对照植物增加的产量,优选增加的生物量和/或增加的种子产量。
31.根据权利要求25至30之任一项的方法,其中在氮缺乏条件下获得所述增强的产量相关性状。
32.根据权利要求25至31之任一项的方法,其中所述核酸有效地连接至组成型启动子,优选连接至GOS2启动子,最优选连接至来自稻的GOS2启动子。
33.根据权利要求25至32之任一项的方法,其中所述编码OPT4样多肽的核酸是植物来源的,优选来自双子叶植物,更优选来自十字花科,更优选来自拟南芥属,最优选来自拟南芥。
34.可通过根据权利要求25至33之任一项的方法获得的植物或其部分,包括种子,其中所述植物或其部分包含编码OPT4样多肽的重组核酸。
35.构建体,其包含:
(i)编码如权利要求24中定义的OPT4样多肽的核酸;
(ii)能够驱动(i)的核酸序列表达的一个或多个控制序列;和任选地
(iii)转录终止序列。
36.根据权利要求35的构建体,其中所述控制序列之一是组成型启动子,优选GOS2启动子,最优选来自稻的GOS2启动子。
37.根据权利要求35或36的构建体在用于制备相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量的植物的方法中的用途。
38.利用根据权利要求35或36的构建体转化的植物、植物部分或植物细胞。
39.用于产生相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量的转基因植物的方法,其包括:
(i)向植物中引入和表达编码如权利要求23或24中定义的OPT4样多肽的核酸;和
(ii)在促进植物生长和发育的条件下培养所述植物细胞。
40.相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量的转基因植物,或源于所述转基因植物的转基因植物细胞,所述增加的产量因编码如权利要求24中定义的OPT4样多肽的核酸的被调节的表达而产生
41.根据权利要求34、38或40的转基因植物或源于其的转基因植物细胞,其中所述植物是作物植物或单子叶植物或谷类植物,例如稻、玉米、小麦、大麦、粟、黑麦(rye)、黑小麦、高粱、二粒小麦、斯佩耳特小麦、黑麦(secale)、单粒小麦、埃塞俄比亚画眉草、买罗高梁和燕麦。
42.根据权利要求41的植物的可收获部分,其中所述可收获部分优选是枝条生物质和/或种子。
43.从根据权利要求41的植物和/或从根据权利要求42的植物的可收获部分产生的产品。
44.编码OPT4样多肽的核酸在相对于对照植物增加植物的产量,特别是增加种子产量和/或枝条生物量中的用途。
45.用于相对于对照植物增强植物的产量相关性的方法,包括调节编码PLA2样多肽的核酸在植物中的表达,所述多肽包含RNA识别基序2和基序III:T[TS][VL][MI][IV][KR]NIPN。
46.根据权利要求45的方法,其中所述PLA2样多肽包含基序IV:SP[PA]RDG和/或基序V:NK[CS]NVGYGFVN[ML]TSP[QE]A。
47.根据权利要求45或46的方法,其中所述调节的表达通过向植物中引入和表达编码PLA2样多肽的核酸来实现。
48.根据权利要求45至47之任一项的方法,其中述编码PLA2样多肽的核酸编码表A3所列之任一蛋白质,或是这样的核酸的部分,或是能够与这样的核酸杂交的核酸。
49.根据权利要求45至48之任一项的方法,其中所述核酸序列编码表A3中所给出的任何蛋白质的直向同源物或旁系同源物。
50.根据权利要求45至49之任一项的方法,其中所述增强的产量相关性状包括相对于对照植物增加的产量,特别是增加的生物量和/或增加的种子产量。
51.根据权利要求45至50之任一项的方法,其中在非胁迫条件下获得所述增强的产量相关性状。
52.根据权利要求45至50之任一项的方法,其中在氮胁迫条件下获得所述增强的产量相关性状。
53.根据权利要求45至52之任一项的方法,其中所述核酸有效地连接至组成型启动子,优选连接至GOS2启动子,最优选连接至来自稻的GOS2启动子。
54.根据权利要求45至53之任一项的方法,其中所述编码PLA2样多肽的核酸是植物来源的,优选来自双子叶植物,更优选来自杨属,更优选来自毛果杨。
55.可通过根据权利要求45至54之任一项的方法获得的植物或其部分,包括种子,其中所述植物或其部分包含编码PLA2样多肽的重组核酸。
56.构建体,其包含:
(i)编码如权利要求45或46中定义的PLA2样多肽的核酸;
(ii)能够驱动(i)的核酸序列表达的一个或多个控制序列;和任选地
(iii)转录终止序列。
57.根据权利要求56的构建体,其中所述控制序列之一是组成型启动子,优选GOS2启动子,最优选来自稻的GOS2启动子。
58.根据权利要求56或57的构建体在用于制备相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量的植物的方法中的用途。
59.利用根据权利要求56或57的构建体转化的植物、植物部分或植物细胞。
60.用于产生相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量的转基因植物的方法,其包括:
(i)向植物中引入和表达编码如权利要求45或46中定义的PLA2样多肽的核酸;和
(ii)在促进植物生长和发育的条件下培养所述植物细胞。
61.相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量的转基因植物,或源于所述转基因植物的转基因植物细胞,所述增加的产量因编码如权利要求45或46中定义的PLA2样多肽的核酸的被调节的表达而产生。
62.根据权利要求55、59或61的转基因植物,或源于其的转基因植物细胞,其中所述植物是作物植物或单子叶植物或谷类植物,例如稻、玉米、小麦、大麦、粟、黑麦(rye)、黑小麦、高粱、二粒小麦、斯佩耳特小麦、黑麦(secale)、单粒小麦、埃塞俄比亚画眉草、买罗高梁、甘蔗和燕麦。
63.根据权利要求62的植物的可收获部分,其中所述可收获部分优选是枝条生物质和/或种子。
64.从根据权利要求62的植物和/或从根据权利要求63的植物的可收获部分产生的产品。
65.编码PLA2样多肽的核酸在相对于对照植物增加植物的产量,特别是增加种子产量和/或枝条生物量中的用途。
66.用于相对于对照植物增强植物的产量相关性状的方法,包括调节编码WOX1样多肽的核酸在植物中的表达,其中所述WOX1样多肽包含由基序VI:WNPTPEQLRTLEDLYRRGTRAPSTDQIQDITAQLRRYGRIEGKNVFYWFQNHKARERQK、或按照递增的优选次序与基序VI具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的序列同一性的基序所代表的同源域。
67.根据权利要求66的方法,其中所述WOX1样多肽包含下列基序的一个或多个:
(i)基序VII:KNWAPS或按照递增的优选次序与基序VII具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的序列同一性的基序;
(ii)基序VIII:QTLQPFPLR或按照递增的优选次序与基序VIII具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的序列同一性的基序,其中基序VIII为WUS样基序但不具有与EAR基序接近的LELxL阻遏物基序;
(iii)基序IX:FEFLPLKH或按照递增的优选次序与基序IX具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的序列同一性的基序。
68.根据权利要求66或67的方法,其中所述调节的表达通过向植物中引入和表达编码WOX1样多肽的核酸来实现。
69.根据权利要求66至68之任一项的方法,其中所述编码WOX1样多肽的核酸编码表A4所列之任一蛋白质,或是这样的核酸的部分,或是能够与这样的核酸杂交的核酸。
70.根据权利要求66至69之任一项的方法,其中所述核酸序列编码表A4中所给出的任何蛋白质的直向同源物或旁系同源物。
71.根据权利要求66至70之任一项的方法,其中所述增强的产量相关性状包括相对于对照植物增加的产量,优选增加的生物量和/或增加的种子产量。
72.根据权利要求66至71之任一项的方法,其中在非胁迫条件下获得所述增强的产量相关性状。
73.根据权利要求68至72之任一项的方法,其中所述核酸有效地连接至组成型启动子,优选连接至GOS2启动子,最优选连接至来自稻的GOS2启动子。
74.根据权利要求66至73之任一项的方法,其中所述编码WOX1样多肽的核酸是植物来源的,优选来自双子叶植物,更优选来自杨属,更优选来自毛果杨。
75.可通过根据权利要求66至74之任一项的方法获得的植物或其部分,包括种子,其中所述植物或其部分包含编码WOX1样多肽的重组核酸。
76.构建体,其包含:
(i)编码如权利要求66或67中定义的WOX1样多肽的核酸;
(ii)能够驱动(i)的核酸序列表达的一个或多个控制序列;和任选地
(iii)转录终止序列。
77.根据权利要求76的构建体,其中所述控制序列之一是组成型启动子,优选GOS2启动子,最优选来自稻的GOS2启动子。
78.根据权利要求76或77的构建体在用于制备相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量的植物的方法中的用途。
79.利用根据权利要求76或77的构建体转化的植物、植物部分或植物细胞。
80.用于产生相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量的转基因植物的方法,其包括:
(i)向植物中引入和表达编码如权利要求66或67中定义的WOX1样多肽的核酸;和
(ii)在促进植物生长和发育的条件下培养所述植物细胞。
81.相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量的转基因植物,或源于所述转基因植物的转基因植物细胞,所述增加的产量因编码如权利要求66或67中定义的WOX1样多肽的核酸的被调节的表达而产生。
82.根据权利要求75、79或81的转基因植物,或源于其的转基因植物细胞,其中所述植物是作物植物或单子叶植物或谷类植物,例如稻、玉米、小麦、大麦、粟、黑麦(rye)、黑小麦、高粱、二粒小麦、斯佩耳特小麦、黑麦(secale)、单粒小麦、埃塞俄比亚画眉草、买罗高梁和燕麦。
83.根据权利要求82的植物的可收获部分,其中所述可收获部分优选是枝条生物质和/或种子。
84.从根据权利要求82的植物和/或从根据权利要求83的植物的可收获部分产生的产品。
85.编码WOX1样多肽的核酸在相对于对照植物增加植物的产量,特别是增加种子产量和/或枝条生物量中的用途。
CN2010800147400A 2009-01-28 2010-01-13 具有增强的产量相关性状的植物及其制备方法 Pending CN102365366A (zh)

Applications Claiming Priority (17)

Application Number Priority Date Filing Date Title
EP09151557 2009-01-28
EP09151545.2 2009-01-28
EP09151557.7 2009-01-28
EP09151556 2009-01-28
EP09151570.0 2009-01-28
EP09151556.9 2009-01-28
EP09151570 2009-01-28
EP09151545 2009-01-28
US15152109P 2009-02-11 2009-02-11
US15151709P 2009-02-11 2009-02-11
US15152309P 2009-02-11 2009-02-11
US15152509P 2009-02-11 2009-02-11
US61/151517 2009-02-11
US61/151521 2009-02-11
US61/151523 2009-02-11
US61/151525 2009-02-11
PCT/EP2010/050310 WO2010086221A1 (en) 2009-01-28 2010-01-13 Plants having enhanced yield-related traits and a method for making the same

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN201410445921.9A Division CN104232679A (zh) 2009-01-28 2010-01-13 具有增强的产量相关性状的植物及其制备方法

Publications (1)

Publication Number Publication Date
CN102365366A true CN102365366A (zh) 2012-02-29

Family

ID=41818414

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201410445921.9A Pending CN104232679A (zh) 2009-01-28 2010-01-13 具有增强的产量相关性状的植物及其制备方法
CN2010800147400A Pending CN102365366A (zh) 2009-01-28 2010-01-13 具有增强的产量相关性状的植物及其制备方法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN201410445921.9A Pending CN104232679A (zh) 2009-01-28 2010-01-13 具有增强的产量相关性状的植物及其制备方法

Country Status (10)

Country Link
US (2) US20110283420A1 (zh)
EP (2) EP2391719A1 (zh)
CN (2) CN104232679A (zh)
AR (1) AR075186A1 (zh)
AU (1) AU2010209875A1 (zh)
BR (1) BRPI1007465A2 (zh)
CA (1) CA2750007A1 (zh)
DE (1) DE112010000838T5 (zh)
EA (1) EA201170947A1 (zh)
WO (1) WO2010086221A1 (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104073503A (zh) * 2013-03-26 2014-10-01 中国农业科学院作物科学研究所 水稻转录因子Os11g01130基因的应用
CN105164262A (zh) * 2013-11-22 2015-12-16 孟加拉朱特研究所 来自长蒴黄麻和圆果种黄麻的编码wuschel相关的同源框4(wox4)蛋白的核苷酸序列和其使用方法
CN111206041A (zh) * 2019-10-24 2020-05-29 华中农业大学 OsBAK1P基因在控制水稻抗旱性中的应用
CN113024648A (zh) * 2021-03-07 2021-06-25 安徽农业大学 一种玉米的热激转录因子ZmHsf05及其应用
CN113604468A (zh) * 2021-09-02 2021-11-05 河北师范大学 小麦单株穗数及耐热性性状相关snp位点及其应用
CN114703216A (zh) * 2022-03-16 2022-07-05 华中农业大学 莴苣LsWOX3L基因在控制莴苣刺有无性状中的应用
CN116024256A (zh) * 2022-10-09 2023-04-28 南京农业大学 一种水稻基因OsHSFA4d的基因工程应用

Families Citing this family (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2012222999A1 (en) * 2011-02-28 2013-09-19 Basf Plant Science Company Gmbh Plants having enhanced yield-related traits and producing methods thereof
MX2013009749A (es) * 2011-02-28 2013-10-01 Basf Plant Science Co Gmbh Plantas que tienen rasgos relacionados con rendimiento mejorado y metodos para producir los mismos.
BR112013022227A2 (pt) * 2011-03-01 2017-09-19 Basf Plant Science Co Gmbh plantas possuindo características relacionadas ao rendimento melhoradas e métodos de produção das mesmas
EP2511295A1 (en) * 2011-04-15 2012-10-17 Institut National De La Sante Et De La Recherche Medicale Compositions for preventing and/or treating an infection by an HIV-1 virus
CN103814133A (zh) * 2011-07-19 2014-05-21 巴斯夫植物科学有限公司 具有增强的产量相关性状的植物和其生产方法
MX2014004520A (es) * 2011-10-20 2014-05-28 Basf Plant Science Co Gmbh Plantas que tienen mejores rasgos relacionados con el rendimiento y un metodo para producirlas.
AR089254A1 (es) * 2011-12-15 2014-08-13 Dow Agrosciences Llc Metodo para transformacion mejorada utilizando agrobacterium
CN104093840A (zh) * 2011-12-23 2014-10-08 杭州瑞丰生物科技有限公司 调控植物生长基因的克隆及其在提高作物产量中的应用
EA028528B1 (ru) 2013-03-13 2017-11-30 Пайонир Хай-Бред Интернэшнл, Инк. Внесение глифосата для борьбы с сорняками у brassica
BR112015023285B1 (pt) 2013-03-14 2022-03-03 Pioneer Hi-Bred International, Inc. Cassete de expressão, célula hospedeira bacteriana e método para controlar uma praga de planta do tipo coleóptero
CA2901316A1 (en) 2013-03-15 2014-09-25 Pioneer Hi-Bred International, Inc. Phi-4 polypeptides and methods for their use
CN106232820A (zh) 2013-08-16 2016-12-14 先锋国际良种公司 杀昆虫蛋白及其使用方法
BR122020001770B1 (pt) 2013-09-13 2022-11-29 Pioneer Hi-Bred International, Inc Construto de dna, método de obtenção de planta transgênica, proteína de fusão, método para controlar uma população de praga de inseto, método para inibir o crescimento ou matar uma praga de inseto
UA120608C2 (uk) 2014-02-07 2020-01-10 Піонір Хай-Бред Інтернешнл, Інк. Очищений поліпептид ptip-83 та спосіб його застосування
WO2016044092A1 (en) 2014-09-17 2016-03-24 Pioneer Hi Bred International Inc Compositions and methods to control insect pests
CN113372421A (zh) 2014-10-16 2021-09-10 先锋国际良种公司 杀昆虫蛋白及其使用方法
US20170359965A1 (en) 2014-12-19 2017-12-21 E I Du Pont De Nemours And Company Polylactic acid compositions with accelerated degradation rate and increased heat stability
CN108064233B (zh) 2015-05-19 2022-07-15 先锋国际良种公司 杀昆虫蛋白及其使用方法
CA2986265A1 (en) 2015-06-16 2016-12-22 Pioneer Hi-Bred International, Inc. Compositions and methods to control insect pests
WO2017023486A1 (en) 2015-08-06 2017-02-09 Pioneer Hi-Bred International, Inc. Plant derived insecticidal proteins and methods for their use
EP3341483B1 (en) 2015-08-28 2019-12-18 Pioneer Hi-Bred International, Inc. Ochrobactrum-mediated transformation of plants
CN106544344A (zh) * 2015-09-23 2017-03-29 杭州瑞丰生物科技有限公司 一种组织特异性启动子在调控农作物产量中的应用
WO2017105987A1 (en) 2015-12-18 2017-06-22 Pioneer Hi-Bred International, Inc. Insecticidal proteins and methods for their use
CN105566472B (zh) * 2016-03-07 2019-08-20 中国农业科学院生物技术研究所 蒺藜苜蓿叶片发育调节基因stf、编码蛋白及其应用
BR112018072417B1 (pt) 2016-05-04 2023-03-14 E. I. Du Pont De Nemours And Company Polipeptídeo inseticida recombinante, polipeptídeo quimérico, composição, polinucleotídeo recombinante, construtos de dna, métodos para obter uma planta transgênica, métodos para inibir o crescimento ou extermínio de uma praga de inseto ou população de praga, método para obter uma célula procariótica transformada, célula procariótica transformada e método para modificar geneticamente o polipeptídeo inseticida
CA3022858A1 (en) 2016-06-16 2017-12-21 Pioneer Hi-Bred International, Inc. Compositions and methods to control insect pests
RU2019102714A (ru) 2016-07-01 2020-08-03 Пайонир Хай-Бред Интернэшнл, Инк. Инсектицидные белки из растений и способы их применения
US20210292778A1 (en) 2016-07-12 2021-09-23 Pioneer Hi-Bred International, Inc. Compositions and methods to control insect pests
EP3535285B1 (en) 2016-11-01 2022-04-06 Pioneer Hi-Bred International, Inc. Insecticidal proteins and methods for their use
CN106868037A (zh) * 2017-01-21 2017-06-20 浙江大学 一种tel基因在调控玉米农艺性状中的应用
CN108997484B (zh) 2017-06-07 2020-07-24 中国农业科学院作物科学研究所 小麦TaWox5基因在提高小麦转化效率中的应用
EP3787395A1 (en) * 2018-05-01 2021-03-10 Keygene N.V. Genes for hormone-free plant regeneration
CN109485708B (zh) * 2018-11-09 2023-12-05 中国中医科学院中药研究所 用于检测人参维管束干细胞的特异性基因PgWOX4及其检测方法与应用
CN109355297B (zh) * 2018-11-19 2021-04-13 浙江农林大学 铁皮石斛DcWOX4基因及其在提高植物茎分蘖中的应用
CN112410347A (zh) * 2019-08-21 2021-02-26 中国农业大学 玉米ZmHsf21基因及其应用
CA3167040A1 (en) * 2020-02-07 2021-08-12 Yunhai Li Methods of controlling grain size and weight
BR112022027035A2 (pt) 2020-07-14 2023-04-11 Pioneer Hi Bred Int Proteínas inseticidas e métodos para uso das mesmas
CN111808866A (zh) * 2020-07-23 2020-10-23 南京林业大学 一种石榴PgWUS基因及其应用
CN113502291B (zh) * 2021-05-21 2023-03-10 南京林业大学 一种日香桂快速脱分化相关ofWOX1基因及其应用
CN114369599B (zh) * 2022-01-25 2023-04-21 北京师范大学 一种增加水稻产量的长链非编码rna基因及其应用
CN114958869B (zh) * 2022-05-23 2023-06-02 南京林业大学 杂交鹅掌楸分生组织生长关键基因LhWOX4及其应用

Family Cites Families (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4962028A (en) 1986-07-09 1990-10-09 Dna Plant Technology Corporation Plant promotors
US5116742A (en) 1986-12-03 1992-05-26 University Patents, Inc. RNA ribozyme restriction endoribonucleases and methods
US4987071A (en) 1986-12-03 1991-01-22 University Patents, Inc. RNA ribozyme polymerases, dephosphorylases, restriction endoribonucleases and methods
US5004863B2 (en) 1986-12-03 2000-10-17 Agracetus Genetic engineering of cotton plants and lines
EP0419533A1 (en) 1988-06-01 1991-04-03 THE TEXAS A&M UNIVERSITY SYSTEM Method for transforming plants via the shoot apex
AU4115693A (en) 1992-04-24 1993-11-29 Sri International In vivo homologous sequence targeting in eukaryotic cells
HUT71929A (en) 1992-06-29 1996-02-28 Gene Shears Pty Ltd Nucleic acids and methods of use thereof for controlling viral pathogens
US5401836A (en) 1992-07-16 1995-03-28 Pioneer Hi-Bre International, Inc. Brassica regulatory sequence for root-specific or root-abundant gene expression
WO1994012015A1 (en) 1992-11-30 1994-06-09 Chua Nam Hai Expression motifs that confer tissue- and developmental-specific expression in plants
KR960705036A (ko) 1993-07-22 1996-10-09 리 비. 패어렐 Dna 바이러스 리보자임
CA2174954C (en) 1993-11-19 2005-03-15 Stanton B. Gelvin Chimeric regulatory regions and gene cassettes for expression of genes in plants
NZ278490A (en) 1993-12-09 1998-03-25 Univ Jefferson Chimeric polynucleotide with both ribo- and deoxyribonucleotides in one strand and deoxyribonucleotides in a second strand
US6395547B1 (en) 1994-02-17 2002-05-28 Maxygen, Inc. Methods for generating polynucleotides having desired characteristics by iterative selection and recombination
US5605793A (en) 1994-02-17 1997-02-25 Affymax Technologies N.V. Methods for in vitro recombination
US6420628B1 (en) 1995-10-06 2002-07-16 Plant Genetic Systems, N.V. Seed shattering
US7390937B2 (en) 1996-02-14 2008-06-24 The Governors Of The University Of Alberta Plants with enhanced levels of nitrogen utilization proteins in their root epidermis and uses thereof
GB9607517D0 (en) 1996-04-11 1996-06-12 Gene Shears Pty Ltd The use of DNA Sequences
GB9703146D0 (en) 1997-02-14 1997-04-02 Innes John Centre Innov Ltd Methods and means for gene silencing in transgenic plants
GB9710475D0 (en) 1997-05-21 1997-07-16 Zeneca Ltd Gene silencing
GB9720148D0 (en) 1997-09-22 1997-11-26 Innes John Centre Innov Ltd Gene silencing materials and methods
DK1068311T3 (da) 1998-04-08 2011-08-08 Commw Scient Ind Res Org Fremgangsmåder og midler til opnåelse af modificerede fænotyper
CN1268749C (zh) 1998-06-26 2006-08-09 爱阿华州立大学研究机构 用于改变植物中酶和乙酰辅酶a水平的材料和方法
US6555732B1 (en) 1998-09-14 2003-04-29 Pioneer Hi-Bred International, Inc. Rac-like genes and methods of use
US7663025B2 (en) * 1999-03-23 2010-02-16 Mendel Biotechnology, Inc. Plant Transcriptional Regulators
US7858848B2 (en) * 1999-11-17 2010-12-28 Mendel Biotechnology Inc. Transcription factors for increasing yield
US20040031072A1 (en) * 1999-05-06 2004-02-12 La Rosa Thomas J. Soy nucleic acid molecules and other molecules associated with transcription plants and uses thereof for plant improvement
CN1279172C (zh) 1999-07-22 2006-10-11 独立行政法人农业生物资源研究所 转化水稻植物的方法
EP1206560B1 (de) 1999-08-26 2005-11-09 BASF Plant Science GmbH Pflanzliche genexpression unter der kontrolle von konstitutiven pflanzlichen v-atpase promotoren
CA2390597A1 (en) * 1999-11-17 2001-05-25 Mendel Biotechnology, Inc. Pathogen tolerance genes
WO2002015675A1 (en) * 2000-08-22 2002-02-28 Mendel Biotechnology, Inc. Genes for modifying plant traits iv
ES2279339T3 (es) 2003-01-21 2007-08-16 Cropdesign N.V. Uso de la secuencia reguladora del gen gos2 del arroz para la expresion genica en plantas o celulas de plantas dicotiledoneas.
CN102586252B (zh) 2003-02-04 2014-09-24 作物培植股份有限公司 稻启动子
EP1778845A2 (en) * 2004-08-16 2007-05-02 CropDesign N.V. Plants having improved growth characteristics and method for making the same
MX2007005915A (es) * 2004-11-27 2007-08-02 Metanomics Gmbh Incremento en el rendimiento al reducir la expresion genica.
CN103773796A (zh) * 2006-03-31 2014-05-07 巴斯福植物科学有限公司 具有增强的产量相关性状的植物和用于产生该植物的方法
GB0704984D0 (en) * 2007-03-15 2007-04-25 Wivenhoe Technology Ltd Plant responses
CA2690563A1 (en) * 2007-06-29 2009-01-08 Basf Plant Science Gmbh Plants having enhanced yield-related traits and a method for making the same
EP2380988A3 (en) * 2007-07-10 2012-04-11 Mosanto Technology LLC Transgenic plants with enhanced agronomic traits
WO2009099580A2 (en) * 2008-02-05 2009-08-13 Monsanto Technology, Llc Isolated novel nucleic acid and protein molecules from soy and methods of using those molecules to generate transgenic plants with enhanced agronomic traits

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104073503A (zh) * 2013-03-26 2014-10-01 中国农业科学院作物科学研究所 水稻转录因子Os11g01130基因的应用
CN105164262A (zh) * 2013-11-22 2015-12-16 孟加拉朱特研究所 来自长蒴黄麻和圆果种黄麻的编码wuschel相关的同源框4(wox4)蛋白的核苷酸序列和其使用方法
CN111206041A (zh) * 2019-10-24 2020-05-29 华中农业大学 OsBAK1P基因在控制水稻抗旱性中的应用
CN113024648A (zh) * 2021-03-07 2021-06-25 安徽农业大学 一种玉米的热激转录因子ZmHsf05及其应用
CN113024648B (zh) * 2021-03-07 2023-07-21 安徽农业大学 一种玉米的热激转录因子ZmHsf05及其应用
CN113604468A (zh) * 2021-09-02 2021-11-05 河北师范大学 小麦单株穗数及耐热性性状相关snp位点及其应用
CN113604468B (zh) * 2021-09-02 2023-10-03 河北师范大学 小麦单株穗数及耐热性性状相关snp位点及其应用
CN114703216A (zh) * 2022-03-16 2022-07-05 华中农业大学 莴苣LsWOX3L基因在控制莴苣刺有无性状中的应用
CN116024256A (zh) * 2022-10-09 2023-04-28 南京农业大学 一种水稻基因OsHSFA4d的基因工程应用
CN116024256B (zh) * 2022-10-09 2024-03-26 南京农业大学 一种水稻基因OsHSFA4d的基因工程应用

Also Published As

Publication number Publication date
AR075186A1 (es) 2011-03-16
EP2845903A2 (en) 2015-03-11
AU2010209875A1 (en) 2011-08-18
CN104232679A (zh) 2014-12-24
BRPI1007465A2 (pt) 2015-11-24
AU2010209875A2 (en) 2011-10-27
DE112010000838T5 (de) 2012-11-29
EP2391719A1 (en) 2011-12-07
EP2845903A3 (en) 2015-06-10
WO2010086221A1 (en) 2010-08-05
US20140366222A1 (en) 2014-12-11
EA201170947A1 (ru) 2012-07-30
US20110283420A1 (en) 2011-11-17
CA2750007A1 (en) 2010-08-05

Similar Documents

Publication Publication Date Title
CN102365366A (zh) 具有增强的产量相关性状的植物及其制备方法
CN101965405B (zh) 具有增强的产量相关性状的植物和用于制备该植物的方法
CN101981195B (zh) 产量相关性状增强的植物及其制备方法
CN103987848A (zh) 具有增强的产量相关性状的植物及其制备方法
CN102459613A (zh) 具有增强的产量相关性状的植物及其制备方法
CN104024415A (zh) 具有增强的产量相关性状的植物及其制备方法
CN102143971A (zh) 通过过表达编码tfl-1 样蛋白的多核苷酸而具有增强的产量相关性状的植物及其制备方法
CN102459614A (zh) 具有增强的产量相关性状的植物和用于产生该植物的方法
CN102827865A (zh) 具有增强的产率相关性状的植物及其制备方法
CN102656270A (zh) 具有增强的产量相关性状的植物和用于产生该植物的方法
CN102666858A (zh) 具有增强的产量相关性状的植物和用于产生该植物的方法
CN103249836A (zh) 具有增强的产量相关性状的植物和用于产生该植物的方法
CN102936605A (zh) 具有增强的产量相关性状的植物和用于制备该植物的方法
CN102686605A (zh) 具有增强的产量相关性状的植物及其制备方法
CN102257142A (zh) 具有增强的产量相关性状的植物及其制备方法
CN102648282A (zh) 具有增强的产量相关性状的植物和用于产生该植物的方法
CN102099480A (zh) 具有增强的产量相关性状的植物和用于产生该植物的方法
CN102300991A (zh) 具有增强的非生物胁迫耐受性和/或增强的产量相关性状的植物及其制备方法
CN102482333A (zh) 具有增强的产量相关性状的植物及其制备方法
CN103119170A (zh) 具有增强的产量相关性状的植物及其制备方法
CN103154254A (zh) 具有增强的产量相关性状的植物和产生该植物的方法
CN102892890A (zh) 具有增强的产量相关性状的植物和用于制备该植物的方法
CN103003432A (zh) 具有增强的产量相关性状的植物和用于产生该植物的方法
CN103702554A (zh) 具有一种或多种增强的产量相关性状的植物及其制备方法
CN103929947A (zh) 具有增强的产量相关性状的植物和用于产生该植物的方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
AD01 Patent right deemed abandoned

Effective date of abandoning: 20120229