CN102676575B - 具有增强的产量相关性状的植物和用于产生该植物的方法 - Google Patents

具有增强的产量相关性状的植物和用于产生该植物的方法 Download PDF

Info

Publication number
CN102676575B
CN102676575B CN201210129528.XA CN201210129528A CN102676575B CN 102676575 B CN102676575 B CN 102676575B CN 201210129528 A CN201210129528 A CN 201210129528A CN 102676575 B CN102676575 B CN 102676575B
Authority
CN
China
Prior art keywords
plant
nucleic acid
sequence
coding
gene
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201210129528.XA
Other languages
English (en)
Other versions
CN102676575A (zh
Inventor
C·勒佐
V·弗兰卡德
A·I·桑兹莫林纳罗
W·布洛克阿尔特
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BASF Plant Science GmbH
Original Assignee
BASF Plant Science GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BASF Plant Science GmbH filed Critical BASF Plant Science GmbH
Publication of CN102676575A publication Critical patent/CN102676575A/zh
Application granted granted Critical
Publication of CN102676575B publication Critical patent/CN102676575B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/415Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A40/00Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
    • Y02A40/10Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture
    • Y02A40/146Genetically Modified [GMO] plants, e.g. transgenic plants

Landscapes

  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Zoology (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Cell Biology (AREA)
  • Plant Pathology (AREA)
  • Microbiology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Medicinal Chemistry (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Botany (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Peptides Or Proteins (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明一般地涉及分子生物学领域,并涉及增强植物中多种具有经济重要性的产量相关性状的方法。更具体地,本发明涉及通过调节编码产量增强蛋白(Yield Enhancing Protein,YEP)的核酸在植物中的表达来增强植物中产量相关性状的方法。所述YEP选自液泡加工酶(Vacuolar Processing Enzyme,VPE)、CCA1样多肽或SAP样多肽或种子产量增强因子1(Seed Yield Promoting Factor 1,SYPF1)多肽或者核酮糖-1,5-二磷酸羧化酶/加氧酶(RuBisCO)活化酶(activase)(RCA)多肽。本发明还涉及已调节了编码如YEP之核酸的表达的植物,所述植物具有相对于对照植物而言增强的产量相关性状。本发明还提供可用于实施本发明方法的迄今未知的YEP编码核酸,以及包含所述核酸的构建体。

Description

具有增强的产量相关性状的植物和用于产生该植物的方法
本申请是申请日为2007年12月21日、发明名称为“具有增强的产量相关性状的植物和用于产生该植物的方法”的中国专利申请200780049885.2(国际申请号PCT/EP2007/064510)的分案申请。
本发明一般地涉及分子生物学领域,并涉及增强植物中多种具有经济重要性的产量相关性状的方法。更具体地,本发明涉及通过调节编码产量增强蛋白(Yield Enhancing Protein,YEP)的核酸在植物中的表达来增强植物中产量相关性状的方法。所述YEP选自液泡加工酶(VacuolarProcessing Enzyme,VPE)、CCA1样多肽、SAP样多肽、种子产量增强因子1(Seed Yield Promoting Factor 1,SYPF1)多肽和核酮糖-1,5-二磷酸羧化酶/加氧酶(RuBisCO)活化酶(activase)(RCA)多肽。本发明还涉及已调节了编码如YEP之核酸的表达的植物,所述植物具有相对于对照植物而言增强的产量相关性状。本发明还提供可用于实施本发明方法的迄今未知的YEP编码核酸,以及包含所述核酸的构建体。
持续增长的世界人口和农业用可耕地供应萎缩刺激了有关增加农业效率的研究。常规的作物及园艺学改良手段利用选择育种技术来鉴定具有受欢迎特性的植物。然而,此类选择育种技术具有几个缺陷,即这些技术一般耗费很多劳动并且产生这样的植物,其经常含有异源性遗传组分,这可能不总是导致从亲代植物中传递的所希望性状。分子生物学进展已经允许人类改良动物及植物的种质。植物的遗传工程使得可以分离和操作遗传物质(一般处于DNA或RNA形式)并且随后引入该遗传物质至植物中。此类技术具有产生具备多种经济学、农学或园艺学改良性状的作物或植物的能力。
具有特殊经济意义的性状是增加的产量。产量通常定义为作物产生的可测量的经济价值。这可以就数量和/或品质方面进行定义。产量直接取决于几个因素,例如器官的数目和大小、植物构造(例如枝的数目)、种子产生、叶衰老等。根发育、养分摄入量、胁迫耐性和早期萌发势(early vigor)也可以是决定产量的重要因素。因此,优化前述因素可以对增加作物产量有贡献。
种子产量是特别重要的性状,这是因为许多植物的种子对于人类和动物营养而言至关重要。诸如玉米、稻、小麦、芸苔(canola)和大豆等作物占人类总卡路里摄取量的一半以上,不论是通过种子本身的直接消耗,还是通过由加工的种子所饲养的肉类产品的消耗。它们也是工业加工所用的糖类、油类和多类代谢物的来源。种子含有胚(新的枝条和根的来源)和胚乳(发芽和幼苗早期生长过程中胚生长的营养源)。种子的发育涉及许多基因,并且需要代谢物自根、叶和茎转移至正在生长的种子。特别是胚乳,同化糖类、油类和蛋白质的代谢前体,将其合成为贮存性高分子,以充盈谷粒。
植物生物量为饲料作物如苜蓿、青贮谷物和干草的产量。在谷物作物中使用产量的许多替代参数。其中首要的是估算植物大小。根据物种以及发育阶段的不同,可以通过许多方法测量植物大小,但是包括植物总干重、地上干重、地上鲜重、叶面积、茎体积、植物高度、莲座植物直径、叶长、根长、根生物量、分蘖数和叶数。许多物种在给定的发育阶段维持植物不同部分大小间的保守比。利用这些异速生长关系而对这些有关大小的测量结果进行由此及彼的外推(如Tittonell等2005 Agric Ecosys&Environ 105:213)。早期发育阶段的植物大小通常将与晚期发育阶段的植物大小有关。具有更大叶面积的较大植物通常能够比较小的植物吸收更多的光和二氧化碳,因此很可能在同期增重更多(Fasoula&Tollenaar 2005 Maydica50:39)。除了植物所具有的最初达到较大大小的微环境或遗传优势的潜在延续,此为其附加效应。植物大小和生长速率存在着强遗传组分(如terSteege等2005 Plant Physiology 139:1078),且迄今为止,种种多样化基因型植物在一种环境条件下的大小很可能与另一种环境条件下的大小有关(Hittalmani等2003 Theoretical Applied Genetics 107:679)。以这种方式,使用标准环境作为田地中作物在不同时间和地点所遭遇的多样化动态环境的替代参数。
收获指数为种子产量与地上干重的比值,其在许多环境条件下相对稳定,因此在植物大小和谷物产量之间通常能够获得比较稳固的相关性(如Rebetzke等2002 Crop Science 42:739)。这些方法固有地联系在一起,因为大多数谷物生物量取决于植物叶和茎当前或贮存的光合作用生产力(Gardener等1985 Physiology of Crop Plants.Iowa State University Press,pp68-73)。因此,对植物大小的选择,甚至是在发育早期阶段的选择,已经用作为未来潜在产量的指标(如Tittonell等2005 Agric Ecosys&Environ 105:213)。当测试遗传差异对胁迫耐性的影响时,温室或植物培养室与田地相比具有固有的优势:即能够使土壤性能、温度、水和营养的可用性以及光强度标准化。不过,因缺乏风力或昆虫导致不良授粉,或由于空间不足以让成熟根或冠层生长等等,对产量造成的这些人工局限性会限制这些控制环境在测试产量差异中的应用。因此,在培养室或温室标准条件下测量早期发育阶段的植物大小,是提供潜在遗传产量优势指标的标准方法。
对许多作物而言具有经济重要性的另一性状是早期萌发势(earlyvigour)。提高早期萌发势是温带及热带稻栽培种的现代稻育种计划中一个重要的目标。长的根对于水栽稻正确的土壤锚着是很重要的。在将稻直接播种到涝田里以及植物必须迅速从水中长出时,更长的根与萌发势相关。在进行条播(drill-seeding)时,更长的中胚轴和胚芽鞘对于良好的出苗是很重要的。早期萌发势还来自于提高的植物适应性,例如由于植物更好地适应其环境(即更能应对多种非生物或生物胁迫因素)。具有早期萌发势的植物还显示出更好的作物建立(作物以更均一的方式生长,即大部分植株基本同时达到各个发育阶段),并显示更好的生长,并经常显示更高的产量。
在植物中改造出早期萌发势的能力在农业中会极为重要,例如提高植物种子产量的能力,无论是通过种子数、种子生物量、种子发育、种子充盈度(seed filling)或者任何其他种子相关性状。除了在农业中的许多应用(包括产生观赏植物、造林、园艺和林业)以外,增强产量相关性状还将具有许多非农业用途,例如利用生物技术生产物质,如药物、抗体或疫苗。提高产量还可用于产生用于生物反应器(用于利用生物技术生产物质,如药物、抗体或疫苗,或者用于有机废物的生物转化)和其他这些领域的藻类。
意想不到的是,现在发现调节编码产量增强蛋白(YEP)的核酸在植物中的表达赋予植物相对于对照植物而言增强的产量相关性状,所述YEP选自液泡加工酶(VPE)、CCA1样多肽、SAP样多肽、种子产量增强因子1(SYPF1)多肽和核酮糖-1,5-二磷酸羧化酶/加氧酶活化酶(RuBisCOactivase,RCA)多肽。
背景技术
I.液泡加工酶(VPE)
液泡加工酶(VPE)是半胱氨酸蛋白酶,其切割天冬酰胺和天冬氨酸C端一侧的肽键。VPE最初是作为负责种子贮藏蛋白成熟的新的半胱氨酸蛋白酶发现的。拟南芥属(Arabidopsis)含有四种VPE基因(αVPE、βVPE、γVPE和δVPE)。Hara-Nishimura等,Current Opinion in Plant Biology2005,8:404-408。
在高等植物中,多种液泡蛋白的前蛋白(proprotein)前体通过VPE的作用在翻译后转变成其各自的成熟形式。首先对蓖麻子VPE报道了该酶的分子结构。已在植物(大豆、刀豆、拟南芥属、野豌豆(vetch)和柑橘)和动物(曼森血吸虫(Schistosoma mansoni)、人和小鼠)中发现了VPE同源物。VPE前体由信号肽、N端前肽、成熟VPE结构域和C端前肽构成。表达蓖麻子VPE前体的酵母(酿酒酵母(Saccharomyces cerevisiae))转化体在其液泡中积累成熟形式。成熟蛋白具有液泡加工活性,相反,前体无活性。对无活性突变体进行的分析提示,VPE前蛋白前体向活性形式的转化可能是通过自催化介导的。(Hiraiwa等.FEBS Letters 447,1999,213-216页)。
程序性细胞死亡(PCD)在动物和植物中在多种胁迫和发育阶段中发生。VPE被鉴定为植物PCD的执行者。VPE显示与胱天蛋白酶(介导动物中PCD途径的半胱氨酸蛋白酶)相似的酶特性,尽管这两种酶之间的序列同一性有限。具报道,VPE具有胱天蛋白酶-1活性(Hatsugai等,SCIENCE卷3058.62004)。VPE与胱天蛋白酶-1共有一些结构特性:催化二联体和形成底物口袋(Asp口袋)的三个氨基酸在VPE和胱天蛋白酶-1之间是保守的。与这些相似性相反,VPE位于液泡中,而胱天蛋白酶位于细胞溶胶中。VPE通过在发病机制和发育中破坏液泡而发挥植物PCD关键分子的功能。Hatsugai等,Apoptosis 2006;11:905-911。据报道,VPEγ(VPEg)在衰老(PCD的一种形式)中被诱导(参阅Rojo等,2004,Current Biology,第14卷,1897-1906页)。
II.CCA1
MYB蛋白是在植物中发育过程和防御应答中发挥调节作用的一个转录因子超家族。表达分析显示,大多数拟南芥属MYB基因的表达应答于一种或多种类型的激素和胁迫处理(Yanhui等,Plant Mol.Biol 60,107-124,2006)。对拟南芥和稻中该超家族成员进行的系统发生比较提示,拟南芥属MYB超家族在其与单子叶植物分离后但未与其他双子叶植物分离前发生了快速扩展(Yanhui等,2006)。MYB蛋白一般包含结构保守的DNA结合结构域——MYB结构域。它们参与细胞周期、分生组织形成的调节、细胞分化的控制,还参与调节次生代谢。MYB结构域转录因子构成了植物转录因子中最大的家族之一(拟南芥(Arabidopsis thaliana)中至少为130种),但在MYB结构域以外几乎没有保守性。因此,基于在MYB编码区以外鉴定的保守基序将它们归类成亚组(Jiang等(2004)GenomeBiology 5:R46)。不同类别的MYB蛋白可基于其所包含MYB结构域中不完全重复的数目来鉴别,并归为三个家族:R2R3-MYB家族、R1R2R3-MYB家族和MYB相关家族。R2R3-MYB家族包含最多的MYB蛋白数,并分成5个亚家族(Yanhui等2006):CCA1样、CPC样、TBP样、I盒结合样和R-R型MYB蛋白。其中,CCA1样亚家族是最大的,该亚家族的成员在MYB重复中含有保守性基序SHAQK或MYADN。
在高等生物中,昼夜节律钟控制多种生理和分子过程。在植物中,这些过程包括叶移动、气孔打开和大量基因的表达。在拟南芥中,已经鉴定了大量时钟相关蛋白组分。其中,相信CCA1(昼夜节律钟相关1(CIRCADIAN CLOCK-ASSOCIATED 1))/LHY(晚期延伸的下胚轴(LATE ELONGATED HYPOCOTYL))和TOC1(CAB表达计时1(TIMING OF CAB EXPRESSION 1))是中央振荡器的关键组分。CCA1和LHY是同源且部分冗余的Myb相关DNA结合蛋白,而TOC1是名为假应答调节蛋白(PSEUDO-RESPONSE REGULATOR)的小蛋白家族的成员。还认为这两种不同类别的时钟组分在转录/翻译水平形成了产生固有节律的自主调节正/负反馈环(Nakamichi等,Plant Cell Physiol.46,686-689,2005)。有报道称CCA1(昼夜节律钟相关1(CIRCADIANCLOCK-ASSOCIATED 1))基因在拟南芥属植物中的组成型表达(CCA1-ox)导致丧失了昼夜节律性(Green等,Plant Physiol.129,576-584,2002)。这些CCA1-ox植物保留了应答于光照的昼夜改变的能力。因此,如果在昼夜条件下培养CCA1-ox植物,则多种受昼夜节律调节的基因以及CCA1本身和密切相关的LHY的转录水平强烈振荡。然而,与预计发生光照/黑暗转化而发生转录水平改变的野生型植物相反,CCA1-ox植物丧失了预计其环境中这种每日改变的能力。与其野生型对应体相比,CCA1-ox植物开花更晚(特别是在长日照条件下),并且在非常短日照条件下的生存力更低。此外,已证明另外两种昼夜节律突变体LHY-ox和elf3具有低生存力表型。
WO2003013228和US2004019927描述了过表达CCA1的植物抽薹很晚,显示提高的生物量(提高的叶数目和大小),并且营养组织和生殖组织的绿色更深。提出CCA1可用于提高叶绿素含量,从而可以在低光照条件下有更高的生长和生产力。此外,还描述了CCA1用于防止开花的用途可帮助实现最高的营养产量,并防止经遗传修饰的生物(GMO)的花粉逃逸(US2004045049)。目前,没有报道显示提高的CCA1表达导致提高的种子产量,相反,与其野生型对应体相比,CCA1过表达者开花更晚(特别是在长日照条件下),并且在极短日照条件下的生存力更低。(Green等,2002)。
III.SAP
SAP结构域(根据SAF-A/B、Acinus和PIAS命名)是形成螺旋-延伸-螺旋结构的DNA结合结构域。已在酵母、哺乳动物和植物中鉴定出了含有SAP结构域(也称为SAF盒)的蛋白质。SAP结构域由35个氨基酸残基构成,包含由含有甘氨酸的区域隔开的两个两亲性螺旋。该结构域中的一些位置富含带正电的氨基酸(R、K),它们被认为是与DNA主链接触的。据报道称SAP结构域形成螺旋-延伸-螺旋(helix-extended-helix,HEH)结构,一些原核生物蛋白(如转录终止子RHO蛋白)也预计含有SAP结构域。Chen等,2003(Plant Molecular Biology 52:579-590)报道称,已将含有SAP结构域的蛋白质与多种功能相关联,所述功能与其DNA和/或RNA相互作用有关。已将SAP蛋白与核构造和/或RNA代谢相关联。例如,人支架附着因子A(SAF-A)是核支架(核基质)中的丰富组分,并且还存在于不均一核的核糖核蛋白复合体中,该复合体已与核组织和RNA加工相关联。Acinus是一种被胱天蛋白酶-3激活的蛋白质,是凋亡染色质凝聚所需的。结合了SAP结构域和MIZ锌指基序的PIAS蛋白家族成员是活化STAT(信号转导蛋白和转录激活蛋白)的蛋白抑制剂。酵母Tho1p蛋白(另一种含有SAP的蛋白质)在调节RNA聚合酶II的转录延伸中发挥作用。Chen等,2003描述了稻基因OsBP-73的克隆和表征,其编码含有SAP样结构域的375个氨基酸的蛋白质。该作者报道称,Northern印迹分析证明,OsBP-73在根、叶和未成熟种子中微弱表达。他们还通过组织化学研究检查了带有OsBP-73 5_/GUS报告基因的转基因稻植物中OsBP-73基因的表达。发现该报告基因主要在具有高细胞分裂活性的组织(如根尖、茎结、圆锥花序和未成熟种子)中表达。他们还报告称,通过双链RNA对OsBP-73基因表达进行的遗传干扰抑制了完整植物的生长,但不影响从年幼至成年阶段的这一段。他们提出,OsBP-73可能在细胞增殖的调节中发挥重要作用。
IV.SYPF1
SYPF1是可用于增强植物中产量相关性状的新转录因子。
转录因子一般定义为显示序列特异性DNA结合并能激活和/或抑制转录的蛋白质。拟南芥属基因组编码至少1533种转录调节子,占其估计基因总数的约5.9%。据报道,这些转录因子中约45%来自于植物特异性家族(Riechmann等,2000(Science卷290,2105-2109))。
根据PRODOM数据库,发现SYPF1与肿瘤相关的At4g18650;TGA1bzip激活剂卷曲螺旋具有一定的相似性。Miao等,1994(Plant Mol Biol.Apr 25(1):1-11)报道称,TGA1a是可能介导一些植物基因的根特异性表达和生长素应答性表达的已充分表征的转录因子。
V.核酮糖-1,5-二磷酸羧化酶/加氧酶(RubisCO)活化酶(RCA)多肽
核酮糖-1,5-二磷酸羧化酶/加氧酶(RuBisCo,EC 4.1.1.39[EC])是地球上最丰富的酶,并且是最重要的酶之一。它催化光合碳固定中的第一步和限速步骤——核酮糖-1,5-二磷酸与CO2不可逆羧化形成两个3-磷酸甘油酸分子。然而,该反应的速率极低,RuBisCo必须被活化和氨甲酰化以具有催化能力。活化通过RuBisCo活化酶(RCA)来实现,其可从RuBisCo的催化位点上除去抑制剂,改变构象并以ATP依赖性方式体内活化RuBisCo(Andrews等,1995)。
RCA是核编码的叶绿体蛋白,基于序列和结构同源性,它是AAA+家族(与不同细胞活性相关的ATP酶)的成员,该家族的成员参与发挥多种伴侣分子样功能的大分子复合体。与RCA的ATP酶活性一致,在RCA多肽序列中鉴定到了用于核苷酸结合的P环(或Walker A;Walker等,(1982)EMBO J.1982;1:945-951)三磷酸结合环共有序列GXXXGK(S/T)。还鉴定了RCA与RubisCo相互作用及RuBisCo活化所需的一些其他关键氨基酸残基(综述参阅Portis(2003)Photosynthesis Research 75:11-27)。
RCA在多数植物中包括两种同工型,45-46kDa(或α型)和41-43kDa(或β型),它们通过选择性剪接来自于单个基因(综述参阅Portis(2003)Photosynthesis Research 75:11-27)。这两种形式仅在羧基端不同,较长的形式包含参与光依赖性氧化还原反应调节(由硫氧还蛋白-f介导)的两个半胱氨酸残基。与多数植物不同,在绿藻莱茵衣藻(Chlamydomonasreinhardtii)中发现了一种多肽(无羧基端延伸),它在该多肽的氨基端也包含叶绿体转运肽(Roesler&Ogren(1990)Plant Physiol94(4):1837-1841)。
缺少RCA活性的突变体拟南芥植物(称为rca-;Somerville等(1982)Plant Physiol 70:381-387)或者RCA活性水平极低的转基因植物无法在大气CO2水平下存活(Flaveria bidentis;von Caemmerer等(2005)PlantPhysiol 137(2):747-55),表达水平降低的那些则显示降低的光合作用速率和生长(在拟南芥属中,Eckhardt等(1997)Plant Physiol 113:575-586;在烟草中,Mate等(1996)Planta 198:604-613)。然而,在正常温度下,RCA活性的大幅降低是显著实现稳态光合作用之前所需要的(例如拟南芥、稻(Jin等(2006)Ann Bot(Lond)97(5):739-44)、烟草(He等(1997)PlantPhysiol 115(4):1569-80;Hammond等(1998)Plant J 14:101-110)。
用αRCA同工型(突变的αRCA同工型(参与氧化还原反应调节的两个Cys残基突变成Ala残基)、βRCA同工型或者这两种同工型转化缺少RCA的拟南芥突变体(rca-)回复了植物在正常CO2水平下生长的能力(Zhang等(2002)PNAS USA 99(5):3330-3334)。仅表达βRCA同工型(因此不受光依赖性氧化还原调节)或者仅表达突变的αRCA同工型(氧化还原敏感性)的植物不能在光照有限的条件下下调RuBisCo。
专利申请US2006/0272044涉及(通过基因改组)获得编码活性增强的RCA多肽的分离的多核苷酸序列的方法。
意想不到的是,现在发现调节编码YEP的核酸在植物中的表达赋予植物相对于对照植物而言增强的产量相关性状,所述YEP选自液泡加工酶(VPE)、CCA1样多肽、SAP样多肽、种子产量增强因子1(SYPF1)多肽和核酮糖-1,5-二磷酸羧化酶/加氧酶活化酶(RuBisCO activase,RCA)多肽。
定义
多酞/蛋白质
术语“多肽”和“蛋白质”在本文中可互换使用并且指处于任意长度聚合形式中的氨基酸。
多核苷酸/核酸/核酸序列/核苷酸序列
术语“多核苷酸”、“核酸序列”、“核苷酸序列”在本文中可互换使用并且指处于任意长度聚合形式中的核苷酸,即核糖核苷酸或脱氧核糖核苷酸或这二者组合。
对照植物
选择合适的对照植物是实验设置的惯用部分并且可以包括对应的野生型植物或无目的基因的对应植物。对照植物一般是与待评价植物相同的植物物种或甚至是相同的变种。对照植物也可以是待评价植物的失效合子。如本文中所用的“对照植物”不仅指整株植物,还指植物部分,包括种子及种子部分。
同源物
蛋白质的“同源物”包括这样的肽、寡肽、多肽、蛋白质及酶,它们相对于非修饰的上述蛋白质具有氨基酸替换、缺失和/或插入并且与所述肽、寡肽、多肽、蛋白质及酶来源的非修饰蛋白质具有相似生物学活性和功能活性。
缺失指从蛋白质中移除一个或多个氨基酸。
插入指一个或多个氨基酸残基在蛋白质中预定位点内的引入。插入可以包含单个或多个氨基酸的氨基端融合和/或羧基端融合以及序列内插入。通常,在氨基酸序列内部的插入会比氨基端融合或羧基端融合更小,约1-10个残基级别。氨基端或羧基端融合蛋白或融合肽的实例包括如酵母双杂交系统中所用转录激活物的结合结构域或激活结构域、噬菌体外壳蛋白、(组氨酸)-6-标签、谷胱甘肽S-转移酶-标签、蛋白A、麦芽糖结合蛋白、二氢叶酸还原酶、Tag·100表位、c-myc表位、-表位、lacZ、CMP(钙调蛋白结合肽)、HA表位、蛋白C表位和VSV表位。
替换指以具有相似特性(如相似疏水性、亲水性、抗原性、形成或破坏α-螺旋结构或β-折叠结构的倾向)的其它氨基酸替换蛋白质的氨基酸。氨基酸替换一般是单个残基的,不过可以是簇集性的,这取决于置于多肽的功能性约束;插入通常会是约1-10个氨基酸残基级别。氨基酸替换优选地是保守性氨基酸替换。保守性替换表是本领域众所周知的(见例如Creighton(1984)Proteins.W.H.Freeman and Company和下表1)。
表1:保守性氨基酸替换的实例
  残基   保守性替换   残基   保守性替换
  Ala   Ser   Leu   Ile;Val
  Arg   Lys   Lys   Arg;Gln
  Asn   Gln;His   Met   Leu;Ile
  Asp   Glu   Phe   Met;Leu;Tyr
  Gln   Asn   Ser   Thr;Gly
  Cys   Ser   Thr   Ser;Val
  Glu   Asp   Trp   Tyr
  Gly   Pro   Tyr   Trp;Phe
  His   Asn;Gln   Val   Ile;Leu
  Ile   Leu,Val
氨基酸替换、缺失和/或插入可以使用本领域众所周知的肽合成技术如固相肽合成法等或通过重组DNA操作而容易地进行。用于操作DNA序列以产生蛋白质的替换、插入或缺失变体的方法是本领域众所周知的。例如,用于在DNA中的预定位点处产生替换突变的技术是本领域技术人员众所周知的并且包括M13诱变法、T7-Gen体外诱变法(USB,Clevelaand,OH)、QuickChange位点定向诱变法(Stratagene,San Diego,CA)、PCR-介导的位点定向诱变或其它位点定向诱变法。
衍生物
“衍生物”包括这样的肽、寡肽、多肽,其中与天然存在形式的蛋白质(如目的蛋白)的氨基酸序列相比,它们包含以非天然存在的氨基酸残基对氨基酸的替换或非天然存在的氨基酸残基的添加。蛋白质的“衍生物”也包含这样的肽、寡肽、多肽,其中与多肽的天然存在形式的氨基酸序列相比,它们包含天然存在的改变(糖基化、酰化、异戊二烯化、磷酸化、肉豆蔻酰化、硫酸化等)氨基酸残基或非天然的改变氨基酸残基。与衍生物所来源的氨基酸序列相比,该衍生物可以也包含与所述氨基酸序列共价或非共价结合的一个或多个非氨基酸取代基或添加(例如报道分子或其它配体),如为促进检测该衍生物而结合的报道分子,和与天然存在的蛋白质的氨基酸序列相对比的非天然存在的氨基酸残基。此外,“衍生物”还包括天然发生形式蛋白质与标签肽(如FLAG、HIS6或硫氧还蛋白)的融合物(标签肽的综述参阅Terpe,Appl.Microbiol.Biotechnol.60,523-533,2003)。
直向同源物/旁系同源物
直向同源物和旁系同源物包含用来描述基因祖先关系的进化概念。旁系同源物是相同物种内起源于先祖基因复制的基因,直向同源物是来自不同生物的起源于物种形成的基因,并且也来源于共同的先祖基因。
结构域
术语“结构域”指沿进化相关蛋白质的序列比对结果而在特定位置处保守的一组氨基酸。尽管在其它位置处的氨基酸可以在同源物之间变动,然而在特定位置处的高度保守的氨基酸指示在蛋白质的结构、稳定性或活性方面可能是必需的氨基酸。结构域因通过在蛋白质同源物家族的比对序列中的高保守程度而被鉴定,它们可以用作鉴定物以确定任意的所讨论多肽是否属于先前已鉴定的多肽家族。
基序/共有序列/标签
术语“基序”或“共有序列”或“标签”指在进化相关蛋白质的序列中的短保守区。基序往往是结构域的高度保守部分,不过也可以仅包括结构域的部分,或可以位于保守结构域之外(若基序的全部氨基酸位于定义的结构域之外)。
杂交
如本文中所定义的术语“杂交”是其中基本上同源的互补核苷酸序列彼此退火的过程。杂交过程可以完全在溶液中进行,即两种互补性核酸均处于溶液中。杂交过程也可以在互补性核酸之一固定到基质如磁珠、琼脂糖(Sepharose)珠或任何其他树脂的情况下发生。杂交过程也可以在互补性核酸之一固定至固相支持体如硝酸纤维素膜或尼龙膜上或通过例如照相平版印刷术固定至例如硅酸玻璃支持物(后者称作核酸阵列或微阵列或称作核酸芯片)上的情况下进行。为使杂交发生,通常将核酸分子热变性或化学变性以使双链解链成为两条单链和/或去除来自单链核酸的发夹或其它二级结构。
术语“严格性”指在其中发生杂交的条件。杂交的严格性受条件如温度、盐浓度、离子强度和杂交缓冲液组成影响。通常,将低严格性条件选择为在确定的离子强度及pH时低于特定序列热解链温度(Tm)约30℃。中等严格性条件是此时温度低于Tm 20℃,高严格性条件是此时温度低于Tm10℃。高严格性杂交条件一般用于分离与靶核酸序列具有高序列相似性的杂交序列。然而,核酸可以在序列上偏离并且因遗传密码子的简并性而依旧编码基本上相同的多肽。因而有时候可能需要中等严格性杂交条件来鉴定此类核酸分子。
Tm是在确定的离子强度及pH下50%的靶序列与完全匹配的探针杂交时的温度。Tm取决于溶液条件和探针的碱基组成及长度。例如,较长的序列在较高温度下特异性地杂交。从低于Tm约16℃直至32℃获得最大杂交速率。一价阳离子在溶液中的存在降低了两条核酸链间的静电排斥,因而促进杂交分子形成;这种作用对于高达0.4M的钠浓度是明显的(对于更高浓度,这种效应可以忽略)。甲酰胺降低DNA-DNA和DNA-RNA双链体的解链温度,每百分数甲酰胺降低0.6-0.7℃,并且添加50%甲酰胺允许在30-45℃进行杂交,虽然杂交速率会降低。碱基对错配降低了杂交速率及双链体的热稳定性。平均而言并且对于大的探针来说,每%碱基错配Tm下降约1℃。取决于杂交分子的类型,Tm可以使用下列等式计算:
1)DNA-DNA杂交分子(Meinkoth和Wahl,Anal.Biochem.,138:267-284,1984):
Tm=81.5C+16.6×log10[Na+]a+0.41×%[G/Cb]-500×[Lc]-1-0.61×%甲酰胺
2)DNA-RNA或RNA-RNA杂交分子
Tm=79.8+18.5(log10[Na+]a)+0.58(%G/Cb)+11.8(%G/Cb)2-820/Lc
3)寡DNA或寡RNAd杂交分子:
对于<20个核苷酸:Tm=2(ln)
对于20-35个核苷酸:Tm=22+1.46(ln)
a或对于其它一价阳离子,但是仅在0.01-0.4M范围内是精确的。
b仅对于%GC在30%-75%范围内是精确的。
cL=双链体的长度(以碱基对计)。
d Oligo,寡核苷酸;ln,引物的有效长度=2×(G/C数)+(A/T数)。
可以众多已知技术的任何一种来控制非特异性结合,例如用含蛋白质的溶液封闭薄膜、添加异源性RNA、异源性DNA及SDS至杂交缓冲液并且用RNA酶处理。对于非同源性探针,一系列杂交可以通过改变以下条件之一进行:(i)逐渐降低退火温度(例如从68℃至42℃)或(ii)逐渐降低甲酰胺浓度(例如从50%至0%)。技术人员了解杂交期间可以加以改变和将维持或改变严格性条件的多种参数。
除杂交条件之外,杂交特异性一般还取决于杂交后洗涤的功能。为除去因非特异性杂交所致的背景,样品用稀释的盐溶液洗涤。此类洗涤的关键因素包括最终洗涤溶液的离子强度及温度:盐浓度越低并且洗涤温度越高,则洗涤的严格性越高。洗涤条件一般在杂交严格性上或低于杂交严格性而进行。阳性杂交产生至少两倍于背景信号的信号。通常,用于核酸杂交分析法或基因扩增检测方法的合适严格性条件如上所述。也可以选择更严格或更不严格的条件。技术人员了解洗涤期间可以加以改变和将维持或改变严格性条件的多种参数。
例如,用于长度大于50个核苷酸的DNA杂交分子的常见高严格性杂交条件包括在65℃于1×SSC中或在42℃于1×SSC和50%甲酰胺中杂交,随后在65℃于0.3×SSC中洗涤。用于长度大于50个核苷酸的DNA杂交分子的中等严格性杂交条件的实例包括在50℃于4×SSC中或在40℃于6×SSC和50%甲酰胺中杂交,随后在50℃于2×SSC中洗涤。杂交分子的长度是杂交核酸的预期长度。当序列已知的核酸杂交时,可以通过比对序列并鉴定本文中所述的保守区而确定杂交分子长度。1×SSC是0.15MNaCl和15mM柠檬酸钠;杂交溶液和洗涤溶液可以额外地包含5×Denhardt试剂、0.5-1.0%SDS、100μg/ml变性的片段化鲑精DNA、0.5%焦磷酸钠。
为了定义严格性水平的目的,可以参考Sambrook等(2001)MolecularCloning:a laboratory manual,第三版Cold Spring Harbor LaboratoryPress,CSH,New York或参考Current Protocols in Molecular Biology,John Wiley&Sons,N.Y.(1989和每年更新版本)。
剪接变体
如本文中所用的术语“剪接变体”包含其中已经切除、替换、移位或添加所选内含子和/或外显子或其中内含子已经缩短或加长的核酸序列的变体。此类变体将是其中基本上保留了蛋白质的生物活性的一种变体;这可以通过选择性保留蛋白质的功能性片段而实现。此类剪接变体可以在自然界中找到或可以人工制造。用于预测和分离此类剪接变体的方法是本领域众所周知的(见例如Foissac和Schiex,BMC Bioinformatics.2005;6:25)。
等位变体
等位基因或等位变体是给定基因的替代形式,位于相同染色体位置内。等位变体包含单核苷酸多态性(SNP)和小插入/缺失多态性(INDEL)。INDEL的尺寸通常小于100bp。SNP和INDEL形成在大部分生物的天然存在性多态性株系中序列变体的最大集合。
基因改组/定向进化
基因改组或定向进化的组成为:反复DNA改组,随后适当筛选和/或选择以产生编码具有改良生物学活性的蛋白质的核酸或其部分的变体(Castle等,(2004)Science 304(5674):1151-4;美国专利5,811,238和6,395,547)。
调节元件/控制序列/启动子
术语“调节元件”、“控制序列”和“启动子”均在本文中可互换使用,并且在广义上意指能够实现与之连接的序列表达的调节性核酸序列。术语“启动子”一般指位于基因转录起点上游并参与识别及结合RNA聚合酶和其它蛋白质,因而指导有效连接的核酸转录的核酸控制序列。前述术语包括从典型的真核基因组基因(包括对于精确转录启动所需的TATA盒,具有或没有CCAAT盒序列)中衍生的转录调节序列和应答发育刺激和/或外部刺激或以组织特异性方式改变基因表达的额外调节元件(如,上游激活序列、增强子和沉默子)。本术语还包括典型的原核基因的转录调节序列,在此情况下它可以包括-35盒序列和/或-10盒转录调节序列。术语“调节元件”也包含赋予、激活或增强核酸分子在细胞、组织或器官中表达的合成的融合分子或衍生物。
“植物启动子”包含介导编码序列区段在植物细胞中表达的调节元件。因此,植物启动子不一定是植物来源的,而是可以源自病毒或微生物,例如来自侵袭植物细胞的病毒。“植物启动子”也可以源自植物细胞,例如来自用待于本发明方法中表达及在本文中描述的核酸序列所转化的植物。这也适用于其它“植物”调节性信号,如“植物”终止子。用于本发明方法中的核苷酸序列的启动子上游可以由一个或多个核苷酸替换、插入和/或缺失而受到修饰,但不干扰启动子、可读框(ORF)或3′调节区如终止子或远离ORF的其它3′调节区的功能性或活性。启动子的活性还有可能因修饰该启动子的序列或由更具活性的启动子、甚至来自异源生物的启动子彻底替换该启动子而增加。为在植物中表达,如上所述,核酸分子必须有效连接至或包含合适的启动子,其中所述的启动子在正确时间点上并以所需要的空间表达模式表达基因。
有效连接
如本文中所用的术语“有效连接”指启动子序列与目的基因之间功能性地连接,以至于启动子序列能够启动目的基因转录。
发育调节性启动子
发育调节性启动子在某个发育期期间或在经历发育变化的植物部分内有活性。
诱导型启动子
诱导型启动子在应答化学品(综述见Gatz 1997,Annu.Rev.PlantPhysiol.Plant Mol.Biol.,48:89-108)、环境刺激或物理刺激时具有受诱导或增加的转录启动,或可以是“胁迫诱导型”,即当植物暴露于多种胁迫条件时受到激活,或是“病原体诱导型”,即当植物暴露于多种病原体时受到激活。
器官特异性/组织特异性启动子
器官特异性/组织特异性启动子是在某些器官或组织(如叶、根、种子组织等)中能够偏好性起始转录的启动子。仅在某些细胞中起始转录的启动子在本文中称为“细胞特异性”。
器官特异性/组织特异性启动子
器官特异性或组织特异性启动子是能够优先在某些器官官或组织如叶、根、种子组织等内启动转录的启动子。例如,“根特异性启动子”是在植物根中优势地具有转录活性的启动子,在植物的任何其它部分内基本上无活性,尽管在植物的这些其它部分内允许任何泄露表达。能够仅在某些细胞中启动转录的启动子在本文中称作“细胞特异性”。
根特异性启动子的实例列于下表:
根特异性启动子的实例
表2:种子特异性启动子的实例
表3:胚特异性启动子的实例
  基因来源   参考文献
  稻OSH1   Sato等,Proc.Natl.Acad.Sci.USA,93:8117-8122,1996
  KNOX   Postma-Haarsma等,Plant Mol.Biol.39:257-71,1999
  PRO0151   WO 2004/070039
  PRO0175   WO 2004/070039
  PRO005   WO 2004/070039
  PRO0095   WO 2004/070039
表4:糊粉特异性启动子的实例
组成型启动子
“组成型启动子”指在至少一种细胞、组织或器官中在其大多数(但不一定是全部)生长和发育阶段并在大多数环境条件下有转录活性的启动子。
表5:组成型启动子的实例
  基因来源   参考文献
  肌动蛋白   McElroy等,Plant Cell,2:163-171,1990
  HMGP   WO 2004/070039
  CAMV35S   Odell等,Nature,313:810-812,1985
  CaMV 19S   Nilsson等,Physiol.Plant.100:456-462,1997
  GOS2   de Pater等,Plant J Nov;2(6):837-44,1992,WO 2004/065596
  泛素   Christensen等,Plant Mol.Biol.18:675-689,1992
  稻亲环蛋白   Buchholz等,Plant Mol Biol.25(5):837-43,1994
  玉米H3组蛋白   Lepetit等,Mol.Gen.Genet.231:276-285,1992
  苜蓿H3组蛋白   Wu等Plant Mol.Biol.11:641-649,1988
  肌动蛋白2   An等,Plant J.10(1);107-121,1996
  34S FMV   Sanger等,Plant.Mol.Biol.,14,1990:433-443
  Rubisco小亚基   US 4,962,028
  OCS   Leisner(1988)Proc Natl Acad Sci USA 85(5):2553
  SAD1   Jain等,Crop Science,39(6),1999:1696
  SAD2   Jain等,Crop Science,39(6),1999:1696
  nos   Shaw等(1984)Nucleic Acids Res.12(20):7831-7846
  V-ATP酶   WO 01/14572
  超级启动子   WO 95/14098
  G盒蛋白   WO 94/12015
遍在启动子
遍在启动子在生物的基本上全部组织或细胞中有活性。
绿色组织特异性启动子
如本文中所定义的绿色组织特异性启动子是主要在绿色组织中具有转录活性的启动子,在植物的任何其它部分内基本上无活性,尽管在植物的这些其它部分内允许任何泄露表达。
可以用来实施本发明方法的绿色组织特异性启动子的实例在下表6中显示。
表6:绿色组织特异性启动的实例
组织特异性启动子的另一个实例是分生组织特异性启动子,其主要在分生性组织中具有转录活性,在植物的任何其它部分内基本上无活性,尽管在植物的这些其它部分内允许任何泄露表达。可用于实施本发明方法的绿色分生组织特异性启动子的实例示于下文表7。
表7:分生组织特异性启动子的实例
终止子
术语“终止子”包括这样的控制序列,其是在转录单位末端的DNA序列,发出对初级转录物进行3’加工并多聚腺苷化以及终止转录的信号。终止子可以来自天然基因、来自多种其它植物基因或来自T-DNA。待添加的终止子可以来自例如胭脂碱合酶或章鱼碱合酶基因,或者来自其它植物基因或较不优选地来自任何其它真核基因。
选择标记(基因)/报告基因
“选择标记”、“选择标记基因”或“报告基因”包括向细胞赋予表型的任何基因,其中在所述的细胞内表达所述基因以促进鉴定和/或选择用本发明的核酸构建体所转染或转化的细胞。这些标记基因能够通过一系列不同原理鉴定核酸分子的成功转移。合适的标记可以选自赋予抗生素抗性或除草剂抗性、引入新代谢性状或允许目视选择的标记。选择标记基因的实例包括赋予抗生素抗性的基因(如使新霉素和卡那霉素磷酸化的nptII或使潮霉素磷酸化的hpt或赋予对例如博来霉素、链霉素、四环素、氯霉素、氨苄青霉素、庆大霉素、遗传霉素(Geneticin)(G418)、壮观霉素或杀稻瘟素的抗性的基因)、赋予除草剂抗性的基因(例如提供抗性的bar;提供草甘膦抗性的aroA或gox或赋予对例如咪唑啉酮、膦丝菌素或磺脲类的抗性的基因)或提供代谢性状的基因(如允许植物使用甘露糖作为唯一碳源的manA或利用木糖的木糖异构酶或抗营养标记如2-脱氧葡萄糖抗性)。视觉标记基因的表达导致形成颜色(例如β-葡糖醛酸糖苷酶、GUS或β-半乳糖苷酶与其有色底物例如X-Gal)、发光(如萤光素/萤光素酶系统)或荧光(绿色荧光蛋白GFP及其衍生物)。这个名单仅代表少数的可能标记。技术人员熟悉此类标记。取决于生物和选择方法,优选不同的标记。
转基因的/转基因/重组
为本发明目的,“转基因的”、“转基因”或“重组”就例如核酸序列而言意指包含此核酸序列的表达盒、基因构建体或载体或用本发明的核酸序列、表达盒或载体转化的生物,所有这些构建均通过重组方法产生,其中
(a)编码用于本发明方法中的蛋白质的核酸序列,或
(b)与本发明核酸序列有效连接的遗传控制序列,例如启动子,或
(c)a)和b)
不处于其天然遗传环境中或已经通过遗传操作方法修饰,修饰有可能采用例如替换、添加、缺失、倒位或插入一个或多个核苷酸残基的形式。天然遗传环境理解为意指来源植物中的天然基因组基因座或染色体基因座或在基因组文库中存在。在基因组文库的情况下,核酸序列的天然遗传环境优选地得到保留,至少部分地得以保留。该环境分布在核酸序列的至少一侧并且具有至少50bp,优选至少500bp,特别优选至少1000bp,最优选至少5000bp的序列长度。天然存在的表达盒-例如核酸序列的天然启动子与编码本发明方法中所用多肽的对应核酸序列的天然存在的组合,如上文所定义-在这种表达盒通过非天然的合成(“人工”)方法(如诱变处理)而受到修饰时,变成转基因表达盒。合适方法例如在US 5,565,350或WO00/15815中描述。
为本发明目的,转基因植物因此如上理解为意指本发明方法中所用的核酸不位于所述植物基因组中该核酸的天然基因座内,所述核酸有可能同源或异源地表达。然而如所提及,转基因还意指尽管本发明核酸或在本发明方法中所用核酸处于植物基因组中该核酸的天然位置内,然而其序列相对于天然序列而言已经受到修饰,和/或所述天然序列的调节序列已经受到修饰。转基因优选地理解为意指本发明核酸在基因组中的非天然基因座内表达,即发生核酸的同源表达或优选异源表达。在本文中提到了优选的转基因植物。
转化
如本文中所提及的术语“引入”或“转化”包括将外源性多核苷酸转移至宿主细胞内,无论用于转化的方法是什么。能够后续克隆性增殖(无论通过器官发生或胚胎发生)的植物组织可以用本发明的遗传构建体转化并且可以从中再生整株植物。选择的具体组织将取决于可用于并且最适于正进行转化的具体物种的克隆性增殖系统。示例性组织靶包括叶盘、花粉、胚、子叶、下胚轴、大配子体、愈伤组织、已有的分生组织(例如顶端分生组织、腋芽和根分生组织)和诱导的分生组织(例如子叶分生组织和下胚轴分生组织)。多核苷酸可以瞬时或稳定地引入宿主细胞并且可以非整合地维持,例如作为质粒。或者,多核苷酸可以整合至宿主基因组内。产生的转化植物细胞随后可以用来以本领域技术人员已知的方式再生出转化植物。
外来基因转化至植物基因组内称作转化。植物物种的转化现在是相当常规的技术。有利地,几种转化方法中的任一方法可以用来将目的基因引入合适的祖先细胞。用于从植物组织或植物细胞中转化并再生出植物所述的方法可以用于瞬时转化或用于稳定转化。转化方法包括使用脂质体、电穿孔法、增加游离DNA摄入的化学品、DNA直接注射至植物、粒子枪轰击法、使用病毒或花粉的转化法和显微注射。转化方法可以选自用于原生质体的钙/聚乙二醇法(Krens,F.A.等,(1982)Nature 296,72-74;NegrutiuI等(1987)Plant Mol Biol 8:363-373);原生质体的电穿孔法(Shillito R.D.等(1985)Bio/Technol 3,1099-1102);对植物材料的显微注射(Crossway A等,(1986)Mol.Gen Genet 202:179-185);包被有DNA或RNA的粒子轰击法(Klein TM等,(1987)Nature 327:70)、(非整合性)病毒感染法等。转基因植物,包括转基因作物植物,优选地通过农杆菌介导的转化法产生。有利的转化方法是在植物中(in planta)的转化法。为此目的,例如有可能使农杆菌作用于植物种子或有可能用农杆菌接种植物的分生组织。根据本发明已经证明使转化的农杆菌混悬液作用于完整植物或至少作用于花原基是特别有利的。植物随后继续培育直至获得所处理植物的种子(Clough和Bent,Plant J.(1998)16,735-743)。用于农杆菌介导的稻转化的方法包括用于稻转化的公知方法,如在任一以下文献中描述的那些方法:欧洲专利申请EP 1198985A1,Aldemita和Hodges(Planta 199:612-617,1996);Chan等(Plant Mol Biol 22(3):491-506,1993),Hiei等(Plant J 6(2):271-282,1994),其公开内容在本文中引入作为参考,如同完全给出那样。在玉米转化的情况下,优选的方法如Ishida等(Nat.Biotechnol 14(6):745-50,1996)或Frame等(Plant Physiol 129(1):13-22,2002)描述,其公开内容在本文中如充分所述那样引入作为参考。所述方法通过举例方式进一步由B.Jenes等,Techniq ues for Gene Transfer,在:Transgenic Plants,第1卷,Engineering and Utilization,编者S.D.Kung和R.Wu,AcademicPress(1993)128-143及在Potrykus Annu.Rev.Plant Physiol.Plant Molec.Biol.42(1991)205-225)中描述。待表达的核酸或构建体优选地克隆至适于转化根癌农杆菌(Agrobacterium tumefaciens)的载体,例如pBin19(Bevan等,Nucl.Acids Res.12(1984)8711)。由这种载体转化的农杆菌随后可以按照已知方式用于转化植物,例如作为模型使用的植物,如拟南芥(拟南芥属于本发明的范围,不视为作物植物)或作物植物,例如烟草植物,通过在农杆菌溶液中浸泡擦伤的叶或切碎的叶并随后将它们在合适的培养基内培育。植物通过根癌农杆菌的转化例如由和Willmitzer在Nucl.AcidRes.(1988)16,9877中描述或尤其从F.F.White,Vectors for Gene Transferin Higher Plants;在Transgenic Plants,第1卷,Engineering andUtilization,编者S.D.Kung和R.Wu,Academic Press,1993,第15-38页中获知。
除了转化体细胞(其随后必须再生成完整植物)之外,还有可能转化植物分生组织的细胞及特别转化发育成配子的那些细胞。在这种情况下,转化的配子遵循天然的植物发育过程,产生转基因植物。因此,例如拟南芥种子用农杆菌处理并且从发育植物中获得种子,其中一定比例的所述植物受到转化并且因此是转基因的[Feldman,KA和Marks MD(1987)Mol GenGenet 208:274-289;Feldmann K(1992)。在:编者C Koncz,N-H Chua和J Shell,Methods in Arabidopsis Research.Word Scientific,Singapore,第274-289页]。替代性方法基于反复去掉圆锥花序并使莲座叶丛中心中的切除部位与转化的农杆菌孵育,因而转化的种子同样可以在较晚的时间点获得(Chang(1994)Plant J.5:551-558;Katavic(1994)Mol Gen Genet,245:363-370)。然而,尤其有效的方法是改良的真空渗入法,如“花浸染”法。在拟南芥真空渗入法的情况下,完整植物在减压下用农杆菌混悬液处理[Bechthold,N(1993)。C R Acad Sci Paris Life Sci,316:1194-1199],而在“花浸染法”的情况下,正在发育的花组织与表面活性剂处理的农杆菌混悬液短暂孵育[Clough,SJ和Bent,AF(1998)The Plant J.16,735-743]。在两种情况下收获了一定比例的转基因种子,并且这些种子可以通过在如上所述的选择条件下培育而与非转基因种子区分。此外,质体的稳定转化是有利的,因为质体在大部分作物中以母体方式遗传,降低或消除了转基因经花粉流动风险。叶绿体基因组的转化一般通过已在Klaus等,2004[Nature Biotechnology 22(2),225-229]中示例性加以展示的方法实现。简而言之,待转化的序列连同选择标记基因一起克隆至与叶绿体基因组同源的侧翼序列之间。这些同源的侧翼序列指导位点特异性整合至原质体系内。已经对众多不同植物物种描述了质体转化并且综述可以出自Bock(2001)在基础研究和植物生物技术中的转基因质体(Transgenic plastids in basicresearch and plant biotechnology).J Mol Biol.2001年9月21日;312(3):425-38或Maliga,P(2003)质体转化技术商业化进展(Progress towardscommercialization of plastid transformation technology).TrendsBiotechnol.21,20-28。进一步生物技术进展最近已经以无标记质体转化体的形式作了报道,所述无标记质体转化体可以通过瞬时共整合的标记基因产生(Klaus等,2004,Nature Biotechnology 22(2),225-229)。
T-DNA激活标签化
T-DNA激活标签化(Hayashi等Science(1992)1350-1353)涉及在目的基因的基因组区域内或基因编码区上游或下游10kb处以如此结构插入T-DNA(通常含有启动子(也可以是翻译增强子或内含子)),使得启动子指导被靶定基因的表达。通常,由靶定基因的天然启动子对所述靶定基因表达的调节作用遭到破坏并且该基因处在新引入的启动子控制下。启动子一般嵌入在T-DNA中。这种T-DNA随机地插入植物基因组,例如通过农杆菌感染,并导致在所插入T-DNA附近的基因的改良表达。因靠近所引入启动子的基因的改良表达,产生的转基因植物表现显性表型。
TILLING
TILLING(基因组内定向诱导的局部损伤)是用于产生和/或鉴定核酸诱变技术,其中所述的核酸编码具有修饰表达和/或活性的蛋白质。TILLING还允许选择携带此类突变变体的植物。这些突变变体可以显示在强度方面或在位置方面或在时间方面改良的表达(例如若突变影响启动子)。这些突变变体可以显示比由处于其天然形式的基因所显出活性更高的活性。TILLING将高密度诱变与高通量筛选方法组合。一般在TILLING中遵循的步骤是:(a)EMS诱变(Redei GP和Koncz C(1992)在Methods inArabidopsis Research,Koncz C,Chua NH,Schell J,Singapore编辑,World Scientific Publishing Co,第16-82页;Feldmann等,(1994)在Meyerowitz EM,Somerville CR编辑,Arabidopsis.Cold Spring HarborLaboratory Press,Cold Spring Harbor,NY,第137-172页;Lightner J和Caspar T(1998)在J Martinez-Zapater,J Salinas编者,Methods onMolecular Biology第82卷.Humana Press,Totowa,NJ,第91-104页);(b)个体的DNA制备和汇集;(c)PCR扩增目的区;(d)变性和退火以允许形成异源双链体;(e)DHPLC,其中将异源双链体是否在汇集物中的存在检测为色谱图中的一个额外峰;(f)鉴定突变个体;和(g)对突变PCR产物测序。用于TILLING的方法是本领域众所周知的(McCallum等,(2000)NatBiotechnol 18:455-457;综述见Stemple(2004)Nat Rev Genet 5(2):145-50)。
同源重组
同源重组允许选择的核酸在基因组中于确定的所选择位置内引入。同源重组是在生物科学中常规地用于低等生物如酵母或苔藓剑叶藓(Physcomitrella)的标准技术。用于在植物中开展同源重组的方法已经不仅对模式植物(Offringa等(1990)EMBO J 9(10):3077-84)而且对作物植物例如稻(Terada等(2002)Nat Biotech 20(10):1030-4;Iida和Terada(2004)Curr Opin Biotech 15(2):132-8)进行了描述。
产量
术语“产量”通常意指经济价值的可测量结果,必定与指定作物、与面积并与时间段有关。单个植物部分基于它们的数目、大小和/或重量而直接对产量有贡献,或实际产量是对于某作物和一年的每英亩产量,这通过总产量(包括收获的和评价的产量)除以种植的英亩数而确定。
增加/改善/增强
术语“增加”,“改善”或“增强”是可互换的并且应当在本申请含义上指与如本文中定义的对照植物相比至少5%、6%、7%、8%、9%或10%、优选至少15%或20%、更优选地25%、30%、35%或40%更多的产量和/或生长。
种子产量
增加的种子产量本身可以表现为下列一种或多种指标:a)种子生物量(种子总重量)增加,这可以基于单粒种子和/或每株植物和/或每公顷或每英亩;b)每株植物增加的花数;c)增加的(饱满)种子数;d)增加的种子饱满率(其表述为饱满种子数与种子总数之间的比率);e)增加的收获指数,其表述为可收获部分(如种子)产量与总生物量的比率;和f)增加的千粒重(TKW),这从计数的饱满种子数及其总重量外推而来。增加的TKW可以因增加的种子大小和/或种子重量所致,并且也可以因胚和/或胚乳尺寸的增加所致。
种子产量的增加也可以表现为种子大小和/或种子体积的增加。此外,种子产量的增加本身也可以自我表现为种子面积和/或种子长度和/或种子宽度和/或种子周长的增加。增加的产量也可以产生改良的结构,或可以因改良的结构而出现。
植物
如本文中所用的术语“植物”包括整株植物、植物的祖先及后代和植物部分,包括种子、枝条、茎、叶、根(包括块茎)、花和组织及器官,其中每种所提及对象包含目的基因/核酸。术语“植物”也包括植物细胞、悬浮培养物、愈伤组织、胚、分生组织区、配子体、孢子体、花粉和小孢子,同样每种提及的对象包含目的基因/核酸。
特别用于本发明方法中的植物包括属于植物界(Viridiplantae)超家族的全部植物,尤其单子叶植物和双子叶植物,包括选自以下的饲用或饲料豆类、观赏植物、粮食作物、树或灌木:槭树属物种(Acer spp.)、猕猴桃属物种(Actinidia spp.)、秋葵属物种(Abelmoschus spp.)、剑麻(Agavesisalana)、冰草属物种(Agropyron spp.)、匍匐剪股颖(Agrostisstolonifera)、葱属物种(Allium spp.)、苋属物种(Amaranthus spp.)、欧洲海滨草(Ammophila arenaria)、凤梨(Ananas comosus)、番荔枝属物种(Annona spp.)、芹菜(Apium graveolens)、落花生属物种(Arachis spp.)、木波罗属物种(Artocarpus spp.)、石刁柏(Asparagus officinalis)、燕麦属物种(Avena spp.)(例如燕麦(Avena sativa)、野燕麦(Avena fatua)、比赞燕麦(Avena byzantina)、Avena fatua var.sativa、杂种燕麦(Avena hybrida)、阳桃(Averrhoa carambola)、箣竹属(Bambusa sp.)、冬瓜(Benincasa hispida)、巴西栗(Bertholletia excelsea)、甜菜(Beta vulgaris)、芸苔属物种(Brassicaspp.)(例如欧洲油菜(Brassica napus)、芜青物种(Brassica rapa spp.)[芸苔(canola)、油菜(oilseed rape)、蔓青(turnip rape)])、Cadaba farinosa、茶(Camellia sinensis)、美人蕉(Canna indica)、大麻(Cannabis sativa)、辣椒属物种(Capsicum spp.)、Carex elata、番木瓜(Carica papaya)、大果假虎刺(Carissa macrocarpa)、山核桃属物种(Carya spp.)、红花(Carthamustinctorius)、栗属物种(Castanea spp.)、美洲木棉(Ceiba pentandra)、苦苣(Cichorium endivia)、樟属物种(Cinnamomum spp.)、西瓜(Citrulluslanatus)、柑桔属物种(Citrus spp.)、椰子属物种(Cocos spp.)、咖啡属物种(Coffea spp.)、芋头(Colocasia esculenta)、非洲梧桐属物种(Cola spp.)、黄麻属(Corchorus sp.)、芫荽(Coriandrum sativum)、榛属物种(Corylus spp.)、山楂属物种(Crataegus spp.)、番红花(Crocus sativus)、南瓜属物种(Cucurbita spp.)、香瓜属物种(Cucumis spp.)、菜蓟属物种(Cynara spp.)、胡萝卜(Daucus carota)、山马蝗属物种(Desmodium spp.)、龙眼(Dimocarpus longan)、薯蓣属物种(Dioscorea spp.)、柿树属物种(Diospyrosspp.)、稗属物种(Echinochloa spp.)、油棕属(Elaeis)(例如油棕(Elaeisguineensis)、美洲油棕Elaeis(oleifera))、穇子(Eleusine coracana)、蔗茅属(Erianthus sp.)、枇杷(Eriobotrya japonica)、桉属(Eucalyptus sp.)、红仔果(Eugenia unifiora)、荞麦属物种(Fagopyrum spp.)、水青冈属物种(Fagusspp.)、苇状羊茅(Festuca arundinacea)、无花果(Ficus carica)、金桔属物种(Fortunella spp.)、草莓属物种(Fragaria spp.)、银杏(Ginkgo biloba)、大豆属物种(Glycine spp.)(例如大豆(Glycine max)、大豆(Soja hispida)或大豆(Soja max))、陆地棉(Gossypium hirstum)、向日葵属物种(Helianthusspp.)(例如向日葵(Helianthus annuus))、长管萱草(Hemerocallis fulva)、木槿属物种(Hibiscus spp.)、大麦属物种(Hordeum spp.)(例如大麦(Hordeumvulgare))、甘薯(Ipomoea batatas)、核桃属物种(Juglans spp.)、莴苣(Lactucasativa)、山黧豆属物种(Lathyrus spp.)、兵豆(Lens culinaris)、亚麻(Linumusitatissimum)、荔枝(Litchi chinensis)、百脉根属物种(Lotus spp.)、棱角丝瓜(Luffa acutangula)、羽扇豆属物种(Lupinus spp.)、Luzula sylvatica、番茄属(Lycopersicon spp.)(例如番茄(Lycopersicon esculentum、Lycopersicon lycopersicum、Lycopersicon pyriforme))、硬皮豆属物种(Macrotyloma spp.)、苹果属物种(Malus spp.)、凹缘金虎尾(Malpighiaemarginata)、牛油果(Mammea americana)、芒果(Mangifera indica)、木薯属物种(Manihot spp.)、人心果(Manilkara zapota)、苜蓿(Medicagosativa)、草木樨属物种(Melilotus spp.)、薄荷属物种(Mentha spp.)、芒(Miscanthus sinensis)、苦瓜属物种(Momordica spp.)、黑桑(Morus nigra)、芭蕉属物种(Musa spp.)、烟草属物种(Nicotiana spp.)、木犀榄属物种(Oleaspp.)、仙人掌属物种(Opuntia spp.)、鸟足豆属物种(Ornithopus spp.)、稻属物种(Oryza spp.)(例如稻(Oryza sativa)、阔叶稻(Oryza latifolia))、稷(Panicum miliaceum)、柳枝稷(Panicum virgatum)、鸡蛋果(Passifloraedulis)、欧防风(Pastinaca sativa)、狼尾草属物种(Pennisetum sp.)、鳄梨属物种(Persea spp.)、芹菜(Petroselinum crispum)、虉草(Phalarisarundinacea)、菜豆属物种(Phaseolus spp.)、猫尾草(Phleum pratense)、刺葵属物种(Phoenix spp.)、南方芦苇(Phragmites australis)、酸浆属物种(Physalis spp.)、松属物种(Pinus spp.)、阿月浑子(Pistacia vera)、豌豆属物种(Pisum spp.)、早熟禾属物种(Poa spp.)、杨属物种(Populus spp.)、牧豆草属物种(Prosopis spp.)、李属物种(Prunus spp.)、番石榴属物种(Psidiumspp.)、石榴(Punica granatum)、西洋梨(Pyrus communis)、栎属物种(Quercus spp.)、萝卜(Raphanus sativus)、波叶大黄(Rheumrhabarbarum)、茶藨子属物种(Ribes spp.)、蓖麻(Ricinus communis)、悬钩子属物种(Rubus spp.)、甘蔗属物种(Saccharum spp.)、柳属物种(Salixsp.)、接骨木属物种(Sambucus spp.)、黑麦(Secale cereale)、胡麻属物种(Sesamum spp.)、白芥属物种(Sinapis sp.)、茄属物种(Solanum spp.)(例如马铃薯(Solanum tuberosum)、红茄(Solanum integrifolium)或番茄(Solanum lycopersicum))、两色蜀黍(Sorghum bicolor)、菠菜属物种(Spinacia spp.)、蒲桃属物种(Syzygium spp.)、万寿菊属物种(Tagetes spp.)、酸豆(Tamarindus indica)、可可树(Theobroma cacao)、车轴草属物种(Trifolium spp.)、Triticosecale rimpaui、小麦属物种(Triticum spp.)(例如普通小麦(Triticum aestivum)、硬粒小麦(Triticum durum)、圆柱小麦(Triticum turgidum)、Triticum hybernum、马卡小麦(Triticum macha)、普通小麦(Triticum sativum)或普通小麦(Triticum vulgare))、小金莲花(Tropaeolum minus)、金莲花(Tropaeolum majus)、越桔属物种(Vacciniumspp.)、野碗豆属物种(Vicia spp.)、豇豆属物种(Vigna spp.)、香堇(Violaodorata)、葡萄属物种(Vitis spp.)、玉蜀黍(Zea mays)、Zizania palustris、枣属物种(Ziziphus spp.)等等。
发明详述
(i)VPE
根据第一个实施方案,本发明提供了在植物中相对于对照植物而增强产量相关性状的方法,包括调节植物中编码VPE的核酸的表达。
本发明还提供目前未知的VPE编码核酸和VPE。这些序列也可用于实施本发明的方法。
因此根据本发明的另一实施方案,提供了分离的核酸分子,其包含:
(i)SEQ ID NO:151、SEQ ID NO:153、SEQ ID NO:155、SEQ IDNO:157、SEQ ID NO:159、SEQ ID NO:161、SEQ ID NO:163、SEQ IDNO:165、SEQ ID NO:167、SEQ ID NO:169、SEQ ID NO:171所示核酸;
(ii)(i)所示任一SEQ ID NO的互补序列;
(iii)编码VPE的核酸,所述VPE与SEQ ID NO:152、SEQ ID NO:154和SEQ ID NO:156、SEQ ID NO:158、SEQ ID NO:160、SEQ ID NO:162、SEQ ID NO:164、SEQ ID NO:166、SEQ ID NO:168、SEQ ID NO:170、SEQ ID NO:172中任一氨基酸序列具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%(优选程度逐渐提高)的序列同一性;
(iv)能在严格杂交条件下与上述(i)、(ii)或(iii)中任一核酸杂交的核酸。
根据本发明的另一实施方案,还提供了分离的多肽,其包含:
(i)SEQ ID NO:152、SEQ ID NO:154和SEQ ID NO:156、SEQ IDNO:158、SEQ ID NO:160、SEQ ID NO:162、SEQ ID NO:164、SEQ IDNO:166、SEQ ID NO:168、SEQ ID NO:170、SEQ ID NO:172中任一项所示氨基酸序列;
(ii)与SEQ ID NO:152、SEQ ID NO:154和SEQ ID NO:156、SEQID NO:158、SEQ ID NO:160、SEQ ID NO:162、SEQ ID NO:164、SEQID NO:166、SEQ ID NO:168、SEQ ID NO:170、SEQ ID NO:172中任一氨基酸序列具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%(优选程度逐渐提高)序列同一性的氨基酸序列;
(iii)上文(i)或(ii)中任一氨基酸序列的衍生物。
调节(优选提高)编码VPE的核酸的表达的优选方法是在植物中引入并表达编码VPE的核酸。
下文中对“可用于本发明方法的蛋白质”的任何提及均指本文定义的VPE。下文中对“可用于本发明方法的核酸”的任何提及均指能够编码这些VPE的核酸。待引入植物(因此可用于实施本发明方法)的核酸是编码现将描述的蛋白质类型的任何核酸,下文也称为“VPE核酸”或“VPE基因”。
本文定义的“VPE”指任何液泡加工酶。VPE是切割天冬酰胺和天冬氨酸C端肽键的半胱氨酸蛋白酶(Hiraiwa等FEBS Letters 447,1999,第213-216页)。
本发明的蛋白质可通过保守性结构域的存在来鉴定(参阅图5,其显示γVPE(VPEg)的结构域结构)。VPEg包含以下特征中的一种或多种:
-用于插入内膜系统的信号肽;
-N端抑制性结构域;
-活性结构域
-C端抑制性结构域;和
-保守的组氨酸及半胱氨酸残基。
术语“结构域”在本文“定义”章节中定义。存在用于鉴定结构域的专门数据库,例如SMART(Schultz等(1998)Proc.Natl.Acad.Sci.USA 95,5857-5864;Letunic等(2002)Nucleic Acids Res 30,242-244,InterPro(Mulder等,(2003)Nucl.Acids.Res.31,315-318;Prosite(Bucher和Bairoch(1994),A generalized profile syntax for biomolecular sequences motifs andits function in automatic sequence interpretation.(In)ISMB-94;Proceedings 2nd International Conference on Intelligent Systems forMolecular Biology.Altman R.,Brutlag D.,Karp P.,Lathrop R.,Searls D.,编著,53-61页,AAAIPress,Menlo Park;Hulo等,Nucl.Acids.Res.32:D134-D137,(2004)或者Pfam(Bateman等,Nucleic Acids Research 30(1):276-280(2002)。用于计算机分析蛋白质序列的一组工具在ExPASY蛋白组学服务器(由Swiss Institute of Bioinformatics(Gasteiger等,ExPASy:theproteomics server for in-depth protein knowledge and analysis,NucleicAcids Res.31:3784-3788(2003)提供)提供。还可以使用常规技术(如序列比对)来鉴定结构域。
比对序列以进行比较的方法为本领域所熟知,这些方法包括GAP、BE STFIT、BLAST、FASTA和TFASTA。GAP利用Needleman和Wunsch((1970)J Mol Biol 48:443-453)的算法来寻找两序列间使匹配数最高并使空位数最少的全局比对(即在完整序列上)。BLAST算法(Altschul等(1990)J Mol Biol 215:403-10)在两序列间计算百分比序列同一性并进行相似性的统计学分析。用于进行BLAST分析的软件在国际生物技术信息中心(National Centre for Biotechnology Information(NCBI))向公众提供。可以使用如默认配对比对参数的ClustalW多重序列比对算法(1.83版)和百分比评分法来容易地鉴定同源物。也可以使用MatGAT软件包(Campanella等,BMC Bioinformatics.2003 Jul 10;4:29.MatGAT:anapplication that generates similarlty/identity matrices using protein orDNA sequences)中提供的一种方法确定全局的相似性和同一性百分比。本领域技术人员会意识到,可以进行少量手动编辑以优化保守性基序之间的比对。此外,还可以使用特定的结构域代替全长序列来鉴定同源物。序列同一性值(在下文的实施例部分中以百分比表示)是使用默认参数的上述程序在完整的核酸或氨基酸序列上和/或在所选择的结构域或保守的基序测定的。
此外,VPE(至少在其天然形式下)一般具有以下活性。其他细节在本文的实施例部分中提供。
SEQ ID NO:150所示VPE是酶学委员会(EC)编号EC 3.4.22.34的酶,http://www.ebi.ac.uk/intenz/query?cmd=SearchEC&ec=3.4.22.34&status=OK legumain(也称为天冬酰胺酰内肽酶)。天冬酰胺酰内肽酶催化蛋白质和小分子底物在键处水解。这类肽酶不被化合物E-64抑制。已经显示,VPEg(VPEγ)对Asp残基和Asp-Gln键显示蛋白酶活性,以除去N端的前肽(Haraiwa等1999,FEBS 447:213-216)。还报道了检测VPE蛋白质的蛋白酶活性的其他方法(参阅如Kuroyanagi,The Journal of Biological Chemistry第280卷,No.38,32914-32920页)。
VPE一般还显示CASPASE I活性(参阅Hatsugai等,(Science第305卷2004年8月6日)和Rojo等,2004(Current Biology,第14卷,1897-1906页))。报道了胱天蛋白酶中的以下活性五肽位点:E(A/G)CES(SEQ ID NO:209)。
本发明以SEQ ID NO:149所示的核酸序列转化植物来进行举例说明,其编码多肽序列SEQ ID NO:150。然而,本发明的实施并不局限于这些序列;本发明的方法可以有利地利用本文所定义的任何VPE编码核酸或VPE来实施。
VPE编码核酸的实例在本文实施例部分中给出。这样的核酸可用于实施本发明的方法。实施例中给出的氨基酸序列为SEQ ID NO:150所示VPE的直向同源物和旁系同源物的示例序列,其中术语“直向同源物”和“旁系同源物”如本文所定义。可以通过进行所谓的交互BLAST检索容易地找到其它直向同源物和旁系同源物。通常,这包括以查询序列(例如,利用实施例的表中所列的任一序列)针对任何序列数据库如可公共获得的NCBI数据库进行BLAST的一次BLAST。当从核苷酸序列开始时,通常使用BLASTN或TBLASTX(利用标准默认值),而当从蛋白质序列开始时,则使用BLASTP或TBLASTN(利用标准默认值)。BLAST结果可以任选地过滤。接着使用过滤的结果或者未过滤的结果中的全长序列针对查询序列来源生物的序列进行反向BLAST(二次BLAST)(在查询序列为SEQ IDNO:149或SEQ ID NO:150的情况下,二次BLAST将会针对拟南芥属序列)。然后比较一次和二次BLAST的结果。如果一次BLAST中高排名的命中来自查询序列源自的相同物种,然后反向BLAST理想地导致查询序列处于最高命中之列,则找到了旁系同源物;如果一次BLAST中高排名的命中不来自查询序列源自的相同物种,且优选地在反向BLAST时导致查询序列在最高命中中,则找到了直向同源物。
高排名的命中是E值低的命中。E值越低,分值越具有显著性(或者换句话说,偶然发现此命中的几率越低)。E值的计算是本领域众所周知的。除了E值之外,还对比较进行同一性百分比评分。同一性百分比是指两比较核酸(或多肽)序列之间在特定长度上的相同核苷酸(或氨基酸)数。在大家族的情况下可以使用ClustalW,继之以邻接树来辅助相关基因的聚类可视化,和鉴定直向同源物和旁系同源物。
核酸变体也可用于实施本发明的方法。这类核酸变体的实例包括编码实施例部分表B1中所示任一氨基酸序列的同源物和衍生物的核酸,其中术语“同源物”和“衍生物”如本文所定义。同样可用于本发明方法的有编码实施例部分表B1所示任一氨基酸序列的直向同源物或旁系同源物的同源物和衍生物的核酸。可用于本发明方法的同源物和衍生物与其源自的未修饰蛋白质具有基本上相同的生物活性和功能活性。
可用于实施本发明方法的其他核酸变体包括VPE编码核酸的部分、与VPE编码核酸杂交的核酸、VPE编码核酸的剪接变体、VPE编码核酸的等位变体,以及通过基因改组获得的VPE编码核酸的变体。术语杂交序列、剪接变体、等位变体和基因改组如本文所述。
VPE编码核酸无需是全长核酸,因为本发明方法的实施不依赖于全长核酸序列的使用。根据本发明,提供了增强植物产量相关性状的方法,包括在植物中引入和表达实施例部分表B1所示任一核酸序列的部分、或者编码表B1所示任一氨基酸序列的直向同源物、旁系同源物或同源物的核酸的部分。
例如,可以通过对核酸进行一个或多个缺失来制备所述核酸的“部分”。“部分”可以以分离的形式使用,或者可将其与其他编码(或非编码)序列融合,以便例如,产生组合了若干活性的蛋白质。当与其他编码序列融合时,经翻译后所产生的多肽可能比针对该蛋白质部分所预测到的要大。
可用于本发明方法的“部分”编码如本文所定义的VPE,并与实施例部分表B1所示氨基酸序列具有基本上相同的生物活性。优选“部分”是实施例部分表B1所示任一核酸的部分,或是编码表B1所示任一氨基酸序列的直向同源物或旁系同源物的核酸的部分。该“部分”长度一般为至少800个连续核苷酸,优选长度为至少1000个连续核苷酸,更优选长度为至少1200个连续核苷酸,最优选长度为至少1500个连续核苷酸,所述连续核苷酸来自实施例表B1所示任一核酸序列或者编码实施例表B1所示任一氨基酸序列的直向同源物或旁系同源物的核酸。最优选“部分”是核酸SEQ ID NO:149的部分。优选“部分”编码包含本文所定义的任何一个或多个结构域的氨基酸序列。优选“部分”编码这样的氨基酸序列,当例如如图6所示利用其构建VPE系统发生树时,其倾向于与包含SEQ ID NO:150所示氨基酸序列的γVPE的群而非任何其他蛋白质群聚类。
可用于本发明方法的另一类核酸变体为在降低的严格条件下、优选在严格条件下,能够与本文所定义的VPE编码核酸或者本文所定义的“部分”杂交的核酸。
根据本发明,提供了增强植物产量相关性状的方法,包括在植物中引入和表达能够与实施例部分表B1所示任一核酸杂交的核酸,或者包括在植物中引入和表达能够与编码实施例表B1所示任一核酸序列的直向同源物、旁系同源物或同源物的核酸杂交的核酸。
可用于本发明方法的杂交序列编码如本文所定义的VPE,并与实施例表B1所示氨基酸序列具有基本上相同的生物活性。优选杂交序列能够与表B1所示任一核酸杂交、或与任一前述序列的部分杂交,其中部分如上文所定义;或者其中杂交序列能够与编码表B1所示任一氨基酸序列的直向同源物或旁系同源物的核酸杂交。最优选杂交序列能够与SEQ ID NO:149所示的核酸或其部分杂交。优选杂交序列编码包含任何一个或多个本文所定义基序或结构域的氨基酸序列。优选杂交序列编码这样的氨基酸序列,当如图6所示利用其构建VPE系统发生树时,其倾向于与包含SEQ ID NO:150所示氨基酸序列的γVPE的群而非任何其他群聚类。
可用于本发明方法的另一类核酸变体为编码前文所定义的VPE的剪接变体,其中剪接变体如本文所定义。
根据本发明,提供了增强植物产量相关性状的方法,包括在植物中引入和表达实施例表B1所示任一核酸序列的剪接变体、或编码表B1所示任一氨基酸序列的直向同源物、旁系同源物或同源物的核酸的剪接变体。
优选的剪接变体是SEQ ID NO:149所示核酸的剪接变体,或编码SEQID NO:150的直向同源物或旁系同源物的核酸的剪接变体。优选剪接变体所编码的氨基酸序列包含任何一个或多个本文所定义的基序或结构域。优选剪接变体编码这样的氨基酸序列,其在例如如图6所示构建VPE系统发生树时,其倾向于与包含SEQ ID NO:150所示氨基酸序列的γVPE蛋白质的群而非任何其他群聚类。
可用于实施本发明方法的另一类核酸变体为前文所定义的VPE编码核酸的等位变体,其中等位变体如本文所定义。
根据本发明,提供了增强植物产量相关性状的方法,包括在植物中引入和表达实施例表B1所示任一核酸的等位变体,或者包括在植物中引入和表达编码表B1所示任一氨基酸序列的直向同源物、旁系同源物或同源物的核酸的等位变体。
可用于本发明方法的等位变体与SEQ ID NO:150的VPE及实施例部分表B1所示的任一氨基酸序列具有基本上相同的生物活性。等位变体天然存在,并且这些天然等位基因的使用包含于本发明的方法中。优选等位变体为SEQ ID NO:149的等位变体,或编码SEQ ID NO:150的直向同源物或旁系同源物的核酸的等位变体。优选等位变体所编码的氨基酸序列包含任何一个或多个本文所定义的基序或结构域。优选等位变体编码这样的氨基酸序列,当利用其在例如如图6所示构建VPE系统发生树时,其倾向于与包含SEQ ID NO:150所示氨基酸序列的γVPE蛋白质的群而非任何其他群聚类。
基因改组或定向进化也可用于产生上文所定义的VPE编码核酸的变体;其中术语“基因改组”如本文所定义。
根据本发明,提供了增强植物产量相关性状的方法,包括在植物中引入和表达实施例表B1所示任一核酸序列的变体,或者包括在植物中引入和表达编码实施例部分所示表B1给出的任一氨基酸序列的直向同源物、旁系同源物或同源物的核酸的变体,其中所述变体核酸通过基因改组获得。
优选通过基因改组获得的变体核酸编码包含任何一个或多个本文所定义基序或结构域的氨基酸序列。优选通过基因改组获得的变体核酸编码这样的氨基酸序列,其在例如如图6所示构建VPE系统发生树时,其倾向于与包含SEQ ID NO:150所示氨基酸序列的γVPE的群而非任何其他群聚类。
此外,还可利用定点诱变获得核酸变体。若干方法可用来实现定点诱变,最常见的是基于PCR的方法(Current Protocols in Molecular Biology.Wiley编辑)。
编码VPE蛋白的核酸可以来自任何天然或人工的来源。可以通过有意的人为操作在组成和/或基因组环境上修饰核酸,使之不同于天然形式。优选VPE编码核酸来自植物,还优选来自双子叶植物,更优选来自芸苔科(Brassica family),最优选核酸来自拟南芥。
本发明方法的实施产生具有增强的产量相关性状的植物。尤其本发明方法的实施产生相对于对照植物而具有增加的产量、尤其增加的种子产量的植物。在本文中的“定义”部分中更详细地描述了术语“产量”和“种子产量”。
在本文中对增强的产量相关性状的提及意指植物的一个或多个部分的生物量(重量)增加,所述的部分可以包括地上(可收获)部分和/或地下(可收获)部分。尤其,此类可收获部分是种子,并且本发明方法的实施产生相对于合适的对照植物的种子产量具有增加的种子产量的植物。
以玉米为例,产量增加可以表现为下列一种或多种指标:每公顷或英亩中已建立植物数的增加、每株植物穗数的增加、行数的增加、每行粒数、粒重、千粒重、玉米穗长度/直径、种子饱满率的增加(其中种子饱满率是饱满种子数除以种子总数并乘以100)及其它。以稻为例,产量增加本身可以表现为下列一种或多种指标的增加:每公顷或英亩植物数、每株植物圆锥花序数、每圆锥花序小穗数、每圆锥花序花(小花)数(其表达为饱满种子数对原圆锥花序数之比)、种子饱满率的增加(其中种子饱满率是饱满种子数除以种子总数并乘以100)、千粒重的增加及其它。
本发明提供了增加植物相对于对照植物的产量、特别是种子产量的方法,所述方法包括调节植物中本文所定义的VPE编码核酸的表达(优选提高表达)。
由于本发明的转基因植物具有增加的产量,因而相对于对照植物的生长速率,这些植物有可能在其生活周期中的对应阶段上表现增加的生长速率(在其生活周期的至少部分期间)。
增加的生长速率可以对于植物的一个或多个部分(包括种子)是特异性的,或可以基本上遍及整株植物。具有增加的生长速率的植物可以具备较短的生活周期。植物的生活周期可以视为意指从干燥成熟种子成长至植物已经产生与起始材料相似的干燥成熟种子的阶段所需要的时间。这个生活周期可以受下列因素影响,如早期萌发势、生长速率、绿度指数、开花时间和种子成熟速度。生长速率的增加可以在植物生活周期中的一个或多个阶段上或在基本上整个植物生活周期期间发生。在植物生活周期中的早期期间增加的生长速率可以反映增强的萌发势。生长速率的增加可以改变植物的收获周期,允许植物较晚播种和/或较早收获,否则这将不可能(相似的作用可以用较早的开花时间获得)。若生长速率充分地增加,可以允许进一步播种相同植物物种的种子(例如播种并收获稻植物,随后播种并收获其它稻植物,全部稻植物均在一个常规生长时段内)。类似地,若生长速率足够地增加,可以允许进一步播种不同植物物种的种子(例如播种并收获玉米植物,随后例如播种并任选收获大豆、马铃薯或任何其它合适植物)。从相同的根茎中收获额外次数在一些作物植物的情况中也是可能的。改变植物的收获周期可以导致每英亩的年生物量产量的增加(因任何特定植物可以生长并收获的次数(如在一年中)增加)。生长速率的增加也可以允许比其野生型对应物在更广泛的地理区域内培育转基因植物,因为对培育作物的区域限制往往由栽种时节(早季)或在收获时期(晚季)的不利环境条件所决定。若缩短收获周期,则可以避开这类不利条件。生长速率可以通过从生长曲线中得到多种参数而确定,此类参数可以是:T-Mid(植物达到其50%最大尺寸所花费的时间)和T-90(植物达到其90%最大尺寸所花费的时间),等等。
根据本发明的优选特征,本发明方法的实施产生相对于对照植物而具有增加的生长速率的植物。因而根据本发明,提供增加植物生长速率的方法,所述方法包括调节表达、优选增加本文中所定义的编码VPE的核酸在植物中的表达。
与对照植物相比,无论植物处于非胁迫条件下还是植物暴露于多种胁迫下,都发生产量和/或生长速率的增加。植物一般通过生长得更慢而对暴露于胁迫作出应答。在严重胁迫条件下,植物甚至可以完全停止生长。另一方面,轻微胁迫在本文中定义为植物对其暴露的任何胁迫,其中所述的胁迫未导致植物完全停止生长而没有恢复生长的能力。与非胁迫条件下的对照植物相比,轻微胁迫在本发明意义中导致受胁迫植物生长降低小于40%、35%或30%,优选小于25%、20%或15%,更优选小于14%、13%、12%、11%或10%或更低。由于农业实践(灌溉、施肥、杀虫剂处理)上的进步,在栽培作物植物中并不经常遇到严重胁迫。因此,由轻微胁迫诱导的受损生长往往是农业上不希望的特征。轻微胁迫是植物暴露的常见生物性和/或非生物性(环境)胁迫。非生物胁迫可以因干旱或水涝、厌氧胁迫、盐胁迫、化学毒性、氧化胁迫和热、寒冷或冰冻温度所致。非生物胁迫可以是由水胁迫(尤其因为干旱)、盐胁迫、氧化胁迫或离子胁迫引起的渗透胁迫。生物胁迫一般是由病原体如细菌、病毒、真菌和昆虫引起的那些胁迫。
尤其,本发明的方法可以在非胁迫条件下或在轻微干旱条件下实施以产生相对于对照植物而具有增加的产量的植物。如在Wang等(Planta(2003)218:1-14)中报道,非生物胁迫导致不利地影响植物生长及生产力的一系列形态学变化、生理学变化、生物化学变化和分子变化。已知干旱、盐度、极端温度和氧化胁迫是相互联系的并可以通过相似机制而诱导生长损害及细胞损害。Rabbani等(Plant Physiol(2003)133:1755-1767)描述了干旱胁迫与高盐度胁迫间极高程度的“交叉(cross talk)”。例如,干旱和/或盐化作用主要表现为渗透胁迫,导致细胞内稳态和离子分布的破坏。经常伴随高温或低温、盐度或干旱胁迫的氧化胁迫可以造成功能性蛋白和结构蛋白变性。因此,这些多样的环境胁迫常常激活相似的细胞信号途径和细胞应答,如产生胁迫蛋白质、上调抗氧化物质、积累相容性溶质和生长抑制。如本文中所用的术语“非胁迫”条件是允许植物最佳生长的环境条件。本领域技术人员清楚对于给定地点的正常土壤条件和气候条件。
本发明方法的实施相对于在可比条件下培育的合适对照植物,赋予在非胁迫条件下或在轻微干旱条件下培育的植物增加的产量。因而根据本发明,提供用于在非胁迫条件下或在轻微干旱条件下培育的植物中增加产量的方法,所述方法包括增加编码VPE的核酸在植物中表达。
本发明包括可由根据本发明的方法获得的植物或其部分(包括种子)。所述植物或其部分含有编码如上文所定义的VPE的核酸转基因。
本发明还提供遗传构建体和载体,以利于在植物中引入和/或表达VPE编码核酸。可以将基因构建体插入适于转化进入植物并适于在转化的细胞中表达目的基因的载体中,该载体可以是可商购的载体。本发明还提供了如本文所定义的基因构建体在本发明方法中的用途。
更具体地,本发明提供这样的构建体,其含有:
(a)编码如上文所定义的VPE的核酸;
(b)一个或多个能够驱动(a)中核酸序列表达的控制序列;和任选的
(c)转录终止序列。
术语“控制序列”和“终止序列”如本文所定义。
可以使用含有任何上述核酸的载体转化植物。技术人员充分知晓载体中必须存在的遗传元件,以便成功进行转化、选择并繁殖含目的序列的宿主细胞。将目的序列有效连接于一个或多个控制序列(至少连接于启动子)。
有利地,任何类型的启动子均可用于驱动核酸序列的表达。组成型启动子作为根特异性启动子特别有用。然而特别优选的是种子特异性启动子。种子特异性启动子主要在种子组织中有转录活性,但不一定仅在种子组织中有(泄漏表达的情况)。种子特异性启动子可在种子发育和/或萌发过程中有活性。种子特异性启动子为本领域所熟知。应该明白,本发明的适用范围不仅限于SEQ ID NO:149所示的VPE编码核酸,本发明的适用范围也不仅限于由种子特异性启动子驱动时表达VPE编码核酸。可用于驱动VPE编码核酸表达的其他种子特异性启动子的实例示于本文“定义”部分中。种子特异性启动子的其他实例在Qing Qu和Takaiwa(Plant Biotechnol.J.2,113-125,2004)中给出,其公开内容通过参考整体并入本文。
更优选在种子的胚和/或糊粉层中有转录活性的启动子。优选地,种子特异性启动子为水胁迫诱导型(WSI)启动子或其功能等价启动子。更优选地,启动子序列如SEQ ID NO:205所示。也可用于驱动VPE编码核酸表达的其他胚特异性启动子的实例示于本文“定义”部分中。也可以用于驱动VPE编码核酸表达的其它糊粉特异性启动子的实例也示于本文“定义”部分中。
为了鉴定功能等价启动子,可以分析候选启动子的启动子强度和/或表达模式,例如通过将该启动子与报告基因有效连接并测定该报告基因在多种植物组织中的表达水平和模式。合适的熟知报告基因包括如β-葡糖醛酸糖苷酶或β-半乳糖苷酶。通过测量β-葡糖醛酸糖苷酶或β-半乳糖苷酶的酶活性来测定启动子活性。接着可以将启动子强度和/或表达模式与参考启动子(例如用于本发明方法中的)进行比较。或者,可以通过定量mRNA水平或者将本发明方法中所用核酸的mRNA水平与持家基因(如18SrRNA)mRNA水平进行比较来测定启动子强度,其中使用本领域熟知的技术,通过放射自显影的光密度测定分析进行的Northern印迹、定量实时PCR或RT-PCR(Heid等,1996Genome Methods 6:986-994)。通常,“弱启动子”指驱动编码序列低水平表达的启动子。“低水平”指每个细胞中约1/10,000的转录物至约1/100,000的转录物至约1/500,0000的转录物的水平。相反,“强启动子”驱动编码序列高水平表达,或者每个细胞中约1/10的转录物至约1/100的转录物至约1/1000的转录物的水平。
任选地,可在引入植物的构建体中使用一个或多个终止子序列。其他调节元件可包括转录及翻译增强子。本领域技术人员会了解适于实施本发明的终止子和增强子序列。这些序列是已知的,或者可由本领域技术人员容易地获得。
也可将内含子序列添加至5′非翻译区(UTR)或编码序列上,以增加在细胞溶胶内积累的成熟信息的量。已经证实可剪接内含子在植物表达构建体和动物表达构建体中转录单位内的包含在mRNA水平及蛋白质水平上增加基因表达至多达1000倍(Buchman和Berg(1988)Mol.Cell biol.8:4395-4405;Callis等(1987)Gens Dev 1:1183-1200)。基因表达的此类内含子增强作用一般在位于转录单元5′端附近时最强烈。使用玉米内含子Adh1-S内含子1、2和6、Bronze-1内含子是本领域已知的。对于一般信息,见:The Maize Handbook,第116章,Freeling和Walbot编辑,Springer,N.Y.(1994)。
其它控制序列(除启动子、增强子、沉默子、内含子序列、3’UTR和/或5’UTR区之外)可以是蛋白质和/或RNA稳定元件。本领域技术人员会知道或可以容易地获得此类序列。
本发明的遗传构建体还可以包括需要用于在特定细胞类型中维持和/或复制的复制起点序列。一个实例是当需要将遗传构建体在细菌细胞中维持为附加型遗传元件(例如质粒或粘粒分子)时。优选的复制起点包括但不限于f1-ori和colE1。
为检测如在本发明方法中所用核酸序列的成功转移和/或选择包含这些核酸的转基因植物,使用标记基因(或报告基因)是有利的。因而,遗传构建体可以任选地包含选择标记基因。选择标记在本文“定义”部分中有更详细的描述。
已知当核酸稳定或瞬时整合至植物细胞时,仅小部分的细胞摄取外来DNA并且根据需要将其整合至细胞基因组,这取决于所用表达载体和使用的转染技术。为鉴定并选择这些整合子,通常将编码选择标记(如上文所述之一)的基因连同目的基因一起引入宿主细胞。这些标记可以在其中这些基因因例如常规方法所致的缺失而无功能的突变体中使用。此外,编码选择标记的核酸分子可以引入宿主细胞中,与在包含编码本发明多肽或本发明方法中所用多肽的序列在同一载体上,或在单独的载体上。已经用引入的核酸稳定转染的细胞可以通过选择进行鉴定(例如具有整合的选择标记的细胞存活而其它细胞死亡)。
因为一旦已经成功引入了核酸,则转基因宿主细胞中就不再需要或不希望有标记基因,尤其抗生素抗性基因和除草剂抗性基因,因此用于引入核酸的本发明方法有利地使用能够去掉或切除这些标记基因的技术。一种如此方法称作共转化法。共转化法使用同时用于转化的两种载体,一种载体携带本发明的核酸而另一种载体携带标记基因。高比例的转化体接受,或在植物的情况下,包含(高达40%或更多的转化体)这两种载体。在用农杆菌转化的情况下,转化体通常仅接受载体的一部分,即侧翼有T-DNA的序列,它通常代表表达盒。标记基因随后可以通过进行杂交而从转化的植物中去掉。在另一种方法中,整合至转座子的标记基因用来与想要的核酸一起进行转化(称作Ac/Ds技术)。转化体可以与转座酶来源植物杂交或转化体用导致转座酶表达的核酸构建体瞬时或稳定地转化。在一些情况下(大约10%),转座子在已经成功发生转化时跳出宿主细胞的基因组并丢失。在其它更多情况下,转座子跳至不同位置。在这些情况下,标记基因必须通过进行杂交而去除。在微生物学中,开发了实现或促进检测这类事件的技术。又一个有利的方法依赖于重组系统;此方法的优势在于不必通过杂交去除。该类型的最知名系统称作Cre/lox系统。Cre1是去掉位于loxP序列之间序列的重组酶。若标记基因整合于loxP序列之间,则通过重组酶表达已经成功发生转化时,标记基因被去除。其它重组系统是HIN/HIX、FLP/FRT和REP/STB系统(Tribble等,J.Biol.Chem.,275,2000:22255-22267;Velmurugan等,J.Cell Biol.,149,2000:553-566)。有可能将本发明核酸序列以位点特异性方式整合至植物基因组。这些方法自然也可以应用至微生物如酵母、真菌或细菌。
本发明还提供产生与对照植物相比具有增强的产量相关性状的转基因植物的方法,其包括在植物中引入和表达编码上文所定义VPE的任何核酸。
更具体地,本发明提供了产生具有提高的产量的转基因植物的方法,所述方法包括:
(i)向植物或植物细胞中引入和表达VPE编码核酸;和
(ii)在促进植物生长和发育的条件下培养植物细胞。
可以将核酸直接引入植物细胞或植物本身(包括引入组织、器官或植物的任何其它部分)。根据本发明优选的方面,优选通过转化将核酸引入植物。术语“转化”在本文“定义”部分有更详细的说明。
遗传修饰的植物细胞能够通过技术人员熟悉的所有方法再生。合适的方法可见于上述S.D.Kung和R.Wu、Potrykus或者和Willmitzer的出版物。
通常在转化以后,选出存在一个或多个标记的植物细胞或细胞群,所述标记由与目的基因共转移的植物可表达基因编码,继之将转化的材料再生成整个植物。为选择转化的植物,通常将在转化过程中获得的植物材料置于选择性条件下,从而可将转化的植物与非转化植物区分开来。例如,可以种植以上述方式获得的种子,并在最初的生长期之后,通过喷雾对其进行合适的选择。另一可能方案是使用合适的选择剂,将种子(适当时在灭菌之后)种在琼脂板上,从而仅转化的种子能够长成植物。可选地,针对转化的植物筛选可选择标记如上文所述标记的存在。
DNA转移和再生之后,还可评价推定转化的植物,例如用Southern分析(DNA印迹),评价目的基因的存在、拷贝数和/或基因组构造。备选地或额外地,可用Northern和/或Western分析监测新引入的DNA的表达水平,这两种技术都是本领域普通技术人员所熟知的。
产生的转化植物可以通过多种方式繁殖,如通过克隆繁殖或经典的育种技术。例如,第一代(或T1)转化的植物可自交,选择纯合的第二代(或T2)转化体,而T2植物可进一步通过经典育种技术繁殖。
产生的转化生物体可以有多种形式。例如,它们可以是转化细胞和非转化细胞的嵌合体;克隆的转化体(例如所有细胞经转化含有表达盒);转化和非转化组织的嫁接体(例如在植物中,转化的根状茎嫁接到非转化的接穗上)。
本发明显然延及由本文所述任何方法产生的任何植物细胞或植物,以及所有的植物部分及其繁殖体。本发明还延及由任何上述方法产生的原代转化或转染的细胞、组织、器官或整个植物的后代,唯一的要求是所述后代呈现出与在本发明方法中亲本产生的相同的基因型和/或表型特征。
本发明也包括含有分离的编码上文所定义的VPE的核酸的宿主细胞。根据本发明优选的宿主细胞是植物细胞。对于用于本发明方法的核酸或载体、表达盒或构建体或载体,其宿主植物原则上有利地为能够合成在本发明方法中使用的多肽的所有植物。
本发明方法有利地适用于任何植物。
特别用于本发明方法中的植物包括属于植物界超家族的全部植物,尤其单子叶植物和双子叶植物,包括饲用或饲料豆类、观赏植物、粮食作物、树或灌木。根据本发明优选的实施方案,植物是作物植物。作物植物的实例包括大豆、向日葵、芸苔、苜蓿、油菜、棉花、番茄、马铃薯和烟草。还优选地,植物是单子叶植物。单子叶植物的实例包括甘蔗。更优选地,植物是谷物。谷物的实例包括稻、玉米、小麦、大麦、粟、黑麦、高粱和燕麦。
本发明也扩展至植物的可收获部分如,但不限于种子、叶、果实、花、茎、根茎、块茎和球茎。本发明进一步涉及来自、优选直接来自这种植物的可收获部分中的产物,如干燥颗粒或粉末、油、脂肪及脂肪酸、淀粉或蛋白质。
根据本发明的一个优选的特征,调节的表达是提高的表达。用于提高核酸或基因或基因产物之表达的方法均已详细记载于本领域中,包括如通过适当的启动子驱动过表达,使用转录增强子或翻译增强子。作为启动子或增强子元件的分离的核酸可在非异源形式多核苷酸中的适当位置(一般为上游)引入,以上调表达。例如,可以通过突变、缺失和/或替换在体内改变内源启动子(参阅Kmiec,美国专利No.5,565,350;Zarling等,PCT/US93/03868),或者可将分离的启动子以正确的方向和与本发明基因的距离引入植物细胞中,以控制基因表达。
如果期望表达多肽,一般期望在多核苷酸编码区的3’末端包含多腺苷酸化区。多腺苷酸化区可来自该天然基因,来自多种其他植物基因,或者来自T-DNA。待被加入的3’末端序列可来自例如胭脂碱合酶或章鱼碱合酶基因,或者来自其他植物基因,或者较不优选地来自任何其他真核基因。
如上文所述,调节(优选提高)VPE编码核酸之表达的优选方法是在植物中引入和表达编码VPE的核酸;然而也可使用其他熟知的技术实现本方法的效果,即增强产量相关性状。现将对这些技术中的一些进行描述。
一种这样的技术是T-DNA激活标签化(Hayashi等Science(1992)1350-1353),其涉及在目的基因的基因组区域内或基因编码区上游或下游10kb处以如此结构插入T-DNA(通常含有启动子(也可以是翻译增强子或内含子)),使得启动子指导被靶定基因的表达。通常,由靶定基因的天然启动子对所述靶定基因表达的调节作用遭到破坏并且该基因处在新引入的启动子控制下。启动子一般嵌入在T-DNA中。这种T-DNA随机地插入植物基因组,例如通过农杆菌感染,并导致在所插入T-DNA附近的基因的改良表达。因靠近所引入启动子的基因的改良表达,产生的转基因植物表现显性表型。
还可以使用TILLING(基因组中靶向诱导的局部损伤)技术来再现本发明的效果,其描述参阅“定义”部分。
还可以使用同源重组来再现本发明的效果,其描述参阅“定义”部分。
本发明还包括编码如本文所述的VPE的核酸以及这些VPE在增强植物任一上述产量相关性状中的用途。
可以在育种程序中使用编码本文所述VPE的核酸或所述VPE本身,其中鉴定可能与VPE编码基因遗传连锁的DNA标记。可以使用所述核酸/基因或所述VPE蛋白本身定义分子标记。接着可以将此DNA或蛋白质标记在育种程序中使用,以在本发明的方法中选择具有如上文所定义的增强的产量相关性状的植物。
VPE蛋白编码核酸/基因的等位变体也可以用于标记辅助的育种程序中。这种育种程序有时需要通过使用例如EMS诱变法对植物作诱变处理而引入等位基因变异;备选地,该程序可以从非人为引起的所谓“自然”起源的一组等位变体开始。随后进行等位变体的鉴定,例如通过PCR法。此后是用于选择所讨论及导致增加产量的序列的优异等位变体的步骤。一般通过监测含有所讨论序列的不同等位变体的植物的生长性能而实施选择。可以在温室中或田间监测生长性能。其它任选步骤包括将鉴定了优异等位变体的植物与另一种植物杂交。这可以用来例如产生目标表型特征的组合。
编码VPE的核酸也可以用作探针以便对基因进行遗传作图和物理作图,所述探针作为所述基因的一部分及与这些基因关联的性状的标记。此类信息可以用于植物育种中,以便开发具有想要表型的株系。VPE编码核酸的这种用途仅需要具有至少15个核苷酸长度的核酸序列。VPE编码核酸可以用作限制性片段长度多态性(RFLP)标记。限制性消化的植物基因组DNA的Southern印迹(Sambrook J,Fritsch EF和Maniatis T(1989)Molecular Cloning,A Laboratory Manual)可以用VPE编码核酸探测。产生的结合图式随后可以使用计算机程序如MapMaker(Lander等(1987)Genomics 1:174-181)进行遗传分析以构建遗传图。此外,该核酸可以用来探测含有经限制性内切核酸酶处理的一组个体的基因组DNA的Southern印迹,其中所述的一组个体代表具有确定的遗传杂交的亲代和后代。DNA多态性的分离被标出并用来计算VPE编码核酸在使用这个群体先前所获得的遗传图中的位置(Botstein等(1980)Am.J.Hum.Genet.32:314-331)。
在Bernatzky和Tanksley(1986)Plant Mol.Biol.Reporter 4:37-41中描述了植物基因衍生的探针的产生和其在遗传作图中的用途。众多出版物描述了使用以上所提及的方法学或其改良方法对特定cDNA克隆的遗传作图。例如,F2互交群、回交群、随机交配群、邻近纯合系和其它个体群体可以用于作图。此类方法学是本领域技术人员众所周知的。
所述核酸探针也可以用于物理作图(即序列在物理图上的排列;见Hoheisel等在:Non-mammalian Genomic Analyasis:A Practical Guide,Academic press 1996,第319-346页及其中引用的参考文献)。
在另一实施方案中,核酸探针可以在直接荧光原位杂交(FISH)作图法(Trask(1991)Trends Genet.7:149-154)中使用。尽管当前的FISH作图法支持使用大型克隆(几个kb至几百个kb;见Laan等(1995)Genome Res.5:13-20),然而灵敏度的改善可以允许使用更短探针进行FISH作图。
用于遗传作图及物理作图的多种基于核酸扩增的方法可以使用所述核酸而实施。实例包括等位基因特异的扩增法(Kazazian(1989)J.Lab.Clin.Med 11:95-96)、PCR扩增片段的多态性(CAPS;Sheffield等(1993)Genomics 16:325-332)、等位基因特异性连接(Landegren等(1988)Science241:1077-1080)、核苷酸延伸反应(Sokolov(1990)Nucleic Acid Res.18:3671)、放射杂交作图(Walter等(1997)Nat.Genet.7:22-28)和Happy作图法(Dear和Cook(1989)Nucleic Acid Res.17:6795-6807)。对于这些方法,使用一种核酸的序列来设计并产生在扩增反应或在引物延伸反应中使用的引物对。此类引物的设计是本领域技术人员众所周知的。在使用基于PCR遗传作图的方法中,可能必须鉴定在对应于当前核酸序列的区域内作图交叉亲代间的DNA序列差异。然而,这对于作图法而言通常不是必需的。
本发明方法产生具有如前文所述的产量提高相关性状的植物。这些性状也可以与其它经济有利的性状组合,如其它的产量增强性状、对其它非生物胁迫和生物胁迫的耐性、调节多种构造性特征和/或生物化学特征和/或生理学特征的性状。
(ii)CCA1
现已惊奇地发现调节编码CCA1样多肽的核酸在植物中的表达产生了相对于对照植物具有增强的产量相关性状(特别是提高的种子产量)的植物。在下文详细描述了适于增强植物中产量相关性状的特定类的CCA1样多肽。
本发明提供了相对于对照植物增强植物中产量相关性状(特别是提高的种子产量)的方法,其包括调节编码CCA1样多肽的核酸在植物中的表达。
在此之后“用于本发明方法中的蛋白质”的任何提及意指如本文中所定义的CCA1样多肽。在此之后“用于本发明方法中的核酸”的任何提及意指能够编码这种CCA1样多肽的核酸。
术语“多肽”和“蛋白质”如本文定义部分中所定义。术语“多核苷酸”、“核酸序列”、“核苷酸序列”也如本文所定义。术语“对照植物”也如本文所定义。
用于调节(优选增加)编码用于本发明方法中的蛋白质的核酸表达的优选方法是在植物中引入并表达编码如下文所定义的用于本发明方法中的蛋白质的核酸。
待引入植物(因此可用于实施本发明方法)的核酸是编码现将描述的蛋白质类型的任何核酸,在下文也称为“CCA1样核酸”或“CCA1样基因”。本文定义的CCA1样多肽指SHAQKYF类的任何MYB转录因子。MYB转录因子为本领域所熟知,近期关于稻和拟南芥中MYB转录因子的一篇综述由Yanhui等(Plant Mol.Biol 60,107-124,2006)给出,其公开内容通过参考并入本文。转录因子调节基因表达,并至少包含DNA结合结构域以及激活/抑制结构域。MYB DNA结合结构域一般由1至3个不完全重复组成,各具有大约52个氨基酸,并采取嵌入DNA大沟中的螺旋-转角-螺旋构象。每个MYB重复包含三个规则排列的色氨酸残基,其参与疏水簇并推测参与DNA的特异性识别。
本文定义的CCA1样蛋白质包含SANT结构域(在SMART中定义为SM00717,InterPro IPR001005,见图1),其参与特异性DNA基序的识别,YAAC(G/T)G序列(其中Y代表C或T)。
SANT结构域优选包含基序1和/或基序2:
基序1,SEQ ID NO:141:
W(T/S)(E/D/A/P/T/R)(G/E/P/Q/D/A/N/Y)E(H/Q)(D/E/N/R/K/Q/A/S)(K/R/L/M/T/N/Q)F(L/I/V/M)(E/D/Q/I/L/V/M/T/A/R/H)(A/S/G)(L/I/M)(Q/H/I/K/R/S/E/D/N)(L/M/K/R/Q/V/T)(F/Y/H/V/L/F)(D/G)(R/K/E)
优选地,基序1具有序列
W(T/S)(E/D/A)(G/E/P/Q/D/A)EH(D/E/N/R/K/Q/A)(K/R/L)F(L/O/V)(E/D/Q/I)(A/S)(L/I)(Q/H/I/K/R)(L/M/K)(F/Y/H)(D/G)R
更优选地,基序1具有序列
WT(E/D)(E/P/Q/D)EH(D/N/K/Q)(K/R)F(L/I)(E/D/Q)AL(Q/H/I/K/R)L(F/Y/H)(D/G)R
最优选地,基序1具有序列
WTEEEHNRFIEALRLYGR
基序2,SEQ ID NO:142
(F/H/Y/C/L)(V/I)(G/A/K/T/V/S/R)(S/T)(K/R)(T/N/S)(V/T/A/P/S)(I/V/T/M/R/E/A)Q(I/V)(R/A/S)(S/M)(H/Y)(A/Y)(Q/D)(K/Y/N)(Y/H/F)(F/K/C)(L/T/S/A/I/R/H)
优选地,基序2具有序列
(F/H/Y)(V/I)(G/A)(S/T)K(T/N/S)(V/T/A)(I/V)QIRSHAQK(Y/H/F)F(L/T/S/A)
最优选地,基序2具有序列
HVATKTAVQIRSHAQKFFS
优选地,可用于本发明方法的CCA1样蛋白还包含基序3和/或基序4:
基序3,SEQ ID NO:143:PP(P/Q)(R/Y/L)(P/H)(K/R/P)
基序4,SEQ ID NO:144:ATVAAA(S/T)AWWA
还优选可用于本发明方法的CCA1样蛋白还包含基序5,SEQ ID NO:145:DRSS(C/S)GSNT。
使用产生系统树的已知技术和软件(如GCG、EBI或CLUSTAL包,使用默认参数),本领域技术人员容易确定目的氨基酸序列是否落入“CCA1样”多肽的定义内。构建系统树的优选方法是Yanhui等(2006)描述的方法。任何聚类到Yanhui等所定义的CCA1样亚家族的序列均认为落入上文CCA1样多肽的定义,并认为适于用于本发明的方法。
在下文实施例1的表A中给出了用于本发明方法中的蛋白质和编码该蛋白质的核酸的实例。
还用于本发明方法中的是在实施例1表A中给出的任何一种氨基酸序列的同源物。“同源物”如上文定义章节中所定义。
还用于本发明方法中的是在实施例1的表A中给出的任何一种多肽的衍生物或任一前述SEQ ID NO的直向同源物或旁系同源物。术语“衍生物”如本文所定义。特别优选SEQ ID NO:2的衍生物或实施例1表A所给出多肽的衍生物。用于本发明方法中的衍生物优选地具有与所述衍生物从其中衍生的非修饰蛋白质相似的生物学活性及功能活性。
本发明通过用由SEQ ID NO:1代表的编码多肽序列SEQ ID NO:2的拟南芥核酸序列转化植物加以说明,然而,本发明的实施不限于这些序列。本发明方法可以使用编码用于本发明方法中如本文中所定义的蛋白质的任何核酸有利地进行,所述核酸包括直向同源物和旁系同源物,如在实施例1表A中给出的任一核酸序列。
在实施例1表A中给出的氨基酸序列可以视为由SEQ ID NO:2代表的CCA1样多肽的直向同源物和旁系同源物,直向同源物和旁系同源物如本文所定义。
直向同源物和旁系同源物可以通过开展所谓交互性blast检索而容易地找到。这通常涉及一次BLAST,其中所述的一次BLAST包括对查询序列(例如使用实施例1表A中列出的任一序列)针对任一序列数据库(如公众可用的NCBI数据库)进行BLAST检索。当从核苷酸序列开始时,一般使用BLASTN或TBLASTX(使用标准默认值),并且当从蛋白质序列开始时,可以使用BLASTP或TBLASTN(使用标准默认值)。任选地可以筛选BLAST结果。随后提交筛选结果和非筛选结果的全长序列以针对来自生物的序列进行反向BLAST(二次BLAST),其中查询序列来自所述的生物(其中在查询序列是SEQ ID NO:1或SEQ ID NO:2的情况下,二次BLAST因而将针对拟南芥序列)。随后比较一次和二次BLAST检索的结果。若来自一次BLAST的高排名命中源自与查询序列从其中衍生的物种相同的物种,反向BLAST随后理想地产生查询序列作为最高命中,则鉴定到旁系同源物;若一次BLAST的中的高排名命中不源自与查询序列从其中衍生的物种相同的物种,并且优选地在反向BLAST时产生属于最高命中之列的查询序列,则鉴定到直向同源物。
高排名命中是具有低E-值的那些命中。E-值越低,评分越显著(或换句话说,此命中因偶然而发生的几率越低)。E-值的计算是本领域众所周知的。除了E-值外,比较结果还由同一性百分数评分。同一性百分数指两个所比较核酸(或多肽)序列之间在特定长度范围内的相同核苷酸(或氨基酸)数目。在大型家族的情况下,可以使用ClustalW,随后使用邻接树法以便帮助显示相关基因的聚类和以便鉴定直向同源物和旁系同源物。
实施例1表A给出由SEQ ID NO 2代表的CCA1样蛋白质的直向同源物和旁系同源物的实例。其它直向同源物和旁系同源物可以使用上文所述的BLAST方法而容易地鉴定。
本发明的蛋白质可通过存在保守性SANT结构域以及基序3至5中的一个或多个来鉴定(示于图1)。术语“结构域”指沿进化相关蛋白质的序列比对而在特定位置处保守的一组氨基酸。尽管在其它位置处的氨基酸可以在同源物之间变动,然而在特定位置处的高度保守的氨基酸指示在蛋白质的结构、稳定性或功能方面必需的氨基酸。结构域因通过在蛋白质同源物家族的比对序列中的高保守程度而被鉴定,它们可以用作鉴定物以确定任意的所讨论多肽是否属于先前已鉴定的多肽家族(在这种情况下是本文所定义的可用于本发明方法的蛋白质及其编码核酸)
术语“基序”、“共有序列”和“标签(signature)”如本文所定义。术语“结构域”也如本文所定义。
还存在用于鉴定结构域的专门数据库,如SMART(Schultz等(1998)Proc.Natl.Acad.Sci.USA 95,5857-5864;Letunic等(2002)Nucleic AcidsRes 30,242-244)、InterPro(Mulder等,(2003)Nucl.Acids.Res.31,315-318)、Prosite(Bucher和Bairoch(1994),用于生物分子序列基序的广义图谱语法及其在自动化序列判读中的功能.(在)ISMB-94;第二届分子生物学智能系统国际会议文集.Altman R.,Brutlag D.,Karp P.,Lathrop R.,Searls D.编辑,第53-61页,AAAIPress,Menlo Park;Hulo等,Nucl.Acids.Res.32:D134-D137,(2004))或Pfam(Bateman等,Nucleic Acids Research30(1):276-280(2002))。用于计算机芯片上分析蛋白质序列的一组工具可在ExPASY蛋白质组学服务器上获得(由瑞士生物信息学研究所拥有(Gasteiger等,ExPASy:用于深入认识和分析蛋白质的蛋白组学服务器,Nucleic Acids Res.31:3784-3788(2003))。
结构域也可以使用常规技术如通过序列比对而鉴定。用于比对序列用于比较的方法是本领域众所周知的,此类方法包括GAP、BESTFIT、BLAST、FASTA和TFASTA。GAP使用Needleman和Wunsch算法((1970)J Mol Biol 48:443-453)以找到使匹配数最大化并使空位数最小化的两个完整序列的全局性(即覆盖完整序列的)比对。BLAST算法(Altschul等(1990)JMol Biol 215:403-10)计算序列同一性百分数并执行对两个序列间相似性的统计分析。用于执行BLAST分析的软件是公众通过国家生物技术信息中心(NCBI)可获得的。同源物可以使用例如ClustalW多重序列比对算法(1.83版本)以默认配对比对参数和评分方法(以百分数计)而容易地鉴定。相似性和同一性的全局百分数也可以使用在MatGAT软件包中可获得的方法之一而确定(Campanella等,BMC Bioinformatics.2003Jul 10;4:29.MatGAT:用蛋白质或DNA序列而产生相似性/同一性矩阵的应用)。可以进行细微手工编辑以优化保守基序之间的比对,如本领域技术人员显而易见。此外作为使用全长序列以鉴定同源物的替代,也可以使用特定结构域(如SANT结构域或上文所定义的基序之一)。使用上文提及的程序,使用默认参数,针对整个核酸序列或氨基酸序列和/或针对选择的结构域或保守基序测定了在下文实施例10中显示为百分数的序列同一性值。
此外,CCA1样蛋白(至少在其天然形式下)一般具有DNA结合活性。本领域技术人员可以使用常规工具和技术容易地确定DNA结合活性或转录激活的存在。为了测定CCA1样蛋白的DNA结合活性,有几种测定可用(例如Current Protocols in Molecular Biology,第1和2卷,Ausubel等(1994),Current Protocols)。特别地,Wang等(Plant Cell 9,497-507,1197)描述了使用Lhcb13基因的A2片段对CCA1样转录因子进行DNA结合测定。其他细节提供于实施例6。
编码用于本发明方法中的蛋白质的核酸无需是全长核酸,因为本发明方法的实施不依赖使用全长核酸序列。在实施本发明方法中适用的核酸实例包括在实施例1表A中给出的核酸序列,但不限于这些序列。核酸变体也可以用于实践本发明方法。核酸变体的实例包括编码本发明方法中所用蛋白质的核酸的部分、与编码本发明方法中所用蛋白质的核酸杂交的核酸、编码本发明方法中所用蛋白质的核酸的剪接变体、编码本发明方法中所用蛋白质的核酸的等位变体和通过基因改组作用而获得的编码本发明方法中所用蛋白质的核酸的变体。现在将描述术语“部分、杂交序列、剪接变体、等位变体和基因改组”。
根据本发明,提供用于增强植物中产量相关性状的方法,包括在植物中引入并表达在实施例1表A中给出的任何一种核酸序列的一部分或编码实施例1表A中给出的任何一种氨基酸序列的直向同源物、旁系同源物或同源物的核酸的一部分。
用于本发明方法中的部分编码属于核酸的定义范围的多肽,其中所述的核酸编码用于本发明方法中并具有与实施例1表A中给出的氨基酸序列相同的生物学活性的蛋白质。优选地,此部分是在实施例1表A中给出的任何一种核酸的部分。该部分一般具有至少1200个连续核苷酸长度、优选至少1400个连续核苷酸长度、更优选至少1600个连续核苷酸长度并且最优选至少1800个连续核苷酸长度,其中所述的连续核苷酸是在实施例1表A中给出的任何一种核酸序列。最优选地,该部分是核酸SEQ ID NO:1的部分。优选地,该部分编码包含如本文中所定义的(任何一种或多种)SANT结构域和角蛋白结构域的氨基酸序列。
编码如本文中所定义的CCA1样蛋白质的核酸的部分可以例如通过对该核酸产生一种或多种缺失而制备。所述的部分可以以分离的形式加以使用或它们可以与其它编码性(或非编码性)序列融合,以便例如产生组合几种活性的蛋白质。当与其它编码序列融合时,翻译时产生的所得多肽可以比对CCA1样蛋白质部分所预测的多肽更大。
用于本发明方法中的另一种核酸变体是能够在降低的严格性条件下、优选在严格条件下与编码如本文中所定义的CCA1样蛋白质的核酸杂交,或与如本文中所定义的部分杂交的核酸。术语“杂交”如上文所定义。
用于本发明方法中的杂交序列编码具有SANT结构域结构域(见图2的比对结果)并且具有与CCA1样蛋白质基本相同的生物学活性的多肽,其中所述的CCA1样蛋白质由实施例1表A中给出的任一氨基酸序列代表。该杂交序列一般具有至少1200个连续核苷酸长度、优选至少1400个连续核苷酸长度、更优选至少1600个连续核苷酸长度并且最优选至少1800个连续核苷酸长度,其中所述的连续核苷酸是在实施例1表A中给出的任何一种核酸序列。优选地,杂交序列是能够与实施例1表A中给出的任一核酸杂交或与任一这些序列的一部分杂交的序列,其中所述的一部分如上文所定义。最优选地,杂交序列能够与如SEQ ID NO:1所代表的核酸或与其部分杂交。优选地,杂交序列编码包含任何一种或多种如本文中所定义的基序或结构域的氨基酸序列。
根据本发明,提供用于增强植物中产量相关性状的方法,包括在植物中引入并表达能够与实施例1表A中给出的任何一种核酸杂交的核酸,或包括在植物中引入并表达这样的核酸,其能够与编码在实施例1表中给出的任一核酸序列的直向同源物、旁系同源物或同源物的核酸杂交。
用于本发明方法中的另一种核酸变体是编码如上文所定义的CCA1样蛋白质的剪接变体。术语“剪接变体”如本文所定义。
根据本发明,提供用于增强植物中产量相关性状的方法,包括在植物中引入并表达在实施例1表A中给出的任何一种核酸序列的剪接变体,或如此核酸的剪接变体,其中所述的核酸编码在实施例1表A中给出的任一氨基酸序列的直向同源物、旁系同源物或同源物。
优选的剪接变体是由SEQ ID NO:1代表的核酸的剪接变体或编码SEQ ID NO:2的直向同源物或旁系同源物的核酸的剪接变体。优选地,由所述剪接变体编码的氨基酸序列包含任何一种或多种如本文中所定义的基序或结构域。
用于实施本发明方法中的另一种核酸变体是编码如上文所定义的CCA1样蛋白质的核酸的等位变体。术语“等位变体”如本文所定义。用于本发明方法中的等位变体具有与SEQ ID NO:2的CCA1样蛋白质基本上相同的生物学活性。
根据本发明,提供用于增强植物中产量相关性状的方法,包括在植物中引入并表达在实施例1表A中给出的任何一种核酸的等位变体,或包括在植物中引入并表达如此核酸的等位变体,其中所述的核酸编码在实施例1表A中给出的任一氨基酸序列的直向同源物、旁系同源物或同源物。
优选地,该等位变体是SEQ ID NO:1的等位变体或编码SEQ ID NO:2的直向同源物或旁系同源物的核酸的等位变体。优选地,由所述等位变体编码的氨基酸序列包含任何一种或多种如本文中所定义的基序或结构域。
可用于本发明方法的其他核酸变体是编码上述CCA1样蛋白的核酸变体,该变体可通过基因改组获得,“基因改组”或“定向进化”如本文所定义。
根据本发明,提供用于增强植物中产量相关性状的方法,包括在植物中引入并表达在实施例1表A中给出的任何一种核酸序列的变体,或包括在植物中引入并表达如此核酸的变体,其中所述的核酸编码在实施例1表A中给出的任一氨基酸序列的直向同源物、旁系同源物或同源物,其中变体核酸通过基因改组作用而获得。优选地,通过基因改组作用而获得的变体核酸编码包含任何一种或多种如本文中所定义的基序或结构域的氨基酸序列。
另外,核酸变体也可以通过位点定向诱变获得。几种方法可用于实现位点定向诱变,最常见的是基于PCR的方法(Current Protocols inMolecular Biology.Wiley编辑)。
编码CCA1样蛋白质的核酸可以衍生自任何天然来源或人工来源。核酸可以根据其天然形式就组成和/或基因组环境方面通过人类有意操作而加以修饰。优选地,编码CCA1样的核酸来自植物,还优选来自双子叶植物,更优选来自十字花科、该核酸最优选地来自拟南芥。
在下文中对CCA1样蛋白质的任何提及因而意指如上文定义的CCA1样蛋白质。编码如此CCA1样蛋白质的任何核酸适用于实施本发明方法。
本发明也包括通过本发明方法可获得的植物或其部分(包括种子)。该植物或其部分包含编码如上文定义的CCA1样蛋白质的核酸转基因。
本发明还提供遗传构建体和载体以促进在植物中引入和/或表达用于本发明方法中的核酸序列。该基因构建体可以插入适于转化至植物内并适于在转化的细胞中表达目的基因的载体,其中所述载体可以通过商业途径获得。本发明也提供如本文中所定义的基因构建体在本发明方法中的用途。
更具体地,本发明提供构建体,其包含
(a)编码如上文定义的CCA1样蛋白质的核酸;
(b)能够驱动(a)的核酸序列表达的一种或多种控制序列;和任选地
(c)转录终止序列。
植物用包含目的序列(即编码如上文定义的CCA1样多肽的核酸)的载体转化。技术人员非常了解为成功转化、选择和增殖含有目的序列的宿主细胞而必须于载体上存在的遗传元件。目的序列与一种或多种控制序列(至少与启动子)有效连接。术语“调节元件”、“控制序列”和“启动子”如上文所定义。术语“有效连接”也如本文所定义。
有利地,任何类型的启动子都可以用来驱动核酸序列的表达。
启动子可以是组成型启动子。术语“组成型启动子”如本文所定义,组成型启动子的实例也在本文定义部分中给出。或者,启动子可以是诱导型启动子,如本文定义部分中所定义。额外地或备选地,启动子可以是器官特异性或组织特异性启动子,也如本文所定义。
优选地,CCA1样核酸或其变体与组成型启动子有效连接。优选的组成型启动子是基本上也遍在表达的组成型启动子。启动子还优选地从植物、更优选从单子叶植物中得到。最优选使用GOS2启动子(优选来自稻)(SEQID NO:146)。应当明白,本发明的适用性不限于由SEQ ID NO:1代表的CCA1样核酸,同时本发明的适用性也不限于在GOS2启动子驱动时CCA1样核酸的表达。也可以用来驱动CCA1样核酸表达的其它组成型启动子的实例在“定义”部分中显示。
设想在CCA1样核酸或其变体与绿色组织特异性启动子有效连接时也将获得产量的提高。绿色组织特异性启动子的实例在本文定义部分中提供。
为了鉴定功能等价启动子,可以分析候选启动子的启动子强度和/或表达模式,例如通过将该启动子与报告基因有效连接并测定该报告基因在多种植物组织中的表达水平和模式。合适的熟知报告基因包括如β-葡糖醛酸糖苷酶或β-半乳糖苷酶。通过测量β-葡糖醛酸糖苷酶或β-半乳糖苷酶的酶活性来测定启动子活性。接着可以将启动子强度和/或表达模式与参考启动子(例如用于本发明方法中的)进行比较。或者,可以通过定量mRNA水平或者将本发明方法中所用核酸的mRNA水平与持家基因(如18SrRNA)mRNA水平进行比较来测定启动子强度,其中使用本领域熟知的技术,通过放射自显影的光密度测定分析进行的Northern印迹、定量实时PCR或RT-PCR(Heid等,1996Genome Methods 6:986-994)。通常,“弱启动子”指驱动编码序列低水平表达的启动子。“低水平”指每个细胞中约1/10,000的转录物至约1/100,000的转录物,至约1/500,0000的转录物的水平。相反,“强启动子”驱动编码序列高水平表达,或者每个细胞中约1/10的转录物至约1/100的转录物至约1/1000的转录物的水平。
任选地,一种或多种终止子序列可以在引入植物的构建体中使用,术语“终止子”如本文所定义。额外的调节元件可以包括转录增强子以及翻译增强子。本领域技术人员会知道可以在实施本发明中适用的终止子序列和增强子序列。本领域技术人员会知道或可以容易地获得此类序列。
也可将内含子序列添加至5′非翻译区(UTR)或编码序列上,以增加在细胞溶胶内积累的成熟信息的量。已经证实可剪接内含子在植物表达构建体和动物表达构建体中转录单位内的包含在mRNA水平及蛋白质水平上增加基因表达至多达1000倍(Buchman和Berg(1988)Mol.Cell biol.8:4395-4405(1988);Callis等(1987)Gens Dev 1:1183-1200(1987))。基因表达的此类内含子增强作用一般在位于转录单元5′端附近时最强烈。使用玉米内含子Adh1-S内含子1、2和6、Bronze-1内含子是本领域已知的。对于一般信息,见The Maize Handbook,第116章,Freeling和Walbot编辑,Springer,N.Y.(1994)。
其它控制序列(除启动子、增强子、沉默子、内含子序列、3’UTR和/或5’UTR区之外)可以是蛋白质和/或RNA稳定化元件。本领域技术人员会知道或可以容易地获得此类序列。
本发明的遗传构建体还可以包括需要用于在特定细胞类型中维持和/或复制的复制起点序列。一个实例是当需要将遗传构建体在细菌细胞中维持为附加型遗传元件(例如质粒或粘粒分子)时。优选的复制起点包括,但不限于f1-ori和colE1。
为检测如在本发明方法中所用核酸序列的成功转移和/或选择包含这些核酸的转基因植物,使用标记基因(或报告基因)是有利的。因而,遗传构建体可以任选地包含选择标记基因。术语“选择标记”、“选择标记基因”或“报告基因”如上文所定义。
已知当核酸稳定或瞬时整合至植物细胞时,仅小部分的细胞摄取外来DNA并且根据需要将其整合至细胞基因组,这取决于所用表达载体和使用的转染技术。为鉴定并选择这些整合子,通常将编码选择标记(如上文所述之一)的基因连同目的基因一起引入宿主细胞。这些标记可以在其中这些基因因例如常规方法所致的缺失而无功能的突变体中使用。此外,编码选择标记的核酸分子可以引入宿主细胞中,与在包含编码本发明多肽或本发明方法中所用多肽的序列在同一载体上,或在单独的载体上。例如,已经用引入的核酸稳定转染的细胞可以通过选择进行鉴定(例如具有整合的选择标记的细胞存活而其它细胞死亡)。
因为一旦已经成功引入了核酸,则转基因宿主细胞中就不再需要或不希望有标记基因,尤其抗生素抗性基因和除草剂抗性基因,因此用于引入核酸的本发明方法有利地使用能够去掉或切除这些标记基因的技术。一种如此方法称作共转化法。共转化法使用同时用于转化的两种载体,一种载体携带本发明的核酸而另一种载体携带标记基因。高比例的转化体接受,或在植物的情况下,包含(高达40%或更多的转化体)这两种载体。在用农杆菌转化的情况下,转化体通常仅接受载体的一部分,即侧翼有T-DNA的序列,它通常代表表达盒。标记基因随后可以通过进行杂交而从转化的植物中去掉。在另一种方法中,整合至转座子的标记基因用来与想要的核酸一起进行转化(称作Ac/Ds技术)。转化体可以与转座酶来源植物杂交或转化体用导致转座酶表达的核酸构建体瞬时或稳定地转化。在一些情况下(大约10%),转座子在已经成功发生转化时跳出宿主细胞的基因组并丢失。在其它更多情况下,转座子跳至不同位置。在这些情况下,标记基因必须通过进行杂交而去除。在微生物学中,开发了实现或促进检测这类事件的技术。又一个有利的方法依赖于重组系统;此方法的优势在于不必通过杂交去除。该类型的最知名系统称作Cre/lox系统。Cre1是去掉位于loxP序列之间序列的重组酶。若标记基因整合于loxP序列之间,则通过重组酶表达已经成功发生转化时,标记基因被去除。其它重组系统是HIN/HIX、FLP/FRT和REP/STB系统(Tribble等,J.Biol.Chem.,275,2000:22255-22267;Velmurugan等,J.Cell Biol.,149,2000:553-566)。有可能将本发明核酸序列以位点特异性方式整合至植物基因组。这些方法自然也可以应用至微生物如酵母、真菌或细菌。
本发明也提供相对于对照植物产生具有增强的产量相关性状的转基因植物的方法,包括在植物中引入并表达编码如上文所定义的CCA1样蛋白质的任何核酸。
就本发明而言,“转基因的”、“转基因”或“重组”如本文定义部分所定义。设想引入上述天然表达盒的多个拷贝也可用于本发明的方法。
更具体地,本发明提供用于产生具有增加产量的转基因植物的方法,所述方法包括:
(i)在植物或植物细胞中引入并表达CCA1样核酸或其变体;和
(ii)在促进植物生长和发育的条件下培育植物细胞。
核酸可以直接引入植物细胞或引入植物本身(包括引入组织、器官或植物的任何其它部分)。根据本发明的优选特征,核酸优选地通过转化引入植物。
术语“引入”或“转化”如本文“定义”部分中所定义。遗传修饰的植物细胞可以通过技术人员熟悉的所有方法加以再生。合适的方法可以在S.D.Kung和R.Wu,Potrykus或和Willmitzer的前述出版物中找到。
通常在转化后,对植物细胞或细胞群体选择一种或多种标记的存在,其中所述的标记由与目的基因一起共转移的植物可表达基因编码,随后将转化的材料再生成整株植物。为选择转化的植物,在转化中获得的植物材料原则上接受选择条件处理,以至于转化的植物可以与未转化的植物区分。例如。以上文所述方式获得的种子可以播种,在初始培育时期后,通过喷雾进行合适的选择处理。又一种可能性包括在使用合适选择剂的琼脂平板上培育种子(根据需要在灭菌之后),以至于仅转化的种子可以生长成植物。备选地,对转化的植物筛选选择标记(如上文所述的那些选择标记)的存在。
在DNA转移和再生后,推测的转化植物可以例如使用Southern分析对目的基因的存在、拷贝数和/或基因组构造进行评价。备选或额外地,新引入DNA的表达水平可以使用Northern和/或Western分析监测,全部技术是本领域内普通技术人员众所周知的。
产生的转化植物可以通过多种方法加以增殖,如通过克隆性增殖法或经典育种技术。例如,第一代(或T1)的转化植物可以进行自交并选择纯合的第二代(或T2)转化体,并且T2植物随后可以通过经典育种技术进一步繁殖。
产生的转化生物可以采取多种形式。例如,它们可以是转化细胞和非转化细胞的嵌合体;克隆性转化体(例如受转化以含有表达盒的全部细胞);转化组织和未转化组织的移植体(例如在植物中,与未转化嫩枝嫁接的转化的根茎)。
本发明明确地扩展至通过本文中所述的任一方法产生的任何植物细胞或植物,并扩展至全部植物部分及其繁殖体。本发明进一步扩展至包含已经通过任一前述方法产生的原代转化或转染细胞、组织、器官或整株植物的后代,唯一要求是后代表现与通过本发明方法中的亲代所产生的那些后代相同的基因型特征和/或表型特征。
本发明也包括宿主细胞,其含有编码如上文所定义的CCA1样蛋白质的分离核酸。本发明优选的宿主细胞是植物细胞。
宿主植物对于本发明方法中所用核酸或载体、表达盒或构建体或载体而言原则上有利地是能够合成本发明方法中所用多肽的全部植物。
为本发明目的,转基因植物因此如上理解为意指本发明方法中所用的核酸不位于所述植物基因组中该核酸的天然基因座内,所述核酸有可能同源或异源地表达。然而如所提及,转基因还意指尽管本发明核酸或在本发明方法中所用核酸处于植物基因组中该核酸的天然位置内,然而其序列相对于天然序列而言已经受到修饰,和/或所述天然序列的调节序列已经受到修饰。转基因优选地理解为意指本发明核酸在基因组中的非天然基因座内表达,即发生核酸的同源表达或优选异源表达。在本文中提到了优选的转基因植物。
本发明也扩展至植物的可收获部分如,但不限于种子、叶、果实、花、茎、根状茎、块茎和球茎。本发明进一步涉及来自、优选直接来自这种植物的可收获部分中的产物,如干燥颗粒或粉末、油、脂肪及脂肪酸、淀粉或蛋白质。
根据本发明的一个优选的特征,调节的表达是提高的表达。用于提高核酸或基因或基因产物之表达的方法均已记载于本领域中,包括如通过适当的启动子驱动过表达,使用转录增强子或翻译增强子。作为启动子或增强子元件的分离的核酸可在非异源形式多核苷酸中的适当位置(一般为上游)引入,以上调表达。例如,可以通过突变、缺失和/或替换在体内改变内源启动子(参阅Kmiec,美国专利No.5,565,350;Zarling等,PCT/US93/03868),或者可将分离的启动子以正确的方向和与本发明基因的距离引入植物细胞中,以控制基因表达。
如果期望表达多肽,一般期望在多核苷酸编码区的3’末端包含多腺苷酸化区。多腺苷酸化区可来自该天然基因,来自多种其他植物基因,或者来自T-DNA。所加入的3’末端序列可来自例如胭脂碱合酶或章鱼碱合酶基因,或者来自其他植物基因,或者较不优选地来自任何其他真核基因。
还可以加入如上文所示的内含子序列。
其它控制序列(除启动子、增强子、沉默子、内含子序列、3’UTR和/或5’UTR区之外)可以是蛋白质和/或RNA稳定元件。
如上文所述,调节(优选提高)CCA1样蛋白编码核酸之表达的优选方法是在植物中引入和表达编码CCA1样蛋白的核酸;然而也可使用其他熟知的技术实现本方法的效果,即增强产量相关性状。现将对这些技术中的一些进行描述。
一种这样的技术是本文定义的T-DNA激活标签化。还可以使用TILLING(基因组中靶向诱导的局部损伤)技术来再现本发明的效果,该技术如本文定义部分所定义。还可以使用同源重组来再现本发明的效果,该技术如本文定义部分所定义。
在本文中对增强的产量相关性状的提及意指植物的一个或多个部分的生物量(重量)增加,所述的部分可以包括地上(可收获)部分和/或地下(可收获)部分。
特别地,这些可收获部分为种子,并且实施本发明方法导致植物与适当对照植物的种子产量相比具有提高的种子产量。
术语“产量”和“种子产量”如本文所定义,术语“提高”、“改进”或“改善”也如本文所定义。
以玉米为例,产量增加可以表现为下列一种或多种指标:每公顷或英亩植物数的增加、每株植物穗数的增加、行数的增加、每行粒数、粒重、千粒重、玉米穗长度/直径、种子饱满率的增加(其中种子饱满率是饱满种子数除以种子总数并乘以100)及其它。以稻为例,产量增加本身可以表现为下列一种或多种指标的增加:每公顷或英亩植物数、每株植物圆锥花序数、每圆锥花序小穗数、每圆锥花序花(小花)数(其表达为饱满种子数对原圆锥花序数之比)、种子饱满率的增加(其中种子饱满率是饱满种子数除以种子总数并乘以100)、千粒重的增加及其它。
由于本发明的转基因植物具有增加的产量,因而相对于对照植物的生长速率,这些植物有可能在其生活周期中的对应阶段上表现增加的生长速率(在其生活周期的至少部分期间)。增加的生长速率可以对于植物的一个或多个部分(包括种子)是特异性的,或可以基本上遍及整株植物。具有增加的生长速率的植物可以具备较短的生活周期。植物的生活周期可以视为意指从干燥成熟种子成长至植物已经产生与起始材料相似的干燥成熟种子的阶段所需要的时间。这个生活周期可以受下列因素影响,如早期萌发势、生长速率、绿度指数、开花时间和种子成熟速度。生长速率的增加可以在植物生活周期中的一个或多个阶段上或在基本上整个植物生活周期期间发生。在植物生活周期中的早期期间增加的生长速率可以反映增强的萌发势。生长速率的增加可以改变植物的收获周期,允许植物较晚播种和/或较早收获,否则这将不可能(相似的作用可以用较早的开花时间获得)。若生长速率充分地增加,可以允许进一步播种相同植物物种的种子(例如播种并收获稻植物,随后播种并收获其它稻植物,全部稻植物均在一个常规生长时段内)。类似地,若生长速率足够地增加,可以允许进一步播种不同植物物种的种子(例如播种并收获玉米植物,随后例如播种并任选收获大豆、马铃薯或任何其它合适植物)。从相同的根茎中收获额外次数在一些作物植物的情况中也是可能的。改变植物的收获周期可以导致每英亩的年生物量产量的增加(因任何特定植物可以生长并收获的次数(如在一年中)增加)。生长速率的增加也可以允许比其野生型对应物在更广泛的地理区域内培育转基因植物,因为对培育作物的区域限制往往由栽种时节(旱季)或在收获时期(晚季)的不利环境条件所决定。若缩短收获周期,则可以避开这类不利条件。生长速率可以通过从生长曲线中得到多种参数而确定,此类参数可以是:T-Mid(植物达到其50%最大尺寸所花费的时间)和T-90(植物达到其90%最大尺寸所花费的时间),等等。
根据本发明的优选特征,本发明方法的实施产生相对于对照植物而具有增加的生长速率的植物。因而根据本发明,提供用于增加植物生长速率的方法,所述方法包括调节表达、优选增加本文中所定义的编码CCA1样蛋白质的核酸在植物中的表达。
与对照植物相比,无论植物处于非胁迫条件下还是植物暴露于多种胁迫下,都发生产量和/或生长速率的增加。植物一般通过生长得更慢而对暴露于胁迫作出应答。在严重胁迫条件下,植物甚至可以完全停止生长。另一方面,轻微胁迫在本文中定义为植物对其暴露的任何胁迫,其中所述的胁迫未导致植物完全停止生长而没有恢复生长的能力。与非胁迫条件下的对照植物相比,轻微胁迫在本发明意义中导致受胁迫植物生长降低小于40%、35%或30%,优选小于25%、20%或15%,更优选小于14%、13%、12%、11%或10%或更低。由于农业实践(灌溉、施肥、杀虫剂处理)上的进步,在栽培作物植物中并不经常遇到严重胁迫。因此,由轻微胁迫诱导的受损生长往往是农业上不希望的特征。轻微胁迫是植物暴露的常见生物性和/或非生物性(环境)胁迫。非生物胁迫可以因干旱或水涝、厌氧胁迫、盐胁迫、化学毒性、氧化胁迫和热、寒冷或冰冻温度所致。非生物胁迫可以是由水胁迫(尤其因为干旱)、盐胁迫、氧化胁迫或离子胁迫引起的渗透胁迫。生物胁迫一般是由病原体如细菌、病毒、真菌和昆虫引起的那些胁迫。
尤其,本发明的方法可以在非胁迫条件下或在轻微干旱条件下实施以产生相对于对照植物而具有增加的产量的植物。如在Wang等(Planta(2003)218:1-14)中报道,非生物胁迫导致不利地影响植物生长及生产力的一系列形态学变化、生理学变化、生物化学变化和分子变化。已知干旱、盐度、极端温度和氧化胁迫是相互联系的并可以通过相似机制而诱导生长损害及细胞损害。Rabbani等(Plant Physiol(2003)133:1755-1767)描述了干旱胁迫与高盐度胁迫间极高程度的“交叉”。例如,干旱和/或盐化作用主要表现为渗透胁迫,导致细胞内稳态和离子分布的破坏。经常伴随高温或低温、盐度或干旱胁迫的氧化胁迫可以造成功能性蛋白和结构蛋白变性。因此,这些多样的环境胁迫常常激活相似的细胞信号途径和细胞应答,如产生胁迫蛋白质、上调抗氧化物质、积累相容性溶质和生长抑制。如本文中所用的术语”非胁迫”条件是允许植物最佳生长的环境条件。本领域技术人员清楚对于给定地点的正常土壤条件和气候条件。
本发明方法的实施相对于在可比条件下培育的合适对照植物,赋予在非胁迫条件下或在轻微干旱条件下培育的植物增加的产量。因而根据本发明,提供用于在非胁迫条件下或在轻微干旱条件下培育的植物中增加产量的方法,所述方法包括增加编码CCA1样多肽的核酸在植物中表达。
在本发明优选的实施方案中,产量和/或生长速率的增加根据本发明方法在非胁迫条件下出现。
本发明方法可有利地用于植物中,术语“植物”如本文所定义。
根据本发明优选的实施方案,植物是作物植物。作物植物的实例包括大豆、向日葵、芸苔、苜蓿、油菜、棉花、番茄、马铃薯和烟草。还优选地,植物是单子叶植物。单子叶植物的实例包括甘蔗。更优选地,植物是谷物。谷物的实例包括稻、玉米、小麦、大麦、粟、黑麦、高粱和燕麦。
本发明也包括编码本文中所述CCA1样蛋白质的核酸的用途和这些CCA1样蛋白质的用途,用于增强植物中的产量相关性状。
编码本文中所述CCA1样蛋白质的核酸或CCA1样蛋白质本身可以用于育种程序中,其中鉴定到可以遗传地与编码CCA1样的基因连接的DNA标记。所述的核酸/基因或CCA1样蛋白质本身可以用来定义分子标记。这种DNA或蛋白质标记随后可以在育种程序中用来选择具有本发明方法中如上文所定义的增强的产量相关性状的植物。
编码CCA1样蛋白的核酸/基因的等位变体也可以用于标记辅助的育种程序中。这种育种程序有时需要通过使用例如EMS诱变法对植物作诱变处理而引入等位基因变异;备选地,该程序可以从非人为引起的所谓“自然”起源的一组等位变体开始。随后进行等位变体的鉴定,例如通过PCR法。此后是用于选择所讨论及导致增加产量的序列的优异等位变体的步骤。一般通过监测含有所讨论序列的不同等位变体的植物的生长性能而实施选择。可以在温室中或田间监测生长性能。其它任选步骤包括将鉴定了优异等位变体的植物与另一种植物杂交。这可以用来例如产生目标表型特征的组合。
编码CCA1样蛋白的核酸也可以用作探针以便对基因进行遗传作图或物理作图,所述探针作为所述基因的一部分及作为与这些基因关联的性状的标记。此类信息可以用于植物育种中,以便开发具有想要表型的株系。编码CCA1样蛋白的核酸的这种用途仅需要具有至少15个核苷酸长度的核酸序列。编码CCA1样蛋白的核酸可以用作限制性片段长度多态性(RFLP)标记。限制性消化的植物基因组DNA的Southern印迹(SambrookJ,Fritsch EF和Maniatis T(1989)Molecular Cloning,A LaboratoryManual)可以用编码CCA1样蛋白的核酸探测。产生的条带图式随后可以使用计算机程序如MapMaker(Lander等(1987)Genomics 1:174-181)进行遗传分析以构建遗传图。此外,该核酸可以用来探测含有经限制性内切核酸酶处理的一组个体的基因组DNA的Southern印迹,其中所述的一组个体代表具有确定的遗传杂交的亲代和后代。DNA多态性的分离被标出并用来计算编码CCA1样蛋白的核酸在使用这个群体先前所获得的遗传图中的位置(Botstein等(1980)Am.J.Hum.Genet.32:314-331)。
在Bernatzky和Tanksley(1986)Plant Mol.Biol.Reporter 4:37-41中描述了植物基因衍生的探针的产生和其在遗传作图中的用途。众多出版物描述了使用以上所提及的方法学或其改良方法对特定cDNA克隆的遗传作图。例如,F2互交群、回交群、随机交配群、邻近纯合系和其它个体群体可以用于作图。此类方法学是本领域技术人员众所周知的。
所述核酸探针也可以用于物理作图(即序列在物理图上的排列;见Hoheisel等在:Non-mammalian Genomic Analyasis:A Practical Guide,Academic press 1996,第319-346页及其中引用的参考文献)。
在另一实施方案中,核酸探针可以在直接荧光原位杂交(FISH)作图法(Trask(1991)Trends Genet.7:149-154)中使用。尽管当前的FISH作图法支持使用大型克隆(几个kb至几百个kb;见Laan等(1995)Genome Res.5:13-20),然而灵敏度的改善可以允许使用更短探针进行FISH作图。
用于遗传作图及物理作图的多种基于核酸扩增的方法可以使用所述核酸而实施。实例包括等位基因特异的扩增法(Kazazian(1989)J.Lab.Clin.Med 11:95-96)、PCR扩增片段的多态性(CAPS;Sheffield等(1993)Genomics 16:325-332)、等位基因特异性连接(Landegren等(1988)Science241:1077-1080)、核苷酸延伸反应(Sokolov(1990)Nucleic Acid Res.18:3671)、放射杂交作图(Walter等(1997)Nat.Genet.7:22-28)和Happy作图法(Dear和Cook(1989)Nucleic Acid Res.17:6795-6807)。对于这些方法,使用一种核酸的序列来设计并产生在扩增反应或在引物延伸反应中使用的引物对。此类引物的设计是本领域技术人员众所周知的。在使用基于PCR遗传作图的方法中,可能必须鉴定在对应于当前核酸序列的区域内作图交叉亲代间的DNA序列差异。然而,这对于作图法而言通常不是必需的。
本发明方法产生具有增强的产量相关性状的植物,如前文所述。这些性状也可以与经济有利的其它性状组合,如其它的产量增强性状、对其它非生物胁迫和生物胁迫的耐性、调节多种构造特征和/或生物化学特征和/或生理学特征的性状。
(iii)SAP
意想不到的是,现在发现调节植物中编码SAP样多肽的核酸的表达使植物具有相对于对照植物而言增强的产量相关性状。
根据第一个实施方案,本发明提供了在植物中相对于对照植物而增强产量相关性状的方法,包括调节植物中编码SAP样多肽的核酸的表达。
本发明还提供目前未知的SAP样编码核酸和SAP样多肽。这些序列也可用于实施本发明的方法。
因此根据本发明的另一实施方案,提供了分离的核酸分子,其包含:
(i)SEQ ID NO:212、SEQ ID NO:214、SEQ ID NO:216、SEQ IDNO:218、SEQ ID NO:220、SEQ ID NO:222、SEQ ID NO:224和SEQ IDNO:226所示核酸;
(ii)(i)所示任一SEQ ID NO的互补序列;
(iii)编码SAP样多肽的核酸,其与SEQ ID NO:213、SEQ ID NO:215和SEQ ID NO:217、SEQ ID NO:219、SEQ ID NO:221、SEQ ID NO:223、SEQ ID NO:225和SEQ ID NO:227中任一氨基酸序列具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%(优选程度逐渐提高)的序列同一性;
(iv)能在严格杂交条件下与上述(i)、(ii)或(iii)中任一核酸杂交的核酸。
根据本发明的另一实施方案,还提供了分离的多肽,其包含:
(i)SEQ ID NO:213、SEQ ID NO:215和SEQ ID NO:217、SEQ IDNO:219、SEQ ID NO:221、SEQ ID NO:223、SEQ ID NO:225和SEQ IDNO:227中任一项所示氨基酸序列;
(ii)与SEQ ID NO:213、SEQ ID NO:215和SEQ ID NO:217、SEQID NO:219、SEQ ID NO:221、SEQ ID NO:223、SEQ ID NO:225和SEQID NO:227中任一氨基酸序列具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%(优选程度逐渐提高)序列同一性的氨基酸序列;
(iii)上文(i)或(ii)中任一氨基酸序列的衍生物。
调节(优选提高)编码SAP样多肽的核酸的表达的优选方法是在植物中引入并表达编码SAP样多肽的核酸。
下文中对“可用于本发明方法的蛋白质”的任何提及均指本文定义的SAP样多肽。下文中对“可用于本发明方法的核酸”的任何提及均指能够编码这些SAP样多肽的核酸。待引入植物(因此可用于实施本发明方法)的核酸是编码现将描述的蛋白质类型的任何核酸,下文也称为“SAP样核酸”或“SAP样基因”。
本文定义的“SAP样多肽”指包含以下SAP结构域的任何多肽:
(i)基序1(SEQ ID NO:240):
XLSSLKVXELRELAKSRGIKGYSKMKKXELVELLS,其中X为任何氨基酸;或者
(ii)与基序1具有至少60%、65%、70%、75%、80%、85%、90%或95%或更高(优选程度逐渐提高)序列同一性的基序;或者
(iii)与下述基序1具有至少60%、65%、70%、75%、80%、85%、95%或100%(优选程度逐渐提高)序列同一性的基序,所述基序1如其在SEQ ID NO:211中所显现的:
DLSTLKVTELRELAKSRGIKGYSKMKKNDLVELLS(SEQ ID NO:243)
SAP样多肽还可包含:
(i)基序2(SEQ ID NO:241):
EKxEIVELFKKVQxxLRxRAxxKxExKxxxExAKAQxxxExxTVDSLLxLLRKHSxDQxKK,
其中X为任何氨基酸;或者
(ii)与基序2具有至少60%、65%、70%、75%、80%、85%、90%或95%或更高(优选程度逐渐提高)序列同一性的基序;或者
(iii)与下述基序2具有至少60%、65%、70%、75%、80%、85%、90%、95%或100%(优选程度逐渐提高)序列同一性的基序,所述基序2如其在SEQ ID NO:211中所显现的:
EKEIVELFKRVQAQLRARGKGKEEKKPEQAKAQGERGSVDSLLNLLRKHSVDQR
RK(SEQ ID NO:244);和/或
(iv)基序3(SEQ ID NO:242):RPxSxFxRRSPVP,其中X为任何氨基酸;或者
(v)与基序3具有至少60%、65%、70%、75%、80%、85%、90%、95%或更高(优选程度逐渐提高)序列同一性的基序;或者
(vi)与下述基序3具有至少60%、65%、70%、75%、80%、85%、90%、95%或100%(优选程度逐渐提高)序列同一性的基序,所述基序3如其在SEQ ID NO:211中所显现的:RPASNFRRRSPVP(SEQ ID NO:245)。
术语“结构域”和“基序“在本文“定义”章节中定义。存在用于鉴定结构域的专门数据库,例如SMART(Schultz等(1998)Proc.Natl.Acad.Sci.USA 95,5857-5864;Letunic等(2002)Nucleic Acids Res 30,242-244,InterPro(Mulder等,(2003)Nucl.Acids.Res.31,315-318;Prosite(Bucher和Bairoch(1994),A generalized profile syntax for biomolecular sequencesmotifs and its function in automatic sequence interpretation.(In)ISMB-94;Proceedings 2nd International Conference on Intelligent Systems forMolecular Biology.Altman R.,Brutlag D.,Karp P.,Lathrop R.,Searls D.,编著,53-61页,AAAIPress,Menlo Park;Hulo等,Nucl.Acids.Res.32:D134-D137,(2004)或者Pfam(Bateman等,Nucleic Acids Research 30(1):276-280(2002)。用于计算机分析蛋白质序列的一组工具在ExPASY蛋白组服务器(由Swiss Institute of Bioinformatics(Gasteiger等,ExPASy:theproteomics server for in-depth protein knowledge and analysis,NucleicAcids Res.31:3784-3788(2003)提供)提供。还可以使用常规技术(如序列比对)来鉴定结构域。
比对序列以进行比较的方法为本领域所熟知,这些方法包括GAP、BE STFIT、BLAST、FASTA和TFASTA。GAP利用Needleman和Wunsch((1970)J Mol Biol 48:443-453)的算法来寻找两序列间使匹配数最高并使空位数最少的全局比对(即在完整序列上)。BLAST算法(Altschul等(1990)J Mol Biol 215:403-10)在两序列间计算百分比序列同一性并进行相似性的统计学分析。用于进行BLAST分析的软件在国际生物技术信息中心(National Centre for Biotechnology Information(NCBI))向公众提供。可以使用如默认配对比对参数的ClustalW多重序列比对算法(1.83版)和百分比评分法来容易地鉴定同源物。也可以使用MatGAT软件包(Campanella等,BMC Bioinformatics.2003Jul 10;4:29.MatGAT:anapplication that generates similarity/identity matrices using protein orDNA sequences)中提供的一种方法确定全局的相似性和同一性百分比。本领域技术人员会意识到,可以进行少量手动编辑以优化保守性基序之间的比对。此外,还可以使用特定的结构域代替全长序列来鉴定同源物。序列同一性值(在下文的实施例部分中以百分比表示)是使用默认参数的上述程序在完整的核酸或氨基酸序列上和/或在所选择的结构域或保守的基序测定的。
此外,SAP样多肽(至少在其天然形式下)一般具有DNA结合活性。用于测量DNA结合活性的工具和技术为本领域所熟知;一个这样的实例提供于本文的实施例部分。
本发明以SEQ ID NO:210所示的核酸序列转化植物来进行举例说明,其编码多肽序列SEQ ID NO:211。然而,本发明的实施并不局限于这些序列;本发明的方法可以有利地利用本文所定义的任何SAP样编码核酸或SAP样多肽来实施。
编码SAP样多肽的核酸的实例在本文实施例表C1中给出。这样的核酸可用于实施本发明的方法。表C1中给出的氨基酸序列为SEQ ID NO:211所示SAP样多肽的直向同源物和旁系同源物的示例序列,其中术语“直向同源物”和“旁系同源物”如本文所定义。可以通过进行所谓的交互BLAST检索容易地找到更多直向同源物和旁系同源物。通常,这包括以查询序列(例如,利用表C1中所列的任一序列)针对任何序列数据库如可公共获得的NCBI数据库进行BLAST的一次BLAST。当从核苷酸序列开始时,通常使用BLASTN或TBLASTX(利用标准默认值),而当从蛋白质序列开始时,则使用BLASTP或TBLASTN(利用标准默认值)。BLAST结果可以任选地过滤。接着使用过滤的结果或者未过滤的结果中的全长序列针对查询序列来源生物的序列进行反向BLAST(二次BLAST)(在查询序列为SEQ ID NO:210或SEQ ID NO:211的情况下,二次BLAST将会针对稻序列)。然后比较一次和二次BLAST的结果。如果一次BLAST中的高排名命中来自查询序列源自的相同物种,然后反向BLAST理想地导致查询序列处于最高命中之列,则找到了旁系同源物;如果一次BLAST中高排名命中不来自查询序列源自的相同物种,且优选地在反向BLAST时导致查询序列在最高命中中,则找到了直向同源物。
高排名的命中是E值低的命中。E值越低,分值越具有显著性(或者换句话说,偶然发现此命中的几率越低)。E值的计算是本领域众所周知的。除了E值之外,还对比较进行同一性百分比评分。同一性百分比是指两比较核酸(或多肽)序列之间在特定长度上的相同核苷酸(或氨基酸)数。在大家族的情况下可以使用ClustalW,继之以邻接树来辅助相关基因的聚类可视化,和鉴定直向同源物和旁系同源物。
核酸变体也可用于实施本发明的方法。这类核酸变体的实例包括编码表C1中所示任一氨基酸序列的同源物和衍生物的核酸,其中术语“同源物”和“衍生物”如本文所定义。同样可用于本发明方法的有编码表C1所示任一氨基酸序列的直向同源物或旁系同源物的同源物和衍生物的核酸。可用于本发明方法的同源物和衍生物与其源自的未修饰蛋白质具有基本上相同的生物活性和功能活性。
可用于实施本发明方法的其他核酸变体包括SAP样多肽编码核酸的部分、与SAP样多肽编码核酸杂交的核酸、SAP样多肽编码核酸的剪接变体、SAP样多肽编码核酸的等位变体,以及通过基因改组获得的SAP样多肽编码核酸的变体。术语杂交序列、剪接变体、等位变体和基因改组如本文所述。
编码SAP样多肽的核酸无需是全长核酸,因为本发明方法的实施不依赖于全长核酸序列的使用。根据本发明,提供了增强植物产量相关性状的方法,包括在植物中引入和表达本文实施例部分表C1所示任一核酸序列的部分、或者编码表C1所示任一氨基酸序列的直向同源物、旁系同源物或同源物的核酸的部分。
例如,可以通过对核酸进行一个或多个缺失来制备所述核酸的“部分”。“部分”可以以分离的形式使用,或者可将其与其他编码(或非编码)序列融合,以便例如,产生组合了若干活性的蛋白质。当与其他编码序列融合时,经翻译后所产生的多肽可能比针对该蛋白质部分所预测到的要大。
可用于本发明方法的“部分”编码如本文所定义的SAP样多肽,并与表C1所示氨基酸序列具有基本上相同的生物活性。优选“部分”是表C1所示任一核酸的部分,或是编码表C1所示任一氨基酸序列的直向同源物或旁系同源物的核酸的部分。为了实施本发明的方法,该部分仅需编码本文定义的SAP结构域,即编码:
(a)基序1(SEQ ID NO:240):
XLSSLKVXELRELAKSRGIKGYSKMKKXELVELLS,其中X为任何氨基酸;或者
(b)与基序1具有至少60%、65%、70%、75%、80%、85%、90%或95%或更高(优选程度逐渐提高)序列同一性的基序;或者
(c)与下述基序1具有至少60%、65%、70%、75%、80%、85%、90%、95%或100%(优选程度逐渐提高)序列同一性的基序,所述基序1如其在SEQ ID NO:211中所显现的:
DLSTLKVTELRELAKSRGIKGYSKMKKNDLVELLS(SEQ ID NO:243)。
因此该部分仅需长约100个连续核苷酸,只要这100个连续核苷酸编码本文定义的SAP结构域即可。优选地,该部分编码包含本文所定义SAP结构域以及本文所定义基序2和基序3的多肽。优选地,该部分长为至少200、300、400、500、600、700、800、900、1000、1100(优选程度逐渐提高)个连续核苷酸,所述连续核苷酸是表C1所示任一核酸序列或者编码表C1所示任一氨基酸序列的直向同源物或旁系同源物的核酸。最优选“部分”是核酸SEQ ID NO:210的部分。优选“部分”编码包含本文所定义的任何一个或多个结构域的氨基酸序列。优选“部分”编码这样的氨基酸序列,当例如利用其构建系统发生树(如图10所示)时,其倾向于与包含SEQ ID NO:211所示氨基酸序列的SAP样多肽的群而非任何其他群聚类。
可用于本发明方法的另一核酸变体是能在降低的严格条件下(优选在严格条件下)与编码本文所定义SAP样多肽的核酸或本文所定义的部分杂交的核酸。
根据本发明,提供了增强植物产量相关性状的方法,包括在植物中引入和表达能够与表C1所示任一核酸杂交的核酸,或者包括在植物中引入和表达能够与编码表C1所示任一核酸序列的直向同源物、旁系同源物或同源物的核酸杂交的核酸。
可用于本发明方法的杂交序列编码如本文所定义的SAP样多肽,并与表C1所示氨基酸序列具有基本上相同的生物活性。优选杂交序列能够与表C1所示任一核酸杂交、或与任一前述序列的部分杂交,其中部分如上文所定义;或者其中杂交序列能够与编码表C1所示任一氨基酸序列的直向同源物或旁系同源物的核酸杂交。最优选杂交序列能够与SEQ ID NO:210所示的核酸或其部分杂交。优选杂交序列编码包含任何一个或多个本文所定义基序或结构域的氨基酸序列。为了实施本发明的方法,杂交序列仅需编码本文所定义的SAP结构域,即编码:
(a)基序1(SEQ ID NO:240):
XLSSLKVXELRELAKSRGIKGYSKMKKXELVELLS,其中X为任何氨基酸;或者
(b)与基序1具有至少60%、65%、70%、75%、80%、85%、90%或95%或更高(优选程度逐渐提高)序列同一性的基序;或者
(c)与下述基序1具有至少60%、65%、70%、75%、80%、85%、90%、95%或100%(优选程度逐渐提高)序列同一性的基序,所述基序1如其在SEQ ID NO:211中所显现的:
DLSTLKVTELRELAKSRGIKGYSKMKKNDLVELLS(SEQ ID NO:243)。
优选地,杂交序列编码这样的氨基酸序列,当如图10所示利用其构建VPE系统发生树时,其倾向于与包含SEQ ID NO:211所示氨基酸序列的SAP样多肽的群而非任何其他群聚类。
可用于本发明方法的另一核酸变体是编码本文所定义SAP样多肽的剪接变体,剪接变体如本文所定义。
根据本发明,提供了增强植物产量相关性状的方法,包括在植物中引入和表达表C1所示任一核酸序列的剪接变体,或者编码表C1所示任一氨基酸序列的直向同源物、旁系同源物或同源物的核酸的剪接变体。
优选的剪接变体是SEQ ID NO:210所示核酸的剪接变体,或编码SEQID NO:211的直向同源物或旁系同源物的核酸的剪接变体。优选剪接变体所编码的氨基酸序列包含任何一个或多个本文所定义的基序或结构域。为了实施本发明的方法,剪接变体仅需编码本文所定义的SAP结构域。优选剪接变体所编码的氨基酸序列当例如在如图10所示用于构建系统发生树时,其倾向于与包含SEQ ID NO:211所示氨基酸序列的SAP样多肽的群而非任何其他群聚类。
可用于实施本发明方法的另一核酸变体为前文所定义的SAP样多肽编码核酸的等位变体,其中等位变体如本文所定义。
根据本发明,提供了增强植物产量相关性状的方法,包括在植物中引入和表达表C1所示任一核酸的等位变体,或者包括在植物中引入和表达编码表C1所示任一氨基酸序列的直向同源物、旁系同源物或同源物的核酸的等位变体。
可用于本发明方法的等位变体与SEQ ID NO:211的SAP样多肽及表C1所示的任一氨基酸序列具有基本上相同的生物活性。等位变体天然存在,并且这些天然等位基因的用途包含于本发明的方法中。优选等位变体为SEQ ID NO:210的等位变体,或编码SEQ ID NO:211的直向同源物或旁系同源物的核酸的等位变体。优选等位变体所编码的氨基酸序列包含任何一个或多个本文所定义的基序或结构域。为了实施本发明的方法,等位变体仅需编码本文所定义的SAP结构域。优选等位变体所编码的氨基酸序列当在例如如图10所示用于构建系统发生树时,其倾向于与包含SEQ ID NO:211所示氨基酸序列的SAP样多肽的群而非任何其他群聚类。
基因改组或定向进化也可用于产生上文所定义的SAP样多肽编码核酸的变体;其中术语“基因改组”如本文所定义。
根据本发明,提供了增强植物产量相关性状的方法,包括在植物中引入和表达表C1所示任一核酸序列的变体,或者包括在植物中引入和表达编码表C1给出的任一氨基酸序列的直向同源物、旁系同源物或同源物的核酸的变体,其中所述变体核酸通过基因改组获得。
优选通过基因改组获得的变体核酸编码包含任何一个或多个本文所定义基序或结构域的氨基酸序列。为了实施本发明的方法,变体核酸仅需编码本文所定义的SAP结构域。优选通过基因改组获得的变体核酸所编码的氨基酸序列在如图10所示构建系统发生树时,其倾向于与包含SEQ ID NO:211所示氨基酸序列的SAP样多肽的群而非任何其他群聚类。
另外,核酸变体也可以通过位点定向诱变获得。几种方法可用于实现位点定向诱变,最常见的是基于PCR的方法(Current Protocols inMolecular Biology.Wiley编辑)。
编码SAP样多肽的核酸可以衍生自任何天然来源或人工来源。核酸可以根据其天然形式就组成和/或基因组环境方面通过人类有意操作而加以修饰。优选地,编码SAP样多肽的核酸来自植物,还优选来自单子叶植物,更优选来自禾本科(poaceae)、该核酸最优选地来自稻。
本发明方法的实施产生具有增强的产量相关性状的植物。尤其本发明方法的实施产生相对于对照植物而具有增加的产量、尤其增加的种子产量的植物。在本文中的“定义”部分中更详细地描述了术语“产量”和“种子产量”。
在本文中对增强的产量相关性状的提及意指植物的一个或多个部分的生物量(重量)增加,所述的部分可以包括地上(可收获)部分和/或地下(可收获)部分。尤其,此类可收获部分是种子,并且本发明方法的实施产生相对于合适的对照植物的种子产量具有增加的种子产量的植物。
以玉米为例,产量增加可以表现为下列一种或多种指标:每公顷或英亩中已建立植物数的增加、每株植物穗数的增加、行数的增加、每行粒数、粒重、千粒重、玉米穗长度/直径、种子饱满率的增加(其中种子饱满率是饱满种子数除以种子总数并乘以100)及其它。以稻为例,产量增加本身可以表现为下列一种或多种指标的增加:每公顷或英亩植物数、每株植物圆锥花序数、每圆锥花序小穗数、每圆锥花序花(小花)数(其表达为饱满种子数对原圆锥花序数之比)、种子饱满率的增加(其中种子饱满率是饱满种子数除以种子总数并乘以100)、千粒重的增加及其它。
本发明提供了增加植物相对于对照植物的产量、特别是种子产量的方法,所述方法包括调节植物中本文所定义的SAP样多肽编码核酸的表达(优选提高表达)。
由于本发明的转基因植物具有增加的产量,因而相对于对照植物的生长速率,这些植物有可能在其生活周期中的对应阶段上表现增加的生长速率(在其生活周期的至少部分期间)。
增加的生长速率可以对于植物的一个或多个部分(包括种子)是特异性的,或可以基本上遍及整株植物。具有增加的生长速率的植物可以具备较短的生活周期。植物的生活周期可以视为意指从干燥成熟种子成长至植物已经产生与起始材料相似的干燥成熟种子的阶段所需要的时间。这个生活周期可以受下列因素影响,如早期萌发势、生长速率、绿度指数、开花时间和种子成熟速度。生长速率的增加可以在植物生活周期中的一个或多个阶段上或在基本上整个植物生活周期期间发生。在植物生活周期中的早期期间增加的生长速率可以反映增强的萌发势。生长速率的增加可以改变植物的收获周期,允许植物较晚播种和/或较早收获,否则这将不可能(相似的作用可以用较早的开花时间获得)。若生长速率充分地增加,可以允许进一步播种相同植物物种的种子(例如播种并收获稻植物,随后播种并收获其它稻植物,全部稻植物均在一个常规生长时段内)。类似地,若生长速率足够地增加,可以允许进一步播种不同植物物种的种子(例如播种并收获玉米植物,随后例如播种并任选收获大豆、马铃薯或任何其它合适植物)。从相同的根茎中收获额外次数在一些作物植物的情况中也是可能的。改变植物的收获周期可以导致每英亩的年生物量产量的增加(因任何特定植物可以生长并收获的次数(如在一年中)增加)。生长速率的增加也可以允许比其野生型对应物在更广泛的地理区域内培育转基因植物,因为对培育作物的区域限制往往由栽种时节(早季)或在收获时期(晚季)的不利环境条件所决定。若缩短收获周期,则可以避开这类不利条件。生长速率可以通过从生长曲线中得到多种参数而确定,此类参数可以是:T-Mid(植物达到其50%最大尺寸所花费的时间)和T-90(植物达到其90%最大尺寸所花费的时间),等等。
根据本发明的优选特征,本发明方法的实施产生相对于对照植物而具有增加的生长速率的植物。因而根据本发明,提供增加植物生长速率的方法,所述方法包括调节表达、优选增加本文中所定义的编码SAP样多肽的核酸在植物中的表达。
与对照植物相比,无论植物处于非胁迫条件下还是植物暴露于多种胁迫下,都发生产量和/或生长速率的增加。植物一般通过生长得更慢而对暴露于胁迫作出应答。在严重胁迫条件下,植物甚至可以完全停止生长。另一方面,轻微胁迫在本文中定义为植物对其暴露的任何胁迫,其中所述的胁迫未导致植物完全停止生长而没有恢复生长的能力。与非胁迫条件下的对照植物相比,轻微胁迫在本发明意义中导致受胁迫植物生长降低小于40%、35%或30%,优选小于25%、20%或15%,更优选小于14%、13%、12%、11%或10%或更低。由于农业实践(灌溉、施肥、杀虫剂处理)上的进步,在栽培作物植物中并不经常遇到严重胁迫。因此,由轻微胁迫诱导的受损生长往往是农业上不希望的特征。轻微胁迫是植物暴露的常见生物性和/或非生物性(环境)胁迫。非生物胁迫可以因干旱或水涝、厌氧胁迫、盐胁迫、化学毒性、氧化胁迫和热、寒冷或冰冻温度所致。非生物胁迫可以是由水胁迫(尤其因为干旱)、盐胁迫、氧化胁迫或离子胁迫引起的渗透胁迫。生物胁迫一般是由病原体如细菌、病毒、真菌和昆虫引起的那些胁迫。
尤其,本发明的方法可以在非胁迫条件下或在轻微干旱条件下实施以产生相对于对照植物而具有增加的产量的植物。如在Wang等(Planta(2003)218:1-14)中报道,非生物胁迫导致不利地影响植物生长及生产力的一系列形态学变化、生理学变化、生物化学变化和分子变化。已知干旱、盐度、极端温度和氧化胁迫是相互联系的并可以通过相似机制而诱导生长损害及细胞损害。Rabbani等(Plant Physiol(2003)133:1755-1767)描述了干旱胁迫与高盐度胁迫间极高程度的“交叉(cross talk)”。例如,干旱和/或盐化作用主要表现为渗透胁迫,导致细胞内稳态和离子分布的破坏。经常伴随高温或低温、盐度或干旱胁迫的氧化胁迫可以造成功能性蛋白和结构蛋白变性。因此,这些多样的环境胁迫常常激活相似的细胞信号途径和细胞应答,如产生胁迫蛋白质、上调抗氧化物质、积累相容性溶质和生长抑制。如本文中所用的术语“非胁迫”条件是允许植物最佳生长的环境条件。本领域技术人员清楚对于给定地点的正常土壤条件和气候条件。
本发明方法的实施相对于在可比条件下培育的合适对照植物,赋予在非胁迫条件下或在轻微干旱条件下培育的植物增加的产量。因而根据本发明,提供用于在非胁迫条件下或在轻微干旱条件下培育的植物中增加产量的方法,所述方法包括增加编码SAP样多肽的核酸在植物中表达。
本发明包括可由根据本发明的方法获得的植物或其部分(包括种子)。所述植物或其部分含有编码如上文所定义的SAP样多肽的核酸转基因。
本发明还提供遗传构建体和载体,以利于在植物中引入和/或表达SAP样多肽编码核酸。可以将基因构建体插入适于转化进入植物并适于在转化的细胞中表达目的基因的载体中,该载体可以是可商购的载体。本发明还提供了如本文所定义的基因构建体在本发明方法中的用途。
更具体地,本发明提供这样的构建体,其含有:
(a)编码如上文所定义的SAP样多肽的核酸;
(b)一个或多个能够驱动(a)中核酸序列表达的控制序列;和任选的
(c)转录终止序列。
术语“控制序列”和“终止序列”如本文所定义。
可以使用含有任何上述核酸的载体转化植物。技术人员充分知晓载体中必须存在的遗传元件,以便成功进行转化、选择并繁殖含目的序列的宿主细胞。将目的序列有效连接于一个或多个控制序列(至少连接于启动子)。
有利地,任何类型的启动子均可用于驱动核酸序列的表达。组成型启动子在所述方法中作为组织特异性启动子特别有用。特别地,所述组织特异性启动子是根特异性启动子或年幼绿色组织特异性启动子。多种启动子类型的定义参见本文的“定义”部分。应该明白,本发明的适用范围不仅限于由SEQ ID NO:210所示的SAP样多肽编码核酸,本发明的适用范围也不仅限于表达由组成型启动子、根特异性启动子或年幼绿色组织特异性启动子驱动时SAP样多肽编码核酸。
年幼绿色组织特异性启动子优选为原叶绿素酸酯还原酶(PcR)启动子。也可以用于驱动SAP样编码核酸表达的其他年幼绿色组织特异性启动子的实例示于本文“定义”部分的表6。组成型启动子优选为GOS2启动子,优选为来自稻的GOS2启动子。组成型启动子的其他实例见本文“定义”部分的表6。根特异性启动子优选为RCC3启动子,优选RCC3启动子(PlantMol Biol.1995Jan;27(2):237-48),更优选来自稻的RCC3启动子,还优选与SEQ ID NO:246基本相似的核酸序列所代表的启动子,更优选启动子如SEQ ID NO:246所示。根特异性启动子的其他实例见“定义”部分。
为了鉴定功能等价启动子,可以分析候选启动子的启动子强度和/或表达模式,例如通过将该启动子与报告基因有效连接并测定该报告基因在多种植物组织中的表达水平和模式。合适的熟知报告基因包括如β-葡糖醛酸糖苷酶或β-半乳糖苷酶。通过测量β-葡糖醛酸糖苷酶或β-半乳糖苷酶的酶活性来测定启动子活性。接着可以将启动子强度和/或表达模式与参考启动子(例如用于本发明方法中的)进行比较。或者,可以通过定量mRNA水平或者将本发明方法中所用核酸的mRNA水平与持家基因(如18SrRNA)mRNA水平进行比较来测定启动子强度,其中使用本领域熟知的技术,通过放射自显影的光密度测定分析进行的Northern印迹、定量实时PCR或RT-PCR(Heid等,1996Genome Methods 6:986-994)。通常,“弱启动子”指驱动编码序列低水平表达的启动子。“低水平”指每个细胞中约1/10,000的转录物至约1/100,000的转录物至约1/500,0000的转录物的水平。相反,“强启动子”驱动编码序列高水平表达,或者每个细胞中约1/10的转录物至约1/100的转录物至约1/1000的转录物的水平。
任选地,可在引入植物的构建体中使用一个或多个终止子序列。其他调节元件可包括转录及翻译增强子。本领域技术人员会了解适于实施本发明的终止子和增强子序列。这些序列是已知的,或者可由本领域技术人员容易地获得。
也可将内含子序列添加至5′非翻译区(UTR)或编码序列上,以增加在细胞溶胶内积累的成熟信息的量。已经证实可剪接内含子在植物表达构建体和动物表达构建体中转录单位内的包含在mRNA水平及蛋白质水平上增加基因表达至多达1000倍(Buchman和Berg(1988)Mol.Cell biol.8:4395-4405;Callis等(1987)Gens Dev 1:1183-1200)。基因表达的此类内含子增强作用一般在位于转录单元5′端附近时最强烈。使用玉米内含子Adh1-S内含子1、2和6、Bronze-1内含子是本领域已知的。对于一般信息,见:The Maize Handbook,第116章,Freeling和Walbot编辑,Springer,N.Y.(1994)。
其它控制序列(除启动子、增强子、沉默子、内含子序列、3’UTR和/或5’UTR区之外)可以是蛋白质和/或RNA稳定元件。本领域技术人员会知道或可以容易地获得此类序列。
本发明的遗传构建体还可以包括需要用于在特定细胞类型中维持和/或复制的复制起点序列。一个实例是当需要将遗传构建体在细菌细胞中维持为附加型遗传元件(例如质粒或粘粒分子)时。优选的复制起点包括但不限于f1-ori和colE1。
为检测如在本发明方法中所用核酸序列的成功转移和/或选择包含这些核酸的转基因植物,使用标记基因(或报告基因)是有利的。因而,遗传构建体可以任选地包含选择标记基因。选择标记在本文“定义”部分中有更详细的描述。
已知当核酸稳定或瞬时整合至植物细胞时,仅小部分的细胞摄取外来DNA并且根据需要将其整合至细胞基因组,这取决于所用表达载体和使用的转染技术。为鉴定并选择这些整合子,通常将编码选择标记(如上文所述之一)的基因连同目的基因一起引入宿主细胞。这些标记可以在其中这些基因因例如常规方法所致的缺失而无功能的突变体中使用。此外,编码选择标记的核酸分子可以引入宿主细胞中,与在包含编码本发明多肽或本发明方法中所用多肽的序列在同一载体上,或在单独的载体上。已经用引入的核酸稳定转染的细胞可以通过选择进行鉴定(例如具有整合的选择标记的细胞存活而其它细胞死亡)。
因为一旦已经成功引入了核酸,则转基因宿主细胞中就不再需要或不希望有标记基因,尤其抗生素抗性基因和除草剂抗性基因,因此用于引入核酸的本发明方法有利地使用能够去掉或切除这些标记基因的技术。一种如此方法称作共转化法。共转化法使用同时用于转化的两种载体,一种载体携带本发明的核酸而另一种载体携带标记基因。高比例的转化体接受,或在植物的情况下,包含(高达40%或更多的转化体)这两种载体。在用农杆菌转化的情况下,转化体通常仅接受载体的一部分,即侧翼有T-DNA的序列,它通常代表表达盒。标记基因随后可以通过进行杂交而从转化的植物中去掉。在另一种方法中,整合至转座子的标记基因用来与想要的核酸一起进行转化(称作Ac/Ds技术)。转化体可以与转座酶来源植物杂交或转化体用导致转座酶表达的核酸构建体瞬时或稳定地转化。在一些情况下(大约10%),转座子在已经成功发生转化时跳出宿主细胞的基因组并丢失。在其它更多情况下,转座子跳至不同位置。在这些情况下,标记基因必须通过进行杂交而去除。在微生物学中,开发了实现或促进检测这类事件的技术。又一个有利的方法依赖于重组系统;此方法的优势在于不必通过杂交去除。该类型的最知名系统称作Cre/lox系统。Cre1是去掉位于loxP序列之间序列的重组酶。若标记基因整合于loxP序列之间,则通过重组酶表达已经成功发生转化时,标记基因被去除。其它重组系统是HIN/HIX、FLP/FRT和REP/STB系统(Tribble等,J.Biol.Chem.,275,2000:22255-22267;Velmurugan等,J.Cell Biol.,149,2000:553-566)。有可能将本发明核酸序列以位点特异性方式整合至植物基因组。这些方法自然也可以应用至微生物如酵母、真菌或细菌。
本发明还提供产生与对照植物相比具有增强的产量相关性状的转基因植物的方法,其包括在植物中引入和表达编码上文所定义SAP样多肽的任何核酸。
更具体地,本发明提供了产生具有提高的产量的转基因植物的方法,所述方法包括:
(i)向植物或植物细胞中引入和表达SAP样多肽编码核酸;和
(ii)在促进植物生长和发育的条件下培养植物细胞。
可以将核酸直接引入植物细胞或植物本身(包括引入组织、器官或植物的任何其它部分)。根据本发明优选的方面,优选通过转化将核酸引入植物。术语“转化”在本文“定义”部分有更详细的说明。
遗传修饰的植物细胞能够通过技术人员熟悉的所有方法再生。合适的方法可见于上述S.D.Kung和R.Wu、Potrykus或者和Willmitzer的出版物。
通常在转化以后,选出存在一个或多个标记的植物细胞或细胞群,所述标记由与目的基因共转移的植物可表达基因编码,继之将转化的材料再生成整个植物。为选择转化的植物,通常将在转化过程中获得的植物材料置于选择性条件下,从而可将转化的植物与非转化植物区分开来。例如,可以种植以上述方式获得的种子,并在最初的生长期之后,通过喷雾对其进行合适的选择。另一可能方案是使用合适的选择剂,将种子(适当时在灭菌之后)种在琼脂板上,从而仅转化的种子能够长成植物。可选地,针对转化的植物筛选可选择标记如上文所述标记的存在。
DNA转移和再生之后,还可评价推定转化的植物,例如用Southern分析(DNA印迹),评价目的基因的存在、拷贝数和/或基因组构造。备选地或额外地,可用Northern和/或Western分析监测新引入的DNA的表达水平,这两种技术都是本领域普通技术人员所熟知的。
产生的转化植物可以通过多种方式繁殖,如通过克隆繁殖或经典的育种技术。例如,第一代(或T1)转化的植物可自交,选择纯合的第二代(或T2)转化体,而T2植物可进一步通过经典育种技术繁殖。
产生的转化生物体可以有多种形式。例如,它们可以是转化细胞和非转化细胞的嵌合体;克隆的转化体(例如所有细胞经转化含有表达盒);转化和非转化组织的嫁接体(例如在植物中,转化的根状茎嫁接到非转化的接穗上)。
本发明显然延及由本文所述任何方法产生的任何植物细胞或植物,以及所有的植物部分及其繁殖体。本发明还延及由任何上述方法产生的原代转化或转染的细胞、组织、器官或整个植物的后代,唯一的要求是所述后代呈现出与在本发明方法中亲本产生的相同的基因型和/或表型特征。
本发明也包括含有分离的编码上文所定义的SAP样多肽的核酸的宿主细胞。根据本发明优选的宿主细胞是植物细胞。对于用于本发明方法的核酸或载体、表达盒或构建体或载体,其宿主植物原则上有利地为能够合成在本发明方法中使用的多肽的所有植物。
本发明方法有利地适用于任何植物。
特别用于本发明方法中的植物包括属于植物界超家族的全部植物,尤其单子叶植物和双子叶植物,包括饲用或饲料豆类、观赏植物、粮食作物、树或灌木。根据本发明优选的实施方案,植物是作物植物。作物植物的实例包括大豆、向日葵、芸苔、苜蓿、油菜、棉花、番茄、马铃薯和烟草。还优选地,植物是单子叶植物。单子叶植物的实例包括甘蔗。更优选地,植物是谷物。谷物的实例包括稻、玉米、小麦、大麦、粟、黑麦、高粱和燕麦。
本发明也扩展至植物的可收获部分如,但不限于种子、叶、果实、花、茎、根茎、块茎和球茎。本发明进一步涉及来自、优选直接来自这种植物的可收获部分中的产物,如干燥颗粒或粉末、油、脂肪及脂肪酸、淀粉或蛋白质。
根据本发明的一个优选的特征,调节的表达是提高的表达。用于提高核酸或基因或基因产物之表达的方法均已详细记载于本领域中,包括如通过适当的启动子驱动过表达,使用转录增强子或翻译增强子。作为启动子或增强子元件的分离的核酸可在非异源形式多核苷酸中的适当位置(一般为上游)引入,以上调表达。例如,可以通过突变、缺失和/或替换在体内改变内源启动子(参阅Kmiec,美国专利No.5,565,350;Zarling等,PCT/US93/03868),或者可将分离的启动子以正确的方向和与本发明基因的距离引入植物细胞中,以控制基因表达。
如果期望表达多肽,一般期望在多核苷酸编码区的3’末端包含多腺苷酸化区。多腺苷酸化区可来自该天然基因,来自多种其他植物基因,或者来自T-DNA。待被加入的3’末端序列可来自例如胭脂碱合酶或章鱼碱合酶基因,或者来自其他植物基因,或者较不优选地来自任何其他真核基因。
如上文所述,调节(优选提高)SAP样多肽编码核酸之表达的优选方法是在植物中引入和表达编码SAP样多肽的核酸;然而也可使用其他熟知的技术实现本方法的效果,即增强产量相关性状。现将对这些技术中的一些进行描述。
一种这样的技术是T-DNA激活标签化(Hayashi等Science(1992)1350-1353),其涉及在目的基因的基因组区域内或基因编码区上游或下游10kb处以如此结构插入T-DNA(通常含有启动子(也可以是翻译增强子或内含子)),使得启动子指导被靶定基因的表达。通常,由靶定基因的天然启动子对所述靶定基因表达的调节作用遭到破坏并且该基因处在新引入的启动子控制下。启动子一般嵌入在T-DNA中。这种T-DNA随机地插入植物基因组,例如通过农杆菌感染,并导致在所插入T-DNA附近的基因的改良表达。因靠近所引入启动子的基因的改良表达,产生的转基因植物表现显性表型。
还可以使用TILLING(基因组中靶向诱导的局部损伤)技术来再现本发明的效果,其描述参阅“定义”部分。
还可以使用同源重组来再现本发明的效果,其描述参阅“定义”部分。
本发明还包括编码如本文所述的SAP样多肽的核酸以及这些SAP样多肽在增强植物任一上述产量相关性状中的用途。
可以在育种程序中使用编码本文所述SAP样多肽的核酸或所述SAP样多肽本身,其中鉴定可能与SAP样多肽编码基因遗传连锁的DNA标记。可以使用所述核酸/基因或所述SAP样多肽本身定义分子标记。接着可以将此DNA或蛋白质标记在育种程序中使用,以在本发明的方法中选择具有如上文所定义的增强的产量相关性状的植物。
SAP样多肽编码核酸/基因的等位变体也可以用于标记辅助的育种程序中。这种育种程序有时需要通过使用例如EMS诱变法对植物作诱变处理而引入等位基因变异;备选地,该程序可以从非人为引起的所谓“自然”起源的一组等位变体开始。随后进行等位变体的鉴定,例如通过PCR法。此后是用于选择所讨论及导致增加产量的序列的优异等位变体的步骤。一般通过监测含有所讨论序列的不同等位变体的植物的生长性能而实施选择。可以在温室中或田间监测生长性能。其它任选步骤包括将鉴定了优异等位变体的植物与另一种植物杂交。这可以用来例如产生目标表型特征的组合。
编码SAP样多肽的核酸也可以用作探针以便对基因进行遗传作图和物理作图,所述探针作为所述基因的一部分及与这些基因关联的性状的标记。此类信息可以用于植物育种中,以便开发具有想要表型的株系。SAP样多肽编码核酸的这种用途仅需要具有至少15个核苷酸长度的核酸序列。SAP样多肽编码核酸可以用作限制性片段长度多态性(RFLP)标记。限制性消化的植物基因组DNA的Southern印迹(Sambrook J,Fritsch EF和Maniatis T(1989)Molecular Cloning,A Laboratory Manual)可以用SAP样多肽编码核酸探测。产生的结合图式随后可以使用计算机程序如MapMaker(Lander等(1987)Genomics 1:174-181)进行遗传分析以构建遗传图。此外,该核酸可以用来探测含有经限制性内切核酸酶处理的一组个体的基因组DNA的Southern印迹,其中所述的一组个体代表具有确定的遗传杂交的亲代和后代。DNA多态性的分离被标出并用来计算SAP样多肽编码核酸在使用这个群体先前所获得的遗传图中的位置(Botstein等(1980)Am.J.Hum.Genet.32:314-331)。
在Bernatzky和Tanksley(1986)Plant Mol.Biol.Reporter 4:37-41中描述了植物基因衍生的探针的产生和其在遗传作图中的用途。众多出版物描述了使用以上所提及的方法学或其改良方法对特定cDNA克隆的遗传作图。例如,F2互交群、回交群、随机交配群、邻近纯合系和其它个体群体可以用于作图。此类方法学是本领域技术人员众所周知的。
所述核酸探针也可以用于物理作图(即序列在物理图上的排列;见Hoheisel等在:Non-mammalian Genomic Analyasis:A Practical Guide,Academic press 1996,第319-346页及其中引用的参考文献)。
在另一实施方案中,核酸探针可以在直接荧光原位杂交(FISH)作图法(Trask(1991)Trends Genet.7:149-154)中使用。尽管当前的FISH作图法支持使用大型克隆(几个kb至几百个kb;见Laan等(1995)Genome Res.5:13-20),然而灵敏度的改善可以允许使用更短探针进行FISH作图。
用于遗传作图及物理作图的多种基于核酸扩增的方法可以使用所述核酸而实施。实例包括等位基因特异的扩增法(Kazazian(1989)J.Lab.Clin.Med 11:95-96)、PCR扩增片段的多态性(CAPS;Sheffield等(1993)Genomics 16:325-332)、等位基因特异性连接(Landegren等(1988)Science241:1077-1080)、核苷酸延伸反应(Sokolov(1990)Nucleic Acid Res.18:3671)、放射杂交作图(Walter等(1997)Nat.Genet.7:22-28)和Happy作图法(Dear和Cook(1989)Nucleic Acid Res.17:6795-6807)。对于这些方法,使用一种核酸的序列来设计并产生在扩增反应或在引物延伸反应中使用的引物对。此类引物的设计是本领域技术人员众所周知的。在使用基于PCR遗传作图的方法中,可能必须鉴定在对应于当前核酸序列的区域内作图交叉亲代间的DNA序列差异。然而,这对于作图法而言通常不是必需的.
本发明方法产生具有如前文所述的产量提高相关性状的植物。这些性状也可以与其它经济有利的性状组合,如其它的产量增强性状、对其它非生物胁迫和生物胁迫的耐性、调节多种构造性特征和/或生物化学特征和/或生理学特征的性状。
(iv)SYPF1
现已惊奇地发现调节编码SYPF1多肽的核酸在植物中的表达产生了相对于对照植物具有增强的产量相关性状的植物。
根据一个实施方案,本发明提供了相对于对照植物增强植物中产量相关性状的方法,其包括调节编码SYPF1多肽的核酸在植物中的表达。
用于调节(优选增加)编码SYPF1多肽的核酸表达的优选方法是在植物中引入并表达编码SYPF1多肽的核酸。
下文中对“可用于本发明方法的蛋白质”的任何提及均指本文定义的SYPF1多肽。下文中对“可用于本发明方法的核酸”的任何提及均指能够编码这些SYPF1多肽的核酸。待引入植物(因此可用于实施本发明方法)的核酸是编码现将描述的蛋白质类型的任何核酸,下文也称为“SYPF1核酸”或“SYPF1基因”。
本文定义的“SYPF1多肽”指与图19比对所示基序I、II和III中任何一个(优选任何两个,更优选全部三个)具有至少40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或更高(优选程度逐渐提高)序列同一性的任何多肽。加框区域代表SYPF1多肽中发现的保守性区或基序。
SYPF1多肽可包含图19比对所示基序I、II和III中的任何一个,优选任何两个,更优选全部三个,所示基序包含任何位置上的任何保守性氨基酸改变。
SYPF1多肽可包含图19比对所示基序I、II和III中的任何一个,优选任何两个,更优选全部三个。
基序优选为SEQ ID NO:322序列或其相应的稻直向同源物(SEQ IDNO:336)中发现的基序,即
基序1:
SLVSNFLSHYLQYYEEKS(SEQ ID NO:322中发现的)
RLVNRVLGHYEHYYRTK(SE Q ID NO:336中发现的)
-该基序可包含任何位置上的任何保守性氨基酸改变。
-该基序可包含任何位置上的1至9个非保守性氨基酸改变。
基序2:
PPWLSSYEKLILWIGGFKP(SEQ ID NO:322中发现的)
PSWTSTTENLYLWCGGWRP(SEQ ID NO:336中发现的)
-该基序可包含任何位置上的任何保守性氨基酸改变。
-该基序可包含任何位置上的1至10个非保守性氨基酸改变。
基序3:
NADQLRCVTVGKVVEVLNPRQSIKLLRA(SEQ ID NO:322中发现的)
MADGLRLETMREVVALLRPSQAVHFLIA(SEQ ID NO:336中发现的)
-该基序可包含任何位置上的任何保守性氨基酸改变。
-该基序可包含任何位置上的1至14个非保守性氨基酸改变。
额外或备选地,本文定义的“SYPF1多肽”包含与SEQ ID NO:322所示SYPF1多肽或本文表E1所示氨基酸序列中任何一个具有至少45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或更高(优选程度逐渐提高)序列同一性。
此外,SYPF1多肽(至少在其天然形式下)可具有DNA结合活性。用于测量DNA结合活性的工具和技术为本领域所熟知。
术语“结构域”和“基序“在本文“定义”章节中定义。存在用于鉴定结构域的专门数据库,例如SMART(Schultz等(1998)Proc.Natl.Acad.Sci.USA 95,5857-5864;Letunic等(2002)Nucleic Acids Res 30,242-244,InterPro(Mulder等,(2003)Nucl.Acids.Res.31,315-318;Prosite(Bucher和Bairoch(1994),A generalized profile syntax for biomolecular sequencesmotifs and its function in automatic sequence interpretation.(In)ISMB-94;Proceedings 2nd International Conference on Intelligent Systems forMolecular Biology.Altman R.,Brutlag D.,Karp P.,Lathrop R.,Searls D.,编著,53-61页,AAAIPress,Menlo Park;Hulo等,Nucl.Acids.Res.32:D134-D137,(2004)或者Pfam(Bateman等,Nucleic Acids Research 30(1):276-280(2002)。用于计算机分析蛋白质序列的一组工具在ExPASY蛋白组学服务器(由Swiss Institute of Bioinformatics(Gasteiger等,ExPASy:theproteomics server for in-depth protein knowledge and analysis,NucleicAcids Res.31:3784-3788(2003)提供)提供。还可以使用常规技术(如序列比对)来鉴定结构域。
在SMART数据库中对SEQ ID NO:322多肽序列进行的分析显示,存在四个称为本征无序态(intrinsic disorder)的结构域(见图18)。这些结构域富含R、K、S,并涉及蛋白质-蛋白质相互作用。这四个结构域是:
第一本征无序态结构域:
MPNTSSSQSF
第二本征无序态结构域:
VSVADLTRHQKDRISSLKSETRRKEREV
第三本征无序态结构域:
LVQQSVADPPVM
第四本征无序态结构域:
HLRLRDRDQERA
这些本征无序态结构域也可见于稻直向同源物SEQ ID NO:336(NP_909348)中。
第一本征无序态结构域:
PPPSPHPPH
第二本征无序态结构域:
SRDLAALRSAASAATNPAAPPDDA
第三本征无序态结构域:
LAGGGLGAGDLGDL
第四本征无序态结构域:
ELAGGGGMDAEGMEMEM
此外,在PRODOM数据库中对SEQ ID NO:322多肽序列的分析显示,与肿瘤相关At4g18650;TGA1 bzip激活子卷曲螺旋存在相似性。
此外,SYPFl多肽包含富含F(富含苯丙氨酸)和富含C(富含半胱氨酸)区。这些区域在显示SEQ ID NO:322的图18中以高亮显示。
比对序列以进行比较的方法为本领域所熟知,这些方法包括GAP、BESTFIT、BLAST、FASTA和TFASTA。GAP利用Needleman和Wunsch((1970)J Mol Biol 48:443-453)的算法来寻找两序列间使匹配数最高并使空位数最少的全局比对(即在完整序列上)。BLAST算法(Altschul等(1990)J Mol Biol 215:403-10)在两序列间计算百分比序列同一性并进行相似性的统计学分析。用于进行BLAST分析的软件在国际生物技术信息中心(National Centre for Biotechnology Information(NCBI))向公众提供。可以使用如默认配对比对参数的ClustalW多重序列比对算法(1.83版)和百分比评分法来容易地鉴定同源物。也可以使用MatGAT软件包(Campanella等,BMC Bioinformatics.2003 Jul 10;4:29.MatGAT:anapplication that generates similarity/identity matrices using protein orDNA sequences)中提供的一种方法确定全局的相似性和同一性百分比。本领域技术人员会意识到,可以进行少量手动编辑以优化保守性基序之间的比对。此外,还可以使用特定的结构域代替全长序列来鉴定同源物。序列同一性值(在下文的实施例部分中以百分比表示)是使用默认参数的上述程序在完整的核酸或氨基酸序列上和/或在所选择的结构域或保守的基序测定的。
本发明以SEQ ID NO:321所示的核酸序列转化植物来进行举例说明,其编码多肽序列SEQ ID NO:322。然而,本发明的实施并不局限于这些序列;本发明的方法可以有利地利用本文所定义的任何SYPF1编码核酸或SYPF1多肽来实施。
SYPF1多肽编码核酸的实例在本文表E1中给出。这样的核酸可用于实施本发明的方法。表E1中给出的氨基酸序列为SEQ ID NO:322所示SYPF1多肽的直向同源物和旁系同源物的示例序列,其中术语“直向同源物”和“旁系同源物”如本文所定义。可以通过进行所谓的交互BLAST检索容易地鉴定更多直向同源物和旁系同源物。通常,这包括以查询序列(例如,利用表E1中所列的任一序列)针对任何序列数据库如可公共获得的NCBI数据库进行BLAST的一次BLAST。当从核苷酸序列开始时,通常使用BLASTN或TBLASTX(利用标准默认值),而当从蛋白质序列开始时,则使用BLASTP或TBLASTN(利用标准默认值)。BLAST结果可以任选地过滤。接着使用过滤的结果或者未过滤的结果中的全长序列针对查询序列来源生物的序列进行反向BLAST(二次BLAST)(在查询序列为SEQ IDNO:321或SEQ ID NO:322的情况下,二次BLAST将会针对拟南芥属序列序列)。然后比较一次和二次BLAST的结果。如果一次BLAST中高排名的命中来自查询序列源自的相同物种,然后反向BLAST理想地导致查询序列处于最高命中之列,则找到了旁系同源物;如果一次BLAST中高排名的命中不来自查询序列源自的相同物种,且优选地在反向BLAST时导致查询序列为在最高命中中,则找到了直向同源物。
高排名的命中是E值低的命中。E值越低,分值越具有显著性(或者换句话说,偶然发现此命中的几率越低)。E值的计算是本领域众所周知的。除了E值之外,还对比较进行同一性百分比评分。同一性百分比是指两比较核酸(或多肽)序列之间在特定长度上的相同核苷酸(或氨基酸)数。在大家族的情况下可以使用ClustalW,继之以邻接树来辅助相关基因的聚类可视化,和鉴定直向同源物和旁系同源物。
核酸变体也可用于实施本发明的方法。这类核酸变体的实例包括编码表E1中所示任一氨基酸序列的同源物和衍生物的核酸,其中术语“同源物”和“衍生物”如本文所定义。同样可用于本发明方法的有编码表E1所示任一氨基酸序列的直向同源物或旁系同源物的同源物和衍生物的核酸。可用于本发明方法的同源物和衍生物与其源自的未修饰蛋白质具有基本上相同的生物活性和功能活性。
可用于实施本发明方法的其他核酸变体包括SYPF1多肽编码核酸的部分、与SYPF1多肽编码核酸杂交的核酸、SYPF1多肽编码核酸的剪接变体、SYPF1多肽编码核酸的等位变体,以及通过基因改组获得的SYPF1多肽编码核酸的变体。术语杂交序列、剪接变体、等位变体和基因改组如本文所述。
SYPF1多肽编码核酸无需是全长核酸,因为本发明方法的实施不依赖于全长核酸序列的使用。根据本发明,提供了增强植物产量相关性状的方法,包括在植物中引入和表达表E1所示任一核酸序列的部分、或者编码表E1所示任一氨基酸序列的直向同源物、旁系同源物或同源物的核酸的部分。
例如,可以通过对核酸进行一个或多个缺失来制备所述核酸的“部分”。“部分”可以以分离的形式使用,或者可将其与其他编码(或非编码)序列融合,以便例如,产生组合了若干活性的蛋白质。当与其他编码序列融合时,经翻译后所产生的多肽可能比针对该蛋白质部分所预测到的要大。
可用于本发明方法的“部分”编码如本文所定义的SYPF1多肽,并与表E1所示氨基酸序列具有基本上相同的生物活性。优选“部分”是表E1所示任一核酸的部分,或是编码表E1所示任一氨基酸序列的直向同源物或旁系同源物的核酸的部分。优选地,该部分长为至少300、400、500或600(优选程度逐渐提高)个连续核苷酸,所述连续核苷酸是表E1所示任一核酸序列或者编码表E1所示任一氨基酸序列的直向同源物或旁系同源物的核酸。最优选“部分”是核酸SEQ ID NO:321的部分。优选“部分”编码包含本文所定义的任何一个或多个结构域的氨基酸序列。优选“部分”编码这样的氨基酸序列的片段,当利用其构建系统发生树(如图20所示)时,其倾向于与包含SEQ ID NO:322所示氨基酸序列的SYPF1多肽的群而非任何其他群聚类。
可用于本发明方法的另一类核酸变体为在降低的严格条件下、优选在严格条件下,能够与本文所定义的SYPF1多肽编码核酸或者本文所定义的“部分”杂交的核酸。
根据本发明,提供了增强植物产量相关性状的方法,包括在植物中引入和表达能够与表E1所示任一核酸杂交的核酸,或者包括在植物中引入和表达能够与编码表E1所示任一核酸序列的直向同源物、旁系同源物或同源物的核酸杂交的核酸。
可用于本发明方法的杂交序列编码如本文所定义的SYPF1多肽,并与表E1所示氨基酸序列具有基本上相同的生物活性。优选杂交序列能够与表E1所示任一核酸杂交、或与任一前述序列的部分杂交,其中部分如上文所定义;或者其中杂交序列能够与编码表E1所示任一氨基酸序列的直向同源物或旁系同源物的核酸杂交。最优选杂交序列能够与SEQ ID NO:321所示的核酸或其部分杂交。优选杂交序列编码包含任何一个或多个本文所定义基序或结构域的氨基酸序列。优选杂交序列编码这样的氨基酸序列,当如图20所示利用其构建系统发生树时,其倾向于与包含SEQ ID NO:322所示氨基酸序列的SYPF1多肽的群而非任何其他群聚类。
可用于本发明方法的另一类核酸变体为编码前文所定义的SYPF1多肽的剪接变体,其中剪接变体如本文所定义。
根据本发明,提供了增强植物产量相关性状的方法,包括在植物中引入和表达表E1所示任一核酸序列的剪接变体、或编码表E1所示任一氨基酸序列的直向同源物、旁系同源物或同源物的核酸的剪接变体。
优选的剪接变体是SEQ ID NO:321所示核酸的剪接变体,或编码SEQID NO:322的直向同源物或旁系同源物的核酸的剪接变体。优选剪接变体所编码的氨基酸序列包含任何一个或多个本文所定义的基序或结构域。优选剪接变体编码这样的氨基酸序列,其在例如如图20所示构建系统发生树时,其倾向于与包含SEQ ID NO:322所示氨基酸序列的SYPF1多肽的群而非任何其他群聚类。
可用于实施本发明方法的另一类核酸变体为前文所定义的SYPF1多肽编码核酸的等位变体,其中等位变体如本文所定义。
根据本发明,提供了增强植物产量相关性状的方法,包括在植物中引入和表达表E1所示任一核酸的等位变体,或者包括在植物中引入和表达表E1所示任一氨基酸序列的直向同源物、旁系同源物或同源物的核酸的等位变体。
可用于本发明方法的等位变体与SEQ ID NO:322的SYPF1多肽及表D1所示的任一氨基酸序列具有基本上相同的生物活性。等位变体天然存在,并且这些天然等位基因的使用包含于本发明的方法中。优选等位变体为SEQ ID NO:321的等位变体,或编码SEQ ID NO:322的直向同源物或旁系同源物的核酸的等位变体。优选等位变体所编码的氨基酸序列包含任何一个或多个本文所定义的基序或结构域。优选等位变体编码这样的氨基酸序列,当利用其在例如如图20所示构建系统发生树时,其倾向于与包含SEQID NO:322所示氨基酸序列的SYPF1多肽的群而非任何其他群聚类。
基因改组或定向进化也可用于产生上文所定义的SYPF1多肽编码核酸的变体;其中术语“基因改组”如本文所定义。
根据本发明,提供了增强植物产量相关性状的方法,包括在植物中引入和表达表E1所示任一核酸序列的变体,或者包括在植物中引入和表达编码表E1给出的任一氨基酸序列的直向同源物、旁系同源物或同源物的核酸的变体,其中所述变体核酸通过基因改组获得。
优选通过基因改组获得的变体核酸编码包含任何一个或多个本文所定义基序或结构域的氨基酸序列。优选通过基因改组获得的变体核酸编码这样的氨基酸序列,其在例如如图20所示构建系统发生树时,其倾向于与包含SEQ ID NO:322所示氨基酸序列的SYPF1多肽的群而非任何其他群聚类。
此外,还可利用定点诱变获得核酸变体。若干方法可用来实现定点诱变,最常见的是基于PCR的方法(Current Protocols in Molecular Biology.Wiley编辑)。
编码SYPF1多肽的核酸可以来自任何天然或人工的来源。可以通过有意的人为操作在组成和/或基因组环境上修饰核酸,使之不同于天然形式。优选SYPF1多肽编码核酸来自植物,还优选来自双子叶植物,更优选来自十字花科(Brassicaceae),更优选来自拟南芥属,最优选来自拟南芥。
本发明方法的实施产生具有增强的产量相关性状的植物。尤其本发明方法的实施产生相对于对照植物而具有增加的产量、尤其增加的种子产量的植物。在本文中的“定义”部分中更详细地描述了术语“产量”和“种子产量”。
在本文中对增强的产量相关性状的提及意指植物的一个或多个部分的生物量(重量)增加,所述的部分可以包括地上(可收获)部分和/或地下(可收获)部分。尤其,此类可收获部分是种子,并且本发明方法的实施产生相对于合适的对照植物的种子产量具有增加的种子产量的植物。
以玉米为例,产量增加可以表现为下列一种或多种指标:每公顷或英亩中已建立植物数的增加、每株植物穗数的增加、行数的增加、每行粒数、粒重、千粒重、玉米穗长度/直径、种子饱满率的增加(其中种子饱满率是饱满种子数除以种子总数并乘以100)及其它。以稻为例,产量增加本身可以表现为下列一种或多种指标的增加:每公顷或英亩植物数、每株植物圆锥花序数、每圆锥花序小穗数、每圆锥花序花(小花)数(其表达为饱满种子数对原圆锥花序数之比)、种子饱满率的增加(其中种子饱满率是饱满种子数除以种子总数并乘以100)、千粒重的增加及其它。
本发明提供了增加植物相对于对照植物的产量、特别是种子产量的方法,所述方法包括调节植物中本文所定义的SYPF1多肽编码核酸的表达(优选提高表达)。
由于本发明的转基因植物具有增加的产量,因而相对于对照植物的生长速率,这些植物有可能在其生活周期中的对应阶段上表现增加的生长速率(在其生活周期的至少部分期间)。
增加的生长速率可以对于植物的一个或多个部分(包括种子)是特异性的,或可以基本上遍及整株植物。具有增加的生长速率的植物可以具备较短的生活周期。植物的生活周期可以视为意指从干燥成熟种子成长至植物已经产生与起始材料相似的干燥成熟种子的阶段所需要的时间。这个生活周期可以受下列因素影响,如早期萌发势、生长速率、绿度指数、开花时间和种子成熟速度。生长速率的增加可以在植物生活周期中的一个或多个阶段上或在基本上整个植物生活周期期间发生。在植物生活周期中的早期期间增加的生长速率可以反映增强的萌发势。生长速率的增加可以改变植物的收获周期,允许植物较晚播种和/或较早收获,否则这将不可能(相似的作用可以用较早的开花时间获得)。若生长速率充分地增加,可以允许进一步播种相同植物物种的种子(例如播种并收获稻植物,随后播种并收获其它稻植物,全部稻植物均在一个常规生长时段内)。类似地,若生长速率足够地增加,可以允许进一步播种不同植物物种的种子(例如播种并收获玉米植物,随后例如播种并任选收获大豆、马铃薯或任何其它合适植物)。从相同的根茎中收获额外次数在一些作物植物的情况中也是可能的。改变植物的收获周期可以导致每英亩的年生物量产量的增加(因任何特定植物可以生长并收获的次数(如在一年中)增加)。生长速率的增加也可以允许比其野生型对应物在更广泛的地理区域内培育转基因植物,因为对培育作物的区域限制往往由栽种时节(早季)或在收获时期(晚季)的不利环境条件所决定。若缩短收获周期,则可以避开这类不利条件。生长速率可以通过从生长曲线中得到多种参数而确定,此类参数可以是:T-Mid(植物达到其50%最大尺寸所花费的时间)和T-90(植物达到其90%最大尺寸所花费的时间),等等。
根据本发明的优选特征,本发明方法的实施产生相对于对照植物而具有增加的生长速率的植物。因而根据本发明,提供增加植物生长速率的方法,所述方法包括调节表达、优选增加本文中所定义的编码SYPF1多肽的核酸在植物中的表达。
与对照植物相比,无论植物处于非胁迫条件下还是植物暴露于多种胁迫下,都发生产量和/或生长速率的增加。植物一般通过生长得更慢而对暴露于胁迫作出应答。在严重胁迫条件下,植物甚至可以完全停止生长。另一方面,轻微胁迫在本文中定义为植物对其暴露的任何胁迫,其中所述的胁迫未导致植物完全停止生长而没有恢复生长的能力。与非胁迫条件下的对照植物相比,轻微胁迫在本发明意义中导致受胁迫植物生长降低小于40%、35%或30%,优选小于25%、20%或15%,更优选小于14%、13%、12%、11%或10%或更低。由于农业实践(灌溉、施肥、杀虫剂处理)上的进步,在栽培作物植物中并不经常遇到严重胁迫。因此,由轻微胁迫诱导的受损生长往往是农业上不希望的特征。轻微胁迫是植物暴露的常见生物性和/或非生物性(环境)胁迫。非生物胁迫可以因干旱或水涝、厌氧胁迫、盐胁迫、化学毒性、氧化胁迫和热、寒冷或冰冻温度所致。非生物胁迫可以是由水胁迫(尤其因为干旱)、盐胁迫、氧化胁迫或离子胁迫引起的渗透胁迫。生物胁迫一般是由病原体如细菌、病毒、真菌和昆虫引起的那些胁迫。
尤其,本发明的方法可以在非胁迫条件下或在轻微干旱条件下实施以产生相对于对照植物而具有增加的产量的植物。如在Wang等(Planta(2003)218:1-14)中报道,非生物胁迫导致不利地影响植物生长及生产力的一系列形态学变化、生理学变化、生物化学变化和分子变化。已知干旱、盐度、极端温度和氧化胁迫是相互联系的并可以通过相似机制而诱导生长损害及细胞损害。Rabbani等(Plant Physiol(2003)133:1755-1767)描述了干旱胁迫与高盐度胁迫间极高程度的“交叉(cross talk)”。例如,干旱和/或盐化作用主要表现为渗透胁迫,导致细胞内稳态和离子分布的破坏。经常伴随高温或低温、盐度或干旱胁迫的氧化胁迫可以造成功能性蛋白和结构蛋白变性。因此,这些多样的环境胁迫常常激活相似的细胞信号途径和细胞应答,如产生胁迫蛋白质、上调抗氧化物质、积累相容性溶质和生长抑制。如本文中所用的术语“非胁迫”条件是允许植物最佳生长的环境条件。本领域技术人员清楚对于给定地点的正常土壤条件和气候条件。
本发明方法的实施相对于在可比条件下培育的合适对照植物,赋予在非胁迫条件下或在轻微干旱条件下培育的植物增加的产量。因而根据本发明,提供用于在非胁迫条件下或在轻微干旱条件下培育的植物中增加产量的方法,所述方法包括增加编码SYPF1多肽的核酸在植物中表达。
本发明包括可由根据本发明的方法获得的植物或其部分(包括种子)。所述植物或其部分含有编码如上文所定义的SYPF1多肽的核酸转基因。
本发明还提供遗传构建体和载体,以利于在植物中引入和/或表达SYPF1多肽编码核酸。可以将基因构建体插入适于转化进入植物并适于在转化的细胞中表达目的基因的载体中,该载体可以是可商购的载体。本发明还提供了如本文所定义的基因构建体在本发明方法中的用途。
更具体地,本发明提供这样的构建体,其含有:
(a)编码如上文所定义的SYPF1多肽的核酸;
(b)一个或多个能够驱动(a)中核酸序列表达的控制序列;和任选的
(c)转录终止序列。
术语“控制序列”和“终止序列”如本文所定义。
可以使用含有任何上述核酸的载体转化植物。技术人员充分知晓载体中必须存在的遗传元件,以便成功进行转化、选择并繁殖含目的序列的宿主细胞。将目的序列有效连接于一个或多个控制序列(至少连接于启动子)。
有利地,任何类型的启动子均可用于驱动核酸序列的表达。组成型启动子在本发明方法中特别有用,特别是中等强度组成型启动子。应该明白,本发明的适用范围不仅限于由SEQ ID NO:321所示的SYPF1多肽编码核酸,本发明的适用范围也不仅限于表达由组成型启动子驱动的SYPF1多肽编码核酸。
组成型启动子优选为HMG(高迁移组)启动子。组成型启动子的其他实例见本文的“定义”部分。
为了鉴定功能等价启动子,可以分析候选启动子的启动子强度和/或表达模式,例如通过将该启动子与报告基因有效连接并测定该报告基因在多种植物组织中的表达水平和模式。合适的熟知报告基因包括如β-葡糖醛酸糖苷酶或β-半乳糖苷酶。通过测量β-葡糖醛酸糖苷酶或β-半乳糖苷酶的酶活性来测定启动子活性。接着可以将启动子强度和/或表达模式与参考启动子(例如用于本发明方法中的)进行比较。或者,可以通过定量mRNA水平或者将本发明方法中所用核酸的mRNA水平与持家基因(如18SrRNA)mRNA水平进行比较来测定启动子强度,其中使用本领域熟知的技术,通过放射自显影的光密度测定分析进行的Northern印迹、定量实时PCR或RT-PCR(Heid等,1996Genome Methods 6:986-994)。通常,“弱启动子”指驱动编码序列低水平表达的启动子。“低水平”指每个细胞中约1/10,000的转录物至约1/100,000的转录物至约1/500,0000的转录物的水平。相反,“强启动子”驱动编码序列高水平表达,或者每个细胞中约1/10的转录物至约1/100的转录物至约1/1000的转录物的水平。
任选地,可在引入植物的构建体中使用一个或多个终止子序列。其他调节元件可包括转录及翻译增强子。本领域技术人员会了解适于实施本发明的终止子和增强子序列。这些序列是已知的,或者可由本领域技术人员容易地获得。
也可将内含子序列添加至5′非翻译区(UTR)或编码序列上,以增加在细胞溶胶内积累的成熟信息的量。已经证实可剪接内含子在植物表达构建体和动物表达构建体中转录单位内的包含在mRNA水平及蛋白质水平上增加基因表达至多达1000倍(Buchman和Berg(1988)Mol.Cell biol.8:4395-4405;Callis等(1987)Gens Dev 1:1183-1200)。基因表达的此类内含子增强作用一般在位于转录单元5′端附近时最强烈。使用玉米内含子Adh1-S内含子1、2和6、Bronze-1内含子是本领域已知的。对于一般信息,见:The Maize Handbook,第116章,Freeling和Walbot编辑,Springer,N.Y.(1994)。
其它控制序列(除启动子、增强子、沉默子、内含子序列、3’UTR和/或5’UTR区之外)可以是蛋白质和/或RNA稳定元件。本领域技术人员会知道或可以容易地获得此类序列。
本发明的遗传构建体还可以包括需要用于在特定细胞类型中维持和/或复制的复制起点序列。一个实例是当需要将遗传构建体在细菌细胞中维持为附加型遗传元件(例如质粒或粘粒分子)时。优选的复制起点包括但不限于f1-ori和colE1。
为检测如在本发明方法中所用核酸序列的成功转移和/或选择包含这些核酸的转基因植物,使用标记基因(或报告基因)是有利的。因而,遗传构建体可以任选地包含选择标记基因。选择标记在本文“定义”部分中有更详细的描述。
已知当核酸稳定或瞬时整合至植物细胞时,仅小部分的细胞摄取外来DNA并且根据需要将其整合至细胞基因组,这取决于所用表达载体和使用的转染技术。为鉴定并选择这些整合子,通常将编码选择标记(如上文所述之一)的基因连同目的基因一起引入宿主细胞。这些标记可以在其中这些基因因例如常规方法所致的缺失而无功能的突变体中使用。此外,编码选择标记的核酸分子可以引入宿主细胞中,与在包含编码本发明多肽或本发明方法中所用多肽的序列在同一载体上,或在单独的载体上。已经用引入的核酸稳定转染的细胞可以通过选择进行鉴定(例如具有整合的选择标记的细胞存活而其它细胞死亡)。
因为一旦已经成功引入了核酸,则转基因宿主细胞中就不再需要或不希望有标记基因,尤其抗生素抗性基因和除草剂抗性基因,因此用于引入核酸的本发明方法有利地使用能够去掉或切除这些标记基因的技术。一种如此方法称作共转化法。共转化法使用同时用于转化的两种载体,一种载体携带本发明的核酸而另一种载体携带标记基因。高比例的转化体接受,或在植物的情况下,包含(高达40%或更多的转化体)这两种载体。在用农杆菌转化的情况下,转化体通常仅接受载体的一部分,即侧翼有T-DNA的序列,它通常代表表达盒。标记基因随后可以通过进行杂交而从转化的植物中去掉。在另一种方法中,整合至转座子的标记基因用来与想要的核酸一起进行转化(称作Ac/Ds技术)。转化体可以与转座酶来源植物杂交或转化体用导致转座酶表达的核酸构建体瞬时或稳定地转化。在一些情况下(大约10%),转座子在已经成功发生转化时跳出宿主细胞的基因组并丢失。在其它更多情况下,转座子跳至不同位置。在这些情况下,标记基因必须通过进行杂交而去除。在微生物学中,开发了实现或促进检测这类事件的技术。又一个有利的方法依赖于重组系统;此方法的优势在于不必通过杂交去除。该类型的最知名系统称作Cre/lox系统。Cre1是去掉位于loxP序列之间序列的重组酶。若标记基因整合于loxP序列之间,则通过重组酶表达已经成功发生转化时,标记基因被去除。其它重组系统是HIN/HIX、FLP/FRT和REP/STB系统(Tribble等,J.Biol.Chem.,275,2000:22255-22267;Velmurugan等,J.Cell Biol.,149,2000:553-566)。有可能将本发明核酸序列以位点特异性方式整合至植物基因组。这些方法自然也可以应用至微生物如酵母、真菌或细菌。
本发明还提供产生与对照植物相比具有增强的产量相关性状的转基因植物的方法,其包括在植物中引入和表达编码上文所定义SYPF1多肽的任何核酸。
更具体地,本发明提供了产生具有提高的产量的转基因植物的方法,所述方法包括:
(i)向植物或植物细胞中引入和表达SYPF1多肽编码核酸;和
(ii)在促进植物生长和发育的条件下培养植物细胞。
可以将核酸直接引入植物细胞或植物本身(包括引入组织、器官或植物的任何其它部分)。根据本发明优选的方面,优选通过转化将核酸引入植物。术语“转化”在本文“定义”部分有更详细的说明。
遗传修饰的植物细胞能够通过技术人员熟悉的所有方法再生。合适的方法可见于上述S.D.Kung和R.Wu、Potrykus或者和Willmitzer的出版物。
通常在转化以后,选出存在一个或多个标记的植物细胞或细胞群,所述标记由与目的基因共转移的植物可表达基因编码,继之将转化的材料再生成整个植物。为选择转化的植物,通常将在转化过程中获得的植物材料置于选择性条件下,从而可将转化的植物与非转化植物区分开来。例如,可以种植以上述方式获得的种子,并在最初的生长期之后,通过喷雾对其进行合适的选择。另一可能方案是使用合适的选择剂,将种子(适当时在灭菌之后)种在琼脂板上,从而仅转化的种子能够长成植物。可选地,针对转化的植物筛选可选择标记如上文所述标记的存在。
DNA转移和再生之后,还可评价推定转化的植物,例如用Southern分析(DNA印迹),评价目的基因的存在、拷贝数和/或基因组构造。备选地或额外地,可用Northern和/或Western分析监测新引入的DNA的表达水平,这两种技术都是本领域普通技术人员所熟知的。
产生的转化植物可以通过多种方式繁殖,如通过克隆繁殖或经典的育种技术。例如,第一代(或T1)转化的植物可自交,选择纯合的第二代(或T2)转化体,而T2植物可进一步通过经典育种技术繁殖。
产生的转化生物体可以有多种形式。例如,它们可以是转化细胞和非转化细胞的嵌合体;克隆的转化体(例如所有细胞经转化含有表达盒);转化和非转化组织的嫁接体(例如在植物中,转化的根状茎嫁接到非转化的接穗上)。
本发明显然延及由本文所述任何方法产生的任何植物细胞或植物,以及所有的植物部分及其繁殖体。本发明还延及由任何上述方法产生的原代转化或转染的细胞、组织、器官或整个植物的后代,唯一的要求是所述后代呈现出与在本发明方法中亲本产生的相同的基因型和/或表型特征。
本发明也包括含有分离的编码上文所定义的SYPF1多肽的核酸的宿主细胞。根据本发明优选的宿主细胞是植物细胞。对于用于本发明方法的核酸或载体、表达盒或构建体或载体,其宿主植物原则上有利地为能够合成在本发明方法中使用的多肽的所有植物。
本发明方法有利地适用于任何植物。
特别用于本发明方法中的植物包括属于植物界超家族的全部植物,尤其单子叶植物和双子叶植物,包括饲用或饲料豆类、观赏植物、粮食作物、树或灌木。根据本发明优选的实施方案,植物是作物植物。作物植物的实例包括大豆、向日葵、芸苔、苜蓿、油菜、棉花、番茄、马铃薯和烟草。还优选地,植物是单子叶植物。单子叶植物的实例包括甘蔗。更优选地,植物是谷物。谷物的实例包括稻、玉米、小麦、大麦、粟、黑麦、高粱和燕麦。
本发明也扩展至植物的可收获部分如,但不限于种子、叶、果实、花、茎、根茎、块茎和球茎。本发明进一步涉及来自、优选直接来自这种植物的可收获部分中的产物,如干燥颗粒或粉末、油、脂肪及脂肪酸、淀粉或蛋白质。
根据本发明的一个优选的特征,调节的表达是提高的表达。用于提高核酸或基因或基因产物之表达的方法均已详细记载于本领域中,包括如通过适当的启动子驱动过表达,使用转录增强子或翻译增强子。作为启动子或增强子元件的分离的核酸可在非异源形式多核苷酸中的适当位置(一般为上游)引入,以上调表达。例如,可以通过突变、缺失和/或替换在体内改变内源启动子(参阅Kmiec,美国专利No.5,565,350;Zarling等,PCT/US93/03868),或者可将分离的启动子以正确的方向和与本发明基因的距离引入植物细胞中,以控制基因表达。
如果期望表达多肽,一般期望在多核苷酸编码区的3’末端包含多腺苷酸化区。多腺苷酸化区可来自该天然基因,来自多种其他植物基因,或者来自T-DNA。待被加入的3’末端序列可来自例如胭脂碱合酶或章鱼碱合酶基因,或者来自其他植物基因,或者较不优选地来自任何其他真核基因。
如上文所述,调节(优选提高)SYPF1多肽编码核酸之表达的优选方法是在植物中引入和表达编码SYPF1多肽的核酸;然而也可使用其他熟知的技术实现本方法的效果,即增强产量相关性状。现将对这些技术中的一些进行描述。
一种这样的技术是T-DNA激活标签化(Hayashi等Science(1992)1350-1353),其涉及在目的基因的基因组区域内或基因编码区上游或下游10kb处以如此结构插入T-DNA(通常含有启动子(也可以是翻译增强子或内含子)),使得启动子指导被靶定基因的表达。通常,由靶定基因的天然启动子对所述靶定基因表达的调节作用遭到破坏并且该基因处在新引入的启动子控制下。启动子一般嵌入在T-DNA中。这种T-DNA随机地插入植物基因组,例如通过农杆菌感染,并导致在所插入T-DNA附近的基因的改良表达。因靠近所引入启动子的基因的改良表达,产生的转基因植物表现显性表型。
还可以使用TILLING(基因组中靶向诱导的局部损伤)技术来再现本发明的效果,其描述参阅“定义”部分。
还可以使用同源重组来再现本发明的效果,其描述参阅“定义”部分。
本发明还包括编码如本文所述的SYPF1多肽的核酸以及这些SYPF1多肽在增强植物任一上述产量相关性状中的用途。
可以在育种程序中使用编码本文所述SYPF1多肽的核酸或所述SYPF1多肽本身,其中鉴定可能与SYPF1多肽编码基因遗传连锁的DNA标记。可以使用所述核酸/基因或所述SYPF1多肽本身定义分子标记。接着可以将此DNA或蛋白质标记在育种程序中使用,以在本发明的方法中选择具有如上文所定义的增强的产量相关性状的植物。
SYPF1多肽蛋白编码核酸/基因的等位变体也可以用于标记辅助的育种程序中。这种育种程序有时需要通过使用例如EMS诱变法对植物作诱变处理而引入等位基因变异;备选地,该程序可以从非人为引起的所谓“自然”起源的一组等位变体开始。随后进行等位变体的鉴定,例如通过PCR法。此后是用于选择所讨论及导致增加产量的序列的优异等位变体的步骤。一般通过监测含有所讨论序列的不同等位变体的植物的生长性能而实施选择。可以在温室中或田间监测生长性能。其它任选步骤包括将鉴定了优异等位变体的植物与另一种植物杂交。这可以用来例如产生目标表型特征的组合。
编码SYPF1多肽的核酸也可以用作探针以便对基因进行遗传作图和物理作图,所述探针作为所述基因的一部分及与这些基因关联的性状的标记。此类信息可以用于植物育种中,以便开发具有想要表型的株系。SYPF1多肽编码核酸的这种用途仅需要具有至少15个核苷酸长度的核酸序列。SYPF1多肽编码核酸可以用作限制性片段长度多态性(RFLP)标记。限制性消化的植物基因组DNA的Southern印迹(Sambrook J,Fritsch EF和Maniatis T(1989)Molecular Cloning,A Laboratory Manual)可以用SYPF1编码核酸探测。产生的结合图式随后可以使用计算机程序如MapMaker(Lander等(1987)Genomics 1:174-181)进行遗传分析以构建遗传图。此外,该核酸可以用来探测含有经限制性内切核酸酶处理的一组个体的基因组DNA的Southern印迹,其中所述的一组个体代表具有确定的遗传杂交的亲代和后代。DNA多态性的分离被标出并用来计算SYPF1多肽编码核酸在使用这个群体先前所获得的遗传图中的位置(Botstein等(1980)Am.J.Hum.Genet.32:314-331)。
在Bernatzky和Tanksley(1986)Plant Mol.Biol.Reporter 4:37-41中描述了植物基因衍生的探针的产生和其在遗传作图中的用途。众多出版物描述了使用以上所提及的方法学或其改良方法对特定eDNA克隆的遗传作图。例如,F2互交群、回交群、随机交配群、邻近纯合系和其它个体群体可以用于作图。此类方法学是本领域技术人员众所周知的。
所述核酸探针也可以用于物理作图(即序列在物理图上的排列;见Hoheisel等在:Non-mammalian Genomic Analyasis:A Practical Guide,Academic press 1996,第319-346页及其中引用的参考文献)。
在另一实施方案中,核酸探针可以在直接荧光原位杂交(FISH)作图法(Trask(1991)Trends Genet.7:149-154)中使用。尽管当前的FISH作图法支持使用大型克隆(几个kb至几百个kb;见Laan等(1995)Genome Res.5:13-20),然而灵敏度的改善可以允许使用更短探针进行FISH作图。
用于遗传作图及物理作图的多种基于核酸扩增的方法可以使用所述核酸而实施。实例包括等位基因特异的扩增法(Kazazian(1989)J.Lab.Clin.Med 11:95-96)、PCR扩增片段的多态性(CAPS;Sheffield等(1993)Genomics 16:325-332)、等位基因特异性连接(Landegren等(1988)Science241:1077-1080)、核苷酸延伸反应(Sokolov(1990)Nucleic Acid Res.18:3671)、放射杂交作图(Walter等(1997)Nat.Genet.7:22-28)和Happy作图法(Dear和Cook(1989)Nucleic Acid Res.17:6795-6807)。对于这些方法,使用一种核酸的序列来设计并产生在扩增反应或在引物延伸反应中使用的引物对。此类引物的设计是本领域技术人员众所周知的。在使用基于PCR遗传作图的方法中,可能必须鉴定在对应于当前核酸序列的区域内作图交叉亲代间的DNA序列差异。然而,这对于作图法而言通常不是必需的。
本发明方法产生具有如前文所述的产量提高相关性状的植物。这些性状也可以与其它经济有利的性状组合,如其它的产量增强性状、对其它非生物胁迫和生物胁迫的耐性、调节多种构造性特征和/或生物化学特征和/或生理学特征的性状。
(v)RCA
现已惊奇地发现,提高编码核酮糖-1,5-二磷酸羧化酶/加氧酶(RuBisCo)活化酶(RCA)的核酸序列在植物中的表达产生了相对于对照植物具有增强的产量相关性状的植物。在下文详细描述了适于增强植物中产量相关性状的特定类的RCA多肽。
本发明提供了相对于对照植物增强植物中产量相关性状的方法,其包括在植物中增加编码RCA多肽的核酸序列的表达。
下文中对“用于本发明方法中的多肽”的任何提及意指如本文中所定义的RCA多肽。下文中对“用于本发明方法中的核酸”的任何提及意指能够编码这种RCA多肽的核酸。术语“多肽”和“蛋白质”如本文定义部分中所定义。术语“多核苷酸”、“核酸序列”、“核苷酸序列”也如本文所定义。术语“对照植物”也如本文所定义。
用于提高编码用于本发明方法中的多肽的核酸序列表达的优选方法是在植物中引入并表达编码如下文所定义的用于本发明方法中的多肽的核酸序列。
待引入植物(因此可用于实施本发明方法)的核酸是编码现将描述的多肽类型的任何核酸序列,在下文也称为“RCA核酸序列”或“RCA基因”。本文定义的RCA多肽指这样的任何多肽序列,其不受氧化还原反应的调节,并且从N端到C端包含:(i)质体转运肽;(ii)与SEQ ID NO:311所示AAA结构域具有至少60%、65%、70%、75%、80%、85%、90%、95%或98%(优选程度逐渐提高)的序列同一性。
此外,RCA多肽可在AAA结构域中包含SEQ ID NO:312所示基序1G(G/R)KG(Q/E)GK(S/T)。在该基序中,允许存在任何位置上的一个或多个保守性改变和/或任何位置上的一个或两个非保守性改变。
或者,本文定义的“RCA”多肽指这样的任何多肽序列,其不受氧化还原反应的调节,并且与SEQ ID NO:251所示RCA多肽具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或98%(优选程度逐渐提高)的序列同一性。
不受氧化还原反应调节的RCA多肽在本文中应认为指不通过铁氧还蛋白/硫氧还蛋白系统受光照调节的RCA多肽。这些RCA多肽的实例为天然存在的β(短形式,或SF)RCA多肽,或者已在C端延伸中发生截短或突变以阻止氧化还原反应调节的α(长形式,或LF)RCA多肽。
可用于本发明方法的多肽实例及其编码核酸序列在实施例部分的表D1中给出。这些RCA多肽是天然存在的β(短形式,或SF)RCA多肽,或者已在C端延伸中发生截短或突变以阻止氧化还原反应调节的α(长形式,或LF)RCA多肽。
还用于本发明方法中的是在实施例部分表D1中给出的任何一种多肽序列的同源物。“同源物”如上文定义章节中所定义。
还用于本发明方法中的是在表D1中给出的任何一种多肽的衍生物或任一前述SEQ ID NO的直向同源物或旁系同源物。“衍生物”如本文定义章节所定义。优选SEQ ID NO:251的衍生物或表D1所给出任何多肽的衍生物。
本发明通过用由SEQ ID NO:250代表的编码多肽序列SEQ ID NO:251的莱茵衣藻(Chlamydomonas reinhardtii)核酸序列转化植物加以说明,然而,本发明的实施不限于这些序列。本发明方法可以使用编码用于本发明方法中如本文中所定义的多肽的任何核酸序列有利地进行,所述核酸序列包括直向同源物和旁系同源物,如在表D1中给出的任一核酸序列。这些RCA多肽是天然存在的β(短形式,或SF)RCA多肽,或者已在C端延伸中发生截短或突变以阻止氧化还原反应调节的α(长形式,或LF)RCA多肽。
在表D1中给出的多肽序列可以视为由SEQ ID NO:251代表的RCA多肽的直向同源物和旁系同源物,术语“直向同源物”和“旁系同源物”如本文所定义。
可以通过进行所谓的交互BLAST检索容易地找到其它直向同源物和旁系同源物。通常,这包括以查询序列(例如,利用表D1中所列的任一序列)针对任何序列数据库如可公共获得的NCBI数据库进行BLAST的一次BLAST。当从核苷酸序列开始时,通常使用BLASTN或TBLASTX(利用标准默认值),而当从多肽序列开始时,则使用BLASTP或TBLASTN(利用标准默认值)。BLAST结果可以任选地过滤。接着使用过滤的结果或者未过滤的结果中的全长序列针对查询序列来源生物的序列进行反向BLAST(二次BLAST)(在查询序列为SEQ ID NO:250或SEQ ID NO:251的情况下,二次BLAST将会针对莱茵衣藻序列)。然后比较一次和二次BLAST的结果。如果一次BLAST中高排名的命中来自查询序列源自的相同物种,然后反向BLAST理想地导致查询序列处于最高命中之列,则找到了旁系同源物;如果一次BLAST中高排名的命中不来自查询序列源自的相同物种,且优选地在反向BLAST时导致查询序列在最高命中中,则找到了直向同源物。
高排名的命中是E值低的命中。E值越低,分值越具有显著性(或者换句话说,偶然发现此命中的几率越低)。E值的计算是本领域众所周知的。除了E值之外,还对比较进行同一性百分比评分。同一性百分比是指两比较核酸(或多肽)序列之间在特定长度上的相同核苷酸(或氨基酸)数。在大家族的情况下可以使用ClustalW,继之以邻接树来辅助相关基因的聚类可视化,和鉴定直向同源物和旁系同源物。
表D1给出由SEQ ID NO 251代表的RCA多肽的直向同源物和旁系同源物的实例。其它直向同源物和旁系同源物可以使用上文所述的BLAST方法而容易地鉴定。这些RCA多肽是天然存在的β(短形式,或SF)RCA多肽,或者已在C端延伸中发生截短或突变以阻止氧化还原反应调节的α(长形式,或LF)RCA多肽。
本发明多肽可通过保守性AAA结构域(示于图14)的存在来鉴定,术语“结构域”如本文所定义。术语“基序”、“共有序列”和“标签”也如本文所定义。。
本文定义的术语“延伸”指多重序列比对中超出最短多肽最后一个氨基酸的额外的多肽氨基酸残基。所述氨基酸残基可以是天然存在的,或者通过人为间插进行了修饰。
还存在用于鉴定结构域的专门数据库,例如SMART(Schultz等(1998)Proc.Natl.Acad.Sci.USA 95,5857-5864;Letunic等(2002)Nucleic AcidsRes 30,242-244,InterPro(Mulder等,(2003)Nucl.Acids.Res.31,315-318;Prosite(Bucher和Bairoch(1994),A generalized profile syntax forbiomolecular sequences motifs and its function in automatic sequenceinterpretation.(In)ISMB-94;Proceedings 2nd International Conferenceon Intelligent Systems for Molecular Biology.Altman R.,Brutlag D.,KarpP.,Lathrop R.,Searls D.,编著,53-61页,AAAIPress,Menlo Park;Hulo等,Nucl.Acids.Res.32:D134-D137,(2004)或者Pfam(Bateman等,NucleicAcids Research 30(1):276-280(2002)。用于计算机分析多肽序列的一组工具在ExPASY蛋白组学服务器(由Swiss Institute of Bioinformatics(Gasteiger等,ExPASy:the proteomics server for in-depth proteinknowledge and analysis,Nucleic Acids Res.31:3784-3788(2003)提供)提供。例如SEQ ID NO:251的AAA结构域通过登录号IPR003959示于InterPro数据库中。
还可以使用常规技术(如序列比对)来鉴定结构域。比对序列以进行比较的方法为本领域所熟知,这些方法包括GAP、BESTFIT、BLAST、FASTA和TFASTA。GAP利用Needleman和Wunsch((1970)J Mol Biol 48:443-453)的算法来寻找两序列间使匹配数最高并使空位数最少的全局比对(即在完整序列上)。BLAST算法(Altschul等(1990)J Mol Biol 215:403-10)在两序列间计算百分比序列同一性并进行相似性的统计学分析。用于进行BLAST分析的软件在国际生物技术信息中心(National Centre forBiotechnology Information(NCBI))向公众提供。可以使用如默认配对比对参数的ClustalW多重序列比对算法(1.83版)和百分比评分法来容易地鉴定同源物。也可以使用MatGAT软件包(Campanella等,BMCBioinformatics.2003Jul 10;4:29.MatGAT:an application that generatessimilarity/identity matrices using protein or DNA sequences)中提供的一种方法确定全局的相似性和同一性百分比。本领域技术人员会意识到,可以进行少量手动编辑以优化保守性基序之间的比对。此外,还可以使用特定的结构域(例如AAA结构域或上文定义的Motif1)代替全长序列来鉴定同源物。序列同一性值(在下文的实施例3中以百分比表示)是使用默认参数的上述程序在完整的核酸或氨基酸序列上和/或在所选择的结构域或保守的基序测定的。
蛋白质亚细胞定位预测的工作是很重要的,并已充分研究。了解蛋白质的定位有助于阐明其功能。蛋白质定位实验方法的范围从免疫定位到使用绿色荧光蛋白(GFP)标记蛋白质。这些方法很准确,但与计算机方法相比需要大量劳动。从序列数据对蛋白质定位进行计算机预测近来已取得很大进展。本领域技术人员熟知的算法在Swiss Institute for Bioinformatics提供的ExPASy蛋白组学工具可获得,例如PSort、TargetP、ChloroP、Predotar、LipoP、MITOPROT、PATS、PTS1、SignalP等。对本发明多肽亚细胞定位的鉴定描述于本文的实施例部分中。具体地,本发明的SEQID NO:251被指定到光合作用(自养)细胞的质体(叶绿体)区室。
靶向至质体的方法为本领域所熟知,包括使用转运肽。下表显示了可用于将任何RCA多肽靶向至质体的转运肽实例,其中天然形式的RCA多肽通常不靶向至质体,或者其中天然形式的RCA多肽通过不同的转运肽(例如,其天然转运肽)靶向至质体。例如,编码蓝细菌RCA多肽的核酸序列(来自鱼腥藻属,描述于Li等,(1993)Plant Molec Biol 21(5):753-764;SEQ ID NO:301)也可适用于本发明的方法,只要RCA多肽靶向质体(优选叶绿体)并且不受氧化还原反应调节即可。
可用于将多肽靶向至质体的转运肽序列的实例
RCA多肽靶向至叶绿体并在其中有活性,即,RCA多肽在叶绿体中能发挥双重活性:(再)活化RuBisCo以及ATP水解。测试这些活性的测定为本领域所熟知。其他细节在本文的实施例部分中提供。
编码用于本发明方法中的多肽的核酸无需是全长核酸序列,因为本发明方法的实施不依赖使用全长核酸序列。在实施本发明方法中适用的核酸序列的实例包括在表D1中给出的核酸序列,但不限于这些序列。核酸变体也可以用于实践本发明方法。此类核酸变体的实例包括编码本发明方法中所用多肽的核酸序列的部分、与编码本发明方法中所用多肽的核酸序列杂交的核酸序列、编码本发明方法中所用多肽的核酸序列的剪接变体、编码本发明方法中所用多肽的核酸序列的等位变体通过定点诱变而获得的编码本发明方法中所用多肽的核酸序列的变体。现在将描述术语部分、杂交序列、剪接变体、等位变体和定点诱变。
根据本发明,提供用于增强植物中产量相关性状的方法,包括在植物中引入并表达在表D1中给出的任何一种核酸序列的一部分或编码表D1中给出的任何一种多肽序列的直向同源物、旁系同源物或同源物的核酸序列的一部分。这些RCA多肽部分来自天然存在的β(短形式,或SF)RCA多肽,或者来自C端延伸中发生截短或突变以阻止氧化还原反应调节的α(长形式,或LF)RCA多肽。
用于本发明方法中的部分编码属于本文所定义核酸范围的多肽,其中所述的核酸编码用于如本文所定义的本发明方法中并具有与表D1中给出的多肽序列基本上相同的生物学活性的多肽。优选地,此部分是在表D1中给出的任何一种核酸序列的部分。该部分一般具有至少900个连续核苷酸长度、优选至少1000个连续核苷酸长度、更优选至少1100个连续核苷酸长度并且最优选至少1227个连续核苷酸长度,其中所述的连续核苷酸是表D1中给出的任何一种核酸序列。优选地,该部分编码这样的多肽序列,其不受氧化还原反应的调节,并且从N端到C端包含:(i)质体转运肽,(ii)与SEQ ID NO:311所示AAA结构域具有至少60%、65%、70%、75%、80%、85%、90%、95%或98%(优选程度逐渐提高)的序列同一性;并且其可在AAA结构域内额外包含SEQ ID NO:312所示基序1G(G/R)KG(Q/E)GK(S/T)。最优选地,该部分是SEQ ID NO:250核酸序列的一部分。
编码如本文中所定义的RCA多肽的核酸序列的部分可以例如通过对该核酸序列产生一种或多种缺失而制备。所述的部分可以以分离的形式加以使用或它们可以与其它编码性(或非编码性)序列融合,以便例如产生组合几种活性的蛋白质,或者产生靶向其天然区室以外的其他亚细胞区室的多肽。当与其它编码序列融合时,翻译时产生的所得多肽可以比对RCA多肽部分所预测的多肽更大。
用于本发明方法中的另一种核酸变体是能够在降低的严格性条件下、优选在严格条件下与编码如本文中所定义的RCA多肽的核酸序列杂交,或与如本文中所定义的部分杂交的核酸。
用于本发明方法中的杂交序列编码这样的多肽序列,其从N端到C端包含:(i)质体转运肽,(ii)与SEQ ID NO:311所示AAA结构域具有至少60%、65%、70%、75%、80%、85%、90%、95%或98%(优选程度逐渐提高)的序列同一性;并且其可在AAA结构域内额外包含SEQ ID NO:312所示基序1G(G/R)KG(Q/E)GK(S/T)。该杂交序列一般具有至少900个连续核苷酸长度、优选至少1000个连续核苷酸长度、更优选至少1100个连续核苷酸长度并且最优选至少1200个连续核苷酸长度,其中所述的连续核苷酸是在表D1中给出的任何一种核酸序列。优选地,杂交序列是能够与表D1给出的任一核酸序列杂交或与任一这些序列的一部分杂交的序列,其中所述的一部分如上文所定义。最优选地,杂交序列能够与如SEQID NO:250所代表的核酸序列或与其部分杂交。
根据本发明,提供用于增强植物中产量相关性状的方法,包括在植物中引入并表达能够与表D1中给出的任何一种核酸杂交的核酸序列,或包括在植物中引入并表达这样的核酸序列,其能够与编码在表D1中给出的任一核酸序列的直向同源物、旁系同源物或同源物的核酸序列杂交。这些杂交序列编码天然存在的β(短形式,或SF)RCA多肽,或者编码C端延伸中发生截短或突变以阻止氧化还原反应调节的α(长形式,或LF)RCA多肽。术语“杂交”如本文所定义。
用于本发明方法中的另一种核酸变体是编码如上文所定义的RCA多肽的剪接变体。术语“剪接变体”如本文所定义。
根据本发明,提供用于增强植物中产量相关性状的方法,包括在植物中引入并表达在表D1中给出的任何一种核酸序列的剪接变体,或如此核酸的剪接变体,其中所述的核酸编码在表D1中给出的任一多肽序列的直向同源物、旁系同源物或同源物。这些核酸序列剪接变体编码天然存在的β(短形式,或SF)RCA多肽,或者编码C端延伸中发生截短或突变以阻止氧化还原反应调节的α(长形式,或LF)RCA多肽。
优选的剪接变体是由SEQ ID NO:250代表的核酸序列的剪接变体或编码SEQ ID NO:251的直向同源物或旁系同源物的核酸序列的剪接变体。优选地,由所述剪接变体编码的多肽序列包含任何一种或多种如本文中所定义的基序或结构域。
用于实施本发明方法中的另一种核酸变体是编码如上文所定义的RCA多肽的核酸序列的等位变体。等位基因或等位变体是给定基因的备选形式,位于相同染色体位置内。等位变体是天然存在的,并且这些天然等位基因的用途也包括在本发明方法中。等位变体包含单核苷酸多态性(SNP)和小插入/缺失多态性(INDEL)。INDEL的尺寸通常小于100bp。SNP和INDEL形成在大部分生物的天然存在的多态性株系中序列变体的最大集合。
根据本发明,提供用于增强植物中产量相关性状的方法,包括在植物中引入并表达在表D1中给出的任何一种核酸的等位变体,或包括在植物中引入并表达如此核酸序列的等位变体,其中所述的核酸序列编码在表D1中给出的任一多肽序列的直向同源物、旁系同源物或同源物。这些核酸序列的等位变体编码天然存在的β(短形式,或SF)RCA多肽,或者编码C端延伸中发生截短或突变以阻止氧化还原反应调节的α(长形式,或LF)RCA多肽。
优选地,该等位变体是SEQ ID NO:250的等位变体或编码SEQ IDNO:251的直向同源物或旁系同源物的核酸序列的等位变体。优选地,由所述等位变体编码的多肽序列包含任何一种或多种如本文中所定义的基序或结构域。
可用于本发明方法的其他核酸变体是通过定点诱变获得的核酸变体,其如本文“定义”部分中所定义。
根据本发明,提供用于增强植物中产量相关性状的方法,包括在植物中引入并表达在表D1中给出的任何一种核酸序列的变体,或包括在植物中引入并表达如此核酸序列的变体,其中所述的核酸序列编码在表D1中给出的任一多肽序列的直向同源物、旁系同源物或同源物,其中变体核酸通过定点诱变而获得。这些通过定点诱变获得的变体编码β(短形式,或SF)RCA多肽,或者编码C端延伸中发生截短或突变以阻止氧化还原反应调节的α(长形式,或LF)RCA多肽。
优选地,通过定点诱变而获得的变体核酸编码包含任何一种或多种如本文中所定义的基序或结构域的多肽序列。
以下编码RCA多肽的核酸变体是适于实施本发明方法的变体的实例:
(i)编码RCA多肽的核酸序列的部分;
(ii)能与编码RCA多肽的核酸序列杂交的核酸序列;
(iii)编码RCA多肽的核酸序列的剪接变体;
(iv)编码RCA多肽的核酸序列的等位变体;
(v)通过定点诱变获得的编码RCA多肽的核酸序列;
其中RCA多肽不受氧化还原反应调节。
编码RCA多肽的核酸序列可以衍生自任何天然来源或人工来源。核酸序列可以根据其天然形式就组成和/或基因组环境方面通过人类有意操作而加以修饰。优选地,编码RCA多肽的核酸序列来自光合细胞(植物界)。还优选编码RCA多肽的核酸序列来源于植物细胞。更优选编码RCA多肽的核酸序列来源于硅藻细胞。最优选编码RCA多肽的核酸序列来源于藻类(红、褐或绿)细胞。该核酸序列可分离自属于绿藻门(Chlorophyta)或轮藻门(Charophyta)的绿藻,或者分离自陆地植物(非维管植物或维管植物)。最优选编码RCA多肽的核酸序列来自莱茵衣藻。
在下文中对RCA多肽的任何提及因而意指如上文定义的RCA多肽。编码如此RCA多肽的任何核酸序列适用于实施本发明方法。
本发明也包括通过本发明方法可获得的植物或其部分(包括种子)。该植物或其部分包含编码如上文定义的RCA多肽的核酸转基因。
本发明还提供遗传构建体和载体以促进在植物中引入和/或表达用于本发明方法中的核酸序列。该基因构建体可以被插入适于转化至植物内并适于在转化的细胞中表达目的基因的载体,其中所述载体可以通过商业途径获得。本发明也提供如本文中所定义的基因构建体在本发明方法中的用途。
更具体地,本发明提供构建体,其包含
(a)编码如上文定义的RCA多肽的核酸序列;
(b)能够驱动(a)的核酸序列表达的一种或多种控制序列;和任选地
(c)转录终止序列。
优选的构建体是控制序列为强组成型启动子的构建体,更优选GOS2启动子,还优选稻GOS2启动子,最优选SEQ ID NO:306所示稻GOS2启动子。
或者,优选的构建体是控制序列为中等强度组成型启动子的构建体,更优选HMGB启动子,还优选SEQ ID NO:307所示稻HMGB启动子。
或者,优选的构建体是控制序列为绿色组织特异性启动子的构建体,更优选原叶绿素酸酯还原酶启动子,还优选SEQ ID NO:308所示稻原叶绿素酸酯还原酶启动子。
植物用包含目的序列的载体转化(即编码如上文定义的RCA多肽的核酸序列)。技术人员非常了解为成功转化、选择和增殖含有目的序列的宿主细胞而必须于载体上存在的遗传元件。目的序列与一种或多种控制序列(至少与启动子)有效连接。术语“调节元件”、“控制序列”和“启动子”如上文所定义。术语“有效连接”也如本文所定义。
有利地,任何类型的启动子都可以用来驱动核酸序列的表达。术语“启动子”指这样的核酸控制序列,其位于基因转录起点上游,并且参与RNA聚合酶及其他蛋白质的识别和结合,从而指导有效连接的核酸序列转录。“植物启动子”包含介导编码序列区段在植物细胞中表达的调节元件。因此,植物启动子不一定是植物来源的,而是可以源自病毒或微生物,例如来自侵袭植物细胞的病毒。“植物启动子”也可以源自植物细胞,例如来自用待于本发明方法中表达及在本文中描述的核酸序列所转化的植物。这也适用于其它“植物”调节性信号,如“植物”终止子。用于本发明方法中的核苷酸序列的启动子上游可以由一个或多个核苷酸替换、插入和/或缺失而受到修饰,但不干扰启动子、可读框(ORF)或3′调节区如终止子或远离ORF的其它3′调节区的功能性或活性。启动子的活性还有可能因修饰该启动子的序列或由更具活性的启动子、甚至来自异源生物的启动子彻底替换该启动子而增加。为在植物中表达,如上所述,核酸分子必须有效连接至或包含合适的启动子,其中所述的启动子在正确时间点上并以所需要的空间表达模式表达基因。
启动子可以是组成型启动子或诱导型启动子,例如胁迫诱导型启动子。或者,启动子可以是器官特异性或组织特异性启动子(多种启动子类型的定义和实例见本文的定义部分)。
在一个实施方案中,核酸序列与强组成型启动子有效连接。优选地,该启动子来自植物,如果待转化单子叶植物,则更优选该启动子来自单子叶植物。
在优选的实施方案中,组成型启动子是GOS2启动子,更优选稻GOS2启动子。最优选SEQ ID NO:306所示GOS2启动子。应当明白,本发明的适用性不限于由SEQ ID NO:250代表的RCA多肽编码核酸序列,同时本发明的适用性也不限于GOS2启动子驱动时RCA多肽编码核酸序列的表达。
或者,核酸序列与组成型启动子有效连接,优选HMGB启动子,更优选稻HMGB启动子。更优选HMGB启动子如SEQ ID NO:307所示。应当明白,本发明的适用性不限于由SEQ ID NO:250代表的RCA多肽编码核酸序列,同时本发明的适用性也不限于HMGB启动子驱动时RCA多肽编码核酸序列的表达。
根据另一优选的实施方案,编码RCA多肽的核酸与绿色组织特异性启动子有效连接,优选原叶绿素酸酯还原酶启动子,还优选稻原叶绿素酸酯还原酶启动子。最优选绿色组织特异性启动子如SEQ ID NO:308所示。应当明白,本发明的适用性不限于由SEQ ID NO:250代表的RCA多肽编码核酸序列,同时本发明的适用性也不限于原叶绿素酸酯还原酶启动子驱动时RCA多肽编码核酸序列的表达。可用于在植物中表达基因的其他绿色组织特异性启动子如DE-A 19644478所述。
为了鉴定功能等价启动子,可以分析候选启动子的启动子强度和/或表达模式,例如通过将该启动子与报告基因有效连接并测定该报告基因在多种植物组织中的表达水平和模式。合适的熟知报告基因包括如β-葡糖醛酸糖苷酶或β-半乳糖苷酶。通过测量β-葡糖醛酸糖苷酶或β-半乳糖苷酶的酶活性来测定启动子活性。接着可以将启动子强度和/或表达模式与参考启动子(例如用于本发明方法中的)进行比较。或者,可以通过定量mRNA水平或者将本发明方法中所用核酸序列的mRNA水平与持家基因(如18SrRNA)mRNA水平进行比较来测定启动子强度,其中使用本领域熟知的技术,通过放射自显影的光密度测定分析进行的Northern印迹、定量实时PCR或RT-PCR(Heid等,1996Genome Methods 6:986-994)。通常,“弱启动子”指驱动编码序列低水平表达的启动子。“低水平”指每个细胞中约1/10,000的转录物至约1/100,000的转录物至约1/500,0000的转录物的水平。相反,“强启动子”驱动编码序列高水平表达,或者每个细胞中约1/10的转录物至约1/100的转录物至约1/1000的转录物的水平。
任选地,可在引入植物的构建体中使用一个或多个终止子序列;术语“终止子”如本文所定义。其他调节元件可包括转录及翻译增强子。本领域技术人员会了解适于实施本发明的终止子和增强子序列。这些序列是已知的,或者可由本领域技术人员容易地获得。
也可将内含子序列添加至5′非翻译区(UTR)或编码序列上,以增加在细胞溶胶内积累的成熟信息的量。已经证实可剪接内含子在植物表达构建体和动物表达构建体中转录单位内的包含在mRNA水平及蛋白质水平上增加基因表达至多达1000倍(Buchman和Berg(1988)Mol.Cell biol.8:4395-4405;Callis等(1987)Gens Dev 1:1183-1200)。基因表达的此类内含子增强作用一般在位于转录单元5′端附近时最强烈。使用玉米内含子Adh1-S内含子1、2和6、Bronze-1内含子是本领域已知的。对于一般信息,见:The Maize Handbook,第116章,Freeling和Walbot编辑,Springer,N.Y.(1994)。
其它控制序列(除启动子、增强子、沉默子、内含子序列、3’UTR和/或5’UTR区之外)可以是蛋白质和/或RNA稳定元件。本领域技术人员会知道或可以容易地获得此类序列。
本发明的遗传构建体还可以包括需要用于在特定细胞类型中维持和/或复制的复制起点序列。一个实例是当需要将遗传构建体在细菌细胞中维持为附加型遗传元件(例如质粒或粘粒分子)时。优选的复制起点包括但不限于f1-ori和colE1。
为检测如在本发明方法中所用核酸序列的成功转移和/或选择包含这些核酸的转基因植物,使用标记基因(或报告基因)是有利的。因而,遗传构建体可以任选地包含选择标记基因。本文使用的术语“选择标记”、“选择标记基因”或“报告基因”包括向细胞赋予表型的任何基因,其中在所述的细胞内表达所述基因以促进鉴定和/或选择用本发明的核酸构建体所转染或转化的细胞。这些标记基因能够通过一系列不同原理鉴定核酸分子的成功转移。合适的标记可以选自赋予抗生素抗性或除草剂抗性、引入新代谢性状或允许目视选择的标记。选择标记基因的实例包括赋予抗生素抗性的基因(如使新霉素和卡那霉素磷酸化的nptII或使潮霉素磷酸化的hpt或赋予对例如博来霉素、链霉素、四环素、氯霉素、氨苄青霉素、庆大霉素、遗传霉素(Geneticin)(G418)、壮观霉素或杀稻瘟素的抗性的基因)、赋予除草剂抗性的基因(例如提供抗性的bar;提供草甘膦抗性的aroA或gox或赋予对例如咪唑啉酮、膦丝菌素或磺脲类的抗性的基因)或提供代谢性状的基因(如允许植物使用甘露糖作为唯一碳源的manA或利用木糖的木糖异构酶或抗营养标记如2-脱氧葡萄糖抗性)。目视标记基因的表达导致形成颜色(例如β-葡糖醛酸糖苷酶、GUS或β-半乳糖苷酶与其有色底物例如X-Gal)、发光(如萤光素/萤光素酶系统)或荧光(绿色荧光蛋白GFP及其衍生物)。这个名单仅代表少数的可能标记。技术人员熟悉此类标记。取决于生物和选择方法,优选不同的标记。
已知当核酸序列稳定或瞬时整合至植物细胞时,仅小部分的细胞摄取外来DNA并且根据需要将其整合至细胞基因组,这取决于所用表达载体和使用的转染技术。为鉴定并选择这些整合子,通常将编码选择标记(如上文所述之一)的基因连同目的基因一起引入宿主细胞。这些标记可以在其中这些基因因例如常规方法所致的缺失而无功能的突变体中使用。此外,编码选择标记的核酸分子可以引入宿主细胞中,与在包含编码本发明多肽或本发明方法中所用多肽的序列在同一载体上,或在单独的载体上。已经用引入的核酸序列稳定转染的细胞可以通过选择进行鉴定(例如具有整合的选择标记的细胞存活而其它细胞死亡)。
因为一旦已经成功引入了核酸序列,则转基因宿主细胞中就不再需要或不希望有标记基因,尤其抗生素抗性基因和除草剂抗性基因,因此用于引入核酸序列的本发明方法有利地使用能够去掉或切除这些标记基因的技术。一种如此方法称作共转化法。共转化法使用同时用于转化的两种载体,一种载体携带本发明的核酸序列而另一种载体携带标记基因。高比例的转化体接受,或在植物的情况下,包含(高达40%或更多的转化体)这两种载体。在用农杆菌转化的情况下,转化体通常仅接受载体的一部分,即侧翼有T-DNA的序列,它通常代表表达盒。标记基因随后可以通过进行杂交而从转化的植物中去掉。在另一种方法中,整合至转座子的标记基因用来与想要的核酸序列一起进行转化(称作Ac/Ds技术)。转化体可以与转座酶来源植物杂交或转化体用导致转座酶表达的核酸构建体瞬时或稳定地转化。在一些情况下(大约10%),转座子在已经成功发生转化时跳出宿主细胞的基因组并丢失。在其它更多情况下,转座子跳至不同位置。在这些情况下,标记基因必须通过进行杂交而去除。在微生物学中,开发了实现或促进检测这类事件的技术。又一个有利的方法依赖于重组系统;此方法的优势在于不必通过杂交去除。该类型的最知名系统称作Cre/lox系统。Cre1是去掉位于loxP序列之间序列的重组酶。若标记基因整合于loxP序列之间,则通过重组酶表达已经成功发生转化时,标记基因被去除。其它重组系统是HIN/HIX、FLP/FRT和REP/STB系统(Tribble等,J.Biol.Chem.,275,2000:22255-22267;Velmurugan等,J.Cell Biol.,149,2000:553-566)。有可能将本发明核酸序列以位点特异性方式整合至植物基因组。这些方法自然也可以应用至微生物如酵母、真菌或细菌。
本发明也提供相对于对照植物产生具有增强的产量相关性状的转基因植物的方法,包括在植物中引入并表达编码如上文所定义的RCA多肽的任何核酸序列。术语“转基因的”、“转基因”或“重组”如本文所定义。
更具体地,本发明提供用于产生相对于对照植物具有增加的产量相关性状的转基因植物的方法,所述方法包括:
(i)在植物或植物细胞中引入并表达编码RCA多肽的核酸;和
(ii)在促进植物生长和发育的条件下培育植物细胞。
核酸序列可以直接引入植物细胞或引入植物本身(包括引入组织、器官或植物的任何其它部分)。根据本发明的优选特征,核酸序列优选地通过转化引入植物。术语“引入”或“转化”如本文所定义。
除了转化体细胞(其随后必须再生成完整植物)之外,还有可能转化植物分生组织的细胞及特别转化发育成配子的那些细胞。在这种情况下,转化的配子遵循天然的植物发育过程,产生转基因植物。因此,例如拟南芥种子用农杆菌处理并且从发育植物中获得种子,其中一定比例的所述植物受到转化并且因此是转基因的[Feldman,KA和Marks MD(1987)Mol GenGenet 208:274-289;Feldmann K(1992)。在:编者C Koncz,N-H Chua和J Shell,Methods in Arabidopsis Research.Word Scientific,Singapore,第274-289页]。替代性方法基于反复去掉圆锥花序并使莲座叶丛中心中的切除部位与转化的农杆菌孵育,因而转化的种子同样可以在较晚的时间点获得(Chang(1994)Plant J.5:551-558;Katavic(1994)Mol Gen Genet,245:363-370)。然而,尤其有效的方法是改良的真空渗入法,如“花浸染”法。在拟南芥真空渗入法的情况下,完整植物在减压下用农杆菌混悬液处理[Bechthold,N(1993)。C R Acad Sci Paris Life Sci,316:1194-1199],而在“花浸染法”的情况下,正在发育的花组织与表面活性剂处理的农杆菌混悬液短暂孵育[Clough,SJ和Bent,AF(1998)The Plant J.16,735-743]。在两种情况下收获了一定比例的转基因种子,并且这些种子可以通过在如上所述的选择条件下培育而与非转基因种子区分。此外,质体的稳定转化是有利的,因为质体在大部分作物中以母体方式遗传,降低或消除了转基因经花粉流动风险。叶绿体基因组的转化一般通过已在Klaus等,2004[Nature Biotechnology 22(2),225-229]中示例性加以展示的方法实现。简而言之,待转化的序列连同选择标记基因一起克隆至与叶绿体基因组同源的侧翼序列之间。这些同源的侧翼序列指导位点特异性整合至原质体系内。已经对众多不同植物物种描述了质体转化并且综述可以出自Bock(2001)在基础研究和植物生物技术中的转基因质体(Transgenic plastids in basicresearch and plant biotechnology).J Mol Biol.2001年9月21日;312(3):425-38或Maliga,P(2003)质体转化技术商业化进展(Progress towardscommercialization of plastid transformation technology).TrendsBiotechnol.21,20-28。进一步生物技术进展最近已经以无标记质体转化体的形式作了报道,所述无标记质体转化体可以通过瞬时共整合的标记基因产生(Klaus等,2004,Nature Biotechnology 22(2),225-229)。
遗传修饰的植物细胞能够通过技术人员熟悉的任何方法再生。合适的方法可见于上述S.D.Kung和R.Wu、Potrykus或者和Willmitzer的出版物。
通常在转化以后,选出存在一个或多个标记的植物细胞或细胞群,所述标记由与目的基因共转移的植物可表达基因编码,继之将转化的材料再生成整个植物。为选择转化的植物,通常将在转化过程中获得的植物材料置于选择性条件下,从而可将转化的植物与非转化植物区分开来。例如,可以种植以上述方式获得的种子,并在最初的生长期之后,通过喷雾对其进行合适的选择。另一可能方案是使用合适的选择剂,将种子(适当时在灭菌之后)种在琼脂板上,从而仅转化的种子能够长成植物。可选地,针对转化的植物筛选可选择标记如上文所述标记的存在。
DNA转移和再生之后,还可评价推定转化的植物,例如用Southern分析(DNA印迹),评价目的基因的存在、拷贝数和/或基因组构造。备选地或额外地,可用Northern和/或Western分析监测新引入的DNA的表达水平,这两种技术都是本领域普通技术人员所熟知的。
产生的转化植物可以通过多种方式繁殖,如通过克隆繁殖或经典的育种技术。例如,第一代(或T1)转化的植物可自交,选择纯合的第二代(或T2)转化体,而T2植物可进一步通过经典育种技术繁殖。
产生的转化生物体可以有多种形式。例如,它们可以是转化细胞和非转化细胞的嵌合体;克隆的转化体(例如所有细胞经转化含有表达盒);转化和非转化组织的嫁接体(例如在植物中,转化的根状茎嫁接到非转化的接穗上)。
本发明显然延及由本文所述任何方法产生的任何植物细胞或植物,以及所有的植物部分及其繁殖体。本发明还延及由任何上述方法产生的原代转化或转染的细胞、组织、器官或整个植物的后代,唯一的要求是所述后代呈现出与在本发明方法中亲本产生的相同的基因型和/或表型特征。
本发明也包括宿主细胞,其含有编码如上文所定义的RCA多肽的分离核酸。本发明优选的宿主细胞是植物细胞。
宿主植物对于本发明方法中所用核酸序列或载体、表达盒或构建体或载体而言原则上有利地是能够合成本发明方法中所用多肽的全部植物。
为本发明目的,转基因植物因此如上理解为意指本发明方法中所用的核酸序列不位于所述植物基因组中该核酸序列的天然基因座内,所述核酸序列有可能同源或异源地表达。然而如所提及,转基因还意指尽管本发明核酸序列或在本发明方法中所用核酸处于植物基因组中该核酸的天然位置内,然而其序列相对于天然序列而言已经受到修饰,和/或所述天然序列的调节序列已经受到修饰。转基因优选地理解为意指本发明核酸序列在基因组中的非天然基因座内表达,即发生核酸序列的同源表达或优选异源表达。在本文中提到了优选的转基因植物。
本发明也扩展至植物的可收获部分如,但不限于种子、叶、果实、花、茎、根茎、块茎和球茎。本发明进一步涉及来自、优选直接来自这种植物的可收获部分中的产物,如干燥颗粒或粉末、油、脂肪及脂肪酸、淀粉或蛋白质。
用于提高核酸序列或基因或基因产物之表达的方法均已记载于本领域中,包括如通过适当的启动子驱动过表达,使用转录增强子或翻译增强子。作为启动子或增强子元件的分离的核酸序列可在非异源形式多核苷酸中的适当位置(一般为上游)引入,以上调表达。例如,可以通过突变、缺失和/或替换在体内改变内源启动子(参阅Kmiec,美国专利No.5,565,350;Zarling等,PCT/US93/03868),或者可将分离的启动子以正确的方向和与本发明基因的距离引入植物细胞中,以控制基因表达。
术语“表达”或“基因表达”指转录一个或多个特定基因或特定的遗传构建体。特别地,术语“表达”或“基因表达”指将一个或多个基因或遗传构建体转录成结构RNA(rRNA、tRNA)或mRNA,并将后者翻译或不翻译成蛋白质。该过程包括转录DNA和加工所得的mRNA产物。
术语“提高表达”指提高编码RCA多肽的核酸序列的表达,该表达提高导致该植物相对于对照植物增强的产量相关性状。优选地,核酸的表达提高为内源植物RCA多肽表达的1.25、1.5、1.75、2、5、7.5、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100或更多倍。
通过提高编码RCA多肽的核酸序列(在质体中的)表达,获得了RCA多肽量的提高。这种RCA多肽(在质体中)量的提高导致RCA活性提高。或者,活性也可以在RCA多肽量不变或者甚至是RCA多肽量减少的情况下提高。这可在多肽的固有特性改变时发生,例如通过产生比天然存在的多肽更具活性的突变体形式。
使用本领域熟知的技术在质体中提高编码RCA多肽的核酸序列的表达,例如通过使用转运肽序列将RCA多肽靶向至质体,或者通过将无转运肽序列的RCA多肽直接转化进质体。可以在任何质体中提高表达,但偏好在叶绿体中提高表达。
如果期望表达多肽,一般期望在多核苷酸编码区的3’末端包含多腺苷酸化区。多腺苷酸化区可来自该天然基因,来自多种其他植物基因,或者来自T-DNA。所加入的3’末端序列可来自例如胭脂碱合酶或章鱼碱合酶基因,或者来自其他植物基因,或者较不优选地来自任何其他真核基因。
还可以加入如上文所示的内含子序列。
其它控制序列(除启动子、增强子、沉默子、内含子序列、3’UTR和/或5’UTR区之外)可以是蛋白质和/或RNA稳定元件。
如上文所述,提高RCA多肽编码核酸序列之表达的优选方法是在植物中引入和表达编码RCA多肽的核酸序列;然而也可使用其他熟知的技术实现本方法的效果,即增强产量相关性状。现将对这些技术中的一些进行描述。
一种这样的技术是T-DNA激活标签化(Hayashi等Science(1992)1350-1353),其涉及在目的基因的基因组区域内或基因编码区上游或下游10kb处以如此结构插入T-DNA(通常含有启动子(也可以是翻译增强子或内含子)),使得启动子指导被靶定基因的表达。通常,由靶定基因的天然启动子对所述靶定基因表达的调节作用遭到破坏并且该基因处在新引入的启动子控制下。启动子一般嵌入在T-DNA中。这种T-DNA随机地插入植物基因组,例如通过农杆菌感染,并导致在所插入T-DNA附近的基因的改良表达。因靠近所引入启动子的基因的改良表达,产生的转基因植物表现显性表型。
还可以使用TILLING(基因组中靶向诱导的局部损伤)技术来再现本发明的效果。这是用于产生和/或鉴定核酸序列的诱变技术,其中所述的核酸序列编码具有修饰表达和/或活性的RCA多肽。TILLING还允许选择携带此类突变变体的植物。这些突变变体可以显示在强度方面或在位置方面或在时间方面改良的表达(例如若突变影响启动子)。这些突变变体可以显示比由处于其天然形式的基因所显出活性更高的RCA多肽活性。TILLING将高密度诱变与高通量筛选方法组合。一般在TILLING中遵循的步骤是:(a)EMS诱变(Redei GP和Koncz C(1992)在Methods inArabidopsis Research,Koncz C,Chua NH,Schell J,Singapore编辑,World Scientific Publishing Co,第16-82页;Feldmann等,(1994)在Meyerowitz EM,Somerville CR编辑,Arabidopsis.Cold Spring HarborLaboratory Press,Cold Spring Harbor,NY,第137-172页;Lightner J和Caspar T(1998)在J Martinez-Zapater,J Salinas编者,Methods onMolecular Biology第82卷.Humana Press,Totowa,NJ,第91-104页);(b)个体的DNA制备和汇集;(c)PCR扩增目的区;(d)变性和退火以允许形成异源双链体;(e)DHPLC,其中将异源双链体是否在汇集物中的存在检测为色谱图中的一个额外峰;(f)鉴定突变个体;和(g)对突变PCR产物测序。用于TILLING的方法是本领域众所周知的(McCallum等,(2000)NatBiotechnol 18:455-457;综述见Stemple(2004)Nat Rev Genet 5(2):145-50)。
还可以使用同源重组来再现本发明的效果,其允许选择的核酸序列在基因组中于确定的所选择位置内引入。同源重组是在生物科学中常规地用于低等生物如酵母或苔藓剑叶藓(Physcomitrella)的标准技术。用于在植物中开展同源重组的方法已经不仅对模式植物(Offringa等(1990)EMBO J9(10):3077-84)而且对作物植物例如稻(Terada等(2002)Nat Biotech20(10):1030-4;Iida和Terada(2004)Curr Opin Biotech 15(2):132-8)进行了描述。
在本文中对增强的产量相关性状的提及意指植物的一个或多个部分的生物量(重量)增加,所述的部分可以包括地上(可收获)部分和/或地下(可收获)部分。特别地,这些可收获部分为种子,并且实施本发明方法导致植物与对照植物的种子产量相比具有提高的种子产量。术语“产量”和“种子产量”如本文所定义。术语“提高的”、“改善的”、“增强的”也如本文所定义。
特别地,增强的产量相关性状选自以下一种或多种:(i)提高的早期萌发势;(ii)提高的地上部分生物量;(iii)开花时间更早;(iv)(饱满)种子数增加;和(v)提高的TKW。
以玉米为例,产量增加可以表现为下列一种或多种指标:每公顷或英亩中已建立植物数的增加、每株植物穗数的增加、行数的增加、每行粒数、粒重、千粒重、玉米穗长度/直径、种子饱满率的增加(其中种子饱满率是饱满种子数除以种子总数并乘以100)及其它。以稻为例,产量增加本身可以表现为下列一种或多种指标的增加:每公顷或英亩植物数、每株植物圆锥花序数、每圆锥花序小穗数、每圆锥花序花(小花)数(其表达为饱满种子数对原圆锥花序数之比)、种子饱满率的增加(其中种子饱满率是饱满种子数除以种子总数并乘以100)、千粒重的增加及其它。
增强的产量相关性状还可导致改变的结构,或者可由于改变的结构而发生。
由于本发明的转基因植物具有增强的产量相关性状,因而相对于对照植物的生长速率,这些植物有可能在其生活周期中的对应阶段上表现增加的生长速率(在其生活周期的至少部分期间)。增加的生长速率可以对于植物的一个或多个部分(包括种子)是特异性的,或可以基本上遍及整株植物。具有增加的生长速率的植物可以具备较短的生活周期。植物的生活周期可以视为意指从干燥成熟种子成长至植物已经产生与起始材料相似的干燥成熟种子的阶段所需要的时间。这个生活周期可以受下列因素影响,如早期萌发势、生长速率、绿度指数、开花时间和种子成熟速度。生长速率的增加可以在植物生活周期中的一个或多个阶段上或在基本上整个植物生活周期期间发生。在植物生活周期中的早期期间增加的生长速率可以反映增强的萌发势。生长速率的增加可以改变植物的收获周期,允许植物较晚播种和/或较早收获,否则这将不可能(相似的作用可以用较早的开花时间获得)。若生长速率充分地增加,可以允许进一步播种相同植物物种的种子(例如播种并收获稻植物,随后播种并收获其它稻植物,全部稻植物均在一个常规生长时段内)。类似地,若生长速率足够地增加,可以允许进一步播种不同植物物种的种子(例如播种并收获玉米植物,随后例如播种并任选收获大豆、马铃薯或任何其它合适植物)。从相同的根茎中收获额外次数在一些作物植物的情况中也是可能的。改变植物的收获周期可以导致每英亩的年生物量产量的增加(因任何特定植物可以生长并收获的次数(如在一年中)增加)。生长速率的增加也可以允许比其野生型对应物在更广泛的地理区域内培育转基因植物,因为对培育作物的区域限制往往由栽种时节(早季)或在收获时期(晚季)的不利环境条件所决定。若缩短收获周期,则可以避开这类不利条件。生长速率可以通过从生长曲线中得到多种参数而确定,此类参数可以是:T-Mid(植物达到其50%最大尺寸所花费的时间)和T-90(植物达到其90%最大尺寸所花费的时间),等等。
根据本发明的优选特征,本发明方法的实施产生相对于对照植物而具有增加的生长速率的植物。因而根据本发明,提供增加植物生长速率的方法,所述方法包括在植物中增加核酸序列的表达,所述核酸序列编码如本文所定义的RCA多肽。
与对照植物相比,无论植物处于非胁迫条件下还是植物暴露于多种胁迫下,都发生增强的产量相关性状和/或生长速率的增加。植物一般通过生长得更慢而对暴露于胁迫作出应答。在严重胁迫条件下,植物甚至可以完全停止生长。另一方面,轻微胁迫在本文中定义为植物对其暴露的任何胁迫,其中所述的胁迫未导致植物完全停止生长而没有恢复生长的能力。与非胁迫条件下的对照植物相比,轻微胁迫在本发明意义中导致受胁迫植物生长降低小于40%、35%或30%,优选小于25%、20%或15%,更优选小于14%、13%、12%、11%或10%或更低。由于农业实践(灌溉、施肥、杀虫剂处理)上的进步,在栽培作物植物中并不经常遇到严重胁迫。因此,由轻微胁迫诱导的受损生长往往是农业上不希望的特征。轻微胁迫是植物暴露的常见生物性和/或非生物性(环境)胁迫。非生物胁迫可以因干旱或水涝、厌氧胁迫、盐胁迫、化学毒性、氧化胁迫和热、寒冷或冰冻温度所致。非生物胁迫可以是由水胁迫(尤其因为干旱)、盐胁迫、氧化胁迫或离子胁迫引起的渗透胁迫。生物胁迫一般是由病原体如细菌、病毒、真菌和昆虫引起的那些胁迫。
尤其,本发明的方法可以在非胁迫条件下或在轻微干旱条件下实施以产生相对于对照植物而具有增强的产量相关性状的植物。如在Wang等(Planta(2003)218:1-14)中报道,非生物胁迫导致不利地影响植物生长及生产力的一系列形态学变化、生理学变化、生物化学变化和分子变化。已知干旱、盐度、极端光照条件(低或高或可变(varaibale)波长)、极端温度(高或低)和氧化胁迫是相互联系的并可以通过相似机制而诱导生长损害及细胞损害。Rabbani等(Plant Physiol(2003)133:1755-1767)描述了干旱胁迫与高盐度胁迫间极高程度的“交叉(cross talk)”。例如,干旱和/或盐化作用主要表现为渗透胁迫,导致细胞内稳态和离子分布的破坏。经常伴随高温或低温、盐度或干旱胁迫的氧化胁迫可以造成功能性蛋白和结构蛋白变性。因此,这些多样的环境胁迫常常激活相似的细胞信号途径和细胞应答,如产生胁迫蛋白质、上调抗氧化物质、积累相容性溶质和生长抑制。如本文中所用的术语“非胁迫”条件是允许植物最佳生长的环境条件。本领域技术人员清楚对于给定地点的正常土壤条件和气候条件。
本发明方法的实施相对于在可比条件下培育的合适对照植物,赋予在非胁迫条件下或在轻微干旱条件下培育的植物增强的产量相关性状。因而根据本发明,提供用于在非胁迫条件下或在轻微干旱条件下培育的植物中增强产量相关性状的方法,所述方法包括增加编码RCA多肽的核酸序列在植物中表达。
在本发明优选的实施方案中,产量相关性状的增强和/或生长速率的增加根据本发明方法在非胁迫条件下出现。
本发明方法的实施导致在非生物胁迫条件下培养的植物相对于相当条件下培养的对照植物具有提高的产量相关性状。如在Wang等(Planta(2003)218:1-14)中报道,非生物胁迫导致不利地影响植物生长及生产力的一系列形态学变化、生理学变化、生物化学变化和分子变化。已知干旱、盐度、极端温度和氧化胁迫是相互联系的并可以通过相似机制而诱导生长损害及细胞损害。Rabbani等(Plant Physiol(2003)133:1755-1767)描述了干旱胁迫与高盐度胁迫间极高程度的“交叉”。例如,干旱和/或盐化作用主要表现为渗透胁迫,导致细胞内稳态和离子分布的破坏。经常伴随高温或低温、盐度或干旱胁迫的氧化胁迫可以造成功能性蛋白和结构蛋白变性。因此,这些多样的环境胁迫常常激活相似的细胞信号途径和细胞应答,如产生胁迫蛋白质、上调抗氧化物质、积累相容性溶质和生长抑制。由于不同的环境胁迫激活相似的途径,因此本发明就干旱胁迫进行的示例不应看作局限在干旱胁迫,而是更应看作为筛选,其表明上文定义的RCA多肽在一般性非生物胁迫下参与相对于在相当胁迫条件下培养的对照植物而提高产量相关性状。
本文定义的“术语非生物胁迫”指以下任何一种或多种:水胁迫(由于干旱或水过多)、厌氧胁迫、盐胁迫、温度胁迫(由于热、冷或冰冻温度)、化学毒性胁迫和氧化胁迫。根据本发明的一个方面,非生物胁迫是渗透胁迫,其选自水胁迫、盐胁迫、氧化胁迫和离子胁迫。优选地,水胁迫为干旱胁迫。术语“盐胁迫”不仅限于常见盐(NaCl),而是可以为由以下一种或多种引起的任何胁迫:NaCl、KCl、LiCl、MgCl2、CaCl2等。
本发明方法的实施赋予在非生物胁迫条件下植物相对于在相当条件下培养的对照植物而言具有提高的产量相关性状。因此,根据本发明,提供了在非生物胁迫条件下培养的植物中提高产量相关性状的方法,该方法包括在植物中提高编码RCA多肽的核酸序列的表达。根据本发明的一个方面,非生物胁迫是渗透胁迫,其选自以下一种或多种:水胁迫、盐胁迫、氧化胁迫和离子胁迫。
非生物环境胁迫的另一实例是植物生长和发育的同化所需的一种或多种养分利用度的降低。由于养分利用效率对植物产量和产品质量有显著影响,因此在田间倾倒了大量肥料来优化植物生长和质量。植物的生产力一般受限于三种主要养分:磷、钾和氮,在这三者中,氮通常是植物生长的限速元素。因此,植物生长所需的主要营养元素是氮(N)。这是可见于活细胞中的多种重要化合物的组分,所述化合物包括氨基酸、蛋白质(酶)、核酸和叶绿素。植物干物质的1.5%至2%以及总植物蛋白质的约16%是氮。因此,氮的利用度是作物植物生长和生产的主要限制因素(Frink等(1999)Proc Natl Acad Sci USA 96(4):1175-1180),并也对蛋白质积累和氨基酸组成有重大影响。因此,在氮有限条件下培养时具有提高的产量相关性状的作物植物是很有意义的。
本发明方法的实施赋予在养分利用度降低条件下(特别是在减少的氮利用度的条件下)培养的植物相对于在相当条件下培养的对照植物而言提高的产量相关性状。因此,根据本发明,提供了在养分利用度降低条件下(优选在降低的氮利用度的条件下)培养的植物中提高产量相关性状的方法,该方法包括在植物中提高编码RCA多肽的核酸序列的表达。降低的养分利用度可能是由于养分(如氮、磷酸和其他含磷化合物、钾、钙、镉、镁、锰、铁和硼等)的缺少或过剩所致。优选地,降低的养分利用度是降低的氮利用度。
本发明的方法有利地应用于任何植物,术语“植物”如本文所定义。
根据本发明优选的实施方案,植物是作物植物。作物植物的实例包括大豆、向日葵、芸苔、苜蓿、油菜、棉花、番茄、马铃薯和烟草。还优选地,植物是单子叶植物。单子叶植物的实例包括甘蔗。更优选地,植物是谷物。谷物的实例包括稻、玉米、小麦、大麦、粟、黑麦、高粱和燕麦。
本发明也包括编码本文中所述RCA多肽的核酸序列的用途和这些RCA多肽的用途,用于增强植物中的产量相关性状。
编码本文中所述RCA多肽的核酸序列或RCA多肽本身可以用于育种程序中,其中鉴定到可以遗传地与编码RCA多肽的基因连锁的DNA标记。所述基因/核酸序列或RCA多肽本身可以用来定义分子标记。这种DNA或多肽标记随后可以在育种程序中用来选择具有本发明方法中如上文所定义的增强的产量相关性状的植物。
编码RCA多肽的基因/核酸序列的等位变体也可以用于标记辅助的育种程序中。这种育种程序有时需要通过使用例如EMS诱变法对植物作诱变处理而引入等位基因变异;备选地,该程序可以从非人为引起的所谓“自然”起源的一组等位变体开始。随后进行等位变体的鉴定,例如通过PCR法。此后是用于选择所讨论及导致增强的产量相关性状的序列的优异等位变体的步骤。一般通过监测含有所讨论序列的不同等位变体的植物的生长性能而实施选择。可以在温室中或田间监测生长性能。其它任选步骤包括将鉴定了优异等位变体的植物与另一种植物杂交。这可以用来例如产生目标表型特征的组合。
编码RCA多肽的核酸序列也可以用作探针以便对基因进行遗传作图和物理作图,所述探针作为所述基因的一部分及与这些基因关联的性状的标记。此类信息可以用于植物育种中,以便开发具有想要表型的株系。编码RCA多肽的核酸序列的这种用途仅需要具有至少15个核苷酸长度的核酸序列。编码RCA多肽的核酸序列可以用作限制性片段长度多态性(RFLP)标记。限制性消化的植物基因组DNA的Southern印迹(Sambrook J,Fritsch EF和Maniatis T(1989)Molecular Cloning,A Laboratory Manual)可以用编码RCA多肽的核酸序列来探测。产生的结合图式随后可以使用计算机程序如MapMaker(Lander等(1987)Genomics 1:174-181)进行遗传分析以构建遗传图。此外,该核酸序列可以用来探测含有经限制性内切核酸酶处理的一组个体的基因组DNA的Southern印迹,其中所述的一组个体代表具有确定的遗传杂交的亲代和后代。DNA多态性的分离被标出并用来计算编码RCA多肽的核酸序列在使用这个群体先前所获得的遗传图中的位置(Botstein等(1980)Am.J.Hum.Genet.32:314-331)。
在Bernatzky和Tanksley(1986)Plant Mol.Biol.Reporter 4:37-41中描述了植物基因衍生的探针的产生和其在遗传作图中的用途。众多出版物描述了使用以上所提及的方法学或其改良方法对特定cDNA克隆的遗传作图。例如,F2互交群、回交群、随机交配群、邻近纯合系和其它个体群体可以用于作图。此类方法学是本领域技术人员众所周知的。
所述核酸探针也可以用于物理作图(即序列在物理图上的排列;见Hoheisel等在:Non-mammalian Genomic Analyasis:A Practical Guide,Academic press 1996,第319-346页及其中引用的参考文献)。
在另一实施方案中,核酸探针可以在直接荧光原位杂交(FISH)作图法(Trask(1991)Trends Genet.7:149-154)中使用。尽管当前的FISH作图法支持使用大型克隆(几个kb至几百个kb;见Laan等(1995)Genome Res.5:13-20),然而灵敏度的改善可以允许使用更短探针进行FISH作图。
用于遗传作图及物理作图的多种基于核酸扩增的方法可以使用所述核酸序列而实施。实例包括等位基因特异的扩增法(Kazazian(1989)J.Lab.Clin.Med 11:95-96)、PCR扩增片段的多态性(CAPS;Sheffield等(1993)Genomics 16:325-332)、等位基因特异性连接(Landegren等(1988)Science241:1077-1080)、核苷酸延伸反应(Sokolov(1990)Nucleic Acid Res.18:3671)、放射杂交作图(Walter等(1997)Nat.Genet.7:22-28)和Happy作图法(Dear和Cook(1989)Nucleic Acid Res.17:6795-6807)。对于这些方法,使用一种核酸的序列来设计并产生在扩增反应或在引物延伸反应中使用的引物对。此类引物的设计是本领域技术人员众所周知的。在使用基于PCR遗传作图的方法中,可能必须鉴定在对应于当前核酸序列的区域内作图交叉亲代间的DNA序列差异。然而,这对于作图法而言通常不是必需的。
本发明方法产生具有如前文所述的产量提高相关性状的植物。这些性状也可以与其它经济有利的性状组合,如其它的产量增强性状、对其它非生物胁迫和生物胁迫的耐性、调节多种构造性特征和/或生物化学特征和/或生理学特征的性状。
附图简述
现将参考以下附图描述本发明,其中:
图1显示了SEQ ID NO:2所代表CCA1蛋白的结构域结构。SANT结构域以带下划线的粗体给出。SANT结构域中的基序1和2以带下划线的粗斜体标出。基序3、4和5以带下划线的斜体标出。
图2显示了CCA1蛋白多重比对的系统树。可容易地识别出图1所示基序,并可使用该比对定义新基序。
图3显示用于提高GOS2启动子控制下的拟南芥CCA1样蛋白质编码核酸在稻中表达的二元载体。
图4详细举例了可用于实施本发明方法的CCA1序列。
图5显示了γVPE的结构域结构。图5A是示意图,其中(从左至右)斜线框代表用于插入内膜系统的信号肽;白色框代表N端抑制性结构域;点框代表活性结构域;灰色框代表羧基抑制性结构域。组氨酸-半胱氨酸催化二联体的位置以“H”和“C”标出。图5B显示该结构域在蓖麻子VPE与SEQ ID NO:150之间序列比对中的位置。双线代表信号肽,实黑线代表活性肽,黑色箭头表示推定发生自催化加工而产生成熟活性肽的天冬氨酸残基,保守性Hys和Cys残基加框表示。下划线为点的是胱天蛋白酶中保守的活性五肽。
图6显示了(A)肽酶超家族多肽的系统树。VPE肽酶聚类与CA、CF或CE分支(clan)的肽酶分离。VPE多肽聚类成四个亚类:α、β、γ和δ,α和β是最密切相关的;(B)VPE的比对,最高序列保守性见于肽酶结构域中。
图7显示了用于提高稻WSI18基因启动子控制下的拟南芥VPE编码核酸在稻中表达的二元载体。
图8显示了可用于本发明方法的VPE序列。
图9显示了SAP样多肽中的结构域结构及其各自位置,基序1为SAP样结构域。
图10显示了SAP与SAP样多肽的系统树和序列比对。SAP多肽的进化枝以单线加框;双线框是SAP样多肽的进化枝。图10B显示了SAP样多肽的比对。
图11显示了用于提高稻RCC3启动子(pRCC3)控制下的稻SAP样蛋白编码核酸在稻中表达的二元载体。
图12详细示例了可用于实施本发明方法的SAP序列。
图13显示了RCA活化RuBisCo的模型。糖磷酸抑制剂与RuBisCo大亚基的活性位点结合,从而封闭它们。RCA将通过ATP水解而寡聚化,并结合Rubisco以形成超复合体,其以16个RCA亚基环绕的RuBisCo大亚基和小亚基组成。这种结合导致了构象改变,这将引起释放各个RCA亚基,释放抑制剂并打开RuBisCo活性位点(更详细的解释参见Portis(2003)Photosynthesis Research 75:11-27)。
图14显示了RCA多肽中包含的重要特征,即用于质体靶向的转运肽、AAA结构域以及用于核苷酸结合的P环三磷酸结合环共有序列G(G/R)KG(Q/E)GK(S/T),其对应于SEQ ID NO:312所示的基序1。
图15显示了RCA多肽的比对。使用来自Vector NTI套装(InforMax,Bethesda,MD)的AlignX程序比对序列。使用空位开放罚分10和空位延伸0.01进行多重比对。真核RCA多肽之间序列保守的起点以括号显示(该括号N端上游的氨基酸序列被认为包含用于质体亚细胞靶向的转运肽),如AAA结构域的起点和终点。P环加框显示,对应于SEQ ID NO:312显示的基序1。C端延伸的起点也以括号标出。
图16显示了用于提高组成型启动子控制下或绿色组织特异性启动子控制下的莱茵衣藻RCA多肽编码核酸序列在稻中表达的二元载体。
图17详细示例了可用于实施本发明方法的RCA序列。
图18显示SEQ ID NO:322的序列,含有带下划线的富含F(富含苯丙氨酸)和富含C(富含半胱氨酸)区。框内是称为本征无序态的四个结构域。
图19显示来自多个物种的SYPF1多肽的CLUSTAL W多重序列比对。以基序I、II和III显示的保守区加框显示。
图20显示包含SYP1多肽序列的系统树。与SEQ ID NO:322的序列聚类的序列可用于实施本发明的方法。
图21显示用于提高HMG启动子控制下的拟南芥SYPF1蛋白编码核酸在稻中表达的二元载体。
图22详细示例了可用于实施本发明方法的SYPF1序列。
实施例
现将参考以下仅用于说明的实施例来描述本发明。以下实施例不旨在完整的定义或以其他方式限定本发明的范围。
第I部分CCA1
实施例1:鉴定与SEQ ID NO:1和SEQ ID NO:2的CCA1相关的序列。
使用数据库序列检索工具,如基本局部比对工具(BLAST)(Altschul等(1990)J.Mol.Biol.215:403-410;和Altschul等(1997)Nucleic Acids Res.25:3389-3402)在国家生物技术信息中心(NCBI)的Entrez核苷酸数据库中所维护的那些序列内鉴定到与SEQ ID NO:1相关的序列(全长cDNA、EST或基因组)和/或与SEQ ID NO:2相关的蛋白质序列。该程序用来通过核酸序列或多肽序列与序列数据库比较并通过计算匹配的统计学显著性而找到序列间具有局部相似性的区域。对SEQ ID NO:1所编码的多肽使用TBLASTN算法,采用默认设置和过滤以忽略低复杂性序列启动(set off)。分析的结果通过配对性比较显示,并根据概率评分(E-值)排序,其中该评分反映特定比对结果因偶然而发生的概率(E-值越低,命中的显著性越高)。除了E-值外,比较还通过同一性百分数进行记分。同一性百分数指两个所比较核酸(或多肽)序列之间在特定长度范围内的相同核苷酸(或氨基酸)数目。在一些情况下,可以调整默认参数以调节检索的严格性。
表A提供了与SEQ ID NO:1所示核酸序列及SEQ ID NO:2所示蛋白质序列相关的核酸及蛋白质序列的列表。
表A:与可用于本发明方法的核酸序列(SEQ ID NO:1)相关的核酸序列,及其相应推导的多肽。
实施例2:相关多肽序列的比对
来自Vector NTI(Invitrogen)的AlignX是基于流行的逐步比对的聚类算法(Thompson等(1997)Nucleic Acids Res 25:4876-4882;Chenna等(2003).Nucleic Acids Res 31:3497-3500)。可以使用邻接聚类算法来构建系统树。默认值为空位开放罚分10,空位延伸罚分0.1,选定的权重矩阵为Blosum 62(如果比对多肽的话)。
使用相关多肽鉴定可用于实施本发明方法的序列的多重序列比对结果示于图2。将对用于多重比对的序列的选择用作计算系统树的输入数据。尽管几乎没有总体序列保守性(见实施例3),但可以区分出高度保守的区域,例如SEQ ID NO:141至145的基序,但该比对也可产生其他基序。
实施例3:计算可用于实施本发明方法的多肽序列之间的全局百分比同一性。
使用本领域可获得的方法之一MatGAT(矩阵全局比对工具)软件(BMC Bioinformatics.20034:29.MatGAT:an application that generatessimilarity/identity matrices using protein or DNA sequences.CampanellaJJ,Bitincka L,Smalley J;软件由Ledion Bitincka提供)确定用于实施本发明方法的全长多肽序列之间全局相似性百分数和同一性百分数。MatGAT软件为DNA序列或蛋白质序列产生相似性/同一性矩阵,无需数据的预比对。该程序使用Myers和Miller全局比对算法(空位开放罚分12和空位延伸罚分2)执行一系列逐对比对,使用例如Blosum 62(对于多肽)计算相似性和同一性并且随后将结果置于距离矩阵中。序列相似性在分界线的下半部分中显示,序列同一性在对角分界线的上半部分中显示。
比较中所用的参数是:
评分矩阵:Blosum62
第一空位:12
延伸空位:2
多肽序列(排除部分多肽序列)全长上的全局相似性和同一性软件分析结果在表A1中显示。同一性百分数在对角线之上以粗体给出并且相似性百分数在对角线之下给出(普通字体)。
与SEQ ID NO:2相比,用于实施本发明方法的多肽序列之间的同一性百分数可以低到9%氨基酸同一性。
表A1:多肽序列全长的全局相似性及同一性的MatGAT结果
  1   2   3   4   5   6   7   8   9   10   11   12   13
  1.SEQID2   42.4   17.2   16.3   16.9   17.4   18.8   21.6   12.5   11.9   11.3   19.4   13
  2.SEQID4   57.8   16.4   15.3   15.1   14.9   16.4   21.5   12.1   11   11.3   18.8   11.9
  3.SEQID6   25.5   25.4   44.2   47.4   43.8   69.8   25.3   17.5   14.4   14.3   25.9   21.3
  4.SEQID8   25.7   24.5   57.6   44.9   46.6   47.6   25.9   18.8   18.8   19.2   27.5   19.7
  5.SEQID10   25   24.7   61.1   61.8   58.8   47.5   27   17   18.6   19.1   26.3   19.2
  6.SEQID12   25.5   24.5   57.6   60.9   73.2   44.8   26.2   15.8   16.7   17.6   26.8   19.8
  7.SEQID14   26.3   24.7   78.5   57   59.6   56.6   26.9   15.2   16.6   14.6   26.5   20.6
  8.SEQID16   32.6   31.3   41.6   42.5   42.5   44.8   43.1   16.8   17   15.2   88.1   15.5
  9.SEQID18   22.2   20.5   29.4   30.9   35.9   29.1   29.8   29.5   39   55.9   16.1   25.9
  10.SEQID20   19.4   18   29   30.9   36.2   32.5   31.2   27.7   51.2   40.6   17.7   24.9
  11.SEQID22   20.1   19.1   33.1   33.3   34.1   33.1   34.4   31.5   69.8   54   15.2   28
  12.SEQID24   30.8   28.7   43.5   44   41.7   42.6   42.6   92.2   29.8   30.7   31.8   18.2
  13.SEQID26   20.1   20.5   38.2   32.1   36.6   35.8   36.9   31.8   41.8   41.1   42.5   32.7
  14.SEQID28   16.4   17.8   29.7   27   30   27.8   33   23.7   35.8   37.2   37.4   23.5   40.4
  15.SEQID30   25.2   22.2   30.5   35.1   27.6   29.7   26.6   29.2   44.7   42.1   42.1   30.2   32.8
  16.SEQID32   15.6   16.3   29.4   24.8   26.5   27.8   28   27.5   37.5   33   38.1   28   54.7
  17.SEQID34   28.5   28.4   46.1   42.4   46.7   43   46.3   51.7   30   30   28.9   49.1   29.3
  18.SEQID36   23.2   23.6   33.7   34   33.2   35.3   34   38.4   43.6   45.2   41.6   33.2   32.6
  19.SEQID38   18.8   17.1   27.3   30.3   27.5   34.1   35.1   27.7   44.2   47.9   48.3   26.8   36.2
  20.SEQID40   23.2   21.4   30.9   35.8   32.5   37.2   29.3   28.9   43.8   45.7   44.5   36   39.4
  21.SEQID42   28.9   25.7   52.3   50.9   52.6   52.6   51.3   41.3   28.8   30.1   28.4   40.5   28.4
  22.SEQID44   22.5   23.3   33.3   30.6   31.1   32.5   32.2   33.6   42.9   44.3   41   32   34.7
  23.SEQID46   20.9   20.9   35.5   37.3   39   36.5   30.6   30.3   46.5   46.8   47.1   30.7   36.8
  24.SEQID48   20.9   19.5   24.6   27.3   25.6   23.8   27.9   27.7   42.5   49.2   43.5   26.5   37.2
  25.SEQID50   20.2   20   28   28.5   31.4   29.1   34   30.9   38.6   31.9   29.7   29.8   38.3
  26.SEQID52   22.9   22   45.4   41.2   42.5   46   46.1   38.2   29.8   29.5   29.4   37.2   34.1
  27.SEQID54   20.2   19.1   30   29.7   30.3   29.8   31.4   30.9   47.4   53   51.2   29.5   40.8
  28.SEQID56   21.4   18.4   27   28.8   30.3   28.5   28.7   26   45.3   48.5   48.5   28.9   37.3
  29.SEQID58   21.9   20.5   26.5   28.5   30.2   26.2   25.5   25.7   38   38.9   37.4   31.3   35.5
  30.SEQID60   24.3   22.5   27.7   27.9   25.6   29.7   25.6   30.7   32.7   29.4   33.5   31.7   32.7
  31.SEQID62   20.7   20.8   29.5   30   26.5   27.2   25.8   30.1   36.2   32.6   35.6   30.1   36.9
  32.SEQID64   22.7   21.4   29.6   29.6   28.5   28.5   29.8   33.4   29.3   28.5   32.3   30.9   32.9
  33.SEQID66   13.7   14   30.4   29.1   31.4   33.8   31.6   22   21.8   30.7   28.3   23.5   22.6
  34.SEQID68   24.2   24   30.3   32.1   29.2   31.9   32.1   31.3   38.4   39.7   36   32.4   32.6
  35.SEQID70   25.2   23.4   33.6   37.2   32.7   37.5   33   34.1   42.2   37.8   41.9   35.4   34.5
  36.SEQID72   52.3   54.2   22.5   24.2   21.1   23.1   23.5   27.1   18.2   17.9   17.2   25.9   18.5
  37.SEQID74   21.2   21.4   40.6   36.7   30.8   38.7   38.1   33.8   46.5   48.1   47.2   37.8   34
  38.SEQID76   21.7   18.1   37.5   34.2   38.3   36.1   37.2   28   43.9   45.7   47.5   33.6   41.5
  39.SEQID78   36.8   34.4   30.8   32   31.8   33   31   40.1   24.4   23   22.6   38.3   22.2
  40.SEQID80   39.6   36.3   32.8   34.3   29.6   31.7   32.2   41.5   25.7   24.6   21.8   40   24.2
  41.SEQID82   37.5   34.4   35.3   37.3   34.4   35.7   35   43.9   27.7   26.6   24.8   42.6   29.5
  42.SEQID84   52.6   50.1   28.7   29.4   27.3   28.3   27.2   35.2   21.2   21.3   22.1   33   24.2
  43.SEQID86   52   53.3   27.4   26.7   25.6   27.2   27.2   33.9   20.5   20   20.1   30.6   20.1
  44.SEQID88   54   58.9   22.3   22.1   19.5   20.2   20.2   25.3   16.8   17.4   18.5   25.4   18.4
  45.SEQID90   53.1   61   23.4   22.7   21.3   22.4   21.3   27.7   18.4   16.9   16.2   26.4   18.7
  46.SEQID94   52.4   58.1   22.6   23.3   20.4   22.1   20.3   27.2   18.1   18.4   16.9   25.4   16.6
  47.SEQID96   50.7   55.1   21.8   22.7   21.3   22.4   20.7   26   19.2   16.7   17.3   24.9   16.9
  48.SEQID100   50   47.9   33.6   34.9   32.4   31.3   32.9   40.5   26.6   25   24.1   38.3   27
  49.SEQID102   30.3   30.4   44.7   44.8   46.3   41.4   48.6   43.6   29.8   36.1   31.8   42.6   30.3
  50.SEQID104   48.5   47.1   31.4   31.6   31.8   33.6   34.3   41.3   26   23.9   21.7   39.3   25.5
  51.SEQID106   35.7   33.6   36.5   38.5   35.1   36.2   33.7   46.6   26.4   24.1   24.1   45.2   27.5
  52.SEQID108   36.5   35.7   32.3   34.7   31.2   32.7   34.1   43.4   25.4   26.9   26.3   42.3   25.2
  53.SEQID110   28.3   25.4   44.7   42.7   44.9   42.1   46   49.4   38.3   37.3   32.1   47.3   39
  54.SEQID124   27.6   25.6   61.6   72.7   60.7   61.9   58.5   47.4   30.3   28.5   32.8   46.1   33.4
  55.SEQID126   26.8   25.1   64.5   62.1   66.2   63.9   65.7   43.4   32.2   32.5   31.8   42.3   31.4
  56.SEQID134   27.1   28.2   55.9   68.6   63.1   63.7   59.8   46.2   32   27.2   34.7   45.2   33.5
  57.SEQID140   24.8   23.3   70.6   55.2   58.2   57   78   40.8   34   29.3   37.6   40.8   39
表A1续
  14   15   16   17   18   19   20   21   22   23   24   25   26
  1.SEQID2   10   14.1   9   20.2   12.2   12.5   12.5   19.9   13.3   13.7   13.5   12   16.6
  2.SEQID4   9.9   11.7   10.5   21   13.3   10.5   13   18.1   12.7   12.4   10.2   11.9   14.9
  3.SEQID6   14.7   16.5   15   27.1   19.8   14   16.7   35.3   18.3   16.2   11.6   17.5   29
  4.SEQID8   15.1   22   15.4   25.5   20   19.1   17.2   34.3   18.9   20.5   13.3   15   28.1
  5.SEQID10   15.3   17.2   12.9   28.9   18.9   14.6   18.3   32.6   20.1   18.8   13.5   14.7   27.9
  6.SEQID12   13.7   17   13.5   27.3   19   17.9   19   34.6   19.3   18.6   11.4   14.5   29
  7.SEQID14   18.5   17.6   14.1   29.2   19.7   19.9   15.9   34.4   19.3   15.8   13.3   14.9   31.4
  8.SEQID16   12.7   14.2   14.4   35.1   18.7   17.7   15.3   22.7   16   14.8   13.9   15.9   23.4
  9.SEQID18   23.6   30.8   26   12.7   33.3   30.9   29.5   14.1   31.7   31.1   26.8   19.3   19.1
  10.SEQID20   23   34.2   23   15.9   32.6   36.1   31.1   14   32.2   34.1   34.5   16.4   16.5
  11.SEQID22   20.7   28.9   28   13.4   31.6   30.4   27.6   14.1   29.9   30   28.4   13.9   12.4
  12.SEQID24   13.6   14.4   13.4   33.3   18.9   16.8   17.4   22.2   15.7   14.3   13.6   14.7   23.1
  13.SEQID26   28.4   20.7   48.8   12   19.9   23.9   25.9   14.8   23.5   23.7   23.6   20.5   18.8
  14.SEQID28   14.5   38   17.4   16.2   24.8   17.1   15.9   15.1   22   22.1   20.7   16
  15.SEQID30   24.5   19.1   13.1   41.4   27.6   29.1   16.7   46.6   33.8   35.8   15.9   15.4
  16.SEQID32   56.8   27.9   15.2   19   23.3   21.8   12.3   19.3   22.3   23.5   23.2   14.1
  17.SEQID34   33.4   26.6   25.8   17.3   15.3   14.8   26.7   15.6   16.3   12.4   16.2   26
  18.SEQID36   26   57.4   27.1   31.8   29.3   32   19.2   44.4   32   28.6   13.2   15.1
  19.SEQID38   39.9   37.7   32.6   29.3   37.5   32.6   11.4   29.6   38.9   37   19   12.6
  20.SEQID40   29.7   42.9   31.2   26.8   46   44.8   15.7   32.7   32.1   26.4   13   16.1
  21.SEQID42   28.4   28.9   24.5   44.4   33.7   28.1   31.2   17.3   16.2   12.5   15.6   39.9
  22.SEQID44   24.9   59.7   24.9   27.9   60.1   41.3   47   31.7   31.1   32.4   15.2   16.9
  23.SEQID46   32.9   49.9   31.3   29   47.7   50   47.3   32.6   47.5   46.3   19.1   17.5
  24.SEQID48   32.6   45.7   30.9   30.2   45.5   49.8   46.1   23.2   47.3   58.7   17.8   14.4
  25.SEQID50   33   26.4   34.4   32.1   24.9   35.9   24.3   30.1   24.6   37.4   33.9   18.4
  26.SEQID52   31.7   24.3   25.6   42.2   26.8   26.8   27.4   52.3   27   30   26.2   30.1
  27.SEQID54   34.5   44.7   35.5   30.7   43.3   49.8   46.7   30.4   42.3   72.3   58.8   35.5   25.8
  28.SEQID56   36.3   44.2   35.9   31.7   40.8   48.5   45.1   24.5   41.5   54.2   64.5   39.5   28.9
  29.SEQID58   32.1   35.1   32.1   29.3   25.5   33   42.7   24.9   29   41.1   38.9   34   24.6
  30.SEQID60   26.6   34.8   27.4   29.7   35   28.2   29.9   27.4   36.8   31.2   34.3   27.4   26.1
  31.SEQID62   26.5   31   31.2   28.9   34.8   34.9   36.3   29.1   29.5   38.4   37.9   32.6   26.8
  32.SEQID64   24.6   32.3   26.5   28.2   29.3   29.3   35.6   26.5   32   35.4   31.8   27.9   24
  33.SEQID66   26.2   19.6   27.5   24   20   33   22.1   29.4   20.8   19.4   23.9   23.6   25.2
  34.SEQID68   23.5   50.1   23.2   29.2   53.3   35   47   31.9   50.4   43.1   39.9   25.1   26.4
  35.SEQID70   27.1   41.1   27.7   33   43.8   43.4   44.5   36.9   43.7   50.1   41.3   26.5   30.7
  36.SEQID72   15.4   23.1   12.9   25.2   23.2   16.4   19.2   22.8   21.6   20.3   19.1   18.4   19.5
  37.SEQID74   29.9   56.6   30.5   32.7   65.2   43.7   48.7   32.4   57.1   53.8   51.3   29.9   29.9
  38.SEQID76   38.9   39.3   35.8   29.3   38.4   43   43.2   31.7   38.5   43.2   45.2   35.9   38.1
  39.SEQID78   17.9   28.7   16.7   38.5   33.4   20   26.5   31.2   27.9   24   22.6   25.3   26.9
  40.SEQID80   23.1   27.6   19.9   40.4   31.1   22.9   242   33.7   28.5   25.9   24.2   24   26.6
  41.SEQID82   20.6   27.9   21.7   40.1   33.3   23.5   27.9   36.6   27.7   28.2   25.1   29.5   30.4
  42.SEQID84   18.7   27.3   16.7   31.8   27.2   17.8   24.2   30.1   28.3   23   20.6   22.8   25.1
  43.SEQID86   17   23.9   15.7   31.2   23.6   17.9   22.2   27.7   23.6   22.9   20   22.2   23.6
  44.SEQID88   14.5   22   13   22.9   22.5   15.2   19.4   22.1   20.2   17.1   17.1   17.3   18.6
  45.SEQID90   16.3   23.1   14.2   23.9   21.3   15.5   18.9   23.4   21.2   20.7   19.2   17.4   19.4
  46.SEQID94   13.9   229   14.6   22.6   21   16.5   18.9   24.5   19.8   18.7   18.9   17.1   19.4
  47.SEQID96   14.2   22.6   13   23.8   22.6   15.7   16.4   23.6   20.7   19.7   19.2   15.6   18.8
  48.SEQID100   19.8   28.4   20.7   38.1   27.9   21.4   25   35.4   27.3   26.1   23.6   26.8   29.7
  49.SEQID102   29.3   30.5   26.4   53.7   27.9   29.6   29.3   43.8   29.2   31.6   33.6   29.3   44.3
  50.SEQID104   21.4   28.2   19.9   37   29.6   22.1   27.1   34.5   29.6   26.4   24.2   24.6   29.3
  51.SEQID106   23.4   31.2   21.3   43.6   36   24.1   25.5   34.4   26.4   24.5   25   22.7   27.5
  52.SEQID108   21.4   29.8   20.7   40.5   29.8   21.6   26.5   34.7   25.8   23.4   23.6   25.6   27.8
  53.SEQID110   27.5   30.7   27.2   56.8   33.2   33.8   32.2   36.6   33.3   38.1   32.6   27.9   38
  54.SEQID124   26.3   29.2   25.1   44.6   34.5   30.7   37.2   52.3   31.1   38.1   23.5   29.4   42.4
  55.SEQID126   28.3   30.2   26.6   46.3   33.2   30.1   30.6   52   28.7   36.1   25.9   30.8   46.9
  56.SEQID134   24.8   32.8   23.6   42.9   35.3   29.6   36.6   49.5   32.5   37.5   24.2   29.9   40.5
  57.SEQID140   28.6   28.7   28.2   46.7   33.7   30.8   29.7   50   29   27.1   30.9   29.3   53.8
表A1续
  27   28   29   30   31   32   33   34   35   36   37   38   39
  1.SEQID2   13.3   12.3   13.2   12.6   12.3   13.1   8.6   13.3   13.8   36.1   13.3   12.7   25.6
  2.SEQID4   11.6   11.5   11.9   13.2   12.1   12.4   9   13.9   13.2   39.1   12.6   10.9   21.4
  3.SEQID6   13.4   13.2   15.1   14.7   13.2   14.2   19   17.7   17.5   15.7   23.1   19.1   21.4
  4.SEQID8   16.6   15.9   13.9   13   14.2   14.7   23.1   18.4   20.6   15.6   20.6   20.6   22
  5.SEQID10   12.5   12.9   15.4   13.9   13.2   13.8   19.4   16.7   19.4   14.8   16.7   21   20.2
  6.SEQID12   13.5   13.3   11.3   14.7   14.2   11.8   21.8   19   20.6   14.5   22.7   18.4   22.6
  7.SEQID14   17.5   14   14   14   14.6   13.7   21.2   17.8   19.6   15.4   21.1   18.5   20.5
  8.SEQID16   15.1   13   13.4   14.7   14.2   14.1   11   17.1   17.7   199   18.9   18.8   28.7
  9.SEQID18   29.6   26.1   19.5   20.3   20.5   18.1   12.6   25.9   28.1   11.8   32.4   29.1   14.9
  10.SEQID20   36.8   32.8   22   19.5   19.9   18.3   18.6   27.4   25.7   12.4   35.3   32.6   13.4
  11.SEQID22   34   29.1   19.6   18.6   17.5   17.2   14.7   26.8   29.9   9.9   34   30.2   12.8
  12.SEQID24   12.9   14.8   13.2   16.2   13.2   13.5   14.3   18.3   17.4   18.9   20.3   18.6   28.3
  13.SEQID26   24.5   24.8   20.2   21   18.2   18.2   13.9   22.6   23.3   10.6   22.9   23.5   13.5
  14.SEQID28   21.8   22.7   22   17.8   13.9   14   14.6   13   19.1   8.6   18.5   22.5   10.2
  15.SEQID30   32.8   32.8   21.6   19.4   16.6   18.4   11.6   34.1   30.5   13.2   44.6   27.6   17
  16.SEQID32   24.4   23.9   19.6   18.5   18.5   17.1   13   19   19.9   8.9   20.4   22.5   11.2
  17.SEQID34   16.3   15.6   15.8   15.7   12.4   12.2   14.3   15.8   17.5   17.8   14.5   13.4   27.6
  18.SEQID36   28.4   26.5   12.8   17.9   17.9   15.1   12   37.4   30.4   13.1   55.2   26.9   18.4
  19.SEQID38   39.9   36.2   18.7   16.2   20.3   16.3   18.9   25.7   30.9   9.8   33.1   32.1   12.6
  20.SEQID40   28.9   28   21   18.4   18.1   18.8   12.6   32.9   31.7   11.8   33.3   29.3   15
  21.SEQID42   14.5   13.1   11.7   13.4   12.1   12.9   19.8   20   19.3   16.8   15.4   15.8   20.1
  22.SEQID44   29.9   29.6   17.2   20.4   17.4   16.3   12.6   36.1   30.9   13.2   45   28.7   15
  23.SEQID46   58.7   40.4   23.4   18.5   20.6   17.4   11.9   29.4   33.2   12.4   32.8   30.3   16
  24.SEQID48   46.4   52.4   23.5   18.8   19.9   17.6   14.6   26.9   28.7   11.4   31.5   28.7   14.6
  25.SEQID50   16.8   20.9   18.8   18.2   18.5   16.5   12.7   14.5   16.7   11.5   14.2   16.4   16.8
  26.SEQID52   11.8   15.6   14.2   13.1   13.8   13.6   15.7   15.9   19.8   14.3   17.3   17.4   20.6
  27.SEQID54   41.5   19.9   20.8   20.8   16.7   13.9   26.9   28.8   10.8   31.1   32.7   14.2
  28.SEQID56   57.1   21.6   18.8   19.9   19.1   16.7   24.3   27.2   11.3   30.5   31.8   15.4
  29.SEQID58   35.5   34.6   24.9   27.1   24.3   13.1   16.7   17.8   11.4   19.7   19.8   16.3
  30.SEQID60   34.3   32.7   35.5   37.1   38.9   12.2   18.5   21.9   12   19.3   20.2   15.4
  31.SEQID62   37.2   34.9   40.5   48.5   72.8   13.1   19.2   20.8   11.3   18.2   17.6   15.4
  32.SEQID64   34   33.7   37.3   54.8   75.7   12.1   19.6   18.3   12.1   17.9   16.3   16.6
  33.SEQID66   22.6   28.9   20.9   20.6   23.8   21.3   12   13.2   7.4   13.5   15.6   11
  34.SEQID68   39.2   33.9   27.4   33.5   30   36.6   19.6   26.8   13.4   37.7   25.7   15.8
  35.SEQID70   45.4   38.6   35.1   35.8   34.2   34.8   22.1   38.4   14.4   29.7   33   16.8
  36.SEQID72   19.1   17.9   19.7   21.8   18.8   22.9   12   20.6   22.5   12.2   11   21.5
  37.SEQID74   47.8   45.3   35.8   33.5   34   32.6   22.3   51.2   44.5   20.9   30.5   16
  38.SEQID76   47.7   47.4   34   29.9   31.2   28.2   24.9   35.8   44.2   17.4   43.1   14.5
  39.SEQID78   24   23   25.3   27.9   22.6   26.3   16.5   25.3   25.5   34.4   28.9   23.8
  40.SEQID80   23.3   24.8   26.3   30.5   26.6   29.8   17.7   32.2   25.5   32.7   27.4   22.2   59.9
  41.SEQID82   27.1   24.4   28.8   28.8   25.9   32.6   20.8   33   27.3   32   30.8   23.3   46.4
  42.SEQID84   22.3   21.3   23.4   27.3   21.7   21.9   15   26.8   25.3   45.3   21.2   21.9   39.7
  43.SEQID86   20.3   20.8   22   25.5   20.8   22.4   15   27.2   23.8   48.7   21.7   20.3   39.8
  44.SEQID88   17.6   16.4   19.1   21.7   17.6   20.3   11.1   21.2   19.9   53.9   18.8   16.8   32.2
  45.SEQID90   18.4   18   19.6   22.4   17.2   21   12.7   21.7   20.2   56   18.5   18.5   34.4
  46.SEQID94   17.3   18.5   18.1   20.7   17.2   19.8   11.6   22.3   21.2   52.6   19.5   17.1   32.1
  47.SEQID96   16.9   16.4   19.3   20.5   18.2   20.3   12.1   22.8   21.7   54.5   20.2   17.7   31.4
  48.SEQID100   27   27.3   24.8   27.3   24.3   26.4   18.7   29.3   27.3   43.1   27.7   23.6   39.3
  49.SEQID102   31.7   27.1   27.7   26.6   27.5   24   26.4   26.9   31.3   32.4   27.7   32.1   32.8
  50.SEQID104   25.3   27.3   27.3   29.8   24.6   27.5   17.4   28.2   25.1   43.3   29.1   26.2   41.3
  51.SEQID106   25   25.5   25.9   26.1   23.4   28   17.9   34.2   25   31.7   32.6   25.7   46.6
  52.SEQID108   22.7   23.8   24.5   27.2   25.6   27.6   18   28.7   28.1   31.8   27.4   25.2   66.6
  53.SEQID110   31.7   33.8   27.7   26.6   27.9   28.7   22.6   31.1   32.4   23.8   38.1   36.2   36
  54.SEQID124   31.6   27.6   25.1   26.6   24.8   30.1   28.5   32.1   36   23.5   39.3   35.3   31.4
  55.SEQID126   31.4   31.8   29.3   26.9   30.2   29.3   36   32.9   32.4   23.6   37.4   29.7   31.8
  56.SEQID134   27.8   25.4   27.5   25.9   32.9   27.6   32.6   30.5   36.3   25.2   37.2   35   35
  57.SEQID140   33.4   30.4   26.5   24.4   27.9   27.9   32.7   30.3   32.7   22.7   33.3   36.1   31.4
表A1续
  40   41   42   43   44   45   46   47   48   49   50   51   52
  1.SEQID2   25.3   22.4   39.5   38.3   41.7   41.1   39.7   37.9   38.3   22.4   36.5   23.8   23.8
  2.SEQID4   23.7   23.1   38.8   39.6   46.7   46.9   45.1   43.1   37.5   21.2   37.8   22.2   23.5
  3.SEQID6   22.7   22.3   17.9   17.9   14.3   15.1   15.6   14.5   22.4   29   20.3   25.2   22.3
  4.SEQID8   22.5   25   19.4   18   15.3   15.4   15.4   15.2   23.5   25.1   21   24.7   22
  5.SEQID10   21.9   21.9   18.7   15.5   13   12.9   13.4   13.3   20.4   30.3   21.3   23.6   20.8
  6.SEQID12   22.8   24.3   17.6   18   14.1   14.6   14.2   15.9   20.9   28   20.7   25.8   21.4
  7.SEQID14   22.7   23.9   18.6   17.7   14   14.6   14.1   14.6   22.7   30.1   21.6   23.2   23.8
  8.SEQID16   28.2   31   25.7   23.4   17.9   18.4   18.2   18.9   26.9   31.3   25.6   31   30.8
  9.SEQID18   14.3   14.4   12.7   12.2   10.5   11.2   12   10.9   14.1   14.9   14.6   13.8   14.5
  10.SEQID20   14.7   15.9   11.9   12.1   11.2   10.4   12.6   10.6   14.1   17.1   13   13.8   13.3
  11.SEQID22   14.2   15.2   13.9   11.5   10.9   9.8   11.2   10.8   15.2   16.6   13.1   15.9   14.3
  12.SEQID24   27.5   29.8   23.5   21.4   17.3   17.1   17.2   17.8   25.3   31.1   24   30.2   30.1
  13.SEQID26   13.8   16.9   13.5   14.1   11.8   11.6   10.4   10.9   15.3   12.5   15.6   15.3   15.1
  14.SEQID28   14   11.5   11.8   11   9.6   9.7   9.5   8.5   13.1   15.3   12.4   12.4   12.2
  15.SEQID30   16.1   15.9   13.4   14.2   13.6   13.8   12.7   12.3   14.9   15.9   16.6   13.7   14.7
  16.SEQID32   11.7   12.2   11.2   10.7   7.6   8.4   8.8   8.5   11   13.9   12.8   12.4   12.5
  17.SEQID34   28   29.4   22.7   21.6   16.8   18   16.8   16.8   28.3   33.2   26.2   33.3   29.5
  18.SEQID36   17.4   19.2   14.7   13.4   13   12.6   11.8   13.1   16.4   15.5   15.3   19.5   16.4
  19.SEQID38   12.7   12.8   10.5   12.4   9.5   9.4   10.1   10.2   14.2   13.7   14.2   14.4   12.7
  20.SEQID40   15.1   14.6   13.4   12.4   12.5   11.2   11.2   9.9   14   16.2   16.1   15.1   14.9
  21.SEQID42   22.6   21.5   19.5   18.5   15.5   16.6   16.6   15.7   23.2   28.2   23.2   22   23.1
  22.SEQID44   14.4   15.6   15.6   14.8   13.5   12.6   13.1   12.5   13.9   15.5   18.1   13.9   13.5
  23.SEQID46   16.1   16.6   14.2   14.8   11.6   13.1   10.1   12.4   14.6   13.5   16.7   14.8   15.8
  24.SEQID48   14   14.6   13.2   12.6   10.4   12   10.8   11.9   13.5   16.1   13.1   14.6   14.5
  25.SEQID50   14.5   14.5   14   14.1   11.2   11.3   9.6   9.6   12.9   15   13.7   13.1   16.8
  26.SEQID52   18.6   19.7   18.3   17   12.6   13.8   13.9   13.9   20.4   26   20.9   19.5   20.9
  27.SEQID54   14.5   14.4   14.9   13.7   10.6   11.2   10.4   10.5   14.8   11.9   14   12.8   14.3
  28.SEQID56   15.9   13.3   12.7   12   11.1   11.5   11.5   9.8   16.4   11.7   17   14.4   15.1
  29.SEQID58   15.1   14.4   13.5   13.1   10.5   12   10.8   11.5   13.7   15.3   15.9   16.1   14.3
  30.SEQID60   15.5   13.5   12.2   12.1   12.5   11.6   12.6   12.3   11.9   14.1   13.5   12.4   13.7
  31.SEQID62   12.5   12   11.8   12   9.8   10.4   10.8   10.9   12.1   12.8   13.9   11.6   14.9
  32.SE QID64   15.3   16   11.3   13.4   11.6   12.6   13.4   11.3   13.3   13.2   14.1   13.8   15.8
  33.SEQID66   11   12.4   9.9   9.5   7.8   7.7   8.1   8.1   12.2   13.9   10.8   11   11.6
  34.SEQID68   18   18.4   15.8   14.3   13.8   13.4   14.2   12.7   17.5   17   17.2   18.7   16.2
  35.SEQID70   15.9   15.5   13.6   14.6   12.2   10.7   12.8   13.3   15.1   16.8   17.1   13.9   15.5
  36.SEQID72   22   21.2   35.1   35.3   40   40   37.9   39.8   34   29   34.4   22.6   22.3
  37.SEQID74   16.7   17.2   12.5   13.9   12   12   11.4   11.9   16.6   13   17.3   17.9   15
  38.SEQID76   13   11.5   13.9   12.9   10.7   11.5   9.6   11.4   14.2   13.3   16.4   14.6   16.9
  39.SEQID78   46.4   32.7   25.1   25.5   22.1   24   21.9   21   26.3   24   26.6   33.5   58.2
  40.SEQID80   31.2   27.1   25.2   20.9   22.4   21.9   21.4   29.1   24.6   28.3   34.1   47
  41.SEQID82   49.2   24.5   25.9   20   20.3   20.1   19.9   27.6   25.8   26.9   33.1   31.8
  42.SEQID84   40.8   38.6   71.1   36   36.3   35.8   36   43.5   26.2   41.9   27.1   27.1
  43.SEQID86   38.7   37.7   79.7   35.5   37.9   38   36.8   40   24.4   41   26.2   26.9
  44.SEQID88   32.4   30.6   45.6   46.1   64.6   55.8   53.6   34.5   19   33.7   21.1   20.1
  45.SEQID90   32.5   32.2   46.6   49.7   73   51.3   51.7   35.1   20.1   34.9   22.3   24
  46.SEQID94   31.8   32.9   47.6   51.2   67.6   65.5   49.7   34.8   19.4   33.7   21.5   21.3
  47.SEQID96   30.7   30.1   45.8   46.3   66.7   64.2   63.4   34.3   18.9   34.4   21.6   21.7
  48.SEQID100   42.1   42.1   54.3   50.1   42.8   43.8   42.4   42.9   29.7   72.2   28.3   28.2
  49.SEQID102   35.2   36.4   33   31.2   25.5   25.9   25.2   24.4   41.2   29.6   25.5   26.9
  50.SEQID104   44.1   42.6   51.7   49.7   41   44   41.9   42.5   81.3   39.5   27.7   27.3
  51.SEQID106   50.3   51.7   39.3   36.7   30.3   31.1   32.3   31.6   43.7   36.2   39.5   34.7
  52.SEQID108   61.3   49   38.2   39.1   28.9   33.2   31.3   32.3   43.9   37.2   41.2   48.6
  53.SEQID110   34.6   39   30.1   28.2   21.1   23.1   23.5   22.4   34.2   51.6   33.9   51.6   37
  54.SEQID124   33.5   35.3   30.7   28.1   22.8   24.3   21.8   24   34   42.4   35.7   37.2   35.9
  55.SEQID126   31.7   37   30   28.4   24.1   23.1   22.2   22.2   34.7   50.3   34.8   35.1   34.5
  56.SEQID134   36.1   37.5   32.6   30.8   24.3   24.8   24.5   23.8   34.2   41.7   34.1   37.8   36.1
  57.SEQID140   31.1   33.5   28.8   27.2   20.1   22.3   22.3   19.2   32.9   50   31.8   33.3   32.7
表A1续
  53   54   55   56   57
  1.SEQID2   18   19.6   18.5   17   17.6
  2.SEQID4   17.2   15.7   15.6   17.1   16.4
  3.SEQID6   28.9   47.3   48.4   44.6   59.7
  4.SEQID8   26.8   60.2   52.8   53.3   44.8
  5.SEQID10   29.8   47.5   49   46.9   46.2
  6.SEQID12   28.7   50   46.1   51.1   45.8
  7.SEQID14   27.8   46.1   51.8   46.2   65.2
  8.SEQID16   34.1   29.2   25.6   27.3   27.1
  9.SEQID18   18.7   15.1   15.3   17.9   15.1
  10.SEQID20   19.3   15   15.9   13.9   14.2
  11.SEQID22   18.5   17.7   16.5   19.2   17.4
  12.SEQID24   32.9   30.8   25.7   27.8   26.3
  13.SEQID26   19.4   20.6   18.1   19.7   19.3
  14.SEQID28   13.4   14.2   17   15   13.5
  15.SEQID30   19.8   16.7   18.4   18.6   15.6
  16.SEQID32   13.1   15.2   14.9   12.4   13.8
  17.SEQID34   40.1   27.9   30.1   25.7   30.2
  18.SEQID36   19   19.7   17.8   19.7   19.4
  19.SEQID38   19   18.8   16.1   18.4   18.1
  20.SEQID40   17.9   19.3   13.7   19.4   16.2
  21.SEQID42   24.3   36.4   33.9   35.3   35.8
  22.SEQID44   19   17.9   16.8   17.9   17.8
  23.SEQID46   20.5   19.6   19   18.4   15.6
  24.SEQID48   15.1   12.1   14.2   11.4   14.5
  25.SEQID50   12.6   14.6   16.1   16.6   16.8
  26.SEQID52   25.2   30   30.8   28.6   36.3
  27.SEQID54   15.6   14.2   17.2   14.4   15.5
  28.SEQID56   18.2   13.9   13.8   14.1   13.1
  29.SEQID58   13.2   12.2   15   10.9   14
  30.SEQID60   15.8   14   14.2   14.1   134
  31.SEQID62   12.2   13.9   15.1   14.9   15.2
  32.SEQID64   13.9   13.7   14   10.9   14.3
  33.SEQID66   12.1   23.1   28.8   22.8   19.5
  34.SEQID68   18.7   19   17.4   17.8   17.8
  35.SEQID70   18.6   20.1   20.5   20   19.4
  36.SEQID72   17   15.2   16   16.3   14.6
  37.SEQID74   21.2   19.9   21.6   20.2   20.2
  38.SEQID76   21.3   21.5   14.9   20.6   16.8
  39.SEQID78   25.9   22.6   21.8   22.5   22.2
  40.SEQID80   25.5   22.6   21.6   24.3   23.3
  41.SEQID82   29.2   22   22.8   24.2   22.4
  42.SEQID84   21.6   19.1   19.9   19.5   18.7
  43.SEQID86   19.3   17.9   17.9   18.1   17.2
  44.SEQID88   15.6   14.7   15.1   15.3   14.4
  45.SEQID90   16.2   148   15.9   15.4   14.7
  46.SEQID94   17.3   14.5   14.9   15.7   14.1
  47.SEQID96   16.8   15   15.1   14.8   13.4
  48.SEQID100   24.2   21.2   24   20.7   21.1
  49.SEQID102   33.3   26.1   28.2   25.9   30.2
  50.SEQID104   22.8   21.8   24   21.5   22
  51.SEQID106   46.2   23.5   24.1   25.3   22
  52.SEQID108   25.9   22.8   23.8   22.2   23.2
  53.SEQID110   27.4   29.2   27.4   27.9
  54.SEQID124   44   54.2   54.9   44
  55.SEQID126   44.6   64.1   54.5   49.8
  56.SEQID134   40.8   68   65.6   43.8
  57.SEQID140   41.8   55.1   59.8   52.6
实施例4:鉴定CCA1中包含的结构域
蛋白质家族、结构域和位点集成资源(Integrated Resouce of ProteinFamilies,Domain and Site,InterPro)数据库是基于文本和序列的检索的通常所用标签数据库的集成界面。InterPro数据库组合了这些数据库,所述的数据库使用不同方法学和不同程度的有关已充分表征蛋白质的生物学信息以得到蛋白质标签。合作数据库包括SWISS-PROT、PROSITE、TrEMBL、PRINTS、ProDom和Pfam、Smart和TIGRFAMs。Interpro由英国的欧洲生物信息研究所提供。
InterPro扫描如SEQ ID NO:2所代表的多肽序列的结果在表A2中示出。
表A2:SEQ ID NO:2所示多肽序列的InterPro扫描结果
 数据库   登录号   登录名
 Interpro   IPR001005   Myb,DNA结合
 PFAM   PF00249   Myb_DNA结合
 SMART   SM00717   SANT结构域
 PROFILE   PS50090   MYB_3
 Interpro   IPR006447   Myb样DNA结合区,SHAQKYF类
 TIGRFAMs   TIGR01557   myb_SHAQKYF
 Interpro   IPR009057   同源域样
 SUPERFAMILY   SSF46689   同源域样
实施例5:用于实施本发明方法的多肽序列的拓扑学预测(亚细胞定位,跨膜...)
TargetP 1.1预测真核蛋白质的亚细胞定位。位置分配是基于任何N端前序列的预测的存在:叶绿体转运肽(cTP)、线粒体靶向肽(mTP)或分泌途径信号肽(SP)。作为最终预测基础的评分并不实际是概率,并且它们未必合为一体。然而,具有最高评分的位置根据TargetP是最有可能的,并且评分之间的关系(可靠性类别)可以是预测的肯定性的一个指标。可靠性类别(RC)是1-5,其中1表示最强预测。TargetP在丹麦技术大学的服务器上维护。
对于预测含有N端前序列的序列,也可以预测潜在的切割位点。
选择了众多参数,如生物组(非植物或植物)、临界设置(无、临界的预定义设置或临界的用户指定设置)和对切割位点预测的计算(是或否)。
如SEQ ID NO:2所代表的多肽序列的TargetP 1.1分析的结果在表A3中显示。已经选择“植物”生物组,未定义临界值并且需要转运肽的预测长度。SEQ ID NO:2所示多肽序列的亚细胞定位很可能是胞质或核。然而应该注意,本申请所述在产量上观察到的效果不是该蛋白质特定定位的结果。
表A3:SEQ ID NO:2所示多肽序列的TargetP 1.1分析
  长度(AA)   608
  叶绿体转运肽   0.160
  线粒体转运肽   0.149
  分泌途径信号肽   0.027
  其他亚细胞靶向   0.900
  预测定位   其他
  可靠性级别   2
  预测的转运肽长度   /
众多其它算法可以用来执行此类分析,包括:
在丹麦技术大学(Technical University of Denmar)服务器上提供的ChloroP 1.1;
在澳大利亚布里斯班昆士兰大学分子生物科学研究所(Institute forMolecular Bioscience,University of Queensland,Brisbane,Australia)的服务器上提供的蛋白质Prowler亚细胞定位预测程序(Protein ProwlerSubcellular Localisation Predictor)第1.2版;
在加拿大阿尔伯塔省埃德蒙顿市阿尔伯塔大学(University of Alberta,Edmonton,Alberta,Canada)的服务器上提供的PENCE Proteme AnalystPA-GOSUB 2.5;
在丹麦技术大学服务器上提供的TMHMM。
实施例6:与CCA1多肽序列相关的测定
CCA1样蛋白(至少在其天然形式下)一般具有DNA结合活性。DNA结合测定是本领域的一部分(见例如Current Protocols in MolecularBiology,第1和2卷,Ausubel等(1994),Current Protocols)。特别地,Wang等(Plant Cell 9,497-507,1197)描述了使用Lhcb13基因的A2片段对CCA1样转录因子进行DNA结合测定。简言之,表达并纯化包含MYB重复的多肽,并用于电泳迁移率变动分析(EMSA)。在30℃下将纯化的多肽与放射性标记并纯化的Lhcb13基因A2片段和多聚(dIdC)一起孵育15分钟。接着,在8%聚丙烯酰胺凝胶分离样品并放射自显影。对应于CCA1的蛋白质条带明显地结合了放射性探针,表明形成了蛋白质-DNA复合体。
此外,在植物中过表达CCA1样蛋白导致开花延迟,并在连续光照或连续黑暗条件下消除了Lhcb或其他昼夜节律表达基因的昼夜节律表达。或者,根据本发明方法表达CCA1样蛋白导致下述提高的种子产量。
实施例7:克隆SEQ ID NO:1所示核酸序列
除非另外说明,否则根据以下所述的标准方法进行重组DNA技术:(Sambrook(2001)Molecular Cloning:a laboratory manual,第三版ColdSpring Harbor Laboratory Press,CSH,New York)或者Ausubel等(1994),Current Protocols in Molecular Biology,Current Protocols的第1和2卷。用于植物分子工作的标准材料和方法描述于R.D.D.Croy的PlantMolecular Biology Labfax(1993),由BIOS Scientific Publications Ltd(UK)和Blackwell Scientific Publications(UK)出版。
使用拟南芥幼苗cDNA文库(Invitrogen,Paisley,UK)作为模板通过PCR扩增拟南芥CCA1样基因。PCR扩增中使用包含用于Gateway重组的AttB位点的引物prm07263(SEQ ID NO:146;有义,起始密码子为粗体,AttB1位点为斜体:5’-gagacaaattcgtctgga-3’)和prm07264:(SEQ ID NO:147;反向,互补的,AttB2位点为斜体:5’-gaaaatagagtctcatgtggaagc-3’)。在标准条件中使用Hifi Taq DNA聚合酶进行PCR。还使用标准方法扩增并纯化PCR片段。随后实施Gateway方法的第一步骤,即BP反应,在此期间PCR片段与pDONR201质粒发生体内重组以产生根据Gateway命名的“进入克隆”,pCCA1。质粒pDONR201作为技术的部分从Invitrogen购买。
实施例8:使用如SEQ ID NO:1所代表核酸序列构建表达载体
进入克隆pCCA1随后在LR反应中与pGOS2(一种用于稻转化的目的载体)一起使用。这种载体在T-DNA边界内含有作为功能性元件的:植物选择标记;筛选标记表达盒和意图与已经克隆于所述进入克隆内的目的核酸序列发生LR体内重组的Gateway盒。用于组成型表达的稻GOS2启动子(SEQ ID NO:145)位于这种Gateway盒的上游。
在LR重组步骤后,产生的表达载体pGOS2::CCA1(图3)根据本领域众所周知的方法转化至农杆菌菌株LBA4044中。
实施例9:植物转化
稻转化
含有表达载体的农杆菌用来转化稻植物。将稻的日本栽培品种Nipponbare的成熟干燥种子脱壳。通过在70%乙醇中温育一分钟,随后在2%HgCl2中30分钟,随后用无菌蒸馏水洗涤6次15分钟而实施消毒。消毒的种子随后在含有2,4-D的培养基(愈伤组织诱导培养基)上萌发。在黑暗中温育4周后,将来自小盾片的愈伤组织切下并在同一种培养基上增殖。2周后,愈伤组织通过在同一种培养基上传代培养另外2周而繁殖或增殖。胚发生性愈伤组织片在新鲜培养基上传代培养3日,之后共培育(以增强细胞分裂活性)。
含有表达载体的农杆菌菌株LBA4404用于共培育。农杆菌接种在含有适宜抗生素的AB培养基上并在28℃培养3日。随后将细菌收集并重悬在液体共培育培养基中至密度(OD600)约1。将混悬液随后转移至培养皿并将愈伤组织在该混悬液内浸泡15分钟。愈伤组织组织随后在滤纸上吸干并转移至固化的共培育培养基上并且在黑暗中于25℃温育3日。共培育的愈伤组织在黑暗中于28℃在选择剂存在下于含有2,4-D的培养基上培育4周。在此时段期间,形成迅速生长的抗性愈伤组织岛。在这种材料转移至再生培养基并在光线下温育后,胚发生潜力释放并且苗在随后4-5周发育。将苗从愈伤组织中切下并且在含有植物生长素的培养基上温育2-3周,其中将苗从所述的培养基上转移至土壤。硬化的苗在高湿度和短日照下于温室中培育。
对一个构建体产生约35个独立的T0稻转化体。原代转化体从组织培养箱转移至温室。在定量PCR分析以验证T-DNA插入物的拷贝数后,仅保留表现选择剂耐受性的单拷贝转基因植物用于收获T1种子。种子随后在移植后3-5月收获。本方法以超过50%的比率产生单一基因座转化体(Aldemita和Hodges1996,Chan等1993,Hiei等1994)。
玉米转化
玉米的转化根据对Ishida等(1996.Nature Biotech 14745-50)描述方法的改良方法进行。在玉米中的转化是基因型依赖的并且仅特定的基因型可操作用于转化和再生。近交系A188(明尼苏达大学)或以A188作为亲本的杂种是用于转化的供体材料的良好来源,但是其它基因型也可以成功地使用。玉米穗从玉米植物中在授粉后大约11日(DAP)收获,此时不成熟胚的长度是大约1至1.2mm。不成熟胚与含有表达载体的根癌农杆菌共培育并且转基因植物通过器官发生而恢复。切下的胚在愈伤组织诱导培养基上、随后在玉米再生培养基上培育,其中所述的再生培养基含有选择剂(例如咪唑啉酮,但可以使用多种选择标记)。培养板在25℃于光照下培养2-3周,或直至苗发育。将绿色苗从每个胚转移至玉米生根培养基并在25℃培养2-3周,直至根发育。将生根的苗移植至温室的土壤中。从表现选择剂耐受的并含有单拷贝的T-DNA插入物的植物中产生T1种子。
小麦转化
小麦的转化用Ishida等Ishida等(1996)Nature Biotech 14(6):745-50描述的方法进行。通常在转化中使用(可从墨西哥CIMMYT获得的)栽培品种Bobwhite。不成熟胚与含有表达载体的根癌农杆菌共培育并且转基因植物通过器官发生而恢复。在与农杆菌温育后,胚在愈伤组织诱导培养基上、随后在再生培养基上体外培育,其中所述的再生培养基含有选择剂(例如咪唑啉酮,但可以使用多种选择标记)。培养平板在25℃于光照下培养2-3周,或直至苗发育。将绿色苗从每个胚转移至生根培养基并在25℃培养2-3周,直至根发育。将生根的苗移植至温室的土壤中。从表现选择剂耐受的并含有单拷贝的T-DNA插入物的植物中产生T1种子。
大豆转化
根据对Texas A&M美国专利5,164,310中所述方法的改良方法转化大豆。几个商业大豆品种对于通过这种方法的转化是可行的。栽培品种Jack(从Illinois种子基金会可获得)通常用于转化。对大豆种子消毒以便体外播种。从7日龄幼苗中切下下胚轴、胚根和一片子叶。进一步培育上胚轴和余下的子叶以发育腋生节。将这些腋生节切下并与含有表达载体的根癌农杆菌温育。在共培育处理之后,将外植体洗涤并转移至选择培养基。将再生的苗切下并置于苗伸长培养基上。将长度不超过1cm的苗置于生根培养基上直至根发育。将生根的苗移植至温室的土壤中。从表现选择剂耐受的并含有单拷贝T-DNA插入物的植物中产生T1种子。
油菜籽/芸苔转化
使用5-6日龄幼苗的子叶柄和下胚轴作为用于组织培养的外植体并且根据Babic等(1998,Plant Cell Rep 17:183-188)转化。商业栽培品种Westar(Agriculture Canada)是用于转化的标准品种,但是也可以使用其它品种。对芸苔种子作表面消毒以便体外播种。从体外幼苗中切下具有附着子叶的子叶柄外植体,并以(含有表达载体的)农杆菌通过叶柄外植体的切口端浸入细菌混悬液而接种。外植体随后在含有3mg/l BAP、3%蔗糖、0.7%植物琼脂(Phytagar)的MSBAP-3培养基上在23℃,16小时光照下培养2天。在与农杆菌共培育2日后,将叶柄外植体转移至含有的3mg/l BAP、头孢噻肟、羧苄青霉素或特美汀(300mg/l)的MSBAP-3培养基上持续7日,并且随后在含头孢噻肟、羧苄青霉素或特美汀和选择剂的MSBAP-3培养基上培养,直至苗再生。当苗具有5-10mm长度时,将苗切下并转移至苗伸长培养基(含0.5mg/l BAP的MSBAP-0.5)。将长度大约2cm的苗转移至用于根诱导的生根培养基(MS0)。将生根的苗移植至温室的土壤中。从表现选择剂耐受性并含有单拷贝T-DNA插入物的植物中产生T1种子。
苜蓿转化
苜蓿的再生性克隆使用(McKersie等,1999Plant Physiol 119:839-847)的方法加以转化。苜蓿的再生和转化是基因型依赖性的并且因而需要再生植物。已经描述了获得再生性植物的方法。例如,这些再生性植物可以选自栽培品种Rangelander(Agriculture Canada)或如Brown DCW与AAtanassov(1985.Plant Cell Tissue Culture 4:111-112)描述的任何其它商业苜蓿品种。备选地,RA3品种(威斯康星大学)已经被选择用于组织培养中(Walker等,1978 Am J Bot 65:654-659)。将叶柄外植体与含有表达载体的根癌农杆菌C58C1pMP90(McKersie等,1999Plant Physiol 119:839-847)或LBA4404的过夜培养物共培育。外植体在黑暗中在含有288mg/L Pro、53mg/L硫代脯氨酸、4.35g/L K2SO4和100μm乙酰丁香酮的SH诱导培养基上共培育3天.外植体在半浓缩Murashige-Skoog培养基(Murashige和Skoog,1962)中洗涤并平板接种在不含乙酰丁香酮而含有合适选择剂和合适抗生素以抑止农杆菌生长的相同SH诱导培养基上。在数周后,将体细胞胚转移至不含生长调节剂、不含抗生素而含有50g/L蔗糖的BOi2Y发育培养基中。体细胞胚随后在半浓缩Murashige-Skoog培养基上萌发。将生根的幼苗移植至花钵内并且在温室中培育。从表现选择剂耐受性并含有单拷贝T-DNA插入物的植物中产生T1种子。
棉花转化
根据US 5,159,135的方法使用根癌农杆菌转化棉花。将棉花种子在3%次氯酸钠溶液中表面灭菌20分钟,并以含有500μg/ml头孢噻肟的蒸馏水洗涤。接着将种子转移至含有50μg/ml苯菌灵的SH培养基中进行萌发。取下4至6日龄幼苗的下胚轴,剪成0.5cm的片并置于0.8%琼脂上。用农杆菌悬液(约108个细胞/ml,从转化有目的基因和适当选择标记的过夜培养物稀释而成)接种下胚轴外植体。室温光照3天后,将组织转移至固体培养基(1.6g/l Gelrite),其带有包含B5维生素的Murashige和Skoog盐(Gamborg等,Exp.Cell Res.50:151-158(1968)),0.1mg/l 2,4-D,0.1mg/l 6-糠胺嘌呤和750μg/ml MgCL2,并含有50至100μg/ml头孢噻肟和400-500μg/ml羧苄青霉素以杀死残余细菌。2至3个月(每4至6周传代培养)后分离单个细胞系,并在选择培养基上进一步培养进行组织扩增(30℃,16小时光周期)。接着在非选择培养基上将转化组织再培养2至3个月,以产生体细胞胚。将至少4mm长的表观健康的胚转移至管中,其中含有细蛭石中的SH培养基,并补充有0.1mg/l吲哚乙酸、6糠胺嘌呤和赤霉酸。以16小时光周期在30℃下培养胚,并将2至3叶期的小植株转移至含有蛭石和养分的盆中。植物变硬并接着移至温室中进一步培养。
实施例10:表型评价方法
10.1评价准备
产生大约35个独立的T0稻转化体。原代转化体从组织培养箱转移至温室用于生长和收获T1种子。留下7个事件,其中所述事件的T1后代对转基因的存在/不存在以3∶1比例分离。对于这些事件中的每一事件,通过监测目视标记表达而选择含有转基因的大约10株T1幼苗(杂合子和纯合子)和缺少转基因的大约10株T1幼苗(失效合子)。转基因植物和对应的失效合子在随机位置上并排培育。温室条件是短日照(12小时光照),在光线下28℃和在黑暗中22℃以及相对湿度70%。
4个T1事件在T2世代中按照如用于T1世代的相同评价方法作进一步评价,但每个事件采用更多的个体。使植物从播种期直至成熟期通过数字成像箱数次。在每一时间点上,对每株植物从至少6个不同角度拍摄数字图像(2048x1536像素,1600万颜色)。
10.2统计分析:F-检验
使用双因子ANOVA(方差分析)作为统计模型用于植物表型特征的整体评价。对用本发明基因转化的全部事件的全部植物的所有测量参数实施F检验。实施F检验以检查基因对于全部转化事件的作用并验证基因的整体作用(又称作全局基因作用)。用于真实全局基因作用的显著性的阈值对于F检验设置在5%概率水平上。显著性F检验值标示基因作用,意味着不仅仅基因的存在或位置才造成表型上的差异。
10.3测量的参数
生物量相关的参数测量
从播种期直至成熟期,使植物通过数字成像箱数次。在每一时间点上,对每株植物从至少6个不同角度拍摄数字图像(2048x1536像素,1600万颜色)。
植物地上部分面积(或叶生物量)通过计数在来自植物地上部分的数字图像上区别于背景的像素的总数而测定。该值对在相同时间点上从不同角度拍摄的画面进行平均化并且通过校正转化成以平方mm表达的物理表面值。实验证实以这种方式测量的地上部分植物面积与地上植物部分的生物量相关。地上部分面积是在植物已经达到其最大叶生物量的时间点上所测量的面积。早期萌发势是萌发后3周的植物(幼苗)地上部分面积。
种子相关参数的测量
将成熟的主圆锥花序(primary panicle)收获、计数、装袋、加条形码标记并且随后在干燥箱内在37°干燥3日。随后将圆锥花序脱粒并且收集及计数全部种子。使用吹气装置分开饱满粒(husk)与空粒。弃去空粒并再次对剩余部分计数。饱满粒在分析天平上称重。饱满种子数通过计数分离步骤后的饱满粒数而确定。种子总产量通过称量从植物中收获的全部饱满粒而测量。每株植物种子总数通过计数从植物中收获的壳粒数目而测量。根据计数的饱满种子数及其总重量外推得出千粒重(TKW)。收获指数(HI)在本发明中定义为种子总产量和地上面积(mm2)之间的比值再乘以因子106。每个圆锥花序的花总数在本发明中定义为种子总数与成熟的主圆锥花序数之间的比率。种子饱满率在本发明中定义为饱满种子数占种子(或小花)总数的比例(以%表示)。
实施例11:转基因植物的表型评价结果
表达CCA1核酸序列的转基因稻植物的评价结果示于表A4。也显示了转基因植物和相应失效合子之间的百分比差异,F检验的P值低于0.05。
与对照植物(在此例中为失效合子)相比,表达用于实施本发明方法的核酸序列的转基因植物的种子总产量、饱满种子数、种子饱满率和收获指数均显著增加。
表A4:表达用于实施本发明方法的核酸序列的转基因稻植物的评价结果
第II部分VPE
实施例12:鉴定与SEQ ID NO:149和SEQ ID NO:150的VPE序列相关的序列
使用数据库序列检索工具,如基本局部比对工具(BLAST)(Altschul等(1990)J.Mol.Biol.215:403-410;和Altschul等(1997)Nucleic Acids Res.25:3389-3402)在国家生物技术信息中心(NCBI)的Entrez核苷酸数据库中所维护的那些序列内鉴定到与SEQ ID NO:149相关的序列(全长cDNA、EST或基因组)和/或与SEQ ID NO:150相关的蛋白质序列。该程序用来通过核酸序列或多肽序列与序列数据库比较并通过计算匹配的统计学显著性而找到序列间具有局部相似性的区域。对SEQ ID NO:149所编码的多肽使用TBLASTN算法,采用默认设置和过滤以忽略低复杂性序列启动。分析的结果通过配对性比较显示,并根据概率评分(E-值)排序,其中该评分反映特定比对结果因偶然而发生的概率(E-值越低,命中的显著性越高)。除了E-值外,比较还通过同一性百分数进行记分(同一性百分数指两个所比较核酸(或多肽)序列之间在特定长度范围内的相同核苷酸(或氨基酸)数目)。在一些情况下,可以调整默认参数以调节检索法的严格性。
表B1提供了与SEQ ID NO:149所示核酸序列及SEQ ID NO:150所示蛋白质序列相关的核酸及蛋白质序列的列表。
表B1:与SEQ ID NO:149相关的核酸序列,及其相应推导的多肽。
实施例13:VPE的比对
使用来自Vector NTI(Invitrogen)的AlignX(基于逐步比对的一般聚类算法(Thompson等(1997)Nucleic Acids Res 25:4876-4882;Chenna等(2003).Nucleic Acids Res 31:3497-3500)比对VPE序列。可以使用邻接聚类算法来构建系统树。默认值为空位开放罚分10,空位延伸罚分0.1,选定的权重矩阵为Blosum 62。
使用来自Vector NTI(Invitrogen)的AlignX以默认参数进行的多重序列比对结果示于图6B。使用来自Vector NTI(Invitrogen)的AlignX设置成默认参数进行VPE多肽及代表其他蛋白质分支的肽酶多重序列比对和相应的系统树(图6A)。VPE多肽聚类在一起,与属于其他分支的肽酶分离。VPE多肽聚类成4个亚类。α类VPE与γ类VPE(SEQ ID NO:150所属类别)最接近。
实施例14:计算可用于实施本发明方法的多肽序列之间的全局百分比同一性。
使用本领域可获得的方法之一MatGAT(矩阵全局比对工具)软件(BMC Bioinformatics.20034:29.MatGAT:an application that generatessimilarity/identity matrices using protein or DNA sequences.CampanellaJJ,Bitincka L,Smalley J.;软件由Ledion Bitincka提供)确定用于实施本发明方法的全长多肽序列之间全局相似性百分数和同一性百分数。MatGAT软件为DNA序列或蛋白质序列产生相似性/同一性矩阵,无需数据的预比对。该程序使用Myers和Miller全局比对算法(空位开放罚分12和空位延伸罚分2)执行一系列逐对比对,使用例如Blosum 62(对于多肽)计算相似性和同一性并且随后将结果置于距离矩阵中。序列相似性在分界线的下半部分中显示,序列同一性在对角分界线的上半部分中显示。
比较中所用的参数是:
评分矩阵:Blosum62
第一空位:12
延伸空位:2
多肽序列(排除部分多肽序列)全长上的全局相似性和同一性软件分析结果在表B2中显示。同一性百分数在对角线之上给出并且相似性百分数在对角线之下给出。
与SEQ ID NO:150相比,VPE之间的同一性百分数可以从大约45%氨基酸同一性开始。
表B2和B3:多肽序列全长的全局相似性及同一性的MatGAT结果
表B2:来自双子叶植物的VPE多肽之间的全局相似性
表B3:来自单子叶植物的VPE多肽之间的全局相似性
实施例15:鉴定VPE中包含的结构域
蛋白质家族、结构域和位点集成资源(Integrated Resouce of ProteinFamilies,Domain and Site,InterPro)数据库是基于文本和序列的检索的通常所用标签数据库的集成界面。InterPro数据库组合了这些数据库,所述的数据库使用不同方法学和不同程度的有关已充分表征蛋白质的生物学信息以得到蛋白质标签。合作数据库包括SWISS-PROT、PROSITE、TrEMBL、PRINTS、ProDom和Pfam、Smart和TIGRFAMs。Interpro由英国的欧洲生物信息研究所提供。
InterPro扫描如SEQ ID NO:150所代表的多肽序列的结果在表B4中。
表B4:SEQ ID NO:150所示多肽序列的InterPro扫描结果
实施例16:VPE的拓扑学预测
TargetP 1.1预测真核蛋白质的亚细胞定位。位置分配是基于任何N端前序列的预测的存在:叶绿体转运肽(cTP)、线粒体靶向肽(mTP)或分泌途径信号肽(SP)。作为最终预测基础的评分并不实际是概率,并且它们未必合为一体。然而,具有最高评分的位置根据TargetP是最有可能的,并且评分之间的关系(可靠性类别)可以是预测的肯定性的一个指标。可靠性类别(RC)是1-5,其中1表示最强预测。TargetP在丹麦技术大学的服务器上维护。
对于预测含有N端前序列的序列,也可以预测潜在的切割位点。
选择了众多参数,如生物组(非植物或植物)、临界设置(无、临界的预定义设置或临界的用户指定设置)和对切割位点预测的计算(是或否)。
如SEQ ID NO:150所代表的多肽序列的TargetP 1.1分析的结果在表B5中显示。已经选择“植物”生物组,未定义临界值并且需要转运肽的预测长度。SEQ ID NO:150所示多肽序列的亚细胞定位是分泌途径,转运肽的预计长度为N端开始的20个氨基酸(不如亚细胞定位本身的预测可靠,可能长度上相差几个氨基酸)。最高分数是对于分泌途径信号,表明VPEg蛋白很有可能靶向分泌途径。
表B5:SEQ ID NO:150所示多肽序列的TargetP 1.1分析
  长度(AA)   494
  线粒体转运肽   0.108
  分泌途径信号肽   0.966
  其他亚细胞靶向   0.006
  预测定位   分泌途径
  可靠性级别   2
  预测的转运肽长度   20
众多其它算法可以用来执行此类分析,包括:
在丹麦技术大学(Technical University of Denmar)服务器上提供的ChloroP 1.1;
在澳大利亚布里斯班昆士兰大学分子生物科学研究所(Institute forMolecular Bioscience,University of Queensland,Brisbane,Australia)的服务器上提供的蛋白质Prowler亚细胞定位预测程序(Protein ProwlerSubcellular Localisation Predictor)第1.2版;
在加拿大阿尔伯塔省埃德蒙顿市阿尔伯塔大学(University of Alberta,Edmonton,Alberta,Canada)的服务器上提供的PENCE Proteme AnalystPA-GOSUB 2.5;
在丹麦技术大学服务器上提供的TMHMM。
实施例17:对VPE的测定
通过将蛋白质与底物蛋白孵育并如前述测定切割产物来测定VPEg的肽酶活性(Rojo等2004Current Biology 14,1897-1906;Haraiwa等1999,FEBS 447:213-216;Hatsugai等2004,Science 6:第305卷.no.5685,855-858页)。在切割反应中选择Haraiwa等1999所述的合成十肽Ser-Glu-Ser-Glu-Asn-Gly-Leu-Glu-Glu-Thr、羧肽酶Y和VPEg本身作为底物。通过毛细管电泳分离切割产物并通过200nm的吸光度或通过western印迹来检测。
实施例18:克隆SEQ ID NO:149所示核酸序列
除非另外说明,否则根据以下所述的标准方法进行重组DNA技术:(Sambrook(2001)Molecular Cloning:a laboratory manual,第三版ColdSpring Harbor Laboratory Press,CSH,New York)或者Ausubel等(1994),Current Protocols in Molecular Biology,Current Protocols的第1和2卷。用于植物分子工作的标准材料和方法描述于R.D.D.Croy的PlantMolecular Biology Labfax(1993),由BIOS Scientific Publications Ltd(UK)和Blackwell Scientific Publications(UK)出版。
使用拟南芥幼苗eDNA文库(Invitrogen,Paisley,UK)作为模板通过PCR扩增拟南芥VPEg基因。PCR扩增中使用包含用于Gateway重组的AttB位点的引物SEQ ID NO:206;有义,5’-ggggacaagtttgtacaaaaaagcaggcttaaacaatggccacaacgatgaca-3’)和SEQ IDNO:207;反向互补:5’-ggggaccactttgtacaagaaagctgggtcggtttagggtttctatgcac-3’)。在标准条件中使用Hifi Taq DNA聚合酶进行PCR。也使用标准方法扩增预计长度(包含attB位点)的PCR片段并纯化。随后实施Gateway方法的第一步骤,即BP反应,在此期间PCR片段与pDONR201质粒发生体内重组以产生根据Gateway命名的“进入克隆”,pVPEg。质粒pDONR201作为技术的部分从Invitrogen购买。
实施例19:使用如SEQ ID NO:149所代表核酸序列构建表达载体
进入克隆pVPEg随后在LR反应中与用于稻转化的目标载体一起使用。这种载体在T-DNA边界内含有作为功能性元件的:植物选择标记;筛选标记表达盒和意图与已经克隆于所述进入克隆内的目的核酸序列发生LR体内重组的Gateway盒。用于种子特异性表达的稻WSI18启动子(SEQID NO:205)位于这种Gateway盒的上游。
在LR重组步骤后,将产生的表达载体pWSI18::VPE(图7)根据本领域众所周知的方法转化至农杆菌菌株LBA4044中。
实施例20:植物转化
植物转化的详细内容参见上文实施例9。
实施例21:表型评价方法
详细内容参见上文实施例10。
实施例22:非生物胁迫筛选的实例
干旱筛选
在正常培养条件下在盆土中培养来自选定事件数的植物,直至到达抽穗阶段。接着将其转移至停止浇水的“干旱”部分。在随机选择的盆中插入湿度探测器,以监控土壤含水量(SWC)。当SWC低一定阈值时,自动对植物持续再浇水直至再次达到正常水平。接着将植物再转移至正常条件。其余培养(植物成熟、种子收获)与不在非生物胁迫条件下培养的植物相同。如正常条件下培养所详细描述的那样记录生长和产量参数。
盐胁迫筛选
在由椰子纤维和argex(3∶1比例)构成的底物(substrate)上培养植物。在将小植株移植到温室后的前两周使用正常营养液。前两周之后,向营养液中加入25nM盐(NaCl),直至收获植物。如正常条件下培养所详细描述的那样记录生长和产量参数。
养分(氮)利用度降低筛选
在除营养液以外均为正常的条件下在盆土中培养来自6个事件的植物(T2种子)。从移植到成熟均使用特定的营养液对盆浇水,其中含有降低的氮(N)含量,通常降低7至8倍。其余培养(植物成熟、种子收获)与不在非生物胁迫条件下培养的植物相同。如正常条件下培养所详细描述的那样记录生长和产量参数(见实施例10)。
实施例23:转基因植物的表型评价结果
表达VPE的转基因稻植物的评价结果示于表B6-B9(除非另外指明,否则结果均得自非胁迫条件下培养的植物)。也显示了转基因植物和相应失效合子之间的百分比差异,F检验的P值低于0.05。
与对照植物(在此例中为失效合子)相比,种子总产量、饱满种子数、种子饱满率和收获指数均显著增加。
表B6:转基因稻植物pWSI::VPE的评价结果
  性状   增加%
  种子总产量   18
  饱满种子数   28
  饱满率   18
  收获指数   17
  根冠指数   7
在氮利用度降低条件下培养并表达实施例19pWSI::VPE的转基因稻植物的评价结果示于下文表B7。
表B7:在氮利用度降低条件下评价VPE::pwsi18的结果
  参数   %差异
  地上部分生物量   16.1
  萌发势   43.2
  种子总重   20.7
  不饱满种子   18.8
  收获指数   12.3
在氮利用度降低条件下培养并表达实施例19的VPE构建体(只是用组成型GOS2启动子代替wsi18启动子)的转基因稻植物的评价结果示于下文表B8。这种带有GOS2启动子的相同构建体与在非胁迫条件下给出表B9所示结果。
表B8:在氮利用度降低条件下评价VPE::pGOS2的结果
  参数   %差异
  地上部分生物量   5
  根生物量   6
  萌发势   25
  每个圆锥花序的花数   7
表B9:在非胁迫条件下评价VPE::pGOS2的结果
第III部分SAP
实施例24:鉴定与SEQ ID NO:210和SEQ ID NO:211的SAP序列相关的序列。
使用数据库序列检索工具,如基本局部比对工具(BLAST)(Altschul等(1990)J.Mol.Biol.215:403-410;和Altschul等(1997)Nucleic Acids Res.25:3389-3402)在国家生物技术信息中心(NCBI)的Entrez核苷酸数据库中所维护的那些序列内鉴定到与SEQ ID NO:210相关的序列(全长cDNA、EST或基因组)和/或与SEQ ID NO:211相关的蛋白质序列。该程序用来通过核酸序列或多肽序列与序列数据库比较并通过计算匹配的统计学显著性而找到序列间具有局部相似性的区域。对SEQ ID NO:210所编码的多肽使用TBLASTN算法,采用默认设置和过滤以忽略低复杂性序列启动(setoff)。分析的结果通过配对性比较显示,并根据概率评分(E-值)排序,其中该评分反映特定比对结果因偶然而发生的概率(E-值越低,命中的显著性越高)。除了E-值外,比较还通过同一性百分数进行记分。同一性百分数指两个所比较核酸(或多肽)序列之间在特定长度范围内的相同核苷酸(或氨基酸)数目。在一些情况下,可以调整默认参数以调节检索的严格性。
除了NCBI提供的公共可用的核酸序列以外,还根据与上述相同的方法检索了专有序列数据库。
表C1提供了与SEQ ID NO:210所述核酸序列及SEQ ID NO:211所示蛋白质序列相关的核酸及蛋白质序列的列表。
表C1:与SEQ ID NO:210的SAP编码核苷酸序列相关的核酸序列,及其相应推导的多肽。
实施例25:SAP样多肽序列的比对
来自Vector NTI(Invitrogen)的AlignX程序(基于逐步比对的一般聚类算法)(Thompson等(1997)Nucleic Acids Res 25:4876-4882;Chenna等(2003).Nucleic Acids Res 31:3497-3500)实施多肽序列的比对。默认值为空位开放罚分10,空位延伸罚分0.1,选定的权重矩阵为Blosum 62(如果比对多肽的话)。图10的结果显示,SAP样蛋白共有高序列保守性的区域。基序1、基序2和基序3代表序列同源性最高的区域。
使用来自Vector NTI(Invitrogen)的AlignX程序所提供的邻接聚类算法构建SAP及SAP样多肽的系统树。图11显示SAP样多肽如何与SEQ IDNO:211而不与诸如SAFB2多肽的SAP蛋白聚类。
实施例26:计算SAP样多肽之间的全局百分比同一性
使用本领域可获得的方法之一MatGAT(矩阵全局比对工具)软件(BMC Bioinformatics.20034:29.MatGAT:an application that generatessimilarity/identity matrices using protein or DNA sequences.CampanellaJJ,Bitincka L,Smalley J.;软件由Ledion Bitincka提供)确定用于实施本发明方法的全长多肽序列之间全局相似性百分数和同一性百分数。MatGAT软件为DNA序列或蛋白质序列产生相似性/同一性矩阵,无需数据的预比对。该程序使用Myers和Miller全局比对算法(空位开放罚分12和空位延伸罚分2)执行一系列逐对比对,使用例如Blosum 62(对于多肽)计算相似性和同一性并且随后将结果置于距离矩阵中。序列相似性在分界线的下半部分中显示,序列同一性在对角分界线的上半部分中显示。
比较中所用的参数是:
评分矩阵:Blosum62
第一空位:12
延伸空位:2
多肽序列全长上的全局相似性和同一性软件分析结果在表C2中显示。同一性百分数在对角线之上给出并且相似性百分数在对角线之下给出。
与SEQ ID NO:211相比,SAP样多肽序列之间的同一性百分数可以从13%氨基酸同一性开始。
表C2:多肽序列全长的全局相似性及同一性的MatGAT结果
  1   2   3   4   5   6   7   8   9
  1.SEQ_ID_NO:211   35.3   21.6   15   57.8   14.7   32.3   34.9   20.1
  2.SEQ_ID_NO:213   55.2   23   14.7   22.5   15   30.6   40.2   22.3
  3.SEQ_ID_NO:217   34.1   37   19.7   13.4   18   27.2   43.1   20
  4.SEQ_ID_NO:219   24.5   23.9   30.6   9.6   30.4   19.7   14.4   19.9
  5.SEQ_ID_NO:231   58.5   35.1   21   15.5   8.5   18.9   22.6   13.2
  6.SEQ_ID_NO:233   22.1   23.9   30.2   40.6   13.6   19.3   12   19.5
  7.SEQ_ID_NO:235   46.9   42.9   47.3   31.8   27.8   29.5   28.9   21.3
  8.SEQ_ID_NO:237   52.9   53.6   52.1   23.4   34.3   19.7   40.4   19.9
  9.SEQ_ID_NO:239   35.2   35.7   36.5   33.1   22.4   31.5   40.3   32.2
实施例27:鉴定SEQ ID NO:211中包含的结构域
通过检索与Pfam数据库中存在的蛋白质结构域和蛋白质家族相似性来鉴定SEQ ID NO:211的SAP样多肽序列中的保守结构域。表C3总结了发现的结构域。SEQ ID NO:211中保守结构域的起点和终点以相应的氨基酸坐标给出。
表C3:SEQ ID NO:211所示多肽序列的Pfam扫描结果
实施例28:与SEQ ID NO:211相关的活性测定
如Chen等2003之前的报道,在体外测定中测定SEQ ID NO:211的稻SAP样蛋白的DNA结合活性。在大肠杆菌细胞中过表达SEQ ID NO:211并纯化。将纯化的蛋白质与底物DNA孵育。选择来自稻Waxy基因31bp(碱基对)DNA片段作为DNA底物。蛋白质-DNA复合体可通过电泳在凝胶阻滞实验中鉴定。
实施例29:克隆SEQ ID NO:210所示核酸序列
除非另外说明,否则根据以下所述的标准方法进行重组DNA技术:(Sambrook(2001)Molecular Cloning:a laboratory manual,第三版ColdSpring Harbor Laboratory Press,CSH,New York)或者Ausubel等(1994),Current Protocols in Molecular Biology,Current Protocols的第1和2卷。用于植物分子工作的标准材料和方法描述于R.D.D.Croy的PlantMolecular Biology Labfax(1993),由BIOS Scientific Publications Ltd(UK)和Blackwell Scientific Publications(UK)出版。
使用稻幼苗cDNA文库(Invitrogen,Paisley,UK)作为模板通过PCR扩增稻SAP样基因。PCR扩增中使用包含用于Gateway重组的AttB位点的引物prm08655(SEQ ID NO:247;有义:5’-ggggacaagtttgtacaaaaaagcaggcttaaacaatggccacaacgatgacac-3’)和prm08656(SEQ ID NO:248;反向,互补:5’-ggggaccactttgtacaagaaagctgggtcggtttagggtttctatgcac-3’)。在标准条件中使用Hifi Taq DNA聚合酶进行PCR。也使用标准方法扩增预计长度(包含attB位点)的PCR片段并纯化。随后实施Gateway方法的第一步骤,即BP反应,在此期间PCR片段与pDONR201质粒发生体内重组以产生根据Gateway命名的“进入克隆”。质粒pDONR201作为技术的部分从Invitrogen购买。
实施例30:使用如SEQ ID NO:210所代表核酸序列构建表达载体
含有SEQ ID NO:210的进入克隆pSAP-样随后在LR反应中与pRCC3(一种用于稻转化的目的载体)一起使用。这种载体在T-DNA边界内含有作为功能性元件的:植物选择标记;筛选标记表达盒和意图与已经克隆于所述进入克隆内的目的核酸序列发生LR体内重组的Gateway盒。用于根特异性表达的稻RCC3启动子(SEQ ID NO:246)位于这种Gateway盒的上游。
在LR重组步骤后,根据本领域已知技术将所得表达载体pRCC3::SAP-样(图11)转化至农杆菌菌株LBA4044。
实施例31:植物转化
见上文实施例9。
实施例32:表型评价方法
详细内容参见实施例10和实施例22。
实施例33:转基因植物的表型评价结果
表达可用于实施本发明方法的核酸序列的转基因稻植物的评价结果示于表C4至C9。也显示了转基因植物和相应失效合子之间的百分比差异,F检验的P值低于0.1。
与对照植物(在此例中为失效合子)相比,表达用于实施本发明方法的核酸序列的转基因植物的种子总产量、饱满种子数、种子饱满率、收获指数、每个圆锥花序的花数、千粒重、植物高度和萌发势均显著增加。
表C4:转化有pRCC3::SAP-样(SAP-like)载体的稻植物的评价结果。这些转基因植物中的SAP样核酸在稻RCC3启动子控制下在根中表达。
  性状   转基因植物中相对于对照植物的增加%
  种子总产量   29
  饱满种子数   26
  饱满率   19
  收获指数   27
  每个圆锥花序的花数   5
  TKW   3
  植物高度   7
  萌发势   28
表C5:转化有pGOS2::SAP-样载体的稻植物的评价结果。这些转基因植物中的SAP样核酸在稻GOS2启动子控制下组成型表达(de Pater等,Plant J Nov;2(6):837-44,1992,WO 2004/065596)。
表C6:转化有p(PcR)::SAP-样载体的稻植物的评价结果。这些转基因植物中的SAP样核酸在稻推定的原叶绿素酸酯还原酶启动子控制下组成型表达(WO 2004/070039)
表C7:在如实施例22所述干旱条件下测试并转化有载体pRCC3::SAP-样的稻植物的评价结果。
  参数   %差异
  种子总产量   14.2
  饱满种子数   15.5
  饱满率   22
  收获指数   22.6
表C8:在如实施例22所述氮利用度减少下测试并转化有载体pRCC3::SAP-样的稻植物的评价结果。
  参数   %差异
  地上部分生物量   9.1
  萌发势   20.1
表C9:在如实施例22所述干旱条件下测试并转化有p(PcR)::SAP-样载体的稻植物的评价结果。这些转基因植物中的SAP样核酸在稻推定的原叶绿素酸酯还原酶启动子控制下组成型表达(WO 2004/070039)
第IV部分RCA
实施例34:鉴定与SEQ ID NO:250和SEQ ID NO:251的RCA序列相关的序列。
使用数据库序列检索工具,如基本局部比对工具(BLAST)(Altschul等(1990)J.Mol.Biol.215:403-410;和Altschul等(1997)Nucleic Acids Res.25:3389-3402)在国家生物技术信息中心(NCBI)的Entrez核苷酸数据库中所维护的那些序列内鉴定到与SEQ ID NO:250相关的序列(全长cDNA、EST或基因组)和/或与SEQ ID NO:251相关的蛋白质序列。该程序用来通过核酸序列或多肽序列与序列数据库比较并通过计算匹配的统计学显著性而找到序列间具有局部相似性的区域。对SEQ ID NO:250所编码的多肽使用TBLASTN算法,采用默认设置和过滤以忽略低复杂性序列启动(setoff)。分析的结果通过配对性比较显示,并根据概率评分(E-值)排序,其中该评分反映特定比对结果因偶然而发生的概率(E-值越低,命中的显著性越高)。除了E-值外,比较还通过同一性百分数进行记分。同一性百分数指两个所比较核酸(或多肽)序列之间在特定长度范围内的相同核苷酸(或氨基酸)数目。在一些情况下,可以调整默认参数以调节检索的严格性。
除了NCBI提供的公共可用的核酸序列以外,还根据与上述相同的方法检索了专有序列数据库。
表D1提供了与SEQ ID NO:250所述核酸序列及SEQ ID NO:251所示蛋白质序列相关的核酸及多肽序列的列表。这些核酸序列编码天然存在的β(短形式,或SF)RCA多肽,或者来自已在C端延伸中发生截短或突变以阻止氧化还原反应调节的α(长形式,或LF)RCA多肽。
表D1:与可用于本发明方法的核酸序列(SEQ ID NO:250)相关的核酸序列,及其相应推导的多肽。
在一些情况下,相关序列已由研究机构(如The Institute for GenomicResearch(TIGR))试验性地组装并公开。通过关键词检索或使用以目的核酸序列或多肽序列进行的BLAST算法,可以使用Eukaryotic GeneOrthologs(EGO)数据库来鉴定这些相关序列。在其他情况下,已产生了用于特定生物的专门核酸序列数据库,例如Joint Genome Institute所产生了,例如用于Ostreococcus lucimarinus和团藻。
实施例35:相关多肽序列的比对
来自Vector NTI(Invitrogen)的AlignX是基于逐步比对的流行聚类算法(Thompson等(1997)Nucleic Acids Res 25:4876-4882;Chenna等(2003).Nucleic Acids Res 31:3497-3500)。可以使用邻接聚类算法来构建系统树。默认值为空位开放罚分10,空位延伸罚分0.1,选定的权重矩阵为Blosum 62(如果比对多肽的话)。
使用相关多肽鉴定可用于实施本发明方法的序列的多重序列比对结果示于图15。使用来自Vector NTI套装(InforMax,Bethesda,MD)的AlignX程序比对序列。使用空位开放罚分10和空位延伸0.01进行多重比对。真核RCA多肽之间保守序列的起点以括号显示(该括号N端上游的氨基酸序列被认为包含用于质体亚细胞靶向的转运肽),如AAA结构域的起点和终点。P环加框显示,对应于SEQ ID NO:312显示的基序1。C端延伸的起点也以括号标出。在该C端延伸中,参与氧化还原反应调节的Cys残基在α(长形式或LF)RCA多肽中以粗体标出。它们是用于定点诱变(例如诱变成Ala残基)以防止形成二硫键(从而防止氧化还原反应调节)的优选靶标。
实施例36:计算可用于实施本发明方法的多肽序列之间的全局百分比同一性。
使用本领域可获得的方法之一MatGAT(矩阵全局比对工具)软件(BMC Bioinformatics.20034:29.MatGAT:an application that generatessimilarity/identity matrices using protein or DNA sequences.CampanellaJJ,Bitincka L,Smalley J.;软件由Ledion Bitincka提供)确定用于实施本发明方法的全长多肽序列之间全局相似性百分数和同一性百分数。MatGAT软件为DNA序列或蛋白质序列产生相似性/同一性矩阵,无需数据的预比对。该程序使用Myers和Miller全局比对算法(空位开放罚分12和空位延伸罚分2)执行一系列逐对比对,使用例如Blosum 62(对于多肽)计算相似性和同一性并且随后将结果置于距离矩阵中。序列相似性在分界线的下半部分中显示,序列同一性在对角分界线的上半部分中显示。
比较中所用的参数是:
评分矩阵:Blosum62
第一空位:12
延伸空位:2
多肽序列(排除部分多肽序列)全长上的全局相似性和同一性软件分析结果在表D2中显示。同一性百分数在对角线之上给出并且相似性百分数在对角线之下给出。
与SEQ ID NO:251相比,用于实施本发明方法的多肽序列之间的同一性百分数可以低到50%氨基酸同一性。
表D2:RCA多肽序列全长的全局相似性及同一性的MatGAT结果
  1   2   3   4   5   6   7   8   9   10   11   12   13   14   15   16   17   18   19   20   21   22   23   24   25
  1.Aceru_RCA\LS   92   77   75   55   72   56   66   77   72   85   79   70   71   80   73   78   73   78   73   53   75   71   75   70
  2.Aceru_RCA\SF   92   72   79   59   78   60   72   71   78   79   85   76   77   86   75   85   79   72   78   56   81   77   81   76
  3.Arath_RCA\LF   86   80   91   54   70   55   60   75   69   78   74   68   69   73   70   72   71   77   71   54   69   69   70   67
  4.Arath_RCA\SF   84   88   91   59   76   59   66   72   76   75   81   74   76   80   75   79   77   73   78   58   76   76   76   74
  5.Chlre_RCA   66   71   64   70   58   76   54   56   59   55   58   59   61   58   54   59   58   56   60   63   58   60   59   59
  6.Chequ_RCA   81   87   78   85   69   57   66   70   76   73   81   75   75   80   74   80   79   69   74   59   78   74   79   74
  7.Chlli_RCA   67   72   65   71   87   70   52   57   61   55   58   61   62   59   55   57   58   57   60   64   58   61   58   60
  8.Datgl_RCA   73   79   67   74   66   73   67   59   65   66   73   63   65   72   63   73   68   61   66   52   69   64   68   64
  9.Desan_RCA\\LF   86   81   84   82   66   80   68   68   91   77   72   88   79   72   70   70   70   90   83   55   67   80   70   77
  10.Desan_RCA\SF   80   87   77   85   72   86   73   74   91   71   79   95   85   78   72   76   76   83   89   59   73   86   76   84
  11.Glyma_RCA   93   86   86   83   66   81   67   72   85   79   80   70   71   79   73   79   74   79   74   55   80   71   74   70
  12.Goshi_RCA   86   93   81   88   72   89   71   78   82   88   85   77   80   88   75   85   80   75   80   59   82   79   81   78
  13.Horvu_RCA\SF   79   85   76   83   72   85   74   72   89   97   78   87   84   76   71   75   76   82   89   59   72   85   76   82
  14.Horvu_RCASFII   79   85   76   83   73   83   73   73   85   93   79   87   92   77   71   79   75   79   85   59   75   96   78   83
  15.Lartr_RCA\SF   87   94   82   89   71   89   72   79   82   88   86   94   87   87   76   84   81   73   78   57   82   77   80   78
  16.Lycpe_RCA   85   87   81   85   68   82   70   73   82   82   82   84   81   81   85   75   85   72   73   55   71   70   71   70
  17.Maldo_RCA\SF   86   94   81   88   71   88   72   79   81   87   85   92   85   87   92   85   81   73   78   58   80   78   82   77
  18.Nicta_RCA   83   89   79   86   70   86   71   76   79   83   82   88   84   84   89   90   89   71   76   56   77   75   77   75
  19.Orysa_RCA\LF   88   83   84   82   67   79   68   68   95   88   87   84   87   85   83   83   81   80   92   56   70   80   72   78
  20.Orysa_RCA\SF   81   88   77   84   71   85   73   73   88   95   81   89   94   91   89   83   87   84   92   60   75   86   77   84
  21.Ostta_RCA   65   69   65   71   78   68   78   66   67   72   66   72   72   72   71   67   72   69   67   72   57   59   58   59
  22.Phavu_RCA\SF   85   91   81   88   72   87   71   76   82   86   86   90   86   87   92   85   91   88   82   86   70   74   76   77
  23.Triae_RCA\SF   80   86   77   84   72   85   73   71   86   93   79   87   92   97   87   82   85   84   86   92   72   87   77   84
  24.Zanae_RCA\SF   83   90   78   85   72   87   72   75   80   86   82   90   86   86   90   83   90   86   82   87   69   88   86   74
  25.Zeama_RCA\SF   80   86   76   83   73   83   72   73   85   92   79   88   91   91   87   81   87   82   87   93   72   87   92   86
与SEQ ID NO:311相比,可用于实施本发明方法的RCA多肽序列的AAA结构域之间的同一性百分数可以提高到60%氨基酸同一性。
表D3:RCA多肽序列的AAA结构域之间的全局相似性及同一性的MatGAT结果
  1   2   3   4   5   6   7   8   9   10   11   12   13   14   15   16   17   18
  1.AAA_Aceru_RCA   69   92   93   82   84   93   93   95   93   95   91   94   91   69   94   78   65
  2.AAA_Anasp_RCA   81   68   68   67   68   67   70   69   67   68   66   68   67   99   69   64   76
  3.AAA_Arath_RCA   96   79   92   81   82   92   92   94   92   95   91   92   92   68   94   78   65
  4.AAA_Chequ_RCA   96   81   95   81   82   92   94   96   92   95   94   93   95   68   93   79   64
  5.AAA_Chlli_RCA   91   82   89   88   93   81   80   82   82   81   79   81   80   67   80   80   64
  6.AAA_Chlre_RCA   90   83   89   88   95   83   82   84   83   83   81   82   81   68   81   80   64
  7.AAA_Desan_RCA   97   80   95   95   88   88   93   94   98   95   92   92   92   67   94   78   64
  8.AAA_Glyma_RCA   97   82   95   98   91   91   96   97   93   95   91   95   92   70   96   79   65
  9.AAA_Goshi_RCA   98   81   96   97   90   90   97   99   94   98   93   95   95   69   96   80   65
  10.AAA_Horvu_RCA   97   80   95   96   89   88   98   97   97   94   92   91   92   67   95   78   64
  11.AAA_Lartr_RCA   98   81   97   97   90   89   97   99   99   98   95   95   95   68   97   79   65
  12.AAA_Lycpe_RCA   97   81   96   97   89   89   97   97   97   98   98   91   98   66   94   79   65
  13.AAA_Maldo_RCA   98   82   95   97   91   92   96   99   98   96   98   96   92   68   93   78   67
  14.AAA_Nicta_RCA   96   80   95   96   89   89   95   97   98   96   97   99   96   67   94   79   65
  15.AAA_Nossp_RCA   81   99   79   80   82   83   79   81   81   80   81   80   81   80   69   64   75
  16.AAA_Orysa_RCA   99   81   97   97   90   90   98   99   99   98   99   98   98   98   81   79   65
  17.AAA_Ostta_RCA   89   80   87   88   89   88   87   89   89   88   88   88   89   88   79   89   64
  18.AAA_Synco_RCA   81   85   79   79   81   80   79   81   81   80   81   80   82   80   85   81   82
  19.AAA_Triae_RCA   97   80   95   96   88   88   98   97   98   99   98   98   96   96   79   99   87   79
实施例37:鉴定可用于实施本发明方法的多肽序列中包含的结构域
蛋白质家族、结构域和位点集成资源(Integrated Resouce of ProteinFamilies,Domain and Site,InterPro)数据库是基于文本和序列的检索的通常所用标签数据库的集成界面。InterPro数据库组合了这些数据库,所述的数据库使用不同方法学和不同程度的有关已充分表征蛋白质的生物学信息以得到蛋白质标签。合作数据库包括SWISS-PROT、PROSITE、TrEMBL、PRINTS、ProDom和Pfam、Smart和TIGRFAMs。Interpro由英国的欧洲生物信息研究所提供。
InterPro扫描如SEQ ID NO:251所代表的多肽序列的结果在表D4中。
表D4:SEQ ID NO:251所示多肽序列的InterPro扫描结果
AAA家族成员的关键特征是它们共有约200个氨基酸的保守区,其中含有ATP结合位点(P环)。例如,SEQ ID NO:251的AAA结构域如SEQID NO:311所示。
实施例38:用于实施本发明方法的多肽序列的拓扑学预测(亚细胞定位,跨膜...)
TargetP 1.1预测真核蛋白质的亚细胞定位。位置分配是基于任何N端前序列的预测的存在:叶绿体转运肽(cTP)、线粒体靶向肽(mTP)或分泌途径信号肽(SP)。作为最终预测基础的评分并不实际是概率,并且它们未必合为一体。然而,具有最高评分的位置根据TargetP是最有可能的,并且评分之间的关系(可靠性类别)可以是预测的肯定性的一个指标。可靠性类别(RC)是1-5,其中1表示最强预测。TargetP在丹麦技术大学的服务器上维护。
对于预测含有N端前序列的序列,也可以预测潜在的切割位点。
选择了众多参数,如生物组(非植物或植物)、临界设置(无、临界的预定义设置或临界的用户指定设置)和对切割位点预测的计算(是或否)。
SEQ ID NO:251所示多肽序列的亚细胞定位是叶绿体,转运肽的预计长度为N端开始的32个氨基酸(不如亚细胞定位本身可靠,可能长度上相差几个氨基酸)。将RCA多肽与SEQ ID NO:251的RCA多肽进行比对时,有可能推导出后者中的转运肽长度(见图15)。或者,广义上讲,转运肽是真核RCA多肽之间保守序列的起点之前的氨基酸序列,如图15所示。
众多算法可以用来执行此类分析,包括:
在丹麦技术大学(Technical University of Denmar)服务器上提供的ChloroP 1.1;
在澳大利亚布里斯班昆士兰大学分子生物科学研究所(Institute forMolecular Bioscience,University of Queensland,Brisbane,Australia)的服务器上提供的蛋白质Prowler亚细胞定位预测程序(Protein ProwlerSubcellular Localisation Predictor)第1.2版;
在加拿大阿尔伯塔省埃德蒙顿市阿尔伯塔大学(University of Alberta,Edmonton,Alberta,Canada)的服务器上提供的PENCE Proteme AnalystPA-GOSUB 2.5;
在丹麦技术大学服务器上提供的TMHMM。
实施例39:与可用于实施本发明方法的多肽序列相关的测定
通过将ADP产生与NADH氧化偶联来测量RCA活性所致的ATP水解,如Li等((2005)J Biol Chem 280(26):24864-24869;以及其中的参考文献)所述,如Esau等,((1996)Arch Biochem Biophys 326:100-105)所报道,以分光光度计测定RCA活性所致的RuBisCo活化。
实施例40:克隆SEQ ID NO:250所示核酸序列
除非另外说明,否则根据以下所述的标准方法进行重组DNA技术:(Sambrook(2001)Molecular Cloning:a laboratory manual,第三版ColdSpring Harbor Laboratory Press,CSH,New York)或者Ausubel等(1994),Current Protocols in Molecular Biology,Current Protocols的第1和2卷。用于植物分子工作的标准材料和方法描述于R.D.D.Croy的PlantMolecular Biology Labfax(1993),由BIOS Scientific Publications Ltd(UK)和Blackwell Scientific Publications(UK)出版。
使用莱茵衣藻CC-1690cDNA文库(“核心文库”)(在来自Stratagene的Lambda ZAP II载体中)作为模板通过PCR扩增可用于本发明方法的核酸序列,所述文库购自Duke University,North Carolina,USA的ChlamyCenter(之前的the Chlamydomonas Genetics Center)。PCR使用Hifi TaqDNA聚合酶在标准条件下进行,在50μl PCR混合物中使用200ng模板。使用的引物是包含用于Gateway重组的AttB位点的引物
-prm08444SEQ ID NO:310;有义,AttB1位点为小写:
5’-ggggacaagtttgtacaaaaaagcaggcttaaacaATGCAGGTCACCATGAAGAG-3’;和
-prm08445SEQ ID NO:311反向,互补,AttB2位点为小写:
5’-ggggaccactttgtacaagaaagctgggtCTCCTACAGAGGAGGCACATC-3’。还使用标准方法纯化扩增的PCR片段。随后实施Gateway方法的第一步骤,即BP反应,在此期间PCR片段与pDONR201质粒发生体内重组以产生根据Gateway命名的“进入克隆”,p15972。质粒pDONR201作为技术的部分从Invitrogen购买。
实施例41:使用如SEQ ID NO:250所代表核酸序列构建表达载体
包含SEQ ID NO:250的进入克隆随后在LR反应中与用于其后各个稻转化的三种不同目的载体一起使用。这种载体在T-DNA边界内含有作为功能性元件的:植物选择标记;筛选标记表达盒和意图与已经克隆于所述进入克隆内的目的核酸序列发生LR体内重组的Gateway盒。第一种目的载体在该Gateway盒的上游包含稻GOS2启动子(SEQ ID NO:306)用于强组成型表达,第二种目的载体包含稻HMGB启动子(SEQ ID NO:307)用于组成型表达,第三种目的载体包含稻原叶绿素酸酯还原酶启动子(SEQ ID NO:308)用于在绿色组织中特异性表达。
在LR重组步骤后,产生的表达载体(图16)根据本领域众所周知的方法各自转化至农杆菌菌株LBA4044中。
实施例42:植物转化
见上文实施例9。
实施例43:表型评价方法
见上文实施例10和22。
实施例44:对强组成型启动子控制下表达SEQ ID NO:250的转基因植物的表型评价结果
表D5中给出了对表达强组成型GOS2启动子(SEQ ID NO:306)控制下的用于实施本发明方法中的核酸序列的转基因稻植物的评价结果。还显示转基因植物和对应的失效合子之间的差异百分数,F检验的P值小于0.05。
与对照植物(在这种情况下为失效合子)相比,表达用于实施本发明方法中的核酸序列的转基因植物具有增加的早期萌发势和增加的TKW。
表D5:对表达强组成型GOS2启动子控制下的用于实施本发明方法的核酸序列的转基因稻植物的评价结果。
  性状   T1代中的%提高   T2代中的%提高
  提高的早期萌发势   8   17
  TKW   7   28
实施例45:在组成型启动子控制下表达SEQ ID NO:250的转基因植物的表型评价结果
在组成型HMGB启动子(SEQ ID NO:307)控制下表达可用于实施本发明方法的核酸序列的转基因稻植物的评价结果示于表D6。也显示了转基因植物和相应失效合子之间的百分比差异,F检验的P值低于0.05。
与对照植物(在此例中为失效合子)相比,表达用于实施本发明方法的核酸序列的转基因植物具有提高的早期萌发势、提高的地上部分生物量和提高的饱满种子数。与相应的失效合子相比,转基因植物的开花更早,达到早3天之多。
表D6:表达在组成型HMGB启动子控制下可用于实施本发明方法的核酸序列的转基因稻植物的评价结果。
实施例46:在绿色组织特异性启动子控制下表达SEQ ID NO:250的转基因植物的表型评价结果
在原叶绿素酸酯还原酶(SEQ ID NO:308)启动子控制下表达可用于实施本发明方法的核酸序列的转基因稻植物的评价结果示于表D7。也显示了转基因植物和相应失效合子之间的百分比差异,F检验的P值低于0.05。
与对照植物(在此例中为失效合子)相比,表达用于实施本发明方法的核酸序列的转基因植物具有提高的早期萌发势。与相应的失效合子相比,转基因植物的开花更早,早4天之多。
表D7:在原叶绿素酸酯还原酶启动子控制下表达可用于实施本发明方法的核酸序列的转基因稻植物的评价结果。
  性状   T1代中的%提高   T2代中的%提高
  提高的早期萌发势   18   8
实施例47:转化其它作物的实例
见上文实施例9。
实施例48:非生物胁迫筛选的实例
见上文实施例22。
第V部分SYPF1
实施例49:鉴定与SEQ ID NO:321和SEQ ID NO:322相关的序列。
使用数据库序列检索工具,如基本局部比对工具(BLAST)(Altschul等(1990)J.Mol.Biol.215:403-410;和Altschul等(1997)Nucleic Acids Res.25:3389-3402)在国家生物技术信息中心(NCBI)的Entrez核苷酸数据库中所维护的那些序列内鉴定到与SEQ ID NO:321相关的序列(全长cDNA、EST或基因组)和/或与SEQ ID NO:322相关的蛋白质序列。该程序用来通过核酸序列或多肽序列与序列数据库比较并通过计算匹配的统计学显著性而找到序列间具有局部相似性的区域。对SEQ ID NO:321所编码的多肽使用TBLASTN算法,采用默认设置和过滤以忽略低复杂性序列启动(setoff)。分析的结果通过配对性比较显示,并根据概率评分(E-值)排序,其中该评分反映特定比对结果因偶然而发生的概率(E-值越低,命中的显著性越高)。除了E-值外,比较还通过同一性百分数进行记分。同一性百分数指两个所比较核酸(或多肽)序列之间在特定长度范围内的相同核苷酸(或氨基酸)数目。在一些情况下,可以调整默认参数以调节检索的严格性。
表E1提供了与SEQ ID NO:321所示核酸序列及SEQ ID NO:322所示蛋白质序列相关的核酸及蛋白质序列的列表。
表E1:编码SYPF1多肽的核酸序列和SYPF1多肽。
实施例50:SYPF1多肽序列的比对
使用来自Vector NTI(Invitrogen)的AlignX(基于逐步比对的流行聚类算法)(Thompson等(1997)Nucleic Acids Res 25:4876-4882;Chenna等(2003).Nucleic Acids Res 31:3497-3500)进行多肽序列比对。默认值为空位开放罚分10,空位延伸罚分0.1,选定的权重矩阵为Blosum 62(如果比对多肽的话)。图19的结果显示,SYPF1多肽共有高序列保守性的区域。基序1、基序2和基序3代表序列同源性最高的区域。
使用来自Vector NTI(Invitrogen)的AlignX所提供的邻接聚类算法来构建SYPF1多肽的系统树。图20显示SYPF1多肽如何与SEQ ID NO:322的聚类。
实施例51:克隆SEQ ID NO:321所示核酸序列
除非另外说明,否则根据以下所述的标准方法进行重组DNA技术:(Sambrook(2001)Molecular Cloning:a laboratory manual,第三版ColdSpring Harbor Laboratory Press,CSH,New York)或者Ausubel等(1994),Current Protocols in Molecular Biology,Current Protocols的第1和2卷。用于植物分子工作的标准材料和方法描述于R.D.D.Croy的PlantMolecular Biology Labfax(1993),由BIOS Scientific Publications Ltd(UK)和Blackwell Scientific Publications(UK)出版。
使用拟南芥cDNA文库(Invitrogen,Paisley,UK)作为模板通过PCR扩增拟南芥SYPF1基因。PCR扩增中使用包含用于Gateway重组的AttB位点的引物(SEQ ID NO:353;有义:5’-ggggacaagtttgtacaaaaaagcaggcttaaacaatgccaaacactagcagctc t-3’)和SEQ IDNO:354;反向,互补:5’-ggggaccactttgtacaagaaagctgggtagaagcagagcaaagcaaatta-3’)。在标准条件中使用Hifi Taq DNA聚合酶进行PCR。还使用标准方法扩增并纯化预计长度(包含attB位点)的PCR片段。随后实施Gateway方法的第一步骤,即BP反应,在此期间PCR片段与pDONR201质粒发生体内重组以产生根据Gateway命名的“进入克隆”。质粒pDONR201作为技术的部分从Invitrogen购买。
实施例52:使用如SEQ ID NO:321所代表核酸序列构建表达载体
包含SEQ ID NO:321的进入克隆随后在LR反应中与用于稻转化的目的载体一起使用。这种载体在T-DNA边界内含有作为功能性元件的:植物选择标记;筛选标记表达盒和意图与已经克隆于所述进入克隆内的目的核酸序列发生LR体内重组的Gateway盒。用于根特异性表达的稻HMG启动子(SEQ ID NO:355位于这种Gateway盒的上游。
在LR重组步骤后,产生的表达载体pHMG::SYPF1(图21)根据本领域众所周知的方法转化至农杆菌菌株LBA4044中。
实施例53:植物转化
见上文实施例9。
实施例54:表型评价方法
见上文实施例10和22。
实施例55:转基因植物的表型评估结果
表达SYPF1核酸的转基因稻植物的评价结果如下。
与相应的失效合子(对照)相比,种子饱满率、饱满种子数、种子总重和收获指数均显著增加。就饱满率而言,最佳的3个株系显示与对照植物相比提高16%或更多。在饱满种子数的情形中,最佳的4个株系给出与对照植物相比提高19%或更高。与对照植物相比,种子总重在最佳的4个株系提高19%或更高,就收获指数而言,最佳的3个株系给出高于20%的增加。

Claims (24)

1.用于在植物中相对于对照植物增强产量相关性状的方法,其包括调节编码SAP样多肽的核酸在植物中的表达,其中所述受调节的表达通过在植物中引入并表达编码SAP样多肽的核酸来实现,其中所述产量相关性状是种子产量相关性状,所述种子产量相关性状为总种子产量、饱满种子数、种子饱满率和收获指数,其中所述SAP样多肽的氨基酸序列为SEQ IDNO:211,所述植物是单子叶植物。
2.根据权利要求1的方法,其中所述核酸与组成型启动子有效连接。
3.根据权利要求1的方法,其中所述核酸与GOS2启动子有效连接。
4.根据权利要求1的方法,其中所述核酸与来自稻的GOS2启动子有效连接。
5.根据权利要求1的方法,其中所述核酸与根特异性启动子有效连接。
6.根据权利要求1的方法,其中所述核酸与RCC3启动子有效连接。
7.根据权利要求1的方法,其中所述核酸与来自稻的RCC3启动子有效连接。
8.根据权利要求1的方法,其中所述核酸与年幼绿色组织特异性启动子有效连接。
9.根据权利要求1的方法,其中所述核酸与原叶绿素酸酯还原酶启动子有效连接。
10.根据权利要求1的方法,其中所述编码SAP样多肽的核酸为植物来源。
11.根据权利要求1的方法,其中所述编码SAP样多肽的核酸来自单子叶植物。
12.根据权利要求1的方法,其中所述编码SAP样多肽的核酸来自禾本科(Poacae)植物。
13.根据权利要求1的方法,其中所述编码SAP样多肽的核酸来自稻属(Oryza)植物。
14.根据权利要求1的方法,其中所述编码SAP样多肽的核酸来自稻(Oryza Sativa)。
15.构建体,其包含:
(a)编码SAP样多肽的核酸;
(b)能驱动(a)的核酸序列表达的一个或多个控制序列;以及任选的
(c)转录终止序列,
其中所述一个或多个控制序列选自:
(i)组成型启动子;
(ii)根特异性启动子;
(iii)年幼绿色组织特异性启动子,
其中所述SAP样多肽的氨基酸序列为SEQ ID NO:211。
16.根据权利要求15的构建体,其中所述组成型启动子是GOS2启动子。
17.根据权利要求15的构建体,其中所述组成型启动子是来自稻的GOS2启动子。
18.根据权利要求15的构建体,其中所述根特异性启动子是RCC3启动子。
19.根据权利要求15的构建体,其中所述根特异性启动子是来自稻的RCC3启动子。
20.根据权利要求15的构建体,其中所述年幼绿色组织特异性启动子是原叶绿素酸酯还原酶启动子。
21.根据权利要求15的构建体,其中所述编码SAP样多肽的核酸如SEQ ID NO:210所示。
22.根据权利要求15至21中任一项的构建体在产生与对照植物相比具有提高的种子产量的植物的方法中的用途,其中所述植物是单子叶植物。
23.产生与对照植物相比具有提高的种子产量的转基因植物的方法,其包括
(i)在植物中引入和表达编码SAP样多肽的核酸;和
(ii)在促进植物生长和发育的条件下培养植物细胞,
其中所述SAP样多肽的氨基酸序列为SEQ ID NO:211,所述植物是单子叶植物。
24.编码SAP样多肽的核酸用于在植物中相对于对照植物而提高种子产量中的用途,其中所述SAP样多肽的氨基酸序列为SEQ ID NO:211,所述植物是单子叶植物。
CN201210129528.XA 2006-12-21 2007-12-21 具有增强的产量相关性状的植物和用于产生该植物的方法 Expired - Fee Related CN102676575B (zh)

Applications Claiming Priority (21)

Application Number Priority Date Filing Date Title
EP06126852.0 2006-12-21
EP06126891 2006-12-21
EP06126950 2006-12-21
EP06126852 2006-12-21
EP06126950.2 2006-12-21
EP06126891.8 2006-12-21
EP06127101.1 2006-12-22
EP06127101 2006-12-22
EP06127112 2006-12-22
EP06127112.8 2006-12-22
US88335307P 2007-01-04 2007-01-04
US88335507P 2007-01-04 2007-01-04
US60/883,353 2007-01-04
US60/883,355 2007-01-04
US88610507P 2007-01-23 2007-01-23
US88610407P 2007-01-23 2007-01-23
US88610607P 2007-01-23 2007-01-23
US60/886,104 2007-01-23
US60/886,105 2007-01-23
US60/886,106 2007-01-23
CNA2007800498852A CN101583720A (zh) 2006-12-21 2007-12-21 具有增强的产量相关性状的植物和用于产生该植物的方法

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CNA2007800498852A Division CN101583720A (zh) 2006-12-21 2007-12-21 具有增强的产量相关性状的植物和用于产生该植物的方法

Publications (2)

Publication Number Publication Date
CN102676575A CN102676575A (zh) 2012-09-19
CN102676575B true CN102676575B (zh) 2015-09-30

Family

ID=44951558

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201210129528.XA Expired - Fee Related CN102676575B (zh) 2006-12-21 2007-12-21 具有增强的产量相关性状的植物和用于产生该植物的方法
CNA2007800498852A Pending CN101583720A (zh) 2006-12-21 2007-12-21 具有增强的产量相关性状的植物和用于产生该植物的方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
CNA2007800498852A Pending CN101583720A (zh) 2006-12-21 2007-12-21 具有增强的产量相关性状的植物和用于产生该植物的方法

Country Status (8)

Country Link
US (2) US8569575B2 (zh)
EP (5) EP2395093A3 (zh)
CN (2) CN102676575B (zh)
AR (1) AR064512A1 (zh)
BR (1) BRPI0721100A2 (zh)
CA (1) CA2671401A1 (zh)
MX (1) MX2009005524A (zh)
WO (1) WO2008074891A2 (zh)

Families Citing this family (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8575421B2 (en) * 2007-12-20 2013-11-05 Basf Plant Science Gmbh Plants having enhanced yield-related traits and a method for making the same
CA2731038A1 (en) * 2008-07-31 2010-02-04 Basf Plant Science Gmbh Plants having modified growth characteristics and a method for making the same
WO2010031312A1 (en) * 2008-09-16 2010-03-25 Institute Of Genetics And Development Biology, Chinese Academy Of Sciences Regulation of nitrogen starvation response
JP5519192B2 (ja) 2009-06-04 2014-06-11 トヨタ自動車株式会社 種子のタンパク質含量を増産させる遺伝子及びその利用方法
AU2014200651B2 (en) * 2009-06-04 2015-07-09 Toyota Jidosha Kabushiki Kaisha Gene for increasing plant weight and method for using the same
JP5718554B2 (ja) * 2009-06-04 2015-05-13 トヨタ自動車株式会社 植物の植物重量を増産させる遺伝子及びその利用方法
RS55986B1 (sr) 2010-01-22 2017-09-29 Bayer Ip Gmbh Akaricidne i/ili insekticidne kombinacije aktivnih supstanci
US9388423B2 (en) 2010-02-24 2016-07-12 Basf Plant Science Company Gmbh Plants having enhanced yield-related traits and a method for making the same
US20130019347A1 (en) * 2010-03-19 2013-01-17 Basf Plant Science Company Gmbh Plants having enhanced yield-related traits and a method for making the same
WO2013020985A1 (en) 2011-08-10 2013-02-14 Bayer Intellectual Property Gmbh Active compound combinations comprising specific tetramic acid derivatives
US20150059023A1 (en) * 2012-02-14 2015-02-26 Sapphire Energy, Inc. Biomass yield genes
TW201341398A (zh) * 2012-03-05 2013-10-16 Univ Pontificia Catolica Chile 與硝酸根位準有關的植物轉錄因子及其使用方法
AR092810A1 (es) * 2012-04-02 2015-05-06 Basf Plant Science Co Gmbh Plantas que tienen uno o mas rasgos mejorados relacionados con el rendimiento y un metodo para producirlas
CN103374585A (zh) * 2013-06-28 2013-10-30 西北农林科技大学 萝卜花蕾败育相关的液泡加工酶基因RsVPE1
JP5845306B2 (ja) * 2014-04-10 2016-01-20 トヨタ自動車株式会社 種子のタンパク質含量を増産させる遺伝子及びその利用方法
CN105075767B (zh) * 2014-05-15 2018-01-02 中国热带农业科学院海口实验站 一种促进山竹开花的种植方法
RU2733438C2 (ru) * 2015-01-22 2020-10-01 Маккуори Университет Термостабильные комплексы активазы rubisco
WO2018009632A1 (en) * 2016-07-08 2018-01-11 The United States Of America, As Represented By The Secretary Of Agriculture Mutated rubisco activase
WO2018027048A1 (en) * 2016-08-05 2018-02-08 Bio-Rad Laboratories, Inc. Second strand direct
CN106244596A (zh) * 2016-08-29 2016-12-21 南京农业大学 一种水稻种子休眠基因OsDOG1L3及其应用
US10487368B2 (en) 2016-09-30 2019-11-26 Uchicago Argonne, Llc Stabilization of rubisco activase for enhanced photosynthesis and crop yields
CN106480068B (zh) * 2016-12-16 2019-07-09 农业部沼气科学研究所 浮萍转录因子LmMYB基因及其应用
CN109750046A (zh) * 2017-11-02 2019-05-14 未名生物农业集团有限公司 非生物胁迫耐性提高的植物和提高植物非生物胁迫耐性的多聚核苷酸及方法
CN108504769B (zh) * 2018-06-08 2021-03-30 南京农业大学 一种与光周期敏感的白菜类作物开花时间紧密连锁的InDel分子标记及其应用
CN112585265A (zh) * 2018-06-27 2021-03-30 巴斯夫欧洲公司 热稳定性rubisco活化酶及其用途
CN109232726B (zh) * 2018-11-07 2020-11-24 中国农业科学院农业资源与农业区划研究所 蛋白质OsVPE2在调控植物液泡无机磷输出能力中的应用
CN109576284B (zh) * 2018-12-21 2021-09-17 中国农业科学院北京畜牧兽医研究所 一个多功能的myb转录因子基因及其用途
CN110204601B (zh) * 2019-05-28 2021-06-29 华南农业大学 药用野生稻OoMYB2蛋白及其编码基因、表达载体与应用
CN111778258B (zh) * 2020-01-18 2022-09-16 西南科技大学 Myb140基因、构建的载体、表达的转基因烟草植株
CN111499711B (zh) * 2020-05-20 2022-06-07 中国农业科学院作物科学研究所 一种与植物氮的吸收利用相关的SiTGAL5蛋白质及其相关生物材料与应用
CN112266412B (zh) * 2020-11-02 2022-03-25 北京市农林科学院 二系杂交小麦产量杂种优势相关蛋白TaCCA1-7D及其编码基因和应用
CN112322617A (zh) * 2020-11-27 2021-02-05 中国科学院成都生物研究所 一种可鉴定大麦籽粒糯性的kasp分子标记及其应用
CN114621976B (zh) * 2020-12-11 2023-05-02 华南农业大学 稻瘟病抗性相关基因OsMYB1R的应用
CA3219711A1 (en) * 2021-05-26 2022-12-01 Stephen P. Long C4 plants with increased photosynthetic efficiency
CN113788888B (zh) * 2021-09-18 2022-11-11 浙江大学 时钟基因rve5在调控植物生长和开花时间中的应用
CN114195872B (zh) * 2021-11-02 2022-11-11 四川农业大学 Fot1基因在水稻花时改良育种中的应用
CN113980979B (zh) * 2021-11-19 2024-02-09 云南省烟草农业科学研究院 一种可调控烟叶钾含量的NtLHY1基因及其应用
CN116410279A (zh) * 2021-12-31 2023-07-11 中国科学院植物研究所 与调控水稻非生物胁迫耐受性相关的蛋白及其相关生物材料与应用
CN114959106A (zh) * 2022-06-30 2022-08-30 中国农业科学院棉花研究所 陆地棉d12号染色体与棕榈油酸关联的snp分子标记及其应用

Family Cites Families (44)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5004863B2 (en) 1986-12-03 2000-10-17 Agracetus Genetic engineering of cotton plants and lines
EP0419533A1 (en) 1988-06-01 1991-04-03 THE TEXAS A&M UNIVERSITY SYSTEM Method for transforming plants via the shoot apex
CA2178729A1 (en) 1993-12-09 1995-06-15 Eric B. Kmiec Compounds and methods for site-directed mutations in eukaryotic cells
US6395547B1 (en) 1994-02-17 2002-05-28 Maxygen, Inc. Methods for generating polynucleotides having desired characteristics by iterative selection and recombination
US5605793A (en) 1994-02-17 1997-02-25 Affymax Technologies N.V. Methods for in vitro recombination
GB9613132D0 (en) * 1996-06-21 1996-08-28 Innes John Centre Innov Ltd Genetic control of flowering
DE19644478A1 (de) 1996-10-25 1998-04-30 Basf Ag Blattspezifische Expression von Genen in transgenen Pflanzen
WO1998030702A2 (en) * 1997-01-08 1998-07-16 University Of Florida Polynucleotides encoding choline monooxygenase and plants transformed therewith
US6388172B1 (en) * 1997-04-18 2002-05-14 The Regents Of The University Of California Phytochrome regulated transcription factor for control of higher plant development
US6555732B1 (en) 1998-09-14 2003-04-29 Pioneer Hi-Bred International, Inc. Rac-like genes and methods of use
US7135616B2 (en) * 2001-04-18 2006-11-14 Mendel Biotechnology, Inc. Biochemistry-related polynucleotides and polypeptides in plants
US7345217B2 (en) 1998-09-22 2008-03-18 Mendel Biotechnology, Inc. Polynucleotides and polypeptides in plants
US7511190B2 (en) 1999-11-17 2009-03-31 Mendel Biotechnology, Inc. Polynucleotides and polypeptides in plants
EP1033405A3 (en) * 1999-02-25 2001-08-01 Ceres Incorporated Sequence-determined DNA fragments and corresponding polypeptides encoded thereby
US20040031072A1 (en) * 1999-05-06 2004-02-12 La Rosa Thomas J. Soy nucleic acid molecules and other molecules associated with transcription plants and uses thereof for plant improvement
US20100293669A2 (en) 1999-05-06 2010-11-18 Jingdong Liu Nucleic Acid Molecules and Other Molecules Associated with Plants and Uses Thereof for Plant Improvement
US6268488B1 (en) * 1999-05-25 2001-07-31 Barbas, Iii Carlos F. Prodrug activation using catalytic antibodies
EP1063297B1 (en) * 1999-06-22 2008-12-17 Korea Kumho Petrochemical Co. Ltd. Farnesyl pyrophosphate synthase (FPS) derived from seedlings of sunflower (Helianthus annus)
AU775233B2 (en) 1999-07-22 2004-07-22 National Institute Of Agrobiological Sciences Method for superrapid transformation of monocotyledon
DE60039184D1 (de) * 1999-11-17 2008-07-24 Mendel Biotechnology Inc Toleranzgene für umweltstress
US6512167B1 (en) * 2000-02-04 2003-01-28 Rustica Prograin Genetique Hybrid maize seed and plant RPG824
AU2001247366A1 (en) * 2000-03-13 2001-09-24 Senomyx Inc. Human olfactory receptors and genes encoding same
US20110131679A2 (en) * 2000-04-19 2011-06-02 Thomas La Rosa Rice Nucleic Acid Molecules and Other Molecules Associated with Plants and Uses Thereof for Plant Improvement
ES2360596T3 (es) * 2000-05-12 2011-06-07 Cropdesign N.V. Moléculas de ácido nucleico que codifican proteínas del ciclo celular de las plantas y usos de las mismas.
EP1313867A2 (en) 2000-08-24 2003-05-28 The Scripps Research Institute Stress-regulated genes of plants, transgenic plants containing same, and methods of use
AU2002323142A1 (en) 2001-08-09 2003-02-24 Mendel Biotechnology, Inc. Yield-related polynucleotides and polypeptides in plants
US20030073135A1 (en) 2001-10-12 2003-04-17 Maxygen, Inc. Methods for improving a photosynthetic carbon fixation enzyme
JP2005185101A (ja) * 2002-05-30 2005-07-14 National Institute Of Agrobiological Sciences 植物の全長cDNAおよびその利用
AU2003287825A1 (en) * 2002-12-31 2004-07-22 Affinium Pharmaceuticals, Inc. Crystal structures of nh3-dependent nad synthetases
EP1585820B1 (en) * 2003-01-21 2007-01-03 CropDesign N.V. Use of the regulatory sequence of the rice gos2 gene for the gene expression in dicotyledonous plants or plant cells
ES2375923T3 (es) 2003-02-04 2012-03-07 Cropdesign N.V. Promotores de arroz.
JP2004283078A (ja) 2003-03-20 2004-10-14 Japan Science & Technology Agency 植物における病原菌及びウイルスの感染の防御方法
WO2004093531A2 (en) * 2003-04-22 2004-11-04 Agrinomics Llc Generation of plants with altered oil content
EP2316953A3 (en) * 2003-10-20 2011-10-05 CropDesign N.V. Identification of novel E2F target genes and use thereof
CA2545581A1 (en) * 2003-12-02 2005-06-16 Basf Aktiengesellschaft Clp-protease as target for herbicides
US20060015970A1 (en) 2003-12-12 2006-01-19 Cers, Inc. Nucleotide sequences and polypeptides encoded thereby useful for modifying plant characteristics
CA2573987A1 (en) * 2004-07-14 2006-12-07 Mendel Biotechnology, Inc. Plant polynucleotides for improved yield and quality
EP2562259B1 (en) * 2004-12-21 2016-07-06 Monsanto Technology LLC Transgenic plants with enhanced agronomic traits
AR051865A1 (es) * 2004-12-24 2007-02-14 Cropdesign Nv Plantas teniendo mayor rendimiento y metodo para producirlas
US7314975B2 (en) * 2005-08-24 2008-01-01 Pioneer Hi-Bred International, Inc. Rubisco Activase with increased thermostability and methods of use thereof
AU2007299219A1 (en) * 2006-04-05 2008-03-27 Metanomics Gmbh Process for the production of a fine chemical
MX2008015938A (es) * 2006-06-13 2009-03-13 Agrinomics Llc Generacion de plantas con resistencia a patogenos mejorada.
WO2008070179A2 (en) * 2006-12-06 2008-06-12 Monsanto Technology, Llc Genes and uses for plant improvement
NL1033850C2 (nl) 2007-05-15 2008-11-18 3Force B V Brandersysteem met voorgemengde branders en vlam-overdrachtsmiddelen.

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
OsBP-73, a rice gene, encodes a novel DNA-binding protein with a SAP-like domain and its genetic interference by double-stranded RNA inhibits rice growth;Jun Chen et al;《Plant Molecular Biology》;20031231;第52卷;579-590 *

Also Published As

Publication number Publication date
US20100077502A1 (en) 2010-03-25
EP2395092A2 (en) 2011-12-14
WO2008074891A2 (en) 2008-06-26
EP2395091A2 (en) 2011-12-14
AR064512A1 (es) 2009-04-08
EP2405011A3 (en) 2012-07-25
EP2069505A2 (en) 2009-06-17
EP2395092A3 (en) 2012-08-01
US8569575B2 (en) 2013-10-29
US20140182015A1 (en) 2014-06-26
EP2395093A2 (en) 2011-12-14
US9428761B2 (en) 2016-08-30
MX2009005524A (es) 2009-06-08
CN101583720A (zh) 2009-11-18
BRPI0721100A2 (pt) 2014-02-11
CA2671401A1 (en) 2008-06-26
EP2395091A3 (en) 2012-08-01
CN102676575A (zh) 2012-09-19
WO2008074891A3 (en) 2008-09-04
EP2405011A2 (en) 2012-01-11
EP2395093A3 (en) 2012-08-01

Similar Documents

Publication Publication Date Title
CN102676575B (zh) 具有增强的产量相关性状的植物和用于产生该植物的方法
CN101627125B (zh) 具有增强的产量相关性状的植物及其制备方法
EP2570426B1 (en) Plants having enhanced yield-related traits and a method for making the same
CN101965405B (zh) 具有增强的产量相关性状的植物和用于制备该植物的方法
US20100199382A1 (en) Plants Having Increased Yield-Related Traits And A Method For Making The Same
AU2009209600B2 (en) Plants having increased yield-related traits and a method for making the same
CN102224247A (zh) 具有改良的产量相关性状的植物和用于制备该植物的方法
CN104232679A (zh) 具有增强的产量相关性状的植物及其制备方法
CN102143971A (zh) 通过过表达编码tfl-1 样蛋白的多核苷酸而具有增强的产量相关性状的植物及其制备方法
CN102666858A (zh) 具有增强的产量相关性状的植物和用于产生该植物的方法
CN104531751A (zh) 具有增强的产量相关性状的植物和用于产生该植物的方法
CN102066568A (zh) 具有增强的产量相关性状的植物和用于产生该植物的方法
CN105087634A (zh) 具有增强的产量相关性状的nac转录因子受调节表达的植物和用于产生该植物的方法
CN104404078A (zh) 具有增强的产率相关性状的植物及其制备方法
CN102131934A (zh) 具有增强的产量相关性状的植物及其制备方法
WO2009016104A1 (en) Plants having enhanced yield-related traits and a method for making the same
CN102099480A (zh) 具有增强的产量相关性状的植物和用于产生该植物的方法
CN104328137A (zh) 具有增强的非生物胁迫耐受性和/或增强的产量相关性状的植物及其制备方法
CN102272309A (zh) 具有增强的非生物胁迫耐受性和/或增强的产量相关性状的植物及其制备方法
CN103003432A (zh) 具有增强的产量相关性状的植物和用于产生该植物的方法
CN102753693B (zh) 具有增强的产量相关性状的植物和用于产生该植物的方法
CN101874116B (zh) 具有增强的产量相关性状的植物及其生产方法
CN101548016B (zh) 产率相关性状增强的植物及使用来自yabby蛋白家族的共有序列制备其的方法
CN101432430B (zh) 产量增加的植物及其制备方法
CN104379747A (zh) 具有增强的产量相关性状的植物和用于制备该植物的方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20150930

Termination date: 20171221

CF01 Termination of patent right due to non-payment of annual fee