CN101605902B - 具有增强的产量相关性状和/或提高的非生物胁迫抗性的植物和制备该植物的方法 - Google Patents

具有增强的产量相关性状和/或提高的非生物胁迫抗性的植物和制备该植物的方法 Download PDF

Info

Publication number
CN101605902B
CN101605902B CN2008800037051A CN200880003705A CN101605902B CN 101605902 B CN101605902 B CN 101605902B CN 2008800037051 A CN2008800037051 A CN 2008800037051A CN 200880003705 A CN200880003705 A CN 200880003705A CN 101605902 B CN101605902 B CN 101605902B
Authority
CN
China
Prior art keywords
plant
nucleic acid
sequence
gene
seq
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2008800037051A
Other languages
English (en)
Other versions
CN101605902A (zh
Inventor
C·勒佐
V·弗兰卡德
A·I·桑兹莫林纳罗
Y·海茨费尔德
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BASF Plant Science GmbH
Original Assignee
BASF Plant Science GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BASF Plant Science GmbH filed Critical BASF Plant Science GmbH
Priority claimed from PCT/EP2008/051225 external-priority patent/WO2008092935A2/en
Publication of CN101605902A publication Critical patent/CN101605902A/zh
Application granted granted Critical
Publication of CN101605902B publication Critical patent/CN101605902B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/415Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A40/00Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
    • Y02A40/10Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture
    • Y02A40/146Genetically Modified [GMO] plants, e.g. transgenic plants

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Molecular Biology (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biochemistry (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Physics & Mathematics (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Cell Biology (AREA)
  • Botany (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Medicinal Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Peptides Or Proteins (AREA)

Abstract

本发明总体上涉及分子生物学领域并且涉及用于增强植物中多种经济重要的产量相关性状的方法。更具体地,本发明涉及用于在植物中通过调节植物中编码产量增加蛋白(YEP)的核酸表达而增强产量相关性状的方法。所述YEP选自核小体装配蛋白1样多肽(NAP1样)、Sm样多肽(Lsm蛋白)、截短的细胞周期蛋白H(CycHTr)多肽、Remorin多肽和DREB蛋白。本发明也涉及具有编码此种YEP的核酸受调节地表达的植物,其中所述植物相对于对照植物具有增强的产量相关性状。本发明也提供了在实施本发明方法中有用的迄今未知的YEP编码核酸和包含所述核酸的构建体。

Description

具有增强的产量相关性状和/或提高的非生物胁迫抗性的植物和制备该植物的方法
本发明总体上涉及分子生物学领域并且涉及用于增强植物中多种经济重要的产量相关性状和/或提高非生物胁迫抗性的方法。更具体地,本发明涉及用于通过调节植物中编码产量增加蛋白(Yield Enhancing Protein;YEP)的核酸表达而增强植物中产量相关性状的方法。所述YEP选自核小体装配蛋白1样多肽(NAP1样)、Sm样多肽(Lsm蛋白)、截短的细胞周期蛋白H(CycHTr)多肽、Remorin多肽和DREB蛋白。本发明还涉及具有编码这种YEP的核酸的受调节表达的植物,其中所述植物相对于对照植物具有增强的产量相关性状。本发明也提供了在实施本发明方法中有用的迄今未知的编码YEP的核酸和包含该核酸的构建体。
世界人口持续增长和农业用可耕地供应萎缩刺激了有关提高农业效率的研究。作物和园艺学改良的常规手段利用选择性育种技术来鉴定具有受欢迎特征的植物。然而,此类选择育种技术具有几个缺陷,即这些技术一般耗费巨大的劳动并且导致经常含有异源性遗传成分的植物,其中所述的异源性遗传成分可能不总是导致从亲代植物传递下去的受欢迎性状。分子生物学的进展已经允许人类改良动物和植物的种质。植物的遗传工程引起遗传物质(一般处于DNA或RNA形式)的分离和操作并且随后导入该遗传物质至植物中。此类技术具有能力产生具备多种改良的经济学、农学或园艺学性状的作物或植物。
一个具有特殊经济意义的性状是提高的产量。产量通常定义为可测量的来自作物的经济价值产生。这可以就数量和/或品质方面进行定义。产量直接取决于几个因素,例如器官数目和大小、植物构造(例如枝条的数目)、种子产生、叶衰老和更多因素。根发育、营养摄取、胁迫耐受性和早期生长势也可能是决定产量的重要因素。优化上述因素因而可以有助于作物产量提高。
种子产量是一个特别重要的性状,因为多种植物的种子对于人和动物营养是重要的。作物如谷物(corn)、稻、小麦、卡诺拉油菜(canola)和大豆占超过一半的人类总热量摄入,无论通过直接消费种子自身或通过消费基于加工的种子所产生的肉产品。作物也是糖、油和工业过程中所用多种类型代谢物的来源。种子含有胚(新苗和新根的起源)和胚乳(萌发期间和籽苗早期生长期间用于胚生长的营养来源)。种子发育涉及多种基因并且需要将代谢物从根、叶和茎转移至正在生长的种子中。胚乳尤其同化糖类、油和蛋白质的代谢前体并且将它们合成贮藏大分子以灌满籽粒。
植物生物量是饲料作物如苜蓿(alfalfa)、青贮谷物和干草的产量。产量的多种代用物已经在谷类作物中使用。这些代用物中主要是植物大小的估计。植物大小可以根据物种和发育阶段以多种方式测量,不过包括植物总干重、地上部分干重、地上部分鲜重、叶面积、茎体积、植物高度、莲座丛直径、叶长度、根长度、根质量、分蘖数目和叶数目。众多物种在给定发育阶段处维持植物不同部分的尺寸之间的保守性比率。这些异速生长关系用来从这些大小测量值之一外推出另一种大小测量值(例如Tittonell等2005Agric Ecosys&Environ 105:213)。在早期发育阶段的植物大小一般与发育后期的植物大小相关。具有较大叶面积的较大植物一般可以比较小植物吸收更多光线和二氧化碳,并且因而将可能在相同期间获得更大重量(Fasoula和Tollenaar 2005Maydica 50:39)。这还是该植物拥有的微观环境优势或遗传优势的潜在延续以初始地实现更大的大小。存在对应于植物大小和生长速率的强遗传成分(例如ter Steege等2005Plant Physiology139:1078),并且因而对于一系列不同基因型,在一种环境条件下的植物大小有可能与另一种环境条件下的大小关联(Hittalmani等2003TheoreticalApplied Genetics 107:679)。以这种方式,使用标准环境作为田间作物在不同位置和时间所遭遇的多样和动态环境的代表。
收获指数,即种子产量与地上部分干重比,在多种环境条件下是相对稳定的,并且因此经常可以获得植物大小与谷类产量之间的强烈关联(例如Rebetzke等2002Crop Science 42:739)。这些过程是内在联系的,因为大部分谷类生物量依赖于植物叶和茎的当前或贮备光合生产力(Gardener等1985Physiology of Crop plants.Iowa State University Press,第68-73页)。因此,已经选择植物大小甚至选择发育早期的植物大小用作将来潜在产量的指示物(例如Tittonell等2005Agric Ecosys&Environ 105:213)。当检验遗传差异对胁迫耐受性的影响时,与田间相比,土壤特性、温度、水和营养的可获得性和光强度能够标准化是温室或植物生长箱环境的固有优势。然而,因不良授粉而对产量的人为限制可能限制这些受控环境用于检验产量差异的用途,其中所述的不良授粉因缺乏风或昆虫或成熟根或冠部生长的空间不足引起。因此,测量在生长箱或温室中标准条件下早期发育的植物大小是提供潜在遗传性产量优势指示的标准实践操作。
众多作物的另一个重要性状是早期生长势。改进早期生长势是现代稻育种计划在温带和热带稻品种上的重要目标。长根在水栽稻中对于正确土壤固定是重要的。在稻直接播种至淹水田地,以及植物必须穿过水迅速出苗的情况下,较长的苗与生长势相关。在实施条播的情况下,较长的中胚轴和胚芽鞘对于优异的籽苗出苗是重要的。在农业中将早期生长势设计至植物内是极其重要的。例如,早期生长势不良已经限制在欧洲大西洋地区引种基于玉米带种质(Corn Belt germplasm)的玉米(Zea mayes L.)杂交种。
又一个重要性状是改善的非生物胁迫耐受性。非生物胁迫是世界范围作物损失的主要原因,平均产量对于大多数主要作物植物而言降低超过50%(Wang等,Planta(2003)218:1-14)。非生物胁迫可以由干旱、盐度、极端温度、化学毒性和氧化胁迫引起。改善植物对非生物胁迫耐受的能力将在世界范围对农民提供大的经济优势,并且将允许在不利条件期间和在本来也许不可能栽培作物的土地上栽培作物。
作物产量因而可以通过优化上述因素之一提高。
取决于最终用途,对某些产量性状的改良可能优先于其他产量性状。例如对于应用如饲料或木材生产或生物燃料资源而言,增加植物营养体部分可能是受欢迎的,而对于应用如面粉、淀粉或油生产而言,种子参数的提高尤其可能是受欢迎的。即便在种子参数当中,取决于应用,某些参数可以更优先于其他参数。多种机制可以有助于提高种子产量,无论其形式为提高的种子大小或提高的种子数目。
提高植物中产量(种子产量和/或生物量)的一种方法可以是通过调节植物的内在生长机制如细胞周期或多种参与植物生长或参与防御机制的信号途径。
出人意料地,现在已发现:调节植物中编码产量增加多肽(YieldEnhancing Polypeptide;YEP)的核酸表达产生了相对于对照植物而言,具有增强的产量相关性状和/或提高的非生物胁迫抗性的植物,其中所述的产量增加多肽(YEP)选自核小体装配蛋白1样多肽(NAP1样)、Sm样多肽(Lsm蛋白)、截短的细胞周期蛋白H(CycHTr)多肽、Remorin多肽和DREB蛋白。
发明背景
I.核小体装配蛋白1样多肽(NAP1样)
NAP蛋白构成了在动物中已知并且据报道参与染色质相关活性的相关蛋白质家族。NAP蛋白质家族以存在称作NAP结构域的保守序列为特征。NAP结构域在Pfam(登录号PF00956)和Interpro数据库(登录号IPR002164)中描述。NAP是介导DNA包装至核小体内的多因子复合体的一种组分(Krude,T.和Keller,C.(2001)Cell.Mol.Life Sci.58,665-672)。在真核细胞分裂周期的S期期间,新复制的DNA迅速装配入染色质。这个过程需要几种因子的协调作用。在初始阶段,CAF1(染色质装配因子1)结合组蛋白H3和H4并且通过PCNA结合作用将它们导向复制叉。由NAP1蛋白介导组蛋白H2A和H2B的随后沉积。NAP1首先在HeLA细胞中描述(von Lindern等(1992)Mol.Cell.Biol.12,3346-3355)并且后来发现在全部真核生物中是保守的。此外,认为NAP蛋白调节基因转录并可以影响细胞分化和发育。
SET蛋白与NAP蛋白高度相关并且在人类的多个细胞过程中发挥作用。在人细胞中,已经显示SET在细胞周期调节(如G2/M转换)期间与多种CDK-细胞周期蛋白复合体结合。SET是参与几条信号途径的蛋白磷酸酶2A(PP2A)的强力抑制物。SET的抑制活性可归因于酸性羧基端结构域(Canela等(2003)J.Biol.Chem.278,1158-1164)。其他报告显示SET参与DNA修复和转录。SET是具有染色质相关蛋白HMG2介导的DNA结合和弯曲活性的复合体的部分。HMG2通过使DNA弯曲和成环或通过使低缠绕的DNA稳定而促进核蛋白高级结构的装配。HMG2与SET共沉淀(Fan等(2002)Mol.Cell.Biol.22,2810-2820)。还报道SET抑制活性DNA去甲基化(Cervoni等(2002)J.Biol.Chem.277,25026-25031)。参与抑制组蛋白乙酰化的癌蛋白Set/TAF-I也抑制可导致基因沉默的异位方式甲基化的DNA去甲基化。有人提出Set/TAF-I在基因调节中,在集成组蛋白和DNA的外遗传状态方面发挥作用。
NAP1蛋白的活性部分地通过磷酸化作用调节。已经证实NAP1在果蝇(Drosophila)中的亚细胞定位取决于其磷酸化状态,而所述磷酸化状态可受酪蛋白激酶II控制(Rodriguez等(2000)J.Mol.Biol.298,225-238)。据报道哺乳动物拥有几种NAP1蛋白,而在酵母中仅有一种已知的NAP1蛋白。
植物NAP1直向同源物(orthologues)很大程度上仍是未知的,尽管报道了来自大豆(Yoon等(1995)Mol.Gen.Genet.249,465-473)、拟南芥属(Arabidopsis)、烟草、玉米、和稻(Dong等(2003)Planta 216,561-570)的NAP1蛋白。植物NAP1样基因的系统发生分析已经揭示存在两个亚组,一个亚组与NAP1相关而另一个亚组与SET蛋白相关(图1)。最可能地,后来可能已经发生了序列趋异性,因为两个拟南芥属序列、两个玉米序列和两个烟草序列簇集在一起,指向一个更为新近的基因重复作用。酿酒酵母(Saccharomyces cerevisiae)基因组仅含有一个NAP编码基因,其组合了NAP1和SET这两个亚组的功能特性。类似地,NAP1的一个同源物-模板激活因子1(TAF-I)组合了PP2a抑制活性(Saito等,Biochem.Biophys.Res.Comm.259,471-475,1999)和染色质再塑造活性(Kawase等,GenesCells 1,1045-1056,1996)。因此可能的是NAP/SET家族的植物蛋白很大程度在功能上是冗余的,尤其在SET蛋白的组中,其中与NAP组相比,观察到较低程度的趋异性。此外,存在NAP和SET蛋白属于相同家族的结构证据,因为这两种蛋白质共有后接有羧基端酸性区域的NAP结构域。
对NAP1样蛋白在植物中的功能知之甚少,虽然已经提出其在有丝分裂和胞质分裂中的作用(Dong等2003)。NAP1蛋白的植物直向同源物最有可能发挥异于其动物对应物的不同作用。基于其核定位并基于与哺乳动物SET蛋白的序列相似性,可以预期该植物蛋白在染色质再塑造方面的作用。此外,植物NAP/SET蛋白组可能参与调节植物中的PP2A。PP2A是植物中的主要磷酸酶之一,很大程度地作用于转录因子和蛋白激酶,并且据称调节参与多种细胞过程的蛋白质的活性,所述的细胞过程包括细胞周期(Ayaydin等(2000)Plant J.23,85-96),激素作用如ABA介导的气孔运动,萌发(Kwak等(2002)Plant Cell 14,2849-2861)或者植物生长素运输和根发育(Garbers等1996EMBO J.15,2115-2124)。还报道PP2A参与光合作用和光信号传导作用(Sheen(1993)EMBO J.12,3497-3505)和参与氮同化(Hirose和Yamaya(1999)Plant Physiology 121,805-812)。WO 2005/094562公开了NAP1样蛋白用于提高产量的用途,但是仍没有提到在受非生物胁迫的植物中NAP1样蛋白被调节的表达的作用。
II.Lsm(Sm样)蛋白
核糖核酸(RNA),一种由核糖核苷酸单体组成的核酸聚合物,是活生物中的关键成分。它在必需的细胞功能中发挥重要作用。RNA充当将基因翻译成蛋白质的模版、转运氨基酸至核糖体以合成蛋白质。一些RNA分子如核酶也具有催化活性并且RNA分子作为基因表达的主要调节物的作用最近已经确立。
细胞中信使RNA(mRNA)的合成和功能需要一系列事件,包括转录、加工、运输、翻译和降解。RNA加工指转录后修饰RNA的事件。在真核生物中,绝大部分新生的前mRNA含有内含子,所述的内含子被剪接除去,导致外显子的精确连接以产生成熟的mRNA,即由核糖体使用以翻译成蛋白质的RNA形式。RNA的转录后修饰也包括在5’端加帽和在3’端聚腺苷酸化,其影响稳定性和翻译效率。mRNA翻译与周转之间的关系对于基因表达的调节和细胞发挥正常功能是重要的。在高等真核生物中,几百种蛋白质参与RNA代谢。此类蛋白质的实例是Lsm蛋白(Sm样蛋白)。
Lsm(Like Sm;Sm样)蛋白质如此得名的原因是与之前描述的Sm蛋白的结构相似性。Lsm蛋白是与核心剪接体snRNA(小的核RNA)和snRNP(小的核核糖核蛋白)结合的小蛋白。Lsm蛋白含有长度各异、一般长50-70个氨基酸的Lsm结构域,其包括由可变区隔开的两个短的保守氨基酸段。与Sm蛋白相比,已经提出Lsm蛋白形成异七聚体或异六聚体复合体,其中七个或六个Lsm蛋白排列在具有一个中心小孔的环中(Kambach C等Cell 1999;96:375-387;Khusial P等Trends Biochem Sci.2005年9月;30(9):522-8;Zaric B等J Biol Chem.2005年4月22日;280(16):16066-75)。
Sm样蛋白家族已经在进化期间扩展,产生了具有不同底物特异性的蛋白质复合体。所述多种蛋白质复合体的共有特性是它们与RNA相互作用,保护这些RNA免遭不适宜的核酸酶活性作用和/或修饰它们的结构,在多种情况下影响这些RNA与其他RNA或与蛋白质的相互作用。发现编码Lsm蛋白的基因不仅存在于真核生物中,还存在于细菌以及甚至在没有任何剪接装置的古细菌中存在。
在酵母中,已经描述了Lsm蛋白在胞核和胞浆中形成影响前mRNA剪接和降解、小的核RNA、tRNA和rRNA加工和mRNA降解的复合体。这些活性暗示了影响RNA-RNA和/或RNA-蛋白质相互作用的Lsm蛋白的RNA伴侣样作用。核Lsm蛋白在维持前-rRNA加工事件的秩序方面发挥额外作用,它们与核糖体装配有关并且可能促进核糖体装配。Lsm6p、Lsm7p和Lsm1p蛋白质中的突变仅对核RNA的稳定性影响甚微,表明其他有活性的Lsm或Sm蛋白可替代这些非必需的Lsm蛋白。(Beggs JD.等Biochem Soc Trans.2005年6月;33(Pt 3):433-8)。因此,尽管Lsm蛋白结合以形成具有不同底物特异性的不同蛋白质复合体,然而Lsm蛋白之间存在功能性冗余,从而允许具有不同Lsm组分的备选蛋白质复合体履行相同的功能。已经使用异源系统证实Lsm蛋白在物种之间的功能保守性。例如,酵母Lsm1p促进植物RNA病毒在酵母中的复制(Noueiry AO等Mol Cell Biol.2003年6月;23(12):4094-106)。
提出了Lsm1与涉及mRNA脱帽的蛋白质的相互作用和Lsm蛋白在胞浆mRNA降解中的额外作用(Tharun S等Genetics.2005年5月;170(1):33-46)。还描述了在保护snoRNA(小的核仁RNAs)以及snRNA抵抗3’末端剪裁和ARE-mRNA(含有AU丰富元件的信使RNA)降解中的其它不同作用(Beggs JD.Lsm蛋白和RNA加工(Lsm proteins and RNAprocessing).Biochem Soc Trans.2005年6月;33(Pt 3):433-8;StoecklinG,Mayo T,Anderson P.ARE-mRNA降解需要5′-3′降解途径(ARE-mRNAdegradation requires the 5′-3′decay pathway).EMBO Rep.2006年1月;7(1):72-7)。Stoecklin G,Mayo T,Anderson P.ARE-mRNA降解需要5′-3′降解途径(ARE-mRNA degradation requires the 5′-3′decay pathway).EMBO Rep.2006年1月;7(1):72-7)。
在酵母中,LSM蛋白分成8类,Lsm1至Lsm8(Wang和BrendelGenome Biology 2004,5:R102)。全部酵母Lsm蛋白具有在植物中的同源物。在拟南芥(Arabidopsis thaliana)中,存在11种鉴定的Lsm蛋白,它们属于酵母中存在的相同8个类。4种Lsm蛋白在拟南芥中有两份。这些基因有可能作为单个拷贝存在于动物和植物的祖先中,但是在植物品系中有两个拷贝。
在植物中,已经实验地表征了11个Lsm基因中的一个基因(LSM5,At5g48870)。已经分离了Lsm5p缺陷的拟南芥突变体并证实了在调节脱落酸信号转导中发挥作用。因此,该突变植物显示SAD(对ABA和干旱处理超敏感)表型(Xiong L等Dev Cell.2001年12月;1(6):771-81)。
III.截短的细胞周期蛋白H
细胞周期蛋白是在细胞周期进程中发挥作用的蛋白质。它们在细胞周期期间合成和降解,并且它们大部分通过结合至并因此激活细胞周期蛋白依赖性激酶而展现其功能。细胞周期蛋白可以分组成有丝分裂细胞周期蛋白(在高等真核生物中称为A-和B-型细胞周期蛋白并且在芽殖酵母中称为CLB)和G1特异性细胞周期蛋白(在哺乳动物中称为D-型细胞周期蛋白并且在芽殖酵母中称为CLN)。细胞周期蛋白B例如是有丝分裂促进因子(MPF)的大蛋白质亚基;细胞周期蛋白B在细胞周期期间合成和降解以调节MPF活性。细胞周期蛋白B和细胞周期蛋白依赖性激酶1(cdk1、akacdc2、aka p34激酶)共同形成活性MPF蛋白。其他细胞周期蛋白包括细胞从G1至S期转移所需要的细胞周期蛋白E(与G1期Cdk结合);和细胞周期蛋白A,其中所述的细胞周期蛋白A与S期Cdk2结合并且是细胞推进经过S期所需的。H-型细胞周期蛋白调节CAKs(CDK-激活激酶)的活性。植物中已知的全部四种类型的细胞周期蛋白主要通过类推至它们的人类对应物而鉴定。在拟南芥属中,已经描述了10种A-型、9种B-型、10种D-型和1种H-型细胞周期蛋白(Vandepoele等,2002)。细胞周期蛋白一般具有所谓的细胞周期蛋白盒,是一种为结合并激活细胞周期蛋白依赖性激酶所需的保守序列。
细胞周期蛋白H也是细胞周期的调节物(Fisher等Cell 78,713-724,1994;Makela等Nature 371,254-257,1994;Yamaguchi等Plant J.24,11-20,2000)。在动物细胞中,它是CDK7/细胞周期蛋白H/MAT1复合体的一部分。这种复合体实际上是一种“细胞周期蛋白激活复合体”,该复合体通过磷酸化细胞周期蛋白而调节激活级联中其他细胞周期蛋白/CDK复合体的活性。细胞周期蛋白H也参与转录和DNA修复。CDK7和CDK7在其他生物中的对应物如稻中的R2或裂殖酵母属(Schizosaccharomyces)中的Mcs6/Crk1/Mop1称作细胞周期蛋白依赖性激酶激活激酶(CDK激活激酶或CAK)。
CDK激活激酶(CAK)活化了细胞周期蛋白依赖性激酶(cdks),通过磷酸化cdks中保守的苏氨酸残基而控制细胞周期进程。来自人的CAK复合体包括p40MO15(cdk7)、细胞周期蛋白H和MAT1,它们也是使RNA聚合酶II大亚基的羧基端结构域磷酸化的转录因子IIH的亚基。
IV.Remorin
Remorin(又称作pp34或dbp)形成胞浆膜/脂筏相关蛋白超家族(Alliotte等(1989)Plant Physiol 89:743-752;Reymond等(1996)Plant Cell8:2265-2276;Bariola等(2004)Plant Molec Biol 55:579-594;Mongrand等(2004)J Biol Chem 279(35):36277-36286)。该植物特异的超家族存在于被子植物、裸子植物和苔藓植物中。在拟南芥属中找到至少15种密切相关的Remorin,并且其他植物中Remorin家族具有相似丰度。
Remorin多肽以其羧基端半部分存在卷曲螺旋结构域为特征。卷曲螺旋结构域常常参与蛋白质-蛋白质相互作用,尤其在寡聚化中。与此相符,已经发现Remorin在体外寡聚化并形成丝状结构,并且作为寡聚结构存在于植物胞浆膜制备物中(Bariola等,参见上文)。
尽管与胞浆膜强结合,不过Remorin多肽不具有典型膜结合蛋白的结构。相反,Remorin是小的亲水性多肽。尤其,Remorin的羧基端半部分富含带电荷的氨基酸(Lys(K)、Arg(R)、Asp(D)和Glu(E)。最后,大部分的Remorin于包含在该多肽羧基末端处最后10个氨基酸残基中至少包含半胱氨酸(Cys或C)和/或苯丙氨酸(Phe或F)。
Remorin可以在体外非特异性地与聚阴离子如寡半乳糖醛酸(OGA;Reymond等,参见上文)、多聚半乳糖醛酸(PGA;Farmer等(1991)J BiolChem 266(5):3140-5)结合,并且也可以结合双链DNA(Alliotte等,参见上文)。作为参与众多信号途径的活性胞外基质成分的OGA也刺激Remorin的体外磷酸化,主要在苏氨酸残基处磷酸化。
还不可能重获过量表达编码Remorin多肽的核酸序列的健康拟南芥属品系,并且反义品系不表现明显表型,可能原因是Remorin由庞大的多基因家族代表(Bariola等,参见上文)。国际专利申请WO 02/16655描述了作为SEQ ID NO:2621的编码Remorin多肽的核酸序列。美国专利7,071,380描述了作为SEQ ID NO:379和SEQ ID NO:380的编码Remorin多肽的两种核酸序列。美国专利7,135,616描述了作为SEQ ID NO:133的编码Remorin多肽的核酸序列。
V.DREB
转录因子通常定义为显示序列特异性DNA结合作用和能够激活和/或抑制转录的蛋白质。拟南芥属基因组编码至少1533种转录调节物,这占据估计基因总数的约5.9%。据报道这些转录因子的约45%来自植物专属家族(Riechmann等,2000(Science第290卷,2105-2109))。
AP2/EREBPs(APETALA2/乙烯应答元件结合蛋白)是植物独有的转录因子的原型家族,所述转录因子的区别性特征是它们含有所谓AP2DNA-结合结构域,其与乙烯应答启动子中的GCC盒直接相互作用。然而,含有AP2结构域的蛋白质也在病毒、蓝细菌和纤毛虫的基因组中编码,其中认为它们作为核酸内切酶发挥作用(Magnani等Plant Cell.2004年9月;16(9):2265-77)。
AP2/EREBP家族成员基于AP2结构域的数目和其他保守基序的存在而分成3个不同组。AP2结构域的共有序列显示组间的轻微差异。称作APETALA 2亚家族的第一个性质不同的组由含有两个重复AP2结构域的成员组成。称作ERF亚家族的第二组的成员含有单个AP2结构域,并且也称作RAV蛋白的第三组由含有B3结构域和单个AP2结构域的蛋白质组成。虽然已经报道显示具有两个AP2结构域的蛋白质发挥发育作用,但大部分含有单个AP2结构域的蛋白质相对于生物胁迫和非生物胁迫在进行研究。
DREB或CBF蛋白构成参与非生物胁迫应答的含有单个AP2结构域的蛋白质的亚组(Yamaguchi-Shinozaki等1994.Plant Cell.6,251-264)。已经报道了DREB或CBF结合称作DRE(干旱应答元件)和/或CRT(C重复)的基因启动子中的特异性顺式作用元件并激活与寒冷、干旱和高盐度相关的下游基因转录(Baker等(1994)Plant Mol.Biol.24,710-713);Stockinger等(1997)Proc.Natl.Acad.Sci.94,1035-1040;Liu等Plant Cell 10,1391-1406)。
DREB蛋白的基因表达在植物中受到高度调节。根据不同胁迫条件下的差异表达,可以在拟南芥属中区分两个亚组的DREBS,为DREB1和DREB2。然而在结构和功能方面,这两个亚组通过结合至DRE/CRT顺式作用元件并调节胁迫基因的表达而类似地运作。此外,这种结合作用可以导致下游基因的反式激活或反式失活(Zhao等2006,JBC 218,10752-10759)。
已经广泛报道DREB基因在植物中的过量表达导致胁迫诱导型基因的强表达,并且转基因植物获得较高的非生物胁迫耐受性(Jaglo-Ottosen等(1998)Science 280:104-106;Sakuma Y等(2006)Plant Cell18:1292-1309;Jaglo KR等(2001),Plant Physiol 127:910-917;Shen等(2003)Theor Appl Genet 106:923-930,Dubouzet JG等(2003)Plant J33:751-763)。也已经在CBF2基因表达受损的拟南芥中报道了CBF2突变体的非生物胁迫耐受性。有趣的是,CBF1/DREB1B和CBF3/DREB1A在CBF2敲除植物中的表达水平提高。这些结果显示在拟南芥属植物中,CBF2/DREB1C负向地调节CBF1/DREB1B和CBF3/DREB1A基因的表达(Novillo等2004,101,3985-3990)。
出人意料地,已经发现调节植物中编码产量增加多肽(YEP)的核酸表达产生相对于对照植物而言具有增强的产量相关性状和/或提高的非生物胁迫抗性的植物,其中所述的产量增加多肽(YEP)选自核小体装配蛋白1样多肽(NAP1样)、Sm样多肽(Lsm蛋白)、截短的细胞周期蛋白H(CycHTr)多肽、Remorin多肽和DREB蛋白。
定义
多肽/蛋白质
术语“多肽”和“蛋白质”在本文中可相互交换地使用并且指由肽键连接起来的任意长度聚合物形式的氨基酸。
多核苷酸/核酸/核酸序列/核苷酸序列
术语“多核苷酸”、“核酸序列”、“核苷酸序列”、“核酸”、“核酸分子”在本文中可相互交换地使用并且指任意长度聚合的非分支形式的核苷酸,即核糖核苷酸或脱氧核糖核苷酸或这二者的组合。
对照植物
选择合适的对照植物是实验设计的例行部分并且可以包括相应的野生型植物或无目的基因的相应植物。对照植物一般是相同的植物物种或甚至是与待评估植物相同的品种。对照植物也可以是待评估植物的失效合子。如本文中所用的“对照植物”不仅指完整植物,也指植物部分,包括种子和种子部分。
同源物
蛋白质的“同源物”包括这样的肽、寡肽、多肽、蛋白质和酶,它们相对于非修饰的所讨论蛋白质具有氨基酸替换、缺失和/或插入并且与它们衍生自的所述非修饰蛋白质具有相似的生物学活性和功能活性。
缺失指从蛋白质中移除一个或多个氨基酸。
插入指一个或多个氨基酸残基被导入蛋白质中的预定位点。插入可以包含氨基端融合和/或羧基端融合以及序列内插入单个或多个氨基酸。通常,在氨基酸序列内部的插入物比氨基端融合物或羧基端融合物小约1-10个残基级别。氨基端或羧基端融合蛋白或融合肽的实例包括如酵母双杂交系统中所用的转录激活物的结合结构域或激活结构域、噬菌体外壳蛋白、(组氨酸)-6-标签、谷胱甘肽S-转移酶-标签、蛋白A、麦芽糖结合蛋白、二氢叶酸还原酶、Tag·100表位、c-myc表位、-表位、lacZ、CMP(钙调蛋白结合肽)、HA表位、蛋白C表位和VSV表位。
替换指以具有相似特性(如相似的疏水性、亲水性、抗原性、形成或破坏α-螺旋结构或β-折叠结构的倾向性)的其他氨基酸替换蛋白质的氨基酸。氨基酸替换一般是单个残基的,不过根据给予多肽的功能性约束条件,可以是簇集的;插入通常是约1-10个氨基酸残基级别。氨基酸替换优选地是保守性氨基酸替换。保守性替换表是本领域熟知的(见例如Creighton(1984)Proteins.W.H.Freeman and Company(编著)和下表1)。
表1:保守性氨基酸替换的实例
  残基   保守性替换   残基   保守性替换
  Ala   Ser   Leu   Ile;Val
  Arg   Lys   Lys   Arg;Gln
  Asn   Gln;His   Met   Leu;Ile
  Asp   Glu   Phe   Met;Leu;Tyr
  Gln   Asn   Ser   Thr;Gly
  Cys   Ser   Thr   Ser;Val
  Glu   Asp   Trp   Tyr
  Gly   Pro   Tyr   Trp;Phe
  His   Asn;Gln   Val   Ile;Leu
  Ile   Leu,Val
氨基酸替换、缺失和/或插入可以使用本领域熟知的肽合成技术如固相肽合成法等或通过重组DNA操作轻易地进行。用于操作DNA序列以产生蛋白质的替换、插入或缺失变体的方法是本领域熟知的。例如,用于在DNA的预定位点处产生替换突变的技术是本领域技术人员熟知的并且包括M13诱变法、T7-Gen体外诱变法(USB,Cleveland,OH)、QuickChange位点定向诱变法(Stratagene,San Diego,CA)、PCR介导的位点定向诱变或其他位点定向诱变法。
衍生物
“衍生物”包括这样的肽、寡肽、多肽,其中与天然存在形式蛋白质(如目的蛋白)的氨基酸序列相比较,它们包含非天然存在的氨基酸残基对氨基酸的替换或非天然存在的氨基酸残基的添加。蛋白质的“衍生物”也包括这样的肽、寡肽、多肽,其中与所述多肽天然存在形式的氨基酸序列相比,它们包含天然存在改变(糖基化、酰化、异戊二烯化、磷酸化、肉豆蔻酰化、硫酸化等)的氨基酸残基或非天然存在改变的氨基酸残基。与衍生出衍生物的氨基酸序列相比较,该衍生物可以也包含与所述氨基酸序列共价或非共价结合的一个或多个非氨基酸的取代基或添加物(例如报道分子或其他配体),如所结合旨在促进检测该衍生物的报道分子,和相对于天然存在的蛋白质的氨基酸序列而言,包含非天然存在的氨基酸残基。此外,“衍生物”也包括天然存在形式蛋白质与标签肽如FLAG、HIS6或硫氧还蛋白(对于标签肽的综述,见Terpe,Appl.Microbiol.Biotechnol.60,523-533,2003)的融合物。
直向同源物/旁系同源物
直向同源物和旁系同源物包括用来描述基因祖先关系的进化概念。旁系同源物是相同物种内起源于祖先基因复制的基因;而直向同源物是来自不同生物的因物种形成而起源的基因,并且也来源于共同的祖先基因。
结构域
术语“结构域”指在进化相关性蛋白质的序列比对结果上的特定位置处保守的一组氨基酸。尽管在其他位置处的氨基酸可以在同源物之间不同,然而在特定位置处高度保守的氨基酸指示了很可能在蛋白质结构、稳定性或功能方面是必需的氨基酸。结构域因其在蛋白质同源物家族的比对序列中高保守程度而鉴定,故它们可以作为鉴定物用来确定所讨论的任意多肽是否属于先前已鉴定的多肽家族。
基序/共有序列/标签
术语“基序”或“共有序列”或“标签”指在进化相关蛋白质的序列中短的保守区域。基序往往是结构域的高度保守部分,不过也可以仅包括结构域的部分,或可以位于保守结构域之外(若基序的全部氨基酸位于定义的结构域之外)。
杂交
如本文中所定义的术语“杂交”是其中基本上同源互补的核苷酸序列相互复性的过程。杂交过程可以完全在溶液中进行,即两种互补核酸均处于溶液中。杂交过程也可以用固定至基质如磁珠、琼脂糖凝胶(Sepharose)珠或任何其他树脂的互补核酸之一进行。杂交过程也可以用固定至固体支持物如硝酸纤维素膜或尼龙膜上或通过例如照相平版印刷术固定至例如硅玻璃支持物(后者称作核酸阵列或微阵列或称作核酸芯片)的互补核酸之一进行。为使杂交发生,核酸分子通常受到热变性或化学变性,以使双链解链成两条单链和/或去除来自单链核酸的发夹或其他二级结构。
术语“严格性”指进行杂交的条件。杂交的严格性受诸条件如温度、盐浓度、离子强度和杂交缓冲液组成的影响。通常,低严格条件选择为在定义的离子强度和pH处,低于特定序列的热解链温度(Tm)约30℃。中等严格条件是所述温度低于Tm 20℃并且高严格条件是所述温度低于Tm 10℃。高严格杂交条件一般用于分离与靶核酸序列具有高序列相似性的杂交序列。然而,核酸可以在序列上偏离且依旧编码基本上相同的多肽,原因是遗传密码的简并性。因而,有时候可能需要中等严格杂交条件以鉴定此类核酸分子。
Tm是在定义的离子强度和pH处的下述温度,其中50%的靶序列在所述温度与完全匹配的探针杂交。Tm取决于溶液条件和探针的碱基组成及长度。例如,较长的序列在更高温度上特异性地杂交。最大杂交速率在低于Tm约16℃直至32℃上获得。杂交溶液中一价阳离子的存在降低了两条核酸链之间的静电排斥作用,因而促进杂交体形成;这种作用对于高达0.4M的钠浓度是显而易见的(对于更高的浓度而言,可以忽略这种作用)。甲酰胺降低了DNA-DNA和DNA-RNA双链体的解链温度,每百分数的甲酰胺降低0.6-0.7℃,且添加50%甲酰胺允许在30-45℃杂交,尽管杂交速率将降低。碱基对错配降低了杂交速率和双链体的热稳定性。平均而言和对于大探针而言,Tm下降约1℃/每%碱基错配。根据杂交体的类型,Tm可以使用以下等式计算:
1)DNA-DNA杂交体(Meinkoth和Wahl,Anal.Biochem.,138:267-284,1984):
Tm=81.5℃+16.6×log10[Na+]a+0.41×%[G/Cb]-500×Lc]-1-0.61×%甲酰胺
2)DNA-RNA杂交体或RNA-RNA杂交体
Tm=79.8+18.5(log10[Na+]a)+0.58(%G/Cb)+11.8(%G/Cb)2-820/Lc
3)寡DNA或寡RNAd杂交体:
对少于20个核苷酸而言:Tm=2(ln)
对20至35个核苷酸而言:Tm=22+1.46(ln)
a或者用于其他一价阳离子,但是仅在0.01至0.4M范围内是精确的。
b仅对于在30%-75%范围内的%GC是精确的。
cL=双链体的碱基对长度。
dOligo,寡核苷酸;ln,=引物的有效长度=2×(G/C数)+(A/T数)。
可以众多已知技术中任意一种技术控制非特异性结合,例如将膜以含有蛋白质的溶液封闭、添加异源RNA、异源DNA、和SDS至杂交缓冲液、和用RNA酶处理。对于非同源性探针,可以通过变换以下条件之一:(i)渐进地降低复性温度(例如从68℃至42℃)或(ii)渐进地降低甲酰胺浓度(例如从50%至0%)进行一系列杂交。技术人员了解可以在杂交期间变更和维持或改变所述严格条件的多个参数。
除了杂交条件之外,杂交特异性一般还取决于杂交后洗液的功能。为除去因非特异性杂交引起的背景,样品用稀释的盐溶液洗涤。此类洗液的关键因素包括最终洗涤溶液的离子强度和温度:盐浓度越低且洗涤温度越高,则洗涤的严格性越高。洗涤条件一般在杂交严格性处或低于所述杂交严格性而进行。阳性杂交产生至少两倍于背景信号的信号。通常,用于核酸杂交测定法或基因扩增检测方法的适宜严格条件如上所述。也可以选择严格性更高或更低的条件。技术人员了解可以在杂交期间变更和维持或改变所述严格条件的多个参数。
例如,用于长度大于50个核苷酸的DNA杂交体的典型高严格杂交条件包括在65℃于1×SSC中或在42℃于1×SSC和50%甲酰胺中杂交,随后在65℃于0.3×SSC中洗涤。用于长度大于50个核苷酸的DNA杂交体的中等严格杂交条件的实例包括在50℃于4×SSC或在40℃于6×SSC和50%甲酰胺中杂交,随后在50℃于2×SSC中洗涤。杂交体的长度是杂交核酸的预期长度。当杂交序列已知的核酸时,可以通过将序列比对并鉴定本文中所述的保守区而确定杂交体长度。1×SSC是0.15M NaCl和15mM柠檬酸钠;杂交溶液和洗涤溶液可以额外地包括5×Denhardt试剂、0.5-1.0%SDS、100μg/ml变性的片段化鲑精DNA、0.5%磷酸钠。
出于定义严格性的水平的目的,可以参考Sambrook等(2001)Molecular Cloning:a laboratory manual,第三版Cold Spring HarborLaboratory Press,CSH,New York或参考Current Protocols in MolecularBiology,John Wiley&Sons,N.Y.(1989和年度更新版)。
剪接变体
如本文中所用的术语“剪接变体”包括其中所选内含子和/或外显子已经被切除、替换、置换或添加或其中内含子已经被缩短或加长的核酸序列的变体。此类变体将是其中基本上保留了蛋白质生物学活性的一类变体;这可以通过选择性地保留蛋白质的功能性片段实现。此类剪接变体可以在自然界中找到或可以人工制备。用于预测和分离此类剪接变体的方法是本领域熟知的(见例如Foissac和Schiex,BMC Bioinformatics.2005;6:25)。
等位变体
等位基因或等位变体是给定基因位于相同染色体位置处的备选形式。等位变体包含单核苷酸多态性(SNP)和小的插入/缺失多态性(INDEL)。INDEL的大小通常小于100bp。SNP和INDEL形成大部分生物的天然存在多态性株系中的序列变体的最大集合。
基因改组/定向进化
基因改组或定向进化由反复DNA改组,随后适当筛选和/或选择以产生编码具有改良生物学活性的蛋白质的核酸或其部分的变体而组成(Castle等,(2004)Science 304(5674):1151-4;美国专利5,811,238和6,395,547)。
调节元件/调控序列/启动子
术语“调节元件”、“调控序列”和“启动子”均在本文中可相互交换地使用并且在广泛含义上意指能够实现与它们相连接的序列表达的调节性核酸序列。术语“启动子”一般指位于基因转录起点上游并参与识别和结合RNA聚合酶和其他蛋白质,因而指导有效连接的核酸转录的核酸调控序列。前述术语包括从经典真核基因组基因(包括对于精确转录启动所需的TATA盒,具有或没有CCAAT盒序列)衍生的转录调节序列和应答发育性刺激和/或外部刺激或以组织特异性方式而改变基因表达的其它调节元件(即上游激活序列、增强子和沉默子)。本术语还包括经典原核基因的转录调节序列,在此情况下它可以包括一个-35盒序列和/或一个-10盒转录调节序列。术语“调节元件”也包含赋予、激活或增强细胞、组织或器官中核酸分子表达的人工融合分子或衍生物。
“植物启动子”包含介导植物细胞中编码序列节段表达的调节元件。因此,植物启动子不需要源自植物,而是可以源自病毒或微生物,例如来自侵袭植物细胞的病毒。“植物启动子”也可以源自植物细胞,例如来自待于本发明方法中表达并在本文中描述的核酸序列转化的植物。这也适用于其他“植物”调节信号,如“植物”终止子。在本发明方法中有用的核苷酸序列上游的启动子可以通过一个或多个核苷酸替换、插入和/或缺失进行修饰,但不影响启动子、可读框(ORF)或3′调节区如终止子或远离ORF存在的其他3′调节区的功能性或活性。还有可能的是:所述启动子的活性因其序列的修饰或被更活跃的启动子、甚至来自异源生物的启动子彻底替换而提高。为了在植物中表达,如上所述,核酸分子必须有效地连接至或包含在正确时间点处和以所需空间表达模式表达基因的合适启动子。
为鉴定功能性等效启动子,候选启动子的启动子强度和/或表达模式可以例如通过将此启动子有效地与报道基因连接并分析该报道基因在植物多种组织中的表达水平和模式进行分析。熟知的合适报道基因包括例如β-葡糖苷酸酶或β-半乳糖苷酶。启动子活性通过测量β-葡糖苷酸酶或β-半乳糖苷酶的酶活性进行分析。启动子强度和/或表达模式随后可以与参考启动子(如在本发明方法中使用的一种启动子)的启动子强度和/或表达模式比较。或者,启动子强度可以使用本领域已知方法如RNA印迹法及放射自显影图的密度计分析法、定量实时PCR或RT-PCR(Heid等,1996GenomeMethods 6:986-994),通过量化mRNA水平或通过将本发明方法中所用核酸的mRNA水平与持家基因(如18S rRNA)的mRNA水平比较进行分析。通常“弱启动子”意指驱动编码序列在低水平上表达的启动子。“低水平”意指在每个细胞约1/10,000转录物至约1/100,000转录物、至约1/500,0000转录物的水平上。相反,“强启动子”驱动编码序列在高水平、或在每个细胞约1/10转录物至约1/100转录物、至约1/1,000转录物上表达。
有效地连接
如本文中所用的术语“有效地连接”指启动子序列与目的基因之间的功能性连接,从而该启动子序列能够起始此目的基因转录。
组成型启动子
“组成型启动子”指在生长和发育的大部分期间而不必需是所有期间和在大多数环境条件下在至少一种细胞、组织或器官中有转录活性的启动子。下表2a给出组成型启动子的例子。
表2a:组成型启动子的例子
  基因来源   参考文献
  肌动蛋白   McElroy等,Plant Cell,2:163-171,1990
  HMGP   WO 2004/070039
  CAMV 35S   Odell等,Nature,313:810-812,1985
  CaMV 19S   Nilsson等,Physiol.Plant.100:456-462,1997
GOS2   de Pater等,Plant J Nov;2(6):837-44,1992,WO 2004/065596
遍在蛋白   Christensen等,Plant Mol.Biol.18:675-689,1992
  稻亲环蛋白   Buchholz等,Plant Mol Biol.25(5):837-43,1994
  玉米H3组蛋白   Lepetit等,Mol.Gen.Genet.231:276-285,1992
  苜蓿H3组蛋白   Wu等Plant Mol.Biol.11:641-649,1988
  肌动蛋白2   An等,Plant J.10(1);107-121,1996
  34S FMV   Sanger等,Plant.Mol.Biol.,14,1990:433-443
  核酮糖二磷酸羧化酶-加氧酶小亚基 US 4,962,028
OCS   Leisner(1988)Proc Natl Acad Sci USA 85(5):2553
  SAD1   Jain等,Crop Science,39(6),1999:1696
  SAD2   Jain等,Crop Science,39(6),1999:1696
  nos   Shaw等(1984)Nucleic Acids Res.12(20):
  7831-7846
  V-ATP酶   WO 01/14572
  超级启动子   WO 95/14098
  G盒蛋白质   WO 94/12015
遍在启动子
遍在启动子基本上在生物全部组织或细胞中有活性。
发育调节型启动子
发育调节型启动子在某些发育阶段期间或在经历发育变化的植物的部分中有活性。
诱导型启动子
诱导型启动子在应答化学刺激(综述见Gatz 1997,Annu.Rev.PlantPhysiol.Plant Mol.Biol.,48:89-108)、环境刺激或物理刺激时具有诱导型或提高的转录启动作用,或可以是“胁迫诱导的”,即当植物暴露于多种胁迫条件时被激活,或是“病原体诱导的”,即当植物暴露于多种病原体时被激活。
器官特异性/组织特异性启动子
器官特异性或组织特异性启动子是能够偏好性地启动在某些器官或组织如叶、根、种子组织等中转录的启动子。例如,“根特异性启动子”是这样的启动子,该启动子优势地在植物根中具有转录活性的启动子,基本上在植物任何其他部分中无活性,尽管在所述的植物其他部分中仍允许任意泄露表达。能够仅在某些细胞中启动转录的启动子在本文中称作“细胞特异性的”。
种子特异性启动子是能够优势地在种子组织中有转录活性的启动子,但不是必需排他性地在种子组织中有转录活性(在泄露表达的情况下)。种子特异性启动子可以在种子发育期间和/或萌发期间有活性。种子特异性启动子可以是胚乳/糊粉/胚特异性的。种子特异性启动子的实例示于下文表2b、2c、2d和2e中。种子特异性启动子的其他实例在Qing Qu和Takaiwa(Plant Biotechnol.J.2,113-125,2004)中给出,所述文献的公开内容如完整所述那样通过引用方式并入本文。
表2b:种子特异性启动子的例子
 基因来源   参考文献
 种子特异性基因   Simon等,Plant Mol.Biol.5:191,1985;
  Scofield等,J.Biol.Chem.262:12202,1987.;
  Baszczynski等,Plant Mol.Biol.14:633,1990.
 巴西坚果(Brazil Nut)白蛋白   Pearson等,Plant Mol.Biol.18:235-245,1992.
豆球蛋白   Ellis等,Plant Mol.Biol.10:203-214,1988.
谷蛋白(稻)   Takaiwa等,Mol.Gen.Genet.208:15-22,1986;
  Takaiwa等,FEBS Letts.221:43-47,1987.
玉米醇溶蛋白   Matzke等Plant Mol Biol,14(3):323-321990
 napA   Stalberg等,Planta 199:515-519,1996.
 小麦LMW和HMW麦谷蛋白-1   Mol Gen Genet 216:81-90,1989;NAR17:461-2,1989
 小麦SPA   Albani等,Plant Cell,9:171-184,1997
 小麦α,β,γ-麦醇溶蛋白   EMBO J.3:1409-15,1984
大麦Itr1启动子   Diaz等(1995)Mol Gen Genet248(5):592-8
 大麦B1、C、D、大麦醇溶蛋白   Theor Appl Gen 98:1253-62,1999;PlantJ 4:343-55,1993;Mol Gen Genet250:750-60,1996
大麦DOF   Mena等,The Plant Journal,116(1):53-62,1998
  blz2   EP99106056.7
合成的启动子   Vicente-Carbajosa等,Plant J.13:629-640,1998.
稻谷醇溶蛋白NRP33   Wu等,Plant Cell Physiology 39(8)885-889,1998
稻α-球蛋白Glb-1   Wu等,Plant Cell Physiology 39(8)885-889,1998
稻OSH1   Sato等,Proc.Natl.Acad.Sci.USA,93:8117-8122,1996
稻α-球蛋白REB/OHP-1   Nakase等Plant Mol.Biol.33:513-522,1997
  稻ADP-葡萄糖焦磷酸酶   Trans Res 6:157-68,1997
  玉米ESR基因家族   Plant J 12:235-46,1997
高粱α-高粱醇溶蛋白   DeRose等,Plant Mol.Biol 32:1029-35,1996
KNOX   Postma-Haarsma等,Plant Mol.Biol.39:257-71,1999
  稻油质蛋白   Wu等,J.Biochem.123:386,1998
向日葵油质蛋白   Cummins等,Plant Mol.Biol.19:873-876,1992
  PRO0117,推定的稻40S核糖体蛋白 WO 2004/070039
  PRO0136,稻丙氨酸氨基转移酶 未公开
  PRO0147,酪氨酸抑制物ITR1(大麦)   未公开
  PRO0151,稻WSI18   WO 2004/070039
  PRO0175,稻RAB21   WO 2004/070039
  PRO005   WO 2004/070039
  PRO0095   WO 2004/070039
  α-淀粉酶(Amy32b)   Lanahan等,Plant Cell 4:203-211,1992;
  Skriver等,Proc Natl Acad Sci USA88:7266-7270,1991
组织蛋白酶β样基因   Cejudo等,Plant Mol Biol 20:849-856,1992
大麦Ltp2   Kalla等,Plant J.6:849-60,1994
Chi26   Leah等,Plant J.4:579-89,1994
玉米B-Peru   Selinger等,Genetics 149;1125-38,1998
表2c:胚乳特异性启动子的例子
  基因来源   参考文献
谷蛋白(稻)   Takaiwa等(1986)Mol Gen Genet208:15-22;Takaiwa等(1987)FEBS Letts.221:43-47
玉米醇溶蛋白   Matzke等,(1990)Plant Mol Biol 14(3):323-32
  小麦LMW和HMW麦谷蛋白-1   Colot等(1989)Mol Gen Genet 216:81-90,Anderson等(1989)NAR 17:461-2
  小麦SPA   Albani等(1997)Plant Cell 9:171-184
  小麦麦醇溶蛋白   Rafalski等(1984)EMBO 3:1409-15
大麦Itr1启动子   Diaz等(1995)Mol Gen Genet248(5):592-8
大麦B1、C、D、大麦醇溶蛋白   Cho等(1999)Theor Appl Genet98:1253-62;Muller等(1993)Plant J4:343-55;Sorenson等(1996)Mol GenGenet 250:750-60
  大麦DOF   Mena等,(1998)Plant J 116(1):53-62
blz2   Onate等(1999)J Biol Chem274(14):9175-82
合成的启动子   Vicente-Carbajosa等(1998)Plant J13:629-640
  稻谷醇溶蛋白NRP33   Wu等,(1998)Plant Cell Physiol 39(8)
  885-889
稻球蛋白Glb-1   Wu等(1998)Plant Cell Physiol 39(8)885-889
稻球蛋白REB/OHP-1   Nakase等(1997)Plant Molec Biol 33:513-522
  稻ADP-葡萄糖焦磷酸酶   Russell等(1997)Trans Res 6:157-68
玉米ESR基因家族   Opsahl-Ferstad等(1997)Plant J12:235-46
高粱的高粱醇溶蛋白   DeRose等(1996)Plant Mol Biol32:1029-35
表2d:胚特异性启动子的例子:
  基因来源   参考文献
稻OSH1   Sato等,Proc.Natl.Acad.Sci.USA,93:8117-8122,1996
  KNOX   Postma-Haarsma等,Plant Mol.Biol.39:257-71,1999
  PRO0151   WO 2004/070039
  PRO0175   WO 2004/070039
  PRO005   WO 2004/070039
  PRO0095   WO 2004/070039
表2e:糊粉特异性启动子的例子:
  基因来源  参考文献
α-淀粉酶(Amy32b)  Lanahan等,Plant Cell 4:203-211,1992;Skriver等,Proc Natl Acad Sci USA 88:7266-7270,1991
  组织蛋白酶β样基因  Cejudo等,Plant Mol Biol 20:849-856,1992
  大麦Ltp2  Kalla等,Plant J.6:849-60,1994
  Chi26  Leah等,Plant J.4:579-89,1994
  玉米B-Peru  Selinger等,Genetics 149;1125-38,1998
如本文中所定义的绿色组织特异性启动子是优势地在绿色组织中具有转录活性的启动子,在植物的任何其他部分中基本上无活性,尽管依旧允许在所述的植物其他部分中的任何泄露表达。
组织特异性启动子的另一个实例是分生组织特异性启动子,其优势地在分生组织中具有转录活性,在植物的任何其他部分中基本上无活性,尽管依旧允许在所述的植物其他部分中的任何泄露表达。
终止子
术语“终止子”包括作为转录单元末端处DNA序列的调控序列,所述的DNA序列产生初级转录物的3’加工和多聚腺苷化的信号和转录终止信号。所述终止子可以从天然基因、从多种其他植物基因或从T-DNA衍生。待添加的终止子可以从例如胭脂碱合酶或章鱼碱合酶基因或备选地从另一种植物基因或较不优选地从任何其他真核基因衍生。
调节
就表达或基因表达而言,术语“调节”意指这样的过程,在所述过程中与对照植物相比较,表达水平因所述基因的表达而改变,优选地,表达水平可以提高或降低。原始、未调节的表达可以是结构性RNA(rRNA、tRNA)或mRNA的任何类型的表达,随后是翻译。术语“对活性的调节”应当意指本发明核酸序列或所编码蛋白质的表达的任何改变,这导致植物产量提高和/或生长增加。
表达
术语“表达”或“基因表达”意指某个特定基因或多个特定基因或特定基因构建体的转录。术语“表达”或“基因表达”尤其意指某个基因或诸基因或基因构建体转录成结构性RNA(rRNA,tRNA)或mRNA,而所述RNA随后翻译或不翻译成蛋白质。该过程包括DNA的转录和所得mRNA产物的加工。
提高的表达/过量表达
如本文中所用的术语“提高的表达”或“过量表达”意指相对于原有野生型表达水平为额外的任何形式的表达。
在本领域内充分记载了用于提高基因或基因产物表达的方法并且这些方法包括例如由适宜启动子驱动的过量表达、使用转录增强子或翻译增强子。充当启动子或增强子元件的分离核酸可以导入多核苷酸的非异源形式的适宜位置(一般在上游)中,从而上调编码目的多肽的核酸表达。例如,内源性启动子可以在体内通过突变、缺失和/或替换加以改变(见Kmiec,US 5,565,350;Zarling等,WO9322443),或可以将分离的启动子以相对于本发明基因的恰当方向及距离导入植物细胞,从而控制该基因的表达。
若需要多肽表达,通常希望的是在多核苷酸编码区的3’末端处包括多聚腺苷化区。多聚腺苷化区可以从天然基因、从多种其他植物基因或从T-DNA衍生。待添加的3’末端序列可以从例如胭脂碱合酶或章鱼碱合酶基因或备选地从另一种植物基因或较不优选地从任何其他真核基因衍生。
内含子序列也可以添加至5′非翻译区(UTR)或部分编码序列的编码序列以提高胞浆内聚集的成熟信使的量。已经证实在植物和动物表达构建体的转录单位中包含可剪接内含子提高了mRNA水平及蛋白质水平上的基因表达高达1000倍(Buchman和Berg(1988)Mol.Cell biol.8:4395-4405;Callis等(1987)Gens Dev 1:1183-1200)。此类内含子增强基因表达的作用一般在所述内含子位于转录单位的5′末端附近时最强烈。玉米内含子Adh1-S内含子1、2和6、Bronze-1内含子的用途是本领域已知的。对于总体信息,见:《玉米手册》,第116章,编者Freeling和Walbot,Springer,N.Y.(1994)。
内源基因
本文中对“内源性”基因的称谓不仅仅指如植物中以其天然形式(即没有人类任何干预)存在的所讨论基因,还指处于分离形式下的随后(再)导入植物(转基因)的相同基因(或基本上同源的核酸/基因)。例如,含有这种转基因的转基因植物可以出现转基因表达的大幅降低和/或内源基因表达的大幅降低。所述的分离基因可以从生物分离或可以是人造的,例如通过化学合成法人工制造。
降低的表达
本文中提及的“降低的表达”或“降低或基本消除表达”意指内源基因表达和/或多肽水平和/或多肽活性相对于对照植物的下降。与对照植物相比较,所述降低或基本上消除以递增优选顺序是至少10%、20%、30%、40%或50%、60%、70%、80%、85%、90%或95%、96%、97%、98%、99%或更多降低。
为了降低或基本消除植物中内源基因的表达,需要核酸序列的基本上连续的核苷酸的足够长度。为了进行基因沉默,这个长度可以是短至20、19、18、17、16、15、14、13、12、11、10个或更少的核苷酸,或者该长度可以长至完整基因(包括5’和/或3’UTR,部分或全部)。基本上连续的核苷酸片段可以从编码目的蛋白的核酸(靶基因)或从能够编码目的蛋白的直向同源物、旁系同源物或同源物的任何核酸衍生。优选地,基本上连续的核苷酸的片段能够与靶基因(有义链或反义链)形成氢键,更优选地,基本上连续的核苷酸片段以递增优选顺序与靶基因(有义链或反义链)具有50%、60%、70%、80%、85%、90%、95%、96%、97%、98%、99%、100%的序列同一性。编码(功能性)多肽的核酸序列不是用于降低或基本消除内源基因表达的本文中所讨论多种方法的条件。
表达的这种降低或基本消除可以使用常规方法和技术完成。用于降低或基本消除内源基因表达的优选方法是在植物中导入并表达基因构建体,其中将核酸(在此情况下,从目的基因或从能够编码任何一种目的蛋白的直向同源物、旁系同源物或同源物的任何核酸中衍生的一段基本上连续的核苷酸)克隆至所述基因构建体,作为被间隔序列(非编码性DNA)隔开的(部分或完全)反向重复序列。
在这种优选的方法中,使用核酸或其部分(在此情况下,所述部分是从目的基因或从能够编码目的蛋白的直向同源物、旁系同源物或同源物的任何核酸中衍生的一段基本上连续的核苷酸)的反向重复序列(其优选能够形成发夹结构),通过RNA介导的沉默作用降低或基本上消除内源基因的表达。在包含调控序列的表达载体中克隆所述反向重复序列。非编码性DNA核酸序列(间隔序列,例如基质附着区片段(MAR)、内含子、多接头等)位于形成所述反向重复序列的两个反向核酸之间。在反向重复序列转录后,形成具有(部分或完全)自我互补结构的嵌合RNA。这种双链RNA结构称作发夹RNA(hpRNA)。hpRNA由植物加工成siRNA,该siRNA掺入RNA诱导的沉默复合体(RISC)。RISC进一步切开所述mRNA转录物,从而大幅度地降低待翻译成多肽的mRNA转录物的数目。对于其他一般细节,见例如Grierson等(1998)WO 98/53083;Waterhouse等(1999)WO99/53050)。
本发明方法的实施不依赖在植物中导入并表达所述核酸作为反向重复序列克隆入其中的基因构建体,不过几种众知“基因沉默”方法的任何一种或多种方法可以用来实现相同的作用。
用于降低内源基因表达的这样一种方法是RNA介导的基因表达沉默(下调)。在这种情况下,沉默作用由基本上与内源性靶基因相似的双链RNA序列(dsRNA)在植物中触发。这种dsRNA进一步由植物加工成约20个-约26个核苷酸,称作短干扰RNA(siRNA)。siRNA掺入RNA诱导的沉默复合体(RISC)中,其中所述的RISC切割内源性靶基的mRNA转录物,从而极大降低待翻译成多肽的mRNA转录物的数目。优选地,所述双链RNA序列对应于靶基因。
RNA沉默方法的另一个实例包括将核酸序列或其部分(在此情况下是从目的基因或从能够编码目的蛋白的直向同源物、旁系同源物或同源物的任何核酸中衍生的一段基本上连续的核苷酸)以有义方向导入植物。“有义方向”指与其mRNA转录物同源的DNA序列。因而,将所述核酸序列的至少一个拷贝导入植物。这种额外的核酸序列会降低内源基因表达,产生称为共抑制作用的现象。当一种核酸序列的几个额外拷贝导入植物时,基因表达的降低将更明显,因为高转录物水平与触发共抑制作用之间存在正相关。
RNA沉默方法的另一个实例包括使用反义核酸序列。″反义″核酸序列包含与编码蛋白质的″有义″核酸序列互补,即与双链cDNA分子的编码链互补,或与mRNA转录物序列互补的核苷酸序列。所述反义核酸序列优选地与待沉默的内源基因互补。互补性可以位于基因的“编码区”和/或在其“非编码区”。术语“编码区”指包含被翻译成氨基酸残基的密码子的核苷酸序列的区域。术语“非编码区”指被转录但不被翻译成氨基酸的分布在编码区侧翼的5’和3’序列(也称作5′和3′非翻译区)。
反义核酸序列可以根据Watson和Crick碱基对规则设计。反义核酸序列可以与全部核酸序列(在此情况下是从目的基因或从能够编码目的蛋白的直向同源物、旁系同源物或同源物的任何核酸中衍生的一段基本上连续的核苷酸)互补,不过也可以是仅与所述核酸序列的一部分(包括mRNA5’和3’UTR)互补的寡核苷酸。例如,所述反义寡核苷酸序列可以与编码多肽的mRNA转录物的翻译起点周围的区域互补。合适反义寡核苷酸序列的长度是本领域已知的并且可以从长度约50、45、40、35、30、25、20、15或10个核苷酸或更少的核苷酸开始。本发明的反义核酸序列可以使用化学合成和酶连接反应,利用本领域已知方法构建。例如,反义核酸序列(例如反义寡核苷酸序列)可以使用天然存在的核苷酸或多种修饰的核苷酸化学地合成,设计为旨在提高分子的生物学稳定性或提高反义核酸序列与有义核酸序列之间所形成双链体的物理稳定性,例如,可以使用硫代磷酸酯衍生物和吖啶取代的核苷酸。可以用来产生反义核酸序列的修饰核苷酸的实例是本领域熟知的。已知的核苷酸修饰包括甲基化、环化和′加帽′及用类似物(如肌苷)替换一个或多个天然存在的核苷酸。其他的核苷酸修饰是本领域熟知的。
所述反义核酸序列可以使用表达载体以生物学方式产生,其中将一种核酸序列以反义方向亚克隆(即从所插入核酸转录出的RNA将与目的靶核酸呈反义方向)至所述表达载体。优选地,植物中反义核酸序列的产生借助稳定整合的核酸构建体进行,其中所述的核酸构建体包含启动子、有效连接的反义寡核苷酸和终止子。
本发明方法中用于沉默作用的核酸分子(无论向植物导入或原位(insitu)产生)与mRNA转录物和/或编码多肽的基因组DNA杂交或结合,因此抑制蛋白质的表达,例如通过抑制转录和/或翻译而做到这一点。杂交可以通过常规核苷酸互补性以形成稳定双链体引起,或例如与DNA双链体结合的反义核酸序列的情形下,因双螺旋大沟内的特异性相互作用引起。反义核酸序列可以通过转化法或在特定组织部位处的直接注射法导入植物。或者,反义核酸序列可以受到修饰以靶向所选的细胞并且随后全身性施用。例如,对于全身性施用,可以修饰反义核酸序列,从而它们与表达在所选细胞表面上的受体或抗原特异性地结合,例如通过将所述反义核酸序列连接至与细胞表面受体或抗原结合的肽或抗体连接而做到这一点。所述反义核酸序列也可以使用本文中所述的载体递送至细胞。
根据又一个方面,反义核酸序列是α-端基异构核酸序列。α端基异构核酸序列与互补RNA形成特定的双链杂交体,在所述双链杂交体中与常见的b-单元相反,所述链彼此平行(Gaultier等(1987)Nucl Ac Res 15:6625-6641)。反义核酸序列也可以包含2′-O-甲基核糖核苷酸(Inoue等(1987)Nucl Ac Res 15,6131-6148)或嵌合RNA-DNA类似物(Inoue等(1987)FEBS Lett.215,327-330)。
内源基因表达的降低或基本上消除也可以使用核酶进行。核酶是具有核糖核酸酶活性的催化性RNA分子,能够切割与其具有互补区域的单链核酸序列,如mRNA。因此,核酶(例如锤头状核酶(在Haselhoff和Gerlach(1988)Nature 334,585-591中描述)可以用来催化性地切割编码多肽的mRNA转录物,因而极大降低待翻译成多肽的mRNA转录物的数目。可以设计对核酸序列呈特异性的核酶(见例如:Cech等美国专利号4,987,071;和Cech等美国专利号5,116,742)。或者,与核酸序列相对应的mRNA转录物可以用来从RNA分子汇集物中选出具有特异核糖核酸酶活性的催化性RNA(Bartel和Szostak(1993)Science 261,1411-1418)。核酶用于植物中基因沉默的用途是本领域已知的(例如Atkins等(1994)WO94/00012;Lenne等(1995)WO 95/03404;Lutziger等(2000)WO 00/00619;Prinsen等(1997)WO 97/13865和Scott等(1997)WO 97/38116)。
基因沉默也可以通过插入诱变(例如T-DNA插入或转座子插入)或通过如Angell和Baulcombe((1999)Plant J.20(3):357-62)、(Amplicon VIGSWO 98/36083)或Baulcombe(WO 99/15682)及其他人描述的策略而实现。
当内源基因中存在突变和/或在随后导入植物的分离的基因/核酸中存在突变时,基因沉默也可以发生。所述降低或基本上消除可以由无功能的多肽引起。例如,多肽可以与多种相互作用性蛋白质结合;一种或多种突变和/或截短因而可以产生仍能够结合相互作用性蛋白质(如受体蛋白)但不能表现其正常功能的多肽(如信号配体)。
基因沉默的又一种方法是靶向与基因的调节区(例如启动子和/或增强子)互补的核酸序列以形成可阻止靶细胞中基因转录的三重螺旋结构。见Helene,C.,Anticancer Drug Res.6,569-84,1991;Helene等,Ann.N.Y.Acad.Sci.660,27-361992;和Maher,L.J.Bioassays 14,807-15,1992。
技术人员熟知其他方法,如使用针对内源性多肽的抗体以抑制其在植物中的功能,或干扰其中涉及某多肽的信号途径。尤其,可以考虑人造分子可用于抑制靶多肽的生物学功能,或用于干扰其中涉及所述靶多肽的信号途径。
或者,可以建立筛选程序以鉴定植物群体中基因的天然变体,其中所述的变体编码活性降低的多肽。也可以使用此类天然变体,例如用于开展同源重组。
人工和/或天然的微RNA(miRNA)可以用来敲除基因表达和/或mRNA翻译。内源性miRNA是通常长19-24个核苷酸的单链小RNA。它们主要发挥调节基因表达和/或mRNA翻译的功能。大多数的植物微RNA(miRNA)与其靶序列完全互补或接近完全互补。然而,存在具有多达5个错配的天然靶。它们由Dicer家族的双链特异性RNA酶从具有特征性折返结构的较长非编码性RNA加工而来。加工后,它们通过与RNA诱导的沉默复合体(RISC)的主要成分-Argonaute蛋白结合被掺入该复合体。miRNA充当RISC的特异性成分,因为它们与胞浆内的靶核酸(大多是mRNA)发生碱基配对。后续调节事件包括靶mRNA切割和摧毁和/或翻译抑制。miRNA过量表达的作用因此往往反映为靶基因的mRNA水平降低。
可以按照遗传工程方式专门设计通常长21个核苷酸的人工微RNA(amiRNA)以负向调节单个或多个目的基因的基因表达。选择植物的微RNA靶的决定因素是本领域熟知的。已经定义了用于靶识别的经验参数和可以使用它们来辅助设计特定的amiRNA(Schwab等,Dev.Cell 8,517-527,2005)。用于设计并产生amiRNA及其前体的便利工具也是公众可获得的(Schwab等,2006Plant Cell.200618(5):1121-33)。
为了最佳性能,用于降低植物中内源基因表达的基因沉默技术需要使用来自单子叶植物的核酸序列以转化单子叶植物,和使用来自双子叶植物的核酸序列以转化双子叶植物。优选地,来自任何给定植物物种的核酸序列导入相同物种。例如,来自稻的核酸序列转化至稻植物。然而,并非绝对要求待导入的核酸序列源自与该核酸序列待导入的植物相同的植物物种。只要内源性靶基因与待导入的核酸之间存在实质的同源性即可。
本文描述的是用于降低或基本上消除植物中内源基因表达的多种方法的实例。例如,本领域技术人员会轻易地能够调整前述用于沉默的方法以至于通过利用合适启动子,实现降低完整植物或在其部分中内源基因的表达。
选择标记(基因)/报道基因
“选择标记”、“选择标记基因”或“报道基因”包括对细胞赋予表型的任何基因,其中所述″选择标记″、″选择标记基因″或“报道基因”在所述细胞中表达旨在促进鉴定和/或选择用本发明的核酸构建体转染或转化的细胞。这些标记基因能够通过一系列不同原理而鉴定核酸分子的成功转移。合适的标记可以选自赋予抗生素抗性或除草剂抗性、导入新代谢性状或允许目视选择的标记。选择标记基因的实例包括赋予抗生素抗性的基因(如使新霉素和卡那霉素磷酸化的nptII或使潮霉素磷酸化的hpt或赋予针对例如博来霉素、链霉素、四环素、氯霉素、氨苄青霉素、庆大霉素、遗传霉素(Geneticin)(G418)、壮观霉素或杀稻瘟菌素的抗性的基因)、赋予除草剂抗性的基因(例如提供
Figure G2008800037051D00331
抗性的bar;提供草甘膦抗性的aroA或gox或赋予针对例如咪唑啉酮、膦丝菌素或磺脲类的抗性的基因)或提供代谢性状的基因(如允许植物使用甘露糖作为唯一碳源的manA,或利用木糖的木糖异构酶,或抗营养性标记如2-脱氧葡萄糖抗性)。目视标记基因的表达导致颜色(例如β-葡糖苷酸酶、GUS或β-半乳糖苷酶与其有色底物例如X-Gal)、发光(如萤光素/萤光素酶系统)或荧光(绿色荧光蛋白GFP和其衍生物)的形成。这个名单仅代表少数的可能标记。技术人员熟悉此类标记。取决于生物和选择方法,优选不同的标记。
已知当核酸稳定或瞬时地整合至植物细胞时,仅少数细胞摄取了外来DNA,并且根据需要,将其整合至细胞的基因组中,这取决于所用的表达载体和所用的转染技术。为鉴定并选择这些整合子,编码选择标记的基因(如上文所述的基因)通常连同目的基因一起导入宿主细胞。这些标记可以在其中这些基因例如因常规方法引起的缺失而无功能的突变体中使用。此外,编码选择标记的核酸分子可以在包含编码本发明多肽或在本发明方法中所用多肽的序列的相同载体上,或在独立的载体上导入宿主细胞。已经用所导入核酸稳定转染的细胞可以通过选择进行鉴定(例如具有整合的选择标记的细胞存活而其他细胞死亡)。
因为所述标记基因,尤其抗生素抗性基因和除草剂抗性基因一旦成功地导入,则在转基因宿主细胞中是不再需要或不想要的,故而,用于导入核酸的本发明方法有利地使用能够去掉或切除这些标记基因的技术。一种这样的方法称作共转化法。共转化法同时使用两种载体用于转化,一种载体携带本发明的核酸而第二种载体携带标记基因。大比例的转化体接受或在植物情况下包含(多达40%或更多的转化体)这两种载体。在用农杆菌(Agrobacterium)转化的情况下,转化体通常仅接受载体的一部分,即侧翼存在T-DNA的序列,该序列通常代表表达盒。标记基因随后可以通过开展杂交从转化植物中除去。在另一种方法中,整合至转座子的标记基因用来与目的核酸一起进行转化(称作Ac/Ds技术)。转化体可以与转座酶来源杂交,或该转化体用导致转座酶表达的核酸构建体瞬时或稳定地转化。在一些情况下(大约10%),一旦转化已经成功发生,则转座子从宿主细胞基因组中跳出并丢失。在其他更多情况下,转座子跳至不同位置。在这些情况下,标记基因必须通过开展杂交消除。在微生物学中,开发了有可能或促进检测这类事件的技术。又一个有利的方法依赖于所谓重组系统;此方法的优势在于杂交消除作用可以用所述的重组系统实行。最知名的该类型系统称作Cre/lox系统。Cre1是除去位于loxP序列之间序列的重组酶。若所述标记基因整合在loxP序列之间,则它在转化已经成功发生时因重组酶表达而被除去。其他重组系统是HIN/HIX、FLP/FRT和REP/STB系统(Tribble等,J.Biol.Chem.,275,2000:22255-22267;Velmurugan等,J.Cell Biol.,149,2000:553-566)。有可能将本发明核酸序列以位点特异性方式整合至植物基因组。这些方法自然也可以应用至微生物如酵母、真菌或细菌。
转基因的/转基因/重组
为本发明的目的,“转基因的”、“转基因”或“重组”例如就核酸序列而言,意指包含所述核酸序列的表达盒、基因构建体或载体,或用本发明核酸序列、表达盒或载体转化的生物,这些构建体均通过重组方法产生,其中
(a)编码在本发明方法中有用的蛋白质的核酸序列,或
(b)与本发明核酸序列有效连接的基因调控序列,例如启动子,或
(c)a)和b)
不位于其天然遗传环境中或已经通过遗传操作方法被修饰,所述的修饰有可能采取例如替换、添加、倒位或插入一个或多个核苷酸残基的形式。天然遗传环境理解为意指原初植物中的天然基因组位点或染色体位点或存在于基因组文库中。在基因组文库的情况下,核酸序列的天然遗传环境优选地保留,至少部分保留。该环境分布在所述核酸序列的至少一侧并且具有至少50bp,优选至少500bp,特别优选至少1000bp,最优选至少5000bp序列长度。当天然存在的表达盒受非天然的合成(“人工”)方法(如诱变处理)被修饰时,天然存在的表达盒-例如所述核酸序列的天然启动子与编码在本发明方法中有用的多肽的相应核酸序列的天然存在组合,如上文所定义-变成转基因表达盒。合适方法例如在US 5,565,350或WO00/15815中描述。
为本发明目的,如上所述,将转基因植物因此理解为意指在本发明方法中有用的核酸不处于所述植物基因组中所述核酸的天然基因座处,所述核酸有可能同源或异源地表达。然而如所提及,转基因的还意指尽管本发明的或在本发明方法中有用的核酸处于植物基因组中所述核酸的天然位置处,然而其序列相对于天然序列而言已经被修饰,和/或所述天然序列的调节序列已经被修饰。转基因的优选地理解为意指本发明核酸在基因组的非天然基因座处表达,即所述核酸的同源表达或优选异源表达发生。优选的转基因植物在本文中提及。
转化
如本文中提及的术语“导入”或“转化”包括外源性多核苷酸转移至宿主细胞,无论转化所用的方法是什么方法。能够后续克隆性增殖(无论通过器官发生或胚发生)的植物组织可以用本发明的基因构建体转化并且完整植物可以从中再生。所选的具体组织根据可用于并且最适于正在进行转化的具体物种的克隆性增殖系统变化。示例性靶组织包括叶盘、花粉、胚、子叶、下胚轴、大配子体、愈伤组织、现存分生组织(例如顶端分生组织、腋芽和根分生组织)和诱导性分生组织(例如子叶分生组织和下胚轴分生组织)。多核苷酸可以瞬时或稳定地导入宿主细胞并且可以非整合地维持,例如作为质粒。备选地,它可以整合至宿主基因组。所得的转化植物细胞随后可以用来按照本领域技术人员已知的方式再生出转化植物。
将外来基因转移至植物基因组的过程称作转化。转化植物物种现在是极为常规的技术。有利地,几种转化方法中的任一种方法可以用来将目的基因导入合适的祖先细胞。用于转化并从植物组织或植物细胞再生出植物的方法可以用于瞬时转化或稳定转化。转化方法包括使用脂质体、电穿孔法、提高游离DNA摄入的化学品、DNA直接注射至植物、粒子枪轰击法、使用病毒或花粉的转化法和显微投射法(microprojection)。转化方法可以选自用于原生质体的钙/聚乙二醇法(Krens,F.A.等,(1982)Nature 296,72-74;Negrutiu I等(1987)Plant Mol Biol 8:363-373);原生质体的电穿孔法(Shillito R.D.等(1985)Bio/Technol 3,1099-1102);对植物材料的微注射法(Crossway A等,(1986)Mol.Gen Genet 202:179-185);DNA或RNA包被的粒子轰击法(Klein TM等,(1987)Nature 327:70)、(非整合性)病毒感染法等。包括转基因作物植物在内的转基因植物优选通过农杆菌介导的转化法产生。有利的转化方法是植物内(in planta)转化法。为此目的,例如有可能将农杆菌作用在植物种子上或有可能用农杆菌接种植物的分生组织。根据本发明,已经证明特别有利的是将转化的农杆菌悬液作用于完整植物或至少作用于花原基。随后继续培育植物直至获得处理的植物的种子(Clough和Bent,Plant J.(1998)16,735-743)。用于农杆菌介导稻转化的方法包括用于稻转化的众知方法,如在以下任意文献中描述的那些方法:欧洲专利申请EP 1198985A1,Aldemita和Hodges(Planta 199:612-617,1996);Chan等(Plant Mol Biol 22(3):491-506,1993),Hiei等(Plant J 6(2):271-282,1994),其公开内容如充分所述那样通过引用的方式并入本文。在玉米转化的情况下,优选的方法如Ishida等(Nat.Biotechnol14(6):745-50,1996)或Frame等(Plant Physiol 129(1):13-22,2002)描述,其公开内容如充分所述那样通过引用的方式并入本文。所述方法还例如由B.Jenes等,Techniques for Gene Transfer,在:Transgenic Plants,第1卷,Engineering and Utilization,编者S.D.Kung和R.Wu,AcademicPress(1993)128-143及在Potrykus Annu.Rev.Plant Physiol.Plant Molec.Biol.42(1991)205-225)描述。待表达的核酸或构建体优选地克隆至适于转化根癌农杆菌(Agrobacterium tumefaciens)的载体,例如pBin19(Bevan等,Nucl.Acids Res.12(1984)8711)。通过这种载体转化的农杆菌随后可以按照已知方式用于转化植物,例如作为模型使用的植物如拟南芥属植物(拟南芥属于本发明的范围,不视为作物植物),或作物植物,例如烟草植物,所述方式例如是通过将擦伤的叶或切碎的叶浸泡在农杆菌溶液中并随后将它们在合适培养基中培育。植物的根癌农杆菌转化法例如由
Figure G2008800037051D00371
和Willmitzer在Nucl.Acid Res.(1988)16,9877中描述或尤其从F.F.White,Vectors for Gene Transfer in Higher Plants;在Transgenic Plants,第1卷,Engineering and Utilization,编者S.D.Kung和R.Wu,AcademicPress,1993,第15-38页中获知。
除了转化随后必需再生成完整植物的体细胞之外,还可转化植物分生组织的细胞,并且尤其是发育成配子的那些细胞。在这种情况下,转化的配子遵循天然植物发育过程,从而产生转基因植物。因此,例如用农杆菌处理拟南芥属植物的种子并且从发育植物中获得种子,其中一定比例的所述发育植物被转化并且因此是转基因的[Feldman,KA和Marks MD(1987)Mol Gen Genet 208:274-289;Feldmann K(1992)。在:编者C Koncz,N-H Chua和J Shell,Methods in Arabidopsis Research.Word Scientific,Singapore,第274-289页]。替代方法基于反复除去花序并使莲座丛中心的切除部位与转化的农杆菌温育,因而同样可以在较晚的时间点上获得转化的种子(Chang(1994)Plant J.5:551-558;Katavic(1994)Mol Gen Genet,245:363-370)。然而,特别有效的方法是改良真空渗入法,如“花器浸蘸”法。在拟南芥属植物真空渗入法的情况下,在减压下用农杆菌悬液处理完整植物[Bechthold,N(1993)。C R Acad Sci Paris Life Sci,316:1194-1199],而在”花器浸蘸法”的情况下,将正在发育的花组织与经表面活性剂处理的农杆菌悬液短暂温育[Clough,SJ和Bent,AF(1998)The Plant J.16,735-743]。在这两种情况下均收获某个比例的转基因种子,并且这些种子可以通过在如上所述的选择条件下培育与非转基因种子区分。此外,质体的稳定转化是有利的,因为质体在大部分作物中母系地遗传,这降低或消除了转基因经花粉的流动风险。叶绿体基因组的转化一般通过在Klaus等,2004[Nature Biotechnology 22(2),225-229]中已示意性展示的方法实现。简而言之,将待转化的序列连同选择标记基因一起克隆至同源于叶绿体基因组的侧翼序列之间。这些同源侧翼序列指导进入原质体的位点特异性整合。已经对众多不同植物物种描述了质体转化并且Bock(2001)基础研究和植物生物技术中的转基因质体(Transgenic plastids in basic research andplant biotechnology)。J Mol Biol.2001年9月21日;312(3):425-38或Maliga,P(2003)质体转化技术商业化进展(Progress towardscommercialization of plastid transformation technology),TrendsBiotechnol.21,20-28进行了综述。其他生物技术进展最近已经以无标记质体转化体的形式进行报道,其中所述的无标记质体转化体可以通过瞬时共整合性标记基因产生(Klaus等,2004,Nature Biotechnology 22(2),225-229)。
T-DNA活化标签技术(T-DNA activation tagging)
T-DNA活化标签技术(Hayashi等Science(1992)1350-1353)涉及通常含有启动子(也可以是翻译增强子或内含子)的T-DNA在目的基因的基因组区域内或基因的编码区上游或下游10kb处以这样的方式插入,使得启动子指导靶向的基因表达。一般,靶向基因的天然启动子对该靶向基因表达的调节被破坏,并且所述基因处于新导入的启动子控制下。该启动子一般嵌入T-DNA中。这种T-DNA随机地插入植物基因组,例如借助农杆菌感染,并且导致在插入的T-DNA附近的基因表达受到调节。所得的转基因植物因在导入的启动子附近的基因表达受到调节而显示显性表型。
TILLING
术语“TILLING”是基因组中定向诱导的局部损伤法的缩写并且指用于产生和/或鉴定核酸的诱变技术,其中所述的核酸编码具有改良表达和/或活性的蛋白质。TILLING还允许选择携带此类突变变体的植物。这些突变变体可以表现在强度或在位置或在时间方面改良的表达(例如若所述突变影响启动子)。这些突变变体可以显示比其天然形式基因所表现活性更高的活性。TILLING将高密度诱变与高通量筛选方法组合。在TILLING中一般遵循的步骤是:(a)EMS诱变(Redei GP和Koncz C(1992)在Methodsin Arabidopsis Research,Koncz C,Chua NH,Schell J,Singapore编辑,World Scientific Publishing Co,第16-82页;Feldmann等,(1994)在Meyerowitz EM,Somerville CR编辑,Arabidopsis.Cold Spring HarborLaboratory Press,Cold Spring Harbor,NY,第137-172页;Lightner J和Caspar T(1998)在J Martinez-Zapater,J Salinas编者,Methods onMolecular Biology第82卷.Humana Press,Totowa,NJ,第91-104页);(b)个体的DNA制备和汇集;(c)目的区域的PCR扩增;(d)变性和复性以使得异双链体形成;(e)DHPLC,其中异双链体在汇集物中的存在作为色谱图中一个额外的峰被检测到;(f)鉴定突变个体;和(g)对突变PCR产物的测序。用于TILLING的方法是本领域熟知的(McCallum等,(2000)NatBiotechnol 18:455-457;综述见Stemple(2004)Nat Rev Genet 5(2):145-50)。
同源重组
同源重组允许在基因组中限定的选择位置处导入选择的核酸。同源重组是在生物科学中例行用于低等生物如酵母或小立碗藓属(Physcomitrella)苔藓的标准技术。已经对模式植物(Offringa等(1990)EMBO J 9(10):3077-84)和作物植物例如稻(Terada等(2002)NatBiotech 20(10):1030-4;Iida和Terada(2004)Curr Opin Biotech 15(2):132-8)描述了用于开展植物中同源重组的方法,并且存在与靶生物无关而通常适用的方法(Miller等,Nature Biotechnol.25,778-785,2007)。
产量
术语“产量”通常意指经济价值的可测量结果,一般与特定作物、与面积并与时间段有关。单个植物部分基于它们的数目、大小和/或重量而直接有助于对产量,或实际产量是对于某种作物和一年的每平方米产量,这通过总产量(包括收获的和评估的产量)除以种植的平方米数而确定。术语植物的“产量”可以涉及该植物的营养生物量(根和/或苗生物量)、涉及繁殖器官和/或涉及繁殖体(如种子)。
早期生长势
“早期生长势”指活跃、健康、充分平衡的生长,尤其是植物生长早期期间,并且可以因植物适应性提高引起,其中所述的植物适应性提高原因在于例如该植物更好地适应环境(即优化能量来源利用和苗与根之间的分配)。具有早期生长势的植物也显示籽苗存活提高和作物建立更佳,这往往产生高度均一的田块(作物以均一方式生长,即大多数植物在基本上相同的时间达到各个发育期)和往往形成更好及更高的产量。因而,早期生长势可以通过测量多种因子如千粒核重(Thousand Kernel Weight)、萌发百分数、出苗百分数、籽苗生长、籽苗高度、根长度、根和苗生物量和众多其他因素等确定。
提高/改善/增强
术语“提高”、“改善”或“增强”是相互可交换的并且在应用含义上应当意指与如本文中定义的对照植物相比较,至少3%、4%、5%、6%、7%、8%、9%或10%、优选至少15%或20%、更优选地25%、30%、35%或40%更多的产量和/或生长。
种子产量
提高的种子产量自身可以表现为以下一个或多个指标:a)种子生物量(种子总重量)增加,这可以基于单粒种子基础和/或每株植物和/或每平方米;b)提高的每株植物花数目;c)提高的(充实)种子数;d)提高的种子充实率(其表述为充实种子数与种子总数之间的比率);e)提高的收获指数,其表述为可收获部分(如种子)产量与总生物量的比率;和f)提高的千粒核重(TKW),这从计数的充实种子数及其总重量中外推出来。提高的TKW可以因提高的种子大小和/或种子重量所致,并且也可以因胚和/或胚乳大小的提高所致。
种子产量的提高也可以表现为种子大小和/或种子体积的增长。此外,种子产量的提高自身也可以表现为种子面积和/或种子长度和/或种子宽度和/或种子周长的提高。提高的产量也可以产生改良的构造,或可以因改良的构造而出现。
绿度指数(greenness index)
从植物的数字图像计算如本文中所用的“绿度指数”。对属于图像上植物目标的每个像素计算绿色值与红色值的比率(在编码颜色的RGB模式中)。绿度指数表述为绿色/红色比超过给定阈值的像素百分数。在正常生长条件下,在盐胁迫生长条件下和在营养可用性降低的生长条件下,在开花前的最后成像中测量植物的绿度指数。相反,在干旱胁迫生长条件下,在干旱后的首次成像中测量植物的绿度指数。
植物
如本文中所用的术语“植物”包括完整植物、植物的祖先及后代和包括种子、苗、茎、叶、根(包括块茎)、花和组织、器官在内的植物部分,其中每种前述对象包含目的基因/核酸。术语“植物”也包括植物细胞、悬浮培养物、愈伤组织、胚、分生组织区、配子体、孢子体、花粉和小孢子,同样每种前述对象包含目的基因/核酸。
在本发明方法中特别有用的植物包括属于植物界(Viridiplantae)超家族、尤其单子叶和双子叶植物的全部植物,包括饲用或饲料豆科植物、观赏植物、粮食作物、树或灌木,其中所述植物选自包含以下物种的名单:槭树属物种(Acer spp.)、猕猴桃属物种(Actinidia spp.)、秋葵属物种(Abelmoschus spp.)、剑麻(Agave sisalana)、冰草属物种(Agropyron spp.)、匍匐剪股颖(Agrostis stolonifera)、葱属物种(Allium spp.)、苋属物种(Amaranthus spp.)、欧洲海滨草(Ammophila arenaria)、风梨(Ananascomosus)、番荔枝属物种(Annona spp.)、旱芹(Apium graveolens)、蜘蛛兰属物种(Arachis spp.)、木波罗属物种(Artocarpus spp.)、石刁柏(Asparagusofficinalis)、燕麦属物种(Avena spp.)(例如燕麦(燕麦])、野燕麦(Avenafatua)、比赞燕麦(Avena byzantina)、Avena.fatua var.sativa、杂种燕麦(Avenahybrida)、阳桃(Averrhoa carambola)、箣竹属(Bambusa sp.)、冬瓜(Benincasahispida)、巴西栗(Bertholletia excelsea)、甜菜(Beta vulgaris)、芸苔属物种(Brassica spp.)(例如欧洲油菜(欧洲油菜)、芜青物种(Brassica rapa ssp.)[卡诺拉油菜、油菜(oilseed rape)、蔓青(turnip rape)])、Cadaba farinosa、茶(Camellia sinensis)、美人蕉(Canna indica)、大麻(Cannabis sativa)、辣椒属物种(Capsicum spp.)、Carex elata、番木瓜(Carica papaya)、大果假虎刺(Carissa macrocarpa)、山核桃属物种(Carya spp.)、红花(Carthamustinctorius)、栗属物种(Castanea spp.)、美洲木棉(Ceiba pentandra)、苦苣(Cichorium endivia)、樟属物种(Cinnamomum spp.)、西瓜(Citrullus lanatus)、柑桔属物种(Citrus spp.)、椰子属物种(Cocos spp.)、咖啡属物种(Coffea spp.)、芋头(Colocasia esculenta)、非洲梧桐属物种(Cola spp.)、黄麻属(Corchorussp.)、芫荽(Coriandrum sativum)、榛属物种(Corylus spp.)、山楂属物种(Crataegus spp.)、番红花(Crocus sativus)、南瓜属物种(Cucurbita spp.)、香瓜属物种(Cucumis spp.)、菜蓟属物种(Cynara spp.)、胡萝卜(Daucus carota)、山马蝗属物种(Desmodium spp.)、龙眼(Dimocarpus longan)、薯蓣属物种(Dioscorea spp.)、柿树属物种(Diospyros spp.)、稗属物种(Echinochloa spp.)、油棕属(Elaeis)(例如油棕(油棕)、美洲油棕Elaeis(oleifera))、穇子(Eleusinecoracana)、蔗茅属物种(Erianthus sp.)、枇杷(Eriobotrya japonica)、桉属物种(Eucalyptus sp.)、红仔果(Eugenia uniflora)、荞麦属物种(Fagopyrumspp.)、水青冈属物种(Fagus spp.)、苇状羊茅(Festuca arundinacea)、无花果(Ficus carica)、金桔属物种(Fortunella spp.)、草莓属物种(Fragaria spp.)、银杏(Ginkgo biloba)、大豆属(Glycine spp.)(例如大豆、大豆(Soja hispida)或大豆(Soja max))、陆地棉(Gossypium hirstum)、向日葵属(Helianthusspp.)(例如向日葵(Helianthus annuus))、长管萱草(Hemerocallis fulva)、木槿属物种(Hibiscus spp.)、大麦属(Hordeum spp.)(例如大麦(Hordeumvulgare))、甘薯(Ipomoea batatas)、核桃属物种(Juglans spp.)、莴苣(Lactucasativa)、山黧豆属物种(Lathyrus spp.)、兵豆(Lens culinaris)、亚麻(Linumusitatissimum)、荔枝(Litchi chinensis)、百脉根属物种(Lotus spp.)、棱角丝瓜(Luffa acutangula)、羽扇豆属物种(Lupinus spp.)、Luzula sylvatica、番茄属(Lycopersicon spp.)(例如番茄(Lycopersicon esculentum、Lycopersiconlycopersicum、Lycopersicon pyriforme))、硬皮豆属物种(Macrotyloma spp.)、苹果属物种(Malus spp.)、凹缘金虎尾(Malpighia emarginata)、牛油果(Mammea americana)、芒果(Mangifera indica)、木薯属物种(Manihot spp.)、人心果(Manilkara zapota)、苜蓿(Medicago sativa)、草木樨属物种(Melilotusspp.)、薄荷属物种(Mentha spp.)、芒(Miscanthus sinensis)、苦瓜属物种(Momordica spp.)、黑桑(Morus nigra)、芭蕉属物种(Musa spp.)、烟草属物种(Nicotiana spp.)、木犀榄属物种(Olea spp.)、仙人掌属物种(Opuntia spp.)、鸟足豆属物种(Ornithopus spp.)、稻属(Oryza spp.)(例如稻、阔叶稻(Oryzalatifolia))、稷(Panicum miliaceum)、柳枝稷(Panicum virgatum)、鸡蛋果(Passiflora edulis)、欧防风(Pastinaca sativa)、狼尾草属物种(Pennisetumsp.)、鳄梨属物种(Persea spp.)、欧芹(Petroselinum crispum)、虉草(Phalarisarundinacea)、菜豆属物种(Phaseolus spp.)、猫尾草(Phleum pratense)、刺葵属物种(Phoenix spp.)、南方芦苇(Phragmites australis)、酸浆属物种(Physalis spp.)、松属物种(Pinus spp.)、阿月浑子(Pistacia vera)、豌豆属物种(Pisum spp.)、早熟禾属物种(Poa spp.)、杨属物种(Populus spp.)、牧豆草属物种(Prosopis spp.)、李属物种(Prunus spp.)、番石榴属物种(Psidiumspp.)、石榴(Punica granatum)、西洋梨(Pyrus communis)、栎属物种(Quercusspp.)、萝卜(Raphanus sativus)、波叶大黄(Rheum rhabarbarum)、荼藨子属物种(Ribes spp.)、蓖麻(Ricinus communis)、悬钩子属物种(Rubus spp.)、甘蔗属物种(Saccharum spp.)、柳属物种(Salix sp.)、接骨木属物种(Sambucusspp.)、黑麦(Secale cereale)、胡麻属物种(Sesamum spp.)、白芥属物种(Sinapissp.)、茄属(Solanum spp.)(例如马铃薯(Solanum tuberosum)、红茄(Solanumintegrifolium)或番茄(Solanum lycopersicum))、两色蜀黍(Sorghum bicolor)、菠菜属物种(Spinacia spp.)、蒲桃属物种(Syzygium spp.)、万寿菊属物种(Tagetes spp.)、酸豆(Tamarindus indica)、可可树(Theobroma cacao)、车轴草属物种(Trifolium spp.)、鸭茅状摩擦禾(Tripsacum dactyloides)、Triticosecale rimpaui、小麦属(Triticum spp.)(例如普通小麦(Triticumaestivum)、硬粒小麦(Triticum durum)、圆柱小麦(Triticum turgidum)、Triticum hybernum、马卡小麦(Triticum macha)、普通小麦(Triticumsativum)或普通小麦(Triticum vulgare))、小金莲花(Tropaeolum minus)、金莲花(Tropaeolum majus)、越桔属物种(Vaccinium spp.)、野碗豆属物种(Viciaspp.)、豇豆属物种(Vigna spp.)、香堇(Viola odorata)、葡萄属物种(Vitis spp.)、玉米(Zea mays)、Zizania palustris、枣属物种(Ziziphus spp.)及其他。
发明详述
I.NAP
根据第一个实施方案,本发明提供了相对于对照植物用于提高植物中非生物胁迫耐受性的方法,包括调节植物中编码NAP1样多肽的核酸表达。
用于调节(优选提高)编码NAP1样多肽的核酸表达的优选方法是在植物中导入并表达编码NAP1样多肽的核酸。
下文任一谈及的“在本发明方法中使用的蛋白质”意指如本文中定义的NAP1样多肽,任一谈及的“在本发明方法中使用的核酸”意指能够编码这种NAP1样多肽的核酸。待导入植物(并且因而在实施本发明方法中使用)的核酸是编码现在所描述的蛋白质类型的任意核酸,下文也称作“NAP1样核酸”或“NAP1样基因”。
如本文中定义的术语“NAP1样蛋白”指包含NAP结构域和酸性羧基端区域的任意蛋白质。如本文中所用的术语“NAP结构域”是如Pfam数据库中登录号PF00956定义的(英国Sanger研究所维护的数据库;Bateman等,Nucleic Acids Research 30(1):276-280(2002),例如见表3)。优选地,在本发明中使用的NAP1样蛋白序列具有NAP结构域,该结构域包含(T/S)FF(T/N/S/E/D)(W/F)(L/F)标签(SEQ ID NO:33)和/或SEQ ID NO:34中给出的保守氨基酸序列。优选地,SEQ ID NO:33的标签是SFF(T/N/S)(W/F)F。优选地,在本发明方法中使用的NAP1样蛋白的NAP结构域以增加的优选顺序与SEQ ID NO:32具有至少20%、25%、30%、35%、40%、45%序列同一性。更优选地,在本发明方法中使用的NAP1样蛋白的NAP结构域以增加的优选顺序与SEQ ID NO:32具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%序列同一性。最优选地,该NAP结构域是如SEQ ID NO:32所描述。如本文中所用的术语“酸性羧基端区域”或“酸性羧基端”指蛋白质的羧基末端,其中所述的羧基末端长约20-25个氨基酸,这些氨基酸中至少13个残基是谷氨酸和/或天冬氨酸。
表3:拟南芥属植物的包含NAP1结构域的蛋白质的实例
  基因ID   Pfam的描述   位置   评分   e-值  SEQ ID NO:
  at1g18800   PF00956   27-224   147.7   2e-40   20,21
  at1g74560   PF00956   31-229   135.0   1.3e-36   1,2
  at2g19480   PF00956   52-300   457.4   1.2e-133   26,27
  at5g56950   PF00956   52-300   473.2   2.2e-138   28,29
  at4g26110   PF00956   52-301   503.4   1.7e-147   24,25
  at3g13782   PF00956   69-311   300.7   1.7e-86   30,31
此外,NAP1样多肽(至少在其天然形式中)具有PP2a磷酸酶抑制活性。用于测量PP2a磷酸酶抑制活性的手段和技术是本领域熟知的,例如见Li等,J.Biol.Chem.271,11059-11062和其中参考文献。可以按照几种方式分析染色质再塑造活性,如在凝胶滞留分析法中测量DNA结合活性(Fan等,2002)或如使用ELISA测量组蛋白结合活性(Rodriguez等(1997)Genomics 44,253-265)。可以在连接酶介导的环化测定法(Fan等,2002)或超级螺旋测定法(Fujii-Nakata等(1992)J.Biol.Chem.267,20980-20986;Yoon等(1995),Mol.Gen.Gen.249,465-473)中确定DNA弯曲活性。实施例6中提供了表征NAP1样蛋白质的进一步指南。
优选地,在构建系统发生树如图4中所绘制的系统发生树时使用的多肽序列与包含由SEQ ID NO:2所代表的氨基酸序列的NAP1样多肽组而不与任何其他组聚类。
术语“结构域”和“基序”在本文中的“定义”部分定义。存在用于鉴定结构域的专业数据库,例如,SMART(Schultz等(1998)Proc.Natl.Acad.Sci.USA 95,5857-5864;Letunic等(2002)Nucleic Acids Res 30,242-244)、InterPro(Mulder等,(2003)Nucl.Acids.Res.31,315-318)、Prosite(Bucher和Bairoch(1994),用于生物分子序列基序的概括特征结构及其在自动化序列解读中的功能(A generalized profile syntax for biomolecular sequencesmotifs and its function in automatic sequence interpretation).(在)ISMB-94;第二届分子生物学智能系统国际会议文集.Altman R.,BrutlagD.,Karp P.,Lathrop R.,Searls D.编辑,第53-61页,AAAIPress,MenloPark;Hulo等,Nucl.Acids.Res.32:D134-D137,(2004)或Pfam(Bateman等,Nucleic Acids Research 30(1):276-280(2002))。一组用于计算机方式分析蛋白质序列的工具可在ExPASY蛋白质组服务器上获得(瑞士生物信息研究所维护(Gasteiger等,ExPASy:深入认识和分析蛋白质的蛋白质组服务器,Nucleic Acids Res.31:3784-3788(2003))。结构域也可以使用常规技术如通过序列比对进行鉴定。
分析SMART数据库中SEQ ID NO:2的多肽序列,揭示存在NAP结构域(PFAM登录号PF0059,图1)。这个结构域是NAP蛋白特有的,其中所述的NAP蛋白推测参与移动组蛋白至胞核、核小体装配和染色质流动性。通过SEQ ID NO:2的序列与其他NAP1样蛋白的序列比对,可以确定NAP结构域的定位。
用于比对序列以进行比较的方法是本领域熟知的,此类方法包括GAP、BESTFIT、BLAST、FASTA和TFASTA。GAP使用Needleman和Wunsch算法((1970)J Mol Biol 48:443-453)以找到使匹配数最大化并使空位数最小化的两个序列的总体(即覆盖完整序列的)比对结果。BLAST算法(Altschul等(1990)J Mol Biol 215:403-10)计算序列同一性百分数并在两个序列之间开展相似性的统计分析。用于执行BLAST分析的软件是通过国家生物技术信息中心(NCBI)可公开获得的。同源物可以使用例如ClustalW多重序列比对算法(1.83版本),以默认配对比对参数和百分数评分方法轻易地鉴定。相似性和同一性的总体百分数也可以使用MatGAT软件包中的可用方法之一确定(Campanella等,BMC Bioinformatics.2003年7月10日;4:29.MatGAT:使用蛋白质序列或DNA序列产生相似性/同一性矩阵的一种应用)。如本领域技术人员显而易见,可以进行少许手工编辑以优化保守基序之间的比对结果。此外,作为使用全长序列以鉴定同源物的替代,也可以使用特定结构域。对于局部比对,Smith-Waterman算法是特别有用的(Smith TF,Waterman MS(1981)J.Mol.Biol 147(1);195-7)。在下文实施例3中表述为百分数的序列同一性值利用上文提及的程序,使用默认参数在完整核酸或氨基酸序列范围和/或在所选择的结构域或保守基序范围内确定。
本发明通过用SEQ ID NO:1所代表的核酸序列转化植物进行说明,其中所述的核酸序列编码SEQ ID NO:2的多肽序列。然而,本发明的实施不限于这些序列;本发明的方法可以有利地使用编码NAP1样的任意核酸或如本文中定义的NAP1样多肽实施。
编码NAP1样多肽的核酸的实例在本文实施例1的表A中给出。此类核酸用于实施本发明的方法中。在实施例1的表A中给出的氨基酸序列是由SEQ ID NO:2所代表的NAP1样多肽的直向同源物和旁系同源物的示例序列,术语“直向同源物”和“旁系同源物”如本文中定义。其他直向同源物和旁系同源物可以通过开展所谓交互性blast搜索轻易地鉴定。通常,这包括第一BLAST,其中所述的第一BLAST包括将查询序列(例如使用实施例1的表A中列出的任意序列)针对任意序列数据库,如可公开获得的NCBI数据库进行BLAST。当从核苷酸序列开始时,一般使用BLASTN或TBLASTX(使用标准默认值),并且当从蛋白质序列开始时,使用BLASTP或TBLASTN(使用标准默认值)。可以任选地筛选BLAST结果。随后提交筛选结果或非筛选结果的全长序列以针对来自生物的序列进行反向BLAST搜索(第二BLAST),其中查询序列从所述的生物中衍生。筛选结果或非筛选结果的全长序列随后针对来自生物的序列进行反向BLAST(第二BLAST),其中所述查询序列从所述生物衍生(在查询序列是SEQ ID NO:1或SEQ ID NO:2的情况下,所述第二BLAST因而将针对拟南芥属植物的序列进行)。随后比较第一BLAST和第二BLAST的结果。若来自第一blast的高阶位命中源自与衍生查询序列的物种相同的物种,则鉴定到旁系同源物,反向BLAST随后理想地在最高命中当中产生该查询序列;若高阶位命中不是源自与衍生查询序列的物种相同的物种,则鉴定到直向同源物,并且优选地在反向BLAST时,在最高命中当中产生该查询序列。
高阶位命中是具有低E-值的那些命中。E-值越低,评分越显著(或换句话说,偶然发现该命中的几率越低)。E-值的计算是本领域熟知的。除了E-值外,也通过同一性百分数评分来进行比较。同一性百分数指两个所比较的核酸(或多肽)序列之间特定长度范围内相同的核苷酸(或氨基酸)的数目。在大型家族的情况下,可以使用ClustalW,随后使用邻接树法,以帮助观察相关基因的聚集和鉴定直向同源物和旁系同源物。
核酸变体也可以用于实施本发明的方法中。此类变体的实例包括编码在实施例1的表A中所给出任一氨基酸序列的同源物和衍生物的核酸,术语“同源物”和“衍生物”如本文中定义。还在本发明方法中使用的是这样的核酸,其编码在实施例1的表A中所给出任一氨基酸序列的直向同源物或旁系同源物的同源物和衍生物。在本发明方法中使用的同源物和衍生物与衍生它们的未修饰蛋白质具有基本上相同的生物学活性和功能活性。
在实施本发明方法中有用的其他核酸变体包括编码NAP1样多肽的核酸的部分、与编码NAP1样多肽的核酸杂交的核酸、编码NAP1样多肽的核酸的剪接变体、编码NAP1样多肽的核酸的等位变体和通过基因改组获得的编码NAP1样多肽的核酸的变体。术语“杂交序列”、“剪接变体”、“等位变体”和“基因改组作用”如本文中所述。
编码NAP1样多肽的核酸无需是全长核酸,因为实施本发明方法不依赖于使用全长核酸序列。根据本发明,提供了用于提高植物中非生物胁迫抗性的方法,包括在植物中导入并表达实施例1的表A中给出的任一核酸序列的一部分或编码在实施例1表A中所给出任一氨基酸序列的直向同源物、旁系同源物或同源物的核酸的一部分。
核酸的一部分可以例如通过对所述核酸产生一个或多个缺失而制备。所述部分可以以分离的形式使用或它们可以与其他编码(或非编码)序列融合,例如旨在产生联合几种活性的蛋白质。与其他编码序列融合时,在翻译时所产生的所得多肽可以比对于该蛋白质部分所预测的多肽更大。
在本发明方法中使用的部分编码如本文中定义的NAP1样多肽,并且基本上具有如实施例1的表A中所给出氨基酸序列相同的生物学活性。优选地,此部分是在实施例1的表A中给出的任一核酸的一部分,或是编码在实施例1的表A中所给出任一氨基酸序列的直向同源物或旁系同源物的核酸的一部分。优选地,所述部分的长度以增加的优选顺序是至少400,500,600或700个连续核苷酸,所述连续核苷酸为实施例1的表A中给出的任一核酸序列或为编码在实施例1的表A中所给出任一氨基酸序列的直向同源物或旁系同源物的核酸。最优选地,所述部分是SEQ ID NO:1的核酸的一部分。优选地,所述部分编码包含(本文所定义的任意一个或多个结构域或基序)的氨基酸序列。优选地,所述部分编码这样的氨基酸序列,当在构建系统发生树中使用时,所述氨基酸序列总是与包含由SEQ ID NO:2所代表的氨基酸序列的NAP1样多肽组而不与任何其他组聚类。
在本发明方法中使用的另一种核酸变体是能够在降低的严格条件下、优选在严格条件下与编码如本文中定义的NAP1样多肽的核酸或与如本文中定义的部分杂交的核酸。
根据本发明,提供了用于提高植物的非生物胁迫抗性的方法,包括在植物中导入并表达能够与实施例1的表A中给出的任一核酸杂交的核酸,或包括在植物中导入并表达这样的核酸,其中所述核酸能够与编码在实施例1的表A中给出的任意核酸序列的直向同源物、旁系同源物或同源物的核酸杂交。
在本发明方法中使用的杂交序列编码如本文中定义的NAP1样多肽,并且基本上具有如实施例1的表A中所给出氨基酸序列相同的生物学活性。优选地,所述杂交序列能够与实施例1的表A中给出的任一核酸或与这些序列中任意序列的一部分杂交,所述的一部分如上文定义,或其中所述杂交序列能够与编码在实施例1的表A中给出的任一氨基酸序列的直向同源物或旁系同源物的核酸杂交。最优选地,所述杂交序列能够与如SEQID NO:1所代表的核酸或与其一部分杂交。优选地,所述杂交序列编码了包含如本文定义的任意一个或多个基序或结构域的氨基酸序列。优选地,所述杂交序列编码这样的氨基酸序列,当在构建系统发生树中使用时,所述氨基酸序列总是与包含由SEQ ID NO:2所代表的氨基酸序列的NAP1样多肽组而不与任何其他组聚类。
在本发明方法中使用的另一种核酸变体是编码如上文所定义的NAP1样多肽的剪接变体,剪接变体如本文中定义。
根据本发明,提供了用于提高植物的非生物胁迫抗性的方法,包括在植物中导入并表达在实施例1的表A中给出的任一核酸序列的剪接变体,或导入并表达编码在实施例1的表A中所给出任一氨基酸序列的直向同源物、旁系同源物或同源物的核酸的剪接变体。
优选的剪接变体是由SEQ ID NO:1所代表的核酸的剪接变体,或是编码SEQ ID NO:2的直向同源物或旁系同源物的核酸的剪接变体。优选地,由所述剪接变体编码的氨基酸序列包含如本文中定义的任意一个或多个基序或结构域。优选地,由所述剪接变体编码的氨基酸序列在构建系统发生树中使用时,总是与包含由SEQ ID NO:2所代表的氨基酸序列的NAP1样多肽组而不与任何其他组聚类。
在本发明方法中使用的另一种核酸变体是编码如上文所定义的NAP1样多肽的核酸的等位变体,等位变体如本文中定义。
根据本发明,提供了用于提高植物的非生物胁迫抗性的方法,包括在植物中导入并表达在实施例1的表A中给出的任一核酸的等位变体,或包括在植物中导入并表达编码在实施例1的表A中所给出任一氨基酸序列的直向同源物、旁系同源物或同源物的核酸的等位变体。
在本发明方法中使用的等位变体基本上具有如SEQ ID NO:2的NAP1样多肽和实施例1的表A中所述任意氨基酸序列相同的生物学活性。等位变体天然存在,并且在本发明的方法中包括这些天然等位基因的用途。优选地,所述等位变体是SEQ ID NO:1的等位变体或编码SEQ ID NO:2的直向同源物或旁系同源物的核酸的等位变体。优选地,由所述等位变体编码的氨基酸序列包含如本文中定义的任意一个或多个基序或结构域。优选地,由所述等位变体编码的氨基酸序列在构建系统发生树中使用时,总是与包含由SEQ ID NO:2所代表的氨基酸序列的NAP1样多肽组而不与任何其他组聚类。
基因改组或定向进化也可以用来产生编码如上文定义的NAP1样多肽的核酸的变体;术语“基因改组”如本文中定义。
根据本发明,提供了用于提高植物的非生物胁迫抗性的方法,包括在植物中导入并表达在实施例1的表A中给出的任一核酸序列的变体,或包括在植物中导入并表达核酸的变体,所述的核酸编码在实施例1的表A中给出的任一氨基酸序列的直向同源物、旁系同源物或同源物,其中所述的变异核酸通过基因改组获得。
优选地,通过基因改组获得的变异核酸编码了包含如本文定义的任意一个或多个基序或结构域的氨基酸序列。优选地,由通过基因改组获得的变异核酸所编码的氨基酸序列在构建系统发生树中使用时,总是与包含由SEQ ID NO:2所代表的氨基酸序列的NAP1样多肽组而不与任何其他组聚类。
另外,核酸变体也可以通过位点定向诱变获得。几种方法可用于实现位点定向诱变,最常见的是基于PCR的方法(Current Protocols inMolecular Biology.Wiley编辑)。
编码NAP1样多肽的核酸可以衍生自任何天然来源或人工来源。该核酸可以通过人类有意操作,在组成和/或基因组环境方面从其天然形式中修饰而来。优选地,编码NAP1样多肽的核酸来自植物,还优选来自双子叶植物,更优选来自十字花科(Brassicaceae)、更优选来自拟南芥属,最优选地来自拟南芥。
本发明方法的实施产生了与非生物胁迫下培育时的对照植物相比较,具有提高的非生物胁迫抗性(或非生物胁迫耐受性,所述术语可相互交换地使用)的植物,所述提高的非生物胁迫抗性作为增强的产量相关性状实现。尤其,本发明方法的实施产生了相对于对照植物而言,具有提高的产量、尤其提高的种子产量的植物。术语“产量”和“种子产量”在本文的“定义”部分中更详细地描述。然而,应当指出术语“产量相关性状”不包括植物细胞的代谢物含量并且增强的产量相关性状是提高的胁迫抗性的结果。
本文谈及的增强的产量相关性状意指植物的一个或多个部分的生物量(重量)增加,所述的部分可以包括地上(可收获的)部分和/或(可收获的)地下部分。尤其,此类可收获部分是种子,并且本发明方法的实施产生了相对于合适对照植物的种子产量而言,具有提高的种子产量的植物。
以谷物(corn)为例,产量提高可以表现为以下一个或多个指标:每公顷或英亩已建立的植物数目增加,每株植物花序数的提高,行数、每行核粒数、核粒重、千粒核重、花序长度/直径的提高,种子充实率(即充实种子数除以种子总数并乘以100)提高,及其他。以稻为例,产量提高可以自身表现为下列一种或多种指标的提高:每公顷或英亩植物数、每株植物的花序数、每花序的小穗数、每花序的花(小花)数目(其表达为充实种子数对原发花序数的比)、种子充实率的提高(其中种子充实率是充实种子数除以种子总数并乘以100)、千粒核重提高及其他。
本发明提供用于提高植物的非生物胁迫抗性的方法,从而导致提高的产量,尤其植物的种子产量,相对于非生物胁迫条件下培育的对照植物,所述方法包括调节植物中编码如本文中定义的NAP1样多肽的核酸表达,优选地增加该核酸表达。
由于本发明的转基因植物具有提高的产量,故相对于对照植物的生长速率,这些植物有可能在其生活周期的对应阶段上表现提高的生长速率(在其生活周期的至少部分期间)。除了提高的产量能力之外,提高的营养摄取效率也可能有助于产量提高。观察到本发明的植物在营养摄取方面显示较高的效率。提高的营养摄取效率允许植物在胁迫下较好地生长。
提高的生长速率可以是植物的一个或多个部分(包括种子)特异的,或可以基本上遍及整个植物。生长速率提高的植物可以具备较短的生活周期。植物的生活周期可以意指从干燥成熟种子成长至植物已经产生与起始材料相似的干燥成熟种子的阶段所需要的时间。这个生活周期可以受以下因素影响,如早期生长势、生长速率、绿度指数、开花时间和种子成熟速度。生长速率的提高可以在植物生活周期的一个或多个阶段上或在整个植物生活周期期间发生。植物生活周期早期中提高的生长速率在可以反映增强的生长势。生长速率的提高可以改变植物的收获周期,从而导致植物较晚播种和/或较早收获,而这本来是不可能的(相似效果可以随较早的开花时间获得)。若生长速率充分提高,则可以允许进一步播种相同植物物种的种子(例如播种并收获稻植物,随后播种并收获其他稻植物,全部稻植物均出于一个常规生长时期中)。类似地,若生长速率充分地提高,可以允许进一步播种不同植物物种的种子(例如播种并收获谷物植物,随后例如播种并任选收获大豆、马铃薯或任何其他合适植物)。在一些作物植物的例子中,来自相同根状茎的额外收获次数也可以是可能的。改变植物的收获周期可以导致每英亩一年生物量生产提高(原因在于可以培育并收获任何具体植物的次数(即在一年中)提高)。生长速率的提高也可以允许转基因植物在比其野生型对应物更广泛的地理区域内培育,因为培育作物的地域限制往往由栽种时节(早季)或在收获时期(晚季)的不利环境条件所决定。这类不利条件可以避开,若缩短收获周期。生长速率可以通过从生长曲线获得多个参数而确定,此类参数可以是:T-Mid(植物达到其50%最大尺寸所花费的时间)和T-90(植物达到其50%最大尺寸所花费的时间),以及其他。
根据本发明的优选特征,本发明方法的实施产生了相对于非生物胁迫下培育时的对照植物而言,具有提高的生长速率的植物。因此,根据本发明,提供了用于提高非生物胁迫条件下植物生长速率的方法,所述方法包括在植物中调节、优选提高如本文中定义的编码NAP1样多肽的核酸的表达。
与对照植物相比较,当所述植物暴露于多种非生物胁迫时,是否出现产量和/或生长速率的提高。植物一般通过生长得更慢而应答于胁迫暴露。在严重胁迫条件下,植物甚至可以完全停止生长。另一方面,轻度胁迫在本文中定义为植物所暴露的任何下述胁迫,其中所述的胁迫未导致植物完全停止生长,但同时不能恢复生长。与非胁迫条件下的对照植物相比较,轻度胁迫在本发明意义中导致受胁迫植物的生长降低小于40%、35%或30%、优选地小于25%、20%或15%、更优选地小于14%、13%、12%、11%或10%或更低。由于农业实践(灌溉、施肥、杀虫剂处理)的进步,在栽培作物植物中并不经常遇到严重胁迫。因此,由轻度胁迫诱导的受损生长对于农业往往是不受欢迎的特征。(如本文中所用的)轻度胁迫是植物所暴露的常见非生物性(环境)胁迫。非生物胁迫可以因干旱或过量的水、缺氧胁迫、盐胁迫、化学毒性、氧化胁迫和热、寒冷或冰冻温度所致。非生物胁迫可以是因水胁迫(尤其因为干旱)、盐胁迫、氧化胁迫或离子胁迫引起的渗透胁迫。
非生物性环境胁迫的另一个实例是需要由所述植物同化以生长和发育的一种或多种营养的可获量降低。因为营养可获量强烈地影响植物产量和产品品质,故将大量肥料倾注至田中以优化植物产量和产品品质。植物的生产量通常受三种主要营养素,即磷、钾和氮限制,这三种营养素中,氮通常是是植物生长的限速性元素。因此,植物生长所需的主要营养元素是氮(N)。氮是活细胞中存在的众多重要化合物的组成成分,所述的重要化合物包括氨基酸、蛋白质(酶)、核酸和叶绿素。植物干物质的1.5%-2%是氮和植物总蛋白的大约16%是氮。因此,氮可获量是作物植物生长和生产的主要限制性因素(Frink等(1999)Proc Natl Acad Sci USA 96(4):1175-1180),并且也对蛋白质聚集和氨基酸组成也有明显影响。因此,在氮限制性条件下培育时具有提高产量的植物是具有重大意义的。
生物胁迫一般是由病原体如细菌、病毒、线虫、真菌和昆虫引起的那些胁迫。
尤其,本发明的方法可以在胁迫条件下开展以产生相对于对照植物具有提高的产量的植物。如Wang等(Planta(2003)218:1-14)中报道,非生物胁迫导致一系列不利地影响植物生长及生产量的形态学、生理学、生物化学和分子变化。干旱、盐度、极端温度和氧化胁迫已知是相互联系的并可以通过相似机制诱导生长损害及细胞损害。Rabbani等(PlantPhysiol(2003)133:1755-1767)描述了干旱胁迫与高盐度胁迫间极高程度的“交互作用”。例如,干旱和/或盐化作用主要地表现为渗透胁迫,从而导致细胞内稳态和离子分布的破坏。经常伴随高温或低温、盐度或干旱胁迫的氧化胁迫可以造成功能性蛋白和结构蛋白变性。因此,这些多样的环境胁迫常常激活相似的细胞信号途径和细胞应答,如产生胁迫蛋白、上调抗氧化物质、积累兼容性溶质和生长停滞。如本文中所用的术语“非胁迫”条件是允许植物最佳生长的环境条件。本领域技术人员清楚对于给定地点的正常土壤条件和气候条件。
本发明方法的实施产生了在非生物胁迫条件下生长的植物,其相对于可比较条件下生长的合适对照植物而言,具有提高的产量。因而,根据本发明,提供了用于提高在非生物胁迫条件下培育的植物中产量的方法,所述的方法包括在植物中提高编码NAP1样多肽的核酸表达。在一个具体实施方案中,提高的非生物胁迫耐受性是对降低的营养可获量具有提高的耐受性。
本发明包括可由本发明方法获得的植物或其部分(包括种子)。所述植物或其部分包含编码如上文定义的NAP1样多肽的核酸转基因。
本发明也提供基因构建体和载体以促进在植物中导入和/或表达编码NAP1样多肽的核酸。所述基因构建体可以插入适于转化至植物并适于在转化细胞中表达目的基因的载体,所述载体可以是市售的。本发明也提供如本文中定义的基因构建体在本发明方法中的用途。
更具体地,本发明提供构建体,其包含:
(a)编码如上文定义的NAP1样多肽的核酸;
(b)能够驱动(a)的核酸序列表达的一个或多个调控序列;和任选地
(c)转录终止序列。
优选地,编码NAP1样多肽的核酸是如上文定义的。术语“调控序列”和“终止序列”如本文中的定义。
植物用包含任一上述核酸的载体转化。技术人员非常了解必须存在于所述载体上以便成功转化、选择和增殖含有目的序列的宿主细胞的遗传元件。所述目的序列有效地与一个或多个调控序列(至少与启动子)连接。
有利地,任意类型的启动子可以用来驱动所述核酸序列的表达。组成型启动子在本发明方法中是特别有用的,优选地,所述组成型启动子是组成型强启动子。应当明白本发明的应用不限于由SEQ ID NO:1代表的编码NAP1样多肽的核酸,本发明的应用也不限于编码NAP1样多肽的核酸在受组成型启动子驱动时的表达。
所述组成型启动子优选地是GOS2启动子,更优选地是稻GOS2启动子,最优选地如SEQ ID NO:39中描述的启动子。对于组成型启动子的其他实例,见本文中“定义”部分的表2。优选地,所述构建体包含如SEQ IDNO:3代表的表达盒。
任选地,可以在导入植物的构建体中导入一个或多个终止子序列。其它的调节元件可以包括转录增强子和翻译增强子。本领域技术人员将知道可能适用于实施本发明的终止子和增强子序列。此类序列将是已知的或可以由本领域技术人员轻易获得。
如定义部分中描述,内含子序列也可以添加至5′非翻译区(UTR)或编码序列中,以增加聚集在细胞质内的成熟信使的量。
(除启动子、增强子、沉默子、内含子序列、3′UTR和/或5′UTR区域之外的)其他调控序列可以是蛋白质/或RNA稳定元件。此类序列将是已知的或可以由本领域技术人员轻易获得。
本发明的基因构建体还可以包括为在特定细胞类型中维持和/或复制所需要的复制起点序列。一个实例是当基因构建体需要作为游离型遗传元件(例如质粒或粘粒分子)维持在细菌细胞中时的复制起点。优选的复制起点包括但不限于f1-ori和colE1。
为检测如在本发明方法中使用的核酸序列的成功转移和/或选择包含这些核酸的转基因植物,有利的是使用标记基因(或报道基因)。因此,所述基因构建体可以任选地包含选择标记基因。选择标记在本文的“定义”部分中更详细地描述。一旦不再需要所述标记基因时,它们可以从转基因细胞中移出或切除。用于移出标记的技术是本领域已知的,有用技术在上文定义部分中描述。
已知当核酸稳定或瞬时地整合至植物细胞时,仅少数细胞摄取了外来DNA,并且根据需要,将其整合至细胞的基因组中,这取决于所用的表达载体和所用的转染技术。为鉴定并选择这些整合子,编码选择标记的基因(如上文所述的基因)通常连同目的基因一起导入宿主细胞。这些标记可以例如在突变体中使用,在所述突变体中这些基因例如因常规方法缺失而没有功能。此外,编码选择标记的核酸分子可以在相同的载体或在分别的载体上导入宿主细胞,其中所述相同的载体包含编码本发明多肽的或在本发明方法使用的序列。已经用所导入核酸稳定转染的细胞可以例如通过选择加以鉴定(例如,已经整合了所述标记的细胞存活而其余细胞死亡)。
本发明也提供用于产生转基因植物的方法,所述转基因植物在非生物胁迫条件下培育时相对于对照植物而言,具有增强的产量相关性状,其中所述方法包括在植物中导入并表达编码如上文所定义的NAP1样多肽的任意核酸。
更具体地,本发明提供用于产生具有增加了产量的转基因植物的方法,所述方法包括:
(i)在植物或植物细胞中导入并表达编码NAP1样多肽的核酸;和
(ii)在促进植物生长和发育的条件下培养植物细胞。
所述核酸可以直接导入植物细胞或导入植物自身(包括导入组织、器官或植物的任何其他部分)。根据本发明的优选特征,该核酸优选地通过转化作用导入植物。术语“转化”在本文的“定义”部分中更详细地描述。
经遗传修饰的植物细胞可以通过技术人员熟悉的所有方法再生。合适的方法可以在上文提及的S.D.Kung和R.Wu,Potrykus或
Figure G2008800037051D00581
和Willmitzer的出版物中找到。
通常在转化后,对植物细胞或细胞群体选择一个或多个标记的存在性,其中所述标记由随同目的基因一起共转移的植物可表达基因编码,随后将转化材料再生成完整植物。为了选择转化植物,在所述转化中获得的植物材料原则上经历选择性条件,从而转化植物可以与非转化植物区分。例如,可以将以上述方式获得的种子播种,并且在初始培育时间后,通过喷洒进行合适的选择。另一种可能性在于根据需要消毒后,在使用合适选择剂的琼脂板上培育种子,从而仅转化的种子可以长成植物。或者,对所述转化植物筛选选择标记(如上文所述的选择标记)的存在性。
在DNA转移和再生后,推定转化的植物也可以例如使用DNA印迹分析对目的基因的存在性、拷贝数和/或基因组构造进行评价。备选地或额外地,新导入的DNA的表达水平可以使用RNA印迹分析和/或蛋白质印迹分析或这两种分析法监测,这两项技术均是本领域普通技术人员熟知的。
产生的转化植物可以通过多种方法繁殖,如通过克隆繁殖法或经典育种技术。例如,第一世代(或T1)转化植物可以进行自交并且选择纯合的第二世代(或T2)转化体,并且T2植物随后可以通过经典育种技术进一步繁殖。
产生的转化生物可以采取多种形式。例如,它们可以是转化细胞和非转化细胞的嵌合体;克隆性转化体(例如,被转化以含有表达盒的全部细胞);转化组织和非转化组织的移植体(例如在植物中,与未转化接穗嫁接的转化根状茎)。
本发明明确地扩展至由本文中所述的任意方法产生的任意植物细胞或植物,并扩展至全部植物部分及其繁殖体。本发明进一步扩展以包括已经由前述任意方法产生的原代转化或转染细胞、组织、器官或完整植物的后代,唯一要求是后代表现与如本发明方法中的亲代相同的基因型和/或表型特征。
本发明也包括含有编码NAP1样多肽的分离核酸的宿主细胞。本发明的优选宿主细胞是植物细胞。在本发明方法中所用核酸或载体、表达盒或构建体或载体的宿主植物原则上有利地是能够合成在本发明方法中所使用多肽的全部植物。
本发明的方法有利地适用于任意植物。
在本发明方法中特别有用的植物包括属于植物界(Viridiplantae)超家族、尤其单子叶和双子叶植物的全部植物,包括饲用或饲料豆科植物、观赏植物、粮食作物、树或灌木。根据本发明的一个优选实施方案,所述植物是作物植物。作物植物的实例包括大豆、向日葵、卡诺拉油菜、苜蓿、油菜籽、棉花、番茄、马铃薯和烟草。更优选地,所述植物是单子叶植物。单子叶植物的实例包括甘蔗。更优选地,所述植物是谷物植物。谷物植物的实例包括稻、玉米、小麦、大麦、谷子、黑麦、小黑麦属(triticale)、高粱、二粒小麦、斯卑尔脱小麦、黑麦属(secale)、单粒小麦、埃塞俄比亚画眉草(teff)、买罗高粱和燕麦。
本发明也扩展至植物的可收获部分如,但不限于种子、叶、果实、花、茎、根状茎、块茎和球茎。本发明进一步涉及了衍生自、优选直接衍生自此种植物的可收获部分的产品,如干燥颗粒或粉末、油、脂肪和脂肪酸、淀粉或蛋白质。
根据本发明的优选特征,受调节的表达是提高的表达。提高的表达或过量表达应当理解为额外于原初野生型表达水平的任意表达。本领域充分记录了用于提高核酸或基因或基因产物表达的方法并且在定义部分中提供了例子。
如上所述,用于调节(优选地提高)编码NAP1样多肽的核酸表达的优选方法是通过在植物中导入并表达编码NAP1样多肽的核酸;然而,实施本方法的效果,即增强产量相关性状,也可以使用其他熟知技术实现。下文现在将描述这些技术中的某些技术。
这样的一种技术是T-DNA活化标签技术(Hayashi等Science(1992)1350-1353),其包括通常含有启动子(也可以是翻译增强子或内含子)的T-DNA在目的基因的基因组区或基因的编码区上游或下游10kb以这样的方式插入,从而该启动子指导靶向的基因表达。一般,靶向基因的天然启动子对该靶向基因表达的调节被破坏,并且所述基因处于新导入的启动子控制下。该启动子一般嵌入T-DNA中。这种T-DNA随机地插入植物基因组,例如借助农杆菌感染,并且导致在插入的T-DNA附近的基因表达受到调节。所得的转基因植物因在导入的启动子附近的基因表达受到调节而显示显性表型。
本发明的作用也可以使用TILLING技术(基因组中定向诱导的局部损伤)重复;对TILLING技术的描述见“定义”部分。
对该技术的描述见“定义”部分。本发明的作用也可以使用同源重组法重复;对同源重组的描述见“定义”部分。
本发明也包括编码如本文中所述NAP1样多肽的核酸的用途,和这种NAP1样多肽的用途,用于增强在非生物胁迫条件下培育时植物中任意的前述产量相关性状。
编码本文中所述NAP1样多肽的核酸或NAP1样多肽自身可以用于育种程序中,在所述育种程序中鉴定到可以遗传地与编码NAP1样多肽的基因连接的DNA标记。所述核酸/基因或NAP1样多肽自身可以用来定义分子标记。这种DNA或蛋白质标记随后可以在育种程序中用来在本发明的方法中选择具有如上文所定义的增强的产量相关性状的植物。
编码NAP1样多肽的核酸/基因的等位变体也可以用于标记辅助的育种程序中。这种育种程序有时需要使用例如EMS诱变法通过对植物进行诱变处理而导入等位变异;备选地,该程序可以从收集并非故意造成的所谓“自然”源性等位变体开始。随后进行等位变体的鉴定,例如通过PCR法。此后是步骤:选择所讨论和导致产量提高的序列的优异等位变体。选择一般通过监测含有所讨论序列的不同等位变体的植物的生长性能而实施。生长性能可以在温室或在田间监测。其他任选步骤包括使其中鉴定到优异等位变体的植物与另一种植物杂交。这可能用来例如产生感兴趣的表型特征组合。
编码NAP1样多肽的核酸也可以作为探针用于遗传地或物理地绘制所述探针构成其一部分的基因并且作为标记用于与这些基因连锁的性状。此类信息可以用于植物育种,旨在开发具有所希望表型的品系。编码NAP1样多肽的核酸的这种用途仅需要具有至少15个核苷酸长度的核酸序列。编码NAP1样多肽的核酸可以用作限制性片段长度多态性(RFLP)标记。限制性消化的植物基因组DNA的DNA印迹物(Sambrook J,Fritsch EF和Maniatis T(1989)Molecular Cloning,A Laboratory Manual)可以用编码NAP1样多肽的核酸探测。所得的结合图式随后可以使用计算机程序如MapMaker(Lander等(1987)Genomics 1:174-181)进行遗传分析以构建遗传图。此外,该核酸可以用来探测含有一组个体的限制性核酸内切酶处理的基因组DNA的DNA印迹物,其中所述的一组个体代表具有定义的遗传杂交的亲代和后代。标出DNA多态性的分离并用来计算编码NAP1样多肽的核酸在先前使用这个群体获得的遗传图中的位置(Botstein等(1980)Am.J.Hum.Genet.32:314-331)。
在Bernatzky和Tanksley(1986)Plant Mol.Biol.Reporter 4:37-41中描述了植物基因来源的探针的产生及其在遗传作图中的用途。众多出版物描述了使用以上所提及的方法学或其改良法对特定cDNA克隆的遗传作图。例如,F2互交群、回交群、随机交配群、邻近纯合系和其他个体群体可以用于作图。此类方法学是本领域技术人员熟知的。
所述核酸探针也可以用于物理作图(即序列在物理图上的排列;见Hoheisel等在:Non-mammalian Genomic Analyasis:A Practical Guide,Academic press 1996,第319-346页及其中引用的参考文献)。
在另一实施方案中,核酸探针可以在直接荧光原位杂交(FISH)作图法(Trask(1991)Trends Genet.7:149-154)中使用。尽管当前的FISH作图法支持使用大的克隆(几个kb至几百个kb;见Laan等(1995)Genome Res.5:13-20),然而灵敏度的改善可以允许使用更短探针进行FISH作图。
用于遗传作图及物理作图的多种基于核酸扩增的方法可以使用所述核酸而实施。方法实例包括等位基因特异性扩增法(Kazazian(1989)J.Lab.Clin.Med 11:95-96)、PCR扩增片段的多态性(CAPS;Sheffield等(1993)Genomics 16:325-332)、等位基因特异性连接(Landegren等(1988)Science241:1077-1080)、核苷酸延伸反应(Sokolov(1990)Nucleic Acid Res.18:3671)、放射杂交作图(Walter等(1997)Nat.Genet.7:22-28)和Happy作图法(Dear和Cook(1989)Nucleic Acid Res.17:6795-6807)。对于这些方法,使用一种核酸的序列来设计并产生在扩增反应或在引物延伸反应中使用的引物对。此类引物的设计是本领域技术人员熟知的。在使用基于PCR遗传作图的方法中,可能需要在对应于当前核酸序列的区域中鉴定作图交叉的亲代之间的DNA序列差异。然而,这通常对作图法而言不是必需的。
本发明方法产生了具有如前文所述提高的产量的植物。这些性状也可以与经济上有利的其他性状组合,如其他的产量增强性状、针对其他非生物胁迫和生物胁迫的耐受性、调节多种构造性特征和/或生物化学特征和/或生理学特征的性状。
II.Lsm
出人意料地,现在已经发现调节在植物中编码Lsm多肽的核酸表达产生了相对于对照植物而言具有增强的产量相关性状的植物。下文详细描述适用于增强植物中产量相关性状的具体类别的Lsm多肽。
本发明提供相对于对照植物用于增强植物中产量相关性状的方法,包括调节植物中编码Lsm多肽的核酸的表达。
下文任一谈及的“在本发明方法中使用的蛋白质”意指如本文中定义的Lsm多肽。下文任一谈及的“在本发明方法中使用的核酸”意指能够编码这种Lsm多肽的核酸。
用于调节(优选地提高)编码在本发明方法中使用的蛋白质的核酸表达的优选方法是通过在植物中导入并表达编码如下文定义的在本发明方法中使用的蛋白质的核酸。
待导入植物(并且因而在实施本发明的方法中使用)的核酸是编码现在将描述的蛋白质类型的任意核酸,下文也称作“Lsm核酸”或“Lsm基因”。如本文中定义的“Lsm”多肽指具有包含Lsm结构域的氨基酸序列的任意分子。
SEQ ID Nos 120、121、122、123、124、125、126、127、128、129和130是在如SEQ ID Nos 41、43、45、47、49、51、53、55、57、59和61中提供的代表性Lsm蛋白中所发现的Lsm结构域的实例。通常,Lsm蛋白中的Lsm结构域具有这样的氨基酸序列,其以增加的优选顺序与选自SEQ ID Nos 120、121、122、123、124、125、126、127、128、129和130的序列具有至少50%、60%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性。
Lsm结构域在多肽中的存在可以通过该多肽序列与已经充分描述的Lsm蛋白比较并在Lsm结构域中建立同源性而轻易确定。开展序列比较的方法是本领域熟知的并且在下文描述。或者,Lsm结构域可以如实施例14中所述,通过在含有保守蛋白质结构域的适宜数据库中搜索而轻易鉴定。
通常,Lsm蛋白包含以增加的优选顺序与选自SEQ ID Nos 41、43、45、47、49、51、53、55、57、59和61的序列具有至少50%、60%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。
还优选地,在本发明方法中使用的蛋白质的Lsm序列包含任意一个或多个以下保守基序:
基序I:GTLXSFDQFANVVLXGACERVIVGELYCDVPLGLYVIRGENVVLIG或以增加的优选顺序与基序I的序列具有至少70%、80%或90%序列同一性的基序,其中允许任何保守性变化并且其中‘X’取为任意氨基酸。
基序II:KAEREARDLKGTMRKRMEFLDFD或以增加的优选顺序与基序II的序列具有至少70%、80%或90%序列同一性的基序,其中允许任何保守性变化并且其中‘X’取为任意氨基酸。
基序I和/或基序II可以按照优选顺序包含0、1、2、3、4、5、6或7个氨基酸的缺失和/或替换和/或插入。
还优选地,在本发明方法中使用的Lsm蛋白是Lsm1类蛋白质。如本文中提到的Lsm1类蛋白质是酿酒酵母Lsm1蛋白的任意直向同源物或如SEQ ID No.41和SEQ ID No.43中所提供的拟南芥Lsm1a或Lsm1b蛋白的任意直向同源物。
鉴定直向同源蛋白质的方法是本领域熟知的并且在本文中描述。代表性Lsm1类蛋白的实例在表G中给出。
在本发明方法中使用的Lsm蛋白优选地包含具有下述氨基酸序列的Lsm结构域,所述的氨基酸序列以增加的优选顺序与选自SEQ ID Nos.120、121、131、132、133、140、142、143、144、152、154和157的序列具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性。
甚至更优选地,以上提及的Lsm1类蛋白包含以增加的优选顺序与SEQ ID No 41、43、73、75、77、81、85、87、89、105、109和115中任意序列具有70%、75%、80%、82%、84%、86%、88%、90%、92%、94%、96%、98%或99%序列同一性的氨基酸序列。最优选地,Lsm1蛋白是SEQ ID No 41、43、73、75、77、81、85、87、89、105、109和115中的任一序列。
在本发明方法中使用的蛋白质和编码该蛋白质的核酸的实例在如下文实施例11的表G中给出。
还在本发明方法中使用的是在实施例11的表G中给出的任一Lsm氨基酸序列的同源物。
还在本发明方法中使用的是在实施例11的表G中给出的任一多肽的衍生物或者任意前述SEQ ID NOs的直向同源物或旁系同源物的衍生物。
本发明通过用SEQ ID NO:40所代表的拟南芥核酸序列转化植物进行说明,其中所述的核酸序列编码SEQ ID NO:41的多肽序列。然而,本发明的实施不限于这些序列;本发明的方法可以有利地使用编码如本文中定义的在本发明方法中使用的蛋白质(包括同源物、直向同源物和旁系同源物)的任意核酸(如实施例11的表G中给出的任意核酸序列)实施。
在实施例11的表G中给出的氨基酸序列可以视为由SEQ ID Nos 41、43、45、47、49、51、53、55、57、59和61中任一序列所代表的Lsm多肽的直向同源物和旁系同源物,术语“直向同源物”和“旁系同源物”如本文中定义。
直向同源物和旁系同源物可以通过开展所谓交互式blast搜索而轻易找到。通常,这包括第一BLAST,其中所述的第一BLAST包括将查询序列(例如使用实施例11的表G中列出的任意序列)针对任意序列数据库(如可公开获得的NCBI数据库)进行BLAST。当从核苷酸序列开始时,一般使用BLASTN或TBLASTX(使用标准默认值),并且当从蛋白质序列开始时,使用BLASTP或TBLASTN(使用标准默认值)。可以任选地筛选BLAST结果。筛选结果或非筛选结果的全长序列随后针对来自生物的序列进行反向BLAST(第二BLAST),其中所述查询序列从所述生物衍生(在查询序列是SEQ ID NO:40或SEQ ID NO:41的情况下,所述第二BLAST因而将针对拟南芥序列进行)。随后比较第一BLAST和第二BLAST的结果。若来自第一blast的高阶位命中源自与衍生查询序列的物种相同的物种,则鉴定到旁系同源物,反向BLAST随后理想地在最高命中当中产生该查询序列;若高阶位命中不是源自与衍生查询序列的物种相同的物种,则鉴定到直向同源物,并且优选地在反向BLAST时,在最高命中当中产生该查询序列。
高阶位命中是具有低E-值的那些命中。E-值越低,评分越显著(或换句话说,偶然发现该命中的几率越低)。E-值的计算是本领域熟知的。除了E-值外,也通过同一性百分数评分来进行比较。同一性百分数指两个所比较的核酸(或多肽)序列之间特定长度范围内相同的核苷酸(或氨基酸)的数目。在大型家族的情况下,可以使用ClustalW,随后使用邻接树法,以帮助观察相关基因的聚集和鉴定直向同源物和旁系同源物。
实施例11的表G给出了由SEQ ID NO 41代表的Lsm蛋白的直向同源物和旁系同源物的实例。其他直向同源物和旁系同源物可以使用上文所述的BLAST方法轻易地鉴定到。
本发明的蛋白质因存在(例如图9中显示的)保守Lsm结构域而是可鉴定的。
优选地,在构建系统发生树时使用的多肽序列(如图9中所描述的那种多肽序列)与包含由SEQ ID NO:41所代表的氨基酸序列的Lsm多肽组而不与任何其他组聚类。
术语“结构域”、“标签”和“基序”在本文中的“定义”部分定义。也存在用于鉴定结构域的专业数据库,例如,SMART(Schultz等(1998)Proc.Natl.Acad.Sci.USA 95,5857-5864;Letunic等(2002)Nucleic Acids Res 30,242-244)、InterPro(Mulder等,(2003)Nucl.Acids.Res.31,315-318)、Prosite(Bucher和Bairoch(1994),用于生物分子序列基序的概括特征结构及其在自动化序列解读中的功能(在)ISMB-94;第二届分子生物学智能系统国际会议文集.Altman R.,Brutlag D.,Karp P.,Lathrop R.,Searls D.编辑,第53-61页,AAAIPress,Menlo Park;Hulo等,Nucl.Acids.Res.32:D134-D137,(2004)或Pfam(Bateman等,Nucleic Acids Research 30(1):276-280(2002))。一组用于计算机方式分析蛋白质序列的工具可在ExPASY蛋白质组服务器上获得(瑞士生物信息研究所维护(Gasteiger等,ExPASy:深入认识和分析蛋白质的蛋白质组服务器,Nucleic Acids Res.31:3784-3788(2003))。
结构域也可以使用常规技术如通过序列比对进行鉴定。用于比对序列以进行比较的方法是本领域熟知的,此类方法包括GAP、BESTFIT、BLAST、FASTA和TFASTA。GAP使用Needleman和Wunsch算法((1970)J Mol Biol 48:443-453)以找到使匹配数最大化并使空位数最小化的两个序列的总体(即覆盖完整序列的)比对结果。BLAST算法(Altschul等(1990)J Mol Biol 215:403-10)计算序列同一性百分数并在两个序列之间开展相似性的统计分析。用于执行BLAST分析的软件是通过国家生物技术信息中心(NCBI)可公开获得的。同源物可以使用例如ClustalW多重序列比对算法(1.83版本),以默认配对比对参数和百分数评分方法轻易地鉴定。相似性和同一性的总体百分数也可以使用MatGAT软件包中的可用方法之一确定(Campanella等,BMC Bioinformatics.2003年7月10日;4:29.MatGAT:使用蛋白质序列或DNA序列产生相似性/同一性矩阵的一种应用)。如本领域技术人员显而易见,可以进行少许手工编辑以优化保守基序之间的比对结果。此外,作为使用全长序列以鉴定同源物,也可以使用特定结构域(如Lsm结构域或如上所定义的基序之一)。对于局部比对,Smith-Waterman算法是特别有用的(Smith TF,Waterman MS(1981)J.Mol.Biol 147(1);195-7)。在下文实施例13中表述为百分数的序列同一性值利用上文提及的程序,使用默认参数在完整核酸或氨基酸序列范围和/或在所选择的结构域或保守基序范围内确定。
此外,已经描述了Lsm蛋白(至少在其天然形式中)的活性。活性测定法通常基于Lsm蛋白属性的生物化学或生物学功能,这包括它们结合其他Lsm蛋白、调节剪接、胞质mRNA降解、rRNA加工的能力和它们在翻译效率中的作用。酵母双杂和体外共沉淀实验可以用来检测与snRNA和snRNP的结合(Mayes AE等EMBO J.1999Aug 2;18(15):4321-31)。已经使用toeprinting、体外翻译和电泳迁移率移动测定法(electromobility shiftassays)报道了因Lsm蛋白所致的蛋白质翻译干扰(Vytvytska O等GenesDev.2000年5月1日;14(9):1109-18;Zaric B等J Biol Chem.2005年4月22日;280(16):16066-75)。Lsm活性还通过测定受脱腺苷酰作用依赖性脱帽过程影响的特定基因积累的相对水平(Tharum等2005)或通过总体mRNA基因表达变化(Fraser MM,Watson PM,Fraig MM,Kelley JR,Nelson PS,Boylan AM,Cole DJ,Watson DK.CaSm介导的细胞转化与基因表达改变和信使RNA稳定性相关(CaSm-mediated cellulartransformation is associated with altered gene expression and messengerRNA stability).Cancer Res.2005年7月15日;65(14):6228-36)揭示。
编码在本发明方法中使用的蛋白质的核酸无需是全长核酸,因为实施本发明方法不依赖于使用全长核酸序列。在实施本发明方法中适用的核酸的实例包括在实施例11的表G中给出的核酸序列,但不限于这些序列。核酸变体也可以用于实施本发明的方法中。此类核酸变体的实例包括编码在本发明方法中使用的蛋白质的核酸的部分、与编码在本发明方法中使用的蛋白质的核酸杂交的核酸、编码在本发明方法中使用的蛋白质的核酸的剪接变体、编码在本发明方法中使用的蛋白质的核酸的等位变体,和通过基因改组获得的编码在本发明方法中使用的蛋白质的核酸的变体,术语“杂交序列”、“剪接变体”、“等位变体”和“基因改组作用”如本文中所述。
根据本发明,提供了用于增强植物中产量相关性状的方法,包括在植物中导入并表达在实施例11的表G中给出的任一核酸序列的一部分,或下述核酸的一部分,其中所述的核酸编码在实施例11的表G中给出的任一氨基酸序列的直向同源物、旁系同源物或同源物。
优选地,在本发明方法中使用的核酸包含任一以下核酸:
(i)SEQ ID NO:82、SEQ ID NO:84、SEQ ID NO:86、SEQ ID NO:88、SEQ ID NO:90、SEQ ID NO:92、SEQ ID NO:94、SEQ ID NO:96、SEQID NO:98、SEQ ID NO:100、SEQ ID NO:102、SEQ ID NO:104、SEQ IDNO:106、SEQ ID NO:108、SEQ ID NO:110、SEQ ID NO:112、SEQ IDNO:114和SEQ ID NO:116;
(ii)编码Lsm蛋白的核酸,其中所述的Lsm蛋白以增加的优选顺序与SEQ ID NO:83、SEQ ID NO:85、SEQ ID NO:87、SEQ ID NO:89、SEQID NO:91、SEQ ID NO:93、SEQ ID NO:95、SEQ ID NO:97、SEQ ID NO:99、SEQ ID NO:101、SEQ ID NO:103、SEQ ID NO:105、SEQ ID NO:107、SEQ ID NO:109、SEQ ID NO:111、SEQ ID NO:113、SEQ ID NO:115、SEQ ID NO:117中给出的任一氨基酸序列具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%的序列同一性;
(iii)能够在严格条件下与上文(i)或(ii)中给出的任一核酸杂交的核酸。
在本发明方法中使用的部分编码这样的多肽,所述多肽属于编码如本文中定义的在本发明方法中使用的蛋白质的核酸的定义范围并且基本上具有如实施例11的表G中给出的氨基酸序列相同的生物学活性。优选地,所述部分是在实施例11的表G中给出的任一核酸的一部分。该部分一般是至少100个连续核苷酸长度,优选至少150个连续核苷酸长度,更优选至少180个连续核苷酸长度和最优选至少350个连续核苷酸长度,所述连续核苷酸来源于实施例11的表G中给出的任一核酸序列。最优选地,所述部分是SEQ ID NO:40的核酸的一部分。优选地,所述部分编码如本文中所定义的任意一个或多个Lsm结构域的氨基酸序列。优选地,所述部分编码这样的氨基酸序列,当在构建Lsm系统发生树(如图10中所绘制的一个系统发生树)中使用时,所述氨基酸序列倾向于与包含由SEQ ID Nos 41、43、45、47、49、51、53、55、57、59和61所代表的氨基酸序列的任意代表性Lsm蛋白聚类,而不偏离于前述SEQ ID Nos聚类。
编码如本文中定义的Lsm蛋白的核酸的一部分可以例如通过对所述核酸产生一个或多个缺失而制备。所述部分可以以分离的形式使用或它们可以与其他编码(或非编码)序列融合,例如旨在产生联合几种活性的蛋白质。与其他编码序列融合时,在翻译时所产生的所得多肽可以比对于Lsm蛋白部分所预测的多肽更大。
在本发明方法中使用的另一种核酸变体是能够在降低的严格条件下、优选在严格条件下与编码如本文中定义的Lsm蛋白的核酸或与如本文中定义的部分杂交的核酸。
在本发明方法中使用的杂交序列编码这样的多肽,所述的多肽具有Lsm结构域(见图10的比对结果)并且基本上具有与由实施例11的表G中给出的任一氨基酸序列所代表的Lsm蛋白的相同生物学活性。优选地,所述杂交序列一般是至少100个连续核苷酸长度,优选至少150个连续核苷酸长度,更优选至少180个连续核苷酸长度和最优选至少350个连续核苷酸长度,所述连续核苷酸来源于实施例11的表G中给出的任一核酸序列。优选地,所述杂交序列是能够与实施例11的表G中给出的任意核酸或与这些序列中任意序列的一部分杂交的序列,其中所述的一部分如上文定义。最优选地,所述杂交序列能够与如SEQ ID NO:40所代表的核酸或与其一部分杂交。优选地,所述杂交序列编码了包含如本文定义的任意一个或多个基序或结构域的氨基酸序列。优选地,所述杂交序列编码这样的氨基酸序列,当在构建Lsm系统发生树(如图10中所绘制的一个系统发生树)中使用时,所述氨基酸序列倾向于与包含由SEQ ID Nos 41、43、45、47、49、51、53、55、57、59和61所代表的氨基酸序列的任意代表性Lsm蛋白聚类,而不偏离于前述SEQ ID Nos聚类。
根据本发明,提供了用于增强植物中产量相关性状的方法,包括在植物中导入并表达能够与实施例11的表G中给出的任一核酸杂交的核酸,或包括在植物中导入并表达这样的核酸,其中所述的核酸能够与编码实施例11的表G中给出的任意核酸序列的直向同源物、旁系同源物或同源物的核酸杂交。
在本发明方法中使用的另一种核酸变体是编码如上文所定义的Lsm蛋白的剪接变体。
根据本发明,提供了用于增强植物中产量相关性状的方法,包括在植物中导入并表达在实施例11的表G中给出的任一核酸序列的剪接变体,或导入并表达编码在实施例11的表G中所给出任一氨基酸序列的直向同源物、旁系同源物或同源物的核酸的剪接变体。
优选的剪接变体是由SEQ ID NO:40所代表的核酸的剪接变体,或是编码SEQ ID NO:41的直向同源物或旁系同源物的核酸的剪接变体。优选地,由所述剪接变体编码的氨基酸序列包含如本文中定义的任意一个或多个基序或结构域。优选地,由所述剪接变体编码的氨基酸序列编码这样的氨基酸序列,当在构建Lsm系统发生树(如图10中所绘制的一个系统发生树)中使用时,所述氨基酸序列倾向于在与1类至8类进化支中任意类进化支对应的进化支内聚类,或备选地,该氨基酸序列倾向于与包含由SEQ IDNos 41、43、45、47、49、51、53、55、57、59和61所代表的氨基酸序列的任意代表性Lsm蛋白聚类,而不偏离于前述SEQ ID Nos聚类。
在本发明方法中使用的另一种核酸变体是编码如上文所定义的Lsm蛋白的等位变体。等位变体天然存在,并且在本发明的方法中包括这些天然等位基因的用途。在本发明方法中使用的等位变体基本上具有与表G中给出的任意Lsm蛋白的相同生物学活性。在SEQ ID NO:80中提供作为SEQ ID NO:40的等位变体的实例。
根据本发明,提供了用于增强植物中产量相关性状的方法,包括在植物中导入并表达在实施例11的表G中给出的任一核酸序列的等位变体,或包括在植物中导入并表达编码在实施例11的表G中所给出任一氨基酸序列的直向同源物、旁系同源物或同源物的核酸的等位变体。
优选地,所述等位变体是SEQ ID NO:40的等位变体,或是编码SEQID NO:41的直向同源物或旁系同源物的核酸的等位变体。优选地,由所述等位变体编码的氨基酸序列包含如本文中定义的任意一个或多个基序或结构域。优选地,由所述等位变体编码的氨基酸序列为这样的氨基酸序列,当在构建Lsm系统发生树(如图10中所绘制的一个系统发生树)中使用时,所述氨基酸序列倾向于在与1类至8类进化支中任意类进化支对应的进化支内聚类,或备选地,该氨基酸序列倾向于与包含由SEQ ID Nos41、43、45、47、49、51、53、55、57、59和61所代表的氨基酸序列的任意代表性Lsm蛋白聚类,而不偏离于前述SEQ ID Nos聚类。
在本发明方法中使用的其他核酸变体是通过基因改组获得的核酸变体。基因改组或定向进化也可以用来产生编码如上文定义的Lsm蛋白的核酸的变体。
根据本发明,提供了用于增强植物中产量相关性状的方法,包括在植物中导入并表达在实施例11的表G中给出的任一核酸序列的变体,或包括在植物中导入并表达核酸的变体,所述的核酸编码在实施例11的表G中给出的任一氨基酸序列的直向同源物、旁系同源物或同源物,其中所述的变异核酸通过基因改组获得。
优选地,通过基因改组获得的变异核酸编码了包含如本文定义的任意一个或多个基序或结构域的氨基酸序列。优选地,由通过基因改组获得的变异核酸所编码的氨基酸序列在构建Lsm系统发生树(如图10中描述的系统发生树)中使用时,倾向于在与1类至8类进化支中任意类进化支对应的进化支内聚类,或备选地,该氨基酸序列倾向于与包含由SEQ ID Nos41、43、45、47、49、51、53、55、57、59和61所代表的氨基酸序列的任意代表性Lsm蛋白聚类,而不偏离于前述SEQ ID Nos聚类。
另外,核酸变体也可以通过位点定向诱变获得。几种方法可用于实现位点定向诱变,最常见的是基于PCR的方法(Current Protocols inMolecular Biology.Wiley编辑)。
编码Lsm蛋白的核酸可以衍生自任何天然来源或人工来源。该核酸可以通过人类有意操作,在组成和/或基因组环境方面从其天然形式中修饰而来。优选地,编码Lsm蛋白的核酸来自植物,进一步优选来自双子叶植物,更优选来自十字花科(Brassicaceae),所述核酸最优选地来自拟南芥。
本文中任一谈及的Lsm蛋白因此意指如上定义的Lsm蛋白,编码这种Lsm蛋白的任意核酸适用于实施本发明的方法。
本发明也包括可由本发明方法获得的植物或其部分(包括种子)。所述植物或其部分包含编码如上文定义的Lsm蛋白的核酸转基因。
本发明也提供基因构建体和载体以促进在植物中导入和/或表达在本发明方法中使用的核酸序列。所述基因构建体可以插入适于转化至植物并适于在转化细胞中表达目的基因的载体,所述载体可以是市售的。本发明也提供如本文中定义的基因构建体在本发明方法中的用途。
更具体地,本发明提供构建体,其包含
(a)编码如上文定义的Lsm蛋白的核酸;
(b)能够驱动(a)的核酸序列表达的一个或多个调控序列;和任选地
(c)转录终止序列。
由以上(a)的核酸编码的Lsm蛋白具有这样的氨基酸序列,所述氨基酸序列以增加的优选顺序与选自SEQ ID Nos 120,121,122,123,124,125,126,127,128,129和130的序列具有至少50%、60%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性。
优选地,以上(a)的核酸是:
(a)SEQ ID No.:82,84,86,88,90,92,94,96,98,100,102,104,106,108,110,112,114和116的任意核酸或
(b)核酸,其能够在严格条件下与(i)中给出的任一核酸或具有在(i)中给出的任意核酸的互补序列的核酸杂交。
植物用包含目的序列(即编码如本文中定义的Lsm多肽的核酸)的载体转化。技术人员非常了解必须存在于所述载体上以便成功转化、选择和增殖含有目的序列的宿主细胞的遗传元件。所述目的序列有效地与一个或多个调控序列(至少与启动子)连接。
有利地,任意类型的启动子可以用来驱动所述核酸序列的表达。
所述启动子可以是组成型启动子或器官特异性或组织特异性启动子或细胞特异性启动子。
优选地,Lsm核酸或其变体有效地与种子特异性启动子连接。优选地,所述种子特异性启动子是WSI18启动子,或功能等效的启动子。更优选地,所述启动子序列如SEQ ID NO:161或SEQ ID NO:164所代表。应当明白本发明的应用不限于由SEQ ID NO:40代表的Lsm核酸,本发明的应用也不限于Lsm核酸在受种子特异性启动子驱动时的表达。也可以用来驱动Lsm核酸表达的其他种子特异性启动子的实例在定义部分显示。
其它的调节元件可以包括转录增强子和翻译增强子。本领域技术人员将知道可能适用于实施本发明的终止子和增强子序列。如定义部分中描述,内含子序列也可以添加至5′非翻译区(UTR)或编码序列中,以增加聚集在细胞质内的成熟信使的量。(除启动子、增强子、沉默子、内含子序列、3’UTR和/或5’UTR区域之外的)其他调控序列可以是蛋白质/或RNA稳定元件。此类序列将是已知的或可以由本领域技术人员轻易获得。
本发明的基因构建体还可以包括为在特定细胞类型中维持和/或复制所需要的复制起点序列。一个实例是当基因构建体需要作为游离型遗传元件(例如质粒或粘粒分子)维持在细菌细胞中时的复制起点。优选的复制起点包括但不限于f1-ori和colE1。
为检测如在本发明方法中使用的核酸序列的成功转移和/或选择包含这些核酸的转基因植物,有利的是使用标记基因(或报道基因)。因此,所述基因构建体可以任选地包含选择标记基因。选择标记在本文的“定义”部分中更详细地描述。一旦不再需要所述标记基因时,它们可以从转基因细胞中移出或切除。用于移出标记的技术是本领域已知的,有用技术在上文定义部分中描述。
本发明也提供用于产生转基因植物的方法,所述转基因植物相对于对照植物而言,具有增强的产量相关性状,其中所述方法包括在植物中导入并表达编码如上文所定义的Lsm蛋白的任意核酸。
更具体地,本发明提供用于产生具有增强的产量相关性状的转基因植物的方法,所述方法包括:
(a)在植物或植物细胞中导入并表达Lsm核酸或其变体;和
(b)在促进植物生长和发育的条件下培养植物细胞。
所述核酸可以直接导入植物细胞或导入植物自身(包括导入组织、器官或植物的任何其他部分)。根据本发明的优选特征,该核酸优选地通过转化作用导入植物。术语“转化”在本文的“定义”部分中更详细地描述。
经遗传修饰的植物细胞可以通过技术人员熟悉的所有方法再生。合适的方法可以在上文提及的S.D.Kung和R.Wu,Potrykus或
Figure G2008800037051D00741
和Willmitzer的出版物中找到。
通常在转化后,对植物细胞或细胞群体选择一个或多个标记的存在性,其中所述标记由随同目的基因一起共转移的植物可表达基因编码,随后将转化材料再生成完整植物。为了选择转化植物,在所述转化中获得的植物材料原则上经历选择性条件,从而转化植物可以与非转化植物区分。例如,可以将以上述方式获得的种子播种,并且在初始培育时间后,通过喷洒进行合适的选择。另一种可能性在于(根据需要)消毒后,在使用合适选择剂的琼脂板上培育种子,从而仅转化的种子可以长成植物。或者,对所述转化植物筛选选择标记(如上文所述的选择标记)的存在性。
在DNA转移和再生后,推定转化的植物也可以例如使用DNA印迹分析对目的基因的存在性、拷贝数和/或基因组构造进行评价。备选地或额外地,新导入的DNA的表达水平可以使用RNA印迹分析和/或蛋白质印迹分析或这两种分析法监测,这两项技术均是本领域普通技术人员熟知的。
产生的转化植物可以通过多种方法繁殖,如通过克隆繁殖法或经典育种技术。例如,第一世代(或T1)转化植物可以进行自交并且选择纯合的第二世代(或T2)转化体,并且T2植物随后可以通过经典育种技术进一步繁殖。
产生的转化生物可以采取多种形式。例如,它们可以是转化细胞和非转化细胞的嵌合体;克隆性转化体(例如,被转化以含有表达盒的全部细胞);转化组织和非转化组织的移植体(例如在植物中,与未转化接穗嫁接的转化根状茎)。
本发明明确地扩展至由本文中所述的任意方法产生的任意植物细胞或植物,并扩展至全部植物部分及其繁殖体。本发明进一步扩展以包括已经由前述任意方法产生的原代转化或转染细胞、组织、器官或完整植物的后代,唯一要求是后代表现与如本发明方法中的亲代相同的基因型和/或表型特征。
本发明也包括含有编码如上文所定义的Lsm蛋白的分离核酸的宿主细胞。本发明的优选宿主细胞是植物细胞。
在本发明方法中所用核酸或载体、表达盒或构建体或载体的宿主植物原则上有利地是能够合成在本发明方法中所使用多肽的全部植物。
本发明也扩展至植物的可收获部分如,但不限于种子、叶、果实、花、茎、根状茎、块茎和球茎。本发明进一步涉及了衍生自、优选直接衍生自此种植物的可收获部分的产品,如干燥颗粒或粉末、油、脂肪和脂肪酸、淀粉或蛋白质。
根据本发明的优选特征,受调节的表达是提高的表达。
如上所述,用于调节(优选地提高)编码Lsm蛋白的核酸表达的优选方法是通过在植物中导入并表达编码Lsm蛋白的核酸;然而,实施本方法的效果,即增强产量相关性状,也可以使用其他熟知技术实现,并且在定义部分中提供了例子。
如上所述,用于调节(优选地提高)编码Lsm多肽的核酸表达的优选方法是通过在植物中导入并表达编码Lsm多肽的核酸;然而,实施本方法的效果,即增强产量相关性状,也可以使用其他熟知技术实现,所述的其他熟知技术包括但不限于T-DNA活化标签技术、TILLING、同源重组法。在定义部分中提供了对这些技术的描述。
本发明方法的实施产生了具有增强的产量相关性状的植物。本文谈及的增强的产量相关性状意指植物的一个或多个部分的生物量(重量)增加,所述的部分可以包括地上(可收获的)部分和/或(可收获的)地下部分。
尤其,此类可收获部分是种子,并且本发明方法的实施产生了相对于合适对照植物的种子产量而言,具有提高的种子产量的植物。
以谷物(corn)为例,产量提高可以表现为以下一个或多个指标:每公顷或英亩已建立的植物数目增加,每株植物穗(ear)数的提高,行数、每行核粒数、核粒重、千粒核重、穗长度/直径的提高,种子充实率(即充实种子数除以种子总数并乘以100)提高,及其他。以稻为例,产量提高可以自身表现为下列一种或多种指标的提高:每公顷或英亩植物数、每株植物的花序(panicle)数、每花序的小穗数、每花序的花(小花)数目(其表达为充实种子数对原发花序(primary panicle)数的比)、种子充实率的提高(其中种子充实率是充实种子数除以种子总数并乘以100)、千粒核重提高及其他。
由于本发明的转基因植物具有提高的产量,故相对于对照植物的生长速率,这些植物有可能在其生活周期的对应阶段上表现提高的生长速率(在其生活周期的至少部分期间)。提高的生长速率可以是植物的一个或多个部分(包括种子)特异的,或可以基本上遍及整个植物。生长速率提高的植物可以具备较短的生活周期。植物的生活周期可以意指从干燥成熟种子成长至植物已经产生与起始材料相似的干燥成熟种子的阶段所需要的时间。这个生活周期可以受以下因素影响,如早期生长势、生长速率、绿度指数、开花时间和种子成熟速度。生长速率的提高可以在植物生活周期的一个或多个阶段上或在整个植物生活周期期间发生。植物生活周期早期中提高的生长速率在可以反映增强的生长势。生长速率的提高可以改变植物的收获周期,从而导致植物较晚播种和/或较早收获,而这本来是不可能的(相似效果可以随较早的开花时间获得)。若生长速率充分提高,则可以允许进一步播种相同植物物种的种子(例如播种并收获稻植物,随后播种并收获其他稻植物,全部稻植物均出于一个常规生长时期中)。类似地,若生长速率充分地提高,可以允许进一步播种不同植物物种的种子(例如播种并收获谷物植物,随后例如播种并任选收获大豆、马铃薯或任何其他合适植物)。在一些作物植物的例子中,来自相同根状茎的额外收获次数也可以是可能的。改变植物的收获周期可以导致每英亩一年生物量生产提高(原因在于可以培育并收获任何具体植物的次数(即在一年中)提高)。生长速率的提高也可以允许转基因植物在比其野生型对应物更广泛的地理区域内培育,因为培育作物的地域限制往往由栽种时节(早季)或在收获时期(晚季)的不利环境条件所决定。这类不利条件可以避开,若缩短收获周期。生长速率可以通过从生长曲线获得多个参数而确定,此类参数可以是:T-Mid(植物达到其50%最大尺寸所花费的时间)和T-90(植物达到其50%最大尺寸所花费的时间),以及其他。
根据本发明的优选特征,本发明方法的实施产生了相对于对照植物而言,具有提高的生长速率的植物。因此,根据本发明,提供了用于提高植物生长速率的方法,所述方法包括调节、优选提高植物中编码如本文中定义的Lsm蛋白的核酸表达。
与对照植物相比较,当所述植物处于非胁迫条件下或当植物暴露于多种胁迫时,是否出现产量和/或生长速率的提高。植物一般通过生长得更慢而应答于胁迫暴露。在严重胁迫条件下,植物甚至可以完全停止生长。另一方面,轻度胁迫在本文中定义为植物所暴露的任何下述胁迫,其中所述的胁迫未导致植物完全停止生长,且没有再继续生长的能力。与非胁迫条件下的对照植物相比较,轻度胁迫在本发明意义中导致受胁迫植物的生长降低小于40%、35%或30%、优选地小于25%、20%或15%、更优选地小于14%、13%、12%、11%或10%或更低。由于农业实践(灌溉、施肥、杀虫剂处理)的进步,在栽培作物植物中并不经常遇到严重胁迫。因此,由轻度胁迫诱导的受损生长对于农业往往是不受欢迎的特征。轻度胁迫是植物所暴露的常见生物和/或非生物性(环境)胁迫。非生物胁迫可以因干旱或过量的水、缺氧胁迫、盐胁迫、化学毒性、氧化胁迫和热、寒冷或冰冻温度所致。非生物胁迫可以是因水胁迫(尤其因为干旱)、盐胁迫、氧化胁迫或离子胁迫引起的渗透胁迫。生物胁迫一般是由病原体如细菌、病毒、线虫、真菌和昆虫引起的那些胁迫。
尤其,本发明的方法可以在非胁迫条件或轻微干旱条件下开展以产生相对于对照植物具有提高的产量的植物。如Wang等(Planta(2003)218:1-14)中报道,非生物胁迫导致一系列不利地影响植物生长及生产量的形态学、生理学、生物化学和分子变化。干旱、盐度、极端温度和氧化胁迫已知是相互联系的并可以通过相似机制诱导生长损害及细胞损害。Rabbani等(Plant Physiol(2003)133:1755-1767)描述了干旱胁迫与高盐度胁迫间极高程度的“交互作用”。例如,干旱和/或盐化作用主要地表现为渗透胁迫,从而导致细胞内稳态和离子分布的破坏。经常伴随高温或低温、盐度或干旱胁迫的氧化胁迫可以造成功能性蛋白和结构蛋白变性。因此,这些多样的环境胁迫常常激活相似的细胞信号途径和细胞应答,如产生胁迫蛋白、上调抗氧化物质、积累兼容性溶质和生长停滞。如本文中所用的术语“非胁迫”条件是允许植物最佳生长的环境条件。本领域技术人员清楚对于给定地点的正常土壤条件和气候条件。
本发明方法的实施产生了相对于在可比较条件下生长的合适对照植物,在非胁迫条件或轻微干旱条件下生长的提高了产量的植物。因此,根据本发明,提供了用于在非胁迫条件或轻微干旱条件下生长的植物中提高产量的方法,所述方法包括提高植物中编码Lsm多肽的核酸的表达。
本发明方法的实施产生了相对于在可比较条件下生长的对照植物而言,在营养素缺乏条件下、尤其在氮缺乏条件下培育的具有提高产量的植物。因此,根据本发明,提供了用于在营养缺乏条件下培育的植物中提高产量的方法,所述方法包括调节植物中编码Lsm多肽的核酸表达。营养缺乏可以因营养素如氮、磷酸盐和其他含磷化合物、钾、钙、镉、镁、锰、铁和硼及其他元素缺少所致。
在本发明的一个优选实施方案中,产量和/或生长速率的提高在非胁迫条件下发生。
在本发明的另一个优选实施方案中,在轻微干旱条件下观察到增强的产量相关性状,最优选地,所述干旱条件是根据实施例18中描述的浇水方案2。
本发明的方法有利地适用于任意植物。
如本文中所用的术语“植物”包括完整植物、植物的祖先及后代和包括种子、苗、茎、叶、根(包括块茎)、花和组织与器官在内的植物部分,其中每种前述对象包含目的基因/核酸。术语“植物”也包括植物细胞、悬浮培养物、愈伤组织、胚、分生组织区、配子体、孢子体、花粉和小孢子,同样每种前述对象包含目的基因/核酸。
在本发明方法中特别有用的植物包括属于植物界(Viridiplantae)超家族、尤其单子叶和双子叶植物的全部植物,包括饲用或饲料豆科植物、观赏植物、粮食作物、树或灌木。根据本发明的一个优选实施方案,所述植物是作物植物。作物植物的实例包括大豆、向日葵、卡诺拉油菜、苜蓿、油菜、棉花、番茄、马铃薯和烟草。还优选地,所述植物是单子叶植物。单子叶植物的实例包括甘蔗。更优选地,所述植物是谷物植物。谷物植物的实例包括稻、玉米、小麦、大麦、谷子、黑麦、高粱、二粒小麦、斯卑尔脱小麦、黑麦属、单粒小麦、埃塞俄比亚画眉草、买罗高粱和燕麦。
本发明也扩展至植物的可收获部分如,但不限于种子、叶、果实、花、茎、根状茎、块茎和球茎。本发明进一步涉及了衍生自、优选直接衍生自此种植物的可收获部分的产品,如干燥颗粒或粉末、油、脂肪和脂肪酸、淀粉或蛋白质。
本发明也提供了迄今未知的Lsm核酸和Lsm蛋白,这些序列也在实施本发明方法中使用。
根据本发明的又一实施方案,提供了分离的核酸分子,其包含:
(i)由SEQ ID NO:82,SEQ ID NO:84,SEQ ID NO:86SEQ ID NO:88,SEQ ID NO:90,SEQ ID NO:92,SEQ ID NO:94,SEQ ID NO:96,SEQ ID NO:98,SEQ ID NO:100,SEQ ID NO:102,SEQ ID NO:104,SEQ ID NO:106,SEQ ID NO:108,SEQ ID NO:110,SEQ ID NO:112,SEQ ID NO:114或SEQ ID NO:116所代表的核酸;
(ii)在(i)中给出的任一SEQ ID NO的互补物;
(iii)编码Lsm蛋白的核酸,所述的Lsm蛋白以增加的优选顺序与SEQID NO:83,SEQ ID NO:85,SEQ ID NO:87,SEQ ID NO:89,SEQ ID NO:91,SEQ ID NO:93,SEQ ID NO:95,SEQ ID NO:97,SEQ ID NO:99,SEQ ID NO:101,SEQ ID NO:103,SEQ ID NO:105,SEQ ID NO:107,SEQ ID NO:109,SEQ ID NO:111,SEQ ID NO:113,SEQ ID NO:115,SEQ ID NO:117中给出的任一氨基酸序列具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性;
(iv)能够在严格条件下与以上(i),(ii)或(iii)中给出的任一核酸杂交的核酸。
根据本发明的又一实施方案,提供了分离的多肽,其包含:
(i)由SEQ ID NO:83,SEQ ID NO:85,SEQ ID NO:87,SEQ ID NO:89,SEQ ID NO:91,SEQ ID NO:93,SEQ ID NO:95,SEQ ID NO:97,SEQ ID NO:99,SEQ ID NO:101,SEQ ID NO:103,SEQ ID NO:105,SEQ ID NO:107,SEQ ID NO:109,SEQ ID NO:111,SEQ ID NO:113,SEQ ID NO:115,SEQ ID NO:117任一序列所代表的氨基酸序列;
(ii)氨基酸序列,其以增加的优选顺序与SEQ ID NO:83,SEQ ID NO:85,SEQ ID NO:87,SEQ ID NO:89,SEQ ID NO:91,SEQ ID NO:93,SEQ ID NO:95,SEQ ID NO:97,SEQ ID NO:99,SEQ ID NO:101,SEQID NO:103,SEQ ID NO:105,SEQ ID NO:107,SEQ ID NO:109,SEQ IDNO:111,SEQ ID NO:113,SEQ ID NO:115,SEQ ID NO:117中给出的任一氨基酸序列具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性;
(iii)以上(i)或(ii)中给出的任一氨基酸序列的衍生物。
本发明也包括编码本文中所述的Lsm蛋白的核酸和这些Lsm蛋白在增强植物中产量相关性状中的用途。
编码本文中所述的Lsm蛋白的核酸或Lsm蛋白自身可以用于育种程序中,在所述育种程序中鉴定到可以遗传地与编码Lsm蛋白的基因连接的DNA标记。所述核酸/基因或Lsm蛋白自身可以用来定义分子标记。这种DNA或蛋白质标记随后可以在育种程序中用来在本发明的方法中选择具有如上文所定义的增强的产量相关性状的植物。
编码Lsm蛋白的核酸/基因的等位变体也可以用于标记辅助的育种程序中。这种育种程序有时需要使用例如EMS诱变法通过对植物进行诱变处理而导入等位变异;备选地,该程序可以从收集并非故意造成的所谓“自然”源性等位变体开始。随后进行等位变体的鉴定,例如通过PCR法。此后是步骤:选择所讨论和导致产量提高的序列的优异等位变体。选择一般通过监测含有所讨论序列的不同等位变体的植物的生长性能而实施。生长性能可以在温室或在田间监测。其他任选步骤包括使其中鉴定到优异等位变体的植物与另一种植物杂交。这可能用来例如产生感兴趣的表型特征组合。
编码Lsm蛋白的核酸也可以作为探针用于遗传地或物理地绘制所述探针构成其一部分的基因并且作为标记用于与这些基因连锁的性状。此类信息可以用于植物育种,旨在开发具有所希望表型的品系。编码Lsm蛋白的核酸的这种用途仅需要具有至少15个核苷酸长度的核酸序列。编码Lsm蛋白的核酸可以用作限制性片段长度多态性(RFLP)标记。限制性消化的植物基因组DNA的DNA印迹物(Sambrook J,Fritsch EF和Maniatis T(1989)Molecular Cloning,A Laboratory Manual)可以用编码Lsm蛋白的核酸探测。所得的结合图式随后可以使用计算机程序如MapMaker(Lander等(1987)Genomics 1:174-181)进行遗传分析以构建遗传图。此外,该核酸可以用来探测含有一组个体的限制性核酸内切酶处理的基因组DNA的DNA印迹物,其中所述的一组个体代表具有定义的遗传杂交的亲代和后代。标出DNA多态性的分离并用来计算编码Lsm蛋白的核酸在先前使用这个群体获得的遗传图中的位置(Botstein等(1980)Am.J.Hum.Genet.32:314-331)。
在Bernatzky和Tanksley(1986)Plant Mol.Biol.Reporter 4:37-41中描述了植物基因来源的探针的产生及其在遗传作图中的用途。众多出版物描述了使用以上所提及的方法学或其改良法对特定cDNA克隆的遗传作图。例如,F2互交群、回交群、随机交配群、邻近纯合系和其他个体群体可以用于作图。此类方法学是本领域技术人员熟知的。
所述核酸探针也可以用于物理作图(即序列在物理图上的排列;见Hoheisel等在:Non-mammalian Genomic Analyasis:A Practical Guide,Academic press 1996,第319-346页及其中引用的参考文献)。
在另一实施方案中,核酸探针可以在直接荧光原位杂交(FISH)作图法(Trask(1991)Trends Genet.7:149-154)中使用。尽管当前的FISH作图法支持使用大的克隆(几个kb至几百个kb;见Laan等(1995)Genome Res.5:13-20),然而灵敏度的改善可以允许使用更短探针进行FISH作图。
用于遗传作图及物理作图的多种基于核酸扩增的方法可以使用所述核酸而实施。方法实例包括等位基因特异性扩增法(Kazazian(1989)J.Lab.Clin.Med 11:95-96)、PCR扩增片段的多态性(CAPS;Sheffield等(1993)Genomics 16:325-332)、等位基因特异性连接(Landegren等(1988)Science241:1077-1080)、核苷酸延伸反应(Sokolov(1990)Nucleic Acid Res.18:3671)、放射杂交作图(Walter等(1997)Nat.Genet.7:22-28)和Happy作图法(Dear和Cook(1989)Nucleic Acid Res.17:6795-6807)。对于这些方法,使用一种核酸的序列来设计并产生用于扩增反应或引物延伸反应中的引物对。此类引物的设计是本领域技术人员熟知的。在使用基于PCR遗传作图的方法中,可能需要在对应于当前核酸序列的区域中鉴定作图交叉的亲代之间的DNA序列差异。然而,这通常对作图法而言不是必需的。
本发明方法产生了具有如前文所述提高的产量的植物。这些性状也可以与经济上有利的其他性状组合,如其他的产量增强性状、针对其他非生物胁迫和生物胁迫的耐受性、调节多种构造性特征和/或生物化学特征和/或生理学特征的性状。
III.截短的细胞周期蛋白H
根据第一实施方案,本发明提供相对于对照植物用于增强植物中产量相关性状的方法,包括调节植物中编码截短的细胞周期蛋白H多肽(此后也称作CycHTr)的核酸表达。
用于调节(优选提高)编码CycHTr多肽的核酸表达的优选方法是在植物中导入并表达编码CycHTr多肽的核酸。
下文任一谈及的“在本发明方法中使用的蛋白质”意指如本文中定义的CYCHTR多肽。该术语也包括为产生如下所述截短形式所使用的细胞周期蛋白H多肽。下文任一谈及的“在本发明方法中使用的核酸”意指这样的核酸,所述核酸能够编码这种CYCHTR多肽或编码为产生如下所述截短形式所使用的细胞周期蛋白H多肽。待导入植物(并且因而在实施本发明方法中使用)的核酸是编码现在所描述的蛋白质类型的任意核酸,此后也称作“CycHTR核酸”或“CycHTR基因”。
细胞周期蛋白H多肽是一般结合并活化CDK-激活激酶(CAK)的蛋白质。据报道细胞周期蛋白H包含2个特征性α螺旋结构域,每个α螺旋结构域含有5个螺旋(称作H1-H5和H1’-H5’)和氨基端和羧基端螺旋(Hn和Hc,见图13)(Andersen等,EMBO Journal 16,958-967,1997)。细胞周期蛋白H包含特征性细胞周期蛋白盒(图13)、存在于全部细胞周期蛋白中的结构域;另外,CycH优选地还包含保守的基序1(L/V/I)(Q/R)(E/D)VCXAF(SEQ ID NO:169)。
“CycH多肽”也可以定义为与SEQ ID NO:173以增加的优选顺序具有至少20%、25%、30%、35%、40%、45%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%,89%、90%、91%、92%、93%、94%、95%96%、97%、98%、99%或更大序列同一性的细胞周期蛋白。
此外,细胞周期蛋白(至少在其天然形式中)可以具有CDK-结合活性。据报道CycH尤其结合并活化CAK蛋白。用于测量蛋白质-蛋白质相互作用(包括双杂交测定法)和用于测量激酶活性(尤其CAK活性)的手段和技术是本领域熟知的,其他细节见实施例25。
本发明的方法使用截短的细胞周期蛋白H。cycH的有用截短形式是仍能够与CAK结合但不能激活CAK的那些截短形式。测量cycH结合作用和CAK激活作用的指南可以在Andersen等(1997)中找到。优选地,截短的细胞周期蛋白H至少缺少Hc螺旋结构域,截短的细胞周期蛋白H进一步优选还缺少H5’螺旋结构域,更优选地,截短的细胞周期蛋白H缺少Hc、H5’和H4’螺旋。在具体实施方案中,与全长细胞周期蛋白H蛋白质序列相比较,截短的细胞周期蛋白H以缺少螺旋H3’、H4’、H5’和Hc为特征。优选地,截短的cycH是如SEQ ID NO:166所代表。然而,如Andersen等(1997)所概述,缺失其他螺旋结构域也导致CAK激活活性丧失。术语“截短的细胞周期蛋白H”或“CycHTr”也包括这些缺失变体并且在本发明方法中同等地使用。
优选地,在构建系统发生树(如图15中所绘制的系统发生树)时使用的多肽序列与包含由SEQ ID NO:166或SEQ ID NO:173所代表的氨基酸序列的CycH多肽组而不与任何其他组聚类。
术语“结构域”和“基序”在本文中的“定义”部分定义。存在用于鉴定结构域的专业数据库,例如,SMART(Schultz等(1998)Proc.Natl.Acad.Sci.USA 95,5857-5864;Letunic等(2002)Nucleic Acids Res 30,242-244)、InterPro(Mulder等,(2003)Nucl.Acids.Res.31,315-318)、Prosite(Bucher和Bairoch(1994),用于生物分子序列基序的概括特征结构及其在自动化序列解读中的功能(A generalized profile syntax for biomolecular sequencesmotifs and its function in automatic sequence interpretation).(在)ISMB-94;第二届分子生物学智能系统国际会议文集.Altman R.,BrutlagD.,Karp P.,Lathrop R.,Searls D.编辑,第53-61页,AAAIPress,MenloPark;Hulo等,Nucl.Acids.Res.32:D134-D137,(2004)或Pfam(Bateman等,Nucleic Acids Research 30(1):276-280(2002))。一组用于计算机方式分析蛋白质序列的工具可在ExPASY蛋白质组服务器上获得(瑞士生物信息研究所维护(Gasteiger等,ExPASy:深入认识和分析蛋白质的蛋白质组服务器,Nucleic Acids Res.31:3784-3788(2003))。结构域也可以使用常规技术如通过序列比对进行鉴定。
分析SMART数据库中SEQ ID NO:166的多肽序列,揭示存在细胞周期蛋白盒,SMART登录号为SM00385(见图13)。
用于比对序列以进行比较的方法是本领域熟知的,此类方法包括GAP、BESTFIT、BLAST、FASTA和TFASTA。GAP使用Needleman和Wunsch算法((1970)J Mol Biol 48:443-453)以找到使匹配数最大化并使空位数最小化的两个序列的总体(即覆盖完整序列的)比对结果。BLAST算法(Altschul等(1990)J Mol Biol 215:403-10)计算序列同一性百分数并在两个序列之间开展相似性的统计分析。用于执行BLAST分析的软件是通过国家生物技术信息中心(NCBI)可公开获得的。同源物可以使用例如ClustalW多重序列比对算法(1.83版本),以默认配对比对参数和百分数评分方法轻易地鉴定。相似性和同一性的总体百分数也可以使用MatGAT软件包中的可用方法之一确定(Campanella等,BMC Bioinformatics.2003年7月10日;4:29.MatGAT:使用蛋白质序列或DNA序列产生相似性/同一性矩阵的一种应用)。如本领域技术人员显而易见,可以进行少许手工编辑以优化保守基序之间的比对结果。此外,作为使用全长序列以鉴定同源物的替代,也可以使用特定结构域。对于局部比对,Smith-Waterman算法是特别有用的(Smith TF,Waterman MS(1981)J.Mol.Biol 147(1);195-7)。在下文实施例3中表述为百分数的序列同一性值利用上文提及的程序,使用默认参数在完整核酸或氨基酸序列范围和/或在所选择的结构域或保守基序范围内确定。
本发明通过用核酸序列转化植物进行说明,其中所述的核酸序列由编码SEQ ID NO:166的多肽序列的SEQ ID NO:165代表。然而,本发明的实施不限于这些序列;本发明的方法可以有利地使用如本文中定义的编码CycH的任意核酸的截短形式或CycH多肽实施。
编码CycH多肽的核酸的实例在本文实施例20的表K中给出。此类核酸在实施本发明方法中用于产生截短形式的细胞周期蛋白H。在实施例20的表K中给出的氨基酸序列是由SEQ ID NO:173所代表的CycH多肽的直向同源物和旁系同源物的示例序列,术语“直向同源物”和“旁系同源物”如本文中定义。其他直向同源物和旁系同源物可以通过开展所谓交互性blast搜索轻易地鉴定。通常,这包括第一BLAST,其中所述的第一BLAST包括将查询序列进行BLAST(例如使用实施例20的表K中列出的任意序列)针对任意序列数据库,如可公开获得的NCBI数据库进行BLAST。当从核苷酸序列开始时,一般使用BLASTN或TBLASTX(使用标准默认值),并且当从蛋白质序列开始时,使用BLASTP或TBLASTN(使用标准默认值)。可以任选地筛选BLAST结果。筛选结果或非筛选结果的全长序列随后针对来自生物的序列进行反向BLAST(第二BLAST),其中所述查询序列从所述生物衍生(在查询序列是SEQ ID NO:172或SEQ ID NO:173的情况下,所述第二BLAST因而将针对拟南芥属植物的序列进行)。随后比较第一BLAST和第二BLAST的结果。若来自第一blast的高阶位命中源自与衍生查询序列的物种相同的物种,则鉴定到旁系同源物,反向BLAST随后理想地在最高命中当中产生该查询序列;若高阶位命中不是源自与衍生查询序列的物种相同的物种,则鉴定到直向同源物,并且优选地在反向BLAST时,在最高命中当中产生该查询序列。
高阶位命中是具有低E-值的那些命中。E-值越低,评分越显著(或换句话说,偶然发现该命中的几率越低)。E-值的计算是本领域熟知的。除了E-值外,也通过同一性百分数评分来进行比较。同一性百分数指两个所比较的核酸(或多肽)序列之间特定长度范围内相同的核苷酸(或氨基酸)的数目。在大型家族的情况下,可以使用ClustalW,随后使用邻接树法,以帮助观察相关基因的聚集和鉴定直向同源物和旁系同源物。
核酸变体也可以用于实施本发明的方法中。术语“同源物”和“衍生物”如本文中定义。此类变体的实例包括编码在实施例20的表K中所给出任一氨基酸序列的同源物和衍生物的核酸,术语“同源物”和“衍生物”如本文中定义。还在本发明方法中使用的是这样的核酸,其编码在实施例20的表K中所给出任一氨基酸序列的直向同源物或旁系同源物的同源物和衍生物。在本发明方法中使用的同源物和衍生物与衍生它们的未修饰蛋白质具有基本上相同的生物学活性和功能活性。
在实施本发明方法中有用的其他核酸变体包括编码CycH多肽的核酸的部分、与编码CycH多肽的核酸杂交的核酸、编码CycH多肽的核酸的剪接变体、编码CycH多肽的核酸的等位变体和通过基因改组获得的编码CycH多肽的核酸的变体。全部这些核酸及其变体可以用来产生编码如上文所述的cycHTr多肽的核酸。术语“杂交序列”、“剪接变体”、“等位变体”和“基因改组作用”如本文中所述。
编码CycH多肽的核酸无需是全长核酸,因为实施本发明方法不依赖于使用全长核酸序列。根据本发明,提供了用于增强植物中产量相关性状的方法,包括在植物中导入并表达实施例20的表K中给出的任一核酸序列的一部分或编码在实施例20的表K中所给出任一氨基酸序列的直向同源物、旁系同源物或同源物的核酸的一部分。优选地,所述部分编码如上文所述的截短的细胞周期蛋白H多肽。
核酸的一部分可以例如通过对所述核酸产生一个或多个缺失而制备。所述部分可以以分离的形式使用或它们可以与其他编码(或非编码)序列融合,例如旨在产生联合几种活性的蛋白质。与其他编码序列融合时,在翻译时所产生的所得多肽可以比对于该蛋白质部分所预测的多肽更大。
在本发明方法中使用的部分编码如本文中定义的CycHTr多肽,并且基本上具有如SEQ ID NO:166的氨基酸序列相同的生物学活性。优选地,此部分是在实施例20的表K中给出的任一核酸的一部分,或是编码在实施例20的表K中所给出任一氨基酸序列的直向同源物或旁系同源物的核酸的一部分。优选地,所述部分的长度以增加的优选顺序是至少100,150,200,250或300个连续核苷酸,所述连续核苷酸是实施例20的表K中给出的任一核酸序列或是编码在实施例20的表K中所给出任一氨基酸序列的直向同源物或旁系同源物的核酸。更优选地,所述部分是SEQ ID NO:172的核酸的一部分,最优选地,所述部分是由SEQ ID NO:165代表的核酸。优选地,所述部分编码包含(本文所定义的任意一个或多个结构域或基序)的氨基酸序列。优选地,所述部分编码这样的氨基酸序列,当在构建系统发生树(如图15中所绘制的一个系统发生树)中使用时,所述氨基酸序列倾向于与包含由SEQ ID NO:166或SEQ ID NO:173所代表的氨基酸序列的CycHTr多肽组而不与任何其他组聚类。
在本发明方法中使用的另一种核酸变体是能够在降低的严格条件下、优选在严格条件下与编码如本文中定义的CycH多肽的核酸或与如本文中定义的部分杂交的核酸。
根据本发明,提供了用于增强植物中产量相关性状的方法,包括在植物中导入并表达能够与实施例20的表K中给出的任一核酸杂交的核酸,或包括在植物中导入并表达这样的核酸,其中所述核酸能够与编码在实施例20的表K中给出的任意核酸序列的直向同源物、旁系同源物或同源物的核酸杂交。优选地,杂交核酸编码如上文所述的截短的细胞周期蛋白H。
在本发明方法中使用的杂交序列编码如本文中定义的CycHTr多肽,并且基本上具有如SEQ ID NO:166的氨基酸序列相同的生物学活性。优选地,所述杂交序列能够与实施例20的表K中给出的任一核酸或与这些序列中任意序列的一部分杂交,所述的一部分如上文定义,或其中所述杂交序列能够与编码在实施例20的表K中给出的任一氨基酸序列的直向同源物或旁系同源物的核酸杂交。最优选地,所述杂交序列能够与如SEQ IDNO:165所代表的核酸或与其一部分杂交。优选地,所述杂交序列编码了包含如本文定义的任意一个或多个基序或结构域的氨基酸序列。优选地,所述杂交序列编码这样的氨基酸序列,当在构建系统发生树(如图15中所绘制的一个系统发生树)中使用时,所述氨基酸序列倾向于与包含由SEQID NO:166或SEQ ID NO:173所代表的氨基酸序列的CycHTr多肽组而不与任何其他组聚类。
在本发明方法中使用的另一种核酸变体是编码如上文所定义的CycH多肽的剪接变体,剪接变体如本文中定义。优选地,所述剪接变体或其部分编码如上文所述的CycHTr多肽。
根据本发明,提供了用于增强植物中产量相关性状的方法,包括在植物中导入并表达在实施例20的表K中给出的任一核酸序列的剪接变体,或导入并表达编码在实施例20的表K中所给出任一氨基酸序列的直向同源物、旁系同源物或同源物的核酸的剪接变体。优选地,所述剪接变体编码如上文所述的如上文所述的截短的细胞周期蛋白H。
优选的剪接变体是编码CycH多肽的截短形式的任一核酸的剪接变体,所述的CycH多肽在实施例20的表K中给出,或下述核酸的剪接变体,所述的核酸编码实施例20的表K中所给出的任一氨基酸序列的截短的直向同源物、旁系同源物或同源物。优选地,由所述剪接变体编码的氨基酸序列包含如本文中定义的CycHTr的任意一个或多个基序或结构域。优选地,由所述剪接变体编码的氨基酸序列在构建系统发生树(如图15中所绘制的一个系统发生树)中使用时,倾向于与包含由SEQ ID NO:166或SEQ ID NO:173所代表的氨基酸序列的CycH多肽组而不与任何其他组聚类。
在本发明方法中使用的另一种核酸变体是编码如上文所定义的CycH多肽的核酸的等位变体,等位变体如本文中定义。优选地,所述等位变体编码如上文所述的截短形式的细胞周期蛋白H。
根据本发明,提供了用于增强植物中产量相关性状的方法,包括在植物中导入并表达编码CycH多肽的截短形式的任一核酸的等位变体,所述的CycH多肽在实施例20的表K中给出,或在植物中导入并表达编码在实施例20的表K中所给出任一氨基酸序列的直向同源物、旁系同源物或同源物的核酸的等位变体。优选地,所述等位变体编码如上文所述的截短的细胞周期蛋白H。
由本发明方法中使用的等位变体编码的多肽基本上具有如SEQ IDNO:166的CycHTr多肽和在实施例20的表K中所述任一氨基酸序列的如上文所述截短形式那样的相同生物学活性。等位变体天然存在,并且在本发明的方法中包括这些天然等位基因的用途。优选地,所述等位变体是SEQ ID NO:165或SEQ ID NO:172的等位变体或编码SEQ ID NO:166或SEQ ID NO:173的直向同源物或旁系同源物的核酸的等位变体。优选地,由所述等位变体编码的氨基酸序列包含如本文中定义的CycHTr的任意一个或多个基序或结构域。优选地,由所述等位变体编码的氨基酸序列在构建系统发生树(如图15中所绘制的一个系统发生树)中使用时,倾向于与包含由SEQ ID NO:166或SEQ ID NO:173所代表的氨基酸序列的CycHTr多肽组而不与任何其他组聚类。
基因改组或定向进化也可以用来产生编码如上文定义的CycHTr多肽的核酸的变体;术语“基因改组”如本文中定义。
根据本发明,提供了用于增强植物中产量相关性状的方法,包括在植物中导入并表达在实施例20的表K中给出的任一核酸序列或其变体的一部分,或包括在植物中导入并表达下述核酸的一部分,其中所述的核酸编码在实施例20的表K中给出的任一氨基酸序列的直向同源物、旁系同源物或同源物,其中所述的核酸通过基因改组获得。优选地,所述部分编码如上文定义的截短的细胞周期蛋白H。
优选地,通过基因改组获得的变异核酸编码了包含如本文定义的任意一个或多个基序或结构域的氨基酸序列。优选地,由通过基因改组获得的变异核酸所编码的氨基酸序列在构建系统发生树(如图15中所绘制的一个系统发生树)中使用时,倾向于与包含由SEQ ID NO:166或SEQ ID NO:173所代表的氨基酸序列的CycH多肽组而不与任何其他组聚类。
另外,核酸变体也可以通过位点定向诱变获得。几种方法可用于实现位点定向诱变,最常见的是基于PCR的方法(Current Protocols inMolecular Biology.Wiley编辑)。
编码CycHTr多肽的核酸可以衍生自任何天然来源或人工来源。该核酸可以通过人类有意操作,在组成和/或基因组环境方面从其天然形式中修饰而来。优选地,编码CycHTr多肽的核酸来自植物,还优选来自双子叶植物,更优选来自十字花科、更优选来自拟南芥属,最优选地来自拟南芥。
本发明方法的实施产生了具有增强的产量相关性状的植物。尤其,本发明方法的实施产生这样的植物,该植物与对照植物相比较,具有提高的产量,尤其增加的生物量和/或提高的种子产量。术语“产量”和“种子产量”在本文的“定义”部分中更详细地描述。
本文谈及的增强的产量相关性状意指植物的一个或多个部分的生物量(重量)增加,所述的部分可以包括地上(可收获的)部分和/或(可收获的)地下部分。尤其,此类可收获部分是种子和/或(营养性)生物量,并且本发明方法的实施产生了相对于对照植物的生物量和种子产量,具有增加的生物量和/或提高的种子产量的植物。
以谷物(corn)为例,产量提高可以表现为以下一个或多个指标:每公顷或英亩已建立的植物数目增加,每株植物穗数的提高,行数、每行核粒数、核粒重、千粒核重、穗长度/直径的提高,种子充实率(即充实种子数除以种子总数并乘以100)提高,及其他。以稻为例,产量提高可以自身表现为下列一种或多种指标的提高:每公顷或英亩植物数、每株植物的花序数、每花序的小穗数、每花序的花(小花)数目(其表达为充实种子数对原发花序数的比)、种子充实率的提高(其中种子充实率是充实种子数除以种子总数并乘以100)、千粒核重提高及其他。
本发明提供相对于对照植物,用于提高植物的产量、尤其是植物的种子产量的方法,所述方法包括调节、优选提高植物中编码如本文中定义的CycHTr多肽的核酸的表达。
由于本发明的转基因植物具有提高的产量,故相对于对照植物的生长速率,这些植物有可能在其生活周期的对应阶段上表现提高的生长速率(在其生活周期的至少部分期间)。除了提高的产量能力之外,提高的营养摄取效率也可能有助于产量提高。观察到本发明的植物在营养摄取方面显示较高的效率。提高的营养摄取效率允许植物在胁迫下较好地生长。
提高的生长速率可以是植物的一个或多个部分(包括种子)特异的,或可以基本上遍及整个植物。生长速率提高的植物可以具备较短的生活周期。植物的生活周期可以意指从干燥成熟种子成长至植物已经产生与起始材料相似的干燥成熟种子的阶段所需要的时间。这个生活周期可以受以下因素影响,如早期生长势、生长速率、绿度指数、开花时间和种子成熟速度。生长速率的提高可以在植物生活周期的一个或多个阶段上或在整个植物生活周期期间发生。植物生活周期早期中提高的生长速率在可以反映增强的生长势。生长速率的提高可以改变植物的收获周期,从而导致植物较晚播种和/或较早收获,而这本来是不可能的(相似效果可以随较早的开花时间获得)。若生长速率充分提高,则可以允许进一步播种相同植物物种的种子(例如播种并收获稻植物,随后播种并收获其他稻植物,全部稻植物均出于一个常规生长时期中)。类似地,若生长速率充分地提高,可以允许进一步播种不同植物物种的种子(例如播种并收获谷物植物,随后例如播种并任选收获大豆、马铃薯或任何其他合适植物)。在一些作物植物的例子中,来自相同根状茎的额外收获次数也可以是可能的。改变植物的收获周期可以导致每英亩一年生物量生产提高(原因在于可以培育并收获任何具体植物的次数(即在一年中)提高)。生长速率的提高也可以允许转基因植物在比其野生型对应物更广泛的地理区域内培育,因为培育作物的地域限制往往由栽种时节(早季)或在收获时期(晚季)的不利环境条件所决定。这类不利条件可以避开,若缩短收获周期。生长速率可以通过从生长曲线获得多个参数而确定,此类参数可以是:T-Mid(植物达到其50%最大尺寸所花费的时间)和T-90(植物达到其50%最大尺寸所花费的时间),以及其他。
根据本发明的优选特征,本发明方法的实施产生了相对于对照植物而言,具有提高的生长速率的植物。因此,根据本发明,提供了用于提高植物生长速率的方法,所述方法包括在植物中调节、优选提高如本文中定义的编码CycHTr多肽的核酸的表达。
与对照植物相比较,当所述植物处于非胁迫条件下或当植物暴露于多种胁迫时,是否出现产量和/或生长速率的提高。植物一般通过生长得更慢而应答于胁迫暴露。在严重胁迫条件下,植物甚至可以完全停止生长。另一方面,轻度胁迫在本文中定义为植物所暴露的任何下述胁迫,其中所述的胁迫未导致植物完全停止生长,且没有再继续生长的能力。与非胁迫条件下的对照植物相比较,轻度胁迫在本发明意义中导致受胁迫植物的生长降低小于40%、35%或30%、优选地小于25%、20%或15%、更优选地小于14%、13%、12%、11%或10%或更低。由于农业实践(灌溉、施肥、杀虫剂处理)的进步,在栽培作物植物中并不经常遇到严重胁迫。因此,由轻度胁迫诱导的受损生长对于农业往往是不受欢迎的特征。轻度胁迫是植物所暴露的常见非生物性(环境)胁迫。非生物胁迫可以因干旱或过量的水、缺氧胁迫、盐胁迫、化学毒性、氧化胁迫和热、寒冷或冰冻温度所致。非生物胁迫可以是因水胁迫(尤其因为干旱)、盐胁迫、氧化胁迫或离子胁迫引起的渗透胁迫。
非生物性环境胁迫的另一个实例是需要由所述植物同化以生长和发育的一种或多种营养的可获量降低。因为营养可获量强烈地影响植物产量和产品品质,故将大量肥料倾注至田中以优化植物产量和产品品质。植物的生产量通常受三种主要营养素,即磷、钾和氮限制,这三种营养素中,氮通常是是植物生长的限速性元素。因此,植物生长所需的主要营养元素是氮(N)。氮是活细胞中存在的众多重要化合物的组成成分,所述的重要化合物包括氨基酸、蛋白质(酶)、核酸和叶绿素。植物干物质的1.5%-2%是氮和植物总蛋白的大约16%是氮。因此,氮可获量是作物植物生长和生产的主要限制性因素(Frink等(1999)Proc Natl Acad Sci USA 96(4):1175-1180),并且也对蛋白质聚集和氨基酸组成也有明显影响。因此,在氮限制性条件下培育时具有提高产量的植物是具有重大意义的。
生物胁迫一般是由病原体如细菌、病毒、线虫、真菌和昆虫引起的那些胁迫。
尤其,本发明的方法可以在非胁迫条件或轻微干旱条件下开展以产生相对于对照植物具有提高的产量的植物。如Wang等(Planta(2003)218:1-14)中报道,非生物胁迫导致一系列不利地影响植物生长及生产量的形态学、生理学、生物化学和分子变化。干旱、盐度、极端温度和氧化胁迫已知是相互联系的并可以通过相似机制诱导生长损害及细胞损害。Rabbani等(Plant Physiol(2003)133:1755-1767)描述了干旱胁迫与高盐度胁迫间极高程度的“交互作用”。例如,干旱和/或盐化作用主要地表现为渗透胁迫,从而导致细胞内稳态和离子分布的破坏。经常伴随高温或低温、盐度或干旱胁迫的氧化胁迫可以造成功能性蛋白和结构蛋白变性。因此,这些多样的环境胁迫常常激活相似的细胞信号途径和细胞应答,如产生胁迫蛋白、上调抗氧化物质、积累兼容性溶质和生长停滞。如本文中所用的术语“非胁迫”条件是允许植物最佳生长的环境条件。本领域技术人员清楚对于给定地点的正常土壤条件和气候条件。
本发明方法的实施产生了在非胁迫条件或轻微干旱条件下生长的植物,其相对于可比较条件下生长的合适对照植物而言,具有提高的产量。因而,根据本发明,提供了用于在非胁迫条件或轻微干旱条件下培育的植物中提高产量的方法,所述的方法包括在植物中提高编码CycHTr多肽的核酸表达。
本发明包括可由本发明方法获得的植物或其部分(包括种子)。所述植物或其部分包含编码如上文定义的CycHTr多肽的核酸转基因。
本发明也提供基因构建体和载体以促进在植物中导入和/或表达编码CycHTr多肽的核酸。所述基因构建体可以插入适于转化至植物并适于在转化细胞中表达目的基因的载体,所述载体可以是市售的。本发明也提供如本文中定义的基因构建体在本发明方法中的用途。
更具体地,本发明提供构建体,其包含
(a)如上文定义的编码CycHTr多肽的核酸;
(b)能够驱动(a)的核酸序列表达的一个或多个调控序列;和任选地
(c)转录终止序列。
优选地,编码CycHTr多肽的核酸是如上文定义的。术语“调控序列”和“终止序列”如本文中的定义。
植物用包含上文所述的任意核酸的载体转化。技术人员非常了解必须存在于所述载体上以便成功转化、选择和增殖含有目的序列的宿主细胞的遗传元件。所述目的序列有效地与一个或多个调控序列(至少与启动子)连接。
有利地,任意类型的启动子可以用来驱动所述核酸序列的表达。优选地,CycHTr核酸或其变体有效地与种子特异性启动子连接。种子特异性启动子在种子组织中优势地具有转录活性,但不是必需排他地在种子组织中具有转录活性(在泄露表达的情况下)。种子特异性启动子可以在种子发育和/或在萌发期间有活性。种子特异性启动子是本领域熟知的。优选地,所述种子特异性启动子是油质蛋白启动子或WSI18启动子,或功能等效的启动子。更优选地,所述启动子序列如SEQ ID NO:170,SEQ ID NO:171和SEQ ID NO:164之一所代表。应当明白本发明的应用不限于由SEQ IDNO:165代表的CycHTr核酸,本发明的应用也不限于CycHTr核酸在受种子特异性启动子驱动时的表达。也可以用来驱动CycHTr核酸表达的其他种子特异性启动子的实例在定义部分显示。
任选地,可以在导入植物的构建体中使用一个或多个终止子序列。其它的调节元件可以包括转录增强子和翻译增强子。本领域技术人员将知道可能适用于实施本发明的终止子和增强子序列。如定义部分中描述,内含子序列也可以添加至5′非翻译区(UTR)或编码序列中,以增加聚集在细胞质内的成熟信使的量。(除启动子、增强子、沉默子、内含子序列、3’UTR和/或5’UTR区域之外的)其他调控序列可以是蛋白质/或RNA稳定元件。此类序列将是已知的或可以由本领域技术人员轻易获得。
本发明的基因构建体还可以包括为在特定细胞类型中维持和/或复制所需要的复制起点序列。一个实例是当基因构建体需要作为游离型遗传元件(例如质粒或粘粒分子)维持在细菌细胞中时的复制起点。优选的复制起点包括但不限于f1-ori和colE1。
为检测如在本发明方法中使用的核酸序列的成功转移和/或选择包含这些核酸的转基因植物,有利的是使用标记基因(或报道基因)。因此,所述基因构建体可以任选地包含选择标记基因。选择标记在本文的“定义”部分中更详细地描述。一旦不再需要所述标记基因时,它们可以从转基因细胞中移出或切除。用于移出标记的技术是本领域已知的,有用技术在上文定义部分中描述。
本发明也提供用于产生转基因植物的方法,所述转基因植物相对于对照植物而言,具有增强的产量相关性状,其中所述方法包括在植物中导入并表达编码如上文所定义的CycHTr多肽的任意核酸。
更具体地,本发明提供用于产生具有增加的产量的转基因植物的方法,所述方法包括:
(a)在植物或植物细胞中导入并表达编码CycHTr多肽的核酸;和
(b)在促进植物生长和发育的条件下培养植物细胞。
所述核酸可以直接导入植物细胞或导入植物自身(包括导入组织、器官或植物的任何其他部分)。根据本发明的优选特征,该核酸优选地通过转化作用导入植物。术语“转化”在本文的“定义”部分中更详细地描述。
经遗传修饰的植物细胞可以通过技术人员熟悉的所有方法再生。合适的方法可以在上文提及的S.D.Kung和R.Wu,Potrykus或
Figure G2008800037051D00961
和Willmitzer的出版物中找到。
通常在转化后,对植物细胞或细胞群体选择一个或多个标记的存在性,其中所述标记由随同目的基因一起共转移的植物可表达基因编码,随后将转化材料再生成完整植物。为了选择转化植物,在所述转化中获得的植物材料原则上经历选择性条件,从而转化植物可以与非转化植物区分。例如,可以将以上述方式获得的种子播种,并且在初始培育时间后,通过喷洒进行合适的选择。另一种可能性在于(根据需要)消毒后,在使用合适选择剂的琼脂板上培育种子,从而仅转化的种子可以长成植物。或者,对所述转化植物筛选选择标记(如上文所述的选择标记)的存在性。
在DNA转移和再生后,推定转化的植物也可以例如使用DNA印迹分析对目的基因的存在性、拷贝数和/或基因组构造进行评价。备选地或额外地,新导入的DNA的表达水平可以使用RNA印迹分析和/或蛋白质印迹分析或这两种分析法监测,这两项技术均是本领域普通技术人员熟知的。
产生的转化植物可以通过多种方法繁殖,如通过克隆繁殖法或经典育种技术。例如,第一世代(或T1)转化植物可以进行自交并且选择纯合的第二世代(或T2)转化体,并且T2植物随后可以通过经典育种技术进一步繁殖。
产生的转化生物可以采取多种形式。例如,它们可以是转化细胞和非转化细胞的嵌合体;克隆性转化体(例如,被转化以含有表达盒的全部细胞);转化组织和非转化组织的移植体(例如在植物中,与未转化接穗嫁接的转化根状茎)。
本发明明确地扩展至由本文中所述的任意方法产生的任意植物细胞或植物,并扩展至全部植物部分及其繁殖体。本发明进一步扩展以包括已经由前述任意方法产生的原代转化或转染细胞、组织、器官或完整植物的后代,唯一要求是后代表现与如本发明方法中的亲代相同的基因型和/或表型特征。
本发明也包括含有编码如上文所定义的CycHTr多肽的分离核酸的宿主细胞。本发明的优选宿主细胞是植物细胞。在本发明方法中所用核酸或载体、表达盒或构建体或载体的宿主植物原则上有利地是能够合成在本发明方法中所使用多肽的全部植物。
本发明的方法有利地适用于任意植物。
在本发明方法中特别有用的植物包括属于植物界(Viridiplantae)超家族、尤其单子叶和双子叶植物的全部植物,包括饲用或饲料豆科植物、观赏植物、粮食作物、树或灌木。根据本发明的一个优选实施方案,所述植物是作物植物。作物植物的实例包括大豆、向日葵、卡诺拉油菜、苜蓿、油菜籽、棉花、番茄、马铃薯和烟草。更优选地,所述植物是单子叶植物。单子叶植物的实例包括甘蔗。更优选地,所述植物是谷物植物。谷物植物的实例包括稻、玉米、小麦、大麦、谷子、黑麦、高粱、二粒小麦、斯卑尔脱小麦、黑麦属、单粒小麦、埃塞俄比亚画眉草、买罗高粱和燕麦。
本发明也扩展至植物的可收获部分如,但不限于种子、叶、果实、花、茎、根状茎、块茎和球茎。本发明进一步涉及了衍生自、优选直接衍生自此种植物的可收获部分的产品,如干燥颗粒或粉末、油、脂肪和脂肪酸、淀粉或蛋白质。
根据本发明的优选特征,受调节的表达是提高的表达。本领域充分记录了用于提高核酸或基因或基因产物表达的方法并且在定义部分中提供了例子。
如上所述,用于调节(优选地提高)编码CycHTr多肽的核酸表达的优选方法是通过在植物中导入并表达编码CycHTr多肽的核酸;然而,实施本方法的效果,即增强产量相关性状,也可以使用其他熟知技术实现,所述的其他熟知技术包括但不限于T-DNA活化标签技术、TILLING、同源重组法。在定义部分中提供了对这些技术中某些技术的描述。
另外,EMS诱变或使用T-DNA或转座子的插入诱变可以用于在内源性CycH基因中产生突变,从而导致形成编码CycHTR的序列。这些技术是本领域熟知的。
本发明也包括编码如本文中所述CycHTr多肽的核酸的用途,和这些CycHTr多肽在植物中增强任意的前述产量相关性状的用途。
编码本文中所述CycHTr多肽的核酸或CycHTr多肽自身可以用于育种程序中,在所述育种程序中鉴定到可以遗传地与编码CycHTr多肽的基因连接的DNA标记。所述核酸/基因或CycHTr多肽自身可以用来定义分子标记。这种DNA或蛋白质标记随后可以在育种程序中用来在本发明的方法中选择具有如上文所定义的增强的产量相关性状的植物。
编码CycHTr多肽的核酸/基因的等位变体也可以用于标记辅助的育种程序中。这种育种程序有时需要使用例如EMS诱变法通过对植物进行诱变处理而导入等位变异;备选地,该程序可以从收集并非故意造成的所谓“自然”源性等位变体开始。随后进行等位变体的鉴定,例如通过PCR法。此后是步骤:选择所讨论和导致产量提高的序列的优异等位变体。选择一般通过监测含有所讨论序列的不同等位变体的植物的生长性能而实施。生长性能可以在温室或在田间监测。其他任选步骤包括使其中鉴定到优异等位变体的植物与另一种植物杂交。这可能用来例如产生感兴趣的表型特征组合。
编码CycHTr多肽的核酸也可以作为探针用于遗传地或物理地绘制所述探针构成其一部分的基因并且作为标记用于与这些基因连锁的性状。此类信息可以用于植物育种,旨在开发具有所希望表型的品系。编码CycHTr多肽的核酸的这种用途仅需要具有至少15个核苷酸长度的核酸序列。编码CycHTr多肽的核酸可以用作限制性片段长度多态性(RFLP)标记。限制性消化的植物基因组DNA的DNA印迹物(Sambrook J,Fritsch EF和Maniatis T(1989)Molecular Cloning,A Laboratory Manual)可以用编码CycHTr多肽的核酸探测。所得的结合图式随后可以使用计算机程序如MapMaker(Lander等(1987)Genomics 1:174-181)进行遗传分析以构建遗传图。此外,该核酸可以用来探测含有一组个体的限制性核酸内切酶处理的基因组DNA的DNA印迹物,其中所述的一组个体代表具有定义的遗传杂交的亲代和后代。标出DNA多态性的分离并用来计算编码CycHTr多肽的核酸在先前使用这个群体获得的遗传图中的位置(Botstein等(1980)Am.J.Hum.Genet.32:314-331)。
在Bernatzky和Tanksley(1986)Plant Mol.Biol.Reporter 4:37-41中描述了植物基因来源的探针的产生及其在遗传作图中的用途。众多出版物描述了使用以上所提及的方法学或其改良法对特定cDNA克隆的遗传作图。例如,F2互交群、回交群、随机交配群、邻近纯合系和其他个体群体可以用于作图。此类方法学是本领域技术人员熟知的。
所述核酸探针也可以用于物理作图(即序列在物理图上的排列;见Hoheisel等在:Non-mammalian Genomic Analyasis:A Practical Guide,Academic press 1996,第319-346页及其中引用的参考文献)。
在另一实施方案中,核酸探针可以在直接荧光原位杂交(FISH)作图法(Trask(1991)Trends Genet.7:149-154)中使用。尽管当前的FISH作图法支持使用大的克隆(几个kb至几百个kb;见Laan等(1995)Genome Res.5:13-20),然而灵敏度的改善可以允许使用更短探针进行FISH作图。
用于遗传作图及物理作图的多种基于核酸扩增的方法可以使用所述核酸而实施。方法实例包括等位基因特异性扩增法(Kazazian(1989)J.Lab.Clin.Med 11:95-96)、PCR扩增片段的多态性(CAPS;Sheffield等(1993)Genomics 16:325-332)、等位基因特异性连接(Landegren等(1988)Science241:1077-1080)、核苷酸延伸反应(Sokolov(1990)Nucleic Acid Res.18:3671)、放射杂交作图(Walter等(1997)Nat.Genet.7:22-28)和Happy作图法(Dear和Cook(1989)Nucleic Acid Res.17:6795-6807)。对于这些方法,使用一种核酸的序列来设计并产生用于扩增反应或引物延伸反应中的引物对。这类引物的设计是本领域技术人员熟知的。在使用基于PCR遗传作图的方法中,可能需要在对应于当前核酸序列的区域中鉴定作图交叉的亲代之间的DNA序列差异。然而,这通常对作图法而言不是必需的。
本发明方法产生了具有如前文所述提高的产量的植物。这些性状也可以与经济上有利的其他性状组合,如其他的产量增强性状、针对其他非生物胁迫和生物胁迫的耐受性、调节多种构造性特征和/或生物化学特征和/或生理学特征的性状。
IV.Remorin
根据第一实施方案,本发明提供相对于对照植物用于增强植物中产量相关性状的方法,包括提高植物中编码Remorin多肽的核酸序列的表达。
用于提高编码Remorin多肽的核酸序列表达的优选方法是在植物中导入并表达编码Remorin多肽的核酸序列。
下文任一谈及的“在本发明方法中使用的蛋白质”意指如本文中定义的Remorin多肽。下文任一谈及的“在本发明方法中使用的核酸”意指能够编码这种Remorin多肽的核酸,待导入植物(并且因而在实施本发明方法中使用)的核酸是编码现在所描述的蛋白质类型的任意核酸,下文也称作“Remorin核酸序列”或“Remorin基因”。
如本文中定义的术语Remorin多肽”指包含(i)羧基端Remorin结构域(对应于Pfam家族登录号PF03763);和(ii)预测的羧基端卷曲螺旋结构域的任意多肽。
此外,如本文中定义的“Remorin多肽”额外地包含以下项之一或这两者:(i)富含带电荷氨基酸的羧基端Remorin结构域;(ii)在所述多肽的羧基端的最后10个氨基酸残基中包含至少一个Cys和/或一个Phe。
备选地或额外地,如本文中定义的“Remorin多肽”指包含如此羧基端Remorin结构域的任意多肽,所述的羧基端Remorin结构域以增加的优选顺序与如SEQ ID NO:326所代表的羧基端Remorin结构域具有至少15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或更大的序列同一性。
备选地或额外地,如本文中定义的“Remorin多肽”指如下的任意多肽,所述多肽以增加的优选顺序与如SEQ ID NO:199所代表的Remorin多肽具有至少10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或更大的序列同一性。
术语“结构域”和“基序”在本文中的“定义”部分定义。存在用于鉴定结构域的专业数据库,例如,SMART(Schultz等(1998)Proc.Natl.Acad.Sci.USA 95,5857-5864;Letunic等(2002)Nucleic Acids Res 30,242-244)、InterPro(Mulder等,(2003)Nucl.Acids.Res.31,315-318)、Prosite(Bucher和Bairoch(1994),用于生物分子序列基序的概括特征结构及其在自动化序列解读中的功能(A generalized profile syntax for biomolecular sequencesmotifs and its function in automatic sequence interpretation).(在)ISMB-94;第二届分子生物学智能系统国际会议文集.Altman R.,BrutlagD.,Karp P.,Lathrop R.,Searls D.编辑,第53-61页,AAAIPress,MenloPark;Hulo等,Nucl.Acids.Res.32:D134-D137,(2004)或Pfam(Bateman等,Nucleic Acids Research 30(1):276-280(2002))。一组用于计算机方式分析蛋白质序列的工具可在ExPASY蛋白质组服务器上获得(瑞士生物信息研究所维护(Gasteiger等,ExPASy:深入认识和分析蛋白质的蛋白质组服务器,Nucleic Acids Res.31:3784-3788(2003))。结构域也可以使用常规技术如通过序列比对进行鉴定。结构域也可以使用常规技术如通过序列比对进行鉴定。对SEQ ID NO:199的多肽序列的分析在下文实施例32和34中描述。羧基端Remorin结构域在Pfam数据库中鉴定为Pfam家族登录号PF03763,在Prodom数据库中鉴定为登录号PD350442。在Pfam数据库中鉴定的SEQ ID NO:199的羧基端Remorin结构域是如SEQ ID NO:326代表的。因为Remorin多肽的羧基端Remorin结构域之间的同一性百分数是众所周知的,因而使用专业化数据库(如Pfam)的算法鉴定此类结构域是特别有用的。
“N端”(又称作“氨基末端”或“氨基端”)在本文中意指以带有游离氨基(-NH2)的氨基酸为结尾的蛋白质或多肽或肽的末端。蛋白质或多肽或肽的“C端”(又称作“羧基末端”或“羧基端”)是以游离羧基(-COOH)结尾的氨基酸链的末端。“羧基端的半部分(C-terminus half)”在本文中意指包含所述羧基端的半部分多肽。“羧基端结构域”在本文中意指在包含所述羧基端的半部分多肽中包含的结构域。可以单纯地通过目视检验法确定在Remorin多肽的羧基端最后10个氨基酸残基中存在至少一个Cys和/或一个Phe。一旦确定Remorin多肽的羧基端,则检验该羧基端上游的10个氨基酸残基(从氨基端的方向)至少一个Cys和/或一个Phe的存在。
用于比对序列以进行比较的方法是本领域熟知的,此类方法包括GAP、BESTFIT、BLAST、FASTA和TFASTA。GAP使用Needleman和Wunsch算法((1970)J Mol Biol 48:443-453)以找到使匹配数最大化并使空位数最小化的两个序列的总体(即覆盖完整序列的)比对结果。BLAST算法(Altschul等(1990)J Mol Biol 215:403-10)计算序列同一性百分数并在两个序列之间开展相似性的统计分析。用于执行BLAST分析的软件是通过国家生物技术信息中心(NCBI)可公开获得的。同源物可以使用例如ClustalW多重序列比对算法(1.83版本),以默认配对比对参数和百分数评分方法轻易地鉴定。相似性和同一性的总体百分数也可以使用MatGAT软件包中的可用方法之一确定(Campanella等,BMC Bioinformatics.2003年7月10日;4:29.MatGAT:使用蛋白质序列或DNA序列产生相似性/同一性矩阵的一种应用)。如本领域技术人员显而易见,可以进行少许手工编辑以优化保守基序之间的比对结果。此外,作为使用全长序列以鉴定同源物的替代,也可以使用特定结构域。对于局部比对,Smith-Waterman算法是特别有用的(Smith TF,Waterman MS(1981)J.Mol.Biol 147(1);195-7)。利用上文提及的程序,使用默认参数在完整核酸序列或多肽序列(本文中表Q)范围和/或在所选择的结构域(如由SEQ ID NO:326所代表的羧基端Remorin结构域;本文中表Q1)或保守基序范围内确定在下文实施例33中表述为百分数的序列同一性值。Remorin多肽之间的同一性百分数据称是低的(低至10%),Remorin多肽的羧基端Remorin结构域之间的同一性百分数据称略高(15%或更大)。
此外,可以使用计算机算法或单纯地通过目视检验法确定富含特定氨基酸的区域(如富含带电荷氨基酸的结构域)的存在。对于前者,可以使用来自ExPASy服务器的软件程序、尤其ProtParam工具Gasteiger E等(2003)ExPASy:深入认识和分析蛋白质的蛋白质组服务器.Nucleic AcidsRes 31:3784-3788)来计算某个多肽区域的主要氨基酸组成(%),以确定某个多肽区域是否富含特定氨基酸。目的多肽的组成随后可以与Swiss-Prot蛋白质序列数据库中的平均氨基酸组成(%)比较。在所述数据库中,带电荷的氨基酸(Asp、Glu、Lys和Arg)的平均%是23%(本文中表F)。如本文中定义的,假如Remorin结构域的带电荷氨基酸残基的百分数高于Swiss-Prot蛋白质序列数据库中带电荷氨基酸的百分数,则Remorin多肽的羧基端Remorin结构域富含带电荷的氨基酸。优选地,Remorin多肽的羧基端Remorin结构域中带电荷氨基酸残基的百分数比Swiss-Prot蛋白质序列数据库中带电荷氨基酸的百分数高1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%或更大。例如,如SEQ ID NO:326所代表的羧基端Remorin结构域包含40%的带电荷的氨基酸,尤其Lys、Arg和Glu,如实施例36中所述。
卷曲螺旋对于鉴定相同蛋白质、相同家族的蛋白质和不相关蛋白质的蛋白质-蛋白质相互作用(如寡聚化)是重要的。Remorin多肽可以与自身相互作用,或与Remorin直向同源物或旁系同源物相互作用。最近在从序列数据计算性预测卷曲螺旋方面取得长足进展。本领域技术人员熟知的算法可自瑞士生物信息研究所维护的ExPASy蛋白质组工具COILS,PAIRCOIL,PAIRCOIL2,MULTICOIL或MARCOIL获得。在实施例36和图19中分别显示如通过COILS算法分析所产生的SEQ ID NO:199的数字结果和图形结果。在如SEQ ID NO:199所代表的Remorin多肽序列中鉴定到预测的羧基端卷曲螺旋结构域。
本发明通过用SEQ ID NO:198所代表的核酸序列转化植物进行说明,其中所述的核酸序列编码SEQ ID NO:199的多肽序列。然而,本发明的实施不限于这些序列;本发明的方法可以有利地使用编码Remorin的任意核酸序列或如本文中定义的Remorin多肽实施。
编码植物Remorin多肽的核酸序列的实例在本文实施例31的表P中给出。此类核酸序列用于实施本发明的方法中。在实施例31的表P中列出的多肽序列是由SEQ ID NO:199所代表的Remorin多肽的直向同源物和旁系同源物的示例序列,术语“直向同源物”和“旁系同源物”如本文中定义。其他直向同源物和旁系同源物可以通过开展所谓交互性blast搜索轻易地鉴定。通常,这包括第一BLAST,其中所述的第一BLAST包括将查询序列进行BLAST(例如使用实施例31的表P中列出的任意序列)针对任意序列数据库,如可公开获得的NCBI数据库。当从核苷酸序列开始时,一般使用BLASTN或TBLASTX(使用标准默认值),并且当从蛋白质序列开始时,使用BLASTP或TBLASTN(使用标准默认值)。可以任选地筛选BLAST结果。筛选结果或非筛选结果的全长序列随后针对来自生物的序列进行反向BLAST(第二BLAST),其中所述查询序列从所述生物衍生(在查询序列是SEQ ID NO:198或SEQ ID NO:199的情况下,所述第二BLAST因而将针对拟南芥属植物的序列进行)。随后比较第一BLAST和第二BLAST的结果。若来自第一blast的高阶位命中源自与衍生查询序列的物种相同的物种,则鉴定到旁系同源物,反向BLAST随后理想地在最高命中当中产生该查询序列;若高阶位命中不是源自与衍生查询序列的物种相同的物种,则鉴定到直向同源物,并且优选地在反向BLAST时,在最高命中当中产生该查询序列。
高阶位命中是具有低E-值的那些命中。E-值越低,评分越显著(或换句话说,偶然发现该命中的几率越低)。E-值的计算是本领域熟知的。除了E-值外,也通过同一性百分数评分来进行比较。同一性百分数指两个所比较的核酸(或多肽)序列之间特定长度范围内相同的核苷酸(或氨基酸)的数目。在大型家族的情况下,可以使用ClustalW,随后使用邻接树法,以帮助观察相关基因的聚集和鉴定直向同源物和旁系同源物。
核酸变体也可以用于实施本发明的方法中。术语“同源物”和“衍生物”如本文中定义。此类变体的实例包括编码在实施例31的表P中所列出任一多肽序列的同源物和衍生物的核酸序列,术语“同源物”和“衍生物”如本文中定义。还在本发明方法中使用的是这样的核酸序列,其编码在实施例31的表P所列出任一多肽序列的直向同源物或旁系同源物的同源物和衍生物。在本发明方法中使用的同源物和衍生物与衍生它们的未修饰蛋白质具有基本上相同的生物学活性和功能活性。
在实施本发明方法中有用的其他核酸变体包括编码Remorin多肽的核酸序列的部分、与编码Remorin多肽的核酸序列杂交的核酸序列、编码Remorin多肽的核酸序列的剪接变体、编码Remorin多肽的核酸序列的等位变体和通过基因改组获得的编码Remorin多肽的核酸序列的变体。全部这些核酸序列及其变体可以用来产生编码如上文所述的Remorin多肽的核酸序列。术语“部分”、“杂交序列”、“剪接变体”、“等位变体”和“基因改组作用”如本文中所述。
编码Remorin多肽的核酸无需是全长核酸序列,因为实施本发明方法不依赖于使用全长核酸序列。根据本发明,提供了用于增强植物中产量相关性状的方法,包括在植物中导入并表达实施例31的表P中列出的任一核酸序列的一部分或编码在实施例31的表P中所列出的任意多肽序列的直向同源物、旁系同源物或同源物的核酸序列的一部分。
核酸序列的一部分可以例如通过对所述核酸序列进行一个或多个缺失而制备。所述部分可以以分离的形式使用或它们可以与其他编码(或非编码)序列融合,例如旨在产生联合几种活性的蛋白质。与其他编码序列融合时,在翻译时所产生的所得多肽可以比对于该蛋白质部分所预测的多肽更大。
在本发明方法中使用的部分编码如本文中定义的Remorin多肽,并且基本上具有如实施例31的表P中所列出多肽序列那样的相同生物学活性。优选地,此部分是在实施例31的表P中列出的任一核酸序列的一部分,或是编码在实施例31的表P中所列出任一多肽序列的直向同源物或旁系同源物的核酸序列的一部分。优选地,所述部分的长度以增加的优选顺序是至少200,300,400,500或600个连续核苷酸,所述连续核苷酸是实施例31的表P中列出的任一核酸序列或是编码在实施例31的表P中所列出任一多肽序列的直向同源物或旁系同源物的核酸序列。优选地,所述部分编码包含本文所定义的任意一个或多个结构域或基序的多肽序列。最优选地,所述部分是SEQ ID NO:198的核酸序列的一部分。
在本发明方法中使用的另一种核酸变体是能够在降低的严格条件下、优选在严格条件下与编码如本文中定义的Remorin多肽的核酸序列或与如本文中定义的部分杂交的核酸序列。
根据本发明,提供了用于增强植物中产量相关性状的方法,包括在植物中导入并表达能够与实施例31的表P中列出的任一核酸序列杂交的核酸序列,或包括在植物中导入并表达这样的核酸序列,其中所述核酸序列能够与编码在实施例31的表P中所列出任意核酸序列的直向同源物、旁系同源物或同源物的核酸序列杂交。
在本发明方法中使用的杂交序列编码如本文中定义的Remorin多肽,并且基本上具有如实施例31的表P中所列出多肽序列那样的相同生物学活性。优选地,所述杂交序列能够与实施例31的表P中列出的任一核酸序列或与这些序列中任意序列的一部分杂交,所述的一部分如上文定义,或其中所述杂交序列能够与编码在实施例31的表P中所列出任一多肽序列的直向同源物或旁系同源物的核酸序列杂交。优选地,所述杂交序列编码了包含如本文定义的任意一个或多个基序或结构域的多肽序列。最优选地,所述杂交序列能够与如SEQ ID NO:198所代表的核酸序列或与其一部分杂交。
在本发明方法中使用的另一种核酸变体是编码如上文所定义的Remorin多肽的剪接变体,剪接变体如本文中定义。
根据本发明,提供了用于增强植物中产量相关性状的方法,包括在植物中导入并表达在实施例31的表P中列出的任一核酸序列的剪接变体,或导入并表达编码在实施例31的表P中所列出的任意多肽序列的直向同源物、旁系同源物或同源物的核酸序列的剪接变体。
在本发明方法中使用的剪接变体基本上具有如SEQ ID NO:199的Remorin多肽和实施例31的表P中所列出的任意多肽序列那样的相同生物学活性。优选地,由所述剪接变体编码的多肽序列包含如本文中定义的任意一个或多个基序或结构域。最优选地,所述剪接变体是SEQ ID NO:198的核酸序列的剪接变体或是编码SEQ ID NO:199的直向同源物或旁系同源物的核酸序列的剪接变体。
在本发明方法中使用的另一种核酸变体是编码如上文所定义的Remorin多肽的核酸序列的等位变体,等位变体如本文中定义。
根据本发明,提供了用于增强植物中产量相关性状的方法,包括在植物中导入并表达在实施例31的表P中列出的任一核酸序列的等位变体,或导入并表达编码在实施例31的表P中所列出的任意多肽序列的直向同源物、旁系同源物或同源物的核酸序列的等位变体。
在本发明方法中使用的等位变体基本上具有如SEQ ID NO:199的Remorin多肽和实施例31的表P中所列出的任意多肽序列那样的相同生物学活性。等位变体天然存在,并且在本发明的方法中包括这些天然等位基因的用途。优选地,由所述等位变体编码的多肽序列包含如本文中定义的任意一个或多个基序或结构域。最优选地,所述等位变体是SEQ ID NO:198的等位变体或是编码SEQ ID NO:199的直向同源物或旁系同源物的核酸序列的等位变体。
基因改组或定向进化也可以用来产生编码如上文定义的Remorin多肽的核酸序列的变体;术语“基因改组”如本文中定义。
根据本发明,提供了用于增强植物中产量相关性状的方法,包括在植物中导入并表达在实施例31的表P中列出的任一核酸序列的变体,或包括在植物中导入并表达下述核酸序列的变体,所述的核酸序列编码在实施例31的表P中列出的任意多肽序列的直向同源物、旁系同源物或同源物,其中所述的变异核酸序列通过基因改组获得。
通过基因改组获得的在本发明方法中使用的变异核酸序列基本上具有如SEQ ID NO:199的Remorin多肽和实施例31的表P中所述任意多肽序列那样的相同生物学活性。优选地,通过基因改组获得的变异核酸序列编码了包含如本文定义的任意一个或多个基序或结构域的多肽序列。
另外,核酸变体也可以通过位点定向诱变获得。几种方法可用于实现位点定向诱变,最常见的是基于PCR的方法(Current Protocols inMolecular Biology.Wiley编辑)。
编码Remorin多肽的核酸序列可以衍生自任何天然来源或人工来源。该核酸序列可以通过人类有意操作,在组成和/或基因组环境方面从其天然形式中修饰而来。优选地,编码Remorin多肽的核酸序列来自植物,还优选来自双子叶植物,更优选来自十字花科,最优选地来自拟南芥。
本发明方法的实施产生了相对于对照植物而言,具有增强的产量相关性状的植物。尤其,本发明方法的实施产生了相对于对照植物而言,具有提高的产量、尤其提高的种子产量的植物。术语“产量”和“种子产量”在本文的“定义”部分中更详细地描述
本文谈及的增强的产量相关性状意指植物的一个或多个部分的生物量(重量)增加,所述的部分可以包括地上(可收获的)部分和/或(可收获的)地下部分。尤其,此类可收获部分是种子,并且本发明方法的实施产生了相对于合适对照植物,具有增强的产量相关性状的植物
以谷物(corn)为例,产量提高可以表现为以下一个或多个指标:每公顷或英亩已建立的植物数目增加,每株植物穗数的提高,行数、每行核粒数、核粒重、千粒核重、穗长度/直径的提高,种子充实率(即充实种子数除以种子总数并乘以100)提高,及其他。以稻为例,产量提高可以自身表现为下列一种或多种指标的提高:每公顷或英亩植物数、每株植物的花序数、每花序的小穗数、每花序的花(小花)数目(其表达为充实种子数对原发花序数的比)、种子充实率的提高(其中种子充实率是充实种子数除以种子总数并乘以100)、千粒核重提高及其他。
本发明提供相对于对照植物,用于增强植物的产量相关性状的方法,所述方法包括提高植物中编码如本文中定义的Remorin多肽的核酸序列的表达。优选地,增强的产量相关性状是以下一项或多项:(i)提高的种子充实率;(ii)提高的每株植物种子总产量;(iii)增加的充实种子数;(iv)增加的种子总数;(v)提高的千粒核重(TKW)或(vi)提高的收获指数。
由于本发明的转基因植物具有增强的产量相关性状,故相对于对照植物的生长速率,这些植物有可能在其生活周期的对应阶段上表现提高的生长速率(在其生活周期的至少部分期间)。
提高的生长速率可以是植物的一个或多个部分(包括种子)特异的,或可以基本上遍及整个植物。生长速率提高的植物可以具备较短的生活周期。植物的生活周期可以意指从干燥成熟种子成长至植物已经产生与起始材料相似的干燥成熟种子的阶段所需要的时间。这个生活周期可以受以下因素影响,如早期生长势、生长速率、绿度指数、开花时间和种子成熟速度。生长速率的提高可以在植物生活周期的一个或多个阶段上或在整个植物生活周期期间发生。植物生活周期早期中提高的生长速率在可以反映增强的生长势。生长速率的提高可以改变植物的收获周期,从而导致植物较晚播种和/或较早收获,而这本来是不可能的(相似效果可以随较早的开花时间获得)。若生长速率充分提高,则可以允许进一步播种相同植物物种的种子(例如播种并收获稻植物,随后播种并收获其他稻植物,全部稻植物均出于一个常规生长时期中)。类似地,若生长速率充分地提高,可以允许进一步播种不同植物物种的种子(例如播种并收获谷物植物,随后例如播种并任选收获大豆、马铃薯或任何其他合适植物)。在一些作物植物的例子中,来自相同根状茎的额外收获次数也可以是可能的。改变植物的收获周期可以导致每英亩一年生物量生产提高(原因在于可以培育并收获任何具体植物的次数(即在一年中)提高)。生长速率的提高也可以允许转基因植物在比其野生型对应物更广泛的地理区域内培育,因为培育作物的地域限制往往由栽种时节(早季)或在收获时期(晚季)的不利环境条件所决定。这类不利条件可以避开,若缩短收获周期。生长速率可以通过从生长曲线获得多个参数而确定,此类参数可以是:T-Mid(植物达到其50%最大尺寸所花费的时间)和T-90(植物达到其50%最大尺寸所花费的时间),以及其他。
根据本发明的优选特征,本发明方法的实施产生了相对于对照植物而言,具有提高的生长速率的植物。因此,根据本发明,提供了用于提高植物生长速率的方法,所述方法包括提高植物中编码如本文中定义的Remorin多肽的核酸序列的表达。
与可比较条件下生长的对照植物相比较,当所述植物处于非胁迫条件下或当植物暴露于多种胁迫时,是否出现产量和/或生长速率的提高。植物一般通过生长得更慢而应答于胁迫暴露。在严重胁迫条件下,植物甚至可以完全停止生长。另一方面,轻度胁迫在本文中定义为植物所暴露的任何下述胁迫,其中所述的胁迫未导致植物完全停止生长,且没有再继续生长的能力。与非胁迫条件下的对照植物相比较,轻度胁迫在本发明意义中导致受胁迫植物的生长降低小于40%、35%或30%、优选地小于25%、20%或15%、更优选地小于14%、13%、12%、11%或10%或更低。由于农业实践(灌溉、施肥、杀虫剂处理)的进步,在栽培作物植物中并不经常遇到严重胁迫。因此,由轻度胁迫诱导的受损生长对于农业往往是不受欢迎的特征。轻度胁迫是植物所暴露的常见非生物性(环境)胁迫。非生物胁迫可以因干旱或过量的水、缺氧胁迫、盐胁迫、化学毒性、氧化胁迫和热、寒冷或冰冻温度所致。非生物胁迫可以是因水胁迫(尤其因为干旱)、盐胁迫、氧化胁迫或离子胁迫引起的渗透胁迫。生物胁迫一般是由病原体如细菌、病毒、线虫、真菌和昆虫引起的那些胁迫。
尤其,本发明的方法可以在非胁迫条件或轻微干旱条件下开展以产生相对于对照植物具有增强的产量相关性状的植物。如Wang等(Planta(2003)218:1-14)中报道,非生物胁迫导致一系列不利地影响植物生长及生产量的形态学、生理学、生物化学和分子变化。干旱、盐度、极端温度和氧化胁迫已知是相互联系的并可以通过相似机制诱导生长损害及细胞损害。Rabbani等(Plant Physiol(2003)133:1755-1767)描述了干旱胁迫与高盐度胁迫间极高程度的“交互作用”。例如,干旱和/或盐化作用主要地表现为渗透胁迫,从而导致细胞内稳态和离子分布的破坏。经常伴随高温或低温、盐度或干旱胁迫的氧化胁迫可以造成功能性蛋白和结构蛋白变性。因此,这些多样的环境胁迫常常激活相似的细胞信号途径和细胞应答,如产生胁迫蛋白、上调抗氧化物质、积累兼容性溶质和生长停滞。如本文中所用的术语“非胁迫”条件是允许植物最佳生长的环境条件。本领域技术人员清楚对于给定地点的正常土壤条件和气候条件。
本发明方法的实施产生了相对于在可比较条件下生长的对照植物而言,在非胁迫条件或轻微干旱条件下生长的具有增强的产量相关性状的植物。因此,根据本发明,提供了用于在非胁迫条件或轻微干旱条件下的植物中增强产量相关性状的方法,所述方法包括提高植物中编码如上文定义的Remorin多肽的核酸序列的表达。
本发明方法的实施产生了相对于在可比较条件下生长的对照植物而言,在营养素缺乏条件下、尤其在氮缺乏条件下培育的具有提高产量的植物。因此,根据本发明,提供了用于在营养缺乏条件下培育的植物中提高产量的方法,所述方法包括调节植物中编码Remorin多肽的核酸的表达。营养缺乏可以因营养素如氮、磷酸盐和其他含磷化合物、钾、钙、镉、镁、锰、铁和硼及其他元素缺少所致。
本发明包括可由本发明方法获得的植物、植物部分(包括种子)和植物细胞。所述的植物、植物部分或植物细胞包含编码如上文定义的Remorin多肽的核酸转基因。
本发明也提供基因构建体和载体以促进在植物中导入和/或表达编码Remorin多肽的核酸序列。所述基因构建体可以插入适于转化至植物并适于在转化细胞中表达目的基因的载体,所述载体可以是市售的。本发明也提供如本文中定义的基因构建体在本发明方法中的用途。
更具体地,本发明提供构建体,其包含
(a)编码如上文定义的Remorin多肽的核酸序列;
(b)能够驱动(a)的核酸序列表达的一个或多个调控序列;和任选地
(c)转录终止序列。
术语“调控序列”和“终止序列”如本文中的定义。在一个实施方案中,所述调控序列是组成型启动子,优选地(i)GOS2启动子;或(ii)高速泳动族B(HMGB)启动子之一。
植物用包含上文所述的任意核酸序列的载体转化。技术人员非常了解必须存在于所述载体上以便成功转化、选择和增殖含有目的序列的宿主细胞的遗传元件。所述目的序列有效地与一个或多个调控序列(至少与启动子)连接。
有利地,任意类型的启动子可以用来驱动所述核酸序列的表达。组成型启动子在本发明方法中特别有用。应当明白本发明的应用不限于编码如由SEQ ID NO:198所代表的Remorin多肽的核酸序列,本发明的应用也不限于编码Remorin多肽的核酸序列在受组成型启动子驱动时的表达。
组成型启动子优选地是(i)GOS2启动子;或(ii)高速泳动族B(HMGB)启动子之一。对于组成型启动子的其他实例,见本文“定义”部分中的表2。还优选地,GOS2启动子来自稻,更优选地基本上与如SEQ ID NO:329所代表的GOS2启动子相似,最优选地,所述GOS2启动子是如SEQ IDNO:329或SEQ ID NO:39所代表。还优选地,HMGB启动子来自稻,更优选地基本上与如SEQ ID NO:330所代表的HMGB启动子相似,最优选地,所述HMGB启动子是如SEQ ID NO:330或SEQ ID NO:331所代表。
任选地,可以在导入植物的构建体中使用一个或多个终止子序列。其它的调节元件可以包括转录增强子和翻译增强子。本领域技术人员将知道可能适用于实施本发明的终止子和增强子序列。如定义部分中描述,内含子序列也可以添加至5′非翻译区(UTR)或编码序列中,以增加聚集在细胞质内的成熟信使的量。(除启动子、增强子、沉默子、内含子序列、3’UTR和/或5’UTR区域之外的)其他调控序列可以是蛋白质/或RNA稳定元件。此类序列将是已知的或可以由本领域技术人员轻易获得。
本发明的基因构建体还可以包括为在特定细胞类型中维持和/或复制所需要的复制起点序列。一个实例是当基因构建体需要作为游离型遗传元件(例如质粒或粘粒分子)维持在细菌细胞中时的复制起点。优选的复制起点包括但不限于f1-ori和colE1。
为检测如在本发明方法中使用的核酸序列的成功转移和/或选择包含这些核酸序列的转基因植物,有利的是使用标记基因(或报道基因)。因此,所述基因构建体可以任选地包含选择标记基因。选择标记在本文的“定义”部分中更详细地描述。一旦不再需要所述标记基因时,它们可以从转基因细胞中移出或切除。用于移出标记的技术是本领域已知的,有用技术在上文定义部分中描述
本发明也提供用于产生转基因植物的方法,所述转基因植物相对于对照植物而言,具有增强的产量相关性状,其中所述方法包括在植物中导入并表达编码如上文所定义的Remorin多肽的任意核酸序列。
更具体地,本发明提供相对于对照植物,用于产生具有增强的产量相关性状的转基因植物的方法,所述方法包括:
(i)在植物、植物部分或植物细胞中导入并表达编码Remorin多肽的核酸序列;和
(ii)在促进植物生长和发育的条件下培养植物细胞。
(i)的核酸可以是能够编码如本文中定义的Remorin多肽的任意核酸。
所述核酸序列可以直接导入植物细胞或导入植物自身(包括导入组织、器官或植物的任何其他部分)。根据本发明的优选特征,该核酸序列优选地通过转化作用导入植物。术语“转化”在本文的“定义”部分中更详细地描述。
经遗传修饰的植物细胞可以通过技术人员熟悉的所有方法再生。合适的方法可以在上文提及的S.D.Kung和R.Wu,Potrykus或
Figure G2008800037051D01141
和Willmitzer的出版物中找到。
通常在转化后,对植物细胞或细胞群体选择一个或多个标记的存在性,其中所述标记由随同目的基因一起共转移的植物可表达基因编码,随后将转化材料再生成完整植物。为了选择转化植物,在所述转化中获得的植物材料原则上经历选择性条件,从而转化植物可以与非转化植物区分。例如,可以将以上述方式获得的种子播种,并且在初始培育时间后,通过喷洒进行合适的选择。另一种可能性在于(根据需要)消毒后,在使用合适选择剂的琼脂板上培育种子,从而仅转化的种子可以长成植物。或者,对所述转化植物筛选选择标记(如上文所述的选择标记)的存在性。
在DNA转移和再生后,推定转化的植物也可以例如使用DNA印迹分析对目的基因的存在性、拷贝数和/或基因组构造进行评价。备选地或额外地,新导入的DNA的表达水平可以使用RNA印迹分析和/或蛋白质印迹分析或这两种分析法监测,这两项技术均是本领域普通技术人员熟知的。
产生的转化植物可以通过多种方法繁殖,如通过克隆繁殖法或经典育种技术。例如,第一世代(或T1)转化植物可以进行自交并且选择纯合的第二世代(或T2)转化体,并且T2植物随后可以通过经典育种技术进一步繁殖。
产生的转化生物可以采取多种形式。例如,它们可以是转化细胞和非转化细胞的嵌合体;克隆性转化体(例如,被转化以含有表达盒的全部细胞);转化组织和非转化组织的移植体(例如在植物中,与未转化接穗嫁接的转化根状茎)。
本发明明确地扩展至由本文中所述的任意方法产生的任意植物细胞或植物,并扩展至全部植物部分及其繁殖体。本发明进一步扩展以包括已经由前述任意方法产生的原代转化或转染细胞、组织、器官或完整植物的后代,唯一要求是后代表现与如本发明方法中的亲代相同的基因型和/或表型特征。
本发明也包括含有编码如上文所定义的Remorin多肽的分离核酸序列的宿主细胞。本发明的优选宿主细胞是植物细胞。在本发明方法中所用的核酸序列或载体、表达盒或构建体或载体的宿主植物原则上有利地是能够合成在本发明方法中所使用多肽的全部植物。
本发明的方法有利地适用于任意植物。在本发明方法中特别有用的植物包括属于植物界(Viridiplantae)超家族、尤其单子叶和双子叶植物的全部植物,包括饲用或饲料豆科植物、观赏植物、粮食作物、树或灌木。根据本发明的一个优选实施方案,所述植物是作物植物。作物植物的实例包括大豆、向日葵、卡诺拉油菜、苜蓿、油菜、棉花、番茄、马铃薯和烟草.更优选地,所述植物是单子叶植物。单子叶植物的实例包括甘蔗。更优选地,所述植物是谷物植物。谷物植物的实例包括稻、玉米、小麦、大麦、谷子、黑麦、小黑麦属、高粱、二粒小麦、斯卑尔脱小麦、黑麦属、单粒小麦、埃塞俄比亚画眉草、买罗高粱和燕麦。
本发明也扩展至植物的可收获部分如,但不限于种子、叶、果实、花、茎、根状茎、块茎和球茎。本发明进一步涉及了衍生自、优选直接衍生自此种植物的可收获部分的产品,如干燥颗粒或粉末、油、脂肪和脂肪酸、淀粉或蛋白质。
本领域充分记录了用于提高核酸序列或基因或基因产物表达的方法并且在定义部分中提供了例子。
如上所述,用于调节(优选地提高)编码Remorin多肽的核酸序列表达的优选方法是通过在植物中导入并表达编码Remorin多肽的核酸序列;然而,实施本方法的效果,即增强产量相关性状,也可以使用其他熟知技术实现,所述的其他熟知技术包括但不限于T-DNA活化标签技术、TILLING、同源重组法。在定义部分中提供了对这些技术的描述。
本发明也包括编码如本文中所述Remorin多肽的核酸序列的用途,和这些Remorin多肽在植物中相对于对照植物而增强产量相关性状的用途。优选地,增强的产量相关性状是提高的产量。更优选地是提高的种子产量,最优选地,所述提高的种子产量包括以下一项或多项:(i)提高的种子充实率;(ii)提高的每株植物种子总产量;(iii)增加的充实种子数;(iv)增加的种子总数;(v)提高的千粒核重(TKW)或(vi)提高的收获指数。
本发明也提供迄今未知的编码Remorin的核酸和Remorin多肽。
根据本发明的又一实施方案,提供了分离的核酸分子,其选自:
(i)由SEQ ID NO:332所代表的核酸;
(ii)由SEQ ID NO:332所代表的核酸的互补物;
(iii)编码下述Remorin多肽的核酸,所述Remorin多肽以增加的优选顺序与SEQ ID NO:333所代表的氨基酸序列具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更大的序列同一性、和以增加的优选顺序与SEQ ID NO:334(VKKEEVETKVTAWQTAEVAKINNRFKREDVVINGWETEQVEKASAWLKKIERKLDEQRAKALEKTQNDIAKARRKAEEKRASAEAKRGLKLAKVLELANFMKAVGRVPTKR具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更大的序列同一性,所述的SEQ ID NO:334与SEQ ID NO:326的羧基端区域匹配。
根据本发明的又一实施方案,还提供分离的多肽,其选自:
(i)由SEQ ID NO:333所代表的氨基酸序列;
(ii)下述氨基酸序列,其以增加的优选顺序与SEQ ID NO:333所代表的氨基酸序列具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更大的序列同一性、和以增加的优选顺序与SEQ ID NO:334(VKKEEVETKVTAWQTAEVAKINNRFKREDVVINGWETEQVEKASAWLKKIERKLDEQRAKALEKTQNDIAKARRKAEEKRASAEAKRGLKLAKVLELANFMKAVGRVPTKR具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更大的序列同一性,所述的SEQ ID NO:334与SEQ ID NO:326的羧基端区域匹配;
(iii)以上(i)或(ii)中所给出的任一氨基酸序列的衍生物。
编码本文中所述Remorin多肽的核酸序列或Remorin多肽自身可以用于育种程序中,在所述育种程序中鉴定到可以遗传地与编码Remorin多肽的基因连接的DNA标记。所述基因/核酸序列或Remorin多肽自身可以用来定义分子标记。这种DNA或蛋白质标记随后可以在育种程序中用来在本发明的方法中选择具有如上文所定义的增强的产量相关性状的植物。
编码Remorin样多肽的基因/核酸序列的等位变体也可以用于标记辅助的育种程序中。这种育种程序有时需要使用例如EMS诱变法通过对植物进行诱变处理而导入等位变异;备选地,该程序可以从收集并非故意造成的所谓“自然”源性等位变体开始。随后进行等位变体的鉴定,例如通过PCR法。此后是步骤:选择所讨论和导致产量提高的序列的优异等位变体。选择一般通过监测含有所讨论序列的不同等位变体的植物的生长性能而实施。生长性能可以在温室或在田间监测。其他任选步骤包括使其中鉴定到优异等位变体的植物与另一种植物杂交。这可能用来例如产生感兴趣的表型特征组合。
编码Remorin多肽的核酸序列也可以作为探针用于遗传地或物理地绘制所述探针构成其一部分的基因并且作为标记用于与这些基因连锁的性状。此类信息可以用于植物育种,旨在开发具有所希望表型的品系。编码Remorin多肽的核酸序列的这种用途仅需要具有至少15个核苷酸长度的核酸序列。编码Remorin多肽的核酸序列可以用作限制性片段长度多态性(RFLP)标记。限制性消化的植物基因组DNA的DNA印迹物(SambrookJ,Fritsch EF和Maniatis T(1989)Molecular Cloning,A LaboratoryManual)可以用编码Remorin多肽的核酸序列探测。所得的结合图式随后可以使用计算机程序如MapMaker(Lander等(1987)Genomics 1:174-181)进行遗传分析以构建遗传图。此外,该核酸序列可以用来探测含有一组个体的限制性核酸内切酶处理的基因组DNA的DNA印迹物,其中所述的一组个体代表具有定义的遗传杂交的亲代和后代。标出DNA多态性的分离并用来计算编码Remorin多肽的核酸序列在先前使用这个群体获得的遗传图中的位置(Botstein等(1980)Am.J.Hum.Genet.32:314-331)。
在Bernatzky和Tanksley(1986)Plant Mol.Biol.Reporter 4:37-41中描述了植物基因来源的探针的产生及其在遗传作图中的用途。众多出版物描述了使用以上所提及的方法学或其改良法对特定cDNA克隆的遗传作图。例如,F2互交群、回交群、随机交配群、邻近纯合系和其他个体群体可以用于作图。此类方法学是本领域技术人员熟知的。
所述核酸探针也可以用于物理作图(即序列在物理图上的排列;见Hoheisel等在:Non-mammalian Genomic Analyasis:A Practical Guide,Academic press 1996,第319-346页及其中引用的参考文献)。
在另一实施方案中,核酸探针可以在直接荧光原位杂交(FISH)作图法(Trask(1991)Trends Genet.7:149-154)中使用。尽管当前的FISH作图法支持使用大的克隆(几个kb至几百个kb;见Laan等(1995)Genome Res.5:13-20),然而灵敏度的改善可以允许使用更短探针进行FISH作图。
用于遗传作图及物理作图的多种基于核酸扩增的方法可以使用所述核酸序列而实施。方法实例包括等位基因特异性扩增法(Kazazian(1989)J.Lab.Clin.Med 11:95-96)、PCR扩增片段的多态性(CAPS;Sheffield等(1993)Genomics 16:325-332)、等位基因特异性连接(Landegren等(1988)Science 241:1077-1080)、核苷酸延伸反应(Sokolov(1990)Nucleic Acid Res.18:3671)、放射杂交作图(Walter等(1997)Nat.Genet.7:22-28)和Happy作图法(Dear和Cook(1989)Nucleic Acid Res.17:6795-6807)。对于这些方法,使用一种核酸的序列来设计并产生用于扩增反应或引物延伸反应中的引物对。这类引物的设计是本领域技术人员熟知的。在使用基于PCR遗传作图的方法中,可能需要在对应于当前核酸序列的区域中鉴定作图交叉的亲代之间的DNA序列差异。然而,这通常对作图法而言不是必需的。
本发明方法产生了相对于对照植物而言,具有如前文所述增强的产量相关性状的植物。这种性状也可以与经济上有利的其他性状组合,如其他的产量增强性状、针对其他非生物胁迫和生物胁迫的耐受性、调节多种构造性特征和/或生物化学特征和/或生理学特征的性状。
V.DREB
出人意料地,现在已经发现通过降低或基本上消除植物中内源性DREB基因的表达和/或DREB蛋白的水平和/或活性产生了与对照植物相比较,具有提高的产量的植物。本发明因而提供相对于对照植物而言,用于提高植物产量的方法,包括降低或基本上消除内源性DREB基因的表达和/或DREB蛋白的水平和/或活性。
选择对照植物是实验设置的例行部分并且可以包括相应的野生型植物和其中没有对内源性DREB基因的表达和/或DREB蛋白的水平和/或活性进行(由人类干预介导的)调节的相应植物。
有利地,本发明方法的实施产生了相对于对照植物具有提高的产量的植物。尤其,本发明方法的实施产生了相对于对照植物而言,具有提高的产量、尤其提高的种子产量的植物。术语“产量”和“种子产量”在本文的“定义”部分中更详细地描述。
如本文中定义的术语“提高的产量”意指植物的一个或多个可收获部分(在量上)增加,其中所述的可收获部分可以包括生物量(重量),无论是地上部分和/或地下部分。
尤其,此类可收获部分包括营养生物量和/或种子,并且本发明方法的实施产生了相对于对照植物的产量,具有提高的产量(营养生物量和/或种子)的植物。
种子数的提高可以是具有每株植物更多分蘖和/或每个分蘖或每株植物具有更多花簇(花序)和/或每个花序或每株植物具有更多花的结果。所述提高可以是因较低的花/胚败育和/或受精效率提高所致和/或因种子充实改善所致。
种子产量的提高也可以表现为种子大小和/或种子体积增加。这可以增加种子中物质的量或改变种子中物质(如油、蛋白质和糖类)的组成。此外,种子产量的提高自身可以表现为种子面积和/或种子长度和/或种子宽度和/或种子周长增加。提高的产量也可以导致改良的结构或可以因改良的结构而出现。
以谷物(corn)为例,产量提高可以表现为以下一个或多个指标:每公顷或英亩植物数目增加,每株植物穗数的提高,行数、每行核粒数、核粒重、千粒核重、穗长度/直径的提高,种子充实率(即充实种子数除以种子总数并乘以100)提高,及其他。以稻为例,产量提高可以自身表现为下列一种或多种指标的提高:每公顷或英亩植物数、每株植物的花序数、每花序的小穗数、每花序的花(小花)数目(其表达为充实种子数对原发花序数的比)、种子充实率的提高(其中种子充实率是充实种子数除以种子总数并乘以100)、千粒核重提高及其他。
根据优选的特征,本发明方法的实施导致提高的产量、尤其提高的花序数和/或种子产量的植物。因此,根据本发明,提供了用于提高植物种子产量和/或提高花序数的方法,所述方法包括降低或基本上消除DREB蛋白的活性水平,优选地通过下调DREB基因的表达进行。
由于本发明的转基因植物具有提高的产量,故相对于对照植物的生长速率而言,这些植物有可能在其生活周期的对应阶段上表现提高的生长速率(在其生活周期的至少部分期间)。提高的生长速率可以是植物的一个或多个部分(包括种子)特异的,或可以基本上遍及整个植物。生长速率提高的植物可以具备较短的生活周期。植物的生活周期可以意指从干燥成熟种子成长至植物已经产生与起始材料相似的干燥成熟种子的阶段所需要的时间。这个生活周期可以受以下因素影响,如早期(籽苗)生长势、生长速率、开花时间和种子成熟速度。生长速率的提高可以在植物生活周期的一个或多个阶段上或基本上在整个植物生活周期期间发生。提高的生长速率在植物生活周期的早期期间可以反映增强的(籽苗)生长势。生长速率的提高可以改变植物的收获周期,从而导致植物较晚播种和/或较早收获,而这本来是不可能的(相似效果可以随较早的开花时间获得)。若生长速率充分提高,则可以允许进一步播种相同植物物种的种子(例如播种并收获稻植物,随后播种并收获其他稻植物,全部稻植物均出于一个常规生长时期中)。类似地,若生长速率充分地提高,可以允许进一步播种不同植物物种的种子(例如播种并收获谷物植物,随后例如播种并任选收获大豆、马铃薯或任何其他合适植物)。在一些作物植物的例子中,来自相同根状茎的额外收获次数也可以是可能的。改变植物的收获周期可以导致每英亩一年生物量生产提高(原因在于可以培育并收获任何具体植物的次数(即在一年中)提高)。生长速率的提高也可以允许转基因植物在比其野生型对应物更广泛的地理区域内培育,因为培育作物的地域限制往往由栽种时节(早季)或在收获时期(晚季)的不利环境条件所决定。这类不利条件可以避开,若缩短收获周期。生长速率可以通过从生长曲线获得多个参数而确定,此类参数可以是:T-Mid(植物达到其50%最大尺寸所花费的时间)和T-90(植物达到其50%最大尺寸所花费的时间),以及其他。
本发明方法的实施产生了具有提高的生长速率和/或提高的籽苗生长势的植物。因此,根据本发明,提供了相对于对照植物而言提高植物生长速率和/或籽苗生长势的方法,所述方法包括优选地降低和/或基本上消除植物中内源性DREB基因的表达和/或内源性DREB基因的水平和/或活性。
与对照植物相比较,当所述植物处于非胁迫条件下或当植物暴露于多种胁迫时,是否出现产量和/或生长速率的提高。植物一般通过生长得更慢而应答于胁迫暴露。在严重胁迫条件下,植物甚至可以完全停止生长。另一方面,轻度胁迫在本文中定义为植物所暴露的任何下述胁迫,其中所述的胁迫未导致植物完全停止生长,且没有再继续生长的能力。与非胁迫条件下的对照植物相比较,轻度胁迫在本发明意义中导致受胁迫植物的生长降低小于40%、35%或30%、优选地小于25%、20%或15%、更优选地小于14%、13%、12%、11%或10%或更低。由于农业实践(灌溉、施肥、杀虫剂处理)的进步,在栽培作物植物中并不经常遇到严重胁迫。因此,由轻度胁迫诱导的受损生长对于农业往往是不受欢迎的特征。轻度胁迫是植物所暴露的常见非生物性(环境)胁迫。非生物胁迫可以因干旱或过量的水、缺氧胁迫、盐胁迫、化学毒性、氧化胁迫和热、寒冷或冰冻温度所致。非生物胁迫可以是因水胁迫(尤其因为干旱)、盐胁迫、氧化胁迫或离子胁迫引起的渗透胁迫。生物胁迫一般是由病原体如细菌、病毒、线虫、真菌和昆虫引起的那些胁迫。
尤其,本发明的方法可以在非胁迫条件或轻微干旱条件下开展以产生相对于对照植物具有提高的产量的植物。如Wang等(Planta(2003)218:1-14)中报道,非生物胁迫导致一系列不利地影响植物生长及生产量的形态学、生理学、生物化学和分子变化。干旱、盐度、极端温度和氧化胁迫已知是相互联系的并可以通过相似机制诱导生长损害及细胞损害。Rabbani等(Plant Physiol(2003)133:1755-1767)描述了干旱胁迫与高盐度胁迫间极高程度的“交互作用”。例如,干旱和/或盐化作用主要地表现为渗透胁迫,从而导致细胞内稳态和离子分布的破坏。经常伴随高温或低温、盐度或干旱胁迫的氧化胁迫可以造成功能性蛋白和结构蛋白变性。因此,这些多样的环境胁迫常常激活相似的细胞信号途径和细胞应答,如产生胁迫蛋白、上调抗氧化物质、积累兼容性溶质和生长停滞。如本文中所用的术语“非胁迫”条件是允许植物最佳生长的环境条件。本领域技术人员清楚对于给定地点的正常土壤条件和气候条件。
本发明方法的实施产生了这样的在非胁迫条件下或在轻微干旱条件下生长的植物,其相对于可比较条件下生长的对照植物而言,具有提高的产量。因而,根据本发明,提供了用于提高在非胁迫条件下或在轻微干旱条件下生长的植物中产量的方法,所述的方法包括在植物中调节编码DREB多肽的核酸表达。
本发明方法的实施产生了在营养缺乏条件下、尤其在氮缺乏条件下培育的植物,其相对于可比较条件下培育的合适对照植物而言,具有提高的产量。因而,根据本发明,提供了用于提高在营养缺乏条件下培育的植物中产量的方法,所述的方法包括在植物中调节编码DREB多肽的核酸表达。营养缺乏可以因营养素如氮、磷酸盐和其他含磷化合物、钾、钙、镉、镁、锰、铁和硼及其他元素缺少所致。
以上提及的生长特征可以有利地在任意植物中进行调节。
如本文中所用的术语“植物”包括完整植物、植物的祖先及后代和包括种子、苗、茎、叶、根(包括块茎)、花和组织与器官在内的植物部分,其中每种前述对象包含目的基因/核酸。术语“植物”也包括植物细胞、悬浮培养物、愈伤组织、胚、分生组织区、配子体、孢子体、花粉和小孢子,同样每种前述对象包含目的基因/核酸。
根据本发明的一个优选实施方案,所述植物是作物植物。作物植物的实例包括大豆、向日葵、卡诺拉油菜、苜蓿、油菜、棉花、番茄、马铃薯和烟草。还优选地,所述植物是单子叶植物。单子叶植物的实例包括甘蔗。更优选地,所述植物是谷物植物。谷物植物的实例包括稻、玉米、小麦、大麦、谷子、小黑麦属、黑麦、高粱、二粒小麦、斯卑尔脱小麦、黑麦属、单粒小麦、埃塞俄比亚画眉草、买罗高粱和燕麦。
与本发明有关的内源性DREB蛋白指包含单个AP2结构域的蛋白质,其中所述的AP2结构域能够与启动子中所包含的DRE(脱水应答元件)元件或其片段结合。
通常,除AP2结构域之外,所述DREB蛋白也包含众多特征性保守基序,也即CMIII-1至CMIII-4和/或CMIV-1与CMIV-2,如Sakuma等2002年描述(Biochemical and Biophysical ResearchCommunications(2002),290,3,998-1009)。此外,所述DREB蛋白可以含有其功能是指导该蛋白质进入细胞核的核定位信号。核定位作用已经对例如OsDREB1L蛋白(与SEQ ID NO:336相同)进行描述(Chen等2003Theor.Appl.Genet.107:972-979)。
另外,在AP2蛋白的系统发生树中分析时,DREB蛋白倾向于在与属于其他亚家族(如Apetala 2,RAV或ERF亚家族)的包含AP2蛋白的进化支的一个独特的进化支内聚类。已经广泛地报道了AP2蛋白之间的系统发生关系(Shigyo等Gene 366(2006)256-265;Nakano等2006;Dubouzet等2003)。开展DREB蛋白系统发生关系分析的方法是本领域熟知的。通常,使用众多可获得的方法之一(如CLUSTAL X或在VectorNTI(Invitrogen)的Align AlignX中提供的方法)进行蛋白质序列的比对。将比对序列输入,使用算法如在Vector NTI(Invitrogen)或在PHYLIP软件包或在MOLPHY版本2.3b3(Adachi和Hasegawa,1996)中提供的那些算法,构建系统发生树。构建了最大或然性树。所述树的或然性可以使用例如ProtML程序在JTT模式下计算,和所述树可以根据其Akaike信息标准(AIC)值(Adachi和Hasegawa,1996)进行分类。每个分支的局部引导(bootstrap)概率可以使用再采样-评估对数-或然性(RELL)方法(Kishino等,1990;Hasegawa和Kishino,1994)进行评估。在图25中显示AP2蛋白的系统发生树的实例,该系统发生树显示了其中DRE蛋白质聚类的所述独特进化支。优选地,在本发明方法中使用的DREB蛋白聚集在NP_567719组内。
AP2结构域是本领域技术人员熟知的,并且在数据库例如pfam、interpro和smart中广泛描述(Bateman等,Nucleic Acids Research 30(1):276-280(2002);Mulder等,(2003)Nucl.Acids.Res.31,315-318;Letunic等(2006)Nucleic Acids Res 34,D257-D260)。序列“.a+GVp.+.hG.+W.ucItcs..........ttclaLGoFsot-tAAhAYD.AAhhhhG..pAhhNFs....tt”(SEQ ID NO:340)代表如在SMART数据库提供的AP2结构域的共有序列。AP2结构域在SMART数据库中的登录号是SM00380。在缩写中使用的氨基酸分组在表4中给出。可以允许空位和插入,其中所述空位和插入一般至多到5个氨基酸。AP2结构域长大约60-70个氨基酸并且具有DNA结合活性(Ohme-takagi和Shinshi;Plant Cell 1995;7:173-182)。它例如与发病机理相关蛋白的启动子中存在的GCC盒结合(Liu等2006.FEBS Lett.580(5):1303-8)。
表4.在AP2共有序列(SEQ ID NO:340)中使用的氨基酸分组的代码。“类”指氨基酸分类,“关键码”指对某类所用的代码。“残基”指属于给定类别的氨基酸。
  类   关键码   残基
  醇   o   S、T
  脂族的   l   I、L、V
任意 ·   A、C、D、E、F、G、H、I、K、L、M、N、P、Q、R、S、T、V、W、Y
  芳族的   a   F、H、W、Y
  带电荷的   c   D、E、H、K、R
疏水的 h   A、C、F、G、H、I、K、L、M、R、T、V、W、Y
  带负电荷的   -   D、E
  极性的   p   C、D、E、H、K、N、Q、R、S、T
  带正电荷的   +   H、K、R
  小的   s   A、C、D、G、N、P、S、T、V
  微小的   u   A、G、S
  转角样的   t   A、C、D、E、G、H、K、N、Q、R、S、T
鉴定AP2结构域的方法在本文中描述,实施例49还提供了此类方法的细节。与本发明相关的DREB蛋白包含这样的AP2(DNA-结合)结构域,其以增加的优选顺序与如SEQ ID NO:340或SEQ ID NO:341代表的结构域具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或更大的序列同一性。
DREB蛋白可以与胁迫应答基因的启动子中存在的由DRE(脱水应答元件)、CRT(C-重复序列)和LTRE(低温应答元件)元件代表的顺式元件结合。核酸序列TACCGACAT代表DRE元件,其中CCGAC核心基序也包含在如拟南芥胁迫基因启动子中存在的CRT和LTRE基序。DREB蛋白特异性地与DRE元件中由(G/a)(C/t)CGAC(SEQ ID NO:342)所代表的6核苷酸结合。本领域技术人员将能够使用标准生物信息学手段和分子手段轻易地鉴定多核苷酸序列中的DRE/CRT/LTRE基序。DREB蛋白与DRE/CRT/LTRE基序的蛋白质-DNA结合作用可以在体内例如在单杂交筛选中或在体外使用凝胶迁移率测定法分析。这些方法是本领域熟知的并且在本领域中描述(Xue,Biochim Biophys Acta.(2002)1577(1):63-72;HaoD等Biochemistry.2002年4月2日;41(13):4202-8;Dubouzet等2003;Qin等.2004Aug;45(8):1042-52)。
与本发明有关的DREB蛋白能够与包含如SEQ ID NO:342代表的DRE元件的DNA分子结合。
AP2/ERF蛋白已经基于其氨基酸序列中存在的保守基序进行分类。本发明方法中使用的DREB蛋白属于如Sakuma等2002(Biochemical和Biophysical Research Communications,290,998-1009)定义的AP2/ERF转录因子的亚组A-1和A-2或备选地属于根据Nakano等,2006(PlantPhys.140,411-432)分类的组IIIc、IVa和IVb内。
根据Nakamo等2006,除AP2结构域之外,IIIc组中的拟南芥DREB蛋白还包含众多保守基序,即CMII-1-CMIII-4;CMIII-1可以由序列PELAWSLPRPESTSPKDIQAAAAEAAAMF(SEQ ID NO:343)代表。CMII-2可以由序列QSCGAFFMDEEAMLGMPNLLANMAEGMLLPPP(SEQ ID NO:344)代表,CMIII-3可以由序列DYDPTLAESCPKKPAGRKKFR(SEQ ID NO:345)代表并且CMIII-4可以由序列LWSY(SEQ IDNO:346;从Nakano等2006改编)代表。基序CMIII-2和CMIII-4一般位于羧基端区域。基序CMIII-2和CMIII-4包含在拟南芥CBF1/DREB1B蛋白的羧基端98个氨基酸部分,其中报道证实所述的羧基端氨基酸部分发挥反式激活结构域作用(Wang等,2005,Plant Mol Biol 58:543-559)。
CMIII-3基序指存在于AP2/ERF两侧的高度保守区域。在这两个区域PKK/RPAGRxKFxETRHP(区域I)(其中X代表任意氨基酸(SEQ ID NO:347))和DSAWR(区域II)(SEQ ID NO:348)中保守序列的存在是在几个植物物种的DREB蛋白中保守(Jaglo等,2001,Plant Physiol 127:910-917;Haake等,2002Plant Physiol 130:639-648)。
属于根据Nakano等2006的IV组的DREB蛋白包含如分别由保守序列K/RGKGGPxN(SEQ ID NO:349)和KKRKRRGGRDVAEILKKWKEYNEQVEADSCIDGGGPKKIRK(SEQ ID NO:350)代表的基序CMIV-1和CMIV-2,其中X可以是任意氨基酸。CMIV-2基序包括推定的核定位信号(Liu等,1998)。
一般地,在包含AP2结构域的多肽中存在与基序CMIII-1至CMIII-4、区域I和II、基序CMIV-1和CMIV-2相同或充分同源的至少一个保守基序应当足以将任意查询序列鉴定为DREB蛋白,但是,优选的是存在至少PKK/RPAGRxKFxETRHP(区域I)和DSAWR(区域II)。
作为保守基序提供的共有序列主要基于拟南芥DREB蛋白的序列。本领域技术人员将会充分认识到所述共有序列可以某种程度地变化,包括因缺失或插入氨基酸而变化,如果使用其他或不同的序列(例如来自其他生物的序列)进行比较。优选地,CMIII-1至CMIII-4和基序CMIV-1和CMIV-2的保守序列以增加的优选顺序与任意保守基序CMIII-1至CMIII-4、CMIV-1和CMIV-1至少50%、55%.60%、65%、70%、75%、80%、85%、90%或95%相同。最优选地,所述保守基序是在稻蛋白OsDREB1A或Os09g0522200中存在的那些保守基序,如图23中描述。
优选地,与本发明有关的DREB蛋白包含:
(i)以增加的优选顺序与SEQ ID NO:340或SEQ ID NO:341具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或更大序列同一性的AP2DNA-结合结构域,和
(ii)以增加的优选顺序与SEQ ID NO:343至SEQ ID NO:350的任意序列具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或更大序列同一性的一个或多个保守基序。
甚至更优选地,用于本发明方法的DREB蛋白包含:
(i)以增加的优选顺序与SEQ ID NO:340或SEQ ID NO:341具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或更大序列同一性的AP2DNA-结合结构域,和
(ii)以增加的优选顺序与SEQ ID NO:343至SEQ ID NO:348的任意序列具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或更大序列同一性的一个或多个保守基序。
本发明方法中使用的DREB蛋白和DREB基因的实例在实施例46中提供。
进一步优选的与本发明有关的DREB蛋白包含这样的序列,其以增加的优选顺序与实施例46中给出的任一氨基酸序列具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或更大的序列同一性。最优选地,所述DREB蛋白具有实施例46中给出的任意序列,最优选地具有如SEQ ID NO:336中给出的任意序列。
本文中谈及的植物中内源性DREB基因表达的“降低或基本上消除”意指与对照植物相比时,DREB基因转录和/或DREB mRNA的水平和/或浓度降低或减少。这种降低或基本上消除可以导致降低或减少或基本上消除植物中DREB mRNA活性。与对照植物相比较,减少、降低或基本上消除为以增加的优选顺序至少10%、20%、30%、40%或50%、60%、70%、80%、85%、90%或95%、96%、97%、98%、99%或更多。
本文中谈及的植物中内源性DREB蛋白的水平“降低”意指相对于对照植物存在的内源性DREB蛋白水平而言,DREB蛋白水平和/或蛋白质浓度降低或减少,或基本上消除内源性DREB蛋白。这种降低或基本上消除可以导致降低或基本上消除植物中的DREB蛋白活性。相对于对照植物,所述减少、降低或基本上消除为以增加的优选顺序降低至少10%、20%、30%、40%或50%、60%、70%、80%、85%、90%或95%、96%、97%、98%、99%或更多。
本文中谈及的植物中内源性DREB蛋白的活性“降低”意指相对于对照植物存在的内源性DREB蛋白活性水平,DREB蛋白活性降低或减少和/或内源性DREB蛋白的活性基本上消除。相对于对照植物,所述减少、降低或基本上消除是以增加的优选顺序降低至少10%、20%、30%、40%或50%、60%、70%、80%、85%、90%或95%、96%、97%、98%、99%或更多。
优选地,内源性DREB蛋白水平和/或活性的降低通过下调内源性DREB基因的表达获得。
本文中对“内源的”DREB基因的称谓指如植物中以其天然形式(即没有任何人工介入)存在的DREB基因。“降低或基本上消除”DREB基因的表达和/或与本发明有关的DREB蛋白的水平和/或活性也可以影响DREB转基因,即随后导入植物的分离的DREB基因。与对照植物相比较,本发明方法在含有DREB转基因的转基因植物上的开展导致降低或基本上消除DREB内源基因和/或转基因表达和/或导致降低或基本上消除DREB蛋白的水平和/或活性。
在一个优选的实施方案中,降低或基本上消除内源性DREB基因表达和/或DREB蛋白的水平和/或活性通过导入DREB核酸或与DREB基因基本上同源的片段获得,更优选地,所述分离的核酸能够形成发夹结构,进一步优选地,所述分离的核酸处于组成型启动子的控制下。
为降低或基本上消除植物中内源基因的表达,需要核酸序列的基本上连续核苷酸的足够长度。为了开展基因沉默,该长度可以是短至20、19、18、17、16、15、14、13、12、11、10或更少个核苷酸,或者,或者该长度可以长至完整基因(包括部分或完整的内含子、5’和/或3’UTR(非翻译区))。基本上连续的核苷酸的片段可以从SEQ ID NO:335或从实施例1中给出的任意核酸序列或从能够编码实施例46中给出的任一氨基酸序列的同源物(直向同源物或旁系同源物,术语“直向同源物”和“旁系同源物”如本文中定义)的任何核酸衍生。对于本文中讨论的多种方法而言,降低或基本上消除内源基因的表达不要求编码(功能性)多肽的核酸序列。
内源性DREB基因表达的这种降低(或基本上消除)可以使用熟知基因沉默方法中的任意一种或多个几种方法实现。如本文中所用的“基因沉默”或表达“下调”指DREB基因表达和/或DREB蛋白水平和/或DREB蛋白活性的降低或基本上消除。对于下调表达的技术的描述可以在定义部分中找到。
用于降低或基本上消除内源性DREB基因表达的这样一种方法是RNA介导的基因表达下调(RNA沉默)。在这种情况下,沉默作用在植物中由与靶DREB基因基本上同源的双链RNA分子(dsRNA)触发。这种dsRNA进一步由植物加工成长约21至约26个核苷酸的所谓短干扰性RNA(siRNA)。该siRNA被掺入RNA诱导的沉默复合体(RISC)中,其中所述的RISC切割DREB靶基因的mRNA,因而降低或基本上消除待翻译成DREB蛋白的DREB mRNA的数目和/或降低其浓度。本发明的siRNA具有这样的序列,其与贯穿靶基因完整序列的约21个基本上连续核苷酸的片段相对应。优选地,如SEQ ID NO:335中所述的靶基因衍生的本发明中有用的siRNA可以包括多个RNA分子,所述的RNA分子选自与SEQ IDNO:335中任意给出的18-26个连续核苷酸基本上相同的寡核苷酸。
优选含有与靶基因的一部分相同或基本上同源的核苷酸序列的dsRNA以实现DREB基因表达的降低或基本上消除。然而,本发明具有能够容忍序列变异的优势,其中所述的序列变异可以预计因遗传突变、株多态性或进化趋异所致。相对于靶序列具有插入、缺失和单个点突变的RNA序列也可以用于降低。优选所述siRNA与所述DREB基因之间大于90%、92%、94%、96%、98%序列同一性或甚至达100%的序列同一性。或者,可以功能性地将所述RNA的双链体区域定义为能够与靶基因转录物的一部分在严格条件(例如400mM NaCl,40mM PIPES pH 6.4,1mM EDTA,在60摄氏度持续12-16小时;随后洗涤)下杂交的核苷酸序列。基本上相同的双链核苷酸序列的长度可以是所靶向DREB基因的至少约21(包括至少15),25,50,100,200,300,400,500个核苷酸或更多个核苷酸长,直至所靶向DREB基因的全部长度。在一个优选的实施方案中,双链核苷酸序列的长度是从约21(至少15)至约400或500个核苷酸长,且它与所靶向DREB基因的全部长度相等或较之短。
RNA沉默方法的一个实例涉及将基因序列或其部分以有义方向导入植物。“有义方向”指与其mRNA转录物同源或相对应的DNA。因而将已经存在于宿主植物内的DREB基因的至少一个(完整或部分)额外拷贝导入植物。所述额外基因或其部分将使内源性DREB基因沉默,产生所谓共抑制现象。若将几个额外拷贝导入植物,将更明显地降低DREB基因表达,原因是存在高转录物水平和触发共抑制作用之间的正相关。
RNA沉默方法的另一个实例包括使用反义DREB核酸序列。″反义″核酸包含与编码蛋白质的″有义″核酸互补(例如与双链cDNA分子的编码链互补或与mRNA序列互补)的核苷酸序列。因此,反义核酸可以与有义核酸杂交。所述反义核酸可以与DREB完整编码链或仅与其一部分互补。反义核酸可以根据Watson和Crick碱基配对原则设计。所述反义核酸分子可以反义于″编码区″或反义于DREB基因的已转录mRNA或前mRNA的″非编码区″。术语″编码区″指核苷酸序列中包含待翻译成氨基酸残基的密码子的区域。术语″非编码区″指基因中或其已转录的RNA中位于所述编码区之外的序列。此类非编码区可以至少部分地包含5’前导序列、3’UTR(非翻译区)和内含子中的任一种。
反义核酸分子可以与DREB mRNA的完整编码区互补,但是它优选地是仅反义于DREB mRNA的编码区或非编码区中一部分的寡核苷酸。例如,反义寡核苷酸可以与DREB mRNA的翻译起始位点周围的区域互补。合适反义寡核苷酸的长度是本领域已知的并且可以从约20个核苷酸长度或更短开始。本发明的反义核酸可以利用化学合成和酶连接反应,使用本领域已知方法构建。例如,反义核酸可以使用天然存在的核苷酸或多种修饰的核苷酸化学地合成,其中所述修饰的核苷酸设计旨在提高分子的生物学稳定性或提高反义核酸序列与有义核酸序列之间形成的双链体的物理稳定性,例如,可以使用硫代磷酸酯衍生物和吖啶取代的核苷酸。可以用来产生所述反义核酸的修饰核苷酸的实例是本领域熟知的。
已知的核苷酸修饰包括甲基化、环化和′加帽′和用类似物(如肌苷)替换一个或多个天然存在的核苷酸。核苷酸的其他修饰作用是本领域技术人员熟知的。
备选地,所述反义核酸可以使用表达载体以生物学方式产生,其中已经将一种核酸以反义方向亚克隆(即从所插入核酸转录出的RNA将与目的靶核酸为反义方向,这在下文的子部分中进一步描述)至所述表达载体。优选地,植物中反义核酸的产生借助稳定整合的转基因进行,其中所述的转基因包含对植物胚乳组织中优先表达有效的启动子、反义寡核苷酸和终止子。
表达的这种降低或基本上消除可以使用例行手段和技术实现。用于降低或基本上消除植物中内源基因表达的优选方法是通过在植物中导入并表达这样的基因构建体,其中已经将本发明方法中使用的核酸克隆为被间隔序列(非编码的DNA)分开的反向重复序列(部分或完全地)至所述基因构建体内。
在这种的优选方法中,使用在本发明方法中使用的核酸或其部分的反向重复序列(其优选能够形成发夹结构),通过RNA介导的沉默作用降低或基本上消除所述内源基因的表达。在包含调控序列的表达载体中克隆所述反向重复序列。非编码性DNA核酸序列(间隔序列,例如基质附着区片段(MAR)、内含子、多接头等)位于形成所述反向重复序列的两个反向核酸之间。在该反向重复序列转录后,形成具有自身(部分或完全)互补结构的嵌合DREB RNA。这种双链RNA结构称作发夹RNA(hpRNA)。这种hpRNA由植物加工成掺入RISC中的siRNA。所述RISC进一步切割DREB靶基因的mRNA,因而降低或基本上消除待翻译成DREB蛋白的DREB mRNA的数目。参见例如Grierson等(1998)WO 98/53083;Waterhouse等(1999)WO 99/53050)
本发明方法中用于沉默作用的核酸分子(无论向植物导入或原位(insitu)产生)与包含DREB基因的细胞mRNA和/或基因组DNA区域杂交或结合,旨在因此抑制蛋白质的表达,例如通过抑制转录和/或翻译而做到这一点。杂交可以因常规核苷酸互补性以形成稳定双链体引起,或例如在与DNA双链体结合的反义核酸分子的情形下,通过在双螺旋大沟内的特异性相互作用引起。反义核酸序列可以通过转化法或在特定组织部位处的直接注射法导入植物。或者,反义核酸分子可以受到修饰以靶向所选的细胞并然后全身性施用。例如,对于全身性施用,可以修饰反义核酸分子,从而它们与表达在所选细胞表面上的受体或抗原特异性地结合,例如通过将所述反义核酸分子连接至与细胞表面受体或抗原结合的肽或抗体连接而做到这一点。所述反义核酸分子也可以使用本文中所述的载体递送至细胞。
根据又一个方面,反义核酸是α-端基异构核酸分子。α端基异构核酸分子形成具有互补RNA的特定双链杂交体,在所述双链杂交体中与常见的b-单元相反,所述链彼此平行地分布(Gaultier等(1987)Nucl Ac Res 15:6625-6641)。反义核酸分子也可以包含2′-O-甲基核糖核苷酸(Inoue等(1987)Nucl Ac Res 15,6131-6148)或嵌合RNA-DNA类似物(Inone等(1987)FEBS Lett.215,327-330)。
人工和/或天然微RNA(miRNA)可以用来减少基因表达和/或mRNA翻译。内源性miRNA是通常长19-24个核苷酸的单链小RNA。它们主要发挥调节基因表达和/或mRNA翻译的功能。大多数的植物微RNA(miRNA)与其靶序列完全互补或接近完全互补。然而,存在具有多达5个错配的天然靶。它们由Dicer家族的双链特异性RNA酶从具有特征性折返结构的较长非编码性RNA加工而来。加工后,它们通过与RNA诱导的沉默复合体(RISC)的主要成分-Argonaute蛋白结合被掺入该复合体。miRNA充当RISC的特异性成分,因为它们与胞浆内的靶核酸(大多是mRNA)发生碱基配对。后续调节事件包括靶mRNA切割和破坏和/或翻译抑制。miRNA过量表达的作用因此往往反映为靶基因的mRNA水平降低。
天然miRNA存在于自然界中。不过人工微RNA(amiRNA)同等地用于本发明的方法中。可以按照遗传工程方式专门设计通常长21或24个核苷酸的amiRNA以负向调节单个或多个目的基因的基因表达。选择植物的微RNA靶的决定因素是本领域熟知的。已经定义了用于靶识别的经验参数并且可以使用它们来辅助设计特定的amiRNA,Schwab R等,2005(DevCell.(2005)8(4):517-27)。用于设计并产生amiRNA及其前体的便利手段也是公众可获得的(Schwab等,2006Plant Cell.200618(5):1121-33)。
根据本发明的另一个特征,所述降低或基本上消除优选地通过使用微RNA(天然或人工miRNA)实现。
在又一个实施方案中,在本发明方法中使用的反义核酸是核酶。核酶是具有核糖核酸酶活性的催化性RNA分子,能够切割与其具有互补区域的单链核酸,如mRNA。因此,核酶(例如锤头状核酶(其在Haselhoff和Gerlach(1988)Nature 334,585-591,1988中描述)可以用来催化性地切割DREB mRNA转录物,以因而抑制DREB mRNA翻译。基于DREB cDNA的核苷酸序列,可以设计具有针对编码DREB的核酸特异性的核酶。例如,可以构建四膜虫(Tetrahymena)L-19IVS RNA的衍生物,在衍生物中活性部位的核苷酸序列与编码DREB的mRNA中待切割的核苷酸序列互补。参见Cech等美国专利号4,987,071;和Cech等美国专利号5,116,742。或者,DREB mRNA可以用来从RNA分子汇集物中选出具有特异性核糖核酸酶活性的催化性RNA。见例如Bartel和Szostak(1993)Science 261,1411-1418,1993)。核酶用于植物中基因沉默的用途是本领域已知的(例如Atkins等(1994)WO 94/00012;Lenne等(1995)WO 95/03404;Lutziger等(2000)WO 00/00619;Prinsen等(1997)WO 97/13865和Scott等(1997)WO97/38116)。
基因沉默作用也可以通过插入诱变(例如T-DNA插入或转座子插入)或通过如Angell和Baulcombe 1998(Amplicon VIGS WO 98/36083);Baulcombe(WO 99/15682)及其他人描述的基因沉默策略而实现。
当内源性DREB基因中存在突变和/或在随后导入植物的分离的DREB基因中存在突变时,基因沉默也可以出现。例如,导入此类突变的方法可以是EMS(甲磺酸乙酯)处理法。DREB蛋白活性的降低或基本上消除可以由无功能的DREB蛋白引起。例如,DREB可以与多种相互作用蛋白结合;一个或多个突变因而可以产生仍能够结合至相互作用蛋白但不能表现其作为转录因子的正常功能的DREB蛋白。
基因沉默的又一种方法是靶向与DREB基因调节区(例如,DREB启动子和/或增强子)互补的核苷酸序列以形成阻止靶细胞中DREB基因转录的三股螺旋结构。见Helene,C.,Anticancer Drug Res.6,569-84,1991;Helene等,Ann.N.Y.Acad.Sci.660,27-36 1992和Maher,L.J.Bioassays14,807-15,1992。
技术人员熟知其他方法,如使用针对内源性多肽的抗体以抑制其在植物中的功能,或干扰多肽参与其中的信号途径。尤其,可以构思人造分子用于抑制靶多肽的生物学功能,或用于干扰所述靶多肽参与的信号途径。
备选地,可以建立筛选程序以鉴定植物群体中基因的天然变体,其中所述的变体编码活性降低的多肽。也可以使用此类天然变体例如旨在开展同源重组。
Hiratsu等(Plant J.34,733-739,2003)描述了基因沉默的又一种方法。此方法不依赖与靶向基因的序列同源性,但是涉及使用转录性基因融合物中的抑制序列结构域,并且该方法已经用来改良有农学意义的性状(Fujita等,Plant Cell 17,3470-3488,2005和Mitsuda等,Plant Cell 17,2993-3006,2005)。通常,在编码能够正向影响靶向基因表达的蛋白质(如转录激活蛋白)的基因与编码抑制结构域的核苷酸片段之间产生核苷酸嵌合融合物。在表达所述嵌合基因融合物后,靶向基因的表达被抑制,通常以显性阴性方式被抑制,从而降低和消除该转录因子的活性。抑制结构域是本领域熟知的,例如存在于一些AP2和锌指转录因子中的EAR基序。基于抑制结构域的方法非常适于克服所选植物物种中靶向基因的基因冗余性(Hiratsu等Plant J.2003年6月;34(5):733-9.)。
上文所述是用于基因沉默(用于降低或基本消除内源性DREB基因表达和该蛋白质活性)的多种方法的实例。本发明方法取决于降低植物中内源性DREB基因的表达。例如,本领域技术人员将轻易地能够调整用于基因沉默的前述方法,从而例如通过使用适宜的启动子在整株植物或在其部分中实现基因沉默。
应当指出本发明的实质在于降低或基本上消除植物中内源性DREB基因表达后发现的有利且出人意料的结果,并且不限于用于这样降低或基本消除内源性DREB蛋白活性的任何具体方法。也可以通过导入遗传修饰(优选地在DREB基因的基因座内)降低或消除DREB蛋白的活性。如本文中定义的基因的基因座意指包括目的基因和编码区上游或下游10kb的基因组区域。
所述遗传修饰可以例如通过以下方法中任意一种(或多种)方法导入:T-DNA失活法、TILLING、位点定向诱变法、定向进化法、同源重组法。导入该遗传修饰后,随后是选择活性降低的DREB蛋白的步骤,其中活性的降低产生具有提高的产量的植物。
T-DNA失活标签法涉及T-DNA在目的基因的基因组区域中或基因的编码区上游或下游10kb以这样的方式插入,从而此T-DNA抑制靶基因的表达。通常,所述靶基因的天然启动子对所述靶基因表达的调节作用被破坏。T-DNA随机地插入植物基因组,例如通过农杆菌感染,并且导致在插入的T-DNA附近的基因表达下调。所得的转基因植物表现出因在导入的T-DNA附近的基因表达受抑制所致的表型。
也可以使用TILLING(基因组中定向诱导的局部损伤)技术将遗传修饰导入DREB基因的基因座内。这种诱变技术用来产生、鉴定和分离不能够表现DREB活性的DREB核酸的诱变变体。TILLING还允许选择携带此类突变变体的植物。这些突变变体可以彻底缺少DREB活性。TILLING的原理在定义部分中描述。
位点定向诱变和随机诱变可以用来产生DREB核酸的变体。几种方法可用于实现位点定向诱变,最常见的方法是基于PCR的方法(CurrentProtocols in Molecular Biology.Wiley编辑)。
定向进化也可以用来产生DREB核酸的变体。这由以下内容组成:反复DNA改组,随后合适地筛选和/或选择以产生DREB核酸的变体或所述变体的编码具有改良(此处是降低或消除的)生物学活性的DREB蛋白的变体(Castle等,(2004)Science 304(5674):1151-4;美国专利5,811,238和6,395,547)。
T-DNA激活法、TILLING、位点定向诱变法和定向进化法是能够产生新等位基因和DREB变体的技术的实例。
同源重组允许在基因组中导入所选择的核酸于定义的所选位置处,优选地导入至DREB基因的基因座。
技术人员熟知其他方法,如使用针对内源性DREB的抗体以抑制其在植物中的功能,或干扰DREB参与的信号途径。备选地,可以建立筛选程序以鉴定DREB基因的天然变体,其中所述的变体具有降低的DREB活性,或根本没有DREB活性。此类天然变体也可以用于本发明的方法中。
为了最佳性能,用于降低或基本消除内源性DREB基因表达的基因沉默技术需要使用来自单子叶植物的DREB基因序列以转化至单子叶植物。优选地,将来自给定植物物种的DREB基因序列导入相同的物种。例如,来自稻的DREB基因序列(是全长DREB序列或片段)转化至稻植物。DREB基因序列不需要导入相同的植物品种。
“DREB基因”或“DREB核酸”指这样的脱氧核糖核苷酸聚合物或核糖核苷酸聚合物,其包含与编码DREB蛋白的基因的转录区域同源或相对应的序列。以上提及的聚合物可以是任意长度,为单链或双链,或是其类似物,它们具有天然核糖核苷酸的本质特征,因为它们可以类似于天然存在的多核苷酸的方式与核酸杂交。
在本发明方法中使用的核酸指一般从编码DREB蛋白的基因衍生的足够长度的基本上连续的核苷酸,以使得编码DREB蛋白的基因发生沉默;这种核酸可以短至20个或更少核苷酸。编码(功能性)蛋白质的基因不是以上讨论的用于降低或基本消除DREB内源基因表达和/或DREB蛋白水平和/或活性的多种方法所需的条件。
本发明方法可以使用DREB基因/核酸中足够长度的基本上连续的核苷酸进行,其中所述的基本上连续的核苷酸可以由21个或更少(一般至少10个)核苷酸组成,可以来自DREB基因/核酸的任意部分,如在DREB基因家族中非常保守的AP2编码区或来自DREB基因中非编码区的任意部分。
编码DREB蛋白的基因是本领域熟知的,并且在本发明方法中使用的是所述植物DREB基因/核酸的基本上连续的核苷酸(Qin等Plant CellPhysiol.2004年8月;45(8):1042-52;Li等Theor Appl Genet.2005年5月;110(8):1355-62;Nakano等Plant Physiol.140,411-432,2006Badawi等.Mol Genet Genomics.2007年2月7日;Huang等J Plant Physiol.2007年1月13日)。
其他DREB基因/核酸衍生性序列也可以在本发明的方法中使用,并且可以由本领域技术人员轻易地鉴定。DREB蛋白可以通过存在的几个熟知特征(见上文)中的一个或多个特征而鉴定。在鉴定DREB蛋白后,本领域技术人员可以使用常规技术轻易衍生相应的编码性核酸序列,并且使用该核酸序列的足够长度的连续核苷酸开展任何一种或多种上文所述的基因沉默方法。
植物DREB蛋白也可以通过某些保守基序的存在而被鉴定。可以使用如上文中所述比较的序列比对方法鉴定这些保守基序的存在。在一些情况下,可以调整默认参数以调节搜索的严格性。例如使用BLAST,可以提高用于报告针对数据库序列的匹配的统计显著性阈值(称作“期望”值)以显示严格性较低的匹配。当使用基序CMIII-1至CMIII-4或基序CMIV-1和CMIV-2时,对于鉴定DREB蛋白的匹配的预期值一般低于e-07,更一般地低于e-10、e-15、e-20、e-25、e-30、e-35、e-40、e-45、e-50或e-100。以这种方式,可以鉴定几乎精确的短匹配。一旦通过这些基序的存在鉴定到DREB蛋白,本领域技术人员可以容易地衍生相应的核酸,所述核酸编码包含相关基序的多肽,并且使用所述核酸的足够长度的连续核苷酸来开展上文所述基因沉默方法中任何一种或多种方法(用于降低或基本上消除内源性DREB基因表达和/或DREB蛋白的水平和/或活性)。
如上文定义的同源物可以使用本领域熟知的常规技术,如通过序列比对法轻易地鉴定;DREB蛋白的同源物可以已经在多种植物物种中以不同名称命名,因此,基因/蛋白质名称不应当用于鉴定直向同源物或旁系同源物。用于比对序列以进行比较的方法是本领域熟知的,此类方法包括GAP、BESTFIT、BLAST、FASTA和TFASTA。GAP使用Needleman和Wunsch算法((1970)J Mol Biol 48:443-453)以找到使匹配数最大化并使空位数最小化的两个完整序列的比对。BLAST算法(Altschul等(1990)JMol Biol 215:403-10)计算序列同一性百分数并在两个序列之间开展相似性的统计分析。用于开展BLAST分析的软件是通过国家生物技术信息中心可公开获得的。同源序列可以使用例如具有默认配对比对参数的ClustalW多重序列比对算法(版本1.83)和百分数评分方法轻易地鉴定。如本领域技术人员显而易见,可以进行少许手工编辑以优化保守基序之间的比对结果(见下文)。此外,作为使用全长序列以鉴定同源物的替代,也可以使用特定结构域。利用上文提及的程序,使用默认参数,可以在完整核酸或氨基酸序列范围内或所选结构域或保守基序范围内确定序列同一性值。对于局部比对,Smith-Waterman算法是特别有用的(Smith TF,WatermanMS(1981)J.Mol.Biol 147(1);195-7)。
术语“结构域”、“标签”和“基序”在本文中的“定义”部分定义。DREB蛋白中的多种结构性结构域可以使用专业数据库例如SMART(Schultz等(1998)Proc.Natl.Acad.Sci.USA 95,5857-5864;Letunic等(2002)NucleicAcids Res 30,242-244;InterPro(Mulder等,(2003)Nucl.Acids.Res.31,315-318;Prosite(Bucher和Bairoch(1994)。用于生物分子序列基序的概括特征结构及其在自动化序列解读中的功能(在)ISMB-94;第二届分子生物学智能系统国际会议文集。Altman R.,Brutlag D.,Karp P.,Lathrop R.,Searls D.编辑,第53-61页,AAAIPress,Menlo Park;Hulo等,Nucl.Acids.Res.32:D134-D137,(2004)或Pfam(Bateman等,Nucleic AcidsResearch 30(1):276-280(2002))鉴定。一组用于计算机方式分析蛋白质序列的工具可在ExPASY蛋白质组服务器上获得(瑞士生物信息研究所维护(Gasteiger等,ExPASy:深入认识和分析蛋白质的蛋白质组服务器,Nucleic Acids Res.31:3784-3788(2003))。也可以使用常规技术如通过序列比对鉴定结构域或基序。
另外,DREB蛋白也可以因其结合DNA和与其他蛋白质相互作用的能力而可鉴定。DNA结合活性和蛋白质-蛋白质相互作用可以使用本领域熟知的技术在体外或在体外轻易地确定。用于DNA结合活性的体外测定法的实例包括:使用已知DREB DNA结合结构域的凝胶阻滞分析(Sakuma等2002)或酵母单杂交测定法(Qin等2004)。备选地,DREB蛋白的活性可以通过测量反式激活其中含有DRE的启动子驱动报道基因表达的报道构建体表达的能力确定,例如通过测定所产生报道分子产物的量或活性进行测量。一个这样的实例是原生质体系统,该系统基于包含偶联于UidA基因的拟南芥rd29A启动子的报道构建体和随后测定GUS活性(Dubouzet等2003)。用于蛋白质-蛋白质相互作用的体外测定法的实例是酵母双杂交分析(Fields和Song(1989)Nature 340:245-6)。已知与DREB相互作用的蛋白质包括ADA2和GCN5,Stockinger等(Nucleic Acids Res.2001;29(7):1524-33)。已知与DREB基因启动子结合并且因此影响其基因表达的蛋白质包括ICE1(Chinnusamy等Genes Dev.2003年4月15日;17(8):1043-54)。
因而在使用上文所述的一个或几个特征鉴定DREB蛋白后,本领域技术人员可以容易地衍生编码所述多肽的相应核酸,并且使用所述核酸的足够长度的连续核苷酸来开展上文所述基因沉默方法中任何一种或多种方法(以降低或基本上消除内源性DREB基因表达)。
优选用于本发明方法中的是SEQ ID NO:335(OsDREB1A)的足够长度的基本上连续核苷酸,或使用编码OsDREB1A(SEQ ID NO:335)的直向同源物或旁系同源物的核酸序列的足够长度的基本上连续的核苷酸。在实施例46中提供OsDREB1A蛋白的此类直向同源物和旁系同源物的实例。OsDREB1A的优选同源物是由表Y2中列出的蛋白质序列所代表的蛋白质。
例如单子叶植物物种中的直向同源物可以通过开展所谓交互性blast搜索轻易地找到。这可以通过第一blast进行,所述的第一blast包括将查询序列(例如,SEQ ID NO:335或SEQ ID NO:336)针对任意序列数据库,如可公开获得的NCBI数据库进行BLAST。当从核苷酸序列开始时,一般使用BLASTN或TBLASTX(使用标准默认值),并且当从蛋白质序列开始时,使用BLASTP或TBLASTN(使用标准默认值)。可以任选地筛选BLAST结果。筛选结果或非筛选结果的全长序列随后针对来自生物的序列进行反向BLAST(第二BLAST),其中所述查询序列从所述生物衍生(在查询序列是SEQ ID NO:335或SEQ ID NO:336的情况下,所述第二blast因而将针对稻序列进行)。随后比较第一BLAST和第二BLAST的结果。若来自第二blast的高阶位命中源自与衍生查询序列的物种相同的物种,则鉴定到旁系同源物;若高阶位命中不是源自与衍生查询序列的物种相同的物种,则鉴定到直向同源物。高阶位命中是具有低E-值的那些命中。E-值越低,评分越显著(或换句话说,偶然发现该命中的几率越低)。同一性百分数指两个所比较的核酸(或多肽)序列之间特定长度范围内相同的核苷酸(或氨基酸)的数目。E-值的计算是本领域熟知的。在大型家族的情况下,可以使用ClustalW,随后使用邻接树法,以帮助观察相关基因的聚集和鉴定直向同源物和旁系同源物。
DREB基因/核酸的基本上连续的核苷酸的来源可以是任意植物来源或人工来源。为了最佳性能,用于降低或基本消除内源性DREB基因表达的基因沉默技术需要使用来自单子叶植物的DREB序列以转化至单子叶植物。优选地,来自禾本科(Poaceae)的DREB序列转化至禾本科植物。还优选地,来自稻的DREB基因(是全长DREB序列或片段)转化至稻植物。DREB核酸不需要导入相同的植物品种。最优选地,来自稻的DREB核酸是SEQ ID NO:335(OsDREB1A)的足够长度的基本上连续的核苷酸或是下述核酸序列的足够长度的基本上连续的核苷酸,其中所述的核酸序列编码OsDREB1A(SEQ ID NO:335)的直向同源物或旁系同源物。如上文提及,本领域技术人员将十分清楚何种核苷酸将构成足够长度的基本上连续的核苷酸以开展上文定义的任意基因沉默方法,在一些情况下,这可以是短至20个或更少的基本上连续的核苷酸。
本发明也提供促进导入和/或表达在本发明方法中使用的核苷酸序列的基因构建体和载体。
因而,提供这样的基因构建体,其包含能够驱动植物中有义和/或反义DREB核酸序列表达,从而使植物中内源性DREB基因沉默的一个或多个调控序列;和任选地转录终止序列。优选地,所述调控序列是组成型和遍在性启动子。
用于基因沉默的优选构建体是包含DREB基因或其片段的反向重复序列(此反向重复序列优选能够形成发夹结构)的构建体,其中所述的反向重复序列处在组成型启动子控制下。本发明方法也可以使用可降低蛋白质水平和/或活性的其他策略进行。此类技术是本领域已知的。
在本发明方法中使用的构建体可以使用本领域技术人员熟知的重组DNA技术产生。所述基因构建体可以插入适于转化至植物并适于在转化细胞中表达目的基因的载体,所述载体可以是市售的。本发明因而提供如上文所定义的基因构建体在本发明方法中的用途。
所述目的序列有效地与能够提高植物中表达的一个或多个调控序列(至少与启动子)连接,术语“调控序列”和“启动子”如本文中定义。
有利地,任何类型的启动子可以用来驱动核酸序列的表达。优选地,DREB核酸或其功能变体有效连接至组成型启动子。优选地,能够优先地在整个植物各处表达核酸的组成型启动子具有与GOS2启动子可比较的表达谱。更优选地,组成型启动子具有与稻GOS2启动子相同的表达谱,最优选地,能够优先地在整个植物各处表达核酸的启动子是来自稻的GOS2启动子(SEQ ID NO:339或SEQ ID NO:39)。应当明白本发明的应用不限于SEQ ID NO:335所代表的DREB核酸,同时本发明的应用也不限于由GOS2启动子驱动时DREB核酸的表达。在本发明方法中使用的备选组成型启动子是高速泳动族蛋白启动子(WO2004070039中的SEQ ID NO:40)。也可以用来驱动DREB核酸表达的其他组成型启动子的实例在定义部分中显示。
任选地,可以在导入植物内的构建体中使用一个或多个终止子序列。其它的调节元件可以包括转录增强子以及翻译增强子。本领域技术人员将知道可能适用于实施本发明的终止子序列和增强子序列。如定义部分中描述,内含子序列也可以添加至5′非翻译区(UTR)或编码序列中,以增加聚集在细胞质内的成熟信使的量。(除启动子、增强子、沉默子、内含子序列、3’UTR和/或5’UTR区域之外的)其他调控序列可以是蛋白质/或RNA稳定元件。此类序列将是已知的或可以由本领域技术人员轻易获得。
基因构建体还可以包括为在特定细胞类型中维持和/或复制所需要的复制起点序列。一个实例是当基因构建体需要作为游离型遗传元件(例如质粒或粘粒分子)维持在细菌细胞中时的复制起点。优选的复制起点包括但不限于f1-ori和colE1。
为检测如在本发明方法中使用的核酸序列的成功转移和/或选择包含这些核酸的转基因植物,有利的是使用标记基因(或报道基因)。因此,所述基因构建体可以任选地包含选择标记基因。选择标记在本文的“定义”部分中更详细地描述。一旦不再需要所述标记基因时,它们可以从转基因细胞中移出或切除。用于移出标记的技术是本领域已知的,有用技术在上文定义部分中描述。
本发明也包括通过本发明方法可获得的植物,包括植物部分,其中所述的植物相对于对照植物具有提高的产量并且具有降低的或基本上消除的内源性DREB基因表达。宿主细胞和宿主植物意指作为本发明基因构建体的受体的细胞、完整植物或其部分,其中所述的本发明基因构建体一般使用转化技术导入。
本发明也提供用于产生相对于对照植物具有提高的产量的转基因植物的方法,其中所述转基因植物具有降低的或基本上消除的内源性DREB基因表达和/或DREB蛋白的水平和/或活性。
更具体地,本发明提供用于产生具有提高的种子产量的转基因植物的方法,所述方法包括:
(i)在植物、植物部分或植物细胞中导入并表达基因构建体,所述基因构建体包含能够优先地驱动有义和/或反义DREB核酸序列在植物中表达,从而使植物中内源性DREB基因表达沉默的一个或多个调控序列;和
(ii)在促进植物生长和发育的条件下培育植物、植物部分或植物细胞。
优选地,导入植物的构建体是包含DREB基因或其片段的(部分或完全)反向重复序列的构建体,所述的反向重复序列优选能够形成发夹结构。
根据本发明的优选特征,所述构建体通过转化导入植物。术语“转化”在本文的“定义”部分中更详细地描述。
经遗传修饰的植物细胞可以通过技术人员熟悉的所有方法再生。合适的方法可以在上文提及的S.D.Kung和R.Wu,Potrykus或和Willmitzer的出版物中找到。
通常在转化后,对植物细胞或细胞群体选择一个或多个标记的存在性,其中所述标记由随同目的基因一起共转移的植物可表达基因编码,随后将转化材料再生成完整植物。为了选择转化植物,在所述转化中获得的植物材料原则上经历选择性条件,从而转化植物可以与非转化植物区分。例如,可以将以上述方式获得的种子播种,并且在初始培育时间后,通过喷洒进行合适的选择。另一种可能性在于(根据需要)消毒后,在使用合适选择剂的琼脂板上培育种子,从而仅转化的种子可以长成植物。或者,对所述转化植物筛选选择标记(如上文所述的选择标记)的存在性。
在DNA转移和再生后,推定转化的植物也可以例如使用DNA印迹分析对目的基因的存在性、拷贝数和/或基因组构造进行评价。备选地或额外地,新导入的DNA的表达水平可以使用RNA印迹分析和/或蛋白质印迹分析或或定量PCR监测,全部技术均是本领域普通技术人员熟知的。
产生的转化植物可以通过多种方法繁殖,如通过克隆繁殖法或经典育种技术。例如,第一世代(或T1)转化植物可以进行自交并且选择纯合的第二世代(或T2)转化体,并且T2植物随后可以通过经典育种技术进一步繁殖。
产生的转化生物可以采取多种形式。例如,它们可以是转化细胞和非转化细胞的嵌合体;克隆性转化体(例如,被转化以含有表达盒的全部细胞);转化组织和非转化组织的移植体(例如在植物中,与未转化接穗嫁接的转化根状茎)。
本发明明确地扩展至由本文中所述的任意方法产生的任意植物细胞或植物,并扩展至全部植物部分及其繁殖体。本发明进一步扩展以包括已经由前述任意方法产生的原代转化或转染细胞、组织、器官或完整植物的后代,唯一要求是后代表现与如本发明方法中的亲代相同的基因型和/或表型特征。
本发明也扩展至植物的可收获部分,如种子和衍生、优选直接衍生自这种植物的可收获部分的产品,如干燥颗粒或粉末、油、脂肪和脂肪酸、淀粉或蛋白质。
本发明也包含DREB核酸用于降低或基本上消除植物中内源性DREB基因表达和/或DREB蛋白的水平和/或活性,以提高如上文所定义的植物种子产量的用途。
附图简述
本发明现在将参考以下附图进行描述,其中:
图1显示SEQ ID NO:2(A)和SEQ ID NO:27(B)的序列,NAP1结构域以粗体和下划线标出。
图2显示用于稻中在GOS2启动子的控制下增加编码拟南芥属植物NAP1样蛋白的核酸表达的双元载体。
图3显示来自多个植物物种的NAP1样多肽的CLUSTAL W多重序列比对结果。SEQ ID NO:2(AtNAP1样,At1g74560)以粗体显示并且对保守的NAP结构域加下划线。
图4是描述来自酵母、人和植物的NAP和SET蛋白之间关系的系统发生树。在这个系统发生树中标出的参考标识是所述序列的GenBank和MIPS(对于拟南芥)登录号。At:拟南芥,Gm:大豆,Nt:烟草(源自WO03/085115的序列),Os:稻,Ps:豌豆,Zm:玉米,Hs:智人,Sc:酿酒酵母。
图5苜蓿属植物NAP1样蛋白在大肠杆菌中表达并且通过亲和层析法借助6xHIS-标签从粗制细胞提取物纯化。从镍琼脂糖树脂以不同咪唑浓度洗脱的34kD蛋白的洗脱物使用抗6xHIS抗体(Sigma,St Louis,USA)通过蛋白质印迹法显现。
图6NAP1样蛋白在植物中具有核定位作用。A)已经使用针对纯化蛋白所产生的抗体通过间接免疫荧光法证实了苜蓿属植物NAP1样蛋白定位在培养的苜蓿细胞的细胞核中(图A的左图)。为了证实这种核定位作用,将细胞核平行地用荧光染料DAPI染色(图A的右图)。在插图中,箭头指向分裂中期细胞。微弱荧光显示在无核区室的分裂中期细胞中染色体周围的NAP1样蛋白的低丰度。B)PEG介导的基因构建体摄取至原生质体后,瞬时表达的与GFP融合的拟南芥属植物NAP1样蛋白位于拟南芥属植物细胞的细胞核内。
图7纯化的苜蓿属植物NAP1样蛋白抑制(从兔骨骼肌纯化的)PP2A的体外磷酸组蛋白H2B脱磷酸活性,但是不影响由相同酶所致的糖原磷酸化酶脱磷酸。
图8在实施本发明方法中有用的序列的实例。
图9显示SEQ ID No.41的结构域结构。加阴影的长方形表示Lsm结构域的位置。
图10显示Lsm蛋白的比对结果(图10A)和相应的系统发生树(图10B)。保守结构域的位置显示为:虚线表示α螺旋的位置;Lms基序I和II分别以单下划线和双下划线表示;对如SEQ ID No.159和SEQ ID No.160所代表的基序I和基序II加框。
图11显示用于稻中在WSI18启动子的控制下增加编码拟南芥Lsm蛋白的核酸表达的双元载体。
图12详述在实施本发明方法中有用的序列的实例。
图13示出了具有以粗体显示的细胞周期蛋白盒的SEQ ID NO:173的序列。显示了如Andersen等(1997)所区分的多种螺旋结构域(Hn、H1、H2、H3、H4、H5、H1’、H2’、H3’、H4’、H5’和Hc)。
图14显示来自多个物种的CycH多肽的CLUSTAL W多重序列比对结果。所用参数是:缓慢比对,空位开口10,空位延伸:0.1,BLOSUM矩阵。保守的氨基酸以星号显示,保守性替换由冒号显示,保守性较低的替换由小点显示。这种多重序列比对用于定义其他细胞周期蛋白H蛋白中的螺旋结构域和用于定义合适的截短以产生在本发明方法中使用的CycHTr多肽。
图15显示包含多种细胞周期蛋白多肽序列(Yamaguchi等,Plant J.24,11-20,2000)的系统发生树。与细胞周期蛋白H(如SEQ ID NO:166或SEQID NO:173的序列)聚类的序列可以用于实施本发明的方法。
图16显示用于稻中在种子特异性启动子的控制下增加编码拟南芥CycHTr蛋白的核酸表达的双元载体。
图17详述在实施本发明方法中有用的序列的实例。
图18显示了描述Remorin结构的示意图。显示了羧基端Remorin结构域(其对应于Pfam家族登录号PF03763),显示了氨基端结构域(从氨基端至羧基端包含从氨基端至羧基端Remorin结构域上游最末尾氨基酸残基处的氨基酸残基),和显示了在该多肽羧基端处包含至少一个Cys和/或一个Phe的最后10个氨基酸残基。
图19显示了预测如SEQ ID NO:199所代表的多肽的羧基端半部分中卷曲螺旋结构域的COILS算法的图形输出结果。X轴代表氨基酸残基位置,Y轴代表卷曲螺旋结构域存在的概率(范围从0至1),并且三条线代表所检验的三个窗口(14、21、28)。
图20显示了来自多个来源物种的Remorin多肽羧基端Remorin结构域和Remorin多肽羧基端末端氨基酸残基的CLUSTAL W(1;83)多重序列比对。SEQ ID NO:199的Remorin结构域由所述多肽序列上方的黑色框代表并且如此进行显示。SEQ ID NO:199的预测卷曲螺旋结构域加双下划线显示并且将推定的苏素化位点加框显示,另外,在该比对中对Remorin多肽通常包含至少一个Cys和/或一个Phe的羧基端氨基酸残基加框显示。
图21显示用于稻中在组成型启动子GOS2或HMGB的控制下增加编码拟南芥Remorin多肽的核酸序列表达的双元载体。
图22详述在实施本发明方法中有用的序列的实例。
图23是OsDREB1A(SEQ ID NO:336)蛋白的全长序列的代表。显示了保守基序CMIII-1至CMIII-4以及CMIV-1和CMIV-2的位置。推定的定位信号加双下划线显示。对应于AP2结构域的区域以粗体标记。
图24显示来自稻和拟南芥的DREB蛋白的氨基酸序列的比对结果。显示了共有序列。
图25显示了如Shigyo等2006发表的AP2/EREBP多基因家族系统发生树的无根最大或然性树。显示了其中AP2转录因子归属的不同亚家族和组,包括DREB GROUP。
图26显示用于稻中使用组成型启动子(OsGOS2)控制下的发夹构建体沉默OsDREB1A RNA的双元载体。
图27显示在实施本发明方法中有用的序列实例或用于分离这类序列的序列实例。序列可以从公开的EST集合(public EST assemblies)中产生,测序质量较低。因此,可以预期有一些核酸替换。起始密码子(ATG)和终止密码子在这些核酸序列编码全长DREB蛋白时对核酸序列进行了限定。然而,5’UTR和3’UTR也均可以用于实施本发明的方法。
实施例
本发明现在参考如下实施例进行描述,所述实施例仅是示意性的。以下实施例不意图完全限定或限制本发明的范围。
DNA操作:除非另外说明,重组DNA技术根据(Sambrook(2001)Molecular Cloning:a laboratory manual,第3版Cold Spring HarborLaboratory Press,CSH,New York)或Ausubel等(1994),Current Protocolsin Molecular Biology,Current Protocols第1卷和第2卷中描述的标准方案进行。用于植物分子研究工作的标准材料和方法在BIOS科学出版有限责任公司(BIOS Scientific Publications Ltd(英国))和Blackwell科学出版社(Blackwell Scientific Publications(英国))出版的R.D.D.Croy的PlantMolecular Biology Labfax(1993)中描述。
实施例1:与SEQ ID NO:1和SEQ ID NO:2相关的序列的鉴定
使用数据库搜索工具如基本局部比对工具(BLAST)(Altschul等(1990)J.Mol.Biol.215:403-410;和Altschul等(1997)Nucleic Acids Res.25:3389-3402),在国家生物技术信息中心(NCBI)的Entrez核苷酸数据库中维护的那些序列中鉴定到与SEQ ID NO:1相关的(全长cDNA、EST或基因组)序列和/或与SEQ ID NO:2相关的蛋白质序列。使用该程序通过将核酸序列或多肽序列与序列数据库比较并且计算匹配的统计显著性来找到序列之间的局部相似性区域。由SEQ ID NO:1编码的多肽用于TBLASTN算法,采用默认设置和过滤程序以忽略低复杂性序列启动(setoff)。这种分析的结果通过配对比较进行观察,并根据概率评分(E-值)进行评级,其中所述的评分反映特定比对结果因偶然发生的概率(E-值越低,命中的显著性越高)。除了E-值外,比较过程也可以通过同一性百分数评分。同一性百分数指两个比较的核酸(或多肽)序列之间在特定长度范围内相同核苷酸(或氨基酸)的数目。在一些情况下,可以调整默认参数以修改所述搜索的严格性。
表A提供与如SEQ ID NO:1所代表的核酸序列和SEQ ID NO:2所代表的蛋白质序列相关的核酸序列和蛋白质序列名单。
表A:编码NAP1样多肽的核酸序列和NAP1样多肽。
  名称/代号   来源生物  核酸SEQ ID NO:  多肽SEQ ID NO:
  AtNAP1   拟南芥   1   2
  NtNAP1a   烟草   6   7
  NtNAP1b   烟草   8   9
  Ms10.1   苜蓿   10   11
  nfa104   玉米   12   13
  OsNAP1a   稻   14   15
  OsNAP1b   稻   16   17
  nfa103   玉米   18   19
  NAP1样   拟南芥   20   21
  LeNAP1   番茄   22   23
  NAP1样   拟南芥   24   25
  NAP1样   拟南芥   26   27
  NAP1样   拟南芥   28   29
  NAP1样   拟南芥   30   31
  NAP1Ps   豌豆   35   36
  SNAP-1   大豆   37   38
实施例2:NAP1样多肽序列的比对
多肽序列的比对使用来自Vector NTI(Invitrogen)的Alignment X程序进行,其中所述Alignment X程序基于受欢迎的累进比对Clustal算法(Thompson等(1997)Nucleic Acids Res 25:4876-4882;Chenna等(2003),Nucleic Acids Res 31:3497-3500)。空位开口罚分的默认值是10,空位延伸罚分0.1并且所选的权重矩阵是Blosum 62(若比对多肽)。图3中的结果显示NAP1样多肽共享序列高度保守的区域。
描述来自酵母、人类和植物的NAP和SET蛋白之间关系的系统发生树在图4中给出。该系统发生树由VNTI软件包5.5(Informax)的AlignmentX程序建立。用来产生多重比对结果的矩阵是Blosum62并且所用比对参数是:空位开口罚分,10;空位延伸罚分,0.5;空位分离罚分范围,8;比对延迟的同一性百分数40。该系统发生树使用Saitou和Nei邻接法建立。
实施例3:在实施本发明方法中有用的多肽序列之间总体同一性百分数的计算
使用现有技术领域可获得的方法之一,即MatGAT(矩阵总体比对工具)软件(BMC Bioinformatics.20034:29.MatGAT:使用蛋白质序列或DNA序列产生相似性/同一性矩阵的一项应用,Campanella JJ,Bitincka L,Smalley J)确定在实施本发明方法中有用的全长多肽序列之间的总体相似性和同一性百分数。MatGAT软件对DNA序列或蛋白质序列产生相似性/同一性矩阵,无需数据的预先比对。该程序使用Myers和Miller总体比对算法(空位开口罚分12和空位延伸罚分2)进行一系列配对比对,使用例如Blosum 62(对于多肽而言)计算相似性和同一性并且随后将结果置于距离矩阵内。在分割线下半部分显示序列相似性,和在对角分割线的上半部分显示序列同一性。
比较中使用的参数是:
评分矩阵:Blosum62
第一空位:12
延伸空位:2
表B中显示在多肽序列的全长范围(不包括部分多肽序列)中的总体相似性和同一性的软件分析结果。同一性百分数在对角线上方给出而相似性百分数在对角线下方给出。
与SEQ ID NO:2相比较,在实施本发明方法中有用的全长多肽序列之间的同一性百分数可以低至22%氨基酸同一性。因为NAP结构域覆盖了所述蛋白质序列的最大部分,因而当比较NAP结构域时,序列同一性仅略微较高。
Figure G2008800037051D01521
Figure G2008800037051D01531
实施例4:在实施本发明方法中有用的多肽序列中所包含的结构域的鉴定
蛋白质家族、结构域和位点的集成资源(InterPro)数据库是针对基于文本及基于序列的搜索法的常用特征标识数据库的集成界面。InterPro数据库合并了这些数据库,所述数据库使用不同方法学及不同程度的有关充分表征的蛋白质的生物学信息以获得蛋白质特征标识(protein signatures)。合作数据库包括SWISS-PROT、PROSITE、TrEMBL、PRINTS、ProDom和Pfam,Smart和TIGRFAMs。Interpro由英国欧洲生物信息学研究所维护。
如SEQ ID NO:2所代表的多肽序列的InterPro扫描结果呈现于表C。
表C:如SEQ ID NO:2所代表多肽序列的InterPro扫描结果
  数据库   登录号   登录名称
  PANTHER   PTHR11875   NAP_家族
  PANTHER   PTHR11875:SF9   PTHR11875:SF9
  PFAM   PF00956   NAP
实施例5:在实施本发明方法中有用的多肽序列的拓扑结构预测(亚细胞定位、跨膜...)
TargetP 1.1预测真核生物蛋白的亚细胞定位。基于任何氨基端前序列的预测存在进行定位指派:叶绿体转运肽(cTP),线粒体靶向肽(mTP)或分泌途径信号肽(SP)。作为最终预测基础的评分并不真正是概率,并且它们不是必需地加合成一体。然而,根据TargetP,具有最高评分的定位是最可能的,并且评分之间的关系(可靠性级别)可以指示该预测具有多大确定性。可靠性级别(RC)范围从1至5,其中1表示最可靠的预测。TargetP在丹麦技术大学(Technical University of Denmark)的服务器上维护。
对于预测含有氨基端前序列的序列而言,也可以预测潜在的切割位点。
可以选择许多参数,如生物组别(非植物或植物),临界值集合(无、预定的临界值集合或用户指定的临界值集合)和切割位点预测的计算(是或否)。
对SEQ ID NO:2所代表的多肽序列的TargetP 1.1分析的结果在表D中显示。选择“植物”生物组别,未定义临界值,并且对转运肽的预测长度提出要求。SEQ ID NO:2所代表多肽序列的亚细胞定位可以是细胞质或细胞核,没有预测到转运肽。
表D:对如SEQ ID NO:2所代表的多肽序列的TargetP 1.1分析
  长度(AA)   256
  叶绿体转运肽   0.108
  线粒体转运肽   0.079
  分泌途径信号肽   0.134
  其他亚细胞定位   0.908
  预测位置   /
  可靠性级别   2
  预测的转运肽长度   /
众多其他算法可以用来进行此类分析,包括:
·在丹麦技术大学服务器上维护的ChloroP 1.1;
·在澳大利亚布里斯班昆士兰大学生物科学研究所的服务器上维护的Protein Prowler亚细胞定位预测者1.2版;
·在加拿大阿伯特省埃德蒙顿市阿尔伯塔大学的服务器上维护的PENCE蛋白组分析专家PA-GOSUB 2.5;
·在丹麦技术大学服务器上维护的TMHMM
实施例6:苜蓿NAP1样蛋白的表征:
材料和方法
推定的苜蓿PP2A抑制物的全长cDNA克隆的分离
已经使用编码推定的苜蓿(Medicago sativa)NAP1样蛋白的一部分的分离cDNA片段从苜蓿根瘤λ-ZAP噬菌体cDNA文库(Savoure等PlantMol.Biol.27,1059-1070;1995),利用如制造商(Stratagene)所述的标准筛选方法分离全长克隆。筛选了400000个蚀斑,留下20个克隆,其中18个克隆在第二轮杂交筛选中为阳性。选择这些克隆中的8个克隆用于进一步研究并从各个噬菌体转化至噬菌粒内。对四个克隆测序,并且证明其中两个克隆是推定NAP1样蛋白的全长cDNA克隆。这两个克隆之一(Ms10.1)用于进一步研究(SEQ ID NO:10,编码蛋白质SEQ ID NO:11)。
苜蓿属植物NAP1样蛋白的产生和纯化
将编码苜蓿NAP1样蛋白的cDNA序列插入pENTRY4载体(Invitrogen)的NcoI/XhoI位点并随后导入pDEST17细菌表达载体。pDEST17载体允许NAP1样蛋白在BL21大肠杆菌细胞内表达为加6xHIS标签的蛋白质。34kDa的NAP1样蛋白通过使用镍琼脂糖树脂(Sigma)的亲和层析法纯化(图5)。
磷酸酶活性测量
苜蓿NAP1样蛋白的潜在磷酸酶抑制活性根据Ulloa等(1993)使用32P-同位素标记的糖原磷酸化酶和组蛋白H2A蛋白作为底物,在纯化自兔骨骼肌的蛋白磷酸酶2A(PP2A)催化亚基上体外测试。
MsNAP1样蛋白和AtNAP1样蛋白的胞内定位
使用标准免疫方案在兔中产生针对加6xHIS标签的纯化蛋白的抗MsNAP1样多克隆抗体。
从悬浮培养的苜蓿(Medicago sativa)细胞分离并用6%甲醛固定原生质体。随后将细胞附着至聚L-赖氨酸涂覆的载玻片上并暴露于抗MsNAP1样抗血清(在PBS中稀释200倍)、洗涤并暴露于FITC缀合的山羊抗兔第二抗体(SIGMA,100x稀释度)。细胞核平行地用DAPI(0.02mg/ml)染色并用Nikon TE300荧光显微镜和SPOT II彩色CCD照相机拍照。
苜蓿NAP1样蛋白的拟南芥直向同源物的编码区(SEQ ID NO:1)以符合绿色荧光蛋白(GFP)的可读框方式插入
Figure G2008800037051D01562
-相容性植物表达载体(pK7WGF2)。使用标准方法分离原生质体并以纯化的质粒DNA转染。在转染后1日或2日通过荧光显微镜记录瞬时表达。
结果
拟南芥属植物NAP1样蛋白和苜蓿属植物NAP1样蛋白定位于细胞核
使用抗MsNAP1样抗体,间接免疫荧光法显示抗体识别位于悬浮培养的苜蓿细胞胞核内的蛋白质。这种定位通过胞核染色DAPI验证。微弱荧光与分裂中期细胞中的染色体相关联(图6.A,插图)。
加GFP标签的拟南芥属植物NAP1样蛋白也排他性地位于位于悬浮培养的拟南芥属植物细胞胞核内(图6.B)。
苜蓿NAP1样蛋白体外抑制PP2A磷酸酶在磷酸组蛋白底物上的活性
将纯化的苜蓿NAP1样蛋白以多种浓度添加至反应混合物,其中所述的反应混合物含有兔骨骼肌PP2A的催化亚基和作为底物的磷酸化组蛋白H2A或糖原磷酸化酶。观察到所述NAP1样蛋白不影响糖原磷酸化酶的脱磷酸,即便在500mM浓度上也是如此,但是仅2.5mM浓度的NAP1样蛋白有效地抑制PP2A在磷酸组蛋白H2A底物上的活性(活性的50%降低)(图7)。
结论
苜蓿NAP1样蛋白和拟南芥NAP1样蛋白显示在结构和功能方面的相似性。植物NAP1样蛋白体外抑制磷酸酶(PP2A)对组蛋白底物的活性,这提示在染色质组织和基因转录方面可能的体内功能。
实施例7:使用如SEQ ID NO:1所代表的核酸序列构建表达载体
除非另外说明,重组DNA技术根据(Sambrook(2001)MolecularCloning:a laboratory manual,第3版Cold Spring Harbor LaboratoryPress,CSH,New York)或Ausubel等(1994),Current Protocols inMolecular Biology,Current Protocols第1卷和第2卷中描述的标准方案进行。用于植物分子研究工作的标准材料和方法在BIOS科学出版有限责任公司(BIOS Scientific Publications Ltd(英国))和Blackwell科学出版社(Blackwell Scientific Publications(英国))出版的R.D.D.Croy的PlantMolecular Biology Labfax(1993)中描述。
使用拟南芥籽苗cDNA文库(Invitrogen,Paisley,UK)作为模板,通过PCR扩增拟南芥NAP1样核酸。在逆转录从籽苗提取的RNA后,将cDNA克隆至pCMV Sport 6.0内。文库插入物的平均大小是1.5kb,并且原始克隆数是1.59×107cfu。6×1011cfu/ml的第一轮扩增后,测定原始滴度是9.6×105cfu/ml。在提取质粒后,将200ng模板用于50μl PCR混合物中。将包含用于Gateway重组的AttB位点的引物prm1505(SEQ ID NO:4)和prm1506(SEQ ID NO:5)用于PCR扩增。使用Hifi Taq DNA聚合酶在标准条件开展PCR。也使用标准方法扩增并纯化771bp的PCR片段。随后进行Gateway方法的第一步骤,即BP反应,在此期间该PCR片段在体内与pDONR201质粒重组以产生根据Gateway术语称作“进入克隆”的pNAP1样。质粒pDONR201从Invitrogen作为技术的一部分购买。
进入克隆pNAP1样随后与用于稻转化的目的载体一起用于LR反应中,其中所述的目的载体在T-DNA边界内包含植物选择标记;目视标记表达盒和意图用于LR与已经克隆在所述进入克隆内的目的序列体内重组的Gateway盒作为功能性元件。用于组成型表达的GOS2启动子位于这个Gateway盒上游。在LR重组步骤后,将所得表达载体pGOS2::NAP1样(图2)转化至农杆菌菌株LBA4404内并随后使用本领域熟知的方法转化至稻植物内。
实施例8:植物转化
稻转化
使用含有所述表达载体的农杆菌来转化稻植物。将稻粳型栽培品种Nipponbare的成熟干燥种子脱壳。通过如下方式实施消毒:在70%乙醇中孵育1分钟,随后在0.2%HgCl2中孵育30分钟,随后用无菌蒸馏水洗涤6次15分钟。无菌的种子随后在含有2,4-D的培养基(愈伤组织诱导培养基)上萌发。在黑暗中孵育4周后,将盾片衍生的胚发生的愈伤组织切下并在相同的培养基上增殖。2周后,将愈伤组织通过在同一种培养基上传代培养另外2周进行繁殖或增殖。胚发生的愈伤组织片在新鲜培养基上传代培养3日,随后共培育(以助长细胞分裂活性)。
将含有所述表达载体的农杆菌菌株LBA4404用于共培育。农杆菌接种在含有适宜抗生素的AB培养基上并在28℃培养3日。随后收集细菌并在液体共培育培养基中悬浮至密度(OD600)约1。该悬液随后转移至培养皿内并将所述愈伤组织浸没于此悬液内15分钟。该愈伤组织随后在滤纸上蘸干并转移至固化的共培育培养基,并在25℃于黑暗中孵育3日。共培育的愈伤组织在含2,4-D的培养基上在28℃于黑暗中在选择剂存在下培育4周。在此期间,迅速生长的抗性愈伤组织团发育。将这种材料转移至再生培养基并在光照下孵育后,胚发生潜能得到释放并且苗在随后4至5周内发育。将苗从愈伤组织上切下并且在含有植物生长素的培养基上孵育2至3周,将苗从所述培养基转移至土壤。硬化的苗在温室中于高湿度和短日照下培育。
对于一个构建体,产生大约35个独立的T0稻转化体。将原代转化体从组织培养箱转移至温室。在定量PCR分析验证T-DNA插入物的拷贝数后,仅保留针对所述选择剂显示抗性的单拷贝转基因植物用于收获T1种子。种子随后在移栽后3至5个月收获。该方法以超过50%的比例产生单基因座转化体(Aldemita和Hodges1996,Chan等1993,Hiei等1994)。
谷物转化
玉米(Zea mays)的转化用Ishida等(1996.Nature Biotech 14(6):745-50)所述方法的改良方法进行。在谷物中,转化是基因型依赖的并且仅特定基因型对于转化和再生是服从的。杂交系A188(明尼苏达大学)或以A188作为亲本的杂交体是用于转化的供体材料的良好来源,不过其他基因型也可以成功地使用。谷穗在授粉后大约11日(DAP)从谷物植物收获,此时不成熟胚的长度是大约1-1.2mm。不成熟的胚与含有所述表达载体的根癌农杆菌共培育,并且转基因植物通过器官发生过程回收。切下的胚在愈伤组织诱导培养基上、随后在玉米再生培养基上生长,其中所述的培养基含有选择剂(例如咪唑啉酮,不过可以使用不同的选择标记)。培养板在25℃于光照下孵育2-3周,或直至苗发育。将源自每个胚的绿色苗转移至玉米生根培养基并在25℃孵育2-3周,直至根发育。将生根的苗移植至温室中的土壤内。从针对所述选择剂显示耐受性并且含有单拷贝T-DNA插入物的植物产生T1种子。
小麦转化
小麦的转化用Ishida等(1996)Nature Biotech 14(6):745-50描述的方法进行。栽培品种Bobwhite(可从墨西哥CIMMYT获得)通常在转化中使用。不成熟的胚与含有所述表达载体的根癌农杆菌共培育,并且转基因植物通过器官发生过程回收。与农杆菌孵育后,所述胚在愈伤组织诱导培养基上、随后在再生培养基上体外培育,其中所述的培养基含有选择剂(例如咪唑啉酮,不过可以使用多种选择标记)。培养板在25℃于光照下孵育2-3周,或直至苗发育。将源自每个胚的绿色苗转移至生根培养基并在25℃孵育2-3周,直至根发育。将生根的苗移植至温室中的土壤内。从针对所述选择剂显示耐受性并且含有单拷贝T-DNA插入物的植物产生T1种子。
大豆转化
根据对Texas A&M美国专利5,164,310中所述方法的改良方法转化大豆。几个商业大豆品种对于通过这种方法的转化是可操作的。栽培品种Jack(从Illinois种子基金会可获得)通常用于转化。对大豆种子消毒以便体外播种。下胚轴、胚根和一片子叶从7日龄年幼籽苗中切下。进一步培育上胚轴和剩余子叶以使辅助节发育。将这些辅助节切下并与含有所述表达载体的根癌农杆菌孵育。在共培育处理之后,洗涤外植体并转移至选择培养基。切下再生的苗并置于苗伸长培养基上。将长度不超过1cm的苗置于生根培养基上直至根发育。生根的苗移植至温室中的土壤内。从针对所述选择剂显示耐受性并且含有单拷贝T-DNA插入物的植物产生T1种子。
油菜籽/卡诺拉油菜转化
使用5-6日龄年幼籽苗的子叶柄和下胚轴作为用于组织培养的外植体并且根据Babic等(1998,Plant Cell Rep 17:183-188)进行转化。商业栽培品种Westar(Agriculture Canada)是用于转化的标准品种,不过其他品种也可以使用。对卡诺拉油菜种子进行表面消毒以体外播种。从所述体外籽苗切下附带子叶的子叶叶柄外植体,并且通过将此叶柄外植体的切口末端浸入细菌悬液以(含有所述表达载体的)农杆菌接种。该外植体随后在23℃,16小时光照下于含有3mg/l BAP、3%蔗糖、0.7%植物琼脂的MSBAP-3培养基上培养2日。与农杆菌共培育2日后,将所述叶柄外植体转移至含有3mg/l BAP、头孢噻肟、羧苄青霉素或特美汀(300mg/l)的MSBAP-3培养基上培养7日,并且随后在含有头孢噻肟、羧苄青霉素或特美汀和选择剂的MSBAP-3培养基上培养,直至苗再生。当苗长度是5-10mm时,切下这些苗并转移至苗伸长培养基(MSBAP-0.5,含有0.5mg/l BAP)。将长度大约2cm的苗转移至生根培养基(MS0)用于根诱导。生根的苗移植至温室中的土壤内。从针对所述选择剂显示耐受性并且含有单拷贝T-DNA插入物的植物产生T1种子。
苜蓿转化
使用(McKersie等,1999Plant Physiol 119:839-847)的方法转化苜蓿的再生性克隆。苜蓿的再生和转化是基因型依赖性的并且因而需要再生性植物。已经描述了获得再生性植物的方法。例如,这些再生性植物可以选自栽培品种Rangelander(Agriculture Canada)或如Brown DCW和AAtanassov(1985.Plant Cell Tissue Culture 4:111-112)所述的任何其他商业苜蓿品种。备选地,已经选择RA3品种(威斯康星大学)用于组织培养(Walker等,1978Am J Bot 65:654-659)。叶柄外植体与含有所述表达载体的根癌农杆菌C58C1 pMP90(McKersie等,1999Plant Physiol119:839-847)或LBA4404的过夜培养物共培育。所述外植体在黑暗中于含有288mg/L Pro、53mg/L硫代脯氨酸、4.35g/L K2SO4和100μm乙酰丁香酮的SH诱导培养基上共培育3日。所述外植体在浓度减半的Murashige-Skoog培养基(Murashige和Skoog,1962)中洗涤并铺种在不含乙酰丁香酮而含有合适选择剂和抑止农杆菌生长的合适抗生素的相同SH诱导培养基上。几周后,将体细胞胚转移至不含生长调节剂、不含抗生素和含有50g/L蔗糖的BOi2Y发育培养基中。体细胞胚随后在浓度减半的Murashige-Skoog培养基上萌发。生根的籽苗移植至花钵内并且在温室中培育。从针对所述选择剂显示耐受性并且含有单拷贝T-DNA插入物的植物产生T1种子。
棉花转化
使用根癌农杆菌,根据US 5,159,135中所述的方法转化棉花。棉花种子在3%次氯酸钠溶液中持续20分钟进行表面消毒并且在含有500μg/ml头孢噻肟的蒸馏水中洗涤。随后将种子转移至含有50μg/ml苯菌灵的SH-培养基以萌发。将4-6日龄籽苗的下胚轴取出、切成0.5cm的小段并置于0.8%琼脂上。农杆菌悬液(约108个细胞/ml,从用目的基因和合适选择标记转化的过夜培养物稀释)用于接种所述下胚轴外植体。在室温和光照下3日后,将组织转移至含有Murashige和Skoog盐的固体培养基(1.6g/l脱乙酰吉兰糖胶),其中所述的Murashige和Skoog盐含有B5维生素(Gamborg等,Exp.Cell Res.50:151-158(1968))、0.1mg/l 2,4-D、0.1mg/l 6-糠氨基嘌呤和750μg/ml MgCL2并含有50-100μg/ml头孢噻肟和400-500μg/ml羧苄青霉素以杀死残余细菌。各个细胞系在2-3个月后分离(每隔4-6周传代培养)并且在用于组织扩增的选择性培养基上进一步培育(30℃,16小时光周期)。转化的组织随后在非选择性培养基上进一步培育2-3月以产生体细胞胚。将长度至少4mm的外观健康胚转移至细蛭石中的含有SH培养基的管内,其中所述的SH培养基补充有0.1mg/l吲哚乙酸、6-糠氨基嘌呤和赤霉酸。所述胚在30℃以16小时光周期培育,并且将2-3叶期的小植株转移至具有蛭石和营养物的花钵内。使植物硬化并随后移至温室以进一步培育。
实施例9:表型评价方法
9.1评价建立
产生大约35个独立的T0稻转化体。原代转化体从组织培养箱转移至温室以生长并收获T1种子。留下下述6个事件,其中所述事件的T1后代对所述转基因的存在/不存在以3∶1比例分离。对于这些事件中的每一个,通过监测目视标记表达而选出大约10株含有该转基因的T1籽苗(杂合子和纯合子)和大约10株缺少该转基因的T1籽苗(失效合子)。转基因植物和对应的失效合子于随机位置并排培育。稻植物在盆栽土壤中正常条件下培育,除了营养液之外。花钵从移植至成熟一直用氮(N)含量降低、通常降低7-8倍的特定营养液浇灌。其余培育过程(植物成熟、种子收获)与不在非生物胁迫下培育的植物相同。温室条件是短日照(12小时光照),在光照下28℃和在黑暗中22℃以及相对湿度70%。随后测量种子相关参数。
4个T1事件在T2世代中按照如对T1世代相同的评价方法进一步评估,不过每个事件采用更多个体。从播种期直至成熟期,将所述植物数次通过数字成像室。在每一时间点上,从至少6个不同角度拍摄每株植物的数字图像(2048×1536像素,1600万颜色)。
盐胁迫筛选
植物在由椰子纤维和Argex(比率3∶1)组成的基质上培育。在移植小植物至温室后头2周期间使用正常的营养液。在头两周之后,向所述营养液添加25mM盐(NaCl),直至收获植物。随后测量种子相关参数。
9.2统计分析:F-检验
使用两因素ANOVA(变量分析)作为整体评价植物表型特征的统计模型。对于用本发明基因转化的全部事件的全部植物的全部所测量参数实施F检验。实施F检验以检查该基因对全部转化事件的影响并验证该基因的整体作用(又称作基因总体作用)。真实基因总体作用显著性的阈值对于F检验设置在5%概率水平上。显著性F检验值指出基因作用,意指不仅仅是基因的存在或位置才造成表型上的差异。
9.3测量的参数
生物量相关的参数测量
植物从播种期至成熟期数次通过数字成像室。在每个时间点上,从至少6个不同角度拍摄每株植物的数字图像(2048×1536像素,1600万颜色)。
植物地上部分面积(或叶生物量,areamax)通过计数来自植物地上部分的数字图像上区别于背景的像素总数而确定。该值对相同时间点上从不同角度拍摄的画面进行平均化并且转化成通过校正以平方mm表述的物理表面值(physical surface value)。实验证实以这种方式测量的地上部分植物面积与地上植物部分的生物量相关。地上部分面积是植物已经实现其最大叶生物量的时间点上所测量的面积。早期生长势是萌发后3周的植物(籽苗)地上部分的面积。根生物量的增加表述为根总生物量的增加(测量为植物寿命期间观察到的根最大生物量);或表述为根/冠比增加(测量为根和苗的活跃生长期间根质量与苗质量之间的比例)。
种子相关参数测量
将成熟的原发花序收获、计数、装袋、加条形码标记并且随后在干燥箱内于37°干燥3日。随后将所述花序脱粒,并且收集和计数全部种子。充实粒使用吹气装置与空粒分开。弃去空粒并且再次计数剩余部分。充实粒在分析天平上称重。充实种子数通过计数所述分离步骤后充实粒数目加以确定。种子总产量通过称量从一株植物收获的全部充实粒而测量。每株植物的种子总数通过计数从一株植物收获的壳数目测量。从计数的充实种子数及其总重量外推出千粒核重(TKW)。收获指数(HI)在本发明中定义为种子总产量与地上部分面积(mm2)之间的比率,乘以系数106。如本发明中定义的每花序的总花数是种子总数与成熟原发花序数目之间的比率。如本发明中定义的种子充实率是充实种子数对种子(或小花)总数的比例(表述为%)。
实施例10:转基因植物的表型评价的结果
如表F中所示,与对应的失效合子(对照)相比较,观察到转基因植物的生物量和种子产量增加,在每种情况下,p-值低于0.05。
  参数   提高(%)
  Areamax(生物量)   17.0
  种子总重   35.9
  充实种子数   34.7
  种子充实率   11.6
  收获指数   17.1
实施例11:鉴定与SEQ ID NO:40和SEQ ID NO:41相关的序列使用数据库搜索工具如基本局部比对工具(BLAST)(Altschul等(1990)J.Mol.Biol.215:403-410;和Altschul等(1997)Nucleic Acids Res.25:3389-3402),从国家生物技术信息中心(NCBI)的Entrez核苷酸数据库中维护的那些序列当中鉴定到与SEQ ID NO:40相关的(全长cDNA、EST或基因组)序列和/或与SEQ ID NO:41相关的蛋白质序列。使用该程序通过核酸序列或多肽序列与序列数据库比较并且通过计算匹配的统计显著性来找到序列之间的局部相似性区域。由SEQ ID NO:40编码的多肽用于TBLASTN算法,采用默认设置和过滤程序以忽略低复杂性序列启动。这种分析的结果通过配对比较进行观察,并根据概率评分(E-值)进行评级,其中所述的评分反映特定比对结果因偶然发生的概率(E-值越低,命中的显著性越高)。除了E-值外,比较过程也可以由同一性百分数评分。同一性百分数指两个比较的核酸(或多肽)序列之间在特定长度范围内相同核苷酸(或氨基酸)的数目。在一些情况下,可以调整默认参数以修改所述搜索的严格性。
除了在NCBI可获得的公开可用的核酸序列之外,也按照如上文所述的相同方法检索专利序列数据库。
表G提供与如SEQ ID NO:40所代表的核酸序列和SEQ ID NO:41所代表的蛋白质序列相关的核酸序列和蛋白质序列名单。
Lsm蛋白分成8个组或类别。表G中题头为“Lsm类”的列显示Lsm蛋白或编码该蛋白质的相应核酸所属的类别。
SEQ ID No.41的同源序列、直向同源序列和旁系同源序列在题头为“与SEQ ID No.41的进化关系”的列中显示。
表G:与在本发明方法中使用的核酸序列(SEQ ID NO:40)相关的核酸序列和相应的推导多肽。
名称 登录号 来源生物   核酸SEQIDNO: 多肽SEQID NO: Lsm类别 与SEQ ID No.41的进化关系 状态
  AtLSM1a  AT1G19120   拟南芥   1  2   Lsm1   NA   全长
 AtLSM1b   AT3G14080   拟南芥   3   4   Lsm1   旁系同源物   全长
 AtLMS2   At1g03330   拟南芥   5   6   Lsm2   同源物   全长
 AtLSM3a   AT1G21190   拟南芥   7   8   Lsm3   同源物   全长
 AtLSM3b   At1g76860   拟南芥   9   10   Lsm3   同源物   全长
 AtLMS4   AT5G27720   拟南芥   11   12   Lsm4   同源物   全长
 AtLMS5   AT5G48870   拟南芥   13   14   Lsm5   同源物   全长
 AtLMS6a   AT3G59810   拟南芥   15   16   Lsm6   同源物   全长
 AtLMS6b   AT2G43810   拟南芥   17   18   Lsm6   同源物   全长
 AtLMS7   AT2G03870   拟南芥   19   20   Lsm7   同源物   全长
 AtLMS8   AT1G65700   拟南芥   21   22   Lsm8   同源物   全长
MsABE78228 ABE78228   蒺藜苜蓿(Medicagotruncatula) 23 24 Lsm1 直向同源物 全长
PpLSM1 scaffold_158   毛果杨(Populustrichocarpa) 25 26 Lsm1 直向同源物 全长
OsLSM1   Os04g0445800   稻(粳型栽培品种组) 27 28 Lsm1 直向同源物 全长
OsLSM3   Os01g0866700   稻(粳型栽培品种组) 29 30 Lsm3 同源物 全长
OsLMS4   Os01g0256900   稻(粳型栽培品种组) 31 32 Lsm4 同源物 全长
OsLSM5   Os05g0389300   稻(粳型栽培品种组) 33 34 Lsm5 同源物 全长
OsLSM6   Os04g0388900   稻(粳型栽培品种组) 35 36 Lsm6 同源物 全长
OsLSM7   Os08g0177700   稻(粳型栽培品种组) 37 38 Lsm7 同源物 全长
OsLSM8   Os05g0594900   稻(粳型栽培品种组) 39 40 Lsm8 同源物 全长
Os_LSM CAH67241   稻(籼型栽培品种组(indica 41 42 Lsm1 直向同源物 全长
  cultivar-group))
  LuLSM8LU04FL62341874 NA 亚麻 43 44 Lsm8 同源物 全长
  BnLSM1aBNM01BN04MC02973 NA 欧洲油菜 45 46 Lsm1 直向同源物 全长
  BnLSM1bBN0204contig12290 NA 欧洲油菜 47 48 Lsm1 直向同源物 全长
  BnLSM1cBN0204contig30411 NA 欧洲油菜 49 50 Lsm1 直向同源物 全长
  BnLSM4aBN04FL41982578 NA 欧洲油菜 51 52 Lsm4 同源物 全长
  BnLSM4bBN04FL42120216 NA 欧洲油菜 53 54 同源物 全长
  BnLSM4cBN04FL42952553 NA 欧洲油菜 55 56 Lsm4 同源物 全长
  GmLSM4aGM04FLGM06LC725 NA 大豆 57 58 Lsm4 同源物 全长
  GmLSM4bGM04FLGM06LC5469 NA 大豆 59 60 Lsm4 同源物 全长
  GmLSM4c   NA   大豆   61   62   Lsm4   同源物   全长
  GM04FLGM06MC03669
  Gm_LSM5GM04FLGM02LC15807 NA 大豆 63 64 Lsm5 同源物 全长
  HvLSM1HV04FL63122459 NA 大麦 65 66 Lsm1 直向同源物 全长
  HvLSM4HV04FL62658793 NA 大麦 67 68 Lsm4 同源物 全长
  TaLSM1TA0704contig16414 NA 普通小麦 69 70 Lsm1 直向同源物 全长
  TaLSM4aTA04FLTA02LC45139 NA 普通小麦 71 72 Lsm4 同源物 全长
  TaLSM4bTA04FLTA02LC24263 NA 普通小麦 73 74 Lsm4 同源物 全长
  ZmLSM1ZM0404contig12257 NA 玉米 75 76 Lsm1 直向同源物 全长
  ZmLSM4aZM04FLZM06LC6366 NA 玉米 77 78 Lsm4 同源物 全长
登录号指基因库数据库,杨树(populus)序列数据库在DOE联合基因组研究所。NA:没有进行。
实施例12:相关多肽序列的比对结果和系统发生树
来自Vector NTI(Invitrogen)的Alignment X用于Lsm蛋白序列的比对,其中所述Alignment X基于受欢迎的累进比对Clustal算法(Thompson等(1997)Nucleic Acids Res 25:4876-4882;Chenna等(2003),Nucleic AcidsRes 31:3497-3500)。使用邻接聚类算法建立系统发生树。对于空位开口罚分使用默认值10,对空位延伸罚分使用默认值0.1并且所选的权重矩阵是Blosum 62。
在图10A中显示使用默认参数,以来自Vector NTI(Invitrogen)的Alignment X所开展的多重序列比对结果。使用设置为默认参数的来自Vector NTI(Invitrogen)的Alignment X开展Lsm蛋白的多重序列比对并建立相应的系统发生树(图10B)。Lsm多肽落入包括下述组中至少一种Lsm蛋白的聚类中,其中所述组由来自拟南芥的代表性Lsm蛋白定义,如SEQID Nos 41、43、45、47、49、51、53、55、57、59和61所代表的拟南芥Lsm蛋白,而不是偏离前述代表性序列聚类。Lsm1蛋白簇集于AtLsm1和AtLsm2周围。
处于不同分类组中的Lsm蛋白簇集在明显不同的进化支中。显示了Lsm类别1-8的进化支。
多重比对显示在Lsm多肽当中的最高序列同源性位于该蛋白质的氨基端。在共有序列中显示了保守残基。显示了保守基序I和基序II的位置。还显示了Lsm蛋白家族的特征性基序:α-螺旋、Lsm-I基序和Lsm-Il基序。
实施例13:计算在实施本发明方法中有用的多肽序列之间的总体同一性百分数
使用现有技术领域可获得的方法之一,即MatGAT(矩阵总体比对工具)软件(BMC Bioinformatics.2003 4:29.MatGAT:使用蛋白质序列或DNA序列产生相似性/同一性矩阵的一项应用,Campanella JJ,Bitincka L,Smalley J;软件由Ledion Bitincka维护)确定在实施本发明方法中有用的全长多肽序列之间的总体相似性和同一性百分数。MatGAT软件对DNA序列或蛋白质序列产生相似性/同一性矩阵,无需数据的预先比对。该程序使用Myers和Miller总体比对算法(空位开口罚分12和空位延伸罚分2)进行一系列配对比对,使用例如Blosum 62(对于多肽而言)计算相似性和同一性并且随后将结果置于距离矩阵内。在分割线下半部分显示序列相似性,和在对角分割线的上半部分显示序列同一性。
比较过程中使用的参数是:
评分矩阵:Blosum62
第一空位:12
延伸空位:2
表B中显示在多肽序列的全长范围(不包括部分多肽序列)内的总体相似性和同一性的该软件分析的结果。同一性百分数在对角线以上给出而相似性百分数在对角线以下给出。
与SEQ ID NO:41相比较,全长拟南芥Lsm蛋白之间的同一性百分数从约17%氨基酸同一性开始。同SEQ ID NO:41最接近的旁系同源序列与SEQ ID NO:41是79.7%同一的(表H1)。
与SEQ ID NO:41相比较,拟南芥Lsm蛋白Lsm结构域之间的同一性百分数从约19%氨基酸同一性开始。SEQ ID NO:41的Lsm结构域与其最接近的旁系同源物AtLsm1b的Lsm结构域之间的同一性是84.3%(表H2)。
表H3中所示直向同源Lsm蛋白的序列之间的同一性百分数从约55%开始。表H3中同SEQ ID NO:41最接近的直向同源蛋白与SEQ ID NO:41是84.3%同一的。
表H1:在拟南芥Lsm多肽序列范围内的总体相似性和同一性的MatGAT结果。
Figure G2008800037051D01711
表H2:在拟南芥Lsm多肽序列中存在的Lsm结构域范围内的总体相似性和同一性的MatGAT结果
Figure G2008800037051D01721
表H3:属于Lsm 1类的Lsm蛋白之间的总体相似性和同一性的MatGAT结果
  1   3   4   5   6   7   8   9   10   11   12
  1.AtLSM1a   79.7   84.4   76   72.1   70.3   77.3   77.3   76.6   76.6   76.6
  3.MsABE78228Lsm1   88.3   85.9   84.5   80.1   57   77.3   77.3   85.2   85.2   84.4
  4.PpLSM1   90.6   93.8   80.6   76.5   60.9   85.9   85.9   81.3   81.3   79.7
  5.OsLSM1   86.8   92.2   91.5   94.9   55   75.2   75.2   95.3   95.3   92.2
  6.OsLSM   82.4   87.5   86.8   94.9   52.2   71.3   71.3   90.4   90.4   87.5
  7.BnLSM1a   71.9   64.1   66.4   62.8   59.6   56.3   56.3   55.5   55.5   53.9
  8.BnLSM1b   88.3   91.4   93.8   90.7   86   63.3   100   75.8   75.8   75
  9.BnLSM1c   88.3   91.4   93.8   90.7   86   63.3   100   75.8   75.8   75
  10.HvLSM1   85.9   93   90.6   97.7   92.6   62.5   89.8   89.8   100   92.2
  11.TaLSM1   85.9   93   90.6   97.7   92.6   62.5   89.8   89.8   100   92.2
  12.ZmLSM1   85.9   92.2   88.3   94.6   89.7   60.9   89.1   89.1   95.3   95.3
实施例14:鉴定在实施本发明方法中有用的多肽序列中所包含的结构域
蛋白质家族、结构域和位点的集成资源(InterPro)数据库是针对基于文本及基于序列的搜索法的常用特征标识数据库的集成界面。InterPro数据库合并了这些数据库,所述数据库使用不同方法学及不同程度的有关充分表征的蛋白质的生物学信息以获得蛋白质特征标识。合作数据库包括SWISS-PROT、PROSITE、TrEMBL、PRINTS、ProDom和Pfam,Smart和TIGRFAMs。Interpro由英国欧洲生物信息学研究所维护。
如SEQ ID NO:2所代表的多肽序列的InterPro扫描结果呈现于表I1。
表I1:如SEQ ID NO:2所代表多肽序列的InterPro扫描结果
  数据库   登录号   登录名称
  Interpro   IPR006649   LSM_core
  Interpro   IPR010920   LSM_related_core.
  Interpro   IPR001163   LSM_snRNP_core.
  Pfam   PF01423   LSM
  ProDom   PD020287   snRNP
  SMART   SM00651   Sm.1
表I2:与存在于表G内所列Lsm蛋白中的Lsm结构域的序列相对应的SEQ ID No.
名称   SEQ IDNo.  参考Lsm蛋白的名称   参考Lsm蛋白的SEQ ID NO.
 AtLSM1a_结构域   120   AtLSM1a   41
 AtLSM1b_结构域   121   AtLSM1b   43
 AtLMS2_结构域   122   AtLMS2   45
 AtLSM3a_结构域   123   AtLSM3a   47
 AtLSM3b_结构域   124   AtLSM3b   49
 AtLMS4_结构域   125   AtLMS4   51
 AtLMS5_结构域   126   AtLMS5   53
 AtLMS6a_结构域   127   AtLMS6a   55
 AtLMS6b_结构域   128   AtLMS6b   57
 AtLMS7_结构域   129   AtLMS7   59
 AtLMS8_结构域   130   AtLMS8   61
 MsABE78228_结构域   131   MsABE78228   63
 PpLSM1_结构域   132   PpLSM1   65
 OsLSM1_结构域   133   OsLSM1   67
 OsLSM3_结构域   134   OsLSM3   69
 OsLMS4_结构域   135   OsLMS4   71
 OsLSM5_结构域   136   OsLSM5   73
 OsLSM6_结构域   137   OsLSM6   75
 OsLSM7_结构域   138   OsLSM7   77
 OsLSM8_结构域   139   OsLSM8   79
 Os_LSM_结构域   140   Os_LSM   81
 LuLSM8_结构域   141   LuLSM8   83
 BnLSM1a_结构域   142   BnLSM1a   85
 BnLSM1b_结构域   143   BnLSM1b   87
 BnLSM1c_结构域   144   BnLSM1c   89
 BnLSM4a_结构域   145   BnLSM4a   91
 BnLSM4b_结构域   146   BnLSM4b   93
 BnLSM4c_结构域   147   BnLSM4c   95
 GmLSM4a_结构域   148   GmLSM4a   97
 GmLSM4b_结构域   149   GmLSM4b   99
 GmLSM4c_结构域   150   GmLSM4c   101
 Gm_LSM5_结构域   151   Gm_LSM5   103
 HvLSM1_结构域   152   HvLSM1   105
 HvLSM4_结构域   153   HvLSM4   107
 TaLSM1_结构域   154   TaLSM1   109
 TaLSM4a_结构域   155   TaLSM4a   111
 TaLSM4b_结构域   156   TaLSM4b   113
 ZmLSM1_结构域   157   ZmLSM1   115
 ZmLSM4a_结构域   158   ZmLSM4a   116
实施例15:克隆如SEQ ID NO:40所代表的核酸序列
除非另外说明,重组DNA技术根据(Sambrook(2001)MolecularCloning:a laboratory manual,第3版Cold Spring Harbor LaboratoryPress,CSH,New York)或Ausubel等(1994),Current Protocols inMolecular Biology,Current Protocols第1卷和第2卷中描述的标准方案进行。用于植物分子研究工作的标准材料和方法在BIOS科学出版有限责任公司(BIOS Scientific Publications Ltd(英国))和Blackwell科学出版社(Blackwell Scientific Publications(英国))出版的R.D.D.Croy的PlantMolecular Biology Labfax(1993)中描述。
使用拟南芥籽苗cDNA文库(Invitrogen,Paisley,UK)作为模板通过PCR扩增拟南芥Lsm基因。包含用于Gateway重组的AttB位点的有义引物5’-ggggacaagtttgt acaaaaaagcaggcttaaacaatgtcttgggctgctcct-3’(SEQ IDNO:162)和反义引物5’-ggggaccactttgtacaagaaagctgggttttctacaatgctgcaacaca-3’(SEQ ID NO:163)用于PCR扩增。使用Hifi Taq DNA聚合酶在标准条件下进行PCR。随后进行Gateway方法的第一步骤,即BP反应,在该步骤期间PCR片段与pDONR201质粒发生体内重组,以产生根据Gateway命名的“进入克隆”pLsm。质粒pDONR201作为
Figure G2008800037051D01751
技术的部分从Invitrogen购买。
实施例16:使用如SEQ ID NO:40所代表的核酸序列构建表达载体
进入克隆pLsm随后与pWSI18(一种用于稻转化的终端载体)在LR反应中一起使用。这种载体在T-DNA边界内含有植物选择标记;可筛选的标记表达盒和旨在使LR与已克隆入所述进入克隆的目的核酸序列体内重组的Gateway盒作为功能性元件。用于组成型表达的稻WSI18启动子(SEQ ID NO:157)位于这种Gateway盒上游。
在LR重组步骤后,所得表达载体pWSI18::Lsm(图11)根据本领域熟知的方法转化至农杆菌菌株LBA4044。
实施例17:植物转化
稻转化
使用含有所述表达载体的农杆菌来转化稻植物。将稻粳型栽培品种Nipponbare的成熟干燥种子脱壳。通过如下方式实施消毒:在70%乙醇中孵育1分钟,随后在0.2%HgCl2中孵育30分钟,随后用无菌蒸馏水洗涤6次15分钟。无菌的种子随后在含有2,4-D的培养基(愈伤组织诱导培养基)上萌发。在黑暗中孵育4周后,将小盾片衍生的胚发生的愈伤组织切下并在相同的培养基上增殖。2周后,将愈伤组织通过在同一种培养基上传代培养另外2周进行繁殖或增殖。胚发生的愈伤组织片在新鲜培养基上传代培养3日,随后共培育(以助长细胞分裂活性)。
将含有所述表达载体的农杆菌菌株LBA4404用于共培育。农杆菌接种在含有适宜抗生素的AB培养基上并在28℃培养3日。随后收集细菌并在液体共培育培养基中悬浮至密度(OD600)约1。该悬液随后转移至培养皿内并将所述愈伤组织浸没于此悬液内15分钟。该愈伤组织随后在滤纸上蘸干并转移至固化的共培育培养基,并在25℃于黑暗中孵育3日。共培育的愈伤组织在含2,4-D的培养基上在28℃于黑暗中在选择剂存在下培育4周。在此期间,迅速生长的抗性愈伤组织团发育。将这种材料转移至再生培养基并在光照下孵育后,胚发生潜能得到释放并且苗在随后4至5周内发育。将苗从愈伤组织上切下并且在含有植物生长素的培养基上孵育2至3周,将苗从所述培养基转移至土壤。在温室中于高湿度和短日照下生长硬化的苗。
对于一个构建体,产生大约35个独立的T0稻转化体。将原代转化体从组织培养箱转移至温室。在定量PCR分析验证T-DNA插入物的拷贝数后,仅保留针对所述选择剂显示抗性的单拷贝转基因植物用于收获T1种子。种子随后在移栽后3至5个月收获。该方法以超过50%的比例产生单基因座转化体(Aldemita和Hodges1996,Chan等1993,Hiei等1994)
谷物转化
玉米(Zea mays)的转化用Ishida等(1996.Nature Biotech 14(6):745-50)所述方法的改良方法进行。在谷物中,转化是基因型依赖的并且仅特定基因型对于转化和再生是服从的。杂交系A188(明尼苏达大学)或以A188作为亲本的杂交体是用于转化的供体材料的良好来源,不过其他基因型也可以成功地使用。谷穗在授粉后大约11日(DAP)从谷物植物收获,此时不成熟胚的长度是大约1-1.2mm。不成熟的胚与含有所述表达载体的根癌农杆菌共培育,并且转基因植物通过器官发生过程回收。切下的胚在愈伤组织诱导培养基上、随后在玉米再生培养基上生长,其中所述的培养基含有选择剂(例如咪唑啉酮,不过可以使用不同的选择标记)。培养板在25℃于光照下孵育2-3周,或直至苗发育。将源自每个胚的绿色苗转移至玉米生根培养基并在25℃孵育2-3周,直至根发育。将生根的苗移植至温室中的土壤内。从针对所述选择剂显示耐受性并且含有单拷贝T-DNA插入物的植物产生T1种子。
小麦转化
小麦的转化用Ishida等(1996)Nature Biotech 14(6):745-50描述的方法进行。栽培品种Bobwhite(可从墨西哥CIMMYT获得)通常在转化中使用。不成熟的胚与含有所述表达载体的根癌农杆菌共培育,并且转基因植物通过器官发生过程回收。与农杆菌孵育后,所述胚在愈伤组织诱导培养基上、随后在再生培养基上体外培育,其中所述的培养基含有选择剂(例如咪唑啉酮,不过可以使用多种选择标记)。培养板在25℃于光照下孵育2-3周,或直至苗发育。将源自每个胚的绿色苗转移至生根培养基并在25℃孵育2-3周,直至根发育。将生根的苗移植至温室中的土壤内。从针对所述选择剂显示耐受性并且含有单拷贝T-DNA插入物的植物产生T1种子。
大豆转化
大豆根据对Texas A&M美国专利5,164,310中所述方法的改良方法转化。几个商业大豆品种对于通过这种方法的转化是可操作的。栽培品种Jack(从Illinois种子基金会可获得)通常用于转化。对大豆种子消毒以便体外播种。下胚轴、胚根和一片子叶从7日龄年幼籽苗中切下。进一步培育上胚轴和剩余子叶以使辅助节发育。将这些辅助节切下并与含有所述表达载体的根癌农杆菌孵育。在共培育处理之后,洗涤外植体并转移至选择培养基。切下再生的苗并置于苗伸长培养基上。将长度不超过1cm的苗置于生根培养基上直至根发育。生根的苗移植至温室中的土壤内。从针对所述选择剂显示耐受性并且含有单拷贝T-DNA插入物的植物产生T1种子。
油菜籽/卡诺拉油菜转化
使用5-6日龄年幼籽苗的子叶柄和下胚轴作为用于组织培养的外植体并且根据Babic等(1998,Plant Cell Rep 17:183-188)进行转化。商业栽培品种Westar(Agriculture Canada)是用于转化的标准品种,不过其他品种也可以使用。对卡诺拉油菜种子进行表面消毒以体外播种。从所述体外籽苗切下附带子叶的子叶叶柄外植体,并且通过将此叶柄外植体的切口末端浸入细菌悬液以(含有所述表达载体的)农杆菌接种。该外植体随后在23℃,16小时光照下于含有3mg/l BAP、3%蔗糖、0.7%植物琼脂的MSBAP-3培养基上培养2日。与农杆菌共培育2日后,将所述叶柄外植体转移至含有3mg/l BAP、头孢噻肟、羧苄青霉素或特美汀(300mg/l)的MSBAP-3培养基上培养7日,并且随后在含有头孢噻肟、羧苄青霉素或特美汀和选择剂的MSBAP-3培养基上培养,直至苗再生。当苗长度是5-10mm时,切下这些苗并转移至苗伸长培养基(MSBAP-0.5,含有0.5mg/l BAP)。将长度大约2cm的苗转移至生根培养基(MS0)用于根诱导。生根的苗移植至温室中的土壤内。从针对所述选择剂显示耐受性并且含有单拷贝T-DNA插入物的植物产生T1种子。
苜蓿转化
使用(McKersie等,1999Plant Physiol 119:839-847)的方法转化苜蓿的再生性克隆。苜蓿的再生和转化是基因型依赖性的并且因而需要再生性植物。已经描述了获得再生性植物的方法。例如,这些再生性植物可以选自栽培品种Rangelander(Agriculture Canada)或如Brown DCW和AAtanassov(1985.Plant Cell Tissue Culture 4:111-112)所述的任何其他商业苜蓿品种。备选地,已经选择RA3品种(威斯康星大学)用于组织培养(Walker等,1978Am J Bot 65:654-659)。叶柄外植体与含有所述表达载体的根癌农杆菌C58C1 pMP90(McKersie等,1999Plant Physiol119:839-847)或LBA4404的过夜培养物共培育。所述外植体在黑暗中于含有288mg/L Pro、53mg/L硫代脯氨酸、4.35g/L K2SO4和100μm乙酰丁香酮的SH诱导培养基上共培育3日。所述外植体在浓度减半的Murashige-Skoog培养基(Murashige和Skoog,1962)中洗涤并铺种在不含乙酰丁香酮而含有合适选择剂和抑止农杆菌生长的合适抗生素的相同SH诱导培养基上。几周后,将体细胞胚转移至不含生长调节剂、不含抗生素和含有50g/L蔗糖的BOi2Y发育培养基中。体细胞胚随后在浓度减半的Murashige-Skoog培养基上萌发。生根的籽苗移植至花钵内并且在温室中培育。从针对所述选择剂显示耐受性并且含有单拷贝T-DNA插入物的植物产生T1种子。
棉花转化
使用根癌农杆菌,根据US 5,159,135中所述的方法转化棉花。棉花种子在3%次氯酸钠溶液中持续20分钟进行表面消毒并且在含有500μg/ml头孢噻肟的蒸馏水中洗涤。随后将种子转移至含有50μg/ml苯菌灵的SH-培养基以萌发。将4-6日龄籽苗的下胚轴取出、切成0.5cm的小段并置于0.8%琼脂上。农杆菌悬液(约108个细胞/ml,从用目的基因和合适选择标记转化的过夜培养物稀释)用于接种所述下胚轴外植体。在室温和光照下3日后,将组织转移至含有Murashige和Skoog盐的固体培养基(1.6g/l脱乙酰吉兰糖胶),其中所述的Murashige和Skoog盐含有B5维生素(Gamborg等,Exp.Cell Res.50:151-158(1968))、0.1mg/l 2,4-D、0.1mg/l 6-糠氨基嘌呤和750μg/ml MgCL2并含有50-100μg/ml头孢噻肟和400-500μg/ml羧苄青霉素以杀死残余细菌。各个细胞系在2-3个月后分离(每隔4-6周传代培养)并且在用于组织扩增的选择性培养基上进一步培育(30℃,16小时光周期)。转化的组织随后在非选择性培养基上进一步培育2-3月以产生体细胞胚。将长度至少4mm的外观健康胚转移至细蛭石中的含有SH培养基的管内,其中所述的SH培养基补充有0.1mg/l吲哚乙酸、6-糠氨基嘌呤和赤霉酸。所述胚在30℃以16小时光周期培育,并且将2-3叶期的小植株转移至具有蛭石和营养物的花钵内。使植物硬化并随后移至温室以进一步培育。
实施例18:表型评价方法
18.1评价建立
产生大约35个独立的T0稻转化体。原代转化体从组织培养箱转移至温室以生长并收获T1种子。留下下述5个事件,其中所述事件的T1后代对所述转基因的存在/不存在以3∶1比例分离。对于这些事件中的每一个,通过监测目视标记表达而选出大约10株含有该转基因的T1籽苗(杂合子和纯合子)和大约10株缺少该转基因的T1籽苗(失效合子)。转基因植物和对应的失效合子于随机位置并排培育。温室条件是短日照(12小时光照),在光照下28℃和在黑暗中22℃以及相对湿度70%。在不同灌溉方案中评估植物。在方案1中,灌溉以日为基础进行,提供足够的水以满足植物实现最佳生长的需要而不造成任何水缺乏症状以够方案序列。在方案2中,在抽穗时期短暂地减少灌溉,直至在对照植物中看到表现为叶卷曲的可眼观的水缺乏症状。在后一个条件下,土壤中的水含量下降至20%以下。在观在T2世代中按照如对T1世代相同的评价方法进一步评估4个T1事件,不过每个事件采用更多个体。从播种期直至成熟期,将所述植物数次通过数字成像室。在每一时间点上,从至少6个不同角度拍摄每株植物的数字图像(2048×1536像素,1600万颜色)。
氮使用效率筛选
来自T2种子的稻植物在盆栽土壤中在正常条件下生长,除了营养液不是正常条件之外。花钵从移植至成熟一直用氮(N)含量降低、通常降低7-8倍的特定营养液浇灌。其余培育过程(植物成熟、种子收获)与不在非生物胁迫下培育的植物相同。生长和产量参数如对正常条件下生长所述那样记录。
盐胁迫筛选
植物在由椰子纤维和Argex(比率3∶1)组成的基质上培育。在移植小植物至温室后头2周期间使用正常的营养液。在头两周之后,向所述营养液添加25mM盐(NaCl),直至收获植物。随后测量种子相关参数。
18.2统计分析:F-检验
使用两因素ANOVA(变量分析)作为整体评价植物表型特征的统计模型。对于用本发明基因转化的全部事件的全部植物的全部所测量参数实施F检验。实施F检验以检查该基因对全部转化事件的影响并验证该基因的整体作用(又称作基因总体作用)。真实基因总体作用显著性的阈值对于F检验设置在5%概率水平上。显著性F检验值指出基因作用,意指不仅仅是基因的存在或位置才造成表型上的差异。
18.3测量的参数
生物量相关的参数测量
植物从播种期至成熟期数次通过数字成像室。在每个时间点上,从至少6个不同角度拍摄每株植物的数字图像(2048×1536像素,1600万颜色)。
植物地上部分面积(或叶生物量)通过计数来自植物地上部分的数字图像上区别于背景的像素总数而确定。该值对相同时间点上从不同角度拍摄的画面进行平均化并且转化成通过校正以平方mm表述的物理表面值。实验显示以这种方式测量的植物地上部分面积与植物地上部分的生物量相关。地上部分面积是植物已经实现其最大叶生物量的时间点上所测量的面积。早期生长势是萌发后3周的植物(籽苗)地上部分的面积。
种子相关参数测量
将成熟的原发花序收获、计数、装袋、加条形码标记并且随后在干燥箱内于37°干燥3日。随后将所述花序脱粒,并且收集和计数全部种子。充实粒使用吹气装置与空粒分开。弃去空粒并且再次计数剩余部分。充实粒在分析天平上称重。充实种子数通过计数所述分离步骤后充实粒数目加以确定。种子总产量通过称量从一株植物收获的全部充实粒而测量。每株植物的种子总数通过计数从一株植物收获的壳数目测量。从计数的充实种子数及其总重量外推出千粒核重(TKW)。收获指数(HI)在本发明中定义为种子总产量与地上部分面积(mm2)之间的比率,乘以系数106。如本发明中定义的每花序的总花数是种子总数与成熟原发花序数目之间的比率。如本发明中定义的种子充实率是充实种子数对种子(或小花)总数的比例(表述为%)。
实施例19:转基因植物的表型评价的结果
在表J中显示评价表达在实施本发明方法中有用的核酸序列的转基因稻植物的结果。还显示了所述转基因植物与相应失效合子之间的差异。
与对照植物(在本例中,是失效合子)相比较,种子总产量、充实种子数、种子充实率和收获指数在表达实施本发明方法中有用的核酸序列的转基因植物中显著提高。
表J:评价在表达实施本发明方法中有用的核酸序列的转基因稻植物的结果。
  性状  在灌溉方案1下的提高%  在灌溉方案2下的提高%
  种子总产量   27   27
  充实种子数   25   25
  充实率   27   14
  生物量   1   5
  收获指数   25   21
在灌溉方案2下生长用编码蛋白质SEQ ID NO:47并在稻GOS2启动子控制下的核酸所转化的稻植物。至少一个事件显示以下一个或多个指标的提高:营养生物量、早期生长势、种子总重量、充实种子数、种子总数。
实施例20:鉴定与SEQ ID NO:165和SEQ ID NO:166相关的序列
使用数据库搜索工具如基本局部比对工具(BLAST)(Altschul等(1990)J.Mol.Biol.215:403-410;和Altschul等(1997)Nucleic Acids Res.25:3389-3402),从国家生物技术信息中心(NCBI)的Entrez核苷酸数据库中维护的那些序列当中鉴定到与SEQ ID NO:165相关的(全长cDNA、EST或基因组)序列和/或与SEQ ID NO:166相关的蛋白质序列。使用该程序通过核酸序列或多肽序列与序列数据库比较并且通过计算匹配的统计显著性来找到序列之间的局部相似性区域。由SEQ ID NO:173编码的多肽用于TBLASTN算法,采用默认设置和过滤程序以忽略低复杂性序列启动。这种分析的结果通过配对比较进行观察,并根据概率评分(E-值)进行评级,其中所述的评分反映特定比对结果因偶然发生的概率(E-值越低,命中的显著性越高)。除了E-值外,比较过程也可以由同一性百分数评分。同一性百分数指两个比较的核酸(或多肽)序列之间在特定长度范围内相同核苷酸(或氨基酸)的数目。在一些情况下,可以调整默认参数以修改所述搜索的严格性。
表K提供与如SEQ ID NO:165所代表的核酸序列和SEQ ID NO:166所代表的蛋白质序列相关的核酸序列和蛋白质序列名单。
表K:编码CycHTr多肽的核酸序列和CycHTr多肽。
名称 来源生物  核酸SEQ ID NO:  多肽SEQ ID NO:
 AtCycHTr   拟南芥   1   2
 AtCycH1   拟南芥   8   9
 CAK相关的细胞周期蛋白H同源物 欧美杂种山杨(Populustremula x Populus tremuloides) 10 11
 cycH-1   稻   12   13
 CycH   番茄   14   15
 CycH   玉米   16   17
 CycH   普通小麦   18   19
CycH   红花耧斗菜(Aquilegiaformosa) 20 21
 CycH   马铃薯   22   23
 CycH   甘蔗(Saccharum officinarum)   24   25
 CycH   Ostreococcus tauri   26   27
CycH   黑腹果蝇(Drosophilamelanogaster) 28 29
 CycH   智人(Homo sapiens)   30   31
CycH   三角褐指藻(Phaeodactylumtricornutum) 32 33
实施例21:CycH多肽序列的比对
使用ClustalW(1.83)算法进行多肽序列的比对。备选地,可以使用来自Vector NTI(Invitrogen)的Align X程序进行比对,其中所述Align X也基于受欢迎的累进比对Clustal算法(Thompson等(1997)Nucleic Acids Res25:4876-4882;Chenna等(2003),Nucleic Acids Res 31:3497-3500)。空位开口罚分的默认值是10,空位延伸罚分的默认值是0.1并且所选的权重矩阵是Blosum 62(若比对多肽)。图14中的结果显示CycH多肽共享序列高度保守的区域。
使用标准技术构建CycHTr多肽的系统发生树。图15显示CycH多肽如何簇集在一起。
实施例22:计算在实施本发明方法中有用的多肽序列之间的总体同一性百分数
使用现有技术领域可获得的方法之一,即MatGAT(矩阵总体比对工具)软件(Campanella等,BMC Bioinformatics.2003 4:29.MatGAT:使用蛋白质序列或DNA序列产生相似性/同一性矩阵的一项应用)确定在实施本发明方法中有用的全长多肽序列之间的总体相似性和同一性百分数。MatGAT软件对DNA序列或蛋白质序列产生相似性/同一性矩阵,无需数据的预先比对。该程序使用Myers和Miller总体比对算法(空位开口罚分12和空位延伸罚分2)进行一系列配对比对,使用例如Blosum 62(对于多肽而言)计算相似性和同一性并且随后将结果置于距离矩阵内。在分割线下半部分显示序列相似性,和在对角分割线的上半部分显示序列同一性。
比较过程中使用的参数是:
评分矩阵:Blosum62
第一空位:12
延伸空位:2
表L中显示在多肽序列的全长范围(不包括部分多肽序列)内的总体相似性和同一性的该软件分析的结果。同一性百分数在对角线之上以粗体给出,且相似性百分数在对角线以下给出(正常体)。
与SEQ ID NO:173相比较,在实施本发明方法中有用的CycH多肽序列之间的同一性百分数可以低至22%氨基酸同一性。
表L:在多肽序列的全长范围内的总体相似性和同一性的MatGAT结果
  1   2   3   4   5   6   7   8   9   10   11   12   13   14
  1.SEQID166 61.3 44.0 39.9 40.5 38.5 38.4 41.8 44.3 42.4 20.2 19.9 23.7 14.2
  2.   63.1   64.2   56.4   56.5   54.9   54.1   59.8   53.1   51.9   31.2   25.4   29.3   22.7
  SEQID173
  3.SEQID175 54.2 82.1 58.6 58.2 57.3 55.6 64.0 57.7 53.0 30.5 23.4 29.0 21.9
  4.SEQID177 51.5 75.0 78.9 57.3 83.1 81.3 64.4 54.5 78.2 31.0 25.9 30.9 22.5
  5.SEQID179 51.5 72.0 74.7 72.4 55.7 54.6 60.5 84.8 52.3 31.3 27.7 30.6 21.6
  6.SEQID181 51.4 73.2 78.3 91.2 69.6 78.7 60.7 53.8 89.1 32.0 26.9 30.1 23.9
  7.SEQID183 50.6 74.4 76.5 90.7 71.1 87.7 61.7 52.7 72.9 30.1 24.6 30.6 22.0
  8.SEQID185 53.9 77.7 79.6 82.3 75.4 78.1 78.7 58.3 57.4 31.5 25.6 29.3 20.6
  9.SEQID187 54.8 66.7 71.1 67.3 88.7 64.7 66.9 70.4 55.8 29.6 24.2 28.7 20.4
  10.SEQID189 54.5 68.5 72.3 86.4 66.2 90.3 81.6 73.4 68.8 29.9 26.6 28.4 22.2
  11.SEQID191 36.3 53.3 53.0 53.3 53.0 54.1 50.9 54.5 50.3 50.9 25.1 27.9 22.7
  12.SEQID193 34.6 45.5 46.1 50.3 48.2 48.9 49.7 49.1 44.1 46.6 46.6 43.2 19.3
  13.SEQID195 38.1 50.9 52.4 54.2 51.8 51.4 53.9 51.5 48.9 50.2 48.9 63.3 22.0
  14.SEQID197 24.8 38.8 38.5 39.7 35.8 39.9 36.9 37.6 33.7 36.7 36.2 32.8 36.2
实施例23:鉴定在实施本发明方法中有用的多肽序列中包含的结构域
蛋白质家族、结构域和位点的集成资源(InterPro)数据库是针对基于文本及基于序列的搜索法的常用特征标识数据库的集成界面。InterPro数据库合并了这些数据库,所述数据库使用不同方法学及不同程度的有关充分表征的蛋白质的生物学信息以获得蛋白质特征标识。合作数据库包括SWISS-PROT、PROSITE、TrEMBL、PRINTS、ProDom和Pfam、Smart和TIGRFAMs。Interpro由英国欧洲生物信息学研究所维护。
如SEQ ID NO:173所代表的多肽序列的InterPro扫描结果呈现于表M。
表M:如SEQ ID NO:173所代表的多肽序列的InterPro扫描结果
  数据库   登录号   登录名称
  Interpro   IPR006670   细胞周期蛋白
  Interpro   IPR011028   细胞周期蛋白样
  SMART   SM00385   细胞周期蛋白
  PANTHER   PTHR10026   SF8细胞周期蛋白H
  超家族   SSF47954   细胞周期蛋白样
实施例24:在实施本发明方法中有用的多肽序列的拓扑结构预测(亚细胞定位、跨膜...)
TargetP 1.1预测真核生物蛋白的亚细胞定位。定位指派基于预测任何氨基端前序列的存在:叶绿体转运肽(cTP)、线粒体定位肽(mTP)或分泌途径信号肽(SP)。作为最终预测基础的评分并不真正是概率,并且它们不是必需地加合成一体。然而,根据TargetP,具有最高评分的定位是最可能的,并且评分之间的关系(可靠性级别)可以指示该预测具有多大确定性。可靠性级别(RC)范围从1至5,其中1表示最可靠的预测。TargetP在丹麦技术大学(Technical University of Denmark)的服务器上维护。
对于预测含有氨基端前序列的序列而言,也可以预测潜在的切割位点。
可以选择许多参数,如生物组别(非植物或植物),临界值集合(无、预定的临界值集合或用户指定的临界值集合)和切割位点预测的计算(是或否)。
对如SEQ ID NO:173所代表的多肽序列的TargetP 1.1分析的结果在表N中显示。选择“植物”生物组别,未定义临界值,并且对转运肽的预测长度提出要求。如SEQ ID NO:173所代表多肽序列的亚细胞定位可能是细胞质或细胞核。然而,应当指出如本申请中所述的对产量所观察到的影响不是所述蛋白质特定定位的结果。
表N:对如SEQ ID NO:173所代表的多肽序列的TargetP 1.1分析
  长度(AA)   336
  叶绿体转运肽   0.109
  线粒体转运肽   0.416
  分泌途径信号肽   0.083
  其他亚细胞定位   0.551
  预测位置   其它
  可靠性级别   5
  预测的转运肽长度   /
众多其他算法可以用来进行此类分析,包括:
·在丹麦技术大学服务器上维护的ChloroP 1.1;
·在澳大利亚布里斯班昆士兰大学生物科学研究所的服务器上维护的Protein Prowler亚细胞定位预测者1.2版;
·在加拿大阿伯特省埃德蒙顿市阿尔伯塔大学的服务器上维护的PENCE蛋白组分析专家PA-GOSUB 2.5;
·在丹麦技术大学服务器上维护的TMHMM
实施例25:与实施本发明方法中有用的多肽序列相关的测定法
使用酵母双杂系统确定CycHTr蛋白与CAK蛋白之间的相互作用(Yamaguchi等,2000)。简而言之,在酿酒酵母Y190株中产生与GAL4-DNA结合结构域(DNA-BD)融合的CAK和融合于GAL4-反式激活结构域(AD)的CycHTr,其中所述酿酒酵母Y190株具有在GAL4结合位点的共有序列下的HIS3和LacZ报道基因。CAK或CycHTr的表达不诱导报道基因表达,而表达CAK融合蛋白及CycHTr融合蛋白这两者的细胞可以在不含组氨酸的培养基上生长并表达LacZ蛋白。
如Yamaguchi(2000)所述测量CycH激活CAK。在芽殖酵母中,Civ1/Cak1具有体内CAK活性,但没有体内CTD-激酶活性。已经证实:稻CAK(R2)的过量表达能够在芽殖酵母株GF2351中弥补CAK突变,其中所述的芽殖酵母株GF2351在civ1/cak1基因中携带一个温度敏感突变。当CAK(克隆至含有半乳糖诱导型GAL1启动子的表达载体pYES2)、CycH(克隆至组成型表达载体pGAD-GL,其中所述的表达载体含有截短的adh启动子并表达与CycH融合的GAL4反式激活结构域)或这两者导入GF2351细胞,随后表达CAK的细胞在34℃生长于含有半乳糖的基本培养基(MVGS)上,但在含有葡萄糖的基本培养基(MVD)上不生长。仅表达CycH的细胞在34℃不生长。相反,表达CAK和CycH这两者的细胞在36℃生长于MVGS上,然而在这个温度上,仅表达CAK的那些细胞不能够生长。这表明CycH的表达增强了芽殖酵母细胞中CAK对civ1/cak1突变的抑制性活性。相反,当使用CycHTr替代CycH时,没有观察到活性。
此外,CycHTr蛋白在植物中的过量表达导致如下文所述的提高的种子产量。
实施例26:克隆如SEQ ID NO:165所代表的核酸序列
除非另外说明,重组DNA技术根据(Sambrook(2001)MolecularCloning:a laboratory manual,第3版Cold Spring Harbor LaboratoryPress,CSH,New York)或Ausubel等(1994),Current Protocols inMolecular Biology,Current Protocols第1卷和第2卷中描述的标准方案进行。用于植物分子研究工作的标准材料和方法在BIOS科学出版有限责任公司(BIOS Scientific Publications Ltd(英国))和Blackwell科学出版社(Blackwell Scientific Publications(英国))出版的R.D.D.Croy的PlantMolecular Biology Labfax(1993)中描述。
使用拟南芥cDNA文库(Invitrogen,Paisley,UK)作为模板通过PCR扩增拟南芥CycHTr基因。包含用于Gateway重组的AttB位点的引物(SEQID NO:167;有义引物:5’-ggggacaagtttgtacaaaaaagcaggcttcacaatggcggattttcagacatc-3’)和SEQ ID NO:168;反义互补引物:5’-ggggaccactttgtacaagaaagctgggtaaactcaacctatgggtggc-3’)用于PCR扩增。使用Hifi TaqDNA聚合酶在标准条件下进行PCR。还使用标准方法扩增并纯化预期长度的PCR片段(包括attB位点)。随后进行Gateway方法的第一步骤,即BP反应,在该步骤期间PCR片段与pDONR201质粒发生体内重组,以产生根据Gateway命名的“进入克隆”。质粒pDONR201作为
Figure G2008800037051D01891
技术的部分从Invitrogen购买。
实施例27:使用如SEQ ID NO:165所代表的核酸序列构建表达载体
包含SEQ ID NO:165的进入克隆随后与用于稻转化的一种终端载体在LR反应中一起使用。这种载体在T-DNA边界内含有植物选择标记;可筛选的标记表达盒和旨在使LR与已克隆入所述进入克隆的目的核酸序列体内重组的Gateway盒作为功能性元件。用于种子特异性表达的稻油质蛋白或WSI18启动子(SEQ ID NO:170或SEQ ID NO:171)位于这种Gateway盒上游。
在LR重组步骤后,所得表达载体pSeed::CycHTr(图16)根据本领域熟知的方法转化至农杆菌菌株LBA4044。
实施例28:植物转化
稻转化
使用含有所述表达载体的农杆菌来转化稻植物。将稻粳型栽培品种Nipponbare的成熟干燥种子脱壳。通过如下方式实施消毒:在70%乙醇中孵育1分钟,随后在0.2%HgCl2中孵育30分钟,随后用无菌蒸馏水洗涤6次15分钟。无菌的种子随后在含有2,4-D的培养基(愈伤组织诱导培养基)上萌发。在黑暗中孵育4周后,将小盾片衍生的胚发生的愈伤组织切下并在相同的培养基上增殖。2周后,将愈伤组织通过在同一种培养基上传代培养另外2周进行繁殖或增殖。胚发生的愈伤组织片在新鲜培养基上传代培养3日,随后共培育(以助长细胞分裂活性)
将含有所述表达载体的农杆菌菌株LBA4404用于共培育。农杆菌接种在含有适宜抗生素的AB培养基上并在28℃培养3日。随后收集细菌并在液体共培育培养基中悬浮至密度(OD600)约1。该悬液随后转移至培养皿内并将所述愈伤组织浸没于此悬液内15分钟。该愈伤组织随后在滤纸上蘸干并转移至固化的共培育培养基,并在25℃于黑暗中孵育3日。共培育的愈伤组织在含2,4-D的培养基上在28℃于黑暗中在选择剂存在下培育4周。在此期间,迅速生长的抗性愈伤组织团发育。将这种材料转移至再生培养基并在光照下孵育后,胚发生潜能得到释放并且苗在随后4至5周内发育。将苗从愈伤组织上切下并且在含有植物生长素的培养基上孵育2至3周,将苗从所述培养基转移至土壤。在温室中于高湿度和短日照下生长硬化的苗。
对于一个构建体,产生大约35个独立的T0稻转化体。将原代转化体从组织培养箱转移至温室。在定量PCR分析验证T-DNA插入物的拷贝数后,仅保留针对所述选择剂显示抗性的单拷贝转基因植物用于收获T1种子。种子随后在移栽后3至5个月收获。该方法以超过50%的比例产生单基因座转化体(Aldemita和Hodges1996,Chan等1993,Hiei等1994)。
谷物转化
玉米(Zea mays)的转化用Ishida等(1996.Nature Biotech 14(6):745-50)所述方法的改良方法进行。在谷物中,转化是基因型依赖的并且仅特定基因型对于转化和再生是服从的。杂交系A188(明尼苏达大学)或以A188作为亲本的杂交体是用于转化的供体材料的良好来源,不过其他基因型也可以成功地使用。谷穗在授粉后大约11日(DAP)从谷物植物收获,此时不成熟胚的长度是大约1-1.2mm。不成熟的胚与含有所述表达载体的根癌农杆菌共培育,并且转基因植物通过器官发生过程回收。切下的胚在愈伤组织诱导培养基上、随后在玉米再生培养基上生长,其中所述的培养基含有选择剂(例如咪唑啉酮,不过可以使用不同的选择标记)。培养板在25℃于光照下孵育2-3周,或直至苗发育。将源自每个胚的绿色苗转移至玉米生根培养基并在25℃孵育2-3周,直至根发育。将生根的苗移植至温室中的土壤内。从针对所述选择剂显示耐受性并且含有单拷贝T-DNA插入物的植物产生T1种子。
小麦转化
小麦的转化用Ishida等(1996)Nature Biotech 14(6):745-50描述的方法进行。栽培品种Bobwhite(可从墨西哥CIMMYT获得)通常在转化中使用。不成熟的胚与含有所述表达载体的根癌农杆菌共培育,并且转基因植物通过器官发生过程回收。与农杆菌孵育后,所述胚在愈伤组织诱导培养基上、随后在再生培养基上体外培育,其中所述的培养基含有选择剂(例如咪唑啉酮,不过可以使用多种选择标记)。培养板在25℃于光照下孵育2-3周,或直至苗发育。将源自每个胚的绿色苗转移至生根培养基并在25℃孵育2-3周,直至根发育。将生根的苗移植至温室中的土壤内。从针对所述选择剂显示耐受性并且含有单拷贝T-DNA插入物的植物产生T1种子。
大豆转化
大豆根据对Texas A&M美国专利5,164,310中所述方法的改良方法转化。几个商业大豆品种对于通过这种方法的转化是可操作的。栽培品种Jack(从Illinois种子基金会可获得)通常用于转化。对大豆种子消毒以便体外播种。下胚轴、胚根和一片子叶从7日龄年幼籽苗中切下。进一步培育上胚轴和剩余子叶以使辅助节发育。将这些辅助节切下并与含有所述表达载体的根癌农杆菌孵育。在共培育处理之后,洗涤外植体并转移至选择培养基。切下再生的苗并置于苗伸长培养基上。将长度不超过1cm的苗置于生根培养基上直至根发育。生根的苗移植至温室中的土壤内。从针对所述选择剂显示耐受性并且含有单拷贝T-DNA插入物的植物产生T1种子。
油菜籽/卡诺拉油菜转化
使用5-6日龄年幼籽苗的子叶柄和下胚轴作为用于组织培养的外植体并且根据Babic等(1998,Plant Cell Rep 17:183-188)进行转化。商业栽培品种Westar(Agriculture Canada)是用于转化的标准品种,不过其他品种也可以使用。对卡诺拉油菜种子进行表面消毒以体外播种。从所述体外籽苗切下附带子叶的子叶叶柄外植体,并且通过将此叶柄外植体的切口末端浸入细菌悬液以(含有所述表达载体的)农杆菌接种。该外植体随后在23℃,16小时光照下于含有3mg/l BAP、3%蔗糖、0.7%植物琼脂的MSBAP-3培养基上培养2日。与农杆菌共培育2日后,将所述叶柄外植体转移至含有3mg/l BAP、头孢噻肟、羧苄青霉素或特美汀(300mg/l)的MSBAP-3培养基上培养7日,并且随后在含有头孢噻肟、羧苄青霉素或特美汀和选择剂的MSBAP-3培养基上培养,直至苗再生。当苗长度是5-10mm时,切下这些苗并转移至苗伸长培养基(MSBAP-0.5,含有0.5mg/l BAP)。将长度大约2cm的苗转移至生根培养基(MS0)用于根诱导。生根的苗移植至温室中的土壤内。从针对所述选择剂显示耐受性并且含有单拷贝T-DNA插入物的植物产生T1种子。
苜蓿转化
使用(McKersie等,1999Plant Physiol 119:839-847)的方法转化苜蓿的再生性克隆。苜蓿的再生和转化是基因型依赖性的并且因而需要再生性植物。已经描述了获得再生性植物的方法。例如,这些再生性植物可以选自栽培品种Rangelander(Agriculture Canada)或如Brown DCW和AAtanassov(1985.Plant Cell Tissue Culture 4:111-112)所述的任何其他商业苜蓿品种。备选地,已经选择RA3品种(威斯康星大学)用于组织培养(Walker等,1978Am J Bot 65:654-659)。叶柄外植体与含有所述表达载体的根癌农杆菌C58C1 pMP90(McKersie等,1999Plant Physiol119:839-847)或LBA4404的过夜培养物共培育。所述外植体在黑暗中于含有288mg/L Pro、53mg/L硫代脯氨酸、4.35g/L K2SO4和100μm乙酰丁香酮的SH诱导培养基上共培育3日。所述外植体在浓度减半的Murashige-Skoog培养基(Murashige和Skoog,1962)中洗涤并铺种在不含乙酰丁香酮而含有合适选择剂和抑止农杆菌生长的合适抗生素的相同SH诱导培养基上。几周后,将体细胞胚转移至不含生长调节剂、不含抗生素和含有50g/L蔗糖的BOi2Y发育培养基中。体细胞胚随后在浓度减半的Murashige-Skoog培养基上萌发。生根的籽苗移植至花钵内并且在温室中培育。从针对所述选择剂显示耐受性并且含有单拷贝T-DNA插入物的植物产生T1种子。
棉花转化
使用根癌农杆菌,根据US 5,159,135中所述的方法转化棉花。棉花种子在3%次氯酸钠溶液中持续20分钟进行表面消毒并且在含有500μg/ml头孢噻肟的蒸馏水中洗涤。随后将种子转移至含有50μg/ml苯菌灵的SH-培养基以萌发。将4-6日龄籽苗的下胚轴取出、切成0.5cm的小段并置于0.8%琼脂上。农杆菌悬液(约108个细胞/ml,从用目的基因和合适选择标记转化的过夜培养物稀释)用于接种所述下胚轴外植体。在室温和光照下3日后,将组织转移至含有Murashige和Skoog盐的固体培养基(1.6g/l脱乙酰吉兰糖胶),其中所述的Murashige和Skoog盐含有B5维生素(Gamborg等,Exp.Cell Res.50:151-158(1968))、0.1mg/l 2,4-D、0.1mg/l 6-糠氨基嘌呤和750μg/ml MgCL2并含有50-100μg/ml头孢噻肟和400-500μg/ml羧苄青霉素以杀死残余细菌。各个细胞系在2-3个月后分离(每隔4-6周传代培养)并且在用于组织扩增的选择性培养基上进一步培育(30℃,16小时光周期)。转化的组织随后在非选择性培养基上进一步培育2-3月以产生体细胞胚。将长度至少4mm的外观健康胚转移至细蛭石中的含有SH培养基的管内,其中所述的SH培养基补充有0.1mg/l吲哚乙酸、6-糠氨基嘌呤和赤霉酸。所述胚在30℃以16小时光周期培育,并且将2-3叶期的小植株转移至具有蛭石和营养物的花钵内。使植物硬化并随后移至温室以进一步培育。
实施例29:表型评价方法
29.1评价建立
产生大约35个独立的T0稻转化体。原代转化体从组织培养箱转移至温室以生长并收获T1种子。留下下述7个事件,其中所述事件的T1后代对所述转基因的存在/不存在以3∶1比例分离。对于这些事件中的每一个,通过监测目视标记表达而选出大约10株含有该转基因的T1籽苗(杂合子和纯合子)和大约10株缺少该转基因的T1籽苗(失效合子)。转基因植物和对应的失效合子于随机位置并排培育。温室条件是短日照(12小时光照),在光照下28℃和在黑暗中22℃以及相对湿度70%。
4个T1事件在T2世代中按照如对T1世代相同的评价方法进一步评估,不过每个事件采用更多个体。从播种期直至成熟期,将所述植物数次通过数字成像室。在每一时间点上,从至少6个不同角度拍摄每株植物的数字图像(2048×1536像素,1600万颜色)。
干旱筛选
来自T2种子的植物在盆栽土壤中在正常条件下培育直至它们达到抽穗期。随后将它们转移至其中减少灌溉的“干燥”区域。湿度探针插入随机选择的花钵内,以监测土壤水分含量(SWC)。当SWC下降低于某个阈值时,自动地对植物连续再灌溉直至再次达到正常水平。随后植物再次转移至正常条件正常条件。其余培育过程(植物成熟、种子收获)与不在非生物胁迫下培育的植物相同。生长和产量参数如对正常条件下生长所述那样记录。
氮使用效率筛选
来自T2种子的稻植物在盆栽土壤中在正常条件下培育,除了营养液不是正常条件之外。花钵从移植至成熟一直用氮(N)含量降低、通常降低7-8倍的特定营养液浇灌。其余培育过程(植物成熟、种子收获)与不在非生物胁迫下培育的植物相同。生长和产量参数如对正常条件下生长所述那样记录。
29.2统计分析:F-检验
使用两因素ANOVA(变量分析)作为整体评价植物表型特征的统计模型。对于用本发明基因转化的全部事件的全部植物的全部所测量参数实施F检验。实施F检验以检查该基因对全部转化事件的影响并验证该基因的整体作用(又称作基因总体作用)。真实基因总体作用显著性的阈值对于F检验设置在5%概率水平上。显著性F检验值指出基因作用,意指不仅仅是基因的存在或位置才造成表型上的差异。
因为实施了具有重叠事件的两个实验,故而进行联合分析。这用于检验对这两个实验影响的一致性,并且若是一致的,则用于积累来自两个实验的证据以提高结论的可信度。所用方法是考虑数据的多重水平结构的混合模型法(即实验-事件-分离子)。通过比较针对卡方分布(chi squaredistribution)的似然比检验而获得P-值。
29.3测量的参数
生物量相关的参数测量
植物从播种期至成熟期数次通过数字成像室。在每个时间点上,从至少6个不同角度拍摄每株植物的数字图像(2048×1536像素,1600万颜色)。
植物地上部分面积(或叶生物量)通过计数来自植物地上部分的数字图像上区别于背景的像素总数而确定。该值对相同时间点上从不同角度拍摄的画面进行平均化并且转化成通过校正以平方mm表述的物理表面值。实验显示以这种方式测量的植物地上部分面积与植物地上部分的生物量相关。地上部分面积是植物已经实现其最大叶生物量的时间点上所测量的面积。早期生长势是萌发后3周的植物(籽苗)地上部分的面积。根生物量的增加表述为根总生物量的增加(测量为植物寿命期间观察到的根最大生物量);或表述为根/冠比增加(测量为根和苗的活跃生长期间根质量与苗质量之间的比例)。
种子相关参数测量
将成熟的原发花序收获、计数、装袋、加条形码标记并且随后在干燥箱内于37°干燥3日。随后将所述花序脱粒,并且收集和计数全部种子。充实粒使用吹气装置与空粒分开。弃去空粒并且再次计数剩余部分。充实粒在分析天平上称重。充实种子数通过计数所述分离步骤后充实粒数目加以确定。种子总产量通过称量从一株植物收获的全部充实粒而测量。每株植物的种子总数通过计数从一株植物收获的壳数目测量。从计数的充实种子数及其总重量外推出千粒核重(TKW)。收获指数(HI)在本发明中定义为种子总产量与地上部分面积(mm2)之间的比率,乘以系数106。如本发明中定义的每花序的总花数是种子总数与成熟原发花序数目之间的比率。如本发明中定义的种子充实率是充实种子数对种子(或小花)总数的比例(表述为%)。
实施例30:转基因植物的表型评价的结果
评价在种子特异性启动子控制下表达CycHTr核酸的转基因稻植物的结果显示,与对照植物相比较,以下一种或多种参数提高:营养生物量(AreaMax)、根冠比、种子总重量(totwgseeds)、充实种子数(nrfilledseeds)、充实率(fillrate)、每穗花数目(flowperpan)、收获指数(HI)、千粒核重(TKW)、种子总数(nrtotalseed)。
对于带油质蛋白启动子的构建体,提高的参数包括在表O中给出的参数。
表O:在T1和T2阶段的植物的提高的种子产量参数,其中所述植物携带在油质蛋白启动子控制下的CycHTr转基因。
Figure G2008800037051D01961
实施例31:鉴定与SEQ ID NO:198和SEQ ID NO:199相关的序列
使用数据库搜索工具如基本局部比对工具(BLAST)(Altschul等(1990)J.Mol.Biol.215:403-410;和Altschul等(1997)Nucleic Acids Res.25:3389-3402),从国家生物技术信息中心(NCBI)的Entrez核苷酸数据库中维护的那些序列当中鉴定到与SEQ ID NO:198相关的(全长cDNA、EST或基因组)序列和/或与SEQ ID NO:199相关的蛋白质序列。使用该程序通过核酸序列或多肽序列与序列数据库比较并且计算匹配的统计显著性来找到序列之间的局部相似性区域。由SEQ ID NO:199编码的多肽用于TBLASTN算法,采用默认设置和过滤程序以忽略低复杂性序列启动。这种分析的结果通过配对比较进行观察,并根据概率评分(E-值)进行评级,其中所述的评分反映特定比对结果因偶然发生的概率(E-值越低,命中的显著性越高)。除了E-值外,比较过程也可以由同一性百分数评分。同一性百分数指两个比较的核酸(或多肽)序列之间在特定长度范围内相同核苷酸(或氨基酸)的数目。在一些情况下,可以调整默认参数以修改所述搜索的严格性。
表P提供与如SEQ ID NO:198所代表的核酸序列和SEQ ID NO:199所代表的蛋白质序列相关的核酸序列和多肽序列名单。
表P:编码Remorin多肽的核酸序列和Remorin多肽
名称 来源生物   核酸SEQIDNO:   多肽SEQIDNO: 数据库登录号 数据库登录号
  Remorin   拟南芥   198   199   NM_115614.2   NP_567050.1
  remorin   拟南芥   200   201   AY086863.1   AAM63910.1
  Remorin   拟南芥   202   203   NM_115990.3   NP_191685.1
  remorin   拟南芥   204   205   M25268.1   AAA57124.1
  remorin   拟南芥   206   207   BT000016.1   AAN15335.1
  remorin   拟南芥   208   209   AF387006_1   AAK62451.1
  remorin   拟南芥   210   211   NM_203095.1   NP_974824.1
  remorin   拟南芥   212   213   NM_122280.2   NP_197764.1
  remorin   拟南芥   214   215   NM_114753.1   NP_190463.1
  Remorin   拟南芥   216   217   NM_130145.3   NP_182106.1
  假定的   拟南芥   218   219   gi|7267383   CAB80876.1
  未命名   拟南芥   220   221   gi|10176838   BAB10048.1
  remorin   拟南芥   222   223   NM_116292.2   NP_191976.2
  remorin   拟南芥   224   225   NM_179535.1   NP_849866.1
  Remorin   拟南芥   226   227   NM_001036171.1   NP_001031248.1
  Remorin   拟南芥   228   229   NM_105426.2   NP_564900.1
  remorin   拟南芥   230   231   NM_125521.1   NP_200936.1
  Remorin   拟南芥   232   233   NM_129751.1   NP_181718.1
  remorin   拟南芥   234   235   NM_101258.1   NP_172845.1
  remorin   拟南芥   236   237   gi|7270623   CAB80363.1
  remorin   拟南芥   238   239   NM_104263.3   NP_175789.2
  Remorin   拟南芥   240   241   NM_102770.3   NP_174322.1
  remorin   拟南芥   242   243   NM_202247.1   NP_973976.1
  remorin   拟南芥   244   245   NM_126277.1   AAO23587.1
  remorin   拟南芥   246   247   gi|6382042   AAC13631.1
  remorin   拟南芥   248   249   gi|12597777   AAG60092.1
  remorin   拟南芥   250   251   gi|12325073   AAG52495.1
  remorin   拟南芥   252   253   gi|6850877   CAB71056.1
  remorin   拟南芥   254   255   gi|6434255   CAB62016.1
  remorin   拟南芥   256   257   gi|6491703   CAB66111.1
  remorin   拟南芥   258   259   gi|12324670   AAG52296
  remorin   拟南芥   260   261   gi|20198316   AAB63554
  remorin   拟南芥   262   263   gi|7940274   AAF79398
  remorin   稻   264   265   Os02g0824500   NP_001048576.1
  remorin   稻   266   267   Os02g0642200   NP_001047554.1
  remorin   稻   268   269   Os04g0533300   NP_001053409.1
  remorin   稻   270   271   Os10g0503800   BAF26915.1
  remorin   稻   272   273   Os07g0208600   BAF21077.1
  remorin   稻   274   275   Os03g0111200   BAF10636.1
  remorin   稻   276   277   Os07g0569100   NP_001060036.1
  remorin   稻   278   279   Os03g0808300   NP_001051650.1
  remorin   稻   280   281   Os03g0211500   NP_001049348.1
  remorin   稻   282   283   Os02g0602000   BAF09268.1
  remorin   稻   284   285   Os02g0658400   BAF09549.1
  remorin   稻   286   287   Os03g0120200   BAF10700.1
  remorin   稻   288   289   Os02g0116800   NP_001045682.1
  remorin   稻   290   291   Os04g0620200   NP_001053905.1
  remorin   稻   292   293   Os12g0613600   BAF30284.1
  remorin   稻   294   295   Os11g0616300   BAF28646.1
  remorin   稻   296   297   Os10g0325400   BAF26266.1
  remorin   稻   298   299   Os09g0456100   BAF25275.1
  remorin   稻   300   301   Os08g0471800   NP_001062016.1
  remorin   稻   302   303   Os02g0767000   NP_001048227.1
  假定的   玉米   304   305   gi|23928433   AAN40027.1
  remorin   马铃薯   306   307   gi|1881584   AAB49425.1
  remorin   大豆   308   309   gi|83853825   ABC47866.1
  remorin   蒺藜苜蓿   310   311   gi|61097833   ABN08208.1
  remorin   蒺藜苜蓿   312   313   gi|62629912   ABE89592.1
  remorin   蒺藜苜蓿   314   315   gi|84662897   ABE87162.1
  rem-1   番茄   316   317   gi|4731572   AAD28506.1
  rem-2   番茄   318   319   gi|4883529   AAD28507.2
  remorin   蒺藜苜蓿   320   321   gi|49170172   ABE84731.1
remorin   小果野蕉(Musaacuminata) 322 323 gi|102140012 ABF70164.1
  remorin   蒺藜苜蓿   324   325   gi|52694025   ABE86981.1
实施例32:多肽序列的比对
多肽序列的比对使用来自Vector NTI(Invitrogen)的Alignment X程序进行,其中所述AlignX程序基于受欢迎的累进比对Clustal算法(Thompson等(1997)Nucleic Acids Res 25:4876-4882;Chenna等(2003),Nucleic Acids Res 31:3497-3500)。空位开口罚分的默认值是10,空位延伸罚分的默认值是0.1并且所选的权重矩阵是Blosum 62(若比对多肽)。Remorin之间的序列保守性基本上位于多肽的羧基端Remorin结构域内,氨基端结构域通常在序列长度和组成上更多变。Remorin多肽的羧基端Remorin结构域在图20中比对。SEQ ID NO:199的羧基端Remorin结构域(且如SEQ ID NO:326中所代表)中包含的氨基酸残基以粗体标记并且上方为黑色框。绝大部分Remorin多肽在羧基端10个氨基酸残基内包含至少一个Cys和/或一个Phe,在图20中以框示出。将预测的卷曲螺旋区域加双下划线显示并且将推定的苏素化位点加框显示。
实施例33:计算在实施本发明方法中有用的多肽序列之间总体同一性百分数
使用现有技术领域可获得的方法之一,即MatGAT(矩阵总体比对工具)软件(BMC Bioinformatics.2003 4:29.MatGAT:使用蛋白质序列或DNA序列产生相似性/同一性矩阵的一项应用,Campanella JJ,Bitincka L,Smalley J;软件由Ledion Bitincka维护)确定在实施本发明方法中有用的全长多肽序列之间的总体相似性和同一性百分数。MatGAT软件对DNA序列或蛋白质序列产生相似性/同一性矩阵,无需数据的预先比对。该程序使用Myers和Miller总体比对算法(空位开口罚分12和空位延伸罚分2)进行一系列配对比对,使用例如Blosum 62(对于多肽而言)计算相似性和同一性并且随后将结果置于距离矩阵内。在分割线下半部分显示序列相似性,和在对角分割线的上半部分显示序列同一性。
比较过程中使用的参数是:
评分矩阵:Blosum62
第一空位:12
延伸空位:2
表Q中显示在例如来自拟南芥属植物的多肽序列全长范围(不包括部分多肽序列)内的总体相似性和同一性的该软件分析的结果。同一性百分数在对角线以上给出而相似性百分数在对角线以下给出。
与SEQ ID NO:199相比较,在实施本发明方法中有用的拟南芥多肽序列之间的同一性百分数可以低至11%氨基酸同一性。
表Q1显示了拟南芥Remorin多肽的羧基端Remorin结构域之间的同一性百分数,如SEQ ID NO:326所代表的SEQ ID NO:199的羧基端Remorin结构域。Remorin结构域SEQ ID NO:326和其它拟南芥Remorin羧基端Remorin结构域之间的同一性百分数提高至16%氨基酸同一性。
Figure G2008800037051D02021
实施例34:鉴定在实施本发明方法中有用的多肽序列中包含的结构域
蛋白质家族、结构域和位点的集成资源(InterPro)数据库是针对基于文本及基于序列的搜索法的常用特征标识数据库的集成界面。InterPro数据库合并了这些数据库,所述数据库使用不同方法学及不同程度的有关充分表征的蛋白质的生物学信息以获得蛋白质特征标识。合作数据库包括SWISS-PROT、PROSITE、TrEMBL、PRINTS、ProDom和Pfam,Smart和TIGRFAMs。Interpro由英国欧洲生物信息学研究所维护。
如SEQ ID NO:199所代表多肽序列的InterPro扫描结果呈现于表R和图20中。
表R:如SEQ ID NO:199所代表多肽序列的InterPro扫描结果(主要登录号)。
数据库 登录号 登录名称   在SEQ ID NO 199上的氨基酸位置
  InterPro   IPR005516   Remorin,羧基端区域   180-291
  Pfam   PF03763   Remorin_C   180-291
  Prodom   PD350442   Remorin_C   180-291
Pfam是包括众多常见蛋白质结构域和家族的多重序列比对和隐匿马尔科夫模型的庞大数据集合。Pfam由英国Sanger研究所服务器维护。
实施例35:预测在实施本发明方法中有用的多肽序列的二级结构特征
卷曲螺旋通常含有重复的七氨基酸残基模式,称作七氨基酸重复序列。卷曲螺旋对于鉴定蛋白质-蛋白质相互作用如寡聚化是重要的,其中所述的蛋白质是同一个蛋白质家族的相同蛋白或相关的蛋白质。Remorin多肽可以与自身相互作用,或与Remorin直向同源物或旁系同源物相互作用。最近在从序列数据计算性预测卷曲螺旋方面取得长足进展。在ExPASy蛋白质组工具网站可获得本领域技术人员熟知的众多算法。其中之一是COILS,这是将序列与已知的平行双链卷曲螺旋的数据库比较并获得相似性评分的程序。此程序通过将该评分与球状蛋白和卷曲螺旋蛋白中的评分分布比较,随后计算该序列采取卷曲螺旋构象的概率。
如SEQ ID NO:199所代表的Remorin多肽以高概率在检验的全部三个窗口(14,21和28)中具有预测的羧基端卷曲螺旋结构域。在表S中显示了残基位置、残基、所述3个窗口和相应的概率值。在图2中是COILS算法对如SEQ ID NO:2所代表多肽的图形输出结果,其中在该多肽的羧基端半部分中,在全部三个窗口(如三条线所代表)中清楚地可见到预测的卷曲螺旋。
表S:COILS算法对如SEQ ID NO:199所代表多肽的数字输出结果。显示了残基位置(#)、残基、所述三个窗口和相应的概率值。高于0.09的概率以灰色显示。
# 残基   窗口=14 概率   窗口=21 概率   窗口=28
  213   G   c   0.003   C   0.014   b   0.004
  214   W   d   0.002   C   0.069   c   0.013
  215   L   d   0.014   D   0.821   d   0.626
  216   N   e   0.014   E   0.821   e   0.626
  217   E   f   0.014   F   0.821   f   0.626
  218   Q   g   0.014   G   0.821   g   0.626
  219   V   a   0.014   A   0.821   a   0.626
  220   H   b   0.014   B   0.821   b   0.626
  221   R   c   0.066   C   0.821   c   0.626
  222   A   d   0.066   D   0.821   d   0.626
  223   N   e   0.066   E   0.821   e   0.626
  224   S   f   0.066   F   0.821   f   0.626
  225   W   g   0.066   G   0.821   g   0.626
  226   M   a   0.642   A   0.821   a   0.626
  227   K   b   0.642   B   0.821   b   0.626
  228   K   c   0.642   C   0.821   c   0.626
  229   I   d   0.642   D   0.821   d   0.626
  230   E   e   0.642   E   0.821   d   0.746
  231   R   f   0.642   F   0.821   b   0.819
  232   K   g   0.642   G   0.821   c   0.819
  233   L   a   0.642   A   0.821   d   0.819
  234   E   b   0.642   B   0.821   e   0.819
  235   D   c   0.642   C   0.821   f   0.819
  236   R   d   0.642   D   0.789   f   0.889
  237   R   e   0.642   D   0.871   g   0.889
  238   A   f   0.642   E   0.871   a   0.889
  239   K   f   0.908   F   0.976   f   0.967
  240   A   g   0.930   G   0.976   g   0.967
  241   M   a   0.982   A   0.976   a   0.967
  242   E   b   0.982   B   0.976   b   0.967
  243   K   c   0.982   C   0.976   c   0.967
  244   T   d   0.982   D   0.976   d   0.967
  245   Q   e   0.982   E   0.976   e   0.967
  246   N   f   0.982   F   0.976   f   0.967
  247   K   g   0.982   G   0.976   g   0.967
  248   V   a   0.982   A   0.976   a   0.967
  249   A   b   0.982   B   0.976   b   0.967
  250   K   c   0.982   C   0.976   c   0.967
  251   A   d   0.982   D   0.976   d   0.967
  252   Q   e   0.982   E   0.976   e   0.967
  253   R   f   0.982   F   0.976   f   0.967
  254   K   g   0.982   G   0.976   g   0.967
  255   A   a   0.981   A   0.976   a   0.967
  256   E   b   0.981   B   0.976   b   0.967
  257   E   c   0.981   C   0.976   c   0.967
  258   R   d   0.727   D   0.976   d   0.967
  259   R   e   0.578   E   0.976   e   0.967
  260   A   b   0.577   F   0.964   f   0.967
  261   T   c   0.577   G   0.958   g   0.967
  262   A   d   0.577   A   0.913   a   0.967
  263   E   e   0.577   B   0.913   b   0.967
  264   G   f   0.577   C   0.585   c   0.967
  265   K   g   0.577   D   0.550   d   0.967
  266   R   a   0.577   E   0.407   e   0.967
  267   G   b   0.092   F   0.064   f   0.769
  268   T   c   0.029   G   0.024   g   0.741
  269   E   d   0.010   D   0.023   a   0.159
  270   V   a   0.007   E   0.023   b   0.017
  271   A   b   0.007   F   0.023   c   0.009
  272   R   c   0.007   G   0.023   g   0.007
  273   V   d   0.007   A   0.023   a   0.007
  274   L   e   0.007   B   0.007   b   0.007
其他重要二级结构可以使用需要如SEQ ID NO:199所示序列信息的算法来预测。众多可用算法在瑞士生物信息研究所(Swiss BioinformaticsInstitute)维护的ExPaSy站点上再分组。例如,Jpred是这样的网服务器,其采集蛋白质序列或蛋白质序列的多重比对结果并使用称作Jnet的神经网络获得二级结构。预测是对每个残基在α螺旋(H)中、β折叠(E)中或无规卷曲(C)二级结构中的定义。下文是该预测程序对如SEQ ID NO:199所代表的Remorin多肽的输出结果:
MLTLYGQERSPENSTTSTTDASDRRDETPSSEIVVRDIHAMTTTTELTRPQQRGSGGGYLSP
-------------------------------EEEEEEEE-----------------------
SRSIAFSDGTTSSGENFTTVSREFNALVIAGSSMDNNSNGTNQSGGHRDVIRDERNELTRIG
------------------EEHHHHHHHHHH-----------------EEEEEE---------
ENDDVGDHGQVPEEDSNPWAIVPDDYNNRDGSENNIVLASSGGQNRMVTTASVQRVKREEVE
-------------------EEE---------------------------EEEEEEEHHHHHH
AKITAWQTAKVAKINNRFKRQDAVINGWLNEQVHRANSWMKKIERKLEDRRAKAMEKTQNKV
HHHHHHHHHHHHHH-------EEE----HHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH
AKAQRKAEERRATAEGKRGTEVARVLEVANLMRAVGRPPAKRSFFSLS
HHHHHHHHHHHHHHHHH--HHHHHHHHHHHHHHH---------EE---
实施例36:如SEQ ID NO:199所代表的多肽序列的氨基酸组成
可以使用来自ExPASy服务器的软件程序、尤其ProtParam工具,计算确定多肽结构域是否富含特定氨基酸的一级氨基酸组成(%)(Gasteiger等(2003)ExPASy:用于详细了解并分析蛋白质的蛋白质组服务器.NucleicAcids Res 31:3784-3788)。随后可以将目的蛋白质的组成与UniProtKB/Swiss-Prot蛋白质序列数据库(2007年3月6日发布的52.0版本,含有260175序列条目,包含从152564个参考物中抽取的95002661个氨基酸)中的平均氨基酸组成(%)比较。
已经对如SEQ ID NO:199所代表的多肽、SEQ ID NO:199的Remorin结构域和SEQ ID NO:199的氨基端结构域分析其氨基酸组成。结果在下表T和U中显示。
表T:与UniProtKB/Swiss-Prot蛋白质序列数据库(2007年3月6日发布的52.0版本)相比较,如SEQ ID NO:199所代表的多肽、SEQ ID NO:199的羧基端Remorin结构域和SEQ ID NO:199的氨基端结构域(从氨基端至羧基端计数为羧基端Remorin结构域上游的氨基酸残基)的氨基酸组成(以%表示)
Figure G2008800037051D02091
表U:如SEQ ID NO:199所代表的多肽、SEQ ID NO:199的Remorin结构域和SEQ ID NO:199的氨基端结构域中带正电荷和带负电荷的残基的数目。
SEQ IDNO:199   Remorin结构域(180-290)   氨基端结构域(1-179) Swiss-Prot52.0百分数
 带负电荷的残基(Asp+Glu)的总数: 42 14 28 12%
 带正电荷的残基(Arg+Lys)的总数: 45 30 15 11.3%
 带电荷的氨基酸的总计百分数 29% 40% 24% 23.33%
Remorin结构域富含带电荷的氨基酸,尤其是Lys,Arg和Glu。
实施例37预测在实施本发明方法中有用的多肽中包含的丝氨酸/苏氨酸蛋白激酶磷酸化位点
多肽的磷酸化状态通常与激活或失活相关或与激活/失活该多肽的中间水平相关。OGA和/或PGA增强的Remorin磷酸化是在一个或多个苏氨酸残基处进行,作为丝氨酸/苏氨酸蛋白激酶的产物。虽然所有丝氨酸/苏氨酸激酶均使它们底物中的丝氨酸或苏氨酸残基磷酸化,但它们基于分布于磷酸受体位点侧翼的残基选择特定的残基以磷酸化,所述的残基在一起包含共有序列。如本领域熟知,已经开发了几种算法以基于给定多肽序列预测此类磷酸化位点。维护于丹麦技术大学的NetPhos 2.0服务器对真核生物蛋白中的丝氨酸、苏氨酸和酪氨酸磷酸化位点进行神经网络预测。
NetPhos 2.0服务器-预测结果
MLTLYGQERSPENSTTSTTDASDRRDETPSSEIVVRDIHAMTTTTELTRPQQRGSGGGYLSPSRSIAFSDGTTSSGENFT      80
.........S...S..ST...S.....T.SS...........TT..........S.....S.......S....SS.....      80
TVSREFNALVIAGSSMDNNSNGTNQSGGHRDVIRDERNELTRIGENDDVGDHGQVPEEDSNPWAIVPDDYNNRDGSENNI     160
...........................................................................S....     160
VLASSGGQNRMVTTASVQRVKREEVEAKITAWQTAKVAKINNRFKRQDAVINGWLNEQVHRANSWMKKIERKLEDRRAKA     240
....S.......T....................T.............................S................     240
MEKTQNKVAKAQRKAEERRATAEGKRGTEVARVLEVANLMRAVGRPPAKRSFFGLG                             320
....................T......T............................                             320
预测的磷酸化位点:Ser:14 Thr:8
丝氨酸预测
名称                位置      上下关系      分值     预测
序列                10        GQERSPENS     0.986    S
序列                14        SPENSTTST     0.974    S
序列                17        NSTTSTTDA     0.997    S
序列                22        TTDASDRRD     0.995    S
序列                30        DETPSSEIV     0.730    S
序列                31        ETPSSEIVV     0.677    S
序列                55        QQRGSGGGY     0.972    S
序列                61        GGYLSPSRS     0.979    S
序列                63        YLSPSRSIA     0.395    .
序列                65        SPSRSIAFS     0.415    .
序列                69        SIAFSDGTT     0.942    S
序列                74        DGTTSSGEN     0.990    S
序列                75        GTTSSGENF     0.845    S
序列                83        FTTVSREFN     0.237    .
序列                94        VIAGSSMDN     0.417    .
序列                95        IAGSSMDNN     0.311    .
序列                100       MDNNSNGTN     0.026    .
序列                106       GTNQSGGHR     0.014    .
序列                140       PEEDSNPWA     0.023    .
序列                156       NRDGSENNI     0.951    S
序列                164       IVLASSGGQ     0.014    .
序列                165       VLASSGGQN     0.960    S
序列                176       VTTASVQRV     0.164    .
序列                224       HRANSWMKK     0.895    S
序列                291       PAKRSFFSL     0.039    .
序列                294       RSFFSLS--     0.121    .
序列                296       FFSLS----     0.019    .
苏氨酸预测
名称                位置      上下关系      分值     预测
序列                3         --MLTLYGQ     0.176    .
序列                15        PENSTTSTT     0.122    .
序列                16        ENSTTSTTD     0.059    .
序列            18    STTSTTDAS     0.526    T
序列            19    TTSTTDASD     0.038    .
序列            28    RRDETPSSE     0.983    T
序列            42    IHAMTTTTE     0.165    .
序列            43    HAMTTTTEL     0.918    T
序列            44    AMTTTTELT     0.673    T
序列            45    MTTTTELTR     0.069    .
序列            48    TTELTRPQQ     0.061    .
序列            72    FSDGTTSSG     0.118    .
序列            73    SDGTTSSGE     0.491    .
序列            80    GENFTTVSR     0.055    .
序列            81    ENFTTVSRE     0.331    .
序列            103   NSNGTNQSG     0.010    .
序列            121   RNELTRIGE     0.280    .
序列            173   NRMVTTASV     0.528    T
序列            174   RMVTTASVQ     0.484    .
序列            190   EAKITAWQT     0.138    .
序列            194   TAWQTAKVA     0.936    T
序列            244   AMEKTQNKV     0.497    .
序列            261   ERRATAEGK     0.951    T
序列            268   GKRGTEVAR     0.769    T
实施例38:鉴定用于修饰如SEQ ID NO:199所代表的多肽序列的预测位点
多肽的翻译后修饰,通常在特定位点上的多肽的翻译后修饰一般是重要的,但不是必需的对这些多肽的生物学功能的绝对要求。然而,鉴定预测的翻译后修饰位点可以有助于更好地理解目的多肽参与细胞的生物学。
38.1 SUMO基序的鉴定
苏素化是类似于遍在蛋白化的蛋白质翻译后修饰作用,SUMO(小型 在蛋白样调节物)与底物蛋白中赖氨酸残基的可逆共价结合改变了与SUMO缀合的蛋白质的特性。然而,与遍在蛋白相反,SUMO缀合作用一般不导致底物降解;反而,苏素化协调对众多不同生物学过程的一系列不同影响,所述的生物学过程包括蛋白质定位和稳定性、转录活性、胞核-胞质信号作用和运输、以及基因组复制,以及基因表达的调节和病毒繁殖。
可以使用特定算法如ExPASy服务器上的SUMOplot预测推定的苏素化位点。大部分SUMO修饰的蛋白质含有四肽基序B-K-x-D/E,其中B是疏水性残基,K是与SUMO缀合的赖氨酸,x是任意氨基酸(aa),D或E是酸性残基。
将SEQ ID NO:199的Remorin多肽提交至SUMOplot算法时,预测到苏素化位点位于181位置处的Lys(或K),如下文所示。
  编号   位置   组   评分
  1   K181   A SVQR VKRE EVEAK   0.93
1   MLTLYGQERS PENSTTSTTD ASDRRDETPS SEIVVRDIHA MTTTTELTRP
51  QQRGSGGGYL SPSRSIAFSD GTTSSGENFT TVSREFNALV IAGSSMDNNS
101 NGTNQSGGHR DVIRDERNEL TRIGENDDVG DHGQVPEEDS NPWAIVPDDY
151 NNRDGSENNI VLASSGGQNR MVTTASVQRV KREEVEAKIT AWQTAKVAKI
201 NNRFKRQDAV INGWLNEQVH RANSWMKKIE RKLEDRRAKA MEKTQNKVAK
251 AQRKAEERRA TAEGKRGTEV ARVLEVANLM RAVGRPPAKR SFFSLS
38.2PEST基序的鉴定
PEST序列存在于众多迅速降解的蛋白质中。已经提出这些序列起到蛋白水解性降解的信号作用。算法PESTFind(维护于EmbNet)搜索12个或更多个氨基酸的亲水区,其中所述亲水区含有至少一个P(脯氨酸)、一个E(谷氨酸)或D(天冬氨酸)和一个S(丝氨酸)或T(苏氨酸),侧翼分布有K(赖氨酸),R(精氨酸)或H(组氨酸)残基。该算法对发现的每个可能PEST序列赋予一个评分。评分的范围是-50至+50,大于零的评分指示可能的PEST区,而大于+5的值具有特殊意义。使用该算法,发现在氨基酸位置9-24处的预测PEST基序,疏水指数是28.64。低疏水性提示该区域可能是蛋白酶可接近的表面或提示用于与其他蛋白质(如分子伴侣、运输蛋白或蛋白水解体系的组分)的蛋白质-蛋白质相互作用。
MLTLYGQERSPENSTTSTTDASDRRDETPSSEIVVRDIHAMTTTTELTRP  50
         +++++++++++++++ -----------
QQRGSGGGYLSPSRSIAFSDGTTSSGENFTTVSREFNALVIAGSSMDNNS  100
NGTNQSGGHRDVIRDERNELTRIGENDDVGDHGQVPEEDSNPWAIVPDDY  150
                               -------------------
NNRDGSENNIVLASSGGQNRMVTTASVQRVKREEVEAKITAWQTAKVAKI  200
--
NNRFKRQDAVINGWLNEQVHRANSWMKKIERKLEDRRAKAMEKTQNKVAK  250
AQRKAEERRATAEGKRGTEVARVLEVANLMRAVGRPPAKRSFFSLS      296
++++++可能的PEST序列
------差的PEST序列
潜在的PEST序列:
---------------------------------------------------------------------
9 RSPENSTTSTTDASDR  24
PEDST的摩尔份数:63.24
疏水指数:28.64
PEST-FIND评分:+20.46
--------------------------------------------
实施例39:克隆如SEQ ID NO:198所代表的核酸序列
除非另外说明,重组DNA技术根据(Sambrook(2001)MolecularCloning:a laboratory manual,第3版Cold Spring Harbor LaboratoryPress,CSH,New York)或Ausubel等(1994),Current Protocols inMolecular Biology,Current Protocols第1卷和第2卷中描述的标准方案进行。用于植物分子研究工作的标准材料和方法在BIOS科学出版有限责任公司(BIOS Scientific Publications Ltd(英国))和Blackwell科学出版社(Blackwell Scientific Publications(英国))出版的R.D.D.Croy的PlantMolecular Biology Labfax(1993)中描述。
使用从mRNA合成的拟南芥属植物cDNA库作为模板通过PCR扩增拟南芥Remorin基因,其中所述mRNA从混合的植物组织提取。包含用于Gateway重组的AttB位点的引物prm09186(SEQ ID NO:327;有义:5’-GGGGACAAGTTTGTACAAAAAAGCAGGCTTAAACAATGTTGACTTTGTACGGTCAA-3’)和引物prm09187SEQ ID NO:328;反义互补的:5’-GGGGACCACTTTGTACAAGAAAGCTGGGTAGCTTAGCTAGGAAAGAGAGAA-3’)用于PCR扩增。使用Hifi Taq DNA聚合酶在标准条件下进行PCR。还使用标准方法扩增并纯化预期长度的PCR片段(包括attB位点)。随后进行Gateway方法的第一步骤,即BP反应,在该步骤期间PCR片段与pDONR201质粒发生体内重组,以产生根据Gateway命名的“进入克隆”。质粒pDONR201作为
Figure G2008800037051D02151
技术的部分从Invitrogen购头。
实施例40:使用如SEQ ID NO:198所代表的核酸序列构建表达载体
包含SEQ ID NO:198的进入克隆随后与用于稻转化的一种终端载体在LR反应中一起使用。这种载体在T-DNA边界内含有植物选择标记;可筛选的标记表达盒和旨在使LR与已克隆入所述进入克隆的目的核酸序列体内重组的Gateway盒作为功能性元件。用于组成型表达的稻GOS2启动子(SEQ ID NO:329)位于这种Gateway盒上游。也用于组成型表达的另一种启动子-高速泳动族B(HMGB;SEQ ID NO:330)位于该Gateway盒上游。
在LR重组步骤后,所得表达载体pGOS2::Remorin和pHMGB::Remorin(图21)根据本领域熟知的方法转化至农杆菌菌株LBA4044。
实施例41:植物转化
稻转化
独立地使用含有所述表达载体的农杆菌来转化稻植物。将稻粳型栽培品种Nipponbare的成熟干燥种子脱壳。通过如下方式实施消毒:在70%乙醇中孵育1分钟,随后在0.2%HgCl2中孵育30分钟,随后用无菌蒸馏水洗涤6次15分钟。无菌的种子随后在含有2,4-D的培养基(愈伤组织诱导培养基)上萌发。在黑暗中孵育4周后,将小盾片衍生的胚发生的愈伤组织匠下并在相同的培养基上增殖。2周后,将愈伤组织通过在同一种培养基上传代培养另外2周进行繁殖或增殖。胚发生的愈伤组织片在新鲜培养基上传代培养3日,随后共培育(以助长细胞分裂活性)。
将含有每一种表达载体的农杆菌菌株LBA4404独立地用于共培育。农杆菌接种在含有适宜抗生素的AB培养基上并在28℃培养3日。随后收集细菌并在液体共培育培养基中悬浮至密度(OD600)约1。该悬液随后转移至培养皿内并将所述愈伤组织浸没于此悬液内15分钟。该愈伤组织随后在滤纸上蘸干并转移至固化的共培育培养基,并在25℃于黑暗中孵育3日。共培育的愈伤组织在含2,4-D的培养基上在28℃于黑暗中在选择剂存在下培育4周。在此期间,迅速生长的抗性愈伤组织团发育。将这种材料转移至再生培养基并在光照下孵育后,胚发生潜能得到释放并且苗在随后4至5周内发育。将苗从愈伤组织上切下并且在含有植物生长素的培养基上孵育2至3周,将苗从所述培养基转移至土壤。在温室中于高湿度和短日照下生长硬化的苗。
对于每一构建体,产生大约35个独立的T0稻转化体。将原代转化体从组织培养箱转移至温室。在定量PCR分析验证T-DNA插入物的拷贝数后,仅保留针对所述选择剂显示抗性的单拷贝转基因植物用于收获T1种子。种子随后在移栽后3至5个月收获。该方法以超过50%的比例产生单基因座转化体(Aldemita和Hodges1996,Chan等1993,Hiei等1994)。
实施例42:表型评价方法
42.1评价建立
产生大约35个独立的T0稻转化体。原代转化体从组织培养箱转移至温室以生长并收获T1种子。留下下述6个事件,其中所述事件的T1后代对所述转基因的存在/不存在以3∶1比例分离。对于这些事件中的每一个,通过监测目视标记表达而选出大约10株含有该转基因的T1籽苗(杂合子和纯合子)和大约10株缺少该转基因的T1籽苗(失效合子)。转基因植物和对应的失效合子于随机位置并排培育。温室条件是短日照(12小时光照),在光照下28℃和在黑暗中22℃以及相对湿度70%。
植物从播种期至成熟期数次通过数字成像室。在每个时间点上,从至少6个不同角度拍摄每株植物的数字图像(2048×1536像素,1600万颜色)。
氮使用效率筛选
来自T2种子的稻植物在盆栽土壤中在正常条件下培育,除了营养液不是正常条件之外。花钵从移植至成熟一直用氮(N)含量降低、通常降低7-8倍的特定营养液浇灌。其余培育过程(植物成熟、种子收获)与不在非生物胁迫下培育的植物相同。生长和产量参数如对正常条件下生长所述那样记录。
盐胁迫筛选
植物在由椰子纤维和Argex(比率3∶1)组成的基质上培育。在移植小植物至温室后头2周期间使用正常的营养液。在头两周之后,向所述营养液添加25mM盐(NaCl),直至收获植物。随后测量种子相关参数。
42.2统计分析:F-检验
使用两因素ANOVA(变量分析)作为整体评价植物表型特征的统计模型。对于用本发明基因转化的全部事件的全部植物的全部所测量参数实施F检验。实施F检验以检查该基因对全部转化事件的影响并验证该基因的整体作用(又称作基因总体作用)。真实基因总体作用显著性的阈值对于F检验设置在5%概率水平上。显著性F检验值指出基因作用,意指不仅仅是基因的存在或位置才造成表型上的差异。
42.3测量的参数
生物量相关的参数测量
植物从播种期至成熟期数次通过数字成像室。在每个时间点上,从至少6个不同角度拍摄每株植物的数字图像(2048×1536像素,1600万颜色)。
植物地上部分面积(或叶生物量)通过计数来自植物地上部分的数字图像上区别于背景的像素总数而确定。该值对相同时间点上从不同角度拍摄的画面进行平均化并且转化成通过校正以平方mm表述的物理表面值。实验显示以这种方式测量的植物地上部分面积与植物地上部分的生物量相关。T地上部分面积是植物已经实现其最大叶生物量的时间点上所测量的面积。早期生长势是萌发后3周的植物(籽苗)地上部分的面积。根生物量的增加表述为根总生物量的增加(测量为植物寿命期间观察到的根最大生物量);或根生物量的增加表述为根总生物量的增加(测量为植物寿命期间观察到的根最大生物量)。
种子相关参数测量
将成熟的原发花序收获、计数、装袋、加条形码标记并且随后在干燥箱内于37°干燥3日。随后将所述花序脱粒,并且收集和计数全部种子。充实粒使用吹气装置与空粒分开。弃去空粒并且再次计数剩余部分。充实粒在分析天平上称重。充实种子数通过计数所述分离步骤后保留的充实粒数目加以确定。每株植物的种子总重量通过称量从一株植物收获的全部充实粒而测量。每株植物的种子总数通过计数从一株植物收获的壳数目测量。从计数的充实种子数及其总重量外推出千粒核重(TKW)。收获指数(HI)在本发明中定义为种子总产量与地上部分面积(mm2)之间的比率,乘以系数106。如本发明中定义的每花序的总花数是种子总数与成熟原发花序数目之间的比率。如本发明中定义的种子充实率是充实种子数对种子(或小花)总数的比例(表述为%)。
实施例43:转基因稻植物的表型评价的结果
下文描述评价表达如SEQ ID NO:199所代表的Remorin核酸序列的转基因稻植物的结果,其中所述的Remorin核酸序列处在用于组成型表达的GOS2启动子控制下。
如表V中所示,与相应的失效合子(对照)相比较,转基因植物的种子充实率、每株植物的种子总产量、充实种子总数、种子总数、千粒核重(TKW)和收获指数显著提高。
表V:评价在GOS2启动子控制下表达如SEQ ID NO:199所代表的Remorin核酸序列的转基因稻植物的结果。
  T1世代的平均提高率%
  种子充实率   10%
  每株植物的种子总产量   19%
  充实种子总数   15%
  种子总数   5%
  TKW   3%
  收获指数   21%
下文描述评价表达如SEQ ID NO:199所代表的Remorin核酸序列的转基因稻植物的结果,其中所述的Remorin核酸序列处在用于组成型表达的HMGB启动子控制下。
如表W中所示,与相应的失效合子(对照)相比较,转基因植物的种子充实率、每株植物的种子总产量、充实种子总数、种子总数、千粒核重(TKW)和收获指数显著提高。
表W:评价在HMGB启动子控制下表达如SEQ ID NO:199所代表的Remorin核酸序列的转基因稻植物的结果。
  T1世代的平均提高率%
  种子充实率   6%
  每株植物的种子总产量   14%
  充实种子总数   14%
  种子总数   7%
  TKW   1%
  收获指数   12%
实施例44:转基因稻植物的表型评价的结果
编码如SEQ ID NO:203,SEQ ID NO:217,SEQ ID NO:227,SEQ IDNO:229,SEQ ID NO:233和SEQ ID NO:241所代表的Remorin多肽的核酸序列置于组成型启动子控制下,并转化至稻内。相对于对照植物,在转基因稻植物中观察到增强的产量相关性状,如下表X中所示。
表X:在转基因植物中观察到的增强的产量相关性状总结,其中所述转基因植物表达在组成型启动子控制下的编码Remorin多肽的核酸序列。
Figure G2008800037051D02201
转基因稻植物显示千粒核重的显著提高(整体提高超过5%、p-值0.0000),其中所述的转基因稻植物在用于组成型表达的GOS2启动子控制下表达如SEQ ID NO:233所代表的Remorin核酸序列并且在氮含量降低的营养液上生长。此外,在几个事件中,观察到以下一个或多个指标提高:种子总数、充实种子数、种子总重、根冠比和早期生长势。
实施例45:转化其他作物的例子
谷物转化
玉米(Zea mays)的转化用Ishida等(1996.Nature Biotech 14(6):745-50)所述方法的改良方法进行。在谷物中,转化是基因型依赖的并且仅特定基因型对于转化和再生是服从的。杂交系A188(明尼苏达大学)或以A188作为亲本的杂交体是用于转化的供体材料的良好来源,不过其他基因型也可以成功地使用。谷穗在授粉后大约11日(DAP)从谷物植物收获,此时不成熟胚的长度是大约1-1.2mm。不成熟的胚与含有所述表达载体的根癌农杆菌共培育,并且转基因植物通过器官发生过程回收。切下的胚在愈伤组织诱导培养基上、随后在玉米再生培养基上生长,其中所述的培养基含有选择剂(例如咪唑啉酮,不过可以使用不同的选择标记)。培养板在25℃于光照下孵育2-3周,或直至苗发育。将源自每个胚的绿色苗转移至玉米生根培养基并在25℃孵育2-3周,直至根发育。将生根的苗移植至温室中的土壤内。从针对所述选择剂显示耐受性并且含有单拷贝T-DNA插入物的植物产生T1种子。
小麦转化
小麦的转化用Ishida等(1996)Nature Biotech 14(6):745-50描述的方法进行。栽培品种Bobwhite(可从墨西哥CIMMYT获得)通常在转化中使用。不成熟的胚与含有所述表达载体的根癌农杆菌共培育,并且转基因植物通过器官发生过程回收。与农杆菌孵育后,所述胚在愈伤组织诱导培养基上、随后在再生培养基上体外培育,其中所述的培养基含有选择剂(例如咪唑啉酮,不过可以使用多种选择标记)。培养板在25℃于光照下孵育2-3周,或直至苗发育。将源自每个胚的绿色苗转移至生根培养基并在25℃孵育2-3周,直至根发育。将生根的苗移植至温室中的土壤内。从针对所述选择剂显示耐受性并且含有单拷贝T-DNA插入物的植物产生T1种子。
大豆转化
大豆根据对Texas A&M美国专利5,164,310中所述方法的改良方法转化。几个商业大豆品种对于通过这种方法的转化是可操作的。栽培品种Jack(从Illinois种子基金会可获得)通常用于转化。对大豆种子消毒以便体外播种。下胚轴、胚根和一片子叶从7日龄年幼籽苗中切下。进一步培育上胚轴和剩余子叶以使辅助节发育。将这些辅助节切下并与含有所述表达载体的根癌农杆菌孵育。在共培育处理之后,洗涤外植体并转移至选择培养基。切下再生的苗并置于苗伸长培养基上。将长度不超过1cm的苗置于生根培养基上直至根发育。生根的苗移植至温室中的土壤内。从针对所述选择剂显示耐受性并且含有单拷贝T-DNA插入物的植物产生T1种子。
油菜籽/卡诺拉油菜转化
使用5-6日龄年幼籽苗的子叶柄和下胚轴作为用于组织培养的外植体并且根据Babic等(1998,Plant Cell Rep 17:183-188)进行转化。商业栽培品种Westar(Agriculture Canada)是用于转化的标准品种,不过其他品种也可以使用。对卡诺拉油菜种子进行表面消毒以体外播种。从所述体外籽苗切下附带子叶的子叶叶柄外植体,并且通过将此叶柄外植体的切口末端浸入细菌悬液以(含有所述表达载体的)农杆菌接种。该外植体随后在23℃,16小时光照下于含有3mg/l BAP、3%蔗糖、0.7%植物琼脂的MSBAP-3培养基上培养2日。与农杆菌共培育2日后,将所述叶柄外植体转移至含有3mg/l BAP、头孢噻肟、羧苄青霉素或特美汀(300mg/l)的MSBAP-3培养基上培养7日,并且随后在含有头孢噻肟、羧苄青霉素或特美汀和选择剂的MSBAP-3培养基上培养,直至苗再生。当苗长度是5-10mm时,切下这些苗并转移至苗伸长培养基(MSBAP-0.5,含有0.5mg/l BAP)。将长度大约2cm的苗转移至生根培养基(MS0)用于根诱导。生根的苗移植至温室中的土壤内。从针对所述选择剂显示耐受性并且含有单拷贝T-DNA插入物的植物产生T1种子。
苜蓿转化
使用(McKersie等,1999 Plant Physiol 119:839-847)的方法转化苜蓿的再生性克隆。苜蓿的再生和转化是基因型依赖性的并且因而需要再生性植物。已经描述了获得再生性植物的方法。例如,这些再生性植物可以选自栽培品种Rangelander(Agriculture Canada)或如Brown DCW和AAtanassov(1985.Plant Cell Tissue Culture 4:111-112)所述的任何其他商业苜蓿品种。备选地,已经选择RA3品种(威斯康星大学)用于组织培养(Walker等,1978Am J Bot 65:654-659)。叶柄外植体与含有所述表达载体的根癌农杆菌C58C1 pMP90(McKersie等,1999Plant Physiol119:839-847)或LBA4404的过夜培养物共培育。所述外植体在黑暗中于含有288mg/L Pro、53mg/L硫代脯氨酸、4.35g/L K2SO4和100μm乙酰丁香酮的SH诱导培养基上共培育3日。所述外植体在浓度减半的Murashige-Skoog培养基(Murashige和Skoog,1962)中洗涤并铺种在不含乙酰丁香酮而含有合适选择剂和抑止农杆菌生长的合适抗生素的相同SH诱导培养基上。几周后,将体细胞胚转移至不含生长调节剂、不含抗生素和含有50g/L蔗糖的BOi2Y发育培养基中。体细胞胚随后在浓度减半的Murashige-Skoog培养基上萌发。生根的籽苗移植至花钵内并且在温室中培育。从针对所述选择剂显示耐受性并且含有单拷贝T-DNA插入物的植物产生T1种子。
棉花转化
使用根癌农杆菌,根据US 5,159,135中所述的方法转化棉花。棉花种子在3%次氯酸钠溶液中持续20分钟进行表面消毒并且在含有500μg/ml头孢噻肟的蒸馏水中洗涤。随后将种子转移至含有50μg/ml苯菌灵的SH-培养基以萌发。将4-6日龄籽苗的下胚轴取出、切成0.5cm的小段并置于0.8%琼脂上。农杆菌悬液(约108个细胞/ml,从用目的基因和合适选择标记转化的过夜培养物稀释)用于接种所述下胚轴外植体。在室温和光照下3日后,将组织转移至含有Murashige和Skoog盐的固体培养基(1.6g/l脱乙酰吉兰糖胶),其中所述的Murashige和Skoog盐含有B5维生素(Gamborg等,Exp.Cell Res.50:151-158(1968))、0.1mg/l 2,4-D、0.1mg/l 6-糠氨基嘌呤和750μg/ml MgCL2并含有50-100μg/ml头孢噻肟和400-500μg/ml羧苄青霉素以杀死残余细菌。各个细胞系在2-3个月后分离(每隔4-6周传代培养)并且在用于组织扩增的选择性培养基上进一步培育(30℃,16小时光周期)。转化的组织随后在非选择性培养基上进一步培育2-3月以产生体细胞胚。将长度至少4mm的外观健康胚转移至细蛭石中的含有SH培养基的管内,其中所述的SH培养基补充有0.1mg/l吲哚乙酸、6-糠氨基嘌呤和赤霉酸。所述胚在30℃以16小时光周期培育,并且将2-3叶期的小植株转移至具有蛭石和营养物的花钵内。使植物硬化并随后移至温室以进一步培育。
实施例46:DREB基因和DREB蛋白的鉴定
使用数据库搜索工具如基本局部比对工具(BLAST)(Altschul等(1990)J.Mol.Biol.215:403-410;和Altschul等(1997)Nucleic Acids Res.25:3389-3402),从国家生物技术信息中心(NCBI)的Entrez核苷酸数据库中维护的那些序列当中鉴定到与SEQ ID NO:335相关的(全长cDNA、EST或基因组)序列和/或与SEQ ID NO:336相关的蛋白质序列。使用该程序通过核酸序列或多肽序列与序列数据库比较并且计算匹配的统计显著性来找到序列之间的局部相似性区域。由SEQ ID NO:335编码的多肽用于TBLASTN算法,采用默认设置和过滤程序以忽略低复杂性序列启动。这种分析的结果通过配对比较进行观察,并根据概率评分(E-值)进行评级,其中所述的评分反映特定比对结果因偶然发生的概率(E-值越低,命中的显著性越高)。除了E-值外,比较过程也可以由同一性百分数评分。同一性百分数指两个比较的核酸(或多肽)序列之间在特定长度范围内相同核苷酸(或氨基酸)的数目。在Genbank(
Figure G2008800037051D02241
是通过NCBI-国家生物技术信息中心可用的NIH遗传序列数据库)中鉴定到的DREB蛋白的例子在表Y1中给出。优选的一组与本发明相关的DREB基因和DREB蛋白在表Y2中给出。显示了GenBank登录号和来源生物。
表Y1.源自不同生物的DREB蛋白序列。
  GenBank登录号   来源生物
  AAQ23983   [稻]
  AAX28960   [两色蜀黍(Sorghum bicolor)]
  AAX23703   [多棱大麦(Hordeum vulgare subsp.vulgare)]
  AAX28953   [多棱大麦]
  ABK55358   [普通小麦]
  CAG30550   [苇状羊茅]
  ABK55359   [普通小麦]
  ABK55360   [普通小麦]
  AAX57275   [黑麦草(Lolium perenne)]
  ABK32848   [黑麦草]
  ABK32847   [黑麦草]
  NP_001115477639   (粳型栽培品种组)]
  BAD09739   [稻(粳型栽培品种组)]
  BAD46703   [稻(粳型栽培品种组)]
  EAZ09799   [稻(籼型栽培品种组)]
  AAY32555   [一粒小麦(Triticum monococcum)]
  AAY32550   [一粒小麦]
  ABK55363   [普通小麦]
  AAX14175   [野生二棱大麦(Hordeum vulgare subsp.spontaneu)]
  AAX23694   [多棱大麦]
  AAX14155   [野生二棱大麦]
  AAG59618   [多棱大麦]
  AAX14163   [野生二棱大麦]
  AAX14173   [野生二棱大麦]
  AAX23693   [多棱大麦]
  AAY32553   [一粒小麦]
  AAX14165   [野生二棱大麦]
  BAF36841   [黑麦草]
  ABK55361   [普通小麦]
  ABK55362   [普通小麦]
  AAX14170   [野生二棱大麦]
  AAX14169   [野生二棱大麦]
  AAX14171   野生二棱大麦]
  CAJ21277   [燕麦]
  BAF36837   [黑麦草]
  BAF36838   [黑麦草]
  BAF36842   [黑麦草]
  AAX23712   [多棱大麦]
  AAY32558   [一粒小麦]
  AAX23710   [多棱大麦]
  AAX23713   [多棱大麦]
  AAY32564   [一粒小麦]
  AAX23716   [多棱大麦]
  AAX28956   [多棱大麦]
  BAF36839   [黑麦草]
  AAY32554   [一粒小麦]
  ABK55364   [普通小麦]
  Os09g0522000   [稻(粳型栽培品种组)]
  BAF36840   [黑麦草]
  EAZ09798   [稻(籼型栽培品种组)]
  BAD09738   [稻(粳型栽培品种组)]
  Os08g0545400   [稻(粳型栽培品种组)]
  ABK55369   [普通小麦]
  ABK55370   [普通小麦]
  EAZ07868   [稻(籼型栽培品种组)]
  AAY33832   [玉米]
  AAY32556   [一粒小麦]
  AAX23715   [多棱大麦]
  AAN02488   [稻]
  ABK55371   [普通小麦]
  ABA01492   [多棱大麦]
  AAP83888   [稻]
  CAJ21278   [燕麦]
  ABK55367   [普通小麦]
  ABK55368   [普通小麦]
  ABK55365   [普通小麦]
  ABK55366   [普通小麦]
  ABA01491   [多棱大麦]
  AAQ98965   [Schedonorus arundinaceus]
  ABA25904   [多棱大麦]
  AAY32557   [一粒小麦]
  BAD66926   [普通小麦]
  ABK55375   [普通小麦]
  BAF36843   [黑麦草]
  CAG23919   [苇状羊茅]
  ABK55377   [普通小麦]
  ABK55376   [普通小麦]
  BAD66925   [普通小麦]
  AAL35759   [黑麦]
  CAJ21276   [燕麦]
  ABK55381   [普通小麦]
  ABK55382   [普通小麦]
  BAF36844   [黑麦草]
  ABK55384   [普通小麦]
  AAY32552   [一粒小麦]
  ABA25905   [多棱大麦]
  ABK55383   [普通小麦]
  AAY32562   [一粒小麦]
  ABK55380   [普通小麦]
  AAX23696   [多棱大麦]
  AAX28951   [多棱大麦]
  BAF36846   [黑麦草]
  ABF59742   [油棕(Elaeis guineensis)]
  AAX23690   [多棱大麦]
  ABF59744   [散尾葵(Dypsis lutescens)]
  ABA01494   [多棱大麦]
  AAX23689   [多棱大麦]
  AAL35760   [黑麦]
  ABK55378   [普通小麦]
  ABB54457   [啤酒大麦(Hordeum brevisubulatum)]
  ABF59745   [椰子(Cocos nucifera)]
  ABB84399   [普通小麦]
  ABK55387   [普通小麦]
  ABF59739   [国王椰子(Ravenea rivularis)]
  ABF59738   [棕榈(Trachycarpus fortunei)]
  AAX28959   [两色蜀黍]
  ABF59749   [针棕榈(Rhapidophyllum hystrix)]
  ABK55390   [普通小麦]
  ABK55388   [普通小麦]
  ABK55379   [普通小麦]
  ABF59737   [小箬棕(Sabal minor)]
  ABF59736   [箬棕(Sabal palmetto)]
  ABK55355   [普通小麦]
  AAX28966   [普通小麦]
  EAZ24170   [稻(粳型栽培品种组)]
  ABF59748   [针棕榈]
  AAX28961   [普通小麦]
  ABK55385   [普通小麦]
  ABK55372   [普通小麦]
  ABK55386   [普通小麦]
  EAY87059   [稻(籼型栽培品种组)]
  AAX23709   [多棱大麦]
  AAX28955   [多棱大麦]
  AAY32560   [一粒小麦]
  BAE17131   [多毛番茄(Lycopersicon hirsutum)]
  EAZ35676   [稻(粳型栽培品种组)]
  AAX28952   [多棱大麦]
  AAL35761   [黑麦]
  AAS00621   [小盐芥(Thellungiella salsuginea)]
  AAZ22480   [Capsicum annuum var.annuum]
  ABK55373   [普通小麦]
  AAX23698   [多棱大麦]
  AAR88363   [牛角椒(Capsicum annuum)]
  AAX23700   [多棱大麦]
  AAR35030   [荠菜(Capsella bursa-pastoris)]
  AAX28963   [普通小麦]
  AAR26658   [荠菜]
  AAZ20446   [Malus x domestica]
  AAR20499   [欧洲油菜]
  ABK55356   [普通小麦]
  ABK55357   [普通小麦]
  ABE96792   [葡萄(Vitis vinifera)]
  AAX23686   [多棱大麦]
  ABK55354   [普通小麦]
  ABC86564   [普通小麦]
  EAY95226   [稻(籼型栽培品种组)]
  AAS77819   [番茄]
  ABD63908   白菜型油菜(Brassica rapa subsp.chinensis)]
  AAX23720   [多棱大麦]
  ABK55389   [普通小麦]
  AAW58104   [河岸葡萄(Vitis riparia)]
  AAY32551   [一粒小麦]
  AAY43213   [巴西橡胶树(Hevea brasiliensis)]
  AAC99369   [拟南芥]
  AAZ57434   [马兰(Iris lactea var.chinensis)]
  ABG38530   [黄瓜(Cucumis sativus)]
  AAC99371   [拟南芥]
  AAS77820   [番茄]
  AAP83325   [稻(粳型栽培品种组)]
  AAR20500   [欧洲油菜]
  AAD45623   [欧洲油菜]
  AAM18960   [欧洲油菜]
  ABE66241   [拟南芥]
  CAH10191   [苇状羊茅]
  ABK28752   [拟南芥]
  AAV80413   [拟南芥]
  AAG43549   [烟草(烟草)]
  ABI93900   [拟南芥]
  AAP83936   [陆地棉(Gossypium hirsutum)]
  ABD14412   [拟南芥]
  AAM18959   [欧洲油菜]
  ABD42992   [拟南芥]
  AAR20498   [欧洲油菜]
  AAS77821   [番茄]
  AAY43345   [大白菜(Brassica rapa subsp.pekinensis)]
  ABD65969   [烟草]
  ABM21468   [荠菜]
  AAR11858   [欧洲油菜]
  ABA42927   [Arabis pumila]
  AAM18958   [欧洲油菜]
  ABC79627   [毛白杨(Populus tomentosa)]
  AAR20497   [欧洲油菜]
  AAV80414   [拟南芥]
  AAV80415   [拟南芥]
  ABD65473   [陆地棉]
  AAY21899   [拟南芥]
  CAA18178   [拟南芥]
  CAB81358   [拟南芥]
  AAQ98869   [陆地棉]
  ABK55374   [普通小麦]
  AAQ02702   [甘蓝(Brassica oleracea)]
  AAG43548   [烟草]
  Os06g0165600   [稻(粳型栽培品种组)]
  BAD27123   [甜樱桃(Prunus avium)]
  AAL38242   [欧洲油菜]
  ABB51638   [冈尼桉(Eucalyptus gunnii)]
表Y2.本发明相关的优选DREB基因和DREB蛋白
描述   核苷酸(Nt)/蛋白质 来源物种 SEQ ID NO:
  (PROT)
  Os09g0522200   Nt   [稻(粳型栽培品种组)]   335
  Os09g0522200   PROT   [稻(粳型栽培品种组)]   336
  Os08g0545500   Nt   [稻(粳型栽培品种组)]   351
  Os08g0545500   PROT   [稻(粳型栽培品种组)]   352
  Os09g0522100   Nt   [稻(粳型栽培品种组)]   353
  Os09g0522100   PROT   [稻(粳型栽培品种组)]   354
  Os08g0545400   Nt   [稻(粳型栽培品种组)]   355
  Os08g0545400   PROT   [稻(粳型栽培品种组)]   356
  Os06g0165600   Nt   [稻(粳型栽培品种组)]   357
  Os06g0165600   PROT   [稻(粳型栽培品种组)]   358
  Os09g0522000   Nt   [稻(粳型栽培品种组)]   359
  Os09g0522000   PROT   [稻(粳型栽培品种组)]   360
  Os02g0677300   Nt   [稻(粳型栽培品种组)]   361
  Os02g0677300   PROT   [稻(粳型栽培品种组)]   362
  Os06g0127100   Nt   [稻(粳型栽培品种组)]   363
  Os06g0127100   PROT   [稻(粳型栽培品种组)]   364
  OsDREB1B   Nt   [稻(籼型栽培品种组)]   365
  OsDREB1B   PROT   [稻(籼型栽培品种组)]   366
  ZmCBF1   Nt   [玉米]   367
  ZmCBF1   PROT   [玉米]   368
  ZmCBF2   Nt   [玉米]   369
  ZmCBF2   PROT   [玉米]   370
  ZmCBF3   Nt   [玉米]   371
  ZmCBF3   PROT   [玉米]   372
  ZmDREB1   Nt   [玉米]   373
  ZmDREB1   PROT   [玉米]   374
  ZmDREB1B   Nt   [玉米]   375
  ZmDREB1B   PROT   [玉米]   376
  TaCBF1   Nt   [普通小麦]   377
  TaCBF1   PROT   [普通小麦]   378
  TaCBF2   Nt   [普通小麦]   379
  TaCBF2   PROT   [普通小麦]   380
  TaCBF3   Nt   [一粒小麦]   381
  TaCBF3   PROT   [一粒小麦]   382
  TaCBF4   Nt   [一粒小麦]   383
  TaCBF4   PROT   [一粒小麦]   384
  TaCBF5   Nt   [一粒小麦]   385
  TaCBF5   PROT   [一粒小麦]   386
  DBP3b   Nt   [陆地棉]   387
  DBP3b   PROT   [陆地棉]   388
  DBP3a   Nt   [陆地棉]   389
  DBP3a   PROT   [陆地棉]   390
  DREB1A   Nt   [陆地棉]   391
  DREB1A   PROT   [陆地棉]   392
  DREB1   Nt   [陆地棉]   393
  DREB1   PROT   [陆地棉]   394
  DREB1L   Nt   [陆地棉]   395
  DREB1L   PROT   [陆地棉]   396
  DREB2a   Nt   [大豆]   397
  DREB2a   PROT   [大豆]   398
  DREBa   Nt   [大豆]   399
  DREBa   PROT   [大豆]   400
  DREB2b   Nt   [大豆]   401
  DREB2b   PROT   [大豆]   402
  DREB3   Nt   [大豆]   403
  DREB3   PROT   [大豆]   404
  DREB   Nt   [大豆]   405
  DREB   PROT   [大豆]   406
 CBF17   Nt   [欧洲油菜]   407
 CBF16   PROT   [欧洲油菜]   408
 CBF7   Nt   [欧洲油菜]   409
 CBF16   PROT   [欧洲油菜]   410
 CBF7   Nt   [欧洲油菜]   411
 CBF7   PROT   [欧洲油菜]   412
 CBF5   Nt   [欧洲油菜]   413
 CBF5   PROT   [欧洲油菜]   414
 CBF样蛋白   Nt   [甘蓝]   415
 CBF样蛋白   PROT   [甘蓝]   416
实施例47:相关DREB蛋白的比对
使用来自Vector NTI(Invitrogen)的AlignX进行图24中所示的DREB蛋白的多重比对,其中所述的AlignX基于受欢迎的累进比对Clustal算法(Thompson等(1997)Nucleic Acids Res 25:4876-4882;Chenna等(2003),Nucleic Acids Res 31:3497-3500)。
使用与本发明相关的多肽进行多重序列比对的结果在图24中显示。稻和拟南芥DREB蛋白之间的保守氨基酸在共有序列中显示。相似性最高的区域是对应于AP2结构域和CMIII-4基序的区域。
实施例48:DREB蛋白之间总体同一性百分数的计算
使用现有技术领域可获得的方法之一,即MatGAT(矩阵总体比对工具)软件(BMC Bioinformatics.2003 4:29.MatGAT:使用蛋白质序列或DNA序列产生相似性/同一性矩阵的一项应用,Campanella JJ,Bitincka L,Smalley J;软件由Ledion Bitincka维护)确定在实施本发明方法中有用的全长多肽序列之间的总体相似性和同一性百分数。MatGAT软件对DNA序列或蛋白质序列产生相似性/同一性矩阵,无需数据的预先比对。该程序使用Myers和Miller总体比对算法(空位开口罚分12和空位延伸罚分2)进行一系列配对比对,使用例如Blosum 62(对于多肽而言)计算相似性和同一性并且随后将结果置于距离矩阵内。在分割线下半部分显示序列相似性,和在对角分割线的上半部分显示序列同一性。
比较过程中使用的参数是:
评分矩阵:Blosum62
第一空位:12
延伸空位:2
表Z2中显示在多肽序列的全长范围(不包括部分多肽序列)内的总体相似性和同一性的该软件分析的结果。同一性百分数在对角线以上给出而相似性百分数在对角线以下给出。
拟南芥的旁系同源DREB蛋白之间在完整氨基酸序列范围内的同一性百分数在18.5至86.9%之间变化。在稻旁系同源DREB蛋白之间存在相似范围的序列同一性。拟南芥和稻的DREB蛋白之间的同一性在18.5%至44.5%之间变化。
表Z1:表Z2中蛋白质的描述
  DREB蛋白   染色体基因座
  1   At4g25470
  2   At4g36900
  3   At5g25810
  4   At1g46768
  5   At4g25480
  6   At3g11020
  7   At2g40220
  8   At5g05410
  9   AT4G25490
  10   AT1G7808
  11   Os09g0522200
  12   Os09g0522100
  13   Os09g0522000
  14   Os08g0545500
  15   Os08g0545400
  16   Os06g0165600
  17   Os06g0127100
  18   Os02g0677300
  19   Os01g0968800
表Z2:表Z1中所述DREB蛋白的全长范围内的总体相似性和同一性的MatGAT结果
DREB蛋白 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
  1   26.9   33.5   27.3   87.1   21.5   20.7   24.2   86.6   22.8   38.6   37   38.4   36   35   27.3   42   44.7   41.3
  2   40.3   25.8   45   26.1   20   20.4   22.8   25.4   18.9   21.8   25.2   25.9   20.9   24.2   19.4   29.8   24.4   26.5
  3   50   40.8   25.7   34.9   25.5   23.7   22.5   33.5   23.6   31.3   28.9   32.6   29.5   28.4   24.3   33.3   29.8   32.5
  4   37.5   53.1   42.7   30.1   18.5   19.2   19.9   28.6   20.1   23.5   25.2   27.4   25.5   22.3   20.6   29.4   24.6   28.8
  5   92.6   39.8   50   38.9   22.2   20.4   22.8   86.2   20.7   39.2   36.5   42   37.7   35.4   30.6   44.7   45.8   42.7
  6   31.5   31.8   35.8   26.4   32.1   24   52.3   23.3   20.5   19.9   19.9   22.2   20.7   20.8   19.4   20.5   19.4   19.6
  7   32   29.3   35.7   25.9   32.6   37.6   24.6   21.9   22.4   17.8   22   21.6   18.5   22.6   17   21.3   19.8   20.5
  8   35.8   34.4   35.1   28.8   35.4   64.2   39.3   22.8   22.6   21.4   21.6   24.4   22.5   23.3   19.4   22.8   23.1   19.7
  9   90.3   40.4   50.9   39.9   90.7   33   34.5   35.4   21.6   40   36   43   36.5   38.9   28.6   43.5   44.9   42
  10   29.6   26.9   33.2   27.5   29.6   37.4   38.3   37.7   28.1   22.1   19.8   18.6   18.2   20.9   17.3   15.8   18.7   20
  11   53.4   35.3   47.1   34   50.4   31.2   33.2   31.8   53.4   35   53.5   49   56.3   47.8   35.6   42.4   43.1   37.8
  12   54.1   40.7   45.5   33.7   53.3   32.1   33.8   33.4   50   32   65.9   46.8   47.1   49.6   35.3   40.9   39.5   39.5
  13   58.3   37.2   49.5   35.3   61.5   30.9   32   32.1   61.9   27.5   60.5   59.8   49   44.9   34.9   46.3   41.9   37.9
  14   55.8   33.9   47   35.9   53   33   30.8   35.1   51.8   31.1   68.9   62.9   59.8   47.2   35.9   43   40.2   36.9
  15   50.4   37.2   46.3   33.1   49.2   30.6   31.7   33.4   51.2   35.6   61.2   65.9   56.2   62.9   50.7   40.3   42.4   34.5
  16   41.5   32.4   40.3   27.3   43.5   32.1   32.3   31.1   41.5   29.3   49   49.8   46.2   49.8   60.9   31   31.7   29.9
  17   58.3   40.2   52.3   38.3   59.3   31.5   32.9   32.5   60.7   26   52.5   52.4   58.3   51   54.1   39.5   50   38.8
  18   64.3   41.5   52.2   33.9   62.1   29.7   32.3   31.8   60.7   32.9   55.9   52.8   58   52.2   56.6   43.9   58.9   44.2
  19   56.6   42.5   51.6   37   57.5   29.1   33.8   32.1   54.3   32   50   48.4   53.9   47.4   49.6   40.7   51.6   58
实施例49:鉴定蛋白质中的AP2结构域
蛋白质家族、结构域和位点的集成资源(InterPro)数据库是针对基于文本及基于序列的搜索法的常用特征标识数据库的集成界面。InterPro数据库合并了这些数据库,所述数据库使用不同方法学及不同程度的有关充分表征的蛋白质的生物学信息以获得蛋白质特征标识。合作数据库包括SWISS-PROT、PROSITE、TrEMBL、PRINTS、ProDom和Pfam,Smart和TIGRFAMs。Interpro由英国欧洲生物信息学研究所维护。
如SEQ ID NO:336所代表的多肽序列的InterPro扫描结果呈现于表AA。
表AA:如SEQ ID NO:336所代表的多肽序列的InterPro扫描结果
数据库 登录号 命中的描述   e值[结构域的氨基酸位置]
InterPro IPR001471   发病机理相关的转录因子和ERF
  PRODOM PD001423   Q8LLV0_ORYSA_Q8LLV0; 5e-15[61-95]T
PRINTS PR00367 ETHRSPELEMNT   6.9e-05[51-62]T6.9e-05[75-91]T
  GENE3D   G3DSA:3.30.730.10   无描述   7.7e-15[49-118]T
  PFAM   PF00847   AP2   2.5e-21[48-120]T
  SMART   SM00380   AP2   1.5e-13[50-121]T
  PROFILE   PS51032   AP2_ERF   19.664[50-115]T
实施例50:基因克隆
使用稻籽苗cDNA文库(Invitrogen,Paisley,UK)作为模板通过PCR扩增稻DREB1A基因。在逆转录从籽苗提取的RNA后,将cDNA克隆至pCMV Sport 6.0内。该文库的插入物平均大小是1.5kb,并且原始克隆数是1.59×107cfu。6×1011cfu/ml的第一轮扩增后,测定原始滴度是9.6×105cfu/ml。在提取质粒后,将200ng模板用于50μl PCR混合物中。包含用于Gateway重组的AttB位点的引物prm07441(SEQ ID NO:337;有义:5’-ggggacaagtttgtacaaaaaagcaggcttaaacaatgtgcgggatcaagca-3’)和prm07442(SEQ ID NO:338;反义互补的:5’-ggggaccactttgtacaagaaagctgggtggcaaaattgtacagttgattg-3’)用于PCR扩增。使用Hifi Taq DNA聚合酶在标准条件开展PCR。也使用标准方法扩增并纯化预期大小的PCR片段。随后进行Gateway方法的第一步骤,即BP反应,在此期间该PCR片段在体内与pDONR201质粒重组以产生根据Gateway术语的“进入克隆”。质粒pDONR201从Invitrogen作为
Figure G2008800037051D02371
技术的一部分购买。
实施例51:载体构建
包含OsDREB基因编码序列的进入克隆随后与用于稻转化的目的载体一起用于LR反应中。该目的载体在T-DNA边界内包含植物选择标记;目视标记表达盒和Gateway盒作为功能性元件,其中所述的Gateway盒意图用于LR体内重组,从而来自所述进入克隆的目的序列以有义方向或反义方向整合。用于组成型表达的稻GOS2启动子(SEQ ID NO:339)位于这个Gateway盒上游。
在LR重组步骤后,将所得表达载体(图26)转化至农杆菌菌株LBA4404内并随后转化至稻植物内。使得转化的稻植物生长并随后检验如实施例48中所述的参数。
实施例52:用下调模式下的OsDREB1A转化的植物的评价方法,所述OsDREB1A处于稻GOS2启动子控制下
产生大约15-20个包含用于OSDREB1A的反向重复序列重组DNA的独立T0稻转化体。原代转化体从组织培养箱转移至温室以生长并收获T1种子。留下下述6个事件,其中所述事件的T1后代对所述转基因的存在/不存在以3∶1比例分离。对于这些事件中的每一个,通过监测目视标记表达而选出大约10株含有该转基因的T1籽苗(杂合子和纯合子)和大约10株缺少该转基因的T1籽苗(失效合子)。所选择的T1植物转移至温室。每株植物接受一个独有的条形码标记以将表型数据清楚无误地与相应的植物联系。所选择的T1植物在直径10cm花钵的土壤内,在以下环境设置中培育:光周期=11.5h,日照强度=30,000lux或更大,昼间温度=28℃或更高,夜间温度=22℃,相对湿度=60-70%。转基因植物和对应的失效合子于随机位置并排培育。植物从播种期至成熟期数次通过数字成像室。在每个时间点上,从至少6个不同角度拍摄每株植物的数字图像(2048×1536像素,1600万颜色)。
氮使用效率筛选
来自T2种子的稻植物在盆栽土壤中在正常条件下培育,除了营养液不是正常条件之外。花钵从移植至成熟一直用氮(N)含量降低、通常降低7-8倍的特定营养液浇灌。其余培育过程(植物成熟、种子收获)与不在非生物胁迫下培育的植物相同。生长和产量参数如对正常条件下生长所述那样记录。
盐胁迫筛选
植物在由椰子纤维和Argex(比率3∶1)组成的基质上培育。在移植小植物至温室后头2周期间使用正常的营养液。在头两周之后,向所述营养液添加25mM盐(NaCl),直至收获植物。随后测量种子相关参数。
植物地上部分面积(或叶生物量)通过计数来自植物地上部分的数字图像上区别于背景的像素总数而确定。该值对相同时间点上从不同角度拍摄的画面进行平均化并且转化成通过校正以平方mm表述的物理表面值。实验显示以这种方式测量的植物地上部分面积与植物地上部分的生物量相关。Areamax是在植物已经达到其最大叶生物量的时间点上的地上部分面积。
将成熟的原发花序收获、计数、装袋、加条形码标记并且随后在干燥箱内于37°干燥3日。随后将所述花序脱粒,并且收集和计数全部种子。充实粒使用吹气装置与空粒分开。在分离后,随后使用市售计数机计数两个种子批次。抛弃空粒。充实粒在分析天平上称重,并且使用数字成像术测量种子的横截面。该方法产生以下一组种子相关参数:
花/每花序是估计植物上每个花序的平均花数目的参数,由种子总数除以第一花序(first panicle)获得该参数。最高花序和垂直比对时与所述最高花序重叠的全部花序被视为第一花序并且手工计数。充实种子数通过计数所述分离步骤后存留的充实粒数目加以确定。种子总产量(种子总重量)通过称量从一株植物收获的全部充实粒而测量。每株植物的种子总数通过计数从一株植物收获的壳数目测量,并且对应于每株植物的小花数目。这些参数以自动方式使用图像分析软件从数字图像衍生并且进行统计分析。各个种子参数(包括宽度,长度,面积,重量)使用定制装置测量,所述的定制装置由组成两个主要组件构成:偶联至软件用于图像分析的称重和成像装置。
使用对非平衡设计校正的两因素ANOVA(变量分析)作为整体评价植物表型特征的统计模型。对于用所述基因转化的全部事件的全部植物的全部所测量参数实施F检验。实施F检验以检查该基因对全部转化事件的影响并验证该基因的整体作用(在本文中又称作“基因总体作用”)。若F检验的值显示该数据是显著的,则结论是存在“基因”作用,意指不仅该基因的存在,而且该基因的位置均引起所述作用。真实基因总体作用显著性的阈值对于F检验设置在5%概率水平上。
为检验一个事件内所述基因的作用,即品系特异性作用,使用来自转基因植物和相应无效植物的数据集合在每个事件内进行t-检验。“无效植物”或“无效分离子”或“失效合子”是按照与转基因植物相同的方式进行处理,但是从中转基因已经分离的植物。无效植物也可以描述为纯合阴性转化植物。用于t检验的显著性的阈值设在10%概率水平上。一些事件的结果可以高于或低于该阈值。这基于下述假设,即一个基因可能仅在基因组的某些位置内具有作用,并且这种位置依赖性作用的出现并非罕见。这种基因作用在本文中又称作“基因的品系作用”。p-值通过将t-值与t-分布比较或备选地通过将F-值与F-分布比较而获得。该p-值随后产生无效假设(即不存在转基因的作用)为正确的概率。
实施例53:测量反义构建体转化体的产量相关参数:
在如上所述分析种子后,本发明人发现与缺少OsDREB1A转基因的植物相比较,用反义OsDREB1A基因构建体转化的植物具有更高的种子产量,所述的种子产量表述为充实种子数、种子总重、种子总数、每株植物的花序数和每花序的花数。此外,与对照籽苗相比较,转基因籽苗显示提高的生长势。p-值显示这种提高是显著性的。
对T1世代植物所获得的结果在表BB中总结,所述结果代表对于全部测试品系的均值:
表BB:评价结果
  性状   改善的百分数
  籽苗生长势   11%
  种子总产量   13%
  充实种子数   14%
  每株植物的第一花序数   13%
  种子总数   14%
  收获指数   9%
实施例54:其他植物物种的转化
谷物转化
玉米(Zea mays)的转化用Ishida等(1996.Nature Biotech 14(6):745-50)所述方法的改良方法进行。在谷物中,转化是基因型依赖的并且仅特定基因型对于转化和再生是服从的。杂交系A188(明尼苏达大学)或以A188作为亲本的杂交体是用于转化的供体材料的良好来源,不过其他基因型也可以成功地使用。谷穗在授粉后大约11日(DAP)从谷物植物收获,此时不成熟胚的长度是大约1-1.2mm。不成熟的胚与含有所述表达载体的根癌农杆菌共培育,并且转基因植物通过器官发生过程回收。切下的胚在愈伤组织诱导培养基上、随后在玉米再生培养基上生长,其中所述的培养基含有选择剂(例如咪唑啉酮,不过可以使用不同的选择标记)。培养板在25℃于光照下孵育2-3周,或直至苗发育。将源自每个胚的绿色苗转移至玉米生根培养基并在25℃孵育2-3周,直至根发育。将生根的苗移植至温室中的土壤内。从针对所述选择剂显示耐受性并且含有单拷贝T-DNA插入物的植物产生T1种子。
小麦转化
小麦的转化用Ishida等(1996)Nature Biotech 14(6):745-50描述的方法进行。栽培品种Bobwhite(可从墨西哥CIMMYT获得)通常在转化中使用。不成熟的胚与含有所述表达载体的根癌农杆菌共培育,并且转基因植物通过器官发生过程回收。与农杆菌孵育后,所述胚在愈伤组织诱导培养基上、随后在再生培养基上体外培育,其中所述的培养基含有选择剂(例如咪唑啉酮,不过可以使用多种选择标记)。培养板在25℃于光照下孵育2-3周,或直至苗发育。将源自每个胚的绿色苗转移至生根培养基并在25℃孵育2-3周,直至根发育。将生根的苗移植至温室中的土壤内。从针对所述选择剂显示耐受性并且含有单拷贝T-DNA插入物的植物产生T1种子。
大豆转化
大豆根据对Texas A&M美国专利5,164,310中所述方法的改良方法转化。几个商业大豆品种对于通过这种方法的转化是可操作的。栽培品种Jack(从Illinois种子基金会可获得)通常用于转化。对大豆种子消毒以便体外播种。下胚轴、胚根和一片子叶从7日龄年幼籽苗中切下。进一步培育上胚轴和剩余子叶以使辅助节发育。将这些辅助节切下并与含有所述表达载体的根癌农杆菌孵育。在共培育处理之后,洗涤外植体并转移至选择培养基。切下再生的苗并置于苗伸长培养基上。将长度不超过1cm的苗置于生根培养基上直至根发育。生根的苗移植至温室中的土壤内。从针对所述选择剂显示耐受性并且含有单拷贝T-DNA插入物的植物产生T1种子。
油菜籽/卡诺拉油菜转化
使用5-6日龄年幼籽苗的子叶柄和下胚轴作为用于组织培养的外植体并且根据Babic等(1998,Plant Cell Rep 17:183-188)进行转化。商业栽培品种Westar(Agriculture Canada)是用于转化的标准品种,不过其他品种也可以使用。对卡诺拉油菜种子进行表面消毒以体外播种。从所述体外籽苗切下附带子叶的子叶叶柄外植体,并且通过将此叶柄外植体的切口末端浸入细菌悬液以(含有所述表达载体的)农杆菌接种。该外植体随后在23℃,16小时光照下于含有3mg/l BAP、3%蔗糖、0.7%植物琼脂的MSBAP-3培养基上培养2日。与农杆菌共培育2日后,将所述叶柄外植体转移至含有3mg/l BAP、头孢噻肟、羧苄青霉素或特美汀(300mg/l)的MSBAP-3培养基上培养7日,并且随后在含有头孢噻肟、羧苄青霉素或特美汀和选择剂的MSBAP-3培养基上培养,直至苗再生。当苗长度是5-10mm时,切下这些苗并转移至苗伸长培养基(MSBAP-0.5,含有0.5mg/l BAP)。将长度大约2cm的苗转移至生根培养基(MS0)用于根诱导。生根的苗移植至温室中的土壤内。从针对所述选择剂显示耐受性并且含有单拷贝T-DNA插入物的植物产生T1种子。
苜蓿转化
使用(McKersie等,1999Plant Physiol 119:839-847)的方法转化苜蓿的再生性克隆。苜蓿的再生和转化是基因型依赖性的并且因而需要再生性植物。已经描述了获得再生性植物的方法。例如,这些再生性植物可以选自栽培品种Rangelander(Agriculture Canada)或如Brown DCW和AAtanassov(1985.Plant Cell Tissue Culture 4:111-112)所述的任何其他商业苜蓿品种。备选地,已经选择RA3品种(威斯康星大学)用于组织培养(Walker等,1978Am J Bot 65:654-659)。叶柄外植体与含有所述表达载体的根癌农杆菌C58C1 pMP90(McKersie等,1999Plant Physiol119:839-847)或LBA4404的过夜培养物共培育。所述外植体在黑暗中于含有288mg/L Pro、53mg/L硫代脯氨酸、4.35g/L K2SO4和100μm乙酰丁香酮的SH诱导培养基上共培育3日。所述外植体在浓度减半的Murashige-Skoog培养基(Murashige和Skoog,1962)中洗涤并铺种在不含乙酰丁香酮而含有合适选择剂和抑止农杆菌生长的合适抗生素的相同SH诱导培养基上。几周后,将体细胞胚转移至不含生长调节剂、不含抗生素和含有50g/L蔗糖的BOi2Y发育培养基中。体细胞胚随后在浓度减半的Murashige-Skoog培养基上萌发。生根的籽苗移植至花钵内并且在温室中培育。从针对所述选择剂显示耐受性并且含有单拷贝T-DNA插入物的植物产生T1种子。
棉花转化
使用根癌农杆菌,根据US 5,159,135中所述的方法转化棉花。棉花种子在3%次氯酸钠溶液中持续20分钟进行表面消毒并且在含有500μg/ml头孢噻肟的蒸馏水中洗涤。随后将种子转移至含有50μg/ml苯菌灵的SH-培养基以萌发。将4-6日龄籽苗的下胚轴取出、切成0.5cm的小段并置于0.8%琼脂上。农杆菌悬液(约108个细胞/ml,从用目的基因和合适选择标记转化的过夜培养物稀释)用于接种所述下胚轴外植体。在室温和光照下3日后,将组织转移至含有Murashige和Skoog盐的固体培养基(1.6g/l脱乙酰吉兰糖胶),其中所述的Murashige和Skoog盐含有B5维生素(Gamborg等,Exp.Cell Res.50:151-158(1968))、0.1mg/l 2,4-D、0.1mg/l 6-糠氨基嘌呤和750μg/ml MgCL2并含有50-100μg/ml头孢噻肟和400-500μg/ml羧苄青霉素以杀死残余细菌。各个细胞系在2-3个月后分离(每隔4-6周传代培养)并且在用于组织扩增的选择性培养基上进一步培育(30℃,16小时光周期)。转化的组织随后在非选择性培养基上进一步培育2-3月以产生体细胞胚。将长度至少4mm的外观健康胚转移至细蛭石中的含有SH培养基的管内,其中所述的SH培养基补充有0.1mg/l吲哚乙酸、6-糠氨基嘌呤和赤霉酸。所述胚在30℃以16小时光周期培育,并且将2-3叶期的小植株转移至具有蛭石和营养物的花钵内。使植物硬化并随后移至温室以进一步培育。
Figure IYZ000005967617600011
Figure IYZ000005967617600021
Figure IYZ000005967617600031
Figure IYZ000005967617600041
Figure IYZ000005967617600051
Figure IYZ000005967617600061
Figure IYZ000005967617600071
Figure IYZ000005967617600091
Figure IYZ000005967617600101
Figure IYZ000005967617600111
Figure IYZ000005967617600121
Figure IYZ000005967617600131
Figure IYZ000005967617600141
Figure IYZ000005967617600151
Figure IYZ000005967617600161
Figure IYZ000005967617600181
Figure IYZ000005967617600191
Figure IYZ000005967617600221
Figure IYZ000005967617600241
Figure IYZ000005967617600251
Figure IYZ000005967617600261
Figure IYZ000005967617600271
Figure IYZ000005967617600291
Figure IYZ000005967617600301
Figure IYZ000005967617600311
Figure IYZ000005967617600321
Figure IYZ000005967617600331
Figure IYZ000005967617600341
Figure IYZ000005967617600371
Figure IYZ000005967617600391
Figure IYZ000005967617600401
Figure IYZ000005967617600431
Figure IYZ000005967617600441
Figure IYZ000005967617600451
Figure IYZ000005967617600461
Figure IYZ000005967617600481
Figure IYZ000005967617600491
Figure IYZ000005967617600501
Figure IYZ000005967617600511
Figure IYZ000005967617600521
Figure IYZ000005967617600531
Figure IYZ000005967617600541
Figure IYZ000005967617600551
Figure IYZ000005967617600571
Figure IYZ000005967617600581
Figure IYZ000005967617600591
Figure IYZ000005967617600631
Figure IYZ000005967617600651
Figure IYZ000005967617600671
Figure IYZ000005967617600681
Figure IYZ000005967617600691
Figure IYZ000005967617600701
Figure IYZ000005967617600721
Figure IYZ000005967617600731
Figure IYZ000005967617600741
Figure IYZ000005967617600751
Figure IYZ000005967617600761
Figure IYZ000005967617600771
Figure IYZ000005967617600781
Figure IYZ000005967617600791
Figure IYZ000005967617600801
Figure IYZ000005967617600811
Figure IYZ000005967617600821
Figure IYZ000005967617600831
Figure IYZ000005967617600841
Figure IYZ000005967617600861
Figure IYZ000005967617600871
Figure IYZ000005967617600881
Figure IYZ000005967617600901
Figure IYZ000005967617600911
Figure IYZ000005967617600921
Figure IYZ000005967617600931
Figure IYZ000005967617600941
Figure IYZ000005967617600951
Figure IYZ000005967617600961
Figure IYZ000005967617600981
Figure IYZ000005967617600991
Figure IYZ000005967617601001
Figure IYZ000005967617601011
Figure IYZ000005967617601021
Figure IYZ000005967617601041
Figure IYZ000005967617601051
Figure IYZ000005967617601061
Figure IYZ000005967617601071
Figure IYZ000005967617601081
Figure IYZ000005967617601101
Figure IYZ000005967617601111
Figure IYZ000005967617601121
Figure IYZ000005967617601131
Figure IYZ000005967617601151
Figure IYZ000005967617601161
Figure IYZ000005967617601171
Figure IYZ000005967617601181
Figure IYZ000005967617601191
Figure IYZ000005967617601201
Figure IYZ000005967617601211
Figure IYZ000005967617601221
Figure IYZ000005967617601231
Figure IYZ000005967617601241
Figure IYZ000005967617601251
Figure IYZ000005967617601261
Figure IYZ000005967617601271
Figure IYZ000005967617601281
Figure IYZ000005967617601291
Figure IYZ000005967617601301
Figure IYZ000005967617601311
Figure IYZ000005967617601321
Figure IYZ000005967617601331
Figure IYZ000005967617601341
Figure IYZ000005967617601351
Figure IYZ000005967617601361
Figure IYZ000005967617601371
Figure IYZ000005967617601381
Figure IYZ000005967617601401
Figure IYZ000005967617601411
Figure IYZ000005967617601421
Figure IYZ000005967617601431
Figure IYZ000005967617601441
Figure IYZ000005967617601451
Figure IYZ000005967617601461
Figure IYZ000005967617601471
Figure IYZ000005967617601481
Figure IYZ000005967617601491
Figure IYZ000005967617601501
Figure IYZ000005967617601511
Figure IYZ000005967617601521
Figure IYZ000005967617601531
Figure IYZ000005967617601561
Figure IYZ000005967617601571
Figure IYZ000005967617601581
Figure IYZ000005967617601591
Figure IYZ000005967617601611
Figure IYZ000005967617601621
Figure IYZ000005967617601631
Figure IYZ000005967617601641
Figure IYZ000005967617601651
Figure IYZ000005967617601661
Figure IYZ000005967617601671
Figure IYZ000005967617601701
Figure IYZ000005967617601721
Figure IYZ000005967617601731
Figure IYZ000005967617601741
Figure IYZ000005967617601771
Figure IYZ000005967617601781
Figure IYZ000005967617601791
Figure IYZ000005967617601801
Figure IYZ000005967617601811
Figure IYZ000005967617601821
Figure IYZ000005967617601831
Figure IYZ000005967617601841
Figure IYZ000005967617601851
Figure IYZ000005967617601861
Figure IYZ000005967617601871
Figure IYZ000005967617601881
Figure IYZ000005967617601891
Figure IYZ000005967617601901
Figure IYZ000005967617601911
Figure IYZ000005967617601931
Figure IYZ000005967617601941
Figure IYZ000005967617601961
Figure IYZ000005967617601991
Figure IYZ000005967617602001
Figure IYZ000005967617602021
Figure IYZ000005967617602031
Figure IYZ000005967617602041
Figure IYZ000005967617602051
Figure IYZ000005967617602071
Figure IYZ000005967617602091
Figure IYZ000005967617602111
Figure IYZ000005967617602121
Figure IYZ000005967617602131
Figure IYZ000005967617602141
Figure IYZ000005967617602151
Figure IYZ000005967617602161
Figure IYZ000005967617602171
Figure IYZ000005967617602181
Figure IYZ000005967617602191
Figure IYZ000005967617602201
Figure IYZ000005967617602211
Figure IYZ000005967617602221
Figure IYZ000005967617602231
Figure IYZ000005967617602241
Figure IYZ000005967617602251
Figure IYZ000005967617602261
Figure IYZ000005967617602271
Figure IYZ000005967617602281
Figure IYZ000005967617602291
Figure IYZ000005967617602311
Figure IYZ000005967617602321
Figure IYZ000005967617602331
Figure IYZ000005967617602341
Figure IYZ000005967617602361
Figure IYZ000005967617602371
Figure IYZ000005967617602381
Figure IYZ000005967617602391
Figure IYZ000005967617602401
Figure IYZ000005967617602411
Figure IYZ000005967617602421
Figure IYZ000005967617602441
Figure IYZ000005967617602451
Figure IYZ000005967617602461
Figure IYZ000005967617602471
Figure IYZ000005967617602491
Figure IYZ000005967617602501
Figure IYZ000005967617602511
Figure IYZ000005967617602531
Figure IYZ000005967617602541
Figure IYZ000005967617602561
Figure IYZ000005967617602571
Figure IYZ000005967617602581
Figure IYZ000005967617602601
Figure IYZ000005967617602621
Figure IYZ000005967617602631
Figure IYZ000005967617602651
Figure IYZ000005967617602661
Figure IYZ000005967617602671
Figure IYZ000005967617602681
Figure IYZ000005967617602691
Figure IYZ000005967617602701
Figure IYZ000005967617602721
Figure IYZ000005967617602731
Figure IYZ000005967617602741
Figure IYZ000005967617602751
Figure IYZ000005967617602761
Figure IYZ000005967617602771
Figure IYZ000005967617602781
Figure IYZ000005967617602791
Figure IYZ000005967617602811
Figure IYZ000005967617602821
Figure IYZ000005967617602831
Figure IYZ000005967617602841
Figure IYZ000005967617602851
Figure IYZ000005967617602871
Figure IYZ000005967617602881
Figure IYZ000005967617602891
Figure IYZ000005967617602901
Figure IYZ000005967617602911
Figure IYZ000005967617602921
Figure IYZ000005967617602941
Figure IYZ000005967617602951
Figure IYZ000005967617602961
Figure IYZ000005967617602971
Figure IYZ000005967617602991
Figure IYZ000005967617603001
Figure IYZ000005967617603011
Figure IYZ000005967617603021
Figure IYZ000005967617603031
Figure IYZ000005967617603061
Figure IYZ000005967617603071
Figure IYZ000005967617603081
Figure IYZ000005967617603091
Figure IYZ000005967617603111
Figure IYZ000005967617603121
Figure IYZ000005967617603131
Figure IYZ000005967617603151
Figure IYZ000005967617603161
Figure IYZ000005967617603171
Figure IYZ000005967617603191
Figure IYZ000005967617603201
Figure IYZ000005967617603211
Figure IYZ000005967617603221
Figure IYZ000005967617603231
Figure IYZ000005967617603241
Figure IYZ000005967617603261
Figure IYZ000005967617603271
Figure IYZ000005967617603281
Figure IYZ000005967617603291
Figure IYZ000005967617603301
Figure IYZ000005967617603311
Figure IYZ000005967617603321
Figure IYZ000005967617603341
Figure IYZ000005967617603351
Figure IYZ000005967617603371
Figure IYZ000005967617603381
Figure IYZ000005967617603401
Figure IYZ000005967617603421
Figure IYZ000005967617603431
Figure IYZ000005967617603441
Figure IYZ000005967617603451
Figure IYZ000005967617603461
Figure IYZ000005967617603471
Figure IYZ000005967617603481
Figure IYZ000005967617603491
Figure IYZ000005967617603501
Figure IYZ000005967617603511
Figure IYZ000005967617603521
Figure IYZ000005967617603531
Figure IYZ000005967617603541
Figure IYZ000005967617603561
Figure IYZ000005967617603571
Figure IYZ000005967617603581
Figure IYZ000005967617603601
Figure IYZ000005967617603611
Figure IYZ000005967617603621
Figure IYZ000005967617603641
Figure IYZ000005967617603651
Figure IYZ000005967617603661
Figure IYZ000005967617603671
Figure IYZ000005967617603681
Figure IYZ000005967617603691
Figure IYZ000005967617603701
Figure IYZ000005967617603711
Figure IYZ000005967617603721
Figure IYZ000005967617603731
Figure IYZ000005967617603741
Figure IYZ000005967617603751
Figure IYZ000005967617603761
Figure IYZ000005967617603771
Figure IYZ000005967617603781
Figure IYZ000005967617603791
Figure IYZ000005967617603801
Figure IYZ000005967617603821
Figure IYZ000005967617603831
Figure IYZ000005967617603861
Figure IYZ000005967617603871
Figure IYZ000005967617603881
Figure IYZ000005967617603891
Figure IYZ000005967617603901
Figure IYZ000005967617603911
Figure IYZ000005967617603921
Figure IYZ000005967617603931
Figure IYZ000005967617603961
Figure IYZ000005967617603971
Figure IYZ000005967617603981
Figure IYZ000005967617603991
Figure IYZ000005967617604001
Figure IYZ000005967617604011
Figure IYZ000005967617604021
Figure IYZ000005967617604041
Figure IYZ000005967617604051
Figure IYZ000005967617604061
Figure IYZ000005967617604081
Figure IYZ000005967617604091
Figure IYZ000005967617604101
Figure IYZ000005967617604111
Figure IYZ000005967617604131
Figure IYZ000005967617604141
Figure IYZ000005967617604151
Figure IYZ000005967617604161
Figure IYZ000005967617604171
Figure IYZ000005967617604181
Figure IYZ000005967617604191
Figure IYZ000005967617604201
Figure IYZ000005967617604211
Figure IYZ000005967617604221
Figure IYZ000005967617604231
Figure IYZ000005967617604241
Figure IYZ000005967617604251
Figure IYZ000005967617604261
Figure IYZ000005967617604271
Figure IYZ000005967617604281
Figure IYZ000005967617604291
Figure IYZ000005967617604301
Figure IYZ000005967617604331
Figure IYZ000005967617604341

Claims (15)

1.用于植物中相对于对照植物提高盐胁迫或氮限制条件胁迫抗性的方法,所述方法包括调节植物中编码NAP1样多肽的核酸表达,所述NAP1样多肽是SEQ ID NO:2。
2.根据权利要求1所述的方法,其中所述提高的盐胁迫或氮限制条件胁迫抗性是相对于对照植物而言提高的营养摄取效率。
3.根据权利要求2所述的方法,其中所述的营养摄取效率导致增加的生物量和/或提高的种子产量。
4.权利要求3的方法,其中所述提高的种子产量至少包含提高的种子总重量和/或提高的充实种子数。
5.根据权利要求1所述的方法,其中所述受调节的表达通过在植物中导入并表达编码所述NAP1样多肽的核酸而实现。
6.根据权利要求5的方法,其中所述的核酸有效地连接至组成型启动子。
7.根据权利要求6的方法,其中所述的组成型启动子是GOS2启动子。
8.根据权利要求1所述的方法,其中所述的编码NAP1样多肽的核酸是植物来源的。
9.根据权利要求8所述的方法,其中所述植物是双子叶植物。
10.根据权利要求9所述的方法,其中所述双子叶植物是十字花科(Brassicaceae)植物。
11.根据权利要求10所述的方法,其中所述十字花科植物是拟南芥属(Arabidopsis)植物。
12.根据权利要求11所述的方法,其中所述拟南芥属植物是拟南芥。
13.构建体在用于制备盐胁迫或氮限制条件胁迫抗性提高的植物的方法中的用途,所述构建体包含编码SEQ ID NO:2的NAP1样多肽的核酸;
(b)能够驱动(a)的核酸序列表达的一个或多个调控序列;和任选地
(c)转录终止序列,
并且其中所述调控序列之一是组成型启动子。
14.根据权利要求13的用途,其中所述的组成型启动子是GOS2启动子。
15.编码NAP1样多肽的核酸的用途,用于在植物中相对于对照植物而言提高盐胁迫或氮限制条件胁迫抗性的方法中,所述NAP1样多肽是SEQ ID NO:2。
CN2008800037051A 2007-01-31 2008-01-31 具有增强的产量相关性状和/或提高的非生物胁迫抗性的植物和制备该植物的方法 Expired - Fee Related CN101605902B (zh)

Applications Claiming Priority (21)

Application Number Priority Date Filing Date Title
EP07101533.3 2007-01-31
EP07101533 2007-01-31
US89127107P 2007-02-23 2007-02-23
US60/891,271 2007-02-23
EP07103194.2 2007-02-28
EP07103194 2007-02-28
EP07104172 2007-03-14
EP07104172.7 2007-03-14
EP07104242 2007-03-15
EP07104194.1 2007-03-15
EP07104242.8 2007-03-15
EP07104194 2007-03-15
US89605907P 2007-03-21 2007-03-21
US60/896,059 2007-03-21
US91087407P 2007-04-10 2007-04-10
US60/910,874 2007-04-10
US91108907P 2007-04-11 2007-04-11
US60/911,089 2007-04-11
US91128907P 2007-04-12 2007-04-12
US60/911,289 2007-04-12
PCT/EP2008/051225 WO2008092935A2 (en) 2007-01-31 2008-01-31 Plants having enhanced yield-related traits and/or increased abiotic stress resistance, and a method for making the same

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN201310090605XA Division CN103233037A (zh) 2007-01-31 2008-01-31 具有增强的产量相关性状和/或提高的非生物胁迫抗性的植物和制备该植物的方法

Publications (2)

Publication Number Publication Date
CN101605902A CN101605902A (zh) 2009-12-16
CN101605902B true CN101605902B (zh) 2013-04-17

Family

ID=38134617

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2008800037051A Expired - Fee Related CN101605902B (zh) 2007-01-31 2008-01-31 具有增强的产量相关性状和/或提高的非生物胁迫抗性的植物和制备该植物的方法

Country Status (1)

Country Link
CN (1) CN101605902B (zh)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101984059A (zh) * 2010-07-28 2011-03-09 曲延英 一种海岛棉dreb转录因子基因及其应用
CN103421801B (zh) * 2012-05-22 2016-05-25 中国科学院上海生命科学研究院 一种调控稻类结实率的基因及其应用
EP2677035A1 (en) * 2012-06-22 2013-12-25 BASF Plant Science Company GmbH Plants having enhanced yield-related traits and a method for making the same
CN104178509B (zh) * 2013-05-27 2016-12-28 中国科学院遗传与发育生物学研究所 蛋白质GmDREB2AL及其相关生物材料在调控种子植物油脂和千粒重中的应用
CN103805612A (zh) * 2014-02-08 2014-05-21 南京农业大学 一种水稻基因OsRem1及其应用
CN104031937A (zh) * 2014-04-28 2014-09-10 中国农业大学 谷子SiREM6基因在提高植物抗盐性的应用
CN110066809B (zh) * 2019-03-17 2021-05-25 长江大学 Lr2基因调控水稻茎厚、抗折力及其在抗倒伏中的应用
CN114656540B (zh) * 2020-12-23 2023-03-28 中国农业大学 蛋白质cyca3-1在提高玉米抗盐碱性中的应用
CN113072631A (zh) * 2021-03-10 2021-07-06 中国农业科学院作物科学研究所 OsDREB1C及其编码基因在提高水稻光合效率中的应用
CN113337531A (zh) * 2021-05-26 2021-09-03 谢文军 一组稳定高效表达活性融合蛋白的Gateway真核表达系统
CN114349835B (zh) * 2022-01-07 2023-10-10 河北农业大学 GhREM蛋白及其编码基因在调控棉花抗蚜性能中的应用
CN115028717A (zh) * 2022-06-24 2022-09-09 山东省农业科学院作物研究所 一种识别小麦内源性dreb4蛋白的多克隆抗体的制备方法
CN115725582A (zh) * 2022-10-31 2023-03-03 湖南农业大学 一种启动子及其应用

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005094562A1 (en) * 2004-04-02 2005-10-13 Cropdesign N.V. Plants having improved growth characteristics and method for making the same

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005094562A1 (en) * 2004-04-02 2005-10-13 Cropdesign N.V. Plants having improved growth characteristics and method for making the same

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
A nucleosome assembly protein-like polypeptide binds to chloroplast group II intron RNA in Chlamydomonas reinhardtii;Stephanie Glanz et al.;《NUCLEIC ACIDS RESEARCH》;20060929;第34卷(第18期);第5337-5351页 *
Aiwu Dong et al..Regulation of biosynthesis and intracellular localization of rice and tobacco homologues of nucleosome assembly protein 1.《Planta》.2003,第216卷(第4期),第561-570页.
Arabidopsis NAP1 Is Essential for Arp2/3-Dependent Trichome Morphogenesis;Michael J Deeks et al.;《CURRENT BIOLOGY》;20040810;第14卷(第14期);第1410-1414页 *
Michael J Deeks et al..Arabidopsis NAP1 Is Essential for Arp2/3-Dependent Trichome Morphogenesis.《CURRENT BIOLOGY》.2004,第14卷(第14期),第1410-1414页.
Regulation of biosynthesis and intracellular localization of rice and tobacco homologues of nucleosome assembly protein 1;Aiwu Dong et al.;《Planta》;20031231;第216卷(第4期);第561-570页 *
Stephanie Glanz et al..A nucleosome assembly protein-like polypeptide binds to chloroplast group II intron RNA in Chlamydomonas reinhardtii.《NUCLEIC ACIDS RESEARCH》.2006,第34卷(第18期),第5337-5351页.

Also Published As

Publication number Publication date
CN101605902A (zh) 2009-12-16

Similar Documents

Publication Publication Date Title
CN101605902B (zh) 具有增强的产量相关性状和/或提高的非生物胁迫抗性的植物和制备该植物的方法
CN101855355B (zh) 具有提高的产量相关性状的植物和用于制备该植物的方法
CN101802202B (zh) 具有增强的产量相关性状的植物和用于制备该植物的方法
CN102656270B (zh) 具有增强的产量相关性状的植物和用于产生该植物的方法
ES2485384T3 (es) Plantas que tienen rasgos potenciados relacionados con el rendimiento y/o mayor resistencia al estrés abiótico y un procedimiento para fabricar las mismas
CN101765609B (zh) 具有增强的产量相关性状的植物和用于制备该植物的方法
CN102131934B (zh) 具有增强的产量相关性状的植物及其制备方法
CN101965405B (zh) 具有增强的产量相关性状的植物和用于制备该植物的方法
US20150232874A1 (en) Plants having enhanced yield-related traits and a method for making the same
CN102936605A (zh) 具有增强的产量相关性状的植物和用于制备该植物的方法
CN103103199A (zh) 具有增强的产量相关性状的伸展蛋白受体样激酶受调节表达的植物和用于产生该植物的方法
CN105755036A (zh) 具有增强的产量相关性状的植物和用于产生该植物的方法
CN102224247A (zh) 具有改良的产量相关性状的植物和用于制备该植物的方法
CN104530202A (zh) 具有增强的产量相关性状的植物和用于产生该植物的方法
CN102066568A (zh) 具有增强的产量相关性状的植物和用于产生该植物的方法
CN103951741A (zh) 具有增强的产量相关性状的植物及其制备方法
CN101365786A (zh) 具有改良的生长特征的植物及其生产方法
CN102066569A (zh) 具有增强的产量相关性状的植物和产生所述植物的方法
CN101688214A (zh) 具有增强的产量相关性状的植物和用于产生该植物的方法
CN103397049A (zh) 具有增强的产量相关性状的植物及其制备方法
CN103502456A (zh) 具有增强的产量相关性状的植物和用于制备该植物的方法
CN103119167A (zh) 具有增强的产量相关性状的植物和用于产生该植物的方法
CN102272309A (zh) 具有增强的非生物胁迫耐受性和/或增强的产量相关性状的植物及其制备方法
CN103154254A (zh) 具有增强的产量相关性状的植物和产生该植物的方法
CN103068992A (zh) 具有增强的产量相关性状的植物和用于制备该植物的方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20130417

Termination date: 20150131

EXPY Termination of patent right or utility model