CN104862333A - 具有增强的产量相关性状的植物和用于制备该植物的方法 - Google Patents

具有增强的产量相关性状的植物和用于制备该植物的方法 Download PDF

Info

Publication number
CN104862333A
CN104862333A CN201410643355.2A CN201410643355A CN104862333A CN 104862333 A CN104862333 A CN 104862333A CN 201410643355 A CN201410643355 A CN 201410643355A CN 104862333 A CN104862333 A CN 104862333A
Authority
CN
China
Prior art keywords
plant
nucleic acid
polypeptide
sequence
seq
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410643355.2A
Other languages
English (en)
Inventor
A·I·桑兹莫林纳罗
Y·海茨费尔德
S·范德纳比利
A·舍利
L·达尔尼勒
B·麦克尔西
V·弗兰卡德
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BASF Plant Science Co GmbH
BASF Plant Science GmbH
Original Assignee
BASF Plant Science Co GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BASF Plant Science Co GmbH filed Critical BASF Plant Science Co GmbH
Publication of CN104862333A publication Critical patent/CN104862333A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/415Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • C12N15/8262Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield involving plant development
    • C12N15/827Flower development or morphology, e.g. flowering promoting factor [FPF]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • C12N15/8271Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance
    • C12N15/8273Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for drought, cold, salt resistance
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0071Oxidoreductases (1.) acting on paired donors with incorporation of molecular oxygen (1.14)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y114/00Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14)
    • C12Y114/11Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14) with 2-oxoglutarate as one donor, and incorporation of one atom each of oxygen into both donors (1.14.11)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y207/00Transferases transferring phosphorus-containing groups (2.7)
    • C12Y207/11Protein-serine/threonine kinases (2.7.11)
    • C12Y207/11001Non-specific serine/threonine protein kinase (2.7.11.1), i.e. casein kinase or checkpoint kinase
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A40/00Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
    • Y02A40/10Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture
    • Y02A40/146Genetically Modified [GMO] plants, e.g. transgenic plants

Abstract

本发明总体上涉及分子生物学领域并涉及用于通过调节编码GRP(生长调节蛋白)的核酸在植物中表达而增强产量相关性状和/或改善多种植物生长特征的方法。GRP选自本文中缩写为LBD多肽的包含LOB结构域的蛋白质(LOB:侧生器官边界)、JMJC(JUMONJI-C)多肽、CKI(酪蛋白激酶I)多肽、bHLH11样(碱性螺旋-环-螺旋11)蛋白、植物同源域指-同源域(PHDf-HD)多肽、ASR(脱落酸、胁迫和成熟诱导的)多肽和/或鳞部启动子结合蛋白样11(SPL11)转录因子多肽。本发明也涉及具有编码GRP的核酸受调节地表达的植物,所述植物相对于对应的野生型植物或其他对照植物具有改善的生长特征。本发明也提供了新GRP核酸和GRP多肽以及用于本发明方法中的构建体。

Description

具有增强的产量相关性状的植物和用于制备该植物的方法
本申请是中国专利申请200880022592.X的分案申请,原申请的申请日是2008年5月2日,发明名称是“具有增强的产量相关性状的植物和用于制备该植物的方法”。
本发明总体上涉及分子生物学领域并涉及用于通过调节编码GRP(生长调节蛋白)的核酸在植物中表达而增强产量相关性状和/或改进多种植物生长特征的方法。GRP选自本文中缩写为LBD多肽的包含LOB结构域的蛋白质(LOB:侧生器官边界)、JMJC(JUMONJI-C)多肽、CKI(酪蛋白激酶I)多肽、bHLH11样(碱性螺旋-环-螺旋11)蛋白、植物同源域指-同源域(PHDf-HD)多肽、ASR(脱落酸、胁迫和成熟诱导的)多肽和/或鳞部(Squamosa)启动子结合蛋白样11(SPL11)转录因子多肽。本发明还涉及具有编码GRP的核酸的受调节表达的植物,所述植物相对于对应的野生型植物或其他对照植物具有改善的生长特征。本发明还提供了新GRP核酸和GRP多肽以及用于本发明方法中的构建体。
持续增长的世界人口和农业用可耕地供应萎缩刺激了有关提高农业效率的研究。常规的作物及园艺学改良手段利用选择育种技术以鉴定具有受欢迎特征的植物。但是,此类选择育种技术具有几个缺陷,即这些技术一般耗费很多劳动并且产生这样的植物,其经常含有异源的遗传组分,其可能不总是导致从亲代植物中传递的受欢迎性状。分子生物学进展已经允许人类改良动物及植物的种质。植物的遗传工程使得可以分离和操作遗传物质(一般处于DNA或RNA形式)并且随后导入该遗传物质至植物中。此类技术具有产生具备多种经济学、农学或园艺学改良性状的作物或植物的能力。
具有特殊经济意义的性状是提高的产量。产量通常定义为来自作物的经济价值的可测量结果。该结果可以就数量和/或品质方面进行定义。产量直接取决于几个因素,例如器官的数目和大小、植物构造(例如枝的数目)、种子产生、叶衰老等。根发育、养分摄入量、胁迫耐受性和早期生长势(earlyvigor)也可以是决定产量的重要因素。优化前述因素因而可以对提高作物产量有贡献。
种子产量是特别重要的性状,因为许多植物的种子对人与动物营养是重要的。作物如玉米、稻、小麦、卡诺拉油菜和大豆占超过一半的人类总热量摄入,无论通过直接消费种子本身或通过消费基于加工的种子而产生的肉产品。作物也是糖、油及工业加工中所用许多类型代谢物的来源。种子含有胚(新苗和新根的起源)和胚乳(萌发期间及籽苗早期生长期间用于胚生长的营养来源)。种子发育涉及多种基因并且需要代谢物从根、叶和茎转移至正在生长的种子中。胚乳尤其同化糖类、油和蛋白质的代谢前体并且将它们合成为贮藏大分子以灌满籽粒。
对于许多作物的另一个重要性状是早期生长势。改进早期生长势是现代稻育种计划在温带和热带稻品种上的重要目标。长根在水栽稻中对于正确土壤固定是重要的。在稻直接播种至被淹没田地的情况下,以及在植物必须从水中迅速出苗的情况下,较长的苗与生长势相关。在实施条播的情况下,较长的中胚轴和胚芽鞘对于良好出苗是重要的。将早期生长势人工改造到植物内的能力将在农业中是极其重要的。例如,不良的早期生长势已经限制了基于玉米带种质(Corn Belt germplasm)在欧洲大西洋地区引种玉米(Zea mayes L.)杂种。
又一个重要性状是改进的非生物胁迫耐受性。非生物胁迫是世界范围作物损失的主要原因,对于大多数主要作物植物而言降低平均产量超过50%(Wang等、Planta(2003)218:1-14)。非生物胁迫可以由干旱、盐度、极端温度、化学毒性和氧化胁迫引起。提高植物对非生物胁迫耐受性的能力将在世界范围对农民而言是巨大经济优势并且会允许在不利条件期间及在作物栽培否则是不可能的陆地上栽培作物。
作物产量因而可以通过优化前述因素之一而提高。
取决于最终用途,对某些产量性状的改良可能优先于其它产量性状。例如对于应用如饲料或木材生产或生物燃料资源而言,增加植物营养体部分可能是希望的,而对于应用如面粉、淀粉或油生产而言,种子参数的提高可能是特别希望的。即便在种子参数当中,某些参数可以更优先于其它参数,这取决于应用。多种机制可以对提高种子产量有贡献,无论形式为增加的种子大小或是提高的种子数目。
提高植物中产量(种子产量和/或生物量)的一种方法可以是通过调节植物的内在生长机制如细胞周期或参与植物生长或参与防御机制的多种信号传导途径。
出人意料地,现在已经发现:调节编码GRP多肽的核酸表达产生了相对于对照植物而言具有增强的产量相关性状和/或改善的多种植物生长特征的植物,其中所述的GRP多肽选自本文中缩写为LBD多肽的包含LOB结构域的蛋白质(LOB:侧生器官边界)、JMJC(JUMONJI-C)多肽、酪蛋白激酶多肽、植物同源域指-同源域(PHDf-HD)多肽、bHLH11样(碱性螺旋-环-螺旋11)蛋白、ASR(脱落酸-、胁迫-和成熟诱导的)多肽和/或鳞部启动子结合蛋白样11(SPL11)转录因子多肽。
根据一个实施方案,提供了用于相对于对照植物改善或增强植物的产量相关性状和/或改善多种植物生长特征的方法,包括调节植物中编码GRP多肽的核酸表达,其中所述的GRP多肽选自本文中缩写为LBD多肽的包含LOB结构域的蛋白质(LOB:侧生器官边界)、JMJC(JUMONJI-C)多肽、酪蛋白激酶多肽、植物同源域指-同源域(PHDf-HD)多肽、bHLH11样(碱性螺旋-环-螺旋11)蛋白、ASR(脱落酸-、胁迫-和成熟诱导的)多肽和/或鳞部启动子结合蛋白样11(SPL11)转录因子多肽。
背景
I.包含LOB结构域的蛋白质(LOB:侧生器官边界)
LBD蛋白(或LOB结构域蛋白)均共有在氨基端区域中的一个保守结构域,称作LOB结构域。LOB结构域蛋白(Shuai等人,Plant Physiol.129,747-761,2002)存在于多个植物物种中并且构成一个庞大基因家族:据报道拟南芥属(Arabidopsis)具有超过40种编码LOB结构域蛋白的基因,在稻中发现了至少35种基因稻和在玉米中发现了至少15种基因。LBD多肽可以是转录因子(其中有KNOX转录因子)的调节物并且推测在玉米中的玉米雄穗和玉米穗分枝(Bortiri等人,Plant Cell 18,574-587,2006)、不定根形成(Liu等人,Plant J.43,47-56,2005;Inukai等人,Plant Cell 17,1387-1396,2005)、雌配子体增殖(Evans等人,Plant Cell 19,46-62,2007)、花瓣近-远端模式形成(Chalfun-Junior等人,植物Mol.Biol.57,559-575,2005);叶形态学和叶脉型(Iwakawa等人,Plant Cell Physiol.43,467-478,2002)中发挥作用。基于Iwakawa等人(2005)和Shuai等人(2002)的分类,Yang等人(Molecular Phylogenetics and Evolution 39,248-262,2006)区分了稻中三个类别的LBD蛋白。对I类LOB基因表达的调节(表达的上调或下调)经常产生多效作用,导致异常植物形状和不育。例如,US20060218674公开了用于通过表达I类LOB多肽而增加植物种子中胚乳大小的方法,但是,胚的大小成比例地降低。
出人意料地,现在已经发现:调节编码LBD多肽的核酸表达产生了相对于对照植物具有增强的产量相关性状、尤其提高的生物量和种子产量的植物。
根据一个实施方案,提供了用于相对于对照植物而言改善植物的产量相关性状的方法,包括调节植物中编码LBD多肽的核酸表达。这种改善的产量相关性状包含提高的生物量和提高的种子产量。
II.JMJC(JUMONJI-C)多肽
首次报道的JUMONJI(其意指日文的十字形)基因通过小鼠中的基因截获法鉴定,其中该基因在多种组织的发育中起到重要作用。迄今,JUMONJI多肽构成一个独特类别的蛋白质,其存在于原核生物以及存在于真核生物中,包括细菌、真菌和植物。
JUMONJI多肽家族的大多数成员以存在JmjC或JUMONJI-C结构域为特征。猜想在进化期间,仅包含JmjC结构域的远古蛋白质获得了拓宽JMJC多肽在自然界中存在范围的额外结构域。特别有意义的是这样的JMJC多肽,它们获得参与DNA、RNA和蛋白质结合的保守结构域如锌指、FY丰富、RING指蛋白和F盒结构域,这提示JUMONJI家族的多肽可以调节转录、染色质功能和/或蛋白质转换。因而,已经报道动物中的许多JUMONJI蛋白通过控制基因表达和染色质活性影响发育。例如,小鼠JUMONJI基因起到阻抑胚中细胞周期蛋白D1的作用并且这种活性是正常心脏发生所需要的(Toyoda等人2003Dev Cell.5(1):85-97.)。
在理解含有jmjC结构域的蛋白质的作用模式方面已经取得大量进展。对于其生物学功能关键的可能是JMJC多肽中一些最近揭示的酶活性,例如,一种人源JMJC多肽-JHDM1(Tsukada,Nature.2006;439(7078):811-6)具有组蛋白去甲基化酶活性,并且已经报道了一种参与细胞低氧应答的转录因子FIH(因子抑制性HIF-1α)中的天冬酰胺酰羟化酶活性(Linke等人(2004)J.Biol.Chem.,Vol.279,14391-14397)。
JmjC结构域一般具有与一些金属酶中存在的那些结构类似的结构。对JUMONJI蛋白FIH中存在的JmjC结构域的最近结构分析揭示了参与结合辅因子2-酮戊二酸和铁Fe(II)的氨基酸残基(Dann等;Proc Natl AcadSci U S A.2002;99(24):15351–15356)。FIH具有大多数2-酮戊二酸加氧酶的HXD/E铁结合基序特征。此外并且与水解酶活性相一致,FIH二级结构由围绕Fe(II)-结合部位的β-链薄卷饼型核心构成。这些特点在含有JmjC结构域的蛋白质中是保守的(Trewick等人EMBO Rep.2005(4):315-20)。
在植物中,报道了两种JMJC多肽参与控制开花时间。它们均作为拟南芥(Arabidopsis thaliana)中开花途径的阻遏物发挥作用(Noh等人PlantCell.2004.16(10):2601-13)。仍没有实验地确定所述植物蛋白的酶活性。
出人意料地,现在已经发现:在植物中调节编码JUMONJI-C或JMJC多肽的核酸表达产生了相对于对照植物具有增强的产量相关性状、尤其提高的产量的植物。
根据一个实施方案,提供了用于相对于对照植物而言改善植物的产量相关性状的方法,包括调节植物中编码JMJC多肽的核酸表达。改善的产量相关性状包含在最佳生长条件和次优的轻度干旱条件下的以下一项或多项:提高的每株植物种子总重量、千粒核(1000颗种子)重、种子充实率、收获指数、早期生长势和根/冠比率。
III.酪蛋白激酶I
蛋白激酶代表一个超家族,并且该超家族的成员催化ATP的磷酸酯基团可逆转移至靶多肽上的丝氨酸、苏氨酸和酪氨酸氨基酸侧链。尤其,蛋白酶的酪蛋白激酶1(CKI)家族(EC 2.7.11.1)作为大多数真核生物中信号转导途径的调节物发挥作用。在酵母中,CK I参与调节DNA修复和细胞周期进展(Hoekstra MF等人,Science 253:Brockman JL等人,Proc.NatlAcad Sci.USA 89:9454-9458,1992;Dhillon N和Hoekstra MF,EMBO J13:2777-2788,1994)。酪蛋白激酶I蛋白是含有高度保守的中央激酶结构域的丝氨酸/苏氨酸型单体蛋白激酶。该家族的成员具有趋异的氨基端延伸和羧基端延伸。氨基端区域负责底物识别并且羧基端延伸对于该激酶与底物相互作用是重要的。还认为羧基端延伸对于通过自体磷酸化介导调节作用是重要的(Gross和Anderson,1998Cell Signal 10:699-711;Craves和Roach,1995,J Biol Chem 270:21689-21694)。
在植物中,几种CKI蛋白家族成员已经克隆并以生物化学方式表征(Klimczak和Cashmore AR,1993.Biochem.J.293:283-288;Liu等人2003,Plant Journal.36,189-202;Lee等人2005Plant Cell.17(10):2817–2831)。发现拟南芥属基因组含有至少14种酪蛋白激酶I样(CKL)基因。在保守的激酶结构域范围内,所述多肽共享在氨基酸水平的89%序列相似性。这14种拟南芥CKL同种型已经基于亚细胞定位进一步分类在3个组中。组1主要位于细胞周边;组2主要在细胞核中并且组3主要在细胞浆中。烟草(Nicotiana tabacum)CKI已经被定位于胞间连丝并且提出其在细胞间通讯中发挥作用(Lee等人2005)。对植物CKI提出的其他作用是应答于环境刺激的信号转导、根发育和植物激素敏感性(Liu等人)。
出人意料地,现在已经发现:调节编码CKI多肽的核酸表达产生了相对于对照植物具有增强的产量相关性状的植物。
根据一个实施方案,提供了用于相对于对照植物而言改善植物的产量相关性状的方法,包括调节植物中编码CKI多肽的核酸表达。改善的产量相关性状包含以下一项或多项:提高的生物量、增加的出苗生长势和提高的种子产量。
IV.植物同源域指-同源域(PHDf-HD)多肽
转录因子通常定义为显示序列特异性DNA结合亲和力并且能够激活和/或阻遏转录的蛋白质。拟南芥基因组编码至少1533种转录调节蛋白,占其预计基因总数的约5.9%(Riechmann等人(2000)Science 290:2105-2109)。稻转录因子数据库(DRTF)是籼稻(Oryza sativa L.ssp.indica)和粳稻(Oryza sativa L.ssp.japonica)的已知和预测转录因子的集合,并且目前含有籼稻中的2,025种推定转录因子(TF)基因模型和粳稻中的2,384种推定转录因子基因模型,分布在63个家族中(Gao等人(2006)Bioinformatics2006,22(10):1286-7)。
这些家族之一是参与发育过程多方面的同源域(HD)转录因子超家族。HD转录因子的特征是存在同源域(HD),该结构域是一个60氨基酸DNA结合结构域(BD)。拟南芥和稻大约含有100种HD转录因子,所述转录因子可以基于氨基酸序列同一性进一步划分成亚家族(Richardt等人(2007)Plant Phys 143(4):1452–1466)。这些亚家族中的一些亚家族以存在促进DNA结合和/或蛋白质-蛋白质相互作用的额外的保守结构域为特征。
这些结构域之一是PHD指,因为与相同多肽上的DNA结合HD结合而得名的植物同源域指(PHDf),其中所述的PHD指最初因玉米同源框转录因子ZmHOX1a(Bellman和Werr(1992)EMBO J 11:3367-3374)和其拟南芥属近亲ATHAT3.1(Schindler等人(1993)Plant J 4:137-150)之间的氨基酸序列同一性而鉴定。PHDf是能够螯合两个锌离子的Cys4-His-Cys3锌指样基序。PHDf存在于胞核蛋白质中并且认为其参与染色质介导的转录调节(Halbach等人(2000)Nucleic Acid Res 28(18):3542-3550)。
联合有PHDf和HD的转录因子因而称为PHDf-HD(上文的Halbach等人(2000))。在植物中,此类PHDf-HD进一步以PHDf上游存在亮氨酸拉链(ZIP)为特征。这两种结构域(ZIP和PHDf)共同形成一个称作ZIP/PHDf结构域的高度保守的180氨基酸区域(上文的Halbach等人(2000))。
使用与ω增强子组合的花椰菜花叶病毒35S启动子强烈过量表达两种玉米PHDf-HD多肽(ZmHOX1a或ZmHOX1b)之一的转基因烟草植物显示相同的形态学变化:大小减小、形成不定根和同源异型花转变(Uberlacker等人(1996)Plant Cell 8:349-362)。与野生型相比,使用花椰菜花叶病毒35S启动子强烈过量表达稻(Oryza sativa)HAZ1PHDF-HD多肽的转基因稻植物和烟草植物不显示异常生长或表型变化(Ito等人(2004)Gene 331:9-15)。
在美国专利7,196,245中,将拟南芥PHDf-HD多肽(鉴定为G416)转化到拟南芥中,并且证明与对照植物相比,其促进转基因植物中早期开花,而对种子产量无影响。
出人意料地,现在已经发现:调节、优选地增加编码PHDf-HD多肽的核酸序列表达产生了相对于对照植物具有增强的产量相关性状、优选增强的种子产量相关性状的植物。
根据一个实施方案,提供了用于相对于对照植物增强植物中产量相关性状、优选增强种子产量相关性状的方法,包括调节、优选地增加植物中编码PHDf-HD多肽的核酸序列表达。增强的产量相关性状、优选增强的种子产量相关性状包含以下一项或多项:增加的原发花序(primarypanicle)数、每株植物提高的总种子产量、提高的(充实)种子数、提高的千粒核重(TKW)、提高的收获指数。
V.bHLH11样(碱性螺旋-环-螺旋11)蛋白
转录因子通常定义为显示序列特异性DNA结合作用并且能够激活和/或阻遏转录的蛋白质。碱性螺旋-环-螺旋转录因子家族是最大的转录因子家族之一,已经在拟南芥中表征(Toledo-Ortiz等人,Plant Cell 15,1749-1770,2003;Bailey等人,Plant Cell 15,2497-2501,2003)和已经在稻中表征(Li等Plant Physiol.141,1167-1184,2006)。bHLH转录因子家族的区别性特征是存在由大约60个氨基酸构成的二分结构域。这种二分结构域由与共有的六核苷酸E盒相结合的DNA结合碱性区域和在该区域羧基末端存在的两个α-螺旋构成,其中所述的两个α-螺旋由可变环区隔开。这两个α-螺旋促进二聚化,允许不同家族成员之间形成同二聚体和异二聚体。尽管bHLH结构域是进化保守的,然而除这个结构域之外,进化枝之间存在很少序列相似性。基于bHLH结构域的序列,Li等人(2006)将稻和拟南芥bHLH转录因子分成22个亚家族。
有关bHLH11样多肽在植物中的功能知之甚少。迄今,已经表征仅一种bHLH11样多肽,即来自稻的OsPTF1。据报道OsPTF1参与针对磷酸盐饥饿的耐受性(Yi等人,Plant Physiol.138,2087-2096)。与对照植物相比,在35S启动子控制下过量表达这种基因的稻植物在正常条件下培育时没有显示任何不同的表型,但是在磷酸盐限制条件下,该植物具有改善的磷酸盐摄取。在磷酸盐限制条件下,转基因植物显示生物量增加、磷酸盐含量提高、分蘖增加和种子产量提高。
出人意料地,现在已经发现:在植物中调节编码bHLH11样多肽的核酸表达产生了相对于对照植物具有增强的产量相关性状、尤其提高的产量的植物。这些作用在磷酸盐不限制的生长条件下显示。
根据一个实施方案,提供了用于相对于对照植物而言改善植物的产量相关性状的方法,包括调节植物中编码bHLH11样多肽的核酸表达。这种改善的产量相关性状包含提高的种子产量。
VI.ASR(脱落酸、胁迫和成熟诱导的)蛋白
ASR(脱落酸、胁迫和成熟诱导的)多肽首先在番茄中(Iusem等1993Plant Physiol 102:1353-1354)鉴定为定位至细胞核并与染色质结合的小的高度带电荷的亲水性蛋白质。编码ASR多肽的Asr基因家族广泛存在于高等植物中,并且ASR同源物已经从大量双子叶和单子叶植物克隆(Carrai等人2004Trends Plant Sci 9:57–59)。大多数Asr基因在不同环境胁迫条件下、在果实成熟期间和用激素ABA处理细胞时上调。ASR多肽显示高度的序列保守性(Frankel等人2006.Gene第74-83页)。全部已知的Asr基因含有两个高度保守的区域。第一区域含有在氨基端的一串His残基,具有序列特异的Zn2+-依赖DNA结合活性(Kalifa等人,2004a Biochem J381:373–378)。第二区域是羧基端序列的庞大部分,经常含有核定位信号NLS(Cakir等人,2003Plant Cell 15:2165–2180)。番茄的ASR1蛋白是内在非结构的蛋白质,其在结合锌离子时变得有序(折叠)并且形成二聚体(Goldgur等人Plant Physiol.2007年2月;143(2):617-28)。
已经提出ASR多肽在调节基因转录中的推定作用。据报道,酵母单杂交实验揭示一种葡萄ASR与己糖转运蛋白基因(VvHT1)的启动子结合。与此一致,已经提出了Asr1在异养器官(如马铃薯块茎)中控制己糖摄取的作用(Frankel等人Plant Mol Biol.2007年3月;63(5):719-30)。已经报道了ASR家族的蛋白质成员的锌依赖性DNA结合活性(Kalifa等人2004Biochem J.2004年7月15日;381(Pt 2):373-8)。ASR1蛋白的DNA结合结构域和锌结合结构域已经定位(Rom等人2006.Biochimie.88(6):621-8;Goldgur等人2007.Plant Physiol.2月;143(2):617-28)。
已经公开了使用ASR多肽改善植物中的农学性状作为增强植物针对特定非生物胁迫的耐受性的方法。例如,在拟南芥属植物(拟南芥)中过量表达来自百合(麝香百合(Lilium longiflorum))的ASR1直向同源物LLA23基因提高植物针对干旱和盐度的耐受性(Yang等人2005.Plant Physiol139:836–846)。另外,美国专利7,154.025公开了用于通过增加植物中ASR蛋白的量提高对缺水胁迫的抗性的方法。
出人意料地,现在已经发现:在植物中调节编码ASR多肽的核酸表达产生了相对于对照植物在非胁迫生长条件下具有增强的产量相关性状的植物。根据第一实施方案,本发明提供了用于相对于对照植物增强非胁迫生长条件下植物中产量相关性状的方法,包括调节植物中编码ASR多肽的核酸表达。
VII.鳞部启动子结合蛋白样11(SPL11)
转录因子多肽通常定义为显示序列特异性DNA结合亲和力并且能够激活和/或阻遏转录的蛋白质。鳞部启动子结合蛋白样(SPL)转录因子多肽是共有长度约80个氨基酸残基的高度保守性DNA结合结构域(DBD)的结构多样的蛋白质(Klein等(1996)Mol Gen Genet 259:7-16;Cardon等(1999)Gene 237:91-104)。靶基因启动子内的SPL转录因子DNA共有序列结合位点是5’-TNCGTACAA-3’,其中N代表任意碱基。在SPL DBD内部存在10个保守的半胱氨酸(Cys)或组氨酸(His)残基(见图28),其中8个残基是结合对于SPL特异性锌指三级结构形成所必需的2个锌离子的锌配位残基(Yamasaki等人(2004)J Mol Biol 337:49-63)。SPL DBD内的第二个保守性特征是二分核定位信号。在DBD之外,在整个植物界内大多数编码SPL转录因子多肽的核酸序列中找到一个由miRNA的miR156家族特异性靶向的微RNA(miRNA)靶基序(在编码区中或在3’UTR)(Rhoades等人(2002)Cell 110:513-520)。miRNA通过引导编码SPL的mRNA降解或通过翻译抑制以转录后方式调控SPL基因表达。
拟南芥属植物基因组编码至少1533种转录调节蛋白,占其预计基因总数的约5.9%(Riechmann等人(2000)Science 290:2105-2109)。该文作者报道了拟南芥中的16种SPL转录因子多肽,它们自身之间具有很小的序列相似性(除上文提及的特点之外),推导的SPL多肽的大小是从131至927个氨基酸。不过,在这种植物的SPL家族中检测到共有更高序列同源性的SPL转录因子多肽对(Cardon等人(1999))。
已经证实迄今表征的SPL转录因子多肽(仅于植物中发现)在植物发育、尤其在花发育中发挥作用。据报道过量表达SPL3转录因子多肽的转基因植物开花更早(Cardon等人(1997)Plant J 12:367-377)。在欧洲专利申请EP1033405中,公开了SPL11转录因子多肽的核酸序列和推导的多肽序列。
出人意料地,现在已经发现:在植物中调节编码SPL11多肽的核酸表达产生了相对于对照植物具有增强的产量相关性状、尤其提高的产量的植物。
根据一个实施方案,提供了用于相对于对照植物增强植物的产量相关性状的方法,包括调节植物中编码SPL11多肽的核酸表达。增强的产量相关性状包含以下一项或多项:增加的出苗生长势(改善的籽苗早期生长势)、总种子产量(种子重量)、种子充实率(种子充盈率)、充实种子数、每个花序的花(种子)数目、收获指数和千粒核(1000颗种子)重,此类增加在最佳和次佳生长条件、优选在轻度干旱条件件下均发生。
根据一个实施方案,提供了用于实施本发明方法的新SPL11核酸和SPL11多肽以及包含编码SPL11的核酸的构建体。
定义
多肽/蛋白质
术语“多肽”和“蛋白质”在本文中可相互交换地使用并且指由肽键连接起来的任意长度聚合物形式的氨基酸。
多核苷酸/核酸/核酸序列/核苷酸序列
术语“多核苷酸”、“核酸序列”、“核苷酸序列”、“核酸”、“核酸分子”在本文中可相互交换地使用并且指任意长度的聚合非分支形式的核苷酸,即核糖核苷酸或脱氧核糖核苷酸或这二者的组合。
对照植物
选择合适的对照植物是实验设计的例行部分并且可以包括相应的野生型植物或无目的基因的相应植物。对照植物一般是相同的植物物种或甚至是与待评估植物相同的品种。对照植物也可以是待评估植物的失效合子。失效合子是因分离而丢失转基因的个体。如本文中所用的“对照植物”不仅指完整植物,也指植物部分,包括种子和种子部分。
同源物
蛋白质的“同源物”包括这样的肽、寡肽、多肽、蛋白质和酶,它们相对于非修饰的所讨论蛋白质具有氨基酸替换、缺失和/或插入并且与从中衍生它们的非修饰蛋白质具有相似的生物学活性和功能活性。
缺失指从蛋白质中移除一个或多个氨基酸。
插入指一个或多个氨基酸残基被导入蛋白质中的预定位点。插入可以包含氨基端融合和/或羧基端融合以及序列内插入单个或多个氨基酸。通常,在氨基酸序列内部的插入物比氨基端融合物或羧基端融合物小约1至10个残基级别。氨基端或羧基端融合蛋白或融合肽的例子包括如酵母双杂交系统中所用的转录激活物的结合结构域或激活结构域、噬菌体外壳蛋白、(组氨酸)-6-标签、谷胱甘肽S-转移酶-标签、蛋白A、麦芽糖结合蛋白、二氢叶酸还原酶、Tag·100表位、c-myc表位、-表位、lacZ、CMP(钙调蛋白结合肽)、HA表位、蛋白C表位和VSV表位。
替换指以具有相似特性(如相似的疏水性、亲水性、抗原性、形成或破坏α-螺旋结构或β-折叠结构的倾向性)的其他氨基酸替代蛋白质的氨基酸。氨基酸替换一般是单个残基的,不过根据给予多肽的功能性约束条件,可以是簇集的;插入通常是约1至10个氨基酸残基级别。氨基酸替换优选地是保守性氨基酸替换。保守性替换表是本领域熟知的(见例如Creighton(1984)Proteins.W.H.Freeman and Company(编著)和下表1)。
表1:保守性氨基酸替换的例子
残基 保守性替换 残基 保守性替换
Ala Ser Leu Ile;Val
Arg Lys Lys Arg;Gln
Asn Gln;His Met Leu;Ile
Asp Glu Phe Met;Leu;Tyr
Gln Asn Ser Thr;Gly
Cys Ser Thr Ser;Val
Glu Asp Trp Tyr
Gly Pro Tyr Trp;Phe
His Asn;Gln Val Ile;Leu
Ile Leu,Val
氨基酸替换、缺失和/或插入可以使用本领域熟知的肽合成技术如固相肽合成法等或通过重组DNA操作轻易地进行。用于操作DNA序列以产生蛋白质的替换、插入或缺失变体的方法是本领域熟知的。例如,用于在DNA的预定位点处产生替换突变的技术是本领域技术人员熟知的并且包括M13诱变法、T7-Gen体外诱变法(USB,Cleveland,OH)、QuickChange位点定向诱变法(Stratagene,San Diego,CA)、PCR介导的位点定向诱变或其他位点定向诱变法。
衍生物
“衍生物”包括这样的肽、寡肽、多肽,其中与天然存在形式蛋白质(如目的蛋白)的氨基酸序列相比较,它们包含非天然存在的氨基酸残基对氨基酸的替换或非天然存在的氨基酸残基的添加。蛋白质的“衍生物”也包括这样的肽、寡肽、多肽,其中与所述多肽的天然存在形式的氨基酸序列相比,它们包含天然存在的改变(糖基化、酰化、异戊二烯化、磷酸化、肉豆蔻酰化、硫酸化等)的氨基酸残基或非天然存在的改变的氨基酸残基。与从中衍生出衍生物的氨基酸序列相比较,该衍生物可以也包含与所述氨基酸序列共价或非共价结合的一个或多个非氨基酸取代基或添加物(例如报道分子或其他配体),如所结合旨在促进检测该衍生物的报道分子,和相对于天然存在的蛋白质的氨基酸序列而言,包含非天然存在的氨基酸残基。此外,“衍生物”也包括天然存在形式蛋白质与标签肽如FLAG、HIS6或硫氧还蛋白(对于标签肽的综述,见Terpe,Appl.Microbiol.Biotechnol.60,523-533,2003)的融合物。
直向同源物/旁系同源物
直向同源物和旁系同源物包括用来描述基因祖先关系的进化概念。旁系同源物是相同物种内因祖先基因复制而起源的基因;直向同源物是来自不同生物的因物种形成而起源的基因,并且也衍生于共同的祖先基因。
结构域
术语“结构域”指在进化相关性蛋白质的序列比对结果上的特定位置处保守的一组氨基酸。尽管在其他位置处的氨基酸可以在同源物之间不同,然而在特定位置处高度保守的氨基酸指示了很可能在蛋白质结构、稳定性或功能方面是必需的氨基酸。结构域因其在蛋白质同源物家族的比对序列中高保守程度而鉴定,故它们可以作为鉴定物用来确定所讨论的任意多肽是否属于先前已鉴定的多肽家族。
基序/共有序列/标签
术语“基序”或“共有序列”或“标签”指在进化相关蛋白质的序列中短的保守区域。基序往往是结构域的高度保守部分,不过也可以仅包括该结构域的部分,或可以位于保守结构域之外(若基序的全部氨基酸位于定义的结构域之外)。
杂交
如本文中所定义的术语“杂交”是其中基本上同源的互补核苷酸序列相互复性的过程。杂交过程可以完全在溶液中进行,即两种互补核酸均处于溶液中。杂交过程也可以用固定至基质如磁珠、琼脂糖凝胶(Sepharose)珠或任何其他树脂的互补核酸之一进行。杂交过程也可以用固定至固体支持物如硝酸纤维素膜或尼龙膜上或通过例如照相平版印刷术固定至例如硅玻璃支持物(后者称作核酸阵列或微阵列或称作核酸芯片)的互补核酸之一进行。为使杂交发生,核酸分子通常被热变性或化学变性,以使双链解链成两条单链和/或去除来自单链核酸的发夹或其他二级结构。
术语“严格性”指杂交发生的条件。杂交的严格性受诸条件如温度、盐浓度、离子强度和杂交缓冲液组成的影响。通常,低严格条件选择为在定义的离子强度和pH处,低于特定序列的热解链温度(Tm)约30℃。中等严格条件是当所述温度低于Tm 20℃时,并且高严格条件是当所述温度低于Tm 10℃时。高严格杂交条件一般用于分离与靶核酸序列具有高序列相似性的杂交序列。但是,核酸可以在序列上偏离且依旧编码基本上相同的多肽,原因是遗传密码的简并性。因而,有时候可能需要中等严格杂交条件以鉴定此类核酸分子。
Tm是在定义的离子强度和pH处的下述温度,其中50%的靶序列在所述温度与完全匹配的探针杂交。Tm取决于溶液条件和探针的碱基组成及长度。例如,较长的序列在更高温度上特异性地杂交。最大杂交速率在低于Tm约16℃直至32℃上获得。杂交溶液中一价阳离子的存在降低了两条核酸链之间的静电排斥作用,因而促进杂交体形成;这种作用对于直到0.4M的钠浓度是显而易见的(对于更高的浓度而言,可以忽略这种作用)。甲酰胺降低了DNA-DNA和DNA-RNA双链体的解链温度,每百分数的甲酰胺降低0.6至0.7℃,且添加50%甲酰胺允许在30至45℃杂交,尽管杂交速率将降低。碱基对错配降低了杂交速率和双链体的热稳定性。平均而言和对于大探针而言,Tm下降约1℃/每%碱基错配。根据杂交体的类型,Tm可以使用以下等式计算:
1)DNA-DNA杂交体(Meinkoth和Wahl,Anal.Biochem.,138:267-284,1984):
Tm=81.5℃+16.6×log10[Na+]a+0.41×%[G/Cb]–500×Lc]-1–0.61×%甲酰胺
2)DNA-RNA杂交体或RNA-RNA杂交体:
Tm=79.8+18.5(log10[Na+]a)+0.58(%G/Cb)+11.8(%G/Cb)2-820/Lc
3)寡DNA杂交体或寡RNAd杂交体:
对少于20个核苷酸而言:Tm=2(ln)
对20-35个核苷酸而言:Tm=22+1.46(ln)
a或者用于其他一价阳离子,但是仅在0.01-0.4M范围内是精确的。
b仅对于在30%-75%范围内的%GC是精确的。
c L=双链体的碱基对长度。
d Oligo,寡核苷酸;ln,=引物的有效长度=2×(G/C数)+(A/T数)。
可以使用许多已知技术中任意一种技术控制非特异性结合,例如将膜以含有蛋白质的溶液封闭、添加异源RNA、异源DNA和SDS至杂交缓冲液,并且用RNA酶处理。对于非同源性探针,可以通过变换以下条件之一:(i)渐进地降低复性温度(例如从68℃至42℃)或(ii)渐进地降低甲酰胺浓度(例如从50%至0%)进行一系列杂交。技术人员了解可以在杂交期间变更并且将维持或改变所述严格条件的多个参数。
除了杂交条件之外,杂交特异性一般还取决于杂交后洗液的功能。为除去因非特异性杂交引起的背景,样品用稀释的盐溶液洗涤。此类洗液的关键因素包括最终洗涤溶液的离子强度和温度:盐浓度越低且洗涤温度越高,则洗涤的严格性越高。洗涤条件一般在杂交严格性处或低于所述杂交严格性而进行。阳性杂交产生至少两倍于背景信号的信号。通常,用于核酸杂交测定法或基因扩增检测方法的适宜严格条件如上所述。也可以选择严格性更高或更低的条件。技术人员了解可以在洗涤期间变更并且将维持或改变所述严格条件的多个参数。
例如,用于长度大于50个核苷酸的DNA杂交体的典型高严格杂交条件包括在65℃于1×SSC中或在42℃于1×SSC和50%甲酰胺中杂交,随后在65℃于0.3×SSC中洗涤。用于长度大于50个核苷酸的DNA杂交体的中等严格杂交条件的例子包括在50℃于4×SSC或在40℃于6×SSC和50%甲酰胺中杂交,随后在50℃于2×SSC中洗涤。杂交体的长度是杂交核酸的预期长度。当序列已知的核酸杂交时,可以通过比对序列并鉴定本文中所述的保守区而确定杂交体长度。1×SSC是0.15M NaCl和15mM柠檬酸钠;杂交溶液和洗涤溶液可以额外地包括5×Denhardt试剂、0.5-1.0%SDS、100μg/ml变性的片段化鲑精DNA、0.5%焦磷酸钠。
出于定义严格性的水平的目的,可以参考Sambrook等(2001)Molecular Cloning:a laboratory manual,第三版Cold Spring HarborLaboratory Press,CSH,New York或参考Current Protocols in MolecularBiology,John Wiley&Sons,N.Y.(1989和年度更新版)。
剪接变体
如本文中所用的术语“剪接变体”包括其中已经切除、替换、置换或添加所选内含子和/或外显子或其中已经缩短或加长内含子的核酸序列的变体。此类变体将是其中基本上保留蛋白质的生物学活性的一类变体;这可以通过选择性地保留蛋白质的功能性片段实现。此类剪接变体可以在自然界中找到或可以人工制备。用于预测和分离此类剪接变体的方法是本领域熟知的(见例如Foissac和Schiex,BMC Bioinformatics.2005;6:25)。
等位变体
等位基因或等位变体是给定基因位于相同染色体位置处的备选形式。等位变体包含单核苷酸多态性(SNP)和小型插入/缺失多态性(INDEL)。INDEL的大小通常小于100bp。SNP和INDEL形成大部分生物的天然存在多态性株系中的序列变体的最大集合。
基因改组/定向进化
基因改组或定向进化由反复DNA改组,随后适当筛选和/或选择以产生编码具有改良生物学活性的蛋白质的核酸或其部分的变体而组成(Castle等人(2004)Science 304(5674):1151-4;美国专利5,811,238和6,395,547)。
调节元件/调控序列/启动子
术语“调节元件”、“调控序列”和“启动子”均在本文中可相互交换地使用并且在广泛含义上意指能够实现与它们相连接的序列表达的调节性核酸序列。术语“启动子”一般指位于基因转录起点上游并参与识别和结合RNA聚合酶和其他蛋白质,因而指导有效连接的核酸转录的核酸调控序列。前述术语包括从经典真核基因组基因(包括对于精确转录启动所需的TATA盒,具有或没有CCAAT盒序列)衍生的转录调节序列和应答发育性刺激和/或外部刺激或以组织特异性方式而改变基因表达的其它调节元件(即上游激活序列、增强子和沉默子)。本术语还包括经典原核基因的转录调节序列,在此情况下它可以包括一个–35盒序列和/或一个–10盒转录调节序列。术语“调节元件”也包含赋予、激活或增强核酸分子在细胞、组织或器官中表达的人工融合分子或衍生物。
“植物启动子”包含介导植物细胞中编码序列节段表达的调节元件。因此,植物启动子不需要是植物来源的,而可以源自病毒或微生物,例如来自侵袭植物细胞的病毒。“植物启动子”也可以源自植物细胞,例如来自用在本发明方法中待表达并在本文中描述的核酸序列转化的植物。这也适用于其他“植物”调节信号,如“植物”终止子。在本发明方法中有用的核苷酸序列上游的启动子可以通过一个或多个核苷酸替换、插入和/或缺失进行修饰,但不影响启动子、可读框(ORF)或3’调节区如终止子或远离ORF存在的其他3’调节区的功能性或活性。还有可能的是:所述启动子的活性因其序列的修饰或被更活跃的启动子、甚至来自异源生物的启动子彻底替代而提高。为了在植物中表达,如上所述,核酸分子必须有效地连接至或包含在正确的时间点并以所需空间表达模式表达基因的合适启动子。
鉴定功能性等效启动子,候选启动子的启动子强度和/或表达模式可以例如通过将此启动子有效地与报道基因连接并分析该报道基因在植物多种组织中的表达水平和模式进行分析。熟知的合适报道基因包括例如β-葡糖醛酸酶或β-半乳糖苷酶。启动子活性通过测量β-葡糖醛酸酶或β-半乳糖苷酶的酶活性进行分析。启动子强度和/或表达模式随后可以与参考启动子(如在本发明方法中使用的一种启动子)的启动子强度和/或表达模式比较。备选地,启动子强度可以使用本领域已知方法如RNA印迹法及放射自显影图的密度计分析法、定量实时PCR或RT-PCR(Heid等,1996GenomeMethods 6:986-994),通过量化mRNA水平或通过将本发明方法中所用核酸的mRNA水平与持家基因(如18S rRNA)的mRNA水平比较进行分析。通常“弱启动子”意指驱动编码序列在低水平表达的启动子。“低水平”意指在每个细胞约1/10,000转录物至约1/100,000转录物、至约1/500,0000转录物的水平上。相反,“强启动子”驱动编码序列在高水平、或在每个细胞约1/10转录物至约1/100转录物、至约1/1,000转录物上表达。通常,“中等强度启动子”意指以下的启动子,其驱动编码序列在比强启动子更低的水平、尤其在全部情况低于受35S CaMV启动子控制时所获得水平的水平上表达。
有效地连接
如本文中所用的术语“有效地连接”指启动子序列与目的基因之间的功能性连接,从而该启动子序列能够起动该目的基因转录。
组成型启动子
“组成型启动子”指在生长和发育的大部分期间而无需在全部期间和在大多数环境条件下,在至少一种细胞、组织或器官中有转录活性的启动子。下表2a给出组成型启动子的例子。
表2a:组成型启动子的例子
遍在启动子
遍在启动子基本上在生物的全部组织或细胞中有活性。
发育调节型启动子
发育调节型启动子在某些发育阶段期间或在经历发育变化的植物的部分中有活性。
诱导型启动子
诱导型启动子在应答化学刺激(综述见Gatz 1997,Annu.Rev.PlantPhysiol.Plant Mol.Biol.,48:89-108)、环境刺激或物理刺激时具有诱导型或提高的转录启动作用,或可以是“胁迫诱导的”,即当植物暴露于多种胁迫条件时被激活,或是“病原体诱导的”,即当植物暴露于多种病原体时被激活。
器官特异性/组织特异性启动子
器官特异性或组织特异性启动子是能够偏好性地在某些器官或组织如叶、根、种子组织等中启动转录的启动子。例如,“根特异性启动子”是这样的启动子,该启动子优势地在植物根中具有转录活性,基本上在植物的任何其他部分中无活性,尽管在该植物其他这些部分中仍允许任意泄露表达。能够仅在某些细胞中启动转录的启动子在本文中称作“细胞特异性的”。
根特异性启动子的例子在下表2b中列出。
表2b:根特异性启动子的例子
种子特异性启动子是能够优势地在种子组织中有转录活性的启动子,但实际上并非排他性地在种子组织中有转录活性(在泄露表达的情况下)。种子特异性启动子可以在种子发育期间和/或萌发期间有活性。种子特异性启动子可以是胚乳/糊粉/胚特异性的。种子特异性启动子的例子示于下文表2d、2e、2f中。种子特异性启动子的其他例子在Qing Qu和Takaiwa(PlantBiotechnol.J.2,113-125,2004)中给出,所述文献的公开内容如完整所述那样通过引用方式并入本文。
表2c:种子特异性启动子的例子
表2d:胚乳特异性启动子的例子
表2e:胚特异性启动子的例子
表2f:糊粉特异性启动子的例子
如本文中所定义的绿色组织特异性启动子是优势地在绿色组织中具有转录活性的启动子,在植物的任何其它部分内基本上无活性,尽管在该植物其他这些部分中仍允许任意泄露表达。
可以用来实施本发明方法的绿色组织特异性启动子的例子在下表2g中显示。
表2g:绿色组织特异性启动子的例子
基因 表达 参考文献
玉米正磷酸二激酶 叶特异性 Fukavama等,2001
玉米磷酸烯醇式丙酮酸羧化酶 叶特异性 Kausch等,2001
稻磷酸烯醇式丙酮酸羧化酶 叶特异性 Liu等,2003
稻Rubisco小亚基 叶特异性 Nomura等,2000
稻β扩展蛋白EXBP9 苗特异性 WO 2004/070039
木豆(Pigeonpea)Rubisco小亚基 叶特异性 Panguluri等,2005
豌豆RBCS3A 叶特异性
组织特异性启动子的另一个例子是分生组织特异性启动子,其优势地在分生组织中具有转录活性,在植物的任何其它部分内基本上无活性,尽管在该植物其他这些部分中仍允许任意泄露表达。可以用来实施本发明方法的分生组织特异性启动子的例子在下表2h中显示。
表2h:分生组织特异性启动子的例子
终止子
术语“终止子”包括作为转录单元末端处DNA序列的调控序列,所述的DNA序列产生初级转录物的3’加工和多聚腺苷化及转录终止的信号。所述终止子可以从天然基因、从多种其他植物基因或从T-DNA衍生。待添加的终止子可以从例如胭脂碱合酶或章鱼碱合酶基因或备选地从另一种植物基因或较不优选地从任何其他真核基因衍生。
调节
就表达或基因表达而言,术语“调节”意指这样的过程,在所述过程中与对照植物相比较,表达水平因所述基因的表达而改变,优选地,表达水平可以提高或降低。原始、未调节的表达可以是结构性RNA(rRNA、tRNA)或mRNA的任何类型的表达,随后是翻译。术语“调节活性”意指本发明核酸序列或所编码蛋白质的表达的任何改变,这导致植物产量提高和/或生长增加。
表达
术语“表达”或“基因表达”意指某个特定基因或多个特定基因或特定基因构建体的转录。术语“表达”或“基因表达”尤其意指某个基因或诸基因或基因构建体转录成结构性RNA(rRNA、tRNA)或mRNA,而所述RNA随后翻译或不翻译成蛋白质。该过程包括DNA的转录和所得mRNA产物的加工。
增加的表达/过量表达
如本文中所用的术语“增加的表达”或“过量表达”意指相对于原有野生型表达水平为额外的任何形式的表达。
在本领域内充分记载了用于提高基因或基因产物表达的方法并且这些方法包括例如由适宜启动子驱动的过量表达、使用转录增强子或翻译增强子。充当启动子或增强子元件的分离核酸可以导入多核苷酸的非异源形式的适宜位置(一般在上游)中,从而上调编码目的多肽的核酸表达。例如,内源性启动子可以在体内通过突变、缺失和/或替换进行改变(见Kmiec,US 5,565,350;Zarling等,WO9322443),或可以将分离的启动子以相对于本发明基因的恰当方向及距离导入植物细胞,从而控制该基因的表达。
若需要多肽表达,通常希望的是在多核苷酸编码区的3’末端处包括多聚腺苷化区。所述多聚腺苷化区可以从天然基因、从多种其他植物基因或从T-DNA衍生。待添加的3’末端序列可以从例如胭脂碱合酶或章鱼碱合酶基因或备选地从另一种植物基因或较不优选地从任何其他真核基因衍生。
也可以将内含子序列添加至5’非翻译区(UTR)或部分编码序列的编码序列以提高细胞质内聚集的成熟信使的数量。已经证实在植物和动物表达构建体的转录单位中包含可剪接内含子提高了mRNA水平及蛋白质水平上的基因表达至多到1000倍(Buchman和Berg(1988)Mol.Cell biol.8:4395-4405;Callis等(1987)Gens Dev 1:1183-1200)。此类内含子增强基因表达的作用一般在所述内含子置于转录单位的5’末端附近时最强烈。玉米内含子Adh1-S内含子1、2和6、Bronze-1内含子的用途是本领域已知的。对于总体信息,见:《玉米手册》,第116章,编者Freeling和Walbot,Springer,N.Y.(1994)。
内源基因
本文中对“内源的”基因的称谓不仅仅指如植物中以其天然形式(即没有人类任何干预)存在的所讨论基因,还指处于分离形式下的随后(再)导入植物(转基因)的相同基因(或基本上同源的核酸/基因)。例如,含有这种转基因的转基因植物可以出现转基因表达的大幅降低和/或内源基因表达的大幅降低。所述的分离基因可以从生物分离或可以是人造的,例如通过化学合成法人造的。
降低的表达
本文中提及的“降低的表达”或“降低或基本消除表达”意指内源基因表达和/或多肽水平和/或多肽活性相对于对照植物的下降。与对照植物相比较,所述降低或基本上消除以递增优选顺序是至少10%、20%、30%、40%或50%、60%、70%、80%、85%、90%或95%、96%、97%、98%、99%或更多降低。
为了降低或基本消除植物中内源基因的表达,需要核酸序列的基本上连续的核苷酸的足够长度。为了进行基因沉默,这个长度可以是短至20、19、18、17、16、15、14、13、12、11、10个或更少的核苷酸,或者该长度可以长至完整基因(包括部分或完整的5’和/或3’UTR)。基本上连续的核苷酸片段可以从编码目的蛋白的核酸(靶基因)或从能够编码目的蛋白的直向同源物、旁系同源物或同源物的任何核酸衍生。优选地,基本上连续的核苷酸的片段能够与靶基因(有义链或反义链)形成氢键,更优选地,基本上连续的核苷酸片段以增加的优选顺序与靶基因(有义链或反义链)具有50%、60%、70%、80%、85%、90%、95%、96%、97%、98%、99%、100%的序列同一性。编码(功能性)多肽的核酸序列不是用于降低或基本消除内源基因表达的本文中所讨论多种方法的前提。
表达的这种降低或基本消除可以使用常规工具和技术完成。用于降低或基本消除内源基因表达的优选方法是在植物中导入并表达基因构建体,其中将核酸(在此情况下,从目的基因或从能够编码任何一种目的蛋白的直向同源物、旁系同源物或同源物的任何核酸中衍生的一段基本上连续的核苷酸)克隆至所述基因构建体,作为被间隔序列(非编码性DNA)隔开的(部分或完全)反向重复序列。
在这种优选的方法中,使用核酸或其部分(在此情况下,所述部分是从目的基因或从能够编码目的蛋白的直向同源物、旁系同源物或同源物的任何核酸中衍生的一段基本上连续的核苷酸)的反向重复序列(其优选能够形成发夹结构),通过RNA介导的沉默作用降低或基本上消除内源基因的表达。在包含调控序列的表达载体中克隆所述反向重复序列。非编码性DNA核酸序列(间隔序列,例如基质附着区片段(MAR)、内含子、多接头等)位于形成所述反向重复序列的两个反向核酸之间。在反向重复序列转录后,形成具有(部分或完全)自我互补性结构的嵌合RNA。这种双链RNA结构称作发夹RNA(hpRNA)。hpRNA由植物加工成siRNA,该siRNA掺入RNA诱导的沉默复合体(RISC)。该RISC进一步切开所述mRNA转录物,从而大幅降低待翻译成多肽的mRNA转录物的数目。对于其他一般细节,见例如Grierson等人(1998)WO 98/53083;Waterhouse等人(1999)WO99/53050。
本发明方法的实施不依赖在植物中导入并表达所述核酸作为反向重复序列克隆到其中的基因构建体,不过可以使用几种熟知“基因沉默”方法的任何一种或多种方法来实现相同的作用。
用于降低内源基因表达的这样一种方法是RNA介导的基因表达沉默(下调)。在这种情况下,沉默作用由基本上与内源性靶基因相似的双链RNA序列(dsRNA)在植物中触发。这种dsRNA进一步由植物加工成约20个至约26个核苷酸,称作短干扰RNA(siRNA)。siRNA掺入RNA诱导的沉默复合体(RISC)中,其中所述的RISC切割内源性靶基因的mRNA转录物,从而大幅降低待翻译成多肽的mRNA转录物的数目。优选地,所述双链RNA序列对应于靶基因。
RNA沉默方法的另一个例子包括将核酸序列或其部分(在此情况下是从目的基因或从能够编码目的蛋白的直向同源物、旁系同源物或同源物的任何核酸中衍生的一段基本上连续的核苷酸)以有义方向导入植物。“有义方向”指与其mRNA转录物同源的DNA序列。因而,将所述核酸序列的至少一个拷贝导入植物。这种额外的核酸序列会降低内源基因表达,产生称为共抑制作用的现象。当一种核酸序列的几个额外拷贝导入植物时,基因表达的降低将更明显,因为高转录物水平与触发共抑制作用之间存在正相关。
RNA沉默方法的另一个例子包括使用反义核酸序列。“反义”核酸序列包含与编码蛋白质的“有义”核酸序列互补,即与双链cDNA分子的编码链互补,或与mRNA转录物序列互补的核苷酸序列。所述反义核酸序列优选地与待沉默的内源基因互补。此互补性可以位于基因的“编码区”中和/或基因的“非编码区”中。术语“编码区”指包含被翻译成氨基酸残基的密码子的核苷酸序列的区域。术语“非编码区”指被转录但不被翻译成氨基酸的分布在编码区侧翼的5’和3’序列(也称作5’和3’非翻译区)。
反义核酸序列可以根据Watson和Crick碱基对规则设计。反义核酸序列可以与完整核酸序列(在此情况下是从目的基因或从能够编码目的蛋白的直向同源物、旁系同源物或同源物的任何核酸中衍生的一段基本上连续的核苷酸)互补,不过也可以是仅与所述核酸序列的一部分(包括mRNA5’和3’UTR)反义的寡核苷酸。例如,所述反义寡核苷酸序列可以与编码多肽的mRNA转录物的翻译起点周围的区域互补。合适反义寡核苷酸序列的长度是本领域已知的并且可以从长度约50、45、40、35、30、25、20、15或10个核苷酸或更少的核苷酸开始。本发明的反义核酸序列可以使用化学合成和酶连接反应,利用本领域已知的方法构建。例如,反义核酸序列(例如反义寡核苷酸序列)可以使用天然存在的核苷酸或多种修饰的核苷酸化学地合成,其中设计所述的修饰核苷酸旨在提高分子的生物学稳定性或提高反义核酸序列与有义核酸序列之间所形成双链体的物理稳定性,例如,可以使用硫代磷酸酯衍生物和吖啶取代的核苷酸。可以用来产生反义核酸序列的修饰核苷酸的例子是本领域熟知的。已知的核苷酸修饰包括甲基化、环化和“加帽”用类似物(如肌苷)替换一个或多个天然存在的核苷酸。对核苷酸的其他修饰是本领域熟知的。
所述反义核酸序列可以使用表达载体以生物学方式产生,其中将一种核酸序列以反义方向亚克隆(即从所插入核酸转录出的RNA将与目的靶核酸呈反义方向)至所述表达载体。优选地,植物中反义核酸序列的产生借助稳定整合的核酸构建体进行,其中所述的核酸构建体包含启动子、有效连接的反义寡核苷酸和终止子。
本发明方法中用于沉默作用的核酸分子(无论导入植物中或原位(insitu)产生)与mRNA转录物和/或编码多肽的基因组DNA杂交或结合,从而抑制蛋白质的表达,例如通过抑制转录和/或翻译做到这一点。杂交可以通过常规核苷酸互补性以形成稳定双链体引起,或例如与DNA双链体结合的反义核酸序列的情形下,因双螺旋大沟内的特异性相互作用引起。反义核酸序列可以通过转化法或在特定组织部位处的直接注射法导入植物。或者,反义核酸序列可以受到修饰以靶向所选的细胞并且随后全身性施用例如,对于全身性施用,可以修饰反义核酸序列,从而它们与表达在所选细胞表面上的受体或抗原特异性地结合,例如通过将所述反义核酸序列连接至与细胞表面受体或抗原结合的肽或抗体连接而做到这一点。所述反义核酸序列也可以使用本文中所述的载体递送至细胞。
根据又一个方面,反义核酸序列是α-端基异构核酸序列。α端基异构核酸序列与互补RNA形成特定的双链杂交体,在所述双链杂交体中与常见的b-单元相反,所述链彼此平行(Gaultier等(1987)Nucl Ac Res 15:6625-6641)。反义核酸序列也可以包含2'-O-甲基核糖核苷酸(Inoue等(1987)Nucl Ac Res 15,6131-6148)或嵌合RNA-DNA类似物(Inoue等(1987)FEBS Lett.215,327-330)。
内源基因表达的降低或基本上消除也可以使用核酶进行。核酶是具有核糖核酸酶活性的催化性RNA分子,能够切割与其具有互补区域的单链核酸序列,如mRNA。因此,核酶(例如锤头状核酶(在Haselhoff和Gerlach(1988)Nature 334,585-591中描述)可以用来催化性地切割编码多肽的mRNA转录物,因而大幅降低待翻译成多肽的mRNA转录物的数目。可以设计对核酸序列具有特异性的核酶(见例如:Cech等美国专利号4,987,071;和Cech等美国专利号5,116,742)。或者,与核酸序列相对应的mRNA转录物可以用来从RNA分子汇集物中选出具有特异核糖核酸酶活性的催化性RNA(Bartel和Szostak(1993)Science 261,1411-1418)。核酶用于植物中基因沉默的用途是本领域已知的(例如Atkins等(1994)WO94/00012;Lenne等(1995)WO 95/03404;Lutziger等(2000)WO 00/00619;Prinsen等(1997)WO 97/13865和Scott等(1997)WO 97/38116)。
基因沉默也可以通过插入诱变(例如T-DNA插入或转座子插入)或通过如Angell和Baulcombe((1999)Plant J.20(3):357-62)、(Amplicon VIGSWO 98/36083)或Baulcombe(WO 99/15682)及其他人描述的策略实现。
内源基因中存在突变和/或在随后导入植物的分离的基因/核酸中存在突变时,基因沉默也可以发生。所述降低或基本上消除可以由无功能的多肽引起。例如,多肽可以与多种相互作用性蛋白质结合;一种或多种突变和/或截短因而可以产生仍能够结合相互作用性蛋白质(如受体蛋白)但不能表现其正常功能的多肽(如信号配体)。
基因沉默的又一种方法是靶向与基因的调节区(例如启动子和/或增强子)互补的核酸序列以形成可阻止靶细胞中基因转录的三重螺旋结构。见Helene,C.,Anticancer Drug Res.6,569-84,1991;Helene等,Ann.N.Y.Acad.Sci.660,27-361992;和Maher,L.J.Bioassays 14,807-15,1992。
技术人员熟知其他方法,如使用针对内源性多肽的抗体以抑制其在植物中的功能,或干扰其中涉及某多肽的信号传导途径。尤其,可以考虑人造分子可用于抑制靶多肽的生物学功能,或用于干扰其中涉及所述靶多肽的信号传导途径。
或者,可以设立筛选程序以鉴定植物群体中基因的天然变体,其中所述的天然变体编码活性降低的多肽。也可以使用此类天然变体,例如来开展同源重组。
人工和/或天然的微RNA(miRNA)可以用来敲除基因表达和/或mRNA翻译。内源性miRNA是通常长19-24个核苷酸的单链小RNA。它们主要发挥调节基因表达和/或mRNA翻译的功能。大多数的植物微RNA(miRNA)与其靶序列完全互补或接近完全互补。但是,存在具有多达5个错配的天然靶。它们由Dicer家族的双链特异性RNA酶从具有特征性折返结构的较长非编码性RNA加工而来加工后,它们通过与RNA诱导的沉默复合体(RISC)的主要组分-Argonaute蛋白结合被掺入该复合体。miRNA充当RISC的特异性组分,因为它们与胞浆内的靶核酸(大多是mRNA)发生碱基配对。后续调节事件包括靶mRNA切割和摧毁和/或翻译抑制。miRNA过量表达的作用因此往往反映为靶基因的mRNA水平降低。
可以按照遗传工程方式专门设计通常长21个核苷酸的人工微RNA(amiRNA)以负向地调节单个或多个目的基因的基因表达。选择植物的微RNA靶的决定因素是本领域熟知的。已经定义了用于靶识别的经验参数和可以使用它们来辅助特定amiRNA的设计(Schwab等,Dev.Cell 8,517–527,2005)。用于设计并产生amiRNA及其前体的便利工具也是公众可获得的(Schwab等,2006Plant Cell.200618(5):1121-33)。
为了最佳性能,用于降低植物中内源基因表达的基因沉默技术需要使用来自单子叶植物的核酸序列以转化单子叶植物,和使用来自双子叶植物的核酸序列以转化双子叶植物。优选地,来自任何给定植物物种的核酸序列导入相同物种。例如,来自稻的核酸序列转化至稻植物。但是,并非绝对要求待导入的核酸序列源自与该核酸序列待导入的植物相同的植物物种。只要内源性靶基因与待导入的核酸之间存在实质的同源性即可。
上文描述的是用于降低或基本上消除植物中内源基因表达的多种方法的例子。例如,本领域技术人员会轻易地能够调整前述用于沉默的方法以至于通过利用合适启动子,实现降低完整植物中或其部分中内源基因的表达。
选择标记(基因)/报道基因
“选择标记”、“选择标记基因”或“报道基因”包括对细胞赋予表型的任何基因,其中所述"选择标记"、"选择标记基因"或“报道基因”在所述细胞中表达旨在促进鉴定和/或选择用本发明的核酸构建体转染或转化的细胞。这些标记基因能够借助一系列不同原理而鉴定核酸分子的成功转移。合适的标记可以选自赋予抗生素抗性或除草剂抗性、导入新代谢性状或允许目视选择的标记。选择标记基因的例子包括赋予抗生素抗性的基因(如使新霉素和卡那霉素磷酸化的nptII或使潮霉素磷酸化的hpt或赋予针对例如博来霉素、链霉素、四环素、氯霉素、氨苄青霉素、庆大霉素、遗传霉素(Geneticin)(G418)、壮观霉素或杀稻瘟菌素的抗性的基因)、赋予除草剂抗性的基因(例如提供抗性的bar;提供草甘膦抗性的aroA或gox或赋予针对例如咪唑啉酮、膦丝菌素或磺脲类的抗性的基因)或提供代谢性状的基因(如允许植物使用甘露糖作为唯一碳源的manA,或利用木糖的木糖异构酶,或抗营养性标记如2-脱氧葡萄糖抗性)。目视标记基因的表达导致颜色(例如β-葡糖醛酸酶、GUS或β-半乳糖苷酶与其有色底物例如X-Gal)、发光(如萤光素/萤光素酶系统)或荧光(绿色荧光蛋白GFP和其衍生物)的形成。这个名单仅代表少数的可能标记。技术人员熟悉此类标记。取决于生物和选择方法,优选不同的标记。
已知当核酸稳定或瞬时地整合至植物细胞时,仅少数细胞摄取了外来DNA,并且根据需要,将其整合至细胞的基因组中,这取决于所用的表达载体和所用的转染技术。为鉴定并选择这些整合体,编码选择标记的基因(如上文所述的基因)通常连同目的基因一起导入宿主细胞。这些标记可以在这些基因例如通过常规方法缺失而无功能的突变体中使用。此外,编码选择标记的核酸分子可以在包含编码本发明多肽或在本发明方法中所用多肽的序列的相同载体上,或在独立的载体上导入宿主细胞。已经用所导入核酸稳定转染的细胞可以通过选择作用鉴定(例如具有整合的选择标记的细胞存活而其他细胞死亡)。
因为所述标记基因,尤其抗生素抗性基因和除草剂抗性基因一旦已经成功地导入,则在转基因宿主细胞中是不再需要或不想要的,故而,用于导入核酸的本发明方法有利地使用能够去掉或切除这些标记基因的技术。一种这样的方法称作共转化法。共转化法同时使用两种载体用于转化,一种载体携带本发明的核酸而第二种载体携带标记基因。大比例的转化体接受或在植物情况下包含(多达40%或更多的转化体)这两种载体。在用农杆菌(Agrobacterium)转化的情况下,转化体通常仅接受载体的一部分,即侧翼存在T-DNA的序列,该序列通常代表表达盒。标记基因随后可以通过开展杂交从转化的植物中除去。在另一种方法中,整合至转座子的标记基因用来与目的核酸一起进行转化(称作Ac/Ds技术)。转化体可以与转座酶来源物杂交,或该转化体用导致转座酶表达的核酸构建体瞬时或稳定地转化。在一些情况下(大约10%),一旦转化已经成功发生,则转座子从宿主细胞的基因组中跳出并丢失。在其他许多情况下,转座子跳到不同位置。在这些情况下,必须通过开展杂交消除标记基因。在微生物学中,开发了有可能或促进检测这类事件的技术。又一个有利的方法依赖于所谓重组系统;此方法的优势在于可以用所述的重组系统实行杂交消除作用。最知名的该类型系统称作Cre/lox系统。Cre1是除去位于loxP序列之间序列的重组酶。若所述标记基因整合在loxP序列之间,则一旦转化已经成功发生,它因重组酶表达而被除去。其他重组系统是HIN/HIX、FLP/FRT和REP/STB系统(Tribble等,J.Biol.Chem.,275,2000:22255-22267;Velmurugan等,J.Cell Biol.,149,2000:553-566)。有可能将本发明核酸序列以位点特异性方式整合至植物基因组。这些方法自然也可以应用于微生物如酵母、真菌或细菌。
转基因的/转基因/重组
为本发明的目的,“转基因的”、“转基因”或“重组”例如就核酸序列而言,意指包含所述核酸序列的表达盒、基因构建体或载体,或用本发明核酸序列、表达盒或载体转化的生物,这些构建体均通过重组方法产生,其中
(a)编码在本发明方法中有用的蛋白质的核酸序列,或
(b)与本发明核酸序列有效连接的基因调控序列,例如启动子,或
(c)a)和b)
不位于其天然遗传环境中或已经通过重组方法被修饰,所述的修饰有可能采取例如替换、添加、倒位或插入一个或多个核苷酸残基的形式。天然遗传环境理解为意指原初植物中的天然基因组位点或染色体位点或存在于基因组文库中。在基因组文库的情况下,核酸序列的天然遗传环境优选地保留,至少部分保留。该环境分布在所述核酸序列的至少一侧并且具有至少50bp,优选至少500bp,特别优选至少1000bp,最优选至少5000bp序列长度。当天然存在的表达盒受非天然的合成(“人工”)方法(如诱变处理)被修饰时,天然存在的表达盒–例如所述核酸序列的天然启动子与编码在本发明方法中有用的多肽的相应核酸序列的天然存在组合,如上文所定义–变成转基因表达盒。合适方法例如在US 5,565,350或WO 00/15815中描述。
为本发明目的,如上所述,将转基因植物因此理解为意指在本发明方法中有用的核酸不处于所述植物基因组中所述核酸的天然基因座处,所述核酸有可能同源或异源地表达。但是,如所提及,转基因的还意指尽管本发明的或在本发明方法中有用的核酸处于植物基因组中所述核酸的天然位置处,然而其序列相对于天然序列而言已经被修饰,和/或所述天然序列的调节序列已经被修饰。转基因的优选地理解为意指本发明核酸在基因组的非天然基因座处表达,即,所述核酸的同源表达或优选异源表达发生。优选的转基因植物在本文中提及。
转化
如本文中提及的术语“导入”或“转化”包括外源性多核苷酸转移至宿主细胞,无论转化所用的方法是什么方法。能够后续克隆性增殖(无论通过器官发生或胚发生)的植物组织可以用本发明的基因构建体转化并且完整植物可以从中再生。所选的具体组织根据可用于并且最适于正在进行转化的具体物种的克隆性增殖系统变化。示例性靶组织包括叶盘、花粉、胚、子叶、下胚轴、大配子体、愈伤组织、现存分生组织(例如顶端分生组织、腋芽和根分生组织)和诱导性分生组织(例如子叶分生组织和下胚轴分生组织)。多核苷酸可以瞬时或稳定地导入宿主细胞并且可以非整合地维持,例如作为质粒。备选地,它可以整合至宿主基因组。所得的转化植物细胞随后可以用来按照本领域技术人员已知的方式再生出转化植物。
外来基因转移至植物基因组的过程称作转化。转化植物物种现在是极为常规的技术。有利地,几种转化方法中的任何方法可以用来将目的基因导入合适的祖先细胞。描述用于转化并从植物组织或植物细胞再生出植物的方法可以用于瞬时转化或稳定转化。转化方法包括使用脂质体、电穿孔法、提高游离DNA摄入的化学品、DNA直接注射至植物、粒子枪轰击法、使用病毒或花粉的转化法和显微投射法(microprojection)。转化方法可以选自用于原生质体的钙/聚乙二醇法(Krens,F.A.等,(1982)Nature 296,72-74;Negrutiu I等(1987)Plant Mol Biol 8:363-373);原生质体的电穿孔法(Shillito R.D.等(1985)Bio/Technol 3,1099-1102);对植物材料的微量注射法(Crossway A等,(1986)Mol.Gen Genet 202:179-185);DNA或RNA包被的粒子轰击法(Klein TM等,(1987)Nature 327:70)、(非整合性)病毒感染法等。包括转基因作物植物在内的转基因植物优选通过农杆菌介导的转化法产生。有利的转化方法是植物内(in planta)转化法。为此目的,例如有可能将农杆菌作用于植物种子或有可能用农杆菌接种植物分生组织。根据本发明,已经证明特别有利的是将转化的农杆菌悬液作用于完整植物或至少作用于花原基。随后继续培育该植物直至获得已处理植物的种子(Clough和Bent,Plant J.(1998)16,735–743)。用于农杆菌介导稻转化的方法包括用于稻转化的众知方法,如在以下任意文献中描述的那些方法:欧洲专利申请EP 1198985A1,Aldemita和Hodges(Planta 199:612-617,1996);Chan等(Plant Mol Biol 22(3):491-506,1993),Hiei等(Plant J 6(2):271-282,1994),其公开内容如充分所述那样通过引用的方式并入本文。在玉米转化的情况下,优选的方法如Ishida等(Nat.Biotechnol14(6):745-50,1996)或Frame等(Plant Physiol 129(1):13-22,2002)描述,其公开内容如充分所述那样通过引用的方式并入本文。所述方法还例如由B.Jenes等,Techniques for Gene Transfer,在:Transgenic Plants,第1卷,Engineering and Utilization,编者S.D.Kung和R.Wu,AcademicPress(1993)128-143及在Potrykus Annu.Rev.Plant Physiol.Plant Molec.Biol.42(1991)205-225)描述。待表达的核酸或构建体优选地克隆至适于转化根癌农杆菌(Agrobacterium tumefaciens)的载体,例如pBin19(Bevan等,Nucl.Acids Res.12(1984)8711)。通过这种载体转化的农杆菌随后可以按照已知方式用于转化植物,例如作为模型使用的植物如拟南芥属植物(拟南芥在本发明范围不视为作物植物),或作物植物,例如烟草植物,所述方式例如是通过将擦伤的叶或切碎的叶浸泡在农杆菌溶液中并随后将它们在合适培养基中培育。借助根癌农杆菌转化植物例如由和Willmitzer在Nucl.Acid Res.(1988)16,9877中描述或尤其从F.F.White,Vectors forGene Transfer in Higher Plants;在Transgenic Plants,第1卷,Engineeringand Utilization,编者S.D.Kung和R.Wu,Academic Press,1993,第15-38页中获知。
除了转化随后必需再生成完整植物的体细胞之外,还可转化植物分生组织的细胞,并且尤其是发育成配子的那些细胞。在这种情况下,转化的配子遵循天然植物发育过程,从而产生转基因植物。因此,例如用农杆菌处理拟南芥属植物的种子并且从正在发育的植物中获得种子,其中一定比例的所述植物被转化并且因此是转基因的[Feldman,KA和MarksMD(1987)Mol Gen Genet 208:274-289;Feldmann K(1992),在:编者CKoncz,N-H Chua和J Shell,Methods in Arabidopsis Research.WordScientific,Singapore,第274-289页]。备选方法基于反复除去花序并将莲座丛中心内的切除部位与转化的农杆菌温育,因而同样可以在较晚的时间点上获得转化的种子(Chang(1994)Plant J.5:551-558;Katavic(1994)MolGen Genet,245:363-370)。但是,特别有效的方法是改良真空渗入法,如“花器浸蘸”法。在拟南芥属植物真空渗入法的情况下,在减压下用农杆菌悬液处理完整植物[Bechthold,N(1993)。C R Acad Sci Paris Life Sci,316:1194-1199],而在”花器浸蘸法”的情况下,将正在发育的花组织与经表面活性剂处理的农杆菌悬液短暂温育[Clough,SJ和Bent,AF(1998)ThePlant J.16,735-743]。在这两种情况下均收获某个比例的转基因种子,并且这些种子可以通过在如上所述的选择条件下培育与非转基因种子区分。此外,质体的稳定转化是有利的,因为质体在大部分作物中母系地遗传,这降低或消除了经过花粉的转基因流动风险。叶绿体基因组的转化一般通过在Klaus等,2004[Nature Biotechnology 22(2),225-229]中已示意性展示的方法实现。简而言之,将待转化的序列连同选择标记基因一起克隆至同源于叶绿体基因组的侧翼序列之间。这些同源侧翼序列指导进入原质体的位点特异性整合。已经对许多不同植物物种描述了质体转化并且Bock(2001)基础研究和植物生物技术中的转基因质体(Transgenic plastidsin basic research and plant biotechnology).J Mol Biol.2001年9月21日;312(3):425-38或Maliga,P(2003)质体转化技术商业化进展(Progresstowards commercialization of plastid transformation technology),TrendsBiotechnol.21,20-28进行了综述。其他生物技术进展最近已经以无标记质体转化体的形式进行报道,其中所述的无标记质体转化体可以通过瞬时共整合性标记基因产生(Klaus等,2004,Nature Biotechnology 22(2),225-229)。
T-DNA活化标签技术(T-DNA activation tagging)
T-DNA活化标签技术(Hayashi等Science(1992)1350-1353)涉及以启动子指导靶向的基因表达的方式在目的基因的基因组区域内或基因的编码区上游或下游10kb处插入通常含有启动子(也可以是翻译增强子或内含子)的T-DNA。一般,靶向基因的天然启动子对该靶向基因表达的调节被破坏,并且所述基因处于新导入的启动子控制下。该启动子一般嵌入T-DNA中。这种T-DNA随机地插入植物基因组,例如借助农杆菌感染,并且导致在插入的T-DNA附近的基因表达受到调节。所得的转基因植物因在导入的启动子附近的基因表达受到调节而显示显性表型。
TILLING
术语“TILLING”是“基因组中定向诱导的局部损伤法”的缩写并且指用于产生和/或鉴定核酸的诱变技术,其中所述的核酸编码具有改良表达和/或活性的蛋白质。TILLING还允许选择携带此类突变变体的植物。这些突变变体可以表现在强度或在位置或在时间方面改良的表达(例如若所述突变影响启动子)。这些突变变体可以显示比其天然形式基因所表现活性更高的活性。TILLING将高密度诱变与高通量筛选方法组合。在TILLING中一般遵循的步骤是:(a)EMS诱变(Redei GP和Koncz C(1992)在Methodsin Arabidopsis Research,Koncz C,Chua NH,Schell J,Singapore编辑,World Scientific Publishing Co,第16–82页;Feldmann等,(1994)在Meyerowitz EM,Somerville CR编辑,Arabidopsis.Cold Spring HarborLaboratory Press,Cold Spring Harbor,NY,第137-172页;Lightner J和Caspar T(1998)在J Martinez-Zapater,J Salinas编者,Methods onMolecular Biology第82卷.Humana Press,Totowa,NJ,第91-104页);(b)个体的DNA制备和汇集;(c)目的区域的PCR扩增;(d)变性和复性以使得异双链体形成;(e)DHPLC,其中异双链体在汇集物中的存在作为色谱图中一个额外的峰被检测到;(f)鉴定突变个体;和(g)对突变PCR产物的测序。用于TILLING的方法是本领域熟知的(McCallum等,(2000)NatBiotechnol 18:455-457;综述见Stemple(2004)Nat Rev Genet 5(2):145-50)。
同源重组
同源重组允许在基因组中定义的所选位置处导入选择的核酸。同源重组是在生物科学中例行用于低等生物如酵母或小立碗藓属(Physcomitrella)苔藓的标准技术。已经对模式植物(Offringa等(1990)EMBO J 9(10):3077-84)和作物植物例如稻(Terada等(2002)Nat Biotech 20(10):1030-4;Iida和Terada(2004)Curr Opin Biotech 15(2):132-8)描述了用于植物中开展同源重组的方法,并且存在与靶生物无关而通常适用的方法(Miller等,Nature Biotechnol.25,778-785,2007)。
产量
术语“产量”通常意指经济价值的可测量结果,一般与特定作物、与面积并与时间段有关。单个植物部分基于它们的数目、大小和/或重量而直接有助于对产量,或实际产量是对于某种作物和一年的每平方米产量,这通过总产量(包括收获的和评估的产量)除以种植的平方米数而确定。术语植物的“产量”可以涉及该植物的营养生物量(根和/或苗生物量)、涉及繁殖器官和/或涉及繁殖体(如种子)。
早期生长势
“早期生长势”指活跃、健康、充分平衡的生长,尤其是植物生长早期期间,并且可以因植物适应性提高引起,其中所述的植物适应性提高原因在于例如该植物更好地适应环境(即优化能量来源的用途和苗与根之间的分配)。具有早期生长势的植物也显示籽苗存活提高和作物建立更佳,这往往产生高度均一的田块(作物以均一方式生长,即大多数植物在基本上相同的时间达到各个发育期)和往往形成更好及更高的产量。因而,早期生长势可以通过测量多种因子如千粒核重(Thousand Kernel Weight)、萌发百分数、出苗百分数、籽苗生长、籽苗高度、根长度、根和苗生物量和许多其他因素等确定。
提高/改善/增强
术语“提高”、“改善”或“增强”是相互可交换的并且在应用含义上应当意指与如本文中定义的对照植物相比较,至少3%、4%、5%、6%、7%、8%、9%或10%、优选至少15%或20%、更优选地25%、30%、35%或40%更多的产量和/或生长。
种子产量
提高的种子产量自身可以表现为以下一个或多个指标:a)种子生物量(种子总重量)增加,这可以基于单粒种子基础和/或每株植物和/或每平方米;b)提高的每株植物花数目;c)提高的(充实)种子数;d)提高的种子充实率(其表述为充实种子数与种子总数之间的比率);e)提高的收获指数,其表述为可收获部分(如种子)产量与总生物量的比率;和f)提高的千粒核重(TKW),这从计数的充实种子数及其总重量中外推出来。提高的TKW可以因增加的种子大小和/或种子重量引起,并且也可以因胚和/或胚乳大小的增加引起。
种子产量的提高也可以表现为种子大小和/或种子体积的增长。此外,种子产量的提高自身也可以表现为种子面积和/或种子长度和/或种子宽度和/或种子周长的提高。提高的产量也可以产生改良的构造,或可以因改良的构造而出现。
绿度指数
从植物的数字图像计算如本文中所用的“绿度指数”。对属于图像上植物目标的每个像素计算绿色值与红色值的比率(在编码颜色的RGB模式中)。绿度指数表述为绿色/红色比超过给定阈值的像素百分数。在正常生长条件下,在盐胁迫生长条件下和在营养可用性降低的生长条件下,在开花前的最后成像中测量植物的绿度指数。相反,在干旱胁迫生长条件下,在干旱后的首次成像中测量植物的绿度指数。
植物
本文中所用的术语“植物”包括完整植物、植物的祖先及子代和包括种子、苗、茎、叶、根(包括块茎)、花和组织、器官在内的植物部分,其中每种前述对象包含目的基因/核酸。术语“植物”也包括植物细胞、悬浮培养物、愈伤组织、胚、分生组织区、配子体、孢子体、花粉和小孢子,同样每种前述对象包含目的基因/核酸。
在本发明方法中特别有用的植物包括属于植物界(Viridiplantae)超家族、尤其单子叶和双子叶植物的全部植物,包括饲用或饲料豆科植物、观赏植物、粮食作物、树或灌木,其中所述植物选自包含以下物种的名单:槭树属物种(Acer spp.)、猕猴桃属物种(Actinidia spp.)、秋葵属物种(Abelmoschus spp.)、剑麻(Agave sisalana)、冰草属物种(Agropyron spp.)、匍匐剪股颖(Agrostis stolonifera)、葱属物种(Allium spp.)、苋属物种(Amaranthus spp.)、欧洲海滨草(Ammophila arenaria)、凤梨(Ananascomosus)、番荔枝属物种(Annona spp.)、旱芹(Apium graveolens)、蜘蛛兰属物种(Arachis spp.)、木波罗属物种(Artocarpus spp.)、石刁柏(Asparagusofficinalis)、燕麦属物种(Avena spp.)(例如燕麦(Avena sativa)、野燕麦(Avenafatua)、比赞燕麦(Avena byzantina)、野燕麦原变种(Avena fatua var.sativa)、杂种燕麦(Avena hybrida)、阳桃(Averrhoa carambola)、箣竹属(Bambusasp.)、冬瓜(Benincasa hispida)、巴西栗(Bertholletia excelsea)、甜菜(Betavulgaris)、芸苔属物种(Brassica spp.)(例如欧洲油菜(Brassica napus)、芜青物种(Brassica rapa ssp.)[卡诺拉油菜、油菜(oilseed rape)、蔓青(turniprape)])、Cadaba farinosa、茶(Camellia sinensis)、美人蕉(Canna indica)、大麻(Cannabis sativa)、辣椒属物种(Capsicum spp.)、Carex elata、番木瓜(Carica papaya)、大果假虎刺(Carissa macrocarpa)、山核桃属物种(Caryaspp.)、红花(Carthamus tinctorius)、栗属物种(Castanea spp.)、美洲木棉(Ceiba pentandra)、苦苣(Cichorium endivia)、樟属物种(Cinnamomum spp.)、西瓜(Citrullus lanatus)、柑桔属物种(Citrus spp.)、椰子属物种(Cocos spp.)、咖啡属物种(Coffea spp.)、芋头(Colocasia esculenta)、非洲梧桐属物种(Colaspp.)、黄麻属(Corchorus sp.)、芫荽(Coriandrum sativum)、榛属物种(Corylusspp.)、山楂属物种(Crataegus spp.)、番红花(Crocus sativus)、南瓜属物种(Cucurbita spp.)、香瓜属物种(Cucumis spp.)、菜蓟属物种(Cynara spp.)、胡萝卜、山马蝗属物种(Desmodium spp.)、龙眼(Dimocarpus longan)、薯蓣属物种(Dioscorea spp.)、柿树属物种(Diospyros spp.)、稗属物种(Echinochloa spp.)、油棕属(Elaeis)(例如油棕(Elaeis guineensis)、美洲油棕(Elaeis oleifera))、穇子(Eleusine coracana)、埃塞俄比亚画眉草(Eragrostistef)、蔗茅属物种(Erianthus sp.)、枇杷(Eriobotrya japonica)、桉属物种(Eucalyptus sp.)、红仔果(Eugenia uniflora)、荞麦属物种(Fagopyrum spp.)、水青冈属物种(Fagus spp.)、苇状羊茅(Festuca arundinacea)、无花果(Ficuscarica)、金桔属物种(Fortunella spp.)、草莓属物种(Fragaria spp.)、银杏(Ginkgo biloba)、大豆属(Glycine spp.)(例如大豆(Glycine max)、大豆(Sojahispida)或大豆(Soja max))、陆地棉(Gossypium hirstum)、向日葵属(Helianthus spp.)(例如向日葵(Helianthus annuus))、长管萱草(Hemerocallisfulva)、木槿属物种(Hibiscus spp.)、大麦属(Hordeum spp.)(例如大麦(Hordeum vulgare))、甘薯(Ipomoea batatas)、核桃属物种(Juglans spp.)、莴苣(Lactuca sativa)、山黧豆属物种(Lathyrus spp.)、兵豆(Lens culinaris)、亚麻(Linum usitatissimum)、荔枝(Litchi chinensis)、百脉根属物种(Lotusspp.)、棱角丝瓜(Luffa acutangula)、羽扇豆属物种(Lupinus spp.)、Luzulasylvatica、番茄属物种(Lycopersicon spp.)(例如番茄(Lycopersiconesculentum)、番茄(Lycopersicon lycopersicum)、番茄(Lycopersiconpyriforme))、硬皮豆属物种(Macrotyloma spp.)、苹果属物种(Malus spp.)、凹缘金虎尾(Malpighia emarginata)、牛油果(Mammea americana)、芒果(Mangifera indica)、木薯属物种(Manihot spp.)、人心果(Manilkara zapota)、苜蓿(Medicago sativa)、草木樨属物种(Melilotus spp.)、薄荷属物种(Menthaspp.)、芒(Miscanthus sinensis)、苦瓜属物种(Momordica spp.)、黑桑(Morusnigra)、芭蕉属物种(Musa spp.)、烟草属物种(Nicotiana spp.)、木犀榄属物种(Olea spp.)、仙人掌属物种(Opuntia spp.)、鸟足豆属物种(Ornithopusspp.)、稻属物种(Oryza spp.)(例如稻、阔叶稻(Oryza latifolia))、稷(Panicummiliaceum)、柳枝稷(Panicum virgatum)、鸡蛋果(Passiflora edulis)、欧防风(Pastinaca sativa)、狼尾草属物种(Pennisetum sp.)、鳄梨属物种(Perseaspp.)、欧芹(Petroselinum crispum)、虉草(Phalaris arundinacea)、菜豆属物种(Phaseolus spp.)、猫尾草(Phleum pratense)、刺葵属物种(Phoenix spp.)、南方芦苇(Phragmites australis)、酸浆属物种(Physalis spp.)、松属物种(Pinusspp.)、阿月浑子(Pistacia vera)、豌豆属物种(Pisum spp.)、早熟禾属物种(Poaspp.)、杨属物种(Populus spp.)、牧豆草属物种(Prosopis spp.)、李属物种(Prunus spp.)、番石榴属物种(Psidium spp.)、石榴(Punica granatum)、西洋梨(Pyrus communis)、栎属物种(Quercus spp.)、萝卜(Raphanus sativus)、波叶大黄(Rheum rhabarbarum)、茶藨子属物种(Ribes spp.)、蓖麻(Ricinuscommunis)、悬钩子属物种(Rubus spp.)、甘蔗属物种(Saccharum spp.)、柳属物种(Salix sp.)、接骨木属物种(Sambucus spp.)、黑麦(Secale cereale)、胡麻属物种(Sesamum spp.)、白芥属物种(Sinapis sp.)、茄属(Solanumspp.)(例如马铃薯(Solanum tuberosum)、红茄(Solanum integrifolium)或番茄)、两色蜀黍(Sorghum bicolor)、菠菜属物种(Spinacia spp.)、蒲桃属物种(Syzygium spp.)、万寿菊属物种(Tagetes spp.)、酸豆(Tamarindus indica)、可可树(Theobroma cacao)、车轴草属物种(Trifolium spp.)、鸭茅状摩擦禾(Tripsacum dactyloides)、Triticosecale rimpaui、小麦属(Triticum spp.)(例如普通小麦(Triticum aestivum)、硬粒小麦(Triticum durum)、圆柱小麦(Triticum turgidum)、Triticum hybernum、马卡小麦(Triticum macha)、普通小麦(Triticum sativum)或普通小麦(Triticum vulgare))、小金莲花(Tropaeolum minus)、金莲花(Tropaeolum majus)、越桔属物种(Vacciniumspp.)、野碗豆属物种(Vicia spp.)、豇豆属物种(Vigna spp.)、香堇(Violaodorata)、葡萄属物种(Vitis spp.)、玉米(Zea mays)、Zizania palustris、枣属物种(Ziziphus spp.)及其他。
发明详述
I.包含LOB结构域的蛋白质(LOB:侧生器官边界)
出人意料地,现在已经发现:调节植物中编码LBD多肽的核酸表达产生了相对于对照植物具有增强的产量相关性状的植物。根据第一实施方案,本发明提供了用于相对于对照植物增强植物中产量相关性状的方法,包括调节植物中编码LBD多肽的核酸表达。
用于调节(优选提高)编码LBD多肽的核酸表达的优选方法是在植物中导入并表达编码LBD多肽的核酸。
下文对“在本发明方法中有用的蛋白质”的任意称谓意指如本文中定义的LBD多肽。下文对“在本发明方法中有用的核酸”的任意称谓意指能够编码这种LBD多肽的核酸。待导入植物(并且因而在实施本发明方法中有用)的核酸是编码现在将描述的蛋白质类型的任意核酸,下文也称作“LBD核酸”或“LBD基因”。
如本文中定义的“LBD多肽”指包含DUF260结构域(Pfam登录号PF03195,Interpro登录号IPR004883,见图1)的任意多肽。优选地,该LBD多肽序列在构建进化系统树如图3中所绘制(或如Yang等人2006年使用HKY方法(Hasegawa等人,J.Mol.Evol.22,160-174,1985)定义)的一个进化系统树中使用时,与包含SEQ ID NO:2所代表氨基酸序列的II类LOB结构域多肽组而不与任何其他组聚类。
进一步优选地,LBD蛋白包含以下保守基序的至少之一:
基序1:MSCNGCRXLRKGCX(SEQ ID NO:5),其中在位置8的X可以是任意氨基酸,但优选地是V或I并且其中在位置14的X可以是任意氨基酸,但优选地是S、G或N中之一。
基序2:QXXATXFXAKFXGR(SEQ ID NO:6),其中在位置2的X可以是任意氨基酸,但优选地是A、S或G之一;其中在位置3的X可以是任意氨基酸,但优选地是N、Q或H之一,其中在位置6的X可以是任意氨基酸,但优选地是V、L或I之一;其中在位置8的X可以是任意氨基酸,但优选地是L、V、A或I之一;并且其中在位置12的X可以是任意氨基酸,但优选地是Y或F之一。
基序3:FXSLLXEAXG(SEQ ID NO:7);其中在位置2的X可以是任意氨基酸,但优选地是R、S、K或Q之一,其中在位置6的X可以是任意氨基酸,但优选地是Y、H或F之一;并且其中在位置9的X可以是任意氨基酸,但优选地是C或A之一。
还优选地,LBD蛋白包含多于7个、更优选至少9个Cys残基,且不包含DP(V/I)YG标签(SEQ ID NO:8)。
DUF260结构域的特征是存在C-x(2)-C-x(6)-C-x(3)-C基序(SEQ IDNO:9),其中X可以是任意氨基酸。
术语“结构域”和“基序”在本文中的“定义”部分定义。存在用于鉴定结构域的专业数据库,例如,SMART(Schultz等人(1998)Proc.Natl.Acad.Sci.USA 95,5857-5864;Letunic等人(2002)Nucleic Acids Res 30,242-244)、InterPro(Mulder等,(2003)Nucl.Acids.Res.31,315-318)、Prosite(Bucher和Bairoch(1994),用于生物分子序列基序的概括特征结构及其在自动化序列解读中的功能(A generalized profile syntax forbiomolecular sequences motifs and its function in automatic sequenceinterpretation).(在)ISMB-94;第二届分子生物学智能系统国际会议文集.Altman R.,Brutlag D.,Karp P.,Lathrop R.,Searls D.编辑,第53-61页,AAAIPress,Menlo Park;Hulo等,Nucl.Acids.Res.32:D134-D137,(2004)或Pfam(Bateman等,Nucleic Acids Research 30(1):276-280(2002))。一组用于计算机方式分析蛋白质序列的工具可在ExPASY蛋白质组服务器上获得(瑞士生物信息研究所维护(Gasteiger等,ExPASy:用于深入认识和分析蛋白质的蛋白质组服务器(The proteomics server for in-depth proteinknowledge and analysis),Nucleic Acids Res.31:3784-3788(2003))。结构域也可以使用常规技术如通过序列比对进行鉴定。
用于比对序列以进行比较的方法是本领域熟知的,此类方法包括GAP、BESTFIT、BLAST、FASTA和TFASTA。GAP使用Needleman和Wunsch算法((1970)J Mol Biol 48:443-453)以找到使匹配数最大化并使空位数最小化的两个序列的总体(即覆盖完整序列的)比对结果。BLAST算法(Altschul等人(1990)J Mol Biol 215:403-10)计算序列同一性百分数并在两个序列之间开展相似性的统计分析。用于开展BLAST分析的软件是通过国家生物技术信息中心(NCBI)可公开获得的。同源物可以使用例如ClustalW多重序列比对算法(1.83版本),以默认配对比对参数和百分数评分方法轻易地鉴定。相似性和同一性的总体百分数也可以使用MatGAT软件包中的可用方法之一确定(Campanella等,BMC Bioinformatics.2003年7月10日;4:29.MatGAT:使用蛋白质序列或DNA序列产生相似性/同一性矩阵的一种应用(an application that generates similarity/identitymatrices using protein or DNA sequences))。如本领域技术人员显而易见,可以进行少许手工编辑以优化保守基序之间的比对。此外,作为使用全长序列以鉴定同源物的替代,也可以使用特定结构域。利用上文提及的程序,使用默认参数可以在完整核酸或氨基酸序列范围或保守基序范围内确定序列同一性值。
另外,LBD多肽(至少以它们的天然形式)作为转录因子一般具有DNA结合活性。用于测量DNA结合活性的工具和技术是本领域熟知的并且包括例如凝胶阻滞测定法。用于表征转录因子活性的实验方法可以例如在Sambrook等人(2001)Molecular Cloning:A Laboratory manual,第三版Cold Spring Harbor Laboratory Press,CSH,New York或在Ausubel等人(年度更新版),Current Protocols in Molecular Biology,Current Protocols第1和2卷中找到。
本发明通过用SEQ ID NO:1所代表的核酸序列转化植物进行说明,其中所述的核酸序列编码SEQ ID NO:2的多肽序列。但是,本发明的实施不限于这些序列;本发明的方法可以有利地使用编码LBD的任意核酸或如本文中定义的LBD多肽实施。
编码LBD多肽的核酸的例子在本文实施例1的表A1中给出。此类核酸用于实施本发明的方法中。在实施例1的表A1中给出的氨基酸序列是由SEQ ID NO:2所代表的LBD多肽的直向同源物和旁系同源物的示例序列,术语“直向同源物”和“旁系同源物”如本文中定义。其他直向同源物和旁系同源物可以通过开展所谓交互性blast搜索轻易地鉴定。通常,这包括第一BLAST,其中所述的第一BLAST包括将查询序列(例如使用实施例1的表A1中列出的任意序列)针对任意序列数据库,如可公开获得的NCBI数据库进行BLAST。当从核苷酸序列开始时,一般使用BLASTN或TBLASTX(使用标准默认值),并且当从蛋白质序列开始时,使用BLASTP或TBLASTN(使用标准默认值)。可以任选地筛选BLAST结果。筛选结果或非筛选结果的全长序列随后针对来自生物的序列进行反向BLAST搜索(第二BLAST),其中查询序列从所述的生物中衍生(在查询序列是SEQ ID NO:1或SEQ ID NO:2的情况下,第二BLAST因而将针对拟南芥序列进行)。随后比较第一BLAST和第二BLAST的结果。若来自第一blast的高阶位命中是源自与衍生查询序列的物种相同的物种,则鉴定到旁系同源物,随后一个反向BLAST理想地在最高命中当中产生该查询序列;若在第一BLAST中的高阶位命中不是源自与衍生查询序列的物种相同的物种,则鉴定到直向同源物,并且在反向BLAST时,优选地产生属于最高命中当中的该查询序列。
高阶位命中是具有低E-值的那些命中。E-值越低,评分越显著(或换句话说,偶然发现该命中的几率越低)。E-值的计算是本领域熟知的。除了E-值外,比较过程也通过同一性百分数评分。同一性百分数指两个所比较的核酸(或多肽)序列之间特定长度范围内相同的核苷酸(或氨基酸)的数目。在大型家族的情况下,可以使用ClustalW,随后使用邻接树法,以帮助观察相关基因的聚集和鉴定直向同源物和旁系同源物。
核酸变体也可以用于实施本发明的方法中。此类变体的例子包括编码在实施例1的表A1中所给出的任一氨基酸序列的同源物和衍生物的核酸,术语“同源物”和“衍生物”如本文中定义。还用于本发明方法中的是这样的核酸,其编码在实施例1的表A1中所给出的任一氨基酸序列的直向同源物或旁系同源物的同源物和衍生物。用于本发明方法中的同源物和衍生物与衍生它们的未修饰蛋白质具有基本上相同的生物学活性和功能活性。
在实施本发明方法中有用的其他核酸变体包括编码LBD多肽的核酸的部分、与编码LBD多肽的核酸杂交的核酸、编码LBD多肽的核酸的剪接变体、编码LBD多肽的核酸的等位变体和通过基因改组获得的编码LBD多肽的核酸的变体。术语“杂交序列”、“剪接变体”、“等位变体”和“基因改组作用”如本文中所述。
有利地,本发明提供了至今未知的LBD核酸和多肽序列。
根据本发明的又一个实施方案,提供了分离的核酸分子,其包含:
(i)由SEQ ID NO:69代表的核酸;
(ii)与(i)中给出的任一个SEQ ID NO互补的核酸或其片段;
(iii)编码LBD多肽的核酸,所述LBD多肽以增加的优选顺序与SEQID NO:70具有至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的序列同一性;
(iv)能够在严格条件下与以上(i)、(ii)或(iii)中给出的任一种核酸杂交的核酸。
根据本发明的又一个实施方案,因而提供了分离的多肽,其包含:
(i)以增加的优选顺序与SEQ ID NO:70中给出的氨基酸序列具有至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列;
(ii)(i)中给出的任意氨基酸序列的衍生物。
编码LBD多肽的核酸不需要是全长核酸,因为本发明方法的实施不取决于全长核酸序列的使用。根据本发明,提供了用于增强植物中产量相关性状的方法,包括在植物中导入并表达实施例1的表A1中给出的任一核酸序列的一部分或编码实施例1表A1中所给出的任意氨基酸序列的直向同源物、旁系同源物或同源物的核酸的一部分。
核酸的一部分可以例如通过对所述核酸产生一个或多个缺失而制备。所述部分可以以分离的形式使用或它们可以与其他编码(或非编码)序列融合,例如旨在产生组合有几种活性的蛋白质。与其他编码序列融合时,在翻译时产生的所得多肽可以比对于该蛋白质部分所预测的多肽更大。
本发明方法中有用的部分编码如本文中定义的LBD多肽,并且基本上具有如实施例1的表A1中所给出氨基酸序列相同的生物学活性。优选地,此部分是在实施例1的表A1中给出的任一核酸的一部分,或是编码在实施例1的表A1中所给出的任一氨基酸序列的直向同源物或旁系同源物的核酸的一部分。优选地,该部分的长度是至少500、550、600、650、700、750、800、850、900、950、1000个连续核苷酸,所述连续核苷酸为实施例1的表A1中给出的任一核酸序列或为编码在实施例1的表A1中所给出的任一氨基酸序列的直向同源物或旁系同源物的核酸。最优选地,该部分是SEQ ID NO:1的核酸的一部分。优选地,该部分编码这样的氨基酸序列,其中所述氨基酸序列在构建进化系统树如图3中所绘制(或如Yang等人2006年使用HKY方法(Hasegawa等人,J.Mol.Evol.22,160-174,1985)定义)的一个进化系统树中使用时,与包含SEQ ID NO:2所代表氨基酸序列的II类LOB结构域多肽组而不与任何其他组聚类。
在本发明方法中有用的另一种核酸变体是能够在降低的严格条件下、优选在严格条件下与编码如本文中定义的LBD多肽的核酸或与如本文中定义的部分杂交的核酸。
根据本发明,提供了用于增强植物中产量相关性状的方法,包括在植物中导入并表达能够与实施例1的表A1中给出的任一核酸杂交的核酸,或包括在植物中导入并表达这样的核酸,其中所述核酸能够与编码在实施例1的表A1中给出的任意核酸序列的直向同源物、旁系同源物或同源物的核酸杂交。
在本发明方法中有用的杂交序列编码如本文中定义的LBD多肽,并且基本上具有如实施例1的表A1中所给出氨基酸序列相同的生物学活性。优选地,该杂交序列能够与实施例1的表A1中给出的任一核酸或与这些序列中任意序列的一部分杂交,所述的一部分如上文定义,或其中所述杂交序列能够与编码在实施例1的表A1中给出的任一氨基酸序列的直向同源物或旁系同源物的核酸杂交。最优选地,该杂交序列能够与如SEQ IDNO:1所代表的核酸或与其一部分杂交。
优选地,该杂交序列编码这样的氨基酸序列,其中所述氨基酸序列在构建进化系统树如图3中所绘制(或如Yang等人2006年使用HKY方法(Hasegawa等人,J.Mol.Evol.22,160-174,1985)定义)的一个进化系统树中使用时,与包含SEQ ID NO:2所代表氨基酸序列的II类LOB结构域多肽组而不与任何其他组聚类。
在本发明方法中有用的另一种核酸变体是编码如上文所定义的LBD多肽的剪接变体,剪接变体如本文中定义。
根据本发明,提供了用于增强植物中产量相关性状的方法,包括在植物中导入并表达实施例1的表A1中给出的任一核酸序列的剪接变体或编码实施例1表A1中所给出任意氨基酸序列的直向同源物、旁系同源物或同源物的核酸的剪接变体。
优选的剪接变体是由SEQ ID NO:1所代表的核酸的剪接变体,或是编码SEQ ID NO:2的直向同源物或旁系同源物的核酸的剪接变体。优选地,由所述剪接变体编码的氨基酸序列在构建进化系统树如图3中所绘制(或如Yang等人2006年使用HKY方法(Hasegawa等人,J.Mol.Evol.22,160-174,1985)定义)的一个进化系统树中使用时,与包含SEQ ID NO:2所代表的II类LOB结构域多肽组而不与任何其他组聚类。
在实施本发明方法中有用的另一种核酸变体是编码如上文所定义LBD多肽的核酸的等位变体,等位变体如本文中定义。
根据本发明,提供了用于增强植物中产量相关性状的方法,包括在植物中导入并表达实施例1的表A1中给出的任一核酸的等位变体,或包括在植物中导入并表达编码在实施例1的表A1中所给出的任一氨基酸序列的直向同源物、旁系同源物或同源物的核酸的等位变体。
在本发明方法中有用的等位变体基本上具有如SEQ ID NO:2的LBD多肽和实施例1的表A1中所述任意氨基酸序列相同的生物学活性。等位变体存在于自然界中,并且在本发明的方法中包括这些天然等位基因的用途。优选地,所述等位变体是SEQ ID NO:1的等位变体或编码SEQ ID NO:2的直向同源物或旁系同源物的核酸的等位变体。优选地,由所述等位变体编码的氨基酸序列在构建进化系统树如图3中所绘制(或如Yang等人2006年使用HKY方法(Hasegawa等人,J.Mol.Evol.22,160-174,1985)定义)的一个进化系统树中使用时,与包含SEQ ID NO:2所代表的II类LOB结构域多肽组而不与任何其他组聚类。
基因改组或定向进化也可以用来产生编码如上文定义的LBD多肽的核酸的变体;术语“基因改组”如本文中定义。
根据本发明,提供了用于增强植物中产量相关性状的方法,包括在植物中导入并表达在实施例1的表A1中给出的任一核酸序列的变体,或包括在植物中导入并表达核酸的变体,所述的核酸编码在实施例1的表A1中给出的任意氨基酸序列的直向同源物、旁系同源物或同源物,其中所述的变体核酸通过基因改组获得。
优选地,由通过基因改组获得的变体核酸所编码的氨基酸序列在构建进化系统树如图3中所绘制(或如Yang等人2006年使用HKY方法(Hasegawa等人,J.Mol.Evol.22,160-174,1985)定义)的一个进化系统树中使用时,与包含SEQ ID NO:2所代表的II类LOB结构域多肽组而不与任何其他组聚类。
另外,核酸变体也可以通过位点定向诱变获得。几种方法可用于实现位点定向诱变,最常见的是基于PCR的方法(Current Protocols inMolecular Biology.Wiley编辑)。
编码LBD多肽的核酸可以衍生自任何天然来源或人工来源。该核酸可以通过人类有意操作,在组成和/或基因组环境方面从其天然形式中修饰而来。优选地,编码LBD多肽的核酸来自植物,还优选来自双子叶植物,更优选来自十字花科(Brassicaceae),该核酸最优选地来自拟南芥。
本发明方法的实施产生了具有增强的产量相关性状的植物。尤其,本发明方法的实施产生了相对于对照植物而言,具有提高的产量、尤其提高的种子产量的植物。术语“产量”和“种子产量”在本文的“定义”部分中更详细地描述。
本文中对增强的产量相关性状的称谓意指植物的一个或多个部分的生物量(重量)增加,所述的部分可以包括地上(可收获的)部分和/或(可收获的)地下部分。尤其,此类可收获地上部分是苗生物量和种子,并且本发明方法的实施产生了相对于对照植物的苗生物量和种子产量而言,具有提高的苗生物量和种子产量的植物。
以谷物(corn)为例,产量提高可以表现为以下一个或多个指标:每公顷或英亩已建立的植物数目增加、每株植物花序数的提高、行数、每行核粒数、核粒重、千粒核重、花序长度/直径的提高、种子充实率(即充实种子数除以种子总数并乘以100)提高,及其他。以稻为例,产量提高可以自身表现为下列一种或多种指标的提高:每公顷或英亩植物数、每株植物的花序数、每花序的小穗数、每个花序的花(小花)数目(其表述为充实种子数对原发花序数的比)、种子充实率(即充实种子数除以种子总数并乘以100)提高、千粒核重提高及其他。
本发明提供了用于相对于对照植物提高植物的产量、尤其苗生物量产量和种子产量的方法,所述方法包括调节植物中编码如本文中定义的LBD多肽的核酸表达,优选地增加该核酸表达。
由于本发明的转基因植物具有提高的产量,故相对于对照植物的生长速率,这些植物有可能在其生活周期的对应阶段(在其生活周期的至少部分期间)表现提高的生长速率。
提高的生长速率可以是植物的一个或多个部分(包括种子)特有的,或可以基本上遍及整个植物。具有提到的生长速率的植物可以具备较短的生活周期。植物的生活周期可以意指从干燥成熟种子成长直至植物已经产生与起始材料相似的干燥成熟种子的阶段所需要的时间。这个生活周期可以受以下因素影响,如早期生长势、生长速率、绿度指数、开花时间和种子成熟速度。生长速率的提高可以在植物生活周期的一个或多个阶段上或在基本上整个植物生活周期期间发生。提高的生长速率在植物生活周期的早期期间可以反映增强的生长势。生长速率的提高可以改变植物的收获周期,从而允许植物较晚播种和/或较早收获,而这本来是不可能的(相似效果可以随较早的开花时间获得)。若生长速率充分提高,则可以允许进一步播种相同植物物种的种子(例如播种并收获稻植物,随后播种并收获其他稻植物,全部稻植物均处于一个常规生长时期中)。类似地,若生长速率充分地提高,可以允许进一步播种不同植物物种的种子(例如播种并收获谷物植物,随后例如播种并任选收获大豆、马铃薯或任何其他合适的植物)。在一些作物植物的例子中,来自相同根状茎的额外收获次数也可以是可能的。改变植物的收获周期可以导致每英亩一年生物量生产提高(原因在于可以培育并收获任何具体植物的次数(即在一年中)提高)。生长速率的提高也可以允许转基因植物在比其野生型对应物更广泛的地理区域内培育,因为培育作物的地域限制往往由栽种时期(早季)或在收获时期(晚季)的不利环境条件决定。这类不利条件可以避开,若缩短收获周期。生长速率可以通过从生长曲线获得多个参数而确定,此类参数可以是:T-Mid(植物达到50%最大植物大小所花费的时间)和T-90(植物达到50%最大植物大小所花费的时间),以及其他。
根据本发明的优选特征,本发明方法的实施产生了相对于对照植物而言,具有提高的生长速率的植物。因此,根据本发明,提供了用于提高植物生长速率的方法,所述方法包括在植物中调节、优选地提高编码如本文中定义的LBD多肽的核酸表达。尤其,在植物早期生长阶段期间观察到生长速率的提高(早期生长势)。
与对照植物相比较,无论所述植物处于非胁迫条件下或无论所述植物暴露于多种胁迫,产量和/或生长速率的提高均出现。植物一般通过生长得更慢而应答于胁迫暴露。在严重胁迫条件下,植物甚至可以完全停止生长。另一方面,轻度胁迫在本文中定义为植物所暴露的任何下述胁迫,其中所述的胁迫未导致植物完全停止生长,但同时不能恢复生长。与非胁迫条件下的对照植物相比较,轻度胁迫在本发明意义中导致受胁迫植物的生长降低小于40%、35%或30%、优选地小于25%、20%或15%、更优选地小于14%、13%、12%、11%或10%或更低。由于农业实践(灌溉、施肥、杀虫剂处理)的进步,在栽培作物植物中并不经常遇到严重胁迫。因此,由轻度胁迫诱导的受损生长对于农业往往是不受欢迎的特征。轻度胁迫是植物所暴露的常见生物胁迫和/或非生物(环境)胁迫。非生物胁迫可以因干旱或过量的水、缺氧胁迫、盐胁迫、化学毒性、氧化胁迫和热、寒冷或冰冻温度所致。非生物胁迫可以是因水胁迫(尤其因为干旱)、盐胁迫、氧化胁迫或离子胁迫引起的渗透胁迫。生物胁迫一般是由病原体如细菌、病毒、真菌和昆虫引起的那些胁迫。
具体而言,本发明的方法可以在非胁迫条件下或在轻度干旱条件开展以产生相对于对照植物具有提高的产量的植物。如Wang等人(Planta(2003)218:1-14)中报道,非生物胁迫导致一系列不利地影响植物生长及生产量的形态学、生理学、生物化学和分子变化。干旱、盐度、极端温度和氧化胁迫已知是相互联系的并可以通过相似机制诱导生长损害及细胞损害。Rabbani等人(Plant Physiol(2003)133:1755-1767)描述了干旱胁迫与高盐度胁迫之间极高程度的“交互作用”。例如,干旱和/或盐化作用主要表现为渗透胁迫,从而导致细胞内稳态和离子分布的破坏。经常伴随高温或低温、盐度或干旱胁迫的氧化胁迫可以引起功能性蛋白和结构蛋白变性。因此,这些多样的环境胁迫常常激活相似的细胞信号传导途径和细胞应答,如产生胁迫蛋白、上调抗氧化物质、积累兼容性溶质和生长停滞。如本文中所用的术语“非胁迫”条件是允许植物最佳生长的那些环境条件。本领域技术人员清楚对于给定地点的正常土壤条件和气候条件。具有最佳生长条件(在非胁迫条件下培育)的植物一般以增加的优选顺序产生该植物在给定环境中至少90%、87%、85%、83%、80%、77%或75%的平均产量。平均产量可以基于收获量和/或季节计算。本领域技术人员清楚作物的平均生产产量。
相对于在可比较条件下培育的对照植物,本发明方法的实施赋予在非胁迫条件下或在轻度干旱条件下培育的植物提高的产量。因此,根据本发明,提供了用于在非胁迫条件下或在轻度干旱条件下培育的植物中提高产量的方法,所述方法包括增加植物中编码LBD多肽的核酸表达。
相对于在可比较条件下培育的对照植物,本发明方法的实施赋予在营养缺乏条件下、尤其在缺氮条件下培育的植物提高的早期生长势和提高的产量。因此,根据本发明,提供了用于在营养缺乏条件下培育的植物中提高早期生长势和产量的方法,所述方法包括增加植物中编码LBD多肽的核酸表达。营养缺乏可以因营养素如氮、磷酸盐和其他含磷化合物、钾、钙、镉、镁、锰、铁和硼等缺少过多所致。
本发明包括通过本发明方法可获得的植物或其部分(包括种子)。所述植物或其部分包含编码如上文定义的LBD多肽的核酸转基因。
本发明也提供了基因构建体和载体以促进在植物中导入和/或表达编码LBD多肽的核酸。所述基因构建体可以插入适于转化至植物并适于在转化细胞中表达目的基因的载体,所述载体可以是市售的。本发明也提供了如本文中定义的基因构建体在本发明方法中的用途。
更具体地,本发明提供了构建体,其包含:
(a)编码如上文定义的LBD多肽的核酸;
(b)能够驱动(a)的核酸序列表达的一个或多个控制序列;和任选地
(c)转录终止序列。
优选地,编码LBD多肽的核酸如上文定义。术语“调控序列”和“终止序列”如本文中的定义。
用包含任意上述核酸的载体转化植物。技术人员非常了解必须存在于所述载体上以便成功转化、选择和增殖含有目的序列的宿主细胞的遗传元件。该目的序列有效地与一个或多个调控序列(至少与启动子)连接。
有利地,任意类型的启动子,无论是天然的或人工的,可以用来驱动所述核酸序列的表达。组成型启动子是在所述方法中特别有用的。对于多种启动子类型的定义,见本文中的“定义”部分。
应当明白本发明的应用不限于由SEQ ID NO:1代表的编码LBD多肽的核酸,本发明的应用也不限于编码LBD多肽的核酸在受组成型启动子驱动时的表达。
组成型启动子优选地是GOS2启动子,优选地是来自稻的GOS2启动子。还优选地,所述组成型启动子由基本上与SEQ ID NO:10相似的核酸序列代表,最优选地该组成型启动子如SEQ ID NO:10所代表。对于组成型启动子的其他例子,见本文中的“定义”部分。
任选地,可以在导入植物的构建体中使用一个或多个终止子序列。额外的调节元件可以包括转录增强子以及翻译增强子。本领域技术人员将知道可能适用于实施本发明的终止子和增强子序列。如定义部分中描述,内含子序列也可以添加至5’非翻译区(UTR)或编码序列中,以提高细胞质内聚集的成熟信使的数量。(除启动子、增强子、沉默子、内含子序列、3’UTR和/或5’UTR区域之外的)其他调控序列可以是蛋白质/或RNA稳定元件。此类序列将是已知的或可以由本领域技术人员轻易获得。
本发明的基因构建体还可以包括对于在特定细胞类型中维持和/或复制所需要的复制起点序列。一个例子是当需要基因构建体作为游离型遗传元件(例如质粒或粘粒分子)在细菌细胞中维持时的复制起点。优选的复制起点包括但不限于f1-ori和colE1。
为检测如用于本发明方法中的核酸序列的成功转移和/或选择包含这些核酸的转基因植物,有利的是使用标记基因(或报道基因)。因此,所述基因构建体可以任选地包含选择标记基因。选择标记在本文的“定义”部分中更详细地描述。
已知当核酸稳定或瞬时地整合至植物细胞时,仅少数细胞摄取了外来DNA,并且根据需要,将其整合至细胞的基因组中,这取决于所用的表达载体和所用的转染技术。为鉴定并选择这些整合体,编码选择标记的基因(如上文所述的基因)通常连同目的基因一起导入宿主细胞。这些标记可以在这些基因例如通过常规方法缺失而无功能的突变体中使用。此外,编码选择标记的核酸分子可以在包含编码本发明多肽或在本发明方法中所用多肽的序列的相同载体上,或在独立的载体上导入宿主细胞。已经用所导入核酸稳定转染的细胞可以通过选择作用鉴定(例如具有整合的选择标记的细胞存活而其他细胞死亡)。一旦不再需要所述标记基因时,可以从转基因细胞中去掉或切除它们。用于移出标记基因的技术是本领域已知的,有用技术在上文定义部分中描述。
本发明也提供了用于产生转基因植物的方法,所述转基因植物相对于对照植物具有增强的产量相关性状,其中所述方法包括在植物中导入并表达编码如上文所定义的LBD多肽的任意核酸。
更具体地,本发明提供了用于产生转基因植物的方法,所述转基因植物具有增加的增强产量相关性状、尤其提高的苗生物量和提高的种子产量,其中所述方法包括:
(i)在植物或植物细胞中导入并表达编码LBD多肽的核酸;和
(ii)在促进植物生长和发育的条件下培养植物细胞。
(i)的核酸可以是能够编码如本文中定义的LBD多肽的任意核酸。
所述核酸可以直接导入植物细胞或导入植物自身(包括导入组织、器官或植物的任何其他部分)。根据本发明的优选特征,该核酸优选地通过转化作用导入植物。术语“转化”在本文的“定义”部分中更详细地描述。
遗传修饰的植物细胞可以通过技术人员熟悉的全部方法再生。合适的方法可以在上文提及的S.D.Kung和R.Wu,Potrykus或和Willmitzer的出版物中找到。
通常在转化后,对植物细胞或细胞群体选择一个或多个标记的存在性,其中所述标记由随同目的基因一起共转移的植物可表达基因编码,随后将转化材料再生成完整植物。为了选择转化植物,在所述转化中获得的植物材料原则上经历选择性条件,从而转化植物可以与非转化植物区分。例如,可以将以上述方式获得的种子播种,并且在初始培育期间后,通过喷洒进行合适的选择。另一种可能性在于根据需要消毒后,在使用合适选择剂的琼脂板上培育种子,从而仅转化的种子可以长成植物。备选地,对所述转化植物筛选选择标记(如上文所述的选择标记)的存在性。
在DNA转移和再生后,推定转化的植物也可以例如使用DNA印迹分析对目的基因的存在性、拷贝数和/或基因组构造进行评价。备选地或额外地,新导入的DNA的表达水平可以使用RNA印迹分析和/或蛋白质印迹分析或这两种分析法监测,这两项技术均是本领域普通技术人员熟知的。
产生的转化植物可以通过多种方法繁殖,如通过克隆繁殖法或经典育种技术。例如,第一世代(或T1)转化植物可以进行自交并且选择纯合的第二世代(或T2)转化体,并且T2植物随后可以通过经典育种技术进一步繁殖。产生的转化生物可以采取多种形式。例如,它们可以是转化细胞和非转化细胞的嵌合体;克隆性转化体(例如,被转化以含有表达盒的全部细胞);转化组织和非转化组织的移植体(例如在植物中,与未转化接穗嫁接的转化根状茎)。
本发明明确地扩展至由本文中所述的任意方法产生的任意植物细胞或植物,并扩展至全部植物部分及其繁殖体。本发明进一步扩展以包括已经由前述任意方法产生的原代转化或转染细胞、组织、器官或完整植物的子代,唯一要求是子代表现与如本发明方法中的亲代相同的基因型和/或表型特征。
本发明也包括含有编码如本文以上所定义LBD多肽的分离核酸的宿主细胞。本发明的优选宿主细胞是植物细胞。对于本发明方法中所用核酸或载体、表达盒或构建体或载体的宿主植物原则上有利地是能够合成在本发明方法中所使用多肽的全部植物。
本发明的方法有利地适用于任意植物。在本发明方法中特别有用的植物包括属于植物界(Viridiplantae)超家族、尤其单子叶和双子叶植物的全部植物,包括饲用或饲料豆科植物、观赏植物、粮食作物、树或灌木。根据本发明的一个优选实施方案,所述植物是作物植物。作物植物的例子包括大豆、向日葵、卡诺拉油菜、苜蓿、油菜、棉花、番茄、马铃薯和烟草。还优选地,所述植物是单子叶植物。单子叶植物的例子包括甘蔗。更优选地,所述植物是谷物植物。谷物植物的例子包括稻、玉米、小麦、大麦、谷子、黑麦、小黑麦属(triticale)、高粱和燕麦。
本发明也扩展至植物的可收获部分如,但不限于种子、叶、果实、花、茎、根状茎、块茎和球茎。本发明进一步涉及了衍生自、优选直接衍生自此种植物的可收获部分的产品,如干燥颗粒或粉末、油、脂肪和脂肪酸、淀粉或蛋白质。
根据本发明的优选特征,受调节的表达是增加的表达。用于增加核酸或基因或基因产物表达的方法是本领域中充分经文献报道的并且在定义部分中提供了例子。
如上所述,用于调节(优选地增加)编码LBD多肽的核酸表达的优选方法是通过在植物中导入并表达编码LBD多肽的核酸;但是,实施本方法的效果,即增强产量相关性状,也可以使用包括但不限于T-DNA活化标签法、TILLING、同源重组在内的其他熟知技术实现。在定义部分中提供了对这些技术的描述。
本发明也包括编码如本文中所述LBD多肽的核酸的用途,和这些LBD多肽的用途,用于增强植物中任意的前述产量相关性状。
编码本文中所述LBD多肽的核酸或LBD多肽自身可以用于育种程序中,在所述育种程序中鉴定到可以遗传地与编码LBD多肽的基因连锁的DNA标记。所述核酸/基因或LBD多肽自身可以用来定义分子标记。这种DNA或蛋白质标记随后可以在育种程序中用来在本发明的方法中选择具有如上文所定义的增强的产量相关性状的植物。
编码LBD多肽的核酸/基因的等位变体也可以用于标记辅助的育种程序中。此类育种程序有时需要使用例如EMS诱变法通过对植物进行诱变处理而导入等位变异;备选地,所述程序可以从收集并非故意造成的所谓“自然”源性等位变体开始。随后进行等位变体的鉴定,例如通过PCR法。此后是步骤:选择所讨论和导致产量提高的序列的优异等位变体。选择一般通过监测含有所讨论序列的不同等位变体的植物的生长性能而实施。生长性能可以在温室或在田间监测。其他任选步骤包括将其中鉴定到优异等位变体的植物与另一种植物杂交。这可能用来例如产生感兴趣的表型特征组合。
编码LBD多肽的核酸也可以作为探针用于遗传地或物理地绘制所述探针构成其一部分的基因并且用作与这些基因连锁的性状的标记。此类信息可以用于植物育种中,以开发具有所希望表型的品系。编码LBD多肽的核酸的这种用途仅需要具有至少15个核苷酸长度的核酸序列。编码LBD多肽的核酸可以用作限制性片段长度多态性(RFLP)标记。限制性消化的植物基因组DNA的DNA印迹物(Sambrook J,Fritsch EF和Maniatis T(1989)Molecular Cloning,A Laboratory Manual)可以用编码LBD多肽的核酸探测。所得的结合图式随后可以使用计算机程序如MapMaker(Lander等人(1987)Genomics 1:174-181)进行遗传分析以构建遗传图。此外,该核酸可以用来探测含有一组个体的限制性核酸内切酶处理的基因组DNA的DNA印迹物,其中所述的一组个体代表具有定义的遗传杂交的亲代和子代。DNA多态性的分离是明显的并用来计算编码LBD多肽的核酸在先前使用这个群体获得的遗传图中的位置(Botstein等人(1980)Am.J.Hum.Genet.32:314-331)。
在Bernatzky和Tanksley(1986)Plant Mol.Biol.Reporter 4:37-41中描述了植物基因来源的探针的产生及其在遗传作图中的用途。许多出版物描述了使用以上概述的方法学或其变例对特定cDNA克隆的遗传作图。例如,F2互交群、回交群、随机交配群、邻近纯合系和其他个体群体可以用于作图。此类方法学是本领域技术人员熟知的。
所述核酸探针也可以用于物理作图(即序列在物理图上的排列;见Hoheisel等在:Non-mammalian Genomic Analyasis:A Practical Guide,Academic press 1996,第319-346页及其中引用的参考文献)。
在另一个实施方案中,所述核酸探针可以在直接荧光原位杂交(FISH)作图法(Trask(1991)Trends Genet.7:149-154)中使用。尽管当前的FISH作图法支持使用大的克隆(几个kb至几百个kb;见Laan等人(1995)Genome Res.5:13-20),然而灵敏度的改善可以允许使用更短探针进行FISH作图。
用于遗传作图及物理作图的多种基于核酸扩增的方法可以使用所述核酸而实施。方法例子包括等位基因特异性扩增法(Kazazian(1989)J.Lab.Clin.Med 11:95-96)、PCR扩增片段的多态性(CAPS;Sheffield等人(1993)Genomics 16:325-332)、等位基因特异性连接(Landegren等人(1988)Science 241:1077-1080)、核苷酸延伸反应(Sokolov(1990)Nucleic Acid Res.18:3671)、放射杂交作图(Walter等人(1997)Nat.Genet.7:22-28)和Happy作图法(Dear和Cook(1989)Nucleic Acid Res.17:6795-6807)。对于这些方法,使用一种核酸的序列来设计并产生在扩增反应或在引物延伸反应中使用的引物对。此类引物的设计是本领域技术人员熟知的。在使用基于PCR遗传作图的方法中,可能需要在对应于当前核酸序列的区域中鉴定作图交叉的亲代之间的DNA序列差异。但是,这通常对作图法而言不是必需的。
如前文所述,本发明方法产生了具有增强的产量相关性状的植物。这些性状也可以与经济上有利的其他性状组合,如其他的产量增强性状、针对其他非生物胁迫和生物胁迫的耐受性、调节多种构造性特征和/或生物化学特征和/或生理学特征的性状。
II.JMJC(JUMONJI-C)多肽
出人意料地,现在已经发现:调节植物中编码JMJC多肽的核酸表达产生了相对于对照植物具有增强的产量相关性状的植物。根据第一实施方案,本发明提供了用于相对于对照植物增强植物中产量相关性状的方法,包括调节植物中编码JMJC多肽的核酸表达。
用于调节(优选增加)编码JMJC多肽的核酸表达的优选方法是在植物中导入并表达编码JMJC多肽的核酸。
下文对“在本发明方法中有用的蛋白质”的任意称谓意指如本文中定义的JMJC多肽。下文对“在本发明方法中有用的核酸”的任意称谓意指能够编码这种JMJC多肽的核酸。待导入植物(并且因而在实施本发明方法中有用)的核酸是编码现在将描述的蛋白质类型的任意核酸,下文也称作“JMJC核酸”或“JMJC基因”。
如本文中定义,JMJC多肽指至少包含JmjC结构域的多肽。
JmjC结构域是在原核生物和真核生物中存在的保守序列。JmjC结构域的长度平均是111个氨基酸。通常,JmjC结构域的长度可以在25个至200个氨基酸之间变动,尽管更短或更长的形式可能存在。预测JmjC结构域是采用cupin折叠并且作为调节染色质重塑的酶候选物的金属酶(Clissold等人Trends Biochem Sci.2001年1月;26(1):7-9)。
JMJC多肽可以在专业化数据库如Pfam(Finn等人Nucleic AcidsResearch(2006)Database Issue 34:D247-D251)中找到。Pfam编纂了覆盖许多常见蛋白质结构域和家族的多重序列比对结果和隐匿马尔科夫模型(HMM)的庞大集合和并且通过英国Sanger研究所可使用。
JmjC结构域的收集临界阈值在Pfam HMM_fs模型中是16.0并且在HMM_ls模型中是-8.0。如Pfam数据库中所认为的受信任匹配是评分高于收集临界阈值的那些匹配。但是,包含真实JmjC结构域的潜在匹配依旧可以低于该收集临界值。优选地,JMJC多肽是在其序列中具有超出Pfam蛋白质结构域家族PF02373、jumonji、jmjC的收集临界值的一个或多个结构域的蛋白质。
备选地,多肽中的JmjC结构域可以通过与包含JmjC结构域的已知多肽进行序列比较并在JmjC结构域区域中建立相似性而鉴定。可以使用本领域熟知的任意方法如Blast算法比对所述序列并且取得与给定序列出现比对结果的概率作为用于鉴定相似多肽的基础。通常用来在配对比较中代表这种概率的参数称作e-值。所述e-值描述给定评分预期以多少频率随机出现;该e-值临界可以高至1.0。通常,出现可能性大的比对结果具有低于0.1、0.01、0.001、1.e-05、1.e-10、1.e-15、1.e-20、1.e-25、1.e-50、1.e-75、1.e-100和1.e-200的e-值。优选地,本发明的JMJC多肽包含下述序列,其以增加的优选顺序对于用已知JMJC多肽中存在的JmjC结构域所得的比对结果具有低于0.1、0.01、0.001、1.e-05、1.e-10、1.e-15、1.e-20、1.e-25、1.e-50、1.e-75、1.e-100和1.e-200的e-值。
在表B1中给出JMJC多肽的例子。在表B4中给出作为存在于双子叶植物来源的代表性JMJC多肽中的JmjC结构域的氨基酸坐标。在SEQ IDNO:78中给出JmjC结构域的例子。
JmjC结构域之间序列同一性一般是平均23%并且可以低至10%。本发明的优选JMJC多肽是在表B4中给出其氨基酸坐标的那些JMJC多肽,它们以增加的优选顺序与SEQ ID NO:78或与包含在SEQ ID NO:84;SEQ ID NO:86:SEQ ID NO:96;SEQ ID NO:98;SEQ ID NO:104;SEQID NO:108;SEQ ID NO:110;SEQ ID NO:112;SEQ ID NO:114;SEQID NO:116;SEQ ID NO:118;SEQ ID NO:120;SEQ ID NO:122;SEQID NO:124;SEQ ID NO:128;SEQ ID NO:130;SEQ ID NO:132和SEQID NO:134所代表的JMJC多肽中的任意JmjC结构域具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或更高的序列同一性。
除了JmjC结构域之外,JMJC多肽还可以任选地包含在SEQ ID NO:74中发现的其他高度保守的序列基序,如SEQ ID NO:79、SEQ ID NO:80、SEQ ID NO:81中所代表的那些序列基序。另外,本发明的多肽可以包含在参与铁离子配位的加氧酶中存在的保守序列,其在本文中由HXD(V)或EXnH(SEQ ID NO:82)代表,其中“X”代表任意氨基酸并且“n”代表范围在1-5之间的包括1和5在内的X-残基数目。
本发明的优选JMJC多肽指包含JmjC结构域并任选以增加的优选顺序与任意一个或多个如SEQ ID NO:79、SEQ ID NO:80、SEQ ID NO:81和SEQ ID NO:82所代表的保守序列基序具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或更高序列同一性的任意多肽。
已经报道了JUMONJI蛋白质家族中结构域交换作用的证据(Balciunas和Ronne.Trends Biochem Sci 2000;25:274-276)。因而,除了JmjC结构域之外,JMJC多肽一般还含有一个或多个不同种类的其他已知的保守结构域。与本发明多肽有关的是包含除所述JmjC结构域之外的其他保守结构域的JMJC多肽,其中所述的保守结构域推测参与DNA结合和转录活性(如锌指)和/或参与蛋白质相互作用和蛋白质转换(如F盒和锌指-RING-型结构域)。
因而,在本发明方法中有用的JMJC多肽包含JmjC结构域和任选地一个或多个以下保守结构域:JmJN(pfam登录号PF02375);C5HC2锌指(pfam登录号:PF02928)、氨基端FY丰富结构域(InterPro登录号:IPR003888)和羧基端FY丰富结构域(InterPro登录号:IPR003889)、锌指FYVE/PHD-Zn型(InterPro登录号:IPR011011)、锌指C2H2型(pfam登录号:PF00096)、锌指–RING型(zf-C3HC4)(pfam登录号PF00097)和F盒结构域(pfam登录号:PF00646)。
优选地,本发明的JMJC多肽包含以增加的优选顺序与SEQ ID NO:74、SEQ ID NO:86、SEQ ID NO:94、SEQ ID NO:104、SEQ ID NO:122、SEQ ID NO:134、SEQ ID NO:136、SEQ ID NO:140、SEQ ID NO:142和SEQ ID NO:148具有50%、60%、70%、75%、80%、85%、90%、92%、94%、96%、98%或更高序列同一性的序列。
优选地,所述多肽序列在构建进化系统树如图8中所绘制的进化系统树中使用时,与包含SEQ ID NO:74所代表氨基酸序列的JMJC多肽组(或Takeuchi等人Dev Dyn.2006235(9):2449-59)而不与任何其他组聚类。
术语“结构域”和“基序”在本文中的“定义”部分定义。存在用于鉴定结构域的专业数据库,例如,SMART(Schultz等人(1998)Proc.Natl.Acad.Sci.USA 95,5857-5864;Letunic等人(2002)Nucleic Acids Res 30,242-244)、InterPro(Mulder等,(2003)Nucl.Acids.Res.31,315-318)、Prosite(Bucher和Bairoch(1994),用于生物分子序列基序的概括特征结构及其在自动化序列解读中的功能(A generalized profile syntax forbiomolecular sequences motifs and its function in automatic sequenceinterpretation).(在)ISMB-94;第二届分子生物学智能系统国际会议文集.Altman R.,Brutlag D.,Karp P.,Lathrop R.,Searls D.编辑,第53-61页,AAAIPress,Menlo Park;Hulo等,Nucl.Acids.Res.32:D134-D137,(2004)或Pfam(Bateman等,Nucleic Acids Research 30(1):276-280(2002))。一组用于计算机方式分析蛋白质序列的工具可在ExPASY蛋白质组服务器上获得(瑞士生物信息研究所维护(Gasteiger等,ExPASy:用于深入认识和分析蛋白质的蛋白质组服务器(The proteomics server for in-depth proteinknowledge and analysis),Nucleic Acids Res.31:3784-3788(2003))。结构域也可以使用常规技术如通过序列比对进行鉴定。
用于比对序列以进行比较的方法是本领域熟知的,此类方法包括GAP、BESTFIT、BLAST、FASTA和TFASTA。GAP使用Needleman和Wunsch算法((1970)J Mol Biol 48:443-453)以找到使匹配数最大化并使空位数最小化的两个序列的总体(即覆盖完整序列的)比对结果。BLAST算法(Altschul等人(1990)J Mol Biol 215:403-10)计算序列同一性百分数并在两个序列之间开展相似性的统计分析。用于开展BLAST分析的软件是通过国家生物技术信息中心(NCBI)可公开获得的。同源物可以使用例如ClustalW多重序列比对算法(1.83版本),以默认配对比对参数和百分数评分方法轻易地鉴定。相似性和同一性的总体百分数也可以使用MatGAT软件包中的可用方法之一确定(Campanella等,BMC Bioinformatics.2003年7月10日;4:29.MatGAT:使用蛋白质序列或DNA序列产生相似性/同一性矩阵的一种应用(an application that generates similarity/identitymatrices using protein or DNA sequences))。如本领域技术人员显而易见,可以进行少许手工编辑以优化保守基序之间的比对。此外,作为使用全长序列以鉴定同源物的替代,也可以使用特定结构域。利用上文提及的程序,使用默认参数可以在完整核酸或氨基酸序列范围或保守基序范围内确定序列同一性值。
另外,JMJC多肽一般可以具有蛋白质羟化酶活性,尤其是具有肽-天冬氨酸β-双加氧酶(PABD)活性(EC 1.14.11.16)。所催化的反应是:肽L-天冬氨酸+2-酮戊二酸+O(2)<=>肽3-羟基-L-天冬氨酸+琥珀酸+CO(2)。该反应中的辅因子是铁和2-酮戊二酸。用于测量PABD活性的工具和技术是本领域熟知的(见例如Lavaissiere等人J Clin Invest.1996;98(6):1313-23;Linke等人J Biol Chem.2004;279(14):14391-7;Lee等人J.Biol.Chem.278:7558–7563;2003;Lando等人Genes Dev.16:1466–1471;2002)。铁(II)/2-酮戊二酸(2-OG)依赖性加氧酶催化多种代谢反应中的氧化反应。最近已经提出JMJC多肽也可能具有组蛋白脱甲基酶活性(Trewick等人2005)。
本发明通过用SEQ ID NO:73所代表的核酸序列转化植物进行说明,其中所述的核酸序列编码SEQ ID NO:74的多肽序列。但是,本发明的实施不限于这些序列;本发明的方法可以有利地使用编码JMJC的任意核酸或如本文中定义的JMJC多肽实施。
编码JMJC多肽的核酸的例子在本文实施例12的表B1中给出。此类核酸用于实施本发明的方法中。在实施例12的表B1中给出的氨基酸序列是由SEQ ID NO:74所代表的JMJC多肽的直向同源物和旁系同源物的示例序列,术语“直向同源物”和“旁系同源物”如本文中定义。其他直向同源物和旁系同源物可以通过开展所谓交互性blast搜索轻易地鉴定。通常,这包括第一BLAST,其中所述的第一BLAST包括将查询序列(例如使用实施例12的表B1中列出的任意序列)针对任意序列数据库,如可公开获得的NCBI数据库进行BLAST。当从核苷酸序列开始时,一般使用BLASTN或TBLASTX(使用标准默认值),并且当从蛋白质序列开始时,使用BLASTP或TBLASTN(使用标准默认值)。可以任选地筛选BLAST结果。筛选结果或非筛选结果的全长序列随后针对来自生物的序列进行反向BLAST搜索(第二BLAST),其中查询序列从所述的生物中衍生(在查询序列是SEQ ID NO:73或SEQ ID NO:74的情况下,第二BLAST因而将针对拟南芥序列进行)。随后比较第一BLAST和第二BLAST的结果。若来自第一blast的高阶位命中是源自与衍生查询序列的物种相同的物种,则鉴定到旁系同源物,随后一个反向BLAST理想地在最高命中当中产生该查询序列;若在第一BLAST中的高阶位命中不是源自与衍生查询序列的物种相同的物种,则鉴定到直向同源物,并且在反向BLAST时,优选地产生属于最高命中当中的该查询序列。
高阶位命中是具有低E-值的那些命中。E-值越低,评分越显著(或换句话说,偶然发现该命中的几率越低)。E-值的计算是本领域熟知的。除了E-值外,比较过程也通过同一性百分数评分。同一性百分数指两个所比较的核酸(或多肽)序列之间特定长度范围内相同的核苷酸(或氨基酸)的数目。在大型家族的情况下,可以使用ClustalW,随后使用邻接树法,以帮助观察相关基因的聚集和鉴定直向同源物和旁系同源物。
核酸变体也可以用于实施本发明的方法中。此类变体的例子包括编码在实施例12的表B1中所给出的任一氨基酸序列的同源物和衍生物的核酸,术语“同源物”和“衍生物”如本文中定义。还用于本发明方法中的是这样的核酸,其编码在实施例12的表B1中所给出的任一氨基酸序列的直向同源物或旁系同源物的同源物和衍生物。用于本发明方法中的同源物和衍生物与衍生它们的未修饰蛋白质具有基本上相同的生物学活性和功能活性。
在实施本发明方法中有用的其他核酸变体包括编码JMJC多肽的核酸的部分、与编码JMJC多肽的核酸杂交的核酸、编码JMJC多肽的核酸的剪接变体、编码JMJC多肽的核酸的等位变体和通过基因改组获得的编码JMJC多肽的核酸的变体。术语“杂交序列”、“剪接变体”、“等位变体”和“基因改组作用”如本文中所述。
编码JMJC多肽的核酸不需要是全长核酸,因为本发明方法的实施不取决于全长核酸序列的使用。根据本发明,提供了用于增强植物中产量相关性状的方法,包括在植物中导入并表达实施例12的表B1中给出的任一核酸序列的一部分或编码实施例12表B1中所给出任意氨基酸序列的直向同源物、旁系同源物或同源物的核酸的一部分。
核酸的一部分可以例如通过对所述核酸产生一个或多个缺失而制备。所述部分可以以分离的形式使用或它们可以与其他编码(或非编码)序列融合,例如旨在产生组合有几种活性的蛋白质。与其他编码序列融合时,在翻译时产生的所得多肽可以比对于该蛋白质部分所预测的多肽更大。
在本发明方法中有用的部分编码如本文中定义的JMJC多肽,并且基本上具有如实施例12的表B1中所给出氨基酸序列相同的生物学活性。优选地,此部分是在实施例12的表B1中给出的任一核酸的一部分,或是编码在实施例12的表B1中所给出的任一氨基酸序列的直向同源物或旁系同源物的核酸的一部分。优选地,该部分的长度是至少100、200、500、550、600、650、700、750、800、850、900、950、1000、1500、2000、2500、3000、3500、4000、4500、5000个连续核苷酸,所述连续核苷酸为实施例12的表B1中给出的任一核酸序列或为编码在实施例12的表B1中所给出的任一氨基酸序列的直向同源物或旁系同源物的核酸。最优选地,该部分是SEQ ID NO:73的核酸的一部分。优选地,所述部分编码下述氨基酸序列,其中所述氨基酸序列在构建进化系统树如图8中所绘制的进化系统树中使用时,与包含SEQ ID NO:74所代表氨基酸序列的JMJC多肽组(或Takeuchi等人Dev Dyn.2006235(9):2449-59)而不与任何其他组聚类。
在本发明方法中有用的另一种核酸变体是能够在降低的严格条件下、优选在严格条件下与编码如本文中定义的JMJC多肽的核酸或与如本文中定义的部分杂交的核酸。
根据本发明,提供了用于增强植物中产量相关性状的方法,包括在植物中导入并表达能够与实施例12的表B1中给出的任一核酸杂交的核酸,或包括在植物中导入并表达这样的核酸,其中所述核酸能够与编码在实施例12的表B1中给出的任意核酸序列的直向同源物、旁系同源物或同源物的核酸杂交。
在本发明方法中有用的杂交序列编码如本文中定义的JMJC多肽,并且基本上具有如实施例12的表B1中所给出氨基酸序列相同的生物学活性。优选地,该杂交序列能够与实施例12的表B1中给出的任一核酸或与这些序列中任意序列的一部分杂交,所述的一部分如上文定义,或其中所述杂交序列能够与编码在实施例12的表B1中给出的任一氨基酸序列的直向同源物或旁系同源物的核酸杂交。最优选地,该杂交序列能够与如SEQID NO:73所代表的核酸或与其一部分杂交。
优选地,所述杂交序列编码下述氨基酸序列,其中所述氨基酸序列在构建进化系统树如图8中所绘制的进化系统树中使用时,与包含SEQ IDNO:74所代表氨基酸序列的JMJC多肽组(或Takeuchi等人Dev Dyn.2006235(9):2449-59)而不与任何其他组聚类。
在本发明方法中有用的另一种核酸变体是编码如上文所定义的JMJC多肽的剪接变体,剪接变体如本文中定义。
根据本发明,提供了用于增强植物中产量相关性状的方法,包括在植物中导入并表达实施例12的表B1中给出的任一核酸序列的剪接变体或编码实施例12表B1中所给出任意氨基酸序列的直向同源物、旁系同源物或同源物的核酸的剪接变体。编码SEQ ID NO:74的基因的剪接变体例子由SEQ ID NO:73和SEQ ID NO:83(编码SEQ ID NO:84)代表。
优选的剪接变体是由SEQ ID NO:73所代表的核酸的剪接变体,或是编码SEQ ID NO:74的直向同源物或旁系同源物的核酸的剪接变体。优选地,由所述剪接变体编码的氨基酸序列在构建进化系统树如图8中所绘制的进化系统树中使用时,与包含SEQ ID NO:74所代表氨基酸序列的JMJC多肽组(或Takeuchi等人Dev Dyn.2006235(9):2449-59)而不与任何其他组聚类。
在实施本发明方法中有用的另一种核酸变体是编码如上文所定义JMJC多肽的核酸的等位变体,等位变体如本文中定义。
根据本发明,提供了用于增强植物中产量相关性状的方法,包括在植物中导入并表达实施例12的表B1中给出的任一核酸的等位变体,或包括在植物中导入并表达编码在实施例12的表B1中所给出的任一氨基酸序列的直向同源物、旁系同源物或同源物的核酸的等位变体。
在本发明方法中有用的等位变体基本上具有如SEQ ID NO:74的JMJC多肽和实施例12的表B1中所述任意氨基酸序列相同的生物学活性。等位变体存在于自然界中,并且在本发明的方法中包括这些天然等位基因的用途。优选地,所述等位变体是SEQ ID NO:73的等位变体或编码SEQID NO:74的直向同源物或旁系同源物的核酸的等位变体。优选地,由所述等位变体编码的氨基酸序列在构建进化系统树如图8中所绘制的进化系统树中使用时,与包含SEQ ID NO:74所代表氨基酸序列的JMJC多肽(或Takeuchi等人Dev Dyn.2006235(9):2449-59)而不与任何其他组聚类。
基因改组或定向进化也可以用来产生编码如上文定义的JMJC多肽的核酸的变体;术语“基因改组”如本文中定义。
根据本发明,提供了用于增强植物中产量相关性状的方法,包括在植物中导入并表达在实施例12的表B1中给出的任一核酸序列的变体,或包括在植物中导入并表达核酸的变体,所述的核酸编码在实施例12的表B1中给出的任意氨基酸序列的直向同源物、旁系同源物或同源物,其中所述的变体核酸通过基因改组获得。
有利地,本发明提供了至今未知的JMJC核酸和多肽序列。
根据本发明的又一个实施方案,提供了分离的核酸分子,其包含:
(i)由SEQ ID NO:169代表的核酸:
(ii)与SEQ ID NO:169互补的核酸或其片段;
(iii)编码JMJC多肽的核酸,所述的JMJC多肽以增加的优选顺序与SEQ ID NO:170中给出的氨基酸序列具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的序列同一性:
(iv)能够在严格条件下与以上(i)、(ii)或(iii)中给出的任一种核酸杂交的核酸。
根据本发明的又一个实施方案,因而提供了分离的多肽,其包含:
(i)以增加的优选顺序与SEQ ID NO:170中给出的氨基酸序列具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%或更高的序列同一性的氨基酸序列:
(ii)(i)中给出的任意氨基酸序列的衍生物。
优选地,由通过基因改组法获得的变体核酸编码的氨基酸序列在构建进化系统树如图8中所绘制的进化系统树中使用时,与包含SEQ ID NO:74所代表氨基酸序列的JMJC多肽组(或Takeuchi等人Dev Dyn.2006235(9):2449-59)而不与任何其他组聚类。
另外,核酸变体也可以通过位点定向诱变获得。几种方法可用于实现位点定向诱变,最常见的是基于PCR的方法(Current Protocols inMolecular Biology.Wiley编辑)。
编码JMJC多肽的核酸可以衍生自任何天然来源或人工来源。该核酸可以通过人类有意操作,在组成和/或基因组环境方面从其天然形式中修饰而来。优选地,编码JMJC多肽的核酸来自植物,还优选来自双子叶植物,更优选来自十字花科,该核酸最优选地来自拟南芥。
本发明方法的实施产生了具有增强的产量相关性状的植物。尤其,本发明方法的实施产生了相对于对照植物而言,具有提高的产量、尤其提高的种子产量的植物。术语“产量”和“种子产量”在本文的“定义”部分中更详细地描述。
本文中对增强的产量相关性状的称谓意指植物的一个或多个部分的生物量(重量)增加,所述的部分可以包括地上(可收获的)部分和/或(可收获的)地下部分。尤其,此类可收获部分是种子,并且本发明方法的实施产生了相对于对照植物的产量而言,具有提高的产量的植物。
以谷物为例,产量提高可以表现为以下一个或多个指标:每公顷或英亩已建立的植物数目增加、每株植物花序数的提高、行数、每行核粒数、核粒重、千粒核重、花序长度/直径的提高、种子充实率(即充实种子数除以种子总数并乘以100)提高,及其他。以稻为例,产量提高可以自身表现为下列一种或多种指标的提高:每公顷或英亩植物数、每株植物的花序数、每花序的小穗数、每个花序的花(小花)数目(其表述为充实种子数对原发花序数的比)、种子充实率(即充实种子数除以种子总数并乘以100)提高、千粒核重提高及其他。
本发明提供了用于相对于对照植物提高植物的产量、尤其种子产量的方法,所述方法包括调节植物中编码如本文中定义的JMJC多肽的核酸表达,优选地增加该核酸表达。
由于本发明的转基因植物具有提高的产量,故相对于对照植物的生长速率,这些植物有可能在其生活周期的对应阶段(在其生活周期的至少部分期间)表现提高的生长速率。
提高的生长速率可以是植物的一个或多个部分(包括种子)特有的,或可以基本上遍及整个植物。具有提到的生长速率的植物可以具备较短的生活周期。植物的生活周期可以意指从干燥成熟种子成长直至植物已经产生与起始材料相似的干燥成熟种子的阶段所需要的时间。这个生活周期可以受以下因素影响,如早期生长势、生长速率、绿度指数、开花时间和种子成熟速度。生长速率的提高可以在植物生活周期的一个或多个阶段上或在基本上整个植物生活周期期间发生。提高的生长速率在植物生活周期的早期期间可以反映增强的生长势。生长速率的提高可以改变植物的收获周期,从而允许植物较晚播种和/或较早收获,而这本来是不可能的(相似效果可以随较早的开花时间获得)。若生长速率充分提高,则可以允许进一步播种相同植物物种的种子(例如播种并收获稻植物,随后播种并收获其他稻植物,全部稻植物均处于一个常规生长时期中)。类似地,若生长速率充分地提高,可以允许进一步播种不同植物物种的种子(例如播种并收获谷物植物,随后例如播种并任选收获大豆、马铃薯或任何其他合适的植物)。在一些作物植物的例子中,来自相同根状茎的额外收获次数也可以是可能的。改变植物的收获周期可以导致每英亩一年生物量生产提高(原因在于可以培育并收获任何具体植物的次数(即在一年中)提高)。生长速率的提高也可以允许转基因植物在比其野生型对应物更广泛的地理区域内培育,因为培育作物的地域限制往往由栽种时期(早季)或在收获时期(晚季)的不利环境条件决定。这类不利条件可以避开,若缩短收获周期。生长速率可以通过从生长曲线获得多个参数而确定,此类参数可以是:T-Mid(植物达到50%最大植物大小所花费的时间)和T-90(植物达到50%最大植物大小所花费的时间),以及其他。
根据本发明的优选特征,本发明方法的实施产生了相对于对照植物而言,具有提高的生长速率的植物。因此,根据本发明,提供了用于提高植物生长速率的方法,所述方法包括在植物中调节、优选地提高编码如本文中定义的JMJC多肽的核酸表达。
与对照植物相比较,无论所述植物处于非胁迫条件下或无论所述植物暴露于多种胁迫,产量和/或生长速率的提高均出现。植物一般通过生长得更慢而应答于胁迫暴露。在严重胁迫条件下,植物甚至可以完全停止生长。另一方面,轻度胁迫在本文中定义为植物所暴露的任何下述胁迫,其中所述的胁迫未导致植物完全停止生长,但同时不能恢复生长。与非胁迫条件下的对照植物相比较,轻度胁迫在本发明意义中导致受胁迫植物的生长降低小于40%、35%或30%、优选地小于25%、20%或15%、更优选地小于14%、13%、12%、11%或10%或更低。由于农业实践(灌溉、施肥、杀虫剂处理)的进步,在栽培作物植物中并不经常遇到严重胁迫。因此,由轻度胁迫诱导的受损生长对于农业往往是不受欢迎的特征。轻度胁迫是植物所暴露的常见生物胁迫和/或非生物(环境)胁迫。非生物胁迫可以因干旱或过量的水、缺氧胁迫、盐胁迫、化学毒性、氧化胁迫和热、寒冷或冰冻温度所致。非生物胁迫可以是因水胁迫(尤其因为干旱)、盐胁迫、氧化胁迫或离子胁迫引起的渗透胁迫。生物胁迫一般是由病原体如细菌、病毒、真菌和昆虫引起的那些胁迫。
具体而言,本发明的方法可以在非胁迫条件下或在轻度干旱条件开展以产生相对于对照植物具有提高的产量的植物。如Wang等人(Planta(2003)218:1-14)中报道,非生物胁迫导致一系列不利地影响植物生长及生产量的形态学、生理学、生物化学和分子变化。干旱、盐度、极端温度和氧化胁迫已知是相互联系的并可以通过相似机制诱导生长损害及细胞损害。Rabbani等人(Plant Physiol(2003)133:1755-1767)描述了干旱胁迫与高盐度胁迫之间极高程度的“交互作用”。例如,干旱和/或盐化作用主要表现为渗透胁迫,从而导致细胞内稳态和离子分布的破坏。经常伴随高温或低温、盐度或干旱胁迫的氧化胁迫可以引起功能性蛋白和结构蛋白变性。因此,这些多样的环境胁迫常常激活相似的细胞信号传导途径和细胞应答,如产生胁迫蛋白、上调抗氧化物质、积累兼容性溶质和生长停滞。如本文中所用的术语“非胁迫”条件是允许植物最佳生长的那些环境条件。本领域技术人员清楚对于给定地点的正常土壤条件和气候条件。具有最佳生长条件(在非胁迫条件下培育)的植物一般以增加的优选顺序产生该植物在给定环境中至少90%、87%、85%、83%、80%、77%或75%的平均产量。平均产量可以基于收获量和/或季节计算。本领域技术人员清楚作物的平均生产产量。
相对于在可比较条件下培育的对照植物,本发明方法的实施赋予在非胁迫条件下或在轻度干旱条件下培育的植物提高的产量。因此,根据本发明,提供了用于在非胁迫条件下或在轻度干旱条件下培育的植物中提高产量的方法,所述方法包括增加植物中编码JMJC多肽的核酸表达。
相对于在可比较条件下培育的对照植物,本发明方法的实施赋予在营养缺乏条件下、尤其在缺氮条件下培育的植物提高的产量。因此,根据本发明,提供了用于在营养缺乏条件下培育的植物中提高产量的方法,所述方法包括增加植物中编码JMJC多肽的核酸表达。营养缺乏可以因营养素如氮、磷酸盐和其他含磷化合物、钾、钙、镉、镁、锰、铁和硼等缺少或过多所致。
本发明包括通过本发明方法可获得的植物或其部分(包括种子)。所述植物或其部分包含编码如上文定义的JMJC多肽的核酸转基因。
本发明也提供了基因构建体和载体以促进在植物中导入和/或表达编码JMJC多肽的核酸。所述基因构建体可以插入适于转化至植物并适于在转化细胞中表达目的基因的载体,所述载体可以是市售的。本发明也提供了如本文中定义的基因构建体在本发明方法中的用途。
更具体地,本发明提供了构建体,其包含:
(a)编码如上文定义的JMJC多肽的核酸;
(b)能够驱动(a)的核酸序列表达的一个或多个控制序列;和任选地
(c)转录终止序列。
优选地,编码JMJC多肽的核酸如上文定义。术语“调控序列”和“终止序列”如本文中的定义。
用包含任意上述核酸的载体转化植物。技术人员非常了解必须存在于所述载体上以便成功转化、选择和增殖含有目的序列的宿主细胞的遗传元件。该目的序列有效地与一个或多个调控序列(至少与启动子)连接。
有利地,任意类型的启动子,无论是天然的或人工的,可以用来驱动所述核酸序列的表达。组成型启动子是在所述方法中特别有用的。对于多种启动子类型的定义,见本文中的“定义”部分。
应当明白本发明的应用不限于由SEQ ID NO:73代表的编码JMJC多肽的核酸,本发明的应用也不限于编码JMJC多肽的核酸在受组成型启动子驱动时的表达。
组成型启动子优选地是GOS2启动子,优选地是来自稻的GOS2启动子。还优选地,所述组成型启动子由基本上与SEQ ID NO:75相似的核酸序列代表,最优选地该组成型启动子如SEQ ID NO:75所代表。对于组成型启动子的其他例子,见本文中的“定义”部分。
任选地,可以在导入植物的构建体中使用一个或多个终止子序列。额外的调节元件可以包括转录增强子以及翻译增强子。本领域技术人员将知道可能适用于实施本发明的终止子和增强子序列。如定义部分中描述,内含子序列也可以添加至5’非翻译区(UTR)或编码序列中,以提高细胞质内聚集的成熟信使的数量。(除启动子、增强子、沉默子、内含子序列、3’UTR和/或5’UTR区域之外的)其他调控序列可以是蛋白质/或RNA稳定元件。此类序列将是已知的或可以由本领域技术人员轻易获得。
本发明的基因构建体还可以包括对于在特定细胞类型中维持和/或复制所需要的复制起点序列。一个例子是当需要基因构建体作为游离型遗传元件(例如质粒或粘粒分子)在细菌细胞中维持时的复制起点。优选的复制起点包括但不限于f1-ori和colE1。
为检测如用于本发明方法中的核酸序列的成功转移和/或选择包含这些核酸的转基因植物,有利的是使用标记基因(或报道基因)。因此,所述基因构建体可以任选地包含选择标记基因。选择标记在本文的“定义”部分中更详细地描述。
已知当核酸稳定或瞬时地整合至植物细胞时,仅少数细胞摄取了外来DNA,并且根据需要,将其整合至细胞的基因组中,这取决于所用的表达载体和所用的转染技术。为鉴定并选择这些整合体,编码选择标记的基因(如上文所述的基因)通常连同目的基因一起导入宿主细胞。这些标记可以在这些基因例如通过常规方法缺失而无功能的突变体中使用。此外,编码选择标记的核酸分子可以在包含编码本发明多肽或在本发明方法中所用多肽的序列的相同载体上,或在独立的载体上导入宿主细胞。已经用所导入核酸稳定转染的细胞可以通过选择作用鉴定(例如具有整合的选择标记的细胞存活而其他细胞死亡)。一旦不再需要所述标记基因时,可以从转基因细胞中去掉或切除它们。用于移出标记基因的技术是本领域已知的,有用技术在上文定义部分中描述。
本发明也提供了用于产生转基因植物的方法,所述转基因植物相对于对照植物具有增强的产量相关性状,其中所述方法包括在植物中导入并表达编码如上文所定义的JMJC多肽的任意核酸。
更具体地,本发明提供了用于产生转基因植物的方法,所述转基因植物具有增加的增强产量相关性状、尤其提高的(种子)产量,其中所述方法包括:
(i)在植物或植物细胞中导入并表达编码JMJC多肽的核酸;和
(ii)在促进植物生长和发育的条件下培养植物细胞。
(i)的核酸可以是能够编码如本文中定义的JMJC多肽的任意核酸。
所述核酸可以直接导入植物细胞或导入植物自身(包括导入组织、器官或植物的任何其他部分)。根据本发明的优选特征,该核酸优选地通过转化作用导入植物。术语“转化”在本文的“定义”部分中更详细地描述。
遗传修饰的植物细胞可以通过技术人员熟悉的全部方法再生。合适的方法可以在上文提及的S.D.Kung和R.Wu,Potrykus或和Willmitzer的出版物中找到。
通常在转化后,对植物细胞或细胞群体选择一个或多个标记的存在性,其中所述标记由随同目的基因一起共转移的植物可表达基因编码,随后将转化材料再生成完整植物。为了选择转化植物,在所述转化中获得的植物材料原则上经历选择性条件,从而转化植物可以与非转化植物区分。例如,可以将以上述方式获得的种子播种,并且在初始培育期间后,通过喷洒进行合适的选择。另一种可能性在于根据需要消毒后,在使用合适选择剂的琼脂板上培育种子,从而仅转化的种子可以长成植物。备选地,对所述转化植物筛选选择标记(如上文所述的选择标记)的存在性。
在DNA转移和再生后,推定转化的植物也可以例如使用DNA印迹分析对目的基因的存在性、拷贝数和/或基因组构造进行评价。备选地或额外地,新导入的DNA的表达水平可以使用RNA印迹分析和/或蛋白质印迹分析或这两种分析法监测,这两项技术均是本领域普通技术人员熟知的。
产生的转化植物可以通过多种方法繁殖,如通过克隆繁殖法或经典育种技术。例如,第一世代(或T1)转化植物可以进行自交并且选择纯合的第二世代(或T2)转化体,并且T2植物随后可以通过经典育种技术进一步繁殖。产生的转化生物可以采取多种形式。例如,它们可以是转化细胞和非转化细胞的嵌合体;克隆性转化体(例如,被转化以含有表达盒的全部细胞);转化组织和非转化组织的移植体(例如在植物中,与未转化接穗嫁接的转化根状茎)。
本发明明确地扩展至由本文中所述的任意方法产生的任意植物细胞或植物,并扩展至全部植物部分及其繁殖体。本发明进一步扩展以包括已经由前述任意方法产生的原代转化或转染细胞、组织、器官或完整植物的子代,唯一要求是子代表现与如本发明方法中的亲代相同的基因型和/或表型特征。
本发明也包括含有编码如本文以上所定义JMJC多肽的分离核酸的宿主细胞。本发明的优选宿主细胞是植物细胞。对于本发明方法中所用核酸或载体、表达盒或构建体或载体的宿主植物原则上有利地是能够合成在本发明方法中所使用多肽的全部植物。
本发明的方法有利地适用于任意植物。在本发明方法中特别有用的植物包括属于植物界超家族、尤其单子叶和双子叶植物的全部植物,包括饲用或饲料豆科植物、观赏植物、粮食作物、树或灌木。根据本发明的一个优选实施方案,所述植物是作物植物。作物植物的例子包括大豆、向日葵、卡诺拉油菜、苜蓿、油菜、棉花、番茄、马铃薯和烟草。还优选地,所述植物是单子叶植物。单子叶植物的例子包括甘蔗。更优选地,所述植物是谷物植物。谷物植物的例子包括稻、玉米、小麦、大麦、谷子、黑麦、小黑麦属、高粱和燕麦。
本发明也扩展至植物的可收获部分如,但不限于种子、叶、果实、花、茎、根、根状茎、块茎和球茎。本发明进一步涉及了衍生自、优选直接衍生自此种植物的可收获部分的产品,如干燥颗粒或粉末、油、脂肪和脂肪酸、淀粉或蛋白质。
根据本发明的优选特征,受调节的表达是增加的表达。用于增加核酸或基因或基因产物表达的方法是本领域中充分经文献报道的并且在定义部分中提供了例子。
如上所述,用于调节(优选地增加)编码JMJC多肽的核酸表达的优选方法是通过在植物中导入并表达编码JMJC多肽的核酸;但是,实施本方法的效果,即增强产量相关性状,也可以使用包括但不限于T-DNA活化标签法、TILLING、同源重组在内的其他熟知技术实现。在定义部分中提供了对这些技术的描述。
本发明也包括编码如本文中所述JMJC多肽的核酸的用途,和这些JMJC多肽的用途,用于增强植物中任意的前述产量相关性状。
编码本文中所述JMJC多肽的核酸或JMJC多肽自身可以用于育种程序中,在所述育种程序中鉴定到可以遗传地与编码JMJC多肽的基因连锁的DNA标记。所述核酸/基因或JMJC多肽自身可以用来定义分子标记。这种DNA或蛋白质标记随后可以在育种程序中用来在本发明的方法中选择具有如上文所定义的增强的产量相关性状的植物。
编码JMJC多肽的核酸/基因的等位变体也可以用于标记辅助的育种程序中。此类育种程序有时需要使用例如EMS诱变法通过对植物进行诱变处理而导入等位变异;备选地,所述程序可以从收集并非故意造成的所谓“自然”源性等位变体开始。随后进行等位变体的鉴定,例如通过PCR法。此后是步骤:选择所讨论和导致产量提高的序列的优异等位变体。选择一般通过监测含有所讨论序列的不同等位变体的植物的生长性能而实施。生长性能可以在温室或在田间监测。其他任选步骤包括将其中鉴定到优异等位变体的植物与另一种植物杂交。这可能用来例如产生感兴趣的表型特征组合。
编码JMJC多肽的核酸也可以作为探针用于遗传地或物理地绘制所述探针构成其一部分的基因并且用作与这些基因连锁的性状的标记。此类信息可以用于植物育种中,以开发具有所希望表型的品系。编码JMJC多肽的核酸的这种用途仅需要具有至少15个核苷酸长度的核酸序列。编码JMJC多肽的核酸可以用作限制性片段长度多态性(RFLP)标记。限制性消化的植物基因组DNA的DNA印迹物(Sambrook J,Fritsch EF和ManiatisT(1989)Molecular Cloning,A Laboratory Manual)可以用编码JMJC多肽的核酸探测。所得的结合图式随后可以使用计算机程序如MapMaker(Lander等人(1987)Genomics 1:174-181)进行遗传分析以构建遗传图。此外,该核酸可以用来探测含有一组个体的限制性核酸内切酶处理的基因组DNA的DNA印迹物,其中所述的一组个体代表具有定义的遗传杂交的亲代和子代。DNA多态性的分离是明显的并用来计算编码JMJC多肽的核酸在先前使用这个群体获得的遗传图中的位置(Botstein等人(1980)Am.J.Hum.Genet.32:314-331)。
在Bernatzky和Tanksley(1986)Plant Mol.Biol.Reporter 4:37-41中描述了植物基因来源的探针的产生及其在遗传作图中的用途。许多出版物描述了使用以上概述的方法学或其变例对特定cDNA克隆的遗传作图。例如,F2互交群、回交群、随机交配群、邻近纯合系和其他个体群体可以用于作图。此类方法学是本领域技术人员熟知的。
所述核酸探针也可以用于物理作图(即序列在物理图上的排列;见Hoheisel等在:Non-mammalian Genomic Analyasis:A Practical Guide,Academic press 1996,第319-346页及其中引用的参考文献)。
在另一个实施方案中,所述核酸探针可以在直接荧光原位杂交(FISH)作图法(Trask(1991)Trends Genet.7:149-154)中使用。尽管当前的FISH作图法支持使用大的克隆(几个kb至几百个kb;见Laan等人(1995)Genome Res.5:13-20),然而灵敏度的改善可以允许使用更短探针进行FISH作图。
用于遗传作图及物理作图的多种基于核酸扩增的方法可以使用所述核酸而实施。方法例子包括等位基因特异性扩增法(Kazazian(1989)J.Lab.Clin.Med 11:95-96)、PCR扩增片段的多态性(CAPS;Sheffield等人(1993)Genomics 16:325-332)、等位基因特异性连接(Landegren等人(1988)Science 241:1077-1080)、核苷酸延伸反应(Sokolov(1990)Nucleic Acid Res.18:3671)、放射杂交作图(Walter等人(1997)Nat.Genet.7:22-28)和Happy作图法(Dear和Cook(1989)Nucleic Acid Res.17:6795-6807)。对于这些方法,使用一种核酸的序列来设计并产生在扩增反应或在引物延伸反应中使用的引物对。此类引物的设计是本领域技术人员熟知的。在使用基于PCR遗传作图的方法中,可能需要在对应于当前核酸序列的区域中鉴定作图交叉的亲代之间的DNA序列差异。但是,这通常对作图法而言不是必需的。
如前文所述,本发明方法产生了具有增强的产量相关性状的植物。这些性状也可以与经济上有利的其他性状组合,如其他的产量增强性状、针对其他非生物胁迫和生物胁迫的耐受性、调节多种构造性特征和/或生物化学特征和/或生理学特征的性状。
III.CKI(酪蛋白激酶I)多肽
出人意料地,现在已经发现:调节植物中编码CKI多肽的核酸表达产生了相对于对照植物具有增强的产量相关性状的植物。根据第一实施方案,本发明提供了用于相对于对照植物增强植物中产量相关性状的方法,包括调节植物中编码CKI多肽的核酸表达。
用于调节(优选提高)编码CKI多肽的核酸表达的优选方法是在植物中导入并表达编码CKI多肽的核酸。
下文对“在本发明方法中有用的蛋白质”的任意称谓意指如本文中定义的CKI多肽。下文对“在本发明方法中有用的核酸”的任意称谓意指能够编码这种CKI多肽的核酸。待导入植物(并且因而在实施本发明方法中有用)的核酸是编码现在将描述的蛋白质类型的任意核酸,下文也称作“CKI核酸”或“CKI基因”。
如本文中定义的“CKI多肽”指由SEQ ID NO:174代表的蛋白质并指其同源物(直向同源物和旁系同源物)。优选地,SEQ ID NO:174的同源物具有酪蛋白激酶结构域。
术语“结构域”和“基序”在本文中的“定义”部分定义。存在用于鉴定结构域的专业数据库,例如,SMART(Schultz等人(1998)Proc.Natl.Acad.Sci.USA 95,5857-5864;Letunic等人(2002)Nucleic Acids Res 30,242-244)、InterPro(Mulder等,(2003)Nucl.Acids.Res.31,315-318)、Prosite(Bucher和Bairoch(1994),用于生物分子序列基序的概括特征结构及其在自动化序列解读中的功能(A generalized profile syntax forbiomolecular sequences motifs and its function in automatic sequenceinterpretation).(在)ISMB-94;第二届分子生物学智能系统国际会议文集.Altman R.,Brutlag D.,Karp P.,Lathrop R.,Searls D.编辑,第53-61页,AAAIPress,Menlo Park;Hulo等,Nucl.Acids.Res.32:D134-D137,(2004))或Pfam(Bateman等,Nucleic Acids Research 30(1):276-280(2002))。一组用于计算机方式分析蛋白质序列的工具可在ExPASY蛋白质组服务器上获得(瑞士生物信息研究所维护(Gasteiger等,ExPASy:用于深入认识和分析蛋白质的蛋白质组服务器(The proteomics server for in-depth proteinknowledge and analysis),Nucleic Acids Res.31:3784-3788(2003))。结构域或基序也可以使用常规技术如通过序列比对进行鉴定。
用于比对序列以进行比较的方法是本领域熟知的,此类方法包括GAP、BESTFIT、BLAST、FASTA和TFASTA。GAP使用Needleman和Wunsch算法((1970)J Mol Biol 48:443-453)以找到使匹配数最大化并使空位数最小化的两个序列的总体(即覆盖完整序列的)比对结果。BLAST算法(Altschul等人(1990)J Mol Biol 215:403-10)计算序列同一性百分数并在两个序列之间开展相似性的统计分析。用于开展BLAST分析的软件是通过国家生物技术信息中心(NCBI)可公开获得的。同源物可以使用例如ClustalW多重序列比对算法(1.83版本),以默认配对比对参数和百分数评分方法轻易地鉴定。相似性和同一性的总体百分数也可以使用MatGAT软件包中的可用方法之一确定(Campanella等,BMC Bioinformatics.2003年7月10日;4:29.MatGAT:使用蛋白质序列或DNA序列产生相似性/同一性矩阵的一种应用(an application that generates similarity/identitymatrices using protein or DNA sequences))。如本领域技术人员显而易见,可以进行少许手工编辑以优化保守基序之间的比对。此外,作为使用全长序列以鉴定同源物的替代,也可以使用特定结构域。利用上文提及的程序,使用默认参数可以在完整核酸或氨基酸序列范围或保守基序范围内确定序列同一性值。
另外,在本发明方法中有用的CKI多肽,就SEQ ID NO:174和其同源物而言,CKI蛋白一般具有激酶活性。用于测量激酶活性的方法是本领域已知的。
本发明分别通过用SEQ ID NO:173所代表的核酸序列转化植物进行说明,其中所述的核酸序列编码SEQ ID NO:174的多肽序列。但是,本发明的实施不限于这些序列;本发明的方法可以有利地使用编码CKI的任意核酸或如本文中定义的CKI多肽实施。
可以在本领域已知的数据库中找到编码CKI多肽的核酸的例子。此类核酸用于实施本发明的方法中。直向同源物和旁系同源物可以通过开展所谓交互性blast搜索轻易地鉴定,术语“直向同源物”和“旁系同源物”如本文中定义。通常,这包括第一BLAST,其中所述的第一BLAST包括将查询序列(例如使用SEQ ID NO:174)针对任意序列数据库,如可公开获得的NCBI数据库进行BLAST。当从核苷酸序列开始时,一般使用BLASTN或TBLASTX(使用标准默认值),并且当从蛋白质序列开始时,使用BLASTP或TBLASTN(使用标准默认值)。可以任选地筛选BLAST结果。筛选结果或非筛选结果的全长序列随后针对来自生物的序列进行反向BLAST搜索(第二BLAST),其中查询序列从所述的生物中衍生(在查询序列是SEQ ID NO:173或SEQ ID NO:174的情况下,第二BLAST因而将针对烟草序列进行)。随后比较第一BLAST和第二BLAST的结果。若来自第一blast的高阶位命中是源自与衍生查询序列的物种相同的物种,则鉴定到旁系同源物,随后一个反向BLAST理想地在最高命中当中产生该查询序列;若在第一BLAST中的高阶位命中不是源自与衍生查询序列的物种相同的物种,则鉴定到直向同源物,并且在反向BLAST时,优选地产生属于最高命中当中的该查询序列。
高阶位命中是具有低E-值的那些命中。E-值越低,评分越显著(或换句话说,偶然发现该命中的几率越低)。E-值的计算是本领域熟知的。除了E-值外,比较过程也通过同一性百分数评分。同一性百分数指两个所比较的核酸(或多肽)序列之间特定长度范围内相同的核苷酸(或氨基酸)的数目。在大型家族的情况下,可以使用ClustalW,随后使用邻接树法,以帮助观察相关基因的聚集和鉴定直向同源物和旁系同源物。
编码SEQ ID NO:174的同源物和衍生物的核酸变体也可以用于实施本发明的方法中,术语“同源物”和“衍生物”如本文中定义。还用于本发明方法中的是是这样的核酸,其编码SEQ ID NO:174的直向同源物或旁系同源物的同源物和衍生物。用于本发明方法中的同源物和衍生物与衍生它们的未修饰蛋白质具有基本上相同的生物学活性和功能活性。
在实施本发明方法中有用的其他核酸变体包括编码CKI多肽的核酸的部分、与编码CKI多肽的核酸杂交的核酸、编码CKI多肽的核酸的剪接变体、编码CKI多肽的核酸的等位变体和通过基因改组获得的编码CKI多肽的核酸的变体。术语“杂交序列”、“剪接变体”、“等位变体”和“基因改组作用”如本文中所述。
编码CKI多肽的核酸不需要是全长核酸,因为本发明方法的实施不取决于全长核酸序列的使用。根据本发明,提供了用于增强植物中产量相关性状的方法,包括在植物中导入并表达SEQ ID NO:173的一部分或编码SEQ ID NO:174的直向同源物、旁系同源物或同源物的核酸的一部分。
核酸的一部分可以例如通过对所述核酸产生一个或多个缺失而制备。所述部分可以以分离的形式使用或它们可以与其他编码(或非编码)序列融合,例如旨在产生组合有几种活性的蛋白质。与其他编码序列融合时,在翻译时产生的所得多肽可以比对于该蛋白质部分所预测的多肽更大。
在本发明方法中有用的部分编码如本文中定义的CKI多肽,并且基本上具有如SEQ ID NO:174中所给出氨基酸序列相同的生物学活性。优选地,此部分是在SEQ ID NO:173中给出的任一核酸的一部分,或是编码在SEQ ID NO:173中所给出的任一氨基酸序列的直向同源物或旁系同源物的核酸的一部分。优选地,该部分的长度是至少500、550、600、650、700、750、800、850、900、950、1000、1200、1300、1400个连续核苷酸,所述连续核苷酸属于SEQ ID NO:173,或属于编码SEQ ID NO:174的直向同源物或旁系同源物的核酸。最优选地,该部分是SEQ ID NO:173的核酸的一部分。
在本发明方法中有用的另一种核酸变体是能够在降低的严格条件下、优选在严格条件下与编码如本文中定义的CKI多肽的核酸或与如本文中定义的部分杂交的核酸。
根据本发明,提供了用于增强植物中产量相关性状的方法,包括在植物中导入并表达能够与SEQ ID NO:173杂交的核酸,或包括在植物中导入并表达能够与编码SEQ ID NO:173的直向同源物、旁系同源物或同源物的核酸杂交的核酸。
在本发明方法中有用的杂交序列编码如本文中定义的CKI多肽,基本上具有如SEQ ID NO:174中所给出氨基酸序列相同的生物学活性。优选地,该杂交序列能够与SEQ ID NO:173或与该序列的一部分杂交,所述的一部分如上文定义,或所述杂交序列能够与编码SEQ ID NO:174的直向同源物或旁系同源物的核酸杂交。
在本发明方法中有用的另一种核酸变体是编码如上文所定义的CKI多肽的剪接变体,剪接变体如本文中定义。
根据本发明,提供了用于增强植物中产量相关性状的方法,包括在植物中导入并表达SEQ ID NO:173的剪接变体或编码SEQ ID NO:174的直向同源物、旁系同源物或同源物的核酸的剪接变体。
在实施本发明方法中有用的另一种核酸变体是编码如上文所定义CKI多肽的核酸的等位变体,等位变体如本文中定义。
根据本发明,提供了用于增强植物中产量相关性状的方法,包括在植物中导入并表达SEQ ID NO:173的等位变体,或包括在植物中导入并表达核酸的剪接变体,其中所述核酸编码由SEQ ID NO:174代表的氨基酸序列的直向同源物、旁系同源物或同源物。
本发明方法中有用的等位变体基本上具有与SEQ ID NO:174的CKI多肽相同的生物学活性。等位变体存在于自然界中,并且在本发明的方法中包括这些天然等位基因的用途。基因改组或定向进化也可以用来产生编码如上文定义的CKI多肽的核酸的变体;术语“基因改组”如本文中定义。
根据本发明,提供了用于增强植物中产量相关性状的方法,包括在植物中导入并表达SEQ ID NO:173的变体,或包括在植物中导入并表达编码SEQ ID NO:174的直向同源物、旁系同源物或同源物的核酸的变体,其中所述变体核酸通过基因改组获得。
另外,核酸变体也可以通过位点定向诱变获得。几种方法可用于实现位点定向诱变,最常见的是基于PCR的方法(Current Protocols inMolecular Biology.Wiley编辑)。
编码CKI多肽的核酸可以衍生自任何天然来源或人工来源。该核酸可以通过人类有意操作,在组成和/或基因组环境方面从其天然形式中修饰而来。优选地,编码CKI多肽的核酸来自植物。在SEQ ID NO:173的情况下,编码的CKI多肽核酸优选地来自双子叶植物,更优选地来自茄科(Solanaceae)科,该核酸最优选地来自烟草。
本发明方法的实施产生了具有增强的产量相关性状的植物。尤其,本发明方法的实施产生了相对于对照植物而言,具有提高的早期生长势和提高的产量、尤其提高的生物量和提高的种子产量的植物。术语“产量”和“种子产量”在本文的“定义”部分中更详细地描述。
本文中对增强的产量相关性状的称谓意指早期生长势和/或植物的一个或多个部分的生物量(重量)增加,所述的部分可以包括地上(可收获的)部分和/或(可收获的)地下部分。尤其,此类可收获部分是生物量和/或种子,并且本发明方法的实施产生了相对于对照植物的早期生长势、生物量或种子产量而言,具有提高的早期生长势、生物量或种子产量的植物。
以谷物为例,产量提高可以表现为以下一个或多个指标:每公顷或英亩已建立的植物数目增加、每株植物花序数的提高、行数、每行核粒数、核粒重、千粒核重、花序长度/直径的提高、种子充实率(即充实种子数除以种子总数并乘以100)提高,及其他。以稻为例,产量提高可以自身表现为下列一种或多种指标的提高:每公顷或英亩植物数、每株植物的花序数、每花序的小穗数、每个花序的花(小花)数目(其表述为充实种子数对原发花序数的比)、种子充实率(即充实种子数除以种子总数并乘以100)提高、千粒核重提高及其他。
本发明提供了用于相对于对照植物提高植物的产量、尤其生物量和/或种子产量的方法,所述方法包括调节植物中编码如本文中定义的CKI多肽的核酸表达,优选地增加该核酸表达。
由于本发明的转基因植物具有提高的产量,故相对于对照植物的生长速率,这些植物有可能在其生活周期的对应阶段(在其生活周期的至少部分期间)表现提高的生长速率。
提高的生长速率可以是植物的一个或多个部分(包括种子)特有的,或可以基本上遍及整个植物。具有提到的生长速率的植物可以具备较短的生活周期。植物的生活周期可以意指从干燥成熟种子成长直至植物已经产生与起始材料相似的干燥成熟种子的阶段所需要的时间。这个生活周期可以受以下因素影响,如早期生长势、生长速率、绿度指数、开花时间和种子成熟速度。生长速率的提高可以在植物生活周期的一个或多个阶段上或在基本上整个植物生活周期期间发生。提高的生长速率在植物生活周期的早期期间可以反映增强的生长势。生长速率的提高可以改变植物的收获周期,从而允许植物较晚播种和/或较早收获,而这本来是不可能的(相似效果可以随较早的开花时间获得)。若生长速率充分提高,则可以允许进一步播种相同植物物种的种子(例如播种并收获稻植物,随后播种并收获其他稻植物,全部稻植物均处于一个常规生长时期中)。类似地,若生长速率充分地提高,可以允许进一步播种不同植物物种的种子(例如播种并收获谷物植物,随后例如播种并任选收获大豆、马铃薯或任何其他合适的植物)。在一些作物植物的例子中,来自相同根状茎的额外收获次数也可以是可能的。改变植物的收获周期可以导致每英亩一年生物量生产提高(原因在于可以培育并收获任何具体植物的次数(即在一年中)提高)。生长速率的提高也可以允许转基因植物在比其野生型对应物更广泛的地理区域内培育,因为培育作物的地域限制往往由栽种时期(早季)或在收获时期(晚季)的不利环境条件决定。这类不利条件可以避开,若缩短收获周期。生长速率可以通过从生长曲线获得多个参数而确定,此类参数可以是:T-Mid(植物达到50%最大植物大小所花费的时间)和T-90(植物达到50%最大植物大小所花费的时间),以及其他。
根据本发明的优选特征,本发明方法的实施产生了相对于对照植物而言,具有提高的生长速率的植物。因此,根据本发明,提供了用于提高植物生长速率的方法,所述方法包括在植物中调节、优选地提高编码如本文中定义的CKI多肽的核酸表达。在具体实施方案中,本发明方法的实施产生早期生长势提高的植物。
与对照植物相比较,无论所述植物处于非胁迫条件下或无论所述植物暴露于多种胁迫,产量和/或生长速率的提高均出现。植物一般通过生长得更慢而应答于胁迫暴露。在严重胁迫条件下,植物甚至可以完全停止生长。另一方面,轻度胁迫在本文中定义为植物所暴露的任何下述胁迫,其中所述的胁迫未导致植物完全停止生长,但同时不能恢复生长。与非胁迫条件下的对照植物相比较,轻度胁迫在本发明意义中导致受胁迫植物的生长降低小于40%、35%或30%、优选地小于25%、20%或15%、更优选地小于14%、13%、12%、11%或10%或更低。由于农业实践(灌溉、施肥、杀虫剂处理)的进步,在栽培作物植物中并不经常遇到严重胁迫。因此,由轻度胁迫诱导的受损生长对于农业往往是不受欢迎的特征。轻度胁迫是植物所暴露的常见生物胁迫和/或非生物(环境)胁迫。非生物胁迫可以因干旱或过量的水、缺氧胁迫、盐胁迫、化学毒性、氧化胁迫和热、寒冷或冰冻温度所致。非生物胁迫可以是因水胁迫(尤其因为干旱)、盐胁迫、氧化胁迫或离子胁迫引起的渗透胁迫。生物胁迫一般是由病原体如细菌、病毒、真菌和昆虫引起的那些胁迫。
具体而言,本发明的方法可以在非胁迫条件下或在轻度干旱条件开展以产生相对于对照植物具有提高的产量的植物。如Wang等人(Planta(2003)218:1-14)中报道,非生物胁迫导致一系列不利地影响植物生长及生产量的形态学、生理学、生物化学和分子变化。干旱、盐度、极端温度和氧化胁迫已知是相互联系的并可以通过相似机制诱导生长损害及细胞损害。Rabbani等人(Plant Physiol(2003)133:1755-1767)描述了干旱胁迫与高盐度胁迫之间极高程度的“交互作用”。例如,干旱和/或盐化作用主要表现为渗透胁迫,从而导致细胞内稳态和离子分布的破坏。经常伴随高温或低温、盐度或干旱胁迫的氧化胁迫可以引起功能性蛋白和结构蛋白变性。因此,这些多样的环境胁迫常常激活相似的细胞信号传导途径和细胞应答,如产生胁迫蛋白、上调抗氧化物质、积累兼容性溶质和生长停滞。如本文中所用的术语“非胁迫”条件是允许植物最佳生长的那些环境条件。本领域技术人员清楚对于给定地点的正常土壤条件和气候条件。具有最佳生长条件(在非胁迫条件下培育)的植物一般以增加的优选顺序产生该植物在给定环境中至少90%、87%、85%、83%、80%、77%或75%的平均产量。平均产量可以基于收获量和/或季节计算。本领域技术人员清楚作物的平均生产产量。
相对于在可比较条件下培育的对照植物,本发明方法的实施赋予在非胁迫条件下或在轻度干旱条件下培育的植物提高的产量和/或提高的早期生长势。因此,根据本发明,提供了用于在非胁迫条件下或在轻度干旱条件下培育的植物中提高产量和/或早期生长势的方法,所述方法包括增加植物中编码CKI多肽的核酸表达。
相对于在可比较条件下培育的对照植物,本发明方法的实施赋予在营养缺乏条件下、尤其在缺氮条件下培育的植物提高的产量。因此,根据本发明,提供了用于在营养缺乏条件下培育的植物中提高产量的方法,所述方法包括增加植物中编码CKI多肽的核酸表达。营养缺乏可以因营养素如氮、磷酸盐和其他含磷化合物、钾、钙、镉、镁、锰、铁和硼等缺少所致。
本发明包括通过本发明方法可获得的植物或其部分(包括种子)。所述植物或其部分包含编码如上文定义的CKI多肽的核酸转基因。
本发明也提供了基因构建体和载体以促进在植物中导入和/或表达编码CKI多肽的核酸。所述基因构建体可以插入适于转化至植物并适于在转化细胞中表达目的基因的载体,所述载体可以是市售的。本发明也提供了如本文中定义的基因构建体在本发明方法中的用途。
更具体地,本发明提供了构建体,其包含:
(a)编码如上文定义的CKI多肽的核酸;
(b)能够驱动(a)的核酸序列表达的一个或多个控制序列;和任选地
(c)转录终止序列。
优选地,编码CKI多肽的核酸如上文定义。术语“调控序列”和“终止序列”如本文中的定义。
用包含任意上述核酸的载体转化植物。技术人员非常了解必须存在于所述载体上以便成功转化、选择和增殖含有目的序列的宿主细胞的遗传元件。该目的序列有效地与一个或多个调控序列(至少与启动子)连接。
有利地,任意类型的启动子,无论是天然的或人工的,可以用来驱动所述核酸序列的表达。种子特异性启动子是在本发明方法中特别有用的,优选地,该启动子是胚特异性启动子。对于多种启动子类型的定义,见本文中的“定义”部分。在本发明方法中也有用的是组成型启动子。
应当明白本发明的应用不限于由SEQ ID NO:173代表的编码CKI多肽的核酸,本发明的应用也不限于编码CKI多肽的核酸在受种子特异性启动子驱动时或在受组成型启动子驱动时的表达。
种子特异性启动子优选地是WSI18启动子,优选地是来自稻的WSI18启动子。还优选地,所述种子特异性启动子由基本上与SEQ ID NO:175相似的核酸序列代表,最优选地该种子特异性启动子如SEQ ID NO:175所代表。对于种子特异性启动子的其他例子,见本文中的“定义”部分。
任选地,可以在导入植物的构建体中使用一个或多个终止子序列。额外的调节元件可以包括转录增强子以及翻译增强子。本领域技术人员将知道可能适用于实施本发明的终止子和增强子序列。如定义部分中描述,内含子序列也可以添加至5’非翻译区(UTR)或编码序列中,以提高细胞质内聚集的成熟信使的数量。(除启动子、增强子、沉默子、内含子序列、3’UTR和/或5’UTR区域之外的)其他调控序列可以是蛋白质/或RNA稳定元件。此类序列将是已知的或可以由本领域技术人员轻易获得。
本发明的基因构建体还可以包括对于在特定细胞类型中维持和/或复制所需要的复制起点序列。一个例子是当需要基因构建体作为游离型遗传元件(例如质粒或粘粒分子)在细菌细胞中维持时的复制起点。优选的复制起点包括但不限于f1-ori和colE1。
为检测如用于本发明方法中的核酸序列的成功转移和/或选择包含这些核酸的转基因植物,有利的是使用标记基因(或报道基因)。因此,所述基因构建体可以任选地包含选择标记基因。选择标记在本文的“定义”部分中更详细地描述。一旦不再需要所述标记基因时,可以从转基因细胞中去掉或切除它们。用于移出标记的技术是本领域已知的,有用技术在上文定义部分中描述。
本发明也提供了用于产生转基因植物的方法,所述转基因植物相对于对照植物具有增强的产量相关性状,其中所述方法包括在植物中导入并表达编码如上文所定义的CKI多肽的任意核酸。
更具体地,本发明提供了用于产生转基因植物的方法,所述转基因植物具有增加的增强产量相关性状、尤其提高的早期生长势和/或提高的产量,其中所述方法包括:
(i)在植物或植物细胞中导入并表达编码CKI多肽的核酸;和
(ii)在促进植物生长和发育的条件下培养植物细胞。
(i)的核酸可以是能够编码如本文中定义的CKI多肽的任意核酸。
所述核酸可以直接导入植物细胞或导入植物自身(包括导入组织、器官或植物的任何其他部分)。根据本发明的优选特征,该核酸优选地通过转化作用导入植物。术语“转化”在本文的“定义”部分中更详细地描述。
遗传修饰的植物细胞可以通过技术人员熟悉的全部方法再生。合适的方法可以在上文提及的S.D.Kung和R.Wu,Potrykus或和Willmitzer的出版物中找到。
通常在转化后,对植物细胞或细胞群体选择一个或多个标记的存在性,其中所述标记由随同目的基因一起共转移的植物可表达基因编码,随后将转化材料再生成完整植物。为了选择转化植物,在所述转化中获得的植物材料原则上经历选择性条件,从而转化植物可以与非转化植物区分。例如,可以将以上述方式获得的种子播种,并且在初始培育期间后,通过喷洒进行合适的选择。另一种可能性在于根据需要消毒后,在使用合适选择剂的琼脂板上培育种子,从而仅转化的种子可以长成植物。备选地,对所述转化植物筛选选择标记(如上文所述的选择标记)的存在性。
在DNA转移和再生后,推定转化的植物也可以例如使用DNA印迹分析对目的基因的存在性、拷贝数和/或基因组构造进行评价。备选地或额外地,新导入的DNA的表达水平可以使用RNA印迹分析和/或蛋白质印迹分析或这两种分析法监测,这两项技术均是本领域普通技术人员熟知的。
产生的转化植物可以通过多种方法繁殖,如通过克隆繁殖法或经典育种技术。例如,第一世代(或T1)转化植物可以进行自交并且选择纯合的第二世代(或T2)转化体,并且T2植物随后可以通过经典育种技术进一步繁殖。产生的转化生物可以采取多种形式。例如,它们可以是转化细胞和非转化细胞的嵌合体;克隆性转化体(例如,被转化以含有表达盒的全部细胞);转化组织和非转化组织的移植体(例如在植物中,与未转化接穗嫁接的转化根状茎)。
本发明明确地扩展至由本文中所述的任意方法产生的任意植物细胞或植物,并扩展至全部植物部分及其繁殖体。本发明进一步扩展以包括已经由前述任意方法产生的原代转化或转染细胞、组织、器官或完整植物的子代,唯一要求是子代表现与如本发明方法中的亲代相同的基因型和/或表型特征。
本发明也包括含有编码如本文以上所定义CKI多肽的分离核酸的宿主细胞。本发明的优选宿主细胞是植物细胞。对于本发明方法中所用核酸或载体、表达盒或构建体或载体的宿主植物原则上有利地是能够合成在本发明方法中所使用多肽的全部植物。
本发明的方法有利地适用于任意植物。在本发明方法中特别有用的植物包括属于植物界超家族、尤其单子叶和双子叶植物的全部植物,包括饲用或饲料豆科植物、观赏植物、粮食作物、树或灌木。根据本发明的一个优选实施方案,所述植物是作物植物。作物植物的例子包括大豆、向日葵、卡诺拉油菜、苜蓿、油菜、棉花、番茄、马铃薯和烟草。还优选地,所述植物是单子叶植物。单子叶植物的例子包括甘蔗。更优选地,所述植物是谷物植物。谷物植物的例子包括稻、玉米、小麦、大麦、谷子、黑麦、小黑麦属、高粱和燕麦。
本发明也扩展至植物的可收获部分如,但不限于种子、叶、果实、花、茎、根、根状茎、块茎和球茎。本发明进一步涉及了衍生自、优选直接衍生自此种植物的可收获部分的产品,如干燥颗粒或粉末、油、脂肪和脂肪酸、淀粉或蛋白质。
根据本发明的优选特征,受调节的表达是增加的表达。用于增加核酸或基因或基因产物表达的方法是本领域中充分经文献报道的并且在定义部分中提供了例子。
如上所述,用于调节(优选地增加)编码CKI多肽的核酸表达的优选方法是通过在植物中导入并表达编码CKI多肽的核酸;但是,实施本方法的效果,即增强产量相关性状,也可以使用包括但不限于T-DNA活化标签法、TILLING、同源重组在内的其他熟知技术实现。在定义部分中提供了对这些技术的描述。
本发明也包括编码如本文中所述CKI多肽的核酸的用途,和这些CKI多肽的用途,用于增强植物中任意的前述产量相关性状。
编码本文中所述CKI多肽的核酸或CKI多肽自身可以用于育种程序中,在所述育种程序中鉴定到可以遗传地与编码CKI多肽的基因连锁的DNA标记。所述核酸/基因或CKI多肽自身可以用来定义分子标记。这种DNA或蛋白质标记随后可以在育种程序中用来在本发明的方法中选择具有如上文所定义的增强的产量相关性状的植物。
编码CKI多肽的核酸/基因的等位变体也可以用于标记辅助的育种程序中。此类育种程序有时需要使用例如EMS诱变法通过对植物进行诱变处理而导入等位变异;备选地,所述程序可以从收集并非故意造成的所谓“自然”源性等位变体开始。随后进行等位变体的鉴定,例如通过PCR法。此后是步骤:选择所讨论和导致产量提高的序列的优异等位变体。选择一般通过监测含有所讨论序列的不同等位变体的植物的生长性能而实施。生长性能可以在温室或在田间监测。其他任选步骤包括将其中鉴定到优异等位变体的植物与另一种植物杂交。这可能用来例如产生感兴趣的表型特征组合。
编码CKI多肽的核酸也可以作为探针用于遗传地或物理地绘制所述探针构成其一部分的基因并且用作与这些基因连锁的性状的标记。此类信息可以用于植物育种中,以开发具有所希望表型的品系。编码CKI多肽的核酸的这种用途仅需要具有至少15个核苷酸长度的核酸序列。编码CKI多肽的核酸可以用作限制性片段长度多态性(RFLP)标记。限制性消化的植物基因组DNA的DNA印迹物(Sambrook J,Fritsch EF和Maniatis T(1989)Molecular Cloning,A Laboratory Manual)可以用编码CKI多肽的核酸探测。所得的结合图式随后可以使用计算机程序如MapMaker(Lander等人(1987)Genomics 1:174-181)进行遗传分析以构建遗传图。此外,该核酸可以用来探测含有一组个体的限制性核酸内切酶处理的基因组DNA的DNA印迹物,其中所述的一组个体代表具有定义的遗传杂交的亲代和子代。DNA多态性的分离是明显的并用来计算编码CKI多肽的核酸在先前使用这个群体获得的遗传图中的位置(Botstein等人(1980)Am.J.Hum.Genet.32:314-331)。
在Bernatzky和Tanksley(1986)Plant Mol.Biol.Reporter 4:37-41中描述了植物基因来源的探针的产生及其在遗传作图中的用途。许多出版物描述了使用以上概述的方法学或其变例对特定cDNA克隆的遗传作图。例如,F2互交群、回交群、随机交配群、邻近纯合系和其他个体群体可以用于作图。此类方法学是本领域技术人员熟知的。
所述核酸探针也可以用于物理作图(即序列在物理图上的排列;见Hoheisel等在:Non-mammalian Genomic Analyasis:A Practical Guide,Academic press 1996,第319-346页及其中引用的参考文献)。
在另一个实施方案中,所述核酸探针可以在直接荧光原位杂交(FISH)作图法(Trask(1991)Trends Genet.7:149-154)中使用。尽管当前的FISH作图法支持使用大的克隆(几个kb至几百个kb;见Laan等人(1995)Genome Res.5:13-20),然而灵敏度的改善可以允许使用更短探针进行FISH作图。
用于遗传作图及物理作图的多种基于核酸扩增的方法可以使用所述核酸而实施。方法例子包括等位基因特异性扩增法(Kazazian(1989)J.Lab.Clin.Med 11:95-96)、PCR扩增片段的多态性(CAPS;Sheffield等人(1993)Genomics 16:325-332)、等位基因特异性连接(Landegren等人(1988)Science 241:1077-1080)、核苷酸延伸反应(Sokolov(1990)Nucleic Acid Res.18:3671)、放射杂交作图(Walter等人(1997)Nat.Genet.7:22-28)和Happy作图法(Dear和Cook(1989)Nucleic Acid Res.17:6795-6807)。对于这些方法,使用一种核酸的序列来设计并产生在扩增反应或在引物延伸反应中使用的引物对。此类引物的设计是本领域技术人员熟知的。在使用基于PCR遗传作图的方法中,可能需要在对应于当前核酸序列的区域中鉴定作图交叉的亲代之间的DNA序列差异。但是,这通常对作图法而言不是必需的。
如前文所述,本发明方法产生了具有增强的产量相关性状的植物。这些性状也可以与经济上有利的其他性状组合,如其他的产量增强性状、针对其他非生物胁迫和生物胁迫的耐受性、调节多种构造性特征和/或生物化学特征和/或生理学特征的性状。
IV.植物同源域指-同源域(PHDf-HD)多肽
出人意料地,现在已经发现:调节、优选地增加植物中编码PHDf-HD多肽的核酸序列表达产生了相对于对照植物具有增强的产量相关性状、优选增强的种子产量相关性状的植物。根据第一实施方案,本发明提供了用于相对于对照植物增强植物中产量相关性状、优选增强种子产量相关性状的方法,包括调节、优选地增加植物中编码PHDf-HD多肽的核酸序列表达。
用于调节、优选地增加编码PHDf-HD多肽的核酸序列表达的优选方法是在植物中导入并表达编码PHDf-HD多肽的核酸序列。
下文对“在本发明方法中有用的蛋白质”的任意称谓意指如本文中定义的PHDf-HD多肽。下文对“在本发明方法中有用的核酸序列”的任意称谓意指能够编码这种PHDf-HD多肽的核酸序列。待导入植物(并且因而在实施本发明方法中有用)的核酸序列是编码现在将描述的多肽类型的任意核酸序列,下文也称作“PHDf-HD核酸序列”或“PHDf-HD基因”。
如本文中定义的“PHDf-HD多肽”指包含以下结构域的任意多肽:(i)与如SEQ ID NO:233所代表的亮氨酸拉链/植物同源域指(ZIP/PHDf)结构域具有至少25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或更高氨基酸序列同一性的结构域;和(ii)与如SEQ ID NO:234所代表的同源域(HD)具有至少25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或更高氨基酸序列同一性的结构域。
备选地或额外地,如本文中定义的“PHDf-HD多肽”指包含(i)如PFAM00628所代表的PHD结构域;和(ii)如PFAM00046所代表的HD的任意多肽。
备选地或额外地,如本文中定义的“PHDf-HD多肽”指下述的任意多肽序列,其中所述多肽序列在构建HD进化系统树如图13中所绘制的HD进化系统树中使用时,与包含如SEQ ID NO:180所代表多肽序列的PHDf-HD多肽组而不与任何其他HD组聚类。
备选地或额外地,如本文中定义的“PHDf-HD多肽”指下述的任意多肽序列,其中所述多肽序列以增加的优选顺序与如SEQ ID NO:180所代表的PHDf-HD多肽或与本文表D1中给出的任意多肽序列具有至少25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或更高的序列同一性。
术语“结构域”和“基序”在本文中的“定义”部分定义。存在用于鉴定结构域的专业数据库,例如,SMART(Schultz等人(1998)Proc.Natl.Acad.Sci.USA 95,5857-5864;Letunic等人(2002)Nucleic Acids Res 30,242-244)、InterPro(Mulder等,(2003)Nucl.Acids.Res.31,315-318)、Prosite(Bucher和Bairoch(1994),用于生物分子序列基序的概括特征结构及其在自动化序列解读中的功能(A generalized profile syntax forbiomolecular sequences motifs and its function in automatic sequenceinterpretation).(在)ISMB-94;第二届分子生物学智能系统国际会议文集.Altman R.,Brutlag D.,Karp P.,Lathrop R.,Searls D.编辑,第53-61页,AAAIPress,Menlo Park;Hulo等,Nucl.Acids.Res.32:D134-D137,(2004)或Pfam(Bateman等,Nucleic Acids Research 30(1):276-280(2002))。一组用于计算机方式分析蛋白质序列的工具可在ExPASY蛋白质组服务器上获得(瑞士生物信息研究所维护(Gasteiger等,ExPASy:用于深入认识和分析蛋白质的蛋白质组服务器(The proteomics server for in-depth proteinknowledge and analysis),Nucleic Acids Res.31:3784-3788(2003))。结构域也可以使用常规技术如通过序列比对进行鉴定。下文在实施例30和32中提供对SEQ ID NO:180的多肽序列的分析。例如,如SEQ ID NO:180所代表的PHDf-HD多肽包含具有Pfam登录号PF00628的PHD指和具有Pfam登录号PF00046的HD。
用于比对序列以进行比较的方法是本领域熟知的,此类方法包括GAP、BESTFIT、BLAST、FASTA和TFASTA。GAP使用Needleman和Wunsch算法((1970)J Mol Biol 48:443-453)以找到使匹配数最大化并使空位数最小化的两个序列的总体(即覆盖完整序列的)比对结果。BLAST算法(Altschul等人(1990)J Mol Biol 215:403-10)计算序列同一性百分数并在两个序列之间开展相似性的统计分析。用于开展BLAST分析的软件是通过国家生物技术信息中心(NCBI)可公开获得的。同源物可以使用例如ClustalW多重序列比对算法(1.83版本),以默认配对比对参数和百分数评分方法轻易地鉴定。相似性和同一性的总体百分数也可以使用MatGAT软件包中的可用方法之一确定(Campanella等,BMC Bioinformatics.2003年7月10日;4:29.MatGAT:使用蛋白质序列或DNA序列产生相似性/同一性矩阵的一种应用(an application that generates similarity/identitymatrices using protein or DNA sequences))。如本领域技术人员显而易见,可以进行少许手工编辑以优化保守基序之间的比对。此外,作为使用全长序列以鉴定同源物的替代,也可以使用特定结构域。利用上文提及的程序,使用默认参数可以在完整核酸序列或氨基酸序列范围或保守基序范围内确定序列同一性值。本文中实施例31在表D2中描述了如SEQ ID NO:233所代表的ZIP/PHDf与表D1中所列PHDf-HD多肽的ZIP/PHDf之间的同一性百分数,并在表D3中描述了如SEQ ID NO:234所代表的HD与实施例29表D1中所列PHDf-HD多肽的HD之间的同一性百分数。
另外,分别称作碱性段和酸性段的富含碱性氨基酸(Lys和Arg)或酸性氨基酸(Glu和Asp)的氨基酸序列也轻易地可以通过目视检查简单地鉴定(图17)。备选地,使用来自ExPASy服务器的软件程序、尤其ProtParam工具(Gasteiger等,ExPASy:用于深入认识和分析蛋白质的蛋白质组服务器(The proteomics server for in-depth protein knowledge and analysis),Nucleic Acids Res.31:3784-3788(2003)),可以计算一级氨基酸组成(%)以确定多肽结构域是否富含特定氨基酸。目的蛋白的组成随后可以与Swiss-Prot蛋白质序列数据库中的平均氨基酸组成(%)比较。
卷曲螺旋对于鉴定相同蛋白质、相同家族的蛋白质和不相关蛋白质的蛋白质-蛋白质相互作用(如寡聚化)是重要的。PHDf-HD多肽存在至少一个预测的卷曲螺旋区。最近在从序列数据计算性预测卷曲螺旋方面取得长足进展。本领域技术人员熟知算法当中的COILS、PAIRCOIL、PAIRCOIL2、MULTICOIL或MARCOIL可在瑞士生物信息研究所维护的ExPASy蛋白质组工具上获得。在实施例33和图16中分别显示如通过COILS算法分析所产生的SEQ ID NO:180的数字结果和图形结果。在如SEQ ID NO:180所代表的PHDf-HD多肽序列中以强概率鉴定到两个预测的氨基端卷曲螺旋结构域。还以较低的概率预测到一个羧基端卷曲螺旋。
蛋白质亚细胞定位预测的任务是重要的并且得到充分研究。知晓蛋白质的定位有助于阐明其功能。用于蛋白质定位的实验方法的范围从免疫定位至使用绿色荧光蛋白(GFP)对蛋白质加标签。虽然与计算性方法相比此类方法繁琐费累,然而它准确。最近在从序列数据计算性预测蛋白质定位方面取得长足进展。本领域技术人员熟知算法当中的例如PSort、TargetP、ChloroP、LocTree、Predotar、LipoP、MITOPROT、PATS、PTS1、SignalP可在瑞士生物信息研究所维护的ExPASy蛋白质组工具上获得。在实施例34中显示对本发明多肽的亚细胞定位的鉴定。具体地,将本发明的SEQ IDNO:180划归到真核细胞的核区室内。
另外,在本发明方法中有用的PHDf-HD多肽(至少以它们的天然形式)一般,但并非必然具有转录调节活性和与其他蛋白质相互作用的能力。因此,转录调节活性降低、无转录调节活性、蛋白质-蛋白质相互作用能力降低或无蛋白质-蛋白质相互作用能力的PHDf-HD多肽可以同等地用在本发明的方法中。DNA结合活性和蛋白质-蛋白质相互作用可以使用本领域熟知的技术(例如在Current Protocols in Molecular Biology,第1和2卷,Ausubel等人(1994),Current Protocols中)轻易地在体外或体内测定。为了测定PHDf-HD多肽的DNA结合活性,可用几种测定法,如DNA结合凝胶迁移率测定法(或凝胶阻滞测定法;Korfhage等人(1994)Plant C 6:695-708)、体外DNA结合作用测定法(Schindler等人(1993)Plant J 4(1):137-150)或PHDf-HD多肽在酵母、动物和植物细胞中的转录激活作用(Halbach等人(2000)Nucleic Acid Res 28(18):3542-3550)。可以使用使用随机寡核苷酸选择技术(Viola和Gonzalez(2007年5月26)Biochemistry)确定特定的DNA结合序列。
本发明通过用SEQ ID NO:179所代表的核酸序列转化植物进行说明,其中所述的核酸序列编码SEQ ID NO:180的多肽序列。但是,本发明的实施不限于这些序列;本发明的方法可以有利地使用编码PHDf-HD的任意核酸序列或如本文中定义的PHDf-HD多肽实施。
编码PHDf-HD多肽的核酸的例子在本文实施例29的表D1中给出。此类核酸序列用于实施本发明的方法中。在实施例29的表D1中给出的多肽序列是由SEQ ID NO:180所代表的PHDf-HD多肽的直向同源物和旁系同源物的示例序列,术语“直向同源物”和“旁系同源物”如本文中定义。其他直向同源物和旁系同源物可以通过开展所谓交互性blast搜索轻易地鉴定。通常,这包括第一BLAST,其中所述的第一BLAST包括将查询序列(例如使用实施例29的表D1中列出的任意序列)针对任意序列数据库,如可公开获得的NCBI数据库进行BLAST。当从核苷酸序列开始时,一般使用BLASTN或TBLASTX(使用标准默认值),并且当从蛋白质序列开始时,使用BLASTP或TBLASTN(使用标准默认值)。可以任选地筛选BLAST结果。筛选结果或非筛选结果的全长序列随后针对来自生物的序列进行反向BLAST搜索(第二BLAST),其中查询序列从所述的生物中衍生(在查询序列是SEQ ID NO:179或SEQ ID NO:180的情况下,第二BLAST因而将针对拟稻进行)。随后比较第一BLAST和第二BLAST的结果。若来自第一blast的高阶位命中是源自与衍生查询序列的物种相同的物种,则鉴定到旁系同源物,随后一个反向BLAST理想地在最高命中当中产生该查询序列;若在第一BLAST中的高阶位命中不是源自与衍生查询序列的物种相同的物种,则鉴定到直向同源物,并且在反向BLAST时,优选地产生属于最高命中当中的该查询序列。
高阶位命中是具有低E-值的那些命中。E-值越低,评分越显著(或换句话说,偶然发现该命中的几率越低)。E-值的计算是本领域熟知的。除了E-值外,比较过程也通过同一性百分数评分。同一性百分数指两个所比较的核酸(或多肽)序列之间特定长度范围内相同的核苷酸(或氨基酸)的数目。在大型家族的情况下,可以使用ClustalW,随后使用邻接树法,以帮助观察相关基因的聚集和鉴定直向同源物和旁系同源物。聚类于包含SEQ IDNO:180的组中(在图29中富集)的任意序列将被视为属于PHDf-HD多肽的前述定义,并且视为适用于本发明的方法中。
核酸变体也可以用于实施本发明的方法中。此类变体的例子包括编码在实施例29的表D1中所给出的任一多肽序列的同源物和衍生物的核酸序列,术语“同源物”和“衍生物”如本文中定义。还用于本发明方法中的是这样的核酸序列,其编码在实施例29的表D1中所给出的任一多肽序列的直向同源物或旁系同源物的同源物和衍生物。用于本发明方法中的同源物和衍生物与衍生它们的未修饰蛋白质具有基本上相同的生物学活性和功能活性。
在实施本发明方法中有用的其他核酸变体包括编码PHDf-HD多肽的核酸序列的部分、与编码PHDf-HD多肽的核酸序列杂交的核酸序列、编码PHDf-HD多肽的核酸序列的剪接变体、编码PHDf-HD多肽的核酸序列的等位变体和通过基因改组获得的编码PHDf-HD多肽的核酸序列的变体。术语“杂交序列”、“剪接变体”、“等位变体”和“基因改组作用”如本文中所述。
编码PHDf-HD多肽的核酸序列不需要是全长核酸序列,因为本发明方法的实施不取决于全长核酸序列的使用。根据本发明,提供了用于增强植物中产量相关性状、优选增强种子产量相关性状的方法,包括在植物中导入并表达实施例29的表D1中给出的任一核酸序列的一部分或编码实施例29表D1中所给出任意多肽序列的直向同源物、旁系同源物或同源物的核酸序列的一部分。
核酸序列的一部分可以例如通过对所述核酸序列产生一个或多个缺失而制备。所述部分可以以分离的形式使用或它们可以与其他编码(或非编码)序列融合,例如旨在产生组合有几种活性的蛋白质。与其他编码序列融合时,在翻译时产生的所得多肽可以比对于该蛋白质部分所预测的多肽更大。
在本发明方法中有用的部分编码如本文中定义的PHDf-HD多肽,并且基本上具有如实施例29的表D1中所给出多肽序列相同的生物学活性。优选地,此部分是在实施例29的表D1中给出的任一核酸序列的一部分,或是编码在实施例29的表D1中所给出的任一多肽序列的直向同源物或旁系同源物的核酸序列的一部分。优选地,该部分的长度以增加的优选顺序是至少600、800、1000、1200、1400、1600、1800、2000、2200、2400、2600、2800个连续核苷酸,所述连续核苷酸为实施例29的表D1中给出的任一核酸序列或为编码在实施例29的表D1中所给出的任一多肽序列的直向同源物或旁系同源物的核酸序列。最优选地,该部分是SEQ ID NO:179的核酸序列的一部分。优选地,该部分编码下述多肽序列,其中所述多肽序列在构建HD进化系统树如图13中所绘制的HD进化系统树中使用时,与包含如SEQ ID NO:180所代表的多肽序列的PHDf-HD多肽组聚类,而不与任何其他HD组聚类。
在本发明方法中有用的另一种核酸序列变体是能够在降低的严格条件下、优选在严格条件下与编码如本文中定义的PHDf-HD多肽的核酸序列或与如本文中定义的部分杂交的核酸序列。
根据本发明,提供了用于增强植物中产量相关性状、优选增强种子产量相关性状的方法,包括在植物中导入并表达能够与实施例29的表D1中给出的任一核酸序列杂交的核酸序列,或包括在植物中导入并表达这样的核酸序列,其中所述核酸序列能够与编码在实施例29的表D1中给出的任意核酸序列序列的直向同源物、旁系同源物或同源物的核酸序列杂交。
在本发明方法中有用的杂交序列编码如本文中定义的PHDf-HD多肽,并且基本上具有如实施例29的表D1中所给出多肽序列相同的生物学活性。优选地,该杂交序列能够与实施例29的表D1中给出的任一核酸序列或与这些序列中任意序列的一部分杂交,所述的一部分如上文定义,或其中所述杂交序列能够与编码在实施例29的表D1中给出的任一多肽序列的直向同源物或旁系同源物的核酸序列杂交。最优选地,该杂交序列能够与如SEQ ID NO:179所代表的核酸序列或与其一部分杂交。
优选地,该杂交序列编码下述多肽序列,其中所述多肽序列在构建HD进化系统树如图13中所绘制的HD进化系统树中使用时,与包含如SEQ ID NO:180所代表的多肽序列的PHDf-HD多肽组聚类,而不与任何其他HD组聚类。
在本发明方法中有用的另一种核酸序列变体是编码如上文所定义的PHDf-HD多肽的剪接变体,剪接变体如本文中定义。
根据本发明,提供了用于增强植物中产量相关性状、优选增强种子产量相关性状的方法,包括在植物中导入并表达实施例29的表D1中给出的任一核酸序列的剪接变体或编码实施例29表D1中所给出任意多肽序列的直向同源物、旁系同源物或同源物的核酸序列的剪接变体。
优选的剪接变体是由SEQ ID NO:179所代表的核酸序列的剪接变体,或是编码SEQ ID NO:180的直向同源物或旁系同源物的核酸序列的剪接变体。优选地,由该剪接变体序列编码的多肽序列在构建HD进化系统树如图13中所绘制的HD进化系统树中使用时,与包含如SEQ ID NO:180所代表的多肽序列的PHDf-HD多肽组聚类,而不与任何其他HD组聚类。
在实施本发明方法中有用的另一种核酸序列变体是编码如上文所定义PHDf-HD多肽的核酸序列的等位变体,等位变体如本文中定义。
根据本发明,提供了用于增强植物中产量相关性状、优选增强种子产量相关性状的方法,包括在植物中导入并表达实施例29的表D1中给出的任一核酸序列的等位变体,或包括在植物中导入并表达编码实施例29表D1中所给出任意多肽序列的直向同源物、旁系同源物或同源物的核酸序列的等位变体。
在本发明方法中有用的等位变体基本上具有如SEQ ID NO:180的多肽和实施例29的表D1中所述任意多肽序列相同的生物学活性。等位变体存在于自然界中,并且在本发明的方法中包括这些天然等位基因的用途。优选地,所述等位变体是SEQ ID NO:179的等位变体或编码SEQ ID NO:180的直向同源物或旁系同源物的核酸序列的等位变体。优选地,由该等位变体序列编码的多肽序列在构建HD进化系统树如图13中所绘制的HD进化系统树中使用时,与包含如SEQ ID NO:180所代表的多肽序列的PHDf-HD多肽聚类,而不与任何其他HD组聚类。
基因改组或定向进化也可以用来产生编码如上文定义的PHDf-HD多肽的核酸序列的变体;术语“基因改组”如本文中定义。
根据本发明,提供了用于增强植物中产量相关性状、优选增强种子产量相关性状的方法,包括在植物中导入并表达在实施例29的表D1中给出的任一核酸序列的变体,或包括在植物中导入并表达核酸序列的变体,所述的核酸序列编码在实施例29的表D1中给出的任意多肽序列的直向同源物、旁系同源物或同源物,其中所述的变体核酸序列通过基因改组获得。
有利地,本发明提供了至今未知的PHDf-HD核酸和多肽序列。
根据本发明的又一个实施方案,提供了分离的核酸分子,其包含:
(i)由SEQ ID NO:242代表的核酸:
(ii)与SEQ ID NO:242互补的核酸或其片段;
(iii)编码PHDf-HD多肽的核酸,所述的PHDf-HD多肽以增加的优选顺序与SEQ ID NO:243中给出的氨基酸序列具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的序列同一性:
(iv)能够在严格条件下与以上(i)、(ii)或(iii)中给出的任一种核酸杂交的核酸。
根据本发明的又一个实施方案,因而提供了分离的多肽,其包含:
(i)由SEQ ID NO:242代表的核酸:
(ii)与SEQ ID NO:242互补的核酸或其片段;
(iii)编码PHDf-HD多肽的核酸,所述的PHDf-HD多肽以增加的优选顺序与SEQ ID NO:243中给出的氨基酸序列具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的序列同一性:
(iv)能够在严格条件下与以上(i)、(ii)或(iii)中给出的任一种核酸杂交的核酸。
优选地,由通过基因改组获得的变体核酸序列编码的多肽序列在构建HD进化系统树如图13中所绘制的HD进化系统树中使用时,与包含如SEQ ID NO:180所代表的多肽序列的PHDf-HD多肽组聚类,而不与任何其他HD组聚类。
另外,核酸序列变体也可以通过位点定向诱变获得。几种方法可用于实现位点定向诱变,最常见的是基于PCR的方法(Current Protocols inMolecular Biology.Wiley编辑)。
编码PHDf-HD多肽的核酸序列可以衍生自任何天然来源或人工来源。该核酸序列可以通过人类有意操作,在组成和/或基因组环境方面从其天然形式中修饰而来。优选地,编码PHDf-HD多肽的核酸序列来自植物,进一步优选地来自单子叶植物,更优选地来自禾本科(Poacae),最优选地该核酸序列来自稻。
本发明方法的实施产生了具有增强的产量相关性状的植物。尤其,本发明方法的实施产生了相对于对照植物而言,具有提高的产量、尤其提高的种子产量的植物。术语“产量”和“种子产量”在本文的“定义”部分中更详细地描述。
本文中对增强的产量相关性状的称谓意指植物的一个或多个部分的生物量(重量)增加,所述的部分可以包括地上(可收获的)部分和/或(可收获的)地下部分。尤其,此类可收获部分是种子,并且本发明方法的实施产生了相对于对照植物的种子产量而言,具有提高的种子产量的植物。
以谷物为例,产量提高可以表现为以下一个或多个指标:每公顷或英亩已建立的植物数目增加、每株植物花序数的提高、行数、每行核粒数、核粒重、千粒核重、花序长度/直径的提高、种子充实率(即充实种子数除以种子总数并乘以100)提高,及其他。以稻为例,产量提高可以自身表现为下列一种或多种指标的提高:每公顷或英亩植物数、每株植物的花序数、每花序的小穗数、每个花序的花(小花)数目(其表述为充实种子数对原发花序数的比)、种子充实率(即充实种子数除以种子总数并乘以100)提高、千粒核重提高及其他。
本发明提供了用于相对于对照植物提高植物的产量、尤其种子产量的方法,所述方法包括调节植物中编码如本文中定义的PHDf-HD多肽的核酸序列表达,优选地增加该核酸表达。
由于本发明的转基因植物具有增强的产量相关性状、优选增强的种子产量相关性状,故相对于对照植物的生长速率,这些植物有可能在其生活周期的对应阶段(在其生活周期的至少部分期间)表现提高的生长速率。
提高的生长速率可以是植物的一个或多个部分(包括种子)特有的,或可以基本上遍及整个植物。具有提到的生长速率的植物可以具备较短的生活周期。植物的生活周期可以意指从干燥成熟种子成长直至植物已经产生与起始材料相似的干燥成熟种子的阶段所需要的时间。这个生活周期可以受以下因素影响,如早期生长势、生长速率、绿度指数、开花时间和种子成熟速度。生长速率的提高可以在植物生活周期的一个或多个阶段上或在基本上整个植物生活周期期间发生。提高的生长速率在植物生活周期的早期期间可以反映增强的(早期)生长势。生长速率的提高可以改变植物的收获周期,从而允许植物较晚播种和/或较早收获,而这本来是不可能的(相似效果可以随较早的开花时间获得)。若生长速率充分提高,则可以允许进一步播种相同植物物种的种子(例如播种并收获稻植物,随后播种并收获其他稻植物,全部稻植物均处于一个常规生长时期中)。类似地,若生长速率充分地提高,可以允许进一步播种不同植物物种的种子(例如播种并收获谷物植物,随后例如播种并任选收获大豆、马铃薯或任何其他合适的植物)。在一些作物植物的例子中,来自相同根状茎的额外收获次数也可以是可能的。改变植物的收获周期可以导致每英亩一年生物量生产提高(原因在于可以培育并收获任何具体植物的次数(即在一年中)提高)。生长速率的提高也可以允许转基因植物在比其野生型对应物更广泛的地理区域内培育,因为培育作物的地域限制往往由栽种时期(早季)或在收获时期(晚季)的不利环境条件决定。这类不利条件可以避开,若缩短收获周期。生长速率可以通过从生长曲线获得多个参数而确定,此类参数可以是:T-Mid(植物达到50%最大植物大小所花费的时间)和T-90(植物达到50%最大植物大小所花费的时间),以及其他。如本文中定义的生长速率不视为意指较早开花。
根据本发明的优选特征,本发明方法的实施产生了相对于对照植物而言,具有提高的生长速率的植物。因此,根据本发明,提供了用于提高植物生长速率的方法,所述方法包括在植物中调节、优选地提高编码如本文中定义的PHDf-HD多肽的核酸序列表达。
与可比较条件下培育的对照植物相比较,无论所述植物处于非胁迫条件下或无论所述植物暴露于多种胁迫,增强的产量相关性状、优选增强的产量相关性状出现。植物一般通过生长得更慢而应答于胁迫暴露。在严重胁迫条件下,植物甚至可以完全停止生长。另一方面,轻度胁迫在本文中定义为植物所暴露的任何下述胁迫,其中所述的胁迫未导致植物完全停止生长,但同时不能恢复生长。与非胁迫条件下的对照植物相比较,轻度胁迫在本发明意义中导致受胁迫植物的生长降低小于40%、35%或30%、优选地小于25%、20%或15%、更优选地小于14%、13%、12%、11%或10%或更低。由于农业实践(灌溉、施肥、杀虫剂处理)的进步,在栽培作物植物中并不经常遇到严重胁迫。因此,由轻度胁迫诱导的受损生长对于农业往往是不受欢迎的特征。轻度胁迫是植物所暴露的常见生物胁迫和/或非生物(环境)胁迫。非生物胁迫可以因干旱或过量的水、缺氧胁迫、盐胁迫、化学毒性、氧化胁迫和热、寒冷或冰冻温度所致。非生物胁迫可以是因水胁迫(尤其因为干旱)、盐胁迫、氧化胁迫或离子胁迫引起的渗透胁迫。生物胁迫一般是由病原体如细菌、病毒、真菌、线虫和昆虫引起的那些胁迫。如本文中所用的术语“非胁迫”条件是允许植物最佳生长的那些环境条件。本领域技术人员清楚对于给定地点的正常土壤条件和气候条件。
相对于在可比较条件下培育的对照植物,本发明方法的实施产生在非胁迫条件下或在轻度干旱条件下培育的植物,所述植物具有增强的产量相关性状、优选增强的种子产量相关性状。因此,根据本发明,提供了用于在非胁迫条件下或在轻度干旱条件下培育的植物中增强产量相关性状的方法,所述方法包括在植物中调节、优选地增加PHDf-HD多肽的核酸序列表达。具有最佳生长条件的在非胁迫条件下培育的植物一般以增加的优选顺序产生该植物在给定环境中至少90%、87%、85%、83%、80%、77%或75%的平均产量。平均产量可以在给定位置上基于收获量和/或季节计算。本领域技术人员清楚作物的平均生产产量。
相对于在可比较胁迫条件下培育的对照植物,本发明方法的实施产生在非生物胁迫条件下培育的植物,所述植物具有增强的产量相关性状、优选增强的种子产量相关性状。如Wang等人(Planta(2003)218:1-14)中报道,非生物胁迫导致一系列不利地影响植物生长及生产量的形态学、生理学、生物化学和分子变化。干旱、盐度、极端温度和氧化胁迫已知是相互联系的并可以通过相似机制诱导生长损害及细胞损害。Rabbani等人(PlantPhysiol(2003)133:1755-1767)描述了干旱胁迫与高盐度胁迫之间极高程度的“交互作用”。例如,干旱和/或盐化作用主要表现为渗透胁迫,从而导致细胞内稳态和离子分布的破坏。经常伴随高温或低温、盐度或干旱胁迫的氧化胁迫可以引起功能性蛋白和结构蛋白变性。因此,这些多样的环境胁迫常常激活相似的细胞信号传导途径和细胞应答,如产生胁迫蛋白、上调抗氧化物质、积累兼容性溶质和生长停滞。由于多样的环境胁迫激活相似途径,故本发明采用干旱胁迫的示例不应当视为限于干旱胁迫,而更应视为一种筛选法以相对于在可比较的胁迫条件中、通常在非生物胁迫下培育的对照植物,说明如上文定义的PHDf-HD多肽参与增强产量相关性状、优选地增强种子产量相关性状。
如本文中定义的术语“非生物胁迫”意指以下任意一项或多项:水胁迫(因干旱或过量的水所致)、缺氧胁迫、盐胁迫、温度胁迫(因热、寒冷或冰冻温度所致)、化学毒性胁迫和氧化胁迫。根据本发明的一个方面,所述非生物胁迫是渗透胁迫,其选自水胁迫、盐胁迫、氧化胁迫和离子胁迫。优选地,所述水胁迫是干旱胁迫。术语“盐胁迫”不限于常见盐(NaCl),不过可以是由NaCl、KCl、LiCl、MgCl2、CaCl2等中一种或多种盐引起的任意胁迫。
相对于在可比较胁迫条件下培育的对照植物,本发明方法的实施产生这样的植物,所述植物在非生物胁迫条件下具有增强的产量相关性状、优选增强的种子产量相关性状。因此,根据本发明,提供了用于在非生物胁迫条件下培育的植物中增强产量相关性状、优选增强种子产量相关性状的方法,所述方法包括调节、优选地增加植物中编码PHDf-HD多肽的核酸序列表达。根据本发明的一个方面,所述非生物胁迫是渗透胁迫,其选自以下一个或多个胁迫:水胁迫、盐胁迫、氧化胁迫和离子胁迫。
非生物性环境胁迫的另一个例子是需要由所述植物同化以生长和发育的一种或多种营养素的利用率降低。因为营养利用效率强烈地影响植物产量和产品品质,故将大量肥料倾注至田中以优化植物产量和产品品质。植物的生产量通常受三种主要营养素,即磷、钾和氮限制,这三种营养素中,氮通常是是植物生长的限速性元素。因此,植物生长所需的主要营养元素是氮(N)。氮是活细胞中存在的许多重要化合物的组成成分,所述的重要化合物包括氨基酸、蛋白质(酶)、核酸和叶绿素。植物干物质的1.5%-2%是氮而植物总蛋白的大约16%是氮。因此,氮利用率是作物植物生长和生产的主要限制性因素(Frink等人(1999)Proc Natl Acad Sci USA 96(4):1175-1180),并且对蛋白质聚集和氨基酸组成也有重大影响。因此,在氮限制性条件下培育时具有增强的产量相关性状、优选增强的种子产量相关性状的植物是有重大意义的。
相对于在可比较条件下培育的对照植物,本发明方法的实施赋予在营养缺乏条件下、尤其在缺氮条件下培育的植物增强的产量相关性状、优选增强的种子产量相关性状。因此,根据本发明,提供了用于在营养缺乏条件下培育的植物中增强产量相关性状、优选增强种子产量相关性状的方法,所述方法包括调节、优选地增加植物中编码PHDf-HD多肽的核酸序列表达。营养缺乏可以因营养素如氮、磷酸盐和其他含磷化合物、钾、钙、镉、镁、锰、铁和硼等缺少或过多所致。
本发明包括通过本发明方法可获得的植物或其部分(包括种子)或其细胞。所述植物或其部或其细胞分包含编码如上文定义的PHDf-HD多肽的核酸转基因。
本发明也提供了基因构建体和载体以促进植物中编码PHDf-HD多肽的核酸的导入和/或受调节的、优选增加的表达。所述基因构建体可以插入适于转化至植物并适于在转化细胞中表达目的基因的载体,所述载体可以是市售的。本发明也提供了如本文中定义的基因构建体在本发明方法中的用途。
更具体地,本发明提供了构建体,其包含:
(a)编码如上定义的PHDf-HD多肽的核酸序列;
(b)能够调节、优选增加(a)的核酸序列表达的一个或多个控制序列;和任选地
(c)转录终止序列。
优选地,编码PHDf-HD多肽的核酸序列如上定义;术语“调控序列”和“终止序列”如本文中的定义。
优选地,构建体的所述调控序列之一是从植物基因组分离的组成型启动子。植物组成型启动子的一个例子是GOS2启动子,优选地是稻GOS2启动子,更优选地是如SEQ ID NO:235所代表的GOS2启动子。
植物用包含任意上述核酸序列的载体转化。技术人员非常了解必须存在于所述载体上以便成功转化、选择和增殖含有目的序列的宿主细胞的遗传元件。该目的序列有效地与一个或多个调控序列(至少与启动子)连接。
有利地,任意类型的启动子,无论是天然的或人工的,可以用来调节、优选增加所述核酸序列的表达。组成型启动子是在所述方法中特别有用的,优选从植物基因组分离的组成型启动子。该植物组成型启动子驱动编码序列在全部情况低于受35S CaMV启动子控制时所获得水平的水平上表达。
其他器官特异性启动子,例如用于叶、茎、块茎、分生组织、种子(胚和/或胚乳)中的优选表达的器官特异性启动子,用于实施本发明的方法中。对于多种启动子类型的定义,见本文中的“定义”部分。
应当明白本发明的应用不限于由SEQ ID NO:179代表的编码PHDf-HD多肽的核酸序列,本发明的应用也不限于编码PHDf-HD多肽的核酸序列在受组成型启动子驱动时的表达。
任选地,可以在导入植物的构建体中使用一个或多个终止子序列。额外的调节元件可以包括转录增强子以及翻译增强子。本领域技术人员将知道可能适用于实施本发明的终止子和增强子序列。如定义部分中描述,内含子序列也可以添加至5’非翻译区(UTR)或编码序列中,以提高细胞质内聚集的成熟信使的数量。(除启动子、增强子、沉默子、内含子序列、3’UTR和/或5’UTR区域之外的)其他调控序列可以是蛋白质/或RNA稳定元件。此类序列将是已知的或可以由本领域技术人员轻易获得。
本发明的基因构建体还可以包括对于在特定细胞类型中维持和/或复制所需要的复制起点序列。一个例子是当需要基因构建体作为游离型遗传元件(例如质粒或粘粒分子)在细菌细胞中维持时的复制起点。优选的复制起点包括但不限于f1-ori和colE1。
为检测如用于本发明方法中的核酸序列的成功转移和/或选择包含这些核酸序列的转基因植物,有利的是使用标记基因(或报道基因)。因此,所述基因构建体可以任选地包含选择标记基因。选择标记在本文的“定义”部分中更详细地描述。
已知当核酸序列稳定或瞬时地整合至植物细胞时,仅少数细胞摄取了外来DNA,并且根据需要,将其整合至细胞的基因组中,这取决于所用的表达载体和所用的转染技术。为鉴定并选择这些整合体,编码选择标记的基因(如上文所述的基因)通常连同目的基因一起导入宿主细胞。这些标记可以在这些基因例如通过常规方法缺失而无功能的突变体中使用。此外,编码选择标记的核酸序列分子可以在包含编码本发明多肽或在本发明方法中所用多肽的序列的相同载体上,或在独立的载体上导入宿主细胞。已经用所导入核酸序列稳定转染的细胞可以通过选择作用鉴定(例如具有整合的选择标记的细胞存活而其他细胞死亡)。一旦不再需要所述标记基因时,可以从转基因细胞中去掉或切除它们。用于移出标记基因的技术是本领域已知的,有用技术在上文定义部分中描述。
本发明也提供了用于产生转基因植物的方法,所述转基因植物相对于对照植物具有增强的产量相关性状、优选增强的种子产量相关性状,其中所述方法包括在植物中导入并表达编码如上文所定义的PHDf-HD多肽的任意核酸序列。
更具体地,本发明提供了用于产生转基因植物的方法,所述转基因植物具有增加的增强产量相关性状、优选增强的种子产量相关性状,其中所述方法包括:
(i)在植物、植物部分或植物细胞中导入并表达在植物组成型启动子控制下的编码PHDf-HD多肽的核酸序列;和
(ii)在促进植物生长和发育的条件下培养植物细胞。
(i)的核酸序列可以是能够编码如本文中定义的PHDf-HD多肽的任意核酸序列。
所述核酸序列可以直接导入植物细胞或导入植物自身(包括导入组织、器官或植物的任何其他部分)。根据本发明的优选特征,该核酸序列优选地通过转化作用导入植物。术语“转化”在本文的“定义”部分中更详细地描述。
遗传修饰的植物细胞可以通过技术人员熟悉的全部方法再生。合适的方法可以在上文提及的S.D.Kung和R.Wu,Potrykus或和Willmitzer的出版物中找到。
通常在转化后,对植物细胞或细胞群体选择一个或多个标记的存在性,其中所述标记由随同目的基因一起共转移的植物可表达基因编码,随后将转化材料再生成完整植物。为了选择转化植物,在所述转化中获得的植物材料原则上经历选择性条件,从而转化植物可以与非转化植物区分。例如,可以将以上述方式获得的种子播种,并且在初始培育期间后,通过喷洒进行合适的选择。另一种可能性在于根据需要消毒后,在使用合适选择剂的琼脂板上培育种子,从而仅转化的种子可以长成植物。备选地,对所述转化植物筛选选择标记(如上文所述的选择标记)的存在性。
在DNA转移和再生后,推定转化的植物也可以例如使用DNA印迹分析对目的基因的存在性、拷贝数和/或基因组构造进行评价。备选地或额外地,新导入的DNA的表达水平可以使用RNA印迹分析和/或蛋白质印迹分析或这两种分析法监测,这两项技术均是本领域普通技术人员熟知的。
产生的转化植物可以通过多种方法繁殖,如通过克隆繁殖法或经典育种技术。例如,第一世代(或T1)转化植物可以进行自交并且选择纯合的第二世代(或T2)转化体,并且T2植物随后可以通过经典育种技术进一步繁殖。产生的转化生物可以采取多种形式。例如,它们可以是转化细胞和非转化细胞的嵌合体;克隆性转化体(例如,被转化以含有表达盒的全部细胞);转化组织和非转化组织的移植体(例如在植物中,与未转化接穗嫁接的转化根状茎)。
本发明明确地扩展至由本文中所述的任意方法产生的任意植物细胞或植物,并扩展至全部植物部分及其繁殖体。本发明进一步扩展以包括已经由前述任意方法产生的原代转化或转染细胞、组织、器官或完整植物的子代,唯一要求是子代表现与如本发明方法中的亲代相同的基因型和/或表型特征。
本发明也包括含有编码如本文以上所定义PHDf-HD多肽的分离核酸的宿主细胞,所述的分离核酸与植物组成型启动子有效连接。本发明的优选宿主细胞是植物细胞。对于本发明方法中所用核酸序列或载体、表达盒或构建体或载体的宿主植物原则上有利地是能够合成在本发明方法中所使用多肽的全部植物。
本发明的方法有利地适用于任意植物。在本发明方法中特别有用的植物包括属于植物界超家族、尤其单子叶和双子叶植物的全部植物,包括饲用或饲料豆科植物、观赏植物、粮食作物、树或灌木。根据本发明的一个优选实施方案,所述植物是作物植物。作物植物的例子包括大豆、向日葵、卡诺拉油菜、苜蓿、油菜、棉花、番茄、马铃薯和烟草。还优选地,所述植物是单子叶植物。单子叶植物的例子包括甘蔗。更优选地,所述植物是谷物植物。谷物植物的例子包括稻、玉米、小麦、大麦、谷子、黑麦、小黑麦属、高粱和燕麦。
本发明也扩展至植物的可收获部分,如,但不限于种子、叶、果实、花、茎、根、根状茎、块茎和球茎,其中所述的植物包含与植物组成型启动子有效连接的编码(如本文以上定义的)PHDf-HD的分离核酸序列。本发明进一步涉及了衍生自、优选直接衍生自此种植物的可收获部分的产品,如干燥颗粒或粉末、油、脂肪和脂肪酸、淀粉或蛋白质。
根据本发明的优选特征,受调节的表达是增加的表达。用于增加核酸序列或基因或基因产物表达的方法是本领域中充分经文献报道的并且在定义部分中提供了例子。
如上所述,用于调节、优选增加编码PHDf-HD多肽的核酸序列表达的优选方法是通过在植物中导入并表达编码PHDf-HD多肽的核酸序列;但是,实施本方法的效果,即增强产量相关性状,也可以使用包括但不限于T-DNA活化标签法、TILLING、同源重组在内的其他熟知技术实现。在定义部分中提供了对这些技术的描述。
本发明也包括编码如本文中所述PHDf-HD多肽的核酸序列的用途,和这些PHDf-HD多肽的用途,用于增强植物中任意的前述产量相关性状、优选种子产量相关性状。
编码本文中所述PHDf-HD多肽的核酸序列或PHDf-HD多肽自身可以用于育种程序中,在所述育种程序中鉴定到可以遗传地与编PHDf-HD多肽的基因连锁的DNA标记。所述基因/核酸序列或PHDf-HD多肽自身可以用来定义分子标记。这种DNA或蛋白质标记随后可以在育种程序中用来在本发明的方法中选择具有如上文所定义的增强的产量相关性状、优选增强的种子产量相关性状的植物。
编码PHDf-HD多肽的基因/核酸序列的等位变体也可以用于标记辅助的育种程序中。此类育种程序有时需要使用例如EMS诱变法通过对植物进行诱变处理而导入等位变异;备选地,所述程序可以从收集并非故意造成的所谓“自然”源性等位变体开始。随后进行等位变体的鉴定,例如通过PCR法。此后是步骤:选择所讨论和导致产量相关性状增强的序列的优异等位变体。选择一般通过监测含有所讨论序列的不同等位变体的植物的生长性能而实施。生长性能可以在温室或在田间监测。其他任选步骤包括将其中鉴定到优异等位变体的植物与另一种植物杂交。这可能用来例如产生感兴趣的表型特征组合。
编码PHDf-HD多肽的核酸序列也可以作为探针用于遗传地或物理地绘制所述探针构成其一部分的基因并且用作与这些基因连锁的性状的标记。此类信息可以用于植物育种中,以开发具有所希望表型的品系。编码PHDf-HD多肽的核酸序列的这种用途仅需要具有至少15个核苷酸长度的核酸序列。编码PHDf-HD多肽的核酸序列可以用作限制性片段长度多态性(RFLP)标记。限制性消化的植物基因组DNA的DNA印迹物(SambrookJ,Fritsch EF和Maniatis T(1989)Molecular Cloning,A LaboratoryManual)可以用编码PHDf-HD多肽的核酸序列探测。所得的结合图式随后可以使用计算机程序如MapMaker(Lander等人(1987)Genomics 1:174-181)进行遗传分析以构建遗传图。此外,该核酸序列可以用来探测含有一组个体的限制性核酸内切酶处理的基因组DNA的DNA印迹物,其中所述的一组个体代表具有定义的遗传杂交的亲代和子代。DNA多态性的分离是明显的并用来计算编码PHDf-HD多肽的核酸序列在先前使用这个群体获得的遗传图中的位置(Botstein等人(1980)Am.J.Hum.Genet.32:314-331)。
在Bernatzky和Tanksley(1986)Plant Mol.Biol.Reporter 4:37-41中描述了植物基因来源的探针的产生及其在遗传作图中的用途。许多出版物描述了使用以上概述的方法学或其变例对特定cDNA克隆的遗传作图。例如,F2互交群、回交群、随机交配群、邻近纯合系和其他个体群体可以用于作图。此类方法学是本领域技术人员熟知的。
所述核酸序列探针也可以用于物理作图(即序列在物理图上的排列;见Hoheisel等在:Non-mammalian Genomic Analyasis:A Practical Guide,Academic press 1996,第319-346页及其中引用的参考文献)。
在另一个实施方案中,所述核酸序列探针可以在直接荧光原位杂交(FISH)作图法(Trask(1991)Trends Genet.7:149-154)中使用。尽管当前的FISH作图法支持使用大的克隆(几个kb至几百个kb;见Laan等人(1995)Genome Res.5:13-20),然而灵敏度的改善可以允许使用更短探针进行FISH作图。
用于遗传作图及物理作图的多种基于核酸序列扩增的方法可以使用所述核酸序列而实施。方法例子包括等位基因特异性扩增法(Kazazian(1989)J.Lab.Clin.Med 11:95-96)、PCR扩增片段的多态性(CAPS;Sheffield等人(1993)Genomics 16:325-332)、等位基因特异性连接(Landegren等人(1988)Science 241:1077-1080)、核苷酸延伸反应(Sokolov(1990)Nucleic Acid Res.18:3671)、放射杂交作图(Walter等人(1997)Nat.Genet.7:22-28)和Happy作图法(Dear和Cook(1989)NucleicAcid Res.17:6795-6807)。对于这些方法,使用一种核酸序列的序列来设计并产生在扩增反应或在引物延伸反应中使用的引物对。此类引物的设计是本领域技术人员熟知的。在使用基于PCR遗传作图的方法中,可能需要在对应于当前核酸序列的区域中鉴定作图交叉的亲代之间的DNA序列差异。但是,这通常对作图法而言不是必需的。
如前文所述,本发明方法产生了具有增强的产量相关性状、优选增强的种子产量相关性状的植物。这些性状也可以与经济上有利的其他性状组合,如其他的产量增强性状、针对其他非生物胁迫和生物胁迫的耐受性、调节多种构造性特征和/或生物化学特征和/或生理学特征的性状。
V.bHLH11样(碱性螺旋-环-螺旋11)蛋白
出人意料地,现在已经发现:调节植物中编码bHLH11样多肽的核酸表达产生了相对于对照植物具有增强的产量相关性状的植物。根据第一实施方案,本发明提供了用于相对于对照植物增强植物中产量相关性状的方法,包括调节植物中编码bHLH11样多肽的核酸表达。
用于调节(优选提高)编码bHLH11样多肽的核酸表达的优选方法是在植物中导入并表达编码bHLH11样多肽的核酸。
下文对“在本发明方法中有用的蛋白质”的任意称谓意指如本文中定义的bHLH11样多肽。下文对“在本发明方法中有用的核酸”的任意称谓意指能够编码这种bHLH11样多肽的核酸。待导入植物(并且因而在实施本发明方法中有用)的核酸是编码现在将描述的蛋白质类型的任意核酸,下文也称作“bHLH11样核酸”或“bHLH11样基因”。
如本文中定义的“bHLH11样多肽”指下述的任意多肽,其包含有后附HLH结构域(HMMPFam PF00010、ProfileScan PS50888、SMARTSM00353)的碱性结构域,从而形成碱性螺旋-环-螺旋结构域(bHLH)(Interpro IPR001092)。优选地,所述bHLH11样多肽包含至少1个、优选2个、更优选3个、最优选4个或多个以下基序:
基序1(SEQ ID NO:246):(E/D)(D/S/E)(F/M)(L/F)(D/E/Q/L)(Q/H/E)
基序2(SEQ ID NO:247):RA(R/I/Q)RG(Q/H)ATDPHSIAER
基序3(SEQ ID NO:248):(M/I/V/L)(K/R)(A/S/Q/D/N)LQ(E/D/V)LVP
基序4(SEQ ID NO:249):(M/I)(L/I)DEI(I/V/L)(D/E/G)Y(V/L/I)(K/R)FL(Q/R)LQ(V/I)K
基序5(SEQ ID NO:250):(V/I)LSMSR(L/V)G
基序6(SEQ ID NO:251):
V(A/V/L/I)(K/R)(L/M)(M/L)(E/D)(E/D/S/K/T)(D/N/S)(M/V/I)(G/T/I)XAMQ(Y/L/F)L
其中X可以是任意氨基酸,但优选地是S、T、A、M、K、N中之一
基序7(SEQ ID NO:252):(M/V)(P/S)(I/V)(S/T/A)LA。
备选地,bHLH11样蛋白的同源物以增加的优选顺序与SEQ ID NO:245所代表的氨基酸具有至少25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%整体序列同一性,条件是该同源蛋白包含上文所列出的保守基序。使用全局比对算法如程序GAP(GCG Wisconsin Package,Accelrys)中的Needleman Wunsch算法,优选地采用默认参数,确定整体序列同一性。与整体序列同一性相比较,当仅考虑保守的结构域或基序时,所述序列同一性通常将更高。序列保守性在bHLH结构域区域中高得多(见实施例45中的表E3和图21)。因此,bHLH结构域是定义bHLH11样蛋白组的良好标准。优选地,bHLH11样多肽包含基序8(SEQ ID NO:253)的序列:SIAERLRRERIAERMRALQELVPNTNKTDRAVMLDEILDYVKFLRLQVKVL,或以增加的优选顺序与SEQ ID NO:253具有至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性的序列。如由SMART确定的HLH结构域覆盖SEQ IDNO:245中的第132至181位残基并且被包含在基序8中。
优选地,该多肽序列在构建进化系统树如图22中所绘制的进化系统树中使用时,与bHLH11样蛋白组聚类,而不与其他bHLH蛋白聚类。类似地,当根据Li等人(2006)的图6构建进化系统树时,所选的bHLH11样蛋白将在亚组C中聚类,而不与任何其他组聚类。
术语“结构域”、“标签”和“基序”在本文中的“定义”部分定义。存在用于鉴定结构域的专业数据库,例如,SMART(Schultz等人(1998)Proc.Natl.Acad.Sci.USA 95,5857-5864;Letunic等人(2002)Nucleic Acids Res 30,242-244)、InterPro(Mulder等,(2003)Nucl.Acids.Res.31,315-318)、Prosite(Bucher和Bairoch(1994),用于生物分子序列基序的概括特征结构及其在自动化序列解读中的功能(A generalized profile syntax forbiomolecular sequences motifs and its function in automatic sequenceinterpretation).(在)ISMB-94;第二届分子生物学智能系统国际会议文集.Altman R.,Brutlag D.,Karp P.,Lathrop R.,Searls D.编辑,第53-61页,AAAIPress,Menlo Park;Hulo等,Nucl.Acids.Res.32:D134-D137,(2004))或Pfam(Bateman等,Nucleic Acids Research 30(1):276-280(2002))。一组用于计算机方式分析蛋白质序列的工具可在ExPASY蛋白质组服务器上获得(瑞士生物信息研究所维护(Gasteiger等,ExPASy:用于深入认识和分析蛋白质的蛋白质组服务器(The proteomics server for in-depth proteinknowledge and analysis),Nucleic Acids Res.31:3784-3788(2003))。结构域或基序也可以使用常规技术如通过序列比对进行鉴定。
用于比对序列以进行比较的方法是本领域熟知的,此类方法包括GAP、BESTFIT、BLAST、FASTA和TFASTA。GAP使用Needleman和Wunsch算法((1970)J Mol Biol 48:443-453)以找到使匹配数最大化并使空位数最小化的两个序列的总体(即覆盖完整序列的)比对结果。BLAST算法(Altschul等人(1990)J Mol Biol 215:403-10)计算序列同一性百分数并在两个序列之间开展相似性的统计分析。用于开展BLAST分析的软件是通过国家生物技术信息中心(NCBI)可公开获得的。同源物可以使用例如ClustalW多重序列比对算法(1.83版本),以默认配对比对参数和百分数评分方法轻易地鉴定。相似性和同一性的总体百分数也可以使用MatGAT软件包中的可用方法之一确定(Campanella等,BMC Bioinformatics.2003年7月10日;4:29.MatGAT:使用蛋白质序列或DNA序列产生相似性/同一性矩阵的一种应用(an application that generates similarity/identitymatrices using protein or DNA sequences))。如本领域技术人员显而易见,可以进行少许手工编辑以优化保守基序之间的比对。此外,作为使用全长序列以鉴定同源物的替代,也可以使用特定结构域。利用上文提及的程序,使用默认参数可以在完整核酸或氨基酸序列范围或保守基序范围内确定序列同一性值。对于局部比对,所述Smith-Waterman算法是特别有用的(Smith TF,Waterman MS(1981)J.Mol.Biol 147(1);195-7)。
另外,bHLH11样多肽(至少以它们的天然形式)一般具有DNA结合活性。用于测定DNA结合活性的工具和技术在本领域是熟知的。另外,如本发明中所示的,当bHLH11样蛋白(如SEQ ID NO:245)在稻中过量表达时,产生具有增强的产量相关性状、尤其提高的充实率的植物。在实施例部分提供其他细节。
本发明通过用SEQ ID NO:244所代表的核酸序列转化植物进行说明,其中所述的核酸序列编码SEQ ID NO:245的多肽序列。但是,本发明的实施不限于这些序列;本发明的方法可以有利地使用编码bHLH11样的任意核酸或如本文中定义的bHLH11样多肽实施。
编码bHLH11样多肽的核酸的例子在本文实施例43的表E1中给出。此类核酸用于实施本发明的方法中。在实施例43的表E1中给出的氨基酸序列是由SEQ ID NO:245所代表的bHLH11样多肽的直向同源物和旁系同源物的示例序列,术语“直向同源物”和“旁系同源物”如本文中定义。其他直向同源物和旁系同源物可以通过开展所谓交互性blast搜索轻易地鉴定。通常,这包括第一BLAST,其中所述的第一BLAST包括将查询序列(例如使用实施例43的表E1中列出的任意序列)针对任意序列数据库,如可公开获得的NCBI数据库进行BLAST。当从核苷酸序列开始时,一般使用BLASTN或TBLASTX(使用标准默认值),并且当从蛋白质序列开始时,使用BLASTP或TBLASTN(使用标准默认值)。可以任选地筛选BLAST结果。筛选结果或非筛选结果的全长序列随后针对来自生物的序列进行反向BLAST搜索(第二BLAST),其中查询序列从所述的生物中衍生(在查询序列是SEQ ID NO:244或SEQ ID NO:245的情况下,第二BLAST因而将针对普通小麦序列进行)。随后比较第一BLAST和第二BLAST的结果。若来自第一blast的高阶位命中是源自与衍生查询序列的物种相同的物种,则鉴定到旁系同源物,随后一个反向BLAST理想地在最高命中当中产生该查询序列;若在第一BLAST中的高阶位命中不是源自与衍生查询序列的物种相同的物种,则鉴定到直向同源物,并且在反向BLAST时,优选地产生属于最高命中当中的该查询序列。
高阶位命中是具有低E-值的那些命中。E-值越低,评分越显著(或换句话说,偶然发现该命中的几率越低)。E-值的计算是本领域熟知的。除了E-值外,比较过程也通过同一性百分数评分。同一性百分数指两个所比较的核酸(或多肽)序列之间特定长度范围内相同的核苷酸(或氨基酸)的数目。在大型家族的情况下,可以使用ClustalW,随后使用邻接树法,以帮助观察相关基因的聚集和鉴定直向同源物和旁系同源物。
核酸变体也可以用于实施本发明的方法中。此类变体的例子包括编码在实施例43的表E1中所给出的任一氨基酸序列的同源物和衍生物的核酸,术语“同源物”和“衍生物”如本文中定义。还用于本发明方法中的是这样的核酸,其编码在实施例43的表E1中所给出的任一氨基酸序列的直向同源物或旁系同源物的同源物和衍生物。用于本发明方法中的同源物和衍生物与衍生它们的未修饰蛋白质具有基本上相同的生物学活性和功能活性。
在实施本发明方法中有用的其他核酸变体包括编码bHLH11样多肽的核酸的部分、与编码bHLH11样多肽的核酸杂交的核酸、编码bHLH11样多肽的核酸的剪接变体、编码bHLH11样多肽的核酸的等位变体和通过基因改组获得的编码bHLH11样多肽的核酸的变体。术语“杂交序列”、“剪接变体”、“等位变体”和“基因改组作用”如本文中所述。
编码bHLH11样多肽的核酸不需要是全长核酸,因为本发明方法的实施不取决于全长核酸序列的使用。根据本发明,提供了用于增强植物中产量相关性状的方法,包括在植物中导入并表达实施例43的表E1中给出的任一核酸序列的一部分或编码实施例43表E1中所给出任意氨基核序列的直向同源物、旁系同源物或同源物的核酸的一部分。
核酸的一部分可以例如通过对所述核酸产生一个或多个缺失而制备。所述部分可以以分离的形式使用或它们可以与其他编码(或非编码)序列融合,例如旨在产生组合有几种活性的蛋白质。与其他编码序列融合时,在翻译时产生的所得多肽可以比对于该蛋白质部分所预测的多肽更大。
在本发明方法中有用的部分编码如本文中定义的bHLH11样多肽,并且基本上具有如实施例43的表E1中所给出氨基酸序列相同的生物学活性。优选地,此部分是在实施例43的表E1中给出的任一核酸的一部分,或是编码在实施例43的表E1中所给出的任一氨基酸序列的直向同源物或旁系同源物的核酸的一部分。优选地,该部分的长度是至少500、550、600、650、700、750、800、850、900、950、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000、2100、2200、2300、2400、2500个连续核苷酸,所述连续核苷酸为实施例43的表E1中给出的任一核酸序列或为编码在实施例43的表E1中所给出的任一氨基酸序列的直向同源物或旁系同源物的核酸。最优选地,该部分是SEQ ID NO:244的核酸的一部分。优选地,该部分编码氨基酸序列的片段,其中所述的氨基酸序列在构建进化系统树如图22中所绘制的进化系统树中使用时,与bHLH11样蛋白组聚类,而不与其他bHLH蛋白聚类。类似地,当根据Li等人(2006)的图6构建进化系统树时,所选的bHLH11样蛋白将在亚组C中聚类,而不与任何其他组聚类。
在本发明方法中有用的另一种核酸变体是能够在降低的严格条件下、优选在严格条件下与编码如本文中定义的bHLH11样多肽的核酸或与如本文中定义的部分杂交的核酸。
根据本发明,提供了用于增强植物中产量相关性状的方法,包括在植物中导入并表达能够与实施例43的表E1中给出的任一核酸杂交的核酸,或包括在植物中导入并表达这样的核酸,其中所述核酸能够与编码在实施例43的表E1中给出的任意核酸序列的直向同源物、旁系同源物或同源物的核酸杂交。
在本发明方法中有用的杂交序列编码如本文中定义的bHLH11样多肽,其基本上具有如实施例43的表E1中所给出氨基酸序列相同的生物学活性。优选地,该杂交序列能够与实施例43的表E1中给出的任一核酸的互补物或与这些序列中任意序列的一部分杂交,所述的一部分如上文定义,或其中所述杂交序列能够与核酸的互补物杂交,其中所述的核酸编码在实施例43的表E1中给出的任一氨基酸序列的直向同源物或旁系同源物。最优选地,该杂交序列能够与如SEQ ID NO:244所代表的核酸的互补物或与其一部分杂交。
优选地,该杂交序列编码具有下述氨基酸序列的片段,其中所述的氨基酸序列是全长的且在构建进化系统树如图22中所绘制的进化系统树中使用时,与bHLH11样蛋白组聚类,而不与其他bHLH蛋白聚类。类似地,当根据Li等人(2006)的图6构建进化系统树时,所选的bHLH11样蛋白将在亚组C中聚类,而不与任何其他组聚类。
在本发明方法中有用的另一种核酸变体是编码如上文所定义的bHLH11样多肽的剪接变体,剪接变体如本文中定义。
根据本发明,提供了用于增强植物中产量相关性状的方法,包括在植物中导入并表达实施例43的表E1中给出的任一核酸序列的剪接变体或编码实施例43表E1中所给出任意氨基核序列的直向同源物、旁系同源物或同源物的核酸的剪接变体。
优选的剪接变体是由SEQ ID NO:244所代表的核酸的剪接变体,或是编码SEQ ID NO:245的直向同源物或旁系同源物的核酸的剪接变体。优选地,由该剪接变体编码的氨基酸序列在构建进化系统树如图22中所绘制的进化系统树中使用时,与bHLH11样蛋白组聚类,而不与其他bHLH蛋白聚类。类似地,当根据Li等人(2006)的图6构建进化系统树时,所选的bHLH11样蛋白将在亚组C中聚类,而不与任何其他组聚类。
在实施本发明方法中有用的另一种核酸变体是编码如上文所定义bHLH11样多肽的核酸的等位变体,等位变体如本文中定义。
根据本发明,提供了用于增强植物中产量相关性状的方法,包括在植物中导入并表达实施例43的表E1中给出的任一核酸的等位变体,或包括在植物中导入并表达编码在实施例43的表E1中所给出的任一氨基酸序列的直向同源物、旁系同源物或同源物的核酸的等位变体。
由本发明方法中有用的等位变体编码的多肽基本上具有如SEQ IDNO:244的bHLH11样多肽和实施例43的表E1中所述任意氨基酸序列相同的生物学活性。等位变体存在于自然界中,并且在本发明的方法中包括这些天然等位基因的用途。优选地,所述等位变体是SEQ ID NO:244的等位变体或编码SEQ ID NO:245的直向同源物或旁系同源物的核酸的等位变体。优选地,由该等位变体编码的氨基酸序列在构建进化系统树如图22中所绘制的进化系统树中使用时,与bHLH11样蛋白组聚类,而不与其他bHLH蛋白聚类。类似地,当根据Li等人(2006)的图6构建进化系统树时,所选的bHLH11样蛋白将在亚组C中聚类,而不与任何其他组聚类。
基因改组或定向进化也可以用来产生编码如上文定义的bHLH11样多肽的核酸的变体;术语“基因改组”如本文中定义。
根据本发明,提供了用于增强植物中产量相关性状的方法,包括在植物中导入并表达在实施例43的表E1中给出的任一核酸序列的变体,或包括在植物中导入并表达核酸的变体,所述的核酸编码在实施例43的表E1中给出的任意氨基酸序列的直向同源物、旁系同源物或同源物,其中所述的变体核酸通过基因改组获得。
优选地,由通过基因改组获得的变体核酸所编码的氨基酸序列在构建进化系统树如图22中所绘制的进化系统树中使用时,与bHLH11样蛋白组聚类,而不与其他bHLH蛋白聚类。类似地,当根据Li等人(2006)的图6构建进化系统树时,所选的bHLH11样蛋白将在亚组C中聚类,而不与任何其他组聚类。
另外,核酸变体也可以通过位点定向诱变获得。几种方法可用于实现位点定向诱变,最常见的是基于PCR的方法(Current Protocols inMolecular Biology.Wiley编辑)。
编码bHLH11样多肽的核酸可以衍生自任何天然来源或人工来源。该核酸可以通过人类有意操作,在组成和/或基因组环境方面从其天然形式中修饰而来。优选地,编码bHLH11样多肽的核酸来自植物,进一步优选地来自单子叶植物,更优选地来自禾本科,最优选地该核酸来自普通小麦。
本发明方法的实施产生了具有增强的产量相关性状的植物。尤其,本发明方法的实施产生了相对于对照植物而言,具有提高的产量、尤其提高的种子产量的植物。术语“产量”和“种子产量”在本文的“定义”部分中更详细地描述。
本文中对增强的产量相关性状的称谓意指植物的一个或多个部分的生物量(重量)增加,所述的部分可以包括地上(可收获的)部分和/或(可收获的)地下部分。尤其,此类可收获部分是种子,并且本发明方法的实施产生了相对于对照植物的种子产量而言,具有提高的种子产量的植物。
以谷物为例,产量提高可以表现为以下一个或多个指标:每平方米已建立的植物数目增加、每株植物花序数的提高、行数、每行核粒数、核粒重、千粒核重、花序长度/直径的提高、种子充实率(即充实种子数除以种子总数并乘以100)提高,及其他。以稻为例,产量提高可以自身表现为下列一种或多种指标的提高:每平方米植物数、每株植物的花序数、每花序的小穗数、每个花序的花(小花)数目(其表述为充实种子数对原发花序数的比)、种子充实率(即充实种子数除以种子总数并乘以100)提高、千粒核重提高及其他。
本发明提供了用于相对于对照植物提高植物的产量、尤其种子产量的方法,所述方法包括调节植物中编码如本文中定义的bHLH11样多肽的核酸表达。
由于本发明的转基因植物具有提高的产量,故相对于对照植物的生长速率,这些植物有可能在其生活周期的对应阶段(在其生活周期的至少部分期间)表现提高的生长速率。
提高的生长速率可以是植物的一个或多个部分(包括种子)特有的,或可以基本上遍及整个植物。具有提到的生长速率的植物可以具备较短的生活周期。植物的生活周期可以意指从干燥成熟种子成长直至植物已经产生与起始材料相似的干燥成熟种子的阶段所需要的时间。这个生活周期可以受以下因素影响,如早期生长势、生长速率、绿度指数、开花时间和种子成熟速度。生长速率的提高可以在植物生活周期的一个或多个阶段上或在基本上整个植物生活周期期间发生。提高的生长速率在植物生活周期的早期期间可以反映增强的生长势。生长速率的提高可以改变植物的收获周期,从而允许植物较晚播种和/或较早收获,而这本来是不可能的(相似效果可以随较早的开花时间获得)。若生长速率充分提高,则可以允许进一步播种相同植物物种的种子(例如播种并收获稻植物,随后播种并收获其他稻植物,全部稻植物均处于一个常规生长时期中)。类似地,若生长速率充分地提高,可以允许进一步播种不同植物物种的种子(例如播种并收获谷物植物,随后例如播种并任选收获大豆、马铃薯或任何其他合适的植物)。在一些作物植物的例子中,来自相同根状茎的额外收获次数也可以是可能的。改变植物的收获周期可以导致每平方米一年生物量生产提高(原因在于可以培育并收获任何具体植物的次数(即在一年中)提高)。生长速率的提高也可以允许转基因植物在比其野生型对应物更广泛的地理区域内培育,因为培育作物的地域限制往往由栽种时期(早季)或在收获时期(晚季)的不利环境条件决定。这类不利条件可以避开,若缩短收获周期。生长速率可以通过从生长曲线获得多个参数而确定,此类参数可以是:T-Mid(植物达到50%最大植物大小所花费的时间)和T-90(植物达到50%最大植物大小所花费的时间),以及其他。
根据本发明的优选特征,本发明方法的实施产生了相对于对照植物而言,具有提高的生长速率的植物。因此,根据本发明,提供了用于提高植物生长速率的方法,所述方法包括在植物中调节编码如本文中定义的bHLH11样多肽的核酸表达。
与对照植物相比较,无论所述植物处于非胁迫条件下或无论所述植物暴露于多种胁迫,产量和/或生长速率的提高均出现。植物一般通过生长得更慢而应答于胁迫暴露。在严重胁迫条件下,植物甚至可以完全停止生长。另一方面,轻度胁迫在本文中定义为植物所暴露的任何下述胁迫,其中所述的胁迫未导致植物完全停止生长,但同时不能恢复生长。与非胁迫条件下的对照植物相比较,轻度胁迫在本发明意义中导致受胁迫植物的生长降低小于40%、35%或30%、优选地小于25%、20%或15%、更优选地小于14%、13%、12%、11%或10%或更低。由于农业实践(灌溉、施肥、杀虫剂处理)的进步,在栽培作物植物中并不经常遇到严重胁迫。因此,由轻度胁迫诱导的受损生长对于农业往往是不受欢迎的特征。轻度胁迫是植物所暴露的常见生物胁迫和/或非生物(环境)胁迫。非生物胁迫可以因干旱或过量的水、缺氧胁迫、盐胁迫、化学毒性、氧化胁迫和热、寒冷或冰冻温度所致。非生物胁迫可以是因水胁迫(尤其因为干旱)、盐胁迫、氧化胁迫或离子胁迫引起的渗透胁迫。生物胁迫一般是由病原体如细菌、病毒、真菌、线虫和昆虫引起的那些胁迫。
具体而言,本发明的方法可以在非胁迫条件下或在轻度干旱条件开展以产生相对于对照植物具有提高的产量的植物。如Wang等人(Planta(2003)218:1-14)中报道,非生物胁迫导致一系列不利地影响植物生长及生产量的形态学、生理学、生物化学和分子变化。干旱、盐度、极端温度和氧化胁迫已知是相互联系的并可以通过相似机制诱导生长损害及细胞损害。Rabbani等人(Plant Physiol(2003)133:1755-1767)描述了干旱胁迫与高盐度胁迫之间极高程度的“交互作用”。例如,干旱和/或盐化作用主要表现为渗透胁迫,从而导致细胞内稳态和离子分布的破坏。经常伴随高温或低温、盐度或干旱胁迫的氧化胁迫可以引起功能性蛋白和结构蛋白变性。因此,这些多样的环境胁迫常常激活相似的细胞信号传导途径和细胞应答,如产生胁迫蛋白、上调抗氧化物质、积累兼容性溶质和生长停滞。如本文中所用的术语“非胁迫”条件是允许植物最佳生长的那些环境条件。本领域技术人员清楚对于给定地点的正常土壤条件和气候条件。具有最佳生长条件(在非胁迫条件下培育)的植物一般以增加的优选顺序产生该植物在给定环境中至少90%、87%、85%、83%、80%、77%或75%的平均产量。平均产量可以基于收获量和/或季节计算。本领域技术人员清楚作物的平均生产产量。
相对于在可比较条件下培育的对照植物,本发明方法的实施赋予在非胁迫条件下或在轻度干旱条件下培育的植物提高的产量。因此,根据本发明,提供了用于在非胁迫条件下或在轻度干旱条件下培育的植物中提高产量的方法,所述方法包括增加植物中编码bHLH11样多肽的核酸表达。
相对于在可比较条件下培育的对照植物,本发明方法的实施赋予在营养缺乏条件下、尤其在缺氮条件下培育的植物提高的产量。因此,根据本发明,提供了用于在营养缺乏条件下培育的植物中提高产量的方法,所述方法包括调节植物中编码bHLH11样多肽的核酸表达,只要所述营养缺乏不是磷酸盐缺乏。营养缺乏可以因营养素如氮、磷酸盐和其他含磷化合物、钾、钙、镉、镁、锰、铁和硼等缺少所致。但是,术语“营养缺乏”在本发明的环境下使用时不包括磷酸盐缺乏。
本发明包括通过本发明方法可获得的植物或其部分(包括种子)。所述植物或其部分包含编码如上文定义的bHLH11样多肽的核酸转基因。
本发明也提供了基因构建体和载体以促进在植物中导入和/或表达编码bHLH11样多肽的核酸。所述基因构建体可以插入适于转化至植物并适于在转化细胞中表达目的基因的载体,所述载体可以是市售的。本发明也提供了如本文中定义的基因构建体在本发明方法中的用途。
更具体地,本发明提供了构建体,其包含:
(a)编码如上文定义的bHLH11样多肽的核酸;
(b)能够驱动(a)的核酸序列表达的一个或多个控制序列;和任选地
(c)转录终止序列。
优选地,编码bHLH11样多肽的核酸如上文定义。术语“调控序列”和“终止序列”如本文中的定义。
用包含任意上述核酸的载体转化植物。技术人员非常了解必须存在于所述载体上以便成功转化、选择和增殖含有目的序列的宿主细胞的遗传元件。该目的序列有效地与一个或多个调控序列(至少与启动子)连接。
有利地,任意类型的启动子,无论是天然的或人工的,可以用来驱动所述核酸序列的表达,但优选地,该启动子是植物来源的。组成型启动子是在所述方法中特别有用的。优选地,该组成型启动子也是中等强度的遍在启动子。对于多种启动子类型的定义,见本文中的“定义”部分。
应当明白本发明的应用不限于由SEQ ID NO:1代表的编码bHLH11样多肽的核酸,本发明的应用也不限于编码bHLH11样多肽的核酸在受组成型启动子驱动时的表达。
组成型启动子优选地是中等强度的启动子,如GOS2启动子,该启动子优选地是来自稻的GOS2启动子。还优选地,所述组成型启动子由基本上与SEQ ID NO:256相似的核酸序列代表,最优选地该组成型启动子如SEQ ID NO:256所代表。对于组成型启动子的其他例子,见本文中的“定义”部分。
任选地,可以在导入植物的构建体中使用一个或多个终止子序列。优选地,该构建体包含表达盒,所述表达盒包含基本上与SEQ ID NO:256相似的GOS2启动子和编码所述bHLH11样多肽的核酸。
额外的调节元件可以包括转录增强子以及翻译增强子。本领域技术人员将知道可能适用于实施本发明的终止子和增强子序列。如定义部分中描述,内含子序列也可以添加至5’非翻译区(UTR)或编码序列中,以提高细胞质内聚集的成熟信使的数量。(除启动子、增强子、沉默子、内含子序列、3’UTR和/或5’UTR区域之外的)其他调控序列可以是蛋白质/或RNA稳定元件。此类序列将是已知的或可以由本领域技术人员轻易获得。
本发明的基因构建体还可以包括对于在特定细胞类型中维持和/或复制所需要的复制起点序列。一个例子是当需要基因构建体作为游离型遗传元件(例如质粒或粘粒分子)在细菌细胞中维持时的复制起点。优选的复制起点包括但不限于f1-ori和colE1。
为检测如用于本发明方法中的核酸序列的成功转移和/或选择包含这些核酸的转基因植物,有利的是使用标记基因(或报道基因)。因此,所述基因构建体可以任选地包含选择标记基因。选择标记在本文的“定义”部分中更详细地描述。一旦不再需要所述标记基因时,可以从转基因细胞中去掉或切除它们。用于移出标记的技术是本领域已知的,有用技术在上文定义部分中描述。
本发明也提供了用于产生转基因植物的方法,所述转基因植物相对于对照植物具有增强的产量相关性状,其中所述方法包括在植物中导入并表达编码如上文所定义的bHLH11样多肽的任意核酸。
更具体地,本发明提供了用于产生转基因植物的方法,所述转基因植物具有增加的增强产量相关性状、尤其提高的(种子)产量,其中所述方法包括:
(i)在植物或植物细胞中导入并表达编码bHLH11样多肽的核酸;和
(ii)在促进植物生长和发育的条件下培养植物细胞。
(i)的核酸可以是能够编码如本文中定义的bHLH11样多肽的任意核酸。
所述核酸可以直接导入植物细胞或导入植物自身(包括导入组织、器官或植物的任何其他部分)。根据本发明的优选特征,该核酸优选地通过转化作用导入植物。术语“转化”在本文的“定义”部分中更详细地描述。
遗传修饰的植物细胞可以通过技术人员熟悉的全部方法再生。合适的方法可以在上文提及的S.D.Kung和R.Wu,Potrykus或和Willmitzer的出版物中找到。
通常在转化后,对植物细胞或细胞群体选择一个或多个标记的存在性,其中所述标记由随同目的基因一起共转移的植物可表达基因编码,随后将转化材料再生成完整植物。为了选择转化植物,在所述转化中获得的植物材料原则上经历选择性条件,从而转化植物可以与非转化植物区分。例如,可以将以上述方式获得的种子播种,并且在初始培育期间后,通过喷洒进行合适的选择。另一种可能性在于根据需要消毒后,在使用合适选择剂的琼脂板上培育种子,从而仅转化的种子可以长成植物。备选地,对所述转化植物筛选选择标记(如上文所述的选择标记)的存在性。
在DNA转移和再生后,推定转化的植物也可以例如使用DNA印迹分析对目的基因的存在性、拷贝数和/或基因组构造进行评价。备选地或额外地,新导入的DNA的表达水平可以使用RNA印迹分析和/或蛋白质印迹分析或这两种分析法监测,这两项技术均是本领域普通技术人员熟知的。
产生的转化植物可以通过多种方法繁殖,如通过克隆繁殖法或经典育种技术。例如,第一世代(或T1)转化植物可以进行自交并且选择纯合的第二世代(或T2)转化体,并且T2植物随后可以通过经典育种技术进一步繁殖。产生的转化生物可以采取多种形式。例如,它们可以是转化细胞和非转化细胞的嵌合体;克隆性转化体(例如,被转化以含有表达盒的全部细胞);转化组织和非转化组织的移植体(例如在植物中,与未转化接穗嫁接的转化根状茎)。
本发明明确地扩展至由本文中所述的任意方法产生的任意植物细胞或植物,并扩展至全部植物部分及其繁殖体。本发明进一步扩展以包括已经由前述任意方法产生的原代转化或转染细胞、组织、器官或完整植物的子代,唯一要求是子代表现与如本发明方法中的亲代相同的基因型和/或表型特征。
本发明也包括含有编码如本文以上所定义bHLH11样多肽的分离核酸的宿主细胞。本发明的优选宿主细胞是植物细胞。对于本发明方法中所用核酸或载体、表达盒或构建体或载体的宿主植物原则上有利地是能够合成在本发明方法中所使用多肽的全部植物。
本发明的方法有利地适用于任意植物。在本发明方法中特别有用的植物包括属于植物界超家族、尤其单子叶和双子叶植物的全部植物,包括饲用或饲料豆科植物、观赏植物、粮食作物、树或灌木。根据本发明的一个优选实施方案,所述植物是作物植物。作物植物的例子包括大豆、向日葵、卡诺拉油菜、苜蓿、油菜、亚麻、棉花、番茄、马铃薯和烟草。还优选地,所述植物是单子叶植物。单子叶植物的例子包括甘蔗。更优选地,所述植物是谷物植物。谷物植物的例子包括稻、玉米、小麦、大麦、谷子、黑麦、小黑麦属、高粱、二粒小麦、斯卑尔脱、黑麦属(secale)、单粒小麦、埃塞俄比亚画眉草(teff)、蜀黍(milo)和燕麦。
本发明也扩展至植物的可收获部分如,但不限于种子、叶、果实、花、茎、根、根状茎、块茎和球茎,其中所述可收获部分包含编码bHLH11样多肽的重组核酸。本发明进一步涉及了衍生自、优选直接衍生自此种植物的可收获部分的产品,如干燥颗粒或粉末、油、脂肪和脂肪酸、淀粉或蛋白质。
根据本发明的优选特征,受调节的表达是增加的表达。用于增加核酸或基因或基因产物表达的方法是本领域中充分经文献报道的并且在定义部分中提供了例子。
如上所述,用于调节编码bHLH11样多肽的核酸表达的优选方法是通过在植物中导入并表达编码bHLH11样多肽的核酸;但是,实施本方法的效果,即增强产量相关性状,也可以使用包括但不限于T-DNA活化标签法、TILLING、同源重组在内的其他熟知技术实现。在定义部分中提供了对这些技术的描述。
本发明也包括编码如本文中所述bHLH11样多肽的核酸的用途,和这些bHLH11样多肽的用途,用于增强植物中任意的前述产量相关性状。
编码本文中所述bHLH11样多肽的核酸或bHLH11样多肽自身可以用于育种程序中,在所述育种程序中鉴定到可以遗传地与编码bHLH11样多肽的基因连锁的DNA标记。所述核酸/基因或bHLH11样多肽自身可以用来定义分子标记。这种DNA或蛋白质标记随后可以在育种程序中用来在本发明的方法中选择具有如上文所定义的增强的产量相关性状的植物。
编码bHLH11样多肽的核酸/基因的等位变体也可以用于标记辅助的育种程序中。此类育种程序有时需要使用例如EMS诱变法通过对植物进行诱变处理而导入等位变异;备选地,所述程序可以从收集并非故意造成的所谓“自然”源性等位变体开始。随后进行等位变体的鉴定,例如通过PCR法。此后是步骤:选择所讨论和导致产量提高的序列的优异等位变体。选择一般通过监测含有所讨论序列的不同等位变体的植物的生长性能而实施。生长性能可以在温室或在田间监测。其他任选步骤包括将其中鉴定到优异等位变体的植物与另一种植物杂交。这可能用来例如产生感兴趣的表型特征组合。
编码bHLH11样多肽的核酸也可以作为探针用于遗传地或物理地绘制所述探针构成其一部分的基因并且用作与这些基因连锁的性状的标记。此类信息可以用于植物育种中,以开发具有所希望表型的品系。编码bHLH11样多肽的核酸的这种用途仅需要具有至少15个核苷酸长度的核酸序列。编码bHLH11样多肽的核酸可以用作限制性片段长度多态性(RFLP)标记。限制性消化的植物基因组DNA的DNA印迹物(Sambrook J,Fritsch EF和Maniatis T(1989)Molecular Cloning,A Laboratory Manual)可以用编码bHLH11样多肽的核酸探测。所得的结合图式随后可以使用计算机程序如MapMaker(Lander等人(1987)Genomics 1:174-181)进行遗传分析以构建遗传图。此外,该核酸可以用来探测含有一组个体的限制性核酸内切酶处理的基因组DNA的DNA印迹物,其中所述的一组个体代表具有定义的遗传杂交的亲代和子代。DNA多态性的分离是明显的并用来计算编码bHLH11样多肽的核酸在先前使用这个群体获得的遗传图中的位置(Botstein等人(1980)Am.J.Hum.Genet.32:314-331)。
在Bernatzky和Tanksley(1986)Plant Mol.Biol.Reporter 4:37-41中描述了植物基因来源的探针的产生及其在遗传作图中的用途。许多出版物描述了使用以上概述的方法学或其变例对特定cDNA克隆的遗传作图。例如,F2互交群、回交群、随机交配群、邻近纯合系和其他个体群体可以用于作图。此类方法学是本领域技术人员熟知的。
所述核酸探针也可以用于物理作图(即序列在物理图上的排列;见Hoheisel等在:Non-mammalian Genomic Analyasis:A Practical Guide,Academic press 1996,第319-346页及其中引用的参考文献)。
在另一个实施方案中,所述核酸探针可以在直接荧光原位杂交(FISH)作图法(Trask(1991)Trends Genet.7:149-154)中使用。尽管当前的FISH作图法支持使用大的克隆(几个kb至几百个kb;见Laan等人(1995)Genome Res.5:13-20),然而灵敏度的改善可以允许使用更短探针进行FISH作图。
用于遗传作图及物理作图的多种基于核酸扩增的方法可以使用所述核酸而实施。方法例子包括等位基因特异性扩增法(Kazazian(1989)J.Lab.Clin.Med 11:95-96)、PCR扩增片段的多态性(CAPS;Sheffield等人(1993)Genomics 16:325-332)、等位基因特异性连接(Landegren等人(1988)Science 241:1077-1080)、核苷酸延伸反应(Sokolov(1990)Nucleic Acid Res.18:3671)、放射杂交作图(Walter等人(1997)Nat.Genet.7:22-28)和Happy作图法(Dear和Cook(1989)Nucleic Acid Res.17:6795-6807)。对于这些方法,使用一种核酸的序列来设计并产生在扩增反应或在引物延伸反应中使用的引物对。此类引物的设计是本领域技术人员熟知的。在使用基于PCR遗传作图的方法中,可能需要在对应于当前核酸序列的区域中鉴定作图交叉的亲代之间的DNA序列差异。但是,这通常对作图法而言不是必需的。
如前文所述,本发明方法产生了具有增强的产量相关性状的植物。这些性状也可以与经济上有利的其他性状组合,如其他的产量增强性状、针对其他非生物胁迫和生物胁迫的耐受性、调节多种构造性特征和/或生物化学特征和/或生理学特征的性状。
VI.ASR(脱落酸、胁迫和成熟诱导的)蛋白
用于调节(优选提高)编码ASR多肽的核酸表达的优选方法是在植物中导入并表达编码ASR多肽的核酸。
下文对“在本发明方法中有用的蛋白质”的任意称谓意指如本文中定义的ASR多肽。下文对“在本发明方法中有用的核酸”的任意称谓意指能够编码这种ASR多肽的核酸。待导入植物(并且因而在实施本发明方法中有用)的核酸是编码现在将描述的蛋白质类型的任意核酸,下文也称作“ASR核酸”或“ASR基因”。
如本文中定义的“ASR多肽”指由SEQ ID NO:397代表的蛋白质并指其同源物(直向同源物和旁系同源物)。
优选地,SEQ ID NO:397的同源物具有ABA WDS结构域(Pfam登录号PF02496)。
还优选地,本发明的ASR多肽是以增加的优选顺序与表F1中给出的任意多肽具有至少50%、55%、60%、65%、70%、75%、80%、83%、85%、87%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的序列同一性的那些多肽。
术语“结构域”和“基序”在本文中的“定义”部分定义。存在用于鉴定结构域的专业数据库,例如,SMART(Schultz等人(1998)Proc.Natl.Acad.Sci.USA 95,5857-5864;Letunic等人(2002)Nucleic Acids Res 30,242-244)、InterPro(Mulder等,(2003)Nucl.Acids.Res.31,315-318)、Prosite(Bucher和Bairoch(1994),用于生物分子序列基序的概括特征结构及其在自动化序列解读中的功能(A generalized profile syntax forbiomolecular sequences motifs and its function in automatic sequenceinterpretation).(在)ISMB-94;第二届分子生物学智能系统国际会议文集.Altman R.,Brutlag D.,Karp P.,Lathrop R.,Searls D.编辑,第53-61页,AAAIPress,Menlo Park;Hulo等,Nucl.Acids.Res.32:D134-D137,(2004))或Pfam(Bateman等,Nucleic Acids Research 30(1):276-280(2002))。一组用于计算机方式分析蛋白质序列的工具可在ExPASY蛋白质组服务器上获得(瑞士生物信息研究所维护(Gasteiger等,ExPASy:用于深入认识和分析蛋白质的蛋白质组服务器(The proteomics server for in-depth proteinknowledge and analysis),Nucleic Acids Res.31:3784-3788(2003))。结构域或基序也可以使用常规技术如通过序列比对进行鉴定。
用于比对序列以进行比较的方法是本领域熟知的,此类方法包括GAP、BESTFIT、BLAST、FASTA和TFASTA。GAP使用Needleman和Wunsch算法((1970)J Mol Biol 48:443-453)以找到使匹配数最大化并使空位数最小化的两个序列的总体(即覆盖完整序列的)比对结果。BLAST算法(Altschul等人(1990)J Mol Biol 215:403-10)计算序列同一性百分数并在两个序列之间开展相似性的统计分析。用于开展BLAST分析的软件是通过国家生物技术信息中心(NCBI)可公开获得的。同源物可以使用例如ClustalW多重序列比对算法(1.83版本),以默认配对比对参数和百分数评分方法轻易地鉴定。相似性和同一性的总体百分数也可以使用MatGAT软件包中的可用方法之一确定(Campanella等,BMC Bioinformatics.2003年7月10日;4:29.MatGAT:使用蛋白质序列或DNA序列产生相似性/同一性矩阵的一种应用(an application that generates similarity/identitymatrices using protein or DNA sequences))。如本领域技术人员显而易见,可以进行少许手工编辑以优化保守基序之间的比对。此外,作为使用全长序列以鉴定同源物的替代,也可以使用特定结构域。利用上文提及的程序,使用默认参数可以在完整核酸或氨基酸序列范围或保守基序范围内确定序列同一性值。
另外,ASR多肽(至少以它们的天然形式),就SEQ ID NO:397和其同源物而言,一般具有提高植物的盐胁迫抗性的能力。用于植物中表达ASR并且测试提高的盐胁迫抗性的工具和技术是本领域熟知的。
本发明通过用SEQ ID NO:396所代表的核酸序列转化植物进行说明,其中所述的核酸序列编码SEQ ID NO:397的多肽序列。但是,本发明的实施不限于这些序列;本发明的方法可以有利地使用编码ASR的任意核酸或如本文中定义的ASR多肽实施。
可以在本领域已知的数据库中找到编码ASR多肽的核酸的例子。此类核酸用于实施本发明的方法中。直向同源物和旁系同源物可以通过开展所谓交互性blast搜索轻易地鉴定,术语“直向同源物”和“旁系同源物”如本文中定义。通常,这包括第一BLAST,其中所述的第一BLAST包括将查询序列(例如使用SEQ ID NO:397)针对任意序列数据库,如可公开获得的NCBI数据库进行BLAST。当从核苷酸序列开始时,一般使用BLASTN或TBLASTX(使用标准默认值),并且当从蛋白质序列开始时,使用BLASTP或TBLASTN(使用标准默认值)。可以任选地筛选BLAST结果。筛选结果或非筛选结果的全长序列随后针对来自生物的序列进行反向BLAST搜索(第二BLAST),其中查询序列从所述的生物中衍生(在查询序列是SEQ ID NO:396或SEQ ID NO:397的情况下,第二BLAST因而将针对稻序列进行)。随后比较第一BLAST和第二BLAST的结果。若来自第一blast的高阶位命中是源自与衍生查询序列的物种相同的物种,则鉴定到旁系同源物,随后一个反向BLAST理想地在最高命中当中产生该查询序列;若在第一BLAST中的高阶位命中不是源自与衍生查询序列的物种相同的物种,则鉴定到直向同源物,并且在反向BLAST时,优选地产生属于最高命中当中的该查询序列。
高阶位命中是具有低E-值的那些命中。E-值越低,评分越显著(或换句话说,偶然发现该命中的几率越低)。E-值的计算是本领域熟知的。除了E-值外,比较过程也通过同一性百分数评分。同一性百分数指两个所比较的核酸(或多肽)序列之间特定长度范围内相同的核苷酸(或氨基酸)的数目。在大型家族的情况下,可以使用ClustalW,随后使用邻接树法,以帮助观察相关基因的聚集和鉴定直向同源物和旁系同源物。
编码SEQ ID NO:397的同源物和衍生物的核酸变体也可以用于实施本发明的方法中,术语“同源物”和“衍生物”如本文中定义。还用于本发明方法中的是是这样的核酸,其编码SEQ ID NO:397的直向同源物或旁系同源物的同源物和衍生物。用于本发明方法中的同源物和衍生物与衍生它们的未修饰蛋白质具有基本上相同的生物学活性和功能活性。
在实施本发明方法中有用的其他核酸变体包括编码ASR多肽的核酸的部分、与编码ASR多肽的核酸杂交的核酸、编码ASR多肽的核酸的剪接变体、编码ASR多肽的核酸的等位变体和通过基因改组获得的编码ASR多肽的核酸的变体。术语“杂交序列”、“剪接变体”、“等位变体”和“基因改组作用”如本文中所述。
编码ASR多肽的核酸不需要是全长核酸,因为本发明方法的实施不取决于全长核酸序列的使用。根据本发明,提供了用于增强植物中产量相关性状的方法,包括在植物中导入并表达SEQ ID NO:396的一部分或编码SEQ ID NO:397的直向同源物、旁系同源物或同源物的核酸的一部分。
核酸的一部分可以例如通过对所述核酸产生一个或多个缺失而制备。所述部分可以以分离的形式使用或它们可以与其他编码(或非编码)序列融合,例如旨在产生组合有几种活性的蛋白质。与其他编码序列融合时,在翻译时产生的所得多肽可以比对于该蛋白质部分所预测的多肽更大。
在本发明方法中有用的部分编码如本文中定义的ASR多肽,并且基本上具有如SEQ ID NO:397中所给出氨基酸序列相同的生物学活性。优选地,此部分是在SEQ ID NO:396中给出的任一核酸的一部分,或是编码在SEQ ID NO:396中所给出的任一氨基酸序列的直向同源物或旁系同源物的核酸的一部分。优选地,该部分的长度是至少400、450、500、550、600、650、700、750个连续核苷酸,所述连续核苷酸属于SEQ ID NO:396,或属于编码SEQ ID NO:397的直向同源物或旁系同源物的核酸。最优选地,该部分是SEQ ID NO:396的核酸的一部分。
在本发明方法中有用的另一种核酸变体是能够在降低的严格条件下、优选在严格条件下与编码如本文中定义的ASR多肽的核酸或与如本文中定义的部分杂交的核酸。
根据本发明,提供了用于增强植物中产量相关性状的方法,包括在植物中导入并表达能够与SEQ ID NO:396杂交的核酸,或包括在植物中导入并表达能够与编码SEQ ID NO:396的直向同源物、旁系同源物或同源物的核酸杂交的核酸。
在本发明方法中有用的杂交序列编码如本文中定义的ASR多肽,基本上具有如SEQ ID NO:397中所给出氨基酸序列相同的生物学活性。优选地,该杂交序列能够与SEQ ID NO:396或与该序列的一部分杂交,所述的一部分如上文定义,或所述杂交序列能够与编码SEQ ID NO:397的直向同源物或旁系同源物的核酸杂交。
在本发明方法中有用的另一种核酸变体是编码如上文所定义的ASR多肽的剪接变体,剪接变体如本文中定义。
根据本发明,提供了用于增强植物中产量相关性状的方法,包括在植物中导入并表达SEQ ID NO:396的剪接变体或编码SEQ ID NO:397的直向同源物、旁系同源物或同源物的核酸的剪接变体。
在实施本发明方法中有用的另一种核酸变体是编码如上文所定义ASR多肽的核酸的等位变体,等位变体如本文中定义。
根据本发明,提供了用于增强植物中产量相关性状的方法,包括在植物中导入并表达SEQ ID NO:396的等位变体,或包括在植物中导入并表达核酸的剪接变体,其中所述核酸编码由SEQ ID NO:397代表的氨基酸序列的直向同源物、旁系同源物或同源物。
本发明方法中有用的等位变体基本上具有与SEQ ID NO:397的ASR多肽相同的生物学活性。等位变体存在于自然界中,并且在本发明的方法中包括这些天然等位基因的用途。基因改组或定向进化也可以用来产生编码如上文定义的ASR多肽的核酸的变体;术语“基因改组”如本文中定义。
根据本发明,提供了用于增强植物中产量相关性状的方法,包括在植物中导入并表达SEQ ID NO:396的变体,或包括在植物中导入并表达编码SEQ ID NO:397的直向同源物、旁系同源物或同源物的核酸的变体,其中所述变体核酸通过基因改组获得。
另外,核酸变体也可以通过位点定向诱变获得。几种方法可用于实现位点定向诱变,最常见的是基于PCR的方法(Current Protocols inMolecular Biology.Wiley编辑)。
编码ASR多肽的核酸可以衍生自任何天然来源或人工来源。该核酸可以通过人类有意操作,在组成和/或基因组环境方面从其天然形式中修饰而来。优选地,编码ASR多肽的核酸来自植物。在SEQ ID NO:396的情况下,编码的ASR多肽核酸优选地来自单子叶植物,更优选地来自禾本科,该核酸最优选地来自稻。
本发明也提供了迄今未知的编码ASR的核酸和ASR多肽。
根据本发明的又一个实施方案,因而提供了分离的核酸分子,其选自:
(i)由SEQ ID NO:401、403、405、407、409、411、413、415和417任一序列代表的核酸;
(ii)由SEQ ID NO:401、403、405、407、409、411、413、415和417任一序列代表的核酸的互补物;
(iii)编码ASR多肽的核酸,所述的ASR多肽以增加的优选顺序与SEQ ID NO:402、404、406、408、410、412、414、416和418任一序列所代表的氨基酸序列具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的序列同一性:
根据本发明的又一个实施方案,还提供了分离的多肽,其选自:
(i)由SEQ ID NO:402、404、406、408、410、412、414、416和418任一序列所代表的氨基酸序列;
(ii)以增加的优选顺序与SEQ ID NO:402、404、406、408、410、412、414、416和418任一序列所代表的氨基酸序列具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高序列同一性的氨基酸序列:
(iii)以上(i)或(ii)中给出的任意氨基酸序列的衍生物。
本发明方法的实施产生了具有增强的产量相关性状的植物。尤其,本发明方法的实施产生了相对于对照植物而言,具有提高的早期生长势和提高的产量、尤其提高的生物量和提高的种子产量的植物。术语“产量”和“种子产量”在本文的“定义”部分中更详细地描述。
本文中对增强的产量相关性状的称谓意指早期生长势和/或植物的一个或多个部分的生物量(重量)增加,所述的部分可以包括地上(可收获的)部分和/或(可收获的)地下部分。尤其,此类可收获部分是生物量和/或种子,并且本发明方法的实施产生了相对于对照植物的早期生长势、生物量或种子产量而言,具有提高的早期生长势、生物量或种子产量的植物。
以谷物为例,产量提高可以表现为以下一个或多个指标:每公顷或英亩已建立的植物数目增加、每株植物花序数的提高、行数、每行核粒数、核粒重、千粒核重、花序长度/直径的提高、种子充实率(即充实种子数除以种子总数并乘以100)提高,及其他。以稻为例,产量提高可以自身表现为下列一种或多种指标的提高:每公顷或英亩植物数、每株植物的花序数、每花序的小穗数、每个花序的花(小花)数目(其表述为充实种子数对原发花序数的比)、种子充实率(即充实种子数除以种子总数并乘以100)提高、千粒核重提高及其他。
本发明提供了用于相对于对照植物提高植物的产量、尤其生物量和/或种子产量的方法,所述方法包括调节植物中编码如本文中定义的ASR多肽的核酸表达,优选地增加该核酸表达。
由于本发明的转基因植物具有提高的产量,故相对于对照植物的生长速率,这些植物有可能在其生活周期的对应阶段(在其生活周期的至少部分期间)表现提高的生长速率。
提高的生长速率可以是植物的一个或多个部分(包括种子)特有的,或可以基本上遍及整个植物。具有提到的生长速率的植物可以具备较短的生活周期。植物的生活周期可以意指从干燥成熟种子成长直至植物已经产生与起始材料相似的干燥成熟种子的阶段所需要的时间。这个生活周期可以受以下因素影响,如早期生长势、生长速率、绿度指数、开花时间和种子成熟速度。生长速率的提高可以在植物生活周期的一个或多个阶段上或在基本上整个植物生活周期期间发生。提高的生长速率在植物生活周期的早期期间可以反映增强的生长势。生长速率的提高可以改变植物的收获周期,从而允许植物较晚播种和/或较早收获,而这本来是不可能的(相似效果可以随较早的开花时间获得)。若生长速率充分提高,则可以允许进一步播种相同植物物种的种子(例如播种并收获稻植物,随后播种并收获其他稻植物,全部稻植物均处于一个常规生长时期中)。类似地,若生长速率充分地提高,可以允许进一步播种不同植物物种的种子(例如播种并收获谷物植物,随后例如播种并任选收获大豆、马铃薯或任何其他合适的植物)。在一些作物植物的例子中,来自相同根状茎的额外收获次数也可以是可能的。改变植物的收获周期可以导致每英亩一年生物量生产提高(原因在于可以培育并收获任何具体植物的次数(即在一年中)提高)。生长速率的提高也可以允许转基因植物在比其野生型对应物更广泛的地理区域内培育,因为培育作物的地域限制往往由栽种时期(早季)或在收获时期(晚季)的不利环境条件决定。这类不利条件可以避开,若缩短收获周期。生长速率可以通过从生长曲线获得多个参数而确定,此类参数可以是:T-Mid(植物达到50%最大植物大小所花费的时间)和T-90(植物达到50%最大植物大小所花费的时间),以及其他。
根据本发明的优选特征,本发明方法的实施产生了相对于对照植物而言,具有提高的生长速率的植物。因此,根据本发明,提供了用于提高植物生长速率的方法,所述方法包括在植物中调节、优选地提高编码如本文中定义的ASR多肽的核酸表达。在具体实施方案中,本发明方法的实施产生早期生长势提高的植物。
与对照植物相比较,无论所述植物处于非胁迫条件下或无论所述植物暴露于多种胁迫,产量和/或生长速率的提高均出现。植物一般通过生长得更慢而应答于胁迫暴露。在严重胁迫条件下,植物甚至可以完全停止生长。另一方面,轻度胁迫在本文中定义为植物所暴露的任何下述胁迫,其中所述的胁迫未导致植物完全停止生长,但同时不能恢复生长。与非胁迫条件下的对照植物相比较,轻度胁迫在本发明意义中导致受胁迫植物的生长降低小于40%、35%或30%、优选地小于25%、20%或15%、更优选地小于14%、13%、12%、11%或10%或更低。由于农业实践(灌溉、施肥、杀虫剂处理)的进步,在栽培作物植物中并不经常遇到严重胁迫。因此,由轻度胁迫诱导的受损生长对于农业往往是不受欢迎的特征。轻度胁迫是植物所暴露的常见生物胁迫和/或非生物(环境)胁迫。非生物胁迫可以因干旱或过量的水、缺氧胁迫、盐胁迫、化学毒性、氧化胁迫和热、寒冷或冰冻温度所致。非生物胁迫可以是因水胁迫(尤其因为干旱)、盐胁迫、氧化胁迫或离子胁迫引起的渗透胁迫。生物胁迫一般是由病原体如细菌、病毒、真菌和昆虫引起的那些胁迫。
具体而言,本发明的方法可以在非胁迫条件下或在轻度干旱条件开展以产生相对于对照植物具有提高的产量的植物。如Wang等人(Planta(2003)218:1-14)中报道,非生物胁迫导致一系列不利地影响植物生长及生产量的形态学、生理学、生物化学和分子变化。干旱、盐度、极端温度和氧化胁迫已知是相互联系的并可以通过相似机制诱导生长损害及细胞损害。Rabbani等人(Plant Physiol(2003)133:1755-1767)描述了干旱胁迫与高盐度胁迫之间极高程度的“交互作用”。例如,干旱和/或盐化作用主要表现为渗透胁迫,从而导致细胞内稳态和离子分布的破坏。经常伴随高温或低温、盐度或干旱胁迫的氧化胁迫可以引起功能性蛋白和结构蛋白变性。因此,这些多样的环境胁迫常常激活相似的细胞信号传导途径和细胞应答,如产生胁迫蛋白、上调抗氧化物质、积累兼容性溶质和生长停滞。如本文中所用的术语“非胁迫”条件是允许植物最佳生长的那些环境条件。本领域技术人员清楚对于给定地点的正常土壤条件和气候条件。具有最佳生长条件(在非胁迫条件下培育)的植物一般以增加的优选顺序产生该植物在给定环境中至少90%、87%、85%、83%、80%、77%或75%的平均产量。平均产量可以基于收获量和/或季节计算。本领域技术人员清楚作物的平均生产产量。
相对于在可比较条件下培育的对照植物,本发明方法的实施赋予在非胁迫条件下或在轻度干旱条件下培育的植物提高的产量和/或提高的早期生长势。因此,根据本发明,提供了用于在非胁迫条件下或在轻度干旱条件下培育的植物中提高产量和/或早期生长势的方法,所述方法包括增加植物中编码ASR多肽的核酸表达。
相对于在可比较条件下培育的对照植物,本发明方法的实施赋予在营养缺乏条件下、尤其在缺氮条件下培育的植物提高的产量。因此,根据本发明,提供了用于在营养缺乏条件下培育的植物中提高产量的方法,所述方法包括增加植物中编码ASR多肽的核酸表达。营养缺乏可以因营养素如氮、磷酸盐和其他含磷化合物、钾、钙、镉、镁、锰、铁和硼等缺少所致。
本发明包括通过本发明方法可获得的植物或其部分(包括种子)。所述植物或其部分包含编码如上文定义的ASR多肽的核酸转基因。
本发明也提供了基因构建体和载体以促进在植物中导入和/或表达编码ASR多肽的核酸。所述基因构建体可以插入适于转化至植物并适于在转化细胞中表达目的基因的载体,所述载体可以是市售的。本发明也提供了如本文中定义的基因构建体在本发明方法中的用途。
更具体地,本发明提供了构建体,其包含:
(a)编码如上文定义的ASR多肽的核酸;
(b)能够驱动(a)的核酸序列表达的一个或多个控制序列;和任选地
(c)转录终止序列。
优选地,编码ASR多肽的核酸如上文定义。术语“调控序列”和“终止序列”如本文中的定义。
用包含任意上述核酸的载体转化植物。技术人员非常了解必须存在于所述载体上以便成功转化、选择和增殖含有目的序列的宿主细胞的遗传元件。该目的序列有效地与一个或多个调控序列(至少与启动子)连接。
有利地,任意类型的启动子,无论是天然的或人工的,可以用来驱动所述核酸序列的表达。组成型启动子是在本发明方法中特别有用的。对于多种启动子类型的定义,见本文中的“定义”部分。
应当明白本发明的应用不限于由SEQ ID NO:396代表的编码ASR多肽的核酸,本发明的应用也不限于编码ASR多肽的核酸在受组成型特异性启动子驱动时的表达。
组成型启动子优选地是GOS2启动子,优选地是来自稻的GOS2启动子。还优选地,所述组成型启动子由基本上与SEQ ID NO:398相似的核酸序列代表,最优选地该组成型启动子如SEQ ID NO:398所代表。对于组成型启动子的其他例子,见本文中的“定义”部分。
任选地,可以在导入植物的构建体中使用一个或多个终止子序列。额外的调节元件可以包括转录增强子以及翻译增强子。本领域技术人员将知道可能适用于实施本发明的终止子和增强子序列。如定义部分中描述,内含子序列也可以添加至5’非翻译区(UTR)或编码序列中,以提高细胞质内聚集的成熟信使的数量。(除启动子、增强子、沉默子、内含子序列、3’UTR和/或5’UTR区域之外的)其他调控序列可以是蛋白质/或RNA稳定元件。此类序列将是已知的或可以由本领域技术人员轻易获得。
本发明的基因构建体还可以包括对于在特定细胞类型中维持和/或复制所需要的复制起点序列。一个例子是当需要基因构建体作为游离型遗传元件(例如质粒或粘粒分子)在细菌细胞中维持时的复制起点。优选的复制起点包括但不限于f1-ori和colE1。
为检测如用于本发明方法中的核酸序列的成功转移和/或选择包含这些核酸的转基因植物,有利的是使用标记基因(或报道基因)。因此,所述基因构建体可以任选地包含选择标记基因。选择标记在本文的“定义”部分中更详细地描述。一旦不再需要所述标记基因时,可以从转基因细胞中去掉或切除它们。用于移出标记的技术是本领域已知的,有用技术在上文定义部分中描述。
本发明也提供了用于产生转基因植物的方法,所述转基因植物相对于对照植物具有增强的产量相关性状,其中所述方法包括在植物中导入并表达编码如上文所定义的ASR多肽的任意核酸。
更具体地,本发明提供了用于产生转基因植物的方法,所述转基因植物具有增加的增强产量相关性状、尤其提高的早期生长势和/或提高的产量,其中所述方法包括:
(i)在植物或植物细胞中导入并表达编码ASR多肽的核酸;和
(ii)在促进植物生长和发育的条件下培养植物细胞。
(i)的核酸可以是能够编码如本文中定义的ASR多肽的任意核酸。
所述核酸可以直接导入植物细胞或导入植物自身(包括导入组织、器官或植物的任何其他部分)。根据本发明的优选特征,该核酸优选地通过转化作用导入植物。术语“转化”在本文的“定义”部分中更详细地描述。
遗传修饰的植物细胞可以通过技术人员熟悉的全部方法再生。合适的方法可以在上文提及的S.D.Kung和R.Wu,Potrykus或和Willmitzer的出版物中找到。
通常在转化后,对植物细胞或细胞群体选择一个或多个标记的存在性,其中所述标记由随同目的基因一起共转移的植物可表达基因编码,随后将转化材料再生成完整植物。为了选择转化植物,在所述转化中获得的植物材料原则上经历选择性条件,从而转化植物可以与非转化植物区分。例如,可以将以上述方式获得的种子播种,并且在初始培育期间后,通过喷洒进行合适的选择。另一种可能性在于根据需要消毒后,在使用合适选择剂的琼脂板上培育种子,从而仅转化的种子可以长成植物。备选地,对所述转化植物筛选选择标记(如上文所述的选择标记)的存在性。
在DNA转移和再生后,推定转化的植物也可以例如使用DNA印迹分析对目的基因的存在性、拷贝数和/或基因组构造进行评价。备选地或额外地,新导入的DNA的表达水平可以使用RNA印迹分析和/或蛋白质印迹分析或这两种分析法监测,这两项技术均是本领域普通技术人员熟知的。
产生的转化植物可以通过多种方法繁殖,如通过克隆繁殖法或经典育种技术。例如,第一世代(或T1)转化植物可以进行自交并且选择纯合的第二世代(或T2)转化体,并且T2植物随后可以通过经典育种技术进一步繁殖。产生的转化生物可以采取多种形式。例如,它们可以是转化细胞和非转化细胞的嵌合体;克隆性转化体(例如,被转化以含有表达盒的全部细胞);转化组织和非转化组织的移植体(例如在植物中,与未转化接穗嫁接的转化根状茎)。
本发明明确地扩展至由本文中所述的任意方法产生的任意植物细胞或植物,并扩展至全部植物部分及其繁殖体。本发明进一步扩展以包括已经由前述任意方法产生的原代转化或转染细胞、组织、器官或完整植物的子代,唯一要求是子代表现与如本发明方法中的亲代相同的基因型和/或表型特征。
本发明也包括含有编码如本文以上所定义ASR多肽的分离核酸的宿主细胞。本发明的优选宿主细胞是植物细胞。对于本发明方法中所用核酸或载体、表达盒或构建体或载体的宿主植物原则上有利地是能够合成在本发明方法中所使用多肽的全部植物。
本发明的方法有利地适用于任意植物。在本发明方法中特别有用的植物包括属于植物界超家族、尤其单子叶和双子叶植物的全部植物,包括饲用或饲料豆科植物、观赏植物、粮食作物、树或灌木。根据本发明的一个优选实施方案,所述植物是作物植物。作物植物的例子包括大豆、向日葵、卡诺拉油菜、苜蓿、油菜、棉花、番茄、马铃薯和烟草。还优选地,所述植物是单子叶植物。单子叶植物的例子包括甘蔗。更优选地,所述植物是谷物植物。谷物植物的例子包括稻、玉米、小麦、大麦、谷子、黑麦、小黑麦属、高粱和燕麦。
本发明也扩展至植物的可收获部分如,但不限于种子、叶、果实、花、茎、根、根状茎、块茎和球茎。本发明进一步涉及了衍生自、优选直接衍生自此种植物的可收获部分的产品,如干燥颗粒或粉末、油、脂肪和脂肪酸、淀粉或蛋白质。
根据本发明的优选特征,受调节的表达是增加的表达。用于增加核酸或基因或基因产物表达的方法是本领域中充分经文献报道的并且在定义部分中提供了例子。
如上所述,用于调节(优选地增加)编码ASR多肽的核酸表达的优选方法是通过在植物中导入并表达编码ASR多肽的核酸;但是,实施本方法的效果,即增强产量相关性状,也可以使用包括但不限于T-DNA活化标签法、TILLING、同源重组在内的其他熟知技术实现。在定义部分中提供了对这些技术的描述。
本发明也包括编码如本文中所述ASR多肽的核酸的用途,和这些ASR多肽的用途,用于增强植物中任意的前述产量相关性状。
编码本文中所述ASR多肽的核酸或ASR多肽自身可以用于育种程序中,在所述育种程序中鉴定到可以遗传地与编码ASR多肽的基因连锁的DNA标记。所述核酸/基因或ASR多肽自身可以用来定义分子标记。这种DNA或蛋白质标记随后可以在育种程序中用来在本发明的方法中选择具有如上文所定义的增强的产量相关性状的植物。
编码ASR多肽的核酸/基因的等位变体也可以用于标记辅助的育种程序中。此类育种程序有时需要使用例如EMS诱变法通过对植物进行诱变处理而导入等位变异;备选地,所述程序可以从收集并非故意造成的所谓“自然”源性等位变体开始。随后进行等位变体的鉴定,例如通过PCR法。此后是步骤:选择所讨论和导致产量提高的序列的优异等位变体。选择一般通过监测含有所讨论序列的不同等位变体的植物的生长性能而实施。生长性能可以在温室或在田间监测。其他任选步骤包括将其中鉴定到优异等位变体的植物与另一种植物杂交。这可能用来例如产生感兴趣的表型特征组合。
编码ASR多肽的核酸也可以作为探针用于遗传地或物理地绘制所述探针构成其一部分的基因并且用作与这些基因连锁的性状的标记。此类信息可以用于植物育种中,以开发具有所希望表型的品系。编码ASR多肽的核酸的这种用途仅需要具有至少15个核苷酸长度的核酸序列。编码ASR多肽的核酸可以用作限制性片段长度多态性(RFLP)标记。限制性消化的植物基因组DNA的DNA印迹物(Sambrook J,Fritsch EF和Maniatis T(1989)Molecular Cloning,A Laboratory Manual)可以用编码ASR多肽的核酸探测。所得的结合图式随后可以使用计算机程序如MapMaker(Lander等人(1987)Genomics 1:174-181)进行遗传分析以构建遗传图。此外,该核酸可以用来探测含有一组个体的限制性核酸内切酶处理的基因组DNA的DNA印迹物,其中所述的一组个体代表具有定义的遗传杂交的亲代和子代。DNA多态性的分离是明显的并用来计算编码ASR多肽的核酸在先前使用这个群体获得的遗传图中的位置(Botstein等人(1980)Am.J.Hum.Genet.32:314-331)。
在Bernatzky和Tanksley(1986)Plant Mol.Biol.Reporter 4:37-41中描述了植物基因来源的探针的产生及其在遗传作图中的用途。许多出版物描述了使用以上概述的方法学或其变例对特定cDNA克隆的遗传作图。例如,F2互交群、回交群、随机交配群、邻近纯合系和其他个体群体可以用于作图。此类方法学是本领域技术人员熟知的。
所述核酸探针也可以用于物理作图(即序列在物理图上的排列;见Hoheisel等在:Non-mammalian Genomic Analyasis:A Practical Guide,Academic press 1996,第319-346页及其中引用的参考文献)。
在另一个实施方案中,所述核酸探针可以在直接荧光原位杂交(FISH)作图法(Trask(1991)Trends Genet.7:149-154)中使用。尽管当前的FISH作图法支持使用大的克隆(几个kb至几百个kb;见Laan等人(1995)Genome Res.5:13-20),然而灵敏度的改善可以允许使用更短探针进行FISH作图。
用于遗传作图及物理作图的多种基于核酸扩增的方法可以使用所述核酸而实施。方法例子包括等位基因特异性扩增法(Kazazian(1989)J.Lab.Clin.Med 11:95-96)、PCR扩增片段的多态性(CAPS;Sheffield等人(1993)Genomics 16:325-332)、等位基因特异性连接(Landegren等人(1988)Science 241:1077-1080)、核苷酸延伸反应(Sokolov(1990)Nucleic Acid Res.18:3671)、放射杂交作图(Walter等人(1997)Nat.Genet.7:22-28)和Happy作图法(Dear和Cook(1989)Nucleic Acid Res.17:6795-6807)。对于这些方法,使用一种核酸的序列来设计并产生在扩增反应或在引物延伸反应中使用的引物对。此类引物的设计是本领域技术人员熟知的。在使用基于PCR遗传作图的方法中,可能需要在对应于当前核酸序列的区域中鉴定作图交叉的亲代之间的DNA序列差异。但是,这通常对作图法而言不是必需的。
如前文所述,本发明方法产生了具有增强的产量相关性状的植物。这些性状也可以与经济上有利的其他性状组合,如其他的产量增强性状、针对其他非生物胁迫和生物胁迫的耐受性、调节多种构造性特征和/或生物化学特征和/或生理学特征的性状。
VII.鳞部启动子结合蛋白样11(SPL11)转录因子多肽
出人意料地,现在已经发现:调节植物中编码SPL11多肽的核酸表达产生了相对于对照植物具有增强的产量相关性状的植物。根据第一实施方案,本发明提供了用于相对于对照植物增强植物中产量相关性状的方法,包括调节植物中编码SPL11多肽的核酸表达。
本发明也提供了迄今未知的编码SPL11的核酸和SPL11多肽。这些核酸也用于实施本发明的方法中。
因而根据本发明的又一个实施方案,提供了分离的核酸分子,其包含:
(i)由SEQ ID NO:448代表的核酸;
(ii)由SEQ ID NO:448代表的核酸的互补物;
(iii)编码SPL11多肽的核酸,所述的SPL11多肽以增加的优选顺序与SEQ ID NO:449所代表的氨基酸序列具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的序列同一性,并且以增加的优选顺序与SEQ ID NO:465:SYCQVEGCRTDLSSAKDYHRKHRVCEPHSKAPKVVVA GLERRFCQQCSRFHGLAEFDQKKKSCRRRLNDHNARRRKPQPEAL(其代表SEQ ID NO:449中的SBP结构域)具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的序列同一性;
(iv)在严格杂交条件下与SEQ ID NO:448杂交的核酸。
另外,也提供了分离的多肽,其包含:
(i)由SEQ ID NO:449代表的氨基酸序列;
(ii)氨基酸序列,其以增加的优选顺序与SEQ ID NO:449所代表的氨基酸序列具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的序列同一性,并且以增加的优选顺序与SEQ ID NO:465:SYCQVEGCRTDLSSAKDYHRKHRVCEPHSKAPKVVVAGLERRFCQQCSRFHGLAEFDQKKKSCRRRLNDHNARRRKPQPEAL(其代表SEQ ID NO:449中的SBP结构域)具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的序列同一性;
(iii)以上(i)或(ii)中给出的任意氨基酸序列的衍生物。
用于调节(优选增加)编码SPL11多肽的核酸表达的优选方法是在植物中导入并表达编码SPL11多肽的核酸。
下文对“在本发明方法中有用的蛋白质”的任意称谓意指如本文中定义的SPL11多肽。下文对“在本发明方法中有用的核酸”的任意称谓意指能够编码这种SPL11多肽的核酸。待导入植物(并且因而在实施本发明方法中有用)的核酸是编码现在将描述的蛋白质类型的任意核酸,此后下文也称作“SPL11核酸”或“SPL11基因”。
如本文中定义SPL11多肽指包含鳞部结合蛋白(SBP)结构域的多肽,所述结构域以增加的优选顺序与SEQ ID NO:456至SEQ ID NO:468或SEQ ID NO:478所代表的任一SBP结构域具有至少70%、75%、80%、85%、90%、95%、97%或更高的序列同一性。
如本文中定义的“SPL11多肽”包含与SEQ ID NO:172和与其同源物(直向同源物和旁系同源物)相同的由SEQ ID NO:448代表的蛋白质。优选地,SEQ ID NO:172的同源物具有DNA结合结构域。
SPL11多肽可以在专业化数据库如Pfam(Finn等人Nucleic AcidsResearch(2006)数据库Issue 34:D247-D251)中找到。Pfam编纂了覆盖许多常见蛋白质结构域和家族的多重序列比对结果和隐匿马尔科夫模型(HMM)的庞大集合和并且通过英国Sanger研究所可使用。
SBP结构域的收集临界阈值在Pfam HMM_fs和HMM_ls模型中是25.0。如Pfam数据库中所认为的受信任匹配是评分高于收集临界阈值的那些序列。但是,包含真实SBP结构域的潜在匹配依旧可以低于该收集临界值。优选地,SPL11多肽是在其序列中具有一个或多个下述结构域的蛋白质,其中所述结构域超出Pfam蛋白质结构域家族PF03110的收集临界值,称作SBP结构域。
备选地,多肽中的SBP结构域可以通过与包含SBP结构域的已知多肽进行序列比较并在SBP结构域区域中建立相似性而鉴定。可以使用本领域熟知的任意方法如Blast算法比对所述序列。取得与给定序列出现比对结果的概率作为用于鉴定相似多肽的基础。通常用来代表这种概率的参数称作e-值。所述e-值是S评分可靠性的一个量度。S评分是查询项与所示序列的相似性的一个度量。e-值描述给定S评分预期以多少频率随机出现。该e-值临界可以高至1.0。使用SPL11多肽作为查询序列,来自BLAST搜索输出结果的良好e-值的常见阈值低于e5(=10-5)、1.e-10、1.e-15、1.e-20、1.e-25、1.e-50、1.e-75、1.e-100、1.e-200、1.e-300、1.e-400、1.e-500、1.e-600、1.e-700和1.e-800。优选地,本发明的SPL11多肽包含下述序列,其中所述序列在比对结果中与已知SPL11多肽中存在的SBP结构域具有低于e-5(=10-5)、1.e-10、1.e-15、1.e-20、1.e-25、1.e-50、1.e-75、1.e-100、1.e-200、1.e-300、1.e-400、1.e-500、1.e-600、1.e-700和1.e-800的e-值。
在表G1中给出在本发明方法中有用的SPL11多肽的例子。在表G4中给出SBP结构域在表G1的代表性SPL11蛋白中的氨基酸坐标并且该结构域的序列由SEQ ID NO:456至SEQ ID NO:468代表。在SEQID NO:478中给出了SPL11多肽中存在的SBP结构域的共有序列。
本发明的优选SPL11多肽是以增加的优选顺序与表G2中给出的任意多肽具有至少70%、75%、80%、85%、90%、95%或更高序列同一性的那些SPL11多肽。
通常,除SBP结构域之外,SPL11多肽可以在序列中相对于SBP结构域的保守位置处包含一个或多个以下保守基序:(i)如SEQ ID NO:469所代表的基序1,(ii)基序2是一般在SBP结构域的氨基端处发现的丝氨酸丰富区并且可以由SEQ ID NO:470代表;(iii)如SEQ ID NO:471所代表的基序3,其该基序一般由miR156微RNA家族成员所靶向的包含在SPL11多核苷酸区域内部的核苷酸编码;(iv)如SEQ ID NO:472所代表的基序4。图27显示在SEQ ID NO:428所代表的SPL11多肽序列中的保守基序和它们的相对位置。
因此,除SBP结构域之外,在本发明方法中有用的优选SPL11多肽还包含以下保守基序中的任意一个或多个:
(i)如SEQ ID NO:469所代表的基序1,其中允许任意的保守性氨基酸替换和/或1或2个非保守性替换,
(ii)如SEQ ID NO:470所代表的基序2,其中允许任意氨基酸替换,条件是至少4个氨基酸具有极性侧链、优选地是丝氨酸或苏氨酸,并且条件是该基序位于SBP结构域的氨基末端;
(iii)如SEQ ID:471所代表的基序3,其中允许1或2个错配:
(iv)如SEQ ID:472所代表的基序4,其中允许1、2或3个错配。
在背景部分中给出保守性氨基酸替换的例子。通常,多肽中包含的氨基酸是具有与相同碳(α碳)连接的氨基和羧基的α氨基酸,所述氨基酸分子通常包含与此α碳连接的侧链。表3显示基于侧链的物理特性和化学特性的氨基酸分类。
表3根据侧链特性的氨基酸分类
氨基酸 三字母 单字母 侧链极性 侧链的酸性或碱性 亲水性指数
精氨酸 Arg R 极性 碱性 -4.5
天冬酰胺 Asn N 极性 中性 -3.5
天冬氨酸 Asp D 极性 酸性 -3.5
半胱氨酸 Cys C 极性 中性 2.5
谷氨酸 Glu E 极性 酸性 -3.5
谷氨酰胺 Gln Q 极性 中性 -3.5
组氨酸 His H 极性 碱性 -3.2
赖氨酸 Lys K 极性 碱性 -3.9
丝氨酸 Ser S 极性 中性 -0.8
苏氨酸 Thr T 极性 中性 -0.7
酪氨酸 Tyr Y 极性 中性 -1.3
丙氨酸 Ala A 非极性 中性 1.8
甘氨酸 Gly G 非极性 中性 -0.4
异亮氨酸 Ile I 非极性 中性 4.5
亮氨酸 Leu L 非极性 中性 3.8
甲硫氨酸 Met M 非极性 中性 1.9
苯丙氨酸 Phe F 非极性 中性 2.8
脯氨酸 Pro P 非极性 中性 -1.6
色氨酸 Trp W 非极性 中性 -0.9
缬氨酸 Val V 非极性 中性 4.2
在实施例62中给出包含保守基序的基序1至基序4中一个或多个基序的SPL11多肽的例子。图28显示了这些SPL11多肽中所述保守基序的位置。
优选地,本发明的SPL11多肽在构建进化系统树如图29中所绘制的进化系统树中使用时,与包含由SEQ ID NO:428代表的氨基酸序列的S3组(即图29中的AtSPL11)聚类,而不与任何其他组聚类。
术语“结构域”和“基序”在本文中的“定义”部分定义。存在用于鉴定结构域的专业数据库,例如,SMART(Schultz等人(1998)Proc.Natl.Acad.Sci.USA 95,5857-5864;Letunic等人(2002)Nucleic Acids Res 30,242-244)、InterPro(Mulder等,(2003)Nucl.Acids.Res.31,315-318)、Prosite(Bucher和Bairoch(1994),用于生物分子序列基序的概括特征结构及其在自动化序列解读中的功能(A generalized profile syntax forbiomolecular sequences motifs and its function in automatic sequenceinterpretation).(在)ISMB-94;第二届分子生物学智能系统国际会议文集.Altman R.,Brutlag D.,Karp P.,Lathrop R.,Searls D.编辑,第53-61页,AAAIPress,Menlo Park;Hulo等,Nucl.Acids.Res.32:D134-D137,(2004)或Pfam(Bateman等,Nucleic Acids Research 30(1):276-280(2002))。一组用于计算机方式分析蛋白质序列的工具可在ExPASY蛋白质组服务器上获得(瑞士生物信息研究所维护(Gasteiger等,ExPASy:用于深入认识和分析蛋白质的蛋白质组服务器(The proteomics server for in-depth proteinknowledge and analysis),Nucleic Acids Res.31:3784-3788(2003))。结构域也可以使用常规技术如通过序列比对进行鉴定。
用于比对序列以进行比较的方法是本领域熟知的,此类方法包括GAP、BESTFIT、BLAST、FASTA和TFASTA。GAP使用Needleman和Wunsch算法((1970)J Mol Biol 48:443-453)以找到使匹配数最大化并使空位数最小化的两个序列的总体(即覆盖完整序列的)比对结果。BLAST算法(Altschul等人(1990)J Mol Biol 215:403-10)计算序列同一性百分数并在两个序列之间开展相似性的统计分析。用于开展BLAST分析的软件是通过国家生物技术信息中心(NCBI)可公开获得的。同源物可以使用例如ClustalW多重序列比对算法(1.83版本),以默认配对比对参数和百分数评分方法轻易地鉴定。相似性和同一性的总体百分数也可以使用MatGAT软件包中的可用方法之一确定(Campanella等,BMC Bioinformatics.2003年7月10日;4:29.MatGAT:使用蛋白质序列或DNA序列产生相似性/同一性矩阵的一种应用(an application that generates similarity/identitymatrices using protein or DNA sequences))。如本领域技术人员显而易见,可以进行少许手工编辑以优化保守基序之间的比对。此外,作为使用全长序列以鉴定同源物的替代,也可以使用特定结构域。利用上文提及的程序,使用默认参数可以在完整核酸或氨基酸序列范围或保守基序范围内确定序列同一性值。
另外,SPL11多肽(至少以它们的天然形式)一般可以具有DNA结合活性,尤其它们可以结合这样的DNA片段,所述DNA片段包含由SEQ IDNO:49所代表的SBP结构域DNA结合盒。一般地,发现所述SBP结构域DNA结合盒存在于植物来源基因(如SQUAMOSA基因)的启动子中。包含该SBP结构域DNA结合盒的片段优选地具有超过10,15,20,25,100,200,500,1000,2000碱基对长度。确定含有SBP结构域的蛋白质的DNA结合作用的方法可适用于SPL11多肽并且是本领域已知的(Klein等人.Mol Gen Genet.1996,15;250(1):7-16;Yamasaki等人2004J Mol Biol.2004,12;337(1):49-63)。
本发明的优选SPL11多肽是具有DNA结合活性的那些SPL11多肽,更优选地是结合包含SEQ ID NO:475的DNA片段的那些SPL11多肽。
本发明通过用SEQ ID NO:427所代表的核酸序列转化植物进行说明,其中所述的核酸序列编码SEQ ID NO:428的多肽序列。但是,本发明的实施不限于这些序列;本发明的方法可以有利地使用编码SPL11的任意核酸或如本文中定义的SPL11多肽实施。
编码SPL11多肽的核酸的例子在本文实施例62的表G1中给出。此类核酸用于实施本发明的方法中。在实施例62的表G1中给出的氨基酸序列是由SEQ ID NO:428所代表的SPL11多肽的直向同源物和旁系同源物的示例序列,术语“直向同源物”和“旁系同源物”如本文中定义。其他直向同源物和旁系同源物可以通过开展所谓交互性blast搜索轻易地鉴定。通常,这包括第一BLAST,其中所述的第一BLAST包括将查询序列(例如使用实施例62的表G1中列出的任意序列)针对任意序列数据库,如可公开获得的NCBI数据库进行BLAST。当从核苷酸序列开始时,一般使用BLASTN或TBLASTX(使用标准默认值),并且当从蛋白质序列开始时,使用BLASTP或TBLASTN(使用标准默认值)。可以任选地筛选BLAST结果。筛选结果或非筛选结果的全长序列随后针对来自生物的序列进行反向BLAST搜索(第二BLAST),其中查询序列从所述的生物中衍生(在查询序列是SEQ ID NO:427或SEQ ID NO:428的情况下,第二BLAST因而将针对拟南芥序列进行)。随后比较第一BLAST和第二BLAST的结果。若来自第一blast的高阶位命中是源自与衍生查询序列的物种相同的物种,则鉴定到旁系同源物,随后一个反向BLAST理想地在最高命中当中产生该查询序列;若在第一BLAST中的高阶位命中不是源自与衍生查询序列的物种相同的物种,则鉴定到直向同源物,并且在反向BLAST时,优选地产生属于最高命中当中的该查询序列。
高阶位命中是具有低E-值的那些命中。E-值越低,评分越显著(或换句话说,偶然发现该命中的几率越低)。E-值的计算是本领域熟知的。除了E-值外,比较过程也通过同一性百分数评分。同一性百分数指两个所比较的核酸(或多肽)序列之间特定长度范围内相同的核苷酸(或氨基酸)的数目。在大型家族的情况下,可以使用ClustalW,随后使用邻接树法,以帮助观察相关基因的聚集和鉴定直向同源物和旁系同源物。
核酸变体也可以用于实施本发明的方法中。此类变体的例子包括编码在实施例62的表G1中所给出的任一氨基酸序列的同源物和衍生物的核酸,术语“同源物”和“衍生物”如本文中定义。还用于本发明方法中的是这样的核酸,其编码在实施例62的表G1中所给出的任一氨基酸序列的直向同源物或旁系同源物的同源物和衍生物。用于本发明方法中的同源物和衍生物与衍生它们的未修饰蛋白质具有基本上相同的生物学活性和功能活性。
在实施本发明方法中有用的其他核酸变体包括编码SPL11多肽的核酸的部分、与编码SPL11多肽的核酸杂交的核酸、编码SPL11多肽的核酸的剪接变体、编码SPL11多肽的核酸的等位变体和通过基因改组获得的编码SPL11多肽的核酸的变体。术语“杂交序列”、“剪接变体”、“等位变体”和“基因改组作用”如本文中所述。
在实施本发明方法中有用的优选核酸变体是微RNA不敏感的编码SPL11多肽的核酸,进一步优选地,该核酸对属于miR156家族的微RNA不敏感。用于摧毁的微RNA靶核酸(尤其RNA)一般引起所靶向的RNA的聚集减少或抑制。靶向作用要求在微RNA与所靶向的核酸(RNA)之间在称作miR(微RNA)靶位点的这一非常特定的区域内杂交,所述的靶位点包含与成熟微RNA基因的一部分互补的序列。一般,微RNA不敏感性核酸包含以增加的优选顺序与相关微RNA分子在miR靶位点内具有1、2、3、4、5或更多个错配的序列。微RNA不敏感性核酸可以在细胞中聚集至下述水平,其中所述水平以增加的优选顺序5、10、20、30、40、50倍于或高于相关微RNA所靶向的对应核酸,所述的对应核酸一般在miR靶位点内包含100%序列互补性。
较早已经描述了miR156家族并且可以在miRBase数据库(Griffiths-Jones等人2006Nucleic Acids Research,2006,第34卷,Database Issue D140-D144)中找到包括miR156家族成员的微RNA汇编。该miRBase数据库由英国剑桥的Sanger研究所维康信托(Wellcome Trust)基金会维护。SPL11核酸中的miR156靶位点与miR156微RNA的成熟序列互补。在图30A中给出来自稻的miR156家族成员的成熟序列的例子和它们在稻SPL核酸上的对应靶位点。图31B显示代表性SPL11核酸(以DNA形式)的比对结果,其中显示了对应核糖核酸中miR156的靶位点。编码SEQ ID NO:428的miR156不敏感性SPL11核酸由SEQ ID NO:431代表。miR156不敏感性SPL11核酸的其他例子由SEQ ID 440和SEQ IDNO:454代表,其中SEQ ID NO:454缺少miR156靶位点。
优选地,在本发明方法中有用的SPL11核酸在miR156靶位点中具有1、2、3、4或更多个错配或缺少miR156基因的靶位点。在图31B中给出此类SPL11核酸的例子。进一步优选由SEQ ID NO:431、SEQ ID 440和SEQ ID NO:454代表的核酸。
编码SPL11多肽的核酸不需要是全长核酸,因为本发明方法的实施不取决于全长核酸序列的使用。根据本发明,提供了用于增强植物中产量相关性状的方法,包括在植物中导入并表达实施例62的表G1中给出的任一核酸序列的一部分或编码实施例62表G1中所给出任意氨基核序列的直向同源物、旁系同源物或同源物的核酸的一部分。
核酸的一部分可以例如通过对所述核酸产生一个或多个缺失而制备。所述部分可以以分离的形式使用或它们可以与其他编码(或非编码)序列融合,例如旨在产生组合有几种活性的蛋白质。与其他编码序列融合时,在翻译时产生的所得多肽可以比对于该蛋白质部分所预测的多肽更大。
在本发明方法中有用的部分编码如本文中定义的SPL11多肽,并且基本上具有如实施例62的表G1中所给出氨基酸序列相同的生物学活性。优选地,此部分是在实施例62的表G1中给出的任一核酸的一部分,或是编码在实施例62的表G1中所给出的任一氨基酸序列的直向同源物或旁系同源物的核酸的一部分。优选地,该部分的长度是至少70、100、200、500、550、600、650、700、750、800、850、900、950、1000、1500、2000、2500、3000、3500、4000、4500、5000个连续核苷酸,所述连续核苷酸为实施例62的表G1中给出的任一核酸序列或为编码在实施例62的表G1中所给出的任一氨基酸序列的直向同源物或旁系同源物的核酸。优选地,该部分至少编码SBP结构域。最优选地,该部分是SEQ ID NO:427的核酸的一部分。优选地,该部分编码下述氨基酸序列,其中所述氨基酸序列在构建进化系统树如图29中所绘制的进化系统树中使用时,与包含如SEQ ID NO:428(AtSPL11)所代表的氨基酸序列的SPL11多肽组聚类,而不与任何其他组聚类。
在本发明方法中有用的另一种核酸变体是能够在降低的严格条件下、优选在严格条件下与编码如本文中定义的SPL11多肽的核酸或与如本文中定义的部分杂交的核酸。
根据本发明,提供了用于增强植物中产量相关性状的方法,包括在植物中导入并表达能够与实施例62的表G1中给出的任一核酸杂交的核酸,或包括在植物中导入并表达这样的核酸,其中所述核酸能够与编码在实施例62的表G1中给出的任意核酸序列的直向同源物、旁系同源物或同源物的核酸杂交。
在本发明方法中有用的杂交序列编码如本文中定义的SPL11多肽,并且基本上具有如实施例62的表G1中所给出氨基酸序列相同的生物学活性。优选地,该杂交序列能够与实施例62的表G1中给出的任一核酸或与这些序列中任意序列的一部分杂交,所述的一部分如上文定义,或其中所述杂交序列能够与编码在实施例62的表G1中给出的任一氨基酸序列的直向同源物或旁系同源物的核酸杂交。最优选地,该杂交序列能够与如SEQID NO:427所代表的核酸或与其一部分杂交。
优选地,该杂交序列编码下述氨基酸序列,其中所述氨基酸序列在构建进化系统树如图29中所绘制的进化系统树中使用时,与包含如SEQ IDNO:428(AtSPL11)所代表的氨基酸序列的SPL11多肽组聚类,而不与任何其他组聚类。
在本发明方法中有用的另一种核酸变体是编码如上文所定义的SPL11多肽的剪接变体,剪接变体如本文中定义。
根据本发明,提供了用于增强植物中产量相关性状的方法,包括在植物中导入并表达实施例62的表G1中给出的任一核酸序列的剪接变体或编码实施例62表G1中所给出任意氨基核序列的直向同源物、旁系同源物或同源物的核酸的剪接变体。编码SEQ ID NO:428的基因的剪接变体例子由SEQ ID NO:427;SEQ ID NO:429和SEQ ID NO:430代表。
优选的剪接变体是由SEQ ID NO:427所代表的核酸的剪接变体,或是编码SEQ ID NO:428的直向同源物或旁系同源物的核酸的剪接变体。优选地,由所述剪接变体编码的氨基酸序列在构建进化系统树如图29中所绘制的进化系统树中使用时,与包含如SEQ ID NO:428(AtSPL11)所代表的氨基酸序列的SPL11多肽组聚类,而不与任何其他组聚类。
在实施本发明方法中有用的另一种核酸变体是编码如上文所定义SPL11多肽的核酸的等位变体,等位变体如本文中定义。
根据本发明,提供了用于增强植物中产量相关性状的方法,包括在植物中导入并表达实施例62的表G1中给出的任一核酸的等位变体,或包括在植物中导入并表达编码在实施例62的表G1中所给出的任一氨基酸序列的直向同源物、旁系同源物或同源物的核酸的等位变体。
在本发明方法中有用的等位变体基本上具有如SEQ ID NO:428的SPL11多肽和实施例62的表G1中所述任意氨基酸序列相同的生物学活性。等位变体存在于自然界中,并且在本发明的方法中包括这些天然等位基因的用途。优选地,所述等位变体是SEQ ID NO:427的等位变体或编码SEQ ID NO:428的直向同源物或旁系同源物的核酸的等位变体。优选地,由所述等位变体编码的氨基酸序列在构建进化系统树如图29中所绘制的进化系统树中使用时,与包含如SEQ ID NO:428(AtSPL11)所代表的氨基酸序列的SPL11多肽聚类,而不与任何其他组聚类。
基因改组或定向进化也可以用来产生编码如上文定义的SPL11多肽的核酸的变体;术语“基因改组”如本文中定义。
根据本发明,提供了用于增强植物中产量相关性状的方法,包括在植物中导入并表达在实施例62的表G1中给出的任一核酸序列的变体,或包括在植物中导入并表达核酸的变体,所述的核酸编码在实施例62的表G1中给出的任意氨基酸序列的直向同源物、旁系同源物或同源物,其中所述的变体核酸通过基因改组获得。
优选地,由通过基因改组获得的变体核酸编码的氨基酸序列在构建进化系统树如图29中所绘制的进化系统树中使用时,与包含如SEQ ID NO:428(AtSPL11)所代表的氨基酸序列的SPL11多肽组聚类,而不与任何其他组聚类。
另外,核酸变体也可以通过位点定向诱变获得。几种方法可用于实现位点定向诱变,最常见的是基于PCR的方法(Current Protocols inMolecular Biology.Wiley编辑)。
编码SPL11多肽的核酸可以衍生自任何天然来源或人工来源。该核酸可以通过人类有意操作,在组成和/或基因组环境方面从其天然形式中修饰而来。优选地,编码SPL11多肽的核酸来自植物,还优选来自双子叶植物,更优选来自十字花科,该核酸最优选地来自拟南芥。
本发明方法的实施产生了具有增强的产量相关性状的植物。尤其,本发明方法的实施产生了相对于对照植物而言,具有提高的产量、尤其提高的种子产量的植物。术语“产量”和“种子产量”在本文的“定义”部分中更详细地描述。
本文中对增强的产量相关性状的称谓意指植物的一个或多个部分的生物量(重量)增加,所述的部分可以包括地上(可收获的)部分和/或(可收获的)地下部分。尤其,此类可收获部分是种子,并且本发明方法的实施产生了相对于对照植物的产量而言,具有提高的产量的植物。
以谷物为例,产量提高可以表现为以下一个或多个指标:每公顷或英亩已建立的植物数目增加、每株植物花序数的提高、行数、每行核粒数、核粒重、千粒核重、花序长度/直径的提高、种子充实率(即充实种子数除以种子总数并乘以100)提高,及其他。以稻为例,产量提高可以自身表现为下列一种或多种指标的提高:每公顷或英亩植物数、每株植物的花序数、每花序的小穗数、每个花序的花(小花)数目(其表述为充实种子数对原发花序数的比)、种子充实率(即充实种子数除以种子总数并乘以100)提高、千粒核重提高及其他。
本发明提供了用于相对于对照植物提高植物的产量、尤其种子产量的方法,所述方法包括调节植物中编码如本文中定义的SPL11多肽的核酸表达,优选地增加该核酸表达。
由于本发明的转基因植物具有提高的产量,故相对于对照植物的生长速率,这些植物有可能在其生活周期的对应阶段(在其生活周期的至少部分期间)表现提高的生长速率。
提高的生长速率可以是植物的一个或多个部分(包括种子)特有的,或可以基本上遍及整个植物。具有提到的生长速率的植物可以具备较短的生活周期。植物的生活周期可以意指从干燥成熟种子成长直至植物已经产生与起始材料相似的干燥成熟种子的阶段所需要的时间。这个生活周期可以受以下因素影响,如早期生长势、生长速率、绿度指数、开花时间和种子成熟速度。生长速率的提高可以在植物生活周期的一个或多个阶段上或在基本上整个植物生活周期期间发生。提高的生长速率在植物生活周期的早期期间可以反映增强的生长势。生长速率的提高可以改变植物的收获周期,从而允许植物较晚播种和/或较早收获,而这本来是不可能的(相似效果可以随较早的开花时间获得)。若生长速率充分提高,则可以允许进一步播种相同植物物种的种子(例如播种并收获稻植物,随后播种并收获其他稻植物,全部稻植物均处于一个常规生长时期中)。类似地,若生长速率充分地提高,可以允许进一步播种不同植物物种的种子(例如播种并收获谷物植物,随后例如播种并任选收获大豆、马铃薯或任何其他合适的植物)。在一些作物植物的例子中,来自相同根状茎的额外收获次数也可以是可能的。改变植物的收获周期可以导致每英亩一年生物量生产提高(原因在于可以培育并收获任何具体植物的次数(即在一年中)提高)。生长速率的提高也可以允许转基因植物在比其野生型对应物更广泛的地理区域内培育,因为培育作物的地域限制往往由栽种时期(早季)或在收获时期(晚季)的不利环境条件决定。这类不利条件可以避开,若缩短收获周期。生长速率可以通过从生长曲线获得多个参数而确定,此类参数可以是:T-Mid(植物达到50%最大植物大小所花费的时间)和T-90(植物达到50%最大植物大小所花费的时间),以及其他。
根据本发明的优选特征,本发明方法的实施产生了相对于对照植物而言,具有提高的生长速率的植物。因此,根据本发明,提供了用于提高植物生长速率的方法,所述方法包括在植物中调节、优选地提高编码如本文中定义的SPL11多肽的核酸表达。
与对照植物相比较,无论所述植物处于非胁迫条件下或无论所述植物暴露于多种胁迫,产量和/或生长速率的提高均出现。植物一般通过生长得更慢而应答于胁迫暴露。在严重胁迫条件下,植物甚至可以完全停止生长。另一方面,轻度胁迫在本文中定义为植物所暴露的任何下述胁迫,其中所述的胁迫未导致植物完全停止生长,但同时不能恢复生长。与非胁迫条件下的对照植物相比较,轻度胁迫在本发明意义中导致受胁迫植物的生长降低小于40%、35%或30%、优选地小于25%、20%或15%、更优选地小于14%、13%、12%、11%或10%或更低。由于农业实践(灌溉、施肥、杀虫剂处理)的进步,在栽培作物植物中并不经常遇到严重胁迫。因此,由轻度胁迫诱导的受损生长对于农业往往是不受欢迎的特征。轻度胁迫是植物所暴露的常见生物胁迫和/或非生物(环境)胁迫。非生物胁迫可以因干旱或过量的水、缺氧胁迫、盐胁迫、化学毒性、氧化胁迫和热、寒冷或冰冻温度所致。非生物胁迫可以是因水胁迫(尤其因为干旱)、盐胁迫、氧化胁迫或离子胁迫引起的渗透胁迫。生物胁迫一般是由病原体如细菌、病毒、真菌和昆虫引起的那些胁迫。
具体而言,本发明的方法可以在非胁迫条件下或在轻度干旱条件开展以产生相对于对照植物具有提高的产量的植物。如Wang等人(Planta(2003)218:1-14)中报道,非生物胁迫导致一系列不利地影响植物生长及生产量的形态学、生理学、生物化学和分子变化。干旱、盐度、极端温度和氧化胁迫已知是相互联系的并可以通过相似机制诱导生长损害及细胞损害。Rabbani等人(Plant Physiol(2003)133:1755-1767)描述了干旱胁迫与高盐度胁迫之间极高程度的“交互作用”。例如,干旱和/或盐化作用主要表现为渗透胁迫,从而导致细胞内稳态和离子分布的破坏。经常伴随高温或低温、盐度或干旱胁迫的氧化胁迫可以引起功能性蛋白和结构蛋白变性。因此,这些多样的环境胁迫常常激活相似的细胞信号传导途径和细胞应答,如产生胁迫蛋白、上调抗氧化物质、积累兼容性溶质和生长停滞。如本文中所用的术语“非胁迫”条件是允许植物最佳生长的那些环境条件。本领域技术人员清楚对于给定地点的正常土壤条件和气候条件。具有最佳生长条件(在非胁迫条件下培育)的植物一般以增加的优选顺序产生该植物在给定环境中至少90%、87%、85%、83%、80%、77%或75%的平均产量。平均产量可以基于收获量和/或季节计算。本领域技术人员清楚作物的平均生产产量。
相对于在可比较条件下培育的对照植物,本发明方法的实施赋予在非胁迫条件下或在轻度干旱条件下培育的植物提高的产量。因此,根据本发明,提供了用于在非胁迫条件下或在轻度干旱条件下培育的植物中提高产量的方法,所述方法包括增加植物中编码SPL11多肽的核酸表达。
相对于在可比较条件下培育的对照植物,本发明方法的实施赋予在营养缺乏条件下、尤其在缺氮条件下培育的植物提高的产量。因此,根据本发明,提供了用于在营养缺乏条件下培育的植物中提高产量的方法,所述方法包括增加植物中编码SPL11多肽的核酸表达。营养缺乏可以因营养素如氮、磷酸盐和其他含磷化合物、钾、钙、镉、镁、锰、铁和硼等缺少或过多所致。
本发明包括通过本发明方法可获得的植物或其部分(包括种子)。所述植物或其部分包含编码如上文定义的SPL11多肽的核酸转基因。
本发明也提供了基因构建体和载体以促进在植物中导入和/或表达编码SPL11多肽的核酸。所述基因构建体可以插入适于转化至植物并适于在转化细胞中表达目的基因的载体,所述载体可以是市售的。本发明也提供了如本文中定义的基因构建体在本发明方法中的用途。
更具体地,本发明提供了构建体,其包含:
(a)编码如上文定义的SPL11多肽的核酸;
(b)能够驱动(a)的核酸序列表达的一个或多个控制序列;和任选地
(c)转录终止序列。
优选地,编码SPL11多肽的核酸如上文定义。术语“调控序列”和“终止序列”如本文中的定义。
用包含任意上述核酸的载体转化植物。技术人员非常了解必须存在于所述载体上以便成功转化、选择和增殖含有目的序列的宿主细胞的遗传元件。该目的序列有效地与一个或多个调控序列(至少与启动子)连接。
有利地,任意类型的启动子,无论是天然的或人工的,可以用来驱动所述核酸序列的表达。组成型启动子是在所述方法中特别有用的。对于多种启动子类型的定义,见本文中的“定义”部分。
应当明白本发明的应用不限于由SEQ ID NO:427代表的编码SPL11多肽的核酸,本发明的应用也不限于编码SPL11多肽的核酸在受组成型启动子驱动时的表达。
组成型启动子优选地是GOS2启动子,优选地是来自稻的GOS2启动子。还优选地,所述组成型启动子由基本上与SEQ ID NO:476相似的核酸序列代表,最优选地该组成型启动子如SEQ ID NO:476所代表。对于组成型启动子的其他例子,见本文中的“定义”部分。
在一个备选实施方案中,使用种子特异性启动子。种子特异性启动子优选地是ABA(脱落酸)可诱导的,它优选地是WSI18启动子,优选地是来自稻的WSI18。还优选地,所述组成型启动子由基本上与SEQ ID NO:477相似的核酸序列代表。对于种子特异性启动子的其他例子,见本文中的“定义”部分。
应当清楚在本发明方法中有用的启动子不限于在上文提及的实施方案中详述的那些启动子。
任选地,可以在导入植物的构建体中使用一个或多个终止子序列。额外的调节元件可以包括转录增强子以及翻译增强子。本领域技术人员将知道可能适用于实施本发明的终止子和增强子序列。如定义部分中描述,内含子序列也可以添加至5’非翻译区(UTR)或编码序列中,以提高细胞质内聚集的成熟信使的数量。(除启动子、增强子、沉默子、内含子序列、3’UTR和/或5’UTR区域之外的)其他调控序列可以是蛋白质/或RNA稳定元件。此类序列将是已知的或可以由本领域技术人员轻易获得。
本发明的基因构建体还可以包括对于在特定细胞类型中维持和/或复制所需要的复制起点序列。一个例子是当需要基因构建体作为游离型遗传元件(例如质粒或粘粒分子)在细菌细胞中维持时的复制起点。优选的复制起点包括但不限于f1-ori和colE1。
为检测如用于本发明方法中的核酸序列的成功转移和/或选择包含这些核酸的转基因植物,有利的是使用标记基因(或报道基因)。因此,所述基因构建体可以任选地包含选择标记基因。选择标记在本文的“定义”部分中更详细地描述。
已知当核酸稳定或瞬时地整合至植物细胞时,仅少数细胞摄取了外来DNA,并且根据需要,将其整合至细胞的基因组中,这取决于所用的表达载体和所用的转染技术。为鉴定并选择这些整合体,编码选择标记的基因(如上文所述的基因)通常连同目的基因一起导入宿主细胞。这些标记可以在这些基因例如通过常规方法缺失而无功能的突变体中使用。此外,编码选择标记的核酸分子可以在包含编码本发明多肽或在本发明方法中所用多肽的序列的相同载体上,或在独立的载体上导入宿主细胞。已经用所导入核酸稳定转染的细胞可以通过选择作用鉴定(例如具有整合的选择标记的细胞存活而其他细胞死亡)。一旦不再需要所述标记基因时,可以从转基因细胞中去掉或切除它们。用于移出标记基因的技术是本领域已知的,有用技术在上文定义部分中描述。
本发明也提供了用于产生转基因植物的方法,所述转基因植物相对于对照植物具有增强的产量相关性状,其中所述方法包括在植物中导入并表达编码如上文所定义的SPL11多肽的任意核酸。
更具体地,本发明提供了用于产生转基因植物的方法,所述转基因植物具有增加的增强产量相关性状、尤其提高的(种子)产量,其中所述方法包括:
(i)在植物或植物细胞中导入并表达编码SPL11多肽的核酸;和
(ii)在促进植物生长和发育的条件下培养植物细胞。
(i)的核酸可以是能够编码如本文中定义的SPL11多肽的任意核酸。
所述核酸可以直接导入植物细胞或导入植物自身(包括导入组织、器官或植物的任何其他部分)。根据本发明的优选特征,该核酸优选地通过转化作用导入植物。术语“转化”在本文的“定义”部分中更详细地描述。
遗传修饰的植物细胞可以通过技术人员熟悉的全部方法再生。合适的方法可以在上文提及的S.D.Kung和R.Wu,Potrykus或和Willmitzer的出版物中找到。
通常在转化后,对植物细胞或细胞群体选择一个或多个标记的存在性,其中所述标记由随同目的基因一起共转移的植物可表达基因编码,随后将转化材料再生成完整植物。为了选择转化植物,在所述转化中获得的植物材料原则上经历选择性条件,从而转化植物可以与非转化植物区分。例如,可以将以上述方式获得的种子播种,并且在初始培育期间后,通过喷洒进行合适的选择。另一种可能性在于根据需要消毒后,在使用合适选择剂的琼脂板上培育种子,从而仅转化的种子可以长成植物。备选地,对所述转化植物筛选选择标记(如上文所述的选择标记)的存在性。
在DNA转移和再生后,推定转化的植物也可以例如使用DNA印迹分析对目的基因的存在性、拷贝数和/或基因组构造进行评价。备选地或额外地,新导入的DNA的表达水平可以使用RNA印迹分析和/或蛋白质印迹分析或这两种分析法监测,这两项技术均是本领域普通技术人员熟知的。
产生的转化植物可以通过多种方法繁殖,如通过克隆繁殖法或经典育种技术。例如,第一世代(或T1)转化植物可以进行自交并且选择纯合的第二世代(或T2)转化体,并且T2植物随后可以通过经典育种技术进一步繁殖。产生的转化生物可以采取多种形式。例如,它们可以是转化细胞和非转化细胞的嵌合体;克隆性转化体(例如,被转化以含有表达盒的全部细胞);转化组织和非转化组织的移植体(例如在植物中,与未转化接穗嫁接的转化根状茎)。
本发明明确地扩展至由本文中所述的任意方法产生的任意植物细胞或植物,并扩展至全部植物部分及其繁殖体。本发明进一步扩展以包括已经由前述任意方法产生的原代转化或转染细胞、组织、器官或完整植物的子代,唯一要求是子代表现与如本发明方法中的亲代相同的基因型和/或表型特征。
本发明也包括含有编码如本文以上所定义SPL11多肽的分离核酸的宿主细胞。本发明的优选宿主细胞是植物细胞。对于本发明方法中所用核酸或载体、表达盒或构建体或载体的宿主植物原则上有利地是能够合成在本发明方法中所使用多肽的全部植物。
本发明的方法有利地适用于任意植物。在本发明方法中特别有用的植物包括属于植物界超家族、尤其单子叶和双子叶植物的全部植物,包括饲用或饲料豆科植物、观赏植物、粮食作物、树或灌木。根据本发明的一个优选实施方案,所述植物是作物植物。作物植物的例子包括大豆、向日葵、卡诺拉油菜、苜蓿、油菜、棉花、番茄、马铃薯和烟草。还优选地,所述植物是单子叶植物。单子叶植物的例子包括甘蔗。更优选地,所述植物是谷物植物。谷物植物的例子包括稻、玉米、小麦、大麦、谷子、黑麦、小黑麦属、高粱和燕麦。
本发明也扩展至植物的可收获部分如,但不限于种子、叶、果实、花、茎、根、根状茎、块茎和球茎。本发明进一步涉及了衍生自、优选直接衍生自此种植物的可收获部分的产品,如干燥颗粒或粉末、油、脂肪和脂肪酸、淀粉或蛋白质。
根据本发明的优选特征,受调节的表达是增加的表达。用于增加核酸或基因或基因产物表达的方法是本领域中充分经文献报道的并且在定义部分中提供了例子。
如上所述,用于调节(优选地增加)编码SPL11多肽的核酸表达的优选方法是通过在植物中导入并表达编码SPL11多肽的核酸;但是,实施本方法的效果,即增强产量相关性状,也可以使用包括但不限于T-DNA活化标签法、TILLING、同源重组在内的其他熟知技术实现。在定义部分中提供了对这些技术的描述。
本发明也包括编码如本文中所述SPL11多肽的核酸的用途,和这些SPL11多肽的用途,用于增强植物中任意的前述产量相关性状。
编码本文中所述SPL11多肽的核酸或SPL11多肽自身可以用于育种程序中,在所述育种程序中鉴定到可以遗传地与编码SPL11多肽的基因连锁的DNA标记。所述核酸/基因或SPL11多肽自身可以用来定义分子标记。这种DNA或蛋白质标记随后可以在育种程序中用来在本发明的方法中选择具有如上文所定义的增强的产量相关性状的植物。
编码SPL11多肽的核酸/基因的等位变体也可以用于标记辅助的育种程序中。此类育种程序有时需要使用例如EMS诱变法通过对植物进行诱变处理而导入等位变异;备选地,所述程序可以从收集并非故意造成的所谓“自然”源性等位变体开始。随后进行等位变体的鉴定,例如通过PCR法。此后是步骤:选择所讨论和导致产量提高的序列的优异等位变体。选择一般通过监测含有所讨论序列的不同等位变体的植物的生长性能而实施。生长性能可以在温室或在田间监测。其他任选步骤包括将其中鉴定到优异等位变体的植物与另一种植物杂交。这可能用来例如产生感兴趣的表型特征组合。
编码SPL11多肽的核酸也可以作为探针用于遗传地或物理地绘制所述探针构成其一部分的基因并且用作与这些基因连锁的性状的标记。此类信息可以用于植物育种中,以开发具有所希望表型的品系。编码SPL11多肽的核酸的这种用途仅需要具有至少15个核苷酸长度的核酸序列。编码SPL11多肽的核酸可以用作限制性片段长度多态性(RFLP)标记。限制性消化的植物基因组DNA的DNA印迹物(Sambrook J,Fritsch EF和ManiatisT(1989)Molecular Cloning,A Laboratory Manual)可以用编码SPL11多肽的核酸探测。所得的结合图式随后可以使用计算机程序如MapMaker(Lander等人(1987)Genomics 1:174-181)进行遗传分析以构建遗传图。此外,该核酸可以用来探测含有一组个体的限制性核酸内切酶处理的基因组DNA的DNA印迹物,其中所述的一组个体代表具有定义的遗传杂交的亲代和子代。DNA多态性的分离是明显的并用来计算编码SPL11多肽的核酸在先前使用这个群体获得的遗传图中的位置(Botstein等人(1980)Am.J.Hum.Genet.32:314-331)。
在Bernatzky和Tanksley(1986)Plant Mol.Biol.Reporter 4:37-41中描述了植物基因来源的探针的产生及其在遗传作图中的用途。许多出版物描述了使用以上概述的方法学或其变例对特定cDNA克隆的遗传作图。例如,F2互交群、回交群、随机交配群、邻近纯合系和其他个体群体可以用于作图。此类方法学是本领域技术人员熟知的。
所述核酸探针也可以用于物理作图(即序列在物理图上的排列;见Hoheisel等在:Non-mammalian Genomic Analyasis:A Practical Guide,Academic press 1996,第319-346页及其中引用的参考文献)。
在另一个实施方案中,所述核酸探针可以在直接荧光原位杂交(FISH)作图法(Trask(1991)Trends Genet.7:149-154)中使用。尽管当前的FISH作图法支持使用大的克隆(几个kb至几百个kb;见Laan等人(1995)Genome Res.5:13-20),然而灵敏度的改善可以允许使用更短探针进行FISH作图。
用于遗传作图及物理作图的多种基于核酸扩增的方法可以使用所述核酸而实施。方法例子包括等位基因特异性扩增法(Kazazian(1989)J.Lab.Clin.Med 11:95-96)、PCR扩增片段的多态性(CAPS;Sheffield等人(1993)Genomics 16:325-332)、等位基因特异性连接(Landegren等人(1988)Science 241:1077-1080)、核苷酸延伸反应(Sokolov(1990)Nucleic Acid Res.18:3671)、放射杂交作图(Walter等人(1997)Nat.Genet.7:22-28)和Happy作图法(Dear和Cook(1989)Nucleic Acid Res.17:6795-6807)。对于这些方法,使用一种核酸的序列来设计并产生在扩增反应或在引物延伸反应中使用的引物对。此类引物的设计是本领域技术人员熟知的。在使用基于PCR遗传作图的方法中,可能需要在对应于当前核酸序列的区域中鉴定作图交叉的亲代之间的DNA序列差异。但是,这通常对作图法而言不是必需的。
如前文所述,本发明方法产生了具有增强的产量相关性状的植物。这些性状也可以与经济上有利的其他性状组合,如其他的产量增强性状、针对其他非生物胁迫和生物胁迫的耐受性、调节多种构造性特征和/或生物化学特征和/或生理学特征的性状。
本发明现在将参考以下项进行描述:
1.用于相对于对照植物增强植物中产量相关性状的方法,包括调节植物中编码LBD多肽的核酸表达,其中所述的LBD多肽包含DUF206结构域。
2.根据项1的方法,其中所述的LBD多肽包含一个或多个以下基序:
(i)基序1:MSCNGCRXLRKGCX(SEQ ID NO:5),
(ii)基序2:QXXATXFXAKFXGR(SEQ ID NO:6),
(iii)基序3:FXSLLXEAXG(SEQ ID NO:7)。
3.根据项1或2的方法,其中所述受调节的表达通过在植物中导入和表达编码LBD多肽的核酸实施。
4.根据前述任一项的方法,其中所述编码LBD多肽的核酸编码表A1中所列的任一种蛋白质或是这种核酸的一部分或是能够与这种核酸杂交的核酸。
5.根据前述任一项的方法,其中所述的核酸序列编码表A1中给出的任意蛋白质的直向同源物或旁系同源物。
6.根据前述任一项的方法,其中所述的增强的产量相关性状包括相对于对照植物而言提高的产量、优选提高的生物量和/或提高的种子产量。
7.根据项1至6任一项的方法,其中所述的增强的产量相关性状在非胁迫条件下获得。
8.根据项1至6任一项的方法,其中所述的增强的产量相关性状在缺氮条件下获得。
9.根据项3至8任一项的方法,其中所述的核酸有效连接至组成型启动子,优选地有效连接至GOS2启动子,最优选地有效连接至来自稻的GOS2启动子。
10.根据前述任一项的方法,其中所述编码LBD多肽的核酸是植物来源的,优选地来自双子叶植物,进一步优选地来自十字花科,更优选地来自拟南芥属,最优选地来自拟南芥。
11.分离的核酸分子,包含任一以下特征:
(i)由SEQ ID NO:69代表的核酸;
(ii)与(i)中给出的任一个SEQ ID NO互补的核酸或其片段;
(iii)编码LBD多肽的核酸,所述LBD多肽以增加的优选顺序与SEQID NO:70具有至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的序列同一性;
(iv)能够在严格条件下与以上(i)、(ii)或(iii)中给出的任一种核酸杂交的核酸。
12.分离的多肽,包含:
(i)以增加的优选顺序与SEQ ID NO:70中给出的氨基酸序列具有至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列;
(ii)(i)中给出的任意氨基酸序列的衍生物。
13.由根据前述任一项的方法可获得的植物或其部分,包括种子,其中所述的植物或其部分包含编码LBD多肽的重组核酸。
14.构建体,包含:
(i)编码如项1、2或12中定义的LBD多肽的核酸;
(ii)能够驱动(a)的核酸序列表达的一个或多个控制序列;和任选地
(iii)转录终止序列。
15.根据项14的构建体,其中所述的控制序列之一是组成型启动子,优选地是GOS2启动子,最优选地是来自稻的GOS2启动子。
16.根据项14或15的构建体在用于产生植物的方法中的用途,所述植物相对于对照植物具有提高的产量,特别具有提高的生物量和/或提高的种子产量。
17.用根据项14或15的构建体转化的植物、植物部分或植物细胞。
18.用于产生转基因植物的方法,所述的转基因植物相对于对照植物具有提高的产量、尤其提高的生物量和/或提高的种子产量,该方法包括:
(i)在植物中导入并表达编码如项1、2或12中定义的LBD多肽的核酸;和
(ii)在促进植物生长和发育的条件下培养植物细胞。
19.转基因植物,其因编码项1、2或12中定义的LBD多肽的核酸的表达增加而相对于对照植物具有提高的产量、尤其提高的生物量和/或提高的种子产量,或从所述转基因植物衍生的转基因植物细胞。
20.根据项13、17或19的转基因植物或从其衍生的转基因植物细胞,其中所述的植物是作物植物或单子叶植物或谷物植物,如稻、玉米、小麦、大麦、谷子、黑麦、小黑麦、高粱和燕麦。
21.根据项19的植物的可收获部分,其中所述的可收获部分优选地是苗生物量和/或种子。
22.产物,从根据项19的植物和/或从根据项20的植物的可收获部分衍生。
23.编码LBD多肽的核酸在植物中相对于对照植物提高产量、尤其提高种子产量和/或苗生物量中的用途。
24.用于相对于对照植物增强植物中产量相关性状的方法,包括调节植物中编码JMJC多肽的核酸表达,其中所述的JMJC多肽包含JmjC结构域。
25.根据项24的方法,其中所述的JmjC结构域由这样的序列代表,所述序列以增加的优选顺序与以下序列具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或更高的序列同一性:
(i)SEQ ID NO:78;和/或
(ii)包含于SEQ ID NO:84;SEQ ID NO:86:SEQ ID NO:96;SEQID NO:98;SEQ ID NO:104;SEQ ID NO:108;SEQ ID NO:110;SEQ IDNO:112;SEQ ID NO:114;SEQ ID NO:116;SEQ ID NO:118;SEQ IDNO:120;SEQ ID NO:122;SEQ ID NO:124;SEQ ID NO:128;SEQ IDNO:130;SEQ ID NO:132和SEQ ID NO:134所代表的JMJC多肽中的JmjC结构域之一,其中在表B4中给出所述JMJC多肽的氨基酸坐标。
26.根据项24和项25的方法,其中所述的JMJC多肽包含这样的基序,所述基序以增加的优选顺序与以下任意序列具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或更高的序列同一性:
(i)SEQ ID NO:79,
(ii)SEQ ID NO:80,
(iii)SEQ ID NO:81,
(iv)SEQ ID NO:82。
27.根据项24或26的方法,其中所述受调节的表达通过在植物中导入和表达编码JMJC多肽的核酸实施。
28.根据项24至27任一项的方法,其中所述的调节表达是增加表达。
29.根据项24至28任一项的方法,其中所述编码JMJC多肽的核酸编码表B1中所列的任一种蛋白质或是这种核酸的一部分或是能够与这种核酸杂交的核酸。
30.根据项24至29任一项的方法,其中所述的核酸序列编码表B1中给出的任意蛋白质的直向同源物或旁系同源物。
31.根据项30的方法,其中所述的核酸编码SEQ ID NO:74。
32.根据项24至31任一项的方法,其中所述的增强的产量相关性状包括相对于对照植物而言提高的产量、优选提高的收获指数和/或种子产量。
33.根据项24至32任一项的方法,其中所述的增强的产量相关性状包括相对于对照植物而言的植物早期生长势。
34.根据项24至33任一项的方法,其中所述的增强的产量相关性状在非胁迫条件下获得。
35.根据项24至33任一项的方法,其中所述的增强的产量相关性状在轻度干旱胁迫生长条件下获得。
36.根据项24至33任一项的方法,其中所述的增强的产量相关性状在缺氮生长条件下获得。
37.根据项27至36任一项的方法,其中所述的核酸有效连接至组成型启动子,优选地有效连接至GOS2启动子,最优选地有效连接至来自稻的GOS2启动子。
38.根据项24至37任一项的方法,其中所述编码JMJC多肽的核酸是植物来源的,优选地来自双子叶植物,进一步优选地来自十字花科,更优选地来自拟南芥属,最优选地来自拟南芥。
39.由根据项24至38任一项的方法能够获得的植物或其部分,包括种子,其中所述的植物或其部分包含编码JMJC多肽的重组核酸。
40.构建体,包含:
(i)编码如项24至26中定义的JMJC多肽的核酸;
(ii)能够驱动(i)的核酸序列表达的一个或多个控制序列;和任选地
(iii)转录终止序列。
41.根据项40的构建体,其中所述的控制序列之一是组成型启动子,优选地是GOS2启动子,最优选地是来自稻的GOS2启动子。
42.根据项40或41的构建体在用于产生植物的方法中的用途,所述植物相对于对照植物具有提高的产量、尤其提高的生物量和/或提高的种子产量。
43.用根据项40或41的构建体转化的植物、植物部分或植物细胞。
44.用于产生转基因植物的方法,所述的转基因植物相对于对照植物具有提高的产量相关性状、尤其植物早期生长势和/或提高的种子产量,该方法包括:
(i)在植物中导入并表达编码如项24至26中定义的JMJC多肽的核酸;和
(ii)在促进植物生长和发育的条件下培养植物细胞。
45.转基因植物,其因编码如项24至26中定义的JMJC多肽的核酸的表达增加而相对于对照植物具有提高的产量、尤其提高的植物籽苗生长势和/或提高的种子产量,或从所述转基因植物衍生的转基因植物细胞。
46.根据项39、43或45的转基因植物或从其衍生的转基因植物细胞,其中所述的植物是作物植物或单子叶植物或谷物植物,如稻、玉米、小麦、大麦、谷子、黑麦、小黑麦、高粱和燕麦。
47.根据项46的植物的可收获部分,其中所述的可收获部分优选地是苗生物量和/或种子。
48.产物,从根据项46的植物和/或从根据项47的植物的可收获部分衍生。
49.编码JMJC多肽的核酸在植物中相对于对照植物提高产量、尤其提高种子产量和/或苗生物量中的用途。
50.分离的核酸分子,包含任一以下特征:
(i)由SEQ ID NO:169代表的核酸:
(ii)与SEQ ID NO:169互补的核酸或其片段;
(iii)编码JMJC多肽的核酸,所述的JMJC多肽以增加的优选顺序与SEQ ID NO:170中给出的氨基酸序列具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的序列同一性:
(iv)能够在严格条件下与以上(i)、(ii)或(iii)中给出的任一种核酸杂交的核酸。
51.分离的多肽分子,包含:
(i)以增加的优选顺序与SEQ ID NO:170中给出的氨基酸序列具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%或更高的序列同一性的氨基酸序列;
(ii)(i)中给出的任意氨基酸序列的衍生物。
52.用于相对于对照植物增强植物中产量相关性状的方法,包括调节植物中编码酪蛋白激酶I(CKI)的核酸表达,其中所述的CKI选自SEQ IDNO:174或其直向同源物或旁系同源物。
53.根据项52的方法,其中所述受调节的表达通过在植物中导入和表达编码所述CKI多肽的核酸实现。
54.根据项52或53的方法,其中编码所述CKI多肽的所述核酸是SEQ ID NO:173的一部分或是能够与这种核酸杂交的核酸。
55.根据项52至54任一项的方法,其中所述的核酸序列编码SEQ IDNO:174。
56.根据项52至55任一项的方法,其中所述的增强的产量相关性状包括相对于对照植物而言提高的早期生长势和/或提高的产量、优选提高的生物量和/或提高的种子产量。
57.根据项52至56任一项的方法,其中所述的增强的产量相关性状在非胁迫条件下获得。
58.根据项52至56任一项的方法,其中所述的增强的产量相关性状在非生物胁迫条件下获得。
59.根据项58的方法,其中所述的非生物胁迫条件选自以下一个或多个条件:干旱胁迫条件、盐胁迫条件和缺氮条件。
60.根据项53至59任一项的方法,其中所述的核酸有效连接至种子特异性启动子。
61.根据项53至60任一项的方法,其中所述的种子特异性启动子是WSI18启动子、优选来自稻的WSI18启动子。
62.根据项52至61任一项的方法,其中所述编码CKI多肽的核酸是植物来源的。
63.根据项52至62任一项的方法,其中所述的植物来源优选地来自双子叶植物,进一步优选地来自茄科,更优选来自烟草所属的属。
64.由根据项52至63任一项的方法可获得的植物或其部分,包括种子,其中所述的植物或其部分包含编码CKI多肽的重组核酸。
65.构建体,包含:
(i)编码项52中定义的CKI多肽的核酸;
(ii)能够驱动(a)的核酸序列表达的一个或多个控制序列;和任选地
(iii)转录终止序列。
66.根据项65的构建体,其中所述的控制序列之一是种子特异性启动子、优选WSI18启动子。
67.根据项65的构建体,其中所述的种子特异性启动子之一是WSI18启动子、最优选是来自稻的WSI18启动子。
68.根据项65至67任一项的构建体在用于产生植物的方法中的用途,所述植物相对于对照植物具有提高的产量相关性状、尤其提高的早期生长势、提高的生物量和/或提高的种子产量。
69.用根据项65至67任一项的构建体转化的植物、植物部分或植物细胞。
70.用于产生转基因植物的方法,所述的转基因植物相对于对照植物具有提高的产量、尤其提高的生物量和/或提高的种子产量,该方法包括:
(i)在植物中导入并表达编码如项52中定义的CKI多肽的核酸;和
(ii)在促进植物生长和发育的条件下培养植物细胞。
71.转基因植物,其因编码如项52中定义的CKI多肽的核酸的表达增加而相对于对照植物具有提高的产量相关性状、尤其提高的早期生长势、提高的生物量和/或提高的种子产量,或从所述转基因植物衍生的转基因植物细胞。
72.根据项64、69或71的转基因植物或从其衍生的转基因植物细胞,其中所述的植物是作物植物或单子叶植物或谷物植物,如稻、玉米、小麦、大麦、谷子、黑麦、小黑麦、高粱和燕麦。
73.根据项72的植物的可收获部分,其中所述的可收获部分优选地是苗生物量和/或种子。
74.产物,从根据项72的植物和/或从根据项73的植物的可收获部分衍生。
75.编码CKI多肽的核酸在植物中相对于对照植物提高产量相关性状、尤其提高早期生长势、种子产量和苗生物量之一者或多者中的用途。
76.用于相对于对照植物增强植物中产量相关性状、优选增强种子产量相关性状的方法,包括调节、优选增加植物中编码植物同源域指-同源域(PHDf-HD)多肽的核酸序列表达,所述PHDf-HD多肽包含:(i)与如SEQ IDNO:233所代表的亮氨酸拉链/植物同源域指(ZIP/PHDf)结构域具有至少25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或更高氨基酸序列同一性的结构域;和(ii)与如SEQ ID NO:234所代表的同源域(HD)具有至少25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或更高氨基酸序列同一性的结构域,和任选地选择具有增强的产量相关性状的植物。
77.根据项76的方法,其中所述的PHDf-HD多肽包含:(i)如PFAM00628所代表的PHD结构域;和(ii)如PFAM00046所代表的HD。
78.根据项76或77的方法,其中在构建HD进化系统树如图13中所绘制的HD进化系统树中使用时,所述的PHDf-HD多肽与包含如SEQID NO:180所代表的多肽序列的PHDf-HD组多肽聚类,而不与任何其他HD组聚类。
79.根据项76至78任一项的方法,其中所述的PHDf-HD多肽以增加的优选顺序与如SEQ ID NO:180所代表的PHDf-HD多肽或与本文表D1中给出的任意多肽序列具有至少30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或更高的序列同一性。
80.根据项76至79任一项的方法,其中所述编码PHDf-HD多肽的核酸序列由表D1中给出的任一个核酸序列SEQ ID NO或其部分,或者能够与表D1中所给出的任一个核酸序列SEQ ID NO杂交的序列代表。
81.根据项76至80任一项的方法,其中所述的核酸序列编码表D1中给出的任一SEQ ID NO的直向同源物或旁系同源物。
82.根据项76至81任一项的方法,其中所述的受调节、优选增加的表达通过以下任意一种或多种方法实现:T-DNA活化标签法、TILLING或同源重组法。
83.根据项76至82任一项的方法,其中所述增加的表达通过在植物中导入和表达编码PHDf-HD多肽的核酸序列实现。
84.根据项76至83任一项的方法,其中所述的产量相关性状是种子产量相关性状,包含以下一项或多项:(i)增加的原发花序数;(ii)提高的每株植物种子总重量;(iii)提高的(充实)种子数;(iv)提高的TKW;或(v)提高的收获指数。
85.根据项76至84任一项的方法,其中所述的核酸序列有效连接至组成型启动子,优选地有效连接至植物组成型启动子、更优选地有效连接至GOS2启动子,最优选地有效连接至来自稻的GOS2启动子。
86.根据项76至85任一项的方法,其中所述编码PHDf-HD多肽的核酸序列是植物来源的,优选地来自单子叶植物,进一步优选地来自禾本科,更优选地来自稻属(Oryza),最优选地来自稻。
87.通过项76至86任一项的方法可获得的植物、其部分(包括种子)或植物细胞,其中所述的植物、其部分或细胞包含有效连接至植物组成型启动子的编码PHDf-HD多肽的分离的核酸转基因。
88.构建体,包含:
(i)编码如项76至81任一项中定义的PHDf-HD多肽的核酸序列;
(ii)能够驱动(i)的核酸序列表达的一个或多个控制序列;和任选地
(iii)转录终止序列。
其中至少一个所述控制序列是植物组成型启动子,优选地是GOS2启动子。
89.根据项87的构建体在用于产生植物的方法中的用途,所述植物相对于对照植物具有增强的产量相关性状,所述增强的产量相关性状、优选增强的种子产量相关性状是以下一项或多项:(i)增加的原发花序数;(ii)提高的每株植物种子总重量;(iii)提高的(充实)种子数;(iv)提高的TKW;或(v)提高的收获指数。
90.用根据项87或88的构建体转化的植物、植物部分或植物细胞。
91.用于产生相对于对照植物具有增强的产量相关性状的转基因植物的方法,包括:
(i)在植物、植物部分或植物细胞中导入并表达在植物组成型启动子控制下的编码如项76至81任一项中定义的PHDf-HD多肽的核酸序列;和
(ii)在促进植物生长和发育的条件下培养植物细胞。
92.转基因植物,其因有效连接至植物组成型启动子的编码如项76至81任一项中所定义PHDf-HD多肽的核酸序列受调节、优选增加的表达而相对于对照植物具有增强的产量相关性状、优选具有增强的种子产量相关性状,或从所述的转基因植物衍生的转基因植物细胞。
93.根据项87、90或92的转基因植物,其中所述的植物是作物植物或单子叶植物或谷物植物,如稻、玉米、小麦、大麦、谷子、黑麦、小黑麦、高粱和燕麦,或从所述的转基因植物衍生的转基因植物细胞。
94.包含核酸序列的可收获部分,所述核酸序列编码根据项93的植物的PHDf-HD多肽,其中所述的可收获部分优选地是种子。
95.产物,从根据项93的植物和/或从根据项94的植物的可收获部分衍生。
96.编码如项76至81任一项中定义的PHDf-HD多肽的核酸序列在增强植物中产量相关性状、优选地在增强种子产量相关性状中的用途,所述产量相关性状包含以下一项或多项:(i)增加的原发花序数;(ii)提高的每株植物种子总重量;(iii)提高的(充实)种子数;(iv)提高的TKW;或(v)提高的收获指数。
97.分离的核酸分子,包含任一以下特征:
(i)由SEQ ID NO:242代表的核酸:
(ii)与SEQ ID NO:242互补的核酸或其片段;
(iii)编码JMJC多肽的核酸,所述的JMJC多肽以增加的优选顺序与SEQ ID NO:243中给出的氨基酸序列具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的序列同一性:
(iv)能够在严格条件下与以上(i)、(ii)或(iii)中给出的任一种核酸杂交的核酸。
98.分离的多肽分子,包含:
(i)以增加的优选顺序与SEQ ID NO:243中给出的氨基酸序列具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%或更高的序列同一性的氨基酸序列:
(ii)(i)中给出的任意氨基酸序列的衍生物。
99.用于相对于对照植物增强植物中产量相关性状的方法,包括调节植物中编码bHLH11样多肽的核酸表达,其中所述的bHLH11样多肽包含螺旋-环-螺旋结构域。
100.根据项99的方法,其中所述的bHLH11样多肽包含一个或多个以下基序:
(i)基序1(SEQ ID NO:246):
(ii)基序2(SEQ ID NO:247):
(iii)基序3(SEQ ID NO:248):
(iv)基序4(SEQ ID NO:249):
(v)基序5(SEQ ID NO:250):
(vi)基序6(SEQ ID NO:251);
(vii)基序7(SEQ ID NO:252)。
101.根据项99或100的方法,其中所述受调节的表达通过在植物中导入和表达编码bHLH11样多肽的核酸实现。
102.根据项99至101任一项的方法,其中所述编码bHLH11样多肽的核酸编码表E1中所列的任一种蛋白质或是这种核酸的一部分或是能够与这种核酸杂交的核酸。
103.根据项99至102任一项的方法,其中所述的核酸序列编码表E1中给出的任意蛋白质的直向同源物或旁系同源物。
104.根据项99至103任一项的方法,其中所述的增强的产量相关性状包括相对于对照植物而言提高的产量、优选提高的种子产量。
105.根据项99至104任一项的方法,其中所述的增强的产量相关性状在非胁迫条件下获得。
106.根据项101至105任一项的方法,其中所述的核酸有效连接至组成型启动子,优选地有效连接至GOS2启动子,最优选地有效连接至来自稻的GOS2启动子。
107.根据项99至106任一项的方法,其中所述编码bHLH11样多肽的核酸是植物来源的,优选地来自单子叶植物,进一步优选地来自禾本科,更优选地来自小麦属,最优选地来自普通小麦。
108.通过项99至107任一项的方法可获得的植物或其部分,包括种子,其中所述的植物或其部分包含编码bHLH11样多肽的重组核酸。
109.构建体,包含:
(i)编码如项99或100中定义的bHLH11样多肽的核酸;
(ii)能够驱动(i)的核酸序列表达的一个或多个控制序列;和任选地
(iii)转录终止序列。
110.根据项109的构建体,其中所述的控制序列之一是组成型启动子,优选地是GOS2启动子,最优选地是来自稻的GOS2启动子。
111.根据项109或110的构建体在用于产生植物的方法中的用途,所述植物相对于对照植物具有提高的产量,尤其提高的种子产量。
112.用根据项109或110的构建体转化的植物、植物部分或植物细胞。
113.用于产生转基因植物的方法,所述的转基因植物相对于对照植物具有提高的产量、尤其提高的种子产量,该方法包括:
(i)在植物中导入并表达编码如项99或100中定义的bHLH11样多肽的核酸;和
(ii)在促进植物生长和发育的条件下培养植物细胞。
114.转基因植物,其因编码如项99或100中定义的bHLH11样多肽的核酸的受调节表达而相对于对照植物具有提高的产量、尤其提高的种子产量,或从所述转基因植物衍生的转基因植物细胞。
115.根据项108、112或114的转基因植物或从其衍生的转基因植物细胞,其中所述的植物是作物植物或单子叶植物或谷物植物,如稻、玉米、小麦、大麦、谷子、黑麦、小黑麦、高粱、二粒小麦、二粒小麦、黑麦属植物(secale)、单粒小麦、埃塞俄比亚画眉草、蜀黍和燕麦。
116.根据项115的植物的可收获部分,其中所述的可收获部分优选地是种子。
117.产物,从根据项115的植物和/或从根据项116的植物的可收获部分衍生。
118.编码bHLH11样多肽的核酸在植物中相对于对照植物提高产量、尤其在提高种子产量中的用途。
119.用于相对于对照植物增强植物中产量相关性状的方法,包括调节植物中编码ASR的核酸表达,其中所述的ASR由SEQ ID NO:397或其直向同源物或旁系同源物代表。
120.根据项119的方法,其中所述受调节的表达通过在植物中导入和表达编码所述ASR多肽的核酸实现。
121.根据项119或120的方法,其中编码所述ASR多肽的所述核酸是SEQ ID NO:396的一部分或是能够与这种核酸杂交的核酸。
122.根据项119至121任一项的方法,其中所述的核酸序列编码SEQID NO:397或其直向同源物或旁系同源物。
123.根据项119至122任一项的方法,其中所述的增强的产量相关性状包括相对于对照植物而言提高的产量、优选提高的种子产量。
124.根据项119至123任一项的方法,其中所述的增强的产量相关性状在非胁迫条件下获得。
125.根据项120至124任一项的方法,其中所述的核酸有效连接至组成型启动子,优选地有效连接至GOS2启动子,最优选地有效连接至来自稻的GOS2启动子。
126.根据项119至125任一项的方法,其中所述编码ASR多肽的核酸是植物来源的,优选地来自双子叶植物,进一步优选地来自禾本科,更优选地来自稻属,最优选地来自稻。
127.由根据项119至126任一项的方法可获得的植物或其部分,包括种子,其中所述的植物或其部分包含编码ASR多肽的重组核酸。
128.构建体,包含:
(i)编码如项119或SEQ ID NO:401、403、405、407、409、411、413、415和417任一序列中定义的ASR多肽的核酸;
(ii)能够驱动(a)的核酸序列表达的一个或多个控制序列;和任选地
(iii)转录终止序列。
129.根据项128的构建体,其中所述的控制序列之一是组成型启动子,优选地是GOS2启动子,最优选地是来自稻的GOS2启动子。
130.根据项128或129任一项的构建体在用于产生植物的方法中的用途,所述植物相对于对照植物具有提高的产量相关性状,尤其提高的种子产量。
131.用根据项128或129任一项的构建体转化的植物、植物部分或植物细胞。
132.用于产生转基因植物的方法,所述的转基因植物相对于对照植物具有提高的产量、尤其提高的生物量和/或提高的种子产量,该方法包括:
(i)在植物中导入并表达编码如项119中定义的ASR多肽的核酸;和
(ii)在促进植物生长和发育的条件下培养植物细胞。
133.转基因植物,其因编码如项119中定义的ASR多肽的核酸的表达增加而相对于对照植物具有提高的产量相关性状、尤其提高的种子产量,或从所述转基因植物衍生的转基因植物细胞。
134.根据项127、131或133的转基因植物或从其衍生的转基因植物细胞,其中所述的植物是作物植物或单子叶植物或谷物植物,如稻、玉米、小麦、大麦、谷子、黑麦、小黑麦、高粱和燕麦。
135.根据项134的植物的可收获部分,其中所述的可收获部分优选地是种子。
136.产物,从根据项134的植物和/或从根据项135的植物的可收获部分衍生。
137.编码ASR多肽的核酸在植物中相对于对照植物提高产量相关性、尤其在提高种子产量中的用途。
138.分离的核酸分子,包含任一以下特征:
(i)由SEQ ID NO:401、403、405、407、409、411、413、415和417任一序列代表的核酸;
(ii)由SEQ ID NO:401、403、405、407、409、411、413、415和417任一序列代表的核酸的互补物;
(iii)编码ASR多肽的核酸,所述的ASR多肽以增加的优选顺序与SEQ ID NO:402、404、406、408、410、412、414、416和418任一序列所代表的氨基酸序列具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的序列同一性:
139.分离的多肽,包含:
(i)由SEQ ID NO:402、404、406、408、410、412、414、416和418任一序列所代表的氨基酸序列;
(ii)以增加的优选顺序与SEQ ID NO:402、404、406、408、410、412、414、416和418任一序列所代表的氨基酸序列具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高序列同一性的氨基酸序列:
(iii)以上(i)或(ii)中给出的任意氨基酸序列的衍生物。
140.用于相对于对照植物增强植物中产量相关性状的方法,包括调节植物中编码SPL11多肽的核酸表达,其中所述的SPL11多肽包含以增加的优选顺序与SEQ ID NO:456至SEQ ID NO:468和SEQ ID NO:478中任一序列所代表的氨基酸序列具有至少70%、75%、80%、85%、90%、95%、97%或更高序列同一性的SBP结构域。
141.根据项140的方法,其中除SBP结构域之外,所述的SPL11多肽还包含任意一个或多个以下保守基序:
(i)如SEQ ID NO:469所代表的基序1,其中允许任意的保守性氨基酸替换和/或1或2个非保守性替换;
(ii)如SEQ ID NO:470所代表的基序2,其中允许任意的变化,条件是至少4个氨基酸具有极性侧链、优选地是丝氨酸或苏氨酸,并且条件是该基序位于SBP结构域的氨基末端;
(iii)如SEQ ID:471所代表的基序3,其中允许1或2个错配;
(iv)如SEQ ID:472所代表的基序4,其中允许1、2或3个错配。
142.根据项140或141的方法,其中所述受调节的表达通过在植物中导入和表达编码如项140或141中定义的SPL11多肽的核酸实现。
143.根据项140至142任一项的方法,其中所述受调节的表达是增加的表达。
144.根据项140至143任一项的方法,其中所述编码SPL11多肽的核酸编码表G1中所列的任一种蛋白质或是这种核酸的一部分或是能够与这种核酸杂交的核酸。
145.根据项140至144任一项的方法,其中所述的核酸序列编码表G1中给出的任意蛋白质的直向同源物或旁系同源物。
146.根据项145的方法,其中所述的核酸编码SEQ ID NO:428。
147.根据项140至146任一项的方法,其中所述的增强的产量相关性状包含相对于对照植物/而言提高的产量、优选提高的种子总重量、充实种子数、每花序种子数或小花数、千粒核重、种子充实率和/或收获指数。
148.根据项140至147任一项的方法,其中所述的增强的产量相关性状包括相对于对照植物而言的植物(籽苗)早期生长势。
149.根据项140至147任一项的方法,其中所述的增强的产量相关性状在非胁迫条件下获得。
150.根据项140至147任一项的方法,其中所述的增强的产量相关性状在轻度干旱胁迫生长条件下获得。
151.根据项140至147任一项的方法,其中所述的增强的产量相关性状在缺氮生长条件下获得。
152.根据项140至151任一项的方法,其中所述的核酸有效连接至组成型启动子,优选地有效连接至GOS2启动子,最优选地有效连接至来自稻的GOS2启动子。
153.根据项140至151任一项的方法,其中所述的核酸有效连接至种子特异性启动子,优选地有效连接至WSI18启动子,最优选地有效连接至来自稻的WSI18启动子。
154.根据项140至153任一项的方法,其中所述编码SPL11多肽的核酸是植物来源的,优选地来自双子叶植物,进一步优选地来自十字花科,更优选地来自拟南芥属,最优选地来自拟南芥。
155.通过项140至154任一项的方法可获得的植物或其部分,包括种子,其中所述的植物或其部分包含编码SPL11多肽的重组核酸。
156.分离的核酸分子,包含:
(i)由SEQ ID NO:448代表的核酸;
(ii)由SEQ ID NO:448代表的核酸的互补物;
(iii)编码SPL11多肽的核酸,所述的SPL11多肽以增加的优选顺序与SEQ ID NO:449所代表的氨基酸序列具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的序列同一性,并且以增加的优选顺序与SEQ ID NO:465:SYCQVEGCRTDLSSAKDYHRKHRVCEPHSKAPKVVVAGLERRFCQQCSRFHGLAEFDQKKKSCRRRLNDHNARRRKPQPEAL具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的序列同一性;
(iv)在严格杂交条件下与SEQ ID NO:448杂交的核酸分子。
157.分离的多肽,包含:
(i)由SEQ ID NO:449代表的氨基酸序列;
(ii)氨基酸序列,其以增加的优选顺序与SEQ ID NO:449所代表的氨基酸序列具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的序列同一性,并且以增加的优选顺序与SEQ ID NO:465:SYCQVEGCRTDLSSAKDYHRKHRVCEPHSKAPKVVVAGLERRFCQQCSRFHGLAEFDQKKKSCRRRLNDHNARRRKPQPEAL具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的序列同一性;
(iii)以上(i)或(ii)中给出的任意氨基酸序列的衍生物。
158.构建体,包含:
(i)编码SPL11多肽的核酸;
(ii)能够驱动(i)的核酸序列表达的一个或多个控制序列;和任选地
(iii)转录终止序列。
159.根据项158的构建体,其中所述编码SPL11多肽的核酸是根据项156的核酸。
160.根据项158或159的构建体,其中所述的控制序列之一是组成型启动子,优选地是GOS2启动子,最优选地是来自稻的GOS2启动子。
161.根据项158或159的构建体,其中所述的控制序列之一是种子特异性启动子,优选地是WSI18启动子,最优选地是来自稻的WSI18启动子。
162.根据项158至161的构建体在用于产生植物的方法中的用途,所述植物相对于对照植物具有提高的产量相关性状、尤其提高的种子产量和/或和/或植物或籽苗早期生长势。
163.用根据项158至161的构建体转化的植物、植物部分或植物细胞。
164.用于产生转基因植物的方法,所述的转基因植物相对于对照植物具有提高的产量相关性状、尤其提高的种子产量和/或植物或籽苗早期生长势,该方法包括:
(i)在植物中导入并表达编码SPL11多肽的核酸;和
(ii)在促进植物生长和发育的条件下培养植物细胞。
165.转基因植物,其因编码SPL11多肽的核酸的表达增加而相对于对照植物具有提高的产量、尤其提高的植物籽苗生长势和/或提高的种子产量,或从所述转基因植物衍生的转基因植物细胞。
166.根据项155、163或165的转基因植物或从其衍生的转基因植物细胞,其中所述的植物是双子叶作物植物,如大豆、棉花或卡诺拉油菜,或是单子叶作物植物或谷物植物,如稻、玉米、小麦、大麦、谷子、黑麦、小黑麦、高粱和燕麦。
167.根据项166的植物的可收获部分,其中所述的可收获部分优选地是苗生物量、花和/或种子。
168.产物,从根据项166的植物和/或从根据项167的植物的可收获部分衍生。
169.编码SPL11多肽的核酸在植物中相对于对照植物提高产量、尤其提高种子产量和/或苗生物量中的用途。
附图简述
本发明现在将参考以下图进行描述,其中:
I.包含LOB结构域的蛋白质(LOB:侧生器官边界)
图1表示SEQ ID NO:2的序列,其中DUF260结构域以粗体显示,将保守基序1、2和3加下划线并且保守的Cys残基(SEQ ID NO:9的基序)以斜体表示。
图2表示在本发明方法中有用的多种LBD蛋白序列的多重比对结果。
图3显示II类和I类LBD蛋白的进化系统树。SEQ ID NO:2的序列由AtLBD37代表。
图4表示用于稻中增加在稻GOS2启动子(pGOS2)控制下编码LBD的核酸表达的双元载体。
图5详述在实施本发明方法中有用的LBD序列的例子。
II.JMJC(JUMONJI-C)多肽
图6表示SEQ ID NO:74的氨基酸序列和结构域结构。指出了保守基序和结构域。JmjC结构域以粗体显示。保守基序SEQ ID NO:79、SEQ IDNO:80和SEQ ID NO:81分别由单线、双线和三线长方形指示。加下划线的是通常参与2-酮戊二酸配位作用的T(苏氨酸)和K(赖氨酸)氨基酸残基。大写字母H表示配位铁离子的组氨酸氨基酸残基。
图7表示JMJC蛋白的多重比对结果。此蛋白质的来源由名称中的第一位的两个字母表示,At:拟南芥,Pp:毛果杨(Populus trichocarpa),Os:稻,Ot:Streococcus tauri,Ce:秀丽隐杆线虫(Caenorhabditis elegans),Hs:智人(Homo sapiens)。显示了与图6中所述那些保守氨基酸残基和结构域对应的保守氨基酸残基和结构域的位置。给出了共有序列。给出了该共有序列中高度保守的氨基酸;空白空间代表任意氨基酸。
图8显示JMJC多肽的进化系统树。箭头显示SEQ ID NO:74。其它JMJC多肽使用Genbank登录号命名。组I(G I)包含植物来源的蛋白质;组II(GII)包含非植物来源的蛋白质。
图9表示用于稻中增加在稻GOS2启动子(pGOS2)控制下的SEQ IDNO:73表达的双元载体。
图10详述在实施本发明方法中有用的JMJC序列的例子。
III.酪蛋白激酶I
图11表示用于稻中增加在稻WSI18启动子控制下编码GRP的核酸表达的双元载体(pWSI18::GRP)。
图12详述在实施本发明方法中有用的GRP序列的例子。
IV.植物同源域指-同源域(PHDf-HD)多肽
图13表示在比对(从Potsdam大学服务器上维护的稻TFDB数据库下载的)属于HD家族的全部转录因子和表D1的全部多肽序列(当为完整长度时)后构建的邻接树,其中利用默认值,使用累进比对的Clustal算法(1.83)执行所述邻接树。包含两种稻旁系同源物(SEQ ID NO:180或Os02g05450.1,和SEQ ID NO:202或Os06g12400.1)的目的组划圈标示。属于这个HD组的任意多肽(在如本文以上描述的新多重比对步骤后)认为在实施如本文中所述的本发明方法中有用。
图14表示SEQ ID NO:180所代表的PHDf-HD多肽的卡通图,其包含一个或多个以下特点:预测的核定位信号(NLS)、亮氨酸拉链(ZIP)、PHD指(PHDf,Pfam00628)、酸性区段、两个碱性区段、同源域(HD,Pfam00046)。
图15显示表D1的PHDf-HD多肽的同源域(HD)的序列图标,其中堆叠的总体高度指示在该位置处的序列保守,而在堆叠范围内的符号的高度指示每个氨基酸或核酸在该位置处的相对频率。如SEQ ID NO:234所代表的并且在SEQ ID NO:180中包含的HD符合如该图中所表示的序列图标。
图16显示COILS算法的图形输出结果,所述的COILS算法预测到如SEQ ID NO:180所代表的多肽的氨基端这一半部分中的两个卷曲螺旋结构域。X轴描述氨基酸残基坐标,Y轴描述卷曲螺旋结构域存在的概率(从0至1),和三条线、检验的三个窗口(14、21、28)。
图17显示来自表D1的PHDf-HD多肽(当是完整长度时)的CLUSTALW(1;83)多重序列比对结果,其中鉴定到许多特点。从所述多肽的氨基端至羧基端是:(i)预测的核定位信号(NLS);(ii)亮氨酸拉链(ZIP),其具有4个七残基组(以方框标示,其中每隔7个氨基酸出现一个亮氨酸(偶然是异亮氨酸、缬氨酸或甲硫氨酸);(iii)PHD指(PHDf),其含有带特征性半胱氨酸间隔区的典型C4HC3(4个半胱氨酸、1个组氨酸、3个半胱氨酸);(iv)酸性区段(富含酸性氨基酸D和E);(v)碱性区段(富含碱性氨基酸K和R);(vi)同源域(HD)。
图18显示用于稻中调节、优选地增加在稻GOS2启动子(pGOS2)控制下编码PHDf-HD多肽的核酸序列表达的双元载体。
图19详述在实施本发明方法中有用的PHDf-HD序列的例子。
V.bHLH11样(碱性螺旋-环-螺旋11)蛋白
图20表示SEQ ID NO:245的结构域结构,其具有由下划线和数字指示的保守基序。通过SMART所确定的HLH结构域(基序8)以粗体下划线显示。
图21表示多种bHLH11样蛋白的多重比对结果。点表示保守残基,冒号表示高度保守的残基并且星号代表完全保守的残基。发现最高程度的序列保守性存在于bHLH结构域区域中。删除了比对结果中延伸超过其余蛋白质的AT2G24260的羧基端部分。
图22显示了所选bHLH蛋白的环形进化枝图。使用了bHLH11样蛋白和代表由Heim 2003定义的其余类别中每一类别的一种拟南芥蛋白。使用“CLUSTALX”产生该比对结果,并且计算出邻接树。使用Dendroscope(Huson等人BMC Bioinformatics 2007)绘制该环形进化枝图。对一些主要结节显示100个重复的Bootstrap结果;加框表示的Bootstrap值显示bHLH11样蛋白组清楚地与其余蛋白中区分(delineated)。
图23表示用于稻中增加在稻GOS2启动子(pGOS2)控制下编码bHLH11样的核酸表达的双元载体。
图24详述在实施本发明方法中有用的bHLH11样序列的例子。
VI.ASR(脱落酸、胁迫和成熟诱导的)蛋白
图25表示用于稻中增加在稻GOS2启动子(pGOS2)控制下编码GRP的核酸表达的双元载体(pGOS2::GRP)。
图26详述在实施本发明方法中有用的GRP序列的例子。
VII.鳞部启动子结合蛋白样11(SPL11)
图27表示SEQ ID NO:428的氨基酸序列和结构域结构。指出了保守基序和结构域。SBP结构域由间断线下划显示;基序1以粗体显示;基序2以粗体和下划线显示;基序3是粗体大写字母并且加下划线显示并且基序4以粗体和以双线下划显示。
图28表示SPL11多肽的多重序列比对结果。显示了与图27中所述那些保守氨基酸残基和结构域对应的保守氨基酸残基和结构域的位置。给出了SPL11多肽的代表性共有序列。在所述共有序列中,显示高度保守的氨基酸,并且在所述共有序列之间的空白空间代表任意氨基酸。
图29显示SPL11多肽的进化系统树。进化系统树如Xie等人PlantPhysiology,2006,第142卷,第280-293页中所示构建,所述文献如同充分描述那样通过引用的方式并入本文。SPL11多肽在名为S3类的类别范围内,在与AtSPL11(同一于SEQ ID NO:2)相同的组中聚类。
图30提供稻miR156基因(OsmiR156)和其在稻SPL多肽中所靶向序列的序列分析结果(图30A)以及SPL11核酸的多重比对结果(图30B)。图30A显示OsmiR156成熟序列与OsSPL基因的互补序列的序列比对结果。在底部显示由所述靶序列编码的保守氨基酸序列。在miR156和所靶向OsSPL序列之间的点表示错配。图4B显示SPL11核酸的多重比对结果,其中指出了共有序列中高度保守的核酸残基。高度保守的miR156靶位点的位置以粗体在该共有序列上方显示。作为对miR156不敏感的SPL11核酸代表的SEQ ID NO:431、SEQ ID NO:440和SEQ ID NO:454不具有保守的miR156靶位点或在它们的序列中的该位置处显示巨大的趋异性。
图31表示用于稻中增加在稻GOS2启动子(pGOS2)控制下(图31A)或在稻WSI18启动子控制下(图31B)的SEQ ID NO:427表达的双元载体。
图32详述在实施本发明方法中有用的SPL11序列的例子。
实施例
本发明现在参考如下实施例进行描述,所述实施例仅是示意性的。以下实施例不意图完全限定或限制本发明的范围。
DNA操作:除非另外说明,重组DNA技术根据(Sambrook(2001)Molecular Cloning:a laboratory manual,第3版Cold Spring HarborLaboratory Press,CSH,New York)或Ausubel等人(1994),CurrentProtocols in Molecular Biology,Current Protocols第1卷和第2卷中描述的标准方案进行。用于植物分子研究工作的标准材料和方法在BIOS科学出版有限责任公司(BIOS Scientific Publications Ltd(英国))和Blackwell科学出版社(Blackwell Scientific Publications(英国))出版的R.D.D.Croy的Plant Molecular Biology Labfax(1993)中描述。
I.包含LOB结构域的蛋白质(LOB:侧生器官边界)
实施例1:鉴定与本发明方法中所用核酸序列相关的序列
用数据库搜索工具如基本局部比对工具(BLAST)(Altschul等人(1990)J.Mol.Biol.215:403-410;和Altschul等人(1997)Nucleic Acids Res.25:3389-3402),在国家生物技术信息中心(NCBI)的Entrez核苷酸数据库中维护的那些序列中鉴定到与本发明方法中所用核酸序列相关的(全长cDNA、EST或基因组)序列。使用该程序通过将核酸序列或多肽序列与序列数据库比较并且计算匹配的统计显著性来找到序列之间的局部相似性区域。由与本发明方法中所用核酸编码的多肽用于TBLASTN算法,采用默认设置和过滤程序以忽略低复杂性序列启动(set off)。这种分析的结果通过配对比较进行观察,并根据概率评分(E-值)进行评级,其中所述的评分反映特定比对结果因偶然发生的概率(E-值越低,命中的显著性越高)。除了E-值外,比较过程也可以通过同一性百分数评分。同一性百分数指两个所比较的核酸(或多肽)序列之间特定长度范围内相同的核苷酸(或氨基酸)的数目。
表A1提供与本发明方法中所用LBD核酸序列相关的核酸序列名单。
表A1:LBD多肽的例子:添加稻、玉米、小麦、卡诺拉油菜、马铃薯、大豆、拟南芥的DNA序列
*:在可获得的情况下,提供了GenBank或SwissProt数据库登录号,TC代码来自TIGR。
实施例2:LBD多肽序列的比对
多肽序列的比对使用来自Vector NTI(Invitrogen)的Alignment X程序进行,其中所述Alignment X程序基于受欢迎的累进比对Clustal算法(Thompson等人(1997)Nucleic Acids Res 25:4876-4882;Chenna等人(2003),Nucleic Acids Res 31:3497-3500)。空位开口罚分的默认值是10,空位延伸罚分0.1并且所选的权重矩阵是Blosum 62。进行少许手工编辑以优化该比对。诸LBD多肽之间的序列保守性基本上在所述多肽的氨基端DUF260结构域内,羧基端区域通常在序列长度和组成方面更为多变。所述LBD多肽在图2中比对。
使用如Vector NTI(Invitrogen)的AlignX程序中所提供的邻接法聚类算法构建LBD多肽的进化系统树(图3)。在构建该进化系统树中所使用的I类LBD蛋白的序列是公开可获得的并且以它们的GenBank登录号或SwissProt登录号表示。
实施例3:在实施本发明方法中有用的多肽序列之间的总体同一性百分数的计算
使用现有技术领域可获得的方法之一,即MatGAT(矩阵总体比对工具)软件(BMC Bioinformatics.20034:29.MatGAT:使用蛋白质序列或DNA序列产生相似性/同一性矩阵的一项应用(an application thatgenerates similarity/identity matrices using protein or DNA sequences),Campanella JJ,Bitincka L,Smalley J;该软件由Ledion Bitincka维护)确定在实施本发明方法中有用的全长多肽序列之间的总体相似性和同一性百分数。MatGAT软件对DNA序列或蛋白质序列产生相似性/同一性矩阵,无需数据的预先比对。该程序使用Myers和Miller总体比对算法(空位开口罚分12和空位延伸罚分2)执行一系列配对比对,使用例如Blosum 62(对于多肽而言)计算相似性和同一性并且随后将结果置于距离矩阵内。在分割线下半部分显示序列相似性,和在对角分割线的上半部分显示序列同一性。
比较中使用的参数是:
评分矩阵:Blosum62
第一空位:12
延伸空位:2
表B中显示在多肽序列的全长范围内总体相似性和同一性的软件分析结果。在对角线上方以粗体给出同一性百分数而在对角线下方(正常字体)给出相似性百分数。
与(由第44行At-LBD37代表的)SEQ ID NO:2相比较,在实施本发明方法中有用的LBD多肽序列之间的百分数同一性可以低至30.2%氨基酸同一性。仅比较DUF206结构域的序列时,该同一性百分数可能将会更高。为了鉴定其他LBD蛋白中的DUF260结构域(如图1中所描述),可以使用图2的多重比对进行比对。
表A2:在LBD多肽序列的全长范围内总体相似性和同一性的MatGAT结果
1 2 3 4 5 6 7 8 9 10 11 12
1.Os-Os01g03890 43.2 35.8 34.5 34.4 32.9 33.0 35.5 35.2 34.5 31.5 32.2
2.Os-Os01g32770 55.5 31.0 31.1 31.5 30.3 32.4 30.7 30.6 30.9 29.8 31.2
3.Os-Os03g33090 46.9 40.3 48.3 65.0 56.7 53.9 52.1 66.7 71.3 51.5 55.0
4.Os-Os03g41330 46.3 43.0 60.3 48.3 43.0 43.2 41.2 46.4 48.6 40.2 45.1
5.Os-Os07g40000 45.9 40.9 73.0 59.9 53.0 50.6 49.6 68.0 63.1 47.6 52.3
6.Nb-TC9404 45.9 42.4 66.5 60.3 67.7 60.7 60.3 51.7 51.5 56.7 66.5
7.Gm-TC227562 45.0 44.5 65.2 59.1 65.2 75.2 73.7 50.6 49.4 55.2 64.8
8.Gm-TC216138 47.2 41.5 63.3 58.8 62.1 70.4 79.6 50.0 48.8 53.3 65.3
9.Hv-TC147776 45.9 41.5 76.1 58.6 79.6 69.2 67.4 63.8 58.7 47.3 52.2
10.Sb-TC104758 45.3 40.6 77.0 59.6 71.1 63.0 62.6 58.8 68.5 49.0 51.7
11.Aq-TC18561 47.2 43.3 61.5 56.9 62.3 67.5 69.7 63.8 67.1 61.7 58.1
12.Vv-TC60668 45.0 43.3 65.4 59.1 66.7 79.4 77.4 77.1 66.2 64.7 72.7
13.Lj-TC15459 45.6 40.9 64.1 59.1 64.1 72.2 81.4 88.8 67.5 61.6 70.5 79.3
14.Gh-TC30552 46.3 43.0 66.8 63.4 64.7 75.9 78.4 75.4 66.8 64.3 72.8 82.8
15.Ta-TC235711 56.7 61.5 42.9 43.2 46.3 46.7 46.3 47.4 47.0 44.6 48.4 45.6
16.St-TC133081 59.0 55.8 47.4 48.5 47.1 50.7 49.6 47.4 49.3 48.9 50.4 50.0
17.Mt-TC107091 58.6 60.0 45.5 46.2 43.5 46.5 46.2 47.2 42.5 44.9 49.2 49.2
18.Hv-TC147808 59.0 64.8 42.1 42.1 44.7 44.4 46.7 46.0 45.0 44.7 44.4 45.0
19.Vv-TC55931 57.0 55.2 49.4 47.8 46.2 53.0 51.4 49.8 48.2 46.2 53.8 51.8
20.St-TC162239 49.5 48.2 50.4 52.6 51.7 54.7 54.7 55.0 46.6 51.1 57.7 56.8
21.Pta-TC69225 53.0 50.0 38.9 41.6 40.4 44.9 44.9 43.1 43.1 41.9 44.9 44.6
22.Pta-TC67269 51.8 52.7 39.6 41.4 39.3 42.6 42.9 41.4 43.2 40.8 44.0 42.6
23.Gm-TC220806 45.9 46.1 56.4 49.1 51.3 54.5 52.6 51.7 52.3 48.5 52.4 53.5
24.Ta-TC270332 41.4 40.6 56.5 84.5 59.1 61.3 59.1 57.1 60.0 57.9 59.7 58.7
25.Aq-TC18329 62.5 61.5 46.6 47.9 44.1 50.0 50.7 47.6 44.8 45.2 51.4 49.7
26.St-TC137193 45.6 42.1 68.7 57.3 65.9 89.3 72.6 70.4 68.9 61.3 74.0 77.6
27.St-TC133385 45.6 41.8 70.8 56.9 66.4 87.9 71.3 68.3 66.2 62.1 70.6 76.3
28.St-TC140088 44.3 42.1 64.5 51.3 61.5 71.0 68.3 65.8 65.8 60.9 68.4 70.2
29.Pa-TC14656 48.5 45.2 47.7 46.9 48.4 51.6 52.7 52.7 47.3 48.0 53.4 53.8
30.Pta-TC59178 47.7 45.2 40.5 40.2 43.5 44.1 43.3 44.6 44.1 40.5 46.8 46.6
31.Pta-TC67974 48.2 45.2 50.0 48.2 46.4 52.5 52.2 54.3 48.6 49.3 54.0 54.3
32.Le-TC178827 45.9 41.8 68.3 57.8 66.8 89.7 73.9 71.7 67.6 62.1 73.6 78.1
33.Pt-III.589 45.0 43.9 63.0 60.1 62.6 73.5 76.5 79.6 68.5 64.3 69.7 79.0
34.Pt-V.543 48.2 43.9 64.5 60.3 60.7 74.0 76.4 77.7 66.5 63.6 68.6 77.3
35.Pt-XIV.94 41.7 39.4 64.4 56.0 58.0 63.4 61.3 58.8 61.3 55.7 64.9 64.5
36.Pt-II105 43.0 39.1 63.9 54.7 58.0 60.7 63.0 58.8 65.3 56.6 63.6 65.8
37.Pt-123.86 57.7 57.9 47.6 46.3 46.3 46.6 48.6 47.6 43.6 45.9 47.3 45.9
38.Pt-X180 52.1 49.4 50.2 51.0 49.8 54.8 55.6 55.2 48.5 50.2 56.0 57.7
39.Pt-XII.481 51.5 47.3 43.6 45.8 44.7 48.4 46.5 49.5 46.5 46.9 46.9 50.9
40.Ck-LOB-DQ787782 48.5 43.3 66.7 59.5 60.6 73.2 82.3 82.1 65.8 61.7 71.4 77.5
41.Bn-AAP37970 56.0 56.1 48.9 49.6 46.2 49.6 50.4 51.9 50.0 47.0 50.0 51.5
42.Mt-ABE82505 47.2 44.2 65.2 62.2 65.2 72.5 79.8 80.8 64.8 64.3 71.7 76.8
43.Mt-ABE78739 54.7 56.7 45.7 48.9 44.6 50.7 50.4 49.6 47.1 47.8 51.1 50.4
44.At-LBD37-Q9FN11 45.0 46.1 61.6 56.4 64.0 68.8 68.8 69.6 64.0 63.6 64.0 68.8
45.At-LBD38-Q9SN23 45.9 45.2 61.9 55.5 63.2 61.9 70.4 70.4 62.8 63.6 67.6 70.9
46.At-LBD39-Q9SZE8 45.0 41.8 61.3 56.7 63.3 65.8 70.8 67.9 60.0 62.5 70.4 71.7
47.At-LBD40-Q9ZW96 53.1 49.1 54.5 54.1 55.8 55.8 54.9 52.5 53.2 56.2 60.9 56.7
48.At-LBD41-Q9M886 52.8 56.7 44.9 49.0 47.5 49.8 50.6 47.9 49.8 47.1 51.0 50.2
49.At-LBD42-Q9CA30 52.4 49.4 54.1 50.2 51.9 58.4 57.5 52.9 54.1 52.8 55.4 55.4
13 14 15 16 17 18 19 20 21 22 23 24
1.Os-Os01g03890 33.7 33.0 42.5 46.6 42.9 43.5 42.8 37.7 36.0 36.8 38.1 32.2
2.Os-Os01g32770 30.1 32.4 52.2 46.5 47.1 54.4 41.7 37.0 37.1 38.2 39.7 30.9
3.Os-Os03g33090 54.0 54.5 32.4 37.0 34.4 31.3 37.2 37.6 30.2 28.3 41.3 47.4
4.Os-Os03g41330 41.2 44.1 32.1 33.1 30.2 31.4 36.4 37.0 29.9 28.4 35.5 78.7
5.Os-Os07g40000 50.0 51.7 34.7 35.8 33.9 33.2 35.2 36.5 28.7 28.3 38.7 46.3
6.Nb-TC9404 60.8 63.7 33.7 35.8 33.2 32.1 38.7 38.1 32.3 29.8 39.6 44.0
7.Gm-TC227562 72.4 67.6 33.1 34.7 33.2 33.1 36.6 36.2 32.3 30.7 39.3 42.8
8.Gm-TC216138 81.5 66.5 34.4 34.2 33.2 33.2 37.0 35.7 31.1 30.7 37.6 42.3
9.Hv-TC147776 50.8 51.9 34.9 35.4 31.6 32.6 36.8 34.6 29.3 28.6 37.9 45.4
10.Sb-TC104758 49.4 51.3 33.8 34.5 32.5 33.1 35.3 38.0 29.6 30.1 37.4 46.9
11.Aq-TC18561 54.8 58.5 33.4 35.0 34.2 32.1 37.5 37.6 32.3 30.8 37.3 41.1
12.Vv-TC60668 65.6 68.3 33.1 35.6 35.9 32.1 36.2 38.5 33.3 32.0 39.6 43.5
13.Lj-TC15459 64.9 34.5 33.2 33.8 33.4 36.0 36.5 34.1 29.4 36.8 39.6
14.Gh-TC30552 76.8 36.2 35.4 33.9 34.1 37.5 36.9 32.0 30.7 40.1 44.2
15.Ta-TC235711 47.4 49.5 45.5 49.5 89.9 49.1 41.3 37.8 36.4 46.0 31.8
16.St-TC133081 50.0 50.4 57.5 56.6 47.4 52.5 45.4 37.4 40.1 50.0 32.5
17.Mt-TC107091 48.2 47.5 61.5 66.4 50.5 48.8 41.6 36.4 39.5 51.7 31.2
18.Hv-TC147808 45.4 47.7 92.4 59.6 63.2 48.3 39.0 37.8 39.1 43.7 31.8
19.Vv-TC55931 51.8 51.4 60.3 63.1 61.1 57.9 47.0 35.8 38.1 51.2 36.4
20.St-TC162239 54.9 55.1 55.7 58.8 52.8 52.3 63.2 32.9 36.0 48.7 37.7
21.Pta-TC69225 46.4 44.0 50.9 51.5 53.0 51.2 47.9 43.1 44.5 32.9 27.8
22.Pta-TC67269 42.3 44.3 50.9 54.8 52.4 52.4 50.0 46.4 63.1 35.3 28.6
23.Gm-TC220806 51.1 54.7 51.6 55.8 55.5 49.0 57.3 60.7 40.1 42.0 35.8
24.Ta-TC270332 54.9 61.2 44.3 45.3 44.2 42.7 47.8 50.9 41.0 40.2 51.7
25.Aq-TC18329 49.7 51.0 63.8 70.0 70.8 65.2 65.9 55.5 52.1 53.6 54.1 45.9
26.St-TC137193 71.3 74.6 46.0 48.9 48.5 45.4 52.6 52.1 43.1 41.7 57.1 58.7
27.St-TC133385 70.0 73.3 43.9 48.9 46.5 43.0 52.6 53.0 41.9 41.4 57.1 57.0
28.St-TC140088 66.7 70.3 45.3 47.4 46.8 43.0 53.0 52.6 42.5 41.1 55.3 52.2
29.Pa-TC14656 51.6 53.4 50.2 49.8 48.2 50.0 46.6 52.3 47.3 46.1 44.8 44.8
30.Pta-TC59178 44.4 45.7 41.6 44.9 46.6 44.9 44.4 42.7 47.4 49.6 39.1 40.2
31.Pta-TC67974 50.7 54.3 49.1 50.0 48.2 47.0 47.8 51.8 46.4 48.2 46.7 47.8
32.Le-TC178827 72.6 75.4 46.7 48.9 48.2 43.7 53.0 52.1 42.5 43.2 56.9 58.3
33.Pt-III.589 78.6 81.9 50.5 51.5 48.5 47.0 55.3 57.1 44.3 44.6 53.4 58.0
34.Pt-V.543 76.9 79.8 49.1 52.2 49.2 48.0 53.0 56.2 45.2 45.5 53.3 57.0
35.Pt-XIV.94 59.9 62.5 44.9 45.6 42.5 44.0 48.2 51.7 41.6 41.4 56.3 57.8
36.Pt-II105 61.6 62.5 43.9 47.4 43.5 42.1 47.4 55.1 38.9 40.8 56.7 55.2
37.Pt-123.86 47.6 48.3 56.1 67.2 75.4 55.3 61.8 54.7 53.3 51.5 55.1 43.9
38.Pt-X180 56.0 56.8 53.0 56.6 55.1 51.0 66.4 59.8 48.8 47.6 60.2 49.8
39.Pt-XII.481 48.4 50.2 52.3 58.0 53.8 49.7 58.2 54.6 45.5 49.1 51.3 44.0
40.Ck-LOB-DQ787782 80.2 79.3 49.1 51.8 46.5 47.0 53.0 54.3 43.7 44.9 53.2 58.0
41.Bn-AAP37970 47.0 51.1 58.9 65.7 67.4 56.0 60.2 57.6 47.6 48.5 56.8 47.3
42.Mt-ABE82505 78.9 77.7 50.2 50.7 47.8 48.7 54.2 54.3 44.9 45.8 52.8 61.8
43.Mt-ABE78739 53.6 50.4 59.2 66.9 71.8 60.3 64.4 54.0 52.4 49.7 56.5 46.4
44.At-LBD37-Q9FN11 67.6 75.2 48.8 54.0 49.5 47.0 54.9 55.6 45.2 44.6 52.0 56.4
45.At-LBD38-Q9SN23 63.6 73.7 48.4 51.1 48.8 47.0 51.8 55.1 46.4 46.1 52.2 53.0
46.At-LBD39-Q9SZE8 73.8 70.0 48.8 50.4 47.8 47.4 52.6 53.8 45.2 43.8 51.7 61.7
47.At-LBD40-Q9ZW96 53.2 56.2 54.4 61.7 62.1 51.3 60.9 61.5 48.5 48.2 62.2 52.8
48.At-LBD41-Q9M886 49.8 52.1 56.8 67.5 67.4 57.0 61.2 58.9 49.1 49.1 57.4 46.0
49.At-LBD42-Q9CA30 56.1 54.5 54.0 54.7 54.5 51.3 60.5 64.5 47.0 45.8 62.7 51.1
25 26 27 28 29 30 31 32 33 34 35 36
1.Os-Os01g03890 44.0 32.9 33.6 32.2 32.4 32.5 32.1 33.5 33.7 33.7 33.2 33.2
2.Os-Os01g32770 46.3 30.0 29.4 29.7 28.1 29.4 30.4 30.9 30.6 29.1 30.0 31.5
3.Os-Os03g33090 33.3 61.0 60.2 50.0 35.7 33.9 38.7 60.0 52.9 52.9 50.2 51.7
4.Os-Os03g41330 31.7 44.0 44.0 39.0 36.7 30.2 36.1 44.7 41.0 41.0 41.0 39.7
5.Os-Os07g40000 34.1 52.6 52.5 46.8 35.3 33.3 37.5 51.9 49.6 48.6 46.5 46.0
6.Nb-TC9404 36.6 83.2 82.3 57.5 38.9 36.9 41.9 83.2 64.2 64.9 50.2 49.1
7.Gm-TC227562 35.2 61.1 60.3 51.0 39.8 36.6 41.1 62.1 65.3 64.5 48.5 48.5
8.Gm-TC216138 34.1 61.4 60.2 51.7 38.2 34.9 40.2 61.7 67.2 66.8 47.5 46.9
9.Hv-TC147776 32.8 54.2 54.6 50.2 33.8 32.7 35.7 53.6 50.0 49.8 46.2 47.3
10.Sb-TC104758 31.4 51.7 51.5 46.7 35.6 33.1 37.5 49.0 52.5 50.2 43.8 45.1
11.Aq-TC18561 35.5 59.3 58.8 52.8 38.3 36.4 40.5 58.0 56.8 59.4 52.6 48.5
12.Vv-TC60668 35.1 67.1 67.2 54.5 39.6 36.6 42.3 66.5 69.4 66.7 50.9 50.4
13.Lj-TC15459 33.4 59.7 59.2 51.0 37.4 37.6 39.2 60.7 65.6 64.9 47.9 47.9
14.Gh-TC30552 35.2 63.9 63.4 57.3 39.4 37.2 41.6 64.2 71.4 70.9 50.0 50.0
15.Ta-TC235711 50.3 33.8 32.8 32.4 29.5 31.0 30.8 34.5 36.2 34.8 33.4 34.5
16.St-TC133081 57.4 33.2 34.7 32.5 30.9 32.1 32.6 35.4 36.4 36.0 35.0 34.2
17.Mt-TC107091 56.8 34.2 33.6 33.1 31.5 32.0 31.0 33.9 33.8 35.2 29.6 30.8
18.Hv-TC147808 50.6 34.4 31.5 29.1 31.4 31.6 30.3 33.1 34.8 34.8 32.1 32.5
19.Vv-TC55931 56.3 37.5 39.2 36.6 33.8 31.2 34.9 38.4 37.3 35.5 36.8 35.9
20.St-TC162239 41.8 36.3 37.2 35.0 35.6 32.0 35.7 37.6 39.0 37.3 37.6 37.9
21.Pta-TC69225 36.9 30.5 31.6 29.6 30.5 30.7 31.2 29.9 31.7 31.8 31.1 30.2
22.Pta-TC67269 43.1 30.1 29.2 29.2 28.5 30.0 32.2 31.5 29.5 31.0 29.8 29.8
23.Gm-TC220806 50.0 43.4 42.1 38.4 34.7 28.1 35.5 42.8 39.6 38.5 40.5 41.9
24.Ta-TC270332 32.1 45.5 43.5 39.2 35.7 30.3 36.8 43.3 41.3 40.9 40.9 39.7
25.Aq-TC18329 35.5 35.2 31.4 30.2 33.1 31.5 34.8 33.4 35.5 33.4 34.1
26.St-TC137193 48.6 96.8 58.4 38.8 36.1 41.9 95.0 64.3 62.5 50.2 50.2
27.St-TC133385 48.6 96.8 59.7 38.1 35.8 40.1 92.8 63.9 60.9 50.7 50.9
28.St-TC140088 47.9 72.4 71.9 38.8 33.2 39.8 58.7 54.1 53.8 46.3 45.6
29.Pa-TC14656 49.7 51.6 51.6 54.2 38.6 88.1 38.7 42.1 40.3 33.5 33.5
30.Pta-TC59178 46.0 44.9 44.6 43.3 54.3 39.4 36.9 36.4 38.4 32.5 31.4
31.Pta-TC67974 49.3 52.2 51.4 52.9 92.8 53.2 41.7 42.5 42.8 35.0 36.1
32.Le-TC178827 48.3 97.2 95.0 71.6 50.9 45.2 51.4 64.6 62.2 49.5 49.5
33.Pt-III.589 49.7 73.5 72.3 65.5 54.2 44.9 56.5 75.2 83.3 50.4 48.7
34.Pt-V.543 50.3 73.6 71.5 64.0 54.2 46.8 56.2 73.1 88.8 50.8 48.3
35.Pt-XIV.94 47.9 63.1 63.2 62.7 47.7 39.7 51.1 61.0 63.4 62.0 86.1
36.Pt-II105 47.2 63.1 64.6 60.4 48.4 39.4 51.8 61.5 62.2 59.9 91.8
37.Pt-123.86 70.9 48.0 46.6 48.6 49.7 47.1 50.7 46.6 49.0 50.0 43.9 42.9
38.Pt-X180 61.0 51.9 51.9 53.5 46.2 41.6 46.7 53.5 58.5 58.3 50.2 48.5
39.Pt-XII.481 60.0 50.5 49.5 46.9 49.5 41.6 50.0 50.9 49.5 49.5 45.1 42.1
40.Ck-LOB-DQ787782 47.2 72.3 71.4 68.8 53.4 44.1 54.7 71.9 79.4 78.9 60.6 62.3
41.Bn-AAP37970 65.2 52.3 50.8 47.0 47.7 44.1 50.0 50.8 49.6 51.5 50.4 49.2
42.Mt-ABE82505 50.3 70.4 69.1 67.0 57.4 46.8 55.1 71.2 76.9 78.9 62.7 62.2
43.Mt-ABE78739 67.2 50.0 50.0 50.7 54.7 43.3 53.2 48.2 49.6 48.6 50.0 48.9
44.At-LBD37-Q9FN11 51.4 66.8 65.6 64.4 54.2 47.9 52.9 67.2 76.0 74.0 60.8 60.4
45.At-LBD38-Q9SN23 49.7 65.6 64.4 60.3 52.3 44.9 53.6 66.0 75.3 72.1 58.7 61.5
46.At-LBD39-Q9SZE8 51.0 66.3 64.6 62.1 54.5 46.8 53.3 67.9 71.7 71.1 59.6 60.8
47.At-LBD40-Q9ZW96 61.7 56.7 55.4 54.9 49.1 41.0 49.6 55.8 55.9 55.4 50.6 51.5
48.At-LBD41-Q9M886 66.9 50.6 49.8 48.7 50.5 45.5 49.3 52.1 48.7 51.3 49.0 47.1
49.At-LBD42-Q9CA30 58.3 53.6 54.1 55.4 47.7 41.3 48.2 54.5 54.6 56.2 54.9 54.5
37 38 39 40 41 42 43 44 45 46
1.Os-Os01g03890 44.0 39.2 34.8 35.5 44.4 34.9 40.5 31.9 33.3 32.4
2.Os-Os01g32770 45.3 38.5 32.3 32.1 42.7 33.9 44.8 30.2 32.1 29.7
3.Os-Os03g33090 34.7 36.9 32.7 53.0 36.4 54.9 35.1 50.0 51.2 49.6
4.Os-Os03g41330 33.7 35.2 31.2 43.6 36.2 44.6 32.6 43.9 42.4 40.7
5.Os-Os07g40000 32.8 35.7 31.9 49.8 32.6 51.3 33.1 49.2 47.4 48.1
6.Nb-TC9404 33.8 37.3 32.6 58.6 32.5 61.1 35.1 56.9 54.0 56.3
7.Gm-TC227562 32.8 36.4 32.4 76.6 34.7 74.9 37.1 56.2 57.8 57.3
8.Gm-TC216138 31.6 36.7 31.6 74.3 36.0 74.0 34.9 53.9 55.0 54.1
9.Hv-TC147776 31.1 38.2 33.5 50.6 34.3 50.6 34.5 49.2 48.6 45.8
10.Sb-TC104758 33.1 35.2 31.3 48.7 33.7 50.2 33.1 50.6 48.2 46.7
11.Aq-TC18561 33.4 36.2 32.5 56.7 36.0 57.8 36.0 51.6 55.6 57.1
12.Vv-TC60668 33.4 39.7 34.3 65.3 33.7 66.8 36.0 54.2 57.4 58.8
13.Lj-TC15459 32.1 35.9 31.0 70.4 32.8 70.7 35.3 52.8 53.0 54.8
14.Gh-TC30552 33.7 38.6 33.7 66.2 35.2 69.0 32.9 62.4 63.5 58.7
15.Ta-TC235711 45.3 42.7 36.2 35.4 46.0 38.3 46.6 34.1 35.9 33.7
16.St-TC133081 55.7 45.6 37.3 36.5 55.8 37.2 54.9 37.1 35.8 36.5
17.Mt-TC107091 63.7 43.0 37.3 34.2 54.3 33.9 60.6 33.4 37.2 34.2
18.Hv-TC147808 45.0 41.9 34.3 34.3 45.2 37.4 46.8 32.4 35.4 32.8
19.Vv-TC55931 52.0 51.4 40.9 36.8 49.8 38.7 48.9 37.4 34.9 36.7
20.St-TC162239 41.6 45.1 39.7 36.3 41.8 36.0 42.9 35.4 35.7 35.0
21.Pta-TC69225 37.6 33.4 29.4 33.4 34.7 32.3 38.0 31.7 31.1 32.5
22.Pta-TC67269 38.8 36.8 31.2 30.4 35.7 31.2 38.1 31.3 32.3 31.3
23.Gm-TC220806 48.7 48.8 40.1 39.7 48.1 37.9 51.3 36.5 38.0 38.4
24.Ta-TC270332 31.8 33.3 29.3 42.5 32.5 44.2 32.4 41.5 40.4 43.7
25.Aq-TC18329 61.1 48.3 40.6 33.4 51.2 36.6 55.9 35.1 32.8 34.4
26.St-TC137193 34.1 37.3 35.7 60.9 33.0 60.0 34.4 57.3 55.7 54.1
27.St-TC133385 34.0 37.3 36.4 60.1 34.5 59.6 33.8 56.5 54.9 53.1
28.St-TC140088 33.3 36.9 33.5 53.0 31.4 51.9 31.9 48.8 47.0 49.6
29.Pa-TC14656 32.1 33.3 33.2 41.1 29.3 41.7 32.8 39.0 40.0 39.9
30.Pta-TC59178 34.0 30.3 28.3 37.4 32.8 38.4 30.2 36.5 35.7 37.6
31.Pta-TC67974 33.2 34.2 34.1 42.2 31.9 41.9 34.2 40.9 42.6 40.4
32.Le-TC178827 32.8 38.9 36.5 60.8 34.1 60.7 33.1 56.5 55.5 55.3
33.Pt-III.589 34.7 37.9 33.5 67.1 35.5 65.7 32.7 64.1 63.9 57.5
34.Pt-V.543 34.3 36.6 33.3 67.4 34.5 66.7 32.0 62.6 62.9 59.3
35.Pt-XIV.94 31.8 35.8 30.4 49.4 36.0 51.7 37.1 45.0 45.3 46.5
36.Pt-II105 32.4 35.0 30.4 48.5 36.7 51.1 35.6 43.6 45.7 48.1
37.Pt-123.86 45.8 39.3 33.1 56.2 34.3 55.9 34.8 34.1 33.0
38.Pt-X180 56.4 43.1 34.6 42.3 34.9 44.1 37.2 37.3 39.9
39.Pt-XII.481 55.4 56.8 32.5 37.5 33.6 37.4 31.9 30.5 29.9
40.Ck-LOB-DQ787782 49.0 53.9 47.3 35.5 80.9 33.8 54.0 55.8 57.8
41.Bn-AAP37970 70.3 56.8 55.7 51.5 37.7 51.6 33.2 34.1 34.3
42.Mt-ABE82505 47.0 55.2 47.3 87.1 51.9 36.7 55.6 57.3 56.7
43.Mt-ABE78739 67.6 57.9 55.4 50.7 64.7 51.4 31.9 32.7 34.3
44.At-LBD37-Q9FN11 53.0 53.2 48.0 69.2 50.4 66.8 50.0 76.9 55.3
45.At-LBD38-Q9SN23 47.0 55.9 49.5 70.0 51.5 69.2 48.6 86.4 56.8
46.At-LBD39-Q9SZE8 49.0 57.3 49.1 72.5 53.8 71.3 51.1 67.2 68.8
47.At-LBD40-Q9ZW96 65.5 62.7 52.0 55.8 68.9 56.2 66.2 55.2 55.5 56.3
48.At-LBD41-Q9M886 70.9 58.6 57.1 47.9 90.5 50.2 65.5 53.2 51.7 52.1
49.At-LBD42-Q9CA30 55.4 62.7 52.0 58.4 56.8 55.8 57.2 53.6 52.6 52.9
47 48 49
1.Os-Os01g03890 41.5 41.3 38.2
2.Os-Os01g32770 41.5 44.8 39.0
3.Os-Os03g33090 40.4 35.0 40.8
4.Os-Os03g41330 38.2 33.7 36.0
5.Os-Os07g40000 40.2 33.8 36.3
6.Nb-TC9404 39.4 34.6 40.7
7.Gm-TC227562 40.8 35.7 39.8
8.Gm-TC216138 36.5 34.0 35.5
9.Hv-TC147776 38.2 34.6 37.7
10.Sb-TC104758 36.2 34.5 38.6
11.Aq-TC18561 42.1 37.2 36.6
12.Vv-TC60668 40.2 36.1 38.2
13.Lj-TC15459 38.1 35.1 36.4
14.Gh-TC30552 39.8 34.6 36.6
15.Ta-TC235711 44.3 44.3 41.0
16.St-TC133081 50.7 55.9 45.7
17.Mt-TC107091 52.6 56.1 40.2
18.Hv-TC147808 42.1 46.5 39.7
19.Vv-TC55931 49.2 49.3 47.3
20.St-TC162239 46.5 44.5 47.5
21.Pta-TC69225 36.4 36.2 34.1
22.Pta-TC67269 36.0 36.3 33.3
23.Gm-TC220806 52.8 50.8 49.8
24.Ta-TC270332 39.2 30.4 36.3
25.Aq-TC18329 49.8 53.2 43.7
26.St-TC137193 39.2 34.2 38.6
27.St-TC133385 40.1 34.1 38.4
28.St-TC140088 37.8 35.7 36.6
29.Pa-TC14656 33.8 30.4 31.3
30.Pta-TC59178 30.2 32.5 27.2
31.Pta-TC67974 34.8 31.8 33.0
32.Le-TC178827 39.0 34.6 38.5
33.Pt-III.589 36.6 35.0 35.3
34.Pt-V.543 38.2 35.4 39.2
35.Pt-XIV.94 37.8 33.8 38.3
36.Pt-II105 40.2 35.7 37.4
37.Pt-123.86 53.8 59.1 43.6
38.Pt-X180 46.8 41.5 49.6
39.Pt-XII.481 38.5 37.6 36.4
40.Ck-LOB-DQ787782 40.2 31.6 38.2
41.Bn-AAP37970 55.5 83.5 42.1
42.Mt-ABE82505 40.3 33.8 36.8
43.Mt-ABE78739 53.3 51.6 43.8
44.At-LBD37-Q9FN11 37.5 34.5 34.9
45.At-LBD38-Q9SN23 40.5 33.5 34.8
46.At-LBD39-Q9SZE8 38.3 35.0 37.1
47.At-LBD40-Q9ZW96 56.7 46.5
48.At-LBD41-Q9M886 68.4 42.6
49.At-LBD42-Q9CA30 61.8 56.3
实施例4:鉴定在实施本发明方法中有用的多肽序列中所包含的结构域
蛋白质家族、结构域和位点的集成资源(InterPro)数据库是针对基于文本及基于序列的搜索法的常用特征标识数据库的集成界面。InterPro数据库合并了这些数据库,所述数据库使用不同的方法学及不同程度的有关充分表征的蛋白质的生物学信息以获得蛋白质特征标识(proteinsignatures)。合作数据库包括SWISS-PROT、PROSITE、TrEMBL、PRINTS、ProDom和Pfam、Smart和TIGRFAMs。Pfam是覆盖许多常见蛋白质结构域和家族的多重序列比对结果和隐匿马尔科夫模型的庞大集合。Pfam在英国Sanger研究所服务器上维护。Interpro由英国欧洲生物信息学研究所维护。
在表A3中呈现了如SEQ ID NO:2所代表的多肽序列的InterPro扫描结果。
表A3:如SEQ ID NO:2所代表的多肽序列的InterPro扫描结果(主要登录号)
数据库 登录号 登录名称 在SEQ ID NO 2上的氨基酸坐标
PFAM PF03195 DUF260 2-107
PROFILE PS50891 LOB 1-107
实施例5:在实施本发明方法中有用的多肽序列的拓扑结构预测
TargetP 1.1预测真核生物蛋白的亚细胞定位。基于任何氨基端前序列:叶绿体转运肽(cTP)、线粒体靶向肽(mTP)或分泌途径信号肽(SP)的预测存在性进行定位指派。作为最终预测基础的评分并不真正是概率,并且它们不是必需地加合成一体。但是,根据TargetP,具有最高评分的定位是最可能的,并且评分之间的关系(可靠性级别)可以指示该预测具有多大确定性。可靠性级别(RC)范围从1至5,其中1表示最可靠的预测。TargetP在丹麦技术大学(Technical University of Denmark)的服务器上维护。
对于预测含有氨基端前序列的序列而言,也可以预测潜在的切割位点。
可以选择许多参数,如生物组别(非植物或植物)、临界值集合(无、预定义的临界值集合或用户指定的临界值集合)和切割位点预测的计算(是或否)。
在表A4中呈现了如SEQ ID NO:2所代表的多肽序列的TargetP 1.1分析的结果。选择“植物”生物组别,未定义临界值,并且对转运肽的预测长度提出要求。
表A4:如SEQ ID NO:2所代表的多肽序列的TargetP 1.1分析结果
长度(AA) 250
叶绿体转运肽 0.026
线粒体转运肽 0.401
分泌途径信号肽 0.019
其他亚细胞定位 0.573
预测位置 /
可靠性级别 5
预测的转运肽长度 /
如SEQ ID NO:2所代表的多肽序列的亚细胞定位可以是细胞质或细胞核,没有预测到转运肽。SubLoc(Hua和Sun,Bioinformatics 17,721-728,2001)预测到核定位(可靠性指数:2,准确度:74%);该预测与来自Liu等(2005)的数据相一致。
许多其他算法可以用来进行此类分析,包括:
·在丹麦技术大学服务器上维护的ChloroP 1.1;
·在澳大利亚布里斯班昆士兰大学生物科学研究所的服务器上维护的Protein Prowler亚细胞定位预测者1.2版;
·在加拿大阿伯特省埃德蒙顿市阿尔伯塔大学的服务器上维护的PENCE蛋白组分析专家PA-GOSUB 2.5;
·在丹麦技术大学服务器上维护的TMHMM。
实施例6:在本发明方法中所用的LBD核酸序列的克隆
本发明方法中所用的核酸序列通过PCR,使用定制的拟南芥幼苗cDNA文库(在MV Sport 6.0内;Invitrogen,Paisley,UK)作为模板进行扩增。使用Hifi Taq DNA聚合酶,在标准条件下利用在50μl PCR混合物中的200ng模板进行PCR。使用的引物是prm009067(SEQ ID NO:3;有义,起始密码子为粗体字):
5’-ggggacaagtttgtacaaaaaagcaggcttaaacaatgagctgcaatggttgc-3’
和prm009068(SEQ ID NO:4;反义,互补):
5’-ggggaccactttgtacaagaaagctgggtactaactctgagaaaaccgcc-3’,
其中所述引物包括用于Gateway重组的AttB位点。也使用标准方法纯化扩增的PCR片段。随后进行Gateway方法的第一步骤,即BP反应,在此期间根据Gateway术语学,所述PCR片段与pDONR201质粒在体内重组以产生“进入克隆”pLBD。质粒pDONR201作为技术的部分从Invitrogen购买。
包含SEQ ID NO:1的进入克隆随后在LR反应中与用于稻转化法的目的载体一起使用。这种载体含有在T-DNA边界内部的植物选择标记、筛选标记表达盒和意图与已经克隆在该进入克隆中的目的核酸序列发生LR体内重组的Gateway盒作为功能性元件。用于根特异性表达的稻GOS2启动子(SEQ ID NO:10)位于该Gateway盒上游。
在所述LR重组步骤后,所得表达载体pGOS2::LBD(图4)根据本领域熟知的方法转化入农杆菌菌株LBA4044。
实施例7:植物转化
稻转化
使用含有所述表达载体的农杆菌来转化稻植物。将稻粳型栽培品种Nipponbare的成熟干燥种子脱壳。通过如下方式实施消毒:在70%乙醇中孵育1分钟,随后在0.2%HgCl2中孵育30分钟,随后用无菌蒸馏水洗涤6次15分钟。无菌的种子随后在含有2,4-D的培养基(愈伤组织诱导培养基)上萌发。在黑暗中孵育4周后,将胚发生的盾片衍生的愈伤组织切下并在相同的培养基上增殖。2周后,将所述愈伤组织通过在同一种培养基上传代培养另外2周进行繁殖或增殖。胚发生的愈伤组织片在新鲜培养基上传代培养3日,随后共培育(以助长细胞分裂活性)。
将含有所述表达载体的农杆菌菌株LBA4404用于共培育。农杆菌接种在含有适宜抗生素的AB培养基上并在28℃培养3日。随后收集细菌并在液体共培育培养基中悬浮至密度(OD600)约1。该悬液随后转移至培养皿内并将所述愈伤组织浸没于此悬液中15分钟。该愈伤组织随后在滤纸上蘸干并转移至固化的共培育培养基,并在25℃于黑暗中孵育3日。共培育的愈伤组织在含2,4-D的培养基上在28℃于黑暗中在选择剂存在下培育4周。在此期间,迅速生长的抗性愈伤组织团发育。将这种材料转移至再生培养基并在光照下孵育后,释放了胚发生潜能并且苗在随后4至5周内发育。将苗从愈伤组织上切下并且在含有植物生长素的培养基上孵育2至3周,将苗从所述培养基转移至土壤。硬化的苗在温室中于高湿度和短日照下培育。
对于一个构建体,产生大约35个独立的T0稻转化体。将原代转化体从组织培养箱转移至温室。在定量PCR分析验证T-DNA插入物的拷贝数后,仅保留针对所述选择剂显示抗性的单拷贝转基因植物用于收获T1种子。种子随后在移栽后3至5个月收获。该方法以超过50%的比例产生单基因座转化体(Aldemita和Hodges1996,Chan等1993,Hiei等1994)。
玉米转化
玉米(Zea mays)的转化用Ishida等人(1996).Nature Biotech 14(6):745-50所述方法的改良方法进行。在玉米中,转化是基因型依赖的并且仅特定基因型适合于转化和再生。近交系A188(明尼苏达大学)或以A188作为亲本的杂交体是用于转化的供体材料的良好来源,不过其他基因型也可以成功地使用。谷穗在授粉后大约11日(DAP)从玉米植物收获,此时不成熟胚的长度是大约1至1.2mm。不成熟的胚与含有所述表达载体的根癌农杆菌共培育,并且转基因植物通过器官发生过程回收。切下的胚在愈伤组织诱导培养基上、随后在玉米再生培养基上培育,其中所述的培养基含有选择剂(例如咪唑啉酮,不过可以使用不同的选择标记)。培养板在25℃于光照下孵育2-3周,或直至苗发育。将源自每个胚的绿色苗转移至玉米生根培养基并在25℃孵育2-3周,直至根发育。将生根的苗移植至温室中的土壤内。从针对所述选择剂显示耐受性并且含有单拷贝T-DNA插入物的植物产生T1种子。
小麦转化
小麦的转化用Ishida等人(1996)Nature Biotech 14(6):745-50描述的方法进行。栽培品种Bobwhite(可从墨西哥CIMMYT获得)通常用于转化中。不成熟的胚与含有所述表达载体的根癌农杆菌培育,并且转基因植物通过器官发生过程回收。在与农杆菌培育后,所述胚在愈伤组织诱导培养基上、随后在玉米再生培养基上体外培育,其中所述的培养基含有选择剂(例如咪唑啉酮,不过可以使用不同的选择标记)。培养板在25℃于光照下孵育2-3周,或直至苗发育。将源自每个胚的绿色苗转移至生根培养基并在25℃孵育2-3周,直至根发育。将生根的苗移植至温室中的土壤内。从针对所述选择剂显示耐受性并且含有单拷贝T-DNA插入物的植物产生T1种子。
大豆转化
根据对Texas A&M美国专利5,164,310中所述方法的改良方法转化大豆。几个商业大豆品种适合于通过这种方法转化。栽培品种Jack(从Illinois种子基金会可获得)通常用于转化。对大豆种子消毒以便体外播种。将下胚轴、胚根和一片子叶从7日龄年幼籽苗中切下。进一步培育上胚轴和剩余子叶以使辅助节发育。切下这些辅助节并与含有所述表达载体的根癌农杆菌孵育。在共培育处理之后,洗涤外植体并转移至选择培养基。切下再生的苗并置于苗伸长培养基上。将长度不超过1cm的苗置于生根培养基上直至根发育。将生根的苗移植至温室中的土壤内。从针对所述选择剂显示耐受性并且含有单拷贝T-DNA插入物的植物产生T1种子。
油菜/卡诺拉油菜转化
使用5-6日龄年幼籽苗的子叶柄和下胚轴作为用于组织培养的外植体并且根据Babic等人(1998,Plant Cell Rep 17:183-188)进行转化。商业品种Westar(Agriculture Canada)是用于转化的标准品种,不过其他品种也可以使用。对卡诺拉油菜种子进行表面消毒以便体外播种。从所述体外籽苗切下附带子叶的子叶叶柄外植体,并且通过将此叶柄外植体的切口末端浸入细菌悬液以(含有所述表达载体的)农杆菌接种。所述外植体随后在23℃,16小时光照下于含有3mg/l BAP、3%蔗糖、0.7%植物琼脂的MSBAP-3培养基上培养2日。与农杆菌共培育2日后,将所述叶柄外植体转移至含有3mg/l BAP、头孢噻肟、羧苄青霉素或特美汀(300mg/l)的MSBAP-3培养基上培养7日,并且随后在含有头孢噻肟、羧苄青霉素或特美汀和选择剂的MSBAP-3培养基上培养,直至苗再生。当苗长度是5-10mm时,切下这些苗并转移至苗伸长培养基(MSBAP-0.5,含有0.5mg/lBAP)。将长度大约2cm的苗转移至生根培养基(MS0)用于根诱导。将生根的苗移植至温室中的土壤内。从针对所述选择剂显示耐受性并且含有单拷贝T-DNA插入物的植物产生T1种子。
苜蓿转化
使用(McKersie等,1999Plant Physiol 119:839–847)的方法转化苜蓿的再生性克隆。苜蓿的再生和转化是基因型依赖性的并且因而需要再生性植物。已经描述了获得再生性植物的方法。例如,这些再生性植物可以选自栽培品种Rangelander(Agriculture Canada)或如Brown DCW和AAtanassov(1985.Plant Cell Tissue Culture 4:111-112)所述的任何其他商业苜蓿品种。备选地,已经选择RA3品种(威斯康星大学)用于组织培养(Walker等,1978Am J Bot 65:654-659)。叶柄外植体与含有所述表达载体的根癌农杆菌C58C1pMP90(McKersie等,1999Plant Physiol119:839–847)或LBA4404的过夜培养物共培育。所述外植体在黑暗中于含有288mg/L Pro、53mg/L硫代脯氨酸、4.35g/L K2SO4和100μm乙酰丁香酮的SH诱导培养基上共培育3日。所述外植体在浓度减半的Murashige-Skoog培养基(Murashige和Skoog,1962)中洗涤并铺种在不含乙酰丁香酮而含有合适选择剂和抑止农杆菌生长的合适抗生素的相同SH诱导培养基上。几周后,将体细胞胚转移至不含生长调节剂、不含抗生素和含有50g/L蔗糖的BOi2Y发育培养基中。体细胞胚随后在浓度减半的Murashige-Skoog培养基上萌发。生根的籽苗移植至花钵内并且在温室中培育。从针对所述选择剂显示耐受性并且含有单拷贝T-DNA插入物的植物产生T1种子。
使用根癌农杆菌,在下胚轴外植体上进行棉花转化。商业品种如Coker130或Coker 312(SeedCo,Lubbock,TX)是用于转化的标准品种,不过其他品种也可以使用。将种子进行表面消毒并在黑暗中萌发。从萌发的籽苗切下下胚轴外植体成约1-1.5厘米长度。该下胚轴外植体浸没在含有所述表达载体的根癌农杆菌接种物中5分钟,随后在MS+1.8mg/l KNO3+2%葡萄糖上在24℃于黑暗中共培育约48小时。所述外植体转移至含有适宜细菌选择标记和植物选择标记的相同培养基(更换数次),直至看到生胚性愈伤组织。将所述愈伤组织分开继代培养直至体细胞胚出现。从所述体细胞胚衍生的小植物在生根培养基上成熟直至根发育。将生根的苗移植至温室中的盆栽土壤内。从针对所述选择剂显示耐受性并且含有单拷贝T-DNA插入物的植物产生T1种子。
实施例8:表型评价方法
8.1评价建立
产生大约35个独立的T0稻转化体。将原代转化体从组织培养室转移至温室以培育和收获T1种子。留下下述6个事件,其中所述事件的T1子代对所述转基因的存在/不存在以3:1比例分离。对于这些事件中的每一个,通过监测目视标记表达而选出大约10株含有该转基因的T1籽苗(杂合子和纯合子)和大约10株缺少该转基因的T1籽苗(失效合子)。转基因植物和相应的失效合子以随机的位置并排培育。温室条件是短日照(12小时光照),在光照下28℃和在黑暗中22℃,和70%相对湿度。在非胁迫条件下培育的植物以规律的间隔期供应水分,以确保水和养分对于满足植物完全生长和发育的需要不是限制性的。
氮使用效率筛选
源自T2种子的稻植物在盆栽土壤中于正常条件下培育,除了营养溶液之外。从移植至成熟期间用氮(N)浓度降低、通常7至8倍之间降低的特定营养溶液浇灌所述花钵。其余的培育(植物成熟、种子收获)与并不在非生物胁迫下培育的植物相同。如对正常条件下详述那样记录生长和产量参数。
8.2统计分析:F-检验
使用两因素ANOVA(变量分析)作为整体评价植物表型特征的统计模型。对于用本发明基因转化的全部事件的全部植物的全部所测量参数实施F检验。实施F检验以检查该基因对全部转化事件的影响并验证该基因的整体作用(又称作基因总体作用)。真实基因总体作用显著性的阈值对于所述F检验设置在5%概率水平上。显著性F检验值指出基因作用,这意味不仅仅是基因的存在或位置才造成表型上的差异。
8.3测量的参数
生物量相关的参数测量
植物从播种期至成熟期数次通过数字成像室。在每个时间点上,从至少6个不同角度拍摄每株植物的数字图像(2048x1536像素,1600万颜色)。
植物地上部分面积(或叶生物量)通过计数来自植物地上部分的数字图像上区别于背景的像素总数而确定。该值对相同时间点上从不同角度拍摄的画面进行平均化并且转化成通过校正以平方mm表述的物理表面值(physical surface value)。实验证实以这种方式测量的地上部分植物面积与地上植物部分的生物量相关。地上部分面积是植物已经实现其最大叶生物量的时间点上所测量的面积。早期生长势通过计数来自植物部分的区别于背景的像素总数确定。该值对相同时间点上从不同角度拍摄的画面进行平均化并且转化成通过校正以平方mm表述的物理表面值。下述结果针对萌发后3周的植物。
种子相关的参数测量
将成熟的原发花序收获、计数、装袋、加条形码标记并且随后在干燥箱内于37°干燥3日。随后将所述花序脱粒,并且收集和计数全部种子。充实粒使用吹气装置与空粒分开。弃去空粒并且再次计数剩余部分。充实粒在分析天平上称重。充实种子数通过计数所述分离步骤后仍留下的充实粒的数目来确定。种子总产量通过称量从一株植物收获的全部充实粒而测量。每株植物的种子总数通过计数从一株植物收获的壳数目测量。从计数的充实种子数及其总重量外推出千粒核重(TKW)。收获指数(HI)在本发明中定义为种子总产量与地上部分面积(mm2)之间的比率,乘以系数106。如本发明中定义的种子充实率是充实种子数对种子(或小花)总数的比例(表述为%)。
实施例9:包含SEQ ID NO:1的转基因植物的表型评价结果
评价在非胁迫条件下表达LBD核酸的转基因稻植物,表明地上部分生物量(AreaMax)、总种子产量、充实种子数、充实率、收获指数提高大于5%,并且千粒核重提高大于3%。
在氮利用率筛选法中对表达LBD核酸的转基因稻植物的评价表明出苗生长势(早期生长势)提高大于5%。
实施例10:包含SEQ ID NO:71的转基因植物的表型评价结果
将SEQ ID NO:71中所包含的编码区克隆到如实施例6中所述的稻转化载体中,处于稻GOS2启动子的控制下。按照实施例7的方法产生了包含SEQ ID NO:71的编码区的转基因稻植物。根据实施例8中描述的方法评价植物。SEQ ID NO:71编码由SEQ ID NO:25代表的LBD蛋白。
评价在非胁迫条件下表达SEQ ID NO:71的转基因稻植物,表明地上部分生物量(AreaMax)、每花序的花数目、每株植物的种子总数提高大于5%,并且千粒核重提高大于3%。
实施例11:包含SEQ ID NO:72的转基因植物的表型评价结果
将SEQ ID NO:72中所包含的编码区克隆到如实施例6中所述的稻转化载体中,处于稻GOS2启动子的控制下。按照实施例7的方法产生了包含SEQ ID NO:72的编码区的转基因稻植物。根据实施例8中描述的方法评价植物。SEQ ID NO:72编码由SEQ ID NO:52代表的LBD蛋白。
评价在非胁迫条件下表达SEQ ID NO:72的转基因稻植物,表明地上部分生物量(AreaMax)、每株植物的种子重量、充实种子数、每花序的花数目、每株植物的种子总数、收获指数提高大于5%,并且千粒核重提高大于3%。
在氮利用率筛选法中对表达SEQ ID NO:72的转基因稻植物的评价表明地上部分生物量(AreaMax)提高大于5%。
II.JMJC(JUMONJI-C)多肽
实施例12:鉴定与本发明方法中所用JMJC核酸序列相关的序列
用数据库搜索工具如基本局部比对工具(BLAST)(Altschul等人(1990)J.Mol.Biol.215:403-410;和Altschul等人(1997)Nucleic Acids Res.25:3389-3402),在国家生物技术信息中心(NCBI)的Entrez核苷酸数据库中维护的那些序列中鉴定到与本发明方法中所用核酸序列相关的(全长cDNA、EST或基因组)序列。使用该程序通过将核酸序列或多肽序列与序列数据库比较并且计算匹配的统计显著性来找到序列之间的局部相似性区域。由与本发明方法中所用核酸编码的多肽用于TBLASTN算法,采用默认设置和过滤程序以忽略低复杂性序列启动。这种分析的结果通过配对比较进行观察,并根据概率评分(E-值)进行评级,其中所述的评分反映特定比对结果因偶然发生的概率(E-值越低,命中的显著性越高)。除了E-值外,比较过程也可以通过同一性百分数评分。同一性百分数指两个所比较的核酸(或多肽)序列之间特定长度范围内相同的核苷酸(或氨基酸)的数目。
表B1提供了与本发明方法中所用JMJC核酸序列相关的核酸序列名单。带有一个小点和一位数字扩展名的登录号的多肽代表剪接变体。
表B1:JMJC多肽的例子
在一些情况下,相关序列已经由研究机构如基因组研究机构(TIGR)初步地汇编并且公开公开。可以使用真核生物基因直向同源物(EGO)数据库来鉴定此类相关序列,这可通过关键词搜索或通过使用BLAST算法以目的核酸或多肽序列进行。
实施例13:JMJC多肽序列的比对
多肽序列的比对使用来自Vector NTI(Invitrogen)的Alignment X程序进行,其中所述Alignment X程序基于受欢迎的累进比对Clustal算法(Thompson等人(1997)Nucleic Acids Res 25:4876-4882;Chenna等人(2003),Nucleic Acids Res 31:3497-3500)。空位开口罚分的默认值是10,空位延伸罚分0.1并且所选的权重矩阵是Blosum 62(若比对多肽)。可以进行少许手工编辑以优化该比对。诸JMJC多肽之间的序列保守性主要存在于所述多肽的JmjC结构域内。与SEQ ID NO:79所代表的和SEQ ID NO:81所代表的基序对应的区域比基序8的对应区域更保守。给出了共有序列。在所述共有序列中的氨基酸残基是高度保守的。所述保守序列中的空白代表任意氨基酸。所述JMJC多肽在图7中比对。
实施例14:在实施本发明方法中有用的JMJC多肽序列之间的总体同一性百分数的计算
使用现有技术领域可获得的方法之一,即MatGAT(矩阵总体比对工具)软件(BMC Bioinformatics.20034:29.MatGAT:使用蛋白质序列或DNA序列产生相似性/同一性矩阵的一项应用(an application thatgenerates similarity/identity matrices using protein or DNA sequences),Campanella JJ,Bitincka L,Smalley J;该软件由Ledion Bitincka维护)确定在实施本发明方法中有用的全长多肽序列之间的总体相似性和同一性百分数。MatGAT软件对DNA序列或蛋白质序列产生相似性/同一性矩阵,无需数据的预先比对。该程序使用Myers和Miller总体比对算法(空位开口罚分12和空位延伸罚分2)执行一系列配对比对,使用例如Blosum 62(对于多肽而言)计算相似性和同一性并且随后将结果置于距离矩阵内。在分割线下半部分显示序列相似性,和在对角分割线的上半部分显示序列同一性。
比较中使用的参数是:
评分矩阵:Blosum62
第一空位:12
延伸空位:2
表B2中显示在多肽序列的全长范围内总体相似性和同一性的软件分析结果。在对角线上方以粗体给出同一性百分数而在对角线下方(正常字体)给出相似性百分数。
与SEQ ID NO:74相比较,在实施本发明方法中有用的JMJC多肽序列之间的百分数同一性可以低至15%氨基酸同一性。
表B2:在多肽序列的全长范围内总体相似性和同一性的MatGAT结果
实施例15:鉴定在实施本发明方法中有用的JMJC多肽序列中所包含的结构域
蛋白质家族、结构域和位点的集成资源(InterPro)数据库是针对基于文本及基于序列的搜索法的常用特征标识数据库的集成界面。InterPro数据库合并了这些数据库,所述数据库使用不同的方法学及不同程度的有关充分表征的蛋白质的生物学信息以获得蛋白质特征标识。合作数据库包括SWISS-PROT、PROSITE、TrEMBL、PRINTS、ProDom和Pfam、Smart和TIGRFAM。Pfam是覆盖许多常见蛋白质结构域和家族的多重序列比对结果和隐匿马尔科夫模型(HMM)的庞大集合。Pfam在英国Sanger研究所服务器上维护。Interpro由英国欧洲生物信息学研究所维护。
表B3显示如Pfam数据库中所述的设置(收集临界值、受信任临界值和噪音临界值),所述设置用来产生不同结构域的HMMs_fs。
表B3:HMMs_fs设置
在表B4中呈现了植物来源的代表性JMJC多肽的Pfam扫描的结果。参考序列中每个结构域的氨基酸坐标在开始列和结束列中显示。还给出了比对结果的E-值。还提供了鉴定到的每个结构域的InterPro ID登录号。
表B4:植物来源的代表性JMJC多肽的Pfam扫描结果(主登录号)。
实施例16:在本发明方法中所用的JMJC核酸序列的克隆
本发明方法中所用的核酸序列通过PCR,使用定制的拟南芥幼苗cDNA文库(在MV Sport 6.0内;Invitrogen,Paisley,UK)作为模板进行扩增。使用Hifi Taq DNA聚合酶,在标准条件下利用在50μl PCR混合物中的200ng模板进行PCR。使用如SEQ ID NO:75和SEQ ID NO:76分别所代表的上游引物和下游引物来通过PCR(聚合酶链反应)扩增如SEQID NO:73所代表的JMJC的编码区。所述引物包括用于Gateway重组的AttB位点以促进扩增的PCR DNA片段克隆到Gateway克隆载体中。
也使用标准方法纯化扩增的PCR片段。随后进行Gateway方法的第一步骤,即BP反应,在此期间根据Gateway术语学,所述PCR片段与pDONR201质粒在体内重组以产生“进入克隆”pJMJC。质粒pDONR201作为技术的部分从Invitrogen购买。
包含SEQ ID NO:73的进入克隆随后在LR反应中与用于稻转化法的目的载体一起使用。这种载体含有在T-DNA边界内部的植物选择标记、筛选标记表达盒和意图与已经克隆在该进入克隆中的目的核酸序列发生LR体内重组的Gateway盒作为功能性元件。用于组成型表达的稻GOS2启动子(SEQ ID NO:77)位于该Gateway盒上游。
在所述LR重组步骤后,所得表达载体pGOS2::JMJC(图9)根据本领域熟知的方法转化入农杆菌菌株LBA4044。
实施例17:植物转化
植物的转化根据实施例7中概述的方法实施。
实施例18:表型评价方法
18.1评价建立
产生大约35个独立的T0稻转化体。将原代转化体从组织培养室转移至温室以培育和收获T1种子。留下下述8个事件,其中所述事件的T1子代对所述转基因的存在/不存在以3:1比例分离。对于这些事件中的每一个,通过监测目视标记表达而选出大约10株含有该转基因的T1籽苗(杂合子和纯合子)和大约10株缺少该转基因的T1籽苗(失效合子)。转基因植物和相应的失效合子以随机的位置并排培育。温室条件是短日照(12小时光照),在光照下28℃和在黑暗中22℃,和70%相对湿度。在非胁迫条件下培育的植物以规律的间隔期供应水分,以确保水和养分对于满足植物完全生长和发育的需要不是限制性的。
4个T1事件在T2世代中按照如对T1世代相同的评价方法进一步评估,不过每个事件采用更多个体。植物从播种期至成熟期数次通过数字成像室。在每个时间点上,从至少6个不同角度拍摄每株植物的数字图像(2048x1536像素,1600万颜色)。
干旱筛选
来自T2种子的植物在盆栽土壤中在正常条件下培育直至它们达到抽穗期。随后将它们转移至其中减少灌溉的“干燥”区域。将湿度探针插入随机选择的花钵内,以监测土壤水分含量(SWC)。当SWC下降低于某个阈值时,自动地对所述植物连续地再灌溉直至再次达到正常水平。随后将植物再次转移至正常条件。其余的培育(植物成熟、种子收获)与不在非生物胁迫条件下培育的植物相同。如对正常条件下详述那样记录生长和产量参数。
氮使用效率筛选
源自T2种子的稻植物在盆栽土壤中于正常条件下培育,除了营养溶液之外。从移植至成熟期间用氮(N)浓度降低、通常7至8倍之间降低的特定营养溶液浇灌所述花钵。其余的培育(植物成熟、种子收获)与并不在非生物胁迫下培育的植物相同。如对正常条件下详述那样记录生长和产量参数。
18.2统计分析:F-检验
使用两因素ANOVA(变量分析)作为整体评价植物表型特征的统计模型。对于用本发明基因转化的全部事件的全部植物的全部所测量参数实施F检验。实施F检验以检查该基因对全部转化事件的影响并验证该基因的整体作用(又称作基因总体作用)。真实基因总体作用显著性的阈值对于所述F检验设置在5%概率水平上。显著性F检验值指出了基因作用,这意味不仅仅是基因的存在或位置才造成表型上的差异。
因为实施了具有重叠事件的两个实验,故而进行联合分析。这用于检验对这两个实验影响的一致性,并且若是一致的,则用于积累来自两个实验的证据以提高结论的可信度。所用方法是考虑数据的多重水平结构的混合模型法(即实验-事件-分离子)。通过比较似然比检验与卡方分布(chisquare distribution)获得P-值。
18.3测量的参数
生物量相关的参数测量
植物从播种期至成熟期数次通过数字成像室。在每个时间,从至少6个不同角度拍摄每株植物的数字图像(2048x1536像素,1600万颜色)。
植物地上部分面积(或叶生物量)通过计数来自植物地上部分的数字图像上区别于背景的像素总数而确定。该值对相同时间点上从不同角度拍摄的画面进行平均化并且转化成通过校正以平方mm表述的物理表面值。实验证实以这种方式测量的地上部分植物面积与地上植物部分的生物量相关。地上部分面积是植物已经实现其最大叶生物量的时间点上所测量的面积。早期生长势是萌发后3周的植物(籽苗)地上部分的面积。根生物量的增加表述为根总生物量的增加(测量为植物寿命期间观察到的根最大生物量);或表述为根/冠比增加(测量为根和苗的活跃生长期间根质量与苗质量之间的比例)。
早期生长势通过计数来自植物部分的区别于背景的像素总数确定。该值对相同时间上从不同角度拍摄的画面进行平均化并且转化成通过校正以平方mm表述的物理表面值。下述结果针对萌发后3周的植物。
种子相关的参数测量
将成熟的原发花序收获、计数、装袋、加条形码标记并且随后在干燥箱内于37°干燥3日。随后将所述花序脱粒,并且收集和计数全部种子。充实粒使用吹气装置与空粒分开。弃去空粒并且再次计数剩余部分。充实粒在分析天平上称重。充实种子数通过计数所述分离步骤后仍留下的充实粒的数目来确定。种子总产量通过称量从一株植物收获的全部充实粒而测量。每株植物的种子总数通过计数从一株植物收获的壳数目测量。从计数的充实种子数及其总重量外推出千粒核重(TKW)。收获指数(HI)在本发明中定义为种子总产量与地上部分面积(mm2)之间的比率,乘以系数106。如本发明中定义的每花序总花数是种子总数与成熟原发花序之间的比例。如本发明中定义的种子充实率是充实种子数对种子(或小花)总数的比例(表述为%)。
实施例19:转基因植物的表型评价结果
下文呈现了评价在非胁迫条件下表达如SEQ ID NO:73所代表的JMJC核酸的转基因稻植物的结果。与对照失效合子植物相比时,观察到转基因植物中的出苗生长势(早期生长势)、根/冠比率、总种子产量、收获指数提高至少5%,并且千粒核重提高至少3%。
下文呈现了评价在干旱胁迫条件下表达SEQ ID NO:73的转基因稻植物的结果。与对照失效合子植物相比时,观察到转基因植物中的根/冠比率、种子总重量、充实种子数、充实率、收获指数提高至少5%,并且千粒核重提高至少3%。
III.酪蛋白激酶I
实施例20:鉴定与本发明方法中所用CKI核酸序列相关的序列
用数据库搜索工具如基本局部比对工具(BLAST)(Altschul等人(1990)J.Mol.Biol.215:403-410;和Altschul等人(1997)Nucleic Acids Res.25:3389-3402),在国家生物技术信息中心(NCBI)的Entrez核苷酸数据库中维护的那些序列中鉴定到与本发明方法中所用核酸序列相关的(全长cDNA、EST或基因组)序列。使用该程序通过将核酸序列或多肽序列与序列数据库比较并且计算匹配的统计显著性来找到序列之间的局部相似性区域。由与本发明方法中所用核酸编码的多肽用于TBLASTN算法,采用默认设置和过滤程序以忽略低复杂性序列启动。这种分析的结果通过配对比较进行观察,并根据概率评分(E-值)进行评级,其中所述的评分反映特定比对结果因偶然发生的概率(E-值越低,命中的显著性越高)。除了E-值外,比较也通过同一性百分数评分。同一性百分数指两个所比较的核酸(或多肽)序列之间特定长度范围内相同的核苷酸(或氨基酸)的数目。在一些情况下,可以调整默认参数以修改搜索的严格性。例如,可以提高E-值以显示更少的严格匹配。以这种方式,可以鉴定几乎完美的短匹配。
在一些情况下,相关序列可以由研究机构如基因组研究机构(TIGR)初步地汇编并且公开公开。可以使用真核生物基因直向同源物(EGO)数据库来鉴定此类相关序列,这可通过关键词搜索通过使用BLAST算法以目的核酸或多肽序列进行。
实施例21:GRP多肽序列的比对
多肽序列的比对使用来自Vector NTI软件包(Invitrogen)的AlignmentX程序进行,其中所述Alignment X程序基于受欢迎的累进比对Clustal算法(Thompson等人(1997)Nucleic Acids Res 25:4876-4882;Chenna等人(2003),Nucleic Acids Res 31:3497-3500)。空位开口罚分的默认值是10,空位延伸罚分0.1并且所选的权重矩阵是Blosum 62(若比对多肽)。可以进行少许手工编辑以优化该比对。
使用如Vector NTI(Invitrogen)的AlignX程序中所提供的邻接法聚类算法构建GRP多肽的进化系统树。
实施例22:在实施本发明方法中有用的多肽序列之间的总体同一性百分数的计算
使用现有技术领域可获得的方法之一,即MatGAT(矩阵总体比对工具)软件(BMC Bioinformatics.20034:29.MatGAT:使用蛋白质序列或DNA序列产生相似性/同一性矩阵的一项应用(an application thatgenerates similarity/identity matrices using protein or DNA sequences),Campanella JJ,Bitincka L,Smalley J;该软件由Ledion Bitincka维护)确定在实施本发明方法中有用的全长多肽序列之间的总体相似性和同一性百分数。MatGAT软件对DNA序列或蛋白质序列产生相似性/同一性矩阵,无需数据的预先比对。该程序使用Myers和Miller总体比对算法(空位开口罚分12和空位延伸罚分2)执行一系列配对比对,使用例如Blosum 62(对于多肽而言)计算相似性和同一性并且随后将结果置于距离矩阵内。在分割线下半部分显示序列相似性,和在对角分割线的上半部分显示序列同一性。
比较中使用的参数是:
评分矩阵:Blosum62
第一空位:12
延伸空位:2
也可以产生特定结构域的局部比对结果的MATGAT表或关于特定结构域之间的同一性/相似性%。
实施例23:鉴定在实施本发明方法中有用的多肽序列中所包含的结构域
蛋白质家族、结构域和位点的集成资源(InterPro)数据库是针对基于文本及基于序列的搜索法的常用特征标识数据库的集成界面。InterPro数据库合并了这些数据库,所述数据库使用不同的方法学及不同程度的有关充分表征的蛋白质的生物学信息以获得蛋白质特征标识。合作数据库包括SWISS-PROT、PROSITE、TrEMBL、PRINTS、ProDom和Pfam、Smart和TIGRFAM。Pfam是覆盖许多常见蛋白质结构域和家族的多重序列比对结果和隐匿马尔科夫模型(HMM)的庞大集合。Pfam在英国Sanger研究所服务器上维护。Interpro由英国欧洲生物信息学研究所维护。
代表GRP的蛋白质序列用作搜索InterPro数据库的查询项。
实施例24:在实施本发明方法中有用的多肽序列的拓扑结构预测
TargetP 1.1预测真核生物蛋白的亚细胞定位。基于任何氨基端前序列:叶绿体转运肽(cTP)、线粒体靶向肽(mTP)或分泌途径信号肽(SP)的预测存在性进行定位指派。作为最终预测基础的评分并不真正是概率,并且它们不是必需地加合成一体。但是,根据TargetP,具有最高评分的定位是最可能的,并且评分之间的关系(可靠性级别)可以指示该预测具有多大确定性。可靠性级别(RC)范围从1至5,其中1表示最可靠的预测。TargetP在丹麦技术大学(Technical University of Denmark)的服务器上维护。
对于预测含有氨基端前序列的序列而言,也可以预测潜在的切割位点。
可以选择许多参数,如生物组别(非植物或植物)、临界值集合(无、预定义的临界值集合或用户指定的临界值集合)和切割位点预测的计算(是或否)。
代表GRP的蛋白质序列用来查询TargetP 1.1。已经选择了“植物”生物组别,未定义临界值,并且对转运肽的预测长度提出要求。
许多其他算法可以用来进行此类分析,包括:
·在丹麦技术大学服务器上维护的ChloroP 1.1;
·在澳大利亚布里斯班昆士兰大学生物科学研究所的服务器上维护的Protein Prowler亚细胞定位预测者1.2版;
·在加拿大阿伯特省埃德蒙顿市阿尔伯塔大学的服务器上维护的PENCE蛋白组分析专家PA-GOSUB 2.5;
·在丹麦技术大学服务器上维护的TMHMM。
实施例25:在本发明方法中所用的核酸序列的克隆
SEQ ID NO:171的克隆:
本发明方法中所用的核酸序列SEQ ID NO:171通过PCR,使用定制的拟南芥幼苗cDNA文库(在MV Sport 6.0内;Invitrogen,Paisley,UK)作为模板进行扩增。使用Hifi Taq DNA聚合酶,在标准条件下利用在50μlPCR混合物中的200ng模板进行PCR。使用的引物是prm8667(SEQ IDNO:177;有义,起始密码子为粗体字):5’-ggggacaagtttgtacaaaaaagcaggcttaaacaatggactgcaacatggtatct-3’和prm8668(SEQ ID NO:178;反义,互补):5’-ggggaccactttgtacaagaaagctgggtcacattacttactcatctattttgg-3’,其中所述引物包括用于Gateway重组的AttB位点。也使用标准方法纯化扩增的PCR片段。随后进行Gateway方法的第一步骤,即BP反应,在此期间根据Gateway术语学,所述PCR片段与pDONR201质粒在体内重组以产生“进入克隆”。质粒pDONR201作为技术的部分从Invitrogen购买。
SEQ ID NO:173的克隆:
cDNA-AFLP实验在同步烟草BY2细胞培养物(烟草淡黄色-2栽培品种(Nicotiana tabacum L.cv.Bright Yellow-2)上进行,并且选择受细胞周期调节的BY2表达序列标签用于进一步克隆。使用所述表达序列标签来筛选烟草cDNA文库并分离全长目的cDNA,即编码SEQ ID NO:173的一个全长目的cDNA。
烟草BY2(烟草淡黄色-2栽培品种)培养的细胞悬浮液如下通过用蚜栖菌素阻滞处于S早期的细胞进行同步化。烟草淡黄色-2栽培品种的细胞悬浮液如(Nagata等人Int.Rev.Cytol.132,1-30,1992)所述维持。为了同步化,7日龄的静止期培养物在补充有蚜栖菌素(Sigma-Aldrich,St.Louis,MO;5mg/l)的新鲜培养基中10倍稀释。24小时后,通过用新鲜培养基洗涤从所述阻滞中释放细胞,此后它们的细胞周期进程继续。
使用LiCl沉淀法制备总RNA并且使用Oligotex柱(Qiagen,Hilden,德国),根据制造商说明书从500μg总RNA提取poly(A+)RNA。从1μg聚(A+)RNA开始,通过逆转录,用寡聚dT25引物(法国巴黎Genset)和Superscript II(Life Technologies,Gaithersburg,MD)合成第一链cDNA。用大肠杆菌连接酶(Life Technologies)、DNA聚合酶I(USB,Cleveland,OH)和RNA酶H(USB),通过链置换链进行第二链合成。
将500ng双链cDNA用于如(Vos等人,Nucleic Acids Res.23(21)4407-4414,1995;Bachem等人,Plant J.9(5)745-53,1996)所述的附带改良的AFLP分析。所用的限制性酶是BstYI和MseI(Biolabs)并且消化在两个独立步骤中进行。在用所述酶之一进行第一次限制性消化后,3’端片段借助其生物素化尾部而截留在Dyna珠(挪威奥斯陆Dynal)上,而洗掉其余片段。用所述第二种酶消化后,收集释放的限制性片段并且用作后续AFLP步骤中的模板。为了预扩增,将不含选择性核苷酸的MseI引物与含有T或C作为3’最末端核苷酸的BstYI引物组合。PCR条件如(Vos等人,1995)描述。获得的扩增混合物稀释600倍并且5μl用于使用P33标记的BstYI引物和Amplitaq-Gold聚合酶(比利时布鲁塞尔Roche Diagnostics)的选择性扩增。使用Sequigel系统(Biorad),在5%聚丙烯酰胺凝胶上分离扩增产物。干燥的凝胶对Kodak Biomax胶片曝光以及在磷屏成像仪(PhosphorImager)(Amersham Pharmacia Biotech,Little Chalfont,UK)中扫描。
从所述凝胶中分离与差异性表达的转录物对应的条带并且洗脱的DNA在如对于选择性扩增相同的条件下再次扩增,在所述转录物当中(非全长的)转录物与SEQ ID NO:173对应。序列信息通过用选择性BstYI引物对再扩增的聚合酶链反应产物直接测序或所述片段在pGEM-T easy(Promega,Madison,WI)中克隆后并对各个克隆测序来获得。获得的序列针对公共可用数据库中存在的核苷酸序列和蛋白质序列,通过BLAST序列比对法(Altschul等人,Nucleic Acids Res.25(17)3389-34021997)进行比较。当可获得时,标签序列用较长的EST或分离的cDNA序列替换以提高找到显著同源性的几率。随后从如下商业化烟草cDNA文库扩增出与SEQID NO 173对应的实体cDNA克隆。
从分裂活跃的非同步化BY2烟草细胞中分离的poly(A+)RNA制备插入物平均大小1,400bp的c-DNA文库。这些文库插入物克隆在包含attBGateway盒(Life Technologies)的载体pCMVSPORT6.0中。从该文库中选出46,000个克隆,排布在384孔微量滴定平板中并且随后一式两份点样于尼龙滤器上。使用几百个放射标记标签(包括与序列SEQ ID NO:173对应的BY2标签)的汇集物作为探针筛选排布的克隆。将阳性克隆分离(其中所述克隆与SEQ ID NO:173对应)、测序并与标签序列比对。在与所述标签杂交失败时,与该标签对应的全长cDNA通过PCR扩增法选择:使用通常可用的软件设计标签特异性引物并与常见载体引物联合使用以扩增非全长的cDNA插入物。来自50,000,100,000,150,000和300,000个cDNA克隆的DNA汇集物用作PCR扩增中的模板。扩增产物随后从琼脂糖凝胶分离、克隆、测序并将其序列与标签的序列比对。接下来,与SEQ ID NO:173的核苷酸序列对应的全长cDNA从pCMVsport6.0文库载体借助LR反应克隆到供体载体pDONR201(Invitrogen,Paisley,UK)中,产生进入克隆。
包含SEQ ID NO:171或SEQ ID NO:173的进入克隆随后在LR反应中与用于稻转化法的目的载体一起使用。这种载体含有在T-DNA边界内部的植物选择标记、筛选标记表达盒和意图与已经克隆在进入克隆中的目的核酸序列发生LR体内重组的Gateway盒作为功能性元件。用于种子特异性表达的稻WSI18启动子(SEQ ID NO:175)位于该Gateway盒上游。
在所述LR重组步骤后,所得表达载体pWSI18::GRP(图11)根据本领域熟知的方法转化入农杆菌菌株LBA4044。
在备选构建体中,使用稻GOS2启动子(SEQ ID NO:176),产生表达载体pGOS2::GRP。
实施例26:植物转化
植物的转化根据实施例7中概述的方法实施。
实施例27:表型评价方法
27.1评价建立
产生大约35个独立的T0稻转化体。将原代转化体从组织培养室转移至温室以培育和收获T1种子。留下下述6个事件,其中所述事件的T1子代对所述转基因的存在/不存在以3:1比例分离。对于这些事件中的每一个,通过监测目视标记表达而选出大约10株含有该转基因的T1籽苗(杂合子和纯合子)和大约10株缺少该转基因的T1籽苗(失效合子)。转基因植物和相应的失效合子以随机的位置并排培育。温室条件是短日照(12小时光照),在光照下28℃和在黑暗中22℃,和70%相对湿度。在非胁迫条件下培育的植物以规律的间隔期供应水分,以确保水和养分对于满足植物完全生长和发育的需要不是限制性的。
4个T1事件在T2世代中按照如对T1世代相同的评价方法进一步评估,不过每个事件采用更多个体。植物从播种期至成熟期数次通过数字成像室。在每个时间点上,从至少6个不同角度拍摄每株植物的数字图像(2048x1536像素,1600万颜色)。
干旱筛选
来自T2种子的植物在盆栽土壤中在正常条件下培育直至它们达到抽穗期。随后将它们转移至其中减少灌溉的“干燥”区域。将湿度探测器插入随机选择的花钵内,以监测土壤水分含量(SWC)。当SWC下降低于某个阈值时,自动地对所述植物连续地再灌溉直至再次达到正常水平。随后将植物再次转移至正常条件。其余的培育(植物成熟、种子收获)与不在非生物胁迫条件下培育的植物相同。如对正常条件下详述那样记录生长和产量参数。
氮使用效率筛选
源自T2种子的稻植物在盆栽土壤中于正常条件下培育,除了营养溶液之外。从移植至成熟期间用氮(N)浓度降低、通常7至8倍之间降低的特定营养溶液浇灌所述花钵。其余的培育(植物成熟、种子收获)与并不在非生物胁迫下培育的植物相同。如对正常条件下详述那样记录生长和产量参数。
27.2统计分析:F-检验
使用两因素ANOVA(变量分析)作为整体评价植物表型特征的统计模型。对于用本发明基因转化的全部事件的全部植物的全部所测量参数实施F检验。实施F检验以检查该基因对全部转化事件的影响并验证该基因的整体作用(又称作基因总体作用)。真实基因总体作用显著性的阈值对于所述F检验设置在5%概率水平上。显著性F检验值指出基因作用,这意味不仅仅是基因的存在或位置才造成表型上的差异。
因为实施了具有重叠事件的两个实验,故而进行联合分析。这用于检验对这两个实验影响的一致性,并且若是一致的,则用于积累来自两个实验的证据以提高结论的可信度。所用方法是考虑数据的多重水平结构的混合模型法(即实验-事件-分离子)。通过比较针对卡方分布的似然比检验而获得P-值。
27.3测量的参数
生物量相关的参数测量
植物从播种期至成熟期数次通过数字成像室。在每个时间点上,从至少6个不同角度拍摄每株植物的数字图像(2048x1536像素,1600万颜色)。
植物地上部分面积(或叶生物量)通过计数来自植物地上部分的数字图像上区别于背景的像素总数而确定。该值对相同时间点上从不同角度拍摄的画面进行平均化并且转化成通过校正以平方mm表述的物理表面值。实验证实以这种方式测量的地上部分植物面积与地上植物部分的生物量相关。地上部分面积是植物已经实现其最大叶生物量的时间点上所测量的面积。
早期生长势是萌发后3周的植物(籽苗)地上部分的面积。早期生长势通过计数来自植物部分的区别于背景的像素总数确定。该值对相同时间点上从不同角度拍摄的画面进行平均化并且转化成通过校正以平方mm表述的物理表面值。下述结果针对萌发后3周的植物。
种子相关的参数测量
将成熟的原发花序收获、计数、装袋、加条形码标记并且随后在干燥箱内于37°干燥3日。随后将所述花序脱粒,并且收集和计数全部种子。充实粒使用吹气装置与空粒分开。弃去空粒并且再次计数剩余部分。充实粒在分析天平上称重。充实种子数通过计数所述分离步骤后仍留下的充实粒的数目来确定。种子总产量通过称量从一株植物收获的全部充实粒而测量。每株植物的种子总数通过计数从一株植物收获的壳数目测量。从计数的充实种子数及其总重量外推出千粒核重(TKW)。收获指数(HI)在本发明中定义为种子总产量与地上部分面积(mm2)之间的比率,乘以系数106。如本发明中定义的每花序总花数是种子总数与成熟原发花序之间的比例。如本发明中定义的种子充实率是充实种子数对种子(或小花)总数的比例(表述为%)。
实施例28:转基因植物的表型评价结果
在干旱胁迫条件下培育时,在WSI18启动子控制下表达由SEQ IDNO:171代表的GRP核酸的转基因稻植物显示生物量、种子总重量、充实种子数、充实率和收获指数提高大于5%。在非胁迫条件下培育时,观察到生物量、充实种子数、种子总重量和原发花序数提高大于5%。
对于含有受GOS2启动子控制的SEQ ID NO:171的构建体,观察到转基因植物中早期生长势和每花序的花数提高,并且对于这些参数中的每一个,所述提高大于5%。
在WSI18启动子控制下表达SEQ ID NO:173并在干旱胁迫条件下培育的转基因植物显示在种子总重量、充实种子数、每花序的花数目、收获指数和千粒核重方面提高。对于千粒核重,观察到的提高是至少3.5%,并且对于其余参数,所述提高大于5%。
IV.植物同源域指-同源域(PHDf-HD)多肽
实施例29:鉴定与本发明方法中所用核酸序列相关的序列
用数据库搜索工具如基本局部比对工具(BLAST)(Altschul等人(1990)J.Mol.Biol.215:403-410;和Altschul等人(1997)Nucleic Acids Res.25:3389-3402),在国家生物技术信息中心(NCBI)的Entrez核苷酸数据库中维护的那些序列中鉴定到与本发明方法中所用核酸序列相关的(全长cDNA、EST或基因组)序列。使用该程序通过将核酸序列或多肽序列与序列数据库比较并且计算匹配的统计显著性来找到序列之间的局部相似性区域。例如,由与本发明方法中所用核酸序列编码的多肽用于TBLASTN算法,采用默认设置和过滤程序以忽略低复杂性序列启动。这种分析的结果通过配对比较进行观察,并根据概率评分(E-值)进行评级,其中所述的评分反映特定比对结果因偶然发生的概率(E-值越低,命中的显著性越高)。除了E-值外,比较过程也可以通过同一性百分数评分。同一性百分数指两个所比较的核酸(或多肽)序列之间特定长度范围内相同的核苷酸(或氨基酸)的数目。在一些情况下,可以调整默认参数以修改搜索的严格性。例如,可以提高E-值以显示更少的严格匹配。以这种方式,可以鉴定几乎完美的短匹配。
表D1提供了与本发明方法中所用PHDf-HD核酸序列相关的核酸序列名单。
表D1:PHDf-HD多肽的例子
实施例30:PHDf-HD多肽序列的比对
德国波茨坦大学已经产生了植物转录因子数据库,包括对于稻的植物转录因子数据库,名为稻TFDB。下载与属于HD家族的转录因子(迄今鉴定的120个基因模型(91个基因座))相对应的多肽序列,包括迄今鉴定的两个PHDf-HD多肽(Os02g05450.1和Os06g12400.1)。将本申请的表D1的多肽序列添加(当全长时,即21个多肽序列)至HD家族的集合。
使用默认值,用累进比对Clustal算法(1.83)(Thompson等人(1997)Nucleic Acids Res 25:4876-4882;Chenna等人(2003).Nucleic Acids Res31:3497-3500)进行所述全部多肽序列的比对而后构建邻接树并在本申请的图13中显示,划圈标出包含两个稻旁系同源物(Os02g05450.1和Os06g12400.1)的目的组。属于这个HD组的任意多肽(在如本文以上描述的新多重比对步骤后)认为在实施如本文中所述的本发明方法中有用。
在表D1的全长PHDf-HD多肽的多重序列比对结果中,可以鉴定到许多特点,并且将它们在图17中标出。从所述多肽的氨基末端至羧基端是:(i)预测的核定位信号(NLS);(ii)亮氨酸拉链(ZIP),其具有4个七残基组(以方框标示,其中每隔7个氨基酸出现一个亮氨酸(偶然是异亮氨酸、缬氨酸或甲硫氨酸);(iii)PHD指(PHDf),其含有带特征性半胱氨酸间隔区的典型C4HC3(4个半胱氨酸、1个组氨酸、3个半胱氨酸);(iv)酸性区段(富含酸性氨基酸D和E);(v)碱性区段(富含碱性氨基酸K和R);(vi)同源域(HD)。
实施例31:在实施本发明方法中有用的多肽序列之间的总体同一性百分数的计算
使用现有技术领域可获得的方法之一,即MatGAT(矩阵总体比对工具)软件(BMC Bioinformatics.20034:29.MatGAT:使用蛋白质序列或DNA序列产生相似性/同一性矩阵的一项应用(an application thatgenerates similarity/identity matrices using protein or DNA sequences),Campanella JJ,Bitincka L,Smalley J;该软件由Ledion Bitincka维护)确定在实施本发明方法中有用的全长多肽序列之间的总体相似性和同一性百分数。MatGAT软件对DNA序列或蛋白质序列产生相似性/同一性矩阵,无需数据的预先比对。该程序使用Myers和Miller总体比对算法(空位开口罚分12和空位延伸罚分2)执行一系列配对比对,使用例如Blosum 62(对于多肽而言)计算相似性和同一性并且随后将结果置于距离矩阵内。在分割线下半部分显示序列相似性,和在对角分割线的上半部分显示序列同一性。
比较中使用的参数是:
评分矩阵:Blosum62
第一空位:12
延伸空位:2
表D2中显示在多肽序列的全长范围内总体相似性和同一性的软件分析结果(不包括非全长的多肽序列)。在对角线上方给出同一性百分数而在对角线下方给出相似性百分数。
与SEQ ID NO:180相比较,在实施本发明方法中有用的PHDf-HD多肽序列之间的百分数同一性可以低至15%氨基酸同一性。
表D2:在多肽序列的全长范围内总体相似性和同一性的MatGAT结果
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21
1.Arath_PHDf_HD_PRHA 25 31 40 19 38 26 17 32 40 20 19 40 30 40 23 31 25 25 18 19
2.Arath_PHDf-HD_HAT3 44 23 27 33 26 34 28 27 26 34 35 27 23 28 34 24 36 35 18 20
3.Orysa_PHDf_HD 46 39 35 18 34 20 18 31 34 17 18 33 56 36 21 57 21 23 15 15
4.Eucgr_PHDf_HD 57 45 51 21 47 27 20 36 50 22 21 51 32 52 25 32 26 27 17 17
5.Lotja_PHDf-HD 36 47 31 35 22 29 32 23 20 39 40 20 18 21 34 18 31 32 20 22
6.Medtr_PHDf_HD 55 44 51 64 36 26 19 35 50 20 20 49 30 50 25 32 27 26 17 17
7.Orysa_PHDf-HD_HAZ1 42 50 35 47 45 43 26 25 25 29 29 26 21 26 32 21 50 46 29 30
8.Petcr_PHDf_HD_PRHP 31 39 28 32 48 31 38 22 20 32 33 20 18 20 30 18 26 25 19 21
9.Pinra_PHDf_HD 53 44 47 51 42 50 44 39 36 23 23 37 28 39 26 30 25 27 19 19
10.Poptr_PHDf_HD_I 58 45 52 67 36 66 45 33 52 20 21 84 30 55 25 31 25 25 17 17
11.Poptr_PHDf_HD_III 36 47 30 34 56 35 44 46 41 36 80 21 19 22 37 18 31 31 20 20
12.Poptr_PHDf_HD_II 36 49 31 34 57 34 46 47 42 35 86 21 18 22 38 18 30 30 20 21
13.Poptr_PHDf_HD_IV 59 46 51 68 37 67 44 33 54 91 35 35 30 57 25 32 25 25 17 17
14.Sacof_PHDf_HD 48 43 69 51 31 50 38 29 45 51 34 33 51 34 22 83 21 22 15 16
15.Vitvi_PHDf_HD_I 58 47 52 69 36 67 43 32 52 74 36 35 75 52 23 34 27 25 16 17
16.Vitvi_PHDf_HD_II 39 47 36 39 56 39 45 47 43 40 56 57 40 36 41 22 32 31 23 24
17.Zeama_PHDf_HD 48 41 70 51 32 52 38 30 45 54 33 32 53 87 53 34 22 22 15 15
18.Zeama_hox1a 43 54 39 44 43 44 63 38 43 44 44 43 45 42 43 46 42 83 24 24
19.Zeama_hox1b 42 53 40 44 44 42 60 36 43 44 44 43 45 41 44 45 41 88 23 23
20.Zeama_hox2a 27 27 24 25 32 25 36 31 31 26 30 31 27 25 26 34 24 31 30 81
21.Zeama__Hox2b 29 28 23 27 33 27 37 34 31 27 32 33 26 25 27 35 25 32 30 86
如果在SEQ ID NO:180的保守ZIP/PHDf结构域(保守的亮氨酸拉链/植物同源域指结构域,包含Zip和PHDf结构域)(如SEQ ID NO:233所代表)与在实施本发明中有用的多肽的保守ZIP/PHDf结构域之间开展同一性计算,可能大幅度提高同一性百分数。作为保守ZIP/PHDf的SEQ ID NO:233总计长180个连续氨基酸。如表D3中所示,在实施本发明方法中有用的多肽序列之间保守ZIP/PHDf结构域范围内的同一性百分数范围在30%和75%氨基酸同一性之间。
表D3:在多肽序列中保守的ZIP/PHDf结构域范围内总体相似性和同一性的MatGAT结果
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21
1.ZIP/PHDf_Arath_PHDf_HD_PRHA 52 50 77 48 74 53 48 64 73 48 46 72 51 76 50 52 50 50 53 53
2.ZIP/PHDf_Arath_PHDf-HD_HAT3 70 44 52 73 54 70 69 56 52 75 75 51 43 53 78 46 65 67 64 65
3.ZIP/PHDf_Orysa_PHDf_HD 69 60 56 39 54 37 39 56 53 39 38 53 70 59 41 71 37 38 34 33
4.ZIP/PHDf_Eucgr_PHDf_HD 90 70 73 52 79 48 50 71 82 51 49 81 55 84 52 56 48 48 49 48
5.ZIP/Lotja_PHDf-HD 67 89 59 69 52 64 69 52 47 76 76 47 37 50 78 38 64 66 61 61
6.ZIP/Medtr_PHDf_HD 86 70 72 87 68 52 49 66 74 49 48 75 50 79 51 53 51 51 52 52
7.ZIP/PHDf_Orysa_PHDf-HD_HAZ1 69 83 54 67 83 68 64 51 47 68 67 47 35 47 68 37 79 80 82 84
8.ZIP/PHDf_Petcr_PHDf_HD_PRHP 67 80 54 66 83 65 78 53 47 71 73 45 39 48 74 42 62 63 62 62
9.ZIP/PHDf_Pinra_PHDf_HD 82 74 72 83 73 82 70 69 66 53 52 67 52 73 55 54 53 52 53 52
10.ZIP/PHDf_Poptr_PHDf_HD_I 87 70 72 92 69 88 67 66 83 48 47 93 53 82 50 55 49 48 49 49
11.ZIP/PHDf_Poptr_PHDf_HD_III 66 87 57 67 90 65 82 82 70 67 93 48 36 51 82 39 67 70 65 64
12.ZIP/PHDf_Poptr_PHDf_HD_II 65 88 56 66 90 65 81 84 69 66 96 46 35 49 83 38 67 69 64 64
13.ZIP/PHDf_Poptr_PHDf_HD_IV 86 70 72 91 69 88 67 66 82 97 67 66 52 82 48 54 47 47 48 47
14.ZIP/PHDf_Sacof_PHDf_HD 71 60 82 73 57 69 55 57 70 72 56 55 72 57 39 92 35 35 33 33
15.ZIP/PHDf_Vitvi_PHDf_HD_I 89 71 73 90 70 88 67 64 84 91 67 66 89 73 51 58 48 48 48 48
16.ZIP/PHDf_Vitvi_PHDf_HD_II 67 88 58 69 91 68 84 84 73 69 90 93 67 57 69 42 65 67 65 64
17.ZIP/PHDf_Zeama_PHDf_HD 74 61 83 73 58 70 56 58 69 73 57 55 72 96 73 57 38 37 35 34
18.ZIP/PHDf_Zeama_hox1a 71 84 59 71 85 70 88 79 74 72 83 82 71 61 70 85 62 94 74 76
19.ZIP/PHDf_Zeama_hox1b 70 84 58 69 85 68 89 79 74 70 84 83 70 60 70 85 60 98 75 78
20.ZIP/PHDf_Zeama_hox2a 67 80 54 67 83 67 89 76 70 67 80 79 66 54 66 82 56 87 87 92
21.ZIP/PHDf_Zeama__Hox2b 67 82 53 66 83 67 90 77 71 66 80 79 67 53 67 82 55 88 88 97
也可以在SEQ ID NO:180的HD(如SEQ ID NO:234所代表)和在实施本发明中有用的多肽的保守HD之间计算同一性百分数。如表D4中所示,在实施本发明方法中有用的多肽序列之间保守HD范围内的同一性百分数范围在25%和70%氨基酸同一性之间。
表D4:在多肽序列中保守的HD范围内总体相似性和同一性的MatGAT结果
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21
1.HD_Arath_PHDf_HD_PRHA 34 54 72 36 72 38 36 58 68 38 36 70 54 70 34 54 36 33 29 27
2.HD_Arath_PHDf-HD_HAT3 56 28 32 54 34 40 58 30 32 54 58 32 28 32 58 28 42 39 40 39
3.HD_Orysa_PHDf_HD 76 60 68 42 58 42 36 46 64 38 40 66 94 62 42 92 38 35 35 33
4.HD_Eucgr_PHDf_HD 86 58 78 42 72 44 42 60 82 38 38 84 66 76 42 66 44 41 35 33
5.HD_Lotja_PHDf-HD 60 72 66 64 38 52 58 36 42 64 68 42 42 40 68 40 56 55 50 46
6.HD_Medtr_PHDf_HD 78 60 70 82 66 36 36 62 68 38 36 70 58 66 36 58 40 37 27 27
7.HD_Orysa_PHDf-HD_HAZ1 56 54 64 62 66 58 44 26 44 50 48 44 42 40 46 42 70 65 73 71
8.HD_Petcr_PHDf_HD_PRHP 58 74 58 56 66 58 58 36 42 54 58 42 36 38 62 36 50 45 40 39
9.HD_Pinra_PHDf_HD 74 54 64 72 58 72 50 52 58 30 32 60 44 56 36 44 28 28 21 19
10.HD_Poptr_PHDf_HD_I 86 56 78 92 64 84 64 56 74 36 36 98 64 72 42 64 42 39 35 33
11.HD_Poptr_PHDf_HD_III 54 72 62 60 82 58 66 66 54 58 88 36 38 38 72 38 52 49 46 44
12.HD_Poptr_PHDf_HD_II 56 72 64 62 82 60 68 66 56 60 100 36 40 38 78 40 50 47 46 44
13.HD_Poptr_PHDf_HD_IV 88 56 80 94 64 86 64 56 76 98 58 60 66 72 42 66 42 39 35 33
14.HD_Sacof_PHDf_HD 74 60 94 76 64 72 62 56 62 76 60 62 78 64 42 98 36 33 35 33
15.HD_Vitvi_PHDf_HD_I 82 60 80 86 70 80 60 58 74 88 62 64 88 82 38 64 40 37 29 27
16.HD_Vitvi_PHDf_HD_II 64 76 66 66 82 68 64 74 56 66 84 84 66 64 68 40 48 43 44 44
17.HD_Zeama_PHDf_HD 74 60 94 76 64 72 62 56 62 76 60 62 78 100 82 64 36 33 35 33
18.HD_Zeama_hox1a 56 60 62 60 66 60 78 60 52 62 62 64 62 58 60 68 56 86 60 56
19.HD_Zeama_hox1b 57 63 61 61 69 61 80 63 51 63 67 69 63 57 61 71 55 92 59 53
20.HD_Zeama_hox2a 58 60 60 60 65 64 89 60 52 62 64 64 62 60 62 64 58 77 81 90
21.HD_Zeama__Hox2b 56 56 56 56 62 58 85 54 48 58 60 60 58 56 58 62 54 71 77 92
实施例32:鉴定在实施本发明方法中有用的多肽序列中所包含的结构域
蛋白质家族、结构域和位点的集成资源(InterPro)数据库是针对基于文本及基于序列的搜索法的常用特征标识数据库的集成界面。InterPro数据库合并了这些数据库,所述数据库使用不同的方法学及不同程度的有关充分表征的蛋白质的生物学信息以获得蛋白质特征标识。合作数据库包括SWISS-PROT、PROSITE、TrEMBL、PRINTS、ProDom和Pfam、Smart和TIGRFAMs。Interpro由英国欧洲生物信息学研究所维护。
在表D5中呈现如SEQ ID NO:180所代表的多肽序列的InterPro扫描结果。
表D5:如SEQ ID NO:180所代表的多肽序列的InterPro扫描结果
InterPro扫描结果清楚地鉴定到PHDf-HD多肽的重要特征,即PHDf锌指和同源域,例如由Pfam登录号PF00628和PF00046分别代表。
HD已知具有典型残基。PHDf-HD多肽的HD在序列方面高度趋异,即便在同源域中几乎不变的位置上也是如此。图15中显示表D1的PHDf-HD多肽的HD的序列图标。序列突变是氨基酸或核酸多重序列比对结果的图形表示。每个图标由符号堆叠组成,一个堆叠对应于序列中的每个位置。该堆叠的总体高度指示在该位置处的序列保守性,而在该堆叠范围内的符号的高度指示每个氨基酸或核酸在该位置处的相对频率。通常,序列图标比共有序列提供例如对结合位点的更丰富和更精确描述。产生此类图标的算法(WebLogo)可在伯克利市加利福尼亚大学的服务器上获得。如SEQ ID NO:234所代表的并且在SEQ ID NO:180中包含的HD符合如图15中所表示的序列图标。在实施本发明方法有用的多肽包含如图15中所示序列图标中所含有的HD。
实施例33:在实施本发明方法中有用的多肽序列的二级结构特征的预测
卷曲螺旋通常含有称作七残基重复序列的重复七氨基酸残基模式。卷曲螺旋对于鉴定相同蛋白质、相同家族的蛋白质、或不相关蛋白质的蛋白质-蛋白质相互作用(如寡聚化)是重要的。最近在从序列数据计算性预测卷曲螺旋方面取得长足进展。本领技术人员熟知的许多算法可在ExPASy蛋白质组工具上获得。作为其中算法之一,COILS是将序列与已知的平行双链螺旋卷曲的数据库比较并且导出相似性评分的程序。通过将这种评分与球状蛋白和卷曲螺旋蛋白中的评分分布比较,该程序随后计算该序列会采用卷曲螺旋构象的概率。
如SEQ ID NO:180所代表的PHDf-HD多肽以高概率在检验的3个窗口内(14,21和28)具有氨基端预测的两个卷曲螺旋结构域。在表D6中显示残基坐标、残基、所述三个窗口和对应概率值。在图16中是COILS算法对如SEQ ID NO:180所代表多肽的图形输出结果,其中两个预测的卷曲螺旋在所述多肽的氨基端半部分中,在全部3个窗口(如三条线所代表)是清晰可见的。
表D6:COILS算法对如SEQ ID NO:180所代表多肽的数字输出结果。显示了残基坐标(#)、残基、所述三个窗口和对应概率值。高于0.09的概率以灰色显示。
# 残基 窗口=14 概率 窗口=21 概率 窗口=28 概率
87 P d 0.001 e 0.001 E 0.001
88 T e 0.063 f 0.274 F 0.099
89 R f 0.063 g 0.567 G 0.099
90 R g 0.063 a 0.567 A 0.099
91 K b 0.066 b 0.642 B 0.188
92 H c 0.066 c 0.642 C 0.188
93 K d 0.069 d 0.642 D 0.591
94 Q e 0.178 e 0.642 E 0.672
95 K f 0.335 f 0.642 F 0.672
96 R g 0.335 g 0.642 G 0.772
97 K a 0.335 a 0.642 A 0.772
98 N b 0.347 b 0.642 B 0.772
99 D c 0.347 c 0.642 C 0.772
100 E d 0.347 d 0.642 D 0.772
101 S e 0.347 e 0.642 E 0.808
102 D f 0.347 f 0.642 F 0.808
103 E g 0.347 g 0.642 g 0.808
104 V a 0.347 a 0.642 a 0.808
105 S b 0.347 b 0.642 b 0.808
106 R c 0.347 c 0.642 c 0.808
107 M d 0.347 d 0.642 d 0.808
108 E e 0.347 e 0.642 e 0.808
109 K f 0.347 f 0.642 F 0.808
110 R g 0.347 g 0.642 g 0.808
111 A a 0.347 a 0.642 a 0.808
112 R b 0.307 b 0.514 b 0.808
113 Y c 0.066 c 0.503 c 0.808
114 L d 0.262 d 0.503 d 0.808
115 L e 0.262 e 0.503 e 0.808
116 I f 0.262 f 0.503 F 0.808
117 K g 0.262 g 0.503 g 0.808
118 I a 0.262 a 0.503 a 0.808
119 K b 0.262 b 0.503 b 0.808
120 Q c 0.262 c 0.503 c 0.808
121 E d 0.262 d 0.503 d 0.808
122 Q e 0.262 e 0.503 e 0.808
123 N f 0.262 f 0.503 F 0.808
124 L g 0.262 g 0.434 g 0.808
125 L a 0.262 a 0.434 a 0.808
126 D b 0.262 b 0.434 b 0.808
127 A c 0.262 c 0.304 c 0.808
128 Y d 0.145 d 0.304 d 0.808
129 S e 0.145 e 0.044 e 0.808
130 G f 0.119 f 0.009 F 0.367
131 D g 0.078 g 0.007 g 0.136
132 G a 0.002 a 0.001 a 0.005
133 W b 0 a 0.001 a 0.001
134 N b 0.001 b 0.045 b 0.057
135 G c 0.001 c 0.045 c 0.057
136 H d 0.003 d 0.07 d 0.219
137 S e 0.008 e 0.132 e 0.231
138 R f 0.025 f 0.357 F 0.231
139 E g 0.025 g 0.357 g 0.231
140 K a 0.025 a 0.357 a 0.231
141 I b 0.028 b 0.357 b 0.231
142 K c 0.07 c 0.357 c 0.462
143 P d 0.07 d 0.357 d 0.462
144 E e 0.998 e 0.997 e 0.974
145 K f 0.998 f 0.997 f 0.974
146 E g 0.998 g 0.997 g 0.974
147 L a 0.998 a 0.997 a 0.974
148 Q b 0.998 b 0.997 b 0.974
149 R c 0.998 c 0.997 c 0.974
150 A d 0.998 d 0.997 d 0.974
151 K e 0.998 e 0.997 e 0.974
152 K f 0.998 f 0.997 f 0.974
153 Q g 0.998 g 0.997 g 0.974
154 I a 0.998 a 0.997 a 0.974
155 M b 0.998 b 0.997 b 0.974
156 K c 0.998 c 0.997 c 0.974
157 Y d 0.998 d 0.997 d 0.974
158 K e 0.989 e 0.997 e 0.974
159 I f 0.896 f 0.997 f 0.974
160 A g 0.486 g 0.997 g 0.974
161 I a 0.409 a 0.997 a 0.974
162 R b 0.274 b 0.997 b 0.974
163 D c 0.255 c 0.997 c 0.974
164 V d 0.095 d 0.997 d 0.974
165 I e 0.025 e 0.871 e 0.974
166 H f 0.025 f 0.622 f 0.974
167 Q g 0.025 g 0.496 g 0.974
168 L a 0.025 a 0.496 a 0.974
169 D b 0.025 b 0.468 b 0.974
170 L c 0.005 c 0.111 c 0.974
171 C d 0.002 d 0.02 d 0.974
172 S e 0.001 e 0.007 e 0.719
173 S f 0.001 f 0.003 f 0.482
174 S g 0.001 g 0.001 g 0.066
175 G a 0 a 0 a 0.001
以低于在该多肽氨基端半部分中所包含的两个螺旋结构域的概率预测到在如SEQ ID NO:180所代表的PHDf-HD多肽的羧基端半部分中的另一个卷曲螺旋。
实施例34:在实施本发明方法中有用的多肽序列的亚细胞定位预测
LOC树是可以预测非植物和植物真核生物以及原核生物中非膜蛋白的亚细胞定位和DNA-结合特性的算法。LOC树将真核动物蛋白分成5个亚细胞类别之一,而植物蛋白分成6个亚细胞类别之一,并且原核蛋白质分成3个亚细胞类别之一。
无论何时可用时,LOC树还基于以下项而报道预测结果:1)由PredictNLS算法找到的核定位信号,2)使用蛋白质中存在的Prosite基序和Pfam结构域所推测的定位,和3)与蛋白质相关的SWISS-PROT关键词。在后两种情况下使用基于熵的LOCkey算法推测定位。该软件在美国哥伦比亚大学维护。
使用LOCkey,基于基序和关键词对如SEQ ID NO:180所代表PHDf-HD多肽的亚细胞定位的预测结果。
例如使用PredictNLS算法进行核定位信号(NLS)的预测。该算法也由美国哥伦比亚大学的服务器维护。在下表中显示了使用PredictNLS算法对多肽SEQ ID NO:180中的NLS的预测结果。
在下文多肽序列(SEQ ID NO:180)中,预测的NLS的位置以粗体和双下划线显示。
MNTPEKKPLCYTSRRALQQRTESSSELISVSKRATRQNTPRKPDSPPKRTTRSSANLAKC
IENKHHSSPLNDESDEVSRMEKRARYLLIKIKQ
EQNLLDAYSGDGWNGHSREKIKPEKELQRAKKQIMKYKIAIRDVIHQLDLCSSSGSKDDS
VIPPDGCHESVNPEHTICSRCKSHESFPDNNIIFCEGGCKLACHQKCLEPPFDKILPTTR
HGRLCKHCSSKMKILDAINAHLGTSFTVKCPSSDIFKEAAEHFNSDDGLGQDWLSEYSGD
EDYDPEENEASSSGEENKSADSNCSGSPLYSPNDDIPDFISADFNDAEGFCRESSNLGID
FGEDGLAEILTHQRPRRDVDYTQLNEQMFGEPIGNDEQSEDEDWGLNKRKKRRTGSTGVG
TNSVEGRSDVKSNKKAQPRRKLFRIPPAAVEVLRKAFAENELPARSVKENLSTELGISFE
KIDKWFKNTRCAALRDRKGESRYSGPSKRSRTSIEKAETSAKVDQMDNSCFLPLSEIINV
PTRLQKGLDKKPKSINSPPRPQDNETCLSPTDKTKEGTPPTIKPSITDSSQLMNNDIGTE
ETAVSWVDTWASDALHFLDVSDDEHFFDVIEKVCGLENRLQRLKENMLSSSSSTDNNVAA
ESGLQNEVVLVPAAELKDKAS
许多其他算法可以用来进行此类分析,包括:
·在丹麦技术大学服务器上维护的ChloroP 1.1;
·在澳大利亚布里斯班昆士兰大学生物科学研究所的服务器上维护的Protein Prowler亚细胞定位预测者1.2版;
·在加拿大阿伯特省埃德蒙顿市阿尔伯塔大学的服务器上维护的PENCE蛋白组分析专家PA-GOSUB 2.5;
·在丹麦技术大学服务器上维护的TMHMM。
实施例35:如SEQ ID NO:179所代表的核酸的克隆
除非另外说明,重组DNA技术根据(Sambrook(2001)MolecularCloning:a laboratory manual,第3版Cold Spring Harbor LaboratoryPress,CSH,New York)或Ausubel等人(1994),Current Protocols inMolecular Biology,Current Protocols第1卷和第2卷中描述的标准方案进行。用于植物分子研究工作的标准材料和方法在BIOS科学出版有限责任公司(BIOS Scientific Publications Ltd(英国))和Blackwell科学出版社(Blackwell Scientific Publications(英国))出版的R.D.D.Croy的PlantMolecular Biology Labfax(1993)中描述。
使用从mRNA合成的稻cDNA库作为模板,通过PCR扩增稻PHDf-HD基因,其中所述的mRNA从混合的植物组织提取。引物prm09687(SEQ ID NO:236;有义:5’-ggggacaagtttgtacaaaaaagcaggcttaaacaatgaataccccagaaaagaaa-3’)和引物prm09688SEQ ID NO:237;反向互补:5’-ggggaccactttgtacaagaaagctgggtgatgcaaggttaagatgcttt-3’)用于PCR扩增,其中所述的引物包含用于Gateway重组的AttB位点。使用Hifi Taq DNA聚合酶在标准条件进行PCR。使用标准方法扩增和纯化具有预期长度的PCR片段。随后进行Gateway方法的第一步骤,即BP反应,在此期间根据Gateway术语学,所述PCR片段与pDONR201质粒在体内重组以产生“进入克隆”。质粒pDONR201作为技术的部分从Invitrogen购买。
实施例36:使用如SEQ ID NO:179所代表的核酸序列的表达载体构建
包含SEQ ID NO:179的进入克隆随后在LR反应中与用于稻转化法的目的载体一起使用。这种载体含有在T-DNA边界内部的植物选择标记、筛选标记表达盒和意图与已经克隆在该进入克隆中的目的核酸序列发生LR体内重组的Gateway盒作为功能性元件。用于组成型表达的稻GOS2启动子(SEQ ID NO:235)位于该Gateway盒上游。
在所述LR重组步骤后,所得表达载体pGOS2::PHDf-HD(图18)根据本领域熟知的方法转化入农杆菌菌株LBA4044。
实施例37:植物转化
稻转化
独立地使用含有所述表达载体的农杆菌来转化稻植物。将稻粳型栽培品种Nipponbare的成熟干燥种子脱壳。通过如下方式实施消毒:在70%乙醇中孵育1分钟,随后在0.2%HgCl2中孵育30分钟,随后用无菌蒸馏水洗涤6次15分钟。无菌的种子随后在含有2,4-D的培养基(愈伤组织诱导培养基)上萌发。在黑暗中孵育4周后,将胚发生的盾片衍生的愈伤组织切下并在相同的培养基上增殖。2周后,将所述愈伤组织通过在同一种培养基上传代培养另外2周进行繁殖或增殖。胚发生的愈伤组织片在新鲜培养基上传代培养3日,随后共培育(以助长细胞分裂活性)。
将含有每一单个表达载体的农杆菌菌株LBA4404独立地用于共培育。农杆菌接种在含有适宜抗生素的AB培养基上并在28℃培养3日。随后收集细菌并在液体共培育培养基中悬浮至密度(OD600)约1。该悬液随后转移至培养皿内并将所述愈伤组织浸没于此悬液中15分钟。该愈伤组织随后在滤纸上蘸干并转移至固化的共培育培养基,并在25℃于黑暗中孵育3日。共培育的愈伤组织在含2,4-D的培养基上在28℃于黑暗中在选择剂存在下培育4周。在此期间,迅速生长的抗性愈伤组织团发育。将这种材料转移至再生培养基并在光照下孵育后,释放了胚发生潜能并且苗在随后4至5周内发育。将苗从愈伤组织上切下并且在含有植物生长素的培养基上孵育2至3周,将苗从所述培养基转移至土壤。硬化的苗在温室中于高湿度和短日照下培育。
对于每一个构建体,产生大约35个独立的T0稻转化体。将原代转化体从组织培养箱转移至温室。在定量PCR分析验证T-DNA插入物的拷贝数后,仅保留针对所述选择剂显示抗性的单拷贝转基因植物用于收获T1种子。种子随后在移栽后3至5个月收获。该方法以超过50%的比例产生单基因座转化体(Aldemita和Hodges1996,Chan等1993,Hiei等1994)。
实施例38:表型评价方法
38.1评价建立
产生大约35个独立的T0稻转化体。将原代转化体从组织培养室转移至温室以培育和收获T1种子。留下下述6个事件,其中所述事件的T1子代对所述转基因的存在/不存在以3:1比例分离。对于这些事件中的每一个,通过监测目视标记表达而选出大约10株含有该转基因的T1籽苗(杂合子和纯合子)和大约10株缺少该转基因的T1籽苗(失效合子)。转基因植物和相应的失效合子以随机的位置并排培育。温室条件是短日照(12小时光照),在光照下28℃和在黑暗中22℃,和70%相对湿度。在非胁迫条件下培育的植物以规律的间隔期供应水分,以确保水和养分对于满足植物完全生长和发育的需要不是限制性的。
植物从播种期至成熟期数次通过数字成像室。在每个时间点上,从至少6个不同角度拍摄每株植物的数字图像(2048x1536像素,1600万颜色)。
38.2统计分析:F-检验
使用两因素ANOVA(变量分析)作为整体评价植物表型特征的统计模型。对于用本发明基因转化的全部事件的全部植物的全部所测量参数实施F检验。实施F检验以检查该基因对全部转化事件的影响并验证该基因的整体作用(又称作基因总体作用)。真实基因总体作用显著性的阈值对于所述F检验设置在5%概率水平上。显著性F检验值指出基因作用,这意味不仅仅是基因的存在或位置才造成表型上的差异。
38.3测量的参数
生物量相关的参数测量
植物从播种期至成熟期数次通过数字成像室。在每个时间点上,从至少6个不同角度拍摄每株植物的数字图像(2048x1536像素,1600万颜色)。
植物地上部分面积(或叶生物量)通过计数来自植物地上部分的数字图像上区别于背景的像素总数而确定。该值对相同时间点上从不同角度拍摄的画面进行平均化并且转化成通过校正以平方mm表述的物理表面值。实验证实以这种方式测量的地上部分植物面积与地上植物部分的生物量相关。地上部分面积是植物已经实现其最大叶生物量的时间点上所测量的面积。早期生长势是萌发后3周的植物(籽苗)地上部分的面积。根生物量的增加表述为根总生物量的增加(测量为植物寿命期间观察到的根最大生物量);或表述为根/冠比增加(测量为根和苗的活跃生长期间根质量与苗质量之间的比例)。
种子相关的参数测量
将成熟的原发花序收获、计数、装袋、加条形码标记并且随后在干燥箱内于37°干燥3日。随后将所述花序脱粒,并且收集和计数全部种子。充实粒使用吹气装置与空粒分开。弃去空粒并且再次计数剩余部分。充实粒在分析天平上称重。充实种子数通过计数所述分离步骤后仍留下的充实粒的数目来确定。每株植物的种子总产量通过称量从一株植物收获的全部充实粒而测量。每株植物的种子总数通过计数从一株植物收获的壳数目测量。从计数的充实种子数及其总重量外推出千粒核重(TKW)。收获指数(HI)在本发明中定义为每株植物的种子总产量与地上部分面积(mm2)之间的比率,乘以系数106。如本发明中定义的每花序总花数是种子总数与成熟原发花序之间的比例。如本发明中定义的种子充实率是充实种子数对种子(或小花)总数的比例(表述为%)。
降低的营养(氮)利用率筛选法
源自T2种子的稻植物在盆栽土壤中于正常条件下培育,除了营养溶液之外。从移植至成熟期间用氮(N)浓度降低、通常7至8倍之间降低的特定营养溶液浇灌所述花钵。其余的培育(植物成熟、种子收获)与并不在非生物胁迫下培育的植物相同。如对正常条件下详述那样记录生长和产量参数。
实施例39:转基稻因植物的表型评价的结果
下文呈现了评价转基因稻植物的结果,其中所述的转基因稻植物在用于组成型表达的GOS2启动子控制下表达如SEQ ID NO:180所代表的PHDf-HD多肽的核酸序列。
如表D7中所示,与相应的失效合子(对照)相比,在转基因植物的花序数目、每株植物的种子总产量、充实种子总数、种子总数、千粒核重(TKW)和收获指数方面存在显著提高。
表D7:评价转基因稻植物的结果,其中所述的转基因稻植物在用于组成型表达的GOS2启动子控制下表达编码如SEQ ID NO:180所代表的PHDf-HD多肽的核酸序列。
实施例40:在降低的营养利用率下培育的转基因稻植物的表型评价结果
下文呈现了评价转基因稻植物的结果,其中所述的转基因稻植物在用于组成型表达的GOS2启动子控制下表达编码如SEQ ID NO:180所代表的PHDf-HD多肽的核酸序列并且在降低的营养利用率下培育。
如表D8中所示,与相应的失效合子(对照)相比,在转基因植物的生物量、出苗生长势、每株植物的种子总产量、充实种子总数、种子充实率、种子总数、千粒核重(TKW)和收获指数方面存在显著提高。
表D8:评价转基因稻植物的结果,其中所述的转基因稻植物在用于组成型表达的GOS2启动子控制下表达编码如SEQ ID NO:180所代表的PHDf-HD多肽的核酸序列并且在降低的营养利用率下培育。
实施例41:转化其他作物的例子
如实施例7中所示实施谷物、小麦、大豆、油菜籽/卡诺拉油菜、苜蓿和棉花的转化。
实施例42:非生物胁迫筛选的例子
干旱筛选
来自所选数目事件的植物在盆栽土壤中在正常条件下培育直至它们达到抽穗期。随后将它们转移至其中减少灌溉的“干燥”区域。将湿度探针插入随机选择的花钵内,以监测土壤水分含量(SWC)。当SWC下降低于某个阈值时,自动地对所述植物连续地再灌溉直至再次达到正常水平。随后将植物转移至正常条件。其余的培育(植物成熟、种子收获)与并不在非生物胁迫条件下培育的植物相同。如对正常条件下详述那样记录生长和产量参数。
盐胁迫筛选
植物在由椰子纤维和argex(3:1比率)组成的基质上培育。在温室中移植小植物后,在头两周期间使用正常营养溶液。在这两周后,添加25mM盐(NaCl)至所述营养溶液,直至收获植物。如对正常条件下详述那样记录生长和产量参数。
VIII.bHLH11样(碱性螺旋-环-螺旋11)蛋白
实施例43:鉴定与本发明方法中所用bHLH11样核酸序列相关的序列
用数据库搜索工具如基本局部比对工具(BLAST)(Altschul等人(1990)J.Mol.Biol.215:403-410;和Altschul等人(1997)Nucleic Acids Res.25:3389-3402),在国家生物技术信息中心(NCBI)的Entrez核苷酸数据库中维护的那些序列中鉴定到与本发明方法中所用核酸序列相关的(全长cDNA、EST或基因组)序列。使用该程序通过将核酸序列或多肽序列与序列数据库比较并且计算匹配的统计显著性来找到序列之间的局部相似性区域。由与本发明方法中所用核酸编码的多肽用于TBLASTN算法,采用默认设置和过滤程序以忽略低复杂性序列启动。这种分析的结果通过配对比较进行观察,并根据概率评分(E-值)进行评级,其中所述的评分反映特定比对结果因偶然发生的概率(E-值越低,命中的显著性越高)。除了E-值外,比较过程也可以通过同一性百分数评分。同一性百分数指两个所比较的核酸(或多肽)序列之间特定长度范围内相同的核苷酸(或氨基酸)的数目。在一些情况下,可以调整默认参数以修改搜索的严格性。例如,可以提高E-值以显示更少的严格匹配。以这种方式,可以鉴定几乎完美的短匹配。表E1提供与本发明方法中所用核酸序列相关的核酸序列名单。
表E1:bHLH11样多肽的例子
在一些情况下,相关序列已经由研究机构如基因组研究机构(TIGR)初步地汇编并且公开公开。可以使用真核生物基因直向同源物(EGO)数据库来鉴定此类相关序列,这可通过关键词搜索通过使用BLAST算法以目的核酸或多肽序列进行。
实施例44:bHLH11样多肽序列的比对
多肽序列的比对使用来自Vector NTI(Invitrogen)的Alignment X程序进行,其中所述Alignment X程序基于受欢迎的累进比对Clustal算法(Thompson等人(1997)Nucleic Acids Res 25:4876-4882;Chenna等人(2003),Nucleic Acids Res 31:3497-3500)。空位开口罚分的默认值是10,空位延伸罚分0.1并且所选的权重矩阵是Blosum 62(若比对多肽)。进行少许手工编辑以优化该比对。诸bHLH11样多肽之间的序列保守性基本上在所述多肽的羧基端bHLH结构域内,氨基端结构域通常在序列长度和组成方面更为多变。所述bHLH11样多肽在图21中比对。
使用CLUSTALX构建bHLH11样多肽的进化系统树(图22),并且计算出邻接树。使用Dendroscope(Huson等人2007)绘制该环形进化枝图。
实施例45:在实施本发明方法中有用的多肽序列之间的总体同一性百分数的计算
使用现有技术领域可获得的方法之一,即MatGAT(矩阵总体比对工具)软件(BMC Bioinformatics.20034:29.MatGAT:使用蛋白质序列或DNA序列产生相似性/同一性矩阵的一项应用(an application thatgenerates similarity/identity matrices using protein or DNA sequences),Campanella JJ,Bitincka L,Smalley J;该软件由Ledion Bitincka维护)确定在实施本发明方法中有用的全长多肽序列之间的总体相似性和同一性百分数。MatGAT软件对DNA序列或蛋白质序列产生相似性/同一性矩阵,无需数据的预先比对。该程序使用Myers和Miller总体比对算法(空位开口罚分12和空位延伸罚分2)执行一系列配对比对,使用例如Blosum 62(对于多肽而言)计算相似性和同一性并且随后将结果置于距离矩阵内。在分割线下半部分显示序列相似性,和在对角分割线的上半部分显示序列同一性。
比较中使用的参数是:
评分矩阵:Blosum62
第一空位:12
延伸空位:2
表E2中显示在多肽序列的全长范围内总体相似性和同一性的软件分析结果。在对角线上方给出同一性百分数而在对角线下方给出相似性百分数。SEQ ID NO:245作为TabHLH11表示。
与SEQ ID NO:245相比较,在实施本发明方法中有用的bHLH11样多肽序列之间的百分数同一性可以低至20%氨基酸同一性。但是,当比较HLH结构域时,同一性高得多(表E3)。
实施例46:鉴定在实施本发明方法中有用的多肽序列中所包含的结构域
蛋白质家族、结构域和位点的集成资源(InterPro)数据库是针对基于文本及基于序列的搜索法的常用特征标识数据库的集成界面。InterPro数据库合并了这些数据库,所述数据库使用不同的方法学及不同程度的有关充分表征的蛋白质的生物学信息以获得蛋白质特征标识。合作数据库包括SWISS-PROT、PROSITE、TrEMBL、PRINTS、ProDom和Pfam、Smart和TIGRFAM。Pfam是覆盖许多常见蛋白质结构域和家族的多重序列比对结果和隐匿马尔科夫模型(HMM)的庞大集合。Pfam在英国Sanger研究所服务器上维护。Interpro由英国欧洲生物信息学研究所维护。
在表E4中呈现如SEQ ID NO:245所代表的多肽序列的InterPro扫描结果。
表E4:如SEQ ID NO:245所代表的多肽序列的InterPro扫描结果(主要登录号)
实施例47:在实施本发明方法中有用的多肽序列的拓扑结构预测
TargetP 1.1预测真核生物蛋白的亚细胞定位。基于任何氨基端前序列:叶绿体转运肽(cTP)、线粒体靶向肽(mTP)或分泌途径信号肽(SP)的预测存在性进行定位指派。作为最终预测基础的评分并不真正是概率,并且它们不是必需地加合成一体。但是,根据TargetP,具有最高评分的定位是最可能的,并且评分之间的关系(可靠性级别)可以指示该预测具有多大确定性。可靠性级别(RC)范围从1至5,其中1表示最可靠的预测。TargetP在丹麦技术大学(Technical University of Denmark)的服务器上维护。
对于预测含有氨基端前序列的序列而言,也可以预测潜在的切割位点。
可以选择许多参数,如生物组别(非植物或植物)、临界值集合(无、预定义的临界值集合或用户指定的临界值集合)和切割位点预测的计算(是或否)。
在表E5中呈现如SEQ ID NO:245所代表的多肽序列的TargetP 1.1分析的结果。选择“植物”生物组别,未定义临界值,并且对转运肽的预测长度提出要求。如SEQ ID NO:245所代表的多肽序列的亚细胞定位可以是细胞质或细胞核,没有预测到转运肽。
表E5:如SEQ ID NO:245所代表的多肽序列的TargetP 1.1分析结果
长度(AA) 281
叶绿体转运肽 0.094
线粒体转运肽 0.166
分泌途径信号肽 0.034
其他亚细胞定位 0.855
预测的定位 /
可靠性级别 2
预测的转运肽长度 /
当用PLOC(Park和Kanehisa,Bioinformatics,19,1656-1663,2003)或用PSORT(URL:psort.org)分析时,预测该蛋白质具有核定位信号。
许多其他算法可以用来进行此类分析,包括:
·在丹麦技术大学服务器上维护的ChloroP 1.1;
·在澳大利亚布里斯班昆士兰大学生物科学研究所的服务器上维护的Protein Prowler亚细胞定位预测者1.2版;
·在加拿大阿伯特省埃德蒙顿市阿尔伯塔大学的服务器上维护的PENCE蛋白组分析专家PA-GOSUB 2.5;
·在丹麦技术大学服务器上维护的TMHMM。
实施例48:bHLH11样多肽的功能测定法
在Dombrecht等人(2007)中提供AtbHLH6的DNA结合测定法,该方法可以用于任意bHLH11样蛋白。简而言之,从基因组DNA扩增出包括密码子285至623的AtbHLH6编码序列的1000-bp片段并克隆到经NheI-BamHI消化的pTacLCELD6·His载体(Xue,Plant J.41,638-649,2005)。所得构建体编码AtbHLH6的最后338个氨基酸(包括bHLH区),与报道蛋白CelD和6xHis标签的可读框符合。通过DNA测序验证正确的扩增和克隆。
根据Xue(2005)确定MYC2DNA结合基序的共有序列和这些位点的相对结合亲和力,其中DNA-结合蛋白(DBP)与6·His标记的纤维素酶D(CELD)的融合物充当用于从生物素化的随机序列寡核苷酸汇集物中选择结合位点时亲和纯化DBP-DNA复合物的工具并充当用于测量DNA-结合活性的报道分子。
为了使用纤维素纸作为亲和基质选择结合位点,将DBP-CELD与40μl含有1mM EDTA,0.25μg/μl聚d(AC-TG)、1mg/ml BSA和10%甘油的(上述)结合/洗涤缓冲液中的20ng生物素标记的Bio-RS-Oligo在室温孵育1小时。适宜量的用于结合位点选择的粗制DBP-CELD是实现20–30%相对纤维素结合效率(洗涤后结合于纤维素的纤维素活性百分数)的DBP-CELD。将DBP-CELD/Bio-RS-Oligo混合物转移至含有Whatman 1滤纸(4mm2)的96孔微量滴定平板孔内,其中所述的滤纸用10μl封闭溶液[含有0.5μg/μl聚d(AC-TG)和10%甘油的结合/洗涤缓冲液]预先浸透。在0℃孵育1小时同时轻柔振摇温育后,该纤维素纸用含有1mM EDTA和0.1mg/ml BSA的结合/洗涤缓冲液洗涤6次。彻底洗涤在靶位点选择中的使用基于观察到在固体基质上固定的DBP-寡核苷酸复合物的稳定性相当高。携带靶结合位点的DBP-CELD在40℃用40μl纤维素酶洗脱缓冲液[10mM HEPES,pH7,50mM KCl,0.2mM EDTA,4mM纤维二糖,0.05mg/ml BSA和10μg/ml有义序列-特异性引物SP-S]洗脱15分钟。洗脱物用于所选择寡核苷酸的PCR扩增。未经纯化的PCR产物(0.1μl)用于下一轮位点选择。
备选地,6·His标记的DBP-CELD(10-25μg粗制蛋白)在室温于含有10mM咪唑和350μg Ni-NTA磁性琼脂糖珠(Qiagen)的60μl PNT缓冲液(50mM磷酸钠,pH8.0,300mM NaCl和0.05%吐温20)中孵育45-60分钟,同时在微量管混和仪(日本东京Tomy Seiko Co.)中轻柔振荡。通过将所述管置于12管磁体(Qiagen)中,在管的侧边收集所述Ni-NTA磁珠。未结合的蛋白质通过用含有20mM咪唑的150-200μl PNT洗涤3次并用含有2mM MgCl2、1mg/ml BSA和10%甘油的60μl结合/洗涤缓冲液洗涤1次除去。洗过的珠子悬浮在含有2mM MgCl2,0.25μg/μl聚d(AC-TG),1mg/ml BSA,0.0025%Nonidet P-40,10%甘油和生物素标记的寡核苷酸(50ng Bio-RS-Oligo或从先前选择的寡核苷酸中扩增的1μl PCR产物)的40μl结合/洗涤缓冲液中。悬浮液在室温孵育1.5小时,同时在微量管混和仪中轻柔振荡。用含有2mMMgCl2、0.1mg/ml BSA和0.0025%Nonidet P-40的150-200μl结合/洗涤缓冲液洗涤4次(每次洗涤3-4分钟)后,携带靶位点结合的BDP-CELD的珠子重悬于8μl含有5μg/ml有义序列特异性引物(SP-S)的5mM Tris-Cl(pH8.0)/0.5mM EDTA中,并且悬浮液转移至一只清洁管内并用于所选择寡核苷酸的PCR扩增。未经纯化的PCR产物(1μl)用于下一轮位点选择。
对于EMSA测定法,利用高严格结合缓冲液(50mM磷酸钠,pH8.0,1MNaCl,10%甘油,1%吐温20和10mM咪唑),使用Ni-NTA磁性琼脂糖珠纯化6·His标记的DBP-CELD蛋白,并且该方法的其余部分按照制造商的说明书进行。在3’末端以洋地黄毒甙标记的双链合成性寡核苷酸(30-45fmol)与纯化的DBP(30-75ng)在15μl结合缓冲液[25mM HEPES/KOH,pH 7.0,50mM KCl,0.5mM DTT,2mM MgCl2,0.2μg/μl聚d(AC-TG),0.3mg/mlBSA和10%甘油]中孵育。在室温孵育30分钟后,DBP/DNA复合物在含有5mM乙酸钠,0.5mM EDTA和5%甘油的40-mM Tris乙酸盐缓冲液(pH 7.5)中的6%聚丙烯酰胺凝胶上与游离探针分开。电泳后,将凝胶中的DBP/DNA复合物和游离探针转移至Hybond Np膜。碱性磷酸酶缀和的抗洋地黄毒甙抗体和化学发光底物CDP-Star(Roche Diagnostics)用于根据制造商的说明书检测洋地黄毒甙。
其他细节在Xue(2005)中提供。
实施例49:在本发明方法中所用的核酸序列的克隆
本发明方法中所用并且包含SEQ ID NO:244的核酸序列通过PCR,使用定制的普通小麦幼苗cDNA文库(在MV Sport 6.0内;Invitrogen,Paisley,UK)作为模板进行扩增。使用Hifi Taq DNA聚合酶,在标准条件下利用在50μl PCR混合物中的200ng模板进行PCR。所用的引物是prm009718(SEQ ID NO:254;有义,起始密码子为粗体字):
5’-ggggacaagtttgtacaaaaaagcaggcttaaacaatggcggggcanccg-3’
和prm009719(SEQ ID NO:255;反义,互补):
5’-ggggaccactttgtacaagaaagctgggtatgggtgttgcagctgctgtt-3’,
其中所述引物包括用于Gateway重组的AttB位点。也使用标准方法纯化扩增的PCR片段。随后进行Gateway方法的第一步骤,即BP反应,在此期间根据Gateway术语学,所述PCR片段与pDONR201质粒在体内重组以产生“进入克隆”pbHLH11样。质粒pDONR201作为技术的部分从Invitrogen购买。
包含SEQ ID NO:244的进入克隆随后在LR反应中与用于稻转化法的目的载体一起使用。这种载体含有在T-DNA边界内部的植物选择标记、筛选标记表达盒和意图与已经克隆在该进入克隆中的目的核酸序列发生LR体内重组的Gateway盒作为功能性元件。用于组成型表达的稻GOS2启动子(SEQ ID NO:256)位于该Gateway盒上游。
在所述LR重组步骤后,所得表达载体pGOS2::bHLH11样(图23)根据本领域熟知的方法转化入农杆菌菌株LBA4044。
实施例50:植物转化
植物的转化根据实施例7中概述的方法实施。
实施例51:表型评价方法
51.1评价建立
产生大约35个独立的T0稻转化体。将原代转化体从组织培养室转移至温室以培育和收获T1种子。留下下述6个事件,其中所述事件的T1子代对所述转基因的存在/不存在以3:1比例分离。对于这些事件中的每一个,通过监测目视标记表达而选出大约10株含有该转基因的T1籽苗(杂合子和纯合子)和大约10株缺少该转基因的T1籽苗(失效合子)。转基因植物和相应的失效合子以随机的位置并排培育。温室条件是短日照(12小时光照),在光照下28℃和在黑暗中22℃,和70%相对湿度。在非胁迫条件下培育的植物以规律的间隔期浇水,以确保水和养分对于满足植物完全生长和发育的需要不是限制性的。
植物从播种期至成熟期数次通过数字成像室。在每个时间点上,从至少6个不同角度拍摄每株植物的数字图像(2048x1536像素,1600万颜色)。
干旱筛选
来自T2种子的植物在盆栽土壤中在正常条件下培育直至它们达到抽穗期。随后将它们转移至其中减少灌溉的“干燥”区域。将湿度探针插入随机选择的花钵内,以监测土壤水分含量(SWC)。当SWC下降低于某个阈值时,自动地对所述植物连续地再灌溉直至再次达到正常水平。随后将植物再次转移至正常条件。其余的培育(植物成熟、种子收获)与并不在非生物胁迫条件下培育的植物相同。如对正常条件下详述那样记录生长和产量参数。
氮使用效率筛选
源自T2种子的稻植物在盆栽土壤中于正常条件下培育,除了营养溶液之外。从移植至成熟期间用氮(N)浓度降低、通常7至8倍之间降低的特定营养溶液浇灌所述花钵。其余的培育(植物成熟、种子收获)与并不在非生物胁迫下培育的植物相同。如对正常条件下详述那样记录生长和产量参数。
盐胁迫筛选
植物在由椰子纤维和argex(3:1比率)组成的基质上培育。在温室中移植小植物后,在头两周期间使用正常营养溶液。在这两周后,添加25mM盐(NaCl)至所述营养溶液,直至收获植物。随后测量种子相关参数。
51.2统计分析:F-检验
使用两因素ANOVA(变量分析)作为整体评价植物表型特征的统计模型。对于用本发明基因转化的全部事件的全部植物的全部所测量参数实施F检验。实施F检验以检查该基因对全部转化事件的影响并验证该基因的整体作用(又称作基因总体作用)。真实基因总体作用显著性的阈值对于所述F检验设置在5%概率水平上。显著性F检验值指出基因作用,这意味不仅仅是基因的存在或位置才造成表型上的差异。
51.3测量的参数
生物量相关的参数测量
植物从播种期至成熟期数次通过数字成像室。在每个时间点上,从至少6个不同角度拍摄每株植物的数字图像(2048x1536像素,1600万颜色)。
植物地上部分面积(或叶生物量)通过计数来自植物地上部分的数字图像上区别于背景的像素总数而确定。该值对相同时间点上从不同角度拍摄的画面进行平均化并且转化成通过校正以平方mm表述的物理表面值。实验证实以这种方式测量的地上部分植物面积与地上植物部分的生物量相关。地上部分面积是植物已经实现其最大叶生物量的时间点上所测量的面积。早期生长势是萌发后3周的植物(籽苗)地上部分的面积。根生物量的增加表述为根总生物量的增加(测量为植物寿命期间观察到的根最大生物量);或表述为根/冠比增加(测量为根和苗的活跃生长期间根质量与苗质量之间的比例)。
早期生长势通过计数来自植物部分的区别于背景的像素总数确定。该值对相同时间点上从不同角度拍摄的画面进行平均化并且转化成通过校正以平方mm表述的物理表面值。下述结果针对萌发后3周的植物。
种子相关的参数测量
将成熟的原发花序收获、计数、装袋、加条形码标记并且随后在干燥箱内于37°干燥3日。随后将所述花序脱粒,并且收集和计数全部种子。充实粒使用吹气装置与空粒分开。弃去空粒并且再次计数剩余部分。充实粒在分析天平上称重。充实种子数通过计数所述分离步骤后仍留下的充实粒的数目来确定。种子总产量通过称量从一株植物收获的全部充实粒而测量。每株植物的种子总数通过计数从一株植物收获的壳数目测量。从计数的充实种子数及其总重量外推出千粒核重(TKW)。收获指数(HI)在本发明中定义为种子总产量与地上部分面积(mm2)之间的比率,乘以系数106。如本发明中定义的每花序总花数是种子总数与成熟原发花序之间的比例。如本发明中定义的种子充实率是充实种子数对种子(或小花)总数的比例(表述为%)。
实施例52:转基因植物的表型评价结果
下文呈现了评价在非胁迫条件下表达bHLH11样多肽的转基因稻植物的结果。在至少2个品系中观察到总种子产量、充实种子数、充实率、收获指数、原发花序数目提高大于5%并且千粒核重提高至少3%。在表E6中呈现关于每个参数的总体提高(在全部测试品系范围内测量)的数据。
表E6:
参数 总体提高(%)
种子总重量(种子总产量) 20
充实种子数 20
充实率 18
收获指数 21
VI.ASR(脱落酸、胁迫和成熟诱导的)蛋白
实施例53:鉴定与本发明方法中所用ASR核酸序列相关的序列
用数据库搜索工具如基本局部比对工具(BLAST)(Altschul等人(1990)J.Mol.Biol.215:403-410;和Altschul等人(1997)Nucleic Acids Res.25:3389-3402),在国家生物技术信息中心(NCBI)的Entrez核苷酸数据库中维护的那些序列中鉴定到与本发明方法中所用核酸序列相关的(全长cDNA、EST或基因组)序列。使用该程序通过将核酸序列或多肽序列与序列数据库比较并且计算匹配的统计显著性来找到序列之间的局部相似性区域。由与本发明方法中所用核酸编码的多肽用于TBLASTN算法,采用默认设置和过滤程序以忽略低复杂性序列启动。这种分析的结果通过配对比较进行观察,并根据概率评分(E-值)进行评级,其中所述的评分反映特定比对结果因偶然发生的概率(E-值越低,命中的显著性越高)。除了E-值外,比较过程也可以通过同一性百分数评分。同一性百分数指两个所比较的核酸(或多肽)序列之间特定长度范围内相同的核苷酸(或氨基酸)的数目。
表F1提供与本发明方法中所用核酸序列相关的核酸序列和多肽序列名单。
表F1:ASR核酸和多肽的例子
实施例54:ASR多肽序列的比对
多肽序列的比对使用来自Vector NTI软件包(Invitrogen)的AlignmentX程序进行,其中所述Alignment X程序基于受欢迎的累进比对Clustal算法(Thompson等人(1997)Nucleic Acids Res 25:4876-4882;Chenna等人(2003),Nucleic Acids Res 31:3497-3500)。空位开口罚分的默认值是10,空位延伸罚分0.1并且所选的权重矩阵是Blosum 62(若比对多肽)。可以进行少许手工编辑以优化该比对。
使用如载体NTI(Invitrogen)的AlignX程序中所提供的邻接法聚类算法构建GRP多肽的进化系统树。
实施例55:在实施本发明方法中有用的ASR多肽序列之间的总体同一性百分数的计算
使用现有技术领域可获得的方法之一,即MatGAT(矩阵总体比对工具)软件(BMC Bioinformatics.20034:29.MatGAT:使用蛋白质序列或DNA序列产生相似性/同一性矩阵的一项应用(an application thatgenerates similarity/identity matrices using protein or DNA sequences),Campanella JJ,Bitincka L,Smalley J;该软件由Ledion Bitincka维护)确定在实施本发明方法中有用的全长多肽序列之间的总体相似性和同一性百分数。MatGAT软件对DNA序列或蛋白质序列产生相似性/同一性矩阵,无需数据的预先比对。该程序使用Myers和Miller总体比对算法(空位开口罚分12和空位延伸罚分2)执行一系列配对比对,使用例如Blosum 62(对于多肽而言)计算相似性和同一性并且随后将结果置于距离矩阵内。在分割线下半部分显示序列相似性,和在对角分割线的上半部分显示序列同一性。
比较中使用的参数是:
评分矩阵:Blosum62
第一空位:12
延伸空位:2
也可以产生特定结构域的局部比对结果的MATGAT表或关于特定结构域之间的同一性/相似性%。
实施例56:鉴定在实施本发明方法中有用的ASR多肽序列中所包含的结构域
蛋白质家族、结构域和位点的集成资源(InterPro)数据库是针对基于文本及基于序列的搜索法的常用特征标识数据库的集成界面。InterPro数据库合并了这些数据库,所述数据库使用不同的方法学及不同程度的有关充分表征的蛋白质的生物学信息以获得蛋白质特征标识。合作数据库包括SWISS-PROT、PROSITE、TrEMBL、PRINTS、ProDom和Pfam、Smart和TIGRFAM。Pfam是覆盖许多常见蛋白质结构域和家族的多重序列比对结果和隐匿马尔科夫模型(HMM)的庞大集合。Pfam在英国Sanger研究所服务器上维护。Interpro由英国欧洲生物信息学研究所维护。
代表GRP的蛋白质序列用作搜索InterPro数据库的查询项。
实施例57:在实施本发明方法中有用的ASR多肽序列的拓扑结构预测
TargetP 1.1预测真核生物蛋白的亚细胞定位。基于任何氨基端前序列:叶绿体转运肽(cTP)、线粒体靶向肽(mTP)或分泌途径信号肽(SP)的预测存在性进行定位指派。作为最终预测基础的评分并不真正是概率,并且它们不是必需地加合成一体。但是,根据TargetP,具有最高评分的定位是最可能的,并且评分之间的关系(可靠性级别)可以指示该预测具有多大确定性。可靠性级别(RC)范围从1至5,其中1表示最可靠的预测。TargetP由丹麦技术大学维护。
对于预测含有氨基端前序列的序列而言,也可以预测潜在的切割位点。
可以选择许多参数,如生物组别(非植物或植物)、临界值集合(无、预定义的临界值集合或用户指定的临界值集合)和切割位点预测的计算(是或否)。
代表GRP的蛋白质序列用来查询TargetP 1.1。已经选择了“植物”生物组别,未定义临界值,并且对转运肽的预测长度提出要求。
许多其他算法可以用来进行此类分析,包括:
·在丹麦技术大学服务器上维护的ChloroP 1.1;
·在澳大利亚布里斯班昆士兰大学生物科学研究所的服务器上维护的Protein Prowler亚细胞定位预测者1.2版;
·在加拿大阿伯特省埃德蒙顿市阿尔伯塔大学的服务器上维护的PENCE蛋白组分析专家PA-GOSUB 2.5;
·在丹麦技术大学服务器上维护的TMHMM。
实施例58:在本发明方法中所用的ASR核酸序列的克隆
SEQ ID NO:396的克隆:
本发明方法中所用的核酸序列SEQ ID NO:396通过PCR,使用定制的稻幼苗cDNA文库(在MV Sport 6.0内;Invitrogen,Paisley,UK)作为模板进行扩增。使用Hifi Taq DNA聚合酶,在标准条件下利用在50μl PCR混合物中的200ng模板进行PCR。所用的引物是prm06442(SEQ IDNO:399;有义,起始密码子为粗体字):
5’-ggggacaagtttgtacaaaaaagcaggcttaaacaatggcggaggagaagca-3’
和prm06443(SEQ ID NO:400;反义,互补):
5’-ggggaccactttgtacaagaaagctgggtcggcgacgttgtgatga-3’,
其中所述引物包括用于Gateway重组的AttB位点。也使用标准方法纯化扩增的PCR片段。随后进行Gateway方法的第一步骤,即BP反应,在此期间根据Gateway术语学,所述PCR片段与pDONR201质粒在体内重组以产生“进入克隆”。质粒pDONR201作为技术的部分从Invitrogen购买。
包含SEQ ID NO:396的进入克隆随后在LR反应中与用于稻转化法的目的载体一起使用。这种载体含有在T-DNA边界内部的植物选择标记、筛选标记表达盒和意图与已经克隆在该进入克隆中的目的核酸序列发生LR体内重组的Gateway盒作为功能性元件。用于种子特异性表达的稻GOS2启动子(SEQ ID NO:398)位于该Gateway盒上游。
在所述LR重组步骤后,所得表达载体pGOS2::GRP(图25)根据本领域熟知的方法转化入农杆菌菌株LBA4044。
实施例59:植物转化
植物的转化根据实施例7中概述的方法实施。
实施例60:表型评价方法
60.1评价建立
产生大约35个独立的T0稻转化体。将原代转化体从组织培养室转移至温室以培育和收获T1种子。留下下述6个事件,其中所述事件的T1子代对所述转基因的存在/不存在以3:1比例分离。对于这些事件中的每一个,通过监测目视标记表达而选出大约10株含有该转基因的T1籽苗(杂合子和纯合子)和大约10株缺少该转基因的T1籽苗(失效合子)。转基因植物和相应的失效合子以随机的位置并排培育。温室条件是短日照(12小时光照),在光照下28℃和在黑暗中22℃,和70%相对湿度。
4个T1事件在T2世代中按照如对T1世代相同的评价方法进一步评估,不过每个事件采用更多个体。
植物从播种期至成熟期数次通过数字成像室。在每个时间点上,从至少6个不同角度拍摄每株植物的数字图像(2048x1536像素,1600万颜色)。
干旱筛选
来自T2种子的植物在盆栽土壤中在正常条件下培育直至它们达到抽穗期。随后将它们转移至其中减少灌溉的“干燥”区域。将湿度探针插入随机选择的花钵内,以监测土壤水分含量(SWC)。当SWC下降低于某个阈值时,自动地对所述植物连续地再灌溉直至再次达到正常水平。随后将植物再次转移至正常条件。其余的培育(植物成熟、种子收获)与并不在非生物胁迫条件下培育的植物相同。如对正常条件下详述那样记录生长和产量参数。在非胁迫条件下培育的植物以规律的间隔期供应水分,以确保水和养分对于满足植物完全生长和发育的需要不是限制性的。
氮使用效率筛选
源自T2种子的稻植物在盆栽土壤中于正常条件下培育,除了营养溶液之外。从移植至成熟期间用氮(N)浓度降低、通常7至8倍之间降低的特定营养溶液浇灌所述花钵。其余的培育(植物成熟、种子收获)与并不在非生物胁迫下培育的植物相同。如对正常条件下详述那样记录生长和产量参数。
60.2统计分析:F-检验
使用两因素ANOVA(变量分析)作为整体评价植物表型特征的统计模型。对于用本发明基因转化的全部事件的全部植物的全部所测量参数实施F检验。实施F检验以检查该基因对全部转化事件的影响并验证该基因的整体作用(又称作基因总体作用)。真实基因总体作用显著性的阈值对于所述F检验设置在5%概率水平上。显著性F检验值指出基因作用,这意味不仅仅是基因的存在或位置才造成表型上的差异。
因为实施了具有重叠事件的两个实验,故而进行联合分析。这用于检验对这两个实验影响的一致性,并且若是一致的,则用于积累来自两个实验的证据以提高结论的可信度。所用方法是考虑数据的多重水平结构的混合模型法(即实验-事件-分离子)。通过比较针对卡方分布的似然比检验而获得P-值。
60.3测量的参数
生物量相关的参数测量
植物地上部分面积(或叶生物量)通过计数来自植物地上部分的数字图像上区别于背景的像素总数而确定。该值对相同时间点上从不同角度拍摄的画面进行平均化并且转化成通过校正以平方mm表述的物理表面值。实验证实以这种方式测量的地上部分植物面积与地上植物部分的生物量相关。地上部分面积是植物已经实现其最大叶生物量的时间点上所测量的面积。
种子相关的参数测量
将成熟的原发花序收获、计数、装袋、加条形码标记并且随后在干燥箱内于37°干燥3日。随后将所述花序脱粒,并且收集和计数全部种子。充实粒使用吹气装置与空粒分开。弃去空粒并且再次计数剩余部分。充实粒在分析天平上称重。充实种子数通过计数所述分离步骤后仍留下的充实粒的数目来确定。种子总产量通过称量从一株植物收获的全部充实粒而测量。每株植物的种子总数通过计数从一株植物收获的壳数目测量。从计数的充实种子数及其总重量外推出千粒核重(TKW)。收获指数(HI)在本发明中定义为种子总产量与地上部分面积(mm2)之间的比率,乘以系数106。如本发明中定义的每花序总花数是种子总数与成熟原发花序之间的比例。如本发明中定义的种子充实率是充实种子数对种子(或小花)总数的比例(表述为%)。
实施例61:转基因植物的表型评价结果
在非胁迫条件下培育时,在GOS2启动子控制下表达由SEQ ID NO:396代表的GRP核酸的转基因稻植物显示种子总重量、充实种子数和收获指数提高大于5%。
VII.鳞部启动子结合蛋白样11(SPL11)
实施例62:鉴定与本发明方法中所用SPL 11核酸序列相关的序列
在国家生物技术信息中心(NCBI)的Entrez核苷酸数据库中维护的那些序列中鉴定到与本发明方法中所用核酸序列相关的(全长cDNA、EST或基因组)序列。也在其他公共和专利数据库中实施所述序列搜索。使用序列搜索工具,如基本局部比对工具(BLAST)(Altschul等人(1990)J.Mol.Biol.215:403-410;以及Altschul等人(1997)Nucleic Acids Res.25:3389-3402)。使用该程序通过将核酸序列或多肽序列与序列数据库比较并且计算匹配的统计显著性来找到序列之间的局部相似性区域。由与本发明方法中所用核酸编码的多肽用于TBLASTN算法,采用默认设置和过滤程序以忽略低复杂性序列启动。这种分析的结果通过配对比较进行观察,并根据概率评分(E-值)进行评级,其中所述的评分反映特定比对结果因偶然发生的概率(E-值越低,命中的显著性越高)。除了E-值外,比较过程也可以通过同一性百分数评分。同一性百分数指两个所比较的核酸(或多肽)序列之间特定长度范围内相同的核苷酸(或氨基酸)的数目。在一些情况下,可以调整默认参数以修改搜索的严格性。例如,可以提高E-值以显示更少的严格匹配。以这种方式,可以鉴定几乎完美的短匹配。
表G1提供与本发明方法中所用核酸序列相关的核酸序列名单。带有一个小点和一位数字扩展名的登录号的多肽代表剪接变体。
表G1:SPL11核酸和多肽的例子
实施例63:SPL11多肽序列的比对
多肽序列的比对使用来自Vector NTI(Invitrogen)的Alignment X程序进行,其中所述Alignment X程序基于受欢迎的累进比对Clustal算法(Thompson等人(1997)Nucleic Acids Res 25:4876-4882;Chenna等人(2003),Nucleic Acids Res 31:3497-3500)。空位开口罚分的默认值是10,空位延伸罚分0.1并且所选的权重矩阵是Blosum 62(若比对多肽)。进行少许手工编辑以优化该比对。给出了在每一位置内包含高度保守的氨基酸的共有序列;该共有序列中给定氨基酸之间的空白代表任意氨基酸。在SPL11多肽之间大多沿所述多肽的SBP结构域观察到高度序列保守性。在共有序列列范围内指出了由基序1至基序4(SEQ ID NO:466至SEQ ID NO:472)所代表的本文中SBP结构域之外的其他保守序列基序的位置。
图28提供代表性SPL11多肽的比对结果。
实施例64:在实施本发明方法中有用的SPL11多肽序列之间的总体同一性百分数的计算
使用现有技术领域可获得的方法之一,即MatGAT(矩阵总体比对工具)软件(BMC Bioinformatics.20034:29.MatGAT:使用蛋白质序列或DNA序列产生相似性/同一性矩阵的一项应用(an application thatgenerates similarity/identity matrices using protein or DNA sequences),Campanella JJ,Bitincka L,Smalley J;该软件由Ledion Bitincka维护)确定在实施本发明方法中有用的全长多肽序列之间的总体相似性和同一性百分数。MatGAT软件对DNA序列或蛋白质序列产生相似性/同一性矩阵,无需数据的预先比对。该程序使用Myers和Miller总体比对算法(空位开口罚分12和空位延伸罚分2)执行一系列配对比对,使用例如Blosum 62(对于多肽而言)计算相似性和同一性并且随后将结果置于距离矩阵内。在分割线下半部分显示序列相似性,和在对角分割线的上半部分显示序列同一性。
比较中使用的参数是:
评分矩阵:Blosum62
第一空位:12
延伸空位:2
表G2中显示在所述多肽序列的全长范围内总体相似性和同一性的软件分析结果并且表G3中显示SBP结构域内的相似性。在对角线上方以粗体给出同一性百分数而在对角线下方(正常字体)给出相似性百分数。
与SEQ ID NO:428相比较,在实施本发明方法中有用的SPL11多肽序列之间的百分数同一性可以低至20%氨基酸同一性。一般,SPL11多肽具有在40%范围的整体(沿着完整的多肽序列)序列同一性。
与SEQ ID NO:456(Arath_SPL11a或SEQ ID NO:428中所包含的SBP结构域)相比较,在实施本发明方法中有用的SPL11多肽序列中的SBP结构域之间的百分数同一性可以低至30%氨基酸同一性。在表G1中所给出SPL11多肽中包含的SBP结构域具有31%至93.6%范围的序列同一性。
表G2:在多肽序列的全长范围内总体相似性和同一性的MatGAT结果
序列名称 1 2 3 4 5 6 7 8 9 10 11 12 13
1.Arath_SPL11a 75.3 37.2 31.2 30.9 38.4 34.3 29.9 31 27.5 30.7 31.4 31.5
2.Arath_SPL11b 82.3 36.6 33.2 32.1 37.9 36.4 29.7 31.3 29.5 30.7 31.2 33.2
3.Arath_SPL11c 52.5 52 33.6 34.9 40.4 38.6 33.7 48.5 32.9 31.8 32.4 34.4
4.Orysa_SPL11a 46.5 44.6 46.7 54.3 36.6 38.9 38.1 25.6 46.9 49.2 66.2 34.5
5.Orysa_SPL11b 43.8 43.4 47.8 68.2 35.4 36.7 38.4 25.2 44.3 55.1 55.2 32.6
6.Popth_SPL11a 54.5 52 54.7 49 49.1 66.5 35.4 36.4 30 32.3 35.4 44.1
7.Popth_SPL11b 46.7 48.6 52.3 55.9 53.9 71.2 37.7 32.7 30.7 34.7 37 42.5
8.Popth_SPL11c 44.7 44.7 50.4 55.9 55.6 48.9 55.7 25.8 33.3 34.2 35.7 37.6
9.Brara_SPL11a 41.7 42.4 55.6 34.1 34.3 46.6 40 35.2 22.2 24.1 24.8 29.4
10.Zeama_SPL11a 42.1 42.5 44.6 61.4 58.3 42.7 45.9 51 31.5 41.6 49.4 28.6
11.Zeama_SPL11b 44.2 44.4 46.7 60.6 66.7 47.6 50.5 50.4 35.1 53.1 49.5 32.1
12.Triae_SPL11a 44 44 46.3 77 69.5 48 52 53.9 33.2 62.2 61.1 32.8
13.Vitvi_SPL11a 44.6 43.5 47.2 50.2 50.4 53.8 55.8 55.8 36.7 46.4 46.4 50.2
表G3:在多肽序列的SBP结构域范围内相似性和同一性的MatGAT结果
序列名称 1 2 3 4 5 6 7 8 9 10 11 12
1.Arath_SPL11a 93.7 77.2 73.4 75.9 58.3 62.2 49.5 46.6 73.4 73.4 68.2
2.Arath_SPL11b 96.2 79.7 73.4 73.4 59.3 63.3 49.5 48.9 75.9 77.2 71.8
3.Arath_SPL11c 86.1 88.6 81 77.2 63 66.3 54.2 59.1 81 78.5 74.1
4.Orysa_SPL11a 84.8 86.1 89.9 84.8 61.5 66.3 53.3 50 88.6 83.5 80
5.Orysa_SPL11b 88.6 91.1 91.1 91.1 59.3 64.3 50.5 47.7 87.3 83.5 78.8
6.Popth_SPL11a 64.8 67.6 68.5 65.7 66.7 60.6 52 45.4 62.4 57.4 60.2
7.Popth_SPL11b 69.4 72.4 72.4 70.4 72.4 71.3 45.2 41.3 66.3 62.2 61.5
8.Popth_SPL11c 63.3 64.3 65.3 64.3 66.3 66.7 65.3 31 53.3 50.5 56.1
9.Brara_SPL11a 62 64.6 68.4 63.3 64.6 56.5 55.1 43.9 51.1 51.2 46.8
10.Zeama_SPL11a 86.1 88.6 91.1 93.7 96.2 66.7 70.4 67.3 63.3 88.6 84.7
11.Zeama_SPL11b 88.6 91.1 89.9 88.6 93.7 63.9 69.4 64.3 64.6 92.4 90.6
12.Triae_SPL11a 82.4 84.7 84.7 84.7 88.2 67.6 72.4 71.4 60 88.2 90.6
13.Vitvi_SPL11a 90.1 93.8 90.1 87.7 90.1 70.4 75.5 67.3 64.2 88.9 87.7 87.1
实施例65:鉴定在实施本发明方法中有用的多肽序列中所包含的结构域
蛋白质家族、结构域和位点的集成资源(InterPro)数据库是针对基于文本及基于序列的搜索法的常用特征标识数据库的集成界面。InterPro数据库合并了这些数据库,所述数据库使用不同的方法学及不同程度的有关充分表征的蛋白质的生物学信息以获得蛋白质特征标识。合作数据库包括SWISS-PROT、PROSITE、TrEMBL、PRINTS、ProDom和Pfam、Smart和TIGRFAM。Pfam是覆盖许多常见蛋白质结构域和家族的多重序列比对结果和隐匿马尔科夫模型(HMM)的庞大集合。Pfam在英国Sanger研究所服务器上维护。Interpro由英国欧洲生物信息学研究所维护。
表G4显示如Pfam数据库中所述的设置(收集临界值、受信任临界值和噪音临界值),所述设置用来建立SBP不同结构域的HMMs_fs。
表G4:结构域数据库Pfam版本21.0中的HMMs_建立信息
在表G5中呈现植物来源的代表性SPL11多肽的Pfam扫描的结果。参考序列中SBP结构域的氨基酸坐标在对应的列中显示。还给出了比对结果的E-值。
表G5:如在Pfam版本21.0上进行的代表性SPL11多肽的SBP结构域(Pfam参考PF03110)的Pfam扫描结果。
实施例66:在本发明方法中所用的核酸序列的克隆
本发明方法中所用的核酸序列通过PCR,使用定制的拟南芥幼苗cDNA文库(在MV Sport 6.0内;Invitrogen,Paisley,UK)作为模板进行扩增。使用Hifi Taq DNA聚合酶,在标准条件下利用在50μl PCR混合物中的200ng模板进行PCR。使用如SEQ ID NO:473和SEQ ID NO:474分别所代表的上游引物和下游引物来通过PCR(聚合酶链反应)扩增如SEQID NO:427所代表的SPL11核酸的编码区。所述引物包括用于Gateway重组的AttB位点以促进扩增的PCR DNA片段克隆到Gateway克隆载体中。
也使用标准方法纯化扩增的PCR片段。随后进行Gateway方法的第一步骤,即BP反应,在此期间根据Gateway术语学,所述PCR片段与pDONR201质粒在体内重组以产生“进入克隆”pSPL11。质粒pDONR201作为技术的部分从Invitrogen购买。
包含SEQ ID NO:427的进入克隆随后在LR反应中与用于稻转化法的目的载体一起使用。这种载体含有在T-DNA边界内部的植物选择标记、筛选标记表达盒和意图与已经克隆在该进入克隆中的目的核酸序列发生LR体内重组的Gateway盒作为功能性元件。用于组成型表达的稻GOS2启动子(SEQ ID NO:476)位于载体pGOS2::SPL11中该Gateway盒上游。SPL11编码序列也克隆在包含用于种子特异性表达(ABA诱导型)的稻WSI18启动子(SEQ ID NO:477)的表达载体(pWSI18::SPL11)中。
在所述LR重组步骤后,所得表达载体pGOS2::SPL11和pWSI18::SPL11(图31)根据本领域熟知的方法转化入农杆菌菌株LBA4044。
实施例67:植物转化
植物的转化根据实施例7中概述的方法实施。
实施例68:表型评价方法
68.1评价建立
产生大约35个独立的T0稻转化体。将原代转化体从组织培养室转移至温室以培育和收获T1种子。留下下述6个事件,其中所述事件的T1子代对所述转基因的存在/不存在以3:1比例分离。对于这些事件中的每一个,通过监测目视标记表达而选出大约10株含有该转基因的T1籽苗(杂合子和纯合子)和大约10株缺少该转基因的T1籽苗(失效合子)。转基因植物和相应的失效合子以随机的位置并排培育。温室条件是短日照(12小时光照),在光照下28℃和在黑暗中22℃,和70%相对湿度。在非胁迫条件下培育的植物以规律的间隔期供应水分,以确保水和养分对于满足植物完全生长和发育的需要不是限制性的。
4个T1事件在T2世代中按照如对T1世代相同的评价方法进一步评估,不过每个事件采用更多个体。植物从播种期至成熟期数次通过数字成像室。在每个时间,从至少6个不同角度拍摄每株植物的数字图像(2048x1536像素,1600万颜色)。
干旱筛选
来自T2种子的植物在盆栽土壤中在正常条件下培育直至它们达到抽穗期。随后将它们转移至其中减少灌溉的“干燥”区域。将湿度探针插入随机选择的花钵内,以监测土壤水分含量(SWC)。当SWC下降低于某个阈值时,自动地对所述植物连续地再灌溉直至再次达到正常水平。随后将植物再次转移至正常条件。其余的培育(植物成熟、种子收获)与未在非生物胁迫条件下培育的植物相同。如对正常条件下详述那样记录生长和产量参数。
氮使用效率筛选
源自T2种子的稻植物在盆栽土壤中于正常条件下培育,除了营养溶液之外。从移植至成熟期间用氮(N)浓度降低、通常7至8倍之间降低的特定营养溶液浇灌所述花钵。其余的培育(植物成熟、种子收获)与并不在非生物胁迫下培育的植物相同。如对正常条件下详述那样记录生长和产量参数。
68.2统计分析:F-检验
使用两因素ANOVA(变量分析)作为整体评价植物表型特征的统计模型。对于用本发明基因转化的全部事件的全部植物的全部所测量参数实施F检验。实施F检验以检查该基因对全部转化事件的影响并验证该基因的整体作用(又称作基因总体作用)。真实基因总体作用显著性的阈值对于所述F检验设置在5%概率水平上。显著性F检验值指出基因作用,这意味不仅仅是基因的存在或位置才造成表型上的差异。
当实施了具有重叠事件的两个实验时,进行联合分析。这用于检验对这两个实验影响的一致性,并且若是一致的,则用于积累来自两个实验的证据以提高结论的可信度。所用方法是考虑数据的多重水平结构的混合模型法(即实验-事件-分离子)。通过比较针对卡方分布的似然比检验而获得P-值。
68.3测量的参数
生物量相关的参数测量
植物从播种期至成熟期数次通过数字成像室。在每个时间,从至少6个不同角度拍摄每株植物的数字图像(2048x1536像素,1600万颜色)。
植物地上部分面积(或叶生物量)通过计数来自植物地上部分的数字图像上区别于背景的像素总数而确定。该值对相同时间上从不同角度拍摄的画面进行平均化并且转化成通过校正以平方mm表述的物理表面值。实验证实以这种方式测量的地上部分植物面积与地上植物部分的生物量相关。地上部分面积是植物已经实现其最大叶生物量的时间上所测量的面积。早期生长势是萌发后3周的植物(籽苗)地上部分的面积。根生物量的增加表述为根总生物量的增加(测量为植物寿命期间观察到的根最大生物量);或表述为根/冠比增加(测量为根和苗的活跃生长期间根质量与苗质量之间的比例)。
出苗生长势通过计数来自植物部分的区别于背景的像素总数确定。该值对相同时间上从不同角度拍摄的画面进行平均化并且转化成通过校正以平方mm表述的物理表面值。下述结果针对萌发后3周的植物。
种子相关的参数测量
将成熟的原发花序收获、计数、装袋、加条形码标记并且随后在干燥箱内于37°干燥3日。随后将所述花序脱粒,并且收集和计数全部种子。充实粒使用吹气装置与空粒分开。弃去空粒并且再次计数剩余部分。充实粒在分析天平上称重。充实种子数通过计数所述分离步骤后仍留下的充实粒的数目来确定。种子总产量通过称量从一株植物收获的全部充实粒而测量。每株植物的种子总数通过计数从一株植物收获的壳数目测量。从计数的充实种子数及其总重量外推出千粒核重(TKW)。收获指数(HI)在本发明中定义为种子总产量与地上部分面积(mm2)之间的比率,乘以系数106。如本发明中定义的每花序总花数是种子总数与成熟原发花序之间的比例。如本发明中定义的种子充实率是充实种子数对种子(或小花)总数的比例(表述为%)。
实施例69:转基因植物的表型评价结果
本文给出在干旱胁迫或非胁迫条件下表达与构建体pGOS2::SPL11和pWSI18::SPL11相对应的SPL11核酸的转基因稻植物的评价结果。与对照失效合子植物相比时,在至少一种生长条件下,在转基因植物中观察到一个或多个以下参数提高至少5%:出苗生长势(籽苗早期生长势)、总种子产量(种子重量)、种子充实率、充实种子数、每花序的花(种子)数目和收获指数,并且千粒核(1000颗种子)重提高至少3%。

Claims (169)

1.用于相对于对照植物增强植物中产量相关性状的方法,包括调节植物中编码bHLH11样多肽的核酸表达,其中所述的bHLH11样多肽包含螺旋-环-螺旋结构域。
2.根据权利要求1的方法,其中所述的bHLH11样多肽包含一个或多个以下基序:
(i)基序1(SEQ ID NO:246):
(ii)基序2(SEQ ID NO:247):
(iii)基序3(SEQ ID NO:248):
(iv)基序4(SEQ ID NO:249):
(v)基序5(SEQ ID NO:250):
(vi)基序6(SEQ ID NO:251);
(vii)基序7(SEQ ID NO:252)。
3.根据权利要求1或2的方法,其中所述受调节的表达通过在植物中导入和表达编码bHLH11样多肽的核酸实现。
4.根据权利要求1至3任一项的方法,其中所述编码bHLH11样多肽的核酸编码表E1中所列的任一种蛋白质或是这种核酸的一部分或是能够与这种核酸杂交的核酸。
5.根据权利要求1至4任一项的方法,其中所述的核酸序列编码表E1中给出的任意蛋白质的直向同源物或旁系同源物。
6.根据权利要求1至5任一项的方法,其中所述的增强的产量相关性状包括相对于对照植物而言提高的产量、优选提高的种子产量。
7.根据权利要求1至6任一项的方法,其中所述的增强的产量相关性状在非胁迫条件下获得。
8.根据权利要求1至7任一项的方法,其中所述的核酸有效连接至组成型启动子,优选地有效连接至GOS2启动子,最优选地有效连接至来自稻的GOS2启动子。
9.根据权利要求1至7任一项的方法,其中所述编码bHLH11样多肽的核酸是植物来源的,优选地来自单子叶植物,进一步优选地来自禾本科,更优选地来自小麦属(Triticum),最优选地来自普通小麦(Triticumaestivum)。
10.通过权利要求1至9任一项的方法可获得的植物或其部分,包括种子,其中所述的植物或其部分包含编码bHLH11样多肽的重组核酸。
11.构建体,包含:
(i)编码如权利要求1或2中定义的bHLH11样多肽的核酸;
(ii)能够驱动(i)的核酸序列表达的一个或多个控制序列;和任选地
(iii)转录终止序列。
12.根据权利要求11的构建体,其中所述的控制序列之一是组成型启动子,优选地是GOS2启动子,最优选地是来自稻的GOS2启动子。
13.根据权利要求11或12的构建体在用于产生植物的方法中的用途,所述植物相对于对照植物具有提高的产量,尤其提高的种子产量。
14.用根据权利要求11或12的构建体转化的植物、植物部分或植物细胞。
15.用于产生转基因植物的方法,所述的转基因植物相对于对照植物具有提高的产量、尤其提高的种子产量,该方法包括:
(i)在植物中导入并表达编码如权利要求1或2中定义的bHLH11样多肽的核酸;和
(ii)在促进植物生长和发育的条件下培养植物细胞。
16.转基因植物,其因编码如权利要求1或2中定义的bHLH11样多肽的核酸的受调节表达而相对于对照植物具有提高的产量、尤其提高的种子产量,或从所述转基因植物衍生的转基因植物细胞。
17.根据权利要求10、14或16的转基因植物或从其衍生的转基因植物细胞,其中所述的植物是作物植物或单子叶植物或谷物植物,如稻、玉米、小麦、大麦、谷子、黑麦、小黑麦、高粱、二粒小麦、斯卑尔脱、黑麦属植物(secale)、单粒小麦、埃塞俄比亚画眉草、蜀黍和燕麦。
18.根据权利要求17的植物的可收获部分,其中所述的可收获部分优选地是种子。
19.产物,从根据权利要求17的植物和/或从根据权利要求18的植物的可收获部分衍生。
20.编码bHLH11样多肽的核酸在植物中相对于对照植物提高产量、尤其在提高种子产量中的用途。
21.用于相对于对照植物增强植物中产量相关性状的方法,包括调节植物中编码LBD多肽的核酸表达,其中所述的LBD多肽包含DUF206结构域。
22.根据权利要求21的方法,其中所述的LBD多肽包含一个或多个以下基序:
(i)基序1:MSCNGCRXLRKGCX(SEQ ID NO:5),
(ii)基序2:QXXATXFXAKFXGR(SEQ ID NO:6),
(iii)基序3:FXSLLXEAXG(SEQ ID NO:7)。
23.根据权利要求21或22的方法,其中所述受调节的表达通过在植物中导入和表达编码LBD多肽的核酸实施。
24.根据任一前述权利要求的方法,其中所述编码LBD多肽的核酸编码表A1中所列的任一种蛋白质或是这种核酸的一部分或是能够与这种核酸杂交的核酸。
25.根据任一前述权利要求的方法,其中所述的核酸序列编码表A1中给出的任意蛋白质的直向同源物或旁系同源物。
26.根据任一前述权利要求的方法,其中所述的增强的产量相关性状包括相对于对照植物而言提高的产量、优选提高的生物量和/或提高的种子产量。
27.根据权利要求21至26任一项的方法,其中所述的增强的产量相关性状在非胁迫条件下获得。
28.根据权利要求21至26任一项的方法,其中所述的增强的产量相关性状在缺氮条件下获得。
29.根据权利要求23至28任一项的方法,其中所述的核酸有效连接至组成型启动子,优选地有效连接至GOS2启动子,最优选地有效连接至来自稻的GOS2启动子。
30.根据任一前述权利要求的方法,其中所述编码LBD多肽的核酸是植物来源的,优选地来自双子叶植物,进一步优选地来自十字花科(Brassicaceae),更优选地来自拟南芥属(Arabidopsis),最优选地来自拟南芥(Arabidopsis thaliana)。
31.分离的核酸分子,包含任一以下特征:
(i)由SEQ ID NO:69代表的核酸;
(ii)与(i)中给出的任一个SEQ ID NO互补的核酸或其片段;
(iii)编码LBD多肽的核酸,所述LBD多肽以增加的优选顺序与SEQID NO:70具有至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的序列同一性;
(iv)能够在严格条件下与以上(i)、(ii)或(iii)中给出的任一种核酸杂交的核酸。
32.分离的多肽,包含:
(i)以增加的优选顺序与SEQ ID NO:70中给出的氨基酸序列具有至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列;
(ii)(i)中给出的任意氨基酸序列的衍生物。
33.由根据任一前述权利要求的方法可获得的植物或其部分,包括种子,其中所述的植物或其部分包含编码LBD多肽的重组核酸。
34.构建体,包含:
(i)编码如权利要求21、22或32中定义的LBD多肽的核酸;
(ii)能够驱动(a)的核酸序列表达的一个或多个控制序列;和任选地
(iii)转录终止序列。
35.根据权利要求34的构建体,其中所述的控制序列之一是组成型启动子,优选地是GOS2启动子,最优选地是来自稻的GOS2启动子。
36.根据权利要求34或35的构建体在用于产生植物的方法中的用途,所述植物相对于对照植物具有提高的产量,尤其提高的生物量和/或提高的种子产量。
37.用根据权利要求34或35的构建体转化的植物、植物部分或植物细胞。
38.用于产生转基因植物的方法,所述的转基因植物相对于对照植物具有提高的产量、尤其提高的生物量和/或提高的种子产量,该方法包括:
(i)在植物中导入并表达编码如权利要求21、22或32中定义的LBD多肽的核酸;和
(ii)在促进植物生长和发育的条件下培养植物细胞。
39.转基因植物,其因编码如权利要求21、22或32中定义的LBD多肽的核酸的表达增加而相对于对照植物具有提高的产量、尤其提高的生物量和/或提高的种子产量,或从所述转基因植物衍生的转基因植物细胞。
40.根据权利要求33、37或39的转基因植物或从其衍生的转基因植物细胞,其中所述的植物是作物植物或单子叶植物或谷物植物,如稻、玉米、小麦、大麦、谷子、黑麦、小黑麦、高粱和燕麦。
41.根据权利要求39的植物的可收获部分,其中所述的可收获部分优选地是苗生物量和/或种子。
42.产物,从根据权利要求39的植物和/或从根据权利要求20的植物的可收获部分衍生。
43.编码LBD多肽的核酸在植物中相对于对照植物提高产量、尤其提高种子产量和/或苗生物量中的用途。
44.用于相对于对照植物增强植物中产量相关性状的方法,包括调节植物中编码JMJC多肽的核酸表达,其中所述的JMJC多肽包含JmjC结构域。
45.根据权利要求44的方法,其中所述的JmjC结构域由这样的序列代表,所述序列以增加的优选顺序与以下序列具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或更高的序列同一性:
(i)SEQ ID NO:78;和/或
(ii)包含于SEQ ID NO:84;SEQ ID NO:86:SEQ ID NO:96;SEQID NO:98;SEQ ID NO:104;SEQ ID NO:108;SEQ ID NO:110;SEQ IDNO:112;SEQ ID NO:114;SEQ ID NO:116;SEQ ID NO:118;SEQ IDNO:120;SEQ ID NO:122;SEQ ID NO:124;SEQ ID NO:128;SEQ IDNO:130;SEQ ID NO:132和SEQ ID NO:134所代表的JMJC多肽中的JmjC结构域之一,其中在表B4中给出所述JMJC多肽的氨基酸坐标。
46.根据权利要求44和权利要求45的方法,其中所述的JMJC多肽包含这样的基序,所述基序以增加的优选顺序与以下任意序列具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或更高的序列同一性:
(i)SEQ ID NO:79,
(ii)SEQ ID NO:80,
(iii)SEQ ID NO:81,
(iv)SEQ ID NO:82。
47.根据权利要求44或46的方法,其中所述受调节的表达通过在植物中导入和表达编码JMJC多肽的核酸实施。
48.根据权利要求44至47任一项的方法,其中所述的调节表达是增加表达。
49.根据权利要求44至48任一项的方法,其中所述编码JMJC多肽的核酸编码表B1中所列的任一种蛋白质或是这种核酸的一部分或是能够与这种核酸杂交的核酸。
50.根据权利要求44至49之一项的方法,其中所述的核酸序列编码表B1中给出的任意蛋白质的直向同源物或旁系同源物。
51.根据权利要求50的方法,其中所述的核酸编码SEQ ID NO:74。
52.根据权利要求44至51任一项的方法,其中所述的增强的产量相关性状包含相对于对照植物而言提高的产量、优选提高的收获指数和/或种子产量。
53.根据权利要求44至52任一项的方法,其中所述的增强的产量相关性状包含相对于对照植物而言的植物早期生长势。
54.根据权利要求44至53任一项的方法,其中所述的增强的产量相关性状在非胁迫条件下获得。
55.根据权利要求44至53任一项的方法,其中所述的增强的产量相关性状在轻度干旱胁迫生长条件下获得。
56.根据权利要求44至53任一项的方法,其中所述的增强的产量相关性状在缺氮生长条件下获得。
57.根据权利要求47至56任一项的方法,其中所述的核酸有效连接至组成型启动子,优选地有效连接至GOS2启动子,最优选地有效连接至来自稻的GOS2启动子。
58.根据权利要求44至57任一项的方法,其中所述编码JMJC多肽的核酸是植物来源的,优选地来自双子叶植物,进一步优选地来自十字花科,更优选地来自拟南芥属,最优选地来自拟南芥。
59.由根据权利要求44至58任一项的方法能够获得的植物或其部分,包括种子,其中所述的植物或其部分包含编码JMJC多肽的重组核酸。
60.构建体,包含:
(i)编码如权利要求44至46中定义的JMJC多肽的核酸;
(ii)能够驱动(i)的核酸序列表达的一个或多个控制序列;和任选地
(iii)转录终止序列。
61.根据权利要求60的构建体,其中所述的控制序列之一是组成型启动子,优选地是GOS2启动子,最优选地是来自稻的GOS2启动子。
62.根据权利要求60或61的构建体在用于产生植物的方法中的用途,所述植物相对于对照植物具有提高的产量、尤其提高的生物量和/或提高的种子产量。
63.用根据权利要求60或61的构建体转化的植物、植物部分或植物细胞。
64.用于产生转基因植物的方法,所述的转基因植物相对于对照植物具有提高的产量相关性状、尤其植物早期生长势和/或提高的种子产量,该方法包括:
(i)在植物中导入并表达编码如权利要求44至46中定义的JMJC多肽的核酸;和
(ii)在促进植物生长和发育的条件下培养植物细胞。
65.转基因植物,其因编码如权利要求44至46中定义的JMJC多肽的核酸的表达增加而相对于对照植物具有提高的产量、尤其提高的植物籽苗生长势和/或提高的种子产量,或从所述转基因植物衍生的转基因植物细胞。
66.根据权利要求59、63或65的转基因植物或从其衍生的转基因植物细胞,其中所述的植物是作物植物或单子叶植物或谷物植物,如稻、玉米、小麦、大麦、谷子、黑麦、小黑麦、高粱和燕麦。
67.根据权利要求66的植物的可收获部分,其中所述的可收获部分优选地是苗生物量和/或种子。
68.产物,从根据权利要求66的植物和/或从根据权利要求67的植物的可收获部分衍生。
69.编码JMJC多肽的核酸在植物中相对于对照植物提高产量、尤其提高种子产量和/或苗生物量中的用途。
70.分离的核酸分子,包含任一以下特征:
(i)由SEQ ID NO:169代表的核酸:
(ii)与SEQ ID NO:169互补的核酸或其片段;
(iii)编码JMJC多肽的核酸,所述的JMJC多肽以增加的优选顺序与SEQ ID NO:170中给出的氨基酸序列具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的序列同一性:
(iv)能够在严格条件下与以上(i)、(ii)或(iii)中给出的任一种核酸杂交的核酸。
71.分离的多肽分子,包含:
(i)以增加的优选顺序与SEQ ID NO:170中给出的氨基酸序列具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%或更高的序列同一性的氨基酸序列:
(ii)(i)中给出的任意氨基酸序列的衍生物。
72.用于相对于对照植物增强植物中产量相关性状的方法,包括调节植物中编码酪蛋白激酶I(CKI)的核酸表达,其中所述的CKI选自SEQ IDNO:174或其直向同源物或旁系同源物。
73.根据权利要求72的方法,其中所述受调节的表达通过在植物中导入和表达编码所述CKI多肽的核酸实现。
74.根据权利要求72或73的方法,其中编码所述CKI多肽的所述核酸是SEQ ID NO:173的一部分或是能够与这种核酸杂交的核酸。
75.根据权利要求72至74任一项的方法,其中所述的核酸序列编码SEQ ID NO:174。
76.根据权利要求72至75任一项的方法,其中所述的增强的产量相关性状包括相对于对照植物而言提高的早期生长势和/或提高的产量、优选提高的生物量和/或提高的种子产量。
77.根据权利要求72至76任一项的方法,其中所述的增强的产量相关性状在非胁迫条件下获得。
78.根据权利要求72至76任一项的方法,其中所述的增强的产量相关性状在非生物胁迫条件下获得。
79.根据权利要求78的方法,其中所述的非生物胁迫条件选自以下一个或多个条件:干旱胁迫条件、盐胁迫条件和缺氮条件。
80.根据权利要求73至79任一项的方法,其中所述的核酸有效连接至种子特异性启动子。
81.根据权利要求73至80任一项的方法,其中所述的种子特异性启动子是WSI18启动子、优选来自稻的WSI18启动子。
82.根据权利要求72至81任一项的方法,其中所述编码CKI多肽的核酸是植物来源的。
83.根据权利要求72至82任一项的方法,其中所述的植物来源优选地来自双子叶植物,进一步优选地来自茄科(Solanaceae),更优选来自烟草(Nicotiana tabacum)所属的属。
84.由根据权利要求72至83任一项的方法可获得的植物或其部分,包括种子,其中所述的植物或其部分包含编码CKI多肽的重组核酸。
85.构建体,包含:
(i)编码如权利要求72中定义的CKI多肽的核酸;
(ii)能够驱动(a)的核酸序列表达的一个或多个控制序列;和任选地
(iii)转录终止序列。
86.根据权利要求85的构建体,其中所述的控制序列之一是种子特异性启动子、优选WSI18启动子。
87.根据权利要求85的构建体,其中所述的种子特异性启动子之一是WSI18启动子、最优选是来自稻的WSI18启动子。
88.根据权利要求85至87任一项的构建体在用于产生植物的方法中的用途,所述植物相对于对照植物具有提高的产量相关性状、尤其提高的早期生长势、提高的生物量和/或提高的种子产量。
89.用根据权利要求85至87任一项的构建体转化的植物、植物部分或植物细胞。
90.用于产生转基因植物的方法,所述的转基因植物相对于对照植物具有提高的产量、尤其提高的生物量和/或提高的种子产量,该方法包括:
(i)在植物中导入并表达编码如权利要求72中定义的CKI多肽的核酸;和
(ii)在促进植物生长和发育的条件下培养植物细胞。
91.转基因植物,其因编码如权利要求72中定义的CKI多肽的核酸的表达增加而相对于对照植物具有提高的产量相关性状、尤其提高的早期生长势、提高的生物量和/或提高的种子产量,或从所述转基因植物衍生的转基因植物细胞。
92.根据权利要求84、89或91的转基因植物或从其衍生的转基因植物细胞,其中所述的植物是作物植物或单子叶植物或谷物植物,如稻、玉米、小麦、大麦、谷子、黑麦、小黑麦、高粱和燕麦。
93.根据权利要求92的植物的可收获部分,其中所述的可收获部分优选地是苗生物量和/或种子。
94.产物,从根据权利要求92的植物和/或从根据权利要求93的植物的可收获部分衍生。
95.编码CKI多肽的核酸在植物中相对于对照植物提高产量相关性状、尤其提高早期生长势、种子产量和苗生物量之一者或多者中的用途。
96.用于相对于对照植物增强植物中产量相关性状、优选增强种子产量相关性状的方法,包括调节、优选增加植物中编码植物同源域指-同源域(PHDf-HD)多肽的核酸序列表达,所述PHDf-HD多肽包含:(i)与如SEQ IDNO:233所代表的亮氨酸拉链/植物同源域指(ZIP/PHDf)结构域具有至少25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或更高氨基酸序列同一性的结构域;和(ii)与如SEQ ID NO:234所代表的同源域(HD)具有至少25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或更高氨基酸序列同一性的结构域,和任选地选择具有增强的产量相关性状的植物。
97.根据权利要求96的方法,其中所述的PHDf-HD多肽包含:(i)如PFAM00628所代表的PHD结构域;和(ii)如PFAM00046所代表的HD。
98.根据权利要求96或97的方法,其中在构建HD进化系统树如图13中所绘制的HD进化系统树中使用时,所述的PHDf-HD多肽与包含如SEQ ID NO:180所代表的多肽序列的PHDf-HD组多肽聚类,而不与任何其他HD组聚类。
99.根据权利要求96至98任一项的方法,其中所述的PHDf-HD多肽以增加的优选顺序与如SEQ ID NO:180所代表的PHDf-HD多肽或与本文表D1中给出的任意多肽序列具有至少30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或更高的序列同一性。
100.根据权利要求96至99任一项的方法,其中所述编码PHDf-HD多肽的核酸序列由表D1中给出的任一个核酸序列SEQ ID NO或其部分,或者能够与表D1中所给出的任一个核酸序列SEQ ID NO杂交的序列代表。
101.根据权利要求96至100任一项的方法,其中所述的核酸序列编码表D1中给出的任一SEQ ID NO的直向同源物或旁系同源物。
102.根据权利要求96至101任一项的方法,其中所述的受调节、优选增加的表达通过以下任意一种或多种方法实现:T-DNA活化标签法、TILLING或同源重组法。
103.根据权利要求96至102任一项的方法,其中所述增加的表达通过在植物中导入和表达编码PHDf-HD多肽的核酸序列实现。
104.根据权利要求96至103任一项的方法,其中所述的产量相关性状是种子产量相关性状,包含以下一项或多项:(i)增加的原发花序数;(ii)提高的每株植物种子总重量;(iii)提高的(充实)种子数;(iv)提高的TKW;或(v)提高的收获指数。
105.根据权利要求96至104任一项的方法,其中所述的核酸序列有效连接至组成型启动子,优选地有效连接至植物组成型启动子、更优选地有效连接至GOS2启动子,最优选地有效连接至来自稻的GOS2启动子。
106.根据权利要求96至105任一项的方法,其中所述编码PHDf-HD多肽的核酸序列是植物来源的,优选地来自单子叶植物,进一步优选地来自禾本科(Poacae),更优选地来自稻属(Oryza),最优选地来自稻(Oryzasativa)。
107.通过权利要求96至106任一项的方法可获得的植物、其部分(包括种子)或植物细胞,其中所述的植物、其部分或细胞包含有效连接至植物组成型启动子的编码PHDf-HD多肽的分离的核酸转基因。
108.构建体,包含:
(i)编码如权利要求96至101任一项中定义的PHDf-HD多肽的核酸序列;
(ii)能够驱动(i)的核酸序列表达的一个或多个控制序列;和任选地
(iii)转录终止序列;
其中至少一个所述控制序列是植物组成型启动子,优选地是GOS2启动子。
109.根据权利要求107的构建体在用于产生植物的方法中的用途,所述植物相对于对照植物具有增强的产量相关性状,所述增强的产量相关性状、优选增强的种子产量相关性状是以下一项或多项:(i)增加的原发花序数;(ii)提高的每株植物种子总重量;(iii)提高的(充实)种子数;(iv)提高的TKW;或(v)提高的收获指数。
110.用根据权利要求107或108的构建体转化的植物、植物部分或植物细胞。
111.用于产生相对于对照植物具有增强的产量相关性状的转基因植物的方法,包括:
(i)在植物、植物部分或植物细胞中导入并表达在植物组成型启动子控制下的编码如权利要求96至101任一项中定义的PHDf-HD多肽的核酸序列;和
(ii)在促进植物生长和发育的条件下培养植物细胞。
112.转基因植物,其因有效连接至植物组成型启动子的编码如权利要求96至101任一项中所定义PHDf-HD多肽的核酸序列受调节、优选增加的表达而相对于对照植物具有增强的产量相关性状、优选具有增强的种子产量相关性状,或从所述的转基因植物衍生的转基因植物细胞。
113.根据权利要求107、110或112的转基因植物,其中所述的植物是作物植物或单子叶植物或谷物植物,如稻、玉米、小麦、大麦、谷子、黑麦、小黑麦、高粱和燕麦,或从所述的转基因植物衍生的转基因植物细胞。
114.包含核酸序列的可收获部分,所述核酸序列编码根据权利要求113的植物的PHDf-HD多肽,其中所述的可收获部分优选地是种子。
115.产物,从根据权利要求113的植物和/或从根据权利要求114的植物的可收获部分衍生。
116.编码如权利要求96至101任一项中定义的PHDf-HD多肽的核酸序列在增强植物中产量相关性状、优选地在增强种子产量相关性状中的用途,所述产量相关性状包含以下一项或多项:(i)增加的原发花序数;(ii)提高的每株植物种子总重量;(iii)提高的(充实)种子数;(iv)提高的TKW;或(v)提高的收获指数。
117.分离的核酸分子,包含任一以下特征:
(i)由SEQ ID NO:242代表的核酸:
(ii)与SEQ ID NO:242互补的核酸或其片段;
(iii)编码JMJC多肽的核酸,所述的JMJC多肽以增加的优选顺序与SEQ ID NO:243中给出的氨基酸序列具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的序列同一性:
(iv)能够在严格条件下与以上(i)、(ii)或(iii)中给出的任一种核酸杂交的核酸。
118.分离的多肽分子,包含:
(i)以增加的优选顺序与SEQ ID NO:243中给出的氨基酸序列具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%或更高的序列同一性的氨基酸序列:
(ii)(i)中给出的任意氨基酸序列的衍生物。
119.用于相对于对照植物增强植物中产量相关性状的方法,包括调节植物中编码ASR的核酸表达,其中所述的ASR由SEQ ID NO:397或其直向同源物或旁系同源物代表。
120.根据权利要求119的方法,其中所述受调节的表达通过在植物中导入和表达编码所述ASR多肽的核酸实现。
121.根据权利要求119或120的方法,其中编码所述ASR多肽的所述核酸是SEQ ID NO:396的一部分或是能够与这种核酸杂交的核酸。
122.根据权利要求119至121任一项的方法,其中所述的核酸序列编码SEQ ID NO:397或其直向同源物或旁系同源物。
123.根据权利要求119至122任一项的方法,其中所述的增强的产量相关性状包括相对于对照植物而言提高的产量、优选提高的种子产量。
124.根据权利要求119至123任一项的方法,其中所述的增强的产量相关性状在非胁迫条件下获得。
125.根据权利要求120至124任一项的方法,其中所述的核酸有效连接至组成型启动子,优选地有效连接至GOS2启动子,最优选地有效连接至来自稻的GOS2启动子。
126.根据权利要求119至125任一项的方法,其中所述编码ASR多肽的核酸是植物来源的,优选地来自双子叶植物,进一步优选地来自禾本科,更优选地来自稻属,最优选地来自稻。
127.由根据权利要求119至126任一项的方法可获得的植物或其部分,包括种子,其中所述的植物或其部分包含编码ASR多肽的重组核酸。
128.构建体,包含:
(i)编码如权利要求119或SEQ ID NO:401、403、405、407、409、411、413、415和417任一序列中定义的ASR多肽的核酸;
(ii)能够驱动(a)的核酸序列表达的一个或多个控制序列;和任选地
(iii)转录终止序列。
129.根据权利要求128的构建体,其中所述的控制序列之一是组成型启动子,优选地是GOS2启动子,最优选地是来自稻的GOS2启动子。
130.根据权利要求128或129的构建体在用于产生植物的方法中的用途,所述植物相对于对照植物具有提高的产量相关性状,尤其提高的种子产量。
131.用根据权利要求128或129的构建体转化的植物、植物部分或植物细胞。
132.用于产生转基因植物的方法,所述的转基因植物相对于对照植物具有提高的产量、尤其提高的生物量和/或提高的种子产量,该方法包括:
(i)在植物中导入并表达编码如权利要求119中定义的ASR多肽的核酸;和
(ii)在促进植物生长和发育的条件下培养植物细胞。
133.转基因植物,其因编码如权利要求119中定义的ASR多肽的核酸的表达增加而相对于对照植物具有提高的产量相关性状、尤其提高的种子产量,或从所述转基因植物衍生的转基因植物细胞。
134.根据权利要求127、131或133的转基因植物或从其衍生的转基因植物细胞,其中所述的植物是作物植物或单子叶植物或谷物植物,如稻、玉米、小麦、大麦、谷子、黑麦、小黑麦、高粱和燕麦。
135.根据权利要求134的植物的可收获部分,其中所述的可收获部分优选地是种子。
136.产物,从根据权利要求134的植物和/或从根据权利要求135的植物的可收获部分衍生。
137.编码ASR多肽的核酸在植物中相对于对照植物提高产量相关性、尤其在提高种子产量中的用途。
138.分离的核酸分子,包含任一以下特征:
(i)由SEQ ID NO:401、403、405、407、409、411、413、415和417任一序列代表的核酸;
(ii)由SEQ ID NO:401、403、405、407、409、411、413、415和417任一序列代表的核酸的互补物;
(iii)编码ASR多肽的核酸,所述的ASR多肽以增加的优选顺序与SEQ ID NO:402、404、406、408、410、412、414、416和418任一序列所代表的氨基酸序列具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的序列同一性。
139.分离的多肽,包含:
(i)由SEQ ID NO:402、404、406、408、410、412、414、416和418任一序列所代表的氨基酸序列;
(ii)以增加的优选顺序与SEQ ID NO:402、404、406、408、410、412、414、416和418任一序列所代表的氨基酸序列具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高序列同一性的氨基酸序列:
(iii)以上(i)或(ii)中给出的任意氨基酸序列的衍生物。
140.用于相对于对照植物增强植物中产量相关性状的方法,包括调节植物中编码SPL11多肽的核酸表达,其中所述的SPL11多肽包含以增加的优选顺序与SEQ ID NO:456至SEQ ID NO:468和SEQ ID NO:478中任一序列所代表的氨基酸序列具有至少70%、75%、80%、85%、90%、95%、97%或更高序列同一性的SBP结构域。
141.根据权利要求140的方法,其中除SBP结构域之外,所述的SPL11多肽还包含任意一个或多个以下保守基序:
(i)如SEQ ID NO:469所代表的基序1,其中允许任意的保守性氨基酸替换和/或1或2个非保守性替换;
(ii)如SEQ ID NO:470所代表的基序2,其中允许任意的变化,条件是至少4个氨基酸具有极性侧链、优选地是丝氨酸或苏氨酸,并且条件是该基序位于SBP结构域的氨基末端;
(iii)如SEQ ID:471所代表的基序3,其中允许1或2个错配;
(iv)如SEQ ID:472所代表的基序4,其中允许1、2或3个错配。
142.根据权利要求140或141的方法,其中所述受调节的表达通过在植物中导入和表达编码如权利要求140或141中定义的SPL11多肽的核酸实现。
143.根据权利要求140至142任一项的方法,其中所述受调节的表达是增加的表达。
144.根据权利要求140至143任一项的方法,其中所述编码SPL11多肽的核酸编码表G1中所列的任一种蛋白质或是这种核酸的一部分或是能够与这种核酸杂交的核酸。
145.根据权利要求140至144任一项的方法,其中所述的核酸序列编码表G1中给出的任意蛋白质的直向同源物或旁系同源物。
146.根据权利要求145的方法,其中所述的核酸编码SEQ ID NO:428。
147.根据权利要求140至146任一项的方法,其中所述的增强的产量相关性状包含相对于对照植物/而言提高的产量、优选提高的种子总重量、充实种子数、每花序种子数或小花数、千粒核重、种子充实率和/或收获指数。
148.根据权利要求140至147任一项的方法,其中所述的增强的产量相关性状包括相对于对照植物而言的植物(籽苗)早期生长势。
149.根据权利要求140至147任一项的方法,其中所述的增强的产量相关性状在非胁迫条件下获得。
150.根据权利要求140至147任一项的方法,其中所述的增强的产量相关性状在轻度干旱胁迫生长条件下获得。
151.根据权利要求140至147任一项的方法,其中所述的增强的产量相关性状在缺氮生长条件下获得。
152.根据权利要求140至151任一项的方法,其中所述的核酸有效连接至组成型启动子,优选地有效连接至GOS2启动子,最优选地有效连接至来自稻的GOS2启动子。
153.根据权利要求140至151任一项的方法,其中所述的核酸有效连接至种子特异性启动子,优选地有效连接至WSI18启动子,最优选地有效连接至来自稻的WSI18启动子。
154.根据权利要求140至153任一项的方法,其中所述编码SPL11多肽的核酸是植物来源的,优选地来自双子叶植物,进一步优选地来自十字花科,更优选地来自拟南芥属,最优选地来自拟南芥。
155.通过权利要求140至154任一项的方法可获得的植物或其部分,包括种子,其中所述的植物或其部分包含编码SPL11多肽的重组核酸。
156.分离的核酸分子,包含:
(i)由SEQ ID NO:448代表的核酸;
(ii)由SEQ ID NO:448代表的核酸的互补物;
(iii)编码SPL11多肽的核酸,所述的SPL11多肽以增加的优选顺序与SEQ ID NO:449所代表的氨基酸序列具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的序列同一性,并且以增加的优选顺序与SEQ ID NO:465:SYCQVEGCRTDLSSAKDYHRKHRVCEPHSKAPKVVVAGLERRFCQQCSRFHGLAEFDQKKKSCRRRLNDHNARRRKPQPEAL具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的序列同一性;
(iv)在严格杂交条件下与SEQ ID NO:448杂交的核酸分子。
157.分离的多肽,包含:
(i)由SEQ ID NO:449代表的氨基酸序列;
(ii)氨基酸序列,其以增加的优选顺序与SEQ ID NO:449所代表的氨基酸序列具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的序列同一性,并且以增加的优选顺序与SEQ ID NO:465:SYCQVEGCRTDLSSAKDYHRKHRVCEPHSKAPKVVVAGLERRFCQQCSRFHGLAEFDQKKKSCRRRLNDHNARRRKPQPEAL具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的序列同一性;
(iii)以上(i)或(ii)中给出的任意氨基酸序列的衍生物。
158.构建体,包含:
(i)码SPL11多肽的核酸;
(ii)能够驱动(i)的核酸序列表达的一个或多个控制序列;和任选地
(iii)转录终止序列。
159.根据权利要求158的构建体,其中所述编码SPL11多肽的核酸是根据权利要求156的核酸。
160.根据权利要求158或159的构建体,其中所述的控制序列之一是组成型启动子,优选地是GOS2启动子,最优选地是来自稻的GOS2启动子。
161.根据权利要求158或159的构建体,其中所述的控制序列之一是种子特异性启动子,优选地是WSI18启动子,最优选地是来自稻的WSI18启动子。
162.根据权利要求158至161的构建体在用于产生植物的方法中的用途,所述植物相对于对照植物具有提高的产量相关性状、尤其提高的种子产量和/或和/或植物或籽苗早期生长势。
163.用根据权利要求158至161的构建体转化的植物、植物部分或植物细胞。
164.用于产生转基因植物的方法,所述的转基因植物相对于对照植物具有提高的产量相关性状、尤其提高的种子产量和/或植物或籽苗早期生长势,该方法包括:
(i)在植物中导入并表达编码SPL11多肽的核酸;和
(ii)在促进植物生长和发育的条件下培养植物细胞。
165.转基因植物,其因编码SPL11多肽的核酸的表达增加而相对于对照植物具有提高的产量、尤其提高的植物籽苗生长势和/或提高的种子产量,或从所述转基因植物衍生的转基因植物细胞。
166.根据权利要求155、163或165的转基因植物或从其衍生的转基因植物细胞,其中所述的植物是双子叶作物植物,如大豆、棉花或卡诺拉油菜,或是单子叶作物植物或谷物植物,如稻、玉米、小麦、大麦、谷子、黑麦、小黑麦、高粱和燕麦。
167.根据权利要求166的植物的可收获部分,其中所述的可收获部分优选地是苗生物量、花和/或种子。
168.产物,从根据权利要求166的植物和/或从根据权利要求167的植物的可收获部分衍生。
169.编码SPL11多肽的核酸在植物中相对于对照植物提高产量、尤其提高种子产量和/或苗生物量中的用途。
CN201410643355.2A 2007-05-03 2008-05-02 具有增强的产量相关性状的植物和用于制备该植物的方法 Pending CN104862333A (zh)

Applications Claiming Priority (21)

Application Number Priority Date Filing Date Title
EP07107448.8 2007-05-03
EP07107448 2007-05-03
US91657507P 2007-05-08 2007-05-08
US60/916,575 2007-05-08
EP07109068.2 2007-05-29
EP07109052.6 2007-05-29
EP07109068 2007-05-29
EP07109052 2007-05-29
US94221407P 2007-06-06 2007-06-06
US60/942,214 2007-06-06
EP07109961 2007-06-11
EP07109961.8 2007-06-11
EP07110548 2007-06-19
EP07110557 2007-06-19
EP07110548.0 2007-06-19
EP07110557.1 2007-06-19
US93798907P 2007-06-29 2007-06-29
US60/937,989 2007-06-29
US94803607P 2007-07-05 2007-07-05
US60/948,036 2007-07-05
CN200880022592.XA CN101802202B (zh) 2007-05-03 2008-05-02 具有增强的产量相关性状的植物和用于制备该植物的方法

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN200880022592.XA Division CN101802202B (zh) 2007-05-03 2008-05-02 具有增强的产量相关性状的植物和用于制备该植物的方法

Publications (1)

Publication Number Publication Date
CN104862333A true CN104862333A (zh) 2015-08-26

Family

ID=39758827

Family Applications (2)

Application Number Title Priority Date Filing Date
CN200880022592.XA Expired - Fee Related CN101802202B (zh) 2007-05-03 2008-05-02 具有增强的产量相关性状的植物和用于制备该植物的方法
CN201410643355.2A Pending CN104862333A (zh) 2007-05-03 2008-05-02 具有增强的产量相关性状的植物和用于制备该植物的方法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN200880022592.XA Expired - Fee Related CN101802202B (zh) 2007-05-03 2008-05-02 具有增强的产量相关性状的植物和用于制备该植物的方法

Country Status (11)

Country Link
US (2) US20100132071A1 (zh)
EP (5) EP2316956B1 (zh)
CN (2) CN101802202B (zh)
AR (1) AR067314A1 (zh)
AU (1) AU2008248189A1 (zh)
BR (2) BRPI0823525A2 (zh)
CA (2) CA2685223A1 (zh)
DE (1) DE112008001044T5 (zh)
ES (5) ES2437621T3 (zh)
MX (1) MX2009011716A (zh)
WO (1) WO2008137108A2 (zh)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105524933A (zh) * 2016-01-20 2016-04-27 中国农业科学院生物技术研究所 OsJMJ714影响水稻籽粒大小以及盐胁迫耐性的功能及其应用
CN105734140A (zh) * 2016-03-30 2016-07-06 广东省农业科学院蔬菜研究所 茄子高温胁迫内参基因及其应用
CN107058321A (zh) * 2017-04-13 2017-08-18 中国农业科学院作物科学研究所 miR156及其前体在调控小麦分蘖数中的应用
CN110183524A (zh) * 2019-06-11 2019-08-30 扬州大学 一个促进大豆主根伸长的基因GmKRP2a、蛋白及其应用
CN110734481A (zh) * 2019-11-12 2020-01-31 中国农业大学 番茄SlMIP蛋白及其编码基因在调控植物灰霉病抗性中的应用
CN112375777A (zh) * 2020-08-05 2021-02-19 浙江大学 OsbHLH6在提高作物磷吸收能力及作物耐低磷育种中的应用
CN112575106A (zh) * 2020-12-17 2021-03-30 东北农业大学 基于转录因子基因ZmNAC89开发的与玉米耐盐碱相关的分子标记及其应用
CN112680472A (zh) * 2019-10-17 2021-04-20 华南农业大学 ZmSPL基因在调控玉米冠根或气生根发育中的应用
CN114231542A (zh) * 2022-01-21 2022-03-25 沈阳农业大学 一种影响山新杨耐盐性的bHLH基因及其应用
CN114250230A (zh) * 2020-09-24 2022-03-29 中国科学院遗传与发育生物学研究所 大豆组蛋白去甲基化酶GmJMJ30-2在调控植物耐逆性中的应用
CN115354042A (zh) * 2021-05-19 2022-11-18 湖南农业大学 一种启动子及其制备方法与应用
CN116286944A (zh) * 2022-12-09 2023-06-23 中国科学院华南植物园 组蛋白去甲基化酶SlJMJ10及其编码基因在调控番茄果实成熟中的应用
CN116536286A (zh) * 2023-05-12 2023-08-04 南京农业大学 水稻OsCTK1蛋白及其编码基因的应用

Families Citing this family (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101969759A (zh) * 2007-12-20 2011-02-09 巴斯夫植物科学有限公司 具有增强的产量相关性状的植物及其制备方法
US8658591B2 (en) 2008-07-11 2014-02-25 Robert Day Multi-LEU peptides and analogues thereof as selective PACE4 inhibitors and effective antiproliferative agents
ES2560806T3 (es) * 2009-06-30 2016-02-22 Performance Plants, Inc. Expresión de reguladores de la transcripción que proporcionan tolerancia al calor
CN104651323A (zh) * 2009-11-13 2015-05-27 巴斯夫植物科学有限公司 具有增强的产量相关性状的植物和用于产生该植物的方法
RS55986B1 (sr) 2010-01-22 2017-09-29 Bayer Ip Gmbh Akaricidne i/ili insekticidne kombinacije aktivnih supstanci
EA201290933A1 (ru) * 2010-03-18 2013-05-30 Басф Плант Сайенс Компани Гмбх Растения с улучшенными характеристиками урожайности и способ их получения
WO2011163029A2 (en) * 2010-06-21 2011-12-29 The Board Of Trustees Of The Leland Stanford Junior University Alkenyl substituted cycloaliphatic compounds as chemical inducers of proximity
CA2833876A1 (en) * 2011-04-29 2012-11-01 Pioneer Hi-Bred International, Inc. Down-regulation of a homeodomain-leucine zipper i-class homeobox gene for improved plant performance
US9265252B2 (en) 2011-08-10 2016-02-23 Bayer Intellectual Property Gmbh Active compound combinations comprising specific tetramic acid derivatives
CN102925466A (zh) * 2011-08-12 2013-02-13 华中农业大学 一种棉花酪蛋白激酶基因及其应用
EP2780458A4 (en) * 2011-11-14 2015-11-18 Basf Plant Science Co Gmbh PLANTS HAVING IMPROVED PERFORMANCE ASSOCIATED CHARACTERS AND MANUFACTURING METHOD THEREOF
CN103102402A (zh) * 2011-11-14 2013-05-15 中国科学院遗传与发育生物学研究所 大豆转录活性蛋白GmPHD5及其编码基因与应用
WO2013076672A1 (en) * 2011-11-25 2013-05-30 Basf Plant Science Company Gmbh Plants having enhanced yield-related traits and method for making the same
US10634668B2 (en) 2012-09-13 2020-04-28 Takara Bio Usa, Inc. Modifiable chemical inducers of proximity and methods of using the same
CN103232533A (zh) * 2012-11-13 2013-08-07 华中科技大学 一种小麦抗旱基因TaASR1及其应用
CN103215280B (zh) * 2013-05-08 2014-08-20 山东省农业科学院高新技术研究中心 一种花生spl转录因子基因及其编码蛋白与应用
CA2905229C (en) 2013-06-11 2023-10-10 Clontech Laboratories, Inc. Protein enriched microvesicles and methods of making and using the same
CN104341523B (zh) * 2013-08-02 2017-05-17 中国农业科学院作物科学研究所 水稻转录因子Os03g33090基因CDS序列的应用
CN104371023B (zh) * 2013-08-13 2017-09-05 中国农业科学院作物科学研究所 水稻转录因子Os01g36630基因CDS序列的应用
CN105452274A (zh) * 2013-09-26 2016-03-30 创世纪种业有限公司 一种小盐芥亮氨酸拉链蛋白bZIP-6及其编码基因与应用
CN106062195A (zh) * 2013-11-29 2016-10-26 中国农业大学 玉米基因zmspl1和zmspl2及其用途
US20150322452A1 (en) * 2014-05-12 2015-11-12 Donald Danforth Plant Science Center Compositions and methods for increasing plant growth and yield
CN105087640B (zh) * 2014-05-23 2018-03-30 中国科学院上海生命科学研究院 调节植物种子发育的基因及其应用
GB201501941D0 (en) * 2015-02-05 2015-03-25 British American Tobacco Co Method
WO2016130087A1 (en) * 2015-02-11 2016-08-18 Temasek Life Sciences Laboratory Limited Controlling timing of plant flowering
CN114032251A (zh) * 2015-08-07 2022-02-11 拜尔作物科学公司 根优先和胁迫诱导型启动子及其用途
CN106399513B (zh) * 2016-09-28 2019-08-09 中国农业科学院作物科学研究所 小麦基因TaSPL20-7D分子标记及其在鉴定小麦产量相关性状中的应用
CN109161550B (zh) * 2018-09-26 2020-06-30 华中农业大学 一种调控番茄果实抗坏血酸含量的SlbHLH59基因及应用方法
CN111041034B (zh) * 2018-10-11 2022-09-13 内蒙古农业大学 一种中间锦鸡儿Senescence_reg-1类蛋白编码基因CiDUF584-1及其应用
CN109868278B (zh) * 2019-03-20 2021-02-09 浙江大学 OsSPL3在控制水稻不定根发育中的应用
CA3138204A1 (en) * 2019-05-14 2020-11-19 Yield10 Bioscience, Inc. Modified plants comprising a polynucleotide comprising a non-cognate promoter operably linked to a coding sequence that encodes a transcription factor
CN110734916B (zh) * 2019-11-26 2020-11-03 浙江大学 OsbHLH98在调控水稻叶夹角中的应用
CN112940092B (zh) * 2019-12-11 2022-06-28 中国科学院遗传与发育生物学研究所 玉米ZmbHLH124蛋白质及其编码基因在调控植物耐旱性中的应用
CN111072761B (zh) * 2020-01-09 2021-06-01 西南大学 促进枇杷成花转变的EjSPL5基因及其编码蛋白与应用
US20230039763A1 (en) * 2020-01-14 2023-02-09 Centure Application Ltd. System and method for real-time crop management
US20230116819A1 (en) * 2021-10-07 2023-04-13 Pairwise Plants Services, Inc. Methods for improving floret fertility and seed yield
CN115287290B (zh) * 2022-05-25 2023-11-03 广东省农业科学院农业生物基因研究中心 组蛋白去甲基化酶基因OsJMJ718及其编码蛋白在调控水稻种子活力中的应用

Family Cites Families (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4962028A (en) 1986-07-09 1990-10-09 Dna Plant Technology Corporation Plant promotors
US5116742A (en) 1986-12-03 1992-05-26 University Patents, Inc. RNA ribozyme restriction endoribonucleases and methods
US4987071A (en) 1986-12-03 1991-01-22 University Patents, Inc. RNA ribozyme polymerases, dephosphorylases, restriction endoribonucleases and methods
JP2996995B2 (ja) 1988-06-01 2000-01-11 ザ テキサス エイ アンド エム ユニヴァーシティ システム 茎頂による植物の形質転換方法
AU4115693A (en) 1992-04-24 1993-11-29 Sri International In vivo homologous sequence targeting in eukaryotic cells
RU94046396A (ru) 1992-06-29 1996-11-10 Джин Ширс Пти.Лтд. (AU) Нуклеиновая кислота, днк, вектор, способ получения растения или животного, способ получения клеток, способ создания животного, животное, трансгенное животное, трансгенное растение, плоды, черенки и семена, растительные клетки, способ вмешательства в репликацию вируса
US5401836A (en) 1992-07-16 1995-03-28 Pioneer Hi-Bre International, Inc. Brassica regulatory sequence for root-specific or root-abundant gene expression
JPH08503853A (ja) 1992-11-30 1996-04-30 チューア,ナム−ハイ 植物における組織−及び発生−特異的な発現を付与する発現モチーフ
EP0728199A1 (en) 1993-07-22 1996-08-28 Gene Shears Pty Limited Dna virus ribozymes
CN1061376C (zh) 1993-11-19 2001-01-31 生物技术研究及发展有限公司 用于植物体内基因表达的嵌合调节区和基因盒
WO1995015972A1 (en) 1993-12-09 1995-06-15 Thomas Jefferson University Compounds and methods for site-directed mutations in eukaryotic cells
US6395547B1 (en) 1994-02-17 2002-05-28 Maxygen, Inc. Methods for generating polynucleotides having desired characteristics by iterative selection and recombination
US5605793A (en) 1994-02-17 1997-02-25 Affymax Technologies N.V. Methods for in vitro recombination
AU718082B2 (en) 1995-10-06 2000-04-06 Plant Genetic Systems N.V. Seed shattering
US7390937B2 (en) 1996-02-14 2008-06-24 The Governors Of The University Of Alberta Plants with enhanced levels of nitrogen utilization proteins in their root epidermis and uses thereof
GB9607517D0 (en) 1996-04-11 1996-06-12 Gene Shears Pty Ltd The use of DNA Sequences
CA2276612A1 (en) * 1997-01-08 1998-07-16 University Of Florida Polynucleotides encoding choline monooxygenase and plants transformed therewith
GB9703146D0 (en) 1997-02-14 1997-04-02 Innes John Centre Innov Ltd Methods and means for gene silencing in transgenic plants
GB9710475D0 (en) 1997-05-21 1997-07-16 Zeneca Ltd Gene silencing
NL1006681C2 (nl) 1997-07-29 1999-02-08 Gho St Holding Bv Toepassing van fysiologisch acceptabele vanadiumverbindingen, -zouten en -complexen.
GB9720148D0 (en) 1997-09-22 1997-11-26 Innes John Centre Innov Ltd Gene silencing materials and methods
ATE507299T1 (de) 1998-04-08 2011-05-15 Commw Scient Ind Res Org Verfahren und mittel zum erhalt von veränderten phänotypen
US6764851B2 (en) 1998-06-26 2004-07-20 Iowa State University Research Foundation, Inc. Materials and methods for the alteration of enzyme and acetyl CoA levels in plants
US6555732B1 (en) 1998-09-14 2003-04-29 Pioneer Hi-Bred International, Inc. Rac-like genes and methods of use
EP1033405A3 (en) 1999-02-25 2001-08-01 Ceres Incorporated Sequence-determined DNA fragments and corresponding polypeptides encoded thereby
US20100293669A2 (en) * 1999-05-06 2010-11-18 Jingdong Liu Nucleic Acid Molecules and Other Molecules Associated with Plants and Uses Thereof for Plant Improvement
DE69942750D1 (de) 1999-07-22 2010-10-21 Nat Inst Agrobio Res Verfahren zur superschnellen transformation von monokotyledonen
IL147950A0 (en) 1999-08-26 2002-08-14 Basf Plant Science Gmbh PLANT GENE EXPRESSION, CONTROLLED BY CONSTITUTIVE PLANT V-ATPase PROMOTERS
US20110131679A2 (en) * 2000-04-19 2011-06-02 Thomas La Rosa Rice Nucleic Acid Molecules and Other Molecules Associated with Plants and Uses Thereof for Plant Improvement
FR2808285B1 (fr) 2000-04-28 2004-10-15 Biogemma Fr Procede d'obtention de plantes presentant une resistance accrue a un stress hydrique
WO2003007699A2 (en) * 2001-06-22 2003-01-30 Syngenta Participations Ag Transcription factors of cereals
CN1342772A (zh) * 2001-10-24 2002-04-03 中国科学院成都生物研究所 一种农杆菌介导的植物转基因技术
PT1546336E (pt) 2002-09-18 2012-04-09 Mendel Biotechnology Inc Polinucleótidos e polipéptidos em plantas
DE602004004070T2 (de) * 2003-01-21 2007-08-16 Cropdesign N.V. Verwendung der regulatorischen sequenz des gos2-gens aus reis für die genexpression in dikotyledonen pflanzen oder pflanzenzellen
EP1801223B1 (en) 2003-02-04 2012-01-25 CropDesign N.V. Rice promoters
US6953880B2 (en) * 2003-02-28 2005-10-11 University Of Arkansas, N.A. Rice cultivar ‘Francis’
WO2004093530A2 (en) * 2003-04-22 2004-11-04 Agrinomics Llc Generation of plants with altered oil content
US20040216190A1 (en) * 2003-04-28 2004-10-28 Kovalic David K. Nucleic acid molecules and other molecules associated with plants and uses thereof for plant improvement
DE602004032374D1 (de) * 2003-06-24 2011-06-01 Agrigenetics Inc Erzeugung von pflanzen mit verbesserter toleranz gegenüber trockenheit
US7071380B1 (en) * 2003-08-29 2006-07-04 Agrigenesis Biosciences Limited Control of floral induction
US20060107345A1 (en) * 2003-09-30 2006-05-18 Nickolai Alexandrov Sequence-determined DNA fragments and corresponding polypeptides encoded thereby
US7439416B2 (en) * 2004-01-09 2008-10-21 The Carnegie Institution Of Washington Indeterminate gametophyte 1 (ig1)gene from Zea mays and uses thereof
BRPI0506620A (pt) * 2004-02-02 2007-05-08 Du Pont polinucleotìdeo isolado, subfragmento funcionalmente equivalente do polinucleotìdeo isolado, fragmento de ácido nucléico isolado, construção de dna recombinante, planta, semente, célula vegetal ou tecido vegetal transformado, método de alteração da estrutura de raiz, método de isolamento de fragmentos de ácido nucléico, método de mapeamento de variações genéticas e método de cultivo molecular
US20070270578A1 (en) * 2004-11-25 2007-11-22 Cropdesign N.V. Plants Having Increased Yield and a Method for Making the Same
US7582817B2 (en) 2005-03-23 2009-09-01 E.I. Du Pont De Nemours And Company Alteration of plant embryo/endosperm size during development

Cited By (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105524933A (zh) * 2016-01-20 2016-04-27 中国农业科学院生物技术研究所 OsJMJ714影响水稻籽粒大小以及盐胁迫耐性的功能及其应用
CN105524933B (zh) * 2016-01-20 2018-12-07 中国农业科学院生物技术研究所 OsJMJ714影响水稻籽粒大小以及盐胁迫耐性的功能及其应用
CN105734140A (zh) * 2016-03-30 2016-07-06 广东省农业科学院蔬菜研究所 茄子高温胁迫内参基因及其应用
CN105734140B (zh) * 2016-03-30 2017-06-30 广东省农业科学院蔬菜研究所 茄子高温胁迫内参基因及其应用
CN107058321A (zh) * 2017-04-13 2017-08-18 中国农业科学院作物科学研究所 miR156及其前体在调控小麦分蘖数中的应用
CN107058321B (zh) * 2017-04-13 2020-09-01 中国农业科学院作物科学研究所 miR156及其前体在调控小麦分蘖数中的应用
CN110183524A (zh) * 2019-06-11 2019-08-30 扬州大学 一个促进大豆主根伸长的基因GmKRP2a、蛋白及其应用
CN112680472B (zh) * 2019-10-17 2023-08-01 华南农业大学 ZmSPL基因在调控玉米冠根或气生根发育中的应用
CN112680472A (zh) * 2019-10-17 2021-04-20 华南农业大学 ZmSPL基因在调控玉米冠根或气生根发育中的应用
CN110734481A (zh) * 2019-11-12 2020-01-31 中国农业大学 番茄SlMIP蛋白及其编码基因在调控植物灰霉病抗性中的应用
CN110734481B (zh) * 2019-11-12 2021-02-19 中国农业大学 番茄SlMIP蛋白及其编码基因在调控植物灰霉病抗性中的应用
CN112375777A (zh) * 2020-08-05 2021-02-19 浙江大学 OsbHLH6在提高作物磷吸收能力及作物耐低磷育种中的应用
CN112375777B (zh) * 2020-08-05 2022-05-27 浙江大学 OsbHLH6在提高作物磷吸收能力及作物耐低磷育种中的应用
CN114250230B (zh) * 2020-09-24 2024-02-09 中国科学院遗传与发育生物学研究所 大豆组蛋白去甲基化酶GmJMJ30-2在调控植物耐逆性中的应用
CN114250230A (zh) * 2020-09-24 2022-03-29 中国科学院遗传与发育生物学研究所 大豆组蛋白去甲基化酶GmJMJ30-2在调控植物耐逆性中的应用
CN112575106A (zh) * 2020-12-17 2021-03-30 东北农业大学 基于转录因子基因ZmNAC89开发的与玉米耐盐碱相关的分子标记及其应用
CN115354042A (zh) * 2021-05-19 2022-11-18 湖南农业大学 一种启动子及其制备方法与应用
CN114231542B (zh) * 2022-01-21 2023-02-24 沈阳农业大学 一种影响山新杨耐盐性的bHLH基因及其应用
CN114231542A (zh) * 2022-01-21 2022-03-25 沈阳农业大学 一种影响山新杨耐盐性的bHLH基因及其应用
CN116286944A (zh) * 2022-12-09 2023-06-23 中国科学院华南植物园 组蛋白去甲基化酶SlJMJ10及其编码基因在调控番茄果实成熟中的应用
CN116286944B (zh) * 2022-12-09 2023-08-29 中国科学院华南植物园 组蛋白去甲基化酶SlJMJ10及其编码基因在调控番茄果实成熟中的应用
CN116536286A (zh) * 2023-05-12 2023-08-04 南京农业大学 水稻OsCTK1蛋白及其编码基因的应用
CN116536286B (zh) * 2023-05-12 2023-11-10 南京农业大学 水稻OsCTK1蛋白及其编码基因的应用

Also Published As

Publication number Publication date
US20150259698A1 (en) 2015-09-17
CA2900183A1 (en) 2008-11-13
EP2069509B1 (en) 2013-09-18
DE112008001044T5 (de) 2010-09-02
WO2008137108A3 (en) 2009-03-12
EP2505652B1 (en) 2015-10-14
ES2403281T3 (es) 2013-05-17
CN101802202A (zh) 2010-08-11
AU2008248189A1 (en) 2008-11-13
EP2228386A1 (en) 2010-09-15
AR067314A1 (es) 2009-10-07
EP2316956B1 (en) 2015-04-22
ES2539530T3 (es) 2015-07-01
EP2316956A3 (en) 2011-08-24
EP2069509A2 (en) 2009-06-17
US20100132071A1 (en) 2010-05-27
EP2505652A1 (en) 2012-10-03
CA2685223A1 (en) 2008-11-13
BRPI0823525A2 (pt) 2014-06-03
EP2316956A2 (en) 2011-05-04
BRPI0810703A2 (pt) 2012-12-25
MX2009011716A (es) 2009-12-11
EP2228386B1 (en) 2015-03-18
ES2558745T3 (es) 2016-02-08
EP2230310B1 (en) 2013-01-16
CN101802202B (zh) 2014-12-10
WO2008137108A2 (en) 2008-11-13
ES2542311T3 (es) 2015-08-04
EP2230310A1 (en) 2010-09-22
ES2437621T3 (es) 2014-01-13

Similar Documents

Publication Publication Date Title
CN101802202B (zh) 具有增强的产量相关性状的植物和用于制备该植物的方法
CN102656270B (zh) 具有增强的产量相关性状的植物和用于产生该植物的方法
CN102131934B (zh) 具有增强的产量相关性状的植物及其制备方法
CN101965405B (zh) 具有增强的产量相关性状的植物和用于制备该植物的方法
CN101765609B (zh) 具有增强的产量相关性状的植物和用于制备该植物的方法
US20110283420A1 (en) Plants having enhanced yield-related traits and a method for making the same
EP2377937A1 (en) Plants with reduced expression of a CLE-like gene having enhanced yield-related traits and a method for making the same
US20100199380A1 (en) Plants having enhanced yield-related traits and a method for making the same
CN102066568A (zh) 具有增强的产量相关性状的植物和用于产生该植物的方法
CN101855355A (zh) 具有提高的产量相关性状的植物和用于制备该植物的方法
CN104531751A (zh) 具有增强的产量相关性状的植物和用于产生该植物的方法
CN103233037A (zh) 具有增强的产量相关性状和/或提高的非生物胁迫抗性的植物和制备该植物的方法
CN104530202A (zh) 具有增强的产量相关性状的植物和用于产生该植物的方法
CN102224247A (zh) 具有改良的产量相关性状的植物和用于制备该植物的方法
CN102144033A (zh) 具有修饰的生长特征的植物及其制备方法
CN102066569A (zh) 具有增强的产量相关性状的植物和产生所述植物的方法
CN101415829A (zh) 具有增强的产量相关性状的植物和用于产生该植物的方法
CN103951741A (zh) 具有增强的产量相关性状的植物及其制备方法
CN102648282A (zh) 具有增强的产量相关性状的植物和用于产生该植物的方法
CN104745608A (zh) 具有增强的产量相关性状的植物及其制备方法
CN102099480A (zh) 具有增强的产量相关性状的植物和用于产生该植物的方法
CN102317312A (zh) 具有增强的产量相关性状和/或非生物胁迫耐受性的植物和用于制备此类植物的方法
CN102272309A (zh) 具有增强的非生物胁迫耐受性和/或增强的产量相关性状的植物及其制备方法
CN104328137A (zh) 具有增强的非生物胁迫耐受性和/或增强的产量相关性状的植物及其制备方法
CN102753693B (zh) 具有增强的产量相关性状的植物和用于产生该植物的方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
EXSB Decision made by sipo to initiate substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20150826

WD01 Invention patent application deemed withdrawn after publication