CN101213302B - 咖啡油质蛋白基因和启动子 - Google Patents

咖啡油质蛋白基因和启动子 Download PDF

Info

Publication number
CN101213302B
CN101213302B CN2006800242019A CN200680024201A CN101213302B CN 101213302 B CN101213302 B CN 101213302B CN 2006800242019 A CN2006800242019 A CN 2006800242019A CN 200680024201 A CN200680024201 A CN 200680024201A CN 101213302 B CN101213302 B CN 101213302B
Authority
CN
China
Prior art keywords
coffee
oleosin
gene
sequence
seed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2006800242019A
Other languages
English (en)
Other versions
CN101213302A (zh
Inventor
A·J·西姆金
J·G·麦卡锡
V·帕蒂尔
S·D·坦克斯雷
林晨炜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nestec SA
Cornell Research Foundation Inc
Original Assignee
Nestec SA
Cornell Research Foundation Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nestec SA, Cornell Research Foundation Inc filed Critical Nestec SA
Publication of CN101213302A publication Critical patent/CN101213302A/zh
Application granted granted Critical
Publication of CN101213302B publication Critical patent/CN101213302B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells
    • C12N15/8222Developmentally regulated expression systems, tissue, organ specific, temporal or spatial regulation
    • C12N15/823Reproductive tissue-specific promoters
    • C12N15/8234Seed-specific, e.g. embryo, endosperm
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/415Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells
    • C12N15/8222Developmentally regulated expression systems, tissue, organ specific, temporal or spatial regulation
    • C12N15/8223Vegetative tissue-specific promoters
    • C12N15/8225Leaf-specific, e.g. including petioles, stomata
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8242Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
    • C12N15/8243Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8242Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
    • C12N15/8243Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine
    • C12N15/8247Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine involving modified lipid metabolism, e.g. seed oil composition

Abstract

本发明公开了来自咖啡植物的编码油质蛋白和油体固醇蛋白的多核苷酸。还公开了来自咖啡油质蛋白基因的启动子序列,以及利用这些多核苷酸和启动子进行基因调控和操纵咖啡豆的风味、香味和其它特征的方法。

Description

咖啡油质蛋白基因和启动子
发明领域
本发明涉及农业生物技术领域。具体地,本发明涉及咖啡植物中编码油质蛋白(oleosin)和油体固醇蛋白(steroleosin)的多核苷酸、咖啡油质蛋白基因的启动子序列,以及利用这些多核苷酸和启动子调控基因,并对咖啡豆的风味、香味和其它特征进行操作的方法。 
发明背景 
整个说明书引用多种出版物,包括专利、公开的申请和学术文章。每一出版物在此处以其整体引入作为参考。在本说明书的最后可以找到在说明书中没有充分阐述的引用文献。 
咖啡的香味和风味是消费者偏好咖啡品种和品牌的关键因素。咖啡特有的香味和风味产生于咖啡豆焙烧过程中发生的涉及风味前体的一系列复杂的化学反应(梅拉德反应)。风味前体包括存在于绿色咖啡豆中的化学化合物和生物分子。迄今为止,已经鉴定出超过800种有助于咖啡风味和香味的化学品和生物分子(Montavon等,2003,J.Agric.Food Chem.,51:2328-34;Clarke&Vitzthum,2001,Coffee:Recent Developments. Blackwell Science)。 
由于咖啡消费者正变得日益成熟,为了满足消费者的偏好,期望生产香味和风味改良的咖啡。通过化学方法均可以人工赋予咖啡产品香味和风味。例如参见美国专利No.4,072,761(香味)和美国专利No.3,962,321(风味)。可选方法则是使用分子生物学技术,要么加入咖啡豆非天然产生的增强香味和风味的成分,要么增强咖啡豆天然存在的负责风味和香味的成分。遗传工程尤其适合于获得这样的结果。例如,不同咖啡物种中的咖啡蛋白 质可以进行互换。作为可选方法,可以增强编码天然产生的正面有助于咖啡风味的咖啡蛋白质基因的表达。反之,可以抑制编码天然产生的无益于咖啡风味的咖啡蛋白质基因的表达。 
内源性咖啡蛋白质的表达可以是遗传操作的靶标,并且已经根据经验确定这些咖啡蛋白质的产生是否以及在多大程度上应该被增强或抑制。11S储存蛋白质已被鉴定为一种这样的候选咖啡蛋白质(Montavon等,2003,J.Agric.Food Chem.51:2335-43)。咖啡油质蛋白因其在油储存中的作用,成为另一候选咖啡蛋白质。咖啡油是已知的咖啡香味和风味成分。例如,(E)-2-壬烯醛和反-反-2-4-癸二烯醛是咖啡香味非常重要的脂质衍生挥发物(Akiyama等,2003;Variyar等,2003)。因此,增加或降低这些油在咖啡豆中的储存将对咖啡香味和风味具有重大作用。油质蛋白也形成脂双层,并且也可以促进脂质含量。 
已在多种植物物种,包括油菜籽油菜(Keddie等,1992)、非洲油椰(NCBI)、棉花(Hughes等,1993)、向日葵(Thoyts等,1995)、大麦(Aalen等,1994;1995)、稻(Wu等,1998)、杏(Garcia-Mas等,1995)、可可(Guilloteau等,2003)和玉米(Qu和Huang,1990;Lee和Huang,1994)中检测到油质蛋白。在植物种子中,通过油质蛋白维持油体(也称油质体)。认为这些油体作为三酰基甘油(TAG)(Tzen等,1993)的储蓄库起作用。油质蛋白的一项功能是将种子中的脂储备物组织在小且易于进入的结构中(Huang等,1996)。种子油体直径范围为0.5至2μM(Tzen等,1993),提供高的表面积和体积比,认为这在油体表面通过脂肪酶介导的水解作用促进TAG快速转换成游离的脂肪酸(Huang等,1996)。在含大量油的种子,如油菜籽油菜中,油质蛋白占总蛋白质的8%-20%(Li等,2002),且油质蛋白占拟南芥油体相关蛋白质的79%(Jolivet等,2004)。油质蛋白覆盖在这些油体的表面(Huang,1996),认为它们在此处在种子干燥期间通过阻止油的聚结帮助稳定脂质体。在某些特化细胞中也发现相关的含脂颗粒。例如,绒毡层(参与花粉发育的结构)也含有称为绒毡层小体(tapetosome)的特异性油体样脂颗粒。这些油体样脂颗粒参与提供小孢子和花粉发育所 必需的功能组分(Murphy等,1998;Hernandez-Pinzon等,1999)。 
油质蛋白质由三个不同的结构域组成:中心保守的大约72个氨基酸的疏水片断以及两侧高度可变的N-末端羧基基序和C-末端兼性α-螺旋(Huang,1996;Li等,2002)。氨基和羧基部分的长度高度可变,因而,油质蛋白的大小范围为14到45kDa(Tai等,2002;Kim等,2002)。兼性的氨基和羧基部分允许蛋白质稳定存在于油体的表面(Huang,1996)。疏水区中心的氨基酸包括三个保守的脯氨酸和一个保守的丝氨酸,可形成脯氨酸节(KNOT)基序。该基序据信允许中心片断折叠成疏水的发卡结构,可将油质蛋白锚定在油性中心基质中(Huang,1996)。Abell等人(1997)进一步研究了脯氨酸KNOT基序在蛋白质功能中的作用,他们表明如果三个脯氨酸残基被取代为亮氨酸残基,无论是瞬时的胚表达还是在稳定转化的种子中,油质蛋白-β-葡糖醛酸糖苷酶融合蛋白质均不能靶向油体。 
根据相对分子量已将油质蛋白分为高Mr或低Mr同工型(H-和L-油质蛋白)两类(Tzen等,1990)。序列分析表明H-和L-油质蛋白之间的主要区别是H-油质蛋白的C-末端结构域插入18个残基(Tai等,2002),并且Tzen等人(1998)已表明两种形式共存于油体中。在玉米(Zea mays)中,Lee和Huang(1994)鉴定到分子量分别为16、17和18 kDa的三个基因,即OLE16、OLE17和OLE18在种子成熟期间表达。在分离的油体中,相应的蛋白质比例分别是2∶1∶1(Lee和Huang,1994;Ting等,1996)。Lee等人(1995)把OLE16归为L-油质蛋白,而OLE17和OLE18归为H-油质蛋白,表明玉米的油体含有等量的H-和L-油质蛋白。此外,发现稻胚的油体含有相似量的分子量为18和16 kDa的两种不同的油质蛋白,分别对应于H-型和L-型(Tzen等,1998;Wu等,1998)。在可可(Theobroma cacao)的种子中也鉴定到两种油质蛋白(Guilloteau等,2003)。15和16.1kDa的这些蛋白质分别代表L-型和H-型。 
Kim等人(2002)已将拟南芥(Arabidopsis)中的油质蛋白基因表征为三组。第一组由在种子(S)中特异性表达的油质蛋白组成,第二组在种子和花的小孢子(SM)中表达,最后一组在小花绒毡层(T)中表达。在拟南芥基因 组已鉴定的16种油质蛋白基因中,5种基因显示在正在成熟的种子中特异性表达,3种基因在正在成熟的种子和花的小孢子中表达,8种在花的绒毡层中表达(Kim等,2002)。先前Wu等人(1999)已将拟南芥的5种种子特异性油质蛋白分成3种H-型油质蛋白和2种L-型油质蛋白。芝麻、玉米和稻都已显示编码3种种子特异性油质蛋白(Tai等,2002;Ting等,1996;Chuang等,1996;Wu等,1998;Tzen等,1998)。 
油质蛋白的表达被认为主要在转录水平上受发育和空间调控(Keddie等,1994)。Wu等人(1998)表明两种稻油质蛋白的转录物在授粉后七天出现,并在成熟种子中消失。Guilloteau等人(2003)获得相似的结果,他们表明两种可可油质蛋白转录物的水平在成熟种子中降低。尽管已对许多种子类型中的油质蛋白基因的转录用半定量的方式进行了研究,但是还未有对种子发育期间一类种子中大部分或者全部油质蛋白的转录水平进行定量测定的报道。 
尽管已知咖啡种子含10%至16%的油含量这一事实,但有关咖啡中的油质蛋白质仍知之甚少。关于咖啡油质蛋白的数目、它们的蛋白质结构、它们在整株咖啡植物或不同咖啡物种中的表达水平和分布、它们的油储存能力,以及它们在分子水平上的表达调控缺乏科学数据。因此,有必要鉴定并表征咖啡油质蛋白质、基因和遗传调控元件。这样的信息可以以改良包括油含量和稳定性在内的一个或多个咖啡特性为目的,对咖啡油质蛋白质进行遗传操作,进而影响烘焙参数,最终影响咖啡的香味和风味。 
为了增加或抑制咖啡蛋白质(比如油质蛋白)的产量,需要有一组可以利用的,与咖啡植物相容的启动子。此外,任何遗传操作应该理想地主要或唯一局限于咖啡种子,并且不应该对咖啡植物的增殖或繁育产生有害作用。 
已经对种子特异性启动子进行了描述。这些启动子的例子包括以下基因的5’调控区:十字花科蛋白(crucipheran)(美国专利No.6,501,004)、napin(Kridl等,Seed Sci.Res.1:209:219,1991)、菜豆蛋白(phaseolin)(Bustos等,Plant Cell,1(9):839-853,1989)、大豆胰蛋白酶抑制剂(Riggs等,Plant Cell 1(6):609-621,1989)、ACP(Baerson等,Plant Mol.Biol.,22(2):255-267,1993)、硬脂酰ACP去饱和酶(Slocombe等,Plant Physiol.104(4):167-176,1994)、大豆β-伴大豆球蛋白α亚基(P-Gm7S,Chen等,Proc.Natl.Acad.Sci.83:8560-8564,1986)、蚕豆(Vicia faba)USP(P-Vf.Usp,美国专利申请系列号No.10/429,516)。另外,已描述了玉米L3油质蛋白启动子(P-Zm.L3,Hong等,Plant Mol.Biol.,34(3):549-555,1997)。 
种子特异性启动子已在植物转化中找到应用。例如,有研究小组已经使用遗传操作改变种子组分的水平。参见Selvaraj等,美国专利No.6,501,004,Peoples等美国专利No.6,586,658,Shen等,美国专利申请系列号No.10/223,646,Shewmaker等,美国专利申请系列号No.10/604,708,和Wahlroos等,美国专利申请系列号No.10/787,393。众所周知,油质蛋白启动子已经成功用于这些系统中。 
然而,种子特异性启动子,更具体的咖啡油质蛋白启动子迄今仍未运用到咖啡植物的转化中。因此,急需获得其他基因调控序列以控制咖啡蛋白质的表达。同样的,急需获得基因调控序列以控制油质蛋白在咖啡植物中的表达。此外,急需获得基因调控序列以控制咖啡蛋白质在咖啡种子中的表达。在这点上,特异于咖啡种子中基因表达的启动子是非常吸引人的候选启动子,咖啡油质蛋白启动子就在这些启动子之中。 
发明概述 
本发明的一个方面涉及从咖啡属物种(Coffea spp.)中分离的核酸分子,具有编码油质蛋白的编码序列。在某些实施方案中,编码序列编码的油质蛋白的分子量为大约14kDa到大约19kDa。 
在某些实施方案中,编码序列编码油质蛋白片断,例如,(a)SEQ IDNO:8或9第1位至大约第27位、大约第28位至大约第109位、或者大约第110位至C-末端的残基;(b)SEQ ID NO:10第1位至大约第15位、大约第16位至大约第89位、或者大约第90位至C-末端的残基;(c)SEQID NO:11第1位至大约第30位、大约第31位至大约第114位、或者大 约第115位至C-末端的残基;(d)SEQ ID NO:12第1位至大约第18位、大约第19位至大约第89位、或者大约第90位至C-末端的残基;或者(e)SEQ ID NO:13第1位至大约第40位、大约第41位至大约第115位、或者大约第116位至C-末端的残基。在某些实施方案中,编码的油质蛋白具有的氨基酸序列与SEQ ID NO:8-13中任一的同一性大于80%。 
本发明的另一个方面涉及从咖啡属物种(Coffea spp.)中分离的核酸分子,具有编码油体固醇蛋白的编码序列。在某些实施方案中,核酸分子编码油体固醇蛋白片断,例如,SEQ ID NO:14第1位至大约第50位、大约第50位至大约第80位、大约第81位至大约第102位、大约第103位至大约第307位、以及大约第308位至羧基末端的残基。在其它实施方案中,核酸分子编码的油体固醇蛋白具有的氨基酸序列与SEQ ID NO:14的同一性大于80%。 
以上描述的编码咖啡油质蛋白或油体固醇蛋白的核酸分子可以是若干形式之一,包括(1)具有包含编码序列的开放阅读框的基因,(2)该基因转录所产生的mRNA分子,(3)该mRNA逆转录所产生的cDNA分子,或者(4)长度8至100个碱基的寡核苷酸,其与核酸分子任一上述形式的片断互补。 
本发明的其它方面涉及包含上述编码咖啡油质蛋白或油体固醇蛋白的核酸分子的载体。在某些实施方案中,载体是表达载体,比如质粒、粘粒、杆状病毒、杆粒(bacmid)、细菌、酵母或病毒载体。在某些实施方案中,载体包含与组成型启动子有效连接的油质蛋白或油体固醇蛋白编码序列。在其它实施方案中,编码序列与诱导型启动子有效连接。在其它实施方案中,编码序列与组织特异性启动子有效连接,在某些实施方案中是种子特异性启动子,在特定实施方案中是咖啡种子特异性启动子。在那些实施方案中,咖啡种子特异性启动子可以是油质蛋白基因启动子。 
本发明的另一个方面涉及用以上所述类型的载体转化的宿主细胞。宿主细胞可以是植物细胞、细菌细胞、真菌细胞、昆虫细胞或者哺乳动物细胞。在某些实施方案中,宿主细胞是植物细胞,可以来源于咖啡、烟草、拟南芥、玉米、小麦、稻、大豆、大麦、黑麦、燕麦、高粱、苜蓿、三叶 草、芸苔、红花、向日葵、花生、可可、粘果酸浆(tomatillo)、马铃薯、胡椒、茄子、甜菜、胡萝卜、黄瓜、生菜(lettuce)、豌豆、紫菀、秋海棠、菊花、飞燕草、百日草和草坪草。本发明还涉及从植物细胞产生的可育植物。 
本发明的另一个方面涉及调节咖啡豆风味或香味的方法,包括调节咖啡种子中一种或多种油质蛋白或油体固醇蛋白的产生。在某些实施方案中,所述方法包括增加一种或多种油质蛋白或油体固醇蛋白的产生,例如通过增强咖啡种子中一种或多种内源性油质蛋白或油体固醇蛋白基因的表达,或者通过将编码油质蛋白或油体固醇蛋白的转基因引入植物中。在其它实施方案中,所述方法包括降低一种或多种油质蛋白或油体固醇蛋白的产生,例如通过将抑制油质蛋白或油体固醇蛋白基因表达的核酸分子引入咖啡中。 
本发明的另一个方面涉及从编码油质蛋白的咖啡植物基因中分离的启动子。在某些实施方案中,启动子从编码油质蛋白的基因中分离,所述油质蛋白的氨基酸序列与SEQ ID NO:8-13中任一的同一性大于80%。在特定的实施方案中,启动子包含一个或多个选自TTAAAT、TGTAAAGT、CAAATG、CATGTG、CATGCAAA、CCATGCA和ATATTTATT的调控序列。在具体的实施方案中,启动子包含SEQ ID NO:15。 
本发明的另一个方面涉及包含油质蛋白基因启动子的嵌合基因,其有效连接于一个或多个编码序列。还涉及包含此类嵌合基因的载体、宿主细胞和可育转基因植物。 
本发明的其它特征和优点将通过参照以下的附图、详细说明和实施例加以理解。 
附图的简短说明 
图1.咖啡属蛋白质序列的最佳比对。比对利用Lasergene软件包(DNASTAR)中的clustal W程序产生,然后人工调整优化比对。显示了保守的P-(5X)-SP-(3X)-P脯氨酸结基序的分布,粗体表示高度保守的脯氨酸和丝氨酸。保守序列以方框圈出。H-型插入(见图4)以加深的方框圈出。 比对的油质蛋白序列的登录号是:CaOLE-1(SEQ ID NO:8;AY928084)、CcOLE-1(SEQ ID NO:9;AY841271)、CcOLE-2(SEQ ID NO:10;AY841272)、CcOLE-3(SEQ ID NO:11;AY841273)、CcOLE-4(SEQ IDNO:12;AY841274)和CcOLE-5(SEQ ID NO:13;AY841275)。 
图2.中粒种咖啡(Coffea canephora)油体固醇蛋白即CcSTO-1序列与两个最接近的数据库序列的最佳比对。比对的油质蛋白序列的登录号:CAB39626代表拟南芥(A.thaliana)(At)(AtSTOLE-7,SEQ ID NO.:17),AY841276代表中粒种咖啡(SEQ ID NO:14),而AF498264代表芝麻(Sesamum indicum)(Lin和Tzen,2004)(SiSTO-B,SEQ ID NO.:16)。比对利用Lasergene软件包(DNASTAR)中的clustal W程序产生,然后人工调整优化比对。保守区域以方框圈出。显示了保守的S-(12X)-Y-(3X)-K潜在活性位点和P-(11X)-P脯氨酸KNOT基序的分布,粗体表示高度保守的残基(Lin等,2002)。也显示了Lin等人(2002)所鉴定的NADPH和固醇结合区域。 
图3.基于ClustalW的5种中粒种咖啡油质蛋白和16种拟南芥油质蛋白的系统发生。每个基因的完整蛋白质序列用Lasergene包的Clustal W程序进行比对,然后人工调整优化比对。为阐明多种序列之间可能的进化关系,比对结果用系统发生树的形式表示。标尺代表作为相邻之间残基变化数的分支距离。显示了拟南芥的H-和L-型。拟南芥序列的分布显示为种子/小孢子(SM)、种子(S)和绒毡层(T)。比对的油质蛋白序列的登录号:AAF01542、BAB02690、CAA44225、Q39165、AAO22633、AAF69712、BAB02215、AAC42242、NP196368、NP196369、CAB87942、NP196371、NP196372、NP196373、NP196377和NP200969,分别代表拟南芥S1、S2、S3、S4、S5、SM1、SM2、SM3、T1、T2、T3、T4、T5、T6、T7和T8。 
图4.油质蛋白C-末端结构域含18个残基H-型插入基序的区域的最佳比对。使用clustalW程序将所有咖啡油质蛋白含18个残基插入位点的区域与从其它植物物种中选择的油质蛋白进行比对,随后进行人工优化步 骤。保守残基以方框圈出;粗体是保守性最高的残基。比对的油质蛋白序列的登录号:AAF01542、BAB02690、CAA44225、Q39165和AAO22633,代表拟南芥种子1(S1)、S2、S3、S4、和S5(Kim等,2002;Tai等,2002)(分别为SEQ ID NO.:18-22);AY928084代表小粒种咖啡(Coffea arabica)OLE-1(SEQ ID NO.:1);P21641、S52030和S52029代表玉米H1、H2和L(分别为SEQ ID NO.:23-25);U43931、U43930和BAD23684代表稻H、L1和L2(分别为SEQ ID NO.:26-28);U97700(Chen等,1997)AF302807和AF091840(Tai等,2002)代表芝麻H2、H1和L(分别为SEQ IDNO.:29-31);AF466102和AF466103代表可可16.9和15.8(Guilloteau等,2003)(分别为SEQ ID NO.:32-33)。 
图5.在不同组织中和种子成熟期间中粒种咖啡和小粒种咖啡油质蛋白基因的表达。使用常规(柱状图上方插入的图)以及定量RT-PCR(柱状图)确定A)OLE-1、B)OLE-2、C)OLE-3、D)OLE-4、E)OLE-5在多种组织、发育中的种子以及不同阶段咖啡浆果果皮组织中的转录水平。相对于相同样品中组成型表达的RPL39基因转录物的表达确定表达水平。F)显示了所有组织和样品中RPL39对照转录物。SG,小绿种子;LG,大种子;YG,黄种子;RG,成熟种子;SP,小绿果皮;LP,大果皮;YP,黄果皮;RP,红果皮;St,茎;Le,叶;Fl,花;Rt,根。 
图6.咖啡油质蛋白和油体固醇蛋白基因的表达。A)在不同组织中和种子成熟期间,编码中粒种咖啡和小粒种咖啡11S储存蛋白质的CSP1基因的表达。用等量的总RNA进行逆转录。SG,小绿种子;LG,大种子;YG,黄种子;RG,成熟种子;SP,小绿果皮;LP,大果皮;YP,黄果皮;RP,红果皮;St,茎;Le,叶;Fl,花;Rt,根。B)通过定量PCR确定多种组织中油体固醇蛋白的表达。C)种子萌发期间小粒种咖啡(T-2308)油体固醇蛋白的表达。在五个不同萌发阶段的种子中分析转录水平:成熟(完全发育种子)、T0(随即进行吸胀)、2DAI(吸胀后两天)、5DAI、30DAI和60DAI。 
图7.种子发芽阶段小粒种咖啡(T-2308)中油质蛋白转录水平。在五个不同萌发阶段的种子中分析转录水平:T0(随即进行吸胀)、3DAI(吸胀后 三天)、5DAI、30DAI和60DAI。 
图8.CcOLE-1基因的基因组序列In silico研究。序列中用下划线标示的是用于基因步行(genewalker)的引物。显示了CcOLE-1启动子(pOLE-1,SEQ ID NO.:15)的序列分析。显示了来自于中粒种咖啡的OLE-1的核苷酸和推导的蛋白质序列(SEQ ID NO:2,SEQ ID NO:9)。箭头标示转录起始位点。(===)显示可能的TATA-box。RY-基序以方框圈出。显示了‘胚乳基序’(……),富含AT的增强子样基序(~~~)和E-Box(●-●)。储存在EMBL/Genebank数据库的CcOLE-1启动子(pOLE-1,SEQ ID NO.:15)序列的登录号是AY841277。粗体显示CcOLE-1完整的转录序列。从密码子第一个碱基下方起显示CcOLE-1氨基酸。起始和终止密码子以方框圈出。距转录起始位点123bp位置是HindIII限制性酶切位点。 
图9.每个中粒种咖啡蛋白质序列与四个最接近数据库序列的最佳比对。图9A)CcOLE-1(AY841271);图9B)CcOLE-2(AY841272);图9C)CcOLE-3(AY841273);图9D)CcOLE-4(AY841274)和图9E)CcOLE-5(AY841275)。利用Lasergene软件包(DNASTAR)的Clustal W程序产生比对,然后人工调整优化比对。保守的P-(5X)-SP-(3X)-P脯氨酸结基序的定位以上划线标出,且保守的P和S残基以方框圈出。保守序列以方框圈出;粗体表示高度保守区域。比对的油质蛋白序列的登录号:AAF69712和BAB02215代表拟南芥种子/小孢子1(SM1)和SM2(Kim等,2002)(分别为SEQ ID NO.41、42);AY928084代表小粒种咖啡(Ca)OLE-1(SEQ IDNO.:1);AAO65960代表欧洲榛子(Corylus avellana)(Cav)OLE-L(SEQ IDNO.:38);T10121代表脐橙(Citrus sinensis)OLE(SEQ ID NO.:36)(Naot等,1995);AAL92479代表木犀榄(Olea europaea)OLE;Q43804代表扁桃(Prunus dulcis)PdOLE-1(SEQ ID NO.:37)(Garcia-Mas等,1995);AAG24455、AAG09751、AAG43516和AAG43517代表紫苏(Perillafrutescens)OLN-Lb、OLN-La和OLN-Sa(分别为SEQ ID NO.:39,40,和35)以及U97700(Chen等,1997);AF302807和AF091840(Tai等,2002)代表芝麻H2、H1和L(分别为SEQ ID NO.:29-31)。 
图10.中粒种咖啡油质蛋白家族的疏水性谱图。根据Kyte和Doolittle(1982)的方法,使用Lasergene软件包(DNASTAR)中适当的程序产生亲疏水图。负值表示疏水区域。箭头显示脯氨酸结基序的位置。图10(F)是亲水性图。 
图11.CcOLE-1基因的Southern印迹分析。中粒种咖啡基因组中OLE-1拷贝数的计算。罗巴斯塔(robusta)基因组DNA用DraI、SspI、NotI、RsaI或HindIII/SspI和DraI/RsaI进行酶切。用p32标记的包括3’和5’非翻译区的全长cDNA在基因组印记中探测CcOLE-1。呈现的放射自显影照片在-80℃曝光10天。 
图12.在干旱胁迫下小粒种咖啡(卡蒂姆(catimor))叶子中OLE-1的表达。用定量RT-PCR确定OLE-1的转录水平。相对于相同样品中组成型表达的rpl39基因转录物的表达确定表达水平。各例中未予标记的柱代表在三个良好供水对照中的平均转录水平。杂乱标记的柱表示在三个独立的水胁迫植物中的转录水平。 
举例说明性实施方案的详细描述 
定义: 
在整个说明书和权利要求书中使用涉及本发明生物分子和其它方面的多种术语。 
“分离的”指对自然状态通过“人工”进行改变。如果组合物或物质在自然界中存在,如果它从原初的环境中被改变或者被移取,或者两者兼而有之,则它就被“分离”。例如,自然存在于活的植物或动物中的多核苷酸或多肽不是“分离的”,但是同其自然状态的共存物质分开的同样的多核苷酸或多肽是“分离的”,正如在这里使用的术语所表示的那样。 
“多核苷酸”,也称作“核酸分子”,通常指任一多聚核糖核苷酸或多聚脱氧核糖核苷酸,可以是未修饰的RNA或DNA或者修饰的RNA或DNA。“多核苷酸”包括并非限制性的单链和双链DNA、单链和双链区混合的DNA、单链和双链RNA、单链和双链区混合的RNA、以及由DNA 和RNA组成的杂合分子,此杂合分子可以是单链、或者更通常的双链、或单链和双链区的混合物)。此外,“多核苷酸”还指由RNA或DNA或RNA和DNA两者组成的三链区。术语多核苷酸也包括含一个或多个修饰碱基的DNA或RNA,以及为了稳定性或为了其它原因主链经修饰的DNA或RNA。例如,“修饰”碱基包括三苯甲基化的碱基和稀有碱基,比如肌苷。DNA和RNA能进行多种修饰;因此,“多核苷酸”包括经化学、酶促或代谢修饰的多核苷酸形式,正如通常在自然界中发现的那样,以及病毒和细胞特有的化学形式的DNA和RNA。“多核苷酸”还包括相对短的多核苷酸,通常称为寡核苷酸。 
“多肽”指由两个或多个氨基酸通过肽键或修饰的肽键(比如肽电子等排体)相互连接组成的任何肽或蛋白质。“多肽”既指短链多肽(通常称为肽、寡肽或低聚物)又指长链多肽(一般称为蛋白质)。多肽可以包括除了20个基因编码的氨基酸之外的氨基酸。“多肽”包括或通过自然过程(如,翻译后加工),或通过本领域熟知的化学法修饰技术修饰的氨基酸序列。在基础的教科书、更详细的专著以及大量的研究文献中都充分描述了这样的修饰。修饰能够发生在多肽的任何位置,包括肽主链,氨基酸侧链以及氨基或羧基末端。应当理解相同类型的修饰可以在给定多肽的若干位点以相同或不同的程度呈现。此外,给定的多肽可以包括许多类型的修饰。作为泛素化的结果,多肽可以是分支状,以及具有分支或没有分支的环状。可以通过自然的翻译后加工产生或者可以通过合成方法制得环状、分支状和分支环状多肽。修饰包括乙酰化、酰化、ADP核糖基化、酰胺化、共价结合核黄素、共价结合亚铁血红素部分、共价结合核苷酸或核苷酸衍生物、共价结合脂质或脂质衍生物、共价结合磷脂酰肌醇、交联、环化、形成二硫键、去甲基化、形成共价交联、形成胱氨酸、形成焦谷氨酸、甲酰化、γ-羧化、糖基化、形成GPI锚定、羟基化、碘化、甲基化、豆蔻酰化、氧化、蛋白水解过程、磷酸化、异戊烯化、外消旋化、硒化(selenoylation)、硫酸化、转移核糖核酸介导的蛋白质中的氨基酸添加(如,精氨酰化)以及泛素化。例如,参见Proteins-Structure and Molecular Properties,第2 版,T.E.Creighton,W.H.Freeman and Company,New York,1993和Wold,F.,Posttranslational Protein Modifications:Perspectives andProspects,第1-12页  in Posttranslational Covalent Modification ofProteins,B.C.Johnson编辑,Academic Press,New York,1983;Seifter等,″Analysis for Protein Modifications and Nonprotein Cofactors″,MethEnzymol(1990)182:626-646和Rattan等,″Protein Synthesis:Posttranslational Modifications and Aging″,Ann NY Acad Sci(1992)663:48-62。 
“变体”作为本文中使用的术语,是分别与参照多核苷酸或多肽不相同,但仍保留基本特征的多核苷酸或多肽。典型的多核苷酸变体在核苷酸序列上与另一参照多核苷酸不同。变体核苷酸序列的变化也许改变或者不改变由参照多核苷酸编码的多肽的氨基酸序列。核苷酸的改变也许导致参照序列编码的多肽中的氨基酸取代、添加、缺失、融合以及截短,正如以下讨论的那样。通常的多肽变体在氨基酸序列上与另一参照多肽不同。一般情况下,差异是有限的,从而参照多肽和变体的序列总体上密切相似,并且在许多区域是完全一致的。变体和参照多肽可以由于一个或多个取代、添加或缺失以任意组合而在氨基酸序列上不同。取代或插入的氨基酸残基也许是或者不是遗传密码编码的残基。多核苷酸或多肽的变体可以自然存在,例如等位基因变体,或者可以是自然界未知的变异。可以通过诱变技术或直接合成制备非自然存在的多核苷酸和多肽变体。 
就突变植物而言,术语“无效突变体”或“功能缺失突变体”用于指代突变引起基因产物无功能或大量缺失的生物体或基因组DNA序列。此类突变可能发生在基因的编码和/或调控区域,可以是单个残基的改变,或者核酸区域的插入或缺失。这些突变也可以发生在其它基因的编码和/或调控区域,他们自身也许调控或控制基因和/或编码的蛋白质,从而引起蛋白质无功能或大量缺失。 
术语“基本上相同”指序列变异不实质上影响蛋白质性质(即蛋白质的结构、稳定特性、底物特异性和/或生物活性)的核酸或氨基酸序列。就 给定的核酸序列而言,术语“基本上相同”特指编码区和和控制表达的保守序列,并且主要指编码相同氨基酸的简并密码子,或者在编码多肽中编码保守取代氨基酸的替代密码子。就氨基酸序列而言,术语“基本上相同”主要指不参与决定结构或功能的多肽区域的保守取代和/或变异。 
本文中术语“同一性百分比”和“相似性百分比”也用于氨基酸及核酸序列之间的比较。当指氨基酸序列的时候,  “同一性”或“同一性百分比”指通过序列分析程序得出的受试氨基酸序列与比较氨基酸序列中相同氨基酸匹配的氨基酸百分比。  “相似性百分比”指受试氨基酸序列与相同或保守氨基酸匹配的氨基酸百分比。保守氨基酸是那些结构不同但物理性质相似的氨基酸,因此一个与另一个的交换不会明显地改变所得蛋白质的三级结构。Taylor(1986,J.Theor.Biol.119:205)定义了保守取代。当指核酸分子时,  “同一性百分比”指通过序列分析程序得出的受试核酸序列与相同核苷酸匹配的核苷酸百分比。 
“同一性”和“相似性”很容易用已知的方法计算。核酸序列和氨基酸序列能用比对核酸或氨基酸相似序列的计算机程序进行比较,从而定义差异。首选的方法中,使用BLAST程序(NCBI)和其中用到的参数,并且利用DNAstar系统(Madison,WI)比对基因组DNA序列的序列片断。不过,通过使用任何标准比对软件都能获得等同的比对和相似性/同一性评估。例如,利用从Genetics Computer Group in Madison,Wisconsin得到的GCGWisconsin Package version 9.1以及此程序使用的缺省参数(空位创建罚分=12,空位延伸罚分=4)也可以比较序列的同一性和相似性。 
在此处使用的“抗体”包括多克隆抗体和单克隆抗体、嵌合、单链、人源抗体以及抗体片断(如Fab、Fab’、F(ab’)2和Fv),包括Fab或其它免疫球蛋白表达库的产物。对于抗体而言,术语“免疫学特异性”或“特异性”指抗体结合目的蛋白的一个或多个表位,但是基本上不识别和结合含抗原生物分子混合群的样品中的其它分子。确定抗体结合特异性的筛选测定法在本领域众所周知,并可常规操作。对这类测定法的全面讨论见Harlow等(编辑),ANTIBODIES A LABORATORY MANUAL;Cold Spring Harbor Laboratory;Cold Spring Harbor,NY(1988),第6章。 
术语“基本上纯”指制品包含至少50-60%以重量计的目的化合物(如,核酸、寡核苷酸、蛋白质等)。更优选制品包含至少75%以重量计的目的化合物,最优选包含90-99%以重量计的目的化合物为。通过适于目的化合物的方法(如,色谱法、琼脂糖或聚丙烯酰胺凝胶电泳、HPLC分析等等)测量纯度。 
对于单链核酸分子,术语“特异性杂交”指具有充分互补的序列、从而能够在本领域通常使用的预设条件下进行此类特异性杂交的(有时称为“基本上互补的”)两条单链核酸分子之间的缔合。具体来说,该术语指寡核苷酸与包含在单链DNA或RNA分子内的基本上互补的序列杂交,基本上排除该寡核苷酸与非互补序列的单链核酸杂交。 
“编码序列”或“编码区”指当序列表达时,具有产生基因产物必需的序列信息的核酸分子。编码序列可以包含翻译区内的非翻译序列(如,内含子或者5’或3’非翻译区),或者可以缺失这样的非翻译序列(如,在cDNA中)。 
“内含子”指核酸中不编码有关蛋白质合成信息的多核苷酸序列。这样的序列转录成mRNA,但在mRNA翻译成蛋白质之前被去除。 
术语“有效连接”或“有效插入”指将对编码序列表达必需的调控序列放置在核酸分子中相对于编码序列恰当的位置上,从而使编码序列能够表达。作为例子,当启动子能控制编码序列的转录或表达时,启动子与该编码序列有效连接。编码序列能以正义或反义取向与启动子或调控序列有效连接。术语“有效连接”有时适用于其它转录调控元件(如增强子)在表达载体中的排布。 
DNA调控序列是转录和翻译控制序列,例如确保编码序列在宿主细胞中表达的启动子、增强子、多聚腺苷酸信号、终止子等等。 
术语“启动子”、“启动子区”或“启动子序列”通常指基因的转录调控区,可见于编码区的5’或3’端,或者编码区内,或者内含子内。一般情况下,启动子是DNA调控区,能结合细胞内RNA聚合酶并起始下游(3’ 方向)编码序列的转录。一般5′启动子序列在其3′末端以转录起始位点为界,并向上游(5′方向)延伸,包括以高于背景的可检测水平起始转录所必需的最小数目的碱基或元件。启动子序列内部是转录起始位点(用S1单链核酸酶作图可方便地确定)以及负责结合RNA聚合酶的蛋白质结合结构域(共有序列)。 
“载体”是复制子,比如质粒、噬菌体、粘粒或病毒,另一个核酸区段可有效插入其中,从而引起所述区段的复制或表达。 
术语“核酸构建体”或“DNA构建体”有时用于指编码序列或者有效连接于适当调控序列并插入到载体中的序列,用于转化细胞。这个术语可与术语“转化DNA”或“转基因”互换使用。这样的核酸构建体可以包含目的基因产物的编码序列,连同可选择标记基因和/或报告基因。 
“标记基因”或“可选择标记基因”是这样的基因,其编码的基因产物赋予含有该基因的细胞这样的特征,能将其从不含该基因的细胞中选择出来。用于遗传工程的载体通常包含一个或多个可选择标记基因。可选择标记基因的类型包括:(1)抗生素抗性基因,(2)除草剂耐受或抗性基因,以及(3)代谢或营养缺陷型标记基因,它们能够使转化的细胞合成必需成分,通常是氨基酸,否则所述细胞不能产生此必需成分。 
“报告基因”也是一类标记基因。一般它编码的基因产物可以通过标准的实验室方法(如酶活性、荧光)进行测定或检测。 
术语基因的“表达”  (动词、形容词或名词词性)指基因产物的生物合成。该过程涉及基因转录为mRNA,然后mRNA翻译成一个或多个多肽,并包括所有自然发生的翻译后修饰。 
“内源”指能在指定的生物体中自然找到的任一组分,例如,基因或核酸或多肽。 
核酸构建体的“异源”区域是较大分子内部可识别的一个(或多个)核酸分子区段,而在自然界中并不与所述较大分子缔合在一起。因此,当异源区域包含个基因时,通常该基因两侧的DNA并不在来源生物体基因组中基因组DNA的两侧。在另一个例子中,异源区域是编码序列本身不 存在于自然界中的构建体(如,cDNA但是基因组编码序列包含内含子,或者具有与天然基因不同的密码子的合成序列)。正如在此处定义的,等位基因变异或自然发生的突变事件不产生DNA的异源区。术语“DNA构建体”,正如上面定义的,也用于指异源区域,尤其是构建用于细胞转化的DNA构建体。 
当内源或异源DNA被引入细胞内部时,细胞被这样的DNA“转化”或“转染”。转化DNA可以整合(共价连接)到细胞基因组中,也可以不整合。例如,在原核生物、酵母和哺乳动物细胞中,转化DNA可以在游离型元件(比如质粒)中维持。就真核细胞而言,稳定转化的细胞内的转化DNA已整合到染色体中,从而通过染色体复制在子代细胞中遗传。这种稳定性可通过真核细胞建立由含有转化DNA的子代细胞群组成的细胞系或克隆的能力来证明。“克隆”是通过有丝分裂而来源于一个单细胞或共同祖先的细胞群。“细胞系”是能够在体外稳定生长许多代的原代细胞的克隆。 
“种粒”、“种子”或“豆”指开花植物的繁殖单位,能发育成另一株这样的植物。如本文中所用的,尤其是对于咖啡植物而言,这些术语作为同义词互换使用。 
如本文中所用的,术语“植物”包括提及的整株植物、植物器官(如,叶、茎、芽、根)、种子、花粉、植物细胞、植物细胞细胞器和它们的子代。应当理解本发明范围内转基因植物的部分包括,如,起源于转基因植物或它们子代的植物细胞、原生质体、组织、愈伤组织、胚以及花、茎、种子、花粉、果实、叶或根。 
说明:
本发明的方面之一涉及来自于咖啡、编码多种油质蛋白以及油体固醇蛋白的核酸分子。在拥有超过47,000个表达序列标签(EST)的数据库中鉴定了编码油质蛋白和油体固醇蛋白核酸分子的代表性例子,这些EST来源于若干中粒种咖啡(robusta)cDNA文库,且该cDNA文库由从幼叶以及 在不同发育阶段采集的咖啡浆果种粒和果皮组织中分离的RNA组成。重叠的EST已被鉴定并“簇集”形成包含完整编码序列的单基因(unigene)(重叠群)。针对NCBI(National Center for Biotechnology Information)非冗余蛋白质数据库,通过进行BLAST寻找每个个体序列来注释单基因序列。在种粒发育阶段表达的5个单基因的开放阅读框被注释为编码经确定为油质蛋白的甘氨酸富含蛋白质。用已知的油体固醇蛋白序列,通过BLAST分析数据库,确定了第六个开放阅读框。代表每种油质蛋白或油体固醇蛋白单基因全长cDNA的EST已被分离和测序。一种油质蛋白(OLE-1)的全长cDNA也已被分离和测序。在此处涉及的这些cDNA是CaOLE-1 (SEQID NO:1)和CcOLE-1(SEQ ID NO.:2)、CcOLE-2(SEQ ID NO:3)、CcOLE-3(SEQ ID NO:4)、CcOLE-4(SEQ ID NO:5)、CcOLE-5(SEQ IDNO:6)和CcSTO-1(SEQ ID NO:7)。形成油质蛋白或油体固醇蛋白单基因的EST都来自于从授粉后30和46周的种粒中获得的文库。 
推导出的CaOLE-1以及CcOLE-1至CcOLE-5的氨基酸序列,在此如SEQ NOS:8-13所示,分子量分别为15.7、14.1、18.6、15.3和17.9kDa。这些蛋白质中的每一个分别含有81、73、80、72和75个氨基酸的疏水区,疏水区具有标志性的KNOT基序,其中心包含三个保守的脯氨酸和一个保守的丝氨酸。推导出的Cc STO-1氨基酸序列,在此如SEQ ID NO:14所示,分子量40.5 kDa,在N-末端结构域内具有脯氨酸KNOT基序。 
在拟南芥和其它具有充分表征的油体的植物(如,芝麻、稻和玉米)中,已鉴定了5个咖啡油质蛋白和油体固醇蛋白的密切直系同源物。定量表达分析表明,对于种子(S)和花的小孢子(SM)型油质蛋白,也许至少有两种类型的表达模式。在油质蛋白基因表达之初,发现一组基因有较高水平表达,而在种粒发育的稍晚阶段发现另一组表现较高表达。正如实施例中所示的更为详细的数据所证实的那样,油质蛋白转录物在两种咖啡物种(小粒种咖啡和中粒种咖啡(robusta))中的水平和分布表现出显著的差异,与组成型表达的核糖体蛋白质的表达相比较,含油量更高的小粒种咖啡种粒具有整体更高水平的油质蛋白转录物。所观察到的油质蛋白整体水平在两种 咖啡种类之间的这种变化可以提供操纵咖啡的基础,通过遗传技术或传统育种,影响咖啡商业上重要的性质,比如,油含量、油体的谱图、大小和结构、咖啡烘焙过程中脂质衍生的挥发物(E)-2-壬烯醛和反-反-2-4-癸二烯醛的形成、以及在意大利浓缩咖啡(espresso)咖啡提取过程中“泡沫”的产生。 
本发明的另一个方面涉及启动子序列和控制咖啡油质蛋白基因表达的相关元件。正如实施例中更为详细地描述的那样,用PCR辅助的引物步行鉴定了来源于这些基因其中之一的启动子序列pOLE-1(包含在SEQID NO:15中)。如图8所示和实施例中所描述,表明pOLE-1启动子包含若干种子特异性调控元件。使用连接于GUS报告基因的这种启动子,确定了这个启动子对种子、子叶、胚轴和发育期幼苗的第一真叶是特异性的。还已显示该基因的表达受水胁迫的诱导。 
尽管在此处描述并举例说明了编码来源于中粒种咖啡油质蛋白和油体固醇蛋白的多核苷酸,本发明还旨在包括来源于其它咖啡属物种的核酸和编码的蛋白质,其与中粒种咖啡多核苷酸和蛋白质足够相似,可为以下所述目的互换使用。相应地,当在此处使用术语“油质蛋白”或“油体固醇蛋白”时,它们都意指包括具有在此描述的普遍物理、生物化学和功能特征的所有咖啡属油质蛋白或油体固醇蛋白以及编码它们的多核苷酸。 
从它们的序列方面考虑,本发明编码油质蛋白和油体固醇蛋白的多核苷酸包括SEQ ID NO:1-7的等位基因变体和自然突变体,它们很可能见于小粒种咖啡或中粒种咖啡的不同品种,而SEQ ID NO:1-7的同源物很可能见于不同的咖啡物种。由于预期这样的变体和同源物在核苷酸和氨基酸序列上具有一定的差异,本发明提供分离的编码油质蛋白或油体固醇蛋白的核酸分子,它们各自编码的多肽与SEQ ID NO:8-14中任一具有至少80%(以及随着增加的优选顺序,81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%和99%)的同一性,并且包含与SEQ ID NO:1-7中任一具有等范围同一性的核苷酸序列。由于不同咖啡品种和物种中的油质蛋白和油体固醇蛋白及 其编码基因可能存在着天然序列变异,本领域技术人员预期将会发现这种水平的变异,同时仍维持本发明多肽和多核苷酸的独特性能。这样的预期部分归因于遗传密码的简并性,以及已知的保守氨基酸序列变异的成功进化,这不明显改变编码蛋白质的性质。相应地,这样的变体和同源物视为彼此基本上相同,并且包含在本发明的范围内。 
咖啡油质蛋白和油体固醇蛋白基因和蛋白质的多种结构域和片断也被认为落入本发明的范围内。例如,油质蛋白多肽的亲水或两性氨基和羧基末端结构域(如,N-末端大约10-40个残基和C-末端大约30-50个残基),以及相应的编码多核苷酸,可用于相互区分油质蛋白或油质蛋白编码基因。保守的疏水中心结构域和相应的编码多核苷酸也可用于鉴定来源于其它种或属的油质蛋白直系同源物。同样地,油体固醇蛋白多肽次保守性的部分(如,第1位至大约第50位,大约第81位至大约第102位,以及大约第308位至羧基末端的残基)和相应的编码多核苷酸能够区分彼此紧密相关的油体固醇蛋白,而保守部分(如,第50位至大约第80位,以及大约第103位至大约第307位残基)可以用于鉴定不太紧密相关的直系同源物。 
保守的疏水中心结构域在将重组蛋白质靶向植物油体(包括咖啡)中具有特殊的功用,如美国专利No.6,137,032所述。同样如US 6,137,032所述,将包含咖啡油质蛋白疏水结构域的重组蛋白质与油体缔合(使用例如植物油自然或者人工构建形成的“油体样”结构)可被开发用于促进这样的重组蛋白纯化(van Rooijen&Moloney,1995,Bio/Technology13:72-77)。 
如已提到的,本发明人已证实油质蛋白基因的表达在咖啡中是种子和幼苗特异性的,并且可被干旱胁迫诱导。相应地,与油质蛋白基因相关的基因调控序列有实际功用,并认为在本发明的范围之内。在此处以中粒种咖啡OLE-1启动子为例进行说明。尽管中粒种咖啡OLE-1启动子的其它部分可以在基因的其它位置找到,中粒种咖啡OLE-1基因组序列的上游区域如本文SEQ ID NO:15所示,并包含部分或全部本发明例示的启动子,正如本文上面提到的“启动子”定义中所说明的那样。然而,来源于任一 咖啡物种的油质蛋白和油体固醇蛋白基因的启动子和其它基因调控序列可以通过以下描述的方法获得,并且可以根据本发明利用。控制油质蛋白和油体固醇蛋白表达的组织特异性和时间特异性的启动子和调控元件可有效地用于改变或修饰多种咖啡物种的油体谱图,以及其他种种实用性。 
以下部分阐明实施本发明所涉及的一般方法。在一定程度上提及的特定材料,目的仅仅为了举例说明,并非旨在限制本发明。除非另有详细说明,使用普通生物化学和分子生物学操作,如Sambrook等,MolecularCloning,Cold Spring Harbor Laboratory(1989)或Ausubel等(编辑),Current Protocols in Molecular Biology,John Wiley&Sons(2005)说明的那些。 
核酸分子、蛋白质和抗体: 
本发明的核酸分子可通过两种常用方法制备:(1)它们可以从适宜的三磷酸核苷酸合成,或者(2)它们可以从生物来源中分离。两种方法使用的实验方案在本领域众所周知。 
利用核苷酸序列信息,如具有SEQ ID NO:1-7的cDNA或者SEQ IDNO:15的调控序列,能通过合成寡核苷酸来制备本发明分离的核酸分子。可以通过Applied Biosystems 38A DNA合成仪或相似设备所使用的亚磷酰胺法制备合成的寡核苷酸。可以根据本领域已知的方法纯化所得的构建体,比如高效液相色谱法(HPLC)。由于当前寡核苷酸合成方法固有的大小限制,长的双链多核苷酸,如本发明中的DNA分子,必须分阶段合成。因此,例如,长的双链分子可先合成为若干小的具有适当互补区的区段。由此产生的互补区段可进行退火,从而使得各区段具有适当的粘性末端,以附着于邻近的区段。在DNA连接酶存在的情况下,邻近的区段经退火粘性末端连接起来,构建成完整的长的双链分子。如此构建合成的DNA分子然后可在适当的载体中进行克隆和扩增。 
根据本发明,通过使用适当严谨性的杂交和洗涤条件鉴定核酸分子,所述核酸分子和编码油质蛋白或油体固醇蛋白的多核苷酸的部分或全部编 码区和/或调控区有适当水平序列同源性。本领域技术人员应当理解,当上述策略应用到基因组序列时,除了能分离编码油质蛋白或油体固醇蛋白的序列,还能分离与油质蛋白或油体固醇蛋白相关的启动子和其它的基因调控序列,尽管调控序列本身也许不享有能进行适当杂交的足够同源性。 
作为典型的举例说明,杂交可根据Sambrook等人的方法进行,使用的杂交溶液包含:5X SSC,5X Denhardt′s试剂,1.0%SDS,100μg/ml变性的、片断化的鲑精DNA,0.05%焦磷酸钠和高达50%的甲酰胺。杂交在37-42℃进行至少6个小时。杂交后按照以下步骤洗涤滤膜:(1)室温2×SSC和1%SDS中5分钟;(2)室温2×SSC和0.1%SDS中15分钟;(3)37℃,2X SSC和0.1%SDS中30分钟至1小时;(4)45-55℃,2X SSC和0.1%SDS中2小时,每30分钟更换溶液。 
用于计算具有指定序列同源性的核酸分子之间完成杂交所必需的严谨性条件的通用公式(Sambrook等,1989): 
Tm=81.5℃+16.6Log[Na+]+0.41(%G+C)-0.63(%甲酰胺)-600/双链体碱基对数 
作为上述公式的举例说明,使用[Na+]=[0.368]和50%甲酰胺,以及42%GC含量和平均200个碱基的探针大小,Tm值为57℃。随同源性每降低1%,DNA双链体的Tm值降低1-1.5℃。因此,使用42℃的杂交温度会观察到具有大于大约75%序列同一性的靶标。用上述杂交和洗涤溶液,在一个实施方案中,杂交温度37℃且最后洗涤温度42℃;在另一个实施方案中,杂交温度42℃且最终洗涤温度50℃;又在另一个实施方案中杂交温度42℃且最终洗涤温度65℃。高严谨性条件包括在上述杂交溶液中42℃杂交,并在0.1×SSC和0.1%SDS中65℃最后洗涤10分钟。 
本发明的核酸分子可以作为任何便利克隆载体中的DNA来维持。在一个优选的实施方案中,克隆在质粒克隆/表达载体(如pGEM-T(PromegaBiotech,Madison,WI)、pBluescript(Stratagene,La Jolla,CA)、pCR4-TOPO(Invitrogen,Carlsbad,CA)或pET28a+(Novagen,Madison,WI))中维持,且所有载体都能在适当的大肠杆菌宿主细胞中增殖。 
本发明的核酸分子包括cDNA、基因组DNA、RNA以及它们的片断,片断可以是单链、双链或者甚至是三链。因此,本发明提供的寡核苷酸(DNA或RNA的正义或反义链)具有的序列能够和本发明核酸分子的至少一个序列进行杂交。这样的寡核苷酸可以用作为探针用于检测(如通过PCR扩增)植物组织测试样品中油质蛋白或油体固醇蛋白编码基因或mRNA,或者用于在mRNA翻译成蛋白质之时或之前,正调控或负调控油质蛋白或油体固醇蛋白编码基因的表达。利用编码油质蛋白或油体固醇蛋白的寡核苷酸或多核苷酸作为探针,进行这些测定的方法包括,但不局限于:(1)原位杂交;(2)Southern杂交;(3)northern杂交;(4)分选(assorted)扩增反应,如聚合酶链式反应(PCR)(包括RT-PCR)和连接酶链式反应(LCR)。 
根据已知的方法,可以用多种方式制备本发明核酸编码的多肽。如果原位产生,多肽可以从适当来源中纯化,如:种子、果皮或其它的植物部分。 
可选地,使用本领域已知的体外表达方法,利用分离的编码多肽的核酸分子能够产生蛋白质。例如,cDNA或基因可被克隆到适当的体外转录载体中(如用于体外转录的pSP64或pSP65),然后在合适的无细胞翻译系统(如麦胚或兔子网织红细胞)中进行无细胞翻译。体外转录和翻译系统可以从商业上获得,如,从Promega Biotech,Madison,WI,BRL,Rockville,MD或Invitrogen,Carlsbad,CA。 
根据优选的实施方案,通过在适当的原核或真核系统中表达,可以产生大量的油质蛋白或油体固醇蛋白的多肽。例如,可将DNA分子的部分或全部(如具有SEQ ID NO:1-7的cDNA)插入到经改造适合在细菌细胞(如大肠杆菌)或酵母细胞(如酿酒酵母(Saccharomyces cerevisiae))中表达的质粒载体中,或者插入到在昆虫细胞中表达的杆状病毒载体中。这样的载体包含DNA在宿主细胞中表达所必需的调控元件,以允许DNA在宿主细胞表达的方式安置。这类表达所必需的调控元件包括启动子序列、转录起始序列以及任选的增强子序列。 
可以根据本领域已知的方法纯化在重组原核或真核系统中基因表达所 产生的油质蛋白或油体固醇蛋白。在优选的实施方案中,使用商业上可获得的表达/分泌系统,重组蛋白由此表达并随后从宿主细胞中分泌,可从周围的培养基中方便的纯化。如果不使用表达/分泌载体,可选方法包括通过亲和分离如通过与特异性结合重组蛋白的抗体发生免疫学相互作用来纯化重组蛋白。熟练的专业人员普遍使用这样的方法。 
可以根据标准的方法分析用上述方法制备的本发明油质蛋白和油体固醇蛋白。 
从咖啡中纯化或重组产生的油质蛋白和油体固醇蛋白,可根据已知方法用于产生如本文中所定义的多克隆或单克隆抗体、抗体片断或衍生物。除了制备完整重组蛋白的抗体之外,如果蛋白质分析或Southern和克隆分析(见下文)表明克隆的基因属于多基因家族,那么还能生产成员特异性抗体,该抗体是针对相应蛋白质非保守区域(如N-或C-末端区域)的合成肽制备的抗体。 
含有本发明抗体(用于在此描述的任何目的)的试剂盒,也包含在本发明范围内。通常,这样的试剂盒包括对照抗原,抗体对其有免疫特异性。 
从咖啡中纯化或重组产生的油质蛋白和油体固醇蛋白还可作为乳化剂使用,或者利用它们固有的稳定咖啡豆细胞内小油滴的能力,作为油溶性分子的封装剂而使用。利用这些特性,咖啡油质蛋白和油体固醇蛋白将会在制备标准食品乳胶的食品工业中找到工业实用性,包括但不局限于干酪、酸乳酪,冰淇淋,人造黄油,蛋黄酱,色拉味调料或焙烤产品。它们在生产肥皂、护肤霜、牙膏、唇膏和面部化妆品等的化妆品工业中也将是有用的。 
载体、细胞、组织和植物: 
根据本发明,对产生转基因宿主细胞的载体和试剂盒也进行了描述,转基因宿主细胞包含以正义或反义取向的编码油质蛋白或油体固醇蛋白的多核苷酸或寡核苷酸,或其同源物、类似物或变体,或在油质蛋白或油体固醇蛋白启动子和其它调控序列控制下的报告基因和其它构建体。适当的宿主细胞包括,但不局限于植物细胞、细菌细胞、酵母和其它真菌细胞、 昆虫细胞和哺乳动物细胞。用于转化这些广泛多样宿主细胞的载体对于本领域技术人员是众所周知的。它们包括,但不局限于,质粒、噬菌粒、粘粒、杆状病毒、杆粒、细菌人工染色体(BAC)、酵母人工染色体(YAC),以及其它的细菌、酵母和病毒载体。 通常,产生转基因宿主细胞的试剂盒将包含一个或多个适当的载体和使用载体产生转基因细胞的说明书。试剂盒还可以包括一个或多个附加成分,如用于培养细胞的培养基,用于进行细胞转化的试剂以及用于检验转基因细胞基因表达的试剂,等等。 
本发明包括这样的转基因植物,其含有编码油质蛋白或油体固醇蛋白基因的一个或多个拷贝,或者含有抑制植物内源性油质蛋白或油体固醇蛋白产生或功能的核酸序列。这通过用转基因转化植物细胞来实现,如以下所述,转基因包括受天然或重组调控序列控制的编码油质蛋白或油体固醇蛋白的部分或全部序列,或其突变体、反义序列或变体,包括RNA在内。在此描述目前优先用于制备转基因植物的咖啡物种包括(并非限制性的):C.abeokutae、小粒种咖啡、C.arnoldiana、C.aruwemiensis、C.bengalensis、中粒种咖啡、刚果咖啡(C.congensis)、高产咖啡(C.dewevrei)、埃克赛尔沙咖啡(C.excelsa)、C.eugenioides和C.heterocalyx、C.kapakata、C.khasiana、利比瑞卡咖啡(C.liberica)、C.moloundou、C.rasemosa、C.salvatrix、C.sessiflora、C.stenophylla、C.travencorensis、C.wightiana和C.zanguebariae.任何种类的植物也包含在本发明内;这些包括,但不局限于烟草、拟南芥和其它“实验室友好”种类,谷类作物如玉米、小麦、稻、大豆、大麦、黑麦、  燕麦、  高粱、苜蓿、三叶草等,产油植物如芸苔、红花、向日葵、花生、可可等,蔬菜类作物如粘果酸浆、马铃薯、胡椒、茄子、甜菜、胡萝卜、黄瓜、生菜、豌豆等,园艺植物如紫菀、秋海棠、菊花、飞燕草、矮牵牛、百日草、草坪和草坪草等。 
使用本领域技术人员已知的标准植物转化方法能产生转基因植物。这些包括,但不局限于,农杆菌属(Agrobacterium)载体、聚乙二醇处理原生质体、生物弹射击DNA递送、紫外激光微束、双生病毒载体或其它植物病毒载体、磷酸钙处理原生质体、分离的原生质体电穿孔、搅拌在含有 转化DNA包被的微珠溶液中的细胞悬液、搅拌在含有转化DNA包被的硅纤维溶液中的细胞悬液、直接DNA摄取、脂质体介导的DNA摄取等。这些方法已在本领域公开。例如参见Methods for Plant Molecular Biology(Weissbach&Weissbach编辑,1988);Methods in Plant Molecular Biology(Schuler&Zielinski编辑,1989);Plant Molecular Biology Manual(Gelvin,Schilperoort,Verma编辑,1993);和Methods in Plant Molecular Biology-A Laboratory Manual(Maliga,Klessig,Cashmore,Gruissem&Varner编辑,1994)。 
转化方法取决于待转化的植物。农杆菌属载体经常用于转化双子叶植物物种。农杆菌属双元载体包括,但不局限于,BIN19及其衍生物、pBI载体系列和双元载体pGA482、pGA492、pLH7000(GenBank登录号AY234330)以及任何适当的pCAMBIA载体之一(来源于由Hajdukiewicz,Svab&Maliga,(1994)Plant Mol Biol 25:989-994构建的pPZP载体,可从CAMBIA,GPO Box 3200,Canberra ACT 2601,Australia,或者通过www.CAMBIA.org获得)。为转化单子叶植物物种,转化DNA包被的微粒和转化DNA包被的硅纤维的生物射弹轰击通常可用于核转化。可选地,农杆菌属“超双元(superbinary)”载体已被成功用于稻、玉米和多种其它单子叶植物物种的转化。 
转化所选择的植物的DNA构建体包含与适当5′调控序列(如启动子和翻译调控序列)和3′调控序列(如终止子)有效连接的目的编码序列。在优选的实施方案中,使用了在其自然5′和3′调控元件控制下的油质蛋白或油体固醇蛋白编码序列。在其它实施方案中,为了改进表型(如风味、香味或其它特征),对油质蛋白和油体固醇蛋白编码序列和调控序列进行交换(如CcOLE-1编码序列与CcOLE-2启动子有效连接),以改变转化植物的种子油谱图。 
在可选的实施方案中,将基因的编码区置于强组成型启动子的控制下,如花椰菜花叶病毒(CaMV)35S启动子或玄参花叶病毒35S启动子。本发明中预期用到的其它组成型启动子包括,但不局限于:T-DNA甘露碱合成 酶、胭脂碱合成酶和章鱼碱合成酶启动子。在其它实施方案中,使用强单子叶植物启动子,例如玉米泛素启动子、稻肌动蛋白启动子或稻微管蛋白启动子(Jeon等,Plant Physiology.123:1005-14,2000)。 
在诱导型启动子控制下表达油质蛋白或油体固醇蛋白编码序列的转基因植物也计划在本发明范围之内。诱导型植物启动子包括四环素抑制子/操纵子控制的启动子、热激基因启动子、胁迫(如创伤)诱导型启动子、防御应答基因启动子(如苯丙氨酸氨裂解酶基因),创伤诱导型基因启动子(如富含羟脯氨酸的细胞壁蛋白质基因),化学诱导型基因启动子(如硝酸还原酶基因、葡聚糖酶基因、几丁质酶基因等)和黑暗诱导型基因启动子(如天冬酰胺合成酶)等。 
除了本发明种子特异性油质蛋白启动子,本发明也计划使用组织特异性和发育特异性启动子。其它种子特异性启动子非限制的例子包括Cim1(细胞分裂素诱导信息),cZ19B1(19kDa玉米醇溶蛋白)、milps(肌-肌醇-1-磷酸合酶)和celA(纤维素合成酶)(美国专利申请系列号No.09/377,648)、豆β-菜豆球蛋白、napin β-伴大豆球蛋白、大豆植物凝集素、cruciferin、玉米的15 kDa玉米醇溶蛋白、22 kDa玉米醇溶蛋白、27 kDa玉米醇溶蛋白、g-玉米醇溶蛋白、蜡质、shrunken 1、shrunken 2和球蛋白1、大豆11S豆球蛋白(B
Figure 2006800242019_0
umlein等,1992),以及中粒种咖啡11S种子储存蛋白质(Marraccini等,1999,Plant Physiol.Biochem.37:273-282)。另外参见W000/12733,公开了来自于end1和end2基因的种子偏好启动子。还可以使用其它咖啡属种子特异性启动子,包括但不局限于共同拥有的共同未决的美国临时专利申请No.60/696,890所描述的dehyrdin基因启动子。其它组织特异性启动子的例子包括但不局限于:二磷酸核酮糖羧化酶(RuBisCo)小亚基基因启动子(如Marracini等人2003描述的咖啡小亚基基因启动子)或在光合组织中表达的叶绿素a/b结合蛋白质(CAB)基因启动子以及期望在根部表达时的根特异性谷氨酰胺合成酶基因启动子。 
编码区还与适当的3’调控序列有效连接。在不使用天然3’调控序列的实施方案中,可以利用胭脂碱合成酶多聚合腺苷酸化区域。其它有用的3’ 调控区包括,但不局限于章鱼碱合成酶多腺苷酸化区域。 
在适当的调控元件控制下,所选择的编码区域与核药物抗性标记有效连接,如卡那霉素抗性。其它有用的可选择标记系统包括赋予抗生素或除草剂抗性的基因(如潮霉素、磺胺脲、膦丝菌素或草甘磷)。赋予选择性生长的基因(如能让植物细胞在甘露糖中生长的磷酸甘露糖异构酶)。可选择标记基因包括(并非限制性的):编码抗生素抗性的基因,如那些编码新霉素磷酸转移酶II(NEO)、二氢叶酸还原酶(DHFR)和潮霉素磷酸转移酶(HPT)的基因,以及赋予除草剂化合物抗性的基因,如草甘磷抗性EPSPS和/或草甘磷氧化还原酶(GOX)、抗溴草腈的溴草腈腈水解酶(BXN)、抗咪唑啉酮的AHAS基因,磺胺脲抗性基因和2,4-二氯苯氧乙酸(2,4-D)抗性基因。 
在某些实施方案中,本发明包括的启动子和其它表达调控序列与报告基因有效连接。本发明预期使用的报告基因包括,但不局限于,编码绿色荧光蛋白(GFP)、红色荧光蛋白(DsRed)、青色荧光蛋白(CFP)、黄色荧光蛋白(YFP)、Cerianthus橙色荧光蛋白(cOFP)、碱性磷酸酶(AP)、β-内酰胺酶、氯霉素乙酰转移酶(CAT)、腺苷脱氨酶(ADA)、氨基糖苷磷酸转移酶(neor,G418r)、二氢叶酸还原酶(DHFR)、潮霉素B磷酸转移酶(HPH)、胸苷激酶(TK)、lacZ(编码α-半乳糖苷酶)和黄嘌呤鸟嘌呤磷酸核糖基转移酶(XGPRT)、β-葡糖醛酸糖苷酶(gus)、胎盘碱性磷酸酶(PLAP)、分泌型胚胎碱性磷酸酶(SEAP)或者萤火虫或细菌荧光素酶(LUC)的基因。像许多与本发明实施相关的标准方法一样,熟练的技术人员将会意识到能行使标记或报告功能的其他序列。 
本领域已知能增强细胞宿主中基因表达的其他序列修饰。这些修饰包括消除编码多余多聚腺苷酸化信号、外显子-内含子剪接位点信号、转座子样重复、以及其它这类可能对基因表达有害的充分表征的序列。可选地,如果必须的话,编码序列的G/C含量可调整到给定咖啡植物细胞宿主的平均水平,如参照在咖啡植物细胞中表达的已知基因所计算的那样。并且,有可能的话,对编码序列进行修饰以避免预测的mRNA发夹二级结构。另 一增强基因表达的可选方法是使用5’前导序列。翻译前导序列在本领域众所周知,包括烟草花叶病毒5’前导序列(Ω)的顺式作用衍生物(Ω′)、以及雀麦草花叶病毒、苜蓿花叶病毒和芜箐黄花叶病毒的5′前导序列。 
对植物进行转化,随后通过一个或多个特征进行筛选,包括存在转基因产物、编码转基因的mRNA、或者与转基因表达相关的改变的表型。应当认识到,在转基因植物中,根据转基因插入到核基因组的位置的不同,转基因的表达量以及组织和时间特异性的表达模式能够变化。这类位置效应在本领域众所周知。出于这个原因,一些核转化株应当进行再生,并检验转基因的表达。 
方法: 
本发明的核酸和多肽能用于许多方法中的任一个,由此咖啡植物能产生蛋白质产物,该蛋白质可以发挥作用,以增强咖啡饮料或者从表达此蛋白质的咖啡植物豆中最终产生的咖啡产物的风味和/或香味。 
一方面,本发明描述了改变植物(优选咖啡)中油质蛋白或油体固醇蛋白谱图的方法,包括增加或降低植物中一种或多种油质蛋白或油体固醇蛋白的量或活性。例如,在本发明的一个实施方案中,利用在其自身表达调控序列控制下的油质蛋白编码基因转化植物,以便在植物中增加该油质蛋白的产量。可选地,油质蛋白或油体固醇蛋白的编码区与异源表达调控区(如组成型或诱导型启动子)有效连接。 
通过降低植物中一种或多种油质蛋白或油体固醇蛋白的产量,或者通过筛选油质蛋白或油体固醇蛋白表达降低的自然发生变体也可以改变植物的油体谱图。例如,从目前可用的植物突变体群中,可产生或选择出功能缺失(无效)突变植物。本领域技术人员也应当理解,利用一种或多种在此处描述的方法,也可以从突变的植物群中筛选出过表达特定油质蛋白的突变体。可通过化学诱变、辐照诱变和转座子或T-DNA插入,或靶向诱导的基因组局部损伤产生突变群(TILLING,例如参见Henikoff等,2004,Plant Physiol.135(2):  630-636;Gilchrist&Haughn,2005,Curr.Opin. Plant Biol.8(2):211-215)。产生突变群的方法在本领域众所周知。 
本发明的核酸能用于鉴定多种植物物种中的油质蛋白或油体固醇蛋白突变体。在可获得转座子插入品系的物种如玉米或拟南芥中,能设计寡核酸引物筛选出油质蛋白或油体固醇蛋白基因中的插入品系。通过育种,可随之建立植物品系,该植物品系对于被破坏的基因是杂合或纯合的。 
也可以对植物进行基因工程改造,使之展示出与通过诱变技术产生的无效突变体所见相似的表型。可通过表达突变形式的所选择的油质蛋白或油体固醇蛋白来产生转基因无效突变体,以建立“显性失活效应”。尽管本发明不局限于任何一种机制,这种突变蛋白将与野生型蛋白竞争,与蛋白质或其它细胞因子相互作用。这类“显性失活”效应的例子对于昆虫和脊椎动物系统均是众所周知的(Radke等,1997,Genetics 145:163-171;Kolch等,1991,Nature 349:426-428)。 
通过“转录后基因沉默”,抑制编码油质蛋白或油体固醇蛋白的mRNA的翻译,可产生另一类转基因无效突变体。来自被靶向下调物种的油质蛋白或油体固醇蛋白编码基因或其片段可用于控制编码蛋白质的产生。全长反义分子也能用于此目的。作为选择,可以利用反义寡核苷酸靶向mRNA中对翻译至关重要的特定区域。本领域已知反义分子在降低预设的基因表达水平中的用途。用经转录产生反义RNA序列的DNA构建体转化植物细胞,可原位提供反义分子。可以设计这样的构建体,以产生全长或部分反义序列。可通过转基因过量产生基因编码序列的正义和反义RNA,由此产生大量的dsRNA,来增强这种基因沉默效应(例子见Waterhouse等,1998,PNAS95:13959-13964)。在这点上,发现含有对应至少一个内含子部分或全部序列的dsRNA尤其有效。在一个实施方案中,转基因表达部分或全部油质蛋白或油体固醇蛋白编码序列的反义链。在另一个实施方案中,转基因表达部分或全部油质蛋白或油体固醇蛋白编码序列的杂交的正义和反义链。 
在另一个实施方案中,通过使用目前可用于植物系统的多种其它转录后基因沉默(RNA沉默)技术可以沉默油质蛋白和油体固醇蛋白基因。RNA 沉默包括双链RNA(dsRNA)经基于RNaseH的酶(“Dicer酶”或“Dicer样酶”)加工成为21-28个核苷酸的小片段。切割产物,即siRNA(小干扰RNA)或miRNA(微小RNA),掺入到蛋白质效应因子复合物中,以序列特异性的方式调控基因表达(有关植物中RNA沉默的综述,见Horiguchi,2004,Differentiation 72:65-73;Baulcombe,2004,Nature 431:356-363;Herr,2004,Biochem.Soc.Trans.32:946-951)。 
小干扰RNA可在体外化学合成或者转录和扩增,然后递送至细胞。可以通过显微注射(Tuschl T等人,2002)、化学转染(Agrawal N等人,2003)、电穿孔或阳离子脂质体介导的转染(Brummelkamp TR等人,2002;Elbashir SM等人,2002)、或任何其它本领域可利用的手段进行递送,这是技术人员能够理解的。作为选择,通过将siRNA的DNA模板插入到目的细胞中可在细胞内表达siRNA,例如,借助于质粒(Tuschl T等人,2002),并且siRNA可被特异性靶向选择的细胞中。小干扰RNA已被成功引入植物中(Klahre U等人,2002)。 
本发明优选的RNA沉默方法是使用短的发夹RNA(shRNA)。包含DNA序列(编码期望的特定siRNA序列)的载体通过任何常见的方式递送到靶细胞中。一旦在细胞中,DNA序列持续转录成RNA分子,RNA分子自身成环折回,并通过分子内碱基配对形成发夹结构。这些发夹结构,一经细胞加工,等同于siRNA分子,被细胞用于介导目的蛋白质的RNA沉默。Horiguchi,2004,同前,描述了植物中用于RNA沉默特定功用的多种构建体。通常,这样的构建体包含启动子、欲以“正义”取向被沉默的靶基因序列、间隔区、靶基因序列的反义序列以及终止子。 
然而用“共抑制”技术也能产生另一类合成的无效突变体(Vaucheret等,1998,Plant J.16(6):651-659)。用被靶向抑制的内源基因的完整正义拷贝或部分正义序列转化植物细胞。在许多情况下,这会导致天然基因和转基因的完全抑制。在一个实施方案中,从目的植物物种中分离油质蛋白或油体固醇蛋白编码基因,并用于转化相同物种的细胞。 
根据本发明,还描述了用任何前述方法产生的突变或转基因植物。在 一些实施方案中,这样的植物将被用作研究工具,进一步阐明油质蛋白和油体固醇蛋白所参与的与油谱图相关的咖啡种子的风味、香味和其它特征。优选的植物是可育的植物,从而可用于育种目的。因此,表现出一个或多个上述期望表型的突变体或植物能被用于植物育种、或直接在农业或园艺中应用。为了产生具有增强或组合表型的植物,包含一个转基因或指定突变的植物也可以与包含互补转基因或基因型的植物杂交。 
根据以上描述方法产生的咖啡植物,对于产生具增强的风味、香味或其它如以上讨论特征的咖啡豆有实际效用。通常为了饮用,咖啡豆被烘焙和研磨。然而,咖啡豆的其它使用对于本领域技术人员是显而易见的。例如,可以根据已知的方法,从咖啡豆(未煮过的或轻微烘焙的)收集油体。比如,不同纯度水平的油体可被纯化,如Guilloteau等人2003,PlantScience164:597-606所述,或者例如在授予Deckers等人的美国专利6,146,645和授予Wkabayashi等人的EP 0883997中所公开的那样。与以上描述的分离的油质蛋白相似,这些油体可用于食品工业以增添加风味和营养,如烘焙制品、酸奶酪或冰淇淋(如Berry等人的美国公开申请号No.2005/0037111 A1)等,或者用于化妆品工业以生产肥皂、护肤霜、化妆品等。 
本发明还描述了组合物和方法,以种子偏好或种子特异性方式在植物中产生任何选择的异源基因产物。目的编码序列被置于咖啡油质蛋白或其它种子特异性启动子以及其它适当调控序列的控制之下,产生种子特异性嵌合基因。嵌合基因通过此处描述的或本领域已知的任一转化方法引入植物细胞中。这些嵌合基因和方法可用于在植物中生产许多目的基因产物,包括但不局限于(1)可检测的基因产物如GFP或GUS,如以上列举的那样;(2)赋予农艺学或园艺学利益的基因产物,如其酶活性导致产生微量营养物(如维生素原A,也称为β-胡萝卜素)或者抗氧化剂(如抗坏血酸、Ω脂肪酸、番茄红素、异戊二烯、萜)的那些基因产物;或者(3)控制病原或害虫的基因产物,如Mourgues等人,(1998),TibTech 16:203-210所述,或者已知的其它对植物种子有保护作用或对病原有损害作用的基因产物。 
另外,由于在干旱条件下也诱导油质蛋白基因的表达(如CcOle-1基因),因此当受到严重的渗透性胁迫时,油质蛋白基因启动子对指导基因在其它组织(如,成熟叶子)中表达也证明是有益的。例如,在成熟的晚期当叶子经历衰老并开始变干时,这些启动子能用于在植物(如烟草)叶子中特异性表达重组蛋白质。 
以下提供实施例更详细说明本发明。实施例是以举例说明为目的,并非用来限制本发明。 
实施例1 
用于RNA提取的植物材料
从生长在温室条件(25℃,70%RH)下的小粒种咖啡栽培种CaturraT-2308和生长在印度尼西亚田间的中粒种咖啡(robusta)BP-409,在不同发育阶段,采集新鲜的根,幼叶、茎、花和果实。发育阶段定义如下:小绿果(SG),大绿果(LG),黄果(Y)和红果(R)。新鲜的组织立刻冷冻于液氮中,然后-80℃保存,用于提取RNA。 
实施例2 
提取总RNA并产生cDNA
储存在-80℃的样品研磨成粉末,使用Gilloteau等人,2003所述的方法从中提取总RNA。根据厂商说明书,使用“Qiagen RNase-Free DNase”试剂盒,用DNase处理样品去除DNA杂质。所有的RNA样品用甲醛琼脂糖凝胶电泳进行分析,经溴化乙锭染色,视觉检查核糖体RNA带。使用oligo(dT20)作为引物,根据Superscript II Reverse Transcriptase试剂盒(Invitrogen,Carlsbad,CA)的实验方案从大约4μg总RNA制备cDNA。为了检验cDNA制备物中杂质基因组DNA的存在,设计引物对,使之跨越特异性广泛表达cDNA(查尔酮异构酶(CHI))的已知内含子。使用10倍稀释的cDNA,相应于0.1μg最初的RNA进行RT-PCR。常-PCR反应包含1倍缓冲夜、5mM MgCl2、每种dATP、dCTP、dGTP和dTTP各200μM、 1单位聚合酶、每个基因的特异引物FWD-CCCACCTGGAGCCTCTATTCTGTT(SEQ  ID NO.:83)和REV-CCCCGTCGGCCTCAAGTTTC(SEQ ID NO.:84)各800nM,35个循环。PCR完毕后,观察到预期的272 bp cDNA带。没有观察到对应750 bp的cDNA+内含子第二条带,表明在样品中不存在基因组DNA(数据未列出)。 
用100倍稀释的cDNA,对应于0.01μg最初的RNA,进行目的基因的常规PCR反应。使用每个基因特异引物各800nM进行PCR:CcOLE-1(FWD-TTCGTTATCTTTAGCCCCATTT;REV-CATAGGCAAGATTAACAAGGAT353)(分别为SEQ ID NO.:43、44),CcOLE-2(FWD-GTGGCAGCGTTGAGCGT;REV-GACAATAATGCATGAATACCACAA309)(分别为SEQ ID NO.:45、46),CcOLE-3 (FWD-GAGATCAAGGTGGAAGGGAA;REV-GAAAACCCTCAACAAACAAAGA;228)(分别为SEQ ID NO.:47、48),CcOLE-4(FWD-CTGACACTGGCTGGAACAATA;REV-GCACAACATTCCATCAAGTATCT337)(分别为SEQ ID NO.:49、50)和 CcOLE-5(FWD-TGGCATCCTACTTCTCCTCACT;REV-CTCTCTAGCATAATCCTTCACCTG295)(分别为SEQ ID NO.:51、52)。RPL39基因扩增(FWD-TGGCGAAGAAGCAGAGGCAGA;REV-TTGAGGGGGAGGGTAAAAAG187)(分别为SEQ ID NO.:53、54)作为反转录的阳性对照。样品在1.5%琼脂糖凝胶中进行电泳。每个引物对的上标数字表示扩增子的大小。 
如上所述用cDNA进行定量TagMan-PCR,并使用厂商(AppliedBiosystems,Perkin-Elmer)推荐的实验方案。所有的反应包含1倍TaqMan缓冲夜(Perkin-Elmer)、5mM MgCl2、每种dATP、dCTP、dGTP和dTTP各200μM、0.625单位AmpliTaq Gold聚合酶。使用每个基因特异性引物各800nM(正向和反向引物)、200nM TaqMan探针、1000倍稀释的cDNA,对应于0.001μg最初的RNA,进行PCR。使用PRIMER EXPRESS 软件(Applied Biosystems:见下表3)设计引物和探针。下表4总结了引物和探针的杂交特异性。反应混合物50℃孵育2分钟,然后95℃孵育10分钟,40个扩增循环(95℃,15秒/60℃,1分钟)。用GeneAmp 7500 SequenceDetection System(Applied Biosystems)进行样品定量。以对照基因rpl39的水平标准化转录水平。 
实施例3 
启动子分离和载体构建
回收中粒种咖啡OLE-1的5’上游区,使用基因步行(Genewalker)试剂盒(BD Biosciences)和引物OLE-1A(5’-AAGTTGATGGACCCTTCTGAGGAAGG-3’)(SEQ ID NO.:55),然后进行巢式PCR,使用引物OLE-1B(5’-AGCTGGTAGTGCTCAGCCATGAAGG-3’)(SEQ ID NO.:56)。PCR反应包含1倍缓冲液、5mM MgCl2、每种dATP、dCTP、dGTP和dTTP各200μM、1单位LA Taq聚合酶(Takara,Combrex Bio,Belgium)及200nM引物OLE-1A和200 nM引物AP1(Genewalker试剂盒)。反应混合物94℃孵育10分钟,然后7个扩增循环(94℃,25秒/72℃,4分钟),然后32个扩增循环(94℃,25秒/67℃,4分钟)。PCR反应稀释1/200,然后用于第二个PCR反应,使用200 nM巢式引物OLE-1B和200 nM巢式引物AP2。巢式PCR 94℃孵育10分钟,然后5个扩增循环(94℃,25秒/72℃,4分钟),然后22个扩增循环(94℃,25秒/67℃,4分钟)。回收1075bp的基因组片段,并克隆到pCR4-TOPO载体(Invitrogen)中,得到pCR4-pOLE1,且对该质粒的插入片段进行测序。 
实施例4 
从发育中的咖啡种粒中分离和鉴定油质蛋白基因
超过47,000个表达序列标签(EST)来源于若干咖啡文库,这些文库由从幼叶以及不同发育阶段采集的浆果的种粒和果皮组织中分离的RNA制 得。重叠的EST随后“簇集”形成单基因(即重叠群),针对非冗余蛋白质数据库,用BLAST搜寻每个单独的序列来注释单基因序列。在种粒发育期表达的5种单基因的ORF被注释为富含甘氨酸的蛋白质/油质蛋白。代表每个单基因全长cDNA的EST已被分离和测序。根据获得EST的数量,这些cDNA被命名为CcOLE-1至CcOLE-5(SEQ ID NO:2-6)(克隆分别为cccs46w9j5、cccs46w20j22、cccs46w31f3、cccs30w17h11和cccs30w33)。这些EST都来自于从授粉后第30周和第46周的种粒中获得的文库。推导出的CcOLE-1至CcOLE-5氨基酸序列(图1)的分子量分别为15.7、14.1、18.6、15.3和17.9 kDa。这些蛋白质每一个分别含有81、73、80、72和75个氨基酸的疏水区,其中心具有含3个保守脯氨酸和一个保守丝氨酸的标志性KNOT基序。 
图9A至9E显示每个咖啡油质蛋白与GenBank非冗余蛋白质数据库中最同源的4个序列进行比对,且表1显示每个咖啡蛋白质与最密切相关数据库蛋白质的同一性百分比。 
表1:中粒种咖啡油质蛋白氨基酸序列和最同源GenBank序列的同一性。(NP=未发表)。咖啡油质蛋白登录号存放在NCBI genebank。 
Figure 2006800242019A00800011
[0146] 
Figure 2006800242019A00800021
更详细地研究了不同的咖啡油质蛋白序列。每个咖啡油质蛋白的疏水图清楚地显示存在一个大的负值区域,其等同于中心疏水区(图10)。这些疏水谱图和以前发表的来源于可可(Guilloteau等,2003)和拟南芥(Kim等,2002)种子的种子特异性(S)油质蛋白以及拟南芥种子和小孢子特异性(SM)油质蛋白的谱图相似。 
Tai等人(2002)先前已发现在种子发育阶段表达的油质蛋白分成两 类,他们称之为H和L型,通过C-末端区域18个氨基酸插入的有无与否进行区分。因此将5种咖啡油质蛋白插入位点周围的C-末端区域与GenBank数据库中发现的许多其它油质蛋白的等同区域进行比对(图4)。比对促进了分类:OLE-1、OLE-3和OLE-5作为H型油质蛋白,OLE-2和OLE-4作为L型油质蛋白。应当指出,OLE-5C-末端18残基插入与其它油质蛋白H型插入的同源性差,包括在插入位置6没有高度保守的甘氨酸。先前有关体外装配油体的工作证实来源于稻和芝麻的无论H型或是L型油质蛋白都能稳定油体,尽管单独用L型油质蛋白重构的油体要比那些用H型油质蛋白或H型和L型油质蛋白混合物重构的油体更稳定(Tzen等,1998;Tai等,2002)。 
实施例5 
CcOLE基因表达的组织特异性和发育分布
表2显示单基因中有52个EST代表最丰富的油质蛋白(CcOLE-1),只有5个EST代表最不丰富的油质蛋白(CcOLE-5)。除了在叶子文库中发现CcOLE-5 EST以外,所有油质蛋白EST只在种子文库中检测到,而在叶子或果皮文库中没有检测到。 
表2包含中粒种咖啡油质蛋白全长cDNA的单基因中EST的数量和分布 
Figure 2006800242019A00800031
[0154] 为确定咖啡油质蛋白是种粒特异性的,使用实施例2中描述的方法,通过RT-PCR研究每一个基因的表达。分析在中粒种咖啡(robusta;BP409)和小粒种咖啡(T-2308)的种粒和4个不同发育阶段的果实,以及叶子、茎、花和根中油质蛋白的转录水平。RT-PCR实验结果证实所有5个咖啡油质蛋白主要在种子中表达(图5A至5E)。RPL39(组成型表达的核糖体蛋白质cDNA)的表达作为阳性对照,表明每一个RNA样品(图5F)RT-PCR扩增成功。 
为了对每个OLE基因在咖啡种子发育的不同阶段以及在若干其它咖啡组织中的转录水平进行定量,对每一个基因进行了基于荧光实时RT-PCR(TaqMan:Applied Biosystems)的转录吴特异性测定,相对于同一样品中组成型转录基因(RPL39)的表达,对每一个RNA样品的相对转录水平进行定量。使用厂商(Applied Biosystems,Perkin-Elmer)推荐的实验方案对cDNA进行定量TagMan-PCR。所有反应包含1倍TaqMan缓冲液(Perkin-Elmer)、5mM MgCl2、每种dATP、dCTP、dGTP和dTTP各200μM、0.625单位的AmpliTaq Gold聚合酶。使用每个基因特异性引物各800nM(正向和反向引物)、200nM TaqMan探针、1000倍稀释的cDNA,对应于0.001μg最初的RNA进行PCR。使用PRIMER EXPRESS软件(AppliedBiosystems)设计引物和探针。表3显示基因特异性引物和探针。反应混合物50℃孵育2分钟,然后95℃孵育10分钟,随后40个扩增循环(95℃,15秒/60℃,1分钟)。用GeneAmp 7500 Sequence Detection System(AppliedBiosystems)对样品定量。以对照基因RPL39的水平对转录水平进行标准化。 
Figure 2006800242019A00800041
[0157] 
Figure 2006800242019A00800051
[0158] 
Figure 2006800242019A00800061
(1)MGB探针的5’端用荧光报告染料6-羧基荧光素(FAM)标记,3’端用淬灭染料6-羧基-N,-N-,N’-N-四甲基罗丹明(TAMRA)标记。所有序列均从5’端到3’端。 
(2)RPL39和CcSTO-1探针的5’端用荧光报告染料VIC标记,3’端用淬灭染料TAMRA标记。 
表4总结了按Tan等人(2003)和Simkin等人(2004b)所述,确定OLE引物/探针集合杂交特异性的检测结果。从相应cDNA制得标准曲线。数据代表每个cDNA的每个引物/探针集合产生的等量信号。在与其它咖啡油质蛋白的成对实验中,在相关转录物检测中,每个探针提供至少104倍的分辨力。 
表4.每组CcOLE TaqMan实时PCR引物和探针在相关序列检测中的特异性。ND=没检测到。 
Figure 2006800242019A00800062
使用TaqMan检测,对以前用于常规RT-PCR的相同cDNA样品中 的OLE转录物水平进行定量。图5A至5E(柱状图)显示的结果证实每个OLE基因只在种粒中呈现出显著性表达。然而,在某些其它组织中也检测到多种油质蛋白基因的弱表达。这最可能是由于其它组织中存在油体。已证明油体生物合成能在胚之外的烟草叶细胞(Wahlroos等,2003),木犀榄果实(Donaire等,1984)和成熟中的稻种子(Wu等,1998)中发生。还发现油质蛋白与内质网结合(Abell等,1997;Beaudoin和Napier,2002)。可在种粒之外检测到最显著的油质蛋白转录物水平的是OLE-5,在整个成熟花中能非常清晰地检测到其表达。这后一种观察结果与早先显示的比对结果一致,表明OLE-5可能属于油质蛋白的SM群(Kim等,2002)。实际上,从16种已知的拟南芥序列和5种咖啡油质蛋白序列之间的序列比较获得的结果(图2)支持这后一种观察结果。 
注意到与中粒种咖啡(robusta)比较,小粒种咖啡中的OLE转录物似乎更早被诱导。上表2显示相似的结果,表明在授粉后18周的robusta样品中没有检测到编码油质蛋白基因的EST。总之,这些数据表明与具相似外型的阿拉伯(arabica)浆果相比,小绿期的robusta浆果发育不完善。这种发育上的差别可能与robusta浆果比arabica浆果较慢成熟密切相关;robusta浆果发育为期9到11个月,而小粒种咖啡果实发育为期6到8个月(Costa,1989)。 
为了证实前面的解释,设计特异TaqMan定量RT-PCR测定检测另一咖啡基因(11S存储蛋白基因)的表达,其在种粒发育的中晚期阶段也被强烈诱导(Marraccini等,1999)。图6A显示的结果再一次表明robusta小绿种粒样品也显示检测不到11S表达,而来自arabica的相当样品表现此基因显著性表达。此外,使用Taqman测定,种粒特异性基因另外的表达谱也已表明小绿robusta种粒样品的表达谱和与小绿arabica种粒相关的表达谱不同(数据未列出)。TaqMan和常规RT-PCR(图5)结果之间观察到的微小差别可能由于后者在40个循环中非定量的性质所致。 
当对robusta种粒所独有的每一个油质蛋白基因的表达模式进行研究时,CcOLE-1和程度弱一些的CcOLE-5表现出和其它3种基因不同的表 达模式;CcOLE-1和CcOLE-5的转录物水平在大绿阶段是最高的,然后逐渐减低直到成熟,尽管在CcOLE-5中降低不太显著。应当指出CcOLE-1和CcOLE-5都是H型油质蛋白,因此上述观察到的表达模式与其它咖啡H型油质蛋白(CcOLE-3)不同。Robusta种粒中发现的CcOLE-2、CcOLE-3和CcOLE-4的表达模式表明这些基因的转录物水平在黄阶段达到峰值,此时期之前和之后的水平有点降低。当对arabica和robusta种粒中的5种油质蛋白的转录物水平进行比较时,一旦考虑到发育的时间差异(即小绿种粒的arabica大致等同于大绿robusta),转录物表达模式相对近似。然而,经深入研究,能够观察到arabica和robusta种粒之间转录物水平上的某些差异。假定RPL39转录物水平在arabica和robusta中均相似,arabica中OLE-1、OLE-2和OLE-4的转录物水平峰值表现出比robusta中的高大约2倍。相反,OLE-3的情况似乎相反,与黄阶段的robusta种粒相比,在黄阶段的arabica种粒中,其转录水平大约低2倍。值得注意的是,这两个物种之间的11S转录水平相对近似。这后一种观察结果暗示arabica和robusta之间在油质蛋白转录物积累上的差异可能不是因为RPL39表达的差异。 
Wu等人(1998)表明两种稻油质蛋白的转录物水平在授粉后7天出现,并在成熟种子中消失。Guilloteau等人,(2003)获得相似的结果,他们表明油质蛋白转录物在成熟种子授粉后146天(dpf)达到峰值,并在160pdf降到较低的水平。在本实施例中,OLE-1至OLE-5的转录物水平在成熟的最后阶段都表现出降低,尽管程度不同。在成熟期,OLE-1和OLE-5表现出最大程度的降低。 
不希望被任何机制的解释所限制,在胚乳发育的早期阶段发现OLE-1高水平表达,暗示这种油质蛋白在油体起始/形成中具有某种重要作用。此外,值得注意的是具有更高油含量的样品(小粒种咖啡)也具有更高水平OLE-1的表达。尽管Ting等人(1996)已提出油质蛋白含量与油含量不相关,但事实可能还是在油体形成的开始阶段油含量也许和OLE-1 H型油质蛋白表达的水平相关。 
实施例6 
种子萌发期油质蛋白的表达
对每一个OLE基因在小粒种咖啡不同萌发阶段的转录物水平进行定量。定量RT-PCR实验结果表明在萌发的早期阶段,OLE-1至OLE-4的转录物可在种子中检测到(图7)。观察到OLE-1、OLE-2和OLE-3的转录物水平在吸胀后3天(3DAI)达到峰值。至于OLE-2,观察到转录物水平升高到在种子成熟晚期阶段所观察到的水平(见图7)。在5DAI,H型油质蛋白OLE-1和OLE-3的转录物水平随着OLE-2一起显著降低,并在萌发的其余阶段维持低水平。在60 DAI,检测不到OLE-2和OLE-3的转录物水平。先前鉴定为可能是SM油质蛋白的OLE-5,未在萌发中的种粒中检测到。此外,定量RT-PCR也显示与油质蛋白表达相比,在萌发期伴随STO-1转录物的增加(见图6C和实施例9)。 
实施例7 
中粒种咖啡基因组CcOLE-1的拷贝数
已知单个油质蛋白通常由单个基因或低拷贝数的基因编码(Tai等,2002)。在该实施例中,证实中粒种咖啡OLE-1由咖啡基因组中单个或低拷贝数的基因编码。进行Southern阴极印迹实验估测CcOLE-1的拷贝数。包括3’非翻译区在内的完整插入的CcOLE-1 cDNA用P32标记,然后在高严谨性条件下与来自robusta品种BP-409的已如上所述经若干限制性酶消化的基因组DNA进行杂交。曝光10天后获得的结果(图11)显示除了HindIII+SspI酶切(还可检测到第二条带)以外,单和双酶切导致主要检测出一条主带。认为第二条带由于距转录起始点123 bp存在Hind III酶切位点所致(见图8)。DraI和SsPI单酶切产物中还可以检测到更弱条带的存在,这在双酶切产物中消失。这些很可能因为基因组DNA的部分酶切,或者与一个或多个其它油质蛋白非常弱的交叉杂交。这些数据强烈说明在咖啡基因组中只有1个或可能2个基因编码CcOLE-1。 
实施例8 
鉴定中粒种咖啡OLE-15’区的种子特异性调控元件
从中粒种咖啡(robusta BP-409)的基因组分离OLE-1的启动子区。如早先实施例中描述的那样,通过PCR辅助的引物步行,回收CcOLE-1 ATG位点上游大约1075 bp的序列并全部测序。然后对获得的启动子序列分析已知调控序列的存在(图8)。这个分析表明存在许多DNA调控序列。例如,TTTAAAT基序定位在CcOLE-1 cDNA 5’末端上游39 bp处(箭头所示),可能是TATA盒序列的候选序列。以前表明的负责存储蛋白质基因在多种植物中空间和时间特异性表达的其它调控元件也被发现。序列TGTAAAGT(456/463)已被鉴定为所谓‘胚乳基序’,并参与控制麦谷蛋白在大麦(Thomas,1993)和小麦(Hammond-Kosack等人,1993)、豌豆豆球蛋白(Shirsat等人,1989)和玉米醇溶蛋白(Maier等人,1987)启动子中的胚乳特异性表达。其它序列也被鉴定,如E-box CANNTG(CAAATG 738/743;CATGTG 914/919),被认为参与法国豆菜豆球蛋白(Kawagoe和Murai,1992)和花旗松S2存储蛋白(Chatthai等人,2004)的种子特异性表达。CATGCAAA(886/894)元件和所谓的RY重复区CATGCA(T/a)(A/g)相似;为豆球蛋白box的核心区(Dickinson等,1988;Shirsat等,1989)。这个基序对大豆11S豆球蛋白(B
Figure 2006800242019_1
umlein等,1992)、β-伴大豆球蛋白(Chamberlan等,1992)和大豆球蛋白(Lelievre等,1992)基因的种子特异性表达是必需的。CCATGCA(885/891)序列区与在转基因烟草种子中种子特异性表达必需的2S白蛋白启动子GCATGC RY重复元件(Chatthai等,2004)以及在小粒种咖啡种子特异性11S启动子中检测到的CATGCA和CATGCC序列(Marraccini等,1999)相似。还应注意富含AT的基序ATATTTATT(504/512)与大豆β-伴大豆球蛋白α-亚基基因上游序列中鉴定的种子特异性增强子(Allen等,1989)相似。 
实施例9 
咖啡油体固醇蛋白cDNA的分离和特征描述
油体固醇蛋白家族的单个成员被命名为CcSTO-1(cccs46w11o15,AY841276)。此处的CcSTO-1在开花后30周和46周的种粒中检测到(表5)。 
表5.含油体固醇蛋白全长cDNA的单基因中EST的数量和分布 
Figure 2006800242019A00800071
先前已确定油体固醇蛋白与种子油体相缔合(Lin等,2002;Lin和Tzen,2002)。油体固醇蛋白是结合NADP+的固醇脱氢酶,在体外对雌二醇和皮质甾酮均表现出脱氢酶活性(Lin等,2002)。不希望局限于任何机制的解释,油体固醇蛋白也许参与调节与种子油体相关的特化生物学功能的信号转导中,这可能与种子萌发期油体的动员相关(Lin等,2002)。Lin等人(2002)以及Lin和Tzen,(2004)鉴定了芝麻中与油体相缔合的两种不同的油体固醇蛋白,命名为油体固醇蛋白-A和油体固醇蛋白-B。Lin等人,(2002)还鉴定了NCBI非冗余蛋白质数据库中拟南芥油体固醇蛋白家族的8个成员。然而,Joliver等人(2004)只检测到一个与体内拟南芥油体相缔合的油体固醇蛋白(油体固醇蛋白-1;BAB09145)。图2显示CcSTO-1蛋白质序列和两个最同源GenBank蛋白质序列的最佳比对。CcSTO-1的全长氨基酸序列和与芝麻油体缔合的油体固醇蛋白-B(AF498264;Lin和Tzen,2004)以及拟南芥油体固醇蛋白-7(CAB39626;参见Lin等,2002)的同源性分别是79%和66%。标出了保守的S-(12X)-y-(3X)-K活性位点。此外,还标出了在N末端结构域内的脯氨酸KNOT基序所含的2个保守的脯氨酸,认为它以与先前报道的油质蛋白KNOT基序(Lin等,2002)相似的方式起锚定作用。 
arabica和robusta中STO-1转录物水平的基因特异性Taqman定量 RT-PCR测定均表明,这个转录物主要在种粒中以低水平表达,尽管在其它组织中还观察到低大约16倍的表达水平(图6)。当比较arabica和robusta种子中油体固醇蛋白的转录物水平时,一旦考虑发育的时间差异,STO-1的转录水平在这两个物种之间表现出相对近似。STO-1转录物在robusta晚期阶段的表现与所有在此进行检测的基因的观察结果相似。在robusta和arabica种粒中,STO-1的转录物水平均在大绿期达到峰值,然后在发育晚期阶段降低。Lin和Tzen(2004)获得相似的结果,他们表明芝麻种子油体缔合的油体固醇蛋白A转录物在种子发育期间积累。 
实施例10 
利用启动子-GUS融合在拟南芥中分析咖啡油质蛋白启动子CcDH2的功能
在拟南芥中进行咖啡油质蛋白启动子CcDH2的功能分析。启动子与报告基因连接,也就是编码β-葡糖醛酸糖苷酶(GUS)的序列。 
材料和方法: 
在厂商(stratagene)所述的条件下,用聚合酶Pful扩增油质蛋白CcOle1启动子序列,引物如下: 
TG-702 ttgaagcttACGACAGGTTTCCCGACTG(SEQ ID NO.:81)和 
TG-703 gcagatctaccatggGCGGTGGACGGTAGCTTAT(SEQ IDNO.:82)。 
由此获得的PCR片断再用HindIII和BglII酶切,克隆到植物转化载体pCMBIA1301的HindIII/BglII位点。这在GUS的ATG(GUS第一个外显子)置入大约1kb的片断,包括油质蛋白启动子序列,它包含了在油质蛋白cDNA(大约70 bp)中发现的几乎完整的5’非翻译区(仅缺3bp)。通过测序验证启动子的正确定位。包含新油质蛋白启动子的载体命名为pCAMBIA1301UCD3.1。 
植物转化。使用标准方法,将转化载体pCAMBIA1301UCD3.1转化 到根癌农杆菌(Agrobacterium tumefaciens)菌株EHA105中。被2个35S启动子驱动的潮霉素抗性基因是pCambia1301中的植物可选择标记。用floral-dip方法(Clough和Bent,1998)进行根癌农杆菌介导的拟南芥转化(用质粒pCAMBIA1301UCD3.1)。 
通过将种子种植到含1mM硝酸钾和50μg/ml潮霉素的0.8%琼脂上鉴定转化的植物。种植后7天,当植物具有伸出的初生根时鉴定转化的幼苗。幼苗被转移到含0.5倍M&S盐的0.8%琼脂上。当第二叶对发育时将植物转移到土壤中,使之成熟并结种(T1)。在某些情况下,T1种子萌发,然后使之生长并结种(T2)。 
GUS染色。用于GUS染色研究的幼苗和长角果来自于T1或T2种子,以及不同发育阶段。GUS染色溶液的制备包括:在50μl二甲基甲酰胺中溶解5mg X-Gluc,然后将其加入10ml 50mM NaPO4 pH7.0。用精细的镊子,将幼苗从萌发皿中转移到含有1.0ml GUS染液的1.5ml微量离心管中。将管转移到干燥器,在真空下放置10分钟,然后37℃(在黑暗中)孵育24或48小时。去除染液,放到脱色液(70%乙醇)中。将管放置在37℃以加速褪色。根据组织中色素的量,需要数次更换70%乙醇。在解剖显微镜下观察染上色的幼苗和其它组织,数字化记录图像。至于长角果,将其从植物摘下,用解剖刀打开使染液渗透。上述GUS染液改良成包含0.5%Triton X100。染色之后,长角果在乙醇∶乙酸(2∶1)中孵育脱色,然后在Hoyer’s Light medium(60ml水加入100g水合氯醛)中孵育。具有较不成熟种子的长角果在乙醇:乙酸溶液中预孵育4个小时,具有较成熟种子的长角果预孵育8个小时。长角果在Hoyer’s Light medium中褪色24小时至几天。 
结果: 
在不同发育阶段的幼苗中观察到GUS在用pCam131UCD3.1转化的拟南芥中表达。在非常年轻幼苗的子叶和胚轴以及较成熟幼苗的第一真叶中见到表达。根部没有检测到明显的表达。成熟的叶子中没有检测到GUS 活性。在长角果壁也检测到GUS表达,但长角果壁的GUS染色没有年轻萌发期的种子组织那样强。不可能在Hoyler’s medium中完全褪色长角果,从而残留的绿色色素留在长角果壁,使染色的长角呈青绿色。GUS活性限制在长角果并没有扩展到花茎。 
这些数据证实咖啡油质蛋白启动子CcOLE-1驱动相连的编码序列在种子、长角果以及正萌发种子的第一子叶和第一真叶中表达。重要的是,这个结果表明在此描述的CcOle-1启动子序列包含在植物中驱动种子特异性基因表达所必需的所有功能元件。数据还指出CcOle-1启动子能被用于驱动基因在未成熟组织(如来源于正萌发种胚的头两个子叶)中表达。此外,数据还显示CcDH2启动子在其它组织中(如长角果)被活化。应当指出,CcDH2启动子在长角果和种粒中的活化水平似乎比正萌发种子的子叶中的活化水平相对更低,尽管至少这种区别部分是由于在这些非常不同的组织类型中进行GUS染色的能力不同。最后,考虑到拟南芥和咖啡之间相对大的进化距离,此处证明咖啡CcDH2启动子在拟南芥中发挥功能,暗示这种启动子在相对广泛的植物中应该是有活性的。 
实施例11 
通过渗透性胁迫诱导咖啡CcOle-1基因表达
为了研究咖啡油质蛋白CcOle-1在应对渗透性胁迫中的作用,在进行水缺乏(干旱)处理的植物中研究了CcOle-1的表达。 
材料和方法: 
对在温室中生长的使用小克隆增殖的小粒种咖啡卡帝摩(catimor)树,进行脱水实验。这些树大约三年树龄且正在土壤中生长。实验前几周,树木一起在温度大约25℃的温室中培养,相对湿度大约70%,每天通过自动灌溉浇水。在实验的开始,3棵树作为对照,每天浇水。另外3棵树不浇水,因此经历渐进性脱水。每周对每棵树的2片幼叶(大小5-8 cm,植物顶端长出时摘取)进行取样。样品直接放到液氮中冷冻。 
RNA提取和cDNA合成。使用RNEASY
Figure 2006800242019_2
Plant mini kit(QiagenGmbH,Hilden,Germany)提取经多种胁迫处理的组织样品和对照的RNA。冷冻的组织样品最初用液氮在研钵和乳钵中研磨获得粉末。然后根据RNEASY
Figure 2006800242019_3
Plant mini kit实验方案提取冷冻粉末中的RNA。简言之,最多100mg冷冻的粉末和细胞裂解缓冲液及β-巯基乙醇混合。对表现出明显坏死的组织,再加入2μM的PMSF。为了消除低水平杂质基因组DNA,使用RNEASY
Figure 2006800242019_4
Plant mini kit所含的DNase-free RNase处理(如厂商所述),即室温在柱中处理15分钟。最后,柱中的RNA洗脱到50μL RNasefree水中。在260nm用分光光度计测量确定RNA量,并通过计算260nm/280nm的吸收比值估测RNA质量。还可以通过1%琼脂糖凝胶电泳验证RNA质量。这些RNA样品的反转录反应如下进行:大约1μg总RNA和12.4μM oligo-dT[2.3μl,70μM oligo-dT(Proligo)]用RNase-free水调至终体积13μL。混合物在65℃孵育5分钟。然后,加入7μL混合物:含5倍缓冲液(Transcriptor RT reaction buffer),20单位的RNase抑制剂,1mM的4种dNTP(每种250μm)及10单位的TRANSCRIPTOR
Figure 2006800242019_5
逆转录酶(Roche,Nutley,NJ)。这种混合物在55℃孵育40分钟。最后,在20μL混合物中加入0.5μL的RNaseH(Invitrogen,Carlsbad,CA),在37℃再孵育30分钟。根据厂商提供的实验方案,用SNAPTM凝胶纯化试剂盒(Invitrogen,Carlsbad,CA)纯化产生的cDNA。 
引物和MGB探针设计。使用PRIMER EXPRESSTM软件(AppliedBiosystems,Foster City,CA)设计引物和MGB探针集合。引物杂交温度大约60℃而MGB探针的杂交温度接近70℃。扩增子的大小大约80bp。通过PROLIGO合成引物,按照厂商的说明书(Applied Biosystems,FosterCity,CA)合成MGB探针。上表3已显示CcOle-1和CcRpl39的引物和探针序列。 
实时定量RT-PCR。这些实验所用cDNA的制备如上所述。如以上多个部分所述进行TaqMan-PCR。通过测量GOS基因基因组特异性引物/探针集合的定量PCR扩增信号相对于GOS基因cDNA探针信号的水平,来 验证cDNA制备物中不存在任何明显水平的残留基因组DNA。 
结果: 
图12显示当停止浇水时(干旱条件),在温室生长的小树的叶子中诱导表达CcOle-1基因。三周之后,与三棵供水良好的对照植物中Ole-1平均表达相比,在一棵植物中发现水胁迫轻微诱导CcOle-1表达。在第三周其它两棵处理的植物几乎没有被诱导。但是在第4周,三颗处理植物中的两棵诱导Ole-1表达。在第六周,所有三棵处理的植物表现Ole-1表达上升。所有3棵水胁迫植物发现增加的Ole-1表达水平在0.18<RQ<0.4之间变化。尽管这些数值比正在发育种粒中的Ole-1观测值低几倍,它们仍然比没有胁迫的对照叶子中观测的值高几倍。这后一种观察结果表明油质蛋白如CcOle-1也许有助于叶组织在渗透性胁迫下的内源性保护。 
参考文献 
Aalen RB,Opsahl-Ferstad HG,Linnestad C,Olsen OA.(1994).Transcriptsencoding an oleosin and a dormancy-related protein are present in both thealeurone layer and the embryo of developing barley(Hordeum vulgare L.)seeds.Plant J.5(3):385-396. 
Aalen RB.(1995).The transcripts encoding two oleosin isoforms are bothpresent in the aleurone and in the embryo of barley(Hordeum vulgare L.)seeds.Plant Mol.Biol.28(3):583-588. 
Abell BM,Holbrook LA,Abenes M,Murphy DJ,Hills MJ,Moloney MM.(1997).Role of the proline knot motif in oleosin endoplasmic reticulumtopology and oil body targeting.Plant Cell.9(8):1481-1493. 
Akiyama M,Murakami K,Ohtani N,1watsuki K,Sotoyama K,Wada A,Tokuno K,1wabuchi H,Tanaka K.(2003).Analysis of volatile compoundsreleased during the grinding of roasted coffee beans using solid-phasemicroextraction.J Agric Food Chem.51(7):1961-1969. 
Allen RD,Bernier F,Lessard PA,Beachy RN.(1989).Nuclear factorsinteract with a soybean β-conglycinin enhancer.Plant Cell.1:623-631.Bumlein H,Nagy I,Villarroel R,InzéD,Wobus U.(1992).Cis-analysis ofa seed protein gene promoter:the conservative RY repeat CATGCATGwithin the legumin box is essential for tissue-specific expression of alegumin gene.Plant J.2:233-239. 
Beaudoin F,Napier JA.(2002).Targeting and membrane-insertion of a sunflower oleosin in vitro and in Saccharomyces cerevisiae:the centralhydrophobic domain contains more than one signal sequence,and directsoleosin insertion into the endoplasmic reticulum membrane using a signalanchor sequence mechanism.Planta 215(2):293-303. 
Chamberlan S,Daigle N,Bernier F.(1992).The leguminin boxes and the 3’part of a soybean β-conglycinin promoter are involved in seed geneexpression in transgenic tobacco plants.Plant Mol.Biol.19:937-949.Chatthai M,正向BS,Yevtushenko D,Stefanov I,Osuska L,Osusky M,Misra S.(2004).2S storage protein gene of Douglas-fir:characterizationand activity of promoter in transgenic tobacco seeds.Plant Physiol.Biochem.42(5):417-23. 
Chen JCF,Lin RH,Huang HC,Tzen JTC.(1997).Cloning,expression andisoform classification of a minor oleosin in sesame oil bodies.J.Biochem.122(4):819-824. 
Chen MCM,Chyan CL,Lee TTT,Huang HC,Tzen JTC(2004)Constitution of stable artificial oil bodies with triacylglycerol,phospholipid,and caleosin.J Agric Food Chem 52,3982-3987. 
Chia TY,Pike MJ,Rawsthorne S.(2005).Storage oil breakdown duringembryo development of Brassica napus(L.).J Exp Bot.56(415):1285-1296. 
Chiba A,Ishida H,Nishizawa NK,Makino A,Mae T.(2003).Exclusion ofribulose-1,5-bisphosphate carboxylase/oxygenase from chloroplasts byspecific bodies in naturally senescing leaves of wheat.Plant Cell Physiol.44, 914-921. 
Chuang RL,Chen JC,Chu J,Tzen JT.(1996)Characterization of seed oilbodies and their surface oleosin isoforms from rice embryos.J.Biochem120(1):74-81. 
Clough,SJ and Bent AF(1998).Floral dip:a simplified method forAgrobacterium-mediated transformation of Arabidopsis thaliana.PlantJournal 16;735-743. 
Coste,R.Caféiers et cafés.Techniques aricoles et productions tropicales.G.P.Maisonneuve et Larose et A.C.C.T.Paris,France.(1989). 
Crouzillat D,Lerceteau E,Petiard V,Morera J,Rodriguez H,Walker D,Phillips W,Ronning C,Schnell R,Osei J,Fritz P(1996)Theobroma cacaoL.:a genetic linkage map and quantitative trait loci analysis,Theor.Appl.Genet.93:205-214. 
Diclkinson CD,Evans RP,Nielsen NC.(1988).RY repeats are conserved inthe 5′-flanking regions of legume seed-protein genes.Nucleic Acids Res.16(1):371. 
Donaire JP,Belver A,Rodriguez-Garcia MI,Megias L.(1984).Lipidbiosynthesis,oxidative enzyme activities and cellular changes in growingolive fruit.Rev Esp Fisiol.40(2):191-203. 
Fernandez-Moya V,Martinez-Force E,Garces R.(2000).Metabolism oftriacylglycerol species during seed germination in fatty acid sunflower (Helianthus annuus)mutants.J Agric Food Chem.48(3):770-774. 
Froese CD,Nowack L,Cholewa E,Thompson JE(2003).Molecularcomposition and surface properties of storage lipid particles in wax bean(Phaseolus vulgaris).J Plany Physiol.160(3):215-225. 
Garcia-Mas J,Messeguer R,Arus P,Puigdomenech P.(1995).Molecularcharacterization of cDNAs corresponding to genes expressed duringalmond(Prunus amygdalus Batsch)seed development.Plant Mol.Biol.27(1),205-210. 
Guilloteau M,Laloi M,Blais D,Crouzillat D,McCarthy J.(2003).Oilbodies in Theobroma cacao seeds:cloning and characterization of cDNAencoding the 15.8 and 16.9 kDa oleosins.Plant Sci.164(4):597-606. 
Hammond-Kosack MCU,Holdworth MJ,Bevan MW.(1993).In vitrofootprinting of a low molecular weight glutenin gene(LMWG-1D1)inwheat endosperm.EMBO J.12:545-554. 
Hernandez-Pinzon I,Ross JHE,Barnes KA,Damaht AP.Murphy DJ.(1999).Composition and role of tapetal lipid bodies in the biogenesis of thepollen coat of Brassica napus.Planta208:588-589. 
Hsieh K,Huang AHC.(2004).Endoplastic reticulum,oleosins,and oils inseeds and tapetum cells.Plant Phys.136:3427-3434. 
Huang AHC,(1992).Oil bodies and oleosins in seeds.Ann Rev Plant PhysMol Biol 43:177-200. 
Huang AHC,(1996).Oleosins and oil bodies in seeds and other organs.Plant Physsiol.110(4):1055-1061. 
Hughes DW,Wang HY. Galau GA.(1993).Cotton(Gossypium hirsutum)MatP6 and MatP7 oleosin genes,Plant Physiol.101(2):697-698. 
Jolivet P.Roux E,D′Andrea S,Davanture M,Negroni L,Zivy M,ChardotT.(2004).Protein composition of oil bodies in Arabidopsis thaliana ecotypeWS.Plant Physyiol Biochem.42(6):501-509. 
Kawagoe Y,Murai N.(1992).Four distinct nuclear proteins recognise invitro the proximal promoter of the bean seed storage protein β-phaseolingene conferring spatial and temporal control.Plant J.2:927-936. 
Keddie JS,Edwards EW,Gibbons T,Shaw CH,Murphy DJ.(1992).Sequence of an oleosin cDNA from Brassica napus.Plant Mol.Biol.19(6):1079-1083. 
Keddie JS,Tsiantis M,Piffanelli P,Cella R,Hatzopoulos P,Murphy DJ.(1994).A seed-specific Brassica napus oleosin promoter interacts with aG-Box-specific protein and may be bi-directional.Plant Mol.Bio.24:327-340. 
Kim HU,Hsieh K,Rataayake C,Huang AH.(2002).A novel group ofoleosins is present inside the pollen of Arabidopsis.J.Biol Chem.277(25):22677-22684. 
Lee K,Huang AH.(1994).Genes encoding oleosins in maize kernel ofinbreds Mo17 and B73.Plant Mol.Biol.26(6):1981-1987. 
Lee K,Ratnayake C,Huang AH.(1995).Genetic disseetion of theco-supression of genes encoding the isoforms of oleosins in the oil bodies ofmaize kernel.Plant J.7(4):603-611. 
Lelievre JM,Oliveira LO,Nielsen NC.(1992).5’-CATGCAT-3’elementsmodulate the expression of glycinin genes.Plant Physiol.98:387-391. 
Li M,Murphy DJ,Lee KK,Wilson R,Smith LJ,Clark DC,Sung JY.(2002).Purification and structural characterisation of the centralhydrophoblic domain of oleosin.J.Biol.Chem.277(40):37888-37895. 
Lin LJ,Tai SS,Peng CC,Tzen JT(2002)Steroleosin,a sterol-bindingdehydrogenase in seed oil bodies.Plant Physiol128(4):1200-1211 
Lin LJ,Tzen JT.(2004).Two distinct steroleosins are present in seed oilbodies.Plant Physiol Biochem.42(7-8):601-608. 
Maier UG, Brown JWS,Toloczki C,Feix G.(1987).Binding of a nuclearfactor to a consensus sequence in the 5’flanking region of zein genes frommaize.EMBO J.6:17-22. 
Marraccini P,Deshayes A,Pétiard V,Rogers WJ.(1 999).Molecular cloningof the complete 11S seed storage protein gene of Coffea arabica andpromoter analysis in transgenic tobacco plants.Plant Physiol.Biochem.37(4):273-282. 
Marraccini P,Courjault C,Caillet V,Lausanne F,LePage B,Rogers W,Tessereau S,and Deshayes A.(2003).Rubisco small subunit of Coffeaarabica:cDNA sequence,gene cloning and promoter analysis in transgenictobacco plants.Plant Physiol.Biochem.41:17-25. 
Marriott KM,Northcote DH.(1975).The breakdown of lipid reserves inthe endosperm of germinating castor beans.Biochem J.148(1):139-144. 
Murphy DH,Hernandez-pinzon I,Patel K,Hope RG,McLauchlan J.(2000).Nerw insights into the mechanisms of lipid-body biogenesis inplants and other organisms.Biochem.Soc.Trans.28(6):710-711. 
Murphy DH,Ross JHE.(1998).Biosynthesis,targeting and processing ofoleosin-like proteins,which are major pollen coat components in Brassicanapus.Plant J.13:1-16. 
Naested H,Frandsen GI,Jauh GY,Hernandez-pinzon I,Nielsen HB,Murphy DJ,Rogers JC,Mundy J.(2000).Calosins:Ca2+-binding proteinsassociated with lipid bodies.Plant Mol.Biol.44:463-476. 
Naot D,Holland D,Avsian-Kretchmer O,Eshdat Y,Ben-Hayyim G.(1995).Indnction of a gene encoding an oleosin homologue in cultured citrus cellsexposed to salt stress.Gene 161:171-173. 
Penfield S,Rylott EL,Gilday AD,Graham S,Larson TR,Graham IA.(2004).Reserve mobilization in the Arabidopsis endosperm fuels hypocotylelongation in the dark,is independent of abscisic acid,and requires phosphoenolpyruvate carboxykinase 1.Plant Cell16(10):2705-2718.Pritchard SL,Charlton WL,Baker A,Graham IA.(2002).Germinationand storage reserve mobilization are regulated independently inArabidopsis.Plant J.31(5):639-647. 
Qu RD,Huang AH.(1990).Oleosin KD 18 on the surface of oil bodies inmaize.Genomic and cDNA sequences and the deduced protein structure.J.Biol.Chem.265(4):2238-2243 
Rogers,WJ.,Bézard,G.,Deshayes,A.,Meyer,I.,Pétiard,V.,Marraccini,P.(1999).Biochemical and molecular characterisation and expression of the11S-type storage protein from Coffea arabica endosperm.Plant Physiol.Biochem.37(4):261-272. 
Shirsat A,Wilford N,Croy R,Boulter D.(1 989).Sequences responsible forthe tissue specific promoter activity of a pea legumin gene in tobacco.Mol.Gen.Genet. 215(2):326-331. 
Simkin,AJ.,Laizet,Y.,Kuntz,M.(2004a).Plastid lipid associated proteinsof the fibrillin family:structure,localisation,function and gene expression.Rec.Res.Dev.Biochem.5:307-316. 
Simkin AJ,Underwood BA,Auldridge M,Loucas H,Shibuya K,Clark DG,Klee HJ.(2004b).Circadian regulation of the PhCCD1 carotenoiddioxygenase controls emission of β-ionone,a fragrance volatile of petuniaflowers.Plant Physiol.136(3):3504-3514. 
Slack CR,Bertaud WS,Shaw BD,Holland R,Browse J,Wright H.(1980).Some studies of the compostion and surface of oil bodies from the seedcotyledons of safflower and linseed.Biochem.J.190:551-561. 
Tai SS,Chen MC,Peng CC,Tzen JT.(2002).Gene family of oleosinisoforms and their structural stabilization in sesame seed oil bodies.Biosci.Biotech.Biochem.66(10):2146-2153. 
Takaiwa F,Yamanouchi U,Yoshihara T,Washida H,Tanabe F,Kato A,Yamada K.(1996).Characterization of common cis-regulatory elementsresponsible for the endosperm-specific expression of members of the riceglutelin multgene family.Plant Mol.Biol.(30):1207-1221. 
Tan BC,Joseph LM,Deng WT,Liu L,Li QB,Cline K,McCarty D.(2003).Molecular characterization of the Arabidopsis 9-cis epoxycarotenoiddioxygenase gene family.Plant J.35:1-13. 
Thomas TL.(1993). Gene expression during embryogenesis andgermination:an overview.Plant Cell(5):1401-1410. 
Thoyts PJ,Millichip MI,Stobart AK,Griffiths WT,Shewry PR,Napier JA.(1995).Expression and in vitro targeting of a sunflower oleosin.Plant Mol.Biol.29(2):403-410. 
Ting JTL,Lee K,Ratnayake C,Platt KA,Balsamo RA,and Huang AHC.(1996).Oleosin genes in maize kernels having diverse oil contents areconstitutively expressed independent of oil contents.Size and shape ofintracellular oil bodies are determined by oleosins/oil ratio.Planta,199: 158-165. 
Tzen JTC,CaoYZ,Laurent P,Ratnayake C,Huang AHC.(1993).Lipids,proteins,and structure of seed oil bodies from diverse species.PlantPhysiol,101:267-276. 
Tzen JTC,Chuang RLC,Chen JCF,Wu LSH.(1998).Coexistence of botholeosin isoforms on the surface of seed oil bodies and their individualstabilization to the organelles.J.Biochem.,123:318-323. 
Tzen JTC,Lai YK,Chan KL,Huang AHC.(1990).Oleosin isoforms ofhigh and low molecular weights are present in the oil bodies of diverse seedspecies.Plant Physiol.,94:1282-1289. 
Variyar PS,Ahmad R,Bhat R,Niyas Z,Sharma A.(2003).Flavoringcomponents of raw monsooned arabica coffee and their changes duringradiation processing.J Agric Food Chem.51(27):7945-7950. 
Washida H,Wu CY,Suzuki A,Yamanouchi U,Akihama T,Harada K,Takaiwa F.(1999).Identification of cis-regulatory elements required forendosperm expression of the rice storage protein glutelin gene Glub-1.Plant Mol.Biol.(40)1-12. 
Wahlroos T,Soukka J,Denesyuk A,Wahlroos R,Korpela T,Kilby NJ.(2003).Oleosin expression and trafficking during oil body biogenesis intobacco leaf cells.Genesis 35:125-132. 
Wu LSH,Hong GHH,Hou RF,Tzen JTC.(1999).Classification of the single oleosin isoform and characterization of seed oil bodies ingymnosperms.Plant Cell Physiol.40:326-334. 
Wu LSH,Wang LD,Chen PW,Chen LJ,Tzen JT.(1998).Genomic cloningof 18kDa oleosin and detection of traicymglycerol and oleosin isoforms inmaturing rice postgermination seeds.J.Biochem.123(3):386-391. 
Zheng Z,Kawagoe Y,Xiao S,Li Z,Okita T,Hau TL,Lin A,Murai N.(1993).5′distal and proximal cis-acting regulatory elements are requiredfor developmental control of a rice seed storage protein gene.Plant J.(4)357-366. 
本发明并不局限于上文说明和例举的实施方案,而是能够在所附权利要求书的范围之内进行变化和改动。 

Claims (15)

1.从咖啡中分离的核酸分子,是编码分子量14kDa至19kDa的油质蛋白的编码序列,其中油质蛋白是SEQ ID NO:8所示的氨基酸序列。
2.通过权利要求1的基因转录产生的mRNA分子。
3.通过权利要求2的mRNA分子反转录产生的cDNA分子。
4.包含权利要求1的核酸分子的载体,为从由细菌载体、酵母载体和病毒载体组成的载体组中选择的表达载体。
5.权利要求4的载体,其中所述病毒载体是杆状病毒载体。
6.权利要求4的载体,其中所述病毒载体是杆粒。
7.权利要求4的载体,其中所述载体是质粒。
8.权利要求7的载体,其中所述质粒是粘粒。
9.权利要求4至8中任一项所述的载体,其中核酸分子的编码序列与组成型启动子、或者诱导型启动子、或者组织特异性启动子有效连接。
10.权利要求9的载体,其中所述组织特异性启动子是种子特异性启动子。
11.权利要求10的载体,其中所述种子特异性启动子是咖啡种子特异性启动子。
12.权利要求11的载体,其中咖啡种子特异性启动子是SEQ ID NO:15所示的油质蛋白基因启动子。
13.用权利要求12的载体转化的宿主细胞,其中所述宿主细胞从由细菌细胞、真菌细胞组成的组中选择。
14.权利要求1的核酸分子的用途,用于调节咖啡豆的风味或香味,包括将权利要求1的核酸分子引入咖啡植物中。
15.权利要求4-12中任一项所述的载体的用途,用于调节咖啡豆的风味或香味,包括将权利要求4-12中任一项所述的载体引入咖啡植物中。
CN2006800242019A 2005-07-01 2006-06-30 咖啡油质蛋白基因和启动子 Expired - Fee Related CN101213302B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US69644505P 2005-07-01 2005-07-01
US60/696,445 2005-07-01
PCT/US2006/026121 WO2007005928A2 (en) 2005-07-01 2006-06-30 Oleosin genes and promoters from coffee

Publications (2)

Publication Number Publication Date
CN101213302A CN101213302A (zh) 2008-07-02
CN101213302B true CN101213302B (zh) 2012-09-05

Family

ID=37605175

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2006800242019A Expired - Fee Related CN101213302B (zh) 2005-07-01 2006-06-30 咖啡油质蛋白基因和启动子

Country Status (10)

Country Link
US (1) US7910718B2 (zh)
EP (2) EP2189532A1 (zh)
CN (1) CN101213302B (zh)
AP (1) AP2007004262A0 (zh)
AU (1) AU2006265068A1 (zh)
BR (1) BRPI0613726A2 (zh)
CA (1) CA2613738A1 (zh)
EC (1) ECSP078012A (zh)
WO (1) WO2007005928A2 (zh)
ZA (1) ZA200801046B (zh)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ITRM20070129A1 (it) * 2007-03-14 2008-09-15 Plantechno S R L Piante di tabacco mutagenizzate come coltura da seme per la produzioe di olio da usare ai fini energetici industriali e alimentari
NZ554114A (en) * 2007-04-23 2010-01-29 Agres Ltd Plants with an increased ratio of oleosin to TAG synthesising enzymes
EP2363408A3 (en) 2008-06-23 2012-07-11 Nestec S.A. Genes for modulating coffee maturation and methods for their use
CN101899447B (zh) * 2009-05-26 2012-06-06 中国农业科学院油料作物研究所 一种油菜DNA分子Bnoleosin1基因和应用
TWI377954B (en) * 2009-11-25 2012-12-01 Univ China Medical Oil body carriers, uses in target therapy and/or detection of the same, and fusion proteins comprised therein
CN102822334A (zh) 2010-03-09 2012-12-12 雀巢产品技术援助有限公司 咖啡中半乳甘露聚糖含量的调节
WO2011127118A1 (en) * 2010-04-06 2011-10-13 Algenetix, Inc. Methods of producing oil in non-plant organisms
WO2012126789A1 (en) 2011-03-18 2012-09-27 Nestec S.A. Production of chlorogenic and dactylifric acid species
BR102012008162B1 (pt) * 2012-04-09 2018-08-14 Empresa Brasileira De Pesquisa Agropecuária - Embrapa composições e métodos para modificar a expressão de genes de interesse
CN102925480B (zh) * 2012-11-02 2014-05-07 浙江大学 一种抑制水稻2-pgk基因表达的植物表达载体及培育低植酸水稻的方法
DE102012220083B3 (de) 2012-11-05 2014-03-06 Technische Universität Dresden Verfahren und System zum direkten, strahlungslosen Energietransfer über flüssige Phasengrenzen
US9926347B2 (en) 2013-11-05 2018-03-27 Board Of Regents, The University Of Texas System Methods for engineering sugar transporter preferences
US9695223B2 (en) 2014-05-21 2017-07-04 Board Of Regents, The University Of Texas System Engineered xylose transporters with reduced glucose inhibition
US20230027430A1 (en) * 2019-12-16 2023-01-26 Cargill, Incorporated Isolated oleosome composition and process for preparing it

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1259168A (zh) * 1997-04-09 2000-07-05 罗纳-普朗克农业公司 用来修饰植物种子脂质组成的油质蛋白5′调控区
CN1305532A (zh) * 1998-06-11 2001-07-25 纳幕尔杜邦公司 用于改变玉米脂质特征的去饱和酶的基因

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3962321A (en) 1972-04-11 1976-06-08 General Foods Corporation Enhancement of coffee flavor
US4072761A (en) 1975-11-24 1978-02-07 Societe D'assistance Technique Pour Produits Nestle S.A. Aromatization of coffee products
US5948667A (en) 1996-11-13 1999-09-07 Her Majesty The Queen In Right Of Canada, As Represented By The Department Of Agriculture And Agri-Food Xylanase obtained from an anaerobic fungus
CN1084595C (zh) 1997-05-27 2002-05-15 塞姆柏奥希斯遗传学公司 油体的用途
JPH1156248A (ja) 1997-06-09 1999-03-02 Ajinomoto Co Inc 油糧種子から高濃度油脂含有物と未変性タンパク質を分離、製造する方法
US6586658B1 (en) 1998-03-06 2003-07-01 Metabolix, Inc. Modification of fatty acid metabolism in plants
AU5788299A (en) 1998-08-28 2000-03-21 Pioneer Hi-Bred International, Inc. Seed-preferred promoters from (end) genes
US6501004B1 (en) 1999-05-06 2002-12-31 National Research Council Of Canada Transgenic reduction of sinapine in crucifera
US7126042B1 (en) 1999-11-18 2006-10-24 Nestec S.A. Recombinant oleosins from cacao and their use as flavoring or emulsifying agents
BR0313110A (pt) 2002-08-02 2005-07-12 Basf Plant Science Gmbh ácidos nucleicos que codificam proteìnas regulatórias do metabolismo de açúcar e lipìdios em plantas e seus usos
US7547821B2 (en) 2003-06-17 2009-06-16 Sembiosys Genetics Inc. Methods for the production of insulin in plants
BRPI0409205A (pt) * 2003-06-20 2006-03-28 Nestec Sa modulação dos nìveis de precursores do sabor de café em grãos de café verdes
WO2005013713A1 (en) 2003-08-12 2005-02-17 Unilever Plc Ice confection and its manufacturing process
TW200526778A (en) 2003-11-14 2005-08-16 Sembiosys Genetics Inc Methods for the production of apolipoproteins in transgenic plants

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1259168A (zh) * 1997-04-09 2000-07-05 罗纳-普朗克农业公司 用来修饰植物种子脂质组成的油质蛋白5′调控区
CN1305532A (zh) * 1998-06-11 2001-07-25 纳幕尔杜邦公司 用于改变玉米脂质特征的去饱和酶的基因

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
曹仪植等.种子的油体蛋白及其基因.《植物生理学通讯》.1993,第29卷(第06期),406-412. *
眭顺照等.植物蛋白oleosin及其在植物基因工程中的应用.《中国生物工程杂志》.2003,第23卷(第06期),17-21. *

Also Published As

Publication number Publication date
BRPI0613726A2 (pt) 2011-02-01
EP2189532A1 (en) 2010-05-26
CA2613738A1 (en) 2007-01-11
AU2006265068A1 (en) 2007-01-11
AP2007004262A0 (en) 2007-12-31
ZA200801046B (en) 2009-07-29
EP1902132A2 (en) 2008-03-26
CN101213302A (zh) 2008-07-02
ECSP078012A (es) 2008-03-26
WO2007005928A3 (en) 2007-08-09
US20090229007A1 (en) 2009-09-10
US7910718B2 (en) 2011-03-22
WO2007005928A2 (en) 2007-01-11

Similar Documents

Publication Publication Date Title
CN101213302B (zh) 咖啡油质蛋白基因和启动子
ES2270227T3 (es) Promotor met-1 del maiz.
EP1904639B1 (en) Dehydrin genes and promoters from coffee
CA2544272C (en) Meg1 endosperm-specific promoters and genes
US8969541B2 (en) Nucleic acids and proteins associated with sucrose accumulation in coffee
CA2695929C (en) A plant height regulatory gene and uses thereof
JP5519192B2 (ja) 種子のタンパク質含量を増産させる遺伝子及びその利用方法
Simkin et al. Oleosin gene family of Coffea canephora: quantitative expression analysis of five oleosin genes in developing and germinating coffee grain
JP2009509509A (ja) コーヒー中のスクロース分解と関連している核酸及びタンパク質
BRPI0616979A2 (pt) molécula de ácido nucléico isolada do café (coffea spp), moléculas de mrna e cdna, oligonucleotìdeo, vetor, célula hospedeira, planta fértil e método de modular sabor ou aroma de grãos de café
KR100685520B1 (ko) 종자 특이적 프로모터, 이의 증폭용 프라이머, 이를포함하는 발현벡터 및 형질전환세포
JPWO2009072608A1 (ja) 植物の油脂を増産させる遺伝子及びその利用方法
CZ20021139A3 (cs) Specifické promotory albumenu rostlinných zrn
KR101855137B1 (ko) 식물의 생산성 증대 기능, 노화 지연 기능 및 스트레스 내성 기능을 갖는 atpg8 단백질과 그 유전자 및 이들의 용도
LT et al. 1800 Vevey (CH)
KR20130095482A (ko) 식물의 생산성 증대 기능, 노화 지연 기능 및 스트레스 내성 기능을 갖는 atpg3 단백질과 그 유전자 및 이들의 용도
MX2007015995A (en) Oleosin genes and promoters from coffee
JP5850079B2 (ja) 種子のタンパク質含量を減少させる遺伝子及びその利用方法
JP5845306B2 (ja) 種子のタンパク質含量を増産させる遺伝子及びその利用方法
JP5850078B2 (ja) 種子のタンパク質含量を減少させる遺伝子及びその利用方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20120905

Termination date: 20190630