CN101326194A - 在咖啡中编码类苯基丙烷途径酶的多核苷酸 - Google Patents

在咖啡中编码类苯基丙烷途径酶的多核苷酸 Download PDF

Info

Publication number
CN101326194A
CN101326194A CNA2006800458899A CN200680045889A CN101326194A CN 101326194 A CN101326194 A CN 101326194A CN A2006800458899 A CNA2006800458899 A CN A2006800458899A CN 200680045889 A CN200680045889 A CN 200680045889A CN 101326194 A CN101326194 A CN 101326194A
Authority
CN
China
Prior art keywords
seq
sequence
coffee
nucleic acid
gene
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2006800458899A
Other languages
English (en)
Inventor
M·勒佩莱
G·舍米纳德
J·G·麦卡锡
V·帕蒂尔
林晨炜
S·D·坦克斯雷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nestec SA
Cornell University
Cornell Research Foundation Inc
Original Assignee
Nestec SA
Cornell University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nestec SA, Cornell University filed Critical Nestec SA
Publication of CN101326194A publication Critical patent/CN101326194A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/415Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8242Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
    • C12N15/8243Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Zoology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Microbiology (AREA)
  • Medicinal Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Cell Biology (AREA)
  • Nutrition Science (AREA)
  • Botany (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Plant Pathology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Tea And Coffee (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Coloring Foods And Improving Nutritive Qualities (AREA)

Abstract

本发明公开了在咖啡植物中涉及绿原酸的生物合成途径的多核苷酸和多肽。还公开了使用这些多核苷酸和多肽用于制备咖啡豆的香味、香气和其它特征的方法,及其用于保护咖啡植物对抗疾病或氧化胁迫的方法。

Description

在咖啡中编码类苯基丙烷途径酶的多核苷酸
技术领域
本发明涉及农业生物技术领域。本发明尤其描述来自咖啡植物的多核苷酸,其编码类苯基丙烷(phenylpropanoid)途径中涉及的导致绿原酸合成的酶,本发明也涉及这些多核苷酸用于对咖啡豆的香味、香气和其他特征进行基因调节和操作的方法,以及防止咖啡植物患病和氧化胁迫的方法。
背景技术
在本说明书中引用了多种出版物,包括专利、公开的应用和学术文献。各出版物在此处以其整体引用作为参考。在说明书中没有完全阐明的在说明书末尾列出。
对于消费者优选的咖啡品种和品牌,关键成份是咖啡的香气和香味。咖啡的特征性香气和香味来源于烘焙咖啡豆的过程中出现的涉及香味前体的一系列复杂的化学反应(麦拉德反应(Maillard reaction))。香味前体包括在绿色咖啡豆中存在的化学化合物和生物分子。迄今为止,已经发现大于800种化学和生物分子对于咖啡的香味和香气有所贡献(Flament,I.2002Coffee Flavor Chemistry J.Wiley,U.K.)。
由于咖啡消费者越来越精益求精,因此希望生产具有改良的香气和香味的咖啡,从而适应消费者的选择。香气和香味都可以通过化学方法人为地传递到咖啡产品中去。见例如美国专利号4,072,761(香气)和美国专利号3,962,321(香味)。然而,迄今为止仅有很少的关于影响咖啡香气和香味的天然咖啡粒成分(例如多糖、蛋白质、色素和脂类)的信息。一种方法是从现存种质中选择具有高级香味特征的变种。此途径的一个缺点是最高品质的变种通常也带有显著的负面农业经济学性状,例如低产量和对于疾病和环境胁迫的低抗性。也可以从育种试验中选择新的变种,其中具有不同工业和农艺性状的变种之间进行杂交,在它们的子代中筛选高品质和好的农艺学性能。然而,后一途径非常费时,一个杂交试验和超过三个生长季节的筛选最少需要7-8年。因此,可选择的提高咖啡品质的途径是利用分子生物学技术来增强在咖啡豆中天然存在的负责香味和香气的元素,或者增加非天然存在于咖啡豆中的香气和香味增强元素。基因工程特别适合于实现这些目标。例如,可以交换不同咖啡品种中的咖啡蛋白质。可选择地,可以提高编码对咖啡香味有积极贡献的天然存在咖啡蛋白质的基因的表达。相反,可以抑制编码对咖啡香味不利的天然存在咖啡蛋白质的基因的表达。
当用同样方法烘焙和加工绿色颗粒样品时,不同变种和来源的咖啡展现显著的香味和香气品质的变化。品质的差异是在颗粒样品中化学的和物理的明显变化,其主要由不同的生长和加工条件及母本植物和颗粒的不同的遗传背景所导致。在化学组合物的水平上,至少部分香味品质可以与小的代谢产物的水平相关联,例如发现糖、酸、酚类和咖啡因与不同变体的颗粒相关。公认有其他未充分表征的香味和香味前体分子。另外,可能颗粒中结构的变化也导致咖啡品质的差异。发现咖啡粒中与咖啡品质有关的成分的一个途径是研究在具有不同品质特征的不同变种的颗粒样品成熟过程中差异表达的基因和蛋白质。同样,可以研究参与香味和香味前体分子生物合成的基因和蛋白质。
绿原酸是备选香味和香味前体分子的实例。绿原酸(CGA)是在绿色咖啡粒中发现的一组重要的非挥发性化合物。CGA由某些反式肉桂酸(咖啡酸和阿魏酸)和奎尼酸之间形成的酯类家族组成(Clifford等人,2000)。在咖啡豆中,多数CGA可以被归类为3类之一:绿原酸(CQA;3-CQA,4-CQA和5-CQA);二咖啡酰奎尼酸(diCQA;3,4-diCQA,3,5-diCQA和4,5-diCQA);和阿魏酰奎尼酸(FQA)。在成熟的绿色咖啡粒中,CGA水平是可变的,在卡尼福拉咖啡(Coffea canephora)(罗巴斯特种(robusta))中占干物质成分(DMB)的大约7.88%到14.4%,在阿拉比卡咖啡(CoffeaArabica)中占DMB的大约3.4%到4.8%(Ky等人,2001)。Clifford提出CGA含量在卡尼福拉咖啡中占DMB的7%到10%,而在阿拉比卡咖啡中占DMB的5%到7.5%(Clifford等人,1985)。在卡尼福拉咖啡中,估计总CGA含量的67%由CQA组成,约20%由diCQA组成,和约13%由FQA组成。在阿拉比卡咖啡中,CQA、diCQA和FQA分别相应于总CGA含量的平均80、15和5%(Ky等人,2001)。
对于在植物中合成CGA的早期类苯基丙烷途径已有很多了解。(Dixon,R.和Paiva,N.1995 Plant Cell 7,1085-1097;Douglas,C.J.1996 TrendsPlant Sci.,1 171-178)。此生物合成途径的概况在图1中概述(Hoffmann等人,2004)。第一步涉及苯丙氨酸通过苯丙氨酸氨裂解酶(PAL)转变为肉桂酸。在拟南芥中已经表征了4个不同的PAL基因,并且那些基因可以归为两个不同的组(Raes,J等人2003,Plant Physiology 133,1051-1071)。不同的PAL亚型的表达和活性代表植物初级和次级代谢之间的主要分支点,这样,不同PAL亚型在复杂的调节控制下。(Dixon,R.和Paiva,N.1995 PlantCell 7,1085-1097;Rohde,A.,等人2004 Plant Cell,16 p2749-2771)。此途径中的另一种酶是反式肉桂酸酯-4-羟化酶(C4H)(登录号BAA24355;CYP73A5拟南芥),其将肉桂酸转换成(对)-香豆酸。迄今为止,在拟南芥中仅发现此类P450-依赖的单氧化酶的一个基因,而在一些其他植物中发现归为两个不同类别的两个或更多的C4H基因(Reas等人,2003)。此途径的下一个步骤是由4-香豆酸酯:辅酶连接酶(4CL)执行的。在拟南芥基因组中发现至少4个4CL基因和9个4CL类基因(Raes等人,2003)。4CL可在辅酶A和酚类化合物(例如(对)-香豆酸、咖啡酸、阿魏酸、5-羟基阿魏酸和芥子酸)之间形成酯类(Hu等人,1998)。
虽然在类苯基丙烷途径的早期部分中涉及的酶已经为人们所认知几年了,但是仅在最近才纯化出在接下来的步骤中所需要的酰基转移酶,羟基肉桂酰-辅酶A转移酶(HCT)(烟草)和羟基肉桂酰-辅酶A奎尼酸酯:羟基肉桂酰转移酶(HQT)(来自番茄和烟草),并且克隆和研究了相应的DNA序列(Hoffmann等人2003 J.Biol Chem 278,95-103;Niggeweg等人2004Nature Biotechnology,22,746-754)。这些酶催化(对)-香豆酰-辅酶A或咖啡酰-辅酶A与莽草酸酯或奎尼酸酯之间的酯类形成,从而产生CGA。HCT也可以催化逆向反应,即CGA降解(Hoffmann等人,2003)。在拟南芥中只有一个基因(HCT)编码此步骤中的酶(Raes等人,2003)。仅在最近才阐明了类苯基丙烷途径的下一个步骤,即香豆酸酯第3位点的羟基化作用。Schoch等人发现一种拟南芥P450蛋白质(CYP98A3)能够使香豆酸酯第3位点羟基化,但是仅在其被酯化为莽草酸酯或奎尼酸酯的情况下(2001 J.Biol Chem 276,36566-36574)。在拟南芥基因组中鉴定出3个基因编码该酶,即(对)-香豆酸酯3-羟化酶(C3H)。然而,Raes等人(2003)发现这些基因中只有一个(C3H1)在所有检验的组织中表达,而另外两个基因仅在有限数目的组织中和在发育的特定时间表达。
类苯基丙烷途径的现有模型(图1)提示HCT/HQT的正向和反向活性具有调控木质素前体水平的作用,并且由此影响在植物中形成的木质素的量和类型。在C3H介导的羟基化作用之后,通过HCT/HQT从咖啡酰奎尼酸或咖啡酰莽草酸中释放咖啡酰-辅酶A,然后在活性咖啡酰-辅酶A 3-氧位-甲基转移酶(CCoAOMT)的作用下形成阿魏酰辅酶A(Zhang和Chinnappa 1997 J.Biosci.22,161-175;Zhong等人1998.Plant Cell 10,2033-2046)。CCoAOMT也可以使5-羟基阿魏酰-辅酶A甲基化形成芥子酰-辅酶A(Zhong等人,1998)。在拟南芥中有7个推定的CCoAOMT基因,而在其他植物中存在两类CCoAOMT基因(Zhong等人1998;Raes等人2003)。目前在烟草中3个不同的CCoAOMT类已经被表征(Maury等人1999)。第1类CCoAOMT基因包括仅在拟南芥中表征的CCoAOMT基因(CCoAOMT-1),和在多数其他植物中表征的CCoAOMT基因。剩余的推定CCoAOMT基因归于第2类(Raes等人,2003)。拟南芥CCoAOMT-1是表达量最高的基因,在所有检验的组织中都能检测到其表达;也能在所有组织中检测到拟南芥CCoAOMT-5和CCoAOMT-7的较低表达,而在特异性组织中可以检测到CCoAOMT-2、-3、-4和-6的低表达(Raes等人,2003)。由于其相对高的普遍表达,拟南芥CCoAOMT-1和其在其他植物中可能的直向同源物被认为在与细胞发育相关的木质化过程中起主要作用(Raes等人,2003)。
最初,关于类苯基丙烷途径的许多研究集中于理解用于黄酮类、花青素、不同形式木质素的前体合成的全部通量,和如何调节该途径。然而,由于越来越多的证据表明富含抗氧化剂的饮食可以通过对氧化胁迫的防御而减少癌症和退行性疾病的风险(Bazzano,L.等人2002;Astley,S.,2003),最近的研究认为存在高水平的类苯基丙烷途径的中间代谢产物,并具有高抗氧化剂活性(Hoffmann等人2004,Niggeweg等人2004)。例如,绿原酸构成植物性食品(例如苹果、梨、蕃茄、马铃薯和茄子,以及绿色和烘焙的咖啡粒(豆))中重要的抗氧化剂类。事实上可以通过消耗植物性食物而最好地完成饮食摄取CGA,除此之外,此类分子也显示显著的生物利用度(Nardini等人,2002,J.Agric Food Chem.50,57355741;Couteau等人,2001,J.Applied Microbiol.90,873-881;Clifford,M.2004,Planta Med 70,1103-1114)。已经直接证明在植物减少氧化胁迫中涉及CGA。例如,Shadle等人(2003)证明在烟草中过表达负责CGA生物合成第一步的PAL酶会导致CGA含量相对于野生型植物增加约5倍,并且证明可以抵抗真菌病原体尾孢真菌(Cercospora nicotianae)。
Niggeweg等人(2004)通过在蕃茄中使用组成型启动子(2×35S启动子)来过量生产HQT的研究提出另外的证据。其证明在CGA合成中直接相关的酶HQT的水平越高,CGA的水平就越高,从而提高对氧化胁迫的抵抗力,和增加植物对微生物病原体的抗性。人们逐渐认识到饮食的CGA在血浆抗氧化剂库中可能的重要作用,并且一种或多种CGA类型的分子可能转化为新的或附加的具有促进健康活性的代谢产物(例如见Clifford,2004)。而且,很明显CGA在植物对疾病的抗性中发挥作用。因此,需要更好的了解和促进植物中这些化合物的合成和累积。
绿原酸在咖啡中含量丰富。尽管此类分子对于植物和人类的健康、以及咖啡的香味、香气和品质具有重要作用,但是分析咖啡中类苯基丙烷途径的研究还很少,而且对于咖啡中CGA的可利用的数据也有限。Campa等人鉴定了推定CCoAOMT的部分序列(登录号AF534905)(Campa等人,2003),并绘制了该序列在咖啡基因组中的图谱。另外,发现鉴定的该基因的两条等位基因之一与绿原酸的整体水平相关。Bauman等人分离了编码咖啡PAL的两个部分cDNA序列(登录号AAF27655和AAF27654),且Campa等人分离了编码PAL1(登录号AAN32866)和PAL2(登录号AAN32867)的两个cDNA序列。用Clustal W将相应4个蛋白质的重叠区域进行序列比对,发现这4个序列高度相关,在蛋白质水平具有94-99.5%的预测同一性,且在核苷酸水平具有大于97.1%的同一性。此同一性水平提示这4个序列可能代表单一的咖啡PAL。
在咖啡烘焙过程中,绿原酸进行性降解(De Maria等人,1995)。事实上,这些改变代表在此过程中出现的重要组成性改变之一(Bicchi等人,1995)。有报道表明每1%干物质的丧失伴随CGA含量丧失超过8-10%。(Clifford等人,1985,1998)。在烘焙过程中,CGA转化成一系列挥发性和非挥发性的化合物(S.Homma,2001)。例如,异构化作用和水解作用会导致多种奎尼酸和奎尼内酯、及肉桂酸的产生(Homma,2001),后者进一步通过脱羧作用降解为一系列酚类化合物,包括挥发性化合物例如4-乙烯基愈创木酚,其与通常的咖啡香气相关(Homma 2001,Farah等人,2005;和Rizzi G等人,1993“Flavor chemistry based on the thermally-induceddecarboxylation of p-hydroxycinnamic acids.In Food Flavors,Ingredientsand Composition(Charalambous编辑)第663-670页Elsevier SciencePublishers,Amsterdam,Netherlands)。、
CGA的降解产物,尤其是绿原酸内酯和奎尼酸内酯的形成,与酿造咖啡的苦味相关,咖啡酿造后的酸度增加与游离奎尼酸的产生有关(Homma,2001,Leloup等人,1995;和Buffo等人,2004)。最近,Muller和Hofmann发现绿原酸和它们的热降解产物可作为巯基结合位点(2005,J.Agric和Biol Chem 53,2623-2629)。因为含巯基的化合物(例如2-糠基硫醇和3-甲基-2-丁烯-1-硫醇)是咖啡香气的重要组成部分,已经提出绿原酸和相关化合物与咖啡饮料中的香气化合物反应,其在酿造之后有效地减少咖啡的香气(Muller和Hofmann,2005)。
尽管很清楚咖啡中的绿原酸影响香气,但是仍然不确定是否所有的绿原酸都具有同等的作用。因此需要产生其CGA谱具有清楚差别的确定的咖啡变体。选择具有不同谱的咖啡变体有两种不同的途径。第一种是使用经典的育种和选择,有关CGA生物合成途径的遗传信息可以显著地辅助此途径。此信息可以鉴定主基因的等位基因,和随后的育种材料和子代。第二种通用的途径是直接改变CGA合成过程中涉及的特异性主基因。此途径可以通过诱变和筛选(TILLING),或通过使用基因克隆和咖啡转化来改变特异性基因的表达来实现。随后以它们的绿原酸降解产物的含量和烘焙后的香味谱来评估来自这些新的非-GMO、或GMO变体的具有改变的CGA谱的颗粒。然后选择那些具有更高级的香味和其他特征的颗粒进一步研究。
咖啡粒中绿原酸含量的增加会导致烘焙过程中涉及香气的CGA-衍生挥发物的增加。因此,在咖啡粒中通过对负责CGA生物合成的蛋白质的产生进行基因调控从而调控CGA含量,是提高由此类基因工程咖啡豆所生产的咖啡饮料和咖啡产品的香气的一种新方法。在咖啡豆中CGA含量的增加也可能有利于由此类咖啡豆所生产的咖啡饮料和产品的消费者的整体健康。另外,调节咖啡植物中的CGA含量也有利于咖啡植物的整体健康和疾病抵抗力。由于这些理由,就需要分离咖啡CGA生物合成途径中的多核苷酸和多肽,并发展利用这些分子用于一个或多个上述目的的方法。
发明概述
本发明在此处描述编码咖啡植物中导致绿原酸生物合成的类苯基丙烷途径中的酶的基因,它们编码的多肽,和这些多核苷酸和多肽用于对咖啡豆的香味、香气和其他特征进行基因调节和操作的方法。
本发明一方面描述从某种咖啡(Coffea spp.)中分离的核酸分子,其含有一个编码类苯基丙烷途径酶的编码序列。在一个实施方案中,此类酶是羟基肉桂酰-辅酶A莽草酸酯/奎尼酸酯羟基肉桂酰转移酶,该酶与SEQ IDNO:9或SEQ ID NO:10至少有86.9%的同一性。在另一个实施方案中,此类酶是羟基肉桂酰-辅酶A奎尼酸酯羟基肉桂酰转移酶,该酶与SEQ IDNO:11或SEQ ID NO:12至少有78.1%的同一性。在另一个实施方案中,此类酶是(对)-香豆酰3’羟化酶,该酶与SEQ ID NO:13至少有82.9%的同一性。在另一个实施方案中,该酶是咖啡酰-辅酶A 3-氧位-甲基转移酶,其与SEQ ID NO:14、SEQ ID NO:15或SEQ ID NO:16至少有86.3%的同一性。
在某个实施方案中,核酸分子是具有开放读码框的基因,其包含编码序列。可选择地,其可以包含该基因通过转录产生的mRNA分子,或mRNA分子通过逆转录产生的cDNA分子。本发明也描述长度在8-100碱基之间的寡核苷酸,其与上述核酸分子的片段互补。
本发明的另一方面描述包含上述编码类苯基丙烷途径酶的核酸分子的载体。在特定实施方案中,载体是选自质粒、噬菌粒、粘粒、杆状病毒、杆粒、细菌、酵母和病毒载体的表达载体。在特定实施方案中,载体包含有效连接于组成型启动子的核酸分子的编码序列。在其他实施方案中,编码序列有效连接于诱导型启动子。在其他实施方案中,核酸分子的编码序列有效连接于组织特异型启动子,例如种子特异型启动子,优选咖啡种子特异性启动子。
根据本发明的另一方面,提供用上述载体转化的宿主细胞。宿主细胞可以是植物、细菌、真菌、昆虫或哺乳动物细胞。在特定实施方案中,宿主细胞是选自咖啡、烟草、拟南芥、玉米、小麦、稻、大豆、大麦、黑麦、燕麦、高粱、苜蓿、三叶草、油菜、红花、向日葵、花生、可可、番茄特梅提诺(tomato tomatillo)、马铃薯、胡椒、茄子、甜菜、胡萝卜、黄瓜、莴苣、豌豆、紫菀、秋海棠、菊、翠雀草(delphinium)、百日草(zinnia)和草坪草中任一种的植物细胞。本发明也描述由转化的植物细胞再生所产生的可育转基因植物。在一个特定实施方案中,可育转基因植物是咖啡种。
本发明的另一方面描述调控咖啡豆的香味或香气的方法。该方法包括在咖啡种子中调控一种或多种类苯基丙烷途径酶的产生。在某些实施方案中,该方法包括增加一种或多种类苯基丙烷途径酶的产生,例如通过在咖啡种子中增加编码一种或多种内源类苯基丙烷途径酶的基因的表达,或通过向植物中引入编码类苯基丙烷途径酶的转基因。在其他实施方案中,该方法包括降低一种或多种类苯基丙烷途径酶的产生,例如通过向咖啡中引入核酸分子从而抑制编码一种或多种类苯基丙烷途径酶的基因的表达。
参考如下附图、详细说明和实施例将帮助理解本发明的其他特征和优点。
附图概述
图1.类苯基丙烷途径。该植物的类苯基丙烷途径的表示是来自Hoffman等人,2004的修改版。PAL,苯丙氨酸脱氨酶;C4H,肉桂酸酯4-羟化酶;4CL,4-羟基肉桂酰-辅酶A连接酶;HCT,羟基肉桂酰-辅酶A莽草酸酯/奎尼酸盐羟基肉桂酰转移酶;HQT,羟基肉桂酰-辅酶A奎尼酸盐:羟基肉桂酰转移酶;C3H,(对)-香豆酸酯3-羟化酶;CCoAOMT,咖啡酰-辅酶A氧位-甲基转移酶;CAD,肉桂醇脱氢酶;CCR,肉桂酰-辅酶A还原酶;COMT I,咖啡酸/5-羟基阿魏酸氧位-甲基转移酶;F5H,阿魏酸5-羟化酶;SAD,芥子醇脱氢酶。
图2.来自卡尼福拉咖啡的CcHCT完全ORF的分离和表征。A)包含卡尼福拉咖啡的HCT完全ORF的cDNA的分离。获得两个覆盖CcHCT完全ORF的cDNA克隆,即含有卡尼福拉咖啡HCT的5’端的5’RACE产物(Race1_CcHCT)(SEQ ID NO:17)和含有该基因剩余3’端的部分cDNA克隆pcccwc22w14m23(SEQ ID NO:18)(见实施例中的方法)。用这些序列来设计新的引物从卡尼福拉咖啡BP409 cDNA(颗粒,黄色期)中以PCR扩增1388 bp的片段(pML1中的CcHCT)(SEQ ID NO:1)。5’非翻译区以深黑色条显示,ORF区域以阴影线条显示,并标出翻译起始(ATG)和终止(TGA)密码子。3’非翻译区以浅黑色线显示。B)pML1的插入序列(SEQ IDNO:1)与cDNA序列pcccwc22w14m23(SEQ ID NO:18)和Race1_CcHCT(SEQ ID NO:17)进行比对。用CLUSTAL W程序(Lasergene package,DNASTAR)和手动优化进行比对。标记为灰色的核酸与pML1(CcHCT)插入序列(SEQ ID NO:1)相匹配。
图3.来自阿拉比卡咖啡的CaHCT完全ORF的分离和表征。A)包含阿拉比卡咖啡的HCT完全ORF的cDNA的分离。获得编码阿拉比卡咖啡HCT 5’端的基因组DNA片段(GW1_CaHCT)(SEQ ID NO:19)(见实施例中的方法),其包含与卡尼福拉咖啡HCT cDNA pcccwc22w14m23(SEQ ID NO:18)重叠的部分。获得的阿拉比卡咖啡基因组序列与5’端引物序列HCT-FullUp1(SEQ ID NO:50)几乎完全匹配,因此用该引物与CcHCT-R1从阿拉比卡咖啡T2308 cDNA(颗粒黄色期)中以PCR扩增1388bp的片段(pML5中的CaHCT)(SEQ ID NO:2)。5’非翻译区以深黑色条显示,ORF区域以阴影线条显示,并标出翻译起始(ATG)和终止(TGA)密码子。3’非翻译区以浅黑色线显示。基因组区域以深灰色线显示。值得注意的是该基因的5’非翻译区的主要部分还没有确定。B)用CLUSTAL W程序和手动优化将pML5的插入序列与阿拉比卡咖啡基因组序列GW1_CaHCT(SEQ ID NO:19)和卡尼福拉咖啡  cDNA序列pcccwc22w14m23(SEQ ID NO:18)进行比对。标记为灰色的核酸与pML5(CaHCT)(SEQ ID NO:2)插入序列相匹配。
图4.CcHCT、CaHCT、CcHQT和CaHQT与其他植物的HCT和HQT的蛋白质序列比对。用CLUSTAL W(Lasergene package,DNASTAR)将CcHCT(SEQ ID NO:9)、CaHCT(SEQ ID NO:10)、CcHQT(SEQ IDNO:11)和CcHQT(SEQ ID NO:12)基因编码的蛋白质序列与其他从NCBI数据库获得的HCT和HQT蛋白质进行比对。标记为灰色的氨基酸表示最常见的残基。列出基因名,并在括号中给出登陆号。NtHCT(烟草(Nicotianatabacum),CAD47830(SEQ ID NO:20))、AtHCT(拟南芥,NP_199704(SEQ ID NO:21))、IbHCBT(甘薯(Ipomea batatas),BAA87043.1(SEQ IDNO:22))、NtHQT(烟草,CAE46932.1(SEQ ID NO:23))和LeHQT(食用番茄(Lycopersicon esculentum),CAE46933.1(SEQ ID NO:24))。绿色和蓝色的盒表示保守的氨基酸残基,分别为HXXXD(SEQ ID NO:25)和DFGWG(SEQ ID NO:26)。在pML3蛋白质序列的272位点划圈的X代表由pML3插入序列编码的终止密码子。但是,如在实施例6中所确定的,该终止密码子在PCR步骤被插入,因为基因组序列在该位点编码的是谷氨酰胺。
图5.来自卡尼福拉咖啡的CcHQT完全ORF的分离和表征。A)包含卡尼福拉咖啡的CcHQT完全ORF的cDNA的分离。获得两个覆盖CcHQT完全ORF的cDNA片段(Race3_CcHQT(SEQ ID NO:27)和pcccs30w13p12(SEQ ID NO:28))(见实施例中的方法)。用这些序列来设计引物从卡尼福拉咖啡BP409(果皮,低绿色期)中以PCR扩增1534 bp的片段(pML2中的CcHQT)(SEQ ID NO:3)。蛋白质编码区域以阴影线条显示,并标出翻译起始(ATG)和终止(TGA)密码子。3’非翻译区以浅黑色线显示。标志与图2和3中相同。B)pML2的插入序列与cDNA序列Race3_CcHQT(SEQ ID NO:27)和pcccs30w13p12(SEQ ID NO:28)进行比对。用CLUSTAL W程序(Lasergene package,DNASTAR)和手动优化进行比对。标记为灰色的核酸与pML2(CcHQT)插入序列(SEQ ID NO:3)相匹配。
图6.来自阿拉比卡咖啡的CaHQT完全ORF的分离和表征。A)包含阿拉比卡咖啡的编码CaHQT完全ORF的cDNA的分离。获得编码阿拉比卡咖啡HQT 5’端的5’RACE cDNA片段(Race2_CaHQT)(SEQ IDNO:29)。先前用于CcHQT PCR扩增的引物HQT-FullUp2(SEQ ID NO:52)和HQT-FullLow2(SEQ ID NO:53)也可成功用于从阿拉比卡咖啡T2308cDNA(全花)中以PCR扩增1533bp的片段(pML3中的CaHQT)(SEQ IDNO:4)。标志与图2和3中一致。B)pML3的插入序列(SEQ ID NO:4)与阿拉比卡咖啡cDNA序列Race2_CaHQT(SEQ ID NO:29)和卡尼福拉咖啡序列pcccs30w13p12(SEQ ID NO:28)进行比对。用CLUSTAL W程序和手动优化进行比对。标记为灰色的核酸与pML3(CaHQT)序列(SEQ IDNO:4)相匹配。正如正文和图4的图注中所述,划圈的碱基显示pML3(SEQID NO:4)的ORF中的终止密码子。
图7.CcC3H与其他植物C3H蛋白质序列的比对。由CcC3H(在pcccl20d10(SEQ ID NO:5)中)编码的蛋白质序列(SEQ ID NO:13)与在NCBI数据库中的其他高度相关C3H蛋白质用CLUSTAL W进行比对(注:这些蛋白质是CYP相关蛋白质,因此拟南芥蛋白质最初为AtCYP)。标记为灰色的氨基酸是CcC3H序列(SEQ ID NO:13)。AtCYP(拟南芥22203)(SEQ ID NO:30)、ObC3H(罗勒(Ocimum basilicum),AAL99201)(SEQ IDNO:31)、推定的LeC3H(食用番茄,TC163965(TIGR番茄基因索引注释)(SEQ ID NO:32))。
图8.在卡尼福拉咖啡(罗巴斯特种,BP409)和阿拉比卡咖啡(阿拉比卡(arabica),T2308)中HQT、HCT、C3H、CCoAOMT1、CCoAOMT2和CCoAOMT3的定量表达分析。如方法中所述,各基因的表达用TaqMan特异性探针进行定量RT-PCR来确定。各组织样品的RQ值通过将测试基因转录水平相对于所分析的样品中广泛表达的rpl39基因的转录水平进行均一化来确定。显示的数据代表各样品3次扩增反应获得的平均值,误差线表示SD。
图9.来自阿拉比卡咖啡的CaCCoAOMT-L1(pNT8)的完全ORF的分离和表征。A)包含阿拉比卡咖啡的CCoAOMT-L1(SEQ ID NO:7)完全ORF的cDNA的分离。从卡尼福拉咖啡(颗粒,黄色期)获得一个cDNA片段(Race1_CcCCoAOMT-L1)(SEQ ID NO:33),其覆盖全部卡尼福拉咖啡CCoAOMT-L1(SEQ ID NO:7)的ORF的5’端(见实施例中的方法)。该序列和pcccs30w29k18(SEQ ID NO:34)中包含的插入序列可用于设计引物CCoAOMT-L1-FullUp(SEQ ID NO:56)和CCoAOMT-L1FullLow(SEQID NO:57),从阿拉比卡咖啡T2308(颗粒,黄色期)中扩增含有完全ORF(pNT8中的CaCCoAOMT-L1)(SEQ ID NO:7)的片段。标志与图2和3中一致。B)用CLUSTAL W程序和手动优化将pNT8的插入序列(SEQID NO:7)与cDNA序列Race1_CcCCoAOMT-L1(SEQ ID NO:33)和pcccs30w29k18(SEQ ID NO:34)进行比对。标记为灰色的碱基与该位点最经常出现的碱基相匹配。
图10.来自卡尼福拉咖啡的CcCCoAOMT-L2(pNT4)完全ORF的分离和表征。A)包含阿拉比卡咖啡的CCoAOMT-L2的完全ORF(SEQ IDNO:8)的cDNA的分离。从阿拉比卡咖啡(颗粒,黄色期)获得一个cDNA片段(Race1_CaCCoAOMT-L2)(SEQ ID NO:35),其覆盖全部阿拉比卡咖啡CCoAOMT-L2(SEQ ID NO:8)的ORF的5’端(见实施例中的方法)。该序列和pcccs46w30m24(SEQ ID NO:36)中包含的插入序列可用于设计引物CCoAOMT-L2-FullUp(SEQ ID NO:58)和CCoAOMT-L2-FullLoW(SEQID NO:59),这些引物用于从卡尼福拉咖啡BP409(颗粒,黄色期)中扩增CcCCoAOMT-L2(pNT4)(SEQ ID NO:8)片段。标志与图2和3中一致。B)pNT4的插入序列(SEQ ID NO:8)与cDNA序列Race1_CaCCoAOMT-L2(SEQ ID NO:35)和pcccs46w30m24(SEQ ID NO:36)进行比对。标记为灰色的碱基与该位点最经常出现的碱基相匹配。
图11.CcCCoAOMT-1(pcccl15a11)、CaCCoAOMT-L1(pNT8)和CcCCoAOMT-L2(pNT4)的蛋白质序列比对。用CLUSTAL W程序和手动优化将分别由(SEQ ID NO:6、7、8)编码的CcCCoAOMT-1、CaCCoAOMT-L1和CcCCoAOMT-L2蛋白质序列(分别为SEQ ID NO:14、15、16)进行比对。标记为灰色的氨基酸与在该位点最经常出现的残基相匹配。最近在与反应产物复合的苜蓿(紫花苜蓿(Medicago sativa))CCoAOMT的晶体结构中表征了随后的氨基酸相互作用(Ferrer等人,2005):粉色盒表示与辅酶A的腺苷3’-5’二磷酸部分带负电荷的3’-磷酸盐基团相互作用的氨基酸,蓝色盒表示涉及底物识别的氨基酸,绿色盒表示涉及二价金属离子和辅因子结合的氨基酸。
图12.CcCCoAOMT-1(pcccl15a11)、MsCCoAOMT、NtCCoAOMT、VvCCoAOMT、CaCCoAOMT-L1(pNT8)和CcCCoAOMT-L2(pNT4)的蛋白质序列比对。用CLUSTAL W程序和手动优化将从NCBI数据库获得的蛋白质序列MsCCoAOMT(SEQ ID NO:37)、NtCCoAOMT(SEQ IDNO:38)和VvCCoAOMT(SEQ ID NO:39)与由CcCCoAOMT-1、CaCCoAOMT-L1和CcCCoAOMT-L2基因(分别为SEQ ID NO:6、7、8)编码的蛋白质序列进行比对。标记为灰色的氨基酸与在该位点最经常出现的残基相匹配。最近在与反应产物复合的苜蓿(紫花苜蓿)CCoAOMT晶体结构中表征了随后的氨基酸相互作用(Ferrer等人,2005):粉色盒表示与辅酶A的腺苷3’-5’二磷酸部分带负电荷的3’-磷酸盐基团相互作用的氨基酸,蓝色盒表示涉及底物识别的氨基酸,绿色盒表示涉及二价金属离子和辅助因子结合的氨基酸。括号中给出从NCBI数据库获得的蛋白质序列的登录号:MsCCoAOMT(紫花苜蓿,AAC28973(SEQ ID NO:37))、NtCCoAOMT(烟草,AAC49913(SEQ ID NO:38))和VvCCoAOMT(葡萄(Vitis vinifera),CAA90969(SEQ ID NO:39))。
图13.重组CcHCT蛋白质的表达和纯化。A)来自重组GST-CcHCT融合蛋白质(pGTPc103a_HCT)的表达和纯化的多种阶段的提取物通过以下方法分析,A)用5-18%SDS-PAGE和考马斯亮蓝染色和B)用蛋白质印迹分析(见实施例中的方法)。A中的泳道:1.含有pGTPc103a_HCT并以0.2mM IPTG诱导的Bl21重组细胞的总裂解物,2.裂解物的可溶部分,3.裂解物的不可溶部分,4.用洗涤缓冲液对NiNTA柱的第一步洗涤液,5到9为用洗脱缓冲液对Ni-NTA柱进行洗脱的连续级分,9.分子量标记。B中的泳道:1.从Ni-NTA柱洗脱的混合物质。2.分子量标记。
图14.重组CcHQT蛋白质的表达和纯化。A)来自重组GST-CcHQT融合蛋白质(pGTPc103a_HQT)的表达和纯化的多种阶段的提取物通过以下方法分析,A)用5-18%SDS-PAGE和考马斯亮蓝染色和B)用蛋白质印迹分析(见实施例中的方法)。A中的泳道:1.含有pGTPc103a_HQT并以0.2mM IPTG诱导的Bl21重组细胞的总裂解物,2.裂解物的可溶部分,3.裂解物的不可溶部分,4.用洗涤缓冲液对NiNTA柱的第一步洗涤液,5到9为用洗脱缓冲液对Ni-NTA柱进行洗脱的连续级分,9.分子量标记。B中的泳道:1.从Ni-NTA柱洗脱的混合物质。2.分子量标记。
图15.CcCCoAOMT-1(pNT16)表达和纯化的分析。A)His-标签-CcCCoAOMT1融合蛋白质的表达在12%SDS-PAGE凝胶上分析,并用考马斯亮蓝染色。A-泳道1.含pNT16并用0.2%d’阿拉伯糖诱导表达的Bl21重组细胞的粗提物,2.含pNT16并用0.1%葡萄糖抑制表达的Bl21重组细胞的粗提物。B-泳道1.在NiNTA柱中填装的裂解物,2.第一步洗涤级分,3.第二步洗涤级分,4到7.用洗脱缓冲液对NiNTA柱进行1-4步洗脱的级分。MW:分子量标记(精确加预染全蓝(Biorad#161-0373))。
图16.CaCCoAOMT-L1(pNT12)表达和纯化的分析。A)His-标签-CaCCoAOMT-L1融合蛋白质的表达在12%SDS-PAGE凝胶上分析,并用考马斯亮蓝染色。A-泳道1.含pNT12并用0.2%d’阿拉伯糖诱导表达的Bl21重组细胞的粗提物,2.含pNT12并用0.1%葡萄糖抑制表达的Bl21重组细胞的粗提物。MW:分子量标记(精确加预染全蓝(Biorad#161-0373))。B-泳道1到4.用洗脱缓冲液对NiNTA柱进行1-4步洗脱的级分。MW:分子量标记(未染色精确宽分子量范围(Biorad#161-0362))。
图17.CcCCoAOMT-L2(pNT17)表达和纯化的分析。A)His-标签-CcCCoAOMT-L2融合蛋白质的表达在12%SDS-PAGE凝胶上分析,并用考马斯亮蓝染色。A-泳道1.含pNT17并用0.2%d’阿拉伯糖诱导表达的Bl21重组细胞的粗提物,2.含pNT17并用0.1%葡萄糖抑制表达的Bl21重组细胞的粗提物,MW:分子量标记(精确加预染全蓝(Biorad#161-0373))。B-泳道1到4.用洗脱缓冲液对NiNTA柱进行1-4步洗脱的级分。MW:分子量标记(未染色精确宽分子量范围(Biorad#161-0362))。
图18.His标签-CcCCoAOMT1重组蛋白质的活性分析。在方法部分描述的活性反应样品填装到HPLC柱中,并在324nm测量洗脱谱。A栏为分别在0、6和24小时取得的含40μg重组蛋白质的反应样品的HPLC洗脱谱。B栏为在相同时间点没有加入酶的对照反应的HPLC谱。
图19.CcCCoAOMT1蛋白质的未知产物鉴定为阿魏酸。通过在图18A中所示的24小时酶样品中直接加入的阿魏酸“峰”,鉴定在保留时间14.8分钟的峰为阿魏酸。表示为24小时样品+和-“峰”在324nm的紫外吸光度。绿色曲线代表24小时样品的洗脱谱,黄色曲线代表24小时样品加上阿魏酸“峰”的洗脱谱:未知产物清楚地与阿魏酸“峰”共同洗脱。
图20.在40℃活性缓冲液中5CQA样品的HPLC洗脱谱(阴性对照)。A:T=0 HPLC光谱,B:T2小时HPLC光谱,C:T4小时HPLC光谱。
图21.由重组HCT(AcTEV蛋白酶切割后释放)和5CQA底物反应获得的样品的HPLC洗脱谱。A:T=0时样品的HPLC谱,B:在40℃培育4小时后样品的HPLC谱,C:在40℃培育24小时后样品的HPLC谱。与标准注入相比较,鉴定保留时间约14.4分钟的峰为5CQA。同样鉴定2分钟的峰为辅酶A。
说明性实施方案的详述
定义:
在说明书和权利要求中通篇使用了关于生物学分子和本发明其他方面的多种术语。
术语“类苯基丙烷途径多肽、蛋白质或酶”指参与苯丙醇途径的多肽,其与其他物质一起导致植物中绿原酸的生物合成,且特别是在咖啡植物中。该术语包含此途径中各蛋白质的特异作用机制。多肽包括(不限于)此处例举的苯丙氨酸氨裂解酶、肉桂酸4-羟化酶、4-羟基肉桂酰辅酶A连接酶(也指4香豆酰-辅酶A连接酶)、羟基肉桂酰辅酶A莽草酸酯羟基肉桂酰转移酶、羟基肉桂酰辅酶-A奎尼酸盐羟基肉桂酰转移酶、(对)-香豆酸酯3-羟化酶、咖啡酰-辅酶A氧位-甲基转移酶、肉桂醇脱氢酶、肉桂酰-辅酶A还原酶、咖啡酸/5-羟基阿魏酸氧位-甲基转移酶、阿魏酸盐5-羟化酶、芥子醇脱氢酶等。
“分离的”指从天然状态进行“人工”改变。如果组合物或底物天然存在,那么如果将其从原始环境改变或移出、或两者同时进行,其即为“分离的”。例如,如此处所用的术语,天然存在于活的植物或动物中的多核苷酸或多肽不是“分离的”,但是从其天然状态的共存材料中分离出的同样多核苷酸或多肽则是“分离的”。
“多核苷酸”也指“核酸分子”,通常指任意多聚核糖核苷酸或多聚脱氧核糖核苷酸,其可以是未修饰的RNA或DNA、或修饰的RNA或DNA。“多核苷酸”包括(不限于)单链和双链DNA、单链和双链区混合的DNA、单链和双链RNA、和单链和双链区混合的RNA、包含DNA和RNA的杂化分子(可以是单链、或更通常为双链或单链和双链区混合)。另外,“多核苷酸”指包含RNA或DNA、或RNA和DNA两者的三链区。术语多核苷酸也包括含有一个或多个修饰碱基的DNA或RNA,以及为稳定性或其他原因而进行主链修饰的DNA或RNA。“修饰”碱基包括例如三苯甲基化的碱基和稀有碱基(例如肌苷)。可以对DNA和RNA进行多种修饰;因此,“多核苷酸”包含天然存在的多核苷酸的化学的、酶的或代谢的修饰形式,以及病毒和细胞的特征DNA和RNA的化学形式。“多核苷酸”也包含相对短的多核苷酸,通常指寡核苷酸。
“多肽”指包含两个或多个彼此以肽键或修饰肽键(即肽等构物)相连接的氨基酸的肽或蛋白质。“多肽”既指短链,通常指肽、寡肽或寡聚物,也指较长的链,通常指蛋白质。多肽可以包含除基因编码的20个氨基酸以外的氨基酸。“多肽”包括通过天然方法(例如翻译后加工)修饰的氨基酸序列,或通过本领域内熟知的化学修饰技术修饰的氨基酸序列。此类修饰在基本文本和更详细的专题文章、以及许多研究文献中都有详细描述。可以在多肽的任意位置修饰,包括肽主链、氨基酸侧链和氨基或羧基末端。应该理解在给定多肽中的几个位点可以存在相同或不同程度的同样类型的修饰。同样,给定多肽可以包含许多类型的修饰。由于泛素化作用,多肽可以是有分支的,而且它们可以是有或没有分支的环形。环形、分支和分支环形多肽可以来源于天然的翻译后加工,或通过合成方法形成。修饰包括乙酰化、酰化、ADP核糖基化、酰胺化、共价连接黄素、共价连接血红素部分、共价连接核苷酸或核苷酸衍生物、共价连接脂类或脂类衍生物、共价连接磷脂酰肌醇、交联、环化、形成二硫键、脱甲基、形成共价交联、形成胱氨酸、形成焦谷氨酸、甲酰化、γ-羧化、糖基化、形成GPI锚、羟基化、碘化、甲基化、豆蔻酰化、氧化、蛋白酶加工、磷酸化、异戊二烯化、外消旋、硒基化(selenoylation)、硫酸化、转运RNA介导的向蛋白质添加氨基酸(例如精氨酰化),和泛素化。例如见蛋白质结构和分子性质,第二版,T.E.Creighton,W.H.Freeman and Company,New York,1993和Wold,F.,翻译后蛋白质修饰:前景和展望,1-12页,蛋白质翻译后共价修饰,B.C.Johnson,编辑,学术出版社,New York,1983;Seifter等人,蛋白质修饰和非蛋白质辅助因子的分析,Meth Enzymol(1990)182:626-646和Rattan等人,蛋白质合成:翻译和修饰和衰老,Ann NYAcad Sci(1992)663:48-62。
此处所用术语“变体”指分别与参照多核苷酸或多肽不同的多核苷酸或多肽,但是其保留了基本的性质。通常多核苷酸变体与参照多核苷酸具有不同的核苷酸序列。变体的核苷酸序列的变化可以改变或不改变参照多核苷酸所编码的多肽的氨基酸序列。如下所述,核苷酸变化可以导致参照序列编码的多肽中的氨基酸取代、添加、缺失、融合和截短。通常多肽变体与参照多肽具有不同的氨基酸序列。通常,差异是有限的,从而使参照多肽和变体在整体上接近类似,并且在许多区域是同一的。变体和参照多肽的氨基酸序列的不同可以是一个或多个取代、添加或缺失的任意组合。取代或插入的氨基酸残基可以是或不是由遗传密码编码的。多核苷酸或多肽的变体可以天然存在,例如等位变体,或可以不是天然存在的。多核苷酸或多肽的非天然存在的变体可以通过诱变技术形成或直接合成。
关于突变植物,术语“无效突变”或“丧失功能的突变”用于指引起基因产物无功能或大量缺失的生物体或基因组DNA序列的突变。此类突变存在于基因的编码和/或调节区,且可能改变单个残基、或插入或缺失核酸区域。这些突变也可以发生于其他调节或控制基因和/或编码蛋白质的基因的编码和/或调节区,从而使蛋白质无功能或大量缺失。
术语“基本相同”指核酸或氨基酸序列的序列变化在本质上不影响蛋白质本性(即蛋白质的结构、稳定特性、底物特异性和/或生物学活性)。尤其对于核酸序列,术语“基本相同”指编码区和管理表达的保守序列,并且主要指编码相同氨基酸的简并密码子,或在编码的多肽中编码保守取代氨基酸的替代密码子。对于氨基酸序列,术语“基本相同”通常指在不涉及决定结构或功能的多肽区域的保守取代和/或改变。
术语“同一性百分比”和“相似性百分比”也在此处用于氨基酸和核酸序列中的比较。当指氨基酸序列时,“同一性”或“同一性百分比”指在用序列分析程序进行氨基酸序列的比对中,与同一性氨基酸匹配的受试氨基酸序列的氨基酸百分比。“相似性百分比”指与同一性或保守氨基酸匹配的受试氨基酸序列的氨基酸百分比。保守氨基酸是那些结构不同但是具有相似物理性质的氨基酸,从而使它们互相交换时并不改变最终蛋白质的三级结构。保守取代在Taylor(1986,J.Theor.Biol.119:205)中定义。当指核酸分子时,“同一性百分比”指使用序列分析程序,受试核酸序列的核苷酸与同一性核苷酸配对的百分比。术语“同一性”或“同一的”可与术语“同源性”或“同源的”互换使用。
“同一性”和“相似性”可以通过已知方法容易地计算。可以使用计算机程序来比较核酸序列和氨基酸序列,列出相似的核酸或氨基酸序列,由此得出差异。在优选的方法中,使用BLAST程序(NCBI)和此处所用的参数,和使用DNAstar系统的Lasergene程序包(麦迪逊,WI)来比对基因组DNA序列的片段、以及cDNA和蛋白质序列。然而,可以通过使用任意标准比对软件来获得同等比对和相似性/同一性判定。例如GCG威斯康辛程序包9.1版本,获自威斯康辛州麦迪逊的遗传计算组,并且使用该程序所用的缺省参数(空位产生罚分=12,空位延伸罚分=4)来比较序列同一性和相似性。
此处所用“抗体”包括多克隆和单克隆抗体,嵌合、单链和人化抗体,及抗体片段(例如Fab、Fab’、F(ab’)2和Fv),包括Fab或其他免疫球蛋白表达库的产物。关于抗体,术语“免疫特异性”或“特异性”指结合于目的蛋白质一个或多个表位的抗体,但是其在含有混合抗原生物分子的样品中基本不识别和结合其他分子。确定抗体结合特异性的筛选测定方法是在本领域内熟知的和常规的进行。此类测定方法的综合讨论见Harlow等人(编辑),抗体实验室手册;Cold Spring Harbor Laboratory;Cold SpringHarbor,NY(1988),第6章。
术语“基本纯化”指以重量计包含至少50-60%的目的化合物(例如核酸、寡核苷酸、蛋白质等等)的制品。更优选地,制品以重量计包含至少70%、和最优选90-99%的目的化合物。通过对于目的化合物合适的方法(例如层析法、琼脂糖或聚丙烯酰胺凝胶电泳、HPLC分析等等)来测量纯度。
对于单链核酸分子,术语“特异性杂交”指充分互补序列的两个单链核酸分子之间的相互结合,以允许此类杂交在本领域常用的预定条件下进行(有时称为“基本互补”)。具体地,该术语指寡核苷酸与单链DNA或RNA分子中含有的基本互补序列之间的杂交,基本排除寡核苷酸与单链核酸的非互补序列之间的杂交。
“编码序列”或“编码区”指当表达该序列时,具有产生基因产物必需的序列信息的核酸分子。编码序列可以在翻译区内包含非翻译序列(例如内含子或5’或3’非翻译区),或可以缺少此类插入的非翻译序列(例如在cDNA中的)。
“内含子”指核酸中的多核苷酸序列,其不编码与蛋白质合成相关的信息。此类序列被转录为mRNA,但是在mRNA被翻译成蛋白质之前被除去。
术语“有效连接”或“有效插入”指将表达编码序列所需的调节序列放入核酸分子中相对于编码序列的合适位置,从而使编码序列能够表达。例如,当启动子能够控制编码序列的转录或表达时,该启动子是与编码序列有效连接的。编码序列可以以正向或反向的方向有效连接启动子或调节序列。术语“有效连接”有时应用于在表达载体中其他转录控制元件(例如增强子)的排列。
转录和翻译控制序列是DNA调节序列,例如启动子、增强子、多腺苷酸化信号、终止子等等,其负责在宿主细胞中编码序列的表达。
术语“启动子”、“启动子区”或“启动子序列”通常指基因的转录调节区,其可以在编码区的5’或3’侧,或在编码区之内,或在内含子之内。通常启动子是DNA调节区,其能够在细胞中结合RNA聚合酶和起始下游(3’方向)编码序列的转录。通常5’启动子序列的3’末端结合于转录起始位点,并延伸到上游(5’方向),从而包括在超过背景的可检测水平上起始转录所必需的最少数目的碱基或元件。在启动子序列之内是转录起始位点(通过核酶S1绘制图谱可以方便地确定),和负责结合RNA聚合酶的蛋白质结合结构域(共有序列)。
“载体”是复制子,例如质粒、噬菌体或病毒,另一核酸分子片段可以有效地插入其中,从而引起该片段的复制或表达。
术语“核酸构建体”或“DNA构建体”有时用于指编码序列或有效连接于合适调节序列和插入载体中用于转化细胞的序列。该术语可以与术语“转化DNA”或“转基因”互换使用。此类核酸构建体可以包含目的基因产物的编码序列,同时具有可筛选标记基因和/或报告基因。
“标记基因”或“可筛选标记基因”是编码具有一种特性的基因产物的基因,该特性使含有该基因的细胞能够从不含该基因的细胞中筛选出来。基因工程中使用的载体通常包含一个或多个可筛选标记基因。可筛选标记基因的类型包括(1)抗生素抗性基因,(2)除草剂耐受性或抗性基因,和(3)代谢或营养缺陷型标记基因,其可使转化的细胞能够合成正常细胞不能产生的主要成分,通常是氨基酸。
“报告基因”也是一类标记基因。其通常编码用标准实验室方法(例如酶活性、荧光)可测定或可检测的基因产物。
术语“表达”、“表达的”或基因的“表达”指基因产物的生物合成。该过程涉及基因转录为mRNA,和随后mRNA翻译为一个或多个多肽,并且包含所有天然存在的翻译后修饰。
“内源的”指例如在特定生物中天然发现的任意组成型基因或核酸、或多肽。
核酸构建体的“异源的”区域是在较大分子中核酸分子的可识别片段,其在天然情况下并不与较大分子相结合。因此,当异源区域编码基因时,该基因通常在DNA的旁边,而其在起源生物的基因组中并不在基因组DNA的旁边。在另一实施例中,异源区域是构建体,其中编码序列本身不是天然存在的(例如基因组编码序列包含内含子的cDNA,或具有与天然基因不同的密码子的合成序列)。等位变体或天然存在的突变事件不能形成此处定义的DNA的异源区域。如上所定义,术语“DNA”构建体也用于指异源区域,尤其是为转化细胞而构建的构建体。
当外源或异源DNA被引入到细胞中时,该细胞为被此类DNA“转化的”或“转染的”。转化DNA可以整合(共价连接)或不整合到细胞基因组中。例如在原核、酵母和哺乳动物细胞中,转化DNA可以维持在附加型元件,例如质粒中。对于真核细胞,在稳定转化的细胞中转化DNA整合到染色体中,从而使其可以通过染色体复制而遗传到子细胞中。可以通过真核细胞建立细胞系的能力或含转化DNA的子细胞形成克隆的能力来证明此种稳定性。“克隆”是从单个细胞或共同祖先通过有丝分裂而衍生的细胞群体。“细胞系”是原代细胞的克隆,能够在体外稳定生长许多代。
“颗粒”、“种子”或“豆”指开花植物的生殖单位,能够发育为另一个此类植物。此处所用的这些术语是同义的并可互换使用,尤其是对于咖啡植物。
此处所用的术语“植物”包括参照整体植物、植物器官(例如叶、茎、枝干、根)、种子、花粉、植物细胞、植物细胞器、和其子代。在本发明的范围内应该理解转基因植物的部分包括例如来源于转基因植物或它们的子代的植物细胞、原生质体、组织、愈伤组织、胚,以及花、茎、种子、花粉、果实、叶、或根。
说明
一方面,本发明描述来自咖啡的核酸分子,其编码构成类苯基丙烷途径的多种蛋白质,其导致绿原酸的生物合成以及具有其他功能。从数据库中鉴定的编码构成类苯基丙烷途径的蛋白质的核酸分子的代表性实例超过47,000个表达序列标签(EST),来自从不同发育阶段收获的樱桃的嫩叶及颗粒和果皮组织中分离的RNA制成的几个卡尼福拉咖啡(罗巴斯特种)cDNA文库。鉴定出重叠的EST,并“聚类”成包含完全编码序列的单基因(重叠群)。通过将单基因序列对NCBI(生物技术信息国家中心)的非冗余蛋白质数据库进行BLAST查询来注释单基因序列。
上述分析显示代表咖啡植物中类苯基丙烷途径的几个重要酶的基因序列。目前已获得了代表这些序列的几个全部开放读码框(ORF)的cDNA。这些cDNA和它们编码的蛋白质在此处列出如下:
  酶   cDNA  (SEQ IDNO:)   编码的蛋白质   (SEQIDNO:)
  羟基肉桂酰-辅酶A莽草酸酯/奎尼酸酯羟基肉桂酰转移酶   CcHCT  1   CcHCT   9
  羟基肉桂酰-辅酶A莽草酸酯/奎尼酸酯羟基肉桂酰转移酶   CaHCT  2   CaHCT   10
  羟基肉桂酰-辅酶A奎尼酸酯羟基肉桂酰转移酶   CcHQT  3   CcHQT   11
  羟基肉桂酰-辅酶A奎尼酸酯羟基肉桂酰转移酶   CaHQT  4   CaHQT   12
  (对)-香豆酰3’羟化酶   CcC3H  5   CcC3H   13
  咖啡酰-辅酶A3-氧位甲基转移酶1   CcCCoAOMT1  6   CcCCoAOMT1   14
  咖啡酰-辅酶A3-氧位甲基转移酶-类1   CaCCoAOMT-L1  7   CaCCoAOMT-L1   15
  咖啡酰-辅酶A3-氧位甲基转移酶-类2   CcCCoAOMT-L2  8   CcCCoAOMT-L2   16
编码的蛋白质分子量约为48.06kDa CcHCT(SEQ ID NO:9)、48.19kDa CaHCT(SEQ ID NO:10)、47.72kDa CcHQT SEQ ID NO:11)、47.54kDa CaHQT(SEQ ID NO:12)、57.9kDa CcC3H(SEQ ID NO:13)、27.97kDa CcCCoAOMT1(SEQ ID NO:14)、25.71kDa CaCCoAOM L1(SEQ IDNO:15)和26.3kDa CcCCoAOMT L2(SEQ ID NO:16)。尽管此处描述和例举了来源于卡尼福拉咖啡和阿拉比卡咖啡的编码构成类苯基丙烷途径的蛋白质的多核苷酸,但是本发明也预期包含来自其他足够相似的咖啡种的核酸和编码的蛋白质,其根据下面描述的目的可以与例举的咖啡多核苷酸和蛋白质互换使用。相应地,当此处使用术语“构成类苯基丙烷途径”的多肽或蛋白质时,其预期包含具有此处描述的一般物理、生物化学和功能性特性的所有咖啡蛋白质,以及编码它们的多核苷酸。
考虑到它们的序列,编码构成类苯基丙烷途径的蛋白质的本发明的多核苷酸包括SEQ ID NO:1-8的等位变体和天然突变,其可能在不同变种的卡尼福拉咖啡和阿拉比卡咖啡中被发现,并且可能在不同咖啡种中发现SEQ ID NO:1-8的同系物。因为期望此类变体和同系物具有一定的核苷酸和氨基酸序列的差异,所以本发明提供的编码构成类苯基丙烷途径的蛋白质的分离的多核苷酸与SEQ ID NO:9-16具有至少约50%,优选至少约60、65或70%,更优选至少约71%、72%、73%、74%、75%、76%、77%、78%、79%或80%,甚至更优选81%、82%、83%、84%、85%、86%、87%、88%、89%,和甚至更优选90%、91%、92%、93%、94%、95%,和最优选96%、97%、98%和99%或更高的同一性,并且包含与SEQ IDNO:1-8的任一个具有相同范围同一性的核苷酸序列。因为在构成类苯基丙烷途径的蛋白质和在不同咖啡变种和物种中编码它们的基因中,可能存在天然的序列变体,所以本领域的技术人员期望发现此水平的变化,而仍然保持本发明的多肽和多核苷酸的独特性质。此类预期一部分是由于遗传密码的简并性,以及已知的保守氨基酸序列改变的进化,而其并不改变编码的蛋白质的本性。因此,认为此类变体和同系物基本上彼此相同,并包括在本发明的范畴内。
与编码构成类苯基丙烷途径的蛋白质的基因联合的基因调节序列是有实用性的,并包含在本发明的范畴内。来源于任意咖啡种的编码构成类苯基丙烷途径的蛋白质的基因的启动子和其他基因调节序列可以通过下述方法获得,并且可能根据本发明而利用。在其它利用中,可以使用掌管编码构成类苯基丙烷途径的蛋白质的基因表达的组织特异性和瞬时特异性的启动子和调节元件用于优化、改变或修饰构成类苯基丙烷途径的蛋白质的表达,从而提高含有此类修饰的咖啡豆所产生的咖啡产品的香味和香气。
下面的部分涉及实践本发明的一般过程。对于所述具体材料的范围,其目的只在于说明,而非意在限制本发明。除非另外说明,使用一般的生物化学和分子生物学方法,例如在Sambrook等人,分子克隆,Cold SpringHarbor Laboratory(1989)或Ausubel等人(编辑),现代分子生物学方法,John Wiley和Sons(2005)中描述的。
核酸分子、蛋白质和抗体:
本发明的核酸分子可以通过两种一般的方法制备:(1)可以从适当的核苷三磷酸合成,或(2)可以从生物来源分离。两者都利用本领域熟知的方法。
可利用的核苷酸序列信息(例如具有SEQ ID NO:1-8的cDNA)使通过寡核苷酸合成来制备本发明的分离核酸成为可能。可以通过亚磷酰胺方法使用应用生物系统38A DNA合成仪或类似装置来制备合成的寡核苷酸。可以根据本领域公知的方法,例如高效液相色谱(HPLC)来纯化合成的构建体。由于现有寡核苷酸合成方法对于分子大小的内在局限性,长的双链多核苷酸(例如本发明的DNA分子)必须按阶段合成。因此,可以以几个适当互补的较小片段合成例如一个长的双链分子。将这样产生的互补片段退火从而使每个片段具有用于黏附邻近片段的合适的粘性末端。邻近的片段可以在DNA连接酶的存在下通过粘性末端退火而连接,从而构建全长的双链分子。可以随后在合适的载体中克隆和扩增这样构建的合成DNA分子。
与本发明一致,可以通过使用适当严格性条件下的杂交和洗脱来鉴定与编码构成类苯基丙烷途径蛋白质的基因的编码和/或调节区域的部分或整体具有适当水平的序列同源性的核酸。应该理解通过本领域内的技术人员,上述策略应用于基因组序列时,其不但可以分离编码构成类苯基丙烷途径蛋白质的基因的编码序列,而且也可以分离与编码构成类苯基丙烷途径蛋白质的基因相连接的启动子和其他基因调节序列,尽管调节序列本身可以没有适合于杂交的足够的同源性。
按照一般的说明,可以根据Sambrook等人的方法进行杂交,使用的杂交溶液包含:5×SSC、5×Denhardt试剂、1.0%SDS、100μg/ml变性的鲑精DNA片段、0.05%焦磷酸钠和高达50%的甲酰胺。杂交在37-42℃进行至少6小时。杂交后,按如下步骤洗脱:(1)在2×SSC和1%SDS中于室温洗脱5分钟;(2)在2×SSC和0.1%SDS中于室温洗脱15分钟;(3)在2×SSC和0.1%SDS中于37℃洗脱30分钟到1小时;(4)在2×SSC和0.1%SDS中于45-55℃洗脱2小时,每30分钟更换溶液。
用于计算具有特定同源性的核酸分子之间杂交所需达到的严格性条件的通用公式(Sambrook等人,1989):
Tm=81.5℃+16.6Log[Na+]+0.41(%G+C)-0.63(%甲酰胺)-600/#bp双链中
对于上述公式的说明,使用[Na+]=[0.368]和50%甲酰胺,GC含量为42%,并且平均探针大小为200碱基,Tm值为57℃。同源性每降低1%会使DNA双链的Tm值降低1-1.5℃。因此,使用42℃的杂交温度将观察到靶标具有大于约75%的序列同一性。使用上述杂交和洗脱溶液,在一个实施方案中,杂交在37℃进行,而最终洗脱在42℃进行;在另一个实施方案中,杂交在42℃进行,而最终洗脱在50℃进行;并且在另外一个实施方案中,杂交在42℃进行,而最终洗脱在65℃进行。高严格性条件包括在上述杂交溶液中于42℃杂交和在0.1×SSC和0.1%SDS中于65℃最终洗脱10分钟。
本发明的核酸可以在任意方便克隆的载体中作为DNA维持。在优选的实施方案中,克隆维持在质粒克隆/表达载体中,例如pGEM-T(普洛麦格(Promega)生物技术,麦迪逊,WI)、pBluescript(斯彻特基因公司(Stratagene),La Jolla,CA)、pCR4-TOPO(英杰公司(Invitrogen),卡尔斯巴德,CA)或pET28a+(诺瓦根(Novagen),麦迪逊,WI),所有这些载体可以在合适的大肠杆菌宿主细胞中繁殖。
本发明的核酸分子包括cDNA、基因组DNA、RNA和其片段,可以是单链、双链或甚至是三链的。因此,本发明提供具有能够与至少一种本发明核酸分子序列杂交的序列的寡核苷酸(DNA或RNA的正义或反义链)。此类寡核苷酸作为有用的探针,可以用于例如通过PCR扩增在测试的植物组织样品中检测编码构成类苯基丙烷途径的蛋白质的基因或mRNA,或用于在mRNA翻译为蛋白质过程中或翻译之前对编码构成类苯基丙烷途径的蛋白质的基因的表达进行正或负调控。在此类测定中使用寡核苷酸或多核苷酸作为探针的方法包括(但是不限于):(1)原位杂交;(2)DNA杂交;(3)RNA杂交;和(4)组合的扩增反应,例如聚合酶链式反应(PCR,包括RT-PCR)和连接酶链式反应(LCR)。
可以根据已知方法通过多种方式制备由本发明的核酸编码的多肽。如果原位产生,可以从适当来源,例如种子、果皮或其他的植物部分来纯化该多肽。
可选择地,可以利用编码多肽的核酸分子使用本领域内已知的体外表达方法产生蛋白质。例如可以将cDNA或基因克隆到合适的体外转录载体,例如用于体外转录的pSP64或pSP65中,随后在合适的无细胞翻译系统(例如小麦胚或兔网织红细胞)中进行无细胞翻译。体外转录和翻译系统是商业上可获得的,例如来自普洛麦格生物技术,麦迪逊,WI,BRL,Rockville,MD或英杰公司,卡尔斯巴德,CA。
根据优选实施方案,可以通过在合适的原核或真核系统中表达而产生更大量的构成类苯基丙烷途径的多肽。例如,将部分或全部DNA分子(例如具有SEQ ID NO:1-8的cDNA)插入到适合在细菌细胞(例如大肠杆菌)或酵母细胞(例如酿酒酵母(Saccharomyces cerevisiae))中表达的质粒载体中,或插入到用于在昆虫细胞中表达的杆状病毒载体中。此类载体包含在宿主细胞中表达DNA所必需的调节元件,其放置的顺序允许DNA在宿主细胞中表达。此类表达所需的调节元件包括启动子序列、转录起始序列和任选的增强子序列。
可以根据本领域公知的方法纯化在重组原核或真核系统中通过基因表达产生的构成类苯基丙烷途径的多肽。在优选实施方案中,使用商业上可获得的表达/分泌系统,其中表达并从宿主细胞中分泌出来重组蛋白质,从而使其容易地从周围培养基中纯化。如果不使用表达/分泌载体,可选择的方法包括通过亲和分离纯化重组蛋白质,例如通过与特异性结合重组蛋白质的抗体之间的免疫相互作用。此类方法是技术人员通常使用的。
本发明的多肽也可以作为与一种或多种附加结构域连接的融合蛋白质而合成和表达,例如产生更具免疫性的肽,从而使重组的合成肽更容易分离,并能鉴定和分离抗体和表达抗体的B细胞等等。利于检测和纯化的结构域包括例如金属螯合肽(例如允许在固定化金属上纯化的多组氨酸束和组氨酸-色氨酸模块),允许在固定化免疫球蛋白上纯化的蛋白A结构域,和在FLAGS延伸/亲和纯化系统(Immunex Corp,Seattle Wash.)中应用的结构域。在纯化结构域和含基序的肽或多肽之间包含可切割的连接序列(例如因子Xa或肠激酶(英杰公司,圣地亚哥加利福尼亚)),以利于纯化。例如,表达载体可以包括编码表位的核酸序列,连接于其随后为硫氧还蛋白和肠激酶切割位点的6个组氨酸残基(见例如Williams,Biochemistry 1995,34:1787-1797;Dobeli,Protein Expr.Purif.1998,12:404-14,)。组氨酸残基有利于检测和纯化,而肠激酶切割位点提供用于从剩余的融合蛋白质中纯化表位的方法。编码融合蛋白质的载体的相关技术和融合蛋白质的应用在科学和专利文献中有详细描述(见例如Kroll,DNA Cell.Biol.1993,12:441-53)。
可以根据标准方法分析由上述方法制备的构成类苯基丙烷途径的多肽。
可以使用从咖啡中纯化或重组制备的构成类苯基丙烷途径的多肽根据已知方法产生此处定义的多克隆或单克隆抗体、抗体片段或衍生物。如果抗体对于构成类苯基丙烷途径的多肽具有特异性,那么抗体也可以是识别和结合本发明的构成类苯基丙烷途径的多肽的片段。例如,如果蛋白质或DNA分析和克隆分析(见如下)表明克隆的基因属于多基因家族,那么可以产生由相应于蛋白质非保守区域的合成肽所形成的成员特异性抗体。
用于此处描述的任意目的的包含本发明抗体的试剂盒也包括在本发明的范畴之内。通常,此类试剂盒包括具有免疫特异性抗体的对照抗原。
绿原酸可能在人类健康的多方面起作用。已经证明绿原酸在体外是强的抗氧化剂(Rice-Evands,CA等人1996),其在体外具有对抗DNA损伤的保护性作用(Shibata,H等人1999),具有抗癌和抗诱变性质,并且可能最终减少特定癌症的风险(Olthof,MR等人2001;和Hollman,PC 2001),和可能防御心血管疾病(Olthof,MR等人2001;和Hollman,PC 2001)。绿原酸的这些有益健康的作用仍需要详细说明,而且还假设其具有许多目前未知的其他有益健康的作用。相应地,此处描述和例举的构成绿原酸生物合成途径的咖啡多肽预期可以用于多种食品、健康的应用。例如,构成绿原酸生物合成途径的咖啡多肽、或其各自的绿原酸产物可以用作食品添加物、或用于多种食品和饮料产品。
可以利用编码此处所述构成类苯基丙烷途径多肽的多核苷酸的有效性获得构成类苯基丙烷途径的多肽的上述一种或多种应用,以利用重组生物体(例如在毕赤酵母(Picia pastoris)或适合食品的乳酸杆菌、或植物细胞中)产生大量的纯化蛋白质,并且随后以新的或已建立的测定方法来测试蛋白质用作抗氧化剂、化学防护或化学治疗、促进心血管健康的可能性等等。可以使用这些蛋白质产生的绿原酸根据本领域内合适的已建立或发展的方法来进行类似的测试。如果认为特异纯化的蛋白质、或此类蛋白质所产生的绿原酸产物特别有用,那么也可以从富含那些构成类苯基丙烷途径的特定多肽的咖啡粒中分离那些蛋白质和它们的绿原酸产物的天然版本。
载体、细胞、组织和植物:
根据本发明,用于产生转基因宿主细胞的载体和试剂盒也被表征,所述转基因宿主细胞含有编码构成类苯基丙烷途径的多肽的多核苷酸,或含有寡核苷酸,或其正向或反向的同源物、类似物或变体,或在细胞或组织特异性启动子和其他调节序列控制下的报告基因和其他构建体。合适的宿主细胞包括(但不限于)植物细胞、细菌细胞、酵母和其他真菌细胞、昆虫细胞和哺乳动物细胞。用于转化多种这些宿主细胞的载体是本领域技术人员熟知的。它们包括(但是不限于)质粒、噬菌粒、粘粒、杆状病毒、杆粒、细菌人工染色体(BAC)、酵母人工染色体(YAC)、以及其他细菌、酵母和病毒载体。通常产生转基因宿主细胞的试剂盒包含一种或多种合适的载体和用载体产生转基因细胞的说明书。试剂盒还包括一种或多种附加部分,例如培养细胞的培养基、用于转化细胞的试剂和用于测试转基因细胞中基因表达的试剂,这里仅列出少许。
本发明包括含有编码构成类苯基丙烷途径的多肽的基因的一个或多个拷贝、或抑制植物内源的构成类苯基丙烷途径的多肽的产生和功能的核酸序列的转基因植物。这可以通过用转基因转化植物细胞而实现,该转基因包含如下所述由天然或重组的调节序列控制的构成类苯基丙烷途径的多肽的部分或全部编码序列、或其突变体、反义序列或变体、包括RNA。转基因植物咖啡种优选包括(不限于)C.abeokutae、阿拉比卡咖啡、C.arnoldiana、C.aruwemiensis、C.bengalensis、卡尼福拉咖啡、C.congensisC.dewevrei、C.excelsa、C.eugenioides和C.heterocalyx、C.kapakata、C.khasiana、C.liberica、C.moloundou、C.rasemosa、C.salvatrix、C.sessiflora、C.stenophylla、C.travencorensis、C.wightiana和C.zanguebariae。本发明也包括任意物种的植物;这些包括(但不限于)烟草、拟南芥和其他“可实验室使用”的物种,谷类作物例如玉米、小麦、稻、大豆、大麦、黑麦、燕麦、高粱、苜蓿、三叶草等等,产油植物例如油菜、红花、向日葵、花生、可可等等,蔬菜作物例如番茄特梅提诺、马铃薯、胡椒、茄子、甜菜、胡萝卜、黄瓜、莴苣、豌豆等等,园艺植物例如紫菀、秋海棠、菊、翠雀、牵牛花、百日草、菌苔(lawn)和草坪草等等。
可以使用本领域技术人员已知的标准植物转化方法产生转基因植物。这些包括(但不限于)农杆菌载体、原生质体的聚乙二醇处理、生物射弹DNA递送、紫外激光微束、复染色体病毒载体或其他植物病毒载体、原生质体的磷酸钙处理、分离的原生质体的电穿孔、在含用转化DNA包被的微珠的溶液中搅拌细胞悬液、直接摄取DNA、脂质体介导的DNA摄取等等。此类方法已在本领域中公开。见例如植物分子生物学方法(Weissbach和Weissbach,编辑,1988);植物分子生物学方法(Schuler和Zielinski,编辑,1989);植物分子生物学手册(Gelvin,Schilperoort,Verma,编辑,1993);植物分子生物学方法-实验室手册(Maliga,Klessig,Cashmore,Gruissem &Varner,编辑,1994)。
转化的方法依赖于被转化的植物。农杆菌属载体通常用于转化双子叶植物物种。农杆菌二元载体包括(但不限于)BIN19和其衍生物、pBI载体系列、和二元载体pGA482、pGA492、pLH7000(基因文库登录号AY234330)和任意合适的pCAMBIA载体之一(衍生自Hajdukiewicz,Svab和Maliga,(1994)Plant Mol Biol 25:989-994中构建的pPZP载体,获自CAMBIA,GPO Box 3200,Canberra ACT 2601,Australia,或者通过互联网的CAMBIA.org获得)。对于单子叶植物物种的转化,核转化中常用的是以转化DNA包被的颗粒和以转化DNA包被的硅纤维进行生物射弹轰击。可选择地,农杆菌“超二元”载体已成功用于转化稻、玉米和多种其他单子叶植物物种。
用于转化选定植物而构建的DNA包含有效连接于5’调节序列(例如启动子和翻译调节序列)和3’调节序列(例如终止子)的目的编码序列。在优选实施方案中,使用在天然的5’和3’调节元件控制下的编码构成类苯基丙烷途径的多肽的编码序列。在其他实施方案中,交换编码和调节序列从而改变具有改良表型(例如香味、香气或其他特征)的转化植物的种子中的蛋白质含量。
在一个可选择实施方案中,基因的编码序列置于强的组成型启动子之下,例如花椰菜花叶病毒(CaMV)35S启动子或玄参花叶病毒35S启动子。本发明中可以使用的其他组成型启动子包括(但不限于):T-DNA甘露碱合酶、胭脂碱合酶和章鱼碱合酶启动子。在其他实施方案中,使用强的单子叶植物启动子,例如玉米泛素蛋白启动子、稻肌动蛋白启动子或稻微管蛋白启动子(Jeon等人,Plant Physiology.123:1005-14,2000)。
本发明的范畴之内也包含具有在诱导型启动子控制下表达构成类苯基丙烷途径的多肽的编码序列的转基因植物。诱导型植物启动子包括四环素抑制子/操纵子控制的启动子、热激基因启动子、胁迫(例如创伤)诱导型启动子、防御应答基因启动子(例如苯丙氨酸氨裂解酶基因)、创伤诱导基因启动子(例如富含羟脯氨酸的细胞壁蛋白质基因)、化学诱导型基因启动子(例如硝酸盐还原酶基因、葡聚糖酶基因、甲壳酶基因等等)和黑暗诱导型启动子(例如天冬酰胺合成酶基因),这里仅列出少许。
本发明中也使用组织特异型和发育特异型启动子。种子特异型启动子的非限制性实例包括Cim1(细胞分裂素诱导的通信)、cZ19B1(玉米19kDa玉米醇溶蛋白)、milps(myo-肌醇-1-磷酸合酶)、和celA(纤维素合酶)(美国申请系列号09/377,648)、大豆β-菜豆球蛋白、油菜籽蛋白、β-伴大豆球蛋白、大豆凝集素、十字花科蛋白、玉米15kDa玉米醇溶蛋白、22kDa玉米醇溶蛋白、27kDa玉米醇溶蛋白、g-玉米醇溶蛋白、蜡、shrunken 1、shrunken 2、和球蛋白1、大豆11S豆球蛋白(
Figure A20068004588900361
等人,1992)、和卡尼福拉咖啡11S种子储存蛋白(Marraccini等人,1999,Plant Physiol.Biochem.37:273-282)。也见WO 00/12733,其中公开了来自end1和end2基因的种子优选型启动子。也可以使用其他咖啡种子特异型启动子,包括(但不限于)在共有的PCT申请号US2006/026121中描述的油质蛋白启动子、在共有的PCT申请号US2006/026234中描述的脱水蛋白(dehydrin)基因启动子、和在共有的PCT申请号US2006/34402中描述的9-顺式-环氧类胡萝卜素二氧化酶基因启动子。其他组织特异型启动子的实例包括(但不限于):二磷酸核酮糖羧化酶(RuBisCo)小亚基基因启动子(例如Marracini等人,2003中描述的咖啡小亚基启动子)或在光合作用组织中表达的叶绿素a/b结合蛋白(CAB)基因启动子;和期望在根中表达的根特异型谷氨酸合成酶基因启动子。
编码区也有效连接于合适的3’调节序列。在不使用天然3’调节序列的实施方案中,可以使用胭脂碱合酶多腺苷酸化区域。其他有用的3’调节区包括(但不限于)章鱼碱合酶多腺苷酸化区域。
在合适调节元件控制之下的可筛选编码区有效连接于核抗药性标签,例如卡那霉素抗性。其他有用的可筛选标签系统包括给予抗生素或除草剂抗性的基因(例如对潮霉素、磺酰脲、膦丝菌素或草甘膦的抗性)、或给予选择性生长的基因(例如磷酸甘露糖异构酶,使植物细胞能够在甘露糖上生长)。可筛选标签基因包括(但不限于)编码抗生素抗性的基因,例如那些编码新霉素磷酸转移酶II(NEO)、二氢叶酸还原酶(DHFR)和潮霉素磷酸转移酶(HPT)的基因,以及给予对除草剂化合物的抗性的基因,例如草甘膦抗性EPSPS和/或草甘膦氧化还原酶(GOX)、抗溴草腈的溴草腈腈水解酶(BXN)、抗咪唑啉酮的AHAS基因、磺酰脲抗性基因、和2,4-二氯苯氧乙酸盐(2,4-D)抗性基因。
在特定实施方案中,本发明包含的启动子和其他表达调节序列有效连接于报告基因。本发明中使用的报告基因包括(但不限于)编码绿色荧光蛋白(GFP)、红色荧光蛋白(DsRed)、蓝绿色荧光蛋白(CFP)、黄色荧光蛋白(YFP)、海葵(Cerianthus)橙色荧光蛋白(cOFP)、碱性磷酸酶(AP)、β-内酰胺酶、氯霉素乙酰转移酶(CAT)、腺苷脱氨基酶(ADA)、氨基糖苷磷酸转移酶(neor,G418r)、二氢叶酸还原酶(DHFR)、潮霉素B磷酸转移酶(HPH)、胸苷激酶(TK)、lacZ(编码α-半乳糖苷酶)、和黄嘌呤鸟嘌呤磷酸核糖基转移酶(XGPRT)、β-葡萄糖醛酸苷酶(gus)、胎盘碱性磷酸酶(PLAP)、分泌的胚胎碱性磷酸酶(SEAP)、或萤火虫或细菌荧光素酶(LUC)的基因。根据与本发明实践相联系的许多标准操作,技术人员可以了解具有标签或报告基因功能的附加序列。
本领域公知,额外序列的修饰可以增强细胞宿主中的基因表达。这些修饰包括除去编码多余的多腺苷酸化信号、外显子-内含子剪接位点信号、转座子类重复的序列,和其他此类可能有害于基因表达的已良好表征的序列。可选择地,如果需要,可以将编码序列的G/C含量调节到给定咖啡植物细胞宿主的平均水平,通过参考在咖啡植物细胞中表达的已知基因来计算。同样,如果可能,可以修饰编码序列从而避免预测的mRNA的发夹二级结构。另一个增强基因表达的可选择方法是使用5’前导序列。翻译前导序列是本领域内熟知的,其包括烟草花叶病毒5’前导序列(ω)的顺式-作用衍生物(ω’),雀麦草花叶病毒、苜蓿花叶病毒和芜菁黄花叶病毒的5’前导序列。
转化植物并随后筛选一种或多种性质,包括转基因产物的存在、转基因编码的mRNA、或与转基因的表达相关的改变的表型。应当认识到在转化的植物中转基因表达的量以及其组织特异型和瞬时特异型表达模式可以依赖于其插入到核基因组中的位点而改变。此类位点效应是本领域内熟知的。为此,应该再生几个核转化体并测试转基因的表达。
方法:
可以在许多方法的任意一种中使用本发明的核酸和多肽,其中可以在咖啡植物中表达蛋白质产物,从而使蛋白质行使保护植物免受感染或氧化胁迫的作用,并且使表达该蛋白质的咖啡植物豆最终所产生的咖啡饮料或咖啡产品的香味和/或香气有所增强。同样,可以在许多方法的任意一种中使用本发明的多肽,其中由多肽合成的绿原酸和其他此类植物化学产物可以行使保护植物免受感染或氧化胁迫的作用,并且使含有绿原酸的咖啡植物豆最终所产生的咖啡饮料或咖啡产品的香味和/或香气有所增强。
关于保护植物避免疾病、且尤其是感染疾病的方面,已经证明增加CGA产生可以减少植物对微生物感染的易感性。例如,在番茄植物中增加CGA的产生会导致丁香假单胞菌(Pseudomonas syringae)细菌的进展较慢和感染水平较低。(Niggeweg R,等人2004)。同样,抑制CGA的产生会增加烟草植物对真菌感染的易感性。(Maher EA等人1994)。此类研究强调了类苯基丙烷的重要性(例如CGA有助于植物健康)。因此操作植物(例如咖啡)中构成绿原酸生物合成途径的多肽产物的能力,或者甚至使用本发明多核苷酸和蛋白质检测有关基因表达的能力,将使研究和操纵咖啡植物对病原体的应答成为可能。由此,可能产生遗传修饰的咖啡植物,其对植物病原体(尤其是咖啡植物病原体)的抗性增加。咖啡病原体的实例包括“咖啡锈病”的病原体咖啡锈菌(Hemileia vastatrix)、和“咖啡浆果病”的病原体咖啡浆果病原体(Colletotrichum coffeanum)、和“咖啡枯萎”的病原体丁香假单胞菌咖啡致病变种(Pseudomanas syringae pv.Garcae)。因此,本发明的一个方面描述在植物中(优选在咖啡植物中)通过调控构成类苯基丙烷途径的多肽的表达和调控植物中的绿原酸谱来降低传染性疾病的易感性的方法。
关于保护植物避免氧化胁迫的方面,已经证明绿原酸在植物中具有抗氧化剂的能力。在许多植物物种中,已经发现环境胁迫,例如高亮度、低温、植物组织损伤、氮缺乏和感染可以触发CGA的生物合成。(Grace SC等人2000)。已经证明绿原酸具有清除自由基的性质(Ohnishi M等人1994),包括清除2,2’-联氮基-双-(3-乙基苯并噻唑啉-6-硫酸的稳定绿色自由基正离子和超氧负离子。(Grace SC等人2000)。在植物中,光胁迫(例如过亮)下或暴露于环境污染物(例如臭氧)中,会形成氧化剂。因此,对植物中构成绿原酸生物合成途径的多肽产物操作的能力,或者甚至使用本发明多核苷酸和蛋白质检测此类基因表达的能力,会使研究和操作咖啡植物响应环境胁迫和产生氧化物种成为可能。由此,可能产生遗传上修饰的咖啡植物,其在强烈或延长的环境胁迫条件下能够更好的健康生长和进行作物生产。因此,本发明的一个方面描述在植物中(优选在咖啡植物中)通过调控构成类苯基丙烷途径的多肽的表达和调控植物中的绿原酸谱来增强自由基清除作用的方法。
关于烘焙的咖啡粒的香味和香气方面,预期通过烘焙过程中存在的麦拉德反应,凭借蛋白质自身的含量、或它们所产生的产物例如绿原酸,使构成类苯基丙烷途径的多肽对咖啡后代的香味产生一定的影响。蛋白质、尤其是蛋白质降解产物(肽和氨基酸)代表重要的香味前体组(Spanier等人,2004)。因此,相对丰富的蛋白质(例如构成类苯基丙烷途径的蛋白质)可以促进咖啡烘焙过程中出现的香味生成反应。此类作用可能取决于咖啡豆中蛋白质自身的浓度,或蛋白质所最终产生的绿原酸的浓度。与此处所述方法一致,本发明的多核苷酸提供了监测(例如通过标签辅助的育种)或操作构成类苯基丙烷途径的多肽的蛋白质表达谱的能力。
因此,本发明的一个方面描述在植物(优选咖啡)中改变构成类苯基丙烷途径的多肽的谱的方法,包含在植物中增加或减少一种或多种构成类苯基丙烷途径的多肽的量或活性。例如,在本发明的一个实施方案中,编码构成类苯基丙烷途径的多肽的基因在其自身的表达控制序列的控制下,其被用于转化植物从而增加植物中多肽的产生。可选择地,构成类苯基丙烷途径的多肽的编码区有效连接于异源表达控制区,例如组成型或诱导型启动子。
在某些实施方案中,可能希望在植物中减少一种或多种构成类苯基丙烷途径的多肽的产生。这可以通过几种方法实现,例如通过筛选天然存在的变体从而找到构成类苯基丙烷途径多肽的表达减少的变体,或通过筛选天然存在的变体从而找到多种绿原酸水平降低的变体。例如,创造功能缺失(无效)突变的植物或从当前可获得的植物突变体种群中筛选。本领域的技术人员应该理解也可以利用一种或多种此处所述方法在突变体植物种群中筛选过表达特定的构成类苯基丙烷途径的多肽的突变体。可以通过化学诱变、辐射诱变和转座子或T-DNA插入、或基因组中定向诱导的局部损伤(TILLING,见例如Henikoff等人,2004,Plant Physiol.135(2):630-636;Gilchrist & Haughn,2005,Curr.Opin.Plant Biol.8(2):211-215)来形成突变体种群。形成突变体种群的方法是本领域内熟知的。
可以使用本发明的核酸鉴定在多种植物物种中构成类苯基丙烷途径的多肽的突变体。在例如玉米或拟南芥种中,其中转座子插入的品系是可获得的,可以设计寡核苷酸引物来筛选编码构成类苯基丙烷途径的多肽的基因的插入品系。通过育种,可以随后发展断裂基因的杂合或纯合的植物品系。
也可以设计植物使其展现与诱变技术所产生的无效突变相似的表型。可以通过表达所选的构成类苯基丙烷途径的多肽的突变形式产生“显性负效应”,从而产生转基因无效突变。此类突变蛋白质与野生型蛋白质竞争结合蛋白质或其他细胞因子,但是并不是将本发明限制于任一个机制。此类“显性负效应”的实例对于昆虫和脊椎动物系统都是熟知的(Radke等人,1997,Genetics 145:163-171;Kolch等人,1991,Nature 349:426-428)。
转基因无效突变的另一个类型可以通过用“转录后基因沉默”抑制编码类苯基丙烷途径酶的mRNA的翻译来产生。可以利用来自定向下调物种的基因或其片段来控制编码蛋白质的产生。为此目的可以使用全长的反义分子。可选择地,可以利用靶向对翻译很重要的mRNA的特定区域的反义寡核苷酸。使用反义分子降低预定基因的表达水平是本领域内公知的。反义分子可以由含有DNA构建体的转化植物细胞原位提供,该构建体通过转录产生反义RNA序列。可以设计此类构建体来产生全长或部分的反义序列。通过转基因来过量表达基因编码序列的正义和反义RNA从而产生大量的dsRNA,可以增强此类基因沉默效应(例如见Waterhouse等人,1998,PNAS 95:13959-13964)。在这一方面,含有对应于至少一个内含子的部分或全部序列的dsRNA尤其有效。在一个实施方案中,通过转基因表达部分或全部的编码序列的反义链。在另一个实施方案中,通过转基因表达构成类苯基丙烷途径的多肽的部分或全部编码序列的杂交的正义和反义链。
在另一个实施方案中,可以通过使用当前对植物系统有效的多种其他转录后基因沉默(RNA沉默)技术来使编码类苯基丙烷途径酶的基因沉默。RNA沉默涉及双链RNA(dsRNA)通过基于RNA酶H的酶(“Dicer”或“Dicer类”)形成小的21-28个核苷酸的片段的过程。剪切产物为siRNA(小的干涉RNA)或miRNA(微小RNA),它们掺入蛋白质效应复合物中以序列特异性方式调控基因表达(植物中RNA沉默的综述见Horiguchi,2004,Differentiation 72:65-73;Baulcombe,2004,Nature 431:356-363;Herr,2004,Biochem.Soc.Trans.32:946-951)。
可以化学合成或在体外转录和扩增小的干涉RNA,然后转移到细胞中。可以通过显微注射(Tuschl T等人,2002)、化学转染(Agrawal N等人,2003)、电穿孔或阳离子脂质体介导的转染(Brummelkamp TR等人,2002;Elbashir SM等人,2002)、或为技术人员所理解的本领域的任意其他有效方法进行转移。可选择地,可以通过例如质粒的方法向目的细胞中插入siRNA的DNA模板,从而在细胞内表达siRNA(Tuschl T等人,2002),且siRNA也可以特异性地靶向所选细胞。已经可以将小的干涉RNA成功引入到植物中(Klahre U等人,2002)。
本发明中优选的RNA沉默的方法是使用短的发夹结构RNA(shRNA)。通过常用方法将包含编码特定siRNA序列的DNA序列的载体转移到靶细胞中。一旦在细胞中,DNA序列即持续转录成RNA分子,它们自身形成环状并且通过分子内碱基配对形成发夹结构。这些发夹结构经细胞处理后等同于siRNA分子,被细胞用于介导所希望蛋白质的RNA沉默。Horiguchi,2004,supra中描述了在植物中用于RNA沉默的特定用途的多种构建体。通常,此类构建体包含启动子、要沉默的靶基因“正义”方向的序列、间隔、靶基因的反义序列和终止子。如果希望在多数或所有植物组织中表达,那么可以使用强的组成型启动子(例如CaMV 35S启动子)。同样,如上所述,在其他实施方案中也可以选择组织特异型、发育特异型或顺时特异型启动子。
通过“共抑制”技术也可以产生其他类型的合成的无效突变(Vaucheret等人,1998,Plant J.16(6):651-659)。用靶向抑制的内源基因转化植物细胞。在许多情况下,这样会导致天然基因和转基因的完全抑制。在一个实施方案中,将来自目的植物物种的编码构成类苯基丙烷途径多肽的基因分离并用于转化同物种的细胞。
通过任意上述方法产生的突变体或转基因植物也具有与本发明一致的特征。优选地,植物是可育的,因而可用于育种的目的。因此,展现一个或多个上述所希望表型的突变体或植物可以用于植物育种,或直接应用于农业或园艺。它们也可以作为研究工具用于进一步阐明构成类苯基丙烷途径的多肽在与色素和光合作用相关联的咖啡种子的香味、香气和其他特征中的参与作用。包含转基因或特异性突变的植物也可以与包含互补转基因或基因型的植物杂交,从而产生具有增强或组合表型的植物。
本发明也描述了在植物中以种子优选或种子特异性方式产生任意选择的异源基因产物的组合物和方法。目的编码序列在种子特异型咖啡启动子和其他合适的调节序列的控制之下,从而产生种子特异性的嵌合基因。通过任意此处所述或本领域内已知的转化方法将嵌合基因引入到植物细胞中。用于在植物中产生多种目的基因产物的这些嵌合基因和方法包括(但不限于):(1)如上述列举的可检测的基因产物,例如GFP或GUS;(2)具有农学或园艺优势的基因产物,例如那些酶活性导致产生微量营养素(例如维生素原A,也称为β-胡萝卜素)或抗氧化剂(例如抗坏血酸、ω脂肪酸、蕃茄红素、异戊二烯、萜类)的基因产物;或(3)控制病原体或害虫的基因产物,例如Mourgues等人,(1998),TibTech 16:203-210中所描述的,或者其他已知的保护植物种子或防御病原体侵害的基因产物。
下述实施例提供对本发明更详细的描述。实施例意在说明而非限制本发明。
实施例
实施例1
用于RNA提取的植物材料
在发育不同阶段新鲜收获的根、嫩叶、茎、花和果实来自阿拉比卡咖啡L.cv.Caturra T-2308,嫩叶组织从Tours(25℃,70RH)温室条件下生长的卡尼福拉咖啡变种罗巴斯特种BP409收获。所有来自卡尼福拉咖啡BP-409的其他组织在East Java,印度尼西亚的田地生长。发育阶段定义如下:少绿色果实(SG)、大绿色果实(LG)、黄色果实(Y)和红色果实(R)。新鲜组织立即在液氮里冷冻,然后储存于-80℃直到用于RNA提取。
实施例2
总RNA的提取方法、cDNA的产生和PCR反应条件
为找到在咖啡中控制绿原酸(CGA)合成关键步骤的编码部分或全部咖啡酶HCT (羟基肉桂酰-辅酶A莽草酸酯/奎尼酸酯羟基肉桂酰转移酶)、HQT(羟基肉桂酰-辅酶A奎尼酸酯羟基肉桂酰转移酶)、C3H((对)-香豆酰3’羟化酶)、和CCoAOMT(咖啡酰辅酶A-3-氧位-甲基转移酶)的DNA序列,用TBLASTN算法发现了与公用数据库中编码植物(例如蕃茄、烟草和拟南芥)HCT、HQT、C3H和CCoAOMT蛋白质的序列具有高度相似性的咖啡单基因序列(Altschul等人,1990)。与各蛋白质序列最佳匹配的各单基因的最长cDNA之一随后被全部测序。如果认为最长的EST所编码的蛋白质序列不包含完整的ORF,那么使用5’RACE PCR或者引物辅助的基因组步移来分离缺少的蛋白质编码序列。一旦建立起这些咖啡基因的每一个的完整开放读码框(ORF)序列,则对各个基因进行基因表达分析从而证实从EST数据库获得的预期的表达信息。
根据Rogers等人(1999)的方法,从阿拉比卡咖啡(T2308 04-2003)和卡尼福拉咖啡(BP409)四个不同的成熟期-少绿色(“SG”)、大绿色(“LG”)、黄色(“Y”)、和红色(“R”)的不同组织,即根、茎、叶、花、果皮和颗粒中提取RNA。
根据两种不同方法从提取的RNA制备cDNA。在第一种方法中,从1μg总RNA和50ng寡聚dT(18)(希格玛化学有限公司(Sigma Chemical Co.),St.Loius,MO)制备各个特异性的cDNA样品,具体如下:将1μg总RNA样品和寡聚dT悬浮于体积为12μl的DEPC处理的水中。该混合物在70℃培育10分钟,随后迅速在冰上冷却。然后,加入4.0μl第一链缓冲液5×(英杰公司)、2.0μl的0.1M DTT(英杰公司)和1.0μl的dNTP混合物(各10mM,英杰公司)。这些反应混合物在42℃培育2分钟,然后加入1.0μlSuperScript III RNA酶H-反转录酶(200U/μl)(英杰公司)。然后在25℃反应10分钟,42℃反应50分钟,随后在70℃加热10分钟使酶失活。将产生的cDNA样品用无菌水稀释10倍,储存于-20℃用于不同实验(RT-PCR、实时RT-PCR、5’和3’RACE和全长cDNA克隆的分离)。
在第二种方法中,将1μg总RNA样品和870ng寡聚dT(Proligo)混悬于终体积为13μl的DEPC处理的水中来制备特异性cDNA样品。将该混合物在65℃培育5分钟使核酸变性,然后将样品置于冰上。接着加入转录RT反应缓冲液(罗氏公司(Roche))到1×浓度,并加入10.0U的核糖核酸酶抑制剂(希格玛公司(Sigma))、最终1mM的各dNTP(罗氏公司)和10U的转录反转录酶(20U/μl)(罗氏公司)。将20μl反应体系涡旋混合,然后短暂离心。混合物在55℃培育50分钟,然后向反应体系中加入1.0U的RNA酶H(英杰公司),再于37℃培育30分钟。样品随后储存于-20℃。
使用5’RACE系统用cDNA末端快速扩增试剂盒(英杰公司)根据制造商说明书进行5次不同的5’RACE反应。首先纯化该实验中所使用的cDNA制品,从而除去任何未掺入的核苷酸(因为它们会干扰dC加尾反应)。使用S.N.A.P柱(英杰公司)根据制造商说明书进行纯化。纯化以后,在50μl无菌水中恢复cDNA,然后在用于5’RACE PCR之前储存于-20℃。
所有的5’RACE实验都以各特异性S.N.A.P.纯化的cDNA的TdT尾开始。多聚dC加尾反应如下:5μl纯化的cDNA、11.5μl DEPC处理的水、5μl 5×TdT加尾缓冲液(英杰公司)和2.5μl 2mM dCTP组成25μl的反应体系。反应在94℃进行3分钟,随后在冰上冷却。然后加入1μl TdT,在37℃反应10分钟。在65℃加热10分钟以终止反应,并随后置于冰上。
在最终体积为50μl的体系中进行第一轮5’RACE PCR反应,体系如下:5μl的各加尾的cDNA、5μl 10×PCR缓冲液(ThermoPol缓冲液)、400nM各基因特异性引物1(GSP1)和缩短的锚定引物(AAP)(不同的GSP和其他引物列于表1中)、200μM各dNTP和2.5U Taq DNA聚合酶(BioLabs)。第一轮PCR循环条件如下:94℃ 2分钟;然后94℃ 1分钟、退火温度(表2中所示)1分钟和72℃ 2分钟,进行45个循环。附加72℃ 7分钟的最终延伸步骤。随后通过琼脂糖凝胶电泳和溴化乙锭染色来分析PCR产物。
在最终体积为50μl的体系中进行第二轮PCR反应,体系如下:5μl 1%稀释的PCR(第一轮)产物、5μl 10×PCR缓冲液(LA缓冲液II加Mg++)、200nM各GSP2引物(基因特异性引物2)和缩短的通用扩增引物(AUAP)(见表1中的引物)、200μM各dNTP和0.5U的Takara LA Taq DNA聚合酶(康柏生物科学(Cambrex Bio Science))。PCR循环条件如下:94℃2分钟;然后94℃ 1分钟、退火温度(表2中所示)1分钟和72℃ 1.5分钟,进行40个循环。附加72℃ 7分钟的最终延伸步骤。随后通过琼脂糖凝胶电泳和溴化乙锭染色来分析PCR产物。
表1. 5’Race PCR实验中使用的引物
  引物名称   序列   序列识别号
  AAP   5’GGCCACGCGTCGACTAGTACGGGIIGGGIIGGGIIG3′   40
  AUAP   5’GGCCACGCGTCGACTAGTAC3′   41
  22m12-GSP1   5’CAATGAACGGAGGGACAGCAATGGTGA3′   42
  22m12-GSP2   5’GGCCACGAGCTATGTCTGACCATGTATTGA3′   43
  22w14m23-GSP1   5’CCATCAGACTCGGCCTCCACGAAAAGCAC3′   44
  22w14m23-GSP2   5’CACTCAATCTCAATCCGCCCATCTTCGTCTCT3′   45
  122801-GSP1   5’TTGTAAGGGCAGTAAGCAGTAGGGAG3′   46
  122801-GSP2   5’AAGAGCATGGCAATCAACTGACCAGC 3′   47
  119560-GSP1   5’AACTTCAAATGCTCCTTGATCAGGGTC3′   48
  119560-GSP2   5’AACACCAATCTCCAGTGTCTTCTTGGC3′   49
表2.5’Race PCR实验的引物和退火温度
  实验   基因特异性引物   序列识别号   退火温度
  CcHQT-5’RACE
  第一轮RACE PCR   22m12-GSP1   42   57℃
  第二轮RACE PCR   22m12-GSP2   43   61℃
  CaHQT-5’RACE
  第一轮RACE PCR   22m12-GSP1   42   57℃
  第二轮RACE PCR   22m12-GSP2   43   59℃
  CcHCT-5’RACE
  第一轮RACE PCR   22w14m23-GSP1   44   55℃
  第二轮RACE PCR   22w14m23-GSP2   45   61℃
  CcCCoAOMT-L1-5’RACE
  第一轮RACE PCR   122801-GSP1   46   55℃
  第二轮RACE PCR   122801-GSP2   47   55℃
  CaCCoAOMT-L2-5’RACE
  第一轮RACE PCR   119560-GSP1   48   55℃
  第二轮RACE PCR   119560-GSP2   49   55℃
存在的cDNA序列和从5’RACE或引物辅助的基因组步移实验中获得的新的5’序列用于设计5’和3’UTR序列中的引物,用来扩增包含CcHCT、CaHCT、CcHQT、CaHQT、CaCCoAOMT-L1和CcCCoAOMT-L2完全ORF序列的靶cDNA序列。用上述cDNA合成的第一种方法来制备用于分离这些完全ORF DNA序列的所有cDNA。在各基因ATG起始密码子上游区域和3’UTR中设计两个基因特异性引物,它们在表3中给出。表4中列出在不同PCR反应中使用的特异性cDNA和退火温度。
对于CcHCT(pML1)(SEQ ID NO:1)、CaHCT(pML5)(SEQ IDNO:2)、CcHQT(pML2)(SEQ ID NO:3)、CaHQT(pML3)(SEQ ID NO:4)和CcCCoAOMT-L2(pNT4)(SEQ ID NO:8),在50μl反应体系中进行PCR反应,体系如下:5μl cDNA(表4)、5μl 10×PCR缓冲液(LA缓冲液II加Mg++)、800nM各基因特异性引物、200μM各dNTP和0.5U Takara LATaq DNA聚合酶(康柏生物科学)。94变性2分钟以后,在94℃ 1分钟、退火温度(表4)1分钟和72℃延伸2分钟,进行35个循环的扩增(除CcCCoAOMT-L2(SEQ ID NO:8)以外,其扩增40个循环)。附加72℃7分钟的最终延伸步骤。随后通过琼脂糖凝胶电泳和溴化乙锭染色来分析PCR产物。然后根据制造商提供的说明书用测序用TOPO TA克隆试剂盒(英杰公司)将预期大小的片段克隆到pCR4-TOPO中。随后对产生的质粒的插入序列进行全部测序。
对于CaCCoAOMT-L1(pNT8)(SEQ ID NO:7),在50μl反应体系中进行PCR反应,体系如下:5μl cDNA(表4)、5μl 10×PCR缓冲液(克隆Pfu反应缓冲液)、400nM各基因特异性引物、200μM各dNTP和1.25UPfu Turbo DNA聚合酶。94变性2分钟以后,在94℃ 1分钟、55℃ 1分钟和72℃延伸2分钟,进行40个循环的扩增。附加72℃ 7分钟的最终延伸步骤。随后通过琼脂糖凝胶电泳和溴化乙锭染色来分析PCR产物。然后根据制造商提供的说明书(pENTR定向TOPO克隆试剂盒,英杰公司)将预期大小的片段以5’到3’方向克隆到pENTR/D-TOPO中。产生的质粒的插入序列(pNT8)随后进行全部测序。
表3.用于扩增CcHQT(pML2)、CaHQT(pML3)、CcHCT(pML1)、CaHCT(pML5)、CcCCoAOMT1(pNT15)、CaCCoAOMT-L1(pNT8)、CcCCoAOMT-L2(pNT4)和CcCCoAOMT-L2(pNT10)cDNA的引物
  引物   序列   序列识别号
  HCT-FULLUP1   5’CCATGAAAATCGAGGTGAAGGA3’   50
  CCHCT-R1   5’GAAACCACCACCGCATGAA 3’   51
  HQT-FULLUP2   5’CTTCTCCATCCCAGCTCGTTTCT3’   52
  HQT-FULLLOW2   5’GAGTCCCAATCCAATCACAAGT3’   53
  CCoAOMT1-FullUp   5’CACCATGGCCAGAATGGAGAAGG3’   54
  CCoAOMT1-FullLow   5’AGTAGGGAAATTAATTAGCTGACGC3’   55
  CCoAOMT-L1-FullUp   5’CACCATGGAAAACAAGGGATTGTTGCAGAG 3’   56
  CCoAOMT-L1-FullLow   5’AAGTAAGTACTCCAGCATAAGATTTAGTGG 3’   57
  CCoAOMT-L2-FullUp   5’CACCATGGCCAAGGAAGGAGGTTC 3’   58
  CCoAOMT-L2-FullLow   5’ATCATGTCAGCTAAGCGATGATGC3’   59
表4.分离ORF的退火温度
  基因   cDNA和(组织)   基因特异性引物   序列识别号:   退火温度
  CcHCT   BP409(黄色颗粒)   HCT-FullUp1/CcHCT-R1   50/51   54℃
  CaHCT   T2308(黄色颗粒)   HCT-FullUp1/CcHCT-R1   50/51   56℃
  CcHQT   BP409(Sm.绿色果皮)   HQT-FullUp2/HQT-FullLow2 52/53   59℃
  CaHQT   T2308(花)   HQT-FullUp2/HQT-FullLow2   52/53   55℃
  CaCCoAOMT-L1(pNT8)   T2308(黄色颗粒)   CCoAOMT-L1-FullUp/CCoAOMT-L1-FullLow   56/57   55℃
  CcCCoAOMT-L2(pNT4)  BP409(黄色颗粒)   CCoAOMT-L2-FullUp/CCoAOMT-L2-FullLow   56/57   55℃
根据如下方法对亚克隆到质粒中的cDNA进行测序。根据制造商提供的说明书用Qiagen试剂盒从宿主中纯化质粒DNA。制备的重组质粒DNA和PCR产物用Sanger等人的双脱氧终止法通过GATC Biotech AG(Konstanz,德国)进行测序。可以对从5’RACE和基因组步移实验产生的独特PCR产物不经纯化和使用扩增它们的特异性引物克隆即进行测序,或者在克隆之后进行测序。用Laser Gene软件包(DNASTAR)进行计算机分析。用BLAST程序确定其对基因库数据库的序列同源性。(Altschul等人,1990)。
根据如下方法进行实时RT-PCR。按制造商的推荐使用TaqMan-PCR试剂盒(Applied Biosystems,Perkin-Elmer),并且如先前Privat等人,2004中所述对通过上述第一种方法制备的cDNA进行扩增。TaqMan缓冲液包含
Figure A20068004588900491
UNG(尿嘧啶-N-糖基化酶),其于50℃在最初2分钟有活性,然后在PCR循环开始的95℃失活。
使用PRIMER EXPRESS软件(应用生物系统(Applied Biosystems))设计所用的Q-PCR引物和TaqMan探针,并在表5中列出。用相对定量的方法进行定量,以组成型表达的核糖体蛋白rpl39作为基线参照。为使用相对定量方法,在使用确定引物和探针时的候选cDNA序列的扩增效率要与参照序列(rpl39 cDNA序列)的扩增效率大致相等。为了确定这种相对的相等,将含有合适cDNA序列的质粒DNA稀释1/1000、1/10,000、1/100,000和1/1,000,000倍,并使用上述Q-PCR的条件;对于各质粒/引物/TaqMan探针组计算曲线斜率Ct=f(DNA量的对数)。质粒/引物/TaqMan探针组给出的曲线斜率接近3.32是可以接受的,其代表100%的效率。在表5中列出的质粒/引物/TaqMan探针组都给出可以接受的Ct=f(DNA量的对数)值。所有的MGB探针都在5’末端以荧光报告基因染料6-羧基荧光素(FAM)标记和在3’端具有淬灭染料6-羧基-4甲基-罗丹明(rhodamine)(TAMRA),而RPL39探针在5’末端以荧光报告基因染料VIC标记和在3’末端具有淬灭TAMRA。
表5.用于Q-RT-PCR实验的引物和TaqMan探针
  引物和探针   序列   序列识别号:
  Rpl39-F1   5’GAACAGGCCCATCCCTTATTG3′   60
  Rpl39-R1   5’CGGCGCTTGGCATTGTA3′   61
  Rpl39-MGB1   5’ATGCGCACTGACAACA3′   62
  CcC3H-F1   5’CTCTTGTTACTAAATTTTCAGCTTGCA3′   63
  CcC3H-R1   5’GGAGAATCCAACAAGTTCTTCACA3′   64
  CcC3H-MGB1   5’AGTTGCTTCACTTCCAAC3′   65
  CcHCT-F1   5’GGGAGCACATCACATGAATTTTC3′   66
  CcHCT-R1   5’GAAACCACCACCGCATGAA3′   67
  CcHCT-MGB1   5’CGGTTCCGGGCCAG3′   68
  CcHQT-F1   5’TTGCCAAGTCCAGGCAAAG3′   69
  CcHQT-R1   5’CATGTGATCGGCATCTAAGCA3′   70
  CcHQT-MGB1   5’CAGGACTTTATCGTTAGCTG3′   71
  CcCCoAOMT1-F1   5’TGCGGAAAGTTGGGAATCA3’   72
  CcCCoAOMT1-R1   5’AAGAGGAGGAAGCAAAAGAAGTAGGT3’   73
  CcCCoAOMT1-MGB1   5’TGCAAATGAAAAATAGCCCA3’   74
  CcCCoAOMT-L1-F1   5’GCTAGCTGCTGATACCCGAGTT3’   75
  CcCCoAOMT-L1-R1   5’GACGCTTACAAATAGTAATCCCATCAC3’   76
  CcCCoAOMT-L1-MGB1   5’TATCCCAGGTTCCTCTG3’   77
  CcCCoAOMT-L2-F1   5’GTTACATTGTGTAGGCGCATCATC3’   78
  CcCCoAOMT-L2-R1   5’TGCTACCGTAGCAGTTGCACTATT3’   79
  CcCCoAOMT-L2-MGB1   5’TAGCTGACATGATATTTTAC3’   80
实施例3
卡尼福拉咖啡编码羟基肉桂酰-辅酶A莽草酸酯/奎尼酸酯羟基肉桂酰 转移酶(CcHCT)的cDNA克隆的分离和表征
为了找到编码咖啡HCT的cDNA,以烟草HCT蛋白质序列(登录号CAD47830(SEQ ID NO:20);Hoffmann等人,2003)作为查询序列,使用tblastn算法对5组“单基因”进行BLAST查询。获得的最佳匹配序列为单基因#123197(e值=e-150),尽管也发现第二个咖啡单基因(#125212)与烟草HCT序列高度相关(e值=e-108)。单基因#123197和#125212的在计算机上的DNA和蛋白质序列比对表明尽管它们可能相关,但是这两个单基因序列编码不同的咖啡基因。
代表单基因#123197(pcccwc22w14m23)(SEQ ID NO:18)的5’末端的cDNA并且因此编码与烟草HCT相关的数据库中最长的咖啡cDNA被分离和测序。pcccwc22w14m23(SEQ ID NO:18)的插入序列长度为1465bp,并编码389个氨基酸的部分ORF序列。因为全长烟草蛋白质是435个氨基酸长,假设该咖啡HCT cDNA缺少大约150个碱基对(即全长咖啡HCTcDNA预期编码另外约46个氨基酸)。基于由pcccwc22w14m23(SEQ IDNO:18)编码的咖啡HCT序列的重要部分,设计在已确立的5’RACE PCR技术中使用的特异性引物从而分离相应基因序列的5’端。使用上述实施例2的第二种方法从红色发育期的卡尼福拉咖啡(BP409)颗粒的RNA得到的cDNA,并且在第一轮PCR中使用基因特异性引物22w14m23-GSP1(SEQID NO:44)和在第二轮PCR中使用22w14m23-GSP2(SEQ ID NO:45),该实验产生约300碱基对的PCR片段(在琼脂糖凝胶中估计长度),其可以用基因特异性引物22w14m23-GSP2(SEQ ID NO:45)直接测序。获得的序列(Race1_CcHCT)(SEQ ID NO:17)长度为209bp,并且与cDNA克隆pcccwc22w14m23(SEQ ID NO:18)的5’末端重叠(图2a:重叠序列为60bp)。
该新分离的咖啡5’末端HCT序列(Race1_CcHCT)(SEQ ID NO:17)和cDNA pcccwc22w14m23(SEQ ID NO:18)中接近全长的编码序列,允许设计两个新的引物(HCT-FullUp1(SEQ ID NO:50)和CcHCT-R1(SEQ IDNO:51),表3和4),从而使用通过方法1从黄色发育期的卡尼福拉咖啡(BP-409)颗粒的RNA得到的cDNA来特异性扩增咖啡HCT的完全ORF序列。该PCR扩增实验产生包含在质粒pML1中的cDNA序列CcHCT(SEQ ID NO:1)(图2b)。pML1插入序列(SEQ ID NO:1)的序列分析表明该cDNA长度为1388bp,其完全ORF长1305bp,编码预期分子量为48.06kDa的长434个氨基酸的多肽(SEQ ID NO:9)。完全HCT蛋白质序列(SEQID NO:9)与烟草HCT蛋白质序列和拟南芥中的相关序列(登录号分别为CAD47830(SEQ ID NO:20)和NP 199704(SEQ ID NO:21),见图4)之间的比对验证了用BLAST对该咖啡序列的最初注解,即pML1(SEQ ID NO:1)的ORF编码咖啡HCT蛋白质。在蛋白质水平,咖啡序列(SEQ ID NO:9)分别与烟草和拟南芥序列具有86.9%和78.3%的同源性(图4)。在核酸水平,咖啡序列的完全ORF分别与烟草和拟南芥完全ORF序列具有78.5%和70%的同源性。蛋白质序列比对也显示pML1的咖啡HCT序列具有两段保守序列,HXXXD(SEQ ID NO:25)和DFGWG(SEQ ID NO:26),其被鉴定为植物蛋白质的酰基转移酶类的关键区域。
实施例4
编码羟基肉桂酰-辅酶A莽草酸酯/奎尼酸酯羟基肉桂酰转移酶 (CaHCT)的阿拉比卡咖啡cDNA克隆的分离和表征
用Crouzillat等人,(1996)的方法从温室中收获的阿拉比卡咖啡T2308的新鲜叶中提取总基因组DNA。根据制造商建议的方法使用通用基因组步移试剂盒(BD生物科学)进行引物辅助步移。此处使用的4个基因组步移(GenomeWalker)文库是之前从阿拉比卡咖啡T2308基因组DNA构建的,将其用DraI、EcoRV、PvuI、StuI消化,然后平末端连接到通用基因组步移试剂盒的基因组步移接头上。基因组DNA的消化和基因组步移接头连接反应的进行与制造商的说明书一致。随后将4个文库用作使用HCT-GSP基因特异性引物的PCR反应的模板(表6)。PCR反应混合物终体积为50μl,包含10μl基因组步移文库模板(1/100稀释)、5μl 10×PCR缓冲液(LA缓冲液II加Mg++)、200μM各dNTP、400nM各引物(AP1和HCT-GSP1)和0.5U的Takara LA Taq DNA聚合酶(康柏生物科学)。第一轮PCR使用如下条件:95℃变性2分钟以后,首先95℃ 20秒、72℃退火和延伸3分钟,进行7个循环。再在95℃ 25秒、67℃退火/延伸3分钟,进行31个循环。附加的最终延伸步骤在67℃进行7分钟。第二轮PCR反应的体系与上述第一轮中描述的一样,除了DNA底物为第一轮扩增反应产物1/50稀释后的1μl。PCR循环条件为首先95℃ 25秒、72℃退火和延伸3分钟,进行5个循环。再在95℃ 25秒、67℃退火/延伸3分钟,进行25个循环。附加的最终延伸步骤在67℃进行7分钟。得到的PCR片段用琼脂糖凝胶电泳分离。来自StuI文库的一个PCR产物命名为GW1 CaHCT,其显示唯一条带,随后使用用于测序的TOPO TA克隆试剂盒(英杰公司)将其克隆到pCR4-TOPO中,然后在分离的阳性菌落中进行PCR。用T7和T3引物对具有预期长度的PCR产物进行测序。获得的序列(GW1-CaHCT)(SEQ ID NO:19)长度为685bp,与pcccwc22w14m23(SEQ ID NO:18)序列重叠超过117bp(图3A、3B)。注意该基因组序列可能编码约430bp的CaHCT基因5’非编码区,并且因此编码至少部分的该基因启动子。
表6.用于基因组步移实验的引物
  引物   序列   序列识别号:
  AP1   5’GTAATACGACTCACTATAGGGC3′   81
  AP2   5’ACTATAGGGCACGCGTGGT3′   82
  HCT-GSP1   5’CCATCAGACTCGGCCTCCACGAAAAGCAC3′   83
  HCT-GSP2   5’CACTCAATCTCAATCCGCCCATCTTCGTCTCT3′   84
使用相同的特异性引物组和用于分离卡尼福拉咖啡HCT(CcHCT)的完全ORF的PCR条件来分离编码阿拉比卡咖啡HCT的完全ORF的cDNA(详见实施例2和表3和4)。使用方法1从黄色期的阿拉比卡咖啡(T2308)颗粒的RNA获得cDNA,并克隆到质粒pML5中(图3b)。pML5插入序列(SEQ ID NO:2)的序列分析表明该cDNA长度为1388bp,具有1305bp的完全ORF,其编码预期分子量为48.186kDa的434个氨基酸的多肽(SEQ ID NO:10)。用ClustalW将pML1(CcHCT)(SEQ ID NO:1)和pML5(CaHCT)(SEQ ID NO:2)的插入序列进行最优比对,结果显示两序列在DNA水平上具有98.9%的同一性,两序列之间观察到有14个单核苷酸差异。这些在ORF的DNA序列中的差异会翻译成5个改变的氨基酸序列(图4)。值得注意的是在这些基因的5’和3’UTR序列中预期有更显著的序列改变,其中大部分是来自pML1和pML5缺失的。如图4所示,所有4个HCT序列在高度保守的HXXXD(SEQ ID NO:25)盒中都具有相同的序列(HHAAD)(SEQ ID NO:85)。这进一步支持了pML1和pML5编码咖啡HCT蛋白质的论点。
实施例5
编码羟基肉桂酰-辅酶A奎尼酸酯羟基肉桂酰转移酶(CcHQT)的卡尼 福拉咖啡cDNA克隆的分离和表征
以最近公开的烟草HQT蛋白质序列(NtHQT,登录号CAE46932;Niggeweg等人,2004)和番茄HQT蛋白质序列(LeHQT,登录号CAE46933,Niggeweg等人,2004))作为查询序列,使用tblastn算法对5组“单基因”进行查询。以烟草NtHQT作为查询序列,获得的两个最匹配序列为单基因#125212(e值=e-119)和单基因#123197(e值=e-100)。以番茄LeHQT作为查询序列,获得的两个最匹配序列为单基因#125212(e值=e-127)和单基因#123197(e值=e-103)。通过BLAST查询得到的单基因#125212与NtHQT和LeHQT蛋白质序列具有很高的e值,强烈表明该计算机上得到的单基因序列可能编码HQT蛋白质。
单基因#125212(pcccwc30w13p12)(SEQ ID NO:28)的最长EST之一被从果皮文库中分离和完全测序。序列分析显示该cDNA编码长度为1056bp的插入序列,其含有编码292个氨基酸的部分ORF序列。用Megalign软件(Laser Gene软件包,DNASTAR)将由pcccwc30w13p12(SEQ IDNO:28)编码的多肽序列与烟草和番茄HQT蛋白质序列进行比对。这些手动优化的比对证实pcccwc30w13p12(SEQ ID NO:28)的部分ORF可能编码HQT蛋白质。这些比对也表明该cDNA克隆不包含完全的ORF。将由pcccwc30w13p12(SEQ ID NO:28)编码的多肽序列与单基因123197(pcccwc22w14m23)(SEQ ID NO:18)的最长cDNA编码的多肽序列进行比对。该蛋白质比对显示这两个序列有显著差异(用ClustalW方法得到氨基酸水平上约61.3%的同一性),并且因此这些序列代表不同的基因。
番茄和烟草HQT蛋白质序列与pcccs30w13p12(SEQ ID NO:28)序列的部分ORF之间的比对显示该咖啡HQT序列N-末端缺少约140-150个氨基酸。然而,基于pcccs30w13p12(SEQ ID NO:28)编码的咖啡HQT序列的主要部分,可以设计用于已建立的5’RACE PCR技术的特异性引物,来分离咖啡HQT编码序列缺失的5’端序列。使用通过方法1从卡尼福拉咖啡(BP 409)果皮中分离的RNA(所有发育阶段混合)制备的cDNA,并且使用上述实施例2中的引物和PCR条件,获得长度约为750bp的唯一片段,并且用扩增该片段的特异性引物22m12-GSP2(SEQ ID NO:43)直接测序。获得的序列(RACE3_CcHQT)(SEQ ID NO:27)长639bp,与pcccs30w13p12(SEQ ID NO:28)的5’端序列重叠62bp(图5a)。
该新分离的卡尼福拉咖啡5’末端HQT序列(RACE3_CcHQT)(SEQID NO:27)和cDNA pcccwc30w13m12(SEQ ID NO:28)的编码序列,允许设计两个新的引物,从而使用从少绿色期的卡尼福拉咖啡(BP-409)果皮的RNA得到的cDNA来特异性扩增咖啡HCT的CcHQT的完全ORF序列。(表3和4)。将获得的cDNA克隆到pML2质粒中(图5A和5B)。pML2插入序列(SEQ ID NO:3)的序列分析表明该cDNA长度为1534bp,且其完全ORF长1293bp,编码预期分子量为47.72kDa的长430氨基酸的多肽(SEQID NO:11)。
完全CcHQT ORF序列(SEQ ID NO:3)与先前表征的烟草和番茄HQT序列和甘薯中的高度相关序列IbHCBT(登录号为BAA87043(SEQ IDNO:22))之间的比对验证了最初用BLAST分析对该咖啡序列的注解,即pML2(SEQ ID NO:3)的ORF编码咖啡HQT蛋白质(SEQ ID NO:11)(图4)。在蛋白质水平,咖啡HQT蛋白质序列分别与烟草、番茄和甘薯序列具有75.8%、75.1%和78.1%的同源性。在核酸水平,咖啡HQT ORF序列分别与烟草、番茄和甘薯ORF序列具有72.1%、70.1%和71.1%的同一性。
图4的比对也显示pML2的咖啡HQT序列(SEQ ID NO:11)具有两段保守序列,HXXXD(SEQ ID NO:25)和DFGWG(SEQ ID NO:26),其被鉴定为植物蛋白质的酰基转移酶类的关键区域(Yang等人1997,St-Pierre等人2000,Hoffmann等人2003)。如图4所示,在高度保守的HXXXD(SEQID NO:25)盒中,所有5个HQT序列具有几乎相同的序列(HT/NLSD),进一步支持pML2编码咖啡HQT蛋白质的论点。
实施例6
编码羟基肉桂酰-辅酶A奎尼酸酯羟基肉桂酰转移酶(CaHQT)的阿拉 比卡咖啡cDNA克隆的分离和表征
用分离卡尼福拉咖啡HQT完全ORF所用的同样特异性引物组和PCR条件来分离编码阿拉比卡咖啡HQT的完全ORF的cDNA(见实施例2和表3和4)。从阿拉比卡咖啡(T2308)花中分离的RNA通过方法1制备所用的cDNA,并将扩增的特异性CaHQT片段亚克隆产生pML3质粒(图6)。pML3插入序列的序列分析揭示该cDNA长为1533bp,其可能的完全ORF长1293bp,在其ORF序列中的814-816位点(在蛋白质中的272位点)被单个终止密码子中断。推测该突变是在用Taq DNA聚合酶进行PCR扩增的过程中的单碱基对突变(CAA到TAA)所导致的。为了确定终止密码子由Taq产生,而不是基因组编码的终止密码子,使用方法1从阿拉比卡咖啡T2308根中分离的RNA来制备cDNA。然后使用该cDNA用PCR扩增终止密码子的区域。
在终体积50μl体系中进行PCR反应,所述体系如下:5μl cDNA;10×PCR缓冲液(LA缓冲液II加Mg++)、500nM的引物HQT-FullLup1(5’CTGGAGGAAAGCAGAGAAGCAT3′)(SEQ ID NO:86)和HQT-FullLow2(SEQ ID NO:52)(表3A)、200μM各dNTP、0.5U Takara LA Taq DNA聚合酶(康柏生物科学)。PCR反应条件如下:94℃ 2分钟;然后在94℃ 1分钟、56℃ 1分钟和72℃延伸2分钟,进行40个循环。附加进行72℃ 7分钟的最终延伸步骤。随后通过琼脂糖凝胶电泳和溴化乙锭染色来分析PCR产物。
该PCR扩增产生约1600bp长的唯一片段。然后用HQT-FullLow2引物(SEQ ID NO:52)(表4)对该唯一片段(R-CaHQT)直接测序。获得的626bp的序列与pML3(CaHQT)序列(SEQ ID NO:4)完全重叠。该新的cDNA片段的序列编码含有突变位点的区域(在626bp的重叠区域具有98.9%的同源性),而且在突变位点,其具有CAA(预期的氨基酸Q)而不是在pML3中发现的TAA(终止子)。
克隆的CcHQT(SEQ ID NO:3)和CaHQT(SEQ ID NO:4)cDNA序列的比对显示15个单个核苷酸差异。多肽序列CcHQT(SEQ ID NO:11)和CaHQT(SEQ ID NO:12)的最优比对显示7个氨基酸差异(图4)。
实施例7
编码(对)-香豆酰3’羟化酶CcC3H的卡尼福拉咖啡cDNA克隆的分离 和表征
为了找到编码(对)-香豆酰莽草酸酯3’羟化酶(C3H)的咖啡cDNA,使用两个编码生物化学上有C3H活性特征的蛋白质序列,罗勒(Ocimunbasilicum)(对)-香豆酰莽草酸酯3’羟化酶异构体2(Gang等人,2002;登录号AAL99201)和拟南芥细胞色素P450 CYP98A3(Schoch等人,2001;登录号O22203),用tblastn算法查询5组“单基因”。该查询揭示一个与罗勒和拟南芥C3H蛋白质序列呈现高水平同源性的单基因(#124852)。可能编码该蛋白质完全ORF的代表单基因#124852(pcccl20d10(SEQ ID NO:5))5’端的cDNA随后被分离和测序。
确定pcccl20d10(SEQ ID NO:5)插入序列长度为1728bp,编码1527bp的ORF。推论出含508个氨基酸的蛋白质序列(SEQ ID NO:13),并且其预测分子量为57.9kDa。将pcccl20d10(SEQ ID NO:5)的蛋白质序列(SEQ ID NO:13)与来自罗勒、拟南芥同源C3H蛋白质序列以及来自番茄(L.esculentum)的直向同源序列进行比对(图7)。该比对证明pcccl20d10(SEQID NO:5)所编码的蛋白质(SEQ ID NO:13)分别与这些蛋白质序列具有75.1%、73.9%和82.9%的同源性。因此可以得出pcccl20d10(SEQ ID NO:5)编码卡尼福拉咖啡(对)-香豆酰莽草酸酯3’羟化酶(CcC3H)全长cDNA的结论。编码pcccl20d10(SEQ ID NO:5)中包含的ORF序列的DNA序列与编码罗勒C3H和拟南芥细胞色素P450 CYP98A3的ORF序列的DNA序列之间的比对证明CcC3H的ORF DNA序列与罗勒C3H和拟南芥P450CYP98A3 DNA序列具有69.4%和69.2%的同一性。
实施例8
三个编码CCoAOMT的卡尼福拉咖啡cDNA克隆的分离和表征
为了找到编码CCoAOMT的咖啡cDNA,使用两个编码有CCoAOMT活性特征的蛋白质序列,烟草CCoAOMT(登录号AAC49913(SEQ IDNO:38)Martz等人,1998)和紫花苜蓿(苜蓿)CCoAOMT(登录号AAC28973(SEQ ID NO:37),Ferrer等人,2005),用tblastn算法查询5组“单基因”。该分析揭示三个单基因与烟草CCoAOMT蛋白质序列呈现高水平同源性,#119965(e值=e-125)、#122801(e值=e-63)和#119560(e值=e-56)。这些单基因也显示与紫花苜蓿蛋白质序列相对高的同源性,即#119965(e值=e-127)、#122801(e值=e-64)和#119560(e值=e-59)。
随后从叶文库中分离了可能编码该蛋白质完全ORF的代表该单基因#119965(pcccl15a11(SEQ ID NO:6))的5’端的最长cDNA之一,并进行完全测序。确定pcccl15a11(SEQ ID NO:6)的插入序列长度为1144bp,并且编码744bp的ORF。推论的全长蛋白质序列(SEQ ID NO:14)长度为247个氨基酸,并且其预测分子量为27.97kDa。图12显示pcccl15a11(SEQ IDNO:6)的蛋白质序列(SEQ ID NO:14)与来自烟草和紫花苜蓿的CCoAOMT蛋白质序列的最优比对,显示pcccl15a11蛋白质分别与这些蛋白质序列具有85.1%和86.3%的同源性。该比对也证明CcCCoAOMT1蛋白质(SEQ IDNO:14)包含Ferrer等人2005所确定的所有氨基酸残基。Ferrer组通过x-射线衍射晶体分析法确定了苜蓿咖啡酰辅酶A3-氧位-甲基转移酶的结构a)在辅酶A识别中相互作用,b)涉及底物识别,和c)涉及二价金属离子和辅助因子结合。因此,该比对的数据支持pcccl15a11(SEQ ID NO:6)编码卡尼福拉咖啡咖啡酰辅酶A-氧位-甲基转移酶(CcCCoAOMT1)(SEQ IDNO:14)的全长cDNA这一论点。
值得注意的是公开数据库包含来自卡尼福拉咖啡的部分cDNA(登录号AF534905,编码108个氨基酸的ORF)。当与CcCCoAOMT1(SEQ IDNO:14)比对时,该数据库序列的合适区域在DNA水平显示97.5%的同一性,表明部分卡尼福拉咖啡cDNA(登录号AF534905)可能与CcCCoAOMT1中的完全cDNA是等位基因,因此为具有相同基因的两个不同的卡尼福拉咖啡等位基因。
从30周颗粒文库中(开花以后30周)分离可能编码CcCCoAOMT类蛋白质的代表单基因#122801(cccs30w29k18)5’端的最长cDNA,并进行完全测序。确定pcccs30w29k18(SEQ ID NO:34)的插入序列长度为722bp,并且编码长576bp的部分ORF。确定推论的部分蛋白质序列编码191个氨基酸。将pcccs30w29k18(SEQ ID NO:34)编码的部分多肽序列与来自烟草和紫花苜蓿的CCoAOMT蛋白质序列进行比对。该比对显示pcccs30w29k18(SEQ ID NO:34)的插入ORF序列与这些植物CCoAOMT蛋白质序列都具有56.2%的同一性,证明该蛋白质可能是CCoAOMT类蛋白质。该比对也表明该cDNA克隆不包含完全ORF。
基于pcccs30w29k18(SEQ ID NO:34)编码的序列设计特异性引物,从而用已建立的5’RACE PCR技术分离相应基因序列的5’端。使用上述实施例2和表2中的RACE PCR条件,用基因特异性引物122801-GSP1(SEQID NO:46)(第一轮RACE PCR)和122801-GSP2(SEQ ID NO:47)(第二轮RACE PCR),和从黄色发育期的卡尼福拉咖啡BP409颗粒分离的RNA通过方法1制备的cDNA,产生长218碱基对的PCR片段,根据前述方法将其克隆到pCR4-TOPO中并测序。获得的序列(Race1_CcCCoAOMT-L1在pNT13(SEQ ID NO:33))与cDNA克隆pcccs30w29k18(SEQ ID NO:34)的5’端重叠(图9A:61bp的重叠序列)。该新分离的咖啡5’端CcCCoAOMT-类序列(Race1_CcCCoAOMT-L1(SEQ ID NO:33)),和在cDNApcccs30w29k18(SEQ ID NO:34)中的部分编码序列,允许设计两个新的引物(CCoAOMT-L1-Fullup(SEQ ID NO:54)和CCoAOMT-L1-FullLow(SEQID NO:55),表3和4),从而使用从阿拉比卡咖啡(T2308)颗粒(黄色发育期)分离的RNA制备的cDNA来特异性扩增咖啡CaCCoAOMT-L1(SEQ IDNO:15)的完全ORF序列(表4)。
在终体积50μl体系中进行PCR扩增反应,体系如下:5μl cDNA、5μl的10×PCR缓冲液(克隆的Pfu反应缓冲液)、400nM两种特异性引物、200μM各dNTP、和1.25U Pfu Trubo DNA聚合酶(斯彻特基因公司)。PCR循环条件如下:94℃变性2分钟;然后在94℃ 1分钟、退火温度55℃ 1分钟和72℃延伸2分钟,进行40个循环。附加72℃ 7分钟的最终延伸步骤。将该PCR产生的cDNA片段直接克隆到pENTR/D-TOPO载体中,形成pNT8质粒(图9B)。pNT8插入序列(SEQ ID NO:7)的序列分析表明该cDNA长为717bp(包括在克隆中使用的CACC序列)。质粒pNt8的完全ORF长690bp,编码具有预期分子量为25.71kDa的长229个氨基酸的多肽(SEQ ID NO:15)。
图11中呈现的比对证实了CaCCoAOMT-L1(pNT8)的ORF不是CcCCoAOMT-1的等位基因,而明显是不同的基因产物。有效地,CaCCoAOMT-L1蛋白质序列(SEQ ID NO:15)是由pNT8(SEQ IDNO:7)(与CcCCoAOMT-1同一性为54.6%)中包含的ORF所编码。另外,该蛋白质与所表征的MsCCoAOMT、NtCCoAOMT和VvCCoAOMT蛋白质(基因库登录号分别为AAC28973(SEQ ID NO:37)、AAC49913(SEQID NO:38)和CAA90969(SEQ ID NO:39),见图12)只有54.2%、57.8%和57.4%的同一性。如图12所示,在苜蓿CCoAOMT的晶体结构中描述的5个特征性位点在咖啡蛋白质序列CCoAOMT-L1中是不同的。已经确定12个保守氨基酸中的2个涉及辅助因子的结合(Ferrer等人,2005):即MsCCoAOMT中的谷氨酸67和脯氨酸139在CaCCoAOMT-L1(SEQ IDNO:15)中分别被丙氨酸和谷氨酸残基所取代,并且6个残基中的3个涉及底物识别(Ferrer等人,2005):即在CaCCoAOMT-L1(SEQ ID NO:15)蛋白质中精氨酸206、酪氨酸208和酪氨酸212分别被丙氨酸、谷氨酸和甘氨酸残基所取代。
随后从46周颗粒文库中(开花以后46周)分离了可能编码该蛋白质的部分ORF的、并且代表单基因#119560(cccs46w30m24)的5’端的最长cDNA,并进行完全测序。序列分析显示该cDNA(SEQ ID NO:36)编码长度为934bp的插入序列。使用CLUSTALW将该插入序列的DNA序列与已表征的NtCCoAOMT和MsCCoAOMT(基因库登录号分别为AAC49913(SEQ ID NO:38)和AAC28973(SEQ ID NO:37))蛋白质序列进行比对,表明该cDNA可能包含内含子。使用CLUSTALW程序将NtCCoAOMT和MsCCoAOMT DNA序列与pcccs46w30m24的插入序列进行最优比对,与pcccs46w30m24的插入序列相比,其他已表征的植物cDNA序列的ORF DNA序列中有一个72bp的插入序列。另外,cccs46w30m24插入序列的ORF编码截短的蛋白质序列,由于其在pcccs46w30m24预期的内含子序列中有一个终止密码子,因此其在C-末端比NtCCoAOMT和MsCCoAOMT短92个氨基酸。
基于pcccs46w30m24cDNA序列(SEQ ID NO:36)包含内含子,经电脑模拟产生加工的序列。在426-497bp进行拼接加工,该位置代表假定的内含子。获得的拼接的862bp序列(pcccs46w30m24序列减去假定内含子)的序列分析显示该cDNA包含702bp的ORF,编码233个氨基酸的部分蛋白质。随后将该假定的多肽序列与先前部分中所述的NtCCoAOMT和MsCCoAOMT蛋白质序列进行比对(图12),揭示了pcccs46w30m24的部分ORF与这些CCoAOMT序列各具有48.9%的同一性。与该部分ORF相关的蛋白质称为CcCCoAOMT-L2(SEQ ID NO:16)。
然而,由于pcccs46w30m24(SEQ ID NO:36)编码预期咖啡CCoAOMT-LIKE序列的主要部分,因此可以设计特异性引物来分离该基因缺失的5’端编码序列。使用从阿拉比卡咖啡(T-2308)颗粒黄色期分离的RNA通过方法1制备的cDNA、引物119560-GSP1(SEQ ID NO:48)(第一轮RACE PCR)和119560-GSP2(SEQ ID NO:49)(第二轮RACE PCR)、和在实施例2和表2中所述的PCR条件,可以获得唯一片段。将该片段直接克隆到pCR4-TOPO载体中产生pNT14,并用T3通用引物测序。获得的插入序列(Race1_CaCCoAOMT-L2(SEQ ID NO:35))长度为预期的349bp,与pcccs46w30m24(SEQ ID NO:36)的5’端序列重叠(图10A,重叠序列长224bp)。该新分离的阿拉比卡咖啡5’端CCoAOMT-LIKE序列(Race1_CaCCoAOMT-L2)(SEQ ID NO:35),和在cDNA pcccs46w30m24(SEQ ID NO:36)中的编码序列,允许设计2个新的引物CCoAOMT-L2-FullUp(SEQ ID NO:58)和CCoAOMT-L2-FullLow(SEQ IDNO:59)(表3和4),从而能够特异性扩增CCoAOMT-L2(SEQ ID NO:8)的完全ORF序列。
通过方法1从卡尼福拉咖啡(BP-409)颗粒黄色发育期分离的RNA制备该实验中使用的扩增CCoAOMT-L2的完全ORF的cDNA(使用同样的cDNA用来产生HCT的全长cDNA,见表4)。如实施例2中所述,用TakaraLATaq DNA聚合酶进行实验(PCR反应在终体积50μl体系中进行,体系如下:5μl cDNA(表4)、5μl 10×PCR缓冲液(LA PCR II加Mg2+)、800nM各特异性引物、200μM各dNTP、和0.5U的Takara LA Taq DNA聚合酶(康柏生物科学)。PCR循环条件与实施例2中所述相同。该实验产生单个主要PCR产物,按前述将其直接克隆到pCR4-TOPO载体中获得质粒pNT4(DNA序列见图10B)。pNT4(SEQ ID NO:8)编码长717bp的完全ORF,其编码预期分子量为26.30kDa的长238个氨基酸的多肽(SEQ IDNO:16)。
咖啡CCoAOMT-L2序列的完全ORF与先前表征的紫花苜蓿、烟草和葡萄CCoAOMT序列(如上所述)之间的比对证实了最初的用BLAST将pcccs46w30m24(SEQ ID NO:36)部分咖啡序列注解为咖啡CCoAOMT-LIKE蛋白质(图12)。在蛋白质水平,咖啡CcCCoAOMT-L2(pNT4)ORF序列与MsCCoAOMT蛋白质序列有46.6%同一性、与NtCCoAOMT-1蛋白质序列有47%同一性和与VvCCoAOMT蛋白质序列有47.8%同一性。在图11中展示的咖啡CcCoAOMT-L2序列(SEQ IDNO:16)与上述咖啡CaCCoAOMT-L1蛋白质序列(SEQ ID NO:15)和CcCCoAOMT-1(SEQ ID NO:14)的比对清楚地显示这三个蛋白质序列代表不同的高度相关的蛋白质组。
用所有这三个蛋白质(即咖啡CCoAOMT(SEQ ID NO:14)和两个CCoAOMT-LIKE蛋白质(SEQ ID NO:15和16))与图12中已表征的CCoAOMT蛋白质进行二次比对,清楚地说明咖啡CcCCoAOMT-L2蛋白质(SEQ ID NO:16)的序列与已表征的植物CCoAOMT蛋白质之间比其与CaCCoAOMT-L1蛋白质(SEQ ID NO:15)之间具有更远的相关性。另外,值得注意的还有在图12中,CcCCoAOMT-L2蛋白质序列(SEQ ID NO:16)在底物识别相关的区域中有几个氨基酸改变(紫花苜蓿登录号AAC28973(SEQ ID NO:37),Ferrer等人,2005)。
实施例9
CcCCoAOMT1的过表达和表征
Gateaway技术(英杰公司)由两个载体组成:pENTR/D-TOPO和表达载体pDEST17,用于过量产生CcCCoAOMT1蛋白质(SEQ ID NO:14)。该策略包括将CcCCoAOMT1(SEQ ID NO:6)的ORF按读码框转移到第一个载体(pENTR/D-TOPO)中去,并带有His标签序列。为此设计两个特异性引物。第一个引物(CCoAOMT1-Fullup(SEQ ID NO:54)表3)包括该ORF的前几个密码子(从起始密码子ATG开始)的特异序列,ATG密码子的5’端是直接克隆到pENTR/D-TOPO中所需的CACC接头。第二个引物(CCoAOMT1-FullLow,(SEQ ID NO:55)表3)包含该ORF的终止密码子和在3’UTR的几个碱基(14bp)。
然后,用上述特异性引物和Pfu Turbo DNA聚合酶(斯彻特基因公司)进行PCR反应,其在产物的5’端不产生腺嘌呤,并允许CcCCoAOMT1PCR产物直接克隆到pENTR/D-TOPO中。PCR扩增反应在终体积50μl体系中进行,体系如下:5μl的pcccl15a11质粒(1/50稀释)、5μl 10×PCR缓冲液(克隆的Pfu反应缓冲液)、400nM的各特异性引物、200μM各dNTP、和1.25U的Pfu Trubo DNA聚合酶(斯彻特基因公司)。PCR循环条件如下:94℃变性2分钟;然后在94℃ 1分钟、退火温度55℃ 1分钟和72℃延伸2分钟进行40个循环。附加72℃ 7分钟的最终延伸步骤。该实验将CcCCoAOMT1 ORF插入到pENTR/D-TOPO载体中形成质粒pNT15。
然后,根据制造商(英杰公司)建议的GATEWAY方法将pNT15与pDEST17(氨苄青霉素抗性)重组,产生pNT16,其中ORF与pDEST17的读码框一致。将重组产物转化进入感受态细胞Top10(英杰公司)和具有氨苄青霉素抗性的克隆中。通过使用表3所述的特异性引物CCoAOMT1-FullUp(SEQ ID NO:54)和CCoAOMT1-FullLow(SEQ IDNO:55)进行PCR筛选,来鉴定含有CCoAOMT1插入序列的阳性克隆。纯化以后,根据供应商(英杰公司)建议的方法将pNT16转化到感受态细胞Bl21AI(用于蛋白质表达)中。
对于蛋白质表达,将与pNT16预培养的Bl21AI细胞在37℃、5ml含100μg/ml氨苄青霉素的LB培养基中生长过夜。200μl各培养液接种于两个培养瓶中(50ml含100μg/ml氨苄青霉素的LB培养基),使细胞生长到OD600nm=0.6。随后用0.2%的L-阿拉伯糖诱导克隆的蛋白质的表达,培养物在27℃再培养6小时。也进行使用抑制剂(通过制备另一个对照培养物加0.1%葡萄糖产生)的阴性对照实验。
然后将细胞沉淀、收集并重悬于2ml裂解缓冲液(50mM pH7.8的磷酸钾、400mM NaCl、100mM KCl、20mM β-巯基乙醇、10%甘油、0.5%Triton X100、10mM咪唑)中。通过3个循环的冰冻/融解(-180℃/42℃)进行裂解,并且随后进行3个循环的冰上超声处理(处理1分钟/冷却1分钟),所用的插入探针的功率为最大值的40%(VibraCell72412,BIOBLOCKScientific)。然后将裂解的细胞离心(10,000g,30分钟),上清与Ni-Nta小珠(Qiagen产品1004494)一起培育1小时,随后将全部混合物转移到层析柱(英杰公司#货号)中。然后将该柱用4ml洗涤缓冲液(50mM Tris HCl pH7.5、500mM NaCL、20mM咪唑、20mM β-巯基乙醇、10%甘油、0.2mMMgCl2)洗两次。用5级分的0.5ml洗脱缓冲液(50mM Tris HCl pH 7.5、500mM NaCL、0.2mM MgCl2、20mM β-巯基乙醇、10%甘油、250mM咪唑)洗脱带his标签的蛋白质。
将包含蛋白质的级分集中以后,将其以活性缓冲液(50mM Tris HClpH 7.5、500mM NaCL、0.2mM MgCl2、20mM β-巯基乙醇、10%甘油)透析。通过在12%SDS-PAGE凝胶上分析来证实蛋白质的纯化(图15)。重组细胞的诱导产生大量预期分子量为30kDa的重组蛋白质的累积(图15A),其相应于CcCCoAOMT1 His-标签蛋白质的预期大小。His-标签重组蛋白质主要存在于前3个洗脱级分,并且在这几个洗脱级分中没有任何其他显著的条带,这显示几乎没有非特异性蛋白质的污染,凝胶分析也证明没有重组蛋白质的降解(图15B)。该实验显示His标签层析可以分离大量的His-标签CcCCoAOMT1蛋白质。
用Bradford标准方法(Bradford希格玛公司试剂盒#B6916)进行蛋白质的纯化。
用Inoue等人1998所使用的相关方法来进行CcCCoAOMT1的测定。该测定在终体积为200μl的含40μg蛋白质、150μM SAM和200μM咖啡酸的活性缓冲液(50mM Tris HCl pH 7.5、500mM NaCL、0.2mMMgCl2、20mM β-巯基乙醇、10%甘油)中进行。反应在30℃进行,在所示时间通过加入9体积的终止缓冲液(0.1%(v/v)甲酸、5%(v/v)乙腈,pH 2.5)终止反应。随后将这些样品用0.22μM滤器澄清,取20μL注入HPLC。
进行HPLC分析如下:柱(Machery Nagel Nucleosil 5 C18,8μm,4×250mm);梯度洗脱,溶剂A(0.1%(v/v)甲酸)和溶剂B(5%(v/v)乙腈):0-15分钟5%B-50%B、15-17分钟50%B-70%B、17-23分钟70%B、23-25分钟70%B-100%B、25-30分钟100%B、30-32分钟100%B-5%B、32-40分钟5%B、流速1mL/分钟,并通过紫外分光光度计在324nm检测(Waters2487)。
CcCCoAOMT1酶测定并不是以该酶的优选底物咖啡酰辅酶A进行的,因为该底物不能从商业上获得。作为替代,使用咖啡酸作为底物,其为先前用于紫花苜蓿重组蛋白质CCoAOMT的化合物。咖啡酸具有较低的特异性。(Inoue等人1998;Parvathi等人2001)。在该测定中,反应的预期产物是阿魏酸。对照和测试反应的HPLC分析谱之间的比较在图18A和B中显示。获得的结果证明在6小时后14.8分钟出现一个新的峰,该峰在24小时更大。经鉴定该保留时间为阿魏酸标准。另外,当样品显示阿魏酸峰时,新加入的阿魏酸与预期的阿魏酸峰共同洗脱(图19),证明了CcCCoAOMT1产生的峰是阿魏酸。在保留时间15.2分钟鉴定出第二个峰,并且由于在对照样品(无酶)中不存在该峰,其可能是另一种CcCCoAOMT1产生的任一的另一产物、或阿魏酸的降解产物。总之,图18的数据证明由CcCCoAOMT1编码的蛋白质具有一种与CcCCoAOMT蛋白质(如MsCCoAOMT)相关的预期酶活性,因此CcCCoAOMT1编码咖啡的咖啡酰辅酶A氧位-甲基转移酶蛋白质。
实施例10
CaCCoAOMT-L1和CcCCoAOMT-L2蛋白质的过表达
相应于CaCCoAOMT-L1蛋白质(SEQ ID NO:15)的ORF(SEQ IDNO:7)在入门载体pENTR/D-TOPO(即pNT8)中已经存在。为了过表达CaCCoAOMT-L1蛋白质(SEQ ID NO:15),如上述CcCCoAOMT1(SEQID NO:14)一样,将该ORF转移到pDEST17中,从而产生质粒pNT12。随后将该质粒转化到BL21-AI细胞中,除了用阿拉伯糖诱导表达在20℃过夜进行以外,蛋白质的过表达和纯化和CcCCoAOMT1一样。图16显示该过表达纯化实验的结果。A栏(图16)证明对转化的细胞的诱导产生近似预期大小(约26kDa)的蛋白质的良好诱导。纯化结果显示虽然CaCCoAOMT-L1相对地过表达,但是在His标签柱上纯化并不是很有效(图16,B栏)。这是由于多数蛋白质产物是不可溶的,这些蛋白质在离心步骤丢失。
为了过表达CcCCoAOMT-L2蛋白质(SEQ ID NO:16),设计两个引物CCoAOMT-L2-FullUp(SEQ ID NO:58)和CCoAOMT-L2-FullLow(SEQ IDNO:59)(表3),从质粒pNT4上扩增对应于CcCCoAOMT-L2的ORF。可以用与所述CcCCoAOMT1同样的策略将这些引物产生的PCR片段克隆到pENTR/D-TOPO中。使用Pfu Turbo DNA聚合酶的PCR反应条件也与CcCCoAOMT1的相同,并产生pNT10。为了过表达CcCCoAOMT-L2蛋白质,如上述CcCCoAOMT1一样,将pNT10所包含的ORF转移到pDEST17中,产生质粒pNT17。随后将该质粒转化到BL21-AI细胞中,除了用阿拉伯糖诱导表达在20℃过夜进行以外,蛋白质的过表达和纯化和CcCCoAOMT1一样。图17显示该过表达纯化实验的结果。A栏(图17)证明诱导转化的细胞产生近似预期大小(约28kDa)的蛋白质。纯化结果显示虽然CcCCoAOMT-L2相对地过表达,但是在His标签柱上纯化并不是很有效。这是由于多数产生的CcCCoAOMT-L2蛋白质是不可溶的,因此这些蛋白质在离心步骤丢失。
实施例11
HCT和HQT蛋白质的过表达和纯化
为了证明可以以重组形式产生由pML1(CcHCT(SEQ ID NO:1))和pML2(CcHQT(SEQ ID NO:3))编码的蛋白质,将这些蛋白质在大肠杆菌中过表达。使用表7中记录的引物通过PCR扩增各ORF。5’端PCR引物在ATG起始密码子之前有一个BamHI位点,3’端引物在终止密码子之后有一个XbaI位点。用Phusion聚合酶(FinnZymes)在制造商说明的条件下进行PCR反应。由此产生的特异性PCR产物在琼脂糖凝胶上纯化,然后用GeneClean Turbo试剂盒(Q-biogene)根据制造商说明书从凝胶分离。随后用BamHI和XbaI限制性内切酶(新英格兰生物实验室)消化纯化的片段。
表达载体(质粒pGTPc103a)也在相同的条件下用BamHI和XbaI消化。将凝胶纯化的片段定量并用T4DNA连接酶(新英格兰生物实验室)与消化的pGTPc103a载体连接,该步骤设计(通过所用的PCR引物)将载体编码的GST标签与克隆的HCT/HQT蛋白质序列置于同一读码框。然后根据制造商的方法用各连接混合物转化DH5a感受态细胞(英杰公司)。用与克隆该ORF所用引物相同的引物进行PCR和使用酶消化来筛选具有适当插入序列的菌落。然后将所选的质粒纯化,并对存在的HCT和HQT插入序列测序(从而确定在PCR步骤中没有错误)。含有CcHCT序列的pGTPc103a质粒命名为pGTPc103a_HCT,含有CcHQT序列的pGTPc103a质粒命名为pGTPc103a_HQT。最后,用pGTPc103a_HCT或pGTPc103a_HQT转化表达的感受态细胞BL21(DE3),从而过表达蛋白质。
为了过表达蛋白质,含有CcHCT或CcHQT的各重组Bl21(DE3)细胞的预培养液在37℃、10ml含50μg/ml卡那霉素的LB培养基中生长过夜。然后将各预培养液接种到两个较大培养瓶中(200ml含50μg/ml卡那霉素的LB培养基),生长细胞直至OD 600达到1。然后通过加入0.2mM的IPTG来诱导蛋白质表达,随后培养物在37℃再生长3小时。
在此诱导处理后,将细胞沉淀,然后重悬于25ml裂解缓冲液中(20mMNaPO4pH 7.3、150mM NaCl、1%Triton X100、2mM EDTA、0.1%β-巯基乙醇、1×蛋白酶抑制剂混合物)。用超声处理(Vibracel 72.434)在冰上裂解10秒钟3个循环。将裂解的细胞离心(10,000g,30分钟),上清作为GST-琼脂糖4B介质(阿玛西亚(Amersham))的样品进行2小时。然后将混合物转移到小的层析柱中,用5ml洗涤缓冲液(420mM NaPO4pH 7.3、150mM NaCL、1×蛋白酶抑制剂混合物)洗3次。使用0.5ml的洗脱缓冲液(50mM Tris HCl pH 8、10mM还原型谷胱甘肽、10%甘油、1×蛋白酶抑制剂混合物)的4个不同级分洗脱出GST-标签的蛋白质。产生重组蛋白质和各级分纯化以后,在5-18%SDS-PAGE梯度凝胶上分析,并用特异性抗GST标签的抗体进行蛋白质印迹(图13和14)。
图13A的结果显示HCT微弱地过表达,而且该蛋白质可以通过GST-标签层析来纯化。纯化的蛋白质制品(洗脱出的4个级分)在较高分子量范围包含两个条带(72.2和70kDa)。72.2kDa的蛋白质具有与预期的GST-HCT融合蛋白质最接近的大小。70kDa的蛋白质是未知的。低分子量物质(约28kDa)相应于单独的GST标签。图13B中的蛋白质印迹结果证明72.2kDa的蛋白质与抗GST标签的抗体反应,说明其为预期的GST-HCT融合蛋白质。同样,28kDa的条带与抗GST抗体强烈反应,证实其为GST蛋白质。图14A中的结果显示HQT微弱地过表达,而且该蛋白质可以通过GST-标签层析来纯化。纯化的蛋白质制品(洗脱出的前两个级分)在较高分子量范围包含两个条带(73.1和70kDa)。73.1kDa的蛋白质具有与预期的GST-HQT融合蛋白质最接近的大小。70kDa的蛋白质是未知的。低分子量物质(约28kDa)相应于单独的GST标签。图14B中的蛋白质印迹结果证明73.1kDa的蛋白质与抗GST标签的抗体反应,说明其为预期的GST-HQT融合蛋白质。同样,28kDa的条带与抗GST抗体强烈反应,证实其为GST蛋白质。
表7.将CcHCT和CcHQT亚克隆进入质粒pGTPc103a中的特异性引物表。
Figure A20068004588900691
实施例12
用定量RT-PCR分析HQT、HCT、C3H、CCoAOMT-1、 CCoAOMT-L1、和CCoAOMT-L2基因的表达
为了精确地测量各基因的表达,使用基因特异性TaqMan引物/探针(表5)测定阿拉比卡变种(arabica variety)阿拉比卡咖啡T2308和罗巴斯特种变种卡尼福拉咖啡BP 409的几种组织中的HQT、HCT、C3H、CCoAOMT-1、CCoAOMT-L1和CCoAOMT-L2基因的转录水平。通过方法1按上述实施例2中的描述,用从4个不同发育期的阿拉比卡和罗巴斯特种咖啡的根、茎、叶、花、和从颗粒和果皮组织中分离的RNA来制备这些实验中不同的cDNA。这些实验的结果在图8中显示。
编码HCT和HQT的基因。以HQT和HCT基因设计TaqMan探针和引物(见表5),然后使用这些测量几个不同阿拉比卡和罗巴斯特种咖啡组织中各基因的转录水平(见实施例2)。罗巴斯特种的HQT表达谱(图8)显示该基因在少绿色期的颗粒中以相对高的水平表达(RQ 0.71),而在所有其它检测的组织中的表达水平低一些。值得注意的是相对于果皮发育后期,少绿色果皮样品的HQT水平也有轻微提高。先前发明者已经证明该罗巴斯特种绿色颗粒样品没有胚乳特异性基因表达(临时申请号60/696,445)。通过后者可得出HQT基因可能在颗粒和果皮发育早期有高表达的结论,并且该转录水平在伴随胚乳发育起始时的两种组织中相对较低。
在其它罗巴斯特种组织中的HQT表达水平说明该基因通常在多种咖啡组织中以持续低的水平表达,提示其可能具有某些类型的“看家基因”的功能。当检测阿拉比卡中HQT的水平时,发现与罗巴斯特种在根、茎、和嫩叶、和多数颗粒和果皮组织中具有相对相似的水平。这与其可能是重要的看家基因的观点是一致的。在阿拉比卡少绿色颗粒和果皮样品中HQT水平较低,这与当诱导胚乳特异性基因表达时,由于这些阿拉比卡少绿色颗粒中表达胚乳特异性基因,因此HQT降低的观点一致(临时申请号60/696,445)。最后,应该注意在阿拉比卡和罗巴斯特种的花中检测到HQT表达也有很大的差异。该差异可能由于这两种花样品的精确发育期不同,在两种花样品之间几种基因的表达显著可变。
罗巴斯特种的HCT表达谱表明该基因在大绿色期(RQ 0.33)和黄色期在果皮中相对高表达,在少绿色期(RQ 0.09)和红色期在果皮中表达水平较低。在罗巴斯特种的根和茎中转录水平相对较高,而在叶和花中水平较低。在所研究的全部期的颗粒中也检测到很低的水平。在阿拉比卡中具有不同模式的表达,在果皮中没有检测到HCT转录本,仅在少绿色期检测到低水平。另外,在阿拉比卡的茎组织中检测不到HCT转录本。相反,在阿拉比卡红色期的叶和颗粒中检测到比罗巴斯特种稍高水平的HCT。在有限数量的阿拉比卡组织样品中检测到HCT的表达,排除了由罗巴斯特种序列设计的HCT Taqman探针组不识别阿拉比卡变种的可能性。在阿拉比卡和罗巴斯特种的花样品中HCT水平相似。
相对于罗巴斯特种颗粒,在阿拉比卡颗粒中较高的HCT的表达表明在阿拉比卡和罗巴斯特种中绿原酸谱的差异部分是由于在成熟咖啡粒中HCT表达水平的不同。同样,考虑到绿原酸可能涉及病原抗性(Shadle等人(2003);Niggeweg等人(2004)),在罗巴斯特种的根和茎中HCT的高表达可能显著提高罗巴斯特种相对于阿拉比卡咖啡的病原抗性。值得注意的是在罗巴斯特种BP-409叶样品中HCT表达相对较低。然而,考虑到该叶样品是来自正在展开的嫩叶,可能在成熟叶中HCT的表达要比嫩叶中显著增高,这可能是由于在叶展开期间CGA合成木质素和其它结构型元件的可选择的用途。在嫩叶中HCT转录水平比预期低的解释进一步支持了较高的HCT表达水平与较高的病原或疾病抗性相关这一论点,而这是成熟叶的重要特征。
编码C3H的基因。以C3H基因设计特异性引物和TaqMan探针(见表5)。该探针组用于检测在实施例2种记录的几种不同阿拉比卡和罗巴斯特种咖啡组织中C3H的转录水平。图8中的数据表明在所有检测的罗巴斯特种组织中都能检测到C3H转录本。在罗巴斯特种少绿色期颗粒样品中检测到相对高水平的C3H转录本,在果皮(在大绿色和黄色期)中也检测到相对高水平的C3H转录本。在罗巴斯特种的茎、叶和花样品中C3H转录本的水平较低。有趣的是,在罗巴斯特种的根样品中没有检测到C3H转录本。在阿拉比卡中,除在少绿色期以外,颗粒中的C3H转录本水平与罗巴斯特种中的相似。认为后者与上述阿拉比卡样品的发育期较晚有关。有趣的是,在阿拉比卡的少绿色期果皮样品中没有检测到C3H转录本,而在随后的发育期直到红色期其水平持续升高。这与罗巴斯特种样品不同,在罗巴斯特种中C3H在发育早期表达水平较高,随后在成熟期降低。
编码CCoAOMT-1的基因。以CCoAOMT1基因设计特异性TaqMan探针和两个引物(见表5)。图8中显示该基因的定量RT-PCR数据。在罗巴斯特种颗粒中,在少绿色期CCoAOMT-1转录水平很低(RQ 0.05),而在大绿色期(RQ 0.31)和黄色颗粒期(RQ 0.76)较高,随后在成熟颗粒中下降到很低的水平(RQ 0.09)。在果皮中,其水平在少绿色果皮中较低(RQ 0.15),在大绿色(RQ 0.56)和黄色期(RQ 0.65)稍微升高,随后在红色期又降为很低的水平(RQ 0.06)。在罗巴斯特种中,在根(RQ 1.09)和茎(RQ 1.5)中CCoAOMT-1转录本的水平相对较高,在花中中等高(RQ 0.58),在叶中很低(RQ 0.06)。与BP409罗巴斯特种样品相比较,在阿拉比卡T2308中,叶的CCoAOMT-1在少绿色期(RQ 0.56)、和大绿色颗粒期(RQ 1.21)和红色颗粒期(RQ 1.43)相对较高。在黄色颗粒期CCoAOMT-1水平意想不到地下降,这需要在其它阿拉比卡样品中验证。在少绿色期、大绿色期、黄色期阿拉比卡果皮样品中CCoAOMT-1转录本的水平相对较低。
编码CCoAOMT-L1的基因。以CCoAOMT-L1基因设计特异性TaqMan探针和两个引物(见表5)。得到的定量RT-PCR结果表明CCoAOMT-L1基因转录本的水平接近或低于所有检测的罗巴斯特种组织中的水平。除花样品以外,所有阿拉比卡样品都获得相对相似的结果。在此情况下,清楚地检测到CCoAOMT-L1转录本(RQ 0.14),即,该基因的转录水平比在阿拉比卡少绿色颗粒期检测到的(RQ 0.018)高7.8倍。在阿拉比卡花样品中这些转录本的存在表明该基因在花的一个或多个部分特异性表达。此外,在罗巴斯特种花中缺失CCoAOMT-L1转录本表明阿拉比卡和罗巴斯特种的花在不同的成熟期,因此CCoAOMT-L1的表达可能在花发育过程中具有阶段特异性。许多其他咖啡基因显示在同样阿拉比卡和罗巴斯特种花样品中广泛的差异表达,再次表明这些样品处于不同的成熟期,这也支持了上述论点。
编码CCoAOMT-L2的基因。以CCoAOMT-L2基因设计特异性TaqMan探针和两个引物(见表5)。获得的该基因的定量RT-PCR结果表明,除在罗巴斯特种的花样品以外,使用此处所述实验条件在任意罗巴斯特种或阿拉比卡组织样品中都检测不到CCoAOMT-L2的表达。值得注意的是,对照实验显示rpl39引物/探针组和CCoAOMT-L2引物/探针组当对它们各自质粒进行测试时的扩增效率相似。因此,在罗巴斯特种或阿拉比卡中检测不到CCoAOMT-L2基因的表达可能不是由于CCoAOMT-L2引物/探针组的特异性问题。
实施例13
重组咖啡HCT的功能性活性
没有检测到来自大肠杆菌中产生的重组GST-标签HCT和GST-标签HQT蛋白质的活性。为了检测GST标签是否防碍了这些蛋白质的活性,通过酶切从各蛋白质上除去GST标签。然后再分析重组HCT和HQT蛋白质(无标签)的活性。
AcTEV蛋白酶消化:将按实施例11中所描述的产生和纯化的重组HCT-GST或HQT-GST重组蛋白质根据供应商说明书(英杰公司)用AcTEV消化:将140μl重组酶用7.5μl TEV缓冲液(20×缓冲液,英杰公司)、1.5μl的0.1mM DTT和2μl的AcTEV蛋白酶(20单位)在30℃消化2小时。
酶测定:使用修改的Niggeweg等人,2004和Hoffmann等人,2003的方法。用逆反应(切割5-CQA形成咖啡酰-辅酶A和奎尼酸)在40℃测定酶活性。反应混合物(总体积200μl)为:100mM Na-Pi缓冲液pH 6.5、1mMDTT、5mM CGA(5-CQA-希格玛公司)、3.3mM辅酶A、和30μLAcTEV消化的GST-HCT或GST-HQT重组酶。通过加入底物辅酶A来起始反应。在各时间点,通过加入170μl终止缓冲液(0.1%甲酸、5%乙腈)终止30μl的反应混合物。随后用0.2μm滤器过滤该物质,然后上样于HPLC柱。
HPLC方法:用HPLC分析反应产物,使用Waters反相C18柱(4μm,4.6×250mm)和(8-50%)梯度乙腈:溶剂A为91%的milliQ超纯H2O、8%CH3CN、和1%甲酸;溶剂B为49%milliQ超纯H2O、50%CH3CN、和1%甲酸,溶剂用30%氦喷雾。梯度如下:0分钟,98%A-2%B;5分钟,92%A-8%B;25分钟,50%A-50%B;30分钟,30%A-70%B;35分钟,30%A-70%B;然后从37-45分钟,98%A-2%B。在325nm检测洗脱的化合物。通过洗脱时间和紫外吸光谱来表征化合物,并且在可实施时通过标准物来证实其同一性。
结果:
用AcTEV蛋白质处理GST-标签HCT和GST-标签HQT,通过SDSPAGE凝胶电泳和考马斯亮蓝染色来显示,从各GST-标签“前体”蛋白质产生具有全长蛋白质的预期分子量的较小的多肽。这证明AvTEV蛋白酶成功地从GST-HCT和GST-HQT蛋白质释放GST-标签,并且因此产生正常的全长HCT和HQT多肽。
图20显示HCT/HQT活性的对照反应(切割5-CQA形成咖啡酰-辅酶A和奎尼酸)。该反应包含所有反应物,但是不加酶。图20中的结果证明在所应用的条件下,绿原酸(5-CQA)是稳定的;CGA峰在T=4小时仅比T=0时的峰稍低,而只在12.1分钟出现很小的峰。
相反,图21显示在AvTEV处理分GST-HCT蛋白质的反应中CGA峰显著降低(从T=0的约0.035到T=4小时的约0.02)。CGA峰的减少伴随几个新峰的出现。新的峰分别在约8分钟、17.1分钟和18.3分钟,除此之外CGA峰的肩峰显著发展。因为在这些洗脱条件下,咖啡酸的洗脱峰与5-CQA峰特别接近,加入重组咖啡HCT多肽引起咖啡酸的累积。虽然该反应的预期产物是咖啡酰-辅酶A,但是该分子在所用缓冲液中可能不稳定并迅速降解,形成可检测到的咖啡酸。与此论点一致,可能在17.1分钟和18.3分钟的峰之一实际上是咖啡酰-辅酶A。
参考文献:
Altschul S.F.,Madden T.L.,Schaffer A.A.,Zhang J.,Zhang Z.,MillerW.,Lipman D.J.(1997)Gapped BLAST and PSI-BLAST:a newgeneration of protein database search programs.Nucleic Acids Res.25:3389-3402.
Ben Amor M.and McCarthy J.(2003)Modulation of coffee flavourprecursor levels in green coffe grains.European Patent EPC/03394056.0.
Clifford M.N.(1985)Chlorogenic acids,in Coffee 1.Chemistry,Ed byClarke RJ and Macrae R.Elsevier Applied Science,London,pp 153-202.
Clifford M.N.,Walker R(1987)Chlorogenic acids-confounders ofcoffee±serum cholesterol relationships.Food Chem 24:77-80.
Clifford M.N.(1998)The nature of chlorogenic acids-are theyadvantageous compounds in coffee?,in Dix-septième Colloque ScientifiqueInternational sur le Café.ASIC,Paris,pp 79-91.
Clifford M.N.(1999)Chlorogenic acids and other cinnamates-nature,occurence and dietary burden.J Sci Food Agric 79:362-372.
Clifford M.N.(2000)Chlorogenic acids and other cinnamates-nature,occurrence,dietary burden,absorption and metabolism J Sci Food Agric80:1033-1043.
Crouzillat D.,Lerceteau E.,Petiard V.,Morera J.,Rodriguez H.,Walker D.,Philips W.R.R.,Schnell J.,Osei J.and Fritz P.(1996).Theobroma cacao L.:a genetic linkage map and quantitative trait locianalysis.Theor Appl Genet.93:205-214.
Ferrer JL,Zubieta C,Dixon RA,Noel JP(2005)Crystal structures ofalfalfa caffeoyl coenzyme A 3-O-methyltransferase.Plant Physiol 137:1009-1017.
Gang D.,Wang J.,Dudareva N.,Hee Nam K,Simon J.,Lewinsohn E.,Pichersky E(2001)An Investigation of the Storage and Biosynthesis ofPhenylpropenes in Sweet Basil Plant physiol.125:539-555.
Grace S.C.,Logan B.A.(2000)Energy dissipation and radicalscavenging by the plant phenylpropanoid pathway Phil.Trans.R.Soc.Lond.B.355:1499-1510.
Hoffmann L.,Maury S.,Martz E.,Geoffroy P.,Legrand M..(2003)Purification,Cloning,and Properties of an Acyltransferase ControllingShikimate and Quinate Ester Intermediates in PhenylpropanoidMetabolism J.Bio.Chem.278(1):95-103.
Hoffmann L.,Besseau S.,Geoffroy P,Ritzenthaler C.,Meyer D.Lapierre C,Pollet B.Legrand M (2004)Silencing ofHydroxycinnamoyl-Coenzyme A Shikimate/QuinateHydroxycinnamoyltransferase Affects Phenylpropanoid Biosynthesis PlantCell 16:1446-1465.
Hollman P.C.H.(2001)Evidence for health benefits of plant phenols:local or systemic effects?J.Sci.Food Agric.81:842-852.
Inoue K,Sewalt VJ,Murray GB,Ni W,Sturzer C,Dixon RA(1998)Developmental expression and substrate specificities of alfalfa caffeic acid3-O-methyltransferase and caffeoyl coenzyme A 3-O-methyltransferase inrelation to lignification.Plant Physiol 117:761-770.
Ky C.-L.,Louarn J.,Dussert S.,Guyot B.,Hamon S.,Noirot M.(2001)Cafeine,trigonelline,chlorogenic acids and sucrose diversityin wild阿拉比卡咖啡L.and C.canephora P.accessions Food Chemistry 75:223-230.
Lee C.Y.,Jaworski A.(1987)Phenolic compounds in white grapesgrown in New York.Am.Enol.& Viticul.38:277-281.
Leloup V.,Louvrier A.,Liardon R.(1995)Degradation mecanisms ofchlorogenic acids during roasting.Compte-rendus du Seizième Colloque del′ASIC(Association Scientifique Internationale sur le Café)ASIC Kyoto pp192-198.
Maher E.A.,Bate N.J.,Ni W.,Elkind Y.,Dixon R.A.,Lamb C.J.(1994)Increased disease susceptibility of transgenic tobacco plants withsuppressed levels of preformed phenylpropanoid products.Proc.Natl.Acad.Sci.USA 91:7802-7806.
Marraccini P.,Deshayes A.,Pétiard V.and Rogers W.J.1999.Molecular cloning of the complete 11S seed storage protein gene of阿拉比卡咖啡and promoter analysis in the transgenic tobacco plants.PlantPhysiol.Biochem.37:273-282.
Maury,S.,Geoffroy,P.,Legrand,M.(1999)TobaccoO-methyltransferases involved in phenylpropanoid metabolism.Thedifferent caffeoyl-coenzyme A/5-hydroxyferuloyl-coenzyme A3/5-O-methyltransferase and caffeic acid/5-hydroxyferulic acid3/5-O-methyltransferase classes have distinct substrate specificities andexpression patterns.Plant Physiol.121:215-224.
Mitchell H.J.,Hall S.A.,Stratford R.,Hall J.L.,Barber M.S.(1999).Differential induction of cinnamyl alcohol dehydrogenase during defensivelignification in wheat(Triticum aestivum L.):characterisation of the majorinducible form.Planta 208:31-37.
Montavon P.,Duruz E.,Rumo G.,Pratz G.(2003a)Evolution of GreenCoffee Protein Profiles with Maturation and Relationship to Coffee CupQuality J.Agric.Food Chem.51:2328-2334.
Montavon P.,Mauron A.F.Duruz E.(2003b)Changes in Green CoffeeProtein Profiles during Roasting Food Chem.51:2335-2343.
Nair R.,Xia Q.,Kartha C.,Kurylo E.,Hirji R.,Datla R.,Selvaraj G.(2002)Arabidopsis CYP98A3 Mediating Aromatic 3-Hydroxylation.Developmental Regulation of the Gene,and Expression in Yeast Plantphysiol.130:210-220.
Natella F.,Nardini M.,Giannetti I.,Datillo C.,Scaccini C.(2002)Coffee Drinking Influences Plasma Antioxidant Capacity in Humans J.Agric.Food Chem.50:6211-6216.
Niggeweg R.,Michael A.,Martin C.(2004)Engineering plants withincreased levels of the antioxydant chlorogenic acid Nature Biotech.22(6):746-54.
Ohnishi M.,Morishita H.,Iwahasi H.,Toda S.,Shirataki Y.,KimuraM.,Kido R.(1994)Inhibitory effects of chlorogenic acids on linoleic acidperoxidation and haemolysis.Phytochemistry 36:579-584.
Olthof M.R.,Hollman P.C.H.,Katan M.B.(2001)Chlorogenic acidand caffeic acid are absorbed in humans.J.Nutr.131:66-71.
Parvathi K,Chen F,Guo DJ,Blount JW,Dixon RA(2001)Substratepreferences of O-methyltransferases in alfalfa suggest new pathways for3-O-methylation of monolignols.Plant Journal 25:193-202.
Rice-Evans C.A.,Miller M.J.,Paganga G. (1996)Structure-antioxidant activity relationships of flavonoids and phenolicacids.Free Rad.Biol. Med.20:933-956.
Rogers J.,Michaux S.,Bastin M.,Bucheli P.(1999)Changes to thecontent of sugars,sugar alcohols,myo-inositol,carboxylic acids andinorganic anions in developing grains from different varieties of Robusta(Coffea canephora)and Arabica(C.arabica)coffees Plant Science.149:115-123.
Schoch G.,Goepfert S.,Morant M.,Hehn A.,Meyer D.,Ullmann P.,Werck-Reichhart D.(2001)CYP98A3 from Arabidopsis thaliana Is a3-Hydroxylase of Phenolic Esters,a Missing Link in the PhenylpropanoidPathway.J.Bio.Chem.266(39):36566-36574.
Shadle G.,Wesley V.,Korth K.,Chen F.,Lamb C.,Dixon R.(2003)Phenylpropanoid compounds and disease resistance in transgenic tobaccowith altered expression of l-phenylalanine ammonia-lyase Phytochemistry64:153-161.
Shibata H.,Sakamoto Y.,Oka M.,Kono Y.(1999)Natural antioxidant,chlorogenic acid,protects against DNA breakage caused bymonochloramine. Biosci.Biotechnol.Biochem.63:1295-1297.
Tamagnone T,Merida A.,Stacey N.,Plaskitt K.,Parr A.,Chang C.E.,Lynin D.,Dow M.,Roberts K.,Martin C.(1998)Inhibition of Phenolic AcidMetabolism Results in Precocious Cell Death and Altered Cell Morphologyin Leaves of Transgenic Tobacco Plants Plant Cell 10:1801-1816.
Voilley,A.,Sauvageot,F.,Durand,D.(1977).Influence sur l′amertumed′un caféboisson de quelques paramètres d′extraction.Compte-Rendus duHuitième Colloque de l′ASIC(Association Scientifique International sur leCafé),ASIC pp 192-198251-259.
Zhong R,III W,Negrel J,Ye ZH(1998)Dual methylation pathways inlignin biosynthesis.Plant Cell 1998 Dec;10(12):2033-46.
序列表
Sequence(SEQ ID NO:1)
--------
<213>微生物名称:卡尼福拉咖啡(Coffea canephora)
<212>类型:DNA
<211>长度:1388
    序列名称:CcHCT(cDNA于pML1)
特征
-------
序列:CcHCT(cDNA于pML1):
<221>关键特征:CDS
<222>位置从:3
<222>位置到:1307
    其它信息:bp 3到1307=完全ORF
    CDSJoin:No
自定义密码子
------------
序列名称:CcHCT(cDNA于pML1)
<400>前序列串:
ccatgaaaat cgaggtgaag gaatcgacta tggtgagacc tgcccaagaa actcctggga    60
ggaacttgtg gaactcgaac gtggacttgg tggtgccaaa tttccacacc cctagcgtct    120
acttctatag gccgacggga tcatcgaatt tctttgatgc caaagtgcta aaggacgctt    180
tgagccgagc ccttgtcccg ttctacccaa tggctggtag gttaaagaga gacgaagatg    240
ggcggattga gattgagtgc aatggtgaag gcgtgctttt cgtggaggcc gagtctgatg    300
gagtagttga tgatttcggt gactttgcac caactttaga gcttcgtaga ctcattcctg    360
cagttgatta ttctcaagga atatcaagct acgctctcct agtgctgcag gtgacatatt    420
tcaagtgtgg tggagtctct cttggtgttg gcatgcgaca tcatgcagct gatggatttt    480
caggtcttca tttcatcaat tcatggtctg atatggcccg tggccttgat gtgaccctgc    540
caccattcat agaccgcacc ctcctccgtg cccgcgatcc gccccagcct caattccagc    600
acattgagta ccaacctcct ccagccttaa aagtttcccc gcaaactgca aaatctgact    660
cagttcctga aactgcggtg tccatcttca agttaaccag ggagcaaatc agtgccctga    720
aagccaagtc caaggaagat ggaaacacca ttagctatag ctcctacgaa atgttggcag    780
gccatgtatg gcgctgtgct tgcaaggcac gaggactcga agttgatcaa ggaacaaaat    840
tgtacattgc tactgatgga cgggcaagac ttaggccttc gctcccacct ggctattttg    900
gcaatgtcat cttcacggca accccgatag ctatagctgg tgaccttgaa ttcaagccag    960
tctggtatgc tgccagtaaa atccacgatg cattggcgag gatggacaac gactacttaa    1020
ggtcagctct tgattacttg gaattacagc ctgatttgaa ggccctggtt cgtggtgccc    1080
atactttcaa gtgtccaaat ctggggatca caagctgggt aaggttaccc atccatgatg    1140
ctgattttgg ctggggtcgg cccatattta tgggtcctgg tggcatcgct tatgaaggtt    1200
taagctttat attgcctagt ccaaccaatg atggaagcat gtcagtagct atttcattgc    1260
agggcgagca catgaaactc ttccagagtt tcttgtatga catttgaacg ggagcacatc    1320
acatgaattt tcacgcttgt attaatagct ttcggttccg ggccagctat tcatgcggtg    1380
gtggtttc                                                             1388
序列(SEQ ID NO:2)
--------
<213>微生物名称:阿拉比卡咖啡(Coffea arabica)
<212>类型:DNA
<211>长度:1388
    序列名称:CaHCT(cDNA于pML5)
特征
-------
序列:CaHCT(cDNA于pML5):
<221>关键特征:CDS
<222>位置从:3
<222>位置到:1307
    其它信息:bp 3到1307=完全ORF
    CDSJoin:No
自定义密码子
------------
序列名称:CaHCT(cDNA于pML5)
<400>前序列串:
ccatgaaaat cgaggtgaag gaatcgacta tggtgagacc tgcccacgaa actcctagga    60
ggaacttgtg gaactcgaac gtggacttgg tggtgccaaa tttccacacc cctagcgtct    120
acttctatag gccgacggga tcatcgaatt tctttgatgc caaagtgctg aaggacgctt    180
tgagccgagc ccttgtcccg ttctacccaa tggctggtag gttaaagaga gacgaagatg    240
ggcggattga gattgagtgc aatggtgaag gcgtgctttt cgtggaggcc gagtctgatg    300
gagtagttga tgatttcggt gactttgcac caactttaga gcttcgtaga ctcattcctg    360
cagttgatta ttctcaagga atatcaagct acgctctcct agtgctgcag gtgacatatt    420
tcaagtgtgg tggagtctct cttggtgttg gcatgcaaca tcatgcagct gatggatttt    480
caggtcttca tttcatcaat tcatggtctg atatggcccg tggccttgat gtgaccctgc    540
caccattcat agaccgcacc ctcctccgtg cccgcgatcc gccccagccc caattccagc    600
acattgagta ccaaccccct ccaaccttaa aagtttcccc gcaaactgca aaatctgact    660
cagttcctga aactgcagtg tccatcttca agttaaccag ggagcaaatc agtgccctga    720
aagccaagtc caaggaagat ggaaacacca ttagctatag ctcctacgaa atgttggcag    780
gccatgtatg gcgctgtgct tgcaaggcac gaggactcga agttgatcaa ggaacaaaat    840
tgtacattgc tactgatgga cgagcaagac ttaggccttc gctcccgcct ggctattttg    900
gcaatgtcat cttcacggca accctgatag ctatagctgg tgaccttgaa ttcaagccag    960
tctggtatgc tgcaagtaaa atccacgatg cattggcgag gatggacaac gactacttaa    1020
ggtcagctct tgattacttg gaattacagc ctgatttgaa ggccctggtt cgtggtgccc    1080
atactttcaa gtgtccaaat ctggggatca caagctgggt aaggttaccc atccatgatg    1140
ctgattttgg ctggggtcgg cccatattta tgggtcctgg tggtatcgct tatgaaggtt    1200
taagctttat attgcctagt ccaaccaatg atggaagcat gtcagtagct atttcattgc    1260
agggcgagca catgaaactc ttccagagtt tcctgtatga catttgaatg ggagcacatc    1320
acatgaattt tcacgcttgt attaatagct ttcggttccg ggccagctat tcatgcggtg    1380
gtggtttc                                                             1388
序列(SEQ ID NO:3)
------
<213>微生物名称:卡尼福拉咖啡
<212>类型:DNA
<211>长度:1534
    序列名称:CcHQT(cDNA于pML2)
特征
-------
序列:CcHQT(cDNA于pML2):
-------
<221>关键特征:CDS
<222>位置从:120
<222>位置到:1412
    其它信息:bp 120到1412=完全ORF
    CDSJoin:No
自定义密码子
------------
序列名称:CcHQT(cDNA于pML2)
<400>前序列串:
cttctccatc ccagctcgtt tctgacaaat ccctttcgtc aatcaacaaa actctttaca     60
tattttctgc taaatctcag cttatttcat cttgtttgat cagcgtggga agcgagaaaa    120
tgaagataac cgtgaaggaa acagcaatgg ttcgtccagc ccaaccaaca cccacaaaga    180
ggctatggaa ctcgaatttg gatcttctgg tagcaagaat tcatatcttg accgtctact    240
tctacaagcc taatggttct gctaatttct ttgatacccg tgtgctcaaa gaagcattga    300
gcaatgttct tgtctctttc taccccatgg ctgggagatt agcaagagat gaagaaggaa    360
ggattgagat cgactgtaac ggtgaaggtg tactctttgt tgaggctgaa tcagactcga    420
gtgtcgatga ttttggtgat tttgcaccaa gtttggagct caggaggctc atcccgaccg    480
tcgattgttc tggtgacatt tcttcttacc ccctcgttat tttccaggta actcgtttca    540
agtgtggagc agcagctctt ggagctgggg tgcagcacaa tttatcagat ggcgtttcat    600
ctctgcactt catcaataca tggtcagaca tagctcgtgg cctcaccatt gctgtccctc    660
cgttcattga ccggacactt atccgtgcta gggaccctcc cgtgcctgta ttcgaacatg    720
tcgaatatta tccgccccct caactaaaat cagattcaag aattcaagaa ctcaaaacag    780
gccctagggc aagtaccaca gctgtactaa aaatcacacc tgaacaactt agccagctta    840
aagctaaggc caacaatgag ggcagcactt atgagatctt agcagcacat atatggcgta    900
ctgcatgcaa agcacgtggc ctcaccaatg atcaatccac caagctgtac gttgccactg    960
atggccggtc taggctgatt cctcccctgc ctcctggcta tctaggtaat gtggtcttca   1020
ctgcaactcc aattgctgaa tccagtaatc ttcaatcaga gcccttgacc aattctgcaa   1080
aaagaatcca caacgccttg gcaagaatgg ataatgatta cttaagatca gccctggatt   1140
atcttgaaat tcaacctgat ttgtctgctt tggttagagg gcctcggcat tttgctagtc   1200
ctaatttgaa tatcaatagt tggacaaggc ttccgtttca tgatgcagac tttggctggg   1260
gcagacctat tcatataggg ccggcaatca ttctttatga gggtacggta tatgtattgc   1320
caagtccagg caaagacagg actttatcgt tagctgtgtg cttagatgcc gatcacatgc  1380
cactcttcca aaggttcctg tacgatttct gagaaatttt gaaatatcaa caacaatcaa  1440
taatcaagct tctggaagag aatggatgga attaccattt ttagatggta caaatcaagg  1500
cagcctcgtg acacttgtga ttggattggg actc                              1534
序列(SEQ ID NO:4)
--------
<213>微生物名称:阿拉比卡咖啡
<212>类型:DNA
<211>长度:1533
    序列名称:CaHQT(cDNA于pML3)
特征
-------
序列:CaHQT(cDNA于pML3):
<221>关键特征:misc_feature
<222>位置从:932
<222>位置到:932
    其它信息:未知核苷酸(N)
    CDSJoin:No
特征
-------
序列:CaHQT(cDNA于pML3):
<221>关键特征:CDS
<222>位置从:119
<222>位置到:1411
    其它信息:bp 119到1411=完全ORF
    CDSJoin:No
自定义密码子
------------
序列名称:CaHQT(cDNA于pML3)
<400>前序列串:
cttctccatc ccagccgttt ctgacaaatc cctttcgtca atcaacaaaa ctctttacat     60
attttctgct aaatctcagc ttatttcatc ttgtttgatc agcgtgggaa gcgagaaaat    120
gaagataacc gtgaaggaaa cagcaatggt tcgtccagcc caaccaacac ccacaaagag    180
gctatggaac tcgaatttgg atcttctggt agcaagaatt catatcttga ccatctactt    240
ttacaagcct aatggttctg ctaatttctt tgatacccgt gtgctcaaag aagcattgag    300
caatgttctt gtctctttct accccatggc tgggagatta gcaagagatg aagaaggaag    360
gattgagatc gactgtaacg gtgaaggtgt actctttgtt gaggctgaat cagactcgag    420
tgtcgatgat tttggtgatt ttgcaccaag tttggagctc aggaggctca tcccgaccgt    480
cgattgttct ggtgacattt cttcttaccc cctcgttatt ttccaggtaa ctcgtttcaa    540
gtgtggagca gcagctcttg gagctggggt gcagcacaat ttatcagatg gcgtttcatc    600
tctgcacttc atcaatacat ggtcagacat agctcgtggc ctcaccattg ctgtccctcc    660
gttcattgac cggacactta tccatgctag ggaccctccc gtgcctgtat tcgaacatgt    720
cgaatattat ccgccccctc aactaaaatc agattcaaga attcaagaac tcaaaacagg    780
ccccagggca agtaccacag ctgtactaaa aatcactcct gaacaactta gccagcttaa    840
agctaaggcc aacaatgagg gcagcactta tgagatctta gcagcacata tatggcgtac    900
cgcatgcaaa gcacgtggcc ccaccaatga tnaatccacc aagctgtacg ttgccaccga    960
tggccggtct aggctgattc ctcccctgcc tcctggctat ctaggtaatg tggtcttcac   1020
tgcaactcca attgctgaat ccagtgatct tcaatcagag cccttgacca attctgcaaa   1080
aagaatccac aatgccttgg caagaatgga taatgattac ttaagatcag ccctggatta   1140
tcttgaaatt caacctgatt tgtctgcttt ggttagaggg cctcggcatt ttgctagtcc   1200
taacttgaat atcaatagtt ggacagggct tccgtttcat gatgcagact ttggctgggg   1260
cagacctatt catatagggc cggcaatcat tctttatgag ggtacggtat atgtattgcc   1320
aggtccaggc aaagacagga ctttatcgtt agctgtgtgc ttagatgccg atcacatgcc   1380
actcttccaa aagttcctgt acgatttctg agaaattttg aaatatcaac aacaatcaat   1440
aatcaagctt ctggaagaga atggatagaa ttaccatttt tagacggtac aaatcaaggc   1500
agcctcgtga cacttgtgat tggattggga ctc                                1533
序列(SEQ ID NO:5)
--------
<213>微生物名称:卡尼福拉咖啡
<212>类型:DNA
<211>长度:1728
    序列名称:CcC3H(cDNA于pcccl20d10)
特征
-------
序列:CcC3H(cDNA于pcccl20d10):
<221>关键特征:CDS
<222>位置从:27
<222>位置到:1553
    其它信息:bp 27到1553=完全ORF
    CDSJoin:No
自定义密码子
------------
序列名称:CcC3H(cDNA于pcccl20d10)
<400>前序列串:
caaatctcaa accttcgtat taaccaatgg ctctgcttct gatcctcctc ccagttgcct     60
tcatcttcct agcctacagc ctctatgaac gccttagatt caaactgcca cccgggccac    120
ggccaaaacc ggtggtcgga aacatttacg acataaaacc ggtgaggttc aagtgctatg    180
cggagtggtc aaaactctat ggtccaatat tttctgtcta cttcggttcc cagctgaata    240
ctgttgtgaa cactgcagaa ctggccaaag aagttcttaa agacaatgat cagcaattgg    300
cagataggta caggagtaga ccctctgcca gaatgagcag aaatggccaa gatttgatat    360
gggctgatta tggtcctcat tatgtgaagg tcagaaaact gtgcaatctt gaactcttca    420
ctccaaaaag actggaaggc cttagacctt taagagagga tgaagttaca gccatggttg    480
attccatctt caaggactgc accaaacctg aaaacaaagg caagagtctg ttgatgcgca    540
actacttggg atcagtagca ttcaacaaca ttacaaggct aacatttggg aagaggttca    600
tgaattcaga gggtgtggtt gatgaacaag gccaagagtt taagggcatt gtatcaaatg    660
ggataaggat tggtgcaaaa ctctccgtgg cagatcacat tccttggctt cgttggatgt    720
ttgtaggcga aaatgaggac ctggataagc acaatgcgcg gagagacaaa ctgaccagaa    780
tgatcatgga agagcacact cttgcaaggc aaaagagtgg caatactaag cagcattttg    840
ttgatgcatt gctcactctt caaaagcaat atgaattgag cgatgacact gtcattggac    900
tcctttggga catgattact gctggcatgg atacaaccac aatctcagta gaatgggcaa    960
tggcagagct ggtgaagaat ccaagggtgc agcaaaaggc gcaagaggaa cttgaccgag   1020
tcattggctc cgatagaatc atgactgaag ctgattttgc aaagctccca tacttacagt   1080
gtgtagctaa ggaagctcta aggctgcacc ctccaactcc actaatgctt cctcatagag   1140
ccaatgccaa tgtgaagatc ggtggttatg acatccctaa agggtctatc gtgcacgtta   1200
acgtctgggc gattgctcgt gatcctgcag cctggaaaaa tccactggaa ttccgacctg   1260
agagattcct ggaggaagat gttgacatca agggccacga ttatcggctc ctgccttttg   1320
gtgctggaag gaggatctgc cctggtgcac aacttgcact caatctggtc acttctatgc  1380
tggggcattt gttgcaccac tttacttggt ctccaccacc tggggtcagg cctgaagaga  1440
ttgacctgga agagagccct ggaacagtta cttatatgag aacccctttg caagctgttg  1500
caacaccaag attgcctgca catttgtaca atcgtgtgcc agtagagctg taatgcttcc  1560
tttctcttgt tactaaattt tcagcttgca agagttgctt cacttccaac tctccatttg  1620
attgtgaaga acttgttgga ttctccgagg tatttgagaa aagctactat ttttctagga  1680
aaaataaaat aagggttttc taaaaaaaaa aaaaaaaaaa aaaaaaaa               1728
序列(SEQ ID NO:6)
--------
<213>微生物名称:卡尼福拉咖啡
<212>类型:DNA
<211>长度:1144
    序列名称:CcCCoAOMT1(cDNA于pcccl15a11)
特征
-------
序列:CcCCoAOMT1(cDNA于pcccl15a11):
<221>关键特征:CDS
<222>位置从:80
<222>位置到:823
    其它信息:bp 80到823=完全ORF
    CDSJoin:No
自定义密码子
------------
序列名称:CcCCoAOMT1(cDNA于pcccl15a11)
<400>前序列串:
gtctgtccaa agctccctca aactaaaaga gaaagaaaga aaaaaaaagc cccagaaatc     60
taatctccaa acaacaatta tggcccagaa tggagaagga aaggatagcc aaaatctcag    120
gcatcaagaa gtaggccaca aaagccttct gcaaagtgat gcactctacc agtacatcct    180
ggaaaccagc gtgtatccaa gagagccaga gcccatgaaa gagctgagag aactgacagc    240
aaagcatcca tggaatatta tgactacatc tgctgatgaa gggcagttct tgaacatgat    300
tatcaagttg atcaatgcca agaaaaccat ggagattgga gtttacactg gttactcgct    360
tctggctaca gctctcgctc ttccagaaga tgggaagata ttggccatgg atattaacag    420
agaaaactac gaattgggtc tgcccgtgat cgaaagggct ggtgtgtccc ataaaattga    480
cttcagagaa ggccctgctt tgccagtgct tgatgagttg attgaagatg acaagaacca    540
tggaagtttt gatttcatct tcgtggatgc tgacaaggac aactatctca actaccacaa    600
gaggataatc gagttggtca aggttggggg aatgattggg tacgacaaca ccctatggaa    660
cggctccgtg gtggccccac cagatgctcc aatgaggaag tacgtgaggt actacaggga    720
cttcgtcttg gagctcaaca aagccctggc cgctgatccc aggatcgaga tctgcatgct    780
ccccgttggc gacggtatca ccctgtgccg ccgcgtcagc taattaattt ccctactaaa    840
cccctgcgga aagttgggaa tcaaatgcaa atgaaaaata gcccaacacc tacttctttt    900
gcttcctcct cttttttgtt tttgggaccc tttgtatttt actactgcta tttgtttatt    960
ctgtgggaca cgctgttata tttgtaattt tctttgtact gagaataatt attactatat   1020
gaatctccct gtttacggca actagcaagg actagttgct tttaaaaaaa aaaaaaaaaa   1080
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa   1140
aaaa                                                                1144
序列(SEQ ID NO:7)
--------
<213>微生物名称:阿拉比卡咖啡
<212>类型:DNA
<211>长度:713
    序列名称:CaCCoAOMT-L1(cDNA于pNT8)
特征
-------
序列:CaCCoAOMT-L1(cDNA于pNT8):
<221>关键特征:CDS
<222>位置从:1
<222>位置到:690
    其它信息:bp 1到690=完全ORF
    CDSJoin:No
自定义密码子
------------
序列名称:CaCCoAOMT-L1(cDNA于pNT8)
<400>前序列串:
atggaaaaca agggattgtt gcagagtagg gaactctatc agtacctcct ggagactagt     60
gtctatccac atgaactgca gcctctcaag gagctaaggg atgttactgc aagtcatccg    120
tgggccacta tggcaactgc cccagatgct ggtcagttga ttgccatgct cttgaaacta    180
ataagtgcca aaaagacaat agagattggt gtctttactg gatactccct actgcttact    240
gcccttacaa taccagatga tggcaggatt gtagcaattg accagaacag agatacatat    300
gagatagggc tgccaattat aagaaaagct gcagttgagc ataagatcga cttcattgag    360
tccgaggctc ttccagttct tgataaactc cttgaagaaa atcttaacca tgaagccttt    420
gactttgctt tcgttgatgc ggacaaatta aattatctga agtaccatga gaaactgttg    480
aaattgttaa agcttggtgg aatagttgta tacgacaaca cactttgggg aggattggtg    540
gccttgccgg aagaatctgt ggctgaggaa atgaaagcag gcaggcattt cacaattgag    600
ttcaacaaat tgctagctgc tgatacccga gttcaaatat cccaggttcc tctgggtgat    660
gggattacta tttgtaagcg tctccactaa atcttatgct ggagtactta ctt           713
序列(SEQ ID NO:8)
--------
<213>微生物名称:卡尼福拉咖啡
<212>类型:DNA
<211>长度:727
    序列名称:CcCCoAOMT-L2(cDNA于pNT4)
特征
-------
序列:CcCCoAOMT-L2(cDNA于pNT4):
<221>关键特征:CDS
<222>位置从:1
<222>位置到:717
    其它信息:bp 1到717=完全ORF
    CDSJoin:No
自定义密码子
------------
序列名称:CcCCoAOMT-L2(cDNA于pNT4)
<400>前序列串:
atggccaagg aaggaggttc taaaatgaag acaattctcc agagtgaggc cctccagaag     60
tacatcttga atactagcac atacccaaaa gagcatgaac aactgaagga gctaagagaa    120
gagactgcca ggaaatatgg tgccagggct attataggtg tgccacctga tgaggggctc    180
ttcctgtcta tgtttttgaa agtaatgaat gccaagaaga cactggagat tggtgttttt    240
actggctatt ctcttcttac tactgctctt gcacttcctg atgatggcca gatagttgca    300
atagaccctg atcaaggagc atttgaagtt ggtctgaaat tcatcaagaa agctggtgtg    360
gagaacaaaa tcaaattcat caaatcagat ggcatttctg ctctaaatga tttgttgaac    420
aatgaagcta gtgaagcaac attcgacttt gcatttgtgg atgcagacaa gccaagctac    480
atccagtacc atgaacaact aataaagctg gtgaagattg gaggaattat cgcttacgat    540
aatactctat acggtggata tgttgtcagt gaagaaattg aaatgcacga aggatccact    600
gtcaacagaa aagccatcat acaattcaac aactatatag cctcggatcc gcgagttgag    660
atctctcagg ttcctatagg agatggtgtt acattgtgta ggcgcatcat cgcttagctg    720
acatgat                                                              727
序列(SEQ ID NO:9)
--------
<213>微生物名称:卡尼福拉咖啡
<212>类型:PRT
<211>长度:434
    序列名称:CcHCT(蛋白质由pML1中的cDNA编码):
<400>前序列串:
MKIEVKESTM VRPAQETPGR NLWNSNVDLV VPNFHTPSVY FYRPTGSSNF FDAKVLKDAL     60
SRALVPFYPM AGRLKRDEDG RIEIECNGEG VLFVEAESDG VVDDFGDFAP TLELRRLIPA    120
VDYSQGISSY ALLVLQVTYF KCGGVSLGVG MRHHAADGFS GLHFINSWSD MARGLDVTLP    180
PFIDRTLLRA RDPPQPQFQH IEYQPPPALK VSPQTAKSDS VPETAVSIFK LTREQISALK    240
AKSKEDGNTI SYSSYEMLAG HVWRCACKAR GLEVDQGTKL YIATDGRARL RPSLPPGYFG    300
NVIFTATPIA IAGDLEFKPV WYAASKIHDA LARMDNDYLR SALDYLELQP DLKALVRGAH    360
TFKCPNLGIT SWVRLPIHDA DFGWGRPIFM GPGGIAYEGL SFILPSPTND GSMSVAISLQ    420
GEHMKLFQSF LYDI                                                      434
序列(SEQ ID NO:10)
--------
<213>微生物名称:阿拉比卡咖啡
<212>类型:PRT
<211>长度:434
    序列名称:CaHCT(蛋白质由pML5中的cDNA编码)
<400>前序列串:
MKIEVKESTM VRPAHETPRR NLWNSNVDLV VPNFHTPSVY FYRPTGSSNF FDAKVLKDAL     60
SRALVPFYPM AGRLKRDEDG RIEIECNGEG VLFVEAESDG VVDDFGDFAP TLELRRLIPA    120
VDYSQGISSY ALLVLQVTYF KCGGVSLGVG MQHHAADGFS GLHFINSWSD MARGLDVTLP    180
PFIDRTLLRA RDPPQPQFQH IEYQPPPTLK VSPQTAKSDS VPETAVSIFK LTREQISALK    240
AKSKEDGNTI SYSSYEMLAG HVWRCACKAR GLEVDQGTKL YIATDGRARL RPSLPPGYFG    300
NVIFTATLIA IAGDLEFKPV WYAASKIHDA LARMDNDYLR SALDYLELQP DLKALVRGAH    360
TFKCPNLGIT SWVRLPIHDA DFGWGRPIFM GPGGIAYEGL SFILPSPTND GSMSVAISLQ    420
GEHMKLFQSF LYDI                                                      434
序列(SEQ ID NO:11)
--------
<213>微生物名称:卡尼福拉咖啡
<212>类型:PRT
<211>长度:430
    序列名称:CcHQT(蛋白质由pML2中的cDNA编码)
<400>前序列串:
MKITVKETAM VRPAQPTPTK RLWNSNLDLL VARIHILTVY FYKPNGSANF FDTRYLKEAL     60
SNVLVSFYPM AGRLARDEEG RIEIDCNGEG VLFVEAESDS SVDDFGDFAP SLELRRLIPT    120
VDCSGDISSY PLVIFQVTRF KCGAAALGAG VQHNLSDGVS SLHFINTWSD IARGLTIAVP    180
PFIDRTLIRA RDPPVPVFEH VEYYPPPQLK SDSRIQELKT GPRASTTAVL KITPEQLSQL    240
KAKANNEGST YEILAAHIWR TACKARGLTN DQSTKLYVAT DGRSRLIPPL PPGYLGNVVF    300
TATPIAESSN LQSEPLTNSA KRIHNALARM DNDYLRSALD YLEIQPDLSA LVRGPRHFAS    360
PNLNINSWTR LPFHDADFGW GRPIHIGPAI ILYEGTVYVL PSPGKDRTLS LAVCLDADHM    420
PLFQRFLYDF                                                           430
序列(SEQ ID NO:12)
--------
<213>微生物名称:阿拉比卡咖啡
<212>类型:PRT
<211>长度:430
    序列名称:CaHQT(蛋白质由pML3中的cDNA编码)
特征
-------
序列:CaHQT(蛋白质由pML3中的cDNA编码):
<221>关键特征:MISC_特征
<222>位置从:272
<222>位置到:272
    其它信息:未知氨基酸(X)
    CDSJoin:No
<400>前序列串:
MKITVKETAM VRPAQPTPTK RLWNSNLDLL VARIHILTIY FYKPNGSANF FDTRVLKEAL     60
SNVLVSFYPM AGRLARDEEG RIEIDCNGEG VLFVEAESDS SVDDFGDFAP SLELRRLIPT    120
VDCSGDISSY PLVIFQVTRF KCGAAALGAG VQHNLSDGVS SLHFINTWSD IARGLTIAVP    180
PFIDRTLIHA RDPPVPVFEH VEYYPPPQLK SDSRIQELKT GPRASTTAVL KITPEQLSQL    240
KAKANNEGST YEILAAHIWR TACKARGPTN DXSTKLYVAT DGRSRLIPPL PPGYLGNVVF    300
TATPIAESSD LQSEPLTNSA KRIHNALARM DNDYLRSALD YLEIQPDLSA LVRGPRHFAS    360
PNLNINSWTG LPFHDADFGW GRPIHIGPAI ILYEGTVYVL PGPGKDRTLS LAVCLDADHM    420
PLFQKFLYDF                                                           430
序列(SEQ ID NO:13)
--------
<213>微生物名称:卡尼福拉咖啡
<212>类型:PRT
<211>长度:508
    序列名称:CcC3H(蛋白质由pcccl20d1O中的cDNA编码)
<400>前序列串:
MALLLILLPV AFIFLAYSLY ERLRFKLPPG PRPKPVVGNI YDIKPVRFKC YAEWSKLYGP     60
IFSVYFGSQL NTVVNTAELA KEVLKDNDQQ LADRYRSRPS ARMSRNGQDL IWADYGPHYV    120
KVRKLCNLEL FTPKRLEGLR PLREDEVTAM VDSIFKDCTK PENKGKSLLM RNYLGSVAFN    180
NITRLTFGKR FMNSEGVVDE QGQEFKGIVS NGIRIGAKLS VADHIPWLRW MFVGENEDLD    240
KHNARRDKLT RMIMEEHTLA RQKSGNTKQH FVDALLTLQK QYELSDDTVI GLLWDMITAG    300
MDTTTISVEW AMAELVKNPR VQQKAQEELD RVIGSDRIMT EADFAKLPYL QCVAKEALRL    360
HPPTPLMLPH RANANVKIGG YDIPKGSIVH VNVWAIARDP AAWKNPLEFR PERFLEEDVD    420
IKGHDYRLLP FGAGRRICPG AQLALNLVTS MLGHLLHHFT WSPPPGVRPE EIDLEESPGT    480
VTYMRTPLQA VATPRLPAHL YNRVPVEL                                       508
序列(SEQ ID NO:14)
--------
<213>微生物名称:卡尼福拉咖啡
<212>类型:PRT
<211>长度:247
     序列名称:CcCCoAOMT1(蛋白质由pcccl15a11中的cDNA编码)
<400>前序列串:
MAQNGEGKDS QNLRHQEVGH KSLLQSDALY QYILETSVYP REPEPMKELR ELTAKHPWNI     60
MTTSADEGQF LNMIIKLINA KKTMEIGVYT GYSLLATALA LPEDGKILAM DINRENYELG    120
LPVIERAGVS HKIDFREGPA LPVLDELIED DKNHGSFDFI FVDADKDNYL NYHKRIIELV    180
KVGGMIGYDN TLWNGSVVAP PDAPMRKYVR YYRDFVLELN KALAADPRIE ICMLPVGDGI    240
TLCRRVS                                                              247
序列(SEQ ID NO:15)
--------
<213>微生物名称:阿拉比卡咖啡
<212>类型:PRT
<211>长度:229
     序列名称:CaCCoAOMT-L1(蛋白质由pNT8中的cDNA编码)
<400>前序列串:
MENKGLLQSR ELYQYLLETS VYPHELQPLK ELRDVTASHP WATMATAPDA GQLIAMLLKL     60
ISAKKTIEIG VFTGYSLLLT ALTIPDDGRI VAIDQNRDTY EIGLPIIRKA AVEHKIDFIE    120
SEALPVLDKL LEENLNHEAF DFAFVDADKL NYLKYHEKLL KLLKLGGIVV YDNTLWGGLV    180
ALPEESVAEE MKAGRHFTIE FNKLLAADTR VQISQVPLGD GITICKRLH                229
序列(SEQ ID NO:16)
--------
<213>微生物名称:卡尼福拉咖啡
<212>类型:PRT
<211>长度:238
     序列名称:CcCCoAOMT-L2(蛋白质由pNT4中的cDNA编码)
<400>前序列串:
MAKEGGSKMK TILQSEALQK YILNTSTYPK EHEQLKELRE ETARKYGARA IIGVPPDEGL     60
FLSMFLKVMN AKKTLEIGVF TGYSLLTTAL ALPDDGQIVA IDPDQGAFEV GLKFIKKAGV    120
ENKIKFIKSD GISALNDLLN NEASEATFDF AFVDADKPSY IQYHEQLIKL VKIGGIIAYD    180
NTLYGGYVVS EEIEMHEGST VNRKAIIQFN NYIASDPRVE ISQVPIGDGV TLCRRIIA      238

Claims (41)

1.从咖啡分离的核酸分子,其具有类苯基丙烷途径酶的编码序列,所述酶选自羟基肉桂酰-辅酶A莽草酸酯/奎尼酸酯羟基肉桂酰转移酶、羟基肉桂酰-辅酶A奎尼酸酯羟基肉桂酰转移酶、(对)-香豆酰3’羟化酶和咖啡酰-辅酶A3-氧位-甲基转移酶。
2.权利要求1的核酸分子,其中该编码序列编码羟基肉桂酰-辅酶A莽草酸酯/奎尼酸酯羟基肉桂酰转移酶。
3.权利要求2的核酸分子,其中羟基肉桂酰-辅酶A莽草酸酯/奎尼酸酯羟基肉桂酰转移酶具有与SEQ ID NO:9或SEQ ID NO:10的同一性大于86.9%的氨基酸序列。
4.权利要求3的核酸分子,其中羟基肉桂酰-辅酶A莽草酸酯/奎尼酸酯羟基肉桂酰转移酶具有包含SEQ ID NO:9或SEQ ID NO:10的氨基酸序列。
5.权利要求2的核酸分子,其中该编码序列与SEQ ID NO:1或SEQID NO:2的同一性大于78.5%。
6.权利要求5的核酸分子,其中该编码序列包含SEQ ID NO:1或SEQID NO:2。
7.权利要求1的核酸分子,其中该编码序列编码羟基肉桂酰-辅酶A奎尼酸酯羟基肉桂酰转移酶。
8.权利要求7的核酸分子,其中羟基肉桂酰-辅酶A奎尼酸酯羟基肉桂酰转移酶具有的氨基酸序列与SEQ ID NO:11或SEQ ID NO:12的同一性大于78.1%。
9.权利要求8的核酸分子,其中羟基肉桂酰-辅酶A奎尼酸酯羟基肉桂酰转移酶具有包含SEQ ID NO:11或SEQ ID NO:12的氨基酸序列。
10.权利要求7的核酸分子,其中该编码序列与SEQ ID NO:3或SEQID NO:4的同一性大于72.1%。
11.权利要求10的核酸分子,其中该编码序列包含SEQ ID NO:3或SEQ ID NO:4。
12.权利要求1的核酸分子,其中该编码序列编码(对)-香豆酰3’羟化酶。
13.权利要求12的核酸分子,其中(对)-香豆酰3’羟化酶具有与SEQ IDNO:13的同一性大于82.9%的氨基酸序列。
14.权利要求13的核酸分子,其中(对)-香豆酰3’羟化酶具有包含SEQID NO:13的氨基酸序列。
15.权利要求12的核酸分子,其中该编码序列与SEQ ID NO:5的同一性大于69.4%。
16.权利要求15的核酸分子,其中该编码序列包含SEQ ID NO:5。
17.权利要求1的核酸分子,其中该编码序列编码咖啡酰-辅酶A3-氧位-甲基转移酶。
18.权利要求17的核酸分子,其中咖啡酰-辅酶A3-氧位-甲基转移酶具有与SEQ ID NO:14、SEQ ID NO:15或SEQ ID NO:16的同一性大于86.3%的氨基酸序列。
19.权利要求18的核酸分子,其中咖啡酰-辅酶A3-氧位-甲基转移酶具有包含SEQ ID NO:14、SEQ ID NO:15或SEQ ID NO:16的氨基酸序列。
20.权利要求19的核酸分子,其中该编码序列包含SEQ ID NO:6、SEQID NO:7或SEQ ID NO:8。
21.权利要求1的核酸分子,其中该编码序列是基因的开放读码框。
22.由权利要求21的基因通过转录产生的mRNA分子。
23.由权利要求22的mRNA分子通过反转录产生的cDNA分子。
24.长度在8到100碱基之间的寡核苷酸,其与权利要求1的核酸分子的片段互补。
25.载体,其包含权利要求1的核酸分子的编码序列。
26.权利要求25的载体,其为表达载体,选自质粒、噬菌粒、粘粒、杆状病毒、杆粒、细菌、酵母和病毒载体组成的组。
27.权利要求25的载体,其中核酸分子的编码序列被有效连接于组成型启动子。
28.权利要求25的载体,其中核酸分子的编码序列被有效连接于诱导型启动子。
29.权利要求25的载体,其中核酸分子的编码序列被有效连接于组织特异型启动子。
30.权利要求29的载体,其中组织特异型启动子是种子特异型启动子。
31.权利要求30的载体,其中种子特异型启动子是咖啡种子特异型启动子。
32.用权利要求25的载体转化的宿主细胞。
33.权利要求32的宿主细胞,其选自植物细胞、细菌细胞、真菌细胞、昆虫细胞和哺乳动物细胞组成的组。
34.权利要求33的宿主细胞,其为植物细胞,选自咖啡、烟草、拟南芥、玉米、小麦、稻、大豆、大麦、黑麦、燕麦、高梁、苜蓿、三叶草、油菜、红花、向日葵、花生、可可、特梅提诺、马铃薯、胡椒、茄子、甜菜、胡萝卜、黄瓜、莴苣、豌豆、紫菀、秋海棠、菊、翠雀、百日草和草坪草组成的组。
35.从权利要求34的植物细胞产生的可育植物。
36.调控咖啡豆的香味或香气的方法,其包含调控咖啡种子中一种或多种类苯基丙烷途径酶的产生或活性,其中所述类苯基丙烷途径酶选自羟基肉桂酰-辅酶A莽草酸酯/奎尼酸酯羟基肉桂酰转移酶、羟基肉桂酰-辅酶A奎尼酸酯羟基肉桂酰转移酶、(对)-香豆酰3’羟化酶和咖啡酰-辅酶A3-氧位-甲基转移酶。
37.权利要求36的方法,其包括增加一种或多种类苯基丙烷途径酶的产生或活性。
38.权利要求37的方法,其包括在咖啡种子中增加一种或多种内源类苯基丙烷途径酶基因的表达。
39.权利要求37的方法,其包括向植物中引入编码类苯基丙烷途径酶的转基因。
40.权利要求36的方法,其包括减少一种或多种类苯基丙烷途径酶的产生或活性。
41.权利要求40的方法,其包括向咖啡中引入核酸分子从而抑制编码一种或多种类苯基丙烷途径酶的基因的表达。
CNA2006800458899A 2005-10-07 2006-10-10 在咖啡中编码类苯基丙烷途径酶的多核苷酸 Pending CN101326194A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US72467305P 2005-10-07 2005-10-07
US60/724,673 2005-10-07

Publications (1)

Publication Number Publication Date
CN101326194A true CN101326194A (zh) 2008-12-17

Family

ID=37943484

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2006800458899A Pending CN101326194A (zh) 2005-10-07 2006-10-10 在咖啡中编码类苯基丙烷途径酶的多核苷酸

Country Status (9)

Country Link
US (1) US8362328B2 (zh)
EP (1) EP1940868A2 (zh)
CN (1) CN101326194A (zh)
AP (1) AP2008004413A0 (zh)
AU (1) AU2006302107A1 (zh)
BR (1) BRPI0616979A2 (zh)
CA (1) CA2625350A1 (zh)
EC (1) ECSP088355A (zh)
WO (1) WO2007044751A2 (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102061301A (zh) * 2010-08-04 2011-05-18 陕西师范大学 丹参羟基肉桂酰转移酶基因序列和编码的氨基酸序列及其应用
CN102465135A (zh) * 2010-11-05 2012-05-23 中国中医科学院中药研究所 黄芩咖啡酰辅酶A-3-O-甲基转移酶(SbCCOMT2)基因及其编码产物和应用
CN105087592A (zh) * 2015-09-23 2015-11-25 山东大学 金银花hqt基因冷诱导型启动子
CN106834246A (zh) * 2016-12-30 2017-06-13 江苏省中国科学院植物研究所 石蒜科植物忽地笑细胞色素p450还原酶2及其编码基因与应用
CN108795899A (zh) * 2018-06-25 2018-11-13 黄冈师范学院 NtCCoAOMT基因在提高烟草产绿原酸中的应用
CN114317304A (zh) * 2021-12-21 2022-04-12 浙江工业大学 酿酒酵母产绿原酸工程菌株的构建方法及其应用

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012126789A1 (en) 2011-03-18 2012-09-27 Nestec S.A. Production of chlorogenic and dactylifric acid species
EP2877584A4 (en) * 2012-07-26 2016-03-30 Casa Luker S A METHODS FOR INCREASING THE PRODUCTION OF PHENOLIC COMPOUNDS FROM THEBROMA COCOA
CN110904067B (zh) * 2019-12-20 2022-08-26 中国烟草总公司郑州烟草研究院 烟草绿原酸合成基因NtHQT及其应用

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB0214406D0 (en) 2002-06-21 2002-07-31 Plant Bioscience Ltd Plant-derived transferase genes
EP2336305A3 (en) * 2002-10-16 2011-10-05 U.S. Smokeless Tobacco Company LLC Cloning of cytochrome P450 genes from Nicotiana
WO2006012594A2 (en) * 2004-07-24 2006-02-02 The Samuel Roberts Noble Foundation, Inc. Modification of lignin biosynthesis

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102061301A (zh) * 2010-08-04 2011-05-18 陕西师范大学 丹参羟基肉桂酰转移酶基因序列和编码的氨基酸序列及其应用
CN102061301B (zh) * 2010-08-04 2012-12-05 陕西师范大学 丹参羟基肉桂酰转移酶基因序列和编码的氨基酸序列及其应用
CN102465135A (zh) * 2010-11-05 2012-05-23 中国中医科学院中药研究所 黄芩咖啡酰辅酶A-3-O-甲基转移酶(SbCCOMT2)基因及其编码产物和应用
CN105087592A (zh) * 2015-09-23 2015-11-25 山东大学 金银花hqt基因冷诱导型启动子
CN106834246A (zh) * 2016-12-30 2017-06-13 江苏省中国科学院植物研究所 石蒜科植物忽地笑细胞色素p450还原酶2及其编码基因与应用
CN106834246B (zh) * 2016-12-30 2020-10-23 江苏省中国科学院植物研究所 石蒜科植物忽地笑细胞色素p450还原酶2及其编码基因与应用
CN108795899A (zh) * 2018-06-25 2018-11-13 黄冈师范学院 NtCCoAOMT基因在提高烟草产绿原酸中的应用
CN108795899B (zh) * 2018-06-25 2021-06-04 黄冈师范学院 NtCCoAOMT基因在提高烟草产绿原酸中的应用
CN114317304A (zh) * 2021-12-21 2022-04-12 浙江工业大学 酿酒酵母产绿原酸工程菌株的构建方法及其应用
CN114317304B (zh) * 2021-12-21 2024-03-15 浙江工业大学 酿酒酵母产绿原酸工程菌株的构建方法及其应用

Also Published As

Publication number Publication date
US20090158456A1 (en) 2009-06-18
CA2625350A1 (en) 2007-04-19
WO2007044751A2 (en) 2007-04-19
US8362328B2 (en) 2013-01-29
BRPI0616979A2 (pt) 2011-07-05
EP1940868A2 (en) 2008-07-09
AP2008004413A0 (en) 2008-04-30
AU2006302107A1 (en) 2007-04-19
ECSP088355A (es) 2008-06-30
WO2007044751A3 (en) 2007-11-15

Similar Documents

Publication Publication Date Title
CN101326194A (zh) 在咖啡中编码类苯基丙烷途径酶的多核苷酸
CN101213302B (zh) 咖啡油质蛋白基因和启动子
JP5158639B2 (ja) 植物の内胚乳に特異的に発現する遺伝子および該遺伝子のプロモーター、並びにそれらの利用
JP2009509509A (ja) コーヒー中のスクロース分解と関連している核酸及びタンパク質
CA2478957C (en) Homogentisate prenyl transferase (&#34;hpt&#34;) nucleic acids and polypeptides, and uses thereof
JP2004533244A (ja) TyrA遺伝子及びその使用法
JP5292094B2 (ja) コーヒー中のカロテノイド及びアポカロテノイド生合成経路の酵素をコードするポリヌクレオチド
EP2365071B1 (en) Transformed soybean plant which stores vaccine, and use thereof
JP2005204657A (ja) タンニン含量が低減された植物体の生産方法およびこれを用いて得られる植物体、並びにその利用
AU2003224730B2 (en) Generation of plants with altered oil content
DE10046462A1 (de) Verbesserte Verfahren zur Vitamin E Biosynthese
US7301071B2 (en) Method for the production of plant seed with modified fiber content and modified seed coat
JP2009511071A (ja) コーヒーのフェニルプロパノイド及びフラボノイド生合成経路酵素をコードするポリヌクレオチド
BRPI0720759A2 (pt) Produção de plantas com conteúdo alterado de óleos, proteínas ou fibras
EP1608759B1 (en) Enhanced accumulation of carotenoids in plants
JP2009511062A (ja) コーヒー中のリグニン生合成経路の酵素をコードするポリヌクレオチド
CN111448206B (zh) 源自番薯的IbOr-R96H变异体及其用途
WO2005103269A2 (en) Generation of plants with altered oil content
AU2002231513A1 (en) Method for the production of plant seed with modified fibre content and modified seed coat
MX2008004640A (en) Polynucleotides encoding phenylpropanoid pathway enzymes in coffee
CN114514321A (zh) 调节植物中的糖和氨基酸含量(sultr3)
WO2005118821A2 (en) Generation of plants with altered oil content
WO2006047159A1 (en) Generation of plants with altered oil content
MXPA05006759A (es) Generacion de plantas con contenido alterado de aceite.
KR20100006953A (ko) 벼의 발아중인 종자, 잎, 뿌리, 또는 모든 조직에서특이적으로 발현하는 유전자의 프로모터 및 전사인자

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20081217