CN101356277A - 咖啡中与半乳甘露聚糖合成有关的核酸和蛋白质 - Google Patents

咖啡中与半乳甘露聚糖合成有关的核酸和蛋白质 Download PDF

Info

Publication number
CN101356277A
CN101356277A CNA2006800381365A CN200680038136A CN101356277A CN 101356277 A CN101356277 A CN 101356277A CN A2006800381365 A CNA2006800381365 A CN A2006800381365A CN 200680038136 A CN200680038136 A CN 200680038136A CN 101356277 A CN101356277 A CN 101356277A
Authority
CN
China
Prior art keywords
sequence
coffee
gene
nucleic acid
mannosans
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2006800381365A
Other languages
English (en)
Inventor
J·G·麦卡锡
V·帕蒂尔
V·卡耶
林晨炜
S·D·坦克斯雷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nestec SA
Cornell University
Cornell Research Foundation Inc
Original Assignee
Nestec SA
Cornell University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nestec SA, Cornell University filed Critical Nestec SA
Publication of CN101356277A publication Critical patent/CN101356277A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1048Glycosyltransferases (2.4)
    • C12N9/1051Hexosyltransferases (2.4.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8242Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
    • C12N15/8243Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine
    • C12N15/8245Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine involving modified carbohydrate or sugar alcohol metabolism, e.g. starch biosynthesis
    • C12N15/8246Non-starch polysaccharides, e.g. cellulose, fructans, levans
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1048Glycosyltransferases (2.4)

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Medicinal Chemistry (AREA)
  • Nutrition Science (AREA)
  • Physics & Mathematics (AREA)
  • Cell Biology (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Tea And Coffee (AREA)
  • Polysaccharides And Polysaccharide Derivatives (AREA)

Abstract

本文中公开了从咖啡(咖啡属物种(Coffea spp.))中分离的核酸分子,其包含编码甘露聚糖合酶或半乳甘露聚糖半乳糖基转移酶的序列。还公开了使用这些多核苷酸的方法,用于基因调节和操纵咖啡植物的多糖分子,从而影响咖啡豆的提取特征和其它特征。

Description

咖啡中与半乳甘露聚糖合成有关的核酸和蛋白质
技术领域
本发明涉及农业生物技术领域。更特别的,发明涉及参与包括半乳甘露聚糖合成的多糖代谢的来自咖啡植物的酶,和编码该酶的核酸序列。
背景技术
多种出版物,包括专利、公开的申请和学术文章均在本说明书全文中予以引用。上述出版物的全部内容均以其全文引用在本文中作为参考。在说明书中没有完整阐述的引用可参见本说明书的结尾。
咖啡加工中的关键步骤是烘烤绿色种粒。烘烤步骤通常在170℃至230℃的范围内进行5至15分钟,并负责产生与咖啡饮料有关的大部分香气、风味和颜色(Yeretzian等人,2005)。根据烘烤程度,该步骤中可以降解12-40%的多糖(Redgwell等人,2002)。已经报道过烘烤步骤改变了许多复杂多糖聚合物的长度,这可以增加它们的溶解度(Redgwell等人,2002)。咖啡多糖的片段化被认为有利的影响饮料的感官特性例如口感(Illy和Viani 1995)和泡沫稳定性(Nunes等人,1997)。多糖的分解也被认为会间接的影响挥发性香气化合物的结合,因为一些复杂糖类降解产物参与烘干种粒蛋白黑素的形成,所述蛋白黑素是一类未充分定义的化合物,其构成烘干种粒干重的20%以上(Charles-Bernard等人,2005)。烘烤诱导的多糖裂解还可以增加从咖啡种粒提取的的固体量,这是对于可溶咖啡的生产具有关键性意义的性质。此外,通过与咖啡烘焙有关的美拉反应,咖啡种粒中糖类的片段化/裂解还有助于一组重要的咖啡风味和香气分子的产生(Yeretzian等人,2005)。
糖类构成了成熟的绿色咖啡种粒(绿色豆)中的很大比例。糖类组成阿拉比卡咖啡(arabica)(小果咖啡(Coffea arabica))和罗布斯塔咖啡(robusta)(中果咖啡(C.canephora))绿色种粒干重的约48-55%,其中一些处于复杂多糖的形式,同时其他形式包括游离单糖和二糖(Clifford M.N.,1985In Coffee:Botany,Biochemistry,and Production,第374页,Clifford,M.和Willson,K.编著,Croom Melm Ltd,London;Fischer,等人,2001,Carbohydrate Research,330,93-101)。已经鉴定了咖啡种粒中的基于复杂糖类的聚合物的三种主要类型。最丰富的种粒多糖是半乳甘露聚糖,据报道其代表了成熟的绿色咖啡种粒达25%的质量,即,约50%的种粒糖类。其次最丰富的多糖组是阿拉伯半乳聚糖,其构成了高达35%的绿色种粒多糖(Oosterveld等人,2003 Carbohydrate Polymers 52,285-2960)。阿拉比卡咖啡绿色种粒多糖剩余的约16%主要由纤维素和木糖聚糖组成(Oosterveld等人,2003)。
包含半纤维素的甘露聚糖由β1-4连接的甘露糖分子的主链组成,虽然在植物中广泛的发现它们,但已经认为甘露聚糖在大部分植物细胞类型的壁中是相对较小的组分(Bacic、Harris和Stone 1988;Fry 2004;Somerville等人,2004b)。一些包含胚乳的种子,例如豆科(Leguminosae)、棕榈科(Palmae),和商业上重要的咖啡属(Coffea)物种的种子,在种子胚乳细胞壁中存在相当大量的半乳甘露聚糖(Matheson 1990;Buckeridge等人,2000;Pettolino等人,2001;Redgwell等人,2002;Hanford等人,2003)。半乳甘露聚糖的特点在于甘露聚糖链具有通过(1-6)α键连接的单个半乳糖基分子。种子胚乳的半乳甘露聚糖似乎与胚乳细胞壁的次生细胞壁加厚有关(Pettolino等人,2001;Sunderland等人,2004;Somerville等人,2004a),并被认为构成成熟种子能量储备的一部分,其类似于淀粉在谷类胚乳中扮演的角色(Reid 1985)。胚乳半乳甘露聚糖已经理论化的其他功能包括促进吸涨/发芽以及保护种子胚胎免受干燥(Reid和Bewley 1979)。基于细胞壁聚合物的其他主要甘露聚糖包括葡甘露聚糖,其有一些甘露糖单元被β-1,4-连接的葡萄糖残基取代,和半乳葡甘露聚糖,其是具有α-1,6-连接半乳糖残基的葡甘露聚糖。具有低水平半乳糖的半乳葡甘露聚糖是裸子植物加厚的木质化次生细胞壁的重要成分(Lundqvist,J.等人,2002),还发现其存在于猕猴桃(彩色猕猴桃(Actinidia deliciosa))和组织培养的烟草(白花丹叶烟草(Nicotiana plumbaginifolia))细胞中(Schroder,R.等人,2001;Sims,I.等人,1997)。最近,研究表明甘露聚糖聚合物存在于被子植物模型拟南芥(Arabidopsis thaliana)的木质部分子、木薄壁组织和束间纤维的加厚次生细胞壁上(Handford等人,2003)。他们还在叶和茎加厚的表皮细胞壁中检测到甘露聚糖的显著水平,在测试的大部分其他组织中检测到甘露聚糖的较低水平,表明甘露聚糖广泛存在于拟南芥中。
尽管已知纤维素聚合物是在质膜合成的,大部分非纤维素多糖都被认为是由高尔基体制造,然后运输到细胞膜外的质外体空间(Keegstra和Raikhel 2001;Somerville,Bauer、Brininstool、Facette、Hamann、Milne、Osborne、Paredez、Persson、Raab、Vorwerk和Youngs 2005;Liepman、Wilkerson和Keegstra 2005b)。已知半乳甘露聚糖的合成涉及两种膜结合糖基转移酶:Mg++依赖的、GDP-Man依赖的(1,4)-β-D-甘露糖基转移酶或甘露聚糖合酶(MS),和Mn++依赖的、UDP-Gal依赖的甘露聚糖特异性(1,6)-α-D-半乳糖基转移酶(GMGT),并且认为上述酶非常密切的协作,从而决定半乳糖基残基沿着甘露聚糖聚合物的统计分布(Edwards、Choo、Dickson、Scott、Gridley和Reid 2004)。最近,利用甘露聚糖特异性的抗体在体外检测甘露聚糖的合成,获得了在高尔基体中合成甘露聚糖的证据,该证据进一步支持整体模型,其中半纤维素类型的多糖例如半乳甘露聚糖是在高尔基体中制造的,然后运输到细胞膜并分泌到质外体区域(Handford、Baldwin、Goubet、Prime、Miles、Yu和Dupree 2003;Somerville、Bauer、Brininstool、Facette、Hamann、Milne、Osborne、Paredez、Persson、Raab、Vorwerk和Youngs 2005)。最近,通过展示过表达或低表达百脉根(Lotus japonicus)GMGT蛋白质,导致在种子中半乳糖/甘露糖比值可预测的变化,来证明了高尔基体结合的GMGT蛋白质在合成种子胚乳半乳甘露聚糖中的重要性,以及更确切地,在控制半乳糖修饰水平中的重要性(Edwards、Choo、Dickson、Scott、Gridley和Reid 2004)。
直到最近,负责植物细胞甘露聚糖合成的基因还是未知的。第一个编码在生化上证明是甘露聚糖合酶的分离基因是瓜尔豆(Cyamopsistetragonoloba)(guar)种子的ManS(Dhugga等人,2004)。CtManS的cDNA是从瓜尔豆的三种不同种子发育阶段制备的EST文库中分离的,所述种子产生非常大量半乳甘露聚糖。通过搜索与植物CelA(产生β-1,3-葡聚糖的纤维素合酶)和Csl(纤维素合酶-样蛋白质)具有强相似性的序列,鉴定CtManS相关的EST。Csl基因与CelA基因具有显著的相似性,以前曾经被建议作为在半纤维素如半乳甘露聚糖合成中涉及的酶的候选基因(Cutler和Somerville 1997;Richmond和Somerville 2000;Hazen等人,2002)。该候选甘露聚糖合酶EST在各个瓜尔豆种子文库中的多度对应于在各阶段测量的甘露聚糖合酶生化活性的水平,提示这些EST代表甘露聚糖合酶。当过表达CtManS cDNA序列时,在一般没有可检测的甘露聚糖合酶活性的大豆体细胞胚胎中表现出显著的甘露聚糖合酶活性,表明假设的瓜尔豆甘露聚糖合酶cDNA编码功能性的酶(Dhugga等人,2004)。发现功能性的重组酶位于高尔基体。在拟南芥基因组中,有25种以上的基因被标注为Csl基因,根据它们的序列同源性再分成家族。最近,已经对来源于多种拟南芥Csl基因序列的重组蛋白质进行了功能性评估,并确定CslA基因家族的一些成员编码具有β-甘露聚糖合酶活性的蛋白质(Liepman等人,2005)。
只有很少的关于咖啡中甘露聚糖相关聚合物的新陈代谢的有效资料。已经获得了在咖啡种粒中发现的编码α-半乳糖苷酶的一些高度相关的cDNA,该基因在发育种粒中的表达表明,该基因是在胚乳形成和扩展期间(约22-27WAF(受精后周数)被诱导的,并且还在叶、花、合子胚中检测到表达,并在根中检测到微弱的表达(Marraccini等人,2005))。咖啡种粒半乳甘露聚糖的半乳糖/甘露糖比值从种粒发育初期阶段(11WAF;受精后周数)的约1∶2至1∶7的比值降低至31WAF接近成熟时的1∶7至1∶40的比值(Redgwell等人,2003)。该信息,与上述α-半乳糖苷酶发育的表达数据一起产生理论,即,从约21-26WAF开始持续至种粒成熟的咖啡种粒半乳甘露聚糖的半乳糖含量降低中可以直接涉及该特殊的α-半乳糖苷酶基因产物(Redgwell等人,2003)。在山扁豆(望江南决明(Senna occidentalis))的发育种子中发现了该模型的证据,其中发现α-半乳糖苷酶活性的显著增加与种子半乳甘露聚糖的半乳糖含量的降低相符(Edwards等人,1992)。支持半乳糖含量降低涉及α-半乳糖苷酶的其它证据,是随后在发育的瓜尔豆种子中借助种子特异性启动子表达山扁豆α-半乳糖苷酶时(Joersbo等人,2001)获得的。瓜尔豆种子一般有高水平的半乳甘露聚糖,其具有很高的半乳糖/甘露聚糖比值,但是,从表达山扁豆α-半乳糖苷酶的植物产生的瓜尔豆种子却显示出半乳糖/甘露糖比值水平在被修饰的瓜尔豆种子中的显著降低。从发芽的咖啡种粒中还分离出两种编码不同的内-β甘露聚糖酶的cDNA(manA和manB)(Marraccini等人,2001)。其相应的基因在发育种粒中不表达,但是在发芽期间都表达,在吸涨后10-15天开始检测转录产物。该观察提示,这两个甘露聚糖酶与发芽期间半乳甘露聚糖的裂解有关,导致游离糖的释放,然后,所述糖既作为能量来源又作为发芽种子的还原性碳发挥作用。检测manA的表达,在叶、体细胞胚、花芽或根中没有检测到它的表达(Marraccini等人,2001)。
除了半乳甘露聚糖在咖啡种粒中的多度,以及该酶参与半乳甘露聚糖合成的暗示的重要性,在咖啡中几乎没有这些基因的有效信息。因此,需要鉴别、分离和表征在咖啡半乳甘露聚糖生物合成途径中涉及的酶、基因和遗传调控元件。此类信息将能够以赋予所希望的与改变半乳甘露聚糖生产有关的表型优势为目标,对半乳甘露聚糖合成进行遗传操作。
发明概述
发明一个方面的特征是从咖啡属物种分离的核酸分子,其包括编码半乳甘露聚糖合成酶的编码序列,其可以是半乳糖基转移酶或甘露聚糖合酶。在一些实施方案中,甘露聚糖合酶包括具有氨基酸序列QHRWS的保守结构域。在其它实施方案中,甘露聚糖合酶包括与SEQ ID NO:4-6中任一项具有超过约75%同一性的氨基酸序列,优选的包括SEQ ID NO:4-6中任一项。具体的,编码序列包括SEQ ID NO:2或SEQ ID NO:3。
在其它实施方案中,酶是半乳糖基转移酶,其具有与胡卢巴半乳糖基转移酶或百脉根(Lotus japonicus)半乳糖基转移酶至少约54%的氨基酸序列同一性。在其它实施方案中,半乳糖基转移酶包括与SEQ ID NO:15-18中任一项有超过约75%同一性的氨基酸序列,优选的包括SEQ IDNO:15-18中的任一项。具体的,编码序列包括SEQ ID NO:11-14中的任一项。
在一些实施方案中,编码序列是基因的可读框,或基因转录产生的mRNA分子,或mRNA分子逆转录产生的cDNA分子。
发明另一个方面的特征是长度在8和100个碱基之间的寡核苷酸,其与上述核酸分子的片段是互补的。
发明的另一个方面的特征是包含上述核酸分子的编码序列的载体。载体可以是选自质粒、噬菌粒、黏粒、杆状病毒、杆粒、细菌载体、酵母载体和病毒载体中的表达载体。在一些实施方案中,核酸分子的编码序列有效的连接组成型启动子。可选的,有效的连接诱导型启动子。在另一个替代方案中,核酸分子的编码序列有效的连接组织特异性启动子,在一些实施方案中,其可以是种子特异性启动子,更特别的是咖啡种子特异性启动子。
发明的另一个方面的特征是用上述载体转化的宿主细胞。宿主细胞可以选自植物细胞、细菌细胞、真菌细胞、昆虫细胞和哺乳动物细胞。还提供由转化的植物细胞产生的能育植物。
发明的另一个方面的特征是调节咖啡豆固体物质的可提取性的方法,包括调节咖啡种子内半乳甘露聚糖合成酶的产生或活性。具体地,酶是半乳糖基转移酶或甘露聚糖合酶,或其组合。在一个实施方案中,增加半乳甘露聚糖合成酶的产生或活性,例如,通过增加编码酶的基因的表达,或者通过引入编码酶的转基因。在另一个实施方案中,减少半乳甘露聚糖合成酶的产生或活性,例如,通过干扰编码酶的基因的表达。
发明的其它特征和优势将通过参考下述的附图、详细说明和实施例理解。
附图说明
图1.半乳甘露聚糖聚合物的结构示意图。
图2.分离和表征编码中果咖啡和小果咖啡甘露聚糖合酶的核酸的完整编码序列。
(A)鉴定中果咖啡甘露聚糖合酶-编码CcManS和小果咖啡-编码甘露聚糖合酶CaManS完整ORF序列使用的克隆的概述。获得四个部分cDNA克隆,其覆盖CcManS的完整ORF(参见实施例):两个5′RACE产物,包含CcManS的5′端编码序列的pVC2和pVC3,和两个部分cDNA克隆(pcccs46w24c19和pcccs46w16i11),其包含CcManS剩余的3′端。cDNA克隆pVC4、pVC6和pVC7包含PCR扩增序列,其包含编码咖啡甘露聚糖合酶的完整可读框(注意:pVC4在1118bp处包含在PCR扩增步骤期间错误引入的终止密码子,见实施例的讨论)。注释如下:pcccs46w16i11=中果咖啡的cDNA克隆cccs46w16i11的插入序列(克隆中去掉了两个内含子和3′端非编码序列)(SEQ ID NO:7);pcccs46w24c19=中果咖啡的cDNA克隆cccs46w24c19的插入序列(SEQ ID NO:8);pVC2(SEQ ID NO:9)=中果咖啡罗布斯塔变种(Coffea canephora,var Robusta)(BP409)的第一RACE片段,被克隆到pCR-4-Topo中;pVC3(SEQ ID NO:10)=第二RACE片段,被克隆到pCR-4-Topo中;pVC4(SEQ ID NO:1)=中果咖啡罗布斯塔变种(BP409)多核苷酸的甘露聚糖合酶的全长扩增,其被克隆到pCR-4-Topo中(该片段在ORF中具有终止密码子);pVC6(SEQ ID NO:2)=CcManS的全长扩增,中果咖啡罗布斯塔变种(BP409)的编码甘露聚糖合酶的多核苷酸,其被克隆到pCR-4-Topo中;pVC7(SEQ ID NO:3)=CaManS的全长扩增,小果咖啡阿拉比卡变种(Coffea Arabica,var.Arabica)(T2308)的编码甘露聚糖合酶的多核苷酸,其被克隆到pCR-4-Topo中。
(B)使用CLUSTALW程序(Lasergene程序包,DNASTAR公司)进行所有的CcManS(SEQ ID NO:1和SEQ ID NO:2)和CaManS(SEQ ID NO:3)的序列的比对,并且手动优化。pVC4序列中圈出的核苷酸标记了在该克隆的ORF中导致终止密码子的突变碱基。但是很明显,其它三个编码该区域的cDNA序列(都源自独立的PCR反应的),都在该位置具有导致预期蛋白质的A取代T。因此,我们认为pVC4中的该T是由于异常的PCR或克隆导致的。灰色序列匹配pVC6。内含子序列用这类序列上存在的黑线标记。在pVC3序列第325位的缺失导致可读框的改变,并被认为是在该序列的RT-PCR克隆期间产生的错误。
图3.显示中果咖啡的CcManS的完整蛋白质序列(SEQ ID NO:5)。该蛋白质序列是根据pVC6(SEQ ID NO:2)编码的cDNA序列推断的。
图4.咖啡甘露聚糖合酶序列与其它甘露聚糖合酶序列的蛋白质序列的比对。使用CLUSTAL W将从pVC4和pVC6序列推断的CcManS蛋白质序列(SEQ ID NO:5)以及从pVC7序列推断的CaManS蛋白质序列(SEQID NO:6)与NCBI数据库中可用的其它植物甘露聚糖合酶蛋白质进行比对,然后进行手动优化步骤(注意:用红色圆圈标记在pVC4第345位的终止密码子)。用*标记或者框标记报道的在β-糖基转移酶中保守的区域(如在Dhugga等人,2004中)。用灰色匹配标记的氨基酸代表在该位置发现的最经常被发现的氨基酸。使用的序列登录号是生物化学表征的CtManS(瓜儿豆,AAR23313,SEQ ID NO:21)、AtManS(拟南芥(Arabidpsis thaliana),CAB82941,SEQ ID NO:22)和IbManS(野薯(Iomoea trifida),AAQ62572;SEQ ID NO:23)。
图5.显示单基因(unigene)122620(SEQ ID NO:11)的蛋白质序列(SEQID NO:15)与两个生化表征的植物GMGT序列的序列比对。使用Clustal W将单基因122620(CcGMGT1)的部分ORF与百脉根GMGT(登录号AJ567668,SEQ ID NO:24)和胡卢巴(Trigonellafoenum-graecum)GMGT(登录号AJ245478,SEQ ID NO:25;注意是部分cDNA)的蛋白质序列进行比对。在两个或多个序列中发现的氨基酸是灰色的。
图6.显示单基因122567(SEQ ID NO:12)的蛋白质序列(SEQ ID NO:16)与两个生化表征的植物GMGT序列的序列比对。使用Clustal W将单基因122567(CcGMGT2)的部分ORF与百脉根GMGT(登录号AJ567668,SEQID NO:24)和胡卢巴GMGT(登录号AJ245478,SEQ ID NO:25;注意是部分cDNA)的蛋白质序列进行比对。在两个或多个序列中发现的氨基酸是灰色的。
图7.编码咖啡GMGTase 1部分或完整ORF序列数据的三种克隆的示意图。pcccs46w8o23(SEQ ID NO:19)是中果咖啡EST文库克隆,pVC10(SEQ ID NO:20)包含分离的5′RACE序列,pVC11(SEQ ID NO:13)包含含有阿拉比卡咖啡GMGTase 1完整多肽序列的阿拉比卡咖啡基因组片段。
图8.pcccs46w8o23(SEQ ID NO:19)、pVC10(SEQ ID NO:20)和pVC11(SEQ ID NO:13)的GMGTase 1DNA序列与计算机芯片生成的单基因#122620序列(SEQ ID NO:11)的比对。比对使用CLUSTALW并进行手动调整。
图9.CaGMGTase 1蛋白质序列(SEQ ID NO:17)与GenBank公众数据库中发现的同源性最高的蛋白质序列的比对。使用CLUSTALW进行比对。登录号:CAB52246:[胡卢巴]α半乳糖基转移酶(SEQ ID NO:26);CAI11452:[马铃薯(Solanum tuberosum)]α-6-半乳糖基转移酶(SEQ IDNO:27);CAI11453:[本氏烟草(Nicotiana benthamiana)]α-6-半乳糖基转移酶(SEQ ID NO:28);CAI11454:[蒺藜苜蓿(Medicago truncatula)]α-6-半乳糖基转移酶(SEQ IDNO:29);ABE79594:[蒺藜苜蓿]半乳糖转移酶(SEQ IDNO:30);CAI79402:[瓜儿豆]半乳甘露聚糖半乳糖基转移酶(SEQ IDNO:31);CAI79403:[望江南决明(Senna occidentalis)]半乳甘露聚糖半乳糖基转移酶(SEQ IDNO:32);CAD98924:[光叶百脉根(Lotuscorniculatus var.japonicus)]半乳甘露聚糖半乳糖基转移酶(SEQIDNO:33)。
图10.使用CLUSTALW将单基因#_122567的GMGTase 2DNA序列(SEQ ID NO:12)与中果咖啡GMGTase 2cDNA克隆pcccl26f9的DNA序列(CcGMGTase 2;SEQ ID NO:14)进行比对。
图11.CcGMGTase 2(SEQ ID NO:18)的蛋白质序列与CaGMGTase1(SEQ ID NO:17)和GenBank公众数据库中发现的同源性最高的蛋白质序列进行的比对。使用CLUSTAL W进行比对。登录号:CAB52246:[胡卢巴]α半乳糖基转移酶(SEQ ID NO:26);CAI11452:[马铃薯]α-6-半乳糖基转移酶(SEQ ID NO:27);CAI11453:[本氏烟草]α-6-半乳糖基转移酶(SEQ ID NO:28);CAI11454:[蒺藜苜蓿]α-6-半乳糖基转移酶(SEQ IDNO:29);ABE79594:[蒺藜苜蓿]半乳糖基转移酶(SEQ ID NO:30);CAI79402:[瓜儿豆]半乳甘露聚糖半乳糖基转移酶(SEQ ID NO:31);CAI79403:[望江南决明]半乳甘露聚糖半乳糖基转移酶(SEQ IDNO:32);CAD98924:[光叶百脉根]半乳甘露聚糖半乳糖基转移酶(SEQID NO:33)。
图12.CaGMGT1在中果咖啡和小果咖啡的多种组织中的定量RT-PCR表达数据。
例示性实施方案的详细描述
定义:
在说明书和权利要求书中使用了涉及本发明的生物分子及其他方面的多个术语。除非在本文中被特殊定义,术语被认为具有它们在分子生物学和生物化学领域的习惯含义。
″分离″意指″依靠人力″从自然状态改变。如果组合物或物质存在于自然界,倘若其已经被改变或已经从其原始环境移去,则它已被″分离″。例如,当在本文中使用该术语时,天然的存在于活的植物或动物中的多核苷酸或多肽不是″分离的″,但是与它的自然状态共存的物质分离的相同多核苷酸或多肽是″分离的″。
″多核苷酸″,也被称为″核酸分子″,泛指任何多聚核糖核苷酸或多聚脱氧核糖核苷酸,其可以是未修饰的RNA或DNA,或者修饰的RNA或DNA。″多核苷酸″包括,但不限于单链和双链DNA,作为单链和双链区域混合物的DNA,单链和双链RNA和作为单链和双链区域混合物的RNA,包含DNA和RNA的杂合分子(所述DNA和RNA可以是单链或更通常地,双链或单链和双链区域的混合物)。此外,″多核苷酸″指包含RNA或DNA或RNA和DNA两者的三链区域。术语多核苷酸还包括,包含一个或多个修饰碱基的DNA或RNA,以及出于稳定性或其它理由主链被修饰的DNA或RNA。″修饰″碱基包括,例如三苯甲基化的碱基和稀有碱基如次黄苷。可以对DNA和RNA进行多种修饰;因此,多核苷酸包括在自然界中常见的多核苷酸的化学的、酶促的或代谢的修饰形式,以及病毒和细胞的DNA和RNA特征的化学形式。″多核苷酸″还包括相对短的多核苷酸,通常被称为寡核苷酸。
″多肽″指任何包含两个或多个通过肽键或修饰的肽键彼此连接的氨基酸的肽或蛋白质,即,肽等构物。″多肽″既指短链,通常称为肽、寡肽或寡聚物,又指较长的链,泛指蛋白质。多肽可以包含除20种基因编码的氨基酸以外的氨基酸。″多肽″包括通过自然过程例如翻译后加工,或者通过本领域为熟知的化学修饰方法修饰的氨基酸序列。该修饰详细的描述在基础课本中,更详细的描述在专题论文以及长篇研究文献中。修饰可以发生在多肽任何地方,包括肽主链、氨基酸侧链和氨基或羧基末端。可以理解,在给定多肽的一些位点可以存在相同或不同程度的同类型修饰。而且,给定多肽可以包含多种类型的修饰。由于泛素化作用,多肽可以是分支的,也可以是有或无分支的环状的。环状的、分支的和分支环状的多肽可以是天然翻译后加工的结果,或者可以是用合成方法制造的。修饰包括乙酰化作用、酰化作用、ADP-核糖基化作用、酰胺化作用、黄素的共价连接、血红素部分的共价连接、核苷酸或核苷酸衍生物的共价连接、脂类或脂类衍生物的共价连接、磷脂酰肌醇的共价连接、交联、环化、二硫键形成、脱甲基作用、共价交联的形成、胱氨酸的形成、焦谷氨酸的形成、甲酰化、γ-羧化作用、糖基化作用、GPI锚形成、羟基化、碘化作用、甲基化、豆蔻酰化、氧化、蛋白水解的加工、磷酸化、异戊二烯化、外消旋化、硒化、硫酸盐化作用、转运-RNA介导的氨基酸向蛋白质的添加例如精氨酰化和泛素化。参见例如,Proteins-Structure and Molecular Properties,第2版,T.E.Creighton,W.H.Freeman和Company,New York,1993以及Wold,F.,Posttranslational Protein Modifications:Perspectives andProspects,Posttranslational Covalent Modification of Proteins中的第1-12页,B.C.Johnson编著,Academic Press,New York,1983;Seifter等人,″Analysis for Protein Modifications and Nonprotein Cofactors″,MethEnzymol(1990)182:626-646以及Rattan等人,″Protein Synthesis:Posttranslational Modifications and Aging″,Ann NY Acad Sci(1992)663:48-62。
在本文中使用的术语″变体″,是保持了必需的性质,但分别与参照多核苷酸或多肽不同的多核苷酸或多肽。多核苷酸的典型变体与另一个参照多核苷酸在核苷酸序列上是不同的。在变体核苷酸序列上的变化可以或可以不改变参照多核苷酸编码的多肽的氨基酸序列。如下所述,核苷酸改变可以导致参照序列编码的多肽中氨基酸的取代、添加、缺失、融合和截短。多肽的典型变体与另一个参照多肽在氨基酸序列上不同。一般,差异是有限的,因此参照多肽和变体的序列总体上是紧密相似的,在许多区域是相同的。由于以任意组合的一个或多个取代、添加或缺失,变体和参照多肽在氨基酸序列上可以不同。取代或插入的氨基酸残基可以或可以不是遗传密码子编码的。多核苷酸或多肽的变体可以是天然存在的,例如等位变体,或者可以是已知非天然存在的变体。多核苷酸和多肽的非天然存在的变体可以是用诱变技术或直接合成制造的。
关于突变植物,术语″无效突变体″或″失功能突变体″用于表示具有突变的生物体或基因组DNA序列,所述突变导致基因产物无功能或大量缺少。此类突变可以存在于基因的编码和/或调节区,可以是个别残基的改变,或者核酸区域的插入或缺失。这类突变还可以存在于其它基因的编码和/或调节区,所述其它基因可以调节或者控制基因和/或编码的蛋白质,从而导致蛋白质是无功能的或者大量缺少的。
术语“充分相同”指核酸或氨基酸序列具有的序列变异本质上不影响蛋白质的性质(即,蛋白质的结构、稳定性特征、底物特异性和/或生物活性)。特别对于核酸序列,术语“充分相同”意指编码区和控制表达的保守序列,并主要指在编码的多肽中的编码相同氨基酸的简并密码子,或者编码保守取代的氨基酸的备用密码子。关于氨基酸序列,术语“充分相同”一般指在不涉及决定结构或功能的多肽区域的保存性取代和/或变异。
术语“同一性百分比”和“相似性百分比”在本文中还用于在氨基酸和核酸序列之间的比较。当指氨基酸序列时,“同一性”或“同一性百分比”指通过序列分析程序,目标氨基酸序列中与被比较的氨基酸序列中相同氨基酸相匹配的氨基酸的百分比。“相似性百分比”指目标氨基酸序列中已经匹配相同的或保守的氨基酸的氨基酸百分比。保守氨基酸是结构不同但是物理性质相似的氨基酸,因此彼此的互换不会明显的改变产生的蛋白质的三级结构。Taylor(1986,J.Theor.Biol.119:205)定义了保存性取代。当关于核酸分子时,“同一性百分比”指通过序列分析程序,目标核酸序列中匹配相同的核苷酸的百分比。
用已知的方法可以方便的计算“同一性”和“相似性”。可以使用计算机程序比对核酸或氨基酸的相似序列来比较核酸序列和氨基酸序列,从而定义差别。在优选的方法中,使用BLAST程序(NCBI)及其使用的参数,并且使用DNAstar系统(Madison,WI)比对基因组DNA序列的序列片段。然而,可以使用任何标准比对软件获得等价比对和相似性/同一性评估。例如,可以从Madison,Wisconsin的遗传计算公司(Genetics Computer Group)获得的GCG Wisconsin Package 9.1版,及该程序使用的缺省参数(空位开放罚分=12,空位延伸罚分=4)也可以用来比较序列同一性和相似性。
在本文中使用的“抗体”包括多克隆和单克隆抗体、嵌合的、单链的和人源化抗体,以及抗体片段(例如,Fab、Fab′、F(ab′)2和Fv),包括Fab或其它免疫球蛋白表达文库的产物。关于抗体,术语“免疫特异的”或“特异的”指抗体结合目标蛋白质的一个或多个表位,但是其本质上不识别和结合样品中的其它分子,所述样品包括抗原性生物分子的混合群体。确定抗体结合特异性的筛选测定是本领域普遍已知并常规实践的。对此类测定的综合讨论参见Harlow等人(编著),Antibodies A Laboratory Manual;ColdSpring Harbor Laboratory;Cold Spring Harbor,NY(1988),第6章。
术语“充分纯的”指包含至少50-60%按重量计算的目标化合物(例如,核酸、寡核苷酸、蛋白质,等等)的制品。更优选的,制品包含至少75%(重量),最优选的90-99%(重量)的目标化合物。通过适合目标化合物的方法测量纯度(例如,层析法、琼脂糖或聚丙烯酰胺凝胶电泳、HPLC分析,等等)。
关于单链核酸分子,术语“特异的杂交”指在两个序列足够互补的单链核酸分子之间的缔合作用,所述互补允许在本领域一般使用的预确定的条件下进行此类杂交(有时定义为“充分互补”)。特别的,术语指寡核苷酸和单链DNA或RNA分子中包含的、充分互补的序列的杂交,本质上排除寡核苷酸与非互补序列的单链核酸的杂交。
“编码序列”或“编码区”指当表达序列时,具有产生基因产物例如氨基酸或多肽所必需的序列信息的核酸分子。编码序列可以在翻译区域内包含非翻译序列(例如,内含子或5′或3′非翻译区),或可以缺乏此类间插非翻译序列(例如,在cDNA中)。
“内含子”指核酸中不编码与蛋白质合成有关的信息的多核苷酸序列。此类序列被转录成mRNA,但是在mRNA翻译成蛋白质之前被去掉。
术语“有效的连接”或“有效的插入”意指将表达编码序列必需的调控序列置于核酸分子中相对于编码序列的适当位置,从而使编码序列能够表达。例如,当启动子能够控制编码序列的转录或表达时,启动子是与编码序列有效的连接的。编码序列可以在正义或反义方向与启动子或调控序列有效的连接。术语“有效的连接”有时也用于其它转录调控元件(例如增强子)在表达载体中的排布。
转录和翻译调控序列是DNA调节序列,例如启动子、增强子、多聚腺苷酸化信号、终止子,等等,其用于在宿主细胞中表达编码序列。
术语“启动子”、“启动子区域”或“启动子序列”一般指基因的转录调节区,发现其可以在编码区的5’或3’侧,或在编码区内,或在内含子内。通常,启动子是能够结合细胞内RNA聚合酶并起始下游(3’方向)编码序列转录的DNA调节区。典型的5’启动子序列是在其3’端由转录起始位点所结合,并向上游(5’方向)延伸,以包括以高于背景的可检测水平起始转录所必需的最少碱基数或元件。转录起始位点(通过核酸酶S1作图可方便的定义),以及负责结合RNA聚合酶的蛋白质结合结构域(共有序列)都位于启动子序列内。
“载体”是复制子,例如质粒、噬菌体、黏粒或病毒,其中可以有效的插入另一个核酸片段从而复制或表达该片段。
术语“核酸构建体”或“DNA构建体”有时用于指编码序列或有效的连接合适调控序列并被插入到用于转化细胞的载体中的序列。该术语可与术语“转化的DNA”或“转基因”互换的使用。此类核酸构建体可以包含目标基因产物的编码序列,以及选择性标记基因和/或报告基因。
“标记基因”或“选择性标记基因”是编码基因产物的基因,所述基因产物产生的特征能够使含有该基因的细胞可以从不含该基因的细胞中挑选出来。用于遗传工程的载体一般含有一个或多个选择性标记基因。选择性标记基因的类型包括(1)抗生素抗性基因;(2)除草剂耐受性或抗性基因;和(3)代谢或营养缺陷型标记基因,其使转化的细胞能够合成细胞以其它方式不能产生的必需组分,一般是氨基酸。
“报告基因”也是一类标记基因。它一般编码用标准实验室手段(例如,酶活性、荧光)可测定的或可检测的基因产物。
术语“表达”、“表达的”或基因的“表达”指基因产物的生物合成。过程涉及基因转录为mRNA,然后mRNA翻译为一个或多个多肽,并涵盖所有的天然发生的翻译后修饰作用。
“内源性”指任何成分,例如基因或核酸或多肽,其可以天然的在特定的生物体内发现。
核酸构建体的“异源”区域是在较大分子内核酸分子的可识别部分(或多个部分),其未发现与自然界的较大分子相关。因此,当异源区域包括基因时,位于基因侧面的DNA通常在来源生物体的基因组中是不位于基因组DNA侧面。在另一个实施例中,异源区域是构建体,其中未在自然界中发现编码序列本身(例如,其中基因组编码序列包含内含子的cDNA,或具有不同于天然基因的密码子的合成序列)。等位变异或天然发生的突变事件不产生本文中定义的DNA异源区域。上文定义的术语“DNA构建体”也用于指异源区域,特别是构建用于细胞转化的一个异源区域。
外源或异源DNA“转化”或“转染”细胞是当此类DNA已经被引入细胞内部时。转化DNA可以或可以不必整合(共价连接的)到细胞的基因组中。例如在原核生物、酵母和哺乳动物细胞中,可以在附加型元件例如质粒上维持转化DNA。关于真核细胞,稳定转化的细胞是这样的细胞,其中转化DNA已经整合到染色体中,从而通过染色体复制被子细胞遗传。通过真核细胞建立细胞系或克隆的能力来证明该稳定性,所述细胞系或克隆由含有转化DNA的子细胞群体组成。“克隆”是由单个细胞或共同祖先通过有丝分裂衍生的一群细胞。“细胞系”是初级细胞的克隆,其能够在体外稳定成长多代。
“种粒”、“种子”或“豆”指开花植物的能够发育成另一株此类植物的繁殖单位。如本文中使用的,特别是对于咖啡植物,使用的术语是同义的和可互换的。
“半乳甘露聚糖合成酶”和“半乳甘露聚糖合成基因”指,在半乳甘露聚糖聚合物合成中涉及的蛋白质或酶,和编码其的基因。半乳甘露聚糖合成酶包括甘露聚糖合酶和半乳糖基转移酶。同样地,半乳甘露聚糖合成基因包括编码甘露聚糖合酶和半乳糖基转移酶的基因。
如本文中使用的,术语“植物”包括涉及全株植物、植物器官(例如,叶、茎、枝条、根)、种子、花粉、植物细胞、植物细胞细胞器及其子代。在发明范围内理解的转基因植物的部分包括,例如,源自转基因植物或其子代的植物细胞、原生质体、组织、愈伤组织、胚胎以及花、茎、种子、花粉、果实、叶或根。
描述
半乳甘露聚糖是成熟咖啡种粒中丰富的多糖和重要的组分。它在成熟咖啡种粒中的大量存在支持了它的作用是维持种粒完整性的观点。与之一致,认为半乳甘露聚糖及咖啡种粒中的其它糖组分,在咖啡种粒在水中的提取特征中发挥重要作用,其可以影响获得的咖啡的物理和化学特性。在该多糖的代谢中涉及的关键酶是半乳甘露聚糖合成酶,例如甘露聚糖合酶和半乳糖基转移酶。
本发明一个方面的特征是来自咖啡的编码甘露聚糖合酶和半乳糖基转移酶的核酸分子。来自中果咖啡的编码完整甘露聚糖合酶的cDNA(pVC4、pVC6)在本文中分别被分别陈述为SEQ ID NO:1和2,并被称为CcManS。来自小果咖啡的编码完整甘露聚糖合酶的cDNA(pVC7)在本文中被陈述为SEQ ID NO:3,并被称为CaManS。部分的基因组克隆分别作为SEQ ID NO:7、8、9和10陈述,如在附图2A的描述和实施例中的讨论。此外,本核酸分子包括编码半乳甘露聚糖半乳糖基转移酶的cDNA,其有时是与来自胡卢巴的半乳糖基转移酶具有约54%同一性的序列,有时是与来自百脉根(Japonicus)的半乳糖基转移酶具有约54%同一性的序列。在一些实施方案中,上述cDNA包括SEQ ID NO:11或13提供的序列,其被称为CcGMGT1,以及SEQ ID NO:12或14提供的序列,其被称为CcGMGT2。
发明的另一个方面涉及通过表达上述核酸分子产生的蛋白质及其应用。通过翻译SEQ ID NO:1或SEQ ID NO:2产生的推断的CcManS蛋白质的氨基酸序列,在本文中分别作为SEQ ID NO:4和5陈述。通过翻译SEQ ID NO:3产生的CaManS蛋白质的推断的氨基酸序列在本文中作为SEQ ID NO:6陈述。通过翻译SEQ ID NO:11或SEQ ID NO:13产生的CcGMGT1蛋白质的推断的氨基酸序列在本文中分别作为SEQ ID NO:15和17陈述。通过翻译SEQ ID NO:12或SEQ ID NO:14产生的CcGMGT2蛋白质的推断的氨基酸序列在本文中分别作为SEQ ID NO:16和18陈述。下表列举了上述多核苷酸和编码蛋白质。
半乳甘露聚糖合成涉及的多核苷酸和多肽
Figure A20068003813600221
发明的其它方面还涉及核酸分子和编码多肽在植物育种和植物的遗传操作、以及最终在操作咖啡种粒性质中的应用。
虽然在本文中描述和举例说明了来自中果咖啡和小果咖啡的编码半乳甘露聚糖合成酶的多核苷酸,但是本发明还意在涵盖来自其它咖啡属物种的核酸及其编码的蛋白质,所述核酸和编码的蛋白质与中果咖啡和小果咖啡的多核苷酸和蛋白质足够相似,可互换的用于如下所述的目的。因此,当本文指半乳甘露聚糖合成酶“甘露聚糖合酶”和″半乳甘露聚糖半乳糖基转移酶″(或″半乳糖基转移酶″)时,除非一些特殊的情况,这些术语意在涵盖具有本文中描述的普遍的物理、生化和功能特征的所有咖啡属甘露聚糖合酶和半乳糖基转移酶,以及编码它们的多核苷酸。
根据它们的序列考虑,发明的甘露聚糖合酶多核苷酸包括SEQ IDNO:1-3的等位变体和天然突变体,其很可能在中果咖啡和小果咖啡的不同变种中发现,并且很可能在不同的咖啡物种中发现SEQ ID NO:1-3的同源物。半乳糖基转移酶多核苷酸包括SEQ ID NO:11-14的等位变体和天然突变体,其很可能在中果咖啡和小果咖啡的不同变种中发现,并且很可能在不同的咖啡物种中发现SEQ ID NO:11-14的同源物。预期此类变体和同源物在核苷酸和氨基酸序列中将具有一些差别,因此存在分离的编码甘露聚糖合酶的核酸分子和编码半乳糖基转移酶的核酸分子,它们编码各自的多肽,所述多肽与SEQ ID NO:4、5或6编码的多肽(就甘露聚糖合酶来说),以及与SEQ ID NO:15、16、17或18编码的多肽(就半乳糖基转移酶来说),具有至少约75%(以及,以优选性递增顺序,76%、77%、78%、79%、70%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%和99%)的同一性。因为在不同咖啡变种和物种中甘露聚糖合酶、半乳糖基转移酶以及编码它们的基因之间,可能存在天然的序列变异,预期本领域技术人员可以发现变异的该水平,同时还维持本发明的多肽和多核苷酸的独特性质。此预期的部分是由于遗传密码子的简并状态,以及保守氨基酸序列变异已知的进化成功,其没有可观的改变编码蛋白质的性质。因此,认为此类变体和同源物本质上是彼此相同的,并包括在本发明的范围内。
以下部分阐述了本发明实践中涉及的一般程序。对于被提到的具体物质,仅仅是出于举例说明,并非是意在限制发明。除非另作说明,使用的是普通的生化和分子生物学程序,例如在Sambrook等人,MolecularCloning,Cold Spring Harbor Laboratory(1989)或Ausubel等人(编著),Current Protocols in Molecular Biology,John Wiley&Sons(2005)中阐述的。
核酸分子、蛋白质和抗体:
可以用两种普通方法制备本发明的核酸分子:(1)它们可以从合适的核苷酸三磷酸中合成,或(2)可以从生物学来源中分离。两种方法都利用本领域普遍已知的规程。
核苷酸序列信息的可获得性,例如具有SEQ ID NO:1-3(或由SEQ IDNO:7-10代表的片段)或11-14(或由SEQ ID NO:19和20代表的片段)的cDNA使能够通过寡核苷酸合成来制备本发明的分离的核酸分子。可以通过美国应用生物系统公司(Applied Biosystems)38A DNA合成仪或类似装置中使用的亚磷酰胺方法制备合成的寡核苷酸。可以根据本领域已知的方法纯化所获得的构建体,例如高效液相层析(HPLC)。由于目前的寡核苷酸合成方法固有的尺寸限制,必须分阶段合成长双链多核苷酸如本发明的DNA分子。因此,例如:长双链分子可以作为一些具有适当互补性的较小片段合成。因此,产生的互补片段可以退火的,从而各片段具有连接相邻片段的合适的粘性末端。在存在DNA连接酶的情况下,可以通过粘性末端退火连接相邻片段,从而构建全长的双链分子。随后可以在合适的载体中克隆和扩增所构建的合成DNA分子。
根据本发明,可以通过适当严格性的杂交和洗涤条件,鉴定与编码半乳甘露聚糖合成酶的多核苷酸的部分或全部编码和/或调节区具有适当水平序列同源性的核酸。本领域技术人员将理解,当上述策略应用于基因组序列时,除能够分离编码多糖代谢酶的序列之外,还能够分离与多糖代谢酶基因有关的启动子,和其它基因调节序列,即使该调节序列本身未必具有能够进行合适杂交的足够的同源性。
作为典型的举例说明,可以根据Sambrook等人的方法实施杂交,使用的杂交溶液包含:5×SSC、5×Denhard`t试剂、1.0%SDS、100μg/ml变性的片段化的鲑精DNA、0.05%焦磷酸钠和达到50%的甲酰胺。杂交在37-42℃进行至少六小时。在杂交后,如下所述洗涤滤膜:(1)在2×SSC和1%SDS中室温下5分钟;(2)在2×SSC和0.1%SDS中室温下15分钟;(3)在2×SSC和0.1%SDS中37℃30分钟-1小时;(4)在2×SSC和0.1%SDS中45-55℃2小时,每30分钟更换溶液。
用于计算严格条件的一个常用公式如下,所述严格条件是在指定序列同源性的核酸分子之间完成杂交所要求的(Sambrook等人,1989):
Tm=81.5℃+16.6Log[Na+]+0.41(%G+C)-0.63(%甲酰胺)-600/双链体中的#bp
作为上述公式的举例说明,使用[Na+]=[0.368]和50%甲酰胺,GC含量42%和平均探针大小200碱基,Tm为57℃。同源性每下降1%,DNA双链体的Tm下降1-1.5℃。因此,用42℃的杂交温度可以观察到具有超过约75%序列同一性的靶。在一个实施方案中,杂交是在37℃,最终洗涤是在42℃;在另一个实施方案中,杂交是在42℃,最终洗涤是在50℃;在另一个实施方案中,杂交是在42℃,最终洗涤是在65℃,均利用上述杂交和洗涤溶液。高严格条件包括在上述杂交溶液中42℃杂交,和在0.1×SSC和0.1%SDS中65℃最终洗涤10分钟。
本发明的核酸可以作为在任何便利的克隆载体中的DNA来维持。在优选的实施方案中,克隆维持在质粒克隆/表达载体中,例如pGEM-T(普洛麦格生物技术有限公司(Promega Biotech),Madison,WI)、pBluescript(斯莱特因公司(Stratagene),La Jolla,CA)、pCR4-TOPO(英杰生命技术公司(Invitrogen),Carlsbad,CA)或pET28a+(诺华因公司(Novagen),Madison,WI),它们均可以在合适的大肠杆菌(E.coli)宿主细胞中增殖。
发明的核酸分子包括cDNA、基因组DNA、RNA及其片段,其可以是单链、双链或者甚至三链。因此,本发明提供寡核苷酸(正义或反义链的DNA或RNA),其具有能够与本发明的核酸分子的至少一种序列杂交的序列。此类寡核苷酸可用作检测植物组织测试样品中的编码半乳甘露聚糖合成酶的基因或mRNA的探针(例如,通过PCR扩增),或用于在mRNA翻译成蛋白质时或之前,对编码半乳甘露聚糖合成酶的基因表达进行正调控或负调控。可以使用其中编码半乳甘露聚糖合成酶的寡核苷酸或多核苷酸作为探针用于此类测定的方法包括:(1)原位杂交;(2)Southern杂交;(3)Northern杂交;和(4)分类扩增反应如聚合酶链反应(PCR,包括RT-PCR)和连接酶链式反应(LCR)。
具有能够与本发明的核酸分子的至少一种序列杂交的序列的寡核苷酸包括反义寡核苷酸。反义寡核苷酸是靶向可能使用的对于翻译是关键的mRNA特定区域的。使用反义分子减少预定基因的表达水平是本领域已知的。可以通过用DNA构建体转化植物细胞原位提供反义分子,所述DNA构建体在转录后产生反义RNA序列。此类构建体可设计成产生全长或部分的反义序列。可以通过转基因过量产生基因编码序列的正义和反义RNA,从而产生大量的dsRNA,增强该基因沉默效应(例如见Waterhouse等人,1998,PNAS 95:13959-13964)。在该方面,已经发现含有对应于至少一个内含子的部分或全部的序列的dsRNA是特别有效的。在一个实施方案中,通过转基因表达部分或全部的编码甘露聚糖合酶或编码半乳糖基转移酶的序列的反义链。在另一个实施方案中,转基因表达部分或全部的编码甘露聚糖合酶的序列或编码半乳糖基转移酶的序列的杂交正义和反义链。在另一个实施方案中,甘露聚糖合酶基因或半乳糖基转移酶基因或两者都可以用商业上可获得的物质和方法(例如,英杰生命技术有限公司(Invitrogen,Inc.),Carlsbad CA)使用小干扰RNA(siRNA;Elbashir等人,2001,Genes Dev.15(2):188-200)沉默。
根据已知的方法,可以用多种方法制备本发明核酸编码的多肽。如果在原位生产,则可以从合适的来源中纯化多肽,例如种子、果皮或其它植物部分。
可选的,编码多肽的核酸分子的可获得性,使能够利用本领域已知的体外表达方法生产蛋白质。例如,可以将cDNA或基因克隆到合适的体外转录载体如用于体外转录的pSP64或pSP65中,然后在合适的无细胞翻译系统如小麦胚芽或兔网织红细胞中进行无细胞翻译。体外转录和翻译系统是商业上可获得的,例如、来自普洛麦格生物技术有限公司(Promega Biotech),Madison,WI、BRL,Rockville,MD或英杰生命技术公司(Invitrogen),Carlsbad,CA。
根据优选的实施方案,可以通过合适的原核或真核系统表达生产更大量的多肽。例如,部分或全部的DNA分子例如具有SEQ ID NO:2或SEQ IDNO:3或SEQ ID NO:11-14中任一项的cDNA,可以被插入到适于在细菌细胞(例如大肠杆菌)或酵母细胞(例如酿酒酵母(Saccharomyces cerevisiae))中表达的质粒载体中,或被插入到适于在昆虫细胞中表达的杆状病毒载体中。此类载体包括在宿主细胞中表达DNA所必需的调节元件,其位置的放置方式允许DNA在宿主细胞中表达。此类表达需要的调节元件包括启动子序列、转录起始序列和,任选的,增强子序列。
可以根据本领域已知的方法纯化在重组的原核或真核系统中通过基因表达生产的多肽。在优选的实施方案中,可以使用商业上可获得的表达/分泌系统,藉此重组蛋白质表达并之后从宿主细胞分泌,随后从周围培养基中纯化。替代方案涉及通过亲合分离纯化重组蛋白质,例如通过与重组蛋白质特异性结合的抗体的免疫学相互作用。
可以根据标准程序分析用上述方法制备的本发明的多肽。
根据已知的方法,从咖啡中纯化的或重组生产的多肽可用于产生在本文中定义的多克隆或单克隆抗体、抗体片段或衍生物。除了产生完整重组蛋白质的抗体之外,如果蛋白质或Southern分析以及克隆分析(见下文)表明克隆的基因属于多基因家族,则可以产生针对对应于蛋白质非保守区域的合成肽所制备的成员-特异性抗体。
在本文中出于任何目的描述的包括本发明抗体的试剂盒也包括在本发明的范围内。通常,该试剂盒包括对照抗原,抗体对其是免疫特异性的。
载体、细胞、组织和植物:
生产转基因宿主细胞的载体和试剂盒也是根据本发明的特征,其包括编码半乳甘露聚糖合成酶的多核苷酸或寡核苷酸,或其正义或反义方向的变体,或多糖代谢酶-启动子及其他调节序列控制的报告基因和其他构建体。合适的宿主细胞包括但不限于,植物细胞、细菌细胞、酵母及其他真菌细胞、昆虫细胞和哺乳动物细胞。用于转化多种上述宿主细胞的载体对本领域技术人员是普遍已知的。它们包括但不限于,质粒、黏粒、杆状病毒、杆粒、细菌人工染色体(BAC)、酵母人工染色体(YAC),以及其它细菌的、酵母和病毒的载体。通常,用于生产转基因宿主细胞的试剂盒将包括一个或多个合适的载体,以及用于使用载体生产转基因细胞的说明书。试剂盒还可以包括一个或多个其它组分,仅举几个例子如培养细胞的培养基、实施转化细胞的试剂和检测转基因细胞基因表达的试剂。
本发明包括转基因植物,其含有一个或多个编码半乳甘露聚糖合成酶的基因的拷贝,或抑制植物的内源半乳甘露聚糖合成酶的产生或功能的核酸序列。这是通过用转基因转化植物细胞完成的,所述转基因包含部分或全部编码半乳甘露聚糖合成酶的序列、或其突变体、反义链或变体,包括RNA,如下所述,所述转基因受到天然的或重组的调节序列的调控。转基因植物咖啡物种是优选的,包括但不限于,C.abeokutae、小果咖啡(C.arabica)、阿诺德氏咖啡(C.arnoldiana)、C.aruwemiensis、C.bengalensis、中果咖啡(C.canephora)、刚果咖啡(C.congensis)、高产咖啡(C.Dewevrei)、埃塞尔萨咖啡(C.excelsa)、C.eugenioides和C.heterocalyx、C.kapakata、C.khasiana、大果咖啡(C.liberica)、C.moloundou、C.rasemosa、C.salvatrix、C.sessiflora、狭叶咖啡(C.stenophylla)、C.travencorensis、C.wightiana和C.zanguebariae。发明还包括任何物种的植物;其包括但不限于,烟草、拟南芥和其它“实验室友好的”物种、禾谷类作物例如玉米、小麦、稻、大豆、大麦、黑麦、燕麦、高粱、苜蓿、车轴草等;产油植物例如油菜、红花、向日葵、花生、可可树等,蔬菜作物例如番茄、粘果酸浆(tomatillo)、马铃薯、胡椒、茄子、甜菜、胡萝卜、黄瓜、莴苣、豌豆等、园艺植物例如紫菀、秋海棠、菊花、飞燕草、碧冬茄、百日草、结缕草(lawn)和草坪草等等。
可以用本领域技术人员已知的标准植物转化方法产生转基因植物。这些包括但不限于,农杆菌载体、原生质体的聚乙二醇处理、生物射弹DNA递送、UV激光微束、双生病毒群载体或其它植物病毒载体、原生质体的磷酸钙处理、分离原生质体的电穿孔、搅拌溶液中的细胞悬液与具有转化DNA包被的微珠、搅拌溶液中的细胞悬液与转化DNA包被的硅纤维、直接的DNA摄入、脂质体介导的DNA摄入,等等。此类方法已经在本领域中公开。见例如,Methods for Plant Molecular Biology(Weissbach&Weissbach,编著,1988);Methods in Plant Molecular Biology(Schuler&Zielinski,编著,1989);Plant Molecular Biology Manual(Gelvin,Schilperoort,Verma,编著,1993);和Methods in Plant Molecular Biology-A Laboratory Manual(Maliga,Klessig,Cashmore,Gruissem&Varner,编著,1994)。
转化的方法取决于被转化的植物。农杆菌载体常用于转化双子叶植物物种。农杆菌二元载体包括但不限于,BIN19及其衍生物、pBI载体系列和二元载体pGA482、pGA492、pLH7000(GenBank登录AY234330)以及任一合适的pCAMBIA载体之一(来自由Hajdukiewicz,Svab&Maliga构建的pPZP载体(1994)Plant Mol Biol 25:989-994,可以从CAMBIA,GPO Box3200,Canberra ACT 2601,Australia或通过世界互联网在CAMBIA.org获得)。对于单子叶植物物种的转化,用包被了转化DNA的颗粒和包被了转化DNA的硅纤维进行生物射弹轰击对于进行核转化通常是有效的。可选的,农杆菌“超二元”载体已经被成功地用于稻、玉米和多种其它单子叶植物物种的转化。
用于转化选定植物的DNA构建体包括有效的连接合适的5′(例如,启动子和翻译调节序列)和3′调节序列(例如,终止子)的目标编码序列。在一个实施方案中,可以使用将编码半乳甘露聚糖合成酶的序列受到其自身的5′和3′调节元件的控制下。在其它实施方案中,编码半乳甘露聚糖合成酶的序列和调节序列是被替换了的,从而为了表型的改善例如生产的咖啡的风味、香气或其它特征如泡沫,而改变了转化植物的多糖谱。
在替代的实施方案中,将基因的编码区置于强力的组成型启动子下,所述启动子例如花椰菜花叶病毒(CaMV)35S启动子或玄参花叶病毒35S启动子。在本发明中考虑使用的其它组成型启动子包括但不限于:T-DNA甘露碱合成酶、胭脂氨酸合成酶和章鱼碱合酶启动子。在其它实施方案中,使用的是强的单子叶植物启动子,例如,玉米泛素启动子、稻肌动蛋白启动子或稻微管蛋白启动子(Jeon等人,Plant Physiology.123:1005-14,2000)。
在诱导型启动子下表达半乳甘露聚糖合成酶编码序列的转基因植物也被认为是在本发明的范围之内。诱导型植物启动子仅举几例,包括四环素阻抑物/操纵子控制的启动子、热激基因启动子、胁迫(例如,创伤)-诱导型启动子、防御应答型基因启动子(例如苯丙氨酸氨裂合酶基因)、创伤诱导型基因启动子(例如富羟脯氨酸细胞壁蛋白质基因),化学-诱导型基因启动子(例如,硝酸还原酶基因、葡聚糖酶基因、壳多糖酶基因,等等)和黑暗-诱导型基因启动子(例如,天冬酰胺合成酶基因)。
在本发明中也考虑使用组织特异性和发育特异性启动子。种子特异性启动子的非限制性实施例包括Cim1(细胞分裂素-诱导信息)、cZ19B1(玉米19kDa玉米醇溶蛋白)、milps(肌-肌醇-1-磷酸盐合酶)和celA(纤维素合酶)(美国系列申请号09/377,648)、豆β-菜豆蛋白、油菜籽蛋白、β-伴大豆球蛋白、大豆凝集素、十字花科蛋白、玉米15kDa玉米醇溶蛋白、22kDa玉米醇溶蛋白、27kDa玉米醇溶蛋白、g-玉米醇溶蛋白、蜡质(waxy)、shrunken1、shrunken2和球蛋白1、大豆11s豆球蛋白
Figure A20068003813600301
等人、1992),和中果咖啡11S种子贮藏蛋白(Marraccini等人、1999),也参见WO 00/12733,其中公开了来自end1和end2基因的种子优选的启动子。还可以使用其它的咖啡属种子特异性启动子,包括但不限于在共同拥有的未决的PCT申请号US2006/026121中描述的油质蛋白基因启动子、在共同拥有的未决的PCT申请号US2006/026234中描述的脱水蛋白基因启动子和在共同拥有的未决的PCT申请号US2006/34402中描述的9-顺式-环氧类胡萝卜素双加氧酶基因启动子。其它组织特异性启动子的实施例包括但不限于:为了在光合组织中表达的核酮糖二磷酸羧化酶(RuBisCo)小亚基基因启动子(例如,被Marracini等人,2003描述的咖啡小亚基启动子)或用于在光合组织中表达的叶绿素a/b结合蛋白(CAB)基因启动子;和在根中表达时需要的根-特异性谷氨酰胺合成酶基因启动子。
编码区还有效的连接合适的3′调节序列。在不使用天然3′调节序列的实施方案中,可以使用胭脂氨酸合成酶的多聚腺苷酸化区域。其它有用的3′调节区包括但不限于章鱼碱合酶多聚腺苷酸化区域。
在合适的调节元件的控制之下,被选定的编码区有效的连接核抗药性标记如卡那霉素抗性。其它有效的选择性标记系统包括赋予抗生素或除草剂抗性(例如,对潮霉素、磺酰脲、草丁膦或草甘膦的抗性)的基因或赋予选择性生长的基因(例如,磷酸甘露糖异构酶,其使植物细胞能够在甘露糖上生长)。选择性标记基因包括但不限于,编码抗生素抗性的基因,例如那些编码新霉素磷酸转移酶II(NEO)、二氢叶酸还原酶(DHFR)和潮霉素磷酸转移酶(HPT)的基因,以及赋予对除草剂化合物抗性的基因,例如草甘膦-抗性的EPSPS和/或草甘膦氧化还原酶(GOX)、对溴苯腈抗性的溴苯腈腈水解酶(Bromoxynil nitrilase)(BXN)、对咪唑啉酮抗性的AHAS基因、磺酰脲抗性基因和2,4-二氯苯氧乙酸(2,4-D)抗性基因。
在一些实施方案中,本发明所涵盖的启动子和其它表达调节序列是与报告基因有效连接的。考虑在发明中使用的报告基因包括但不限于,编码绿色荧光蛋白(GFP)、红色荧光蛋白(DsRed)、青色荧光蛋白(CFP)、黄色荧光蛋白(YFP)、角海葵(Cerianthus)橙色荧光蛋白(cOFP)、碱性磷酸酶(AP)、β-内酰胺酶、氯霉素乙酰转移酶(CAT)、腺苷脱氨酶(ADA)、氨基糖苷磷酸转移酶(neor、G418r)、二氢叶酸还原酶(DHFR)、潮霉素-B-磷酸转移酶(HPH)、胸苷激酶(TK)、lacZ(编码α-半乳糖苷酶)和黄嘌呤鸟嘌呤磷酸核糖转移酶(XGPRT)、β-葡糖醛酸糖苷酶(gus)、胎座碱性磷酸酶(PLAP)、分泌型胚胎碱性磷酸酶(SEAP),或萤火虫或细菌的荧光素酶(LUC)的基因。使用与发明的实践有关的许多标准方法,熟练的技术人员将了解其它可以作用为标记或报告基因的序列。
增强基因在细胞宿主中表达的其它序列修饰是本领域已知的。这些修饰包括消除编码多余多聚腺苷酸信号、外显子-内含子剪接位点信号、转位子-样重复的序列和其它此类被清楚表征的对基因表达不利的序列。可选的,根据需要,可以调节编码序列的G/C含量到给定咖啡植物细胞宿主的平均水平,所述水平是参考在咖啡植物细胞中表达的已知基因计算的。而且,如果可能,修饰编码序列从而避免预测的发夹次级mRNA结构。增强基因表达的另一个选择是使用5′前导序列。翻译前导序列是本领域普遍已知的,并包括烟草花叶病毒的5′前导序列(ω)的顺式作用衍生物(ω’)、来自雀麦草花叶病毒、苜蓿花叶病毒和芜菁黄花叶病毒的5′前导序列。
转化植物,然后就一个或多个性质进行筛选,所述性质包括转基因产物、编码转基因的mRNA的存在,或与转基因表达相关的改变的表型。应该认识到,在转化植物中的表达量以及转基因的组织-和时间-特异性的表达模式,可以根据它们在核基因组中插入的位置而变化。该位置效应是本领域普遍已知的。基于该理由,应该再生一些核转化子并对其检测转基因的表达。
方法:
本发明的核酸和多肽可用于许多方法的任一个,藉此可以调节咖啡植物的蛋白质产物的生产,从而影响多种表型性状,例如,增加最终由咖啡豆产生的咖啡饮料或咖啡产物的风味、泡沫(物理性质)和/或香气,或改善咖啡豆的生产品质。例如,半乳甘露聚糖含量的下降,或半乳甘露聚糖结构的变化,预期将大大改善在制备即溶咖啡的过程中固体的回收。
可以通过(1)传统的育种或(2)遗传工程技术,以及上述两种方法的组合获得咖啡种粒多糖谱或其它特征的改善。根据本发明,通过分离和表征咖啡中编码半乳甘露聚糖合成酶的基因,已经极大的改善了这两种方法。例如,可以对编码甘露聚糖合酶或半乳糖基转移酶的基因遗传作图,并可以鉴定咖啡风味涉及的数量性状基因座(QTL)。然后可能确定该QTL是否与甘露聚糖合酶或半乳糖基转移酶相关基因的位置有关。对于影响多糖的基因,还可以鉴定和检测等位基因(单元型),从而确定特定单元型的存在是否与半乳甘露聚糖合成强烈相关。上述标记可用作标记协助的育种方案中的优势。分离在半乳甘露聚糖合成中涉及的多核苷酸的第三个优势是,在具有半乳甘露聚糖的高水平和低水平品种中,产生这些基因在咖啡豆成熟期间的表达数据。该信息可用于指导对遗传操作中使用的基因的选择,所述遗传操作目的在于产生新的转基因咖啡植物,其在成熟的咖啡豆中具有增加或减少的半乳甘露聚糖水平。
在一个方面,本发明的特征是在植物,优选的在咖啡中改变半乳甘露聚糖谱的方法,包括增加或减少植物中一个或多个半乳甘露聚糖合成酶的量或活性。本发明的具体实施方案提供增加或减少甘露聚糖合酶生产的方法。
在一个实施方案中,为了在咖啡的多种组织中,分别过量产生甘露聚糖合酶或半乳糖基转移酶,可以用编码甘露聚糖合酶的多核苷酸转化咖啡植物,所述多核苷酸例如包含SEQ ID NO:2或3,或11-14的cDNA。在一个实施方案中,改造咖啡植物用于普遍增加甘露聚糖合酶生产,例如,通过使用与甘露聚糖合酶基因功能性连接的启动子,如RuBisCo小亚基(SSU)启动子或CaMV35S启动子。在另一个实施方案中,改造咖啡植物用于普遍增加半乳糖基转移酶生产,例如,通过使用与半乳糖基转移酶基因功能性连接的启动子,如RuBisCo小亚基(SSU)启动子或CaMV35S启动子。在一些实施方案中,可以改造咖啡植物的修饰,从而增加甘露聚糖合酶和半乳糖基转移酶的生产。在另一个设计成限制甘露聚糖合酶或半乳糖基转移酶生产的实施方案中,仅对于目标的库器官,即种粒,可以使用种粒特异性启动子,特别是上述的咖啡属种粒特异性启动子之一。
可对表现出改变的半乳甘露聚糖谱的植物筛选甘露聚糖合酶或半乳糖基转移酶的天然发生的变体。例如,从目前可获得的植物突变体群体中,可以制造或选择失功能(无效的)的突变体植物。本领域技术人员还了解,还可以利用本文中描述的一个或多个方法对突变的植物群体筛选低表达或过表达特定多糖代谢酶的突变体,例如半乳甘露聚糖合成酶。可以通过化学诱变、辐射诱变、和转座子或T-DNA插入,或在基因组中靶向诱导局部损害来产生突变的群体(TILLING,参见例如Henikoff等人,2004,PlantPhysiol.135(2):630-636;Gilchrist&Haughn,2005,Curr.Opin.Plant Biol.8(2):211-215)。产生突变群体的方法是本领域普遍已知的。
本发明的核酸可用于鉴定多种植物物种中的半乳甘露聚糖合成酶的突变形式。在转座子插入系是可用的物种中,例如玉米或拟南芥,可以设计寡核苷酸引物筛选品系用于在半乳甘露聚糖合成酶基因中的插入。通过育种,可以培育出间断基因的杂合或纯合的植物品系。
还可以将植物改造成与诱变技术产生的无效突变体表现出相似的表型。通过表达半乳甘露聚糖合成酶的突变形式可以产生转基因的无效突变体,从而制造″显性负调控效应″。虽然发明不限于任一个机制时,该突变蛋白质将与野生型蛋白质竞争相互作用的蛋白质或其它细胞因子。昆虫和脊椎动物系统中的这类″显性负调控″效应的实例是普遍已知的(Radke等人,1997,Genetics 145:163-171;Kolch等人,1991,Nature 349:426-428)。
通过“转录后基因沉默”抑制编码半乳甘露聚糖合成酶的mRNA的翻译,可以产生另一类转基因无效突变体。这类技术可用于下调植物种粒中的甘露聚糖合酶,从而改变多糖谱。例如,源自靶向下调的物种中的编码半乳甘露聚糖合成酶的基因或其片段,可用于控制编码蛋白质的生产。出于该目的可使用全长反义分子。可选的,可使用靶向mRNA特定区域的反义寡核苷酸,所述区域对于翻译是关键的。使用反义分子减少预定基因的表达水平是本领域已知的。可以通过用DNA构建体转化植物细胞原位提供反义分子,所述DNA构建体在转录后产生反义RNA序列。此类构建体可设计成产生全长或部分的反义序列。可以通过转基因过量产生基因编码序列的正义和反义RNA,从而产生大量的dsRNA,增强该基因沉默效应(例如参见Waterhouse等人,1998,PNAS 95:13959-13964)。在这方面,已经发现包含对应于至少一个内含子的部分或全部的序列的dsRNA是特别有效的。在一个实施方案中,通过转基因表达编码甘露聚糖合酶的序列反义链的部分或全部。在另一个实施方案中,通过转基因表达编码甘露聚糖合酶的序列反义链的部分或全部。
在另一个实施方案中,可以通过使用多种在植物系统中目前可用的其它转录后基因沉默(RNA沉默)技术,沉默半乳甘露聚糖合成编码基因。RNA沉默涉及通过基于RNase H的酶(“切酶”或“切酶-样”)将双链RNA(dsRNA)加工成小的21-28个核苷酸片段。切割产物是siRNA(小干扰RNA)或miRNA(微小RNA),以序列-特异性方式掺入到调节基因表达的蛋白质效应复合物中(关于植物中RNA沉默的综述,参见Horiguchi,2004,Differentiation 72:65-73;Baulcombe,2004,Nature 431:356-363;Herr,2004,Biochem.Soc.Trans.32:946-951)。
可以化学合成或在体外转录和扩增小干扰RNA,然后递送到细胞。递送可以通过显微注射(Tuschl T等人,2002),化学转染(Agrawal N等人,2003),电穿孔或阳离子脂质体-介导的转染(Brummelkamp TR等人,2002;Elbashir SM等人,2002),或任一其它在本领域可获得的、熟练的技术人员可理解的方法。可选的,可以通过在目标细胞中插入siRNA的DNA模板,在细胞内表达siRNA,例如,通过质粒(Tuschl T等人,2002),并且可以将所述siRNA特异的靶向选定的细胞。小干扰RNA已经被成功的引入植物(Klahre U等人,2002)。
在本发明中优选的RNA沉默的方法是利用短发夹RNA(shRNA)。通过常规方法将包含编码特殊要求的siRNA序列的DNA序列的载体递送到靶细胞中。一旦位于细胞内,DNA序列便连续的转录成RNA分子,其通过分子内的碱基配对自身弯曲环回并形成发夹结构。这些发夹结构,一旦被细胞加工过,就等同于siRNA分子并被细胞用于介导对所要求的蛋白质的RNA沉默。Horiguchi,2004,如上描述了用于在植物中RNA沉默的特殊用途的多种构建体。通常,该构建体包含启动子、“正义”方向的待沉默的靶基因序列、间隔区、靶基因序列的反义链和终止子。
还可以通过“共抑制”技术(Vaucheret等人,1998,Plant J.16(6):651-659)制造另一种类型的合成的无效突变体。用靶向抑制的内源基因的拷贝转化植物细胞。在多数情况下,这导致对天然基因和转基因的完全抑制。在一个实施方案中,来自目标植物物种的编码半乳甘露聚糖合成酶的基因是分离的,并用于转化该相同物种的细胞。
根据本发明还表征了通过任一上述方法生产的突变体或转基因植物。优选的,植物是能育的,从而用于育种的目的。因此,表现出一个或多个上述所希望的表型的突变体或植物可用于植物育种,或直接在农业或园艺中应用。它们还可用于作为研究工具进一步阐明多糖代谢酶的参与,及其对多糖谱的影响,从而影响咖啡种子的风味、香气和其它特征。包含一个转基因或特定突变的植物还可以与包含互补转基因或基因型的植物杂交,从而生产具有增强的或组合的表型的植物。
下列实施例提供了对发明更细节的描述。实施例是出于例证性的目的,并非意在限制发明。
实施例1
用于下列实施例的材料和方法
植物材料:中果咖啡(BP409,2001)浆果是从印度尼西亚咖啡和可可研究中心(Indonesian Coffee and Cacao Research Center)(ICCRI)印度尼西亚田间的咖啡植物收获的。在收获后,浆果被立即冻存在液氮中,然后用干冰冷冻运输到进一步加工的场所。样品冷冻在-25℃下运输,然后储藏在-80℃直到使用。
DNA序列分析:对于DNA测序,根据标准方法制备并测序重组质粒DNA。使用DNA Star(Lasergene)软件实施计算机分析。使用BLAST程序在GenBank数据库验证序列同源性(Altschul等人,1990)。
cDNA制备:从总RNA和寡dT(18)(西格玛公司(Sigma))按下列方法制备cDNA:1μg总RNA样品加50ng寡dT补入DEPC处理的水至12μl终体积。然后在70℃温育该混合物10分钟,然后快速在冰上冷却。随后,加入4μl第一链缓冲液(5×,英杰生命技术公司(Invitrogen))、2μl DTT(0.1M,英杰生命技术公司(Invitrogen))和1μl dNTP混合物(每种各10mM,英杰生命技术公司(Invitrogen))。这些反应混合物在加入1μl SuperScript IIIRnase H-逆转录酶(200U/μl,英杰生命技术公司(Invitrogen))之前在42℃预温育2分钟。然后,将试管在25℃温育10分钟,再在42℃50分钟,随后在70℃加热10分钟使酶失活。然后将产生的cDNA样品在无菌水中稀释10倍,储存在-20℃供一些下列实验使用,例如5’RACE、分离全长cDNA克隆和QRT-PCR。
5’RACE反应(cDNA末端快速扩增)
为了回收咖啡甘露聚糖合酶的5’编码序列,进行了两轮5’RACE。用于在5’RACE中合成cDNA的RNA是处于黄色阶段的中果咖啡(BP409)种粒。进行5’RACE实验使用的方法是严格遵守cDNA末端快速扩增试剂盒(英杰生命技术公司(Invitrogen))中5’RACE系统的试剂盒中描述的方法。简而言之,首先纯化该实验中使用的cDNA,去掉任何未掺入的核苷酸(因为它们会干扰dC加尾反应)。精确的根据生产商给出的说明书,通过在S.N.A.P柱(英杰生命技术公司(Invitrogen))上纯化5’RACE cDNA完成该步骤。cDNA一旦纯化,就用50μl无菌水回收,并在用于5’RACE PCR以前储存在-20℃。
5’RACE实验都始于对S.N.A.P.纯化的cDNA的TdT加尾。多聚dC加尾反应如下:25μl反应是由5μl纯化的cDNA、11.5μl DEPC处理的水、5μl 5×TdT加尾缓冲液(英杰生命技术公司(Invitrogen))和2.5μl 2mMdCTP。然后,反应在94℃温育3分钟,再在冰上预冷。然后加入1μl TdT并将反应在37℃温育10分钟。通过在65℃加热10分钟终止反应并再次置于冰上。
在最终50μl体积中实施第一轮5’RACE反应,如下:5μL每种加尾cDNA、5μl 10×PCR缓冲液(ThermoPol缓冲液)、400nM基因特异性引物(Gene Specific Primer)1和AAP引物(参见表1和2的引物),200μM每种dNTP和2.5U的Taq DNA聚合酶(博鳌莱伯生物公司(BioLabs))。第一轮PCR循环条件是:94℃2分钟;然后进行40个循环,每个循环是:94℃1分钟,表2中标注的退火温度1分钟,72℃2分钟。延伸的附加最终步骤是在72℃进行7分钟。然后用琼脂糖凝胶电泳并用溴化乙锭染色分析PCR产物。
在最终50μl体积中实施第二轮PCR反应,如下:5μL 1%的稀释的第一轮PCR产物;5μl 10×PCR缓冲液(加Mg++的LA缓冲液II)、200nM的基因特异性引物2和AUAP引物(使用参见表1和2的特异性引物)、200μM各dNTP、0.5U的DNA聚合酶塔卡拉(Takara)LA Taq(凯姆布莱克生物科学公司(Cambrex Bio Science))。循环方案是:94℃2分钟;然后进行40个循环,每个循环是:94℃1分钟,表2中标注的退火温度1分钟和72℃1分30秒。延伸的附加最终步骤是在72℃7分钟。然后用琼脂糖凝胶电泳并用溴化乙锭染色分析PCR产物。
  引物   序列   SEQ IDNO:
  AAP(截短的锚定引物)   5’GGCCACGCGTCGACTAGTACGGGIIGGGIIGGGIIG3   34
  AUAP(截短的通用扩增引物)   5’GGCCACGCGTCGACTAGTAC3   35
  RNAi-Pr2   5’GAACATGTTGACGAGCCT3   36
  ManSynGWR249   5’GCCCGCAGGACTTCATTCGTGGAG3   37
  ManSRace2   5’ATACTTGGTATATCGTTTCCTTCC3   38
  ManSRace1   5’TGACACATCCAATCACATCGC3   39
表1.用于5’RACE PCR实验的引物列表
Figure A20068003813600381
表2.用于不同的5’RACE实验的引物和PCR条件
给出了各种5’RACE PCR反应下的引物、退火温度和循环数。引物的DNA序列在上文表1中给出。
用基因特异性引物从中果咖啡和小果咖啡中分离含有ManS完整编码序列(完整ORF)的cDNA
使用现有的cDNA序列和从5′RACE获得的新的5′序列,在5′和3′UTR序列中设计2个基因特异性引物,以扩增ManS的完整的ORF序列(pVC4、pVC6和pVC7)。表3中标注了用于分离完整ORF序列的cDNA(种子、黄色阶段、BP409;和种子、黄色阶段、T2308),表4中给出了用于每种PCR反应的特异性引物的序列。按照下述在50μl反应中实施PCR反应:5μL的cDNA(表3和4)、5μl 10×PCR缓冲液(加Mg++的LaPCR缓冲液II)、800nM的各基因特异性引物、200μM的各dNTP和0.5U的DNA聚合酶塔卡拉(Takara)LA Taq(凯姆布莱克生物科学公司(Cambrex Bio Science))。在94℃变性2分钟后,扩增由35个循环组成,每个循环是:94℃1分钟、在退火温度(47℃)1分30秒和在72℃3分钟。延伸的附加最终步骤是在72℃进行7分钟。然后用琼脂糖凝胶电泳和溴化乙锭染色分析PCR产物。然后,使用用于测序的TOPO TA克隆试剂盒,根据生产商给出的说明书,将预期大小的片段克隆到pCR4-TOPO中。然后完整的测序所产生的质粒的插入片段。
Figure A20068003813600391
表3.分离编码中果咖啡甘露聚糖合酶(CcManS)和小果咖啡甘露聚糖合酶(CaManS)的全长蛋白质序列的cDNA序列。
给出了用于扩增完整ORF序列的特异性cDNA引物和PCR退火温度。按方法中的描述合成这些cDNA。
  引物   序列  SEQ ID NO:
  ManS-Am3   5’CTGCTCATTGCCCTCAG3   40
  ManS-Am2   5’GACTTGCTGTACTCGTCTA3   41
表4.用于扩增编码CcManS和CaManS全长蛋白质序列的cDNA序列的引物序列。
使用定量RT-PCR(Q-RT-PCR)的CcManS的表达分析
根据上述方法制备用于上述实验的cDNA(罗布斯塔咖啡;中果咖啡BP4091/1000稀释;阿拉比卡咖啡cDNA样品;小果咖啡T-23081/1000稀释,cDNA样品)。根据生产商的推荐实施TaqMan-PCR(美国应用生物系统公司(Applied Biosystems),伯克艾尔莫公司(Perkin-Elmer))。简而言之,在反应平板(MicroAmp Optical 96-孔反应平板,美国应用生物系统公司(Applied Biosystems)ref.:N801-0560)中设置25μl的反应。各反应包含12.5μl的AmpliTaq Gold Master混合物、2.5μl的两种引物(8μM储液、在最终反应中800nM)、2.5μl MGB TaqMan探针(2μM储液,在最终反应中200nM)和5μl的DNA样品加水。首先将水和DNA加入平板,然后加入″Specific Mix″(AmpliTaq Gold Master混合物+引物和TaqMan探针)。反应在室温下进行,只有当Taq被在高温下释放结合的抗体所活化时才开始Taq扩增,即热启动(HotStart)。TaqMan缓冲液包含Amp
Figure A20068003813600401
UNG(尿嘧啶-N-转葡糖基酶),其在PCR循环开始的在50℃下前2分钟是有活性的,然后在95℃下失活。使用的循环条件(7500实时PCR系统-美国应用生物系统公司(Applied Biosystems))是50℃2分钟、95℃10分钟,然后进行40个95℃15秒和60℃1分钟的循环。每个反应一式三份进行,计算三次反应的平均Ct值。
用PRIMER EXPRESS软件(美国应用生物系统公司(AppliedBiosystems))设计使用的引物和TaqMan探针。用于Q-PCR实验的引物和甘露聚糖合酶MGB探针是124613-F1、124613-R1和124613MGB1(参见表5)。使用相对定量(RQ)的方法进行定量,使用组成型表达的咖啡核糖体蛋白基因CcRpl39作为参照。在这种情况下,从对各组织样品中各基因进行的复制,计算CcManSyn(检测基因)和CcRpl39(参照基因)基因的平均Ct。然后计算RQ值(2-δCt;δCt=CcManS Ct-CcRpl39Ct),其是对两种样品之间差值的测量。为了使用相对定量的方法,必须表明使用特定引物和探针组,检测基因的扩增效率与参照序列(rpl39 cDNA序列)的扩增效率是等价的(扩增效率接近1,即100%)。为了确定上述相对等价,将包含合适cDNA序列的质粒DNA稀释为1/1000、1/10,000、1/100,000和1/1,000,000倍,并且使用上述Q-PCR条件,对各质粒/引物/TaqMan探针组,计算曲线Ct=f(LogDNA的量)的斜率。产生曲线斜率接近3.32的质粒/引物/TaqMan探针组,代表100%的效率,被认为是可接受的。在此使用的质粒/引物/TaqMan探针组具有可接受的Ct=f(LogDNA的量)的值。
  引物   序列   SEQ IDNO:
  124613-F1   5’AATGTCATGTCCCTCCATCGA 3   42
  124613-R1   5’AACTCGGCTGGCTTCTAAAAGTC 3   43
  124613MGB1   5’FAM-CAAAGCAGCAATTAT-MGB 3   44
  rpl39-F1   5’GAACAGGCCCATCCCTTATTG 3   45
  rpl39-R1   5’CGGCGCTTGGCATTGTA3   46
rpl39-MGB1   5’VIC-TGACACATCCAATCACATCGC-MGB 3   47
表5.Q-PCR实验使用的引物列表。
实施例2
编码中果咖啡甘露聚糖合酶的cDNA的鉴定
从一些咖啡文库鉴定了超过47,000种EST序列,所述文库是用从幼叶和不同发育阶段收获的浆果的种粒和果皮组织中分离的RNA产生的。然后将重叠的EST“聚簇”成“单基因”(即,重叠群),并且通过针对NCBI非冗余蛋白质数据库中各个单独序列的BLAST搜索来注释单基因序列。
半乳甘露聚糖对成熟咖啡种粒的干重影响很大,被认为在种粒中分子例如糖的接近(access)或可提取性中扮演重要角色。方法用于分离半乳甘露聚糖合成涉及的关键基因之一,即,甘露聚糖合酶,以及研究该基因在发育的咖啡种粒中的表达。使用tblastn算法(Altschul等人,1990),使用来自瓜尔豆的生化表征的甘露聚糖合酶(CtManS,瓜儿豆,登录号AAR23313;Dhugga等人,2004)的蛋白质序列,搜索我们的DNA序列的″单基因″组。该搜索揭示了一个具有非常高水平的同源性的单基因(单基因#124613)。参见表6。分离并完整的测序该单基因中的两个最长的EST:一个是pcccs46w16i11中的插入片段,发现其长1779bp;而另一个是pcccs46w24c19中的插入片段,发现其长1349bp。在这两个序列之间的比对分析表明,在pcccs46w16i11的cDNA中存在两个内含子序列。如附图2A中的图解,内含子之一是在该克隆的5′端,而发现另一个小得多的内含子序列被包埋在cDNA的ORF中。当从这两种cDNA克隆的共有序列中剪切出内含子序列时,揭示了423个氨基酸的部分ORF;然而,全长瓜尔豆蛋白质是526个氨基酸长。因此,咖啡ManS cDNA不是完整的,缺乏309个以上的碱基对(即,编码103个氨基酸加5′UTR)。
表6.咖啡甘露聚糖合酶EST的在计算机上的分布。在每个不同的中果咖啡EST文库中发现的甘露聚糖合酶EST(单基因124613)的数目。
实施例3
全长ManS序列
克隆pcccs46w16i11编码咖啡ManS序列的主要部分,因此,被用于设计在已良好确立的引物辅助基因组步行技术中使用的特异性引物。第一个实验产生了1084bp长的片段(pJMc2),其将内含子区域另外延长了1000bp以上。然而,由于新的序列在下一个外显子上没有包含任何序列信息,该片段在ORF上没有生产任何新的序列数据。其它的基因组步行实验没有产生新的上游序列。
进行在实施例1中描述的5′RACE PCR来分离该基因的漏失5′编码区。这是用基因特异性引物RNAi-Pr2-GSP1和ManSynt GwR249-GSP2完成的。结果是300碱基对的PCR片段,其被克隆到pCR-4-TOPO载体中,然后测序。获得的序列(pVC2;CcManS Race1)长259pb,并与cDNA克隆pcccs46w16i11的5′端重叠(附图2,显示99bp的重叠序列)。然而,确定该RACE片段漏失该基因的5′端。因此,使用基因特异性引物ManSRace2与ManSRace1进行新的5′RACE PCR。这产生了约400碱基对的PCR片段,其被克隆到pCR-4-TOPO载体中然后测序。获得的序列(pVC3CcManS Race2)长340pb,并与CcManS Race1片段的5′端重叠(附图2A,显示38bp的重叠序列)。
如附图2A中显示的多种克隆允许产生附图2B中显示的DNA比对,其显示这些克隆的重叠序列。该DNA序列信息用于寻找咖啡甘露聚糖合酶CcManS的完整ORF。从新分离的咖啡5′端ManS序列(CcManS Race2)和cDNA pcccs46w16i11中接近全长的编码序列中,设计两种新引物(ManS-Am3和ManS-Am2,表7),其能够使用从中果咖啡(BP-409)或小果咖啡(T2308)黄色发育阶段的种粒中分离的RNA所制造的cDNA,特异性的扩增咖啡甘露聚糖合酶的完整ORF序列(表7)。该PCR扩增实验导致产生cDNA序列,其分别包含在质粒pVC4(罗布斯塔咖啡cDNA)、pVC6(罗布斯塔咖啡cDNA)和pVC7(阿拉比卡咖啡cDNA)中(附图2B)。pVC4插入片段的序列分析表明该cDNA是1898bp,编码530个氨基酸的多肽(估计的分子量是61.29kDa)。注意:发现pVC4中插入片段的DNA序列具有碱基改变,在ORF中导致终止密码子。如附图2B的图例所述,该碱基改变是PCR错误并且不是由相应的基因组序列编码的。pVC6和pVC7插入片段的序列分析表明,这些cDNA序列长1897bp,并各具有1590bp的完整ORF,编码530个氨基酸的多肽,其估计的分子量分别是61.3kDa和61.15kDa。
  引物   序列   SEQ ID NO:
  ManS-Am3   5’CTGCTCATTGCCCTCAG 3’   40
  ManS-Am2   5’GACTTGCTGTACTCGTCTA 3’   41
表7.用于扩增编码CcManS全长蛋白质序列的cDNA序列的引物序列。
然后,将这些蛋白质序列与生化表征的瓜尔豆甘露聚糖合酶(CtManS)的蛋白质序列、以及在GenBank数据库中发现的两种最相关的序列(其一的产物未被表征(即野薯))进行比对。该比对的结果(附图4)显示,中果咖啡ManS(CcManS;pVC6)序列分别与瓜尔豆、拟南芥和野薯序列表现出74.7%、65.9%和58.7%的同一性。在该比对中,拟南芥序列也被称为AtCSLA9(拟南芥纤维素合酶样蛋白质家族A基因#9),并且最近显示,该基因编码的蛋白质具有甘露聚糖合成活性,以及较低程度的葡甘露聚糖合成活性(Liepman,A.,Wilkerson,C.,Keegstra,K.2005Expression ofcellulose synthase-like(Csl)genes in insect cells reveals the CslA familymembers encode mannan synthases.Proc.Natl.Acad.Sci.102,2221-2226)。在咖啡和瓜尔豆蛋白质序列之间高水平的同一性支持这样的论据,即CcManS和CaManS序列编码咖啡种粒中负责甘露聚糖合成的蛋白质。还注意到中果咖啡(pVC6)和小果咖啡(pVC7)的ManS序列享有98.5%的同一性,只有12个核苷酸的差异,其翻译成8个氨基酸的差异。这些甘露聚糖合酶蛋白质的细微差异,可以产生普遍已知的存在于上述两种咖啡之间的提取率的差异。
使用ClustalW进行pVC4(CcManS)、pVC6(CcManS)和pVC7(CaManS)的插入DNA序列与瓜尔豆(AAR23313)和拟南芥(CAB82941)的MansS cDNA序列的比对。该DNA比对显示上述咖啡序列是几乎相同的。相反,瓜尔豆序列显示了与咖啡甘露聚糖合酶序列约67%的同源性,拟南芥显示了与咖啡甘露聚糖合酶序列(CAB82941)约55%的同源性。此外,同一性的区域在整个序列有规律的散布,因此在咖啡序列与瓜尔豆和拟南芥序列之间没有发现非常长的具有连续同一性区域。
实施例4
CcManS表达分析
为了验证CcManS基因编码具有甘露聚糖合酶活性的纤维素合酶-样(Csl)家族成员,该基因被证明仅仅在表现出高水平的甘露聚糖和半乳甘露聚糖合成的组织中表达。使用定量RT-PCR研究了CcManS在阿拉比卡咖啡和罗布斯塔咖啡的多种组织中的表达。获得的结果清楚的显示甘露聚糖合酶在罗布斯塔咖啡和阿拉比卡咖啡的种粒中都有高高表达且几乎仅在其中表达,其中阿拉比卡咖啡T2308种粒看来比罗布斯塔咖啡BP409种粒具有略高水平的甘露聚糖合酶表达。这提示在阿拉比卡咖啡种粒中可能有比罗布斯塔咖啡种粒中更高水平的甘露聚糖合酶活性,特别是在种粒发育的晚期。这一活性上的差异可以导致在阿拉比卡咖啡种粒中发现的甘露聚糖/半乳甘露聚糖的更高水平和/或不同结构。该差异通常可以解释,与罗布斯塔咖啡种粒相比,阿拉比卡咖啡种粒在烘烤或加工的提取固体材料中所经历的更大的困难。
使用QRT-PCR在阿拉比卡咖啡T2308或罗布斯塔咖啡BP409的茎、根、叶、果皮和花组织中,检测到轻微的或没有检测到甘露聚糖合酶表达。小绿色罗布斯塔咖啡样品是唯一没有可检测的甘露聚糖合酶基因表达的种粒样品,这与更早的结果是一致的,所述结果显示该特定的罗布斯塔咖啡阶段/样品还没有表达其它的胚乳特异性基因例如油质蛋白(参见,例如共同拥有的未决申请No.60/696,445)。总而言之,所有的甘露聚糖合酶表达数据都显示,甘露聚糖合酶是专一的、或几乎专一的在咖啡种子较晚的发育阶段表达,所述阶段是当胚乳正在形成或发育时。与该发现一致,也只是在用较晚发育阶段的种粒提取的RNA制成文库中检测到甘露聚糖合酶EST,而在用早期咖啡浆果、咖啡浆果果皮组织或叶组织中提取的RNA制成的文库中没有检测到(参见表6)。总的来说,甘露聚糖合酶表达数据与理论一致,所述理论即在咖啡的种粒中,甘露聚糖合酶基因编码甘露聚糖合成涉及的主要酶,并且通过结合,编码半乳甘露聚糖合成涉及的主要酶。
Figure A20068003813600461
ND=未检测到
表8.CcManS对CcRpl39的相对表达
实施例5
鉴定编码中果咖啡中UDP-Gal依赖性甘露聚糖特异性(1,6)-α-D-半乳糖基转移酶(GMGT)的cDNA
半乳甘露聚糖合成涉及的第二种酶是依赖Mn++、UDP-Gal依赖性甘露聚糖特异性(1,6)-α-D-半乳糖基转移酶(GMGT;(Edwards,Choo,Dickson,Scott,Gridley和Reid 2004)。GMGT以及甘露聚糖合酶被认为以紧密的缔合作用(可能作为复合物)发挥作用,以产生半乳甘露聚糖。
使用tblastn算法将生化表征的百脉根GMGT蛋白质的蛋白质序列(登录号AJ567668)用于搜索我们的DNA序列的″单基因″组(Altschul等人,1990)。该搜索揭示了两个具有高水平同源性的单基因(单基因#122567和单基因#122620)。表9显示在不同的中果咖啡文库中为每个单基因发现的EST的数目。鉴于单基因122620的EST仅在种子中发现,单基因122567的EST仅在叶中发现,单基因#122620可能代表了编码种粒特异性咖啡GMGT的基因。在下文中,该GMGT蛋白质(CcGMGT1)被认为与本文中描述的CcManS作用,合成大多数咖啡种粒半乳甘露聚糖。相反,单基因#122567代表的基因可能编码另一个咖啡GMGT蛋白质(GMGT2),其与.其它咖啡组织例如叶中的半乳甘露聚糖合成相关。
附图5和6中显示了每个单基因的比对。发现单基因122620编码的CcGMGT1 ORF与胡卢巴蛋白质序列具有54.3%的同一性,与百脉根(Japonicus)蛋白质序列具有53.6%同一性。发现单基因122567编码的CcGMGT2ORF与胡卢巴蛋白质序列具有62.8%同一性,与百脉根蛋白质序列具有63.8%同一性。
对于每个基因,用这些部分cDNA序列装备的全长cDNA可以使用完善确立的5′RACE和引物辅助基因组步行技术来分离。GMGT1的全长cDNA可用于在植物组织如咖啡中和模式过表达生物体中表达活性的咖啡种粒GMGT蛋白质,以产生蛋白质,用于函数分析咖啡甘露聚糖合酶蛋白质。咖啡CcMansS和CcGMGT蛋白质可以在相同的植物、酵母或细菌细胞中高水平的表达,这将导致由这些不同类型的细胞生产的充分量的半乳甘露聚糖的产生。
Figure A20068003813600471
表9.咖啡GMGT EST的在计算机芯片上的分布。给出了在不同中果咖啡文库中对每个单基因发现的GMGT EST的数目。
实施例6
分离编码GMGTase 1的完整多肽序列的DNA序列
实施例5介绍了部分的cDNA序列的发现,所述序列编码来自中果咖啡种粒的UDP-Gal依赖性甘露聚糖特异性(1,6)-α-D-半乳糖基转移酶,CcGMGTase 1(CcGMTG1)。为了验证在实施例5中介绍的单基因序列#_122620,完全测序了该单基因中的第二长的EST(pcccs46w8o23)。为了获得pcccs46w8o23的部分的cDNA序列5′端上游CcGMGTase 1的序列数据,用引物GMGT-30w15m14-RACE 4和GMGT-30w15m14-RACE 2(参见表10的序列)进行5′RACE。使用从″黄色″阶段的阿拉比卡咖啡T2308浆果的种粒分离的RNA,按之前在本申请方法部分中的描述制备cDNA。然后,使用酶TdT将多聚dC尾加到阿拉比卡咖啡cDNA上,并且在方法部分中描述的条件下用在5′RACE反应中。第一轮5′RACE使用引物GMGT-30w15m14-RACE 4和AAP,第二轮5′RACE使用引物GMGT-30w15m14-RACE 2和AUAP。两个反应的退火温度是60℃。产生约1000-1100个碱基对的片段,其被克隆到pCR-4-TOPO载体中然后测序。
  引物   序列   SEQIDNO:
  AAP(截短的锚定引物)   5’GGCCACGCGTCGACTAGTACGGGIIGGGIIGGGIIG 3   48
  AUAP(截短的通用扩增引物)   5’GGCCACGCGTCGACTAGTAC 3   49
  GMGT-30w15m14-Race4   5’CTCCCATACCCAGCGTCCTTAAG3   50
  GMGT-30w15m14-Race2   5’TTCTCCAGCGTCCCCACG3   51
表10.用于5’RACE PCR实验的引物列表。
5′RACE产生包含1120bp插入片段的克隆pVC10。该5′RACE产物的完整序列的分析显示它编码咖啡GMGTase 1的N-末端区域。使用一套新的PCR引物,从阿拉比卡咖啡变种T-2308的基因组DNA中,成功的PCR扩增出咖啡GMGTase 1的完整ORF序列(作为单一片段),所述引物是从pVC10的末端5′端和cDNA pcccs46w8o23的3′非编码区设计的。然后,将这些GMGTase 1特异性寡核苷酸GMGT-Fwd1和GMGT-Rev(表11),用于从阿拉比卡咖啡T-2308的基因组DNA中PCR扩增包含GMGTase 1的完整ORF序列的片段,所述基因组DNA是根据以前描述的方法从叶组织中纯化的(Crouzillat等人1996Theor.Appl.Genet.93,205-214)。PCR反应在50μl反应中实施,按照下述:5μl的gDNA、5μl10×PCR缓冲液(ThermoPol缓冲液)、400nM的各基因特异性引物、200μM的各dNTP和0.5U的Taq DNA聚合酶(博鳌莱伯公司(Biolabs))。在94℃变性2分钟后,扩增由40个循环组成,每个循环是94℃1分钟,58℃1.5分钟和72℃3分钟。延伸的附加最终步骤是在72℃进行7分钟。然后用琼脂糖凝胶电泳和溴化乙锭染色分析PCR产物。然后,使用用于测序的TOPO TA克隆试剂盒(英杰生命技术公司(Invitrogen)),根据生产商给出的说明书,将预期大小的片段(~1700pb)克隆到pCR4-TOPO中。然后完整的测序产生的质粒的插入片段。对获得的克隆(pVC11;CaGMGTase1)的序列分析显示,在该基因的大部分编码序列中,GMGTase 1不包含任何内含子(内含子仍可以存在于该基因的末端5′或3′编码区)。
Figure A20068003813600491
表11.用于扩增编码CaGMGT1全长蛋白质序列的基因组序列的引物序列。
用于获得全长咖啡GMGTase1多肽序列的三种克隆显示在附图7中。使用CLUSTALW程序比对产生的DNA序列(附图8)。该比对显示在获得的核苷酸序列中有一些差异。然而,只有两个在氨基酸序列区域的碱基差异导致氨基酸改变(第432位L对P和第445位E对G)。然后将pVC11编码的完整氨基酸序列与在GenBank公众数据库中发现的最同源的DNA序列进行比对。该氨基酸序列比对的结果显示在附图9。CaGMGTase 1序列与望江南决明(Senna occidentalis)半乳甘露聚糖半乳糖基转移酶最高度相关(65%的同一性),并与附图3中的大部分其它蛋白质序列具有约56-57.6%的同一性,支持将CaGMGTase 1的全长多肽序列注释为半乳甘露聚糖半乳糖基转移酶。
实施例7
编码GMGTase2完整多肽序列的cDNA表征
实施例5也提出了部分cDNA序列的发现,所述序列编码中果咖啡的叶的UDP-Gal依赖性甘露聚糖特异性(1,6)-α-D-半乳糖基转移酶,CcGMGTase 2(CcGMGT2)。使用三个同源的EST序列产生该单基因序列(单基因#_122567)。为了验证单基因序列数据,并延伸序列数据至覆盖序列的3′端,测序该单基因组中最长的EST克隆(克隆pcccl26f9)。附图10显示pcccl26f9的完整DNA序列与单基因序列#_122567的比对。不出所料,通过多聚A尾的存在证明,pcccl26f9的完整序列包含CcGMGTase 2的3′端。pcccl26f9编码的ORF还包含GMGTase 2的N-末端区域。pcccl26f9的5′端DNA序列几乎与单基因的是一致的。但是,单基因序列的更详细分析揭示,pcccl26f9序列的第一个甲硫氨酸密码子(ATG)在单基因序列中实际上是ATC,因此,没有看见从单基因DNA序列获得的N-末端氨基酸序列。然后,比对pcccl26f9编码的氨基酸序列与公众GenBank数据库中发现的一些最紧密相关的序列(图11)。该比对的检测表明,虽然咖啡GMGTase 1和GMGTase 2序列具有显著的同源性区域(它们具有约52%同一性),但是它们明显是由不同基因编码的。该比对还再次显示,咖啡GMGTase 2也与一组注释为半乳糖基转移酶的蛋白质高度相关。总之,本文提出的证据强烈的表明,从咖啡叶EST文库中分离的cDNA克隆(pcccl26f9)编码在咖啡叶中表达的咖啡GMGTase的完整的多肽序列。
实施例8
咖啡GMGTase1的表达分析
使用定量RT-PCR和相对定量(相对于rpl39的表达)的方法分析GMGTase 1在多种阿拉比卡咖啡和罗布斯塔咖啡组织中的表达水平。使用的方法与以前描述的测量咖啡种粒甘露聚糖合酶表达的方法相似。表12中显示了使用的特异性引物和探针组。对引物/TaqMan探针组的扩增效率的测量,证明它们处于效率的可接受范围内。按照在该申请之前描述的使用SuperScript III(英杰生命技术公司(Invitrogen))制备cDNA。
  引物   序列  SEQ ID NO:
  rpl39F1   5’GAACAGGCCCATCCCTTATTG 3   54
  rpl39R1   5’CGGCGCTTGGCATTGTA 3   55
  rpl39MGB1 VIC   5’ATGCGCACTGACAACA 3   56
  GMGT1-F1   5’CGCCTCTGCCGTTCGA 3   57
  GMGT1-R1   5’ATTTCTAGGAAGCGCCTCCAA 3   58
  GMGT1-MGB1FAM   5’CCAGCATCGGACCTT  3   59
表12.用于定量RT-PCR实验的引物和探针序列。
结果描述在附图12中,并证明GMGTase 1主要在罗布斯塔咖啡和阿拉比卡咖啡的种粒中表达。有趣的,在检测的阿拉比卡咖啡与罗布斯塔咖啡的cDNA样品发现的RQ中约有十倍差异。可能该表达差异会有助于两个物种的种粒中半乳甘露聚糖水平和/或结构上的一些差异。还观察到罗布斯塔咖啡中GMGTase 1的表达在黄色阶段是最高的。这与阿拉比卡咖啡形成对比,在所述阿拉比卡咖啡中最高表达是在小绿色和大绿色阶段中观察到的。还在大部分测试的其它组织中检测到低水平的GMGTase 1表达,还是在阿拉比卡咖啡中检测到比罗布斯塔咖啡更高的表达。最后,注意到观察的GMGTase 1的表达模式反映了观察的甘露聚糖合酶表达的表达模式。因为提议这两个蛋白质在半乳甘露聚糖合成中一起作用,GMGTase 1表达数据进一步支持GMGTase 1是咖啡种粒半乳甘露聚糖合成中的关键参与者。
参考文献:
Altschul S.F.,Madden T.L.,Schaffer A.A.,Zhang J.,Zhang Z.,MillerW.和Lipman D.J.(1997)Gapped BLAST and PSI-BLAST:a newgeneration of protein database search programs.Nucleic Acids Res.25:3389-3402
Bacic A,Harris P,Stone B (1988)Structure and function of plant cellwalls.In J Priess,编著,The biochemistry of plants;a comprehensivetreatise,第14卷,Carbohydrates,Academic Press,New York,第297-371页
Buckeridge M,Pessosa dos Santos H,Tine M (2000)Mobilization ofstorage cell wall polysaccharides in seeds.Plant Physiol Biochem 38:141-156
Charles-Bernard M,Kraehenbuehl K,Rytz A,Roberts D (2005)Interactions between volatile and non-volatile coffee components.1.Screening of non-volatile components.J Agric Food Chem 53:4417-4425
Crouzillat D.,Lerceteau E.,Petiard V.,Morera J.,Rodriguez H.,Walker D.,Philips W.R.R.,Schnell J.,Osei J.和Fritz P.(1996).Theobromacacao L.:a genetic linkage map and quantitative trait loci analysis.TheorAppl Genet.93:205-214.
Cutler S,Somerville C (1997)Cloning in silico.Curr Biol 7:R108-R111
Dhugga KS,Barreiro R,Whitten B,Stecca K,Hazebroek J,Randhawa GS,Dolan M,Kinney A J,Tomes D,Nichols S,Anderson P.(2004)Guar seed beta-mannan synthase is a member of the cellulosesynthase super gene family.Science.2004Jan 16;303(5656):363-6.
Edwards M,Choo T,Dickson C,Scott C,Gridley M,Reid J (2004)The seeds of Lotud japonicus lines transformed with sense,antisense,andsense/antisense galactomannan galactosyltransferase constructs havestructurally altered galactomannans in their endosperm cell walls.PlantPhysiol 134:1153-1162
Edwards M,Scott C,Gidley M,Reid J (1992)Control ofmannose/galactose ratio during galactomannan formation in developinglegume seeds.Planta 187:67-74
Fischer M,Reimann S,Trovato V,Redgwell RJ (2001)Polysaccharides of green Arabica and Robusta coffee beans.CarbohydrateResearch 330:93-101
Fry S (2004)Primary cell wall metabolism:tracking the careers ofwall polymers in living plant cells.New Phytologist 161:641-675
Handford M,Baldwin T,Goubet F,Prime T,Miles J,Yu X,Dupree P(2003)Localization and characterization of cell wall mannanpolysaccharised in Arabidopsis thaliana.Planta 218:27-36
Hanford M,Baldwin T,Goubet F,Prime T,Miles J,Yu X,Dupree P(2003)Localisation and characterization of cell wall mannanpolysaccharides in Arabidopsis thaliana.Planta 218:27-36
Hazen SP,Scott-Craig JS,Walton JD (2002)Cellulose synthase-likegenes of rice.Plant Physiol 128:336-340
Illy A,Viani R (1995)Expresso Coffee.The chemistry of quality.Academic Press,London,第5-7页
Joersbo M,Marcussen J,Brunstedt J (2001)In vivo modification ofthe cell wall polysaccharide galactomannan of guar transformed with analph-galactosidase gene cloned from senna.Molecular Breeding 7:211-219
Keegstra K,Raikhel N (2001)Plant glycosyltransferases.Curr OpinPlant Biol 4:219-224
Liepman A,Wilkerson C,Keegstra K (2005a)Expression of cellulosesynthase-like (Csl)genes in insect cells reveals that CslA family membersencode mannan synthases.Proc Natl Acad Sci 102:2221-2226
Lundqvist,J.,Teleman,A.,Junel,L.,Zacchi,G.,Dahlman,O.,Tjerneld,F.,Stalbrand,H (2002),Isolation and characterization ofgalactomannan from spruce (Picea abies)Carbohydr Polym 48,29-39
Marraccini P.,Deshayes A.,Pétiard V.和Rogers W.J.1999.Molecularcloning of the complete 11S seed storage protein gene of Coffea arabicaand promoter analysis in the transgenic tobacco plants.Plant Physiol.Biochem.37:273-282.
Marraccini,P.,Deshayes,A.,和Rogers,W.J.Coffee plant withreduced alpha-D-galactosidase.EP1436402.2004.
参考文献类型:专利
Marraccini P,Rogers J,Allard C,Andre M-L,Caillet V,Lacoste N,Lausane F,Michaux S (2001)Molecular and biochemical characterizationof endo-beta-mannanases from germination coffee (Coffea arabica)grains.Planta 213:296-308
Marraccini P,Courjault C,Caillet V,Lausanne F,LePage B,RogersW,Tessereau S和Deshayes A.(2003)Rubisco small subunit of Coffeaarabica:cDNA sequence,gene cloning and promoter analysis in transgenictobacco plants.Plant Physiol.Biochem.41:17-25.
Marraccini P,Rogers J,Caillet V,Deshayes A,Granato D,Lausane F,Lechat S,Pridmore D,Petiard V (2005)Biochemical and molecularcharacterization of alpha-D-galactosidase from coffee beans.PlantPhysiology and Biochemistry
Matheson M (1990)Mannose-based polysaccharides.Methods PlantBiochem 12:371-413
Nunes F,Coimbra M,Duarte A,Delgadillo I (1997)J Agric FoodChem 45:3238-3243
Oosterveld A,Harmsen JS,Voragen AGJ,Schols HA (2003)Extraction and characterization of polysaccharides from green and roastedCoffea arabica beans.Carbohydrate Polymers 52:285-296
Pettolino F,Hoogenraad N,Ferguson C,Bacic A,Johnson E,Stone B(2001)A (1-4)-beta-mannan specific monoclonal antibody and its use in theimmunocytochemical location of galactomannans.Planta 214:235-242
Redgwell R,Curti D,Rogers J,Nicolas P,Fischer M (2003)Changesto the galactose/mannose ratio in galactomannans during coffee bean(Coffea arabica L.)development:implications for in vivo modification ofgalactomannan synthesis.Planta 217:316-326
Redgwell RJ,Trovato V,Curti D,Fischer M (2002)Effect of roastingon degradation and structural features of polysaccharises in Arabica coffeebeans.Carbohydrate Research 337:421-431
Reid J (1985)Structure and function in legume-seed polysaccharides.In C Brett,J Hillman,编著,Biochemistry of plant cell walls,CambridgeUniversity Press,Cambridge,第259-268页
Reid J,Bewley J (1979)A dual role for the endosperm and itsgalactomannan reserves in the germinative physiology of fenugreek(Trigonella foenum-graecum L.)an endospermic leguminous seed.Planta147:145-150
Richmond TA,Somerville CR (2000)The cellulose synthasesuperfamily.Plant Physiol 124:495-498
Schroder,R.,Nicolas,P.,Vincent,S.,Fischer,M,Reymond,S.,和Redgewell,R.(2001),Purification and characterization of agalactoglucomannan from kiwi fruit (Actinidia deliciosa)Carbohydr Res.331,291-306
Sims,I.和Craik,D.,和Bacic,A.(1997)Structural characterization ofgalactoglucomannan secreted by suspension-cultured cells of Nicotianaplumbaginifolia Carbohydr Res 303,79-92
Somerville C,Bauer S,Brininstool G,Facette M,Hamann T,Milne J,Osborne E,Paredez A,Persson S,Raab T,Vorwerk S,Youngs H (2004a)Toward a systems approach to understanding plant cell walls.Science 306:2206-2211
Somerville C,Bauer S,Brininstool G,Facette M,Hamann T,Milne J,Osborne E,Paredez A,Persson S,Raab T,Vorwerk S,Youngs H (2004b)Toward a systems approach to understanding plant cell walls.Science 306:2206-2211
Somerville C,Bauer S,Brininstool G,Facette M,Hamann T,Milne J,Osborne E,Paredez A,Persson S,Raab T,Vorwerk S,Youngs H (2005)Toward a systems approach to understanding plant cell walls.Science 306:2206-2211
Sunderland P,Hallet I,MacRea E,Fischer M,Redgwell R (2004)Cytochemistry and immunolocalization of polysaccharides andproteoglycans in the endosperm of green Arabica coffee beans.Protoplasma 223:203-211
Yeretzian C,Jordan A,Badoud R,Lindinger W (2005)From thegreen bean to the coffee cup:investigating coffee roasting by on-linemonitoring of volatiles.Eur Food Res Technol 214:92-104
序列表
<210>1
<211>1898
<212>DNA
<213>中果咖啡(Coffea canephora)
<220>
<221>misc_feature
<222>(1118)..(1118)
<223>用T对A的突变
N显示在此序列中
<400>1
ctgctcattg ccctcagctc ctaagggctc tatcattttg gcttcaagtt caagttcttc     60
ttcaccttca aaaaagcatt tcgttgctcc acttccacaa tcatagcctg ataaaatgag    120
aaactcagtt tctctagagt ccgagccaga ggtaaattta tatgatgata ctggcagaag    180
tctcagccaa gcatgggacc gtatacgagt tcctataatt gtgccaattc tgcggtttgc    240
tttatatgta tgcatagcaa tgtctgttat gcttttcatt gaacgggcgt acatggcgat    300
tgtgattgga tgtgtcaagt gcttgggaag gaaacgatat accaagtata atcttgatgc    360
cataaaagaa gacctagagc aaaacagaaa ctatcctatg gtgctggtcc aaatacccat    420
gtttaacgaa aaagaggtct ataaactctc aattggagct gcatgtgggc tttcatggcc    480
atcagataga ttaatagttc aggttcttga tgactccacg aatgaagtcc tgcgggcatt    540
ggtggagttg gagtgtcaaa gatggataga gaaaggggtg aatgtggagt atgaaacaag    600
gaacaacagg aatggttata aagcaggtgc acttcgggat ggtctaaaaa ggccatatgt    660
tgaaggttgt gagtttgtcg tcatttttga tgcagacttc cagcctgagg aggactttct    720
gtggagaaca gtgccttatc ttcttgaaaa cccagagctg gctttggttc aagcccgatg    780
gaaatttgta aatgcaaatg aatgtttaat gacgcggctt caggagatgt cactagacta    840
tcacttcagt gtggagcaag aagtaggctc gtcaacatgt tcattctttg ggtttaatgg    900
aactgccggt gtatggagga tccaagcagt aagtgatgct ggtggatgga aagataggac    960
cacggttgag gatatggacc ttgcagtaag ggctagcctt aagggttgga aattcatctt   1020
tgtgggagat ttatctgtca aaaatgaact tccaagcact ttcaaggctt atagatttca   1080
gcagcatcga tggtcgtgtg gcccagccaa tctcttcnga aaaatgttca aagaaattct   1140
cctttgtgag cgtgtgtcca tctggaagaa attccatgtc atctatgcct tcttctttgt   1200
gaggaagata gttgcacact gggttacttt tttcttctac tgcattgtga tcccagcaac   1260
tatcttagtt cctgaagtgc atcttccaaa gccaatagca gtttatctgc cagcaaccat   1320
tacacttctt aatgcagcta gcactccaag gtccttgcat ctactcgtgt tctggatact   1380
gtttgagaat gtcatgtccc tccatcgatc caaagcagca attataggac ttttagaagc   1440
cagccgagtt aacgagtgga ttgtgacgga aaagcttgga aacgcattga agcaaaagta   1500
cagcatcccc aaagtatcta agagaccaag atcacgaatt gcagaaagga tccacttttt   1560
ggagctgata atgggaatgt atatgctgca ctgtgctttc tacaacatga tctttgcaaa   1620
cgatcatttc ttcatatacc tgttacttca agcaggggct ttcttcacaa tagggcttgg   1680
ttacattgga acaattgtcc ctacttaaga agctaggcat accgaaaata aagcctccaa   1740
aaggacaagc aggctgctgg aagctactgt catttggtat atccatctag tagcatacta   1800
ctaagtcatg gtattatttt tcaatgttct ttatactgag tgtcctcaag ggtctctgca   1860
cttcgggccc cccttaatat agacgagtac agcaagtc                           1898
<210>2
<211>1897
<212>DNA
<213>中果咖啡
<400>2
tgctcattgc cctcagctcc taagggctct atcattttgg cttcaagttc aagttcttct     60
tcaccttcaa aaaagcattt cgttgcttca cttccacaat tatagcctga taagatgaga    120
aactcagttt ttctagagcc cgagccagag gtaaatttat atgatgatac tggcagaagt    180
ctcagccaag catgggaccg tatacgagtt cctataattg tgccgattct gcggtttgct    240
ttatatgtat gcatagcaat gtctgttatg cgtttcattg aacgggtgta catggcgatt    300
gtgattggat gtgtcaagtg cttgggaagg aaacgatata ccaagtataa tcttgatgcc    360
ataaaagaag acctagagca aaacagaaac tatcctatgg tgctggtcca aatacccatg    420
tttaacgaaa aagaggtcta taaactctca attggagctg catgtgggct ttcatggcca    480
tcagatagac taatagttca ggttcttgat gactccacga atgaagtcct gcgggcattg    540
gtggagttgg agtgtcaaag atggatagag aaaggggtga atgtgaagta tgaaacaagg    600
aacaacagga atggttataa agcaggtgca cttcgggatg gtctaaaaaa gccatatgtt    660
gaagattgtg agttcgtcgt catttttgat gcagacttcc agcctgagga ggactttctg    720
tggagaacag tgccttatct tcttgaaaac ccagagctgg ctttggttca agcccgatgg    780
aaatttgtaa atgcaaatga atgtttaatg acgcggcttc aggagatgcc actagactat   840
cacttcagtg tggagcaaga agtaggctcg tcaacatgtt cattctttgg gtttaatgga   900
actgccggtg tatggaggat ccaagcagta agcgatgctg gtggatggaa agataggacc   960
acggttgagg atatggacct tgcagtaagg gctagcctta agggctggaa attcatcttt  1020
gtgggagatt tatctgtcaa aaatgaactt ccaagcactt tcaaggctta tagatttcag  1080
cagcatcgat ggtcgtgtgg cccagccaat ctcttcagaa aaatgttcaa agaaattctc  1140
ctttgtgagc gtgtgtccat ctggaagaaa ttccatgtca tctatgcctt ctcctttgtg  1200
aggaagatag ttgcacactg ggttactttt ttcttctact gcatcgtgat cccagcaact  1260
atcttagttc ctgaagtgca tcttccaaag ccaatagcag tttatctgcc agcaaccatt  1320
acacttctta atgcagctag cactccaagg tccttgcatc tactcgtgtt ctggatactg  1380
tttgagaatg tcatgtccct ccatcgatcc aaagcagcaa ttataggact tttagaagcc  1440
agccgagtta acgagtggat tgtgacggaa aagcttggaa acgcattgaa gcaaaagtac  1500
agcatcccca aagtatctaa gagaccaaga tcacgaattg cagaaaggat ccactttttg  1560
gagctgataa tgggaatgta tatgctgcac tgtgctttct acaacatgat ctttgcaaac  1620
gatcatttct tcatatacct gttacttcaa gcaggggctt tcttcataat agggcttggt  1680
tacattggaa caattgtccc tacttaagaa gctaggcata ccgaaaataa agcctccaaa  1740
aggacaagca ggctgctgga agctactgtc atttggtata tccatcttgt agcatactac  1800
taagtcatgg tattattttt caatgttctt tatactgtgt gtcctcaagg gtctctgcac  1860
ttcgggcccc ccttaatata gacgagtaca gcaagtc                           1897
<210>3
<211>1897
<212>DNA
<213>小果咖啡(Coffea arabica)
<400>3
tgctcattgc cctcagctcc taagggctct atcattttgg cttcaagttc aagttcttct     60
tcaccttcaa aaaagcattt cgttgcttca cttccacaat tatagcctga taagatgaga    120
aactcagttt ttctagagcc cgagccagag gtaaatttat atgatgatac tggcagaagt    180
ctcagccaag catgggaccg tatacgagtt cctataattg tgccgattct gcggtttgct    240
ttatatgtat gcatagcaat gtctgttatg cttttcatcg aacgggtgta catggcgatt    300
gtgattggat gtgtcaagtg cttgggaagg aaacgatata ccaagtataa tcttgatgcc    360
ataaaagaag acctagagca aaacagaaac tatcctatgg tgctggtcca aatacccatg    420
tttaacgaaa aagaggtcta taaactctca attggagctg catgtgggct ttcacggcca    480
tcagatagac taatagttca ggttcttgat gactccacga atgaagtcct gcgggcattg    540
gtggagttgg agtgtcaaag atggatagag aaaggggtga atgtgaagta tgaaacaagg    600
aacaacagga atggttataa agcaggtgca cttcgggatg gtctaaaaaa gccatatgtt    660
gaagattgtg agtttgtcgt catttttgat gcagacttcc agcctgagga ggactttctg    720
tggagaacag tgccttatct tcttgaaaac ccagagctgg ctttggttca agcccgatgg    780
aaatttgtaa atgcaaatga atgtttaatg acgcggcttc aggagatgtc actagactat    840
cacttcagtg tggagcaaga agtaggctcg tcaacatgtt cattctttgg gtttaatgga    900
actgccggtg tatggaggat ccaagcagta agtgatgctg gtggatggaa agataggacc    960
acggttgagg atatggacct tgcagtaagg gctagcctta agggttggaa attcatcttt   1020
gtgggagatt tatctgtcaa aaatgaactt ccaagcactt tcaaggctta tagatttcag   1080
cagcatcgat ggtcgtgtgg cccagccaat ctcttcagaa aaatgttcaa agaaattctc   1140
ctttgtgagc gtgtgtccat ctggaagaaa ttccatgtca tctatgcctt cttctttgtg   1200
aggaagatag ttgcacactg ggttactttt ttcttctact gcatcgtgat cccagcaact   1260
atcttagttc ctgaagtgca tcttccaaag ccaatagcag tttatccgcc agcaaccatt   1320
acacttctta atgcagctag cactccaagg tccttgcatc tactcgtgtt ctggatactg   1380
tttgagaatg tcatgtccct ccatcgatcc aaagcagcaa ttataggact tttagaagcc   1440
agccgagtta acgagtggat tgtgacggaa aagcttggaa acgcattgaa gcaaaagtac   1500
agcatcccca aagtatctaa gagaccagga tcacgaattg cagaaaggat ccactttttg   1560
gagctgataa tgggaatgta tatgctgcac tgtgctttct acaacctgat ctttgcaaac   1620
gatcatttct tcatataccc gttacttcaa gcaggggctt tcttcataat agggcttggt   1680
tacattggaa caattgtccc tacttaagaa gctaggcata ccgaaaataa agcctccaaa   1740
aggacaagca ggctgctgga agctactgtc atttggtata tccatcttgt agcatactac   1800
taagtcatgg tattattttt caatgttctt tatactgtgt gtcctcaagg gtctctgcac   1860
ttcgggcccc ccttaatata gacgagtaca gcaagtc                            1897
<210>4
<211>530
<212>PRT
<213>中果咖啡
<220>
<221>MISC_FEATURE
<222>(335)..(335)
<223>由于通过T而不是A的在核酸序列中的突变,在此生成了终止密码子。
<400>4
Met Arg Asn Ser Val Ser Leu Glu Ser Glu Pro Glu Val Asn Leu Tyr
1             5               10               15
Asp Asp Thr Gly Arg Ser Leu Ser Gln Ala Trp Asp Arg Ile Arg Val
          20               25               30
Pro Ile Ile Val Pro Ile Leu Arg Phe Ala Leu Tyr Val Cys Ile Ala
      35               40                45
Met Ser Val Met Leu Phe Ile Glu Arg Ala Tyr Met Ala Ile Val Ile
   50               55               60
Gly Cys Val Lys Cys Leu Gly Arg Lys Arg Tyr Thr Lys Tyr Asn Leu
65               70               75               80
Asp Ala Ile Lys Glu Asp Leu Glu Gln Asn Arg Asn Tyr Pro Met Val
             85               90               95
Leu Val Gln Ile Pro Met Phe Asn Glu Lys Glu Val Tyr Lys Leu Ser
         100               105               110
Ile Gly Ala Ala Cys Gly Leu Ser Trp Pro Ser Asp Arg Leu Ile Val
      115               120              125
Gln Val Leu Asp Asp Ser Thr Asn Glu Val Leu Arg Ala Leu Val Glu
   130               135              140
Leu Glu Cys Gln Arg Trp Ile Glu Lys Gly Val Asn Val Glu Tyr Glu
145              150              155              160
Thr Arg Asn Asn Arg Asn Gly Tyr Lys Ala Gly Ala Leu Arg Asp Gly
             165              170              175
Leu Lys Arg Pro Tyr Val Glu Gly Cys Glu Phe Val Val Ile Phe Asp
          180              185              190
Ala Asp Phe Gln Pro Glu Glu Asp Phe Leu Trp Arg Thr Val Pro Tyr
      195               200              205
Leu Leu Glu Asn Pro Glu Leu Ala Leu Val Gln Ala Arg Trp Lys Phe
   210              215              220
Val Asn Ala Asn Glu Cys Leu Met Thr Arg Leu Gln Glu Met Ser Leu
225              230              235              240
Asp Tyr His Phe Ser Val Glu Gln Glu Val Gly Ser Ser Thr Cys Ser
              245              250              255
Phe Phe Gly Phe Asn Gly Thr Ala Gly Val Trp Arg Ile Gln Ala Val
          260              265              270
Ser Asp Ala Gly Gly Trp Lys Asp Arg Thr Thr Val Glu Asp Met Asp
       275              280              285
Leu Ala Val Arg Ala Ser Leu Lys Gly Trp Lys Phe Ile Phe Val Gly
   290              295               300
Asp Leu Ser Val Lys Asn Glu Leu Pro Ser Thr Phe Lys Ala Tyr Arg
305              310              315              320
Phe Gln Gln His Arg Trp Ser Cys Gly Pro Ala Asn Leu Phe Xaa Lys
             325              330              335
Met Phe Lys Glu Ile Leu Leu Cys Glu Arg Val Ser Ile Trp Lys Lys
          340              345              350
Phe His Val Ile Tyr Ala Phe Phe Phe Val Arg Lys Ile Val Ala His
      355               360              365
Trp Val Thr Phe Phe Phe Tyr Cys Ile Val Ile Pro Ala Thr Ile Leu
   370              375               380
Val Pro Glu Val His Leu Pro Lys Pro Ile Ala Val Tyr Leu Pro Ala
385              390              395              400
Thr Ile Thr Leu Leu Asn Ala Ala Ser Thr Pro Arg Ser Leu His Leu
             405              410              415
Leu Val Phe Trp Ile Leu Phe Glu Asn Val Met Ser Leu His Arg Ser
          420              425              430
Lys Ala Ala Ile Ile Gly Leu Leu Glu Ala Ser Arg Val Asn Glu Trp
       435              440              445
Ile Val Thr Glu Lys Leu Gly Asn Ala Leu Lys Gln Lys Tyr Ser Ile
   450              455              460
Pro Lys Val Ser Lys Arg Pro Arg Ser Arg Ile Ala Glu Arg Ile His
465              470              475              480
Phe Leu Glu Leu Ile Met Gly Met Tyr Met Leu His Cys Ala Phe Tyr
             485               490              495
Asn Met Ile Phe Ala Asn Asp His Phe Phe Ile Tyr Leu Leu Leu Gln
         500               505              510
Ala Gly Ala Phe Phe Thr Ile Gly Leu Gly Tyr Ile Gly Thr Ile Val
      515               520              525
Pro Thr
   530
<210>5
<211>530
<212>PRT
<213>中果咖啡
<400>5
Met Arg Asn Ser Val Phe Leu Glu Pro Glu Pro Glu Val Asn Leu Tyr
1             5               10               15
Asp Asp Thr Gly Arg Ser Leu Ser Gln Ala Trp Asp Arg Ile Arg Val
          20               25               30
Pro Ile Ile Val Pro Ile Leu Arg Phe Ala Leu Tyr Val Cys Ile Ala
      35               40               45
Met Ser Val Met Arg Phe Ile Glu Arg Val Tyr Met Ala Ile Val Ile
   50               55               60
Gly Cys Val Lys Cys Leu Gly Arg Lys Arg Tyr Thr Lys Tyr Asn Leu
65               70               75               80
Asp Ala Ile Lys Glu Asp Leu Glu Gln Asn Arg Asn Tyr Pro Met Val
             85               90               95
Leu Val Gln Ile Pro Met Phe Asn Glu Lys Glu Val Tyr Lys Leu Ser
          100              105              110
Ile Gly Ala Ala Cys Gly Leu Ser Trp Pro Ser Asp Arg Leu Ile Val
      115               120              125
Gln Val Leu Asp Asp Ser Thr Asn Glu Val Leu Arg Ala Leu Val Glu
   130              135               140
Leu Glu Cys Gln Arg Trp Ile Glu Lys Gly Val Asn Val Lys Tyr Glu
145              150              155               160
Thr Arg Asn Asn Arg Asn Gly Tyr Lys Ala Gly Ala Leu Arg Asp Gly
             165              170              175
Leu Lys Lys Pro Tyr Val Glu Asp Cys Glu Phe Val Val Ile Phe Asp
          180              185              190
Ala Asp Phe Gln Pro Glu Glu Asp Phe Leu Trp Arg Thr Val Pro Tyr
      195               200              205
Leu Leu Glu Asn Pro Glu Leu Ala Leu Val Gln Ala Arg Trp Lys Phe
   210              215               220
Val Asn Ala Asn Glu Cys Leu Met Thr Arg Leu Gln Glu Met Pro Leu
225               230             235              240
Asp Tyr His Phe Ser Val Glu Gln Glu Val Gly Ser Ser Thr Cys Ser
             245              250               255
Phe Phe Gly Phe Asn Gly Thr Ala Gly Val Trp Arg Ile Gln Ala Val
          260              265              270
Ser Asp Ala Gly Gly Trp Lys Asp Arg Thr Thr Val Glu Asp Met Asp
       275              280              285
Leu Ala Val Arg Ala Ser Leu Lys Gly Trp Lys Phe Ile Phe Val Gly
   290              295               300
Asp Leu Ser Val Lys Asn Glu Leu Pro Ser Thr Phe Lys Ala Tyr Arg
305              310              315              320
Phe Gln Gln His Arg Trp Ser Cys Gly Pro Ala Asn Leu Phe Arg Lys
             325              330              335
Met Phe Lys Glu Ile Leu Leu Cys Glu Arg Val Ser Ile Trp Lys Lys
          340              345              350
Phe His Val Ile Tyr Ala Phe Ser Phe Val Arg Lys Ile Val Ala His
       355              360              365
Trp Val Thr Phe Phe Phe Tyr Cys Ile Val Ile Pro Ala Thr Ile Leu
   370              375              380
Val Pro Glu Val His Leu Pro Lys Pro Ile Ala Val Tyr Leu Pro Ala
385              390              395              400
Thr Ile Thr Leu Leu Asn Ala Ala Ser Thr Pro Arg Ser Leu His Leu
             405               410              415
Leu Val Phe Trp Ile Leu Phe Glu Asn Val Met Ser Leu His Arg Ser
          420              425              430
Lys Ala Ala Ile Ile Gly Leu Leu Glu Ala Ser Arg Val Asn Glu Trp
      435               440              445
lle Val Thr Glu Lys Leu Gly Asn Ala Leu Lys Gln Lys Tyr Ser Ile
   450              455               460
Pro Lys Val Ser Lys Arg Pro Arg Ser Arg Ile Ala Glu Arg Ile His
465              470              475               480
Phe Leu Glu Leu Ile Met Gly Met Tyr Met Leu His Cys Ala Phe Tyr
             485              490               495
Asn Met Ile Phe Ala Asn Asp His Phe Phe Ile Tyr Leu Leu Leu Gln
          500              505              510
Ala Gly Ala Phe Phe Ile Ile Gly Leu Gly Tyr Ile Gly Thr Ile Val
      515               520              525
Pro Thr
   530
<210>6
<211>530
<212>PRT
<213>小果咖啡
<400>6
Met Arg Asn Ser Val Phe Leu Glu Pro Glu Pro Glu Val Asn Leu Tyr
1            5                10               15
Asp Asp Thr Gly Arg Ser Leu Ser Gln Ala Trp Asp Arg Ile Arg Val
          20               25               30
Pro Ile Ile Val Pro Ile Leu Arg Phe Ala Leu Tyr Val Cys Ile Ala
       35               40              45
Met Ser Val Met Leu Phe Ile Glu Arg Val Tyr Met Ala Ile Val Ile
   50               55               60
Gly Cys Val Lys Cys Leu Gly Arg Lys Arg Tyr Thr Lys Tyr Asn Leu
65               70               75               80
Asp Ala Ile Lys Glu Asp Leu Glu Gln Asn Arg Asn Tyr Pro Met Val
             85               90               95
Leu Val Gln Ile Pro Met Phe Asn Glu Lys Glu Val Tyr Lys Leu Ser
          100              105              110
Ile Gly Ala Ala Cys Gly Leu Ser Arg Pro Ser Asp Arg Leu Ile Val
      115               120              125
Gln Val Leu Asp Asp Ser Thr Asn Glu Val Leu Arg Ala Leu Val Glu
   130              135               140
Leu Glu Cys Gln Arg Trp Ile Glu Lys Gly Val Asn Val Lys Tyr Glu
145              150              155               160
Thr Arg Asn Asn Arg Asn Gly Tyr Lys Ala Gly Ala Leu Arg Asp Gly
             165              170               175
Leu Lys Lys Pro Tyr Val Glu Asp Cys Glu Phe Val Val Ile Phe Asp
          180              185              190
Ala Asp Phe Gln Pro Glu Glu Asp Phe Leu Trp Arg Thr Val Pro Tyr
      195               200              205
Leu Leu Glu Asn Pro Glu Leu Ala Leu Val Gln Ala Arg Trp Lys Phe
   210              215               220
Val Asn Ala Asn Glu Cys Leu Met Thr Arg Leu Gln Glu Met Ser Leu
225              230              235               240
Asp Tyr His Phe Ser Val Glu Gln Glu Val Gly Ser Ser Thr Cys Ser
             245               250              255
Phe Phe Gly Phe Asn Gly Thr Ala Gly Val Trp Arg Ile Gln Ala Val
          260              265              270
Ser Asp Ala Gly Gly Trp Lys Asp Arg Thr Thr Val Glu Asp Met Asp
       275              280              285
Leu Ala Val Arg Ala Ser Leu Lys Gly Trp Lys Phe Ile Phe Val Gly
   290               295              300
Asp Leu Ser Val Lys Asn Glu Leu Pro Ser Thr Phe Lys Ala Tyr Arg
305              310              315               320
Phe Gln Gln His Arg Trp Ser Cys Gly Pro Ala Asn Leu Phe Arg Lys
             325              330               335
Met Phe Lys Glu Ile Leu Leu Cys Glu Arg Val Ser Ile Trp Lys Lys
          340              345              350
Phe His Val Ile Tyr Ala Phe Phe Phe Val Arg Lys Ile Val Ala His
      355               360              365
Trp Val Thr Phe Phe Phe Tyr Cys Ile Val Ile Pro Ala Thr Ile Leu
   370              375               380
Val Pro Glu Val His Leu Pro Lys Pro Ile Ala Val Tyr Pro Pro Ala
385              390              395              400
Thr Ile Thr Leu Leu Asn Ala Ala Ser Thr Pro Arg Ser Leu His Leu
             405              410               415
Leu Val Phe Trp Ile Leu Phe Glu Asn Val Met Ser Leu His Arg Ser
          420              425              430
Lys Ala Ala Ile Ile Gly Leu Leu Glu Ala Ser Arg Val Asn Glu Trp
      435               440              445
Ile Val Thr Glu Lys Leu Gly Asn Ala Leu Lys Gln Lys Tyr Ser Ile
   450              455               460
Pro Lys Val Ser Lys Arg Pro Gly Ser Arg Ile Ala Glu Arg Ile His
465              470              475               480
Phe Leu Glu Leu Ile Met Gly Met Tyr Met Leu His Cys Ala Phe Tyr
             485              490               495
Asn Leu Ile Phe Ala Asn Asp His Phe Phe Ile Tyr Pro Leu Leu Gln
          500              505              510
Ala Gly Ala Phe Phe Ile Ile Gly Leu Gly Tyr Ile Gly Thr Ile Val
      515               520              525
Pro Thr
   530
<210>7
<211>XXXX
<212>DNA
<213>中果咖啡
<210>8
<211>xxxx
<212>DNA
<213>中果咖啡
<210>9
<211>xxxx
<212>DNA
<213>中果咖啡
<210>10
<211>xxxx
<212>DNA
<213>中果咖啡
SEQID NO:11
--------
<213>生物体名:中果咖啡
<400>预序列行(PreSequenceString):
atattatttt gaggggtact ggatggaaat cgtggggacg ctggagaaca tcaccgacgc      60
gtacacgggg atcgagaagc gggagaggag attgaggagg aggcatgcag agagagtggg     120
ggagagttat ggtaaggtgt gggaggagca ccttaaggac gctgggtatg ggagggggag     180
ttggaggaga ccgttcatga ctcacttcac ggggtgtcag ccttgtagcg gggaccacaa     240
ccagatgtac tctgggcagt cttgctggga tgcgatgcaa attgctctga attttgcaga     300
taatcaggtg cttaggagat atgggttcgt gcaccgggat ctattggata cgtccaccgt     360
cttgcctctg ccgttcgatt acccggcatc ggaccttgtt gaaggcgctt cctagacata     420
ttttattcta accaacagtt tcctagtttt gtaccatcat cggaggcttt acgagtagta     480
tcattttttt ttttaatctc tgaaacgatt agtatcatat agaaagaagg tatatcagat     540
ttatgaaact atactactgt tgctttagta gtatcatttt gacggttatg ggctcttagt     600
agtaagtgat tgcatatata tatatttcgt ttttcatttt ttgggcaccc tggagatgta     660
ttttctctgt tgtaagttaa agttggggg                                    689
<212>类型:DNA
<211>长度:689
序列名:CcGMGT1(单基因122620)
序列描述:
常规密码子(Custom Codon)
------------
序列名:CcGMGT1(单基因122620)
SEQ ID NO:12
--------
<213>生物体名:中果咖啡
<400>预序列行:
ctctctcctc gtaaaaaaaa caagaagcaa cagtaaagcc ggccagccat ctctaaagat      60
aaagctcaga ccaaacaatc atcatatatt tccagagata gcagcaggtc gtacttcctc     120
gctgtatttg tctccatggt actcgtcttt gtcatatgtt ccttgacaga aactttgccc     180
agtttccaaa ataggatttc aactaccggt gctgatacct gtaacggcga accaccagcc     240
gtaaatcgaa cccacgaccc taaagaagcc actttttacg acgaacccga gctaacctac     300
acgctaggca aaaccatcaa agactgggac aagaagagaa agtcctggct aaaccttcat     360
ccctcgttcg ccgcgggtgc cgacacacgt attctcatcg tgacggggtc tcagccttcg     420
ccatgcaaga atcccatcgg ggatcatcta ctcctgaggt gtttcaagaa caaggctgat     480
tattccagaa tccacggcta cgatatcttt tacaacaccg catgtttaga ccccaagctg     540
tgcaacgttt gggctaaggt agctttaatt cgggctgcca tggtggccca cccggaagca     600
gagtggatct ggtggatgga ctccgatgct gtctttactg acatgtactt taaagttccg     660
ttacagaggt acaagcagca taatctggtt gttcccggct ggcccgacat ggtttacgag     720
aagaagagtt gggtttctct aaataccggg agtttcttca cgagaaattg tcagtggtct     780
ttggattttt tggatgcctg ggctcgtatg agcccccgaa gccctgatta caagttctgg     840
agtgaaactt taatgtcta                                                  859
<212>类型:DNA
<211>长度:859
序列名:CcGMGT2(单基因122567)
序列描述:
常规密码子
------------
序列名:CcGMGT2(单基因122567)
SEQ ID NO:13
<213>生物体名:Coffea arabica
<400>预序列行:
agacagcagc caccatgcct aagcacaaca gcctcctccg caccaaaacc tcgtcgtttt     60
tctccagctg ctttctttac gccgccggaa cttccgcttc ctttttgtta gcctgggcct    120
tctggtcctt cttcagtagc cccgccccat ctgcgaatcc ctctttctcg aggggcctag    180
cttccgaggc tgccctcagc tgccccgccg ggaaagcggg tcacaaccgg agctacgatc    240
cgcccgaccc gactttctat gacgacccgg aattgagcta caccattgag aagaccatca    300
agaactggga tgagaagagg cgggagtggc tcgagaagca tccctcgttc gccgccggag    360
cagctgacag gattttaatg gtcacgggtt ctcaggcgac gccctgcaag aacccgatcg    420
gggatcactt gctgttgagg ttcttcaaga ataaggcgga ctactgcagg atccacggct    480
acgatatctt ctacaacacc gtgctgctgc agccgaagat gttctcgttt tgggcaaaaa    540
tgcctgccgt gaaagcggtc atgttggccc atccggaggc ggagtggatc tggtgggtag    600
attcagacac agccttcacc gacatggact tcacgctgcc gctggatcgc tacaaggccc    660
ataatttagt ggtccacggc tggcctcact tgattcacag ggagaagagc tggacggggc    720
tgaacgcggg agtgtttctg atgcgcaact gtcagtggtc aatggatttc atggaagaat    780
gggcgagcat ggggcctcaa gccccggagt acgacaaatg gggcgtgatt cagcggacga    840
cgttcaagga caagacgttt ccggagtcag acgatcagac ggggttggct tatctgatcc    900
tgaaagagag agagaaatgg gggaacaaaa tttacatgga ggatgaatat tattttgagg    960
ggtactggat ggaaatcgtg gggacgctgg agaacatcac cgacgcgtac acggggatcg   1020
agaagcggga gaggaggttg aggaggaggc atgcagagag agtgggggag agttatggta    1080
aggtgtggga ggagcacctt aaggacgctg ggtatgggag ggggagttgg aggagaccgt    1140
tcatgactca cttcacgggg tgtcagcctt gtagcgggga ccacaaccag atgtactctg    1200
gacagtcttg ctgggatgcg atgcaaattg ctctgaattt tgcagataat caggtgctta    1260
ggagatatgg gttcgtgcac cgggatttat tggatacgtc caccgtcccg cctctgccgt    1320
tcgattaccc agcatcggac cttgttggag gcgcttccta gaaatatttt attctaacca    1380
actgttaagt agttttgtac catcatcgga ggctttacta gtagtatcat tattgattta    1440
tgaaacggtt agtatcatat agaaagaagg tatatcatat ttatgaaact atactactgt    1500
tacttaacta gtatcatttt gaaggttatg ggctcttaat agtaagtgat tgcatatgta    1560
tttcgttttt catttttttg ggcaccctgg agatgtattt tctctgttgt aagttaaaag    1620
tcgggg                                                               1626
<212>类型:DNA
<211>长度:1626
序列名:pVC11(CaGMGT1)核酸
SEQ ID NO:14
<213>生物体名:中果咖啡
<400>预序列行:
ctctctcttt ggcaaaaaaa caagaagcaa cagtaaagcc ggccagccat gtctagagct     60
aaagctcaga ccaaacaatc atcatatatt tccagagata gcagcaggtc gtacttcctc    120
gctgtatttg tctccatggt actcgtcttt gtcatatgtt ccttgacaga aactttgccc    180
agtttccaaa ataggatttc aactaccggt gctgatacct gtaacggcga accaccagcc    240
gtaaatcgaa cccacgaccc taaagaagcc actttttacg acgaacccga gctaacctac    300
acgctaggca aaaccatcaa agactgggac aagaagagaa agtcctggct aaaccttcat    360
ccctcgttcg ccgcgggtgc cgacacacgt attctcatcg tgacggggtc tcagccttcg     420
ccatgcaaga atcccatcgg ggatcatcta ctcctgaggt gtttcaagaa caaggctgat     480
tattccagaa tccacggcta cgatatcttt tacaacaccg catgtttaga ccccaagctg     540
tgcaacgttt gggctaaggt agctttaatt cgggctgcca tggtggccca cccggaagca     600
gagtggatct ggtggatgga ctccgatgct gtctttactg acatgtactt taaagttccg     660
ttacagaggt acaagcagca taatctggtt gttcccggct ggcccgacat ggtttacgag     720
aagaagagtt gggtttctct aaataccggg agtttcttca cgagaaattg tcagtggtct     780
ttggattttt tggatgcctg ggctcgtatg agcccccgaa gccctgatta caagttctgg     840
agtgaaactt taatgtctac gctttcggat aagatgttcc cgggagcaga tgagcagtcg     900
tctttggttt atttgctgtt gacagaaaag aagaaatggg gggataagat ttatttagag     960
aatcagtacg acttgagctc ttattgggta ggcgtagttg gaaagcttga taaatttacg    1020
aggacggagg ctgacgcaga gaagaatttg cccttgctaa ggaggagaag ggcggaggtg    1080
gtgggcgaga gcgttggtga ggtgtgggag aagtacttgg aaaataatac cgctagcgag    1140
ggtaaacggc cgtttattac gcatttcacg ggatgccagc cctgcagcgg aaaccatgac    1200
ccctcctacg ttggaaatac ctgctgggat gcaatggaga ggactctgaa ttatgctgat    1260
aatcaggtcc ttcgtaactt gggttttgtg cacagggata taagccgtgg ctcttacgtt    1320
ttacccctag cctttgattt tccatcggaa gtgctgcaaa gaaagaaatc cggtgaagaa    1380
tataacaggt gaataaatcc ctccgtttta gtgctgttta tagattatag cagccagcag    1440
gacttgggcc ctgaaaattc agtatctcag aaaaaaaatg acagtgaaat tgagagagca    1500
aaaatgtttt cacaagcttg tcgtggtaaa ttcctcagta attgagtgaa tttcaagata    1560
cttatatttg ttgccacgaa atttgttgat gctttttcct gttggtcaac aaaatcgaat    1620
tgattgagtg tgctttttaa taaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa    1680
aaaaaaaaaa aaaaa                                                    1695
<212>类型:DNA
<211>长度:1695
序列名:CcGMGT2(cccl26f9)核酸
SEQID NO:15
--------
<213>生物体名:中果咖啡
<400>预序列行:
YYFEGYWMEI VGTLENITDA YTGIEKRERR LRRRHAERVG ESYGKVWEEH LKDAGYGRGS        60
WRRPFMTHFT GCQPCSGDHN QMYSGQSCWD AMQIALNFAD NQVLRRYGFV HRDLLDTSTV       120
LPLPFDYPAS DLVEGAS                                                      137
<212>类型:PRT
<211>长度:137
序列名:CcGMGT1(由单基因122620编码)
序列描述
SEQID NO:16
--------
<213>生物体名:中果咖啡
<400>预序列行:
TFYDEPELTY TLGKTIKDWD KKRKSWLNLH PSFAAGADTR ILIVTGSQPS PCKNPIGDHL       60
LLRCFKNKAD YSRIHGYDIF YNTACLDPKL CNVWAKVALI RAAMVAHPEA EWIWWMDSDA      120
VFTDMYFKVP LQRYKQHNLV VPGWPDMVYE KKSWVSLNTG SFFTRNCQWS LDFLDAWARM      180
SPRSPDYKFW SETLMS                                                      196
<212>类型:PRT
<211>长度:196
序列名:CcGMGT2(由单基因122567编码)
序列描述:
SEQ ID NO:17
<213>生物体名:小果咖啡
<400>预序列行:
MPKHNSLLRT KTSSFFSSCF LYAAGTSASF LLAWAFWSFF SSPAPSANPS FSRGLASEAA       60
LSCPAGKAGH NRSYDPPDPT FYDDPELSYT IEKTIKNWDE KRREWLEKHP SFAAGAADRI      120
LMVTGSQATP CKNPIGDHLL LRFFKNKADY CRIHGYDIFY NTVLLQPKMF SFWAKMPAVK      180
AVMLAHPEAE WIWWVDSDTA FTDMDFTLPL DRYKAHNLVV HGWPHLIHRE KSWTGLNAGV      240
FLMRNCQWSM DFMEEWASMG PQAPEYDKWG VIQRTTFKDK TFPESDDQTG LAYLILKERE      300
KWGNKIYMED EYYFEGYWME IVGTLENITD AYTGIEKRER RLRRRHAERV GESYGKVWEE      360
HLKDAGYGRG SWRRPFMTHF TGCQPCSGDH NQMYSGQSCW DAMQIALNFA DNQVLRRYGF             420
VHRDLLDTST VPPLPFDYPA SDLVGGAS                                                448
<212>类型:PRT
<211>长度:448
序列名:pVC11(CaGMGT1)蛋白质
SEQ ID NO:18
<213>生物体名:中果咖啡
<400>预序列行:
MSRAKAQTKQ SSYISRDSSR SYFLAVFVSM VLVFVICSLT ETLPSFQNRI STTGADTCNG       60
EPPAVNRTHD PKEATFYDEP ELTYTLGKTI KDWDKKRKSW LNLHPSFAAG ADTRILIVTG      120
SQPSPCKNPI GDHLLLRCFK NKADYSRIHG YDIFYNTACL DPKLCNVWAK VALIRAAMVA      180
HPEAEWIWWM DSDAVFTDMY FKVPLQRYKQ HNLVVPGWPD MVYEKKSWVS LNTGSFFTRN      240
CQWSLDFLDA WARMSPRSPD YKFWSETLMS TLSDKMFPGA DEQSSLVYLL LTEKKKWGDK      300
IYLENQYDLS SYWVGVVGKL DKFTRTEADA EKNLPLLRRR RAEVVGESVG EVWEKYLENN      360
TASEGKRPFI THFTGCQPCS GNHDPSYVGN TCWDAMERTL NYADNQVLRN LGFVHRDISR      420
GSYVLPLAFD FPSEVLQRKK SGEEYNR                                          447
<212>类型:PRT
<211>长度:447
序列名:CcGMGT2(cccl26f9)蛋白质
SEQ ID NO:19
<213>生物体名:中果咖啡
<400>预序列行:
attttgaggg gtactggatg gaaatcgtgg ggacgctgga gaacatcacc gacgcgtaca      60
cggggatcga gaagcgggag aggagattga ggaggaggca tgcagagaga gtgggggaga     120
gttatggtaa ggtgtgggag gagcacctta aggacgctgg gtatgggagg gggagttgga     180
ggagaccgtt catgactcac ttcacggggt gtcagccttg tagcggggac cacaaccaga     240
tgtactctgg gcagtcttgc tgggatgcga tgcaaattgc tctgaatttt gcagataatc     300
aggtgcttag gagatatggg ttcgtgcacc gggatctatt ggatacgtcc accgtcttgc     360
ctctgccgtt cgattacccg gcatcggacc ttgttgaagg cgcttcctag acatatttta     420
ttctaaccaa cagtttccta gttttgtacc atcatcggag gctttacgag tagtatcatt     480
tttttttttt ttttaatttc tgaaacgatt agtatcatat agaaagaagg tatatcagat     540
ttatgaaact atactactgt tactttacta gtatcatttt gacggttatg ggctctttgt     600
agtgagtgat tgcatatata cttcgttttt catttttttg ggcaccctgg agatgtattt     660
tctctgttgt aagttaaaag tcgggggtct tataaagtgt taatgcatgt actatatatg     720
ttgtacttgt ttttttttaa aaaaaaaatt cttttttgtt gggggtttaa aaaaaaaaaa     780
aaaaaaaaaa aaaaaaaaaa a                                               801
<212>类型:DNA
<211>长度:801
序列名cccs46w8o23核酸
SEQ ID NO:20
<213>生物体名:小果咖啡
<400>预序列行:
agacagcagc caccatgcct aagcacaaca gcctcctccg caccaaaacc tcgtcgtttt      60
tctccagctg ctttctttac gccgccggaa cttccgcttc ctttttgtta gcctgggcct     120
tctggtcctt cttcagtagc cccgccccat ctgcgaatcc ctctttctcg aggggcctag     180
cttccgaggc tgccctcagc tgccccgccg ggaaagcggg tcacaaccgg agctacgatc     240
cgcccgaccc gactttctat gacgacccgg tattgagcta caccattgag aagaccatca     300
agaactggga tgagaagagg cgggagtggc tcgagaagca tccctcgttc gccgccggag     360
cagctgacag gattttaatg gtcacgggtt ctcaggcgac gccctgcaag aacccgatcg     420
gggatcactt gctgttgagg ttcttcaaga gtaaggcgga ctactgcagg atccacggct     480
acgatatctt ctacaacacc gtgctgctgc agccgaggat gttctcgttt tgggcaaaaa     540
tgcctgccgt gaaagcggtc atgttggccc atccggaggc ggagtggatc tggtgggtag     600
attcagacgc agccttcacc gacatggact tcacgctgcc gctggatcgc tacaaggccc     660
ataatttagt ggtccacggc tggcctcact tgattcacag ggagaagagc tggacggggc     720
tgaacgcggg agtgtttctg atgcgcaact gtcagtggtc aatggatttc atggaagaat     780
gggcgagcat ggggcctcaa gcctcggagt acgacaaatg gggcgtgatt cagcggacga     840
cgttcaagga caagacgttt ccggagtcag acgatcagac ggggttggct tatctgatcc     900
tgaaagagag agagaaatgg gggaacaaaa tttacatgga ggatgaatat tattttgagg     960
ggtgctggat ggaaatcgtg gggacgctgg agaacatcac cgacgcgtac acggggatcg    1020
agaagcggga gaggagattg aggaggaggc atgcagagag agtgggggag agttatggta    1080
aggtgtggga ggagcacctt aaggacgctg ggtatgggag                          1120
<212>类型:DNA
<211>长度:1120
序列名:pVC10(GMGT-RACE13)核酸
本发明不限于上述所描述和举例的实施方案,而是能够将改变和修饰包含在所附的权利要求范围内。

Claims (31)

1.从咖啡属物种中分离的核酸分子,其包含编码半乳甘露聚糖合成酶的编码序列。
2.权利要求1的核酸分子,其中半乳甘露聚糖合成酶是半乳糖基转移酶或甘露聚糖合酶。
3.权利要求2的核酸分子,其中甘露聚糖合酶包含具有氨基酸序列QHRWS的保守结构域。
4.权利要求2的核酸分子,其中甘露聚糖合酶包含与SEQ ID NO:4-6中任一项的氨基酸序列大于约75%同一的氨基酸序列。
5.权利要求2的核酸分子,其中甘露聚糖合酶包含SEQ ID NO:4-6中的任一项。
6.权利要求2的核酸分子,其包含SEQ ID NO:2或SEQ ID NO:3。
7.权利要求2的核酸分子,其中半乳糖基转移酶与胡卢巴半乳糖基转移酶或百脉根半乳糖基转移酶具有至少约54%同一性。
8.权利要求2的核酸分子,其中半乳糖基转移酶包含与SEQ IDNO:15-18中任一项大于约75%同一的氨基酸序列。
9.权利要求2的核酸分子,其中半乳糖基转移酶包含SEQ IDNO:15-18的任一项。
10.权利要求2的核酸分子,其包含SEQ ID NO:11-14的任一项。
11.权利要求1的核酸分子,其中编码序列是基因的可读框。
12.通过转录权利要求11的基因产生的mRNA分子。
13.通过逆转录权利要求12的mRNA分子产生的cDNA分子。
14.长度在8和100个碱基之间的寡核苷酸,其与权利要求1的核酸分子的片段互补。
15.包含权利要求1的核酸分子的编码序列的载体。
16.权利要求15的载体,其是选自以下载体的表达载体:质粒、噬菌粒、黏粒、杆状病毒、杆粒、细菌、酵母和病毒载体。
17.权利要求15的载体,其中核酸分子的编码序列与组成型启动子有效的连接。
18.权利要求15的载体,其中核酸分子的编码序列与诱导型启动子有效的连接。
19.权利要求15的载体,其中核酸分子的编码序列与组织特异性启动子有效的连接。
20.权利要求19的载体,其中组织特异性启动子是种子特异性启动子。
21.权利要求20的载体,其中种子特异性启动子是咖啡种子特异性启动子。
22.用权利要求15的载体转化的宿主细胞。
23.权利要求22的宿主细胞,其选自植物细胞、细菌细胞、真菌细胞、昆虫细胞和哺乳动物细胞。
24.权利要求23的宿主细胞,其为植物细胞,所述植物细胞选自下列植物:咖啡、烟草、拟南芥、玉米、小麦、稻、大豆、大麦、黑麦、燕麦、高粱、苜蓿、车轴草、油菜、红花、向日葵、花生、可可树、粘果酸浆、马铃薯、胡椒、茄子、甜菜、胡萝卜、黄瓜、莴苣、豌豆、紫菀、秋海棠、菊花、飞燕草、碧冬茄、百日草和草坪草。
25.由权利要求24的植物细胞产生的能育植物。
26.调节来自咖啡豆的固体的可提取性的方法,其包括调节咖啡种子中半乳甘露聚糖合成酶的产生或活性。
27.权利要求26的方法,其中半乳甘露聚糖合成酶是半乳糖基转移酶或甘露聚糖合酶。
28.权利要求27的方法,其包括增加半乳糖基转移酶、甘露聚糖合酶或其组合的产生或活性。
29.权利要求27的方法,其包括增加咖啡种子中编码半乳糖基转移酶、甘露聚糖合酶或其组合的基因的表达。
30.权利要求27的方法,其包括向植物中引入编码半乳糖基转移酶的转基因、编码甘露聚糖合酶的转基因或其组合。
31.权利要求27的方法,其包括降低半乳糖基转移酶、甘露聚糖合酶或其组合的产生或活性。
CNA2006800381365A 2005-10-14 2006-10-16 咖啡中与半乳甘露聚糖合成有关的核酸和蛋白质 Pending CN101356277A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US72660205P 2005-10-14 2005-10-14
US60/726,602 2005-10-14

Publications (1)

Publication Number Publication Date
CN101356277A true CN101356277A (zh) 2009-01-28

Family

ID=37963211

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2006800381365A Pending CN101356277A (zh) 2005-10-14 2006-10-16 咖啡中与半乳甘露聚糖合成有关的核酸和蛋白质

Country Status (10)

Country Link
US (1) US8217226B2 (zh)
EP (1) EP1937822B1 (zh)
CN (1) CN101356277A (zh)
AP (1) AP2008004414A0 (zh)
AU (1) AU2006304484A1 (zh)
BR (1) BRPI0617411A2 (zh)
CA (1) CA2625928A1 (zh)
EC (1) ECSP088365A (zh)
WO (1) WO2007047675A2 (zh)
ZA (1) ZA200804095B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104011063A (zh) * 2011-12-28 2014-08-27 田纳西大学研究基金会 增加大豆针对害虫的防御
CN108913694A (zh) * 2012-04-09 2018-11-30 巴西农业研究公司-恩布拉帕 修饰目的基因表达的组合物和方法
CN111164213A (zh) * 2017-05-31 2020-05-15 热带生物科学英国有限公司 增加从咖啡豆中提取固体的可提取性的组成物及方法

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8080418B2 (en) 2007-03-09 2011-12-20 Corning Incorporated Method of making a three dimensional cell culture matrix
US20110159121A1 (en) * 2009-12-24 2011-06-30 LifeSpan Extension, LLC Methods and compositions for identifying, producing and using plant-derived products for modulating cell function and aging
EP2545166A2 (en) 2010-03-09 2013-01-16 Nestec S.A. Modulation of galactomannan content in coffee
US11149294B2 (en) * 2018-05-01 2021-10-19 Biocapital Holdings, Llc DNA constructs and biological devices for producing carbo sugars

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB9713852D0 (en) * 1997-06-30 1997-09-03 Univ Cambridge Tech Plant genes and uses thereof
GB9810997D0 (en) * 1998-05-21 1998-07-22 Unilever Plc Genes & enzymes
US7265265B2 (en) * 2002-11-14 2007-09-04 Pioneer Hi-Bred International, Inc. Genes for galactomannan production in plants and methods of use

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104011063A (zh) * 2011-12-28 2014-08-27 田纳西大学研究基金会 增加大豆针对害虫的防御
CN108913694A (zh) * 2012-04-09 2018-11-30 巴西农业研究公司-恩布拉帕 修饰目的基因表达的组合物和方法
CN111164213A (zh) * 2017-05-31 2020-05-15 热带生物科学英国有限公司 增加从咖啡豆中提取固体的可提取性的组成物及方法

Also Published As

Publication number Publication date
EP1937822A2 (en) 2008-07-02
ZA200804095B (en) 2009-12-30
WO2007047675A2 (en) 2007-04-26
BRPI0617411A2 (pt) 2011-07-26
AU2006304484A1 (en) 2007-04-26
EP1937822B1 (en) 2012-11-21
CA2625928A1 (en) 2007-04-26
WO2007047675A3 (en) 2008-02-28
ECSP088365A (es) 2008-05-30
US8217226B2 (en) 2012-07-10
AP2008004414A0 (en) 2008-04-30
US20100154075A1 (en) 2010-06-17

Similar Documents

Publication Publication Date Title
Ainsworth et al. Expression, organisation and structure of the genes encoding the waxy protein (granule-bound starch synthase) in wheat
US10428341B2 (en) Transgenic potato plants with increased hyaluronan production
US7989677B2 (en) Nucleic acids and proteins associated with sucrose accumulation in coffee
US20050009165A1 (en) Raffinose synthase gene, method for producing raffinose, and transgenic plant
HU225800B1 (en) Nucleic acid molecules encoding enzymes having fructosyl polymerase activity and methods for preparation of fructosyl-polymers
HU227302B1 (en) Dna molecules that code for enzymes involved in strach synthesis, vectors, bacteria, transgenic plant cells and plants containing said molecules
CN101442903A (zh) 单子叶植物中油的提高
CN101356277A (zh) 咖啡中与半乳甘露聚糖合成有关的核酸和蛋白质
JP2009509509A (ja) コーヒー中のスクロース分解と関連している核酸及びタンパク質
JP5210165B2 (ja) 増加したアミノ糖含量を有する植物
US7041484B1 (en) Starch branching enzymes
EP0994186B1 (en) Raffinose synthetase gene, process for producing raffinose, and transformed plant
JP5759176B2 (ja) 多糖シンターゼ(h)
US7250277B2 (en) Soybean raffinose synthase and a method for producing raffinose
JP4410318B2 (ja) ラフィノース合成酵素遺伝子、ラフィノースの製造法及び形質転換植物
CN102822334A (zh) 咖啡中半乳甘露聚糖含量的调节
WO2000053746A2 (en) Method of delaying or inhibiting sprouting in plants
JP4238909B2 (ja) ラフィノース合成酵素遺伝子、ラフィノースの製造法及び形質転換植物
DK1951879T3 (en) PLANTS WITH AN INCREASED aminosugars
MX2008004864A (en) Nucleic acids and proteins associated with galactomannan synthesis in coffee
JPH1084973A (ja) ラフィノース合成酵素遺伝子、ラフィノースの製造法及び形質転換植物
Bei Isolation, characterization, and expression analysis of genes encoding starch synthesizing enzymes from grain amaranth
JP2006314326A (ja) 植物のラフィノース族オリゴ糖含量を低減させる方法
MXPA99002219A (en) Materials and methods for increasing corn seed weight

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Open date: 20090128