CN102822334A

CN102822334A - 咖啡中半乳甘露聚糖含量的调节

Info

Publication number: CN102822334A
Application number: CN2011800131498A
Authority: CN
Inventors: J·G·麦卡锡; M·N·C·勒佩莱
Original assignee: Societe dAssistance Technique pour Produits Nestle SA
Current assignee: Nestec SA
Priority date: 2010-03-09
Filing date: 2011-03-07
Publication date: 2012-12-12
Also published as: WO2011110510A3; WO2011110510A2; EP2545166A2; JP2013521003A; US20130074215A1

Abstract

本文公开了分离自咖啡(咖啡属物种)的核酸分子，所述核酸分子包含编码UDP-葡糖焦磷酸化酶(UGPP)、GDP-甘露糖焦磷酸化酶(GMPP)、磷酸甘露糖变位酶(PMM)和UDP-葡糖4-差向异构酶(UGE)的序列。本文还公开了使用这些多核苷酸对咖啡粒的含量和/或结构进行基因调控和操纵以影响提取特征和其它特性的方法。

Description

咖啡中半乳甘露聚糖含量的调节

发明领域

本发明涉及农业生物技术的领域。更特别地，本发明涉及来自咖啡植物的、涉及半乳甘露聚糖前体合成的核酸和酶，以及它们在调节咖啡豆的半乳甘露聚糖含量中的用途。

发明背景

植物细胞壁是复杂且动态的混合物(composites)，其特别包含多糖、蛋白和木质素。多糖是绿色咖啡粒的主要成分，其可占到成熟粒的多达50％的干重(Redgwell等，2003，Planta 217，316-326)。在咖啡粒中多糖主要有三种形式：纤维素、II型阿拉伯半乳聚糖和半乳甘露聚糖(Fischer等，2001，Carbohydrate Research 330，93-101)，而半乳甘露聚糖是最为丰富的(总质量的50％，或者粒的干质量的大约25％)。半乳甘露聚糖结构相对简单，其由β-1，4-连接的甘露糖分子的线性主链和以多种间隔沿着甘露聚糖主链的单个单位的α-1，6-连接的半乳糖基侧链购成。在一些植物中(虽然对咖啡来说并不一定)，还有葡萄糖随甘露聚糖散布，由此生成半乳葡甘露聚糖。

Clifford(1986，Tea Coffee Trade J.158，30-32)已报道，阿拉比卡(arabica)咖啡(小果咖啡(Coffea arabica))可含有比罗布斯塔(robusta)(中果咖啡(C.canephora))(6-8％)更多的阿拉伯半乳聚糖(9-13％)，以及更多的半乳甘露聚糖(阿拉比卡中25-30％，而罗布斯塔中19-22％)。他还暗示，罗布斯塔中的半乳甘露聚糖更高度支化，并且由此较少结晶。该论点虽然尚未证实，但已用于解释为何在同样的烘焙程度下罗布斯塔通常比阿拉比卡产生更多可溶固体(Clifford，1985，In：M.N.Clifford和K.C.Wilson编，Coffee Botany，Biochemistry，and Production of Beans andBeverage，Croom Helm，London，第305-374页；Clifford，1986，参见上文；Trugo，1985，In：R.J.Clarke和R.Macrae编，Coffee，Chemistry 1，Elsevier，Amsterdam，第83-114页)。注意到，在对分离自一种阿拉比卡品种和一种罗布斯塔品种的咖啡粒的多糖的研究中，Fischer等(2001)没有在那些样品中发现多糖的量的任何显著不同，虽然阿拉比卡品种的多糖要比罗布斯塔品种具有稍微更多的甘露糖含量。此外，在检验的阿拉比卡和罗布斯塔品种的半乳甘露聚糖中没有看到可检测到的不同。Redgwell等，2002，Carbohydrate Research 337，421-431)和Oosterveld等，2003，CarbohydratePolymers 52，285-296)已报道，多于40％的原本存在于绿色粒中的多糖在较长烘焙期后被降解。然而，Redgwell等(2002，见上文)显示，在烘焙期间阿拉伯半乳聚糖比甘露聚糖对降解更为敏感，并且纤维素聚合物不受影响。半乳甘露聚糖在烘焙期间的有限降解已导向下述观点：半乳甘露聚糖是经烘焙的咖啡粒中最难提取的部分。因为半乳甘露聚糖组成咖啡粒的主要部分，已投入了显著量的研究努力，来理解半乳甘露聚糖在咖啡粒胚乳中是怎样合成和降解的。该研究的主要目的是发现和/或开发出具有改变的半乳甘露聚糖水平和/或结构的咖啡，并且由此其例如可在较低温度下具有改善的可提取性。

半乳甘露聚糖合成通过两种酶来进行，甘露聚糖合酶(ManS)和半乳甘露聚糖半乳糖基转移酶(GMGT)，它们被认为共定位于高尔基小囊的膜中，并且被相信作为复合体一起工作(Dhugga等，2004，Science 303，363-366；Edwards等，2004，Plant Physiol 134，1153-1162)。已分离和表征了涉及咖啡粒半乳甘露聚糖合成的ManS和GMGT基因序列，以及用于在植物的其它部分中进行半乳甘露聚糖合成的序列(Pre等，2008，Ann.Bot.(Lond)102，207-220；WO 2007/047675A2)。在半乳甘露聚糖合成期间，与纤维素合成酶相关的ManS酶使用GDP-甘露糖(GDP-Man)前体来使甘露聚糖主链聚合，而GMGT酶则负责将半乳糖残基从UDP-半乳糖前体转移到生长中的甘露聚糖主链(Edwards等，2004，见上文)。其暗示对由那些基因编码的酶的表达或活性的调节可用于增加或减少植物中，最特别地，豆中的半乳甘露聚糖的量(WO 2007/047675A2)。

甘露聚糖酶涉及半乳甘露聚糖的降解，其还可影响到植物或植物组织中存在的半乳甘露聚糖的量。已经分离和表征了咖啡甘露聚糖酶(WO00/28046；US 7,148,399B2)。已从发芽的咖啡粒分离了编码不同的内-β甘露聚糖酶(manA和manB)的两个cDNA(Marraccini等.，2001，Planta213：296-308)。

尽管半乳甘露聚糖在咖啡粒中具有重要性，并且参与半乳甘露聚糖合成和降解的酶无疑具有重要性，但在通过使用那些基因或酶来调节咖啡粒中半乳甘露聚糖的量或结构的方面进展极少。因此，存在鉴定和开发操纵咖啡中半乳甘露聚糖含量和/或结构的新途径的需要。

发明总结

本发明的一个方面涉及从咖啡属物种分离的核酸分子，其包含编码选自UDP-葡糖焦磷酸化酶(UGPP)、GDP-甘露糖焦磷酸化酶(GMPP)、磷酸甘露糖变位酶(PMM)和UDP-葡糖4-差向异构酶(UGE)的半乳甘露聚糖前体合成酶的编码序列。在一种实施方式中，半乳甘露聚糖前体合成酶包含下述氨基酸序列，当通过BLAST比较进行测定时，所述氨基酸序列在其整体上与SEQ ID NO：6-10中任一的氨基酸序列超过大约80％相同。特别地，半乳甘露聚糖前体合成酶包含SEQ ID NO：6-10中的任一。核酸分子可包含SEQ ID NO：1-5中的任一。在某些实施方式中，编码序列是(1)基因的开放阅读框，或(2)通过基因转录产生的mRNA分子，或

(3)通过对mRNA分子进行逆转录产生的cDNA分子。

本发明的另一方面涉及包含前述编码序列的载体，所述编码序列编码选自UDP-葡糖焦磷酸化酶(UGPP)、GDP-甘露糖焦磷酸化酶(GMPP)、磷酸甘露糖变位酶(PMM)和UDP-葡糖4-差向异构酶(UGE)的半乳甘露聚糖前体合成酶。在一种实施方式中，载体是选自质粒、噬粒、粘粒、杆状病毒、杆粒、细菌、酵母和病毒载体构成的载体组的表达载体。核酸分子的编码序列可与组成型启动子有效连接，或者其可与可诱导启动子有效连接，或者其可与组织特异性启动子有效连接。一些启动子既是可诱导的又是组织特异性的，而另一些是组成型且组织特异性的。任选地，组织特异性启动子是种子特异性启动子。来自咖啡的种子特异性启动子是特别合适的。

本发明的另一方面涉及用一种或多种上述载体转化的宿主细胞。宿主细胞可选自植物细胞、细菌细胞、真菌细胞、昆虫细胞和哺乳动物细胞。在某些实施方式中，宿主细胞是选自咖啡、烟草、拟南芥属、玉米、小麦、水稻、大豆、大麦、黑麦、燕麦、高粱、苜蓿、三叶草、油菜、红花、向日葵、花生、可可、酸浆果(tomatillo)、马铃薯、胡椒、茄子、甜菜、胡萝卜、黄瓜、莴苣、豌豆、紫菀(aster)、秋海棠(begonia)、菊、飞燕草(delphinium)、矮牵牛属植物、百日草属属植物和草皮草。在特别的实施方式中，宿主细胞来自咖啡。还提供了从上述任何植物细胞产生的可育植物。

本发明的另一方面涉及在植物中调节半乳甘露聚糖含量的方法，所述方法包括调节植物内一种或多种半乳甘露聚糖前体合成酶的生产或活性，从而导致植物中半乳甘露聚糖含量改变。在特别的实施方式中，植物是咖啡植物。此类方法可用于通过改变咖啡种子内半乳甘露聚糖的量和/或结构来调节咖啡种子的可提取性。在某些实施方式中，半乳甘露聚糖前体合成酶是UDP-葡糖焦磷酸化酶(UGPP)、GDP-甘露糖焦磷酸化酶(GMPP)、磷酸甘露糖变位酶(PMM)或UDP-葡糖4-差向异构酶(UGE)。

所述方法的一种实施方式包括增加UGPP、GMPP、PMM或UGE中一种或多种的产量或活性，例如通过增加编码UGPP、GMPP、PMM或UGE中一种或多种的基因在植物内的表达来实现。这可通过向植物中引入编码UGPP、GMPP、PMM或UGE中一种或多种的一种或多种转基因来完成。

所述方法的另一实施方式包含减少UGPP、GMPP、PMM或UGE中一种或多种的生产或活性，例如通过减少编码UGPP、GMPP、PMM或UGE中一种或多种的基因在植物内的表达来实现。这可通过向植物中引入编码是UGPP、GMPP、PMM或UGE中一种或多种的翻译的抑制剂的一种或多种多核苷酸(例如反义寡核苷酸、siRNA、miRNA或shRNA)来完成。

本发明的其它特征和优点将参照下文附图、详细描述和实例来理解。

附图简述

图1.对CcUGPP(pcccs46w918)(SEQ ID NO：6)、StUGPP(CAA79357)(SEQ ID NO：11)、OsUGPP(ABD57308)(SEQ ID NO：12)、CmUGPP(ABD98820)(SEQ ID NO：13)和AtUGPP(AAK32773)(SEQID NO：14)的蛋白序列比对。使用CLUSTAL W来进行对NCBI数据库中可获得的马铃薯(Solanum tuberosum)UGPP(StUGPP)、水稻(Oryzasativa)UGPP(OsUGPP)、甜瓜(Cucumis melo)UGPP(CmUGPP)拟南芥UGPP(AtUGPP)蛋白序列与由中果咖啡UGPP基因编码的蛋白序列(CcUGPP)的比对。灰色标识的氨基酸与中果咖啡UGPP序列中发现的残基匹配。

图2.对CcGMPP(pcccl22i19)(SEQ ID NO：7)、StGMPP(AAD01737)(SEQ ID NO：15)、SlGMPP(AAT37498)(SEQ ID NO：16)、MsGMPP(AAT58365)(SEQ ID NO：17)和VvGMPP(CAO69137)(SEQ ID NO：18)的蛋白序列比对。使用CLUSTAL W来进行对NCBI数据库中可获得的马铃薯GMPP(StGMPP)、番茄(Solanunm lycopersicum)GMPP(SlGMPP)、紫花苜蓿(Medicago sativa)GMPP(MsGMPP)和葡萄(Vitis vinifera)GMPP(VvGMPP)蛋白序列与由中果咖啡GMPP基因编码的蛋白序列(CcGMPP)的比对。灰色标识的氨基酸与中果咖啡GMPP序列中发现的残基匹配。

图3.对CcPMM(pcccs46w3a14)(SEQ ID NO：8)、GmPMM(ABD97873)(SEQ ID NO：19)、VvPMM(CAO39354)(SEQ ID NO：20)、PtPMM(ABK96056)(SEQ ID NO：21)和AtPMM(ABD97870)(SEQID NO：22)的蛋白序列比对。使用CLUSTAL W来进行对NCBI数据库中可获得的大豆PMM(GmPMM)、葡萄PMM(VvPMM)、毛果杨(Populustrichocarpa)PMM(PtPMM)和拟南芥PMM(AtPMM)蛋白序列与由中果咖啡PMM基因编码的蛋白序列(CcPMM)的比对。灰色标识的氨基酸与中果咖啡PMM序列中发现的残基匹配。

图4.对CcUGE1(SGN-U347952)(SEQ ID NO：9)、CcUGE5(pcccl17j24)(SEQ ID NO：10)、AtUGE1(NP_172738)(SEQ ID NO：23)、AtUGE3(NP_564811)(SEQ ID NO：24)、StUGE51(AAP97493)(SEQID NO：25)、AtUGE5(NP_192834)(SEQ ID NO：26)、AtUGE2(NP_194123)(SEQ ID NO：27)、AtUGE4(NP_176625)(SEQ ID NO：28)、PtUGE(ABK95303)(SEQ ID NO：29)、StUGE45(AAP42567)(SEQID NO：30)和VvUGE(CAN63477)(SEQ ID NO：31)的蛋白序列比对。使用CLUSTAL W来进行对NCBI数据库中可获得的拟南芥UGE1(AtUGE1)、UGE3(AtUGE3)、马铃薯UGE51(StUGE51)、毛果杨UGE(PtUGE)、马铃薯UGE45(StUGE45)和拟南芥UGE2(AtUGE2)、UGE4(AtUGE4)和UGE5(AtUGE5)与由中果咖啡UGE1(CcUGE1)和UGE5(CcUGE5)基因编码的蛋白序列的比对。灰色标识的氨基酸与中果咖啡UGE1序列中发现的残基匹配。

图5.通过MegAlign软件获得的系统发生树，其源于图4所示的使用ClustalW进行的蛋白比对。

图6.重组的His标签化的CcUGE5和CcUGPP的表达。使用考马斯蓝染色，在8-16％丙烯酰胺快速PAGE凝胶(Acrylamide Express PAGEGel)(GenScript Corp.)上对来自重组HIS-CcUGE5和HIS-CcUGPP融合蛋白(分别是pGT2和pGT3)表达的多个阶段的提取物进行分析。梯(ladder)上样于凝胶左侧(预染色的SDS-PAGE标准物低范围(PrestainedSDS-PAGE Standards Low Range，BIO-RAD))。对于每种蛋白，上样四种级分(frations)，它们是(从左到右)：非诱导的：含有未经诱导的pGT2(HIS-CcUGE5)或pGT3(CcUGPP)的Bl21重组细胞的总裂解物；经诱导的：含有用0.2mM IPTG诱导的pGT2(HIS-CcUGE5)或pGT3(CcUGPP)的Bl21重组细胞的总裂解物；可溶的：使用BugBuster进行裂解处理之后经诱导的裂解物的可溶级分；不可溶的：使用BugBuster进行裂解处理之后经诱导的裂解物的不可溶级分。

图7.针对罗布斯塔FRT32、FRT05和FRT64以及阿拉比卡T2308，在不同的粒发育阶段，对UGE1和UGE5的定量表达分析。使用定量RT-PCR，在多种粒样品中测量每种基因的表达。RQ是相对于组成型表达的基因RPL39的基因表达水平。SG，小、绿色阶段的粒；LG，大、绿色阶段的粒；YG，黄色阶段的粒；RG，红色阶段的粒。用于本实验中的cDNA的代码是：cDNA3-RNA FRT32-1、cDNA1-RNA FRT05-3、cDNA1-RNA

FRT64-3和cDNA3-RNA T2308-2。

图8.针对罗布斯塔FRT32、FRT05和FRT64以及阿拉比卡T2308，在不同的粒发育阶段，对UGPP、GMPP和PMM的定量表达分析。使用定量RT-PCR，在多种粒样品中测量每种基因的表达。RQ是相对于组成型表达的基因RPL39的基因表达水平。SG，小、绿色阶段的粒；LG，大、绿色阶段的粒；YG，黄色阶段的粒；RG，红色阶段的粒。用于本实验中的cDNA的代码是：cDNA3-RNA FRT32-1、cDNA1-RNA FRT05-3、cDNA1-RNA FRT64-3和cDNA3-RNA T2308-2。

图9.对中果咖啡(罗布斯塔，FRT32)和小果咖啡(阿拉比卡，T2308)中UGE1、UGE5、UGPP、GMPP和PMM的定量表达分析。如方法中所描述的，使用TaqMan特异性探针通过定量RT-PCR测定每个基因的表达。每种组织样品的RQ值是通过将测试基因的转录本水平对分析的每种样品中普遍表达的rpl39基因的转录水平归一化来测定的。数据代表从每种样品的三次扩增反应获得的平均值，误差条表示SD。G，粒；P，果皮；SG，小、绿色阶段的粒；LG，大、绿色阶段的粒；YG，黄色阶段的粒；RG，红色阶段的粒。用于本实验中的cDNA的代码是：cDNA3-RNA FRT32-1、cDNA1-RNA FRT05-3、cDNA1-RNA FRT64-3和cDNA3-RNA T2308-2。

对阐述性实施方式的详细描述

定义

关于本发明的生物分子和其它方面的多种术语在说明书和权利要求中通篇使用。除非在本文中对其另有特定定义，术语被认定为具有它们在分子生物学和生物化学领域中的惯常含义。

“经分离的”表示“通过人手”从天然状态改变的。如果组合物或物质是自然界存在的，如果其被改变或将其从原本的环境中移出或者两者兼有，那么其是已“经分离的”。例如，天然存在于活的植物或动物中的多核苷酸或多肽不是“经分离的”，但是与其天然状态共存的材料分开的相同的多核苷酸或多肽则是“经分离的”，如该术语在本文中使用的那样。

“多核苷酸”又被称为“核酸分子”，其通常指任何多聚核糖核苷酸或多聚脱氧核糖核苷酸，其可以是未经修饰的RNA或DNA或经修饰的RNA或DNA。“多核苷酸”包括但不限于单链和双链DNA，为单链和双链区域的混合物的DNA，单链和双链RNA，以及为单链和双链区域的混合物的RNA，包含DNA和RNA的杂交分子，其可以是单链的，或者更一般地，是双链的，或是单链和双链区域的混合物。此外，“多核苷酸”指包含RNA或DNA或RNA和DNA两者的三链区域。术语多核苷酸还包括含有一个或多个经修饰的碱基的DNA或RNA或具有为了稳定性或为了其它原因经修饰的骨架的DNA或RNA。“经修饰的”碱基包括例如，三苯甲基化的碱基和不常见的碱基(例如肌苷)。可对DNA和RNA进行多种修饰；因此，“多核苷酸”包括如在自然界中一般地发现的多核苷酸的以化学、酶促或代谢地修饰的形式，以及病毒和细胞特征性的DNA和RNA的化学形式。“多核苷酸”还包括相对短的多核苷酸，其通常被称为寡核苷酸。

“多肽”指包含通过肽键或经修饰的肽键互相连的两个或多个氨基酸(即，肽等构物)的任何肽或蛋白。“多肽”指通常被称为肽、寡肽或寡聚物的短链和通常被称为蛋白的较长的链两者。多肽可含有除了20种基因编码的氨基酸之外的氨基酸。“多肽”包括由天然过程(例如翻译后加工)或由本领域公知的化学修饰技术修饰的氨基酸序列。此类修饰被很好地描述于基础教科书和更为详细的专著中，以及长篇研究文献中。修饰可在多肽中的任何地方发生，包括肽骨架、氨基酸侧链和氨基或羧基末端。应当知道，在给定多肽的若干位点可以以相同或不同的程度存在相同类型的修饰。此外，给定的多肽可含有很多类型的修饰。多肽可由于泛素化的结果而支化，并且它们可以是环形的，可以有或没有支化。环形的、支化的和支化环形的多肽可产生自天然翻译后过程或可通过合成方法来制造。修饰包括乙酰化、酰化、ADP-核糖基化、酰胺化、黄素的共价连结、血红素部分的共价连结、核苷酸或核苷酸衍生物的共价连结、脂类或脂类衍生物的共价连结、磷脂酰肌醇的共价连结、交联、环化、二硫键形成、脱甲基化、共价交联的形成、胱氨酸的形成、焦谷氨酸的形成、甲酰化、γ-羧化、糖基化、GPI锚形成、羟基化、碘化、甲基化、豆蔻酰化、氧化、蛋白水解加工、磷酸化、异戊烯化、外消旋化、硒化(selenoylation)、硫酸化、转运RNA介导向蛋白添加氨基酸(例如精氨酰化)和泛素化。见例如Proteins-Structure and Molecular Properties，第2版，T.E.Creighton，W.H.Freeman and Company，New York，1993和Wold，F.，于PosttranslationalCovalent Modification of Proteins，B.C.Johnson，编，Academic Press，New York，1983中第1-12页；Seifter等，1990，Meth Enzymol 182，626-646和Rattan等，1992，Ann NY Acad Sci 663，48-62。

“变体”作为在本文中使用的术语是分别与参照多核苷酸或多肽不同但保留了基本性质的多核苷酸或多肽。多核苷酸的典型变体在核苷酸序列上与另外的参照多核苷酸有所不同。变体的核苷酸序列中的变化可改变或不改变由参照多核苷酸编码的多肽的氨基酸序列。如下文所讨论的，核苷酸变化可导致由参照序列编码的多肽的氨基酸替换、添加、缺失、融合和截短。多肽的典型变体在氨基酸序列上与另外的参照多肽有所不同。通常，不同是有限的，使得参照多肽和变体总体上密切相似，在很多区域是相同的。变体和参照多肽可由于任意组合的一处或多处替换、添加或缺失而在氨基酸序列上有所不同。替换或插入的氨基酸残基可以是或者可以不是遗传密码编码的氨基酸残基。多核苷酸或多肽的变体可以是天然存在的，例如等位基因变体，或者其可以是并非已知为天然存在的变体。可通过诱变技术或通过直接合成来制造非天然存在的多核苷酸和多肽变体。

“抗体”在本文中使用时包括多克隆和单克隆抗体，嵌合、单链和人源化抗体，以及抗体片段(例如Fab、Fab’、F(ab’)₂和F_v)，包括Fab或其它免疫球蛋白表达文库的产物。关于抗体，术语“免疫学特异性的”或“特异性的”指与目标蛋白的一种或多种表位结合、但并不实质上识别及结合含有抗原性生物分子的混合群体的样品中的其它分子的抗体。用于测定抗体的结合特异性的筛选测定是本领域中公知并被常规实践的。关于此类测定的综合讨论，见Harlow等(编)，Antibodies A Laboratory Manual；Cold Spring Harbor Laboratory；Cold Spring Harbor，NY(1988)，第6章。

关于单链核酸分子，术语“特异性杂交”指充分互补序列的两条单链核酸分子之间的联结以允许在本领域通常使用的预定条件下进行此类杂交(一些时候被称为“实质上互补的”)。特别地，该术语表示寡核苷酸与单链DNA或RNA分子内含有的实质上互补的序列的杂交，其实质上排除寡核苷酸与非互补序列的单链核酸的杂交。

“编码序列”或“编码区域”指具有当表达序列时产生基因产物(例如氨基酸或多肽)所必需的序列信息的核酸分子。编码序列可在被翻译的区域内包含非翻译序列(例如内含子或5’或3’非翻译区域)，或者缺乏此类处于其间的非翻译序列(例如，像在cDNA中那样)。在某些公开的数据库(例如GenBank)中，有时候使用术语“CDS”。该上下文中的CDS是对应于被编码的蛋白中氨基酸序列的核苷酸序列。典型的CDS从ATG开始，并以终止密码子结束。术语CDS还可用于表示cDNA的完整编码序列。术语“编码序列”有时可与术语“开放阅读框”互换使用。

“内含子”指核酸中不编码与蛋白合成相关的信息的多核苷酸序列。此类序列被转录为mRNA，但是在mRNA翻译成蛋白之前被移除。

术语“有效连接”或“有效插入”表示，编码序列的表达所必需的调控序列被放在核酸分子中相对于编码序列适当的位置上，以使得编码序列能够表达。举例而言，当启动子能控制编码序列的转录或表达时，启动子与该编码序列有效连接。编码序列可以以正义或反义定向与启动子或调控序列有效连接。术语“有效连接的”有时候应用至表达载体中其它转录控制元件(例如增强子)的排列上。

转录和翻译控制序列是DNA调控序列，例如启动子、增强子、聚腺苷化信号、终止子等等，它们提供编码序列在宿主细胞中的表达。

术语“启动子”、“启动子区域”或“启动子序列”通常指基因的转录调控区域，其可被发现于编码区域的5’或3’侧，或在编码区域内，或在内含子内。一般地，启动子是在细胞中能结合RNA聚合酶并起始下游(3’方向)的编码序列转录的DNA调控区域。典型的5’启动子序列在其3’末端以转录起始位点为界限，并上游(5’方向)延伸，以包括在高于背景的可检测到的水平上起始转录所必需的最小数量的碱基或元件。在启动子序列内是转录起始位点(用核酸酶Sl作图而方便地定义)以及负责RNA聚合酶的结合的蛋白结合结构域(共有序列)。

“载体”是复制子，例如质粒、噬菌体、粘粒或病毒，另外的核酸片断可有效地插入其中，以引起所述片断的复制或表达。

术语“核酸构建体”或“DNA构建体”有时用于表示与适当的调控序列有效连接并且插入载体中用于转化细胞的序列或编码序列。该术语可与术语“转化用DNA”或“转基因”互换。此类核酸构建体可含有针对感兴趣的基因产物的编码序列以及可选择标志物基因和/或报告基因。

“标志物基因”或“可选择标志物基因”是下述基因，其编码的基因产物赋予使得能够从不合有该基因的细胞中选择出含有该基因的细胞的特征。用于遗传工程的载体一般地含有一种或多种可选择标志物基因。可选择标志物基因的类型包括(1)抗生素抗性基因，(2)除草剂耐受性或抗性基因，和(3)代谢或营养缺陷型标志物基因，其使得经转化的细胞能合成否则细胞不能产生的必要组分，通常是氨基酸。

“报告基因”也是标志物基因的类型。其一般地编码可通过标准实验室手段(例如酶活性、荧光)测定或检测的基因产物。

术语“表达”、“表达的”或基因的“表达”指基因产物的生物合成。该过程涉及基因转录为mRNA以及然后mRNA翻译为一种或多种多肽，并且涵盖所有天然存在的翻译后修饰。

“内源”指能够在指明的生物中天然发现的任何成分，例如基因或核酸，或多肽。

核酸构建体的“异源”区域是在较大的分子内的核酸分子的可鉴定的片断(或多个片断)，在自然界中未发现其与所述较大的分子相联结的。因此，当异源区域包含基因时，基因侧翼将通常有这样的DNA，所述DNA在源生物的基因组中不在基因组DNA的侧翼。在另一实例中，异源区域是下述构建体，其中，编码序列自身不是自然界中发现的(例如，其中基因组编码序列含有内含子的eDNA，或者具有与天然基因不同的密码子的合成序列)。等位基因变异或天然存在的突变事件并不产生如本文定义的DNA的异源区域。如上文定义，术语“DNA构建体”还用于表示异源区域，特别是构建来用于转化细胞的异源区域。

当外源或异源DNA已被引入细胞中时，细胞已被此类外来或异源DNA“转化”或“转染”。转化用DNA可被或可不被整合(共价连接)进细胞的基因组。在原核生物、酵母和哺乳动物细胞中，例如，转化用DNA可被保持于游离元件(例如质粒)上。就真核细胞而言，经稳定转化的细胞是这样的细胞，其中，转化用细胞已被整合进染色体，使得其通过染色体复制被子代细胞遗传。该稳定性通过真核细胞建立由含有转化用DNA的细胞的子代细胞群体构成的细胞系或克隆的能力来展示。“克隆”是通过有丝分裂源于单个细胞或共同祖先的细胞群体。“细胞系”是能体外稳定生长很多世代的原代细胞的克隆。

提到突变体植物时，术语“无效突变体”或“丢失功能的突变体”用于代指下述生物或基因组DNA序列，其具有导致基因产物无功能或很大程度上不存在的突变。此类突变可在基因的编码和/或调控区域中发生，并且可以是个体残基的变化，或者核酸区域的插入或缺失。这些突变还可在可调控或控制基因和/或被编码的蛋白的其它基因的编码和/或调控区域中发生，以使得蛋白无功能或很大程度上不存在。

“粒(grain)”、“种子”或“豆”指开花植物的繁殖单元，其能发育为另外的此类植物。在本文中使用时，尤其是关于咖啡植物使用时，所述术语可同义且互换使用。

“酶”是具有酶促活性的蛋白。

“半乳甘露聚糖前体合成酶”和“半乳甘露聚糖前体合成基因”指涉及半乳甘露聚糖聚合物合成所需的前体分子的合成的蛋白或酶以及编码它们的基因。半乳甘露聚糖前体合成酶包括UDP-葡糖焦磷酸化酶(UGPP)、UDP-葡糖4-差向异构酶(UGE)、磷酸甘露糖变位酶(PMM)和GDP-甘露糖焦磷酸化酶(GMPP)。相似地，半乳甘露聚糖前体合成基因包括编码UGPP、UGE、PMM和GMPP的基因。

在本文中使用时，术语“植物”包括提到整株植物、植物器官(例如叶、茎、枝、苗、根)、种子、花粉、植物细胞、植物细胞的细胞器、及其后代(包括可育后代)。在本发明的范围内，转基因植物的部分应当被理解为包含，例如，源自转基因植物或它们的后代的植物细胞、原生质体、组织、愈伤组织、胚胎以及花、茎、枝、种子、花粉、果实、叶或根。

范围在本文中用于简述，以避免必须列出和描述范围内的每个和所有的值。如果适当的话，范围内的任何适当的值可被选择为范围的上端值(upper value)、下端值(1ower value)或者终端(terminus)。

在本文中使用时，词语的单数包括复数，反之亦然，除非上下文另有明确规定。因此，提到单数形式“a”，“an”以及“the”通常包括各术语的复数。例如，提到“酶”、“植物”或“方法”或“疾病”包括此类“酶”、“植物”或“方法”的复数。类似地，词语“包含”及其各种词性形式应当被解释为包括性的，而非排他性的。类似地，术语“包括”及其各种词性形式和“或”应当全部被解释为包括性的，除非此类解释明确被上下文所禁止。类似地，术语“实例”，特别地，当在术语列表后时，仅仅是示例性和阐述性的，并且不应当被认为是排他性的或穷举性的。

术语“包含”旨在包括由术语“基本上由......构成”或“由......构成”所包括的实施方式。类似地，术语“基本上由......构成”意欲包括由术语“由......构成”所包括的实施方式。

本文公开的方法和组合物和其它进展不限于特别的方法学、方案和试剂，因为如本领域技术人员将知道的，它们可有所变动。此外，本文使用的术语仅用于描述特别的实施方式的目的，它们不意欲也并不限制被公开的或被要求保护的范围。

除非另有定义，本文使用的所有技术和科学术语、本领域的术语以及缩写具有发明领域或使用该术语的领域的普通技术人员通常理解的含义。虽然与本文所述的那些类似或等同的任何组合物、方法、制造产品或其它手段或材料也可用于实践本发明，但是本文描述了优选的组合物、方法、制造产品或其它手段或材料。

本文引用或提到的所有专利、专利申请、公开文本、技术和/或学术文章以及其它参考文献都通过引用以其整体以法律允许的程度并入本文。关于这些参考文献的讨论仅旨在用于概括其中的主张。并不承认任何此类专利、专利申请、公开文本或参考文献或其任何部分相关、是素材或现有技术。特别保留挑战此类专利、专利申请、公开文本和其它参考文献作为相关、素材或现有技术的任何主张的精确性和针对性的权利。

描述：

半乳甘露聚糖是在绿色咖啡粒中发现的重要的多糖的组。已知，该特别的咖啡聚合物难于溶解。因此，某些研究努力的目的是发现降低咖啡粒中半乳甘露聚糖的量，由此在较低的温度下获得经烘焙咖啡的较高的溶解度的途径。另一研究目的是改变咖啡粒中半乳甘露聚糖的溶解度，使得其更易在较低的温度下提取，甚至当其丰富存在时。在此之前，使用半乳糖基转移酶(GMGTase)、甘露聚糖合酶(ManS)和甘露聚糖酶，此类努力已关注于改变涉及半乳甘露聚糖合成和降解的酶的量或活性。此外，更多的全面努力被用于测定多种代谢途径之间的关系，其中使用小果咖啡作为案例研究，但是并没有特别关注半乳甘露聚糖途径(Joet等，April 2009，New Phytol.182(1)，146-162)。

本发明部分源于发明人的下述见解：还可通过改变底物或上游中间产物(即，甘露糖1-磷酸、GDP-甘露糖、UDP-葡萄糖和UDP-半乳糖)对合成酶(GMGTase和ManS)的可获得性，来调节咖啡粒内半乳甘露聚糖的含量或结构。此外，发明人已知道，这可以通过调节涉及形成这些前体的酶的量或活性，在生物水平上来完成，所述酶包括：(1)UDP-葡糖焦磷酸化酶(UGPP)，其催化葡萄糖-1-磷酸转化为UDP-葡萄糖；(2)UDP-葡糖4-差向异构酶(UGE)，其催化UDP-葡萄糖转化为UDP-半乳糖；(3)磷酸甘露糖变位酶(PMM)，其催化甘露糖-6-磷酸转化为甘露糖-1-磷酸；和(4)GDP-甘露糖焦磷酸化酶(GMPP)，其催化甘露糖-1-磷酸转化为GDP-甘露糖。

如下文中详细描述的，发明人已分离了针对这些基因的中果咖啡cDNA，并且测定了它们在咖啡樱桃果(coffee cherries)发育期间和在若干其它咖啡组织中的表达。还提出了利用这些基因和它们编码的酶来调节半乳甘露聚糖前体合成的方法，其目标在于调节咖啡中的半乳甘露聚糖水平和或溶解度。

多核苷酸和多肽

本发明的一个方面以来自咖啡的、编码涉及半乳甘露聚糖前体合成的酶的核酸分子为特征。这些包括UDP-葡糖焦磷酸化酶(UGPP)、GDP-甘露糖焦磷酸化酶(GMPP)、磷酸甘露糖变位酶(PMM)和UDP-葡糖4-差向异构酶(UGE)，并且有时被合称为“半乳甘露聚糖前体合成酶”。编码来自中果咖啡的完整UGPP的cDNA在本文中示为SEQ ID NO：1，并被称为CcUGPP。编码来自中果咖啡的完整GMPP的cDNA在本文中示为SEQ ID NO：2，并被称为CcGMPP。编码来自中果咖啡的完整PMM的cDNA在本文中示为SEQ ID NO：3，并被称为CcPMM。编码来自中果咖啡的完整UGE的两种cDNA在本文中示为SEQ ID NO：4和SEQ IDNO：5，并分别被称为CcUGE1和CcUGE5。

本发明的另一方面以通过这些核酸分子的表达生产的蛋白为特征。通过SEQ ID NO：1的翻译生产的CcUGPP蛋白的推定的氨基酸序列在本文中示为SEQ ID NO：6。通过SEQ ID NO：2的翻译生产的CcGMPP蛋白的推定的氨基酸序列在本文中示为SEQ ID NO：7。通过SEQ ID NO：3的翻译生产的CcPMM蛋白的推定的氨基酸序列在本文中示为SEQ ID NO：8。通过SEQ ID NO：4和SEQ ID NO：5的翻译生产的CcUGE1和CcUGE5蛋白的推定的氨基酸序列在本文中被分别示为SEQ ID NO：9和SEQ IDNO：10。

虽然本文中示例了来自中果咖啡的半乳甘露聚糖前体合成多核苷酸和酶，就下文描述的目的而言，本发明旨在涵盖来自其它咖啡属物种的、足够相似以至于可与中果咖啡多核苷酸和蛋白互换使用的核酸和被编码的蛋白。因此，当在本文中提到半乳甘露聚糖前体合成酶“UDP-葡糖焦磷酸化酶”(“UGPP”)、“GDP-甘露糖焦磷酸化酶”(“GMPP”)、“磷酸甘露糖变位酶”(“PMM”)和“UDP-葡糖4-差向异构酶”(“UGE”)时，这些术语旨在涵盖具有本文描述的一般性物理、生物化学和功能特征的所有咖啡属UGPP、GMPP、PMM和UGE，以及编码它们的多核苷酸，除非另有特别指明。

考虑到其序列时，本发明的UGPP、GMPP、PMM和UGE多核苷酸包括可能在中果咖啡和小果咖啡的不同品种中发现的、SEQ ID NO：1-5的等位基因变体和天然突变体，以及可能在不同咖啡物种(包括但不限于小果咖啡)中发现的SEQ ID NO：1-5的变体、天然突变体和同源体。在特别的实施方式中，利用来自小果咖啡的变体、突变体和同源体。因为预期此类变体和同源体在核苷酸和氨基酸序列中具有某些差异，合适的半乳甘露聚糖前体合成多肽包括与SEQ ID NO：6-10的多肽分别具有至少大约80％、或81％、或82％、或83％、或84％、或85％、或86％、或87％、或88％、或89％、或90％、或91％、或92％、或93％、或94％、或95％、或96％、或97％、或98％、或99％的同一性的那些多肽。在不同咖啡品种和物种中，因为这些酶，以及编码它们的基因中，可能存在天然序列变异，本领域技术人员将预期发现该种水平的变异，而同时保持本发明的多肽和多核苷酸的独特性质。此类预期部分由于遗传密码的简并性，以及由于保守氨基酸序列变异的已知进化成功，这不明显地改变被编码的蛋白的本质。

中果咖啡半乳甘露聚糖前体酶可进一步通过具有非保守序列的蛋白区域而与来自其它物种的直向同源体区分开。针对CcUGPP、CcGMPP、CcPMM、CcUGE1和CcUGE5中每种的独特或非保守序列示于下文(单个残基如此示出；用两个残基之间的连字符标注两条或更多条序列的连续序列；例如，“1-8”表示包含性的、连续的残基1至8)。

多核苷酸和多肽：

本发明的核酸分子可通过两种一般性方法来制备：(1)可从适当的核苷酸三磷酸酯来合成它们；或(2)它们可分离自生物来源。两种方法均利用本领域公知的方案。

核苷酸序列信息的可获得性，例如具有SEQ ID NO：1-5的eDNA，使得能通过寡核苷酸合成来制备分离的核酸分子。可通过Applied Biosystems38A DNA合成仪或类似设备中采用的亚磷酰胺方法来制备合成寡核苷酸。可根据本领域已知的方法(例如高效液相色谱(HPLC))来纯化得到的构建体。

可通过使用适当严格性的杂交和洗涤条件，来鉴定与半乳甘露聚糖前体合成多核苷酸的部分或全部的编码和/或调控区域具有适当的序列同源性水平的核酸。本领域技术人员将知道，前述策略当应用于基因组序列中，除了使得能分离编码酶的序列之外，还使得能分离与半乳甘露聚糖前体合成基因联结的启动子和其它基因调控序列，即使调控序列自身可能并不共享实现合适杂交的足够的同源性。

作为典型的阐述，可使用包含下述物质的杂交溶液来进行杂交：5XSSC、5X Denhardt试剂、1.0％SDS、100μg/ml变性的、片段化的鲑鱼精子DNA、0.05％焦磷酸钠和至多50％甲酰胺。杂交在37-42℃进行至少6小时。杂交后，按照下文所述来洗滤膜：(1)2X SSC和1％SDS中于室温下进行5分钟；(2)2X SSC和0.1％SDS中于室温下进行15分钟；(3)2X SSC和0.1％SDS中于37℃进行30分钟-1小时；(4)2X SSC和0.1％SDS中于45-55℃进行2小时，每30分钟更换溶液。

用于计算实现指明的序列同源性的核酸分子之间的杂交所需的严格性条件的一种常见公式：

Tm＝81.5℃+16.6Log[Na+]+0.41(％G+C)-0.63(％甲酰胺)-600/双链体中的#bp

作为对上述公式的阐述，使用[Na+]＝[0.368]和50％甲酰胺，GC含量为42％，以及平均探针尺寸200个碱基，Tm为57℃。DNA双链体的Tm随着同源性每减少1％而减少1-1.5％。因此，使用42℃的杂交温度，将观察到具有超过大约75％序列同一性的靶。在一种实施方式中，用上述杂交和洗涤溶液，杂交于37℃进行，最后的洗涤于42℃进行；在另一实施方式中，杂交于42℃进行，最后的洗涤于50℃进行；以及在又一实施方式中，杂交于42℃进行，最后的洗涤于65℃进行。高严格性的条件包括：于42℃在上述杂交溶液中杂交以及于65℃在0.1X SSC和0.1％SDS中进行10分钟的最后洗涤。

核酸可作为DNA被保持于任何方便的克隆载体中。在优选的实施方式中，质粒克隆/表达载体中保持克隆，例如pGEM-T(Promega Biotech，Madison，WI)、pBluescript(Stratagene，La Jolla，CA)、pCR4-TOPO(Invitrogen，Carlsbad，CA)或pET28a+(Novagen，Madison，WI)，它们全部可在合适的大肠杆菌宿主细胞中繁殖。

本发明的核酸分子包括cDNA、基因组DNA、RNA、及其片段，它们可以是单链、双链或者甚至三链的。因此，本发明提供了具有能与本发明的核酸分子的至少一条序列杂交的序列的寡核苷酸(DNA或RNA的正义或反义链)。此类寡核苷酸作为探针是有用的，用于例如通过PCR扩增检测植物组织的测试样品中的半乳甘露聚糖前体合成基因或mRNA，或用于在mRNA翻译为蛋白时或之前对半乳甘露聚糖前体合成酶的表达进行正或负的调控。其中可利用寡核苷酸或多核苷酸作为用于此类测定的探针的方法包括但不限于：(1)原位杂交；(2)Southern杂交；(3)northern杂交；和(4)各种扩增反应，例如聚合酶链式反应(PCR，包括RT-PCR)和连接酶链式反应(LCR)。

任选地，寡核苷酸可被构建为包含编码半乳甘露聚糖前体酶的多核苷酸的、对于这些多核苷酸来说独特的区域，即，较之与来自其它物种的直向同源体杂交而言更可能与咖啡属的多核苷酸杂交的区域。该方式中用于靶向的合适区域包括编码针对每种被编码的蛋白而言独特或非保守区域的区域，如上文示出的。

具有能与本发明的核酸分子的至少一条序列杂交的序列的寡核苷酸包括反义寡核苷酸。可利用靶向对于翻译来说关键的mRNA特定区域的反义寡核苷酸。反义分子用于减少预定基因表达水平的用途是本领域已知的。可通过用转录时产生反义RNA序列的DNA构建体转化植物细胞来原位提供反义分子。此类构建体可被设计为产生全长或部分的反义序列。这种基因沉默效果可通过以转基因方式过量生产编码基因的序列的正义和反义RNA从而使得产生大量dsRNA来增强。在该方面，已发现含有对应于至少一个内含子的部分或全部的序列的dsRNA特别有效。在一种实施方式中，适当的反义链的部分或全部由转基因表达。在另一实施方式中，可通过使用小干扰RNA(siRNA)或微小RNA(miRNA)，使用可商购的材料和方法(例如Invitrogen，Inc.，Carlsbad CA)，来沉默基因。

可以根据已知的方法，以多种途径制备多肽。如果原位产生的话，可从适当的来源纯化多肽，例如，从种子、果皮或其它植物部分。备选地，编码多肽的核酸分子的可获得性使得能使用本领域已知的体外表达方法来生产蛋白。

例如，可通过在合适的原核或真核系统中表达来生产大量多肽。例如，DNA分子(例如具有SEQ ID NO：1-5中任何的cDNA)的部分或全部可被插入适于在细菌细胞(例如大肠杆菌)或酵母细胞(例如酿酒酵母)中表达的质粒载体，或插入用于在昆虫细胞中表达的杆状病毒载体。此类载体包含在宿主细胞中表达DNA所需的调控元件，所述调控元件以允许DNA在宿主细胞中表达的方式被放置。表达所需的此类调控元件包括启动子序列、转录起始序列以及任选地增强子序列。

可根据本领域已知的方法纯化通过在重组原核或真核系统的基因表达而产生的多肽。在优选的实施方式中，可使用可商购的表达/分泌系统，由此表达重组蛋白，以及之后从宿主细胞分泌重组蛋白，以及之后从周围的培养基中纯化重组蛋白。备选的方法涉及通过亲和分离(例如通过与和重组蛋白特异性结合的抗体发生免疫相互作用)来纯化重组蛋白。可根据标准流程分析通过上述方法制备的本发明的多肽。

可根据已知方法，用纯化自咖啡或重组生产的多肽来生成如本文定义的多克隆或单克隆抗体、抗体片段或衍生物。任选地，可生成针对对应于各蛋白非保守区域的合成肽制造的抗体。

载体、试剂盒和转基因生物：

根据本发明还以用于生产转基因宿主细胞的载体和试剂盒为特征，其含有半乳甘露聚糖前体合成多核苷酸、寡核苷酸、其正义或反义定向的变体、siRNa、miRNA或报告基因以及处于适当的启动子和其它调控序列控制下的其它构建体。合适的宿主细胞包括但不限于植物细胞、细菌细胞、酵母和其它真菌细胞、昆虫细胞和哺乳动物细胞。用于转化多种多样的这些宿主细胞的载体是本领域技术人员公知的。它们包括但不限于，质粒、粘粒、杆状病毒、杆粒、细菌人工染色体(BAC)、酵母人工染色体(YAC)以及其它细菌、酵母和病毒载体。一般地，用于生产转基因宿主细胞的试剂盒将含有一种或多种适当的载体和用于使用所述载体来生产转基因细胞的说明书。试剂盒还可包括一种或多种额外的组分，例如用于培养细胞的培养基、用于进行细胞转化的试剂以及用于针对表达对转基因细胞加以测试的试剂，等等。

本发明包括转基因植物，其包含半乳甘露聚糖前体合成多核苷酸的一个或多个拷贝，或抑制一种或多种植物内源的半乳甘露聚糖前体合成酶的产生或功能的核酸序列，例如反义、siRNA或miRNA。如下文所述，这通过用由天然或重组调控序列控制的转基因转化植物细胞来完成，所述转基因包含编码半乳甘露聚糖前体合成酶的序列的部分或全部，或其突变体、反义或变体，包括RNA、siRNA或miRNA。转基因咖啡物种包括但不限于，阿比欧库塔咖啡(C.abeokutae)、小果咖啡、阿诺尔迪亚纳咖啡(C.arnoldiana)、C.aruwemiensis、本伽兰西斯咖啡(C.bengalensis)、中果咖啡、刚果咖啡(C.congensis)、德维瑞咖啡(C.Dewevrei)、艾克塞尔萨(C.excelsa)、欧基尼奥伊德斯咖啡(C.eugenioides)、C.heterocalyx、卡帕卡塔咖啡(C.kapakata)、卡斯亚娜咖啡(C.khasiana)、大果咖啡(C.liberica)、C.moloundou、瑞斯莫撒咖啡(C.rasemosa)、萨尔瓦特里克斯咖啡(C.salvatrix)、C.sessiflora、思迪诺菲拉咖啡(C.stenophylla)、特拉文科仁西斯咖啡(C.travencorensis)、维提亚娜咖啡(C.wightiana)和赞奎巴利亚咖啡(C.zanguebariae)。任何物种的植物也被本发明包括，因为下文描述的方法可对调节其它物种中的半乳甘露聚糖含量有特别优势。此类物种包括但不限于烟草，拟南芥属和其它“实验室友好”的物种，谷类作物，例如玉米、小麦、水稻、大豆、大麦、黑麦、燕麦、高粱、苜蓿、三叶草等等，产油植物，例如油菜、红花、向日葵、花生、可可等等，蔬菜作物，例如番茄、酸浆果、马铃薯、胡椒、茄子、甜菜、胡萝卜、黄瓜、莴苣、豌豆等等，园艺学植物，例如紫菀、秋海棠、菊、飞燕草、矮牵牛属植物、百日草属属植物、草坪和草皮草等等。

可使用本领域技术人员已知的标准植物转化方法来生成转基因植物。它们包括但不限于，农杆菌属载体，对原生质体的聚乙二醇处理，生物射弹DNA递送，UV微激光束，双子病毒载体(gemini virus vectors)或其它植物病毒性载体，对原生质体的磷酸钙处理，对经分离的原生质体的电穿孔，在溶液中用涂布有转化用DNA的微粒来搅拌细胞悬浮液，在溶液中用涂布有转化用DNA的硅纤维来搅拌细胞悬浮液，直接DNA摄入，脂质体介导的DNA摄入等等。此类方法是本领域公知的。

转化方法取决于待转化的植物。农杆菌属的载体通常用于转化双子叶植物物种。农杆菌属的二元载体包括但不限于BIN19及其衍生物、pBI载体系列和二元载体pGA482、pGA492、pLH7000(GenBank检录号AY234330)以及pCAMBIA载体中任何合适的之一(源于由Hajdukiewicz等，1994，Plant Mol Biol 25，989-994构建的pPZP载体，可从CAMBIA，GPO Box 3200，Canberra ACT 2601，澳大利亚获得或者通过CAMBIA.org的全球网页获得)。为进行单子叶植物物种的转化，用经转化用DNA涂布的颗粒和经转化用DNA涂布的硅纤维进行生物射弹轰击通常可用于核转化。备选地，农杆菌属“超级二元”载体已成功用于转化水稻、玉米和多种其它单子叶植物物种。

用于转化所选择的植物的DNA构建体包含与适当的5’(例如启动子和翻译调控序列)和3’调控序列(例如终止子)有效连接的目标编码序列。在一种实施方式中，可利用处于其自身5’和3’调控元件控制下的编码半乳甘露聚糖前体合成的序列。在其它实施方式中，交换编码和调控半乳甘露聚糖前体合成的序列，以改变经转化植物的多糖谱。

在备选的实施方式中，将基因的编码区域放在强有力的组成型启动子下，例如花椰菜花叶病毒(CaMV)35S启动子或玄参花叶病毒35S启动子。被考虑用于本发明的其它组成型启动子包括但不限于，T-DNA甘露碱合成酶、胭脂氨酸合酶和章鱼碱合酶启动子。在其它一些实施方式中，使用强单子叶植物启动子，例如，玉米泛素启动子、水稻肌动蛋白启动子或水稻微管蛋白启动子(Jeon等，2000，Plant Physiology 123，1005-14)。

表达处于可诱导启动子控制下的半乳甘露聚糖前体合成酶编码序列的转基因植物也被考虑在本发明的范围内。可诱导植物启动子包括四环素阻抑子/操纵子控制的启动子、热休克基因启动子、胁迫(例如伤害)诱导的启动子、防御应答性基因启动子(例如苯丙氨酸氨裂解酶基因)、伤口诱导的基因启动子(例如富含羟脯氨酸的细胞壁蛋白基因)、可化学诱导的基因启动子(例如硝酸盐还原酶基因、葡聚糖酶基因、几丁质酶基因等等)和黑暗可诱导的基因启动子(例如天冬酰胺合成酶基因)等等。

组织特异性和发育特异性启动子也被考虑用于本发明。种子特异性启动子的非限制性实例包括Cim1(细胞分裂素诱导的信使)、cZ19B1(玉米19kDa玉米蛋白)、milps(肌醇-1-磷酸合酶)和celA(纤维素合酶)(美国专利号No.6,225,529)、豆β-菜豆蛋白、油菜籽蛋白、β-伴大豆球蛋白、大豆凝集素、十字花科蛋白(cruciferin)、玉米15kDa玉米蛋白、22kDa玉米蛋白、27kDa玉米蛋白、g-玉米蛋白、蜡质、shrunken 1、shrunken 2和球蛋白1、大豆11S豆球蛋白和中果咖啡11S种子贮藏蛋白。还见WO 00/12733，其中公开了来自end1和end2基因的偏好种子的启动子。也可利用其它咖啡属种子特异性启动子，包括但不限于WO2007/005928中描述的油质蛋白基因启动子、WO 2007/005980中描述的脱水素(dehydrin)基因启动子以及WO 2007/028115中描述的9-顺-环氧类胡萝卜素加双氧酶基因启动子。其它组织特异性启动子的实例包括但不限于：用于在光合组织中表达的核酮糖二磷酸羧化酶(RuBisCo)小亚基基因启动子(例如Marraccini等的美国专利No.7,153,953)或叶绿素a/b结合蛋白(CAB)基因启动子；以及根特异性谷氨酰胺合成酶基因启动子，其中在根中的表达是想要的。

编码区域还可与适当的3’调控序列有效连接。在其中不使用天然3’调控序列的实施方式中，可使用胭脂氨酸合成酶聚腺苷化区域。其它有用的3’调控区域包括但不限于，章鱼碱合酶聚腺苷化区域。

处于适当的调控元件控制下的所选择的编码区域与药物抗性标志物(例如卡纳霉素标志物)有效连接。其它有用的可选择标志物系统包括赋予对抗生素或除草剂抗性(例如对潮霉素、磺酰脲、草胺膦(phosphinothricin)或草甘膦(glyphosate)的抗性)的基因或赋予选择性生长(例如磷酸甘露糖异构酶，其使得植物细胞能在甘露糖上生长)的基因。可选择标志物基因包括但不限于，编码抗生素抗性的基因，例如编码新霉素磷酸转移酶II(NEO)、二氢叶酸还原酶(DHFR)和潮霉素磷酸转移酶(HPT)的那些基因，以及赋予对除草剂性化合物的抗性的基因，例如草甘膦抗性EPSPS和/或草甘膦氧化还原酶(GOX)，用于对溴苯腈(bromoxynil)的抗性的溴苯腈腈水解酶(BXN)，用于对咪唑啉酮的抗性的AHAS基因，磺酰脲抗性基因和2，4-二氯苯氧乙酸(2，4-D)抗性基因。

在某些实施方式中，本发明包括的启动子和其它表达调控序列与报告基因有效连接。考虑用于本发明的报告基因包括但不限于，编码绿色荧光蛋白(GFP)、红色荧光蛋白(DsRed)、青色荧光蛋白(CFP)、黄色荧光蛋白(YFP)、角海葵(Cerianthus)橙色荧光蛋白(cOFP)、碱性磷酸酶(AP)、β-内酰胺酶、氯霉素乙酰转移酶(CAT)、腺苷脱氨酶(ADA)、氨基糖苷磷酸转移酶(neo^r，G418^r)、二氢叶酸还原酶(DHFR)、潮霉素-B-磷酸转移酶(HPH)、胸苷激酶(TK)、lacZ(编码α-半乳糖苷酶)和黄嘌呤鸟嘌呤磷酸核糖转移酶(XGPRT)、β-葡糖苷酸酶(gus)、胎盘碱性磷酸酶(PLAP)、分泌的胚胎碱性磷酸酶(SEAP)或萤火虫或细菌荧光素酶(LUC)的基因。使用与实践本发明相关的很多标准流程，本领域技术人员将能知晓可提供标志物或报道基因的功能的额外的序列。

本领域中还已知增强细胞宿主中的基因表达的额外的序列修饰。这些修饰包括消除编码多余的聚腺苷化信号、外显子-内含子剪接位点信号、转座子样重复的序列和可能对基因表达有害的其它此类经良好表征的序列。备选地，如果必要的话，可将编码序列的G/C含量调节至给定的咖啡植物细胞宿主的平均水平，这是通过参照在咖啡植物细胞中表达的已知基因来计算的。此外，当可能时，对编码序列加以修饰，以避免预测的发卡二级mRNA结构。增强基因表达的另一备选是使用5’前导序列。翻译前导序列是本领域中公知的，其包括烟草花叶病毒的5’前导序列(Ω)的顺式作用衍生物(Ω’)，来自雀麦草(brome)花叶病毒、苜蓿花叶病毒和芜菁黄花叶病毒的5’前导序列。

转化植物，并且之后就一种或多种性质对其加以筛选，所述性质包括存在转基因产物、存在编码转基因的mRNA或存在与转基因的表达或与设计来减少内源基因表达的序列(例如反义、siRNA或miRNA)的表达相关的改变的表型。应当认识到，经转化的植物中转基因表达的量、以及转基因表达的组织特异性和事件特异性模式可依赖于它们插入核基因组的位置而不同。此类位置性效应是本领域公知的。为此，应当再生若干核转化体，并就转基因的表达对其加以测试。

方法：

本发明的核酸和多肽可用于大量方法中的任一，通过所述方法，可对咖啡植物中半乳甘露聚糖前体合成酶中一种或多种的生产或活性加以调节，以影响多种表型性状，例如，用于改善豆的生产量。例如，预期半乳甘露聚糖含量的减少或半乳甘露聚糖结构的改变能大大改善制造速溶咖啡的方法中对固体的回收。半乳甘露聚糖含量的增加可能对植物的其它部分或对其它植物物种来说是想要的。

可通过(1)经典育种或(2)遗传工程技术，以及通过组合这两种方法，来获得咖啡粒半乳甘露聚糖含量或结构、或其它特征的改善。根据本发明，通过在咖啡中分离和表征编码半乳甘露聚糖前体合成酶UGPP、GMPP、PMM和/或UGE的多核苷酸，已相当地改善了这两种方法。例如，可对编码UGPP、GMPP、PMM和/或UGE的基因绘制遗传图谱，并鉴定涉及半乳甘露聚糖含量或结构的数量性状基因座(QTL)。然后将能够测定此类QTL是否与UGPP、GMPP、PMM或UGE相关基因相关联。还可鉴定影响半乳甘露聚糖前体水平的基因的等位基因(单倍型)，并检测以确定特定单倍型的存在是否与半乳甘露聚糖前体合成强烈地相关联。这些标志物可用于在标志物辅助育种程序中发挥优势。

本发明者在本文中展示了分离涉及半乳甘露聚糖前体合成的多核苷酸的另一优势。这用于在具有高和低的半乳甘露聚糖或半乳甘露聚糖前体水平的品种中在咖啡豆成熟期间生成这些基因的表达数据。信息用于指导对遗传操作中使用的基因的选择，所述遗传操作目的在于生成在成熟豆中具有增加或减少的半乳甘露聚糖水平的新颖的转基因咖啡植物。

在一个方面，本发明以改变植物(优选地，咖啡)中半乳甘露聚糖谱的方法为特征，所述方法包括增加或减少植物中一种或多种半乳甘露聚糖前体合成酶的量或活性。本发明的特定实施方式提供了增加或减少UGPP、GMPP、PMM和/或UGE的生产的方法。

在一种实施方式中，可使用编码UGPP、GMPP、PMM和/或UGE的多核苷酸中的一种或多种，例如包含SEQ ID NO：1-5的cDNA，来转化咖啡植物，其目的在于在多种咖啡组织中分别过量产生这些酶中的一种或多种。在一种实施方式中，为了UGPP、GMPP、PMM和/或UGE生产的一般性增加，对咖啡植物进行改造，这例如通过使用与编码序列功能性连接的启动子例如RubisCo小亚基(SSU)启动子或CaMV35S启动子来进行。在一些实施方式中，可改造对咖啡植物的修饰，以增加UGPP、GMPP、PMM或UGE中的两种、三种或全部。

包含编码上述UGPP、GMPP、PMM或UGE的序列中的一种或多种的转基因植物还可含有直接涉及半乳甘露聚糖合成的酶(即，甘露聚糖合酶和半乳甘露聚糖半乳糖基转移酶，例如WO 2007/047675中描述的)的编码序列。它们可任选含有靶向编码半乳甘露聚糖降解酶的RNA的RNAi编码序列(如下文所述)。一种或多种这些转基因的组合将导致在生物合成途径中以若干水平对半乳甘露聚糖合成的有效上调，伴随对半乳甘露聚糖降解性酶的任选下调。

构建半乳甘露聚糖前体库的努力中可能产生一种情况，其中此类前体被分流进入其它生物化学途径，并且因此是半乳甘露聚糖合成所无法获得的。避开此类情况的一种途径将是利用来自不同植物物种的一种或多种半乳甘露聚糖前体合成基因。这将预期能避开此类分流(siphoning)，以及避免从物种特异性翻译和翻译后抑制产生的问题。此类现象已在植物中的蔗糖代谢中观察到(Privat，等，2008，New Phytol.178，781-797)。

在设计来将半乳甘露聚糖前体酶过量生产仅限制于目标库器官(sinkorgan)(即，粒)的另一实施方式中，可使用粒特异性的启动子，特别是上文所述的咖啡属粒特异性启动子中的一种。这些启动子还可用于指导旨在下调靶基因的表达的多核苷酸的表达，如下文所述。

可针对UGPP、GMPP、PMM和/或UGE的天然存在的变体，对展示出改变的半乳甘露聚糖或半乳甘露聚糖前体谱的植物加以筛选，这例如通过测量半乳甘露聚糖前体以及任选地半乳甘露聚糖的形成，或通过测量多种酶的量或活性来进行。例如，功能丢失(无效)突变体植物可制造自或选自目前可用的植物突变体的群体。本领域技术人员还将知道，还可利用本文描述的一种或多种方法，针对不足表达或过量表达特定多糖代谢酶(例如半乳甘露聚糖前体合成酶)的突变体，来筛选突变体植物群体。可通过化学诱变、放射诱变以及转座子或T-DNA插入，或者靶向基因组中经诱导的局部伤口，来制造突变体群体(TILLING，见例如Henikoff等，2004，Plant Physiol.135，630-636；Gilchrist&Haughn，2005，Curr.Opin.Plant Biol.8，211-215)。制造突变体群体的方法是本领域公知的。

本发明的核酸可用于在多种植物物种中鉴定半乳甘露聚糖前体合成酶的突变体形式。在例如玉米或拟南芥属的物种中(其中可获得转座子插入品系)，可将寡核苷酸引物设计为针对半乳甘露聚糖前体合成基因中的插入来对品系加以筛选。通过育种，可开发出针对被打断的基因来说杂合或纯合的植物品系。在一些实施方式中，杂合性可能比纯合性更为有用，因为生物合成酶的完全消除可能对植物过于有害以至于无法存活，而部分消除可产生更为合意的结果。

本发明的另一实施方式涉及通过减少粒中UGPP、GMPP、PMM和/或UGE中一种或多种的活性或量，来减少咖啡粒中的半乳甘露聚糖。这可以以多种途径完成。

在一种实施方式中，可对植物进行改造，以展示出与通过诱变技术制造的无效突变体中所看到的类似的表型。可通过表达UGPP、GMPP、PMM和/或UGE的突变体形式以制造“显性失活效应”来制造转基因无效突变体。在不限制本发明为任何一种机制的情况下，该突变体蛋白将针对与蛋白或其它细胞因子的相互作用与野生型蛋白竞争。这种类型的“显性失活”效应的实例对昆虫和脊椎动物系统来说是公知的。

另一种类的转基因无效突变体可通过“转录后基因沉默”抑制编码UGPP、GMPP、PMM和/或UGE的mRNA的翻译来制造。这些技术可用于在植物粒中下调酶，由此减少半乳甘露聚糖合成可用的半乳甘露聚糖前体的量。例如，可使用半乳甘露聚糖前体合成多核苷酸或其片段以控制所编码的蛋白的产生。全长反义分子可用于该目的。备选地，可利用靶向对翻译来说关键的mRNA特定区域的反义寡核苷酸。反义分子减少预定的基因的表达水平的用途是本领域已知的。反义分子可通过用转录后产生反义RNA序列的DNA构建体转化植物细胞来原位提供。此类构建体可被设计为产生全长或部分反义序列。该基因沉默效果可通过下述方式增强：以转基因方式过量产生编码基因的序列的正义和反义RNA两者，使得产生大量的dsRNA(例如见Waterhouse等.，1998，Proc Natl Acad Sci USA 95，13959-13964)。在该方面，已发现含有对应于至少一种内含子的部分或全部的序列的dsRNA特别有效。在一种实施方式中，编码UGPP、GMPP、PMM和/或UGE的反义链的部分或全部由转基因表达。

在另一实施方式中，可通过使用针对植物系统目前可用的多种其他转录后基因沉默(RNA沉默)技术来沉默半乳甘露聚糖前体合成基因。RNA沉默涉及通过基于RNase H的酶(“切酶”或“切酶样”)将双链RNA(dsRNA)加工为小的21-28个核苷酸的片段。是siRNA(小干扰RNA)或miRNA(微小RNA)的切割产物可被并入蛋白效应器复合体，其以序列特异性方式调控基因表达(关于植物中RNA沉默的综述，参见Horiguchi，2004，Differentiation 72，65-73；Baulcombe，2004，Nature 431，356-363；Herr，2004，Biochem.Soc.Trans.32，946-951)。siRNA与其靶完美地碱基配对，并且被认为通过切割靶RNA来降低表达。相比之下，miRNAs通过与靶mRNA形成不完美碱基配对双链体(最通常位于信使的3’非编码区域内)来调控基因表达。通常，miRNA抑制靶mRNA的翻译，尽管在一些情况下它们还可降低被靶向的mRNA的半寿期并因此降低其水平。

可化学合成，或体外转录和扩增小干扰RNA或微小RNA，然后将其递送至细胞。递送可通过显微注射、化学转染、电穿孔或阳离子脂质体介导的转染，或本领域中可用的本领域技术人员知道的任何其它手段来进行。备选地，例如，通过质粒，可通过将miRNA或siRNA的DNA模板插入目标细胞来细胞内表达miRNA或siRNA，并且可特异性靶向miRNA或siRNA以选择细胞。已经将小干扰RNA成功引入植物。

在本发明中优选的RNA沉默方法是使用短发卡RNA(shRNA)。通过任何常见手段，将含有编码特别合意的siRNA序列的DNA序列的载体递送入靶细胞。一旦处于细胞中，DNA序列则被持续转录为RNA分子，所述RNA分子在自身上成环，并通过分子内碱基配对形成发卡结构。这些发卡结构一旦被细胞加工就等同于siRNA分子，并且被细胞用于介导对合意的蛋白的RNA沉默。对RNA沉默有特别用途的多种构建体由上文的Horiguchi，2004描述。一般地，此类构建体包含启动子、“正义”定向的待沉默的靶基因的序列、间隔区、靶基因序列的反义和终止子。

还可通过“共阻抑”技术来制造合成的无效突变体的另一类型(Vaucheret等，1998，Plant J.16，651-659)。用阻抑靶向的内源基因的拷贝来转化植物细胞。在很多情况下，这导致对天然基因以及转基因的完全阻抑。在一种实施方式中，分离来自目标植物物种的半乳甘露聚糖前体合成基因并将其用于转化该相同物种的细胞。

上述技术中的任何可不仅被用于编码UGPP、GMPP、PMM或UGE的序列，其还可包括抑制直接涉及半乳甘露聚糖合成的酶(即，甘露聚糖合酶和半乳甘露聚糖半乳糖基转移酶，例如WO 2007/047675中描述的那些)的编码序列的表达。所述技术可任选与一种或多种甘露聚糖酶的过表达组合，以加速所选择的组织中半乳甘露聚糖的降解。这些转基因中的一种或多种的组合将导致在生物合成途径中以若干水平对半乳甘露聚糖合成的有效下调，伴随对半乳甘露聚糖降解性酶的任选上调。

应用上述翻译抑制性技术的重要考虑是此类抑制的时机。下述是有利的：在正确的时刻选择在咖啡种子中表达的一种或多种半乳甘露聚糖前体合成基因，然后设计RNAi构建体以降低该基因的表达。基因控制应当不仅是发育特异性的，其还是组织特异性的，例如粒特异性的，任选地对粒的所选择的部分是亚特异性的。实施例4中示出的CcUGPP、CcGMPP、CcPMM和CcUGE的基因表达数据可用于基于此类参数进行选择的目的。例如，四种基因的粒表达数据表明，另有两种“上游基因”UGPP和PMM以相对一致的方式在粒发育的多个阶段表达，而下游基因UGE以及特别是GMPP显示出一定程度上更发育相关的谱(明显地，观察到在发育的最迟阶段GMPP表达减少)，这表明它们的表达可能更密切地反映了半乳甘露聚糖合成和其它UDP-半乳糖和GDP-甘露糖反应的实际需求。因此，本发明的一种实施方式的特征是在其表达较高的发育阶段选择性抑制咖啡粒中的GMPP和/或UGE。本文给出的数据还表明，不同的UGE等位基因在不同咖啡品种中具有不同作用。因此，另一实施方式的特征是取决于品种，分开或一起选择性操纵UGE1或UGE5。在另一实施方式中，在GMPP表达最高的发育时间时，可下调UGPP，以及可上调UGE1和/或UGE5。此类操纵可将蔗糖导向UDP-半乳糖，由此下调GMPP。此类操纵可通过优化所使用的启动子(包括上文描述的咖啡启动子)而得益。

通过前述任何方法产生的突变体或转基因植物也是根据本发明的特征。优选地，植物是可育的，由此可用于育种目的。因此，展示出一种或多种上述合意表型的突变体或植物可被用于植物育种，或者直接用于农业或园艺学应用。含有一种转基因或指出的突变的植物还可与含有互补性转基因或基因型的植物杂交，以产生具有增强的或组合的表型的植物。

提供下述实例来更详细地描述本发明。实例用于阐述性目的，并且不意欲限制本发明。

实施例1用于之后的实施例的材料和方法

植物材料。通过Q-PCR进行基因表达之后，使用一种小果咖啡基因型(T2308)和三种中果咖啡基因型(FRT32、FRT05和FRT64)。

从生长于温室(25℃和70％相对湿度)的树收获小果咖啡(T2308，04-2003)组织(在不同发育阶段的根、枝、嫩叶、花和樱桃果)以及中果咖啡FRT32的嫩叶，并在使用前将其保持于-80℃。中果咖啡(FRT32，2001)樱桃果、枝、根和花收获自在印度尼西亚栽种的树。樱桃果的发育阶段如下文定义：小绿色果实(SG)、大绿色果实(LG)、黄色果实(Y)和红色果实(R)。为了使用前运输，将样品立即冷冻于液氮中。

中果咖啡(罗布斯塔)FRT05和FRT64收获自厄瓜多尔田间种植的树，然后立即冷冻于-20℃，用于使用前运输。随后，所有样品都被贮藏于-80℃直到使用。

RNA提取。按照之前描述的，提取和处理总RNA(Lepelley et al.，2007，Plant Science 172，978-996)，其中使用在SPEX CertiPrep 6800冷冻磨(Freezer Mill)和液氮中搅匀的、来自上文“植物材料”章节中所述的小果咖啡T2308，中果咖啡FRT32、FRT05和FRT64的多种组织的贮藏于-80℃的粉末。在来自不同阶段的咖啡樱桃果的情况下，首先将它们分离为果皮和粒组织，然后按照上文所述从每种中提取RNA。

cDNA合成。用于制造cDNA的方法与Superscript III逆转录酶试剂盒(Invitrogen)中描述的方案相同，除了对T2308和FRT32使用100ng聚dT(18)(Sigma)或对FRT05和FRT64使用75ng随机引物(Invitrogen)。然后在灭菌水中对生成的cDNA样品进行100倍稀释，并贮藏于-20℃，用于之后在Q-PCR中使用。简言之，为制备特定的cDNA，将1μg总RNA和寡聚dT(上文)溶解于DEPC处理过的水(12μl最终体积)中。随后将该混合物在70℃孵育10分钟，然后在冰上迅速冷却。然后，添力4μl 5X第一链缓冲液(Invitrogen)、2μl DTT 0.1M(Invitrogen)和1μl dNTP混合物(每种10mM，Invitrogen)。这些反应混合物在42℃预孵育2分钟，之后添加1μl SuperScript III Rnase H-逆转录酶(200U/μl，Invitrogen)。随后，将管在25℃孵育10分钟，然后在42℃孵育50分钟，接着通过在70℃加热10分钟来进行酶失活。最后，向反应混合物中添加1U RNase H(Invitrogen)，接着在37℃孵育30分钟。然后在灭菌水中对生成的cDNA样品进行100倍稀释，并贮藏于-20℃，用于之后在QPCR中使用。

cDNA文库。已经生成了中果咖啡(罗布斯塔)cDNA文库的组，这是Nestlé和Cornell University之间的合作的一部分。分离来自多种文库的超过62,000种cDNA克隆，并对其进行5’末端测序，以生成EST(表达序列标签)，所述EST代表在嫩叶，和在发育中的果皮组织(混合的所有阶段)和发育中的粒(若干不同的阶段)中表达的中果咖啡基因的。品质评价之后，保留了46,914个高品质的EST，这些序列然后被装配为“计算机”咖啡基因序列的独特的组(“unigene”组，即，独特的、非重叠的咖啡cDNADNA序列的组)。关于构建这些文库的细节以及对生成的EST数据的生物信息学分析，之前已被公开(Lin等，2005，Theor.Appl.Genet.112，114-130)。

DNA序列分析。根据厂商提供的说明书，使用Qiagen试剂盒，从宿主纯化质粒DNA。通过GATC Biotech AG(Konstanz，Germany)，使用双脱氧终止方法，对制备的质粒DNA和PCR产物进行测序。使用LaserGene软件包(DNASTAR)来进行计算机分析。使用位于Sol站点(http://www.sgn.cornell.edu)和NCBI BLAST服务器(http://blast.ncbi.nlm.nih.gov/Blast.cgi)的BLAST程序，针对GenBank数据库来验证序列同源性。

实时qRT-PCR。按照上文所述来制备用于这些实验的cDNA。按照之前所述在Q-PCR仪Applied 7500上进行使用TaqMan探针的定量PCR(Simkin等，2006，Journal of Plant Physiology，163，691-708)；除了cDNA稀释和Taqman引物/探针不同之外。对于所有样品，使用100倍稀释的cDNA，这对应于大约0.25ng的原始RNA。

使用PRIMER EXPRESS软件(Applied Biosybranehes)来设计使用的Q-PCR引物和TaqMan探针，它们被列于表1中。每条序列右侧括号中的数字是SEQ ID NO号(例如“SID 32”)。

表1

使用组成型表达的核糖体蛋白rpl39作为参照，用相对定量的方法，来进行定量。为了使用相对定量的方法，必须要显示，使用特别定义的引物和探针组时，基因序列的扩增效率与参照序列(rpl39)的扩增效率大致等同。为测定该相对等同性，来自含有适当的cDNA序列的咖啡数据库的质粒DNA被稀释1/1000、1/10,000、1/100,000和1/1,000,000倍，以及使用上文所述的Q-PCR条件，针对每种质粒/引物/TaqMan探针组计算曲线Ct＝f(DNA的对数量)的斜率(表1)。用于测定效率的质粒是：针对rpl39的pcccs30w21o13、针对UGPP的pcccs46w9l8、针对GMPP的pcccl22i19、针对PMM的pcccs46w3a14、针对UGE1的pcccs30w33c4和针对UGE5的pcccl17j24。

为了最终确认，在对应于Q-PCR表达中使用的不同基因型的基因组DNA上，测试所有引物/TaqMan探针组。为此，使用DNeasy Plant Maxi试剂盒(QIAGEN)从来自基因型T2308、FRT32、FRT05和FRT64(上文列出)的嫩叶提取基因组DNA(表1)。

质粒/引物/TaqMan探针组给出具有接近3.32的斜率的曲线，这代表了100％的效率，被认为是可接受的。使用的质粒/引物/TaqMan探针组示于表1中，并且全部给出针对Ct＝f(DNA的对数量)的可接受的值。用荧光报告染料6-羧基荧光素(FAM)在5’端，并用淬灭染料6-羧基-四甲基-罗丹明(TAMRA)在3’端对所有MGB探针进行标记，除了RPL39探针，其5’端用荧光报告染料VIC标记、3’端用淬灭剂TAMRA标记。

UGPP和UGE5的过表达、纯化和活性测定。用由两种载体：进入载体pENTR/D-TOPO和表达载体pDEST17组成的Gateway技术(Invitrogen)来过量产生UGPP和UGE5咖啡蛋白。该策略由将UGPP(pcccs46w9l8中含有的)或UGE5(pcccl17j24中含有的)的ORF以与定位于N-末端的HisTaq序列符合阅读框的方式转移至第一载体(pENTR/D-TOPO)构成。针对每种构建体设计两种特异性引物(基于pcccs46w9l8和pcccl17j24插入序列)来完成该目的。正义引物(CcUGPP-正向引物和CcUGE5-正向引物)，表2，包括针对ORF(以起始密码子ATG开始)的前几个密码子和指导在pENTR/D-TOPO中的克隆所必需的CACC接头(5’至ATG密码子)的特异性序列。反向引物(CcUGPP-反向引物和-CcUGE5反向引物)，表2，含有ORF的终止密码子和来自3’UTR的若干碱基。每条序列右侧括号中的数字是SEQ ID NO号(例如“SID50”)。

表2

然后，用上文所述的特异性引物和Pfu Turbo DNA聚合酶(Statagene)来进行PCR反应，这不在产物的5’端生成腺嘌呤并且允许将CcUGPP和CcUGE5PCR产物直接克隆进pENTR/D-TOPO。PCR扩增以50μl的最终体积进行，如下所示：1μl pcccs46w9l8或pcccl17j24质粒(1/10稀释的)，5μL 10xPCR缓冲液(克隆的Pfu反应缓冲液)，400nM的两种特异性引物，200μM的每种dNTP和1.25U的Pfu Turbo DNA聚合酶(Stratagene)。PCR循环条件如下所示：94℃2分钟；然后是35个循环的94℃1分钟、退火温度55℃1分30秒和72℃1分30秒。在72℃进行7分钟额外的最后延伸步骤。然后按照厂商(Invitrogen)提供的说明书，将插入片段克隆进pENTR/D-TOPO载体。该实验将CcUGPP和CcUGE5ORF放进pENTR/D-TOPO载体(卡纳霉素抗性)，以分别形成质粒pGT38和pGT25。通过用M13-RP和M13-FP通用引物进行测序，来验证插入片段的克隆，其证实了在PCR期间没有错误的正确克隆。

然后，根据厂商(Invitrogen)建议的方案GATEWAY，用pDEST17(氨苄青霉素抗性)重组pGT38和pGT25，以分别产生pGT3和pGT2，其中ORF与pDEST17中N-末端的His标签符合阅读框。将重组的产物转化进感受态细胞Top10(Invitrogen)。通过用表2中描述的特异性引物CcUGPP-正向引物/CcUGPP-反向引物或CcUGE5-正向引物/CcUGE5-反向引物进行PCR筛选，验证了氨苄青霉素抗性阳性克隆含有CcUGPP或CcUGE5插入片段。纯化后，根据供应商(Invitrogen)建议的方案，将pGT3和pGT2转化进感受态细胞BL21-AI^TM

化学感受态大肠杆菌(用于蛋白表达)。然后通过用T7通用引物进行测序验证了克隆，其显示CcUGPP和CcUGE5与N-末端的His标签符合阅读框。

为进行蛋白表达，将用pGT3或pGT2转化的Bl21AI细胞的2ml培养物(40％甘油)在37℃和200rpm下在含有100μg/ml氨苄青霉素的100ml LB培养基中培养大约3小时，至OD600nm＝0.6。然后保存1ml培养物进行之后的蛋白提取，并在SDS Page凝胶上显现。然后用0.2％L-阿拉伯糖诱导克隆的蛋白的表达，并在27℃再孵育培养物2小时。保存1mL经诱导的培养物用于提取和SDS Page凝胶。

于4℃以5500g对细胞进行30分钟沉淀，然后将收获的细菌沉淀重悬浮于5ml蛋白提取试剂(Novagen)中，其中加入了5μL

核酸酶(Novagen)和蛋白抑制剂Complete Mini EDTA-free(Roche)。在室温下以70rpm孵育30分钟后，于4℃以10000g对裂解的细胞进行30分钟离心，以获得可溶的蛋白性提取物(上清液)和不可溶的蛋白级分(沉淀)。

然后用经预先染色的SDS-PAGE低范围分子量标准物(BIO-RAD)、在8-16％丙烯酰胺快速PAGE凝胶(GenScript Corp.)上、使用变性缓冲液5x样品缓冲液(GenScript Corp.)显现15μL收集的经诱导的/未经诱导的提取物和可溶/不可溶蛋白提取物。使用的迁移缓冲液是Tris-HEPES-SDS电泳缓冲液(GenScript Corp.)，在100V进行。然后用着色溶液(0.25％w/v考马斯蓝、10％乙酸和20％乙醇)以70rpm对凝胶进行20分钟着色，然后使用强脱色溶液(40％乙醇、7％乙酸)以70rpm进行两次20分钟洗脱，然后使用低脱色溶液(10％乙醇、10％乙酸、5％甘油)以70rpm过夜洗涤一次。

实施例2：对编码中果咖啡PMM、GMPP、UGPP和UGE的cDNA的分离和表征

本实施例描述了对编码直接涉及半乳甘露聚糖合成的关键前体(UDP-半乳糖和GDP-甘露糖)的合成的蛋白的cDNA序列的分离和表征。选择的酶是PMM(磷酸甘露糖变位酶)、GMPP(GDP-甘露糖焦磷酸化酶)、UGPP(UDP-葡糖焦磷酸化酶)和UGE(UDP-葡糖4-差向异构酶)。多种BLAST程序(见实施例1)被用于检索与编码经生化表征的PMM、GMPP、UGPP和UGPP蛋白的公众数据库蛋白序列具有最高相似性的unigene序列。除了UGE1之外，然后选择每种“最佳unigene击中”的最长cDNA用于完全测序。结果总结于表3和表4中。

表3参照了来自并非咖啡的其它生物的UGPP、GMPP、PMM和UGE蛋白序列，它们已在http://www.sgn.cornell.edu被用于通过Blast鉴定咖啡的Unigenes。Tblastn同一性来自使用完全蛋白序列作为查询序列针对数据库进行的blast，所述数据库含有翻译成蛋白的所有中果咖啡Unigene的核苷酸序列的。Blastn同一性来自使用完全编码序列(CDS)作为查询序列针对数据库进行的blast，所述数据库含有所有中果咖啡Unigene的核苷酸序列。

表4列出了在http://www.sgn.cornell.edu鉴定的作为可能编码UGPP、GMPP、PMM和两种UGE咖啡蛋白的中果咖啡Unigenes的列表。示出了为验证鉴定的Unigene的“计算机”序列而被全部表征和测序的克隆的名称，还示出了在每种Unigene中发现的EST的数量。SGN ID对应于贡献于来自可从SGN网页获得的中果咖啡Built#2的Unigene序列的SGN数量。

表3

表4

A.UDP-葡糖焦磷酸化酶(CcUGPP)

为发现编码酶UDP-葡糖焦磷酸化酶(UGPP)的咖啡cDNA，使用tblastn算法，用编码经生物化学表征的UGPP蛋白——水稻UDP-葡糖焦磷酸化酶(Chen等，2007，Plant Cell 19，847-861；检录号ABD5730)和甜瓜UDP-葡糖焦磷酸化酶(Dai等，2006，Plant Physiol 142，294-304；检录号ABD98820)的两条蛋白序列检索Nestlé/Cornell“unigene”Built 2。该检索揭示了展示出与水稻和甜瓜UGPP蛋白序列(分别为87％和86％的同一性，其中e值＝0)的同源性的一个unigene(SGN-U348695)。

然后分离并测序了代表unigeneSGN-U348695的5’端(pcccs46w9l8)并且可能编码该蛋白的完全ORF的cDNA。该Unigene包含分离自开花后46周的粒的九个EST，来自果皮的两个EST，来自叶的八个EST，以及来自不同发育阶段的樱桃果的三个EST(表4)。

pcccs46w9l8插入片段为1750bp长，其编码1434bp的ORF。推定的蛋白序列包含477个氨基酸，并且预测分子量为52.49kDa。对pcccs46w9l8的蛋白序列(CcUGPP)和来自拟南芥、甜瓜、水稻的UGPP蛋白序列以及来自马铃薯的直向同源序列的经优化的比对(ClustalW)显示，pcccs46w9l8编码的蛋白与这些蛋白序列分别享有81.7％、86.8％、87％和87.8％的同一性(图1和表5)。

表5

比对数据表明，pcccs46w9l8编码中果咖啡UDP-葡糖焦磷酸化酶(CcUGPP)的全长cDNA。对编码pcccs46w9l8中含有的完全CDS序列的DNA序列与编码来自拟南芥、甜瓜、水稻和马铃薯的UGPP的完全CDS序列的DNA序列的经优化的比对(Jotun Hein方法)显示，咖啡CcUGPP的ORF DNA序列与这些CDS DNA序列分别享有75.1％、78.8％、77.1％和80.6％的同一性。

B.GDP-甘露糖焦磷酸化酶(DcGMPP)

为发现编码咖啡GMPP的cDNA，将经生物化学表征的马铃薯GMPP蛋白序列(检录号AAD01737；(Keller等，1999，Plant J.19(2)，131-141)用作为查询序列，用于使用tblastn算法针对Nestle/Cornell‘unigene’Built2进行的tBLASTn检索(表3)。获得的最佳匹配是unigene SGN-U352112(e值＝1e-163，分数＝567bits(1462)，同一性＝283/310(91％))。该Unigene包含分离自开花后46周时的粒的七个EST和分离自叶的八个EST(表4)。

分离并测序了代表unigene SGN-U352112的5’端(pcccl22i19)并且由此编码了Nestlé/Cornell数据库中与马铃薯GMPP相关的最长的咖啡cDNA的cDNA。发现pcccl22i19的插入片段为1576bp长，并且包含1086bp的完全CDS序列，其编码361个氨基酸的蛋白(估计的分子量为39.43kDa)。对由pcccl22i19编码的咖啡蛋白序列CcGMPP的完整序列与马铃薯、番茄、紫花苜蓿和葡萄的蛋白序列(检录号分别为AAD01737、AAT37498、AAT58365和CAO69137)进行的比对证实了使用ClustalW对该咖啡序列的最初注释，即，pcccl22i19的CDS编码咖啡GMPP蛋白(图2和表6)。

表6

在蛋白水平上，该咖啡GMPP序列展示出与马铃薯、番茄、紫花苜蓿和葡萄GMPP蛋白序列有92.2％、92％、93.1％和94.5％的同一性。在核酸水平上，仍然使用ClustalW方法，咖啡序列的完整CDS展示出与马铃薯、番茄、紫花苜蓿和葡萄的完整CDS序列分别有83.5％、82.7％、81.4％和84％的同一性。应当注意，DNA水平上的同一性数据仅针对CDS序列，因此其可能过高估计完整cDNA序列的相似性，因为cDNA的5’和3’UTR序列通常与较低水平的同一性相关。

C.磷酸甘露糖变位酶(CcPMM)

为发现编码咖啡磷酸甘露糖变位酶的cDNA，将经生物化学表征的拟南芥磷酸甘露糖变位酶蛋白序列(检录号ABD97870；Qian等，2007，PlantJ.49(3)，399-413)用作为查询序列，用于使用tblastn算法针对Nestle/Cornell ‘unigene’进行的tblastn检索(表3)。获得的最佳击中是unigene SGN-U351352(e值＝1e-111，分数＝395bits(1014)，同一性＝190/233(81％))。该Unigene包含分离自粒的六个EST(一个在开花后30周，五个在开花后46周)、分离自果皮的两个EST和分离自叶的一个EST(表4)。

分离并测序了代表单基因SGN-U351352的5’端(pcccs46w3a14)并且由此编码了Nestlé/Cornell数据库中与拟南芥PMM相关的最长的咖啡cDNA的cDNA。发现pcccs46w3a14的插入片段为1218bp长，并且包含741bp的完全CDS序列，其编码246个氨基酸的蛋白(估计的分子量为27.59kDa)。对由pcccs46w3a14编码的CcPMM的完整咖啡蛋白序列与大豆、葡萄、毛果杨和拟南芥的蛋白序列(检录号分别为ABD97873、CAO39534、ABK96056和ABD97870)进行的比对证实了使用ClustalW对该咖啡序列的最初注释，即，pcccs46w3a14的CDS编码咖啡PMM蛋白(图3)。在蛋白水平上，该咖啡PMM序列展示出与大豆、葡萄、毛果杨和拟南芥PMM蛋白序列有90.7％、88.2％、88.6％和80.1％的同一性(表7)。

表7

在核酸水平上，仍然使用ClustalW方法，咖啡序列的完整CDS展示出分别与大豆、葡萄、毛果杨和拟南芥的完整CDS序列有80.4％、79.6％、78.9％和71.8％的同一性。应当注意，DNA水平上的同一性数据仅针对CDS序列，因此其可能过高估计完整cDNA序列的相似性，因为cDNA的5’和3’UTR序列通常与较低水平的同一性相关。

D.编码UDP-葡糖-4-差向异构酶的两个cDNA克隆(CcUGE1、 CcUGe5)

为鉴定中果咖啡EST数据库中编码UDP-葡糖-4-差向异构酶的咖啡cDNA，将经生物化学表征的拟南芥UGE5蛋白序列(检录号NP_194123；等，2007，Plant Cell 19(5)，1565-1579)用作为查询序列，用于针对Nestle/Cornell ‘unigene’Built2进行的tblastn检索(表3)。在拟南芥属中，AtUGE5已经显示出影响生长和遍布植物中的细胞壁碳水化合物生物合成(上文的等，2007)。获得的两个最佳击中是unigene SGN-U352564(e值＝1e-109，分数＝390bits(1003)，同一性＝209/231(80％))和unigeneSGN-347952(e值＝1e-127，分数＝448bits(1153)，同一性＝266/339(62％))。Unigene SGN-U352564包含分离自叶的三个EST，并且unigeneSGN-347952包含来自开花后30周的粒的两个EST和来自整个樱桃果的两个EST(表4)。

第二个被表征的拟南芥UGE蛋白，UGE1(检录号NP_172738；上文的

等，2007)用作为查询序列，用于针对来自Built2中果咖啡Nestle/Cornell Unigene序列进行tBlastn。获得了三个击中，展示出超过50％的同一性。再次，获得的两个最佳击中是unigene SGN-347952(e值＝1e-172，分数＝600bits(1546)，同一性＝289/350(82％))和unigeneSGN-U352564(e值＝5e-85，分数＝309bits(791)，同一性＝151/234(64％))。

编码CcUGE 1的中果咖啡cDNA克隆。发现Unigene SGN-U347952编码Nestlé/Cornell数据库中的与拟南芥属UGE1序列相关的完全“计算机”咖啡cDNA。代表unigene SGN-U351352的5’端的最长的完全cDNA是不能获得的。但是，分离和测序了代表该unigene的bp 696至1424的另外部分cDNA(pcccs30w33c4)。发现pcccs30w33c4的插入片段为732bp长，并且包含部分CDS序列(546bp长并且缺少来自5’端的509bp)，其编码181个氨基酸的部分ORF(估计分子量为20.24kDa)。

通过Seqman软件进行的将unigene SGN-U347952的“计算机”序列与插入片段pcccs30w33c4序列的比对显示该cDNA序列和单基因序列在729bp上100％相同。对来自unigene SGN-U347952的“计算机”序列的生物信息学研究也显示该unigene具有编码351aa长的蛋白(估计分子量为39kDa)的1056bp的完整的CDS。考虑到来自pcccs30w33c4的插入片段的序列和来自unigene SGN-U347952的5’末端克隆的序列(cDNA序列CC-F01_017_L05和CC-F01_014_P09)全部显示出与UnigeneSGN-U347952的100％的同一性，可以说来自Unigene SGN-U347952的“计算机”序列是准确的，并且代表了单个基因的计算机序列。该Unigene序列然后被命名为CcUGE1，因为其与拟南芥UGE1的同一性水平高于与其他拟南芥UGE的同一性水平。

由SGN-U347952编码的完整咖啡蛋白序列CcUGE1与拟南芥(UGE1至UGE5)、毛果杨、马铃薯和葡萄(检录号可在图4中获得)的UGE蛋白序列进行的比对证实了使用ClustalW对该咖啡序列的最初注释，即，SGN-U347952的CDS编码咖啡UGE蛋白(图4)。在蛋白水平上，源于Unigene SGN-U347952的该咖啡CcUGE1序列展示出与拟南芥UGE1(82.3％)、拟南芥UGE3(79.5％)和马铃薯UGE51(81.8％)蛋白的更高的同一性水平(图4、图5和表8)。在五条拟南芥属UGE蛋白序列上，AtUGE1是与由SGN-U347952编码的咖啡蛋白最为紧密关联的，并且该后者的序列由此被明确命名为CcUGE1(注意：针对该序列目前不存在全长cDNA)。

表8

编码CcUGE5的中果咖啡cDNA克隆。分离并测序了代表unigeneSGN-U352564的5’端(pcccl17j24)以及由此编码Nestlé/Cornell数据库中与拟南芥属UGE2序列相关的最长咖啡cDNA的cDNA。发现pcccl17j24的插入片段为1434bp长，并且包含编码350个氨基酸的蛋白(估计分子量为38.42kDa)的1053bp的完全CDS序列。

由pcccl17j24编码的完整咖啡蛋白序列与拟南芥(UGE1至UGE5)、毛果杨、马铃薯和葡萄(检录号可在图4中获得)的UGE蛋白序列的比对证实了使用ClustalW对该咖啡序列的最初注释，即，pcccl17j24的CDS编码咖啡UGE蛋白(图4，图5和表8)。在蛋白水平上，该咖啡序列展示出与VvUGE(85％)，PtUGE(84.4％)，StUGE45(83％)，AtUGE5(81.6％)，AtUGE2(79.4％)和AtUGE4(78.3％)蛋白的更高的同一性水平。由pcccl17j24编码的该咖啡蛋白序列也与CcUGE1共享63％的同一性，并且被命名为CcUGE5。

实施例3：重组CeUGPP和CcUGE5的过表达

为证实pcccs46w9l8(CcUGPP)和pcccl17j24(CcUGE5)的注释，将这些蛋白以重组形式表达于大肠杆菌中。如实施例1中描述的，Gateway技术克隆系统被用于表达CcUGPP和CcUGE5。首先将完整ORF克隆进pENTR/D-TOPO进入载体，以分别形成质粒pGT38和pGT25，然后将pGT38和pGT25与pDEST17目的载体重组，以产生含有与N末端His-标签符合阅读框的CcUGPP和CcUGE5完全编码序列的pGT3和pGT2质粒。然后将这两种质粒pGT3和pGT2转化进BL21-AI细胞，并使用阿拉伯糖诱导表达，来过表达CcUGPP和CcUGE5蛋白。然后在凝胶上显现收集的经诱导的/未经诱导的提取物和可溶的/不可溶的蛋白提取物。图6显示了该过表达实验的结果，并且表明，在对经转化的细胞进行诱导之后，发生了对具有预期的大概尺寸的、经his标记的蛋白UGPP和UGE5(分别大约52.5kDa和38.4kDa，加上融合标签的2.6kDa)的良好诱导。可溶和不可溶级分中的强烈信号显示，在两种级分中都产生了CcUGPP和CcUGE5蛋白，虽然在可溶级分中产量更高，尤其是在CcUGE5的情况下。

实施例4：PMM、GMPP、UGPP和UGE基因的组织特异性表达

使用基因特异性TaqMan引物/探针(表1)，针对阿拉比卡品种T2308和罗布斯塔品种FRT32、FRT05和FRT64的若干组织，来测定来自PMM、GMPP、UGPP和UGE基因的转录本的定量表达。通过实施例1描述的方法来制备用于这些实验的不同的cDNA，且RNA分离自：(1)分离自发育中的阿拉比卡T2308和罗布斯塔FRT32、FRT05和FRRT64咖啡樱桃果的4个不同阶段的粒和果皮组织；和(2)分离自来自阿拉比卡T2308和罗布斯塔FRT32的根、枝、叶和花(如实施例1所述)。这些实验的结果示于图7、8和9中。使用相对定量的方法，使用组成型表达的核糖体蛋白rpl39作为参照，来进行定量。

A.PMM、GMPP、UGPP和UGE在三种罗布斯塔(FRT32、FRT05和FRT64)和阿拉比卡T2308的粒成熟期间的相对表达

应当注意，用于本实验的所有引物/探针组都是经使用含有每条序列的、基于质粒的cDNA验证过的，并且还在这些实验中使用的每种基因型的基因组DNA上测试过。此类实验确保了使用的引物/探针能在简单的情况下(质粒DNA)高效定量测量它们的特异性序列的存在，并且还以大约相同的效率识别被分析的所有植物中的基因，即(1)在每种基因组中证实基因的存在，和(b)这确保了在被测试的序列中没有由于等位基因的变化导致的检测中的差异。还要注意，在引物/探针在基因组DNA上的效率的情况中，对PMM基因特异性的引物/探针组不允许对基因组DNA的扩增。因为该组能以97％的效率扩增质粒DNA，推测引物和/或探针可能被设计在外显子和内含子的连接处，并且因此不能扩增基因组DNA。但是，考虑到用cDNA获得了良好结果，结论是，对PMM基因特异性的引物/探针是本实施例中描述的Q-RT-PCR实验可接受的。

B.对粒发育期间的表达进行比较

图8展示了来自在罗布斯塔品种FRT05、FRP64和FRT32和阿拉比卡品种T2308(CCCA02)中编码GMPP、UGPP、PMM的咖啡基因的转录本积累谱。对于所有四种品种来说UGPP基因的表达谱和表达水平是相对相似，表达水平的RQ在大致0.1和0.2之间。但要注意，随着发育进展，FRT32的转录本水平有轻微上升的趋势，而FRT05则是轻微下降的趋势。对一些基因而言，在阿拉比卡T2308粒的大绿色阶段，转录本水平似乎也有峰。PMM的表达谱在不同品种的粒发育期间也整体稳定(图8)，虽然有一些小的差异。通常，PMM的表达水平在RQ 0.1-0.4的区域中。但是，FRT05和FRT64RQ水平在尺度的较高端，并且似乎在黄色阶段有峰，接着在红色阶段下降。在阿拉比卡中，表达水平在尺度的较低端，但是在整个发育期间相对恒定。GMPP的表达谱一定程度上更为复杂。总体上，RQ在大约0.01至0.144的范围内。这看起来是两种不同的表达模式，一种在早期和晚期阶段具有相当低的表达(FRT32)，而其它(FRT05、FRT64和阿拉比卡T2308)中表达在小绿色粒中最高并且然后在随后每个步骤中减少。所有品种在红色阶段具有相对相似的GMPP转录本水平。

两种被表征的UGE基因的表达数据示于图7以及示于下表9(UGE1)和10(UGE5)中。

表9

表10

UGE1似乎展示出两种类型的表达模式，针对罗布斯塔，两种表达模式具有RQ 0.01至0.28之间的表达水平范围，而针对测试的单种阿拉比卡是RQ 0.17-0.59。通过罗布斯塔FRT32和阿拉比卡T2308表明第一种表达模式。这些品种在每个发育阶段显示出相对高的水平。该结果一定程度上是未预期到的，即，一种罗布斯塔与阿拉比卡表达模式非常相似，但与其它罗布斯塔不同。第二种模式由两种其它罗布斯塔(FRT05和FRT64)显示，在本情况下，在早期小绿阶段中有相对高水平的转录，然后转录本水平在之后的每个阶段显著下降。UGE5的表达模式稍微更复杂。但是，再一次似乎有两种不同的表达组，一种其中在所有阶段UGE5转录本均为相对低的水平(FRT32和阿拉比卡T2308)，而另外两种罗布斯塔显示出高得多的水平。来自对咖啡UGE1和UGE5基因的定量转录本表达数据的一种观察是，在罗布斯塔FRT32和阿拉比卡T2308中，UGE1转录本的水平要比UGe5转录本的水平显著得多，对于另外两种罗布斯塔则是相反的。这种观察可能暗示，这两种基因可在粒中互相替换。

UGPP、GMPP和PMM基因的表达数据示于图8以及示于下表11(UGPP)、12(GMPP)和13(PMM)中。

表11

表12

表13

总之，四种基因的粒表达数据表明，另有两种“上游”基因UGPP和PMM在被检查的粒发育阶段以相对一致的方式表达。该谱可能表明了这两种基因的更多持家类型的功能。相反，下游的基因(GMPP和UGE)似乎显示出更多发育相关的谱，这暗示它们的表达可能更密切反映半乳甘露聚糖合成和其它UDP-半乳糖和GDP-甘露糖反应的实际需求。例如，粒中GMPP转录本的转录本积累高于成熟化开始的时候(小绿色阶段时)，然后在成熟化期间渐进地减少。这可反映半乳甘露聚糖合成中对GDP-甘露糖的高需求，其很好地对应于大绿色和黄色阶段的增加的ManS1基因表达(Pré等，2008)。

C.在罗布斯塔FRT32和/或阿拉比卡T2308的不同组织和/或发育阶段中对PMM、GMPP、UGPP和UGE的比较性表达分析

图9显示了针对PMM、GMPP、UGPP和UGE获得的更多整体表达数据。清楚地，这些基因在植物中广泛表达，反映了它们涉及中央代谢的事实，并且，除了UGE，这些基因均由单个基因代表，至少在拟南芥属基因组中是这样。RQ中位数值显示于表14和15中。

表14

表15

对于罗布斯塔，所有基因都以相对相似的水平在果皮中表达，尽管UGPP看起来在黄色以及尤其是红色阶段显著更高，这表明相关代谢物的增加的流动可发生于果实成熟的这些阶段，导致增加的UDP-Glu水平，这可能导致在果实中有增加的蔗糖合成，或者增加的Glu-1-P生产。在阿拉比卡中的表达遵循相同的一般模式，除了UGE5的水平比对于罗布斯塔观察到的要稍微较低。对于根、枝、叶和花也观察到了类似的表达模式。这些表达数据的值得注意的方面是在花中对于UGE1和UGPP基因观察到了非常高的表达水平，这表明在该发育阶段在花中可能有高水平的UDP-半乳糖流(前进或后退)。

在拟南芥中，显示了UGE对于嫩的小植物的良好发育来说是必要的(上文

等，2007)。也已经显示了来自水稻的UGPP1基因在整个植物中表达，并在小花中有表达的峰，尤其是在花药发育期间的花粉中(上文的Chen等，2007)。通过RNA干扰或共阻抑进行的UGPP1沉默导致雄性不育以及多种多效性发育异常，这表明该UGP酶在植物生长和发育中发挥重要作用。咖啡的直向同源体可能具有类似功能。

本发明不限于上文描述和示例的实施方式，而是能在所附权利要求的范围内变动和修改。

Claims

1.分离自咖啡属物种的核酸分子，其包含下述编码序列，所述编码序列编码选自UDP-葡糖焦磷酸化酶(UGPP)、GDP-甘露糖焦磷酸化酶(GMPP)、磷酸甘露糖变位酶(PMM)和UDP-葡糖4-差向异构酶(UGE)的半乳甘露聚糖前体合成酶。

2.权利要求1的核酸分子，其中所述半乳甘露聚糖前体合成酶包含下述氨基酸序列，当通过BLAST比较进行测定时，所述氨基酸序列与SEQ IDNO：6-10中任一的氨基酸序列在其整体上多于大约80％相同。

3.权利要求2的核酸分子，其中所述半乳甘露聚糖前体合成酶包含SEQ ID NO：6-10中的任一。

4.权利要求3的核酸分子，其包含SEQ ID NO：1-5中的任一。

5.权利要求1的核酸分子，其中所述编码序列包含基因的开放阅读框，或通过基因转录生产的mRNA分子，或通过对mRNA分子进行逆转录产生的cDNA分子。

6.包含权利要求1的核酸分子的编码序列的载体。

7.权利要求6的载体，其中所述核酸分子的编码序列与组成型启动子、或与可诱导启动子、或与组织特异性启动子有效连接，所述组织特异性启动子可以任选地是种子特异性启动子，其还可以任选地是咖啡种子特异性启动子。

8.从用权利要求7的载体转化的植物细胞生产的可育植物，其中所述植物任选地是咖啡植物。

9.调节从咖啡种子提取固体的可提取性的方法，所述方法包括调节咖啡种子内一种或多种半乳甘露聚糖前体合成酶的生产或活性，以导致咖啡种子中半乳甘露聚糖含量改变，其中所述半乳甘露聚糖前体合成酶是选自UDP-葡糖焦磷酸化酶(UGPP)、GDP-甘露糖焦磷酸化酶(GMPP)、磷酸甘露糖变位酶(PMM)和UDP-葡糖4-差向异构酶(UGE)的半乳甘露聚糖前体合成酶。

10.权利要求9的方法，包括增加所述咖啡种子内UGPP、GMPP、PMM或UGE中一种或多种的生产或活性。

11.权利要求10的方法，包括增加所述咖啡种子内编码UGPP、GMPP、PMM或UGE中一种或多种的基因的表达。

12.权利要求11的方法，包括向所述咖啡植物中引入编码UGPP、GMPP、PMM或UGE中一种或多种的一种或多种转基因，用于在所述种子内表达。

13.权利要求9的方法，包括降低所述咖啡种子内UGPP、GMPP、PMM或UGE中一种或多种的生产或活性。

14.权利要求13的方法，包括降低所述咖啡种子内编码UGPP、GMPP、PMM或UGE中一种或多种的基因的表达。

15.权利要求14的方法，包括向咖啡植物中引入用于在所述种子中表达的、编码UGPP、GMPP、PMM或UGE中一种或多种的翻译抑制剂的一种或多种多核苷酸。