CN109890961A

CN109890961A - 香叶基香叶基焦磷酸酯合酶

Info

Publication number: CN109890961A
Application number: CN201780066220.6A
Authority: CN
Inventors: 维克托·马里厄斯·波尔; 普利斯希勒·扎尔特简斯; 约翰尼斯·古斯塔夫·恩斯特·范·莱文
Original assignee: DSM IP Assets BV
Current assignee: DSM IP Assets BV
Priority date: 2016-10-27
Filing date: 2017-10-26
Publication date: 2019-06-14
Anticipated expiration: 2037-10-26
Also published as: US20220090032A1; AU2017350309A1; US11781121B2; US20240067938A1; CN109890961B; EP3532611B1; EP3532611A1; EP3998337A1; BR112019008237A2; US11225647B2; JP2019532655A; WO2018078014A1; CA3040585A1; US20190284539A1

Abstract

本发明涉及具有香叶基香叶基焦磷酸酯合酶活性的变体多肽，所述变体多肽包含氨基酸序列，当与包含SEQ ID NO：1所示序列的香叶基香叶基焦磷酸酯合酶比对时，所述氨基酸序列包含至少一个对应于位置92、100或235的任何氨基酸的氨基酸残基的取代，所述位置是参考SEQ ID NO：1定义的，并且其中所述变体与具有香叶基香叶基焦磷酸酯合酶活性的参考多肽相比具有一种或多种修饰的性质。本发明的变体多肽可用于重组宿主中以生产甜菊醇或甜菊醇糖苷。

Description

香叶基香叶基焦磷酸酯合酶

技术领域

本公开涉及具有香叶基香叶基焦磷酸酯合酶(geranylgeranyl pyrophosphatesynthase)活性的变体多肽以及包含编码这种多肽的序列的核酸。本公开还涉及包含所述核酸的核酸构建体和包含所述核酸或所述核酸构建体的表达载体。此外，本公开涉及包含所述核酸、核酸构建体或表达载体的重组宿主。本公开还涉及制备甜菊醇或甜菊醇糖苷的方法，所述方法包括发酵重组宿主，通过这种方法能够获得的发酵液以及通过所述方法获得的或从发酵液中获得的甜菊醇糖苷。此外，本公开涉及包含两种或更多种甜菊醇糖苷的组合物，并涉及包含所述甜菊醇糖苷或组合物的食品、饲料或饮料。此外，本公开涉及将第一甜菊醇糖苷转换为第二甜菊醇糖苷的方法，并且涉及生产具有香叶基香叶基焦磷酸酯合酶活性的变体多肽的方法。

背景技术

多年生草本植物Stevia rebaudiana Bert.的叶子积聚大量被称为甜菊醇糖苷的具有强烈甜味的化合物。虽然这些化合物的生物功能尚不清楚，但它们作为替代性高效甜味剂具有商业意义。

这些甜的甜菊醇糖苷的功能和感官特性表现为优于许多高效甜味剂的功能和感官特性。此外，研究表明甜菊苷能够降低II型糖尿病患者的血糖水平，并且能够降低轻度高血压患者的血压。

甜菊醇糖苷积聚在甜叶菊(Stevia)叶中，其中它们可以占叶干重的10％至20％。甜菊苷和莱鲍迪甙A均是热和pH稳定的，并且适用于碳酸饮料中并且可以应用于许多其他食物中。甜菊苷比蔗糖甜110至270倍之间，莱鲍迪甙A比蔗糖甜150至320倍之间。此外，莱鲍迪甙D也是在甜叶菊叶中积聚的高效二萜糖苷甜味剂。它可比蔗糖甜约200倍。莱鲍迪甙M是另一种高效二萜糖苷甜味剂。它在某些甜叶菊品种叶中以痕量存在，但已表明其具有优异的味道特征。

传统上已从甜叶菊植物中提取了甜菊醇糖苷。在甜叶菊植物中，(-)-贝壳杉烯酸(赤霉酸(GA)生物合成中的中间体)被转换为四环二萜甜菊醇，其然后通过多步糖基化途径进行以形成各种甜菊醇糖苷。然而，产率可以是可变的，并且受到农业和环境条件的影响。此外，甜叶菊种植需要大量的土地面积、在收获前的长时间、密集劳动以及用于提取和纯化糖苷的额外成本。

最近，使用发酵工艺生产甜菊醇糖苷的兴趣日益增长。WO2013/110673和WO2015/007748中描述了可用于生产至少甜菊醇糖苷莱鲍迪甙A和莱鲍迪甙D的微生物。

此类微生物的进一步改进是期望的，以便可产生更高量的甜菊醇糖苷且/或可产生另外的或新的甜菊醇糖苷和/或更高量的特定甜菊醇糖苷和/或具有期望比例的不同甜菊醇糖苷的甜菊醇糖苷的混合物。

发明概述

本公开基于变体香叶基香叶基焦磷酸酯合酶的鉴定。这些变体可用于产生适合生产甜菊醇和/或一种或多种甜菊醇糖苷的重组宿主。

这种重组宿主与表达非变体香叶基香叶基焦磷酸酯合酶的重组宿主相比可产生更高量的甜菊醇糖苷。产生更高量的甜菊醇糖苷可以使甜菊醇糖苷的回收更容易。作为另外一种选择或除此之外，可以获得更高的产率。

因此，本公开涉及一种具有香叶基香叶基焦磷酸酯合酶活性的变体多肽，所述变体多肽包含氨基酸序列，当与包含SEQ ID NO：1所示序列(来自Yarrowia lipolytica的野生型GGS序列)的香叶基香叶基焦磷酸酯合酶比对时，所述氨基酸序列包含至少一个对应于位置92、100或235的任何氨基酸的氨基酸残基的取代，所述位置是参考SEQ ID NO：1定义的，并且其中所述变体与具有香叶基香叶基焦磷酸酯合酶活性的参考多肽相比具有一种或多种修饰的性质。

本公开还涉及：

-一种具有香叶基香叶基焦磷酸酯合酶活性的变体多肽，所述变体多肽包含与SEQID NO：3、5、7、9、11、13或15中的任一个具有至少约95％序列同一性，至少约96％，至少约97％，至少约98％或至少约99％序列同一性的氨基酸序列；

-包含编码本文公开的变体多肽的序列的核酸；

-包含本文公开的核酸的核酸构建体，所述核酸构建体可操作地连接至一个或多个能够指导香叶基香叶基焦磷酸酯合酶在合适的表达宿主中表达的控制序列；

-包含本文公开的核酸或核酸构建体的表达载体；

-包含本文公开的核酸、核酸构建体或表达载体的重组宿主；

-一种制备甜菊醇或甜菊醇糖苷的方法，所述方法包括在合适的发酵培养基中发酵本文中公开的重组宿主，并任选地回收所述甜菊醇或甜菊醇糖苷。

-包含甜菊醇糖苷的发酵液，所述甜菊醇糖苷能够通过本文公开的制备甜菊醇或甜菊醇糖苷的方法获得；

-通过本文公开的制备甜菊醇或甜菊醇糖苷的方法获得的或者从本文公开的包含甜菊醇糖苷的发酵液获得的甜菊醇糖苷；

-包含两种或更多种甜菊醇糖苷的组合物，所述甜菊醇糖苷通过如本文公开的制备甜菊醇或甜菊醇糖苷的方法获得或者从本文公开的包含甜菊醇糖苷的发酵液获得；

-包含甜菊醇糖苷的食品、饲料或饮料，所述甜菊醇糖苷通过本文公开的制备甜菊醇或甜菊醇糖苷的方法获得或从本文公开的包含甜菊醇糖苷的发酵液或包含本文公开的组合物的食品、饲料或饮料获得；

-一种将第一甜菊醇糖苷转换为第二甜菊醇糖苷的方法，所述方法包括：

使所述第一甜菊醇糖苷与本文公开的重组宿主、源自所述重组宿主的无细胞提取物或源自两者之中任一的酶制剂接触；

从而将第一甜菊醇糖苷转换为第二甜菊醇糖苷；以及

-一种生产香叶基香叶基焦磷酸酯合酶的方法，所述方法包括在适于产生香香叶基香叶基焦磷酸酯合酶的条件下培养本文公开的宿主细胞，并且任选地，回收香叶基香叶基焦磷酸酯合酶。

附图说明

图1示出了导致甜菊醇糖苷生物合成的潜在途径的示意图。

序列表说明

序列说明列于表1中。

表1

说明	SEQ ID NO
		Yarrowia lipolytica GGPS	SEQ ID NO:1
CDS Yarrowia lipolytica GGPS	SEQ ID NO:2
		Yarrowia lipolytica GGPS，具有Gly92Glu突变	SEQ ID NO:3
CDS Yarrowia lipolytica GGPS，具有Gly92Glu突变	SEQ ID NO:4
		Yarrowia lipolytica GGPS，具有Ala100Val突变	SEQ ID NO:5
CDS Yarrowia lipolytica GGPS，具有Ala100Val突变	SEQ ID NO:6
		Yarrowia lipolytica GGPS，具有Ser235Asn突变	SEQ ID NO:7
CDS Yarrowia lipolytica GGPS，具有Ser235Asn突变	SEQ ID NO:8
		Yarrowia lipolytica GGPS，具有Gly92Glu+Ala100Val突变	SEQ ID NO:9
CDS Yarrowia lipolytica GGPS，具有Gly92Glu+Ala100Val突变	SEQ ID NO:10
		Yarrowia lipolytica GGPS，具有Gly92Glu+Ser235Asn突变	SEQ ID NO:11
CDS Yarrowia lipolytica GGPS，具有Gly92Glu+Ser235Asn突变	SEQ ID NO:12
		Yarrowia lipolytica GGPS，具有Ala100Val+Ser235Asn突变	SEQ ID NO:13
CDS Yarrowia lipolytica GGPS，具有Ala100Val+Ser235Asn突变	SEQ ID NO:14
		Yarrowia lipolytica GGPS，具有Gly92Glu+Ala100Val+Ser235Asn突变	SEQ ID NO:15
CDS Yarrowia lipolytica GGPS，具有Gly92Glu+Ala100Val+Ser235Asn突变	SEQ ID NO:16
		Mucor circinelloides GGPS	SEQ ID NO:17
Yarrowia lipolytica GGPS，具有Gly92Asp突变	SEQ ID NO:18
		Yarrowia lipolytica GGPS，具有Gly92Asn突变	SEQ ID NO:19
Yarrowia lipolytica GGPS，具有Gly92Gln突变	SEQ ID NO:20
		Yarrowia lipolytica GGPS，具有Ala100Gly突变	SEQ ID NO:21
Yarrowia lipolytica GGPS，具有Ala100Phe突变	SEQ ID NO:22
		Yarrowia lipolytica GGPS，具有Ala100Tyr突变	SEQ ID NO:23
Yarrowia lipolytica GGPS，具有Ala100Ile突变	SEQ ID NO:24
		Yarrowia lipolytica GGPS，具有Ala100Leu突变	SEQ ID NO:25
Yarrowia lipolytica GGPS，具有Ser235Ala突变	SEQ ID NO:26
		Yarrowia lipolytica GGPS，具有Ser235Gly突变	SEQ ID NO:27
Yarrowia lipolytica GGPS，具有Ser235Gln突变	SEQ ID NO:28
		Yarrowia lipolytica GGPS，具有Ser235Val突变	SEQ ID NO:29
Yarrowia lipolytica GGPS，具有Ser235Asp突变	SEQ ID NO:30
		Yarrowia lipolytica GGPS，具有Ser235Glu突变	SEQ ID NO:31
Yarrowia lipolytica GGPS，具有Ser235Phe突变	SEQ ID NO:32
		Yarrowia lipolytica GGPS，具有Ser235Tyr突变	SEQ ID NO:33

发明详述

在本说明书和所附权利要求书中，词语“包含”、“包括”和“具有”以及变化形式应被解释为包含性的。也就是说，这些词语意图表达在上下文允许的情况下可包含未具体叙述的其他要素或整数。

不使用数量词修饰时在本文中指代一个/种或多于一个/种(即一个/种或至少一个/种)的语法对象。举例来说，“要素”可意指一个/种要素或多于一个/种要素。

在本文，“莱鲍迪甙”可缩写为“reb”。即，例如莱鲍迪甙A和rebA意图表示同一分子。

本公开涉及具有香叶基香叶基焦磷酸酯合酶活性的新多肽。表达这种多肽的重组宿主，即包含编码这种多肽的重组序列的宿主细胞，可用于生产甜菊醇糖苷。给定重组宿主产生甜菊醇糖苷的能力可以是非重组形式的宿主的性质，或者可以是引入一种或更多种重组核酸序列(即编码导致产生甜菊醇糖苷的酶)的结果。与非重组宿主或能够表达具有香叶基香叶基焦磷酸酯合酶活性的参考多肽的重组宿主相比，本文公开的重组宿主能够增加甜菊醇糖苷的产生。

根据本公开，因此提供了具有香叶基香叶基焦磷酸酯合酶活性的变体多肽。

根据本发明的变体多肽具有香叶基香叶基焦磷酸酯合酶活性。香叶基香叶基焦磷酸酯合酶(或香叶基香叶基二磷酸酯合酶(geranylgeranyl diphosphate synthase)活性)是本领域技术人员熟知的术语。

出于本公开的目的，具有香叶基香叶基焦磷酸酯合酶(或合成酶)活性的多肽通常是催化由法呢基二磷酸酯和异戊烯二磷酸酯合成GGPP的多肽。

香叶基香叶基焦磷酸酯合酶活性也可称为GGPP合酶活性、GGPP合成酶活性、GGPPS活性、GGPS活性、GGS活性、GGS1活性、GGPS1活性或GGPPS1活性。

还可根据Mucor circinelloides的carG基因的产物的活性来定义香叶基香叶基焦磷酸酯合酶活性。Mucor circinelloides的carG基因的产物可以催化以下之中的一种或更多种：

-二甲基烯丙基二磷酸酯+异戊烯二磷酸酯＝二磷酸酯+香叶基二磷酸酯；-香叶基二磷酸酯+异戊烯二磷酸酯＝二磷酸酯+(2E,6E)-法呢基二磷酸酯；或-(2E,6E)-法呢基二磷酸酯+异戊烯二磷酸酯＝二磷酸酯+香叶基香叶基二磷酸酯。

这些催化活性中的任何一种都可用于定义本公开的香叶基香叶基焦磷酸酯合酶。

因此，出于本公开的目的，具有香叶基香叶基焦磷酸酯合酶活性的多肽可以是能够催化或部分催化香叶基香叶基焦磷酸酯形成的多肽。

与具有香叶基香叶基焦磷酸酯合酶活性的参考多肽相比，本文公开的变体多肽具有修饰的香叶基香叶基焦磷酸酯合酶活性。

与参考多肽相比，这种变体多肽可具有降低的特定香叶基香叶基焦磷酸酯合酶活性。

与参考多肽相比，这种变体多肽可具有提高的特定香叶基香叶基焦磷酸酯合酶活性。

根据本公开的变体多肽可以是非天然存在的多肽。

本文中，本公开的变体多肽可称为“香叶基香叶基焦磷酸酯合酶变体”、“GGPS”或“GGS”、“GGPS变体”、“GGS变体”、“变体多肽”或“GGPS多肽”或“GGS多肽”等。

如本文所公开的具有香叶基香叶基焦磷酸酯合酶活性的GGPS变体多肽可以是具有香叶基香叶基焦磷酸酯合酶活性的参考多肽的变体，该变体多肽包含氨基酸序列，当与包含SEQ ID NO：1所示序列的香叶基香叶基焦磷酸酯合酶比对时，该氨基酸序列包含至少一个对应于位置92、100或235的任何氨基酸的氨基酸残基的取代，所述位置参考SEQ IDNO：1定义。

如本文所公开的GGPS变体多肽(例如具有如本文所述的一种或多种取代的变体)可与参考GGPS(诸如SEQ ID NO：1的GGPS)多肽具有至少约60％、70％、80％的同一性，例如与参考多肽具有至少约85％的同一性，诸如，与参考多肽具有至少约90％的同一性，与参考多肽具有至少约95％的同一性，与参考多肽具有至少约98％的同一性或与参考多肽具有至少约99％的同一性。这种变体通常具有选自对应于如参考SEQ ID NO：1所定义的92、100或235的位置的一个或多个取代或取代组。

如本文中公开的GGPS变体多肽可以是在位置92、100或235中的一个或多个处具有取代的SEQ ID NO：1中所示多肽的变体。

对应于本文中在参考GGPS中定义的位置之一的氨基酸位置可以是多(蛋白质)序列比对中与任何所述氨基酸位置比对的位置。

因此，如本文中公开的GGPS变体多肽可以是在位置89、97或225中的一个或多个处具有取代的SEQ ID NO：17中所示多肽的变体。

发明人惊奇地发现表达本文公开的变体多肽并在位置92、100或235中的一个或多个处具有取代的重组宿主细胞当用于生产甜菊醇糖苷的方法中时，与表达参考多肽的重组宿主细胞相比，产生显著更高滴度(titers)的甜菊醇糖苷和KA-糖苷。

可以发生根据本公开的取代的三个位置中的两个，即分别为如参考SEQ ID NO：1所定义的92和100，预期分别位于预计将位于蛋白质同源二聚体间期的α螺旋(位置92)和α-螺旋(位置100)顶部的铰接点。系统发育分析表明与甘氨酸92同源的位置是高度保守的。不受理论束缚，发明人认为观察到的令人惊讶的结果可能是由于严格保守的甘氨酸92突变为例如谷氨酸可能对蛋白质结构有影响，并且潜在地对二聚体相互作用有影响。在系统发育中，在与A100同源的位置处观察到很少的氨基酸变异，但是没有观察到朝向更大的疏水性残基如缬氨酸的氨基酸变异。不受理论束缚，发明人认为在实例中观察到的令人惊讶的结果可能是由于Ala100Val突变可能对二聚体间期产生影响并且通过与作为底物结合口袋的一部分的相邻α-螺旋的空间相互作用而影响活性位点和催化作用。

可能发生突变的第三个位置，即235，可能位于远离前面描述的两个位置且不参与蛋白质-蛋白质相互作用的α-螺旋中。系统发育分析表明，丝氨酸出现在与Ser235同源的位置，但丙氨酸是该位置上最主要的氨基酸。

本公开的GGPS变体通常将保留GGPS活性。也就是说，根据本公开内容的GGPS变体通常能够催化上述反应，尽管与参考多肽相比具有修饰的活性。

合适的参考多肽可以是包含SEQ ID NO：1(Yarrowia lipolytica)的氨基酸序列、SEQ ID NO：17(Mucor circinelloides)的氨基酸序列或来自S.cerevisiae的GGPS的氨基酸序列的多肽。

优选地，根据本公开的GGPS变体多肽与其源自的参考多肽相比通常表现出改善的性质，通常在比活性(specific activity)和/或底物特异性方面。如果变体如下所述使用，例如在用于生产甜菊醇和/或甜菊醇糖苷的方法中(通过在重组宿主中表达GGPS)使用，那么这种改善的性质通常是相关的。

因此，根据本公开的GGPS变体是通常能够在能够产生甜菊醇和/或甜菊醇糖苷的重组宿主中增加所述甜菊醇和/或甜菊醇糖苷的产生的变体(与表达参考多肽的能够产生甜菊醇和/或甜菊醇糖苷的重组宿主相比)。也就是说，与过量表达参考多肽(例如SEQ IDNO：1或SEQ ID NO：17的GGPS)的宿主细胞相比，在宿主细胞中过量表达根据本公开的GGPS变体多肽通常会导致甜菊醇和/或甜菊醇糖苷的产生增加。

相对于参考GGPS表现出改善的性质的GGPS变体是表现出相关性质(例如比活性)的可测量的降低或提高的变体，通常使得GGPS变体更适合于本文所述的用途，例如在用于生产甜菊醇或甜菊醇糖苷的方法中。

GGPS变体多肽包含与参考多肽相比具有一个或多个氨基酸的取代、缺失和/或插入和/或与参考多肽相比具有一个或多个截短的氨基酸序列。GGPS变体多肽可以包含一个或多个本文所述的取代。

一种具有GGPS活性的变体多肽，例如如本文所述，该变体多肽具有氨基酸序列，当与包含SEQ ID NO：1所示序列的GGPS比对时，该氨基酸序列包含对应于氨基酸92、100或235中的任何一个的氨基酸残基的至少一个取代，所述位置是参考SEQ ID NO：1定义的，并且其中变体与具有GGPS活性的参考多肽相比具有一种或多种修饰的性质。

因此，存在于一个或多个所述位置的氨基酸将被替代为与参考序列中该位置上出现的氨基酸不同的氨基酸(这些位置是参考SEQ ID NO：1定义的)。

根据本公开的变体GGPS可以包括上述取代之一。然而，变体多肽可包含位置92、100或235处的取代的任何组合，所述位置是参考合适的参考序列(诸如SEQ ID NO：1中所示的参考序列)定义的，诸如在所述位置的两个取代或所有取代。

变体GGPS可以包含如参考SEQ ID NO：1所定义的位置92的取代。取代可以使得选自Glu残基、Asp残基、Asn残基、Gln残基、优选Glu残基的氨基酸残基在该位置。

因此，在一个实施方案中，如本文所公开的具有GGPS活性的变体多肽包含氨基酸序列，当与包含SEQ ID NO：1所示序列的香叶基香叶基焦磷酸酯合酶比对时，该氨基酸序列包含对应于位置92的氨基酸的氨基酸残基被选自Glu残基、Asp残基、Asn残基、Gln残基的氨基酸残基，优选被Glu残基取代，所述位置是参考SEQ ID NO：1定义的，并且其中所述变体与具有香叶基香叶基焦磷酸酯合酶活性的参考多肽相比具有一种或多种修饰的性质。

变体GGPS可以包含如参考SEQ ID NO：1所定义的位置100的取代。取代可以使得Val残基、Gly残基、Phe残基、Tyr残基、Ile残基、Leu残基、优选Val残基在该位置。

因此，在一个实施方案中，如本文所公开的具有GGPS活性的变体多肽包含氨基酸序列，当与包含SEQ ID NO：1所示序列的香叶基香叶基焦磷酸酯合酶比对时，该氨基酸序列包含对应于位置100的氨基酸的氨基酸残基被选自Val残基、Gly残基、Phe残基、Tyr残基、Ile残基、Leu残基，优选Val残基的氨基酸残基取代，所述位置是参考SEQ ID NO：1定义的，并且其中所述变体与具有香叶基香叶基焦磷酸酯合酶活性的参考多肽相比具有一种或多种修饰的性质。

变体GGPS可以包含如参考SEQ ID NO：1所定义的位置235的取代。取代可以使得Asn残基、Ala残基、Gly残基、Gln残基、Val残基、Asp残基、Glu残基、Phe残基、Tyr残基、优选Asn残基在此位置。

因此，在一个实施方案中，如本文所公开的具有GGPS活性的变体多肽包含氨基酸序列，当与包含SEQ ID NO：1所示序列的香叶基香叶基焦磷酸酯合酶比对时，该氨基酸序列包含对应于位置235的氨基酸的氨基酸残基被选自Asn残基、Ala残基、Gly残基、Gln残基、Val残基、Asp残基、Glu残基、Phe残基、Tyr残基，优选Asn残基的氨基酸残基取代，所述位置是参考SEQ ID NO：1定义的，并且其中所述变体与具有香叶基香叶基焦磷酸酯合酶活性的参考多肽相比具有一种或多种修饰的性质。

变体GGPS可以包含如参考SEQ ID NO：1所定义的位置92和100的取代。取代可以使得Glu和Val残基分别在这些位置。在其他实施方案中，取代可以使得Glu和Gly，或Glu和Phe，或Glu和Tyr，或Glu和Ile，或Glu和Leu分别在这些位置。在其他实施方案中，如参考SEQID NO：1所定义的位置92和100的取代可以使得Asp和Val分别处于这些位置，或Asp和Gly，或Asp和Phe，或Asp和Tyr，或Asp和Ile，或Asp和Leu，或Asn和Val，或Asn和Gly，或Asn和Phe，或Asn和Tyr，或Asn和Ile，或Asn和Leu，或Gln和Val，或Gln和Gly，或Gln和Phe，或Gln和Tyr，或Gln和Ile，或Gln和Leu处于这些位置。

变体GGPS可以包含如参考SEQ ID NO：1所定义的位置92和235的取代。取代可以使得Glu和Asn残基分别在这些位置。在其他实施方案中，取代可以使得Glu和Ala，或Glu和Gly，或Glu和Gln，或Glu和Val，或Glu和Asp，或Glu和Glu，或Glu和Phe，或Glu和Tyr分别处于这些位置。在其他实施方案中，如参考SEQ ID NO：1定义的位置92和235的取代可以使得Asp和Asn，或Asp和Ala，或Asp和Gly，或Asp和Gln，或Asp和Val，或Asp和Asp，或Asp和Glu或Asp和Phe，或Asp和Tyr，或Asn和Asn，或Asn和Ala，或Asn和Gly，或Asn和Gln，或Asn和Val，或Asn和Asp，或Asn和Glu，或Asn和Phe，或Asn和Tyr，或Gln和Asn，或Gln和Ala，或Gln和Gly，或Gln和Gln，或Gln和Val，或Gln和Asp，或Gln和Glu，或Gln和Phe，或Gln和Tyr处于这些位置。

变体GGPS可以包含如参考SEQ ID NO：1所定义的位置100和235的取代。取代可以使得Val和Asn残基分别在这些位置。在其他实施方案中，取代可以使得Val和Ala，或Val和Gly，或Val和Gln，或Val和Val，或Val和Asp，或Val和Glu，或Val和Phe，或Val和Tyr分别在这些位置。在其他实施方案中，取代可以使得Gly和Asn，或Gly和Ala，或Gly和Gly，或Gly和Gln，或Gly和Val，或Gly和Asp，或Gly和Glu，或Gly和Phe，或Gly和Tyr分别在这些位置。在其他实施方案中，如参考SEQ ID NO：1定义的位置100和235的取代可以使得Phe和Asn，或Phe和Ala，或Phe和Gly，或Phe和Gln，或Phe和Val，或Phe和Asp，或Phe和Glu，或Phe和Phe，或Phe和Tyr，或Tyr和Asn，或Tyr和Ala，或Tyr和Gly，或Tyr和Gln，或Tyr和Val，或Tyr和Asp，或Tyr和Glu，或Tyr和Phe，或Tyr和Tyr，或Ile和Asn，或Ile和Ala，或Ile和Gly，或Ile和Gln，或Ile和Val，或Ile和Asp，或Ile和Glu，或Ile和Phe，或Ile和Tyr，或Leu和Asn，或Leu和Ala，或Leu和Gly，或Leu和Gln，或Leu和Val，或Leu和Asp，或Leu和Glu，或Leu和Phe，或Leu和Tyr在这些位置。

变体GGPS可以包含如参考SEQ ID NO：1所定义的位置92、100和235的取代。取代可以使得Glu、Val和Asn残基分别在这些位置。根据本公开的实施方案，可以在根据本公开的多肽变体中分别在参考SEQ ID NO：1定义的位置92、100和235发现的取代的组合如下所示：

92E+100V或92E+100G或92E+100F或92E+100Y或92E+100I或92E+100L或92D+100V或92D+100G或92D+100F或92D+100Y或92D+100I或92D+100L或92N+100V或92N+100G或92N+100F或92N+100Y或92N+100I或92N+100L或92Q+100V或92Q+100G或92Q+100F或92Q+100Y或92Q+100I或92Q+100L中的每一个分别与位置235的N，A；G，Q；V；D，E；F；或Y中的每一个分别组合；或者

92E+235N或92E+235A或92E+235G或92E+235Q或92E+235V或92E+235D或92E+235E或92E+235F或92E+235Y或92D+235N或92D+235A或92D+235G或92D+235Q或92D+235V或92D+235D或92D+235E或92D+235F或92D+235Y或92N+235N或92N+235A或92N+235G或92N+235Q或92N+235V或92N+235D或92N+235E或92N+235F或92N+235Y或92Q+235N或92Q+235A或92Q+235G或92Q+235Q或92Q+235V或92Q+235D或92Q+235E或92Q+235F或92Q+235Y中的每一个分别与位置100的V，G，F，Y，I，L中的每一个分别组合；或者

100V+235N或100V+235A或100V+235G或100V+235Q或100V+235V或100V+235D或100V+235E或100V+235F或100V+235Y或100G+235N或100G+235A或100G+235G或100G+235Q或100G+235V或100G+235D或100G+235E或100G+235F或100G+235Y或100F+235N或100F+235A或100F+235G或100F+235Q或100F+235V或100F+235D或100F+235E或100F+235F或100F+235Y或100Y+235N或100Y+235A或100Y+235G或100Y+235Q或100Y+235V或100Y+235D或100Y+235E或100Y+235F或100Y+235Y或100I+235N或100I+235A或100I+235G或100I+235Q或100I+235V或100I+235D或100I+235E或100I+235F或100I+235Y或100L+235N或100L+235A或100L+235G或100L+235Q或100L+235V或100L+235D或100L+235E或100L+235F或100L+235Y中的每一个分别与位置92的E、D、N或Q中的每一个分别组合。

本公开的GGPS变体多肽可以是SEQ ID NO：17所示多肽的变体，其在该序列的位置89、97或225中的一个或多个处具有取代。因此，本公开的变体可以包括：位置89和97的取代；位置89和225的取代；位置97和225的取代；或位置89、97、225的取代。优选的取代是Glu、Asp、Asn或Gln中的一个或多个，优选地，位置89的Glu，Val、Gly、Phe、Tyr、Ile或Leu，优选地，位置97的Val，以及Asn、Ala、Gly、Gln、Val、Asp、Glu、Phe或Tyr，优选地，位置225的Asn。

本公开的变体多肽可以包含除上文定义的三个位置之外的附加取代，例如，一个或多个附加的取代、添加或缺失。

本公开的变体可以包括这种种类的不同类型的修饰的组合。变体可包含一个、两个、三个、四个、至少5个、至少10个、至少15个、至少20个、至少25个、至少30个或更多个这样的修饰(它们可以全部具有相同类型的修饰或可以具有不同类型的修饰)。通常，附加的修饰可以是取代。

这些附加的修饰可以发生在上面提到的铰链区和/或α-螺旋区中。

本公开的变体多肽可包含SEQ ID NO：3、5、7、9、11、13、15或18至33中所示的氨基酸序列。

本公开的宿主细胞可包含编码本公开的一种、两种、三种、四种、五种或更多种变体的核酸。这些变体可以相同或不同。宿主细胞可包含编码SEQ ID NO：1的GGPS的核酸和编码本公开的一种或多种变体的核酸。也就是说，宿主细胞可包含编码SEQ ID NO：1的GGPS的核酸和编码本公开的一种或多种变体的核酸，每种核酸都可以以一个、两个、三个、四个、五个或更多的拷贝(copy)存在。

与参考多肽相比，变体多肽通常具有修饰的GGPS活性。通常，修饰的活性可以根据重组宿主中的甜菊醇和/或甜菊醇糖苷的产生来定义。

当变体GGPS在宿主细胞中过量表达时，可以根据甜菊醇和/或甜菊醇糖苷的产生增加来定义修饰的活性，这是与过量表达参考多肽(例如SEQ ID NO：1或SEQ ID NO：17的参考多肽)的等同宿主细胞的产生水平相比。

当变体GGPS在宿主细胞中过量表达时，可以根据两种甜菊醇糖苷产生的比值变化来定义修饰的活性，例如莱鲍迪甙A：莱鲍迪甙M的比值可以增加，或者莱鲍迪甙M：莱鲍迪甙A的比值可以增加，这是与过量表达参考多肽(例如SEQ ID NO：1或SEQ ID NO：17的参考多肽)的等同宿主细胞的生产水平相比。

变体GGPS可以能够使生产水平提高，例如至少5％，至少10％，至少25％，至少50％，至少100％或更多。生产水平可以用g/L或mol/L(M)表示，因此，以g/L或mol/L表示的更高的生产水平将证明甜菊醇和/或甜菊醇糖苷的生产水平的提高。

本文使用的“多肽”一词是指含有超过约7个氨基酸残基的链。本文的所有多肽序列均从左到右书写，并且从氨基末端到羧基末端的方向。本文使用的单字母氨基酸代码是本领域熟知的，可以在Sambrook等人的文献中找到(Molecular Cloning：A LaboratoryManual，第二版，Cold Spring Harbor Laboratory，Cold Spring Harbor LaboratoryPress，Cold Spring Harbor，NY，1989)。

如本文所公开的GGPS变体多肽可以是分离的(isolated)形式，诸如基本上分离的形式。“分离的”多肽或蛋白质意指从其天然环境中移出的多肽或蛋白质。例如，为了本公开的目的，在宿主细胞中表达的重组产生的多肽和蛋白质被认为是分离的，因为它们是已经通过任何合适的技术基本上纯化的重组多肽。可以通过本领域已知的方法从重组细胞培养物中回收和纯化根据本公开的GGPS变体多肽。

本公开的GGPS变体多肽包括化学合成程序的产物以及通过重组技术由原核或真核宿主(包括例如细菌、酵母、高等植物、昆虫和哺乳动物细胞)产生的产物。取决于重组产生程序中使用的宿主，本公开的多肽可以是糖基化的或可以是非糖基化的。此外，本公开的多肽还可以包括初始修饰的甲硫氨酸残基，在一些情况下是宿主介导的过程的结果。

本公开还涉及根据本公开的GGPS多肽变体的生物活性片段。认为此类片段包含在术语“根据本公开的GGPS变体”内。

GGPS多肽变体的生物活性片段包括含有与本文公开的变体蛋白的氨基酸序列充分相同或衍生自本文公开的变体蛋白的氨基酸序列的氨基酸序列的多肽，其包含比全长蛋白质少的氨基酸，但是它表现出相应的全长蛋白质的至少一种生物活性。通常，生物活性片段包含具有本文公开的变体蛋白的至少一种活性的结构域或基序。根据本公开的GGPS变体的生物活性片段可以是例如长度为10、25、50、100或更多个氨基酸的多肽。此外，其中缺失蛋白质的其他区域的其他生物活性部分可以通过重组技术制备，并评估根据本公开的多肽的天然形式的一种或多种生物活性。

通常，如本文中公开的GGPS变体的蛋白质片段将包含一种或多种本文定义的取代。

本公开还涉及编码上述生物活性片段的核酸片段(该生物活性片段本身是本公开的变体)。

本公开提供了多核苷酸，其包含编码本文公开的GGPS变体多肽(及其生物活性片段)的序列。本公开还涉及编码如本文公开的GGPS多肽变体的至少一个功能结构域的分离的多核苷酸。通常，这种结构域将包含一种或多种本文所述的取代。

可以使用本领域技术人员所熟知的标准分子生物学技术结合本文提供的序列信息来产生本文公开的核酸分子。例如，使用标准合成技术，可以通过PCR产生或从头合成所需的核酸分子。这种合成过程通常是自动化过程。

与编码参考GGPS的核酸相比，本文公开的核酸可包含一个或多个缺失，即空位。还可以使用适当的寡核苷酸使用定点诱变产生这种缺失/空位。产生这种缺失的技术是本领域技术人员熟知的。

此外，对应于根据本公开的核苷酸序列或可与根据本公开的核苷酸序列杂交的寡核苷酸可通过标准合成技术制备，例如使用自动DNA合成仪。

此外，互补核酸和反义核酸被包括在本公开中。与另一核苷酸序列互补的核酸分子是与另一核苷酸序列充分互补的核酸分子，使得它可以与另一核苷酸序列杂交，从而形成稳定的双链体。

本公开的一个方面涉及编码本发明的变体多肽或其生物活性片段或其结构域的分离的核酸分子，以及足以用作杂交探针以鉴定编码本文公开的多肽的核酸分子的核酸分子，以及适合用作核酸分子扩增或突变(例如，用于制备本公开的核酸分子)的PCR引物的此类核酸分子的片段。

“分离的核酸”或“分离的多核苷酸”是这样的DNA或RNA，其不与两个编码序列紧邻(immediately contiguous)，而在其源自的生物体的天然存在的基因组中其与这两个编码序列紧邻(一个在5'端，一个在3'端)。因此，在一个实施方案中，分离的核酸包括与编码序列紧邻的5'非编码(例如，启动子)序列中的一些或全部。因此，该术语包括，例如，掺入载体中的重组DNA，掺入自主复制的质粒或病毒中的重组DNA，或者掺入原核生物或真核生物的基因组DNA中的重组DNA，或者作为单独的分子(例如，通过PCR或限制性内切核酸酶处理产生的cDNA或基因组DNA片段)存在而不依赖于其他序列的重组DNA。它还包括作为编码附加的多肽的杂合基因的一部分的重组DNA，该杂合基因基本上不含细胞材料、病毒材料或培养基(当通过重组DNA技术产生时)或化学前体或其他化学品(当化学合成时)。此外，“分离的核酸片段”是不是天然存在的片段并且在天然状态下不会发现的核酸片段。

如本文所用，术语“核酸”、“多核苷酸”或“核酸分子”旨在包括DNA分子(例如cDNA或基因组DNA)和RNA分子(例如mRNA)和使用核苷酸类似物产生的DNA或RNA的类似物。核酸分子可以是单链DNA或双链DNA，但优选是双链DNA。可以使用寡核苷酸类似物或衍生物(例如肌苷或硫代磷酸酯核苷酸)合成核酸。这种寡核苷酸可用于例如制备具有改变的碱基配对能力或增加的核酸酶抗性的核酸。

本公开还涉及核酸构建体，该核酸构建体包含编码根据本公开的变体多肽的多核苷酸序列以及(与其可操作地连接的)允许多核苷酸序列在宿主细胞中表达的控制序列。可以将核酸构建体掺入载体，诸如表达载体和/或宿主细胞中，以实现变体多肽的表达。

术语“核酸构建体”在本文中是指单链或双链的核酸分子，其从天然存在的基因中分离或更典型地已经被修饰以含有以否则将不会在自然中存在的方式组合和并置的核酸的区段。当核酸构建体含有表达编码序列所需要的所有控制序列时，术语核酸构建体与术语“表达盒”的含义相同，其中所述控制序列可操作地连接至所述编码序列。

如本文所用，术语“可操作地连接”是指多核苷酸要素(或编码序列或核酸序列)以功能关系连接。当核酸序列与另一核酸序列处于功能关系时，该核酸序列是“可操作地连接”。例如，如果启动子或增强子影响编码序列的转录，则它与编码序列可操作地连接。

如本文所用，术语“启动子”是指用于控制一个或多个基因的转录，相对于基因的转录起始位点的转录方向位于上游并且在结构上通过以下方式鉴定的核酸片段：存在DNA依赖性RNA聚合酶的结合位点、转录起始位点和本领域技术人员已知的任何其他DNA序列。“组成型”启动子是在大多数环境和发育条件下具有活性的启动子。“诱导型”启动子是在环境或发育调节下有活性的启动子。

可用于实现编码酶(诸如变体GGPS多肽或在本文公开的重组宿主细胞中引入的任何其他酶)的核苷酸序列表达的启动子可以不与编码待表达的酶的核苷酸序列同源，即与其可操作地连接的核苷酸序列(编码序列)异源的启动子。优选地，启动子是同源的，即对宿主细胞是内源的。

本文中合适的启动子包括本领域技术人员熟知的组成型和诱导型天然启动子以及工程化启动子。宿主细胞中合适的启动子可以是GAL7、GAL10或GAL1、CYC1、HIS3、ADH1、PGL、PH05、GAPDH、ADC1、TRP1、URA3、LEU2、ENO、TPI和AOX1。其他合适的启动子包括PDC、GPD1、PGK1、TEF1和TDH。

通常，编码酶的核苷酸序列包含终止子。在宿主细胞中起作用的任何终止子可用于本公开。优选的终止子得自宿主细胞的天然基因。合适的终止子序列是本领域熟知的。优选地，在本文所公开的宿主细胞中，此类终止子与防止无义介导的mRNA衰变的突变组合(参见例如：Shirley等，2002，Genetics 161：1465-1482)。

本公开进一步涉及载体，优选表达载体，其包含根据本公开的多核苷酸或根据本公开的核酸构建体(即，包含编码如本文公开的变体GGPS多肽的序列)。

为了促进GGPS的表达和/或翻译，编码GGPS的核酸序列可以包含在表达载体中，使得编码GGPS的基因与适当的控制序列可操作地连接以在体外或在本文公开的宿主细胞中表达和/或翻译。表达载体可以是能够方便地进行重组DNA程序并能使编码GGPS变体多肽的多核苷酸表达的任何载体(例如，质粒或病毒)。载体的选择通常取决于载体与要引入载体的细胞的相容性。载体可以是线性或闭合的环状质粒。载体可以是自主复制型载体，即作为染色体外实体而存在、其复制独立于染色体复制的载体，例如，质粒、染色体外要素、微型染色体或人工染色体。如果打算用于真菌来源的宿主细胞，则合适的附加型核酸构建体可以例如基于酵母2μ或pKD1质粒(Gleer等，1991，Biotechnology 9：968-975)或AMA质粒(Fierro等，1995，Curr Genet.29：482-489)。

或者，表达载体可以是当被引入宿主细胞时整合至基因组中并与其已整合至其中的染色体一起复制的载体。整合型克隆载体可随机或在预定靶基因座处整合在宿主细胞的染色体中。在本公开的一个优选实施方案中，整合型克隆载体包含DNA片段，所述DNA片段与宿主细胞基因组中预定靶基因座中的DNA序列同源以使克隆载体的整合靶向该预定基因座。为了促进靶向整合，优选在转化细胞之前将克隆载体线性化。优选进行线性化，使得克隆载体的至少一端但优选任一端的侧翼是与靶基因座同源的序列。靶基因座侧翼的同源序列的长度优选为至少20bp、至少30bp、至少50bp、至少0.1kb、至少0.2kb、至少0.5kb、至少1kb、至少2kb或更长。靶向整合到宿主细胞基因组中(即整合在预定靶基因座中)的效率通过宿主细胞的增强的同源重组能力来增加。

克隆载体中与靶基因座同源的同源侧翼DNA序列可以源自高度表达的基因座，这意味着它们源自能够在宿主细胞中具有高表达水平的基因。能够具有高表达水平的基因，即高度表达的基因，在本文中定义为其mRNA可构成总细胞mRNA的至少0.5％(w/w)的基因，例如在诱导条件下，或者其基因产物可构成总细胞蛋白质的至少1％(w/w)或者(在分泌的基因产物的情况下)可以分泌至至少0.1g/l的水平的基因。更典型地，靶基因座可以是基因间位置，从而基因不被中断。这样的基因座也可以提供高表达水平。因此，克隆载体中的同源侧翼DNA序列可以与基因间靶基因座同源。

核酸构建体或表达载体可以在本文公开的宿主细胞中体内组装，并且任选地，在单个步骤中整合到细胞的基因组中(参见，例如，WO2013/076280)。

可以将多于一个拷贝的本文公开的核酸构建体或表达载体插入宿主细胞中以增加由核酸构建体内包含的核酸序列编码的GGPS变体多肽的产生(过量表达)。这可以优选通过将两个或更多个核酸拷贝整合到其基因组中来进行，更优选通过使核酸整合靶向如上定义的基因座来进行。

本领域技术人员应理解，表达载体的设计可取决于这些因素：例如要转化的宿主细胞的选择、所需蛋白质的表达水平等。可以将本公开的表达载体引入宿主细胞中，从而产生由本文所述的核酸编码的蛋白质或肽(例如SEQ ID NO：1的GGPS变体，例如功能等同物或片段，或包含一种或多种此类变体的融合蛋白)。

可以设计本文公开的核酸构建体和载体用于在原核宿主细胞或真核宿主细胞中表达GGPS变体多肽。

可以通过常规转化或转染技术将本文公开的核酸构建体和/或表达载体引入原核或真核细胞中。如本文所用，术语“转化”和“转染”意指用于将外来核酸(例如DNA)引入本领域技术人员熟知的宿主细胞中的各种本领域公认的技术。用于转化或转染宿主细胞的合适方法可以在Sambrook等人(Molecular Cloning：A Laboratory Manual，第二版，ColdSpring Harbor Laboratory，Cold Spring Harbor Laboratory Press，Cold SpringHarbor，NY，1989)，Davis等，Basic Methods in Molecular Biology(1986)和其他实验室手册中找到。

术语“功能(性)等同物”和“功能(性)变体”在本文中可互换使用。根据本公开的功能等同物是编码表现出如本文所定义的GGPS变体的特定功能的多肽的分离的核酸片段。因此，功能等同物还包括生物活性片段，并且其自身包含在本公开的术语“GGPS变体”内。

优选地，本公开的功能等同物包括本文描述的一个或多个取代。然而，除了上述取代之外，功能等同物还可以包括一种或多种修饰。

功能性核酸等同物通常可含有沉默突变或不改变编码的GGPS变体多肽的生物学功能的突变。因此，本公开提供了编码变体GGPS蛋白的核酸分子，所述变体GGPS蛋白含有对特定生物活性(即GGPS活性)不是必需的氨基酸残基的变化。

GGPS变体蛋白的这些功能等同物的氨基酸序列与其衍生自的亲本GGPS变体序列不同，但仍保留亲本GGPS变体的至少一种生物活性，优选它们至少保留GGPS活性。技术人员将认识到，可以通过突变将变化引入根据本公开的核苷酸序列中，从而导致所得蛋白质的氨基酸序列的变化而基本上不改变这种蛋白质的功能。

在一个实施方案中，分离的核酸分子包含编码蛋白质的核苷酸序列，其中蛋白质包含与亲本GGPS变体或参考氨基酸序列(例如，如SEQ ID NO：1或SEQ ID NO：17所示)具有至少约60％、65％、70％、75％、80％、85％、90％、95％、96％、97％、98％、99％同一性的氨基酸序列。

因此，根据本公开的GGPS变体的功能等同物优选为蛋白质，该蛋白质包含与亲本GGPS变体氨基酸序列或参考多肽序列(例如，如SEQ ID NO：1或SEQ ID NO：17所示)具有至少约60％、65％、70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或更高同一性的氨基酸序列，并且通常还保留亲本GGPS多肽的至少一种功能活性。

具有GGPS活性的本公开的变体多肽可包含与SEQ ID NO：3、SEQ ID NO：5、SEQ IDNO：7、SEQ ID NO：9、SEQ ID NO：11、SEQ ID NO：13或SEQ ID NO：15或SEQ ID NO：18至33中的任何一个具有至少约80％序列同一性，至少约90％的序列同一性，至少约95％的序列同一性，至少约96％，至少约97％，至少约98％或至少约99％的序列同一性的氨基酸序列。

本公开的变体多肽可以具有表2中定义的序列或表2中定义的取代模式(就位置而言，如果不是完全相同的氨基酸取代)。

本文公开的变体GGPS多肽可以例如通过筛选合适的参考多肽的突变体(例如取代突变体)库来鉴定。当在宿主细胞中表达时(与表达参考多肽的相应宿主细胞相比)，可以基于候选突变体增加甜菊醇或甜菊醇糖苷产生的能力来筛选候选突变体。

如本文所公开的核酸片段可包含不编码功能性多肽的序列或由其组成。此类核酸可以用作探针或PCR反应的引物。

根据本公开的核酸，无论它们编码功能性多肽还是非功能性多肽，都可以用作杂交探针或聚合酶链式反应(PCR)引物。不编码具有GGPS活性的多肽的本公开的核酸分子的用途尤其包括：(1)原位杂交(例如FISH)至中期染色体扩散(spreads)，以提供GGPS编码基因的精确染色体定位，如Verma等，Human Chromosomes：a Manual of Basic Techniques，Pergamon Press，New York(1988)所述；(2)Northern印迹分析，用于检测GGPS mRNA在特定组织和/或细胞中的表达；(3)可用作诊断工具的探针和引物，用于分析在给定的生物(例如组织)样品中可与这种探针或引物杂交的核酸的存在。

给定参考GGPS酶的变体可通过以下标准程序获得：

-诱变(易错、掺杂低聚糖(doped oligo)、加标低聚糖(spiked oligo))或变体的合成

-在例如Y.lipolitica或S.cerevisiae中转化

-培养转化体，选择转化体

-在例如Y.lipolitica或S.cerevisiae中表达

-例如根据甜菊醇或甜菊醇糖苷的产生进行初步筛选

-鉴定改进的变体(例如与改变的辅因子特异性有关)。

在一个实施方案中，本公开涉及产生根据本公开的GGPS多肽变体的方法，该方法包括：

a)选择参考GGPS多肽(即模板或起始多肽)；

b)取代至少一个对应于92、100或235中的任何的氨基酸残基，所述位置参考SEQID NO：1定义；

c)任选地取代b)中定义的一个或多个其他氨基酸；

d)制备由步骤a)-c)得到的变体；

e)确定例如如实例中所述的变体的性质；并且

f)选择与参考GGPS多肽相比具有改变的性质的变体。

在产生本文公开的GGPS多肽变体的方法的一个优选实施方案中，参考GGPS多肽具有SEQ ID NO：1所示的序列。

更优选地，在根据本公开的方法的步骤b)中，至少一个对应于92、100或235中的任何一个的氨基酸残基被取代，所述位置是参考SEQ ID NO：1定义的。参考多肽可以与SEQ IDNO：1具有至少约80％的同源性。

在另一个实施方案中，本公开的特征在于宿主细胞，例如含有本公开的核酸、核酸构建体或载体的转化的宿主细胞或重组宿主细胞。根据本发明的“宿主细胞”或“重组细胞”通常是已通过重组DNA技术将根据本公开的核酸(即编码本公开的GGPS的核酸)引入其中(或其祖先中)的细胞。在本公开的上下文中，根据本公开的“宿主细胞”或所述宿主细胞的亲本可以是任何类型的宿主细胞。

因此，如本文所公开的宿主细胞可包含编码本公开的一种或多种变体多肽的重组核酸。

宿主细胞可以是真核细胞或原核细胞。因此，包括原核细胞和真核细胞，例如细菌、真菌、酵母等，特别优选来自酵母(例如S.cerevisiae、Y.lipolytica和K.lactis)的细胞。宿主细胞还包括但不限于哺乳动物细胞系，诸如CHO、VERO、BHK、HeLa、COS、MDCK、293、3T3、WI38和脉络丛细胞系。

因此，本公开提供了用于产生GGPS的方法，该方法包括在适于产生GGPS的条件下培养如本文所述的宿主细胞，并任选地回收GGPS。通常，宿主细胞能够产生甜菊醇或甜菊醇糖苷。

根据本公开的重组宿主可包含本文所述的任何多肽。通常，根据本公开的重组宿主能够产生甜菊醇糖苷。通常，所述重组宿主能够产生糖基化的二萜，诸如甜菊醇糖苷。例如，根据本公开的重组宿主可能够产生以下之中的一种或多种，例如，甜菊醇-13-单糖苷、甜菊醇-19-单糖苷、13-[(β-D-吡喃葡萄糖基)氧基]贝壳杉烯-16-烯-18-油酸2-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖酯(13-[(β-D-Glucopyranosyl)oxy)kaur-16-en-18-oicacid 2-O-β-D-glucopyranosyl-β-D-glucopyranosyl ester)、甜茶苷、甜菊苷、甜菊醇-19-双糖苷、甜菊醇双糖苷、莱鲍迪甙A、莱鲍迪甙E、莱鲍迪甙D或莱鲍迪甙M。

根据本公开的重组宿主可包含一种或多种编码一种或多种具有UDP-糖基转移酶(UGT)活性的多肽的重组核酸序列。

出于本公开的目的，具有UGT活性的多肽是具有糖基转移酶活性(EC2.4)的多肽，即可以充当催化剂以将单糖单元从活化的核苷酸糖(又称“糖基供体”)转移到糖基受体分子(通常是醇)的多肽。UGT的糖基供体通常是核苷酸糖尿苷二磷酸酯葡萄糖(尿嘧啶-二磷酸酯葡萄糖，UDP-葡萄糖)。

可以选择这种附加的UGT以产生期望的甜菊醇糖苷。Humphrey等，PlantMolecular Biology(2006)61：47-62和Mohamed等，J.Plant Physiology 168(2011)1136-1141中示出了甜菊醇糖苷形成的示意图。此外，图1示出了甜菊醇糖苷形成的示意图。

因此，根据本公开的重组宿主可以包含一种或更多种重组核酸序列，所述重组核酸序列编码以下中的一种或更多种：

(i)具有UGT74G1活性的多肽；

(ii)具有UGT2活性的多肽；

(ii)具有UGT85C2活性的多肽；和

(iii)具有UGT76G1活性的多肽。

适用于本公开的重组酵母可包含编码能够催化向甜菊醇中添加C-13-葡萄糖的多肽的核苷酸序列。也就是说，适用于本公开的方法的重组酵母可包含能够催化将甜菊醇转换为甜菊醇单糖苷的反应的UGT。

适用于本公开的方法的这种重组酵母可包含编码具有由UDP-糖基转移酶(UGT)UGT85C2所示的活性的多肽的核苷酸序列，由此转化酵母后，核苷酸序列赋予所述酵母将甜菊醇转换为甜菊醇单糖苷的能力。

UGT85C2活性是将葡萄糖单元转移至甜菊醇的13-OH。因此，合适的UGT85C2可充当尿苷5'-二磷酸葡糖基：甜菊醇13-OH转移酶和尿苷5'-二磷酸葡糖基：甜菊醇-19-O-葡糖苷13-OH转移酶。功能性UGT85C2多肽还可催化葡糖基转移酶反应，所述反应利用除甜菊醇和甜菊醇-19-O-葡糖苷以外的甜菊醇糖苷底物。此类序列可在本文中称为UGT1序列。

适用于本公开的重组酵母可以包含编码具有UGT2活性的多肽的核苷酸序列。

具有UGT2活性的多肽是充当尿苷5'-二磷酸葡糖基：甜菊醇-13-O-葡糖苷转移酶(又称甜菊醇-13-单葡萄糖苷1,2-转葡萄糖基酶)的多肽，其将葡萄糖部分(glucosemoiety)转移到受体分子甜菊醇-13-O-葡糖苷的13-O-葡萄糖的C-2'。典型地，适合的UGT2多肽还充当将葡萄糖部分转移到受体分子甜茶苷的13-O-葡萄糖的C-2'的尿苷5'-二磷酸葡糖基：甜茶苷转移酶。

具有UGT2活性的多肽也可以催化利用除甜菊醇-13-O-葡糖苷和甜茶苷以外的甜菊醇糖苷底物的反应，例如，功能性UGT2多肽可利用甜菊苷作为底物，将葡萄糖部分转移至19-O-葡萄糖残基的C-2'以产生莱鲍迪甙E。功能性UGT2多肽也可以利用莱鲍迪甙A作为底物，从而将葡萄糖部分转移至19-O-葡萄糖残基的C-2'以产生莱鲍迪甙D。然而，功能性UGT2多肽通常不将葡萄糖部分转移至在C-13位具有1,3-结合的葡萄糖的甜菊醇化合物，即将葡萄糖部分转移至甜菊醇1,3-双糖苷和1,3-甜菊苷通常不会发生。

具有UGT2活性的多肽也可以从除尿苷二磷酸酯葡萄糖以外的供体转移糖部分(sugar moieties)。例如，具有UGT2活性的多肽充当尿苷5'-二磷酸D-木糖基：甜菊醇-13-O-葡糖苷转移酶，其将木糖部分(xylose moiety)转移至受体分子甜菊醇-13-O-葡糖苷的13-O-葡萄糖的C-2'。作为另一个实例，具有UGT2活性的多肽可充当尿苷5'-二磷酸L-鼠李糖基：甜菊醇-13-O-葡糖苷转移酶，其将鼠李糖部分(rhamnose moiety)转移至受体分子甜菊醇的13-O-葡萄糖的C-2'。

适用于本公开的方法的重组酵母可以包含编码具有UGT活性的多肽的核苷酸序列，UGT活性能够催化向甜菊醇双糖苷添加C-19-葡萄糖。也就是说，本公开的重组酵母可以包含能够催化将甜菊醇双糖苷转换为甜菊苷的反应的UGT。因此，这种重组酵母可以能够将甜菊醇双糖苷转换为甜菊苷。这种核苷酸序列的表达可以赋予重组酵母生产至少甜菊苷的能力。

因此，适用于本公开的方法的重组酵母还可以包含编码具有由UDP-糖基转移酶(UGT)UGT74G1所示的活性的多肽的核苷酸序列，由此转化酵母后，所述核苷酸序列赋予细胞将甜菊醇双糖苷转换为甜菊苷的能力。

合适的UGT74G1多肽可以能够将葡萄糖单元转移至甜菊醇的13-OH或19-COOH。合适的UGT74G1多肽可充当尿苷5'-二磷酸葡糖基：甜菊醇19-COOH转移酶和尿苷5'-二磷酸葡糖基：甜菊醇-13-O-葡糖苷19-COOH转移酶。功能性UGT74G1多肽还可以催化使用除甜菊醇和甜菊醇-13-O-葡糖苷以外的甜菊醇糖苷底物或者从除尿苷二磷酸酯葡萄糖以外的供体转移糖部分的糖基转移酶反应。此类序列可在本文中称为UGT3序列。

适用于本公开的方法的重组酵母可包含编码能够催化甜菊苷的C-13位置的葡萄糖的C-3'的葡糖基化的多肽的核苷酸序列。也就是说，适用于本公开的方法的重组酵母可包含UGT，所述UGT能够催化甜菊苷转换为莱鲍迪甙A的反应。因此，这种重组酵母可以能够将甜菊苷转换为莱鲍迪甙A。这种核苷酸序列的表达可赋予酵母生产至少莱鲍迪甙A的能力。

适用于本发明方法的重组酵母可以因此还包含编码具有由UDP-糖基转移酶(UGT)UGT76G1所示的活性的多肽的核苷酸序列，由此转化酵母后所述核苷酸序列赋予该酵母将甜菊苷转换为莱鲍迪甙A的能力。

合适的UGT76G1向受体分子甜菊醇1,2糖苷的C-13-O-葡萄糖的C-3'添加葡萄糖部分。因此，UGT76G1充当例如尿苷5'-二磷酸葡糖基：甜菊醇13-O-1,2葡糖苷C-3'葡糖基转移酶和尿苷5'-二磷酸葡糖基：甜菊醇-19-O-葡萄糖、13-O-1,2双糖苷C-3'葡糖基转移酶。功能性UGT76G1多肽还可催化葡糖基转移酶反应，所述反应使用含有除葡萄糖以外的糖的甜菊醇糖苷底物，例如甜菊醇鼠李糖苷和甜菊醇木糖苷。此类序列可在本文中被称为UGT4序列。UGT4可以替代地或者另外地能够将RebD转换为RebM。

适用于本公开方法的重组酵母通常包含编码至少一种具有UGT1活性的多肽、至少一种具有UGT2活性的多肽、至少一种具有UGT3活性的多肽和至少一种具有UGT4活性的多肽的核苷酸序列。这些核酸序列中的一种或更多种可以是重组的。给定的核酸可编码具有一种或更多种上述活性的多肽。例如，核酸可编码具有两种、三种或四种上述活性的多肽。优选地，用于本公开的方法的重组酵母包含UGT1、UGT2和UGT3以及UGT4活性。在WO2015/007748的表1中描述了合适的UGT1、UGT2、UGT3和UGT4序列。

本公开的重组宿主可以包含两种或更多种编码具有任何一种UGT活性(例如，UGT1、UGT2、UGT3或UGT4活性)的多肽的核酸序列。当本公开的重组宿主包含两种或更多种编码具有任何一种UGT活性的多肽的核酸序列时，这些核酸序列可以相同或不同，且/或可编码相同或不同的多肽。特别地，本公开的重组宿主可以包含编码两种不同UGT2多肽的核酸序列。

根据本公开的重组宿主可以包含编码以下项中的一种或更多种的一种或更多种重组核苷酸序列：

具有对映-柯巴基焦磷酸酯合酶活性的多肽；

具有对映-贝壳杉烯合酶活性的多肽；

具有对映-贝壳杉烯氧化酶活性的多肽；以及

具有贝壳杉烯酸13-羟化酶活性的多肽。

出于本公开的目的，具有对映-柯巴基焦磷酸酯合酶(EC 5.5.1.13)的多肽能够催化以下化学反应：

所述酶具有一种底物，香叶基香叶基焦磷酸酯；以及一种产物，对映-柯巴基焦磷酸酯。所述酶参与赤霉素的生物合成。所述酶属于异构酶家族，特别是分子内裂解酶的类别。所述酶类别的系统名称是对映-柯巴基-二磷酸酯裂解酶(脱环)。通常使用的其他名称包括具有对映-柯巴基焦磷酸酯合酶、对映-贝壳杉烯合酶A和对映-贝壳杉烯合成酶A。

编码对映-柯巴基焦磷酸酯合酶的合适核酸序列可例如包含在WO2015/007748的SEQ ID.NO:1、3、5、7、17、19、59、61、141、142、151、152、153、154、159、160、182或184中所示的序列。

出于本公开的目的，具有对映-贝壳杉烯合酶活性(EC 4.2.3.19)的多肽是能够催化以下化学反应的多肽：

对映-柯巴基二磷酸酯对映-贝壳杉烯+二磷酸酯。

因此，所述酶具有一种底物，对映-柯巴基二磷酸酯；以及两种产物，对映-贝壳杉烯和二磷酸酯。

所述酶属于裂解酶家族，特别是作用于磷酸酯的碳-氧裂解酶。所述酶类别的系统名称是对映-柯巴基二磷酸酯二磷酸酯-裂解酶(环化，对映-贝壳杉烯形成)。常用的其它名称包括对映-贝壳杉烯合酶B、对映-贝壳杉烯合成酶B、对映-柯巴基-二磷酸酯二磷酸酯-裂解酶和(环化)。所述酶参与双萜类生物合成。

编码对映-贝壳杉烯合酶的合适核酸序列可例如包含在WO2015/007748的SEQID.NO:9、11、13、15、17、19、63、65、143、144、155、156、157、158、159、160、183或184中列出的序列。

对映-柯巴基二磷酸酯合酶还可具有与相同蛋白质分子相关联的不同对映-贝壳杉烯合酶活性。由对映-贝壳杉烯合酶催化的反应是赤霉素的生物合成途径中的下一步骤。两种类型的酶活性是不同的，并且定点诱变以抑制蛋白质的对映-贝壳杉烯合酶活性导致对映-柯巴基焦磷酸酯的积累。

因此，本公开重组宿主细胞中使用的单个核苷酸序列可编码具有对映-柯巴基焦磷酸酯合酶活性和对映-贝壳杉烯合酶活性的多肽。或者，这两种活性可被两个不同的分离的核苷酸序列编码。

出于本公开的目的，具有对映-贝壳杉烯氧化酶活性(EC 1.14.13.78)的多肽是能够催化对映-贝壳杉烯的4-甲基的三次连续氧化以产生贝壳杉烯酸的多肽。这种活性通常需要细胞色素P450的存在。

编码对映-贝壳杉烯氧化酶的合适核酸序列可例如包含在WO2015/007748的SEQID.NO:21、23、25、67、85、145、161、162、163、180或186中列出的序列。

出于本公开的目的，具有贝壳杉烯酸13-羟化酶活性(EC 1.14.13)的多肽是能够催化使用NADPH和O₂形成甜菊醇(对映-贝壳杉-16-烯-13-醇-19-酸)的多肽。这种活性也可被称为对映-贝壳杉烯酸13-羟化酶活性。

编码贝壳杉烯酸13-羟化酶的合适核酸序列可例如包含在WO2015/007748的SEQID.NO:27、29、31、33、69、89、91、93、95、97、146、164、165、166、167或185中列出的序列。

本公开的重组宿主可包含编码具有NADPH-细胞色素p450还原酶活性的多肽的重组核酸序列。也就是说，本公开的重组宿主可能够表达编码具有NADPH-细胞色素p450还原酶活性的多肽的核苷酸序列。出于本公开的目的，具有NADPH-细胞色素P450还原酶活性(EC1.6.2.4；也称为NADPH:高铁血红蛋白氧化还原酶、NADPH:血红素蛋白氧化还原酶、NADPH:P450氧化还原酶、P450还原酶、POR、CPR、CYPOR)的多肽通常是一种这样的多肽，其为膜结合酶，从而允许电子从含有FAD和FMN的酶NADPH:细胞色素P450还原酶(POR；EC 1.6.2.4)转移至真核细胞的微粒体中的细胞色素P450。

在本公开的重组宿主细胞中，可上调宿主细胞产生香叶基香叶基二磷酸酯(GGPP)的能力(除了通过使用编码本公开的一种或多种多肽的核苷酸序列)。在本公开的上下文中上调意味着重组宿主细胞比等同的非重组宿主细胞产生更多的GGPP。

因此，本公开的重组宿主可包含编码羟甲基戊二酰基-辅酶A还原酶、法呢基-焦磷酸酯合成酶和香叶基香叶基二磷酸酯合酶的一个或多个核苷酸序列，由此微生物转化后所述核苷酸序列赋予微生物产生提高水平的GGPP的能力。因此，根据本公开的重组宿主可包含编码羟甲基戊二酰基-辅酶A还原酶、法呢基-焦磷酸酯合成酶和香叶基香叶基二磷酸酯合酶中的一种或多种的一个或多个重组核酸序列(不同于本公开的GGPS)。

因此，本公开的重组宿主可包含编码以下中的一种或多种的核酸序列：

具有羟甲基戊二酰基-辅酶A还原酶活性的多肽；

具有法呢基-焦磷酸酯合成酶活性的多肽；

具有香叶基香叶基二磷酸酯合酶活性的多肽。

如本文所定义的宿主或宿主细胞是适于遗传操作的生物体，以及可以在可用于工业生产目标产物的细胞密度下培养的生物体。合适的宿主可以是微生物，例如可以在发酵装置中维持的微生物。宿主细胞可以是在自然界中发现的宿主细胞或遗传操作或经典诱变后来源自亲本宿主细胞的宿主细胞。

如本文所用，重组宿主是用一种或多种编码如本文定义的变体GGS的核苷酸序列进行遗传修饰或转化/转染的宿主。一种或多种此类核苷酸序列的存在改变了微生物产生甜菊醇或甜菊醇糖苷，特别是一种或多种甜菊醇糖苷的能力。非重组宿主，即未转化/转染或遗传修饰的宿主，通常不包含一个或多个使细胞能够生产甜菊醇糖苷的核苷酸序列。因此，非重组宿主通常是不天然产生甜菊醇糖苷的宿主，尽管天然产生甜菊醇或甜菊醇糖苷且已根据本公开进行修饰(因此具有改变的产生二萜糖苷的能力)的宿主被认为是根据本公开的重组宿主。

特别地，有可能的是，选自由对映-柯巴基焦磷酸酯合酶、对映-贝壳杉烯合酶、对映-贝壳杉烯氧化酶和贝壳杉烯酸13-羟化酶、UGTs、羟甲基戊二酰基-CoA还原酶、法呢基-焦磷酸酯合成酶、香叶基香叶基二磷酸酯合酶(不同于本公开的GGPS)和NADPH-细胞色素p450还原酶组成的组的酶产自于宿主，并且赋予宿主细胞生产甜菊醇或甜菊醇糖苷的能力可能不需要用一种或多种编码这些酶的核苷酸序列进行转化。根据本公开的宿主可以是天然能够产生GGPP(即以其非重组形式)的重组宿主。

通过经典的菌株改良可以获得宿主微生物的甜菊醇或甜菊醇糖苷生产的进一步改善。

宿主细胞可以是原核宿主细胞、古细菌宿主细胞或真核宿主细胞。

原核宿主细胞可以是但不限于细菌宿主细胞。真核宿主细胞可以是但不限于酵母、真菌、变形虫、藻类、动物、昆虫宿主细胞。

真核宿主细胞可以是真菌宿主细胞。“真菌”包括真菌(Eumycotina)亚门的所有物种(Alexopoulos,C.J.,1962,在Introductory Mycology,John Wiley&Sons,Inc.(约翰威立出版有限公司),纽约)。因此，术语真菌包括丝状真菌和酵母等等。

“丝状真菌”在本文中被定义为真核微生物，其包括真菌和卵菌亚门的所有丝状形式(如由Hawksworth等人，1995，同上所定义)。丝状真菌是以由壳多糖、纤维素、葡聚糖、壳聚糖、甘露聚糖以及其它复合多糖构成的菌丝壁为特征。营养体生长是通过菌丝延长，并且碳代谢是专性需氧的。丝状真菌菌株包括但不限于以下各项的菌株：Acremonium、Aspergillus、Agaricus、Aureobasidium、Cryptococcus、Corynascus、Chrysosporium、Filibasidium、Fusarium、Humicola、Magnaporthe、Monascus、Mucor、Myceliophthora、Mortierella、Neocallimastix、Neurospora、Paecilomyces、Penicillium、Piromyces、Phanerochaete、Podospora、Pycnoporus、Rhizopus、Schizophyllum、Sordaria、Talaromyces、Rasmsonia、Thermoascus、Thielavia、Tolypocladium、Trametes以及Trichoderma。可充当宿主细胞的优选丝状真菌菌株属于以下物种：Aspergillus niger、Aspergillus oryzae、Aspergillus fumigatus、Penicillium chrysogenum、Penicilliumcitrinum、Acremonium chrysogenum、Trichoderma reesei、Rasamsonia emersonii(先前称为Talaromyces emersonii)、Aspergillus sojae、Chrysosporium lucknowense、Myceliophtora thermophyla。用于比较转化和未转化细胞的发酵特征的参考宿主细胞包括例如Aspergillus niger CBS120.49、CBS 513.88；Aspergillus oryzae ATCC16868、ATCC 20423、IF0 4177、ATCC 1011、ATCC 9576、ATCC14488-14491、ATCC 11601、ATCC12892；Aspergillus fumigatus AF293(CBS101355)；P.chrysogenum CBS 455.95；Penicilliumcitrinum ATCC 38065；Penicillium chrysogenum P2；Acremonium chrysogenum ATCC36225、ATCC 48272；Trichoderma reesei ATCC 26921、ATCC56765、ATCC 26921；Aspergillus sojae ATCC11906；Chrysosporium lucknowense ATCC44006以及所有这些菌株的衍生株。作为丝状真菌宿主细胞特别优选的是Aspergillus niger CBS 513.88及其衍生株。

真核宿主细胞可以是酵母细胞。优选的酵母宿主细胞可选自以下属：Saccharomyces(例如，S.cerevisiae、S.bayanus、S.pastorianus、S.carlsbergensis)、Brettanomyces、Kluyveromyces、Candida(例如，C.krusei、C.revkaufi、C.pulcherrima、C.tropicalis、C.utilis)、Issatchenkia(例如，I.orientalis)、Pichia(例如，P.pastoris)、Schizosaccharomyces、Hansenula、Kloeckera、Pachysolen、Schwanniomyces、Trichosporon、Yarrowia(例如，Y.lipolytica)(先前被分类为Candidalipolytica))、Yamadazyma。

原核宿主细胞可以是细菌宿主细胞。细菌宿主细胞可以是革兰氏阴性或革兰氏阳性细菌。细菌的实例包括但不限于，属于以下属的细菌：Bacillus(例如，B.subtilis、B.amyloliquefaciens、B.licheniformis、B.puntis、B.megaterium、B.halodurans、B.pumilus)、Acinetobacter、Nocardia、Xanthobacter、Escherichia(例如，大肠杆菌(例如，菌株DH1OB、Stbl2、DH5-α、DB3、DB3.1)、DB4、DB5、JDP682和ccdA-over(例如，美国申请号09/518,188)))、Streptomyces、Erwinia、Klebsiella、Serratia(S.marcessans)、Pseudomonas(例如，P.aeruginosa)、Salmonella(例如，S.typhimurium、S.typhi)。细菌还包括但不限于光合细菌(例如，绿色非硫细菌(例如，Choroflexus细菌(例如C.aurantiacus)、Chloronema(例如，C.gigateum))、绿色硫细菌(例如，Chlorobium细菌(例如，C.limicola)、Pelodictyon(例如，P.luteolum)、紫色硫细菌(例如，Chromatium(例如，C.okenii))以及紫色非硫细菌(例如，Rhodospirillum(例如，R.rubrum)、Rhodobacter(例如R.sphaeroides、R.capsulatus)和Rhodomicrobium细菌(例如R.vanellii))。

宿主细胞可以是来自非微生物生物体的宿主细胞。此类细胞的实例包括但不限于昆虫细胞(例如，Drosophila(例如，D.melanogaster)、Spodoptera(例如，S.frugiperdaSf9或Sf21细胞)和Trichoplusa(例如，High-Five细胞))；线虫细胞(例如，C.elegans细胞)；禽类细胞；两栖动物细胞(例如，Xenopus laevis细胞)；爬行动物细胞；以及哺乳动物细胞(例如NIH3T3、293、CHO、COS、VERO、C127、BHK、Per-C6、Bowes黑色素瘤和HeLa细胞)。

本公开还提供了一种生产本公开多肽的方法，所述方法包括：

(a)在有助于宿主细胞产生多肽的条件下培养本公开的重组宿主细胞，并且任选地，

(b)回收所述多肽。

根据本公开的重组宿主可能够在本领域中已知的任何合适的碳源上生长，并且将其转换成甜菊醇糖苷，例如甜菊醇糖苷。重组宿主可能够直接转换植物生物质、纤维素、半纤维素、果胶、鼠李糖、半乳糖、岩藻糖、麦芽糖、麦芽糖糊精、核糖、核酮糖或淀粉、淀粉衍生物、蔗糖、葡萄糖、乳糖或甘油。因此，优选的宿主表达酶如用于将纤维素转换成葡萄糖单体和将半纤维素转换成木糖和阿拉伯糖单体所需的纤维素酶(内切纤维素酶和外切纤维素酶)和半纤维素酶(例如内切和外切木聚糖酶、阿拉伯糖酶)，能够将果胶转换成葡萄糖醛酸和半乳糖醛酸的果胶酶或将淀粉转换成葡萄糖单体的淀粉酶。优选地，宿主能够转换选自由以下各项组成的组的碳源：葡萄糖、木糖、阿拉伯糖、蔗糖、乳糖和甘油。宿主细胞可例如是WO03/062430、WO06/009434、EP1499708B1、WO2006096130或WO04/099381中所描述的真核宿主细胞。

因此，另一方面，本公开还提供了一种用于制备甜菊醇糖苷的方法，所述方法包括发酵本公开的重组宿主，所述重组宿主能够在合适的发酵培养基中产生至少一种甜菊醇糖苷；以及任选地回收所述甜菊醇糖苷。

甜菊醇糖苷可以是，例如，甜菊醇-13-单糖苷、甜菊醇-19-单糖苷、13-[(β-D-吡喃葡萄糖基)氧基]贝壳杉烯-16-烯-18-油酸2-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖酯、甜茶苷、甜菊苷、甜菊醇-19-双糖苷、甜菊醇双糖苷、rebA、莱鲍迪甙B、莱鲍迪甙C、莱鲍迪甙E、莱鲍迪甙D或莱鲍迪甙M。

在用于产生甜菊醇糖苷的方法中使用的发酵培养基可以是允许特定宿主细胞生长的任何合适的发酵培养基。发酵培养基的基本要素是本领域的技术人员已知的，并且可适用于所选择的宿主细胞。

优选地，发酵培养基包含选自由以下各项组成的组的碳源：植物生物质、纤维素、半纤维素、果胶、鼠李糖、半乳糖、岩藻糖、果糖、麦芽糖、麦芽糖糊精、核糖、核酮糖或淀粉、淀粉衍生物、葡萄糖、蔗糖、乳糖、脂肪酸、甘油三酯和甘油。优选地，发酵培养基还包含氮源，如尿素；或铵盐，如硫酸铵、氯化铵、硝酸铵或磷酸铵。

根据本公开的发酵方法可以分批、分批补料或连续模式进行。也可应用单独的水解和发酵(SHF)方法或同时糖化和发酵(SSF)方法。这些发酵方法模式的组合对于最佳生产率来说也可以是可行的。如果在发酵方法中使用淀粉、纤维素、半纤维素或果胶作为碳源，则SSF方法可以是特别有吸引力的，其中可需要添加水解酶如纤维素酶、半纤维素酶或果胶酶以水解底物。

在用于制备甜菊醇糖苷的方法中使用的重组宿主可以是如上文所定义的任何合适的重组宿主。在所述方法中使用根据本公开的重组真核宿主可以是有利的，因为大多数真核细胞不需要用于繁殖的无菌条件并且对噬菌体感染不敏感。此外，真核宿主细胞可在低pH下生长以防止细菌污染。

根据本公开的重组宿主可以是兼性厌氧微生物。兼性厌氧重组宿主可以需氧方式繁殖至高细胞浓度。然后可在高细胞密度下进行这种厌氧阶段，这显著地降低了所需的发酵体积并且可使需氧微生物污染的风险最小化。

用于产生根据本公开的甜菊醇糖苷的发酵方法可以是需氧或厌氧发酵方法。

厌氧发酵方法可在本文中定义为在不存在氧的情况下运行或者基本上不消耗氧(优选小于5、2.5或1mmol/L/h)，并且其中有机分子充当电子供体和电子受体两者的发酵方法。根据本公开的发酵方法也可首先在需氧条件下运行，且随后在厌氧条件下运行。

发酵方法也可在限氧或微需氧条件下进行。或者，发酵方法可首先在需氧条件下运行，且随后在限氧条件下运行。限氧发酵方法是其中氧消耗受到从气体到液体的氧传递的限制的过程。氧限制的程度由进入气流的量和组成以及所用发酵设备的实际混合/传质特性决定。

在根据本公开的方法中产生甜菊醇糖苷可在宿主细胞的生长阶段期间、固定(稳定状态)阶段期间或在两个阶段期间发生。在不同的温度下运行发酵方法可以是可行的。

用于生产甜菊醇糖苷的方法可在对于重组宿主来说最佳的温度下进行。对于每种转化的重组宿主而言，最佳生长温度可不同并且是本领域技术人员已知的。最佳温度可高于野生型生物的最适温度以在非无菌条件下在最低感染敏感性和最低冷却成本的条件下有效生长生物体。或者，所述方法可在对于重组宿主的生长来说不是最佳的温度下进行。

用于产生根据本公开的甜菊醇糖苷的方法可在任何合适的pH值下进行。如果重组宿主是酵母，则发酵培养基中的pH优选具有低于6、优选低于5.5、优选低于5、优选低于4.5、优选低于4、优选低于pH 3.5或低于pH 3.0或低于pH 2.5、优选高于pH 2的值。在这些低pH值下进行发酵的优点是可防止发酵培养基中污染细菌的生长。

这种方法可以以工业规模进行。这种方法的产物是一种或多种甜菊醇糖苷，例如，以下各项的一种或多种，例如，甜菊醇-13-单糖苷、甜菊醇-19-单糖苷、13-[(β-D-吡喃葡萄糖基)氧基]贝壳杉烯-16-烯-18-油酸2-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖酯、甜茶苷、甜菊苷、甜菊醇-19-双糖苷、甜菊醇双糖苷、莱鲍迪甙A、莱鲍迪甙E、莱鲍迪甙D或莱鲍迪甙M。

从发酵培养基中回收甜菊醇糖苷可通过本领域已知的方法进行，例如通过蒸馏、真空萃取、溶剂萃取或蒸发。

在用于产生根据本公开的甜菊醇糖苷的方法中，实现高于5mg/l发酵液、优选高于10mg/l、优选高于20mg/l、优选高于30mg/l发酵液、优选高于40mg/l、更优选高于50mg/l、优选高于60mg/l、优选高于70、优选高于80mg/l、优选高于100mg/l、优选高于1g/l、优选高于5g/l、优选高于10g/l，但通常低于70g/l的浓度是可行的。

本公开还提供了一种包含能够通过本公开的用于制备甜菊醇糖苷的方法获得的甜菊醇糖苷的发酵液。

在微生物中表达一种或多种甜菊醇糖苷的情况下，可需要处理此类细胞以释放它们。优选地，在细胞外产生至少一种甜菊醇糖苷，例如rebA、rebD或rebM。

与由表达参考多肽而不是本公开的多肽的重组宿主产生的培养液相比，根据本公开的培养液可包含多于至少一种甜菊醇糖苷，诸如rebA、rebD或rebM。

培养液可以定义为总培养液，即包括本公开的宿主细胞，或者可以根据与本公开的宿主细胞分离的液相(例如上清液)来定义。

与由表达参考多肽而不是本公开的多肽的重组宿主产生的培养液相比，根据本公开的培养液可包含较少的至少一种非甜菊醇糖苷，例如，一种或多种贝壳杉烯酸糖苷。

本公开还提供了一种通过根据本公开的用于制备甜菊醇糖苷的方法获得的或能够从本公开的发酵液获得的甜菊醇糖苷。这种甜菊醇糖苷可以是非天然存在的甜菊醇糖苷，也就是说不在植物中产生的甜菊醇糖苷。

本公开还提供了一种包含能够通过用于制备甜菊醇糖苷的本公开的方法获得的或能够从本公开的发酵液获得的两种或更多种甜菊醇糖苷的组合物。在这种组合物中，一种或多种甜菊醇糖苷可以是非天然存在的甜菊醇糖苷，也就是说不在植物中产生的甜菊醇糖苷。

此外，本公开提供了一种将第一甜菊醇糖苷转换为第二甜菊醇糖苷的方法，该方法包括：

-使所述第一甜菊醇糖苷与本公开的重组宿主、源自所述重组宿主的无细胞提取物或源自两者之中任一的酶制剂接触；

-从而将所述第一甜菊醇糖苷转换为所述第二甜菊醇糖苷。

在这种方法中，第二甜菊醇糖苷可以是甜菊醇-19-双糖苷、甜菊醇双糖苷、甜菊苷、13-[(β-D-吡喃葡萄糖基)氧基]贝壳杉烯-16-烯-18-油酸2-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖酯、RebA、RebE、RebD或RebM。

在这种方法中，第一甜菊醇糖苷可以是甜菊醇-13-单糖苷、甜菊醇-19-单糖苷、甜茶苷、甜菊苷、莱鲍迪甙A或13-[(β-D-吡喃葡萄糖基)氧基]贝壳杉烯-16-烯-18-油酸2-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖酯，并且第二糖基化二萜是甜菊醇-19-双糖苷、甜菊醇双糖苷、甜菊苷、13-[(β-D-吡喃葡萄糖基)氧基]贝壳杉烯-16-烯-18-油酸2-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖酯、RebA、RebE或RebD。

也就是说，本公开涉及生物转换或生物转化的方法。

通过根据本公开的发酵方法产生的甜菊醇糖苷或组合物可用于对于此类化合物来说已知的任何应用中。特别地，它们可例如用作甜味剂，例如用于食品或饮料中。因此，根据本公开，提供了一种包含本公开的甜菊醇糖苷或组合物的食品、饲料或饮料。

例如，本公开的甜菊醇糖苷或组合物可被配制成软饮料、配制为桌面甜味剂、口香糖、乳制品如酸奶(例如原味酸奶)、蛋糕、谷物或基于谷类的食物、营养食品、药物、食用凝胶、糖果产品、化妆品、牙膏或其它口腔组合物等。此外，本公开的甜菊醇糖苷或组合物可用作甜味剂，不仅用于饮料、食品和其它专门用于人消费的产品，而且用于具有改进的特性的动物饲料和草料中。

因此，本发明尤其提供了一种包含根据本公开的方法制备的甜菊醇糖苷的食品、饲料或饮料。

在食品、饮料、药物、化妆品、桌面产品、口香糖的制造过程中，可使用诸如混合、捏合、溶解、酸浸、渗透、渗滤、喷洒、雾化、灌注和其它方法的常规方法。

本公开的甜菊醇糖苷或组合物可以以干燥形式或液体形式使用。可以在食品热处理之前或之后加入。甜味剂的量取决于使用目的。可以单独加入或者与其它化合物组合加入。

根据本公开的方法产生的化合物可以可与一种或多种其它非热量或热量甜味剂掺混。这种掺混可用于改进风味或时间特征或稳定性。广泛范围的非热量和热量甜味剂二者可适用于与本公开的甜菊醇糖苷或组合物掺混。例如，非热量甜味剂如罗汉果苷、莫纳甜、阿斯巴甜、安赛蜜盐、环磺酸盐、三氯蔗糖、糖精盐或赤藓糖醇。适用于与本公开的甜菊醇糖苷或组合物掺混的热量甜味剂包括糖醇和碳水化合物如蔗糖、葡萄糖、果糖和HFCS。还可使用甜味氨基酸，如甘氨酸、丙氨酸或丝氨酸。

本公开的甜菊醇糖苷或组合物可与甜味剂抑制剂如天然甜味剂抑制剂组合使用。它可与鲜味增强剂如氨基酸或其盐组合。

本公开的甜菊醇糖苷或组合物可与多元醇或糖醇、碳水化合物、生理活性物质或功能成分(例如类胡萝卜素、膳食纤维、脂肪酸、皂苷、抗氧化剂、营养品、类黄酮、异硫氰酸酯、苯酚、植物甾醇或甾烷醇(植物甾醇和植物甾烷醇)、多元醇、益生元、益生菌、植物雌激素、大豆蛋白、硫化物/硫醇、氨基酸、蛋白质、维生素、矿物质和/或基于健康益处如心血管、降胆固醇或抗炎分类的物质组合。

具有本公开的甜菊醇糖苷或组合物的组合物可包括调味剂、芳香组分、核苷酸、有机酸、有机酸盐、无机酸、苦味化合物、蛋白质或蛋白质水解产物、表面活性剂、类黄酮、收敛剂化合物、维生素、膳食纤维、抗氧化剂、脂肪酸和/或盐。

本公开的甜菊醇糖苷或组合物可作为高强度甜味剂应用，以产生具有改进的味道特征的零卡路里、低卡路里或糖尿病人用饮料和食品。它也可用于不能使用糖的饮料、食品、药物和其他产品中。

此外，本公开的甜菊醇糖苷或组合物可用作甜味剂，不仅用于饮料、食品和其它专门用于人消费的产品，而且用于具有改进的特性的动物饲料和草料中。

本公开的甜菊醇糖苷或组合物可用作甜味化合物的产品的实例可以是酒精饮料，如伏特加酒、葡萄酒、啤酒、烈酒、清酒等；天然果汁、提神饮料、碳酸软饮料、减肥饮料、零卡路里饮料、低卡路里饮料和食物、酸奶饮料、速溶果汁、速溶咖啡、粉末型速溶饮料、罐装产品、糖浆、发酵大豆酱、酱油、醋、调味品、蛋黄酱、番茄酱、咖喱、汤、速食肉汤、酱油粉、醋粉、多种类型的饼干、香米饼、咸饼干、面包、巧克力、焦糖、糖果、口香糖、果冻、布丁、蜜饯和腌菜、鲜奶油、果酱、橘子酱、糖花膏、奶粉、冰淇淋、冰糕、包装在瓶中的蔬菜和水果、罐装和煮熟的豆类、在甜味酱中煮熟的肉和食物、农业蔬菜食品、海鲜、火腿、香肠、鱼火腿、鱼香肠、鱼酱、油炸鱼制品、干制海产品、冷冻食品、腌渍海带、腊肉、烟草、医药产品等。原则上它可具有无限应用。

甜味组合物包括饮料，其非限制性实例包括非碳酸和碳酸饮料，如可乐、姜汁汽水、根汁汽水、苹果汁、水果味软饮料(例如柑橘味软饮料，如柠檬莱姆或橙汁)、软饮料粉等；来自水果或蔬菜的汁、包括榨汁等的汁、含有果粒的果汁、水果饮料、果汁饮料、含果汁的饮料、具有水果调味料的饮料、蔬菜汁、含蔬菜的汁以及含水果和蔬菜的混合汁；运动饮料、能量饮料、近水(near water)等的饮料(例如具有天然或合成调味剂的水)；茶类或喜好型饮料如咖啡、可可、红茶、绿茶、乌龙茶等；含乳成分饮料如乳饮料、含乳成分咖啡、牛奶咖啡、奶茶、果奶饮料、饮用酸奶、乳酸菌饮料等；以及乳制品。

通常，甜味组合物中存在的甜味剂的量取决于甜味组合物的具体类型及其所需的甜度而广泛变化。本领域的普通技术人员可容易确定加入到甜味组合物中的甜味剂的适当量。

因此，本公开的组合物可通过本领域的技术人员已知的提供成分的均匀或均质混合物的任何方法来制备。这些方法包括干混、喷雾干燥、团聚、湿法制粒、压实、共结晶等。

呈固体形式时，本公开的甜菊醇糖苷或组合物可以适于递送到待甜化的食物中的任何形式提供给消费者，所述形式包括小袋、小包、散装袋或盒、方块、片剂、喷雾或可溶解的条。所述组合物可以单位剂量或散装形式递送。

对于液体甜味剂体系和组合物而言，应开发方便范围的流体、半流体、糊状和膏状形式、使用任何形状或形式的适当包装材料的适当包装，其便于携带或分配或储存或运输含有任何上述甜味剂产品或上述产生的产品的组合的任何组合。

组合物可包含多种填充剂、功能成分、着色剂、调味剂。

术语“序列同源性”或“序列同一性”在本文中可互换使用。出于本公开的目的，在此定义为了确定两个氨基酸序列或两个核酸序列的序列同源性或序列同一性的百分比，出于最佳比较目的比对所述序列。为了优化两个序列之间的比对，可在比较的两个序列中的任一个中引入空位。这种比对可在所比较的序列的全长上进行。或者，比对可在更短的长度上进行，例如在约20、约50、约100或更多个核酸/碱基或氨基酸上进行。序列同一性是在所报告的比对区域上两个序列之间的相同匹配的百分比。

两个序列之间的序列比较和序列同一性百分比的确定可使用数学算法来完成。本领域的技术人员将意识到以下事实：若干不同的计算机程序可用于比对两个序列并确定两个序列之间的同一性(Kruskal,J.B.(1983)An overview of sequence comparison InD.Sankoff and J.B.Kruskal,(编辑),Time warps,string edits and macromolecules:the theory and practice of sequence comparison,第1-44页Addison Wesley)。两个氨基酸序列之间或两个核苷酸序列之间的序列同一性百分比可使用用于两个序列的比对的Needleman和Wunsch算法来确定(Needleman,S.B.和Wunsch,C.D.(1970)J.Mol.Biol.48,443-453)。氨基酸序列和核苷酸序列两者均可通过所述算法进行比对。Needleman-Wunsch算法已在计算机程序NEEDLE中实现。出于本公开的目的，使用了来自EMBOSS包的NEEDLE程序(2.8.0版或更高版本,EMBOSS:The European Molecular Biology Open SoftwareSuite(2000)Rice,P.Longden,I.和Bleasby,A.Trends in Genetics 16,(6)第276-277页,http://emboss.bioinformatics.nl/)。对于蛋白质序列而言，EBLOSUM62用于取代矩阵。对于核苷酸序列而言，使用EDNAFULL。所使用的任选参数是空位开放罚分为10，以及空位延伸罚分为0.5。技术人员将理解的是，所有这些不同的参数将产生稍微不同的结果，但是当使用不同的算法时，两个序列的总体同一性百分比没有显著改变。

在通过如上所述的程序NEEDLE进行比对后，查询序列与本公开的序列之间的序列同一性的百分比计算如下：在两个序列中显示相同氨基酸或相同核苷酸的比对中的相应位置的数目除以在减去比对中的总空位数后比对的总长度。如本文定义的同一性可通过使用NOBRIEF选项从NEEDLE获得，并且在程序的输出中标记为“最长同一性”。

本公开的核酸和蛋白质序列可进一步用作“查询序列”以进行针对公共数据库的检索，以例如鉴定其它家族成员或相关序列。此类搜索可使用Altschul等人(1990)J.Mol.Biol.215:403—10的NBLAST和XBLAST程序(2.0版)进行。BLAST核苷酸搜索可用NBLAST程序(得分＝100、字长＝12)来进行，以获得与本公开的核酸分子同源的核苷酸序列。BLAST蛋白质搜索可用XBLAST程序(得分＝50、字长＝3)来进行，以获得与本公开的蛋白分子同源的氨基酸序列。为了获得用于比较目的的空位比对，可利用如在Altschul等人,(1997)Nucleic Acids Res.25(17):3389-3402中描述的空位BLAST。当利用BLAST和空位BLAST程序时，可使用相应程序(例如XBLAST和NBLAST)的默认参数。参见美国国家生物技术信息中心http://www.ncbi.nlm.nih.gov/的主页。

根据本公开的实施方案：

1.一种具有香叶基香叶基焦磷酸酯合酶活性的变体多肽，诸如具有香叶基香叶基焦磷酸酯合酶活性的参考多肽的变体，该变体多肽包含氨基酸序列，当与包含SEQ ID NO：1所示序列的香叶基香叶基焦磷酸酯合酶比对时，该氨基酸序列包含对应于位置92、100或235的任何氨基酸的氨基酸残基的至少一个修饰，优选地至少一个取代，所述位置是参考SEQ ID NO：1定义的，并且其中所述变体与具有香叶基香叶基焦磷酸酯合酶活性的参考多肽相比具有一种或多种修饰的性质。

2.根据实施方案1所述的变体多肽，其中，所述修饰的性质是修饰的香叶基香叶基焦磷酸酯合酶活性。

3.根据实施方案1或2所述的变体多肽，其中，所述参考多肽包含SEQ ID NO：1或SEQ ID NO：17的香叶基香叶基焦磷酸酯合酶。

4.根据前述实施方案中任一项所述的变体多肽，其中，所述变体包含氨基酸序列，当与包含SEQ ID NO：1所示序列的香叶基香叶基焦磷酸酯合酶比对时，该氨基酸序列包含对应于位置92的氨基酸的氨基酸残基被选自Glu残基、Asp残基、Asn残基、Gln残基，优选Glu残基的氨基酸残基取代，所述位置是参考SEQ ID NO：1定义的，并且其中所述变体与具有香叶基香叶基焦磷酸酯合酶活性的参考多肽相比具有一种或多种修饰的性质。

5.根据前述实施方案中任一项所述的变体多肽，其中所述变体包含氨基酸序列，当与包含SEQ ID NO：1所示序列的香叶基香叶基焦磷酸酯合酶比对时，该氨基酸序列包含对应于位置100的氨基酸的氨基酸残基被选自Val残基、Gly残基、Phe残基、Tyr残基、Ile残基、Leu残基，优选Val残基的氨基酸残基取代，所述位置是参考SEQ ID NO：1定义的，并且其中所述变体与具有香叶基香叶基焦磷酸酯合酶活性的参考多肽相比具有一种或多种修饰的性质。

6.根据前述实施方案中任一项所述的变体多肽，其中所述变体包含氨基酸序列，当与包含SEQ ID NO：1所示序列的香叶基香叶基焦磷酸酯合酶比对时，该氨基酸序列包含对应于位置235的氨基酸的氨基酸残基被选自Asn残基、Ala残基、Gly残基、Gln残基、Val残基、Asp残基、Glu残基、Phe残基、Tyr残基，优选Asn残基的氨基酸残基取代，所述位置是参考SEQ ID NO：1定义的，并且其中所述变体与具有香叶基香叶基焦磷酸酯合酶活性的参考多肽相比具有一种或多种修饰的性质。

7.根据前述实施方案中任一项所述的变体多肽，其中，所述变体多肽是非天然存在的多肽。

8.根据前述实施方案中任一项所述的变体多肽，所述变体多肽包含除实施方案1中定义的那些取代之外的附加取代。

9.根据前述实施方案中任一项所述的变体多肽，所述变体多肽与SEQ ID NO：1或SEQ ID NO：17具有至少70％，至少75％，至少80％，至少85％，至少90％，至少95％，至少97％，至少98％或至少99％的序列同一性。

10.一种具有香叶基香叶基焦磷酸酯合酶活性的变体多肽，所述变体多肽包含与SEQ ID NO：3、5、7、9、11、13、15、18至33中的任一个具有至少约95％序列同一性，至少96％，至少97％，至少98％或至少99％序列同一性的氨基酸序列。

11.一种具有香叶基香叶基焦磷酸酯合酶活性的变体多肽，其中所述多肽催化一个或多个下列反应：

-二甲基烯丙基二磷酸酯+异戊烯二磷酸酯＝二磷酸酯+香叶基二磷酸酯；

-香叶基二磷酸酯+异戊烯二磷酸酯＝二磷酸酯+(2E,6E)-法呢基二磷酸酯；

-(2E,6E)-法呢基二磷酸酯+异戊烯二磷酸酯＝二磷酸酯+香叶基香叶基二磷酸酯。

12.一种多核苷酸，其包含编码根据前述实施方案中任一项所述的变体多肽的序列。

13.一种核酸构建体，其包含实施方案12所述的多核苷酸序列，所述多核苷酸序列可操作地连接至一个或多个能够指导香叶基香叶基焦磷酸酯合酶在合适的表达宿主中表达的控制序列。

14.一种表达载体，所述表达载体包含根据实施方案12所述的多核苷酸或根据实施方案13所述的核酸构建体。

15.一种重组宿主，所述重组宿主包含根据实施方案12所述的多核苷酸、根据实施方案13所述的核酸构建体或根据实施方案14所述的表达载体。

16.根据实施方案15所述的重组宿主，所述重组宿主能够生产甜菊醇或甜菊醇糖苷。

17.根据实施方案15或16所述的重组宿主，所述重组宿主包含一种或多种重组核苷酸序列，所述重组核苷酸序列编码：

具有对映-柯巴基焦磷酸酯合酶活性的多肽；

具有对映-贝壳杉烯合酶活性的多肽；

具有对映-贝壳杉烯氧化酶活性的多肽；以及

具有贝壳杉烯酸13-羟化酶活性的多肽。

18.根据实施方案15-17中任一项所述的重组宿主，其包含重组核酸序列，所述重组核酸序列编码具有NADPH-细胞色素p450还原酶活性的多肽。

19.根据实施方案15-18中任一项所述的重组宿主，其包含编码以下中的一种或更多种的重组核酸序列：

(i)具有UGT74G1活性的多肽；

(ii)具有UGT2活性的多肽；

(iii)具有UGT85C2活性的多肽；以及

(iv)具有UGT76G1活性的多肽。

20.根据实施方案15-19中任一项所述的重组宿主，其中所述宿主属于以下属中的一种：Saccharomyces、Aspergillus、Pichia、Kluyveromyces、Candida、Hansenula、Humicola、Issatchenkia、Trichosporon、Brettanomyces、Pachysolen、Yarrowia、Yamadazyma或Escherichia。

21.根据实施方案20所述的重组宿主，其中所述重组宿主是Saccharomycescerevisiae细胞、Yarrowia lipolitica细胞、Candida krusei细胞、Issatchenkiaorientalis细胞或Escherichia coli细胞。

22.根据实施方案15-21中任一项所述的重组宿主，其中所述宿主产生香叶基香叶基二磷酸酯(GGPP)的能力被上调。

23.根据实施方案15-22中任一项所述的重组宿主，所述重组宿主包含编码以下中的一种或更多种的核酸序列：

具有羟甲基戊二酰基-辅酶A还原酶活性的多肽；

具有法呢基-焦磷酸酯合成酶活性的多肽；或任选地

具有香叶基香叶基二磷酸酯合酶活性的多肽，其不同于根据实施方案1至7中任一项所述的变体多肽。

24.一种用于制备甜菊醇或甜菊醇糖苷的方法，所述方法包括在合适的发酵培养基中发酵根据实施方案15-23中任一项所述的重组宿主，以及任选地回收所述甜菊醇或甜菊醇糖苷。

25.根据实施方案24的任一项所述的方法，其用于制备甜菊醇糖苷，其中所述方法以工业规模进行。

26.一种发酵液，其包含能够通过根据实施方案24或25所述的方法获得的甜菊醇糖苷。

27.通过根据实施方案24或25所述的方法获得的或从根据实施方案26所述的发酵液获得的甜菊醇糖苷。

28.一种组合物，其包含通过根据实施方案24或25所述的方法获得的或从根据实施方案26所述的发酵液获得的两种或更多种甜菊醇糖苷。

29.一种食品、饲料或饮料，其包含根据实施方案27的甜菊醇糖苷或根据实施方案28的组合物。

30.一种将第一甜菊醇糖苷转换为第二甜菊醇糖苷的方法，所述方法包括：

-使所述第一甜菊醇糖苷与根据实施方案15至23中任一项所述的重组宿主、源自所述重组宿主的无细胞提取物或源自两者之中任一的酶制剂接触；

-从而将第一甜菊醇糖苷转换为第二甜菊醇糖苷。

31.根据实施方案30所述的方法，其中所述第二甜菊醇糖苷是：甜菊醇-19-双糖苷、甜菊醇双糖苷、甜菊苷、13-[(β-D-吡喃葡萄糖基)氧基]贝壳杉烯-16-烯-18-油酸2-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖酯、RebA、RebE、RebD或RebM。

32.根据实施方案31所述的方法，其中，所述第一糖基化二萜是甜菊醇-13-单糖苷、甜菊醇-19-单糖苷、甜茶苷、甜菊苷、莱鲍迪甙A或13-[(β-D-吡喃葡萄糖基)氧基]贝壳杉烯-16-烯-18-油酸2-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖酯，并且所述第二糖基化二萜是甜菊醇-19-双糖苷、甜菊醇双糖苷、甜菊苷、13-[(β-D-吡喃葡萄糖基)氧基]贝壳杉烯-16-烯-18-油酸2-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖酯、RebA、RebE或RebD。

33.一种生产香叶基香叶基焦磷酸酯合酶的方法，所述方法包括在适于产生香叶基香叶基焦磷酸酯合酶的条件下培养根据实施方案15所述的宿主细胞，并且任选地，回收所述香叶基香叶基焦磷酸酯合酶。

34.一种产生根据实施方案1至14中任一项所述的GGPS多肽变体的方法，所述方法包括：

a)选择参考GGPS多肽；

c)任选地取代b)中定义的一个或多个其他氨基酸；

d)制备由步骤a)-c)得到的变体；

e)确定例如如实例中所述的变体的性质；并且

f)选择与参考GGPS多肽相比具有改变的性质的变体。

35.根据实施方案34所述的方法，其中，所述参考GGPS多肽具有SEQ ID NO：1中所示的序列。

在本文对专利文件或作为现有技术给出的其他材料的引用不应被认为承认该文件或材料是已知的或它包含的信息是任何这些权利要求的优先权日时公知常识的一部分。

在本文所述的每个参考文献的披露均通过引用以其全部内容并入本文。

本公开通过以下实施例来进一步说明：

实施例

概述

标准遗传技术(如在宿主细胞中过表达酶以及宿主细胞的另外遗传修饰)是本领域已知的方法，例如在Sambrook和Russel(2001)"Molecular Cloning:A LaboratoryManual(第3版),Cold Spring Harbor Laboratory,Cold Spring Harbor LaboratoryPress，或F.Ausubel等人编辑,"Current protocols in molecular biology",GreenPublishing and Wiley Interscience,New York(1987)中所描述的。用于真菌宿主细胞的转化和遗传修饰的方法从例如EP-A-0 635 574、WO 98/46772、WO 99/60102和WO 00/37671中获知。

实施例1：香叶基香叶基焦磷酸酯合酶

GGS的基因变体(参见下表2)以合成构建体的形式订购。通过使用II型限制酶将它们组装成含有强组成型启动子、GGS基因和终止子的表达盒。类似地，针对HYG(编码对潮霉素的抗性)构建表达盒。还构建了允许在Y.lipolytica中同源重组的整合侧翼。这些整合侧翼被称为5'INT3和3'INT3。不同部分含有50bp同源序列，以允许通过在S.cerevisiae同源重组进行装配。将这些部分与也含有两个50bp同源序列的线性化pRS417目的载体一起转化到S.cerevisiae中。在S.cerevisiae中组装后，表达途径由3'INT3、GGS表达盒、HYG表达盒、5'INT3组成。

表2.GGS基因变体

通过去除稀有密码子，针对在Yarrowia中表达优化所有GGS ORF。

从S.cerevisiae中分离含有所述表达途径的质粒，并对所述表达途径进行PCR扩增。将纯化的PCR产物转化至Y.lipolytica菌株ML15186。ML15186还仅用HYG表达盒转化。ML15186菌株已经具有生产甜菊醇糖苷和贝壳杉烯酸(KA)-糖苷的所有要素。该菌株的构建描述于国际专利申请号PCT/EP2016/058882(公布为WO2016/170045A1)中。

实施例2：糖基化贝壳杉烯酸和甜菊醇糖苷的产生

将用不同GGS变体转化的ML15186和作为对照的仅用HYG转化的的ML15186涂布在含有潮霉素的YPhD板上。获得单菌落分离物，并进行生产测试：作为预培养物，用来自含有潮霉素的YEPh-D琼脂板的菌落材料接种200μl含有葡萄糖的YEP。每个GGS变体使用9个重复培养物，并且HYG对照使用46个重复培养物。将预培养物在Infors培养箱中在30℃，750转每分钟和80％湿度下孵育48小时。使用40μl预培养物接种2.5ml含有葡萄糖作为碳源的矿物质培养基。将这些生产培养物在Infors培养箱中在30℃，500转每分钟，80％湿度下孵育120小时。通过以2750xg离心10分钟来沉淀生产培养物。离心后，将上清液转移并在33％乙腈中稀释，并使用LC/MS分析甜菊醇糖苷和相关产物。主要产物是RebA、RebB、甜菊苷、甜茶苷、甜菊醇-19-MS和(单-、二-和三-)糖基化贝壳杉烯酸。将每种GGS设计的产生水平(以摩尔计)的总和归一化并列于表3中。

表3.表达香叶基香叶基焦磷酸酯合酶的菌株中甜菊醇糖苷和KA-糖苷的产生

我们发现与对照(仅HYG和GGS野生型，SEQ ID NO：1)相比，使GGS变体0002至0008表达(SEQ ID NO：3、5、7、9、11、13和15)的转化体产生显著更高滴度的甜菊醇糖苷和KA-糖苷。与野生型(SEQ ID NO：1)相比，所有GGS变体(SEQ ID NO：3、5、7、9、11、13和15)显著更好，假发现率低于0.0005。

总之，我们发现仅添加野生型GGS(SEQ ID NO：1)的另外拷贝并没有改善产生，而添加变体(SEQ ID NO：3、5、7、9、11、13和15)之一显著改善了甜菊醇糖苷和KA-糖苷的产生。

序列表

<110> 帝斯曼知识产权资产管理有限公司

<120> 香叶基香叶基焦磷酸酯合酶

<130> 32211-WO-PCT

<160> 33

<170> PatentIn version 3.5

<210> 1

<211> 327

<212> PRT

<213> Yarrowia lipolytica

<400> 1

Met Asp Tyr Asn Ser Ala Asp Phe Lys Glu Ile Trp Gly Lys Ala Ala

1 5 10 15

Asp Thr Ala Leu Leu Gly Pro Tyr Asn Tyr Leu Ala Asn Asn Arg Gly

20 25 30

His Asn Ile Arg Glu His Leu Ile Ala Ala Phe Gly Ala Val Ile Lys

35 40 45

Val Asp Lys Ser Asp Leu Glu Thr Ile Ser His Ile Thr Lys Ile Leu

50 55 60

His Asn Ser Ser Leu Leu Val Asp Asp Val Glu Asp Asn Ser Met Leu

65 70 75 80

Arg Arg Gly Leu Pro Ala Ala His Cys Leu Phe Gly Val Pro Gln Thr

85 90 95

Ile Asn Ser Ala Asn Tyr Met Tyr Phe Val Ala Leu Gln Glu Val Leu

100 105 110

Lys Leu Lys Ser Tyr Asp Ala Val Ser Ile Phe Thr Glu Glu Met Ile

115 120 125

Asn Leu His Arg Gly Gln Gly Met Asp Leu Tyr Trp Arg Glu Thr Leu

130 135 140

Thr Cys Pro Ser Glu Asp Glu Tyr Leu Glu Met Val Val His Lys Thr

145 150 155 160

Gly Gly Leu Phe Arg Leu Ala Leu Arg Leu Met Leu Ser Val Ala Ser

165 170 175

Lys Gln Glu Asp His Glu Lys Ile Asn Phe Asp Leu Thr His Leu Thr

180 185 190

Asp Thr Leu Gly Val Ile Tyr Gln Ile Leu Asp Asp Tyr Leu Asn Leu

195 200 205

Gln Ser Thr Glu Leu Thr Glu Asn Lys Gly Phe Cys Glu Asp Ile Ser

210 215 220

Glu Gly Lys Phe Ser Phe Pro Leu Ile His Ser Ile Arg Thr Asn Pro

225 230 235 240

Asp Asn His Glu Ile Leu Asn Ile Leu Lys Gln Arg Thr Ser Asp Ala

245 250 255

Ser Leu Lys Lys Tyr Ala Val Asp Tyr Met Arg Thr Glu Thr Lys Ser

260 265 270

Phe Asp Tyr Cys Leu Lys Arg Ile Gln Ala Met Ser Leu Lys Ala Ser

275 280 285

Ser Tyr Ile Asp Asp Leu Ala Ala Ala Gly His Asp Val Ser Lys Leu

290 295 300

Arg Ala Ile Leu His Tyr Phe Val Ser Thr Ser Asp Cys Glu Glu Arg

305 310 315 320

Lys Tyr Phe Glu Asp Ala Gln

325

<210> 2

<211> 984

<212> DNA

<213> Yarrowia lipolytica

<400> 2

atggattata acagcgcgga tttcaaggag atctggggca aggccgccga caccgcgctg 60

ctgggaccgt acaactacct cgccaacaac cggggccaca acatcagaga acacttgatc 120

gcagcgttcg gagcggttat caaggtggac aagagcgatc tcgaaaccat ttcgcacatc 180

accaagattt tgcataactc gtcgctgctt gttgatgacg tggaagacaa ctcgatgctc 240

cgacgaggcc tgccggcagc ccattgtctg tttggagtcc cccaaaccat caactccgcc 300

aactacatgt actttgtggc tctgcaggag gtgctcaagc tcaagtctta tgatgccgtc 360

tccattttca ccgaggaaat gatcaacttg catagaggtc agggtatgga tctctactgg 420

agagaaacac tcacttgccc ctcggaagac gagtatctgg agatggtggt gcacaagacc 480

ggaggactgt ttcggctggc tctgagactt atgctgtcgg tggcatcgaa acaggaggac 540

catgaaaaga tcaactttga tctcacacac cttaccgaca cactgggagt catttaccag 600

attctggatg attacctcaa cctgcagtcc acggaattga ccgagaacaa gggattctgc 660

gaagatatca gcgaaggaaa gttttcgttt ccgctgattc acagcatccg gaccaacccg 720

gataaccacg agattctcaa cattctcaaa cagcgaacaa gcgacgcttc actcaaaaag 780

tacgccgtgg actacatgag aacagaaacc aagagtttcg actactgcct caagagaatc 840

caggccatgt cactcaaggc aagttcgtac attgatgatc tcgcagcagc cggccacgat 900

gtctccaagt tgcgagccat tttgcattat tttgtgtcca cctctgactg tgaggagaga 960

aagtactttg aggatgcgca gtaa 984

<210> 3

<211> 327

<212> PRT

<213> Artificial sequence

<220>

<223> GGS variant

<400> 3

Met Asp Tyr Asn Ser Ala Asp Phe Lys Glu Ile Trp Gly Lys Ala Ala

1 5 10 15

Asp Thr Ala Leu Leu Gly Pro Tyr Asn Tyr Leu Ala Asn Asn Arg Gly

20 25 30

His Asn Ile Arg Glu His Leu Ile Ala Ala Phe Gly Ala Val Ile Lys

35 40 45

Val Asp Lys Ser Asp Leu Glu Thr Ile Ser His Ile Thr Lys Ile Leu

50 55 60

His Asn Ser Ser Leu Leu Val Asp Asp Val Glu Asp Asn Ser Met Leu

65 70 75 80

Arg Arg Gly Leu Pro Ala Ala His Cys Leu Phe Glu Val Pro Gln Thr

85 90 95

Ile Asn Ser Ala Asn Tyr Met Tyr Phe Val Ala Leu Gln Glu Val Leu

100 105 110

Lys Leu Lys Ser Tyr Asp Ala Val Ser Ile Phe Thr Glu Glu Met Ile

115 120 125

Asn Leu His Arg Gly Gln Gly Met Asp Leu Tyr Trp Arg Glu Thr Leu

130 135 140

Thr Cys Pro Ser Glu Asp Glu Tyr Leu Glu Met Val Val His Lys Thr

145 150 155 160

Gly Gly Leu Phe Arg Leu Ala Leu Arg Leu Met Leu Ser Val Ala Ser

165 170 175

Lys Gln Glu Asp His Glu Lys Ile Asn Phe Asp Leu Thr His Leu Thr

180 185 190

Asp Thr Leu Gly Val Ile Tyr Gln Ile Leu Asp Asp Tyr Leu Asn Leu

195 200 205

Gln Ser Thr Glu Leu Thr Glu Asn Lys Gly Phe Cys Glu Asp Ile Ser

210 215 220

Glu Gly Lys Phe Ser Phe Pro Leu Ile His Ser Ile Arg Thr Asn Pro

225 230 235 240

Asp Asn His Glu Ile Leu Asn Ile Leu Lys Gln Arg Thr Ser Asp Ala

245 250 255

Ser Leu Lys Lys Tyr Ala Val Asp Tyr Met Arg Thr Glu Thr Lys Ser

260 265 270

Phe Asp Tyr Cys Leu Lys Arg Ile Gln Ala Met Ser Leu Lys Ala Ser

275 280 285

Ser Tyr Ile Asp Asp Leu Ala Ala Ala Gly His Asp Val Ser Lys Leu

290 295 300

Arg Ala Ile Leu His Tyr Phe Val Ser Thr Ser Asp Cys Glu Glu Arg

305 310 315 320

Lys Tyr Phe Glu Asp Ala Gln

325

<210> 4

<211> 984

<212> DNA

<213> Artificial sequence

<220>

<223> Coding sequence for variant GGS

<400> 4

atggattata acagcgcgga tttcaaggag atctggggca aggccgccga caccgcgctg 60

ctgggaccgt acaactacct cgccaacaac cggggccaca acatcagaga acacttgatc 120

gcagcgttcg gagcggttat caaggtggac aagagcgatc tcgaaaccat ttcgcacatc 180

accaagattt tgcataactc gtcgctgctt gttgatgacg tggaagacaa ctcgatgctc 240

cgacgaggcc tgccggcagc ccattgtctg tttgaagtcc cccaaaccat caactccgcc 300

aactacatgt actttgtggc tctgcaggag gtgctcaagc tcaagtctta tgatgccgtc 360

tccattttca ccgaggaaat gatcaacttg catagaggtc agggtatgga tctctactgg 420

agagaaacac tcacttgccc ctcggaagac gagtatctgg agatggtggt gcacaagacc 480

ggaggactgt ttcggctggc tctgagactt atgctgtcgg tggcatcgaa acaggaggac 540

catgaaaaga tcaactttga tctcacacac cttaccgaca cactgggagt catttaccag 600

attctggatg attacctcaa cctgcagtcc acggaattga ccgagaacaa gggattctgc 660

gaagatatca gcgaaggaaa gttttcgttt ccgctgattc acagcatccg gaccaacccg 720

gataaccacg agattctcaa cattctcaaa cagcgaacaa gcgacgcttc actcaaaaag 780

tacgccgtgg actacatgag aacagaaacc aagagtttcg actactgcct caagagaatc 840

caggccatgt cactcaaggc aagttcgtac attgatgatc tcgcagcagc cggccacgat 900

gtctccaagt tgcgagccat tttgcattat tttgtgtcca cctctgactg tgaggagaga 960

aagtactttg aggatgcgca gtaa 984

<210> 5

<211> 327

<212> PRT

<213> Artificial sequence

<220>

<223> Variant GGS

<400> 5

Met Asp Tyr Asn Ser Ala Asp Phe Lys Glu Ile Trp Gly Lys Ala Ala

1 5 10 15

Asp Thr Ala Leu Leu Gly Pro Tyr Asn Tyr Leu Ala Asn Asn Arg Gly

20 25 30

His Asn Ile Arg Glu His Leu Ile Ala Ala Phe Gly Ala Val Ile Lys

35 40 45

Val Asp Lys Ser Asp Leu Glu Thr Ile Ser His Ile Thr Lys Ile Leu

50 55 60

His Asn Ser Ser Leu Leu Val Asp Asp Val Glu Asp Asn Ser Met Leu

65 70 75 80

Arg Arg Gly Leu Pro Ala Ala His Cys Leu Phe Gly Val Pro Gln Thr

85 90 95

Ile Asn Ser Val Asn Tyr Met Tyr Phe Val Ala Leu Gln Glu Val Leu

100 105 110

Lys Leu Lys Ser Tyr Asp Ala Val Ser Ile Phe Thr Glu Glu Met Ile

115 120 125

Asn Leu His Arg Gly Gln Gly Met Asp Leu Tyr Trp Arg Glu Thr Leu

130 135 140

Thr Cys Pro Ser Glu Asp Glu Tyr Leu Glu Met Val Val His Lys Thr

145 150 155 160

Gly Gly Leu Phe Arg Leu Ala Leu Arg Leu Met Leu Ser Val Ala Ser

165 170 175

Lys Gln Glu Asp His Glu Lys Ile Asn Phe Asp Leu Thr His Leu Thr

180 185 190

Asp Thr Leu Gly Val Ile Tyr Gln Ile Leu Asp Asp Tyr Leu Asn Leu

195 200 205

Gln Ser Thr Glu Leu Thr Glu Asn Lys Gly Phe Cys Glu Asp Ile Ser

210 215 220

Glu Gly Lys Phe Ser Phe Pro Leu Ile His Ser Ile Arg Thr Asn Pro

225 230 235 240

Asp Asn His Glu Ile Leu Asn Ile Leu Lys Gln Arg Thr Ser Asp Ala

245 250 255

Ser Leu Lys Lys Tyr Ala Val Asp Tyr Met Arg Thr Glu Thr Lys Ser

260 265 270

Phe Asp Tyr Cys Leu Lys Arg Ile Gln Ala Met Ser Leu Lys Ala Ser

275 280 285

Ser Tyr Ile Asp Asp Leu Ala Ala Ala Gly His Asp Val Ser Lys Leu

290 295 300

Arg Ala Ile Leu His Tyr Phe Val Ser Thr Ser Asp Cys Glu Glu Arg

305 310 315 320

Lys Tyr Phe Glu Asp Ala Gln

325

<210> 6

<211> 984

<212> DNA

<213> Artificial sequence

<220>

<223> Coding sequence for variant GGS

<400> 6

atggattata acagcgcgga tttcaaggag atctggggca aggccgccga caccgcgctg 60

ctgggaccgt acaactacct cgccaacaac cggggccaca acatcagaga acacttgatc 120

gcagcgttcg gagcggttat caaggtggac aagagcgatc tcgaaaccat ttcgcacatc 180

accaagattt tgcataactc gtcgctgctt gttgatgacg tggaagacaa ctcgatgctc 240

cgacgaggcc tgccggcagc ccattgtctg tttggagtcc cccaaaccat caactccgtc 300

aactacatgt actttgtggc tctgcaggag gtgctcaagc tcaagtctta tgatgccgtc 360

tccattttca ccgaggaaat gatcaacttg catagaggtc agggtatgga tctctactgg 420

agagaaacac tcacttgccc ctcggaagac gagtatctgg agatggtggt gcacaagacc 480

ggaggactgt ttcggctggc tctgagactt atgctgtcgg tggcatcgaa acaggaggac 540

catgaaaaga tcaactttga tctcacacac cttaccgaca cactgggagt catttaccag 600

attctggatg attacctcaa cctgcagtcc acggaattga ccgagaacaa gggattctgc 660

gaagatatca gcgaaggaaa gttttcgttt ccgctgattc acagcatccg gaccaacccg 720

gataaccacg agattctcaa cattctcaaa cagcgaacaa gcgacgcttc actcaaaaag 780

tacgccgtgg actacatgag aacagaaacc aagagtttcg actactgcct caagagaatc 840

caggccatgt cactcaaggc aagttcgtac attgatgatc tcgcagcagc cggccacgat 900

gtctccaagt tgcgagccat tttgcattat tttgtgtcca cctctgactg tgaggagaga 960

aagtactttg aggatgcgca gtaa 984

<210> 7

<211> 327

<212> PRT

<213> Artificial sequence

<220>

<223> Variant GGS

<400> 7

Met Asp Tyr Asn Ser Ala Asp Phe Lys Glu Ile Trp Gly Lys Ala Ala

1 5 10 15

Asp Thr Ala Leu Leu Gly Pro Tyr Asn Tyr Leu Ala Asn Asn Arg Gly

20 25 30

His Asn Ile Arg Glu His Leu Ile Ala Ala Phe Gly Ala Val Ile Lys

35 40 45

Val Asp Lys Ser Asp Leu Glu Thr Ile Ser His Ile Thr Lys Ile Leu

50 55 60

His Asn Ser Ser Leu Leu Val Asp Asp Val Glu Asp Asn Ser Met Leu

65 70 75 80

Arg Arg Gly Leu Pro Ala Ala His Cys Leu Phe Gly Val Pro Gln Thr

85 90 95

Ile Asn Ser Ala Asn Tyr Met Tyr Phe Val Ala Leu Gln Glu Val Leu

100 105 110

Lys Leu Lys Ser Tyr Asp Ala Val Ser Ile Phe Thr Glu Glu Met Ile

115 120 125

Asn Leu His Arg Gly Gln Gly Met Asp Leu Tyr Trp Arg Glu Thr Leu

130 135 140

Thr Cys Pro Ser Glu Asp Glu Tyr Leu Glu Met Val Val His Lys Thr

145 150 155 160

Gly Gly Leu Phe Arg Leu Ala Leu Arg Leu Met Leu Ser Val Ala Ser

165 170 175

Lys Gln Glu Asp His Glu Lys Ile Asn Phe Asp Leu Thr His Leu Thr

180 185 190

Asp Thr Leu Gly Val Ile Tyr Gln Ile Leu Asp Asp Tyr Leu Asn Leu

195 200 205

Gln Ser Thr Glu Leu Thr Glu Asn Lys Gly Phe Cys Glu Asp Ile Ser

210 215 220

Glu Gly Lys Phe Ser Phe Pro Leu Ile His Asn Ile Arg Thr Asn Pro

225 230 235 240

Asp Asn His Glu Ile Leu Asn Ile Leu Lys Gln Arg Thr Ser Asp Ala

245 250 255

Ser Leu Lys Lys Tyr Ala Val Asp Tyr Met Arg Thr Glu Thr Lys Ser

260 265 270

Phe Asp Tyr Cys Leu Lys Arg Ile Gln Ala Met Ser Leu Lys Ala Ser

275 280 285

Ser Tyr Ile Asp Asp Leu Ala Ala Ala Gly His Asp Val Ser Lys Leu

290 295 300

Arg Ala Ile Leu His Tyr Phe Val Ser Thr Ser Asp Cys Glu Glu Arg

305 310 315 320

Lys Tyr Phe Glu Asp Ala Gln

325

<210> 8

<211> 984

<212> DNA

<213> Artificial sequence

<220>

<223> Coding sequence for GGS

<400> 8

atggattata acagcgcgga tttcaaggag atctggggca aggccgccga caccgcgctg 60

ctgggaccgt acaactacct cgccaacaac cggggccaca acatcagaga acacttgatc 120

gcagcgttcg gagcggttat caaggtggac aagagcgatc tcgaaaccat ttcgcacatc 180

accaagattt tgcataactc gtcgctgctt gttgatgacg tggaagacaa ctcgatgctc 240

cgacgaggcc tgccggcagc ccattgtctg tttggagtcc cccaaaccat caactccgcc 300

aactacatgt actttgtggc tctgcaggag gtgctcaagc tcaagtctta tgatgccgtc 360

tccattttca ccgaggaaat gatcaacttg catagaggtc agggtatgga tctctactgg 420

agagaaacac tcacttgccc ctcggaagac gagtatctgg agatggtggt gcacaagacc 480

ggaggactgt ttcggctggc tctgagactt atgctgtcgg tggcatcgaa acaggaggac 540

catgaaaaga tcaactttga tctcacacac cttaccgaca cactgggagt catttaccag 600

attctggatg attacctcaa cctgcagtcc acggaattga ccgagaacaa gggattctgc 660

gaagatatca gcgaaggaaa gttttcgttt ccgctgattc acaacatccg gaccaacccg 720

gataaccacg agattctcaa cattctcaaa cagcgaacaa gcgacgcttc actcaaaaag 780

tacgccgtgg actacatgag aacagaaacc aagagtttcg actactgcct caagagaatc 840

caggccatgt cactcaaggc aagttcgtac attgatgatc tcgcagcagc cggccacgat 900

gtctccaagt tgcgagccat tttgcattat tttgtgtcca cctctgactg tgaggagaga 960

aagtactttg aggatgcgca gtaa 984

<210> 9

<211> 327

<212> PRT

<213> Artificial sequence

<220>

<223> Variant GGS

<400> 9

Met Asp Tyr Asn Ser Ala Asp Phe Lys Glu Ile Trp Gly Lys Ala Ala

1 5 10 15

Asp Thr Ala Leu Leu Gly Pro Tyr Asn Tyr Leu Ala Asn Asn Arg Gly

20 25 30

His Asn Ile Arg Glu His Leu Ile Ala Ala Phe Gly Ala Val Ile Lys

35 40 45

Val Asp Lys Ser Asp Leu Glu Thr Ile Ser His Ile Thr Lys Ile Leu

50 55 60

His Asn Ser Ser Leu Leu Val Asp Asp Val Glu Asp Asn Ser Met Leu

65 70 75 80

Arg Arg Gly Leu Pro Ala Ala His Cys Leu Phe Glu Val Pro Gln Thr

85 90 95

Ile Asn Ser Val Asn Tyr Met Tyr Phe Val Ala Leu Gln Glu Val Leu

100 105 110

Lys Leu Lys Ser Tyr Asp Ala Val Ser Ile Phe Thr Glu Glu Met Ile

115 120 125

Asn Leu His Arg Gly Gln Gly Met Asp Leu Tyr Trp Arg Glu Thr Leu

130 135 140

Thr Cys Pro Ser Glu Asp Glu Tyr Leu Glu Met Val Val His Lys Thr

145 150 155 160

Gly Gly Leu Phe Arg Leu Ala Leu Arg Leu Met Leu Ser Val Ala Ser

165 170 175

Lys Gln Glu Asp His Glu Lys Ile Asn Phe Asp Leu Thr His Leu Thr

180 185 190

Asp Thr Leu Gly Val Ile Tyr Gln Ile Leu Asp Asp Tyr Leu Asn Leu

195 200 205

Gln Ser Thr Glu Leu Thr Glu Asn Lys Gly Phe Cys Glu Asp Ile Ser

210 215 220

Glu Gly Lys Phe Ser Phe Pro Leu Ile His Ser Ile Arg Thr Asn Pro

225 230 235 240

Asp Asn His Glu Ile Leu Asn Ile Leu Lys Gln Arg Thr Ser Asp Ala

245 250 255

Ser Leu Lys Lys Tyr Ala Val Asp Tyr Met Arg Thr Glu Thr Lys Ser

260 265 270

Phe Asp Tyr Cys Leu Lys Arg Ile Gln Ala Met Ser Leu Lys Ala Ser

275 280 285

Ser Tyr Ile Asp Asp Leu Ala Ala Ala Gly His Asp Val Ser Lys Leu

290 295 300

Arg Ala Ile Leu His Tyr Phe Val Ser Thr Ser Asp Cys Glu Glu Arg

305 310 315 320

Lys Tyr Phe Glu Asp Ala Gln

325

<210> 10

<211> 984

<212> DNA

<213> Artificial sequence

<220>

<223> Coding sequence for variant GGS

<400> 10

atggattata acagcgcgga tttcaaggag atctggggca aggccgccga caccgcgctg 60

ctgggaccgt acaactacct cgccaacaac cggggccaca acatcagaga acacttgatc 120

gcagcgttcg gagcggttat caaggtggac aagagcgatc tcgaaaccat ttcgcacatc 180

accaagattt tgcataactc gtcgctgctt gttgatgacg tggaagacaa ctcgatgctc 240

cgacgaggcc tgccggcagc ccattgtctg tttgaagtcc cccaaaccat caactccgtc 300

aactacatgt actttgtggc tctgcaggag gtgctcaagc tcaagtctta tgatgccgtc 360

tccattttca ccgaggaaat gatcaacttg catagaggtc agggtatgga tctctactgg 420

agagaaacac tcacttgccc ctcggaagac gagtatctgg agatggtggt gcacaagacc 480

ggaggactgt ttcggctggc tctgagactt atgctgtcgg tggcatcgaa acaggaggac 540

catgaaaaga tcaactttga tctcacacac cttaccgaca cactgggagt catttaccag 600

attctggatg attacctcaa cctgcagtcc acggaattga ccgagaacaa gggattctgc 660

gaagatatca gcgaaggaaa gttttcgttt ccgctgattc acagcatccg gaccaacccg 720

gataaccacg agattctcaa cattctcaaa cagcgaacaa gcgacgcttc actcaaaaag 780

tacgccgtgg actacatgag aacagaaacc aagagtttcg actactgcct caagagaatc 840

caggccatgt cactcaaggc aagttcgtac attgatgatc tcgcagcagc cggccacgat 900

gtctccaagt tgcgagccat tttgcattat tttgtgtcca cctctgactg tgaggagaga 960

aagtactttg aggatgcgca gtaa 984

<210> 11

<211> 327

<212> PRT

<213> Artificial sequence

<220>

<223> Variant GGS

<400> 11

Met Asp Tyr Asn Ser Ala Asp Phe Lys Glu Ile Trp Gly Lys Ala Ala

1 5 10 15

Asp Thr Ala Leu Leu Gly Pro Tyr Asn Tyr Leu Ala Asn Asn Arg Gly

20 25 30

His Asn Ile Arg Glu His Leu Ile Ala Ala Phe Gly Ala Val Ile Lys

35 40 45

Val Asp Lys Ser Asp Leu Glu Thr Ile Ser His Ile Thr Lys Ile Leu

50 55 60

His Asn Ser Ser Leu Leu Val Asp Asp Val Glu Asp Asn Ser Met Leu

65 70 75 80

Arg Arg Gly Leu Pro Ala Ala His Cys Leu Phe Glu Val Pro Gln Thr

85 90 95

Ile Asn Ser Ala Asn Tyr Met Tyr Phe Val Ala Leu Gln Glu Val Leu

100 105 110

Lys Leu Lys Ser Tyr Asp Ala Val Ser Ile Phe Thr Glu Glu Met Ile

115 120 125

Asn Leu His Arg Gly Gln Gly Met Asp Leu Tyr Trp Arg Glu Thr Leu

130 135 140

Thr Cys Pro Ser Glu Asp Glu Tyr Leu Glu Met Val Val His Lys Thr

145 150 155 160

Gly Gly Leu Phe Arg Leu Ala Leu Arg Leu Met Leu Ser Val Ala Ser

165 170 175

Lys Gln Glu Asp His Glu Lys Ile Asn Phe Asp Leu Thr His Leu Thr

180 185 190

Asp Thr Leu Gly Val Ile Tyr Gln Ile Leu Asp Asp Tyr Leu Asn Leu

195 200 205

Gln Ser Thr Glu Leu Thr Glu Asn Lys Gly Phe Cys Glu Asp Ile Ser

210 215 220

Glu Gly Lys Phe Ser Phe Pro Leu Ile His Asn Ile Arg Thr Asn Pro

225 230 235 240

Asp Asn His Glu Ile Leu Asn Ile Leu Lys Gln Arg Thr Ser Asp Ala

245 250 255

Ser Leu Lys Lys Tyr Ala Val Asp Tyr Met Arg Thr Glu Thr Lys Ser

260 265 270

Phe Asp Tyr Cys Leu Lys Arg Ile Gln Ala Met Ser Leu Lys Ala Ser

275 280 285

Ser Tyr Ile Asp Asp Leu Ala Ala Ala Gly His Asp Val Ser Lys Leu

290 295 300

Arg Ala Ile Leu His Tyr Phe Val Ser Thr Ser Asp Cys Glu Glu Arg

305 310 315 320

Lys Tyr Phe Glu Asp Ala Gln

325

<210> 12

<211> 984

<212> DNA

<213> Artificial sequence

<220>

<223> Coding sequence for variant GGS

<400> 12

atggattata acagcgcgga tttcaaggag atctggggca aggccgccga caccgcgctg 60

ctgggaccgt acaactacct cgccaacaac cggggccaca acatcagaga acacttgatc 120

gcagcgttcg gagcggttat caaggtggac aagagcgatc tcgaaaccat ttcgcacatc 180

accaagattt tgcataactc gtcgctgctt gttgatgacg tggaagacaa ctcgatgctc 240

cgacgaggcc tgccggcagc ccattgtctg tttgaagtcc cccaaaccat caactccgcc 300

aactacatgt actttgtggc tctgcaggag gtgctcaagc tcaagtctta tgatgccgtc 360

tccattttca ccgaggaaat gatcaacttg catagaggtc agggtatgga tctctactgg 420

agagaaacac tcacttgccc ctcggaagac gagtatctgg agatggtggt gcacaagacc 480

ggaggactgt ttcggctggc tctgagactt atgctgtcgg tggcatcgaa acaggaggac 540

catgaaaaga tcaactttga tctcacacac cttaccgaca cactgggagt catttaccag 600

attctggatg attacctcaa cctgcagtcc acggaattga ccgagaacaa gggattctgc 660

gaagatatca gcgaaggaaa gttttcgttt ccgctgattc acaacatccg gaccaacccg 720

gataaccacg agattctcaa cattctcaaa cagcgaacaa gcgacgcttc actcaaaaag 780

tacgccgtgg actacatgag aacagaaacc aagagtttcg actactgcct caagagaatc 840

caggccatgt cactcaaggc aagttcgtac attgatgatc tcgcagcagc cggccacgat 900

gtctccaagt tgcgagccat tttgcattat tttgtgtcca cctctgactg tgaggagaga 960

aagtactttg aggatgcgca gtaa 984

<210> 13

<211> 327

<212> PRT

<213> Artificial sequence

<220>

<223> Variant GGS

<400> 13

Met Asp Tyr Asn Ser Ala Asp Phe Lys Glu Ile Trp Gly Lys Ala Ala

1 5 10 15

Asp Thr Ala Leu Leu Gly Pro Tyr Asn Tyr Leu Ala Asn Asn Arg Gly

20 25 30

His Asn Ile Arg Glu His Leu Ile Ala Ala Phe Gly Ala Val Ile Lys

35 40 45

Val Asp Lys Ser Asp Leu Glu Thr Ile Ser His Ile Thr Lys Ile Leu

50 55 60

His Asn Ser Ser Leu Leu Val Asp Asp Val Glu Asp Asn Ser Met Leu

65 70 75 80

Arg Arg Gly Leu Pro Ala Ala His Cys Leu Phe Gly Val Pro Gln Thr

85 90 95

Ile Asn Ser Val Asn Tyr Met Tyr Phe Val Ala Leu Gln Glu Val Leu

100 105 110

Lys Leu Lys Ser Tyr Asp Ala Val Ser Ile Phe Thr Glu Glu Met Ile

115 120 125

Asn Leu His Arg Gly Gln Gly Met Asp Leu Tyr Trp Arg Glu Thr Leu

130 135 140

Thr Cys Pro Ser Glu Asp Glu Tyr Leu Glu Met Val Val His Lys Thr

145 150 155 160

Gly Gly Leu Phe Arg Leu Ala Leu Arg Leu Met Leu Ser Val Ala Ser

165 170 175

Lys Gln Glu Asp His Glu Lys Ile Asn Phe Asp Leu Thr His Leu Thr

180 185 190

Asp Thr Leu Gly Val Ile Tyr Gln Ile Leu Asp Asp Tyr Leu Asn Leu

195 200 205

Gln Ser Thr Glu Leu Thr Glu Asn Lys Gly Phe Cys Glu Asp Ile Ser

210 215 220

Glu Gly Lys Phe Ser Phe Pro Leu Ile His Asn Ile Arg Thr Asn Pro

225 230 235 240

Asp Asn His Glu Ile Leu Asn Ile Leu Lys Gln Arg Thr Ser Asp Ala

245 250 255

Ser Leu Lys Lys Tyr Ala Val Asp Tyr Met Arg Thr Glu Thr Lys Ser

260 265 270

Phe Asp Tyr Cys Leu Lys Arg Ile Gln Ala Met Ser Leu Lys Ala Ser

275 280 285

Ser Tyr Ile Asp Asp Leu Ala Ala Ala Gly His Asp Val Ser Lys Leu

290 295 300

Arg Ala Ile Leu His Tyr Phe Val Ser Thr Ser Asp Cys Glu Glu Arg

305 310 315 320

Lys Tyr Phe Glu Asp Ala Gln

325

<210> 14

<211> 984

<212> DNA

<213> Artificial sequence

<220>

<223> Coding sequence for GGS

<400> 14

atggattata acagcgcgga tttcaaggag atctggggca aggccgccga caccgcgctg 60

ctgggaccgt acaactacct cgccaacaac cggggccaca acatcagaga acacttgatc 120

gcagcgttcg gagcggttat caaggtggac aagagcgatc tcgaaaccat ttcgcacatc 180

accaagattt tgcataactc gtcgctgctt gttgatgacg tggaagacaa ctcgatgctc 240

cgacgaggcc tgccggcagc ccattgtctg tttggagtcc cccaaaccat caactccgtc 300

aactacatgt actttgtggc tctgcaggag gtgctcaagc tcaagtctta tgatgccgtc 360

tccattttca ccgaggaaat gatcaacttg catagaggtc agggtatgga tctctactgg 420

agagaaacac tcacttgccc ctcggaagac gagtatctgg agatggtggt gcacaagacc 480

ggaggactgt ttcggctggc tctgagactt atgctgtcgg tggcatcgaa acaggaggac 540

catgaaaaga tcaactttga tctcacacac cttaccgaca cactgggagt catttaccag 600

attctggatg attacctcaa cctgcagtcc acggaattga ccgagaacaa gggattctgc 660

gaagatatca gcgaaggaaa gttttcgttt ccgctgattc acaacatccg gaccaacccg 720

gataaccacg agattctcaa cattctcaaa cagcgaacaa gcgacgcttc actcaaaaag 780

tacgccgtgg actacatgag aacagaaacc aagagtttcg actactgcct caagagaatc 840

caggccatgt cactcaaggc aagttcgtac attgatgatc tcgcagcagc cggccacgat 900

gtctccaagt tgcgagccat tttgcattat tttgtgtcca cctctgactg tgaggagaga 960

aagtactttg aggatgcgca gtaa 984

<210> 15

<211> 327

<212> PRT

<213> Artificial sequence

<220>

<223> Variant GGS

<400> 15

Met Asp Tyr Asn Ser Ala Asp Phe Lys Glu Ile Trp Gly Lys Ala Ala

1 5 10 15

Asp Thr Ala Leu Leu Gly Pro Tyr Asn Tyr Leu Ala Asn Asn Arg Gly

20 25 30

His Asn Ile Arg Glu His Leu Ile Ala Ala Phe Gly Ala Val Ile Lys

35 40 45

Val Asp Lys Ser Asp Leu Glu Thr Ile Ser His Ile Thr Lys Ile Leu

50 55 60

His Asn Ser Ser Leu Leu Val Asp Asp Val Glu Asp Asn Ser Met Leu

65 70 75 80

Arg Arg Gly Leu Pro Ala Ala His Cys Leu Phe Glu Val Pro Gln Thr

85 90 95

Ile Asn Ser Val Asn Tyr Met Tyr Phe Val Ala Leu Gln Glu Val Leu

100 105 110

Lys Leu Lys Ser Tyr Asp Ala Val Ser Ile Phe Thr Glu Glu Met Ile

115 120 125

Asn Leu His Arg Gly Gln Gly Met Asp Leu Tyr Trp Arg Glu Thr Leu

130 135 140

Thr Cys Pro Ser Glu Asp Glu Tyr Leu Glu Met Val Val His Lys Thr

145 150 155 160

Gly Gly Leu Phe Arg Leu Ala Leu Arg Leu Met Leu Ser Val Ala Ser

165 170 175

Lys Gln Glu Asp His Glu Lys Ile Asn Phe Asp Leu Thr His Leu Thr

180 185 190

Asp Thr Leu Gly Val Ile Tyr Gln Ile Leu Asp Asp Tyr Leu Asn Leu

195 200 205

Gln Ser Thr Glu Leu Thr Glu Asn Lys Gly Phe Cys Glu Asp Ile Ser

210 215 220

Glu Gly Lys Phe Ser Phe Pro Leu Ile His Asn Ile Arg Thr Asn Pro

225 230 235 240

Asp Asn His Glu Ile Leu Asn Ile Leu Lys Gln Arg Thr Ser Asp Ala

245 250 255

Ser Leu Lys Lys Tyr Ala Val Asp Tyr Met Arg Thr Glu Thr Lys Ser

260 265 270

Phe Asp Tyr Cys Leu Lys Arg Ile Gln Ala Met Ser Leu Lys Ala Ser

275 280 285

Ser Tyr Ile Asp Asp Leu Ala Ala Ala Gly His Asp Val Ser Lys Leu

290 295 300

Arg Ala Ile Leu His Tyr Phe Val Ser Thr Ser Asp Cys Glu Glu Arg

305 310 315 320

Lys Tyr Phe Glu Asp Ala Gln

325

<210> 16

<211> 984

<212> DNA

<213> Artificial sequence

<220>

<223> Coding sequence for variant GGS

<400> 16

atggattata acagcgcgga tttcaaggag atctggggca aggccgccga caccgcgctg 60

ctgggaccgt acaactacct cgccaacaac cggggccaca acatcagaga acacttgatc 120

gcagcgttcg gagcggttat caaggtggac aagagcgatc tcgaaaccat ttcgcacatc 180

accaagattt tgcataactc gtcgctgctt gttgatgacg tggaagacaa ctcgatgctc 240

cgacgaggcc tgccggcagc ccattgtctg tttgaagtcc cccaaaccat caactccgtc 300

aactacatgt actttgtggc tctgcaggag gtgctcaagc tcaagtctta tgatgccgtc 360

tccattttca ccgaggaaat gatcaacttg catagaggtc agggtatgga tctctactgg 420

agagaaacac tcacttgccc ctcggaagac gagtatctgg agatggtggt gcacaagacc 480

ggaggactgt ttcggctggc tctgagactt atgctgtcgg tggcatcgaa acaggaggac 540

catgaaaaga tcaactttga tctcacacac cttaccgaca cactgggagt catttaccag 600

attctggatg attacctcaa cctgcagtcc acggaattga ccgagaacaa gggattctgc 660

gaagatatca gcgaaggaaa gttttcgttt ccgctgattc acaacatccg gaccaacccg 720

gataaccacg agattctcaa cattctcaaa cagcgaacaa gcgacgcttc actcaaaaag 780

tacgccgtgg actacatgag aacagaaacc aagagtttcg actactgcct caagagaatc 840

caggccatgt cactcaaggc aagttcgtac attgatgatc tcgcagcagc cggccacgat 900

gtctccaagt tgcgagccat tttgcattat tttgtgtcca cctctgactg tgaggagaga 960

aagtactttg aggatgcgca gtaa 984

<210> 17

<211> 303

<212> PRT

<213> Mucor circinelloides

<400> 17

Met Leu Asn Ser His Asn Arg Thr Glu Glu Arg Ser Thr Glu Asp Ile

1 5 10 15

Ile Leu Glu Pro Tyr Thr Tyr Leu Ile Ser Gln Pro Gly Lys Asp Ile

20 25 30

Arg Ala Lys Leu Ile Ser Ala Phe Asp Leu Trp Leu His Val Pro Lys

35 40 45

Asp Val Leu Cys Val Ile Asn Lys Ile Ile Gly Met Leu His Asn Ala

50 55 60

Ser Leu Met Ile Asp Asp Val Gln Asp Asp Ser Asp Leu Arg Arg Gly

65 70 75 80

Val Pro Val Ala His His Ile Tyr Gly Val Pro Gln Thr Ile Asn Thr

85 90 95

Ala Asn Tyr Val Ile Phe Leu Ala Leu Gln Glu Val Met Lys Leu Asn

100 105 110

Ile Pro Ser Met Met Gln Val Cys Thr Glu Glu Leu Ile Asn Leu His

115 120 125

Arg Gly Gln Gly Ile Glu Leu Tyr Trp Arg Asp Ser Leu Thr Cys Pro

130 135 140

Thr Glu Glu Glu Tyr Ile Asp Met Val Asn Asn Lys Thr Ser Gly Leu

145 150 155 160

Leu Arg Leu Ala Val Arg Leu Met Gln Ala Ala Ser Glu Ser Asp Ile

165 170 175

Asp Tyr Thr Pro Leu Val Asn Ile Ile Gly Ile His Phe Gln Val Arg

180 185 190

Asp Asp Tyr Met Asn Leu Gln Ser Thr Ser Tyr Thr Asn Asn Lys Gly

195 200 205

Phe Cys Glu Asp Leu Thr Glu Gly Lys Phe Ser Phe Pro Ile Ile His

210 215 220

Ala Ile Arg Lys Asp Pro Ser Asn Arg Gln Leu Leu Asn Ile Ile Ser

225 230 235 240

Gln Lys Pro Thr Ser Ile Glu Val Lys Lys Tyr Ala Leu Glu Val Ile

245 250 255

Arg Lys Ala Gly Ser Phe Glu Tyr Val Arg Glu Phe Leu Arg Gln Lys

260 265 270

Glu Ala Glu Ser Leu Lys Glu Ile Lys Arg Leu Gly Gly Asn Pro Leu

275 280 285

Leu Glu Lys Tyr Ile Glu Thr Ile Arg Val Glu Ala Thr Asn Asp

290 295 300

<210> 18

<211> 327

<212> PRT

<213> Artificial sequence

<220>

<223> GGS variant

<400> 18

Met Asp Tyr Asn Ser Ala Asp Phe Lys Glu Ile Trp Gly Lys Ala Ala

1 5 10 15

Asp Thr Ala Leu Leu Gly Pro Tyr Asn Tyr Leu Ala Asn Asn Arg Gly

20 25 30

His Asn Ile Arg Glu His Leu Ile Ala Ala Phe Gly Ala Val Ile Lys

35 40 45

Val Asp Lys Ser Asp Leu Glu Thr Ile Ser His Ile Thr Lys Ile Leu

50 55 60

His Asn Ser Ser Leu Leu Val Asp Asp Val Glu Asp Asn Ser Met Leu

65 70 75 80

Arg Arg Gly Leu Pro Ala Ala His Cys Leu Phe Asp Val Pro Gln Thr

85 90 95

Ile Asn Ser Ala Asn Tyr Met Tyr Phe Val Ala Leu Gln Glu Val Leu

100 105 110

Lys Leu Lys Ser Tyr Asp Ala Val Ser Ile Phe Thr Glu Glu Met Ile

115 120 125

Asn Leu His Arg Gly Gln Gly Met Asp Leu Tyr Trp Arg Glu Thr Leu

130 135 140

Thr Cys Pro Ser Glu Asp Glu Tyr Leu Glu Met Val Val His Lys Thr

145 150 155 160

Gly Gly Leu Phe Arg Leu Ala Leu Arg Leu Met Leu Ser Val Ala Ser

165 170 175

Lys Gln Glu Asp His Glu Lys Ile Asn Phe Asp Leu Thr His Leu Thr

180 185 190

Asp Thr Leu Gly Val Ile Tyr Gln Ile Leu Asp Asp Tyr Leu Asn Leu

195 200 205

Gln Ser Thr Glu Leu Thr Glu Asn Lys Gly Phe Cys Glu Asp Ile Ser

210 215 220

Glu Gly Lys Phe Ser Phe Pro Leu Ile His Ser Ile Arg Thr Asn Pro

225 230 235 240

Asp Asn His Glu Ile Leu Asn Ile Leu Lys Gln Arg Thr Ser Asp Ala

245 250 255

Ser Leu Lys Lys Tyr Ala Val Asp Tyr Met Arg Thr Glu Thr Lys Ser

260 265 270

Phe Asp Tyr Cys Leu Lys Arg Ile Gln Ala Met Ser Leu Lys Ala Ser

275 280 285

Ser Tyr Ile Asp Asp Leu Ala Ala Ala Gly His Asp Val Ser Lys Leu

290 295 300

Arg Ala Ile Leu His Tyr Phe Val Ser Thr Ser Asp Cys Glu Glu Arg

305 310 315 320

Lys Tyr Phe Glu Asp Ala Gln

325

<210> 19

<211> 327

<212> PRT

<213> Artificial sequence

<220>

<223> GGS variant

<400> 19

Met Asp Tyr Asn Ser Ala Asp Phe Lys Glu Ile Trp Gly Lys Ala Ala

1 5 10 15

Asp Thr Ala Leu Leu Gly Pro Tyr Asn Tyr Leu Ala Asn Asn Arg Gly

20 25 30

His Asn Ile Arg Glu His Leu Ile Ala Ala Phe Gly Ala Val Ile Lys

35 40 45

Val Asp Lys Ser Asp Leu Glu Thr Ile Ser His Ile Thr Lys Ile Leu

50 55 60

His Asn Ser Ser Leu Leu Val Asp Asp Val Glu Asp Asn Ser Met Leu

65 70 75 80

Arg Arg Gly Leu Pro Ala Ala His Cys Leu Phe Asn Val Pro Gln Thr

85 90 95

Ile Asn Ser Ala Asn Tyr Met Tyr Phe Val Ala Leu Gln Glu Val Leu

100 105 110

Lys Leu Lys Ser Tyr Asp Ala Val Ser Ile Phe Thr Glu Glu Met Ile

115 120 125

Asn Leu His Arg Gly Gln Gly Met Asp Leu Tyr Trp Arg Glu Thr Leu

130 135 140

Thr Cys Pro Ser Glu Asp Glu Tyr Leu Glu Met Val Val His Lys Thr

145 150 155 160

Gly Gly Leu Phe Arg Leu Ala Leu Arg Leu Met Leu Ser Val Ala Ser

165 170 175

Lys Gln Glu Asp His Glu Lys Ile Asn Phe Asp Leu Thr His Leu Thr

180 185 190

Asp Thr Leu Gly Val Ile Tyr Gln Ile Leu Asp Asp Tyr Leu Asn Leu

195 200 205

Gln Ser Thr Glu Leu Thr Glu Asn Lys Gly Phe Cys Glu Asp Ile Ser

210 215 220

Glu Gly Lys Phe Ser Phe Pro Leu Ile His Ser Ile Arg Thr Asn Pro

225 230 235 240

Asp Asn His Glu Ile Leu Asn Ile Leu Lys Gln Arg Thr Ser Asp Ala

245 250 255

Ser Leu Lys Lys Tyr Ala Val Asp Tyr Met Arg Thr Glu Thr Lys Ser

260 265 270

Phe Asp Tyr Cys Leu Lys Arg Ile Gln Ala Met Ser Leu Lys Ala Ser

275 280 285

Ser Tyr Ile Asp Asp Leu Ala Ala Ala Gly His Asp Val Ser Lys Leu

290 295 300

Arg Ala Ile Leu His Tyr Phe Val Ser Thr Ser Asp Cys Glu Glu Arg

305 310 315 320

Lys Tyr Phe Glu Asp Ala Gln

325

<210> 20

<211> 327

<212> PRT

<213> Artificial sequence

<220>

<223> GGS variant

<400> 20

Met Asp Tyr Asn Ser Ala Asp Phe Lys Glu Ile Trp Gly Lys Ala Ala

1 5 10 15

Asp Thr Ala Leu Leu Gly Pro Tyr Asn Tyr Leu Ala Asn Asn Arg Gly

20 25 30

His Asn Ile Arg Glu His Leu Ile Ala Ala Phe Gly Ala Val Ile Lys

35 40 45

Val Asp Lys Ser Asp Leu Glu Thr Ile Ser His Ile Thr Lys Ile Leu

50 55 60

His Asn Ser Ser Leu Leu Val Asp Asp Val Glu Asp Asn Ser Met Leu

65 70 75 80

Arg Arg Gly Leu Pro Ala Ala His Cys Leu Phe Gln Val Pro Gln Thr

85 90 95

Ile Asn Ser Ala Asn Tyr Met Tyr Phe Val Ala Leu Gln Glu Val Leu

100 105 110

Lys Leu Lys Ser Tyr Asp Ala Val Ser Ile Phe Thr Glu Glu Met Ile

115 120 125

Asn Leu His Arg Gly Gln Gly Met Asp Leu Tyr Trp Arg Glu Thr Leu

130 135 140

Thr Cys Pro Ser Glu Asp Glu Tyr Leu Glu Met Val Val His Lys Thr

145 150 155 160

Gly Gly Leu Phe Arg Leu Ala Leu Arg Leu Met Leu Ser Val Ala Ser

165 170 175

Lys Gln Glu Asp His Glu Lys Ile Asn Phe Asp Leu Thr His Leu Thr

180 185 190

Asp Thr Leu Gly Val Ile Tyr Gln Ile Leu Asp Asp Tyr Leu Asn Leu

195 200 205

Gln Ser Thr Glu Leu Thr Glu Asn Lys Gly Phe Cys Glu Asp Ile Ser

210 215 220

Glu Gly Lys Phe Ser Phe Pro Leu Ile His Ser Ile Arg Thr Asn Pro

225 230 235 240

Asp Asn His Glu Ile Leu Asn Ile Leu Lys Gln Arg Thr Ser Asp Ala

245 250 255

Ser Leu Lys Lys Tyr Ala Val Asp Tyr Met Arg Thr Glu Thr Lys Ser

260 265 270

Phe Asp Tyr Cys Leu Lys Arg Ile Gln Ala Met Ser Leu Lys Ala Ser

275 280 285

Ser Tyr Ile Asp Asp Leu Ala Ala Ala Gly His Asp Val Ser Lys Leu

290 295 300

Arg Ala Ile Leu His Tyr Phe Val Ser Thr Ser Asp Cys Glu Glu Arg

305 310 315 320

Lys Tyr Phe Glu Asp Ala Gln

325

<210> 21

<211> 327

<212> PRT

<213> Artificial sequence

<220>

<223> GGS variant

<400> 21

Met Asp Tyr Asn Ser Ala Asp Phe Lys Glu Ile Trp Gly Lys Ala Ala

1 5 10 15

Asp Thr Ala Leu Leu Gly Pro Tyr Asn Tyr Leu Ala Asn Asn Arg Gly

20 25 30

His Asn Ile Arg Glu His Leu Ile Ala Ala Phe Gly Ala Val Ile Lys

35 40 45

Val Asp Lys Ser Asp Leu Glu Thr Ile Ser His Ile Thr Lys Ile Leu

50 55 60

His Asn Ser Ser Leu Leu Val Asp Asp Val Glu Asp Asn Ser Met Leu

65 70 75 80

Arg Arg Gly Leu Pro Ala Ala His Cys Leu Phe Gly Val Pro Gln Thr

85 90 95

Ile Asn Ser Gly Asn Tyr Met Tyr Phe Val Ala Leu Gln Glu Val Leu

100 105 110

Lys Leu Lys Ser Tyr Asp Ala Val Ser Ile Phe Thr Glu Glu Met Ile

115 120 125

Asn Leu His Arg Gly Gln Gly Met Asp Leu Tyr Trp Arg Glu Thr Leu

130 135 140

Thr Cys Pro Ser Glu Asp Glu Tyr Leu Glu Met Val Val His Lys Thr

145 150 155 160

Gly Gly Leu Phe Arg Leu Ala Leu Arg Leu Met Leu Ser Val Ala Ser

165 170 175

Lys Gln Glu Asp His Glu Lys Ile Asn Phe Asp Leu Thr His Leu Thr

180 185 190

Asp Thr Leu Gly Val Ile Tyr Gln Ile Leu Asp Asp Tyr Leu Asn Leu

195 200 205

Gln Ser Thr Glu Leu Thr Glu Asn Lys Gly Phe Cys Glu Asp Ile Ser

210 215 220

Glu Gly Lys Phe Ser Phe Pro Leu Ile His Ser Ile Arg Thr Asn Pro

225 230 235 240

Asp Asn His Glu Ile Leu Asn Ile Leu Lys Gln Arg Thr Ser Asp Ala

245 250 255

Ser Leu Lys Lys Tyr Ala Val Asp Tyr Met Arg Thr Glu Thr Lys Ser

260 265 270

Phe Asp Tyr Cys Leu Lys Arg Ile Gln Ala Met Ser Leu Lys Ala Ser

275 280 285

Ser Tyr Ile Asp Asp Leu Ala Ala Ala Gly His Asp Val Ser Lys Leu

290 295 300

Arg Ala Ile Leu His Tyr Phe Val Ser Thr Ser Asp Cys Glu Glu Arg

305 310 315 320

Lys Tyr Phe Glu Asp Ala Gln

325

<210> 22

<211> 327

<212> PRT

<213> Artificial sequence

<220>

<223> GGS variant

<400> 22

Met Asp Tyr Asn Ser Ala Asp Phe Lys Glu Ile Trp Gly Lys Ala Ala

1 5 10 15

Asp Thr Ala Leu Leu Gly Pro Tyr Asn Tyr Leu Ala Asn Asn Arg Gly

20 25 30

His Asn Ile Arg Glu His Leu Ile Ala Ala Phe Gly Ala Val Ile Lys

35 40 45

Val Asp Lys Ser Asp Leu Glu Thr Ile Ser His Ile Thr Lys Ile Leu

50 55 60

His Asn Ser Ser Leu Leu Val Asp Asp Val Glu Asp Asn Ser Met Leu

65 70 75 80

Arg Arg Gly Leu Pro Ala Ala His Cys Leu Phe Gly Val Pro Gln Thr

85 90 95

Ile Asn Ser Phe Asn Tyr Met Tyr Phe Val Ala Leu Gln Glu Val Leu

100 105 110

Lys Leu Lys Ser Tyr Asp Ala Val Ser Ile Phe Thr Glu Glu Met Ile

115 120 125

Asn Leu His Arg Gly Gln Gly Met Asp Leu Tyr Trp Arg Glu Thr Leu

130 135 140

Thr Cys Pro Ser Glu Asp Glu Tyr Leu Glu Met Val Val His Lys Thr

145 150 155 160

Gly Gly Leu Phe Arg Leu Ala Leu Arg Leu Met Leu Ser Val Ala Ser

165 170 175

Lys Gln Glu Asp His Glu Lys Ile Asn Phe Asp Leu Thr His Leu Thr

180 185 190

Asp Thr Leu Gly Val Ile Tyr Gln Ile Leu Asp Asp Tyr Leu Asn Leu

195 200 205

Gln Ser Thr Glu Leu Thr Glu Asn Lys Gly Phe Cys Glu Asp Ile Ser

210 215 220

Glu Gly Lys Phe Ser Phe Pro Leu Ile His Ser Ile Arg Thr Asn Pro

225 230 235 240

Asp Asn His Glu Ile Leu Asn Ile Leu Lys Gln Arg Thr Ser Asp Ala

245 250 255

Ser Leu Lys Lys Tyr Ala Val Asp Tyr Met Arg Thr Glu Thr Lys Ser

260 265 270

Phe Asp Tyr Cys Leu Lys Arg Ile Gln Ala Met Ser Leu Lys Ala Ser

275 280 285

Ser Tyr Ile Asp Asp Leu Ala Ala Ala Gly His Asp Val Ser Lys Leu

290 295 300

Arg Ala Ile Leu His Tyr Phe Val Ser Thr Ser Asp Cys Glu Glu Arg

305 310 315 320

Lys Tyr Phe Glu Asp Ala Gln

325

<210> 23

<211> 327

<212> PRT

<213> Artificial sequence

<220>

<223> GGS variant

<400> 23

Met Asp Tyr Asn Ser Ala Asp Phe Lys Glu Ile Trp Gly Lys Ala Ala

1 5 10 15

Asp Thr Ala Leu Leu Gly Pro Tyr Asn Tyr Leu Ala Asn Asn Arg Gly

20 25 30

His Asn Ile Arg Glu His Leu Ile Ala Ala Phe Gly Ala Val Ile Lys

35 40 45

Val Asp Lys Ser Asp Leu Glu Thr Ile Ser His Ile Thr Lys Ile Leu

50 55 60

His Asn Ser Ser Leu Leu Val Asp Asp Val Glu Asp Asn Ser Met Leu

65 70 75 80

Arg Arg Gly Leu Pro Ala Ala His Cys Leu Phe Gly Val Pro Gln Thr

85 90 95

Ile Asn Ser Tyr Asn Tyr Met Tyr Phe Val Ala Leu Gln Glu Val Leu

100 105 110

Lys Leu Lys Ser Tyr Asp Ala Val Ser Ile Phe Thr Glu Glu Met Ile

115 120 125

Asn Leu His Arg Gly Gln Gly Met Asp Leu Tyr Trp Arg Glu Thr Leu

130 135 140

Thr Cys Pro Ser Glu Asp Glu Tyr Leu Glu Met Val Val His Lys Thr

145 150 155 160

Gly Gly Leu Phe Arg Leu Ala Leu Arg Leu Met Leu Ser Val Ala Ser

165 170 175

Lys Gln Glu Asp His Glu Lys Ile Asn Phe Asp Leu Thr His Leu Thr

180 185 190

Asp Thr Leu Gly Val Ile Tyr Gln Ile Leu Asp Asp Tyr Leu Asn Leu

195 200 205

Gln Ser Thr Glu Leu Thr Glu Asn Lys Gly Phe Cys Glu Asp Ile Ser

210 215 220

Glu Gly Lys Phe Ser Phe Pro Leu Ile His Ser Ile Arg Thr Asn Pro

225 230 235 240

Asp Asn His Glu Ile Leu Asn Ile Leu Lys Gln Arg Thr Ser Asp Ala

245 250 255

Ser Leu Lys Lys Tyr Ala Val Asp Tyr Met Arg Thr Glu Thr Lys Ser

260 265 270

Phe Asp Tyr Cys Leu Lys Arg Ile Gln Ala Met Ser Leu Lys Ala Ser

275 280 285

Ser Tyr Ile Asp Asp Leu Ala Ala Ala Gly His Asp Val Ser Lys Leu

290 295 300

Arg Ala Ile Leu His Tyr Phe Val Ser Thr Ser Asp Cys Glu Glu Arg

305 310 315 320

Lys Tyr Phe Glu Asp Ala Gln

325

<210> 24

<211> 327

<212> PRT

<213> Artificial sequence

<220>

<223> GGS variant

<400> 24

Met Asp Tyr Asn Ser Ala Asp Phe Lys Glu Ile Trp Gly Lys Ala Ala

1 5 10 15

Asp Thr Ala Leu Leu Gly Pro Tyr Asn Tyr Leu Ala Asn Asn Arg Gly

20 25 30

His Asn Ile Arg Glu His Leu Ile Ala Ala Phe Gly Ala Val Ile Lys

35 40 45

Val Asp Lys Ser Asp Leu Glu Thr Ile Ser His Ile Thr Lys Ile Leu

50 55 60

His Asn Ser Ser Leu Leu Val Asp Asp Val Glu Asp Asn Ser Met Leu

65 70 75 80

Arg Arg Gly Leu Pro Ala Ala His Cys Leu Phe Gly Val Pro Gln Thr

85 90 95

Ile Asn Ser Ile Asn Tyr Met Tyr Phe Val Ala Leu Gln Glu Val Leu

100 105 110

Lys Leu Lys Ser Tyr Asp Ala Val Ser Ile Phe Thr Glu Glu Met Ile

115 120 125

Asn Leu His Arg Gly Gln Gly Met Asp Leu Tyr Trp Arg Glu Thr Leu

130 135 140

Thr Cys Pro Ser Glu Asp Glu Tyr Leu Glu Met Val Val His Lys Thr

145 150 155 160

Gly Gly Leu Phe Arg Leu Ala Leu Arg Leu Met Leu Ser Val Ala Ser

165 170 175

Lys Gln Glu Asp His Glu Lys Ile Asn Phe Asp Leu Thr His Leu Thr

180 185 190

Asp Thr Leu Gly Val Ile Tyr Gln Ile Leu Asp Asp Tyr Leu Asn Leu

195 200 205

Gln Ser Thr Glu Leu Thr Glu Asn Lys Gly Phe Cys Glu Asp Ile Ser

210 215 220

Glu Gly Lys Phe Ser Phe Pro Leu Ile His Ser Ile Arg Thr Asn Pro

225 230 235 240

Asp Asn His Glu Ile Leu Asn Ile Leu Lys Gln Arg Thr Ser Asp Ala

245 250 255

Ser Leu Lys Lys Tyr Ala Val Asp Tyr Met Arg Thr Glu Thr Lys Ser

260 265 270

Phe Asp Tyr Cys Leu Lys Arg Ile Gln Ala Met Ser Leu Lys Ala Ser

275 280 285

Ser Tyr Ile Asp Asp Leu Ala Ala Ala Gly His Asp Val Ser Lys Leu

290 295 300

Arg Ala Ile Leu His Tyr Phe Val Ser Thr Ser Asp Cys Glu Glu Arg

305 310 315 320

Lys Tyr Phe Glu Asp Ala Gln

325

<210> 25

<211> 327

<212> PRT

<213> Artificial sequence

<220>

<223> GGS variant

<400> 25

Met Asp Tyr Asn Ser Ala Asp Phe Lys Glu Ile Trp Gly Lys Ala Ala

1 5 10 15

Asp Thr Ala Leu Leu Gly Pro Tyr Asn Tyr Leu Ala Asn Asn Arg Gly

20 25 30

His Asn Ile Arg Glu His Leu Ile Ala Ala Phe Gly Ala Val Ile Lys

35 40 45

Val Asp Lys Ser Asp Leu Glu Thr Ile Ser His Ile Thr Lys Ile Leu

50 55 60

His Asn Ser Ser Leu Leu Val Asp Asp Val Glu Asp Asn Ser Met Leu

65 70 75 80

Arg Arg Gly Leu Pro Ala Ala His Cys Leu Phe Gly Val Pro Gln Thr

85 90 95

Ile Asn Ser Leu Asn Tyr Met Tyr Phe Val Ala Leu Gln Glu Val Leu

100 105 110

Lys Leu Lys Ser Tyr Asp Ala Val Ser Ile Phe Thr Glu Glu Met Ile

115 120 125

Asn Leu His Arg Gly Gln Gly Met Asp Leu Tyr Trp Arg Glu Thr Leu

130 135 140

Thr Cys Pro Ser Glu Asp Glu Tyr Leu Glu Met Val Val His Lys Thr

145 150 155 160

Gly Gly Leu Phe Arg Leu Ala Leu Arg Leu Met Leu Ser Val Ala Ser

165 170 175

Lys Gln Glu Asp His Glu Lys Ile Asn Phe Asp Leu Thr His Leu Thr

180 185 190

Asp Thr Leu Gly Val Ile Tyr Gln Ile Leu Asp Asp Tyr Leu Asn Leu

195 200 205

Gln Ser Thr Glu Leu Thr Glu Asn Lys Gly Phe Cys Glu Asp Ile Ser

210 215 220

Glu Gly Lys Phe Ser Phe Pro Leu Ile His Ser Ile Arg Thr Asn Pro

225 230 235 240

Asp Asn His Glu Ile Leu Asn Ile Leu Lys Gln Arg Thr Ser Asp Ala

245 250 255

Ser Leu Lys Lys Tyr Ala Val Asp Tyr Met Arg Thr Glu Thr Lys Ser

260 265 270

Phe Asp Tyr Cys Leu Lys Arg Ile Gln Ala Met Ser Leu Lys Ala Ser

275 280 285

Ser Tyr Ile Asp Asp Leu Ala Ala Ala Gly His Asp Val Ser Lys Leu

290 295 300

Arg Ala Ile Leu His Tyr Phe Val Ser Thr Ser Asp Cys Glu Glu Arg

305 310 315 320

Lys Tyr Phe Glu Asp Ala Gln

325

<210> 26

<211> 327

<212> PRT

<213> Artificial sequence

<220>

<223> GGS variant

<400> 26

Met Asp Tyr Asn Ser Ala Asp Phe Lys Glu Ile Trp Gly Lys Ala Ala

1 5 10 15

Asp Thr Ala Leu Leu Gly Pro Tyr Asn Tyr Leu Ala Asn Asn Arg Gly

20 25 30

His Asn Ile Arg Glu His Leu Ile Ala Ala Phe Gly Ala Val Ile Lys

35 40 45

Val Asp Lys Ser Asp Leu Glu Thr Ile Ser His Ile Thr Lys Ile Leu

50 55 60

His Asn Ser Ser Leu Leu Val Asp Asp Val Glu Asp Asn Ser Met Leu

65 70 75 80

Arg Arg Gly Leu Pro Ala Ala His Cys Leu Phe Gly Val Pro Gln Thr

85 90 95

Ile Asn Ser Ala Asn Tyr Met Tyr Phe Val Ala Leu Gln Glu Val Leu

100 105 110

Lys Leu Lys Ser Tyr Asp Ala Val Ser Ile Phe Thr Glu Glu Met Ile

115 120 125

Asn Leu His Arg Gly Gln Gly Met Asp Leu Tyr Trp Arg Glu Thr Leu

130 135 140

Thr Cys Pro Ser Glu Asp Glu Tyr Leu Glu Met Val Val His Lys Thr

145 150 155 160

Gly Gly Leu Phe Arg Leu Ala Leu Arg Leu Met Leu Ser Val Ala Ser

165 170 175

Lys Gln Glu Asp His Glu Lys Ile Asn Phe Asp Leu Thr His Leu Thr

180 185 190

Asp Thr Leu Gly Val Ile Tyr Gln Ile Leu Asp Asp Tyr Leu Asn Leu

195 200 205

Gln Ser Thr Glu Leu Thr Glu Asn Lys Gly Phe Cys Glu Asp Ile Ser

210 215 220

Glu Gly Lys Phe Ser Phe Pro Leu Ile His Ala Ile Arg Thr Asn Pro

225 230 235 240

Asp Asn His Glu Ile Leu Asn Ile Leu Lys Gln Arg Thr Ser Asp Ala

245 250 255

Ser Leu Lys Lys Tyr Ala Val Asp Tyr Met Arg Thr Glu Thr Lys Ser

260 265 270

Phe Asp Tyr Cys Leu Lys Arg Ile Gln Ala Met Ser Leu Lys Ala Ser

275 280 285

Ser Tyr Ile Asp Asp Leu Ala Ala Ala Gly His Asp Val Ser Lys Leu

290 295 300

Arg Ala Ile Leu His Tyr Phe Val Ser Thr Ser Asp Cys Glu Glu Arg

305 310 315 320

Lys Tyr Phe Glu Asp Ala Gln

325

<210> 27

<211> 327

<212> PRT

<213> Artificial sequence

<220>

<223> GGS variant

<400> 27

Met Asp Tyr Asn Ser Ala Asp Phe Lys Glu Ile Trp Gly Lys Ala Ala

1 5 10 15

Asp Thr Ala Leu Leu Gly Pro Tyr Asn Tyr Leu Ala Asn Asn Arg Gly

20 25 30

His Asn Ile Arg Glu His Leu Ile Ala Ala Phe Gly Ala Val Ile Lys

35 40 45

Val Asp Lys Ser Asp Leu Glu Thr Ile Ser His Ile Thr Lys Ile Leu

50 55 60

His Asn Ser Ser Leu Leu Val Asp Asp Val Glu Asp Asn Ser Met Leu

65 70 75 80

Arg Arg Gly Leu Pro Ala Ala His Cys Leu Phe Gly Val Pro Gln Thr

85 90 95

Ile Asn Ser Ala Asn Tyr Met Tyr Phe Val Ala Leu Gln Glu Val Leu

100 105 110

Lys Leu Lys Ser Tyr Asp Ala Val Ser Ile Phe Thr Glu Glu Met Ile

115 120 125

Asn Leu His Arg Gly Gln Gly Met Asp Leu Tyr Trp Arg Glu Thr Leu

130 135 140

Thr Cys Pro Ser Glu Asp Glu Tyr Leu Glu Met Val Val His Lys Thr

145 150 155 160

Gly Gly Leu Phe Arg Leu Ala Leu Arg Leu Met Leu Ser Val Ala Ser

165 170 175

Lys Gln Glu Asp His Glu Lys Ile Asn Phe Asp Leu Thr His Leu Thr

180 185 190

Asp Thr Leu Gly Val Ile Tyr Gln Ile Leu Asp Asp Tyr Leu Asn Leu

195 200 205

Gln Ser Thr Glu Leu Thr Glu Asn Lys Gly Phe Cys Glu Asp Ile Ser

210 215 220

Glu Gly Lys Phe Ser Phe Pro Leu Ile His Gly Ile Arg Thr Asn Pro

225 230 235 240

Asp Asn His Glu Ile Leu Asn Ile Leu Lys Gln Arg Thr Ser Asp Ala

245 250 255

Ser Leu Lys Lys Tyr Ala Val Asp Tyr Met Arg Thr Glu Thr Lys Ser

260 265 270

Phe Asp Tyr Cys Leu Lys Arg Ile Gln Ala Met Ser Leu Lys Ala Ser

275 280 285

Ser Tyr Ile Asp Asp Leu Ala Ala Ala Gly His Asp Val Ser Lys Leu

290 295 300

Arg Ala Ile Leu His Tyr Phe Val Ser Thr Ser Asp Cys Glu Glu Arg

305 310 315 320

Lys Tyr Phe Glu Asp Ala Gln

325

<210> 28

<211> 327

<212> PRT

<213> Artificial sequence

<220>

<223> GGS variant

<400> 28

Met Asp Tyr Asn Ser Ala Asp Phe Lys Glu Ile Trp Gly Lys Ala Ala

1 5 10 15

Asp Thr Ala Leu Leu Gly Pro Tyr Asn Tyr Leu Ala Asn Asn Arg Gly

20 25 30

His Asn Ile Arg Glu His Leu Ile Ala Ala Phe Gly Ala Val Ile Lys

35 40 45

Val Asp Lys Ser Asp Leu Glu Thr Ile Ser His Ile Thr Lys Ile Leu

50 55 60

His Asn Ser Ser Leu Leu Val Asp Asp Val Glu Asp Asn Ser Met Leu

65 70 75 80

Arg Arg Gly Leu Pro Ala Ala His Cys Leu Phe Gly Val Pro Gln Thr

85 90 95

Ile Asn Ser Ala Asn Tyr Met Tyr Phe Val Ala Leu Gln Glu Val Leu

100 105 110

Lys Leu Lys Ser Tyr Asp Ala Val Ser Ile Phe Thr Glu Glu Met Ile

115 120 125

Asn Leu His Arg Gly Gln Gly Met Asp Leu Tyr Trp Arg Glu Thr Leu

130 135 140

Thr Cys Pro Ser Glu Asp Glu Tyr Leu Glu Met Val Val His Lys Thr

145 150 155 160

Gly Gly Leu Phe Arg Leu Ala Leu Arg Leu Met Leu Ser Val Ala Ser

165 170 175

Lys Gln Glu Asp His Glu Lys Ile Asn Phe Asp Leu Thr His Leu Thr

180 185 190

Asp Thr Leu Gly Val Ile Tyr Gln Ile Leu Asp Asp Tyr Leu Asn Leu

195 200 205

Gln Ser Thr Glu Leu Thr Glu Asn Lys Gly Phe Cys Glu Asp Ile Ser

210 215 220

Glu Gly Lys Phe Ser Phe Pro Leu Ile His Gln Ile Arg Thr Asn Pro

225 230 235 240

Asp Asn His Glu Ile Leu Asn Ile Leu Lys Gln Arg Thr Ser Asp Ala

245 250 255

Ser Leu Lys Lys Tyr Ala Val Asp Tyr Met Arg Thr Glu Thr Lys Ser

260 265 270

Phe Asp Tyr Cys Leu Lys Arg Ile Gln Ala Met Ser Leu Lys Ala Ser

275 280 285

Ser Tyr Ile Asp Asp Leu Ala Ala Ala Gly His Asp Val Ser Lys Leu

290 295 300

Arg Ala Ile Leu His Tyr Phe Val Ser Thr Ser Asp Cys Glu Glu Arg

305 310 315 320

Lys Tyr Phe Glu Asp Ala Gln

325

<210> 29

<211> 327

<212> PRT

<213> Artificial sequence

<220>

<223> GGS variant

<400> 29

Met Asp Tyr Asn Ser Ala Asp Phe Lys Glu Ile Trp Gly Lys Ala Ala

1 5 10 15

Asp Thr Ala Leu Leu Gly Pro Tyr Asn Tyr Leu Ala Asn Asn Arg Gly

20 25 30

His Asn Ile Arg Glu His Leu Ile Ala Ala Phe Gly Ala Val Ile Lys

35 40 45

Val Asp Lys Ser Asp Leu Glu Thr Ile Ser His Ile Thr Lys Ile Leu

50 55 60

His Asn Ser Ser Leu Leu Val Asp Asp Val Glu Asp Asn Ser Met Leu

65 70 75 80

Arg Arg Gly Leu Pro Ala Ala His Cys Leu Phe Gly Val Pro Gln Thr

85 90 95

Ile Asn Ser Ala Asn Tyr Met Tyr Phe Val Ala Leu Gln Glu Val Leu

100 105 110

Lys Leu Lys Ser Tyr Asp Ala Val Ser Ile Phe Thr Glu Glu Met Ile

115 120 125

Asn Leu His Arg Gly Gln Gly Met Asp Leu Tyr Trp Arg Glu Thr Leu

130 135 140

Thr Cys Pro Ser Glu Asp Glu Tyr Leu Glu Met Val Val His Lys Thr

145 150 155 160

Gly Gly Leu Phe Arg Leu Ala Leu Arg Leu Met Leu Ser Val Ala Ser

165 170 175

Lys Gln Glu Asp His Glu Lys Ile Asn Phe Asp Leu Thr His Leu Thr

180 185 190

Asp Thr Leu Gly Val Ile Tyr Gln Ile Leu Asp Asp Tyr Leu Asn Leu

195 200 205

Gln Ser Thr Glu Leu Thr Glu Asn Lys Gly Phe Cys Glu Asp Ile Ser

210 215 220

Glu Gly Lys Phe Ser Phe Pro Leu Ile His Val Ile Arg Thr Asn Pro

225 230 235 240

Asp Asn His Glu Ile Leu Asn Ile Leu Lys Gln Arg Thr Ser Asp Ala

245 250 255

Ser Leu Lys Lys Tyr Ala Val Asp Tyr Met Arg Thr Glu Thr Lys Ser

260 265 270

Phe Asp Tyr Cys Leu Lys Arg Ile Gln Ala Met Ser Leu Lys Ala Ser

275 280 285

Ser Tyr Ile Asp Asp Leu Ala Ala Ala Gly His Asp Val Ser Lys Leu

290 295 300

Arg Ala Ile Leu His Tyr Phe Val Ser Thr Ser Asp Cys Glu Glu Arg

305 310 315 320

Lys Tyr Phe Glu Asp Ala Gln

325

<210> 30

<211> 327

<212> PRT

<213> Artificial sequence

<220>

<223> GGS variant

<400> 30

Met Asp Tyr Asn Ser Ala Asp Phe Lys Glu Ile Trp Gly Lys Ala Ala

1 5 10 15

Asp Thr Ala Leu Leu Gly Pro Tyr Asn Tyr Leu Ala Asn Asn Arg Gly

20 25 30

His Asn Ile Arg Glu His Leu Ile Ala Ala Phe Gly Ala Val Ile Lys

35 40 45

Val Asp Lys Ser Asp Leu Glu Thr Ile Ser His Ile Thr Lys Ile Leu

50 55 60

His Asn Ser Ser Leu Leu Val Asp Asp Val Glu Asp Asn Ser Met Leu

65 70 75 80

Arg Arg Gly Leu Pro Ala Ala His Cys Leu Phe Gly Val Pro Gln Thr

85 90 95

Ile Asn Ser Ala Asn Tyr Met Tyr Phe Val Ala Leu Gln Glu Val Leu

100 105 110

Lys Leu Lys Ser Tyr Asp Ala Val Ser Ile Phe Thr Glu Glu Met Ile

115 120 125

Asn Leu His Arg Gly Gln Gly Met Asp Leu Tyr Trp Arg Glu Thr Leu

130 135 140

Thr Cys Pro Ser Glu Asp Glu Tyr Leu Glu Met Val Val His Lys Thr

145 150 155 160

Gly Gly Leu Phe Arg Leu Ala Leu Arg Leu Met Leu Ser Val Ala Ser

165 170 175

Lys Gln Glu Asp His Glu Lys Ile Asn Phe Asp Leu Thr His Leu Thr

180 185 190

Asp Thr Leu Gly Val Ile Tyr Gln Ile Leu Asp Asp Tyr Leu Asn Leu

195 200 205

Gln Ser Thr Glu Leu Thr Glu Asn Lys Gly Phe Cys Glu Asp Ile Ser

210 215 220

Glu Gly Lys Phe Ser Phe Pro Leu Ile His Asp Ile Arg Thr Asn Pro

225 230 235 240

Asp Asn His Glu Ile Leu Asn Ile Leu Lys Gln Arg Thr Ser Asp Ala

245 250 255

Ser Leu Lys Lys Tyr Ala Val Asp Tyr Met Arg Thr Glu Thr Lys Ser

260 265 270

Phe Asp Tyr Cys Leu Lys Arg Ile Gln Ala Met Ser Leu Lys Ala Ser

275 280 285

Ser Tyr Ile Asp Asp Leu Ala Ala Ala Gly His Asp Val Ser Lys Leu

290 295 300

Arg Ala Ile Leu His Tyr Phe Val Ser Thr Ser Asp Cys Glu Glu Arg

305 310 315 320

Lys Tyr Phe Glu Asp Ala Gln

325

<210> 31

<211> 327

<212> PRT

<213> Artificial sequence

<220>

<223> GGS variant

<400> 31

Met Asp Tyr Asn Ser Ala Asp Phe Lys Glu Ile Trp Gly Lys Ala Ala

1 5 10 15

Asp Thr Ala Leu Leu Gly Pro Tyr Asn Tyr Leu Ala Asn Asn Arg Gly

20 25 30

His Asn Ile Arg Glu His Leu Ile Ala Ala Phe Gly Ala Val Ile Lys

35 40 45

Val Asp Lys Ser Asp Leu Glu Thr Ile Ser His Ile Thr Lys Ile Leu

50 55 60

His Asn Ser Ser Leu Leu Val Asp Asp Val Glu Asp Asn Ser Met Leu

65 70 75 80

Arg Arg Gly Leu Pro Ala Ala His Cys Leu Phe Gly Val Pro Gln Thr

85 90 95

Ile Asn Ser Ala Asn Tyr Met Tyr Phe Val Ala Leu Gln Glu Val Leu

100 105 110

Lys Leu Lys Ser Tyr Asp Ala Val Ser Ile Phe Thr Glu Glu Met Ile

115 120 125

Asn Leu His Arg Gly Gln Gly Met Asp Leu Tyr Trp Arg Glu Thr Leu

130 135 140

Thr Cys Pro Ser Glu Asp Glu Tyr Leu Glu Met Val Val His Lys Thr

145 150 155 160

Gly Gly Leu Phe Arg Leu Ala Leu Arg Leu Met Leu Ser Val Ala Ser

165 170 175

Lys Gln Glu Asp His Glu Lys Ile Asn Phe Asp Leu Thr His Leu Thr

180 185 190

Asp Thr Leu Gly Val Ile Tyr Gln Ile Leu Asp Asp Tyr Leu Asn Leu

195 200 205

Gln Ser Thr Glu Leu Thr Glu Asn Lys Gly Phe Cys Glu Asp Ile Ser

210 215 220

Glu Gly Lys Phe Ser Phe Pro Leu Ile His Glu Ile Arg Thr Asn Pro

225 230 235 240

Asp Asn His Glu Ile Leu Asn Ile Leu Lys Gln Arg Thr Ser Asp Ala

245 250 255

Ser Leu Lys Lys Tyr Ala Val Asp Tyr Met Arg Thr Glu Thr Lys Ser

260 265 270

Phe Asp Tyr Cys Leu Lys Arg Ile Gln Ala Met Ser Leu Lys Ala Ser

275 280 285

Ser Tyr Ile Asp Asp Leu Ala Ala Ala Gly His Asp Val Ser Lys Leu

290 295 300

Arg Ala Ile Leu His Tyr Phe Val Ser Thr Ser Asp Cys Glu Glu Arg

305 310 315 320

Lys Tyr Phe Glu Asp Ala Gln

325

<210> 32

<211> 327

<212> PRT

<213> Artificial sequence

<220>

<223> GGS variant

<400> 32

Met Asp Tyr Asn Ser Ala Asp Phe Lys Glu Ile Trp Gly Lys Ala Ala

1 5 10 15

Asp Thr Ala Leu Leu Gly Pro Tyr Asn Tyr Leu Ala Asn Asn Arg Gly

20 25 30

His Asn Ile Arg Glu His Leu Ile Ala Ala Phe Gly Ala Val Ile Lys

35 40 45

Val Asp Lys Ser Asp Leu Glu Thr Ile Ser His Ile Thr Lys Ile Leu

50 55 60

His Asn Ser Ser Leu Leu Val Asp Asp Val Glu Asp Asn Ser Met Leu

65 70 75 80

Arg Arg Gly Leu Pro Ala Ala His Cys Leu Phe Gly Val Pro Gln Thr

85 90 95

Ile Asn Ser Ala Asn Tyr Met Tyr Phe Val Ala Leu Gln Glu Val Leu

100 105 110

Lys Leu Lys Ser Tyr Asp Ala Val Ser Ile Phe Thr Glu Glu Met Ile

115 120 125

Asn Leu His Arg Gly Gln Gly Met Asp Leu Tyr Trp Arg Glu Thr Leu

130 135 140

Thr Cys Pro Ser Glu Asp Glu Tyr Leu Glu Met Val Val His Lys Thr

145 150 155 160

Gly Gly Leu Phe Arg Leu Ala Leu Arg Leu Met Leu Ser Val Ala Ser

165 170 175

Lys Gln Glu Asp His Glu Lys Ile Asn Phe Asp Leu Thr His Leu Thr

180 185 190

Asp Thr Leu Gly Val Ile Tyr Gln Ile Leu Asp Asp Tyr Leu Asn Leu

195 200 205

Gln Ser Thr Glu Leu Thr Glu Asn Lys Gly Phe Cys Glu Asp Ile Ser

210 215 220

Glu Gly Lys Phe Ser Phe Pro Leu Ile His Phe Ile Arg Thr Asn Pro

225 230 235 240

Asp Asn His Glu Ile Leu Asn Ile Leu Lys Gln Arg Thr Ser Asp Ala

245 250 255

Ser Leu Lys Lys Tyr Ala Val Asp Tyr Met Arg Thr Glu Thr Lys Ser

260 265 270

Phe Asp Tyr Cys Leu Lys Arg Ile Gln Ala Met Ser Leu Lys Ala Ser

275 280 285

Ser Tyr Ile Asp Asp Leu Ala Ala Ala Gly His Asp Val Ser Lys Leu

290 295 300

Arg Ala Ile Leu His Tyr Phe Val Ser Thr Ser Asp Cys Glu Glu Arg

305 310 315 320

Lys Tyr Phe Glu Asp Ala Gln

325

<210> 33

<211> 327

<212> PRT

<213> Artificial sequence

<220>

<223> GGS variant

<400> 33

Met Asp Tyr Asn Ser Ala Asp Phe Lys Glu Ile Trp Gly Lys Ala Ala

1 5 10 15

Asp Thr Ala Leu Leu Gly Pro Tyr Asn Tyr Leu Ala Asn Asn Arg Gly

20 25 30

His Asn Ile Arg Glu His Leu Ile Ala Ala Phe Gly Ala Val Ile Lys

35 40 45

Val Asp Lys Ser Asp Leu Glu Thr Ile Ser His Ile Thr Lys Ile Leu

50 55 60

His Asn Ser Ser Leu Leu Val Asp Asp Val Glu Asp Asn Ser Met Leu

65 70 75 80

Arg Arg Gly Leu Pro Ala Ala His Cys Leu Phe Gly Val Pro Gln Thr

85 90 95

Ile Asn Ser Ala Asn Tyr Met Tyr Phe Val Ala Leu Gln Glu Val Leu

100 105 110

Lys Leu Lys Ser Tyr Asp Ala Val Ser Ile Phe Thr Glu Glu Met Ile

115 120 125

Asn Leu His Arg Gly Gln Gly Met Asp Leu Tyr Trp Arg Glu Thr Leu

130 135 140

Thr Cys Pro Ser Glu Asp Glu Tyr Leu Glu Met Val Val His Lys Thr

145 150 155 160

Gly Gly Leu Phe Arg Leu Ala Leu Arg Leu Met Leu Ser Val Ala Ser

165 170 175

Lys Gln Glu Asp His Glu Lys Ile Asn Phe Asp Leu Thr His Leu Thr

180 185 190

Asp Thr Leu Gly Val Ile Tyr Gln Ile Leu Asp Asp Tyr Leu Asn Leu

195 200 205

Gln Ser Thr Glu Leu Thr Glu Asn Lys Gly Phe Cys Glu Asp Ile Ser

210 215 220

Glu Gly Lys Phe Ser Phe Pro Leu Ile His Tyr Ile Arg Thr Asn Pro

225 230 235 240

Asp Asn His Glu Ile Leu Asn Ile Leu Lys Gln Arg Thr Ser Asp Ala

245 250 255

Ser Leu Lys Lys Tyr Ala Val Asp Tyr Met Arg Thr Glu Thr Lys Ser

260 265 270

Phe Asp Tyr Cys Leu Lys Arg Ile Gln Ala Met Ser Leu Lys Ala Ser

275 280 285

Ser Tyr Ile Asp Asp Leu Ala Ala Ala Gly His Asp Val Ser Lys Leu

290 295 300

Arg Ala Ile Leu His Tyr Phe Val Ser Thr Ser Asp Cys Glu Glu Arg

305 310 315 320

Lys Tyr Phe Glu Asp Ala Gln

325

Claims

1.一种具有香叶基香叶基焦磷酸酯合酶活性的变体多肽，所述变体多肽包含氨基酸序列，当与包含SEQ ID NO：1所示序列的香叶基香叶基焦磷酸酯合酶比对时，所述氨基酸序列包含至少一个对应于位置92、100或235的任何氨基酸的氨基酸残基的取代，所述位置是参考SEQ ID NO：1定义的，并且其中所述变体与具有香叶基香叶基焦磷酸酯合酶活性的参考多肽相比具有一种或多种修饰的性质。

2.根据权利要求1所述的变体多肽，其中，所述修饰的性质是修饰的香叶基香叶基焦磷酸酯合酶活性。

3.根据权利要求1或2所述的变体多肽，其中，所述参考多肽包含SEQ ID NO：1或SEQ IDNO：17的香叶基香叶基焦磷酸酯合酶。

4.根据前述权利要求中任一项所述的变体多肽，其中，所述变体多肽是非天然存在的多肽。

5.根据前述权利要求中任一项所述的变体多肽，所述变体多肽包含除权利要求1中定义的那些取代之外的附加取代。

6.根据前述权利要求中任一项所述的变体多肽，所述变体多肽与SEQ ID NO：1或SEQID NO：17具有至少70％，至少75％，至少80％，至少85％，至少90％，至少95％，具有至少97％，至少98％或至少99％的序列同一性。

7.一种具有香叶基香叶基焦磷酸酯合酶活性的变体多肽，所述变体多肽包含与SEQ IDNO：3、5、7、9、11、13、15、18至33中的任一个具有至少约95％序列同一性，至少96％，至少97％，至少98％或至少99％序列同一性的氨基酸序列。

8.一种多核苷酸，其包含编码根据前述权利要求中任一项所述的多肽的序列。

9.一种核酸构建体，例如表达载体，所述核酸构建体包含权利要求8所述的多核苷酸序列，所述多核苷酸序列可操作地连接至一个或多个能够指导香叶基香叶基焦磷酸酯合酶在合适的表达宿主中表达的控制序列。

10.一种重组宿主，例如能够生产甜菊醇或甜菊醇糖苷的重组宿主，所述重组宿主包含根据权利要求8所述的多核苷酸或根据权利要求9所述的核酸构建体。

11.根据权利要求10所述的重组宿主，所述重组宿主包含一种或多种重组核苷酸序列，所述重组核苷酸序列编码：

具有对映-柯巴基焦磷酸酯合酶活性的多肽；

具有对映-贝壳杉烯合酶活性的多肽；

具有对映-贝壳杉烯氧化酶活性的多肽；以及

具有贝壳杉烯酸13-羟化酶活性的多肽。

12.根据权利要求10或11所述的重组宿主，所述重组宿主包含编码具有NADPH-细胞色素p450还原酶活性的多肽的重组核酸序列。

13.根据权利要求10-12中任一项所述的重组宿主，所述重组宿主包含编码以下一种或多种的重组核酸序列：

(i)具有UGT74G1活性的多肽；

(ii)具有UGT2活性的多肽；

(iii)具有UGT85C2活性的多肽；以及

(iv)具有UGT76G1活性的多肽。

14.根据权利要求10-13中任一项所述的重组宿主，其中，所述宿主属于以下属中的一种：Saccharomyces、Aspergillus、Pichia、Kluyveromyces、Candida、Hansenula、Humicola、Issatchenkia、Trichosporon、Brettanomyces、Pachysolen、Yarrowia、Yamadazyma或Escherichia。

15.根据权利要求10-14中任一项所述的重组宿主，其中，所述宿主产生香叶基香叶基二磷酸酯(GGPP)的能力被上调。

16.一种制备甜菊醇或甜菊醇糖苷的方法，所述方法包括在合适的发酵培养基中发酵根据权利要求10至15中任一项所述的重组宿主，并任选地回收所述甜菊醇或甜菊醇糖苷。