CN107922913B

CN107922913B - 甜菊醇糖苷转运

Info

Publication number: CN107922913B
Application number: CN201680047069.7A
Authority: CN
Inventors: 维克托·马里厄斯·波尔; 普利斯希勒·扎尔特简斯; 埃里克·范·德恩·伯格
Original assignee: DSM IP Assets BV
Current assignee: DSM IP Assets BV
Priority date: 2015-08-13
Filing date: 2016-08-15
Publication date: 2022-04-05
Anticipated expiration: 2036-08-15
Also published as: US20180230505A1; CA2993744A1; CN107922913A; WO2017025649A1; US20200283816A1; US11293043B2; EP3334819A1

Abstract

一种能够产生甜菊醇糖苷的重组宿主，所述重组宿主过表达介导甜菊醇糖苷转运的多肽，所述多肽包含SEQ ID NO:35或SEQ ID NO:38所示的氨基酸序列或与二者之任一具有至少约50％序列同一性的氨基酸序列。一种能够产生甜菊醇糖苷的重组宿主，所述重组宿主已被修饰，优选在其基因组中被修饰，以导致介导甜菊醇糖苷转运的多肽的产生缺陷，并且所述多肽包含SEQ ID NO:35或SEQ ID NO:38所示的氨基酸序列或与二者之任一具有至少约50％序列同一性的氨基酸序列。

Description

甜菊醇糖苷转运

发明领域

本发明涉及能够产生甜菊醇糖苷的重组宿主。本发明还涉及使用这种重组宿主制备甜菊醇糖苷的方法。本发明还涉及包含甜菊醇糖苷的发酵液、甜菊醇糖苷和包含两种或更多种甜菊醇糖苷的组合物。本发明还涉及包含甜菊醇糖苷或含有两种或更多种甜菊醇糖苷的组合物的食品、饲料或饮料。

发明背景

多年生草本植物甜叶菊(Stevia rebaudiana Bert.)的叶子积聚大量被称为甜菊醇糖苷的具有强烈甜味的化合物。虽然这些化合物的生物功能尚不清楚，但它们作为替代性高效甜味剂具有商业意义。

这些甜的甜菊醇糖苷的功能和感官特性表现为优于许多高效甜味剂的功能和感官特性。此外，研究表明甜菊苷能够降低II型糖尿病患者的血糖水平，并且能够降低轻度高血压患者的血压。

甜菊醇糖苷积聚在甜叶菊叶中，其中它们可占叶干重的10％至20％。甜菊苷和莱鲍迪甙A均是热和pH稳定的，并且适用于碳酸饮料和许多其他食物。甜菊苷比蔗糖甜110与270倍之间，莱鲍迪甙A比蔗糖甜150与 320倍之间。此外，莱鲍迪甙D也是在甜叶菊叶中积聚的高效二萜糖苷甜味剂。它可比蔗糖甜约200倍。莱鲍迪甙M是另一种高效二萜糖苷甜味剂。它在某些甜叶菊品种叶中以痕量存在，但已表明其具有优异的味道特征。

传统上已从甜叶菊植物中提取了甜菊醇糖苷。在甜叶菊中，(-)-贝壳杉烯酸(赤霉酸(GA)生物合成中的中间体)被转化成四环二萜甜菊醇，其然后通过多步糖基化途径进行以形成各种甜菊醇糖苷。然而，产率可以是可变的，并且受到农业和环境条件的影响。此外，甜叶菊种植需要大量的土地面积、在收获前的很长时间、密集劳动以及用于提取和纯化糖苷的额外成本。

最近，使用发酵工艺生产甜菊醇糖苷的兴趣日益增长。 WO2013/110673和WO2015/007748中描述了可用于产生至少甜菊醇糖苷莱鲍迪甙A、莱鲍迪甙D和莱鲍迪甙M的微生物。

此类微生物的进一步改进是令人希望的，以便可产生更高量的甜菊醇糖苷和/或另外或新的甜菊醇糖苷和/或更高量的特异性甜菊醇糖苷和/或具有期望比例的不同甜菊醇糖苷的甜菊醇糖苷的混合物。

发明概述

本发明基于鉴定能够介导甜菊醇糖苷转运的蛋白质。

因此，可以在重组宿主(例如微生物细胞)中过表达一种或更多种这样的蛋白质以增加甜菊醇糖苷转运出宿主。或者，可以修饰宿主(例如微生物细胞)，以相较于相应的未修饰版本的宿主表达更少一种或更多种这样的蛋白质。在这种情况下，宿主内可以保留更多甜菊醇糖苷，其然后被糖基化成包含更高数量的糖部分的甜菊醇糖苷。

因此，本发明涉及重组宿主，例如细胞，诸如微生物细胞，其产生甜菊醇糖苷到宿主外的程度高于不过表达所述蛋白质的相应宿主。这可便于更容易地回收甜菊醇糖苷。本发明还涉及能够产生甜菊醇糖苷的重组宿主，其过表达介导甜菊醇糖苷转运的异源多肽。

因此，本发明涉及能够产生甜菊醇糖苷的重组宿主，其过表达介导甜菊醇糖苷转运的多肽，并且所述多肽包含SEQ ID NO:35或SEQ ID NO: 38所示的氨基酸序列或与二者之任一具有至少约50％序列同一性的氨基酸序列。

本发明还涉及能够产生甜菊醇糖苷的重组宿主，其已被修饰，优选在其基因组中被修饰，以导致介导甜菊醇糖苷转运的多肽的产生缺陷，并且所述多肽包含SEQ ID NO:35或SEQ ID NO:38所示的氨基酸序列或与二者之任一具有至少约50％序列同一性的氨基酸序列。

本发明还涉及(在宿主内和/或在宿主外)包含甜菊醇糖苷的重组宿主，所述甜菊醇糖苷相较于未根据本发明修饰的相应宿主具有更高或更低的平均糖基化数。

本发明还涉及：

-一种制备甜菊醇糖苷的方法，其包括在合适的发酵培养基中发酵根据前述权利要求中任一项所述的重组宿主，以及任选地回收所述甜菊醇糖苷；

-发酵液，其包含能够通过本发明的方法获得的甜菊醇糖苷；

-通过本发明的方法或发酵液获得的甜菊醇糖苷；

-组合物，其包含两种或更多种本发明的或通过本发明的方法能够获得的甜菊醇糖苷；

-包含本发明的甜菊醇糖苷或组合物的食品、饲料或饮料。

附图简介

图1示出了质粒pUG7-KanMX的示意图。

图2示出了设计(A)ERG20、tHMG1和BTS1过表达盒并整合 (B)到酵母基因组中的方法的示意图。(C)显示了通过Cre重组酶移除 KANMX标记后的最终情形。

图3示出了ERG9敲低(knock down)构建体的示意图。其由ERG9 的500bp长的3'部分、TRP1启动子的98bp、TRP1开放阅读框和终止子、随后的ERG9的400bp长的下游序列组成。由于在ERG9开放阅读框末端引入了XbaI位点，所以最后一个氨基酸变成Ser，终止密码子变成 Arg。新的终止密码子位于TPR1启动子中，从而导致18个氨基酸的延伸。

图4示出了UGT2_1a如何整合到基因组中的示意图。A.转化中使用的不同片段；B.整合后的情形；C.Cre重组酶表达后的情形。

图5示出了从GGPP到RebA的途径如何整合到基因组中的示意图。

A.转化中使用的不同片段；B.整合后的情形。

图6示出了KAH和CPR如何整合到基因组中的示意图。A.转化中使用的不同片段；B.整合后的情形。

图7示出了质粒pUG7-NAT的示意图。

图8示出了CPS如何整合到基因组中的示意图。A.转化中使用的不同片段；B.整合后的情形。

图9示出了质粒Sc_2_5-2_a.bbn的示意图。

图10示出了质粒pUG7-HYG的示意图。

图11示出了转运体基因ALNQ_007_38000和ALNQ_214_12000如何整合到基因组中的示意图。A.转化中使用的不同片段；B.整合后的情形。

图12示出了具有过表达的转运体ALNQ_007_38000和 ALNQ_214_12000的菌株的上清液中的莱鲍迪甙A产生。

图13示出了具有过表达的转运体ALNQ_007_38000和 ALNQ_214_12000的菌株的上清液中的莱鲍迪甙B产生。

图14示出了导致甜菊醇糖苷生物合成的潜在途径的示意图。以星号显示的化合物是13-[(β-D-吡喃葡萄糖基)氧基)贝壳杉-16-烯-18-酸2-O-β-D- 吡喃葡萄糖基-β-D-吡喃葡萄糖基酯。

序列表说明

表15中示出了序列说明。可以参考序列表或者参考也示于表15中的数据库登录号来定义本文所述的序列。

发明详述

在本说明书和所附权利要求书中，词语“包含”、“包括”和“具有”以及变化形式应被解释为包含性的。也就是说，这些词语意图表达在上下文允许的情况下可包含未具体叙述的其他要素或整数。

不使用数量词修饰时在本文中指代一个/种或多于一个/种(即一个/种或至少一个/种)的语法对象。举例来说，“要素”可意指一个/种要素或多于一个/种要素。

本发明涉及鉴定能够介导甜菊醇糖苷转运的多肽。这种多肽可以直接介导甜菊醇糖苷转运，即可以是转运体蛋白，或者可以间接介导甜菊醇糖苷转运。这种多肽可以能够介导一种或更多种甜菊醇糖苷的转运。

本发明涉及过表达或具有降低表达的这种多肽的重组宿主。根据上下文，术语重组宿主或重组细胞可以互换使用。

如本文所述的这种多肽可以在能够产生一种或多种甜菊醇糖苷的重组宿主(例如重组宿主细胞)中过表达。这种细胞与不过表达所述多肽的相应细胞相比可以能够产生更多的一种或多种细胞外甜菊醇糖苷。也就是说，与相应的非重组细胞相比，根据本发明的重组细胞可以具有增加或减少的甜菊醇糖苷转运。

因此，本发明提供了能够产生甜菊醇糖苷的重组宿主，其过表达多肽，所述多肽是能够介导甜菊醇糖苷转运的多肽，并且所述多肽包含SEQ ID NO:35或SEQ ID NO:38所示的氨基酸序列或者与二者之任一具有至少约50％序列同一性的氨基酸序列。

还可以在宿主(例如重组宿主细胞)中修饰这种多肽的表达，使得与未经类似修饰的相应细胞相比，这种多肽的表达降低。以这种方式，与未经类似修饰的相应细胞相比，一种或多种细胞外甜菊醇糖苷的量可降低。这可以允许：与未经类似修饰的相应细胞相比，一种或多种细胞内甜菊醇糖苷的糖基化增加。因此，这种宿主与未经类似修饰的相应细胞相比可以包含具有更高平均糖基化数的甜菊醇糖苷。

因此，本发明提供了能够产生甜菊醇糖苷的重组宿主，其已被修饰，优选在其基因组中被修饰，以导致多肽的产生缺陷，所述多肽是能够介导甜菊醇糖苷转运的多肽，并且所述多肽包含SEQ ID NO:35或SEQ ID NO:38所示的氨基酸序列或与二者之任一具有至少约50％序列同一性的氨基酸序列。

本发明的宿主细胞是重组宿主细胞。从这个意义上讲，“重组”表示宿主细胞是非天然存在的宿主细胞，例如通过使用重组技术引入一个或多个核酸而被修饰。用于修饰宿主细胞以获得本发明重组宿主细胞的核酸可以是天然存在的核酸或非天然存在的核酸。

因此，关于本发明的宿主使用时，“重组”表示细胞已通过引入一种或多种异源核酸或蛋白质或改变天然核酸或蛋白质而被修饰，或者细胞来源于如此修饰的细胞。在本文中使用时，术语“异源”是指并非天然存在于宿主细胞中的核酸或氨基酸序列。换句话说，核酸或氨基酸序列与宿主细胞中天然存在的核酸或氨基酸序列不同。

本发明涉及能够产生甜菊醇糖苷的重组宿主，其过表达介导甜菊醇糖苷转运的异源多肽。这种异源多肽可以获自或来源于不同于宿主的属或种的属或种。因此，如果重组宿主是酵母，则介导甜菊醇糖苷转运的异源多肽可以获自或来源于不同的酵母属或种。

例如，如果宿主细胞是Saccharomyces(例如S.cerevisiae、S. bayanus、S.pastorianus、S.carlsbergensis)，则介导甜菊醇糖苷转运的异源多肽可以获自或来源于Candida(例如C.krusei、C.revkaufi、C. pulcherrima、C.tropicalis、C.utilis)、Issatchenkia(例如I.orientalis)或Yarrowia(例如Y.lipolytica(以前归类为Candidalipolytica))。

例如，如果宿主细胞是Candida(例如C.krusei、C.revkaufi、C. pulcherrima、C.tropicalis、C.utilis)，则介导甜菊醇糖苷转运的异源多肽可以获自或来源于Saccharomyces(例如S.cerevisiae、S.bayanus、S. pastorianus、S.carlsbergensis)、Issatchenkia(例如I.orientalis)或 Yarrowia(例如Y.lipolytica(以前归类为Candidalipolytica))。

例如，如果宿主细胞是Issatchenkia(例如I.orientalis)，则介导甜菊醇糖苷转运的异源多肽可以获自或来源于Saccharomyces(例如S. cerevisiae、S.bayanus、S.pastorianus、S.carlsbergensis)、Candida(例如C.krusei、C.revkaufi、C.pulcherrima、C.tropicalis、C.utilis)或 Yarrowia(例如Y.lipolytica(以前归类为Candida lipolytica))。

例如，如果宿主细胞是Yarrowia(例如Y.lipolytica(以前归类为 Candidalipolytica))，则介导甜菊醇糖苷转运的异源多肽可以获自或来源于Saccharomyces(例如S.cerevisiae、S.bayanus、S.pastorianus、S. carlsbergensis)、Candida(例如C.krusei、C.revkaufi、C.pulcherrima、 C.tropicalis、C.utilis)或Issatchenkia(例如I.orientalis))。

如果宿主细胞是Saccharomyces cerevisiae，则介导甜菊醇糖苷转运的异源多肽可以获自或来源于Yarrowia lipolytica(以前归类为Candida lipolytica)、Candidakrusei或Issatchenkia orientalis。

如果宿主细胞是Yarrowia lipolytica，则介导甜菊醇糖苷转运的异源多肽可以获自或来源于Saccharomyces cerevisiae、Yarrowia lipolytica(以前归类为Candidalipolytica)或Candida krusei或Issatchenkia orientalis。

如果宿主细胞是Candida krusei或Issatchenkia orientalis，则介导甜菊醇糖苷转运的异源多肽可以获自或来源于Saccharomyces cerevisiae或 Yarrowialipolytica。

术语“来源于”也涵盖术语“源自”、“获自”、“能够获自”、“分离自”和“由……产生”，其通常表示一种指定材料来源于另一种指定材料或者具有可以参照另一种指定材料描述的特征。在本文中使用时，“来源于”微生物的物质(例如，核酸分子或多肽)可以表示该物质对于该微生物是天然的或者是该微生物的天然物质，但也可以表示已从天然版本改变的物质。

因此，例如，重组细胞可表达在天然(非重组)形式的细胞内不存在的本文所定义的多肽。或者，可修饰重组细胞以使编码本文所定义的多肽的天然基因的表达程度高于天然“非重组”形式的细胞内发生的程度。

或者，可修饰重组细胞以使编码本文所定义的多肽的天然基因的表达程度低于天然“非重组”形式的细胞内发生的程度。

在本发明的细胞中，可以过表达本文所定义的多肽。在本文中，“过表达的”、“过表达”等意味着重组宿主细胞比不过表达所述多肽的相应细胞表达更多的多肽，或者所述多肽在通常不表达该蛋白质的细胞中表达。或者，可以通过表达具有更高比活性的变体多肽来实现过表达。

本发明的重组细胞可以被修饰，优选在其基因组中，以导致如本文所定义的多肽的产生缺陷。

这种细胞可以来自亲本宿主细胞并且与亲本宿主细胞相比被修饰，优选在其基因组中被修饰，以获得与其所来源自的亲本宿主细胞相比不同的基因型和/或不同的表型。

已被修饰(优选在其基因组中)以导致如本文所定义的多肽产生缺陷的这种细胞是已被修饰(优选在其基因组中)以导致表型特征的突变宿主细胞，其中当与未被修饰的亲本微生物宿主细胞相比并且在相同条件下分析时，所述细胞：a)产生更少产物或基本上不产生产物，和/或b)产生具有降低的活性或降低的比活性的产物或者没有活性或没有比活性的产物，以及这些可能性中的一种或多种的组合。

这种重组宿主可以是编码如本文所述的多肽的核酸序列的全部或部分敲除。

术语“重组”与“经遗传修饰”同义。

因此，本发明涉及过表达被鉴定为具有甜菊醇糖苷转运介导活性的多肽或所述多肽缺陷的重组宿主：通常，宿主是可用于产生甜菊醇糖苷的宿主。给定的重组宿主产生甜菊醇糖苷的能力可以是非重组形式的宿主的性质，或者可以是引入一种或多种重组核酸序列(即编码导致产生甜菊醇糖苷的酶)的结果。

出于本发明的目的，具有甜菊醇糖苷转运介导活性的多肽(即介导甜菊醇糖苷转运的多肽)是对穿过细胞膜转运一种或多种甜菊醇糖苷有影响的多肽。影响可以是直接的，即多肽可以是转运体蛋白或包含功能性转运体区域。或者，影响可以是间接的，即多肽不是转运体蛋白，但其活性仍然对甜菊醇糖苷转运有影响。

通常，效果是这样的：提高多肽的表达水平增加穿过细胞膜转运一种或多种甜菊醇糖苷的量(与多肽的表达水平更低的相应细胞相比)。相反，降低多肽的表达水平可以降低穿过细胞膜转运一种或多种甜菊醇糖苷的量(与多肽的表达水平更高的相应细胞相比)。

通常，本发明的重组宿主能够产生甜菊醇糖苷。例如，本发明的重组宿主可以能够产生例如但不限于甜菊醇-13-单糖苷、甜菊醇-19-单糖苷、 13-[(β-D-吡喃葡萄糖基)氧基)贝壳杉-16-烯-18-酸2-O-β-D-吡喃葡萄糖基-β- D-吡喃葡萄糖基酯、甜茶苷、甜菊苷、甜菊醇-19-双糖苷、甜菊醇双糖苷、rebA、rebB、rebC、rebD、rebE或rebM中的一种或更多种。本发明的重组宿主可以能够产生在Ceunen和Geuns,Journal of Natural Products 76(6),1201-1228,2013中所示的甜菊醇糖苷中的一种或多种。

因此，本发明的细胞可以是这样的细胞，其中相较于不过表达或不具有本发明细胞的降低水平的表达的相应细胞，与细胞内相比的细胞外甜菊醇糖苷的总量更高或更低。

或者，相较于不过表达或不具有本发明细胞的降低水平的表达的相应细胞，本发明的细胞可以具有相同的与细胞内相比的细胞外甜菊醇糖苷的总量，但在细胞内外可以具有改变的甜菊醇糖苷分布。

因此，本发明的重组宿主能够产生甜菊醇糖苷。例如，本发明的重组宿主可以能够产生例如甜菊醇-13-单糖苷、甜菊醇-19-单糖苷、13-[(β-D- 吡喃葡萄糖基)氧基)贝壳杉-16-烯-18-酸2-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖基酯、甜茶苷、甜菊苷、甜菊醇-19-双糖苷、甜菊醇双糖苷、rebA、 rebB、rebC、rebD、rebE或rebM中的一种或更多种。

因此，本发明的重组宿主可以是这样的，其中细胞产生的rebA的至少约10％、至少约20％、至少约30％、至少约40％、至少约50％在细胞外。

因此，本发明的重组宿主可以是这样的，其中细胞产生的rebD的至少约10％、至少约20％、至少约30％、至少约40％、至少约50％在细胞外。

因此，本发明的重组宿主可以是这样的，其中细胞产生的rebM的至少约10％、至少约20％、至少约30％、至少约40％、至少约50％在细胞外。

本发明的重组宿主可以是这样的，其中细胞产生的rebA的不超过约 50％、不超过约40％、不超过约30％、不超过约20％、不超过约10％在细胞外。

本发明的重组宿主可以是这样的，其中细胞产生的rebD的不超过约 50％、不超过约40％、不超过约30％、不超过约20％、不超过约10％在细胞外。

本发明的重组宿主可以是这样的，其中细胞产生的rebM的不超过约 50％、不超过约40％、不超过约30％、不超过约20％、不超过约10％在细胞外。

本发明的重组细胞可以是这样的，其中甜菊醇糖苷的平均糖基化数为至少3、至少4、至少5、至少6或更大。与未根据本发明修饰的相应细胞相比，平均糖基化数可以增加或降低。例如，当过表达如本文所述的多肽时，平均糖基化可降低。例如，当本发明多肽的表达降低时，平均糖基化可增加(特别是在细胞本身中)。

平均糖基化可以指本发明的重组细胞的上清液中的平均糖基化或培养液(沉淀+上清液)中的平均糖基化。

因此，本发明提供了能够产生甜菊醇糖苷的重组细胞，所述重组细胞或者过表达下述多肽或者在下述多肽的表达方面有缺陷，所述多肽包含 SEQ ID NO：35或SEQ ID NO：38所示的氨基酸序列或者与二者之任一具有至少约50％序列同一性的氨基酸序列。这种氨基酸序列具有甜菊醇糖苷转运的作用，即是甜菊醇糖苷转运的介导物。

所述多肽还可以被定义为包含以下氨基酸序列(或与其具有至少约 45％序列同一性的氨基酸序列)的多肽：

MSALNTDALESQPDFKFQRQKRLMSPFMSKKVPPIPTKEERKPYGEYHTNILFRIMFWWLNPIL NVGYKRTLTEQDLFYLDNSQTMDTLYETFKSHLKTTIEKSMKKYLQEKYSKEGKTYDPSSIPTAE DLKDFQIPIYAIPLCLFKTLYWQYSLGNLYKVLSDCTSATTPLLQKKLINFVQMKSFTALGSTGKG VGYAIGVCLMIFFQAITVNHAFHNLQICGAKSKAILTRMLLDKSMSVDARGNHFFPASKVQSMIST DLNRVDLAIGFFPFALTCVFPIAICIGLLIWNVGVSALVGIAIFVANVGLLAVSIPRLMRFRIKAMVFT DKRVTLMKELLKNFKMIKFYSWENSYARRIQDARFKEMKLILSLQSLRNIVMSVSFAMPTLASMA TFCTAFDITSGKNAASLFSSLSLFQVLSMQFMLAPVALNTAADMMVSMKKFNQFLAHADLDPEQ YRIEEFHDDKLAVKVDNATFEWDTFDDDKVEDPALEFEKQDNDSLEKVSSHNTVDYDSTEKIRN DTSSIDSTKILEKTAFPGLRNINLEIKKGEFVVVTGSIGAGKSSLLQAISGLMKRVSGKVYVDGDLL LCGYPWVQNATIRDNILFGLPFDQEKYDQVVYACSLQSDFNQFQGGDMTEVGERGITLSGGQK ARINLARSVYADKDIILLDDVLSAVDAKVGRHIVDTCLLGLLKDKTRIMATHQLSLIDSADRMIFLNG DGSIDCGTISELKDRNEKLNELLSHQKDKANDSDEELELQEEIESKEQHLKEDLSEVKHEIKEEQK KMEISGDVGEEFEHADEHKEIVRIIGDEERAVNALKADVYINYAKLAFGKLGLFSLMLFVTVAALQ TYCNMFTNTWLSFWIEEKFHGRSKSFYMGIYIMFAFLYTFFLAAFFYSMCYFCNRASKYLNYKA SEKILHVPMSFMDISPIGRVLNRFTKDTDVLDNEILDQFRQFLSPFCNAIGTIVLCIIYIPWFAIAVPL IVTFYVLVANYYQASAREIKRLEAVKRSLVFGHFNEALSGKETIKAYRAIDRVKQRLNKLIDGQNE AYFLTIVNQRWLGANLSILSFCMVFIISFLCVFRVFNISAASTGLLLTYVINLTNTITMMMRAMTQV ENEFNSVERLNHYAFDLVQEAPYEIPENDPPQDWPKYGEIIFKDVSMRYRPELPFVLKNINLSIG KGEKIGFCGRTGAGKSTFMTCLYRISEFEGTIVIDDVDISKLGLHKLRSKLTIIPQDPVLFVGSIRE NLDPFGEYSDEELWEALTISGLINKEDLNEVKKQNENDDNLNKFHLIRMVEDDGVNFSIGERQLI ALARALVRKTKILILDEATSSVDYATDSRIQKTIATEFDDCMILCIAHRLNTILNYDKIVVMDKGEIVE FDKPRSLFMREEGVFRSMCEQANITIEDFP(SEQ ID NO：35)；或

MKSDNIAMEDLPDSKYLKQRRLLTPLMSKKVPPIPSEDERKAYGEYYTNPVSRMMFWWLNPILK VGYRRTLTENDLFYLEDRQRTETLYEIFRGYLDEEIARAWKKSQESSDDPREFKLPIYIIPLCLFKT MKWEYSRGILQKILGDCASATTPLLQKKLINFVQVKTFSNVGNTGQGVGYAIGVCLMIFFQVLML THAFHNFQISGAKAKAVLTRLLLDKSLTVDARGNHYFPASKIQSMISTDLNRIDLAVGFAPVGFVT IFPIIICIALLIWNVGVSALVGIGVFIANIFVLGLFVSSLMLYREKAMVFTDKRVNLVKELLKNFKMIK FYSWENSYQDRIENARNNEMKYILRLQLLRNFVFSLAFAMPVLASMATFCTAFKITDGKSAASVF SSLSLFEVLSLQFILAPFSLNSTVDMMVSVKKINQFLQHKDTNPNEFSVEKFSDSTLAIKVDNASF EWDTFEDEEKDYEEEAKTKDNIEDEDHNCATETIKGKITVDYKSDSDSISSTLTKGVKTAFPGLN NINLEIAKGEFIVVTGAIGSGKSSLLQAISGLMKRTSGEVYVDGDLLLCGYPWVQNSTIRENILFGLPFNKERYDQVVYSCSLQSDFDQFQGGDMTEVGERGITLSGGQKARINLARSVYADKDIILLDD VLSAVDAKVGKHIVNTCILGLLGGKTRIMATHQLSLIDSADRMVFLNGDGTIDFGTIPELRKRNQK LIELLQHQRDPGQDKEDLSNDLDIQGSTDEGQQIEHADEHKEIVKIIGDEEKAVNALSFQVYYNY CKLAFGKLGYISMLVFIIVSSLETFTQIFTNTWLSFWIEDKFVSRSKNFYMGIYIMFAFLYAIMLCFF LFLLGYFCVKAAERLNIKASRKILHVPMSFMDISPIGRVLNRFTKDTDVLDNELLEQLIQFLSPLFN CFGIIILCIVYIPWFAIGVPIILGFYFIIASYYQASAREIKRLEAVKRSFVFGHFHEVLTGKDTIKAYNA IDRMKLKLNKLIDEQNEAYYLTIANQRWLGANLAIVSFSMVFVISFLCIFRVFNISAASTGLLLTYVI ALTDSITMIMRAMTQVENEFNSVERVNHYAFDLIQEAPYEIPENDPAEDWPQHGKIEFKDVSMR YRPELPFVLKNINLSVREQEKIGFCGRTGAGKSTFMTCLYRITEYEGLISIDGVDISRLGLHRLRSKLTIIPQDPVLFVGTIRENLDPFTEHSDDELWEALAISGLIEREDLEVVKGQEKIGGNDSGKLHKFH LVRMVEDDGINFSLGERQLIALARALVRKSKILILDEATSSVDYATDSKIQRTIASEFRDCTILCIAH RLNTILGYDKIVVMDNGEIVEFENPKLLFMRENSVFRSMCEQANITINDFE(SEQ ID NO：38)

通常具有甜菊醇糖苷转运介导活性的多肽可以包含这样的氨基酸序列，所述氨基酸序列与SEQ ID NO：35具有至少约50％、至少约55％、至少约60％、至少约65％、至少约70％、至少约75％、至少约80％、至少约85％、至少约86％、至少约87％、至少约88％、至少约89％、至少约 90％、至少约91％、至少约92％、至少约93％、至少约94％、至少约 95％、至少约96％、至少约97％、至少约98％或至少约99％的序列同一性。

通常具有甜菊醇糖苷转运介导活性的多肽可以包含这样的氨基酸序列，所述氨基酸序列与SEQ ID NO:38具有至少约50％、至少约55％、至少约60％、至少约65％、至少约70％、至少约75％、至少约80％、至少约85％、至少约86％、至少约87％、至少约88％、至少约89％、至少约 90％、至少约91％、至少约92％、至少约93％、至少约94％、至少约 95％、至少约96％、至少约97％、至少约98％或至少约99％的序列同一性。

由存在于本发明的重组宿主中的重组核酸编码的、通常具有甜菊醇糖苷转运介导活性的多肽可以包含氨基酸序列，所述氨基酸序列是本文所述氨基酸序列的片段，例如这种氨基酸序列的截短版本。

也就是说，本发明还涉及重组宿主，其过表达如本文所述的具有甜菊醇糖苷转运介导活性的多肽的生物学活性片段。

本发明多肽的生物活性片段包括这样的多肽，其包含与SEQ ID NO: 35或SEQ IDNO:38的氨基酸序列足够同一或来源于SEQ ID NO:35或 SEQ ID NO:38的氨基酸序列的氨基酸序列，其比SEQ ID NO:35或SEQ ID NO:38中给出的全长多肽包含更少氨基酸，但展示出相应全长多肽的至少一种生物学活性。

通常，生物活性片段包含具有本发明多肽的至少一种活性的结构域或基序。本发明多肽的生物活性片段可以是这样的多肽，例如，其长度为约 10、约25、约50、约100或更多个氨基酸或至少约100个氨基酸、至少 150、200、250、300、350、400、600、1000个氨基酸或长度达到本发明多肽的氨基酸总数。此外，多肽的其他区域缺失的其他生物学活性部分可以通过重组技术制备，并且可以评估其的一种或多种天然形式本发明多肽的生物学活性。本发明的特征还在于编码本发明多肽的上述生物活性片段的核酸片段。

本发明的重组宿主可以过表达这种多肽或所述多肽缺陷。

本发明的重组宿主可以包含编码多于一种这种多肽(例如两种、三种、四种或更多种这种多肽)的重组核酸序列。如此编码的多肽可以相同或不同。

可以修饰本发明的重组细胞以降低多于一种这种多肽(例如2、3、4 或更多种这种多肽)的表达水平。

由存在于重组宿主中的重组核酸编码的过表达的多肽可以是可获自或来源于或发现于Pichia属的生物体中的多肽，例如可获自或来源于或发现于Pichia kudriavzeii的多肽。

如本文所用，术语“多肽”是指包含通过肽键连接的氨基酸残基并含有多于五个氨基酸残基的分子。氨基酸由单字母或三字母名称标识。如本文所用的术语“蛋白质”与术语“多肽”同义，并且还可指两种或更多种多肽。因此，术语“蛋白质”、“肽”和“多肽”可互换使用。多肽可任选地进行修饰 (例如，糖基化、磷酸化、酰化、法尼基化、异戊二烯化、磺化等)以增加官能度。展现活性的多肽可被称为酶。应理解，作为遗传密码简并的结果，可产生编码给定多肽的许多核苷酸序列。

由用于本发明的重组宿主的重组核酸所编码的多肽可以包含信号肽和/ 或前肽序列。如果本发明的多肽包含信号肽和/或前肽，可以在成熟多肽序列上计算序列同一性。

用于在本发明的重组宿主中使用的重组核酸序列可以以核酸构建体的形式提供。术语“核酸构建体”是指单链或双链的核酸分子，其从天然存在的基因中分离或已经被修饰以含有以否则将不会在自然中存在的方式组合和并置的核酸的区段。当核酸构建体含有表达编码序列所需要的所有控制序列时，术语核酸构建体与术语“表达盒”的含义相同，其中所述控制序列可操作地连接至所述编码序列。

用于在本发明的重组宿主中使用的重组核酸序列可以以表达载体的形式提供，其中多核苷酸序列可操作地连接到至少一个控制序列用于在重组宿主细胞中表达多核苷酸序列。

如本文所用的术语“可操作地连接”是指物理地连接并且彼此有功能性关系的两个或多个核酸序列元件。例如，如果启动子能够起始或调控编码序列的转录或表达，则启动子可操作地连接至编码序列，在这种情况下，所述编码序列应被理解为在启动子的“控制下”。通常，当两个核酸序列可操作地连接时，它们将处于相同的取向并且通常也在同一阅读框中。它们通常将是基本上连续的，尽管这可能不是必需的。

表达载体包含编码本文所述多肽的多核苷酸，其可操作地连接至用于在体外或在宿主细胞中表达和/或翻译多核苷酸的适当控制序列(如启动子以及转录和翻译终止信号)。

表达载体可以是能够方便地进行重组DNA程序并能使多核苷酸表达的任何载体(例如，质粒或病毒)。载体的选择通常将取决于所述载体与待引入所述载体的细胞的相容性。载体可以是线性或闭合的环状质粒。载体可以是自主复制型载体，即作为染色体外实体而存在、其复制独立于染色体复制的载体，例如，质粒、染色体外元件、微型染色体或人工染色体。

或者，载体可以是当被引入宿主细胞时整合至基因组中并与其已整合至其中的染色体一起复制的载体。整合型克隆载体可随机或在预定靶基因座处整合在宿主细胞的染色体中。载体可包含一个或多个选择性标记，其允许容易地选择转化的细胞。

可以根据本领域技术人员熟知的方法生成能够产生甜菊醇糖苷的重组宿主，所述重组宿主已被修饰(优选在其基因组中被修饰)以导致本文所述多肽的产生缺陷。可以修饰编码本文所述多肽的序列，使得发生更少或不发生多肽的表达。例如，可以部分或全部缺失编码本文所述多肽的序列。

本发明的重组宿主可以包含如本文所述的任何多肽。本发明的重组宿主可以过表达本文所述的任何多肽或有本文所述的任何多肽的缺陷。通常，本发明的重组宿主能够产生甜菊醇糖苷。例如，本发明的重组宿主可以能够产生例如甜菊醇-13-单糖苷、甜菊醇-19-单糖苷、13-[(β-D-吡喃葡萄糖基)氧基)贝壳杉-16-烯-18-酸2-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖基酯、甜茶苷、甜菊苷、甜菊醇-19-双糖苷、甜菊醇双糖苷、rebA、rebE、rebD或rebM中的一种或更多种。

本发明的重组宿主可包含编码具有UDP-糖基转移酶(UGT)活性的一种或多种多肽的一种或多种重组核酸序列。

为了本发明的目的，具有UGT活性的多肽是具有糖基转移酶活性 (EC 2.4)的多肽，即可以充当催化剂以将单糖单元从活化的核苷酸糖 (又称“糖基供体”)转移到糖基受体分子(通常是醇)的多肽。UGT的糖基供体典型地是核苷酸糖尿苷二磷酸葡萄糖(尿嘧啶-二磷酸葡萄糖， UDP-葡萄糖)。

可以选择这种另外的UGT以产生期望的甜菊醇糖苷。Humphrey等人, PlantMolecular Biology(2006)61:47-62和Mohamed等人,J.Plant Physiology 168(2011)1136-1141中示出了甜菊醇糖苷形成的示意图。另外，图14示出了甜菊醇糖苷形成的示意图。

因此，本发明的重组宿主可包含一个或多个编码以下项中的一种或多种的重组核酸序列：

(i)具有UGT74G1活性的多肽；

(ii)具有UGT2活性的多肽；

(iii)具有UGT85C2活性的多肽；和

(iv)具有UGT76G1活性的多肽。

适用于本发明的重组酵母可包含编码能够催化向甜菊醇中添加C-13- 葡萄糖的多肽的核苷酸序列。也就是说，适用于本发明方法的重组酵母可包含能够催化将甜菊醇转化为甜菊单糖苷的反应的UGT。

适用于本发明方法的这种重组酵母可包含编码具有由UDP-糖基转移酶(UGT)UGT85C2所示的活性的多肽的核苷酸序列，由此酵母转化后，核苷酸序列赋予所述酵母将甜菊醇转化为甜菊单糖苷的能力。

UGT85C2活性是将葡萄糖单元转移至甜菊醇的13-OH。因此，合适的UGT85C2可充当尿苷5'-二磷酸葡糖基:甜菊醇13-OH转移酶和尿苷5'- 二磷酸葡糖基:甜菊醇-19-O-糖苷13-OH转移酶。功能性UGT85C2多肽还可催化葡糖基转移酶反应，所述反应利用除甜菊醇和甜菊醇-19-O-糖苷以外的甜菊醇糖苷底物。此类序列可在本文中称为UGT1序列。

适用于本发明的重组酵母可以包含编码具有UGT2活性的多肽的核苷酸序列。

具有UGT2活性的多肽是充当尿苷5'-二磷酸葡萄糖基:甜菊醇-13-O-糖苷转移酶(又称甜菊醇-13-单葡萄糖苷1,2-转葡萄糖基酶)的多肽，其将葡萄糖部分转移到受体分子甜菊醇-13-O-糖苷的13-O-葡萄糖的C-2'。典型地，适合的UGT2多肽还可以充当将葡萄糖部分转移到受体分子甜茶苷的 13-O-葡萄糖的C-2’的尿苷5'-二磷酸葡萄糖基:甜茶苷转移酶。

具有UGT2活性的多肽也可以催化利用除甜菊醇-13-O-糖苷和甜茶苷以外的甜菊醇糖苷底物的反应，例如，功能性UGT2多肽可利用甜菊苷作为底物，从而将葡萄糖部分转移至19-O-葡萄糖残基的C-2'以产生莱鲍迪甙E。功能性UGT2多肽也可以利用莱鲍迪甙A作为底物，从而将葡萄糖部分转移至19-O-葡萄糖残基的C-2'以产生莱鲍迪甙D。然而，功能性UGT2多肽可以是这样的多肽，其不将葡萄糖部分转移至在C-13位具有 1,3-结合的葡萄糖的甜菊醇化合物，即将葡萄糖部分转移至甜菊醇1,3-双糖苷和1,3-甜菊苷通常不会发生。

具有UGT2活性的多肽也可以从除尿苷二磷酸葡萄糖以外的供体转移糖部分。例如，具有UGT2活性的多肽充当尿苷5'-二磷酸D-木糖基:甜菊醇-13-O-糖苷转移酶，其将木糖部分转移至受体分子甜菊醇-13-O-糖苷的 13-O-葡萄糖的C-2'。作为另一个实例，具有UGT2活性的多肽可充当尿苷 5'-二磷酸L-鼠李糖基:甜菊醇-13-O-糖苷转移酶，其将鼠李糖部分转移至受体分子甜菊醇的13-O-葡萄糖的C-2'。

适用于本发明方法的重组酵母可以包含编码具有UGT活性的多肽的核苷酸序列，可以包含编码能够催化向甜菊双糖苷添加C-19-葡萄糖的多肽的核苷酸序列。也就是说，本发明的重组酵母可以包含能够催化将甜菊双糖苷转化成甜菊苷的反应的UGT。因此，这种重组酵母可以能够将甜菊双糖苷转化为甜菊苷。这种核苷酸序列的表达可以赋予重组酵母生产至少甜菊苷的能力。

因此，适用于本发明方法的重组酵母还可以包含编码具有由UDP-糖基转移酶(UGT)UGT74G1所示的活性的多肽的核苷酸序列，由此当转化酵母后，所述核苷酸序列赋予细胞将甜菊双糖苷转化为甜菊苷的能力。

合适的UGT74G1多肽可以能够将葡萄糖单元分别转移至甜菊醇的13- OH和/或19-COOH。合适的UGT74G1多肽可充当尿苷5'-二磷酸葡糖基: 甜菊醇19-COOH转移酶和/或尿苷5'-二磷酸葡糖基:甜菊醇-13-O-糖苷19- COOH转移酶。功能性UGT74G1多肽还可催化使用除甜菊醇和甜菊醇- 13-O-糖苷以外的甜菊醇糖苷底物或者从除尿苷二磷酸葡萄糖以外的供体转移糖部分的糖基转移酶反应。此类序列可在本文中称为UGT3序列。

适用于本发明方法的重组酵母可包含编码能够催化甜菊苷的C-13位置处的葡萄糖的C-3'的葡糖基化的多肽的核苷酸序列。也就是说，适用于本发明方法的重组酵母可包含UGT，所述UGT能够催化甜菊苷转化至莱鲍迪甙A的反应。因此，这种重组酵母可以能够将甜菊苷转化为莱鲍迪甙 A。这种核苷酸序列的表达可赋予酵母产生至少莱鲍迪甙A的能力。

适用于本发明方法的重组酵母可以因此还包含编码具有由UDP-糖基转移酶(UGT)UGT76G1所示的活性的多肽的核苷酸序列，由此当转化酵母后所述核苷酸序列赋予该酵母将甜菊苷转化为莱鲍迪甙A的能力。

合适的UGT76G1向受体分子甜菊醇1,2糖苷的C-13-O-葡萄糖的C-3' 添加葡萄糖部分。因此，UGT76G1充当例如尿苷5'-二磷酸葡糖基:甜菊醇 13-O-1,2葡糖苷C-3'葡糖基转移酶和尿苷5'-二磷酸葡糖基:甜菊醇-19-O-葡萄糖、13-O-1,2双糖苷C-3'葡糖基转移酶。功能性UGT76G1多肽还可催化葡糖基转移酶反应，所述反应使用含有除葡萄糖以外的糖的甜菊醇糖苷底物，例如甜菊醇鼠李糖苷和甜菊醇木糖苷。此类序列可在本文中称为 UGT4序列。UGT4可以替代地或者另外地能够将RebD转化为RebM。

适用于本发明方法的重组酵母通常包含编码至少一种具有UGT1活性的多肽、至少一种具有UGT2活性的多肽、至少一种具有UGT3活性的多肽和至少一种具有UGT4活性的多肽的核苷酸序列。这些核酸序列中的一种或更多种可以是重组的。给定的核酸可编码具有一种或更多种上述活性的多肽。例如，核酸编码具有两种、三种或四种上述活性的多肽。优选地，用于本发明方法的重组酵母包含UGT1、UGT2和UGT3以及UGT4 活性。合适的UGT1、UGT2、UGT3和UGT4序列在WO2015/007748的表1中进行了描述。

本发明的重组宿主可以包含两种或更多种编码具有任何一种UGT活性(例如，UGT1、UGT2、UGT3或UGT4活性)的多肽的核酸序列。当本发明的重组宿主包含两种或更多种编码具有任何一种UGT活性的多肽的核酸序列时，这些核酸序列可以相同或不同，和/或可编码相同或不同的多肽。特别地，本发明的重组宿主可以包含编码两种不同UGT2多肽的核酸序列。

根据本发明的重组宿主可以包含编码以下项中的一种或更多种的一种或更多种重组核苷酸序列：

具有对映-柯巴基焦磷酸合酶活性的多肽；

具有对映-贝壳杉烯合酶活性的多肽；

具有对映-贝壳杉烯氧化酶活性的多肽；以及

具有贝壳杉烯酸13-羟化酶活性的多肽。

出于本发明的目的，具有对映-柯巴基焦磷酸合酶(EC 5.5.1.13)的多肽能够催化化学反应：

所述酶具有一种底物，香叶基香叶基焦磷酸；以及一种产物，对映-柯巴基焦磷酸。所述酶参与赤霉素生物的合成。所述酶属于异构酶家族，特别是分子内裂解酶的类别。所述酶类别的系统名称是对映-柯巴基-二磷酸裂解酶(脱环)。通常使用的其他名称包括具有对映-柯巴基焦磷酸合酶、对映-贝壳杉烯合酶A和对映-贝壳杉烯合成酶A。

编码对映-柯巴基焦磷酸合酶的合适核酸序列可例如包含在 WO2015/007748的SEQ ID.NO:1、3、5、7、17、19、59、61、141、 142、151、152、153、154、159、160、182或184中列出的序列。

出于本发明的目的，具有对映-贝壳杉烯合酶活性(EC 4.2.3.19)的多肽是能够催化以下化学反应的多肽：

对映-柯巴基二磷酸

对映-贝壳杉烯+二磷酸

因此，所述酶具有一种底物，对映-柯巴基二磷酸；以及两种产物，对映-贝壳杉烯和二磷酸。

所述酶属于裂解酶家族，特别是作用于磷酸盐/酯的碳-氧裂解酶。所述酶类别的系统名称是对映-柯巴基二磷酸二磷酸-裂解酶(环化，对映-贝壳杉烯形成)。常用的其它名称包括对映-贝壳杉烯合酶B、对映-贝壳杉烯合成酶B、对映-柯巴基-二磷酸二磷酸-裂解酶和(环化)。所述酶参与双萜类生物合成。

编码对映-贝壳杉烯合酶的合适核酸序列可例如包含在 WO2015/007748的SEQID.NO:9、11、13、15、17、19、63、65、143、 144、155、156、157、158、159、160、183或184中列出的序列。

对映-柯巴基二磷酸合酶还可具有与相同蛋白质分子相关联的不同对映 -贝壳杉烯合酶活性。由对映-贝壳杉烯合酶催化的反应是赤霉素的生物合成途径中的下一步骤。两种类型的酶活性是不同的，并且定点诱变以抑制蛋白质的对映-贝壳杉烯合酶活性导致对映-柯巴基焦磷酸的积累。

因此，本发明重组宿主中使用的单个核苷酸序列可编码具有对映-柯巴基焦磷酸合酶活性和对映-贝壳杉烯合酶活性的多肽。或者，两种活性可被两个不同的分离的核苷酸序列编码。

出于本发明的目的，具有对映-贝壳杉烯氧化酶活性(EC 1.14.13.78) 的多肽是能够催化对映-贝壳杉烯的4-甲基的三次连续氧化以产生贝壳杉烯酸的多肽。这种活性通常需要细胞色素P450的存在。

编码对映-贝壳杉烯氧化酶的合适核酸序列可例如包含在WO2015/007748的SEQID.NO:21、23、25、67、85、145、161、162、 163、180或186中列出的序列。

出于本发明的目的，具有贝壳杉烯酸13-羟化酶活性(EC 1.14.13)的多肽是能够催化使用NADPH和O₂形成甜菊醇(对映-贝壳杉-16-烯-13-醇- 19-酸)的多肽。这种活性也可称为对映-贝壳杉烯酸13-羟化酶活性。

编码贝壳杉烯酸13-羟化酶的合适核酸序列可例如包含在 WO2015/007748的SEQID.NO:27、29、31、33、69、89、91、93、95、 97、146、164、165、166、167或185中列出的序列。

本发明的重组宿主可包含编码具有NADPH-细胞色素p450还原酶活性的多肽的重组核酸序列。也就是说，本发明的重组宿主可能够表达编码具有NADPH-细胞色素p450还原酶活性的多肽的核苷酸序列。出于本发明的目的，具有NADPH-细胞色素P450还原酶活性(EC1.6.2.4；也称为 NADPH:高铁血红蛋白氧化还原酶、NADPH:血红素蛋白氧化还原酶、NADPH:P450氧化还原酶、P450还原酶、POR、CPR、CYPOR)的多肽通常是一种这样的多肽，其为膜结合酶，从而允许电子从含有FAD和 FMN的酶NADPH:细胞色素P450还原酶(POR；EC1.6.2.4)转移至真核细胞的微粒体中的细胞色素P450。

在本发明的重组宿主中，可上调宿主产生香叶基香叶基二磷酸 (GGPP)的能力。在本发明的上下文中上调意味着重组宿主比等同的非重组宿主产生更多的GGPP。

因此，本发明的重组宿主可包含编码羟甲基戊二酰基-辅酶A还原酶、法尼基-焦磷酸合成酶和香叶基香叶基二磷酸合酶的一个或多个核苷酸序列，由此宿主转化后的所述核苷酸序列赋予宿主产生提高水平的GGPP 的能力。因此，根据本发明的重组宿主可包含编码羟甲基戊二酰基-辅酶A 还原酶、法尼基-焦磷酸合成酶和香叶基香叶基二磷酸合酶中的一种或多种的一个或多个重组核酸序列。

因此，本发明的重组宿主可包含编码以下中的一种或多种的核酸序列：

具有羟甲基戊二酰基-辅酶A还原酶活性的多肽；

具有法尼基-焦磷酸合成酶活性的多肽；和

本发明的重组宿主可以是例如多细胞生物或其细胞或单细胞生物。本发明的宿主可以是原核、古细菌或真核宿主细胞。

原核宿主细胞可以是但不限于细菌宿主细胞。真核宿主细胞可以是但不限于酵母、真菌、变形虫、藻类、动物、昆虫宿主细胞。

真核宿主细胞可以是真菌宿主细胞。“真菌”包括真菌(Eumycotina) 亚门的所有物种(Alexopoulos,C.J.,1962,在Introductory Mycology,John Wiley&Sons,Inc.(约翰威立出版有限公司),纽约)。因此，术语真菌包括丝状真菌和酵母等等。

“丝状真菌”在本文中定义为真核微生物，其包括真菌和卵菌亚门的所有丝状形式(如由Hawksworth等人，1995，同上所定义)。丝状真菌是以由壳多糖、纤维素、葡聚糖、壳聚糖、甘露聚糖以及其它复合多糖构成的菌丝壁为特征。营养体生长是通过菌丝延长，并且碳代谢是专性需氧的。丝状真菌菌株包括但不限于以下各项的菌株：Acremonium、Aspergillus、Agaricus、Aureobasidium、Cryptococcus、Corynascus、 Chrysosporium、Filibasidium、Fusarium、Humicola、Magnaporthe、 Monascus、Mucor、Myceliophthora、Mortierella、Neocallimastix、 Neurospora、Paecilomyces、Penicillium、Piromyces、Phanerochaete、 Podospora、Pycnoporus、Rhizopus、Schizophyllum、Sordaria、Talaromyces、Rasmsonia、Thermoascus、Thielavia、Tolypocladium、 Trametes以及Trichoderma。可充当宿主细胞的优选丝状真菌菌株属于以下物种：Aspergillus niger、Aspergillus oryzae、Aspergillus fumigatus、 Penicillium chrysogenum、Penicilliumcitrinum、Acremonium chrysogenum、 Trichoderma reesei、Rasamsonia emersonii(先前称为Talaromyces emersonii)、Aspergillus sojae、Chrysosporium lucknowense、Myceliophtora thermophyla。用于比较转化和未转化细胞的发酵特征的参考宿主细胞包括例如Aspergillus niger CBS120.49、CBS 513.88；Aspergillus oryzae ATCC16868、ATCC 20423、IF0 4177、ATCC 1011、ATCC 9576、 ATCC14488-14491、ATCC 11601、ATCC12892；Aspergillus fumigatus AF293(CBS101355)；P.chrysogenum CBS 455.95；Penicillium citrinum ATCC 38065；Penicillium chrysogenum P2；Acremoniumchrysogenum ATCC 36225、ATCC 48272；Trichoderma reesei ATCC 26921、ATCC 56765、ATCC 26921；Aspergillus sojae ATCC11906；Chrysosporium lucknowense ATCC44006以及所有这些菌株的衍生株。作为丝状真菌宿主细胞特别优选的是Aspergillus niger CBS513.88及其衍生株。

真核宿主细胞可以是酵母细胞。优选的酵母宿主细胞可选自以下属：酵母属(例如，S.cerevisiae、S.bayanus、S.pastorianus、S. carlsbergensis)、Brettanomyces、Kluyveromyces、Candida(例如，C. krusei、C.revkaufi、C.pulcherrima、C.tropicalis、C.utilis)、Issatchenkia (例如，I.orientalis)、Pichia(例如，P.pastoris和P.kudriavzevii)、 Schizosaccharomyces、Hansenula、Kloeckera、Pachysolen、Schwanniomyces、Trichosporon、Yarrowia(例如，Y.lipolytica)(先前分类为Candidalipolytica))、Yamadazyma。

原核宿主细胞可以是细菌宿主细胞。细菌宿主细胞可以是革兰氏阴性或革兰氏阳性细菌。细菌的实例包括但不限于，属于以下属的细菌： Bacillus(例如，B.subtilis、B.amyloliquefaciens、B.licheniformis、B. puntis、B.megaterium、B.halodurans、B.pumilus)、Acinetobacter、 Nocardia、Xanthobacter、Escherichia(例如，大肠杆菌(例如，菌株DH 1OB、Stbl2、DH5-α、DB3、DB3.1)、DB4、DB5、JDP682和ccdA-over (例如，美国申请号09/518,188)))、Streptomyces、Erwinia、 Klebsiella、Serratia(S.marcessans)、Pseudomonas(例如，P. aeruginosa)、Salmonella(例如，S.typhimurium、S.typhi)。细菌还包括但不限于光合细菌(例如，绿色非硫细菌(例如，Choroflexus细菌(例如C.aurantiacus)、Chloronema(例如，C.gigateum))、绿色硫细菌(例如，Chlorobium细菌(例如，C.limicola)、Pelodictyon(例如，P. luteolum)、紫色硫细菌(例如，Chromatium(例如，C.okenii))以及紫色非硫细菌(例如，Rhodospirillum(例如，R.rubrum)、Rhodobacter (例如R.sphaeroides、R.capsulatus)和Rhodomicrobium细菌(例如 R.vanellii))。

宿主细胞可以是来自非微生物生物体的宿主细胞。此类细胞的实例包括但不限于昆虫细胞(例如，Drosophila(例如，D.melanogaster)、 Spodoptera(例如，S.frugiperdaSf9或Sf21细胞)和Trichoplusa(例如， High-Five细胞))；线虫细胞(例如，C.elegans细胞)；禽类细胞；两栖动物细胞(例如，Xenopus laevis细胞)；爬行动物细胞；以及哺乳动物细胞(例如NIH3T3、293、CHO、COS、VERO、C127、BHK、Per- C6、Bowes黑色素瘤和HeLa细胞)。

根据本发明的重组宿主可能够在本领域中已知的任何合适的碳源上生长，并且将其转化为甜菊醇糖苷。重组宿主可能够直接转化植物生物质、纤维素、半纤维素、果胶、鼠李糖、半乳糖、岩藻糖、麦芽糖、麦芽糖糊精、核糖、核酮糖或淀粉、淀粉衍生物、蔗糖、乳糖和甘油。因此，优选的宿主表达酶如用于将纤维素转化成葡萄糖单体和将半纤维素转化成木糖和阿拉伯糖单体所需的纤维素酶(内切纤维素酶和外切纤维素酶)和半纤维素酶(例如内切和外切木聚糖酶、阿拉伯糖酶)，能够将果胶转化成葡萄糖醛酸和半乳糖醛酸的果胶酶或将淀粉转化成葡萄糖单体的淀粉酶。优选地，宿主能够转化选自由以下各项组成的组的碳源：葡萄糖、木糖、阿拉伯糖、蔗糖、乳糖和甘油。宿主细胞可例如是WO03/062430、 WO06/009434、EP1499708B1、WO2006096130或WO04/099381中所描述的真核宿主细胞。

因此，另一方面，本发明还提供了一种用于制备甜菊醇糖苷的方法，所述方法包括发酵本发明的重组宿主，所述重组宿主能够在合适的发酵培养基中产生至少一种甜菊醇糖苷；以及任选地回收所述甜菊醇糖苷。

在用于产生甜菊醇糖苷的方法中使用的发酵培养基可以是允许特定真核宿主细胞生长的任何合适的发酵培养基。发酵培养基的基本要素是本领域的技术人员已知的，并且可适用于所选择的宿主细胞。

优选地，发酵培养基包含选自由以下各项组成的组的碳源：植物生物质、纤维素、半纤维素、果胶、鼠李糖、半乳糖、岩藻糖、果糖、麦芽糖、麦芽糖糊精、核糖、核酮糖或淀粉、淀粉衍生物、蔗糖、乳糖、脂肪酸、甘油三酯和甘油。优选地，发酵培养基还包含氮源，如尿素；或铵盐，如硫酸铵、氯化铵、硝酸铵或磷酸铵。

根据本发明的发酵方法可以分批、分批补料或连续模式进行。也可应用单独的水解和发酵(SHF)方法或同时糖化和发酵(SSF)方法。这些发酵方法模式的组合对于最佳生产率来说也可以是可行的。如果在发酵方法中使用淀粉、纤维素、半纤维素或果胶作为碳源，则SSF方法可以是特别有吸引力的，其中可需要添加水解酶如纤维素酶、半纤维素酶或果胶酶以水解底物。

在用于制备甜菊醇糖苷的方法中使用的重组宿主可以是如上文所定义的任何合适的重组宿主。在所述方法中使用根据本发明的重组真核重组宿主可以是有利的，因为大多数真核细胞不需要用于繁殖的无菌条件并且对噬菌体感染不敏感。此外，真核宿主细胞可在低pH下生长以防止细菌污染。

根据本发明的重组宿主可以是兼性厌氧微生物。兼性厌氧重组宿主可以需氧方式繁殖至高细胞浓度。然后可在高细胞密度下进行这种厌氧阶段，这显著地降低了所需的发酵体积并且可使需氧微生物污染的风险最小化。

用于产生根据本发明的甜菊醇糖苷的发酵方法可以是需氧或厌氧发酵方法。

厌氧发酵方法可在本文中定义为在不存在氧的情况下运行或者基本上不消耗氧(优选小于5、2.5或1mmol/L/h)，并且其中有机分子充当电子供体和电子受体两者的发酵方法。根据本发明的发酵方法也可首先在需氧条件下运行，且随后在厌氧条件下运行。

发酵方法也可在限氧或微需氧条件下进行。或者，发酵方法可首先在需氧条件下运行，且随后在限氧条件下运行。限氧发酵方法是其中氧消耗受到从气体到液体的氧传递的限制的过程。氧限制的程度由进入气流的量和组成以及所用发酵设备的实际混合/传质特性决定。

在根据本发明的方法中产生甜菊醇糖苷可在宿主细胞的生长阶段期间、固定(稳定状态)阶段期间或在两个阶段期间发生。在不同的温度下运行发酵方法可以是可行的。

用于产生甜菊醇糖苷的方法可在对于重组宿主来说最佳的温度下进行。对于每种转化的重组宿主而言，最佳生长温度可不同并且是本领域的技术人员已知的。最佳温度可高于野生型生物的最适温度以在非无菌条件下在最低感染敏感性和最低冷却成本的条件下有效生长生物体。或者，所述方法可在对于重组宿主的生长来说不是最佳的温度下进行。

用于产生根据本发明的甜菊醇糖苷的方法可在任何合适的pH值下进行。如果重组宿主是酵母，则发酵培养基中的pH优选具有低于6、优选低于5.5、优选低于5、优选低于4.5、优选低于4、优选低于pH 3.5或低于pH 3.0或低于pH 2.5、优选高于pH 2的值。在这些低pH值下进行发酵的优点是可防止发酵培养基中污染细菌的生长。

这种方法可在工业规模上进行。这种方法的产物是一种或多种甜菊醇糖苷。

从发酵培养基中回收甜菊醇糖苷可通过本领域已知的方法进行，例如通过蒸馏、真空萃取、溶剂萃取或蒸发。

在用于产生根据本发明的甜菊醇糖苷的方法中，实现高于5mg/l发酵液、优选高于10mg/l、优选高于20mg/l、优选高于30mg/l发酵液、优选高于40mg/l、更优选高于50mg/l、优选高于60mg/l、优选高于70、优选高于80mg/l、优选高于100mg/l、优选高于1g/l、优选高于5g/l、优选高于10g/l，例如至少约15g/L，例如至少约20g/l的浓度是可行的。

本发明还提供了一种包含能够通过本发明的用于制备甜菊醇糖苷的方法获得的甜菊醇糖苷的发酵液。

在本发明的重组宿主中表达一种或多种甜菊醇糖苷的情况下，可需要处理此类细胞以释放它们。优选地，在细胞外产生至少一种甜菊醇糖苷，例如rebA或rebM。

本发明还提供了一种通过根据本发明的用于制备甜菊醇糖苷的方法获得的或能够从本发明的发酵液获得的甜菊醇糖苷。这种甜菊醇糖苷可以是非天然存在的甜菊醇糖苷，也就是说不在植物中产生的甜菊醇糖苷。

还提供了通过本发明的方法能够获得的组合物(其通常包含一种或多种甜菊醇糖苷)。本发明还提供了一种包含能够通过用于制备甜菊醇糖苷的本发明的方法获得的或能够从本发明的发酵液获得的两种或更多种甜菊醇糖苷的组合物。在这种组合物中，一种或多种甜菊醇糖苷可以是非天然存在的甜菊醇糖苷，也就是说不在植物中产生的甜菊醇糖苷。这些都是本发明的组合物。

本发明的组合物可用于对于此类化合物来说已知的任何应用中。特别地，这样的组合物可例如用作甜味剂，例如用于食品或饮料中。因此，根据本发明，提供了一种包含本发明的组合物的食品、饲料或饮料。

例如，本发明的组合物可被配制成软饮料、配制为桌面甜味剂、口香糖、乳制品如酸奶(例如原味酸奶)、蛋糕、谷物或基于谷类的食物、营养食品、药物、食用凝胶、糖果产品、化妆品、牙膏或其它口腔组合物等。此外，本发明的组合物可用作甜味剂，不仅用于饮料、食品和其它专门用于人消费的产品，而且用于具有改进的特性的动物饲料和草料中。

因此，本发明尤其提供了一种包含本发明的组合物的食品、饲料或饮料。

在食品、饮料、药物、化妆品、桌面产品、口香糖的制造过程中，可使用诸如混合、捏合、溶解、酸浸、渗透、渗滤、喷洒、雾化、灌注和其它方法的常规方法。

本发明的组合物可以干或液体的形式使用。它可在食品热处理之前或之后加入。甜味剂的量取决于使用目的。它可单独添加或与其它化合物组合添加。

本发明的组合物可与一种或多种其它非热量或热量甜味剂掺混。这种掺混可用于改进风味或时间特征或稳定性。广泛范围的非热量和热量甜味剂二者可适用于与本发明的组合物掺混。例如，非热量甜味剂如罗汉果苷、莫纳甜、阿斯巴甜、安赛蜜盐、环磺酸盐、三氯蔗糖、糖精盐或赤藓糖醇。适用于与本发明的甜菊醇糖苷或组合物掺混的热量甜味剂包括糖醇和碳水化合物如蔗糖、葡萄糖、果糖和HFCS。还可使用甜味氨基酸，如甘氨酸、丙氨酸或丝氨酸。

本发明的组合物可与甜味剂抑制剂如天然甜味剂抑制剂组合使用。它可与鲜味增强剂如氨基酸或其盐组合。

本发明的组合物可与多元醇或糖醇、碳水化合物、生理活性物质或功能成分(例如类胡萝卜素、膳食纤维、脂肪酸、皂苷、抗氧化剂、营养品、类黄酮、异硫氰酸酯、苯酚、植物甾醇或甾烷醇(植物甾醇和植物甾烷醇)、多元醇、益生元、益生菌、植物雌激素、大豆蛋白、硫化物/硫醇、氨基酸、蛋白质、维生素、矿物质和/或基于健康益处如心血管、降胆固醇或抗炎分类的物质组合。

本发明的组合物可包括调味剂、芳香组分、核苷酸、有机酸、有机酸盐、无机酸、苦味化合物、蛋白质或蛋白质水解产物、表面活性剂、类黄酮、收敛剂化合物、维生素、膳食纤维、抗氧化剂、脂肪酸和/或盐。

本发明的组合物可作为高强度甜味剂应用，以产生具有改进的味道特征的零卡路里、低卡路里或糖尿病人用饮料和食品。它也可用于不能使用糖的饮料、食品、药物和其他产品中。

此外，本发明的组合物可用作甜味剂，不仅用于饮料、食品和其它专门用于人消费的产品，而且用于具有改进的特性的动物饲料和草料中。

本发明的组合物可用作甜味化合物的产品的实例可以是酒精饮料，如伏特加酒、葡萄酒、啤酒、烈酒、清酒等；天然果汁、提神饮料、碳酸软饮料、减肥饮料、零卡路里饮料、低卡路里饮料和食物、酸奶饮料、速溶果汁、速溶咖啡、粉末型速溶饮料、罐装产品、糖浆、发酵大豆酱、酱油、醋、调味品、蛋黄酱、番茄酱、咖喱、汤、速食肉汤、酱油粉、醋粉、多种类型的饼干、香米饼、咸饼干、面包、巧克力、焦糖、糖果、口香糖、果冻、布丁、蜜饯和腌菜、鲜奶油、果酱、橘子酱、糖花膏、奶粉、冰淇淋、冰糕、包装在瓶中的蔬菜和水果、罐装和煮熟的豆类、在甜味酱中煮熟的肉和食物、农业蔬菜食品、海鲜、火腿、香肠、鱼火腿、鱼香肠、鱼酱、油炸鱼制品、干制海产品、冷冻食品、腌渍海带、腊肉、烟草、医药产品等。原则上它可具有无限应用。

甜味组合物包括饮料，其非限制性实例包括非碳酸和碳酸饮料，如可乐、姜汁汽水、根汁汽水、苹果汁、水果味软饮料(例如柑橘味软饮料，如柠檬莱姆或橙汁)、软饮料粉等；来自水果或蔬菜的汁、包括榨汁等的汁、含有果粒的果汁、水果饮料、果汁饮料、含果汁的饮料、具有水果调味料的饮料、蔬菜汁、含蔬菜的汁以及含水果和蔬菜的混合汁；运动饮料、能量饮料、近水(near water)等的饮料(例如具有天然或合成调味剂的水)；茶类或喜好型饮料如咖啡、可可、红茶、绿茶、乌龙茶等；含乳成分饮料如乳饮料、含乳成分咖啡、牛奶咖啡、奶茶、果奶饮料、饮用酸奶、乳酸菌饮料等；以及乳制品。

通常，甜味组合物中存在的甜味剂的量取决于甜味组合物的具体类型及其所需的甜度而广泛变化。本领域的普通技术人员可容易确定加入到甜味组合物中的甜味剂的适当量。

因此，掺入了本发明的组合物的组合物可通过本领域的技术人员已知的提供成分的均匀或均质混合物的任何方法来制备。这些方法包括干混、喷雾干燥、团聚、湿法制粒、压实、共结晶等。

呈固体形式时，本发明的组合物可以适于递送到待甜化的食物中的任何形式提供给消费者，所述形式包括小袋、小包、散装袋或盒、方块、片剂、喷雾或可溶解的条。所述组合物可以单位剂量或散装形式递送。

对于液体甜味剂体系和组合物而言，应开发方便范围的流体、半流体、糊状和膏状形式、使用任何形状或形式的适当包装材料的适当包装，其便于携带或分配或储存或运输含有任何上述甜味剂产品或上述产生的产品的组合的任何组合。

本发明的组合物可包含多种填充剂、功能成分、着色剂、调味剂。

术语“序列同源性”或“序列同一性”或“同源性”或“同一性”在本文中可互换使用。出于本发明的目的，在此定义为了确定两个氨基酸序列或两个核酸序列的序列同源性或序列同一性的百分比，出于最佳比较目的比对所述序列。为了优化两个序列之间的比对，可在比较的两个序列中的任一个中引入空位。这种比对可在所比较的序列的全长上进行。或者，比对可在更短的长度上进行，例如在约20、约50、约100或更多个核酸/碱基或氨基酸上进行。序列同一性是在所报告的比对区域上两个序列之间的相同匹配的百分比。

两个序列之间的序列比较和序列同一性百分比的确定可使用数学算法来完成。本领域的技术人员将意识到以下事实：若干不同的计算机程序可用于比对两个序列并确定两个序列之间的同一性(Kruskal,J.B.(1983) An overview of sequence comparison InD.Sankoff and J.B.Kruskal,(编辑),Time warps,string edits and macromolecules:the theory and practice of sequence comparison,第1-44页Addison Wesley)。两个氨基酸序列之间或两个核苷酸序列之间的序列同一性百分比可使用用于两个序列的比对的Needleman和Wunsch算法来确定(Needleman,S.B.和Wunsch,C.D. (1970)J.Mol.Biol.48,443-453)。氨基酸序列和核苷酸序列两者均可通过所述算法进行比对。Needleman-Wunsch算法已在计算机程序NEEDLE 中实现。出于本发明的目的，使用了来自EMBOSS包的NEEDLE程序 (2.8.0版或更高版本,EMBOSS:The European Molecular Biology Open SoftwareSuite(2000)Rice,P.Longden,I.和Bleasby,A.Trends in Genetics 16,(6)第276-277页,http://emboss.bioinformatics.nl/)。对于蛋白质序列而言，EBLOSUM62用于取代矩阵。对于核苷酸序列而言，使用 EDNAFULL。所使用的任选参数是空位开放罚分为10，以及空位延伸罚分为0.5。技术人员将理解的是，所有这些不同的参数将产生稍微不同的结果，但是当使用不同的算法时，两个序列的总体同一性百分比没有显著改变。

在通过如上所述的程序NEEDLE进行比对后，查询序列与本发明的序列之间的序列同一性的百分比计算如下：在两个序列中显示相同氨基酸或相同核苷酸的比对中的相应位置的数目除以在减去比对中的总空位数后比对的总长度。如本文定义的同一性可通过使用NOBRIEF选项从NEEDLE 获得，并且在程序的输出中标记为“最长同一性”。

本发明的核酸和蛋白质序列可进一步用作“查询序列”以进行针对公共数据库的检索，以例如鉴定其它家族成员或相关序列。此类搜索可使用Altschul等人(1990)J.Mol.Biol.215:403—10的NBLAST和XBLAST程序 (2.0版)进行。BLAST核苷酸搜索可用NBLAST程序(得分＝100、字长＝12)来进行，以获得与本发明的核酸分子同源的核苷酸序列。BLAST蛋白质搜索可用XBLAST程序(得分＝50、字长＝3)来进行，以获得与本发明的蛋白分子同源的氨基酸序列。为了获得用于比较目的的空位比对，可利用如在Altschul等人,(1997)Nucleic Acids Res.25(17):3389-3402中描述的空位BLAST。当利用BLAST和空位BLAST程序时，可使用相应程序(例如XBLAST和NBLAST)的默认参数。参见美国国家生物技术信息中心http://www.ncbi.nlm.nih.gov/的主页。

标准遗传技术，例如在宿主细胞中过表达酶、宿主细胞的遗传修饰或杂交技术是本领域已知的方法，例如Sambrook和Russel(2001) “Molecular Cloning：A LaboratoryManual(第3版)，Cold Spring Harbor Laboratory，Cold Spring Harbor LaboratoryPress或F.Ausubel等编，“Current protocols in molecular biology”，GreenPublishing and Wiley Interscience，New York(1987)中所述。转化、遗传修饰真菌宿主细胞的方法等从例如EP-A-0 635 574、WO 98/46772、WO 99/60102和WO 00/37671、WO90/14423、EP-A-0481008、EP-A-0635 574和US6,265,186 中获知。

本发明的一些实施方式：

1.一种能够产生甜菊醇糖苷的重组宿主，所述重组宿主过表达介导甜菊醇糖苷转运的多肽，并且所述多肽包含SEQ ID NO:35或SEQ ID NO: 38所示的氨基酸序列或与二者之任一具有至少约50％序列同一性的氨基酸序列。

2.一种能够产生甜菊醇糖苷的重组宿主，所述重组宿主已被修饰，优选在其基因组中被修饰，以导致介导甜菊醇糖苷转运的多肽的产生缺陷，并且所述多肽包含SEQ IDNO:35或SEQ ID NO:38所示的氨基酸序列或与二者之任一具有至少约50％序列同一性的氨基酸序列。

3.根据实施方式1所述的重组宿主，所述重组宿主包含编码多肽的重组核酸，所述多肽包含SEQ ID NO:35或SEQ ID NO:38所示氨基酸序列或与二者之任一具有至少约50％序列同一性的氨基酸序列。

4.根据前述实施方式中任一种所述的重组宿主，其包含一种或更多种编码以下多肽的重组核苷酸序列：

具有对映-柯巴基焦磷酸合酶活性的多肽；

具有对映-贝壳杉烯合酶活性的多肽；

具有对映-贝壳杉烯氧化酶活性的多肽；以及

具有贝壳杉烯酸13-羟化酶活性的多肽。

5.根据前述实施方式中任一种所述的重组宿主，其包含编码具有 NADPH-细胞色素p450还原酶活性的多肽的重组核酸序列。

6.根据前述实施方式中任一种所述的重组宿主，其包含编码以下项中的一种或更多种的重组核酸序列：

(i)具有UGT74G1活性的多肽；

(ii)具有UGT2活性的多肽；

(iii)具有UGT85C2活性的多肽；和

(iv)具有UGT76G1活性的多肽。

7.根据前述实施方式中任一种所述的重组宿主，其中所述宿主属于Saccharomyces、Aspergillus、Pichia、Kluyveromyces、Candida、 Hansenula、Humicola、Issatchenkia、Trichosporon、Brettanomyces、 Pachysolen、Yarrowia、Yamadazyma或Escherichia属中的一种。

8.根据实施方式7所述的重组宿主，其中所述重组宿主是 Saccharomycescerevisiae细胞、Yarrowia lipolitica细胞、Candida krusei细胞、Issatchenkiaorientalis细胞或Escherichia coli细胞。

9.根据前述实施方式中任一种所述的重组宿主，其中所述宿主产生香叶基香叶基二磷酸(GGPP)的能力被上调。

10.根据前述实施方式中任一种所述的重组宿主，其包含编码以下项中的一种或多种的核酸序列：

具有羟甲基戊二酰基-辅酶A还原酶活性的多肽；或者

具有法尼基-焦磷酸合成酶活性的多肽

11.一种能够产生甜菊醇糖苷的重组宿主，所述重组宿主过表达介导甜菊醇糖苷转运的异源多肽。

12.一种制备甜菊醇糖苷的方法，所述方法包括在合适的发酵培养基中发酵根据前述实施方式中任一种所述的重组宿主，以及任选地回收所述甜菊醇糖苷。

13.根据实施方式12所述的制备甜菊醇糖苷的方法，任选地其中所述方法以工业规模进行。

14.一种发酵液，其包含通过根据实施方式12或13所述的方法能够获得的甜菊醇糖苷。

15.通过根据实施方式12或13所述的方法获得的或者从根据实施方式14所述的发酵液获得的甜菊醇糖苷。

16.通过根据实施方式12或13所述的方法能够获得的组合物，包含两种或更多种通过根据实施方式12或13所述的方法获得的甜菊醇糖苷的组合物或从根据实施方式14所述的发酵液获得的组合物。

17.一种食品、饲料或饮料，其包含根据权利要求15所述的甜菊醇糖苷或根据权利要求16所述的组合物。

在本文对专利文件或作为现有技术给出的其他材料的引用不应被认为承认该文件或材料是已知的或它包含的信息是任何这些权利要求的优先权日时公知常识的一部分。

在本文所述的每个参考文献的披露均通过引用以其全部内容并入本文。

本发明通过以下实施例来进一步说明：

实施例

概述

标准遗传技术(如在宿主细胞中过表达酶以及宿主细胞的另外遗传修饰)是本领域已知的方法，例如在Sambrook和Russel(2001)"Molecular Cloning:A LaboratoryManual(第3版),Cold Spring Harbor Laboratory,Cold Spring Harbor LaboratoryPress，或F.Ausubel等人编辑,"Current protocols in molecular biology",GreenPublishing and Wiley Interscience,New York (1987)中所描述的。用于真菌宿主细胞的转化和遗传修饰的方法从例如 EP-A-0 635 574、WO 98/46772、WO 99/60102和WO 00/37671中获知。

实施例1.在S.cerevisiae中过表达ERG20、BTS1和tHMG

使用如WO2013/076280中描述的技术将表达盒整合至一个位点以过表达ERG20、BTS1和tHMG1。使用合适的引物和源于CEN.PK酵母菌株 (van Dijken等人Enzyme andMicrobial Technology 26(2000)706-714)的基因组DNA扩增整合位点的5’和3’整合侧翼。在DNA2.0，不同的基因被整理为盒子(包含同源序列、启动子、基因、终止子、同源序列)。这些盒子中的基因的侧翼是组成型启动子和终止子。参见表1。溶解来源于 DNA2.0的含有ERG20、tHMG1和BTS1盒子的质粒DNA至浓度为 100ng/μl。在50μl PCR混合物中，使用20ng模板和20pmol引物。材料被溶解至浓度为0.5μg/μl。

表1：过表达构建体的组分

启动子	开放阅读框	终止子
			Eno2(SEQ ID NO:1)	ERG20(SEQ ID NO:2)	Adh1(SEQ ID NO:3)
Fba1(SEQ ID NO:4)	tHMG1(SEQ ID NO:5)	Adh2(SEQ ID NO:6)
			Tef1(SEQ ID NO:7)	Bts1(SEQ ID NO:8)	Gmp1(SEQ ID NO:9)

使用pUG7-EcoRV构建体(图1)和合适的引物来扩增选择标记。使用Zymoclean GelDNA Recovery试剂盒(ZymoResearch)从凝胶中纯化 KanMX片段。使用在表2中列出的片段转化酵母菌株Cen.PK113-3C。

表2：用于ERG20、tHMG1和BTS1的转化的DNA片段

片段
	5’YPRcTau3
ERG20盒
	tHMG1盒
KanMX盒
	BTS1盒
3’YPRcTau3

转化后，在30℃下于YEPhD(酵母膏植物蛋白胨葡萄糖；BBL植物蛋白胨来源于BD)中复苏2.5小时，然后将细胞涂布在含200μg/ml G418 (Sigma)的YEPhD琼脂上。在30℃下培养平板4天。利用诊断PCR和测序技术确定正确的整合。通过对蛋白质进行LC/MS证实过表达。图2 阐释了组装ERG20、tHMG1和BTS1的原理图。该菌株被命名为 STV002。

该菌株中CRE重组酶的表达导致KanMX标记的向外重组。利用诊断 PCR确定正确的向外重组以及ERG20、tHMG1和BTS1的存在。

实施例2.敲低Erg9

为了降低Erg9的表达，设计并使用含有修饰的3’末端的Erg9敲低构建体，其中所述3’末端延续至驱动TRP1表达的TRP1启动子。

转化含有Erg9-KD片段的构建体至E.coli TOP10细胞。转化株生长于 2PY(2倍的植物蛋白胨和酵母膏)-sAMP培养基中。使用QIAprep Spin Miniprep kit(Qiagen)分离质粒DNA，然后用SalI-HF(New England Biolabs)消化。用乙醇沉淀DNA以浓缩。转化所述片段至S.cerevisiae，然后将菌落涂布到不含色氨酸的矿质培养基(Verduyn等人，1992.Yeast8:501-517)琼脂板上。利用诊断PCR和测序技术确定正确整合的Erg9- KD构建体。图 3 阐释了执行Erg9-KD构建体的转化的原理图。该菌株被命名为STV003。

实施例3.过表达UGT2_1a

使用如专利申请号WO2013/076280和WO2013/144257中描述的技术过表达UGT2_1a。在DNA2.0，UGT2_1a被整理为一个盒子(包含同源序列、启动子、基因、终止子、同源序列)。细节请参见表3。使用如专利申请号WO2013/135728中描述的技术以获得含有标记和Cre重组酶的片段。用具有诺尔丝菌素抗性的NAT标记进行筛选。

表3：过表达构建体的组分

启动子	开放阅读框	终止子
			Pgk1(SEQ ID NO:10)	UGT2_1a(SEQ ID NO:11)	Adh2(SEQ ID NO:6)

使用合适的引物进行扩增。使用合适的引物和源于CEN.PK酵母菌株的基因组DNA以扩增整合位点的5’和3’整合侧翼。

使用表4中列出的片段转化S.cerevisiae酵母菌株STV003，然后将转化混合物涂布在含有50μg/ml诺尔丝菌素(Lexy NTC来源于Jena Bioscience)的YEPhD琼脂板上。

表4：用于UGT21a的转化的DNA片段

半乳糖能够激活CRE重组酶的表达。为了诱导CRE重组酶的表达，将转化株再次划线至YEPh半乳糖培养基上。这导致了位于lox位置之间的标记的向外重组。利用诊断PCR证实UGT2_1a的正确整合和NAT标记的向外重组。由此产生的菌株被命名为STV004。图4阐释了执行 UGT2_1a构建体的转化的原理图。

实施例4.过表达RebA产生通路：CPS、KS、KO、KAH、CPR、UGT1、UGT3和UGT4

使用如专利申请号WO2013/076280和WO2013/144257中描述的技术将所有导致RebA产生的通路基因设计整合至一个位点。使用合适的引物和源于CEN.PK酵母菌株的基因组DNA以扩增整合位点的5’和3’整合侧翼。在DNA2.0，不同的基因被整理为盒(包含同源序列、启动子、基因、终止子、同源序列)(概述请参见表5)。溶解来源于DNA2.0的 DNA至100ng/μl。将该原液进一步稀释至5ng/μl，然后取1μl用于50μl- PCR混合物中。反应包含25pmol每种引物。扩增后，使用NucleoSpin 96 PCR Clean-up试剂盒(Macherey-Nagel)纯化DNA或者利用乙醇沉淀以浓缩DNA。

表5.用于RebA产生通路的序列

启动子	ORF	SEQ ID	终止子
				Kl prom 12.pro(SEQ ID NO:12)	trCPS_SR	13	Sc ADH2.ter(SEQ ID NO:9)
Sc PGK1.pro(SEQ ID NO:10)	trKS_SR	14	Sc TAL1.ter(SEQ ID NO:15)
				Sc ENO2.pro(SEQ ID NO:1)	KO_2	16	Sc TPI1.ter(SEQ ID NO:17)
Ag lox_TEF1.pro(SEQ ID NO:18)	KANMX	19	Ag TEF1_lox.ter(SEQ ID NO:20)
				Sc TEF1.pro(SEQ ID NO:7)	KAH_4	21	Sc GPM1.ter(SEQ ID NO:9)
Kl prom 6.pro(SEQ ID NO:22)	CPR_3	23	Sc PDC1.ter(SEQ ID NO:24)
				Kl prom 3.pro(SEQ ID NO:25)	UGT1_SR	26	Sc TDH1.ter(SEQ ID NO:27)
Kl prom 2.pro(SEQ ID NO:28)	UGT3_SR	29	Sc ADH1.ter(SEQ ID NO:3)
				Sc FBA1.pro(SEQ ID NO:4)	UGT4_SR	30	Sc ENO1.ter(SEQ ID NO:31)

将所有RebA通路、标记和侧翼(概述请参见表6)转化至S. cerevisiae酵母菌株STV004。在20℃下于YEPhD中过夜恢复后，将转化混合物涂布至含有200μg/ml G418的YEPhD琼脂上。在25℃下培养3天并在室温下培养一夜。

表6.用于CPS、KS、KO、KanMX、KAH、CPR、UGT1、UGT3和UGT4的转化的DNA片段

片段
	5’INT1
CPS盒
	KS盒
KO盒
	KanMX盒
KAH盒
	CPR盒
UGT1盒
	UGT3盒
UGT4盒
	3’INT1

利用诊断PCR和序列分析(3500基因分析仪，Applied Biosystems) 证实正确的整合。使用BigDye Terminator v3.1循环测序试剂盒(Life Technologies)完成测序反应。每个反应(10μl)包含50ng模板和3.2pmol 引物。通过用乙醇/EDTA沉淀来纯化产物，然后将其溶解在10μl HiDi甲酰胺中并应用于仪器。该菌株被命名为STV016。图5阐释了将GGPP到RebA的通路整合至基因组的示意图。表7示出了在实施例1到5中使用的菌株。

实施例5：构建菌株STV027

为了从菌株STV016的染色体中除去KanMX标记，用表达Cre重组酶(Güldender,2002)的质粒pSH65转化该菌株。随后，通过在非选择性培养基(2％葡萄糖的YEP)上生长来去除(cured)菌株中的质粒 pSH65。所产生的不含KanMX且不含pSH65的菌株(通过涂布在含200 μg G418/ml或20μg腐草霉素/ml的平板上来确定，此时不应发生生长)被命名为STV027。利用诊断PCR进一步证实KanMX标记不存在。所得的菌株被命名为STV027。

实施例6：构建菌株STV035

为了引入额外拷贝的KAH和CPR，使用可用的PCR片段(参见表6 和表7)。使用合适的引物从pUG7-EcoRV(图1)扩增KanMX选择标记片段。为了扩增整合基因座的5'和3'整合侧翼，使用合适的引物和来自 CEN.PK酵母菌株的基因组DNA。

根据Gietz方法用这些片段转化STV027(表7)。在30℃下在 YEPhD中恢复2小时后，将转化混合物涂布在含有200μg/ml G418的 YEPhD琼脂上。将它们在30℃下孵育4天。

表7.用于将KanMX、KAH和CPR转化到STV027的DNA片段。

片段
	5’Chr11.04
KanMX盒
	KAH盒
CPR盒
	3’Chr11.04

图6示出了KAH和CPR如何整合到基因组中的示意图。利用诊断PCR证实正确的整合。所得菌株被命名为STV035。

实施例7：构建菌株STV058

为了整合第二拷贝的CPS，将该基因与TDH3启动子和ADH2终止子一起扩增。

表8.CPS盒(2)中的序列

由于STV035中存在KanMX标记，所以使用合适的引物从pUG7- NAT(图7)扩增NAT标记。为了扩增整合基因座的5'和3'整合侧翼，使用合适的引物和来自CEN.PK酵母菌株的基因组DNA。

表9.用于将CPS和NAT转化到STV035的DNA片段。

片段
	5’Chr2.06
CPS盒(2)
	NAT
3’Chr2.06

将用于整合第二拷贝的CPS的不同片段(表9)组合并转化到 STV035。恢复后，将转化混合物涂布在含有50μg/ml诺尔丝菌素的YEPhD琼脂板上。将它们在30℃下孵育3天。利用诊断PCR证实正确的整合。新菌株被命名为STV058。图8示出了CPS如何整合到基因组中的示意图。

表10.菌株表

实施例8.在S.cerevisiae菌株STV058中表达I.orientalisALNQ_007_38000和 ALNQ_214_12000

为了表达ALNQ_007_38000(SEQ ID NO：33)和ALNQ_214_12000 (SEQ ID NO：36)，使用专利申请号WO2013/076280和 WO2013/144257中所述的技术将表达盒设计成整合在S.cerevisiae STV058 Chr01.05基因座中。为了扩增整合基因座的5'和3'整合侧翼，使用合适的引物和来自CEN.PK酵母菌株的基因组DNA。

使用合适的引物从I.orientalis CBS5147基因组DNA扩增两种转运体基因。将PCR扩增子亚克隆在Zero Blunt TOPO载体(Life Technologies) 中。使用BspMI或BsaI将基因克隆到Sc_2_5-2_a.bbn载体中，其中它们的侧翼为组成型启动子Kl_ENO1或Sc_GPM1和Sc_TAL1终止子，从而导致每个转运体基因有两个表达盒。在50μl PCR混合物中PCR扩增表达盒6次。使用NucleoSpin Gel和PCR Clean-up试剂盒(Machery Nagel)纯化和浓缩PCR产物。

为了扩增选择标记，使用pUG7-HygB构建体(图10)和合适的引物。使用NucleoSpinGel和PCR Clean-up试剂盒(Machery Nagel)纯化和浓缩PCR产物。用表11中列出的片段转化酵母菌株S.cerevisiae STV058。体内组装如图11所示。

表11：转化到S.cerevisiae STV058的片段

转化并在30℃下在YEPhD中恢复2小时后，将细胞涂布在含有200 μg/ml HygB(Invitrogen)的YEPhD琼脂上。将板在30℃下孵育2天。通过将转化体重新划线在含有200μg/ml HygB的YEPhD琼脂上来将其纯化。利用诊断PCR确定正确的整合和组装。

实施例9.发酵STV058以及ALNQ_007_38000和ALNQ_214_12000转运体过表达菌株

用来自YEPh-D琼脂的菌落物质接种预培养物。使预培养物在96半深孔板中含有葡萄糖作为碳源的200μl矿质培养基中生长。将预培养物在 27℃、750rpm和80％湿度的Infors培养箱中孵育72小时。

使用40μl预培养物接种24深孔板中含有葡萄糖作为碳源的2.5ml矿质培养基。将这些生产培养物在27℃、550rpm、80％湿度的Infors培养箱中孵育120小时。将生产培养物充分均化，并将0.5ml培养物转移到96 孔板中。该样品被用作全培养液样品。剩余的生产培养物通过以3000×g 离心10分钟来沉淀。离心后，将0.5上清液转移到96孔板中。该样品被用作上清液样品。将全培养液96孔板和上清液96孔板在90℃水浴中孵育 10分钟，然后冷却至室温。向每个孔中加入0.25ml乙腈并均化。然后将板以3000×g离心10分钟以沉淀细胞材料和碎片。将全培养液和上清液样品在33％乙腈中稀释200倍。使用LC/MS分析样品的RebA和其他甜菊醇糖苷。我们发现：与亲本菌株相比，具有所述的特定转运体基因过表达的菌株在上清液级分中产生更高滴度的莱鲍迪甙A或其他甜菊醇糖苷，例如莱鲍迪甙B。结果概述请参见表12、13。

表12.上清液和培养液中莱鲍迪甙A的浓度

菌株	Reb A上清液(mg/L)	Reb A培养液(mg/L)
			STV058	29	137
ENO1p_ALNQ_007_38000	51	95
			GPM1p_ALNQ_007_38000	53	79
ENO1p_ALNQ_214_12000	171	178
			GPM1p_ALNQ_214_12000	155	151

过表达ALNQ_007_38000转运体或ALNQ_214_12000转运体的菌株在上清液中具有提高水平的莱鲍迪甙A。通过ALNQ_214_12000转运蛋白的过表达，与参考菌株相比，上清液中RebA的量增加至5-6倍。还参见图12。

表13.上清液和培养液中莱鲍迪甙B的浓度

菌株	Reb B上清液(mg/L)	Reb B培养液(mg/L)
			STV058	7	41
ENO1p_ALNQ_007_38000	124	139
			GPM1p_ALNQ_007_38000	165	170
ENO1p_ALNQ_214_12000	15	19
			GPM1p_ALNQ_214_12000	15	17

过表达ALNQ_007_38000转运体或ALNQ_214_12000转运体的菌株在上清液中具有提高水平的莱鲍迪甙B。在ALNQ_007_38000转运体的情况下，这还导致培养液中RebB浓度更高。还参见图13。观察到如此大量的RebB被输出到上清液中解释了培养液中的莱鲍迪甙A产生降低(表 12)，因为上清液中的莱鲍迪甙B不再可用作莱鲍迪甙A产生(其在细胞内发生)的底物。对于莱鲍迪甙A或莱鲍迪甙A下游产物的细胞外生产，因此ALNQ_007_38000(或等同物)转运体可以是包含这种转运体的宿主 (例如I.orientalis)中缺失的靶标，结合更特异地转运莱鲍迪甙A的转运体(例如ALNQ_214_12000转运体)的过表达。

过表达ALNQ_007_38000转运体或ALNQ_214_12000转运体的菌株在培养液中具有降低水平的莱鲍迪甙M。因为这两种转运体有效输出甜菊醇糖苷例如莱鲍迪甙A和莱鲍迪甙B，所以在细胞内可获得的用于朝向莱鲍迪甙M转化的这些中间体较少。因此，这些转运体(或等同物)可以是会具有这种转运体的宿主(例如I.orientalis)中缺失的靶标，以增加莱鲍迪甙M产生。

表14.上清液和培养液中的莱鲍迪甙M浓度

菌株	Reb M培养液(mg/L)
		STV058	60
ENO1p_ALNQ_007_38000	25
		GPM1p_ALNQ_007_38000	13
ENO1p_ALNQ_214_12000	7
		GPM1p_ALNQ_214_12000	2

表15.序列表说明

序列表

<110> 帝斯曼知识产权资产管理有限公司

<120> 甜菊醇糖苷转运

<130> 31190-WO-PCT

<150> 62/204704

<151> 2015-08-13

<160> 38

<170> PatentIn version 3.5

<210> 1

<211> 600

<212> DNA

<213> Artificial sequence

<220>

<223> ScEno2 promoter

<400> 1

gtgtcgacgc tgcgggtata gaaagggttc tttactctat agtacctcct cgctcagcat 60

ctgcttcttc ccaaagatga acgcggcgtt atgtcactaa cgacgtgcac caacttgcgg 120

aaagtggaat cccgttccaa aactggcatc cactaattga tacatctaca caccgcacgc 180

cttttttctg aagcccactt tcgtggactt tgccatatgc aaaattcatg aagtgtgata 240

ccaagtcagc atacacctca ctagggtagt ttctttggtt gtattgatca tttggttcat 300

cgtggttcat taattttttt tctccattgc tttctggctt tgatcttact atcatttgga 360

tttttgtcga aggttgtaga attgtatgtg acaagtggca ccaagcatat ataaaaaaaa 420

aaagcattat cttcctacca gagttgattg ttaaaaacgt atttatagca aacgcaattg 480

taattaattc ttattttgta tcttttcttc ccttgtctca atcttttatt tttattttat 540

ttttcttttc ttagtttctt tcataacacc aagcaactaa tactataaca tacaataata 600

<210> 2

<211> 1056

<212> DNA

<213> Saccharomyces cerevisiae

<400> 2

atggcttctg aaaaggaaat cagaagagaa cgtttcttga atgttttccc aaaattggtt 60

gaagaattga acgcttctct attagcttac ggtatgccaa aggaagcttg tgactggtac 120

gctcactctt tgaactacaa caccccaggt ggtaagttga acagaggtct atccgttgtt 180

gacacctacg ccattttgtc caacaagacc gtcgaacaat taggtcaaga agaatacgaa 240

aaggttgcca tcttaggttg gtgtatcgaa ttgttgcaag cttacttctt ggttgctgat 300

gacatgatgg acaaatctat caccagaaga ggtcaaccat gttggtacaa ggttccagaa 360

gtcggtgaaa ttgccatcaa cgatgctttc atgttggaag ctgccatcta caagttgttg 420

aagtctcact tcagaaacga aaagtactac attgacatca ctgaattatt ccacgaagtt 480

actttccaaa ccgaattggg tcaattgatg gacttgatta ccgctccaga agataaggtc 540

gatttgtcca aattttcctt gaagaaacac tctttcattg tcactttcaa gactgcttac 600

tactcctttt acttgcctgt tgctttggcc atgtatgtcg ctggtatcac cgatgaaaag 660

gacttgaagc aagctcgtga tgtcttgatt ccattaggtg aatacttcca aatccaagat 720

gactacttgg actgtttcgg tactccagaa caaatcggta agattggtac tgatatccaa 780

gacaacaagt gttcctgggt tatcaacaag gctttggaat tggcttctgc tgaacaaaga 840

aagactttgg acgaaaacta cggtaagaag gactctgttg ctgaagctaa gtgtaagaag 900

atcttcaacg atttgaaaat tgaacaatta taccatgaat acgaagaatc tattgccaag 960

gacttgaaag ccaagatctc tcaagtcgac gaatccagag gtttcaaggc tgatgtcttg 1020

actgctttct tgaacaaggt ctacaagaga tcaaaa 1056

<210> 3

<211> 301

<212> DNA

<213> Artificial sequence

<220>

<223> Adh1 terminator

<400> 3

agcgaatttc ttatgattta tgatttttat tattaaataa gttataaaaa aaataagtgt 60

atacaaattt taaagtgact cttaggtttt aaaacgaaaa ttcttattct tgagtaactc 120

tttcctgtag gtcaggttgc tttctcaggt atagcatgag gtcgctctta ttgaccacac 180

ctctaccggc atgccgagca aatgcctgca aatcgctccc catttcaccc aattgtagat 240

atgctaactc cagcaatgag ttgatgaatc tcggtgtgta ttttatgtcc tcagaggaca 300

a 301

<210> 4

<211> 600

<212> DNA

<213> Artificial sequence

<220>

<223> Sc Fba1 promoter

<400> 4

ctacttggct tcacatacgt tgcatacgtc gatatagata ataatgataa tgacagcagg 60

attatcgtaa tacgtaatag ttgaaaatct caaaaatgtg tgggtcatta cgtaaataat 120

gataggaatg ggattcttct atttttcctt tttccattct agcagccgtc gggaaaacgt 180

ggcatcctct ctttcgggct caattggagt cacgctgccg tgagcatcct ctctttccat 240

atctaacaac tgagcacgta accaatggaa aagcatgagc ttagcgttgc tccaaaaaag 300

tattggatgg ttaataccat ttgtctgttc tcttctgact ttgactcctc aaaaaaaaaa 360

aatctacaat caacagatcg cttcaattac gccctcacaa aaactttttt ccttcttctt 420

cgcccacgtt aaattttatc cctcatgttg tctaacggat ttctgcactt gatttattat 480

aaaaagacaa agacataata cttctctatc aatttcagtt attgttcttc cttgcgttat 540

tcttctgttc ttctttttct tttgtcatat ataaccataa ccaagtaata catattcaaa 600

<210> 5

<211> 1575

<212> DNA

<213> Saccharomyces cerevisiae

<400> 5

atggaccaat tggtcaagac tgaagtcacc aagaaatctt tcactgctcc agtccaaaag 60

gcttccactc cagttttgac caacaagacc gtcatctccg gttccaaggt taaatctttg 120

tcctctgctc aatcttcctc ctctggtcca tcttcttctt ctgaagaaga tgattccaga 180

gatatcgaat ctttggacaa gaaaatcaga ccattggaag aattggaagc tctattgtcc 240

tctggtaaca ctaagcaatt aaagaacaag gaagttgctg ctttggttat ccacggtaaa 300

ttgccattgt acgctttgga aaagaaatta ggtgacacca ccagagctgt tgctgtcaga 360

agaaaggctt tgtccatttt ggctgaagct ccagtcttgg cttccgacag attaccatac 420

aagaactacg actacgaccg tgtctttggt gcttgttgtg aaaatgtcat tggttacatg 480

ccattaccag ttggtgtcat tggtccattg gttatcgacg gtacttctta ccacatccca 540

atggctacca ctgaaggttg tttggttgct tctgccatga gaggttgtaa ggccatcaac 600

gctggtggtg gtgctaccac cgttttgact aaggatggta tgaccagagg tcctgttgtc 660

agattcccaa ctttgaagag atctggtgct tgtaagatct ggttggattc tgaagaaggt 720

caaaacgcca tcaagaaggc tttcaactcc acttccagat tcgctagatt gcaacacatt 780

caaacttgtt tagctggtga cttgttgttc atgagattca gaaccaccac tggtgacgct 840

atgggtatga acatgatctc caagggtgtt gaatactctt tgaagcaaat ggttgaagaa 900

tacggttggg aagatatgga agttgtctct gtttctggta actactgtac cgacaagaag 960

ccagctgcca tcaactggat cgaaggtcgt ggtaagtccg ttgttgctga agctaccatt 1020

ccaggtgacg ttgtcagaaa ggttttgaaa tctgatgttt ctgctttagt cgaattgaac 1080

attgccaaga acttggtcgg ttctgccatg gctggttccg tcggtggttt caacgctcat 1140

gccgctaact tggtcactgc tgttttcttg gctttaggtc aagatccagc tcaaaatgtc 1200

gaatcctcta actgtatcac tttgatgaag gaagttgacg gtgatttgag aatttctgtt 1260

tccatgccat ccattgaagt cggtactatc ggtggtggta ctgtcttgga accacaaggt 1320

gccatgttgg acttgttggg tgttcgtggt ccacacgcta ccgctccagg tactaacgcc 1380

agacaattgg ccagaattgt tgcctgtgcc gtcttggctg gtgaattgtc tctatgtgcc 1440

gctttggctg ctggtcactt ggttcaatct cacatgaccc acaacagaaa gcctgctgaa 1500

ccaaccaaac caaacaactt ggatgctact gacattaaca gattaaagga cggttctgtc 1560

acctgtatca agtct 1575

<210> 6

<211> 301

<212> DNA

<213> Artificial sequence

<220>

<223> Adh2 terminator

<400> 6

agcggatctc ttatgtcttt acgatttata gttttcatta tcaagtatgc ctatattagt 60

atatagcatc tttagatgac agtgttcgaa gtttcacgaa taaaagataa tattctactt 120

tttgctccca ccgcgtttgc tagcacgagt gaacaccatc cctcgcctgt gagttgtacc 180

cattcctcta aactgtagac atggtagctt cagcagtgtt cgttatgtac ggcatcctcc 240

aacaaacagt cggttatagt ttgtcctgct cctctgaatc gtgtccctcg atatttctca 300

t 301

<210> 7

<211> 600

<212> DNA

<213> Artificial sequence

<220>

<223> Sc Tef1 promoter

<400> 7

ttggctgata atagcgtata aacaatgcat actttgtacg ttcaaaatac aatgcagtag 60

atatatttat gcatattaca tataatacat atcacatagg aagcaacagg cgcgttggac 120

ttttaatttt cgaggaccgc gaatccttac atcacaccca atcccccaca agtgatcccc 180

cacacaccat agcttcaaaa tgtttctact ccttttttac tcttccagat tttctcggac 240

tccgcgcatc gccgtaccac ttcaaaacac ccaagcacag catactaaat ttcccctctt 300

tcttcctcta gggtgtcgtt aattacccgt actaaaggtt tggaaaagaa aaaagacacc 360

gcctcgtttc tttttcttcg tcgaaaaagg caataaaaat ttttatcacg tttctttttc 420

ttgaaaattt ttttttttga tttttttctc tttcgatgac ctcccattga tatttaagtt 480

aataaacggt cttcaatttc tcaagtttca gtttcatttt tcttgttcta ttacaacttt 540

ttttacttct tgctcattag aaagaaagca tagcaatcta atctaagttt taattacaaa 600

<210> 8

<211> 1005

<212> DNA

<213> Saccharomyces cerevisiae

<400> 8

atggaagcta agattgacga attgatcaac aacgaccctg tctggtcctc tcaaaacgaa 60

tctttgatct ccaagccata caaccacatc ttgttgaagc caggtaagaa cttcagatta 120

aacttgattg ttcaaatcaa cagagttatg aacttgccaa aggaccaatt ggccattgtt 180

tcccaaattg tcgaattgtt gcacaactcc tctctattga tcgatgacat tgaagataat 240

gctccattaa gaagaggtca aaccacttct catttgattt tcggtgtccc atccaccatc 300

aacactgcta actacatgta cttcagagcc atgcaattgg tttctcaatt gaccaccaag 360

gaaccattat accacaactt gatcactatc tttaacgaag aattgattaa cttgcaccgt 420

ggtcaaggtt tggacatcta ctggagagat ttcttgccag aaattattcc aactcaagaa 480

atgtacttga acatggtcat gaacaagact ggtggtttat tcagattgac tttacgtttg 540

atggaagctt tgtctccatc ttcccaccac ggtcactctt tggttccatt catcaatcta 600

ttaggtatca tctaccaaat cagagatgat tacttgaact tgaaggactt ccaaatgtcc 660

tctgaaaagg gtttcgctga agatatcact gaaggtaaat tgtctttccc aattgtccac 720

gccttgaact ttaccaagac caagggtcaa actgaacaac acaacgaaat tttgagaatc 780

ttattgttga gaacttctga caaggacatc aagttgaaat tgatccaaat cttggaattc 840

gataccaact ctttggctta caccaagaac ttcatcaacc aattggttaa catgatcaag 900

aatgacaacg aaaacaaata cttgccagac ttggcttccc actccgatac cgctaccaac 960

ttgcacgacg aattgttgta cattattgac catttgtctg agtta 1005

<210> 9

<211> 301

<212> DNA

<213> Artificial sequence

<220>

<223> Sc Gmp1 terminator

<400> 9

agtctgaaga atgaatgatt tgatgatttc tttttccctc catttttctt actgaatata 60

tcaatgatat agacttgtat agtttattat ttcaaattaa gtagctatat atagtcaaga 120

taacgtttgt ttgacacgat tacattattc gtcgacatct tttttcagcc tgtcgtggta 180

gcaatttgag gagtattatt aattgaatag gttcattttg cgctcgcata aacagttttc 240

gtcagggaca gtatgttgga atgagtggta attaatggtg acatgacatg ttatagcaat 300

a 301

<210> 10

<211> 600

<212> DNA

<213> Artificial sequence

<220>

<223> Sc Pgk1 promoter

<400> 10

gggccagaaa aaggaagtgt ttccctcctt cttgaattga tgttaccctc ataaagcacg 60

tggcctctta tcgagaaaga aattaccgtc gctcgtgatt tgtttgcaaa aagaacaaaa 120

ctgaaaaaac ccagacacgc tcgacttcct gtcttcctat tgattgcagc ttccaatttc 180

gtcacacaac aaggtcctag cgacggctca caggttttgt aacaagcaat cgaaggttct 240

ggaatggcgg gaaagggttt agtaccacat gctatgatgc ccactgtgat ctccagagca 300

aagttcgttc gatcgtactg ttactctctc tctttcaaac agaattgtcc gaatcgtgtg 360

acaacaacag cctgttctca cacactcttt tcttctaacc aagggggtgg tttagtttag 420

tagaacctcg tgaaacttac atttacatat atataaactt gcataaattg gtcaatgcaa 480

gaaatacata tttggtcttt tctaattcgt agtttttcaa gttcttagat gctttctttt 540

tctctttttt acagatcatc aaggaagtaa ttatctactt tttacaacaa atataaaaca 600

<210> 11

<211> 1422

<212> DNA

<213> Artificial sequence

<220>

<223> UGT2_1a CpO for S. cerevisiae

<400> 11

atggctacat ctgattctat tgttgatgac aggaagcagt tgcatgtggc tactttccct 60

tggcttgctt tcggtcatat actgccttac ctacaactat caaaactgat agctgaaaaa 120

ggacataaag tgtcattcct ttcaacaact agaaacattc aaagattatc ttcccacata 180

tcaccattga ttaacgtcgt tcaattgaca cttccaagag tacaggaatt accagaagat 240

gctgaagcta caacagatgt gcatcctgaa gatatccctt acttgaaaaa ggcatccgat 300

ggattacagc ctgaggtcac tagattcctt gagcaacaca gtccagattg gatcatatac 360

gactacactc actattggtt gccttcaatt gcagcatcac taggcatttc tagggcacat 420

ttcagtgtaa ccacaccttg ggccattgct tacatgggtc catccgctga tgctatgatt 480

aacggcagtg atggtagaac taccgttgaa gatttgacaa ccccaccaaa gtggtttcca 540

tttccaacta aagtctgttg gagaaaacac gacttagcaa gactggttcc atacaaggca 600

ccaggaatct cagacggcta tagaatgggt ttagtcctta aagggtctga ctgcctattg 660

tctaagtgtt accatgagtt tgggacacaa tggctaccac ttttggaaac attacaccaa 720

gttcctgtcg taccagttgg tctattacct ccagaaatcc ctggtgatga gaaggacgag 780

acttgggttt caatcaaaaa gtggttagac gggaagcaaa aaggctcagt ggtatatgtg 840

gcactgggtt ccgaagtttt agtatctcaa acagaagttg tggaacttgc cttaggtttg 900

gaactatctg gattgccatt tgtctgggcc tacagaaaac caaaaggccc tgcaaagtcc 960

gattcagttg aattgccaga cggctttgtc gagagaacta gagatagagg gttggtatgg 1020

acttcatggg ctccacaatt gagaatcctg agtcacgaat ctgtgtgcgg tttcctaaca 1080

cattgtggtt ctggttctat agttgaagga ctgatgtttg gtcatccact tatcatgttg 1140

ccaatctttg gtgaccagcc tttgaatgca cgtctgttag aagataaaca agttggaatt 1200

gaaatcccac gtaatgagga agatggatgt ttaaccaagg agtctgtggc cagatcatta 1260

cgttccgttg tcgttgaaaa ggaaggcgaa atctacaagg ccaatgcccg tgaactttca 1320

aagatctaca atgacacaaa agtagagaag gaatatgttt ctcaatttgt agattaccta 1380

gagaaaaacg ctagagccgt agctattgat catgaatcct aa 1422

<210> 12

<211> 1001

<212> DNA

<213> Artificial sequence

<220>

<223> Kl prom 12 promoter

<400> 12

cgtaaaaact aaaacgagcc cccaccaaag aacaaaaaag aaggtgctgg gcccccactt 60

tcttcccttg cacgtgatag gaagatggct acagaaacaa gaagatggaa atcgaaggaa 120

agagggagac tggaagctgt aaaaactgaa atgaaaaaaa aaaaaaaaaa aaaaaaacaa 180

gaagctgaaa atggaagact gaaatttgaa aaatggtaaa aaaaaaaaag aaacacgaag 240

ctaaaaacct ggattccatt ttgagaagaa gcaagaaagg taagtatggt aacgaccgta 300

caggcaagcg cgaaggcaaa tggaaaagct ggagtccgga agataatcat ttcatcttct 360

tttgttagaa cagaacagtg gatgtccctc atctcggtaa cgtattgtcc atgccctaga 420

actctctgtc cctaaaaaga ggacaaaaac ccaatggttt ccccagcttc cagtggagcc 480

accgatccca ctggaaacca ctggacagga agagaaaatc acggacttcc tctattgaag 540

gataattcaa cactttcacc agatcccaaa tgtcccgccc ctattcccgt gttccatcac 600

gtaccataac ttaccatttc atcacgttct ctatggcaca ctggtactgc ttcgactgct 660

ttgcttcatc ttctctatgg gccaatgagc taatgagcac aatgtgctgc gaaataaagg 720

gatatctaat ttatattatt acattataat atgtactagt gtggttattg gtaattgtac 780

ttaattttga tatataaagg gtggatcttt ttcattttga atcagaattg gaattgcaac 840

ttgtctcttg tcactattac ttaatagtaa ttatatttct tattaacctt ttttttaagt 900

caaaacacca aggacaagaa ctactcttca aaggtatttc aagttatcat acgtgtcaca 960

cacgcttcac agtttcaagt aaaaaaaaag aatattacac a 1001

<210> 13

<211> 2229

<212> DNA

<213> Stevia rebaudiana

<400> 13

atgtgtaaag ctgtttccaa ggaatactct gacttgttgc aaaaggatga agcctccttc 60

accaaatggg atgatgacaa agttaaggac catttagaca ctaacaagaa cttgtaccca 120

aacgatgaaa tcaaggaatt cgtcgaatct gtcaaagcta tgttcggttc catgaatgat 180

ggtgaaatca acgtttccgc ttacgacacc gcttgggttg ctttggttca agacgttgat 240

ggttccggtt ctccacaatt cccatcttct ttggaatgga ttgccaacaa ccaattgtct 300

gatggttctt ggggtgacca tttgttattc tctgctcacg acagaattat taacacttta 360

gcttgtgtca ttgctttgac ttcctggaat gtccatccat ccaagtgtga aaagggtttg 420

aacttcttga gagaaaacat ctgtaagttg gaagatgaaa atgctgaaca catgccaatt 480

ggtttcgaag ttaccttccc atctttgatt gatatcgcca agaagttgaa catcgaagtc 540

ccagaagaca ccccagcttt gaaggaaatc tacgccagaa gagatatcaa gttgaccaaa 600

atcccaatgg aagttttgca caaggttcca accaccttgt tgcactcttt ggaaggtatg 660

ccagacttgg aatgggaaaa gttgttaaag ttgcaatgta aggacggttc tttcttgttc 720

tctccatctt ctaccgcctt tgctttgatg caaactaagg acgaaaagtg tctacaatac 780

ttaactaata tcgttaccaa attcaacggt ggtgtcccaa acgtttaccc tgttgacttg 840

tttgaacaca tctgggttgt tgacagattg caacgtttgg gtattgctcg ttatttcaag 900

tctgaaatca aggactgtgt tgaatacatc aacaagtact ggactaagaa cggtatctgt 960

tgggctcgta acacccacgt tcaagatatc gacgacactg ctatgggttt cagagtcttg 1020

agagctcatg gttacgatgt caccccagat gtcttcagac aattcgaaaa ggatggtaag 1080

ttcgtttgtt ttgccggtca atccactcaa gccgtcactg gtatgttcaa cgtctacaga 1140

gcttctcaaa tgttgttccc aggtgaaaga atcctagaag acgctaagaa gttctcctac 1200

aactacttga aagaaaagca atctactaac gaattgttgg acaaatggat cattgccaaa 1260

gacttaccag gtgaagtcgg ttacgctttg gatattccat ggtacgcttc tctaccaaga 1320

ttagaaacca gatactactt ggaacaatac ggtggtgaag acgatgtctg gatcggtaag 1380

accttgtaca gaatgggtta cgtttccaac aacacttact tggaaatggc caaattggac 1440

tacaacaact acgtcgccgt cttacaattg gaatggtaca ccattcaaca atggtacgtt 1500

gacattggta ttgaaaagtt tgaatccgac aacatcaagt ccgtcttggt ttcctactac 1560

ttggctgctg cttccatctt tgaaccagaa agatccaagg aaagaattgc ttgggctaag 1620

accaccatct tggttgacaa gatcacttct attttcgact cttcccaatc ttccaaggaa 1680

gatatcaccg ctttcattga caaattcaga aacaagtctt cttccaagaa gcactccatt 1740

aacggtgaac catggcacga agttatggtt gctttgaaga agactttgca cggttttgct 1800

ttggatgctt tgatgactca ctctcaagat attcaccctc aattacacca agcttgggaa 1860

atgtggttaa ccaagttgca agatggtgtc gatgtcactg ctgaattgat ggttcaaatg 1920

atcaacatga ctgccggtag atgggtttct aaggaattgt tgactcaccc tcaataccaa 1980

cgtttgtcca ccgtcaccaa ctctgtctgt cacgacatca ctaagttgca caacttcaaa 2040

gaaaactcca ctactgtcga ttctaaggtt caagaattgg ttcaattagt tttctctgac 2100

accccagatg acttggacca agacatgaag caaactttct tgactgtcat gaagaccttc 2160

tactacaagg cttggtgtga cccaaacacc atcaacgacc atatttctaa ggtcttcgaa 2220

attgttatc 2229

<210> 14

<211> 2271

<212> DNA

<213> Stevia rebaudiana

<400> 14

atgacttctc acggtggtca aaccaaccca accaacttga ttattgacac caccaaggaa 60

agaatccaaa agcaattcaa gaatgttgaa atctccgttt cctcctacga cactgcttgg 120

gttgccatgg ttccatctcc aaactcccca aagtctccat gtttcccaga atgtttgaac 180

tggttaatca acaaccaatt gaacgatggt tcctggggtt tagtcaatca cacccacaac 240

cacaatcacc cattgttgaa ggactctcta tcctccactt tggcttgtat cgttgctttg 300

aagagatgga acgttggtga agaccaaatc aacaagggtt tgtcctttat tgaatccaac 360

ttggcttctg ctactgaaaa gtcccaacca tctcctatcg gttttgacat cattttccca 420

ggtttattgg aatacgctaa gaacttggac atcaacttat tatctaagca aaccgatttc 480

tccttgatgt tgcacaagag agaattggaa caaaagagat gtcactccaa cgaaatggac 540

ggttacttgg cttacatttc tgaaggtttg ggtaacttgt acgactggaa catggtcaag 600

aaataccaaa tgaagaacgg ttccgttttc aactctccat ctgctaccgc tgctgctttc 660

atcaaccatc aaaacccagg ttgtttgaac tacttgaact ctttgttgga caaattcggt 720

aacgctgttc caactgtcta cccacacgat ttgtttatca gattatccat ggttgacacc 780

attgaacgtt tgggtatttc tcatcacttc agagtcgaaa tcaagaacgt tttggatgaa 840

acttacagat gttgggttga aagagatgaa caaatcttca tggatgtcgt cacttgtgcc 900

ttggccttca gattattgag aattaacggt tacgaagttt ctccagaccc attggctgaa 960

atcactaacg aattggcttt gaaggacgaa tacgccgctt tggaaactta ccatgcctct 1020

cacatcttat accaagaaga cttgtcctct ggtaagcaaa tcttgaagtc tgctgacttc 1080

ttgaaggaaa ttatctctac tgattctaac agattgtcca agttgattca caaggaagtt 1140

gaaaacgcct tgaaattccc aatcaacact ggtttggaaa gaattaacac cagaagaaac 1200

atccaattat acaacgttga caacactaga atcttgaaga ctacttatca ctcttccaac 1260

atctccaaca ctgactactt gagattggct gtcgaagatt tctacacctg tcaatctatt 1320

tacagagaag aattgaaggg tttggaaaga tgggttgtcg aaaacaaatt ggaccaattg 1380

aaatttgcta gacaaaagac cgcctactgt tacttctccg ttgctgccac tttgtcctct 1440

ccagaattat ctgacgccag aatctcctgg gctaagaatg gtatcttgac caccgttgtc 1500

gatgacttct tcgatattgg tggtaccatt gacgaattga ccaacttgat tcaatgtgtt 1560

gaaaagtgga acgtcgatgt cgataaggac tgttgttctg aacacgtcag aatcttattc 1620

ttggctttga aagatgctat ctgttggatc ggtgacgaag ctttcaaatg gcaagctcgt 1680

gacgttacct ctcacgtcat ccaaacctgg ttggaattga tgaactctat gttgagagaa 1740

gccatctgga cccgtgatgc ttacgtccca actttgaacg aatacatgga aaatgcttac 1800

gtttctttcg ctttgggtcc aattgtcaag cctgctattt acttcgttgg tccaaagttg 1860

tccgaagaaa ttgttgaatc ttctgaatac cacaacttgt tcaaattgat gtctactcaa 1920

ggtcgtttgt tgaacgatat ccactctttc aagcgtgaat tcaaggaagg taagttgaat 1980

gctgttgctt tgcatttgtc taacggtgaa tctggtaagg tcgaagaaga agttgtcgaa 2040

gaaatgatga tgatgatcaa gaacaagaga aaggaattga tgaagttgat ctttgaagaa 2100

aacggttcta ttgtcccaag agcttgtaag gatgctttct ggaacatgtg tcacgtcttg 2160

aacttcttct acgctaacga tgacggtttc actggtaaca ccatcttaga caccgtcaag 2220

gacatcattt acaacccatt agtcttggtt aacgaaaacg aagaacaaag a 2271

<210> 15

<211> 301

<212> DNA

<213> Artificial sequence

<220>

<223> Sc Tal1 terminator

<400> 15

aggaagtatc tcggaaatat taatttaggc catgtcctta tgcacgtttc ttttgatact 60

tacgggtaca tgtacacaag tatatctata tatataaatt aatgaaaatc ccctatttat 120

atatatgact ttaacgagac agaacagttt tttatttttt atcctatttg atgaatgata 180

cagtttctta ttcacgtgtt atacccacac caaatccaat agcaataccg gccatcacaa 240

tcactgtttc ggcagcccct aagatcagac aaaacatccg gaaccacctt aaatcaacgt 300

c 301

<210> 16

<211> 1539

<212> DNA

<213> Artificial sequence

<220>

<223> KO_2_ Lactuca_sativa_Sc_CpO

<400> 16

atggatggtg tcattgacat gcaaaccatt ccattgagaa ccgccattgc cattggtggt 60

actgctgttg ctttggttgt tgctctatac ttctggttct tgagatctta cgcttctcca 120

tctcaccact ctaaccattt gccacctgtt ccagaagttc caggtgtccc agtcttgggt 180

aacttgttgc aattgaaaga aaagaagcca tacatgactt tcaccaaatg ggctgaaatg 240

tacggtccaa tctactctat cagaactggt gctacctcca tggttgttgt ttcctctaac 300

gaaattgcca aggaagttgt tgtcactaga ttcccatcca tctccaccag aaagttgtct 360

tacgctttga aggtcttgac tgaagataag tccatggttg ctatgtctga ttaccatgac 420

taccacaaga ccgtcaaaag acacattttg actgctgtct taggtccaaa cgcccaaaag 480

aagttccgtg ctcacagaga caccatgatg gaaaacgttt ccaatgaatt gcatgccttc 540

tttgaaaaga acccaaacca agaagtcaac ttgagaaaga tcttccaatc tcaattgttc 600

ggtttggcca tgaagcaagc tttgggtaag gatgtcgaat ctatctacgt caaggacttg 660

gaaactacca tgaagagaga agaaatcttt gaagtcttgg ttgttgaccc aatgatgggt 720

gccattgaag tcgattggag agacttcttc ccatacttga aatgggttcc aaacaaatct 780

ttcgaaaaca tcattcacag aatgtacacc cgtcgtgaag ctgtcatgaa ggctttgatc 840

caagaacaca agaagagaat tgcttctggt gaaaacttaa actcctacat tgactacttg 900

ttgtctgaag ctcaaacttt gactgacaag caattgttga tgtccctatg ggaaccaatc 960

attgaatctt ccgacaccac catggtcacc actgaatggg ctatgtacga attggctaag 1020

aatccaaaca tgcaagacag attgtacgaa gaaatccaat ctgtttgtgg ttccgaaaag 1080

atcactgaag aaaacttgtc tcaattacca tacttgtacg ctgttttcca agaaactttg 1140

agaaagcact gtccagttcc aatcatgcca ttgagatacg tccacgaaaa caccgttttg 1200

ggtggttacc acgttccagc tggtactgaa gttgctatca acatctatgg ttgtaacatg 1260

gacaagaagg tctgggaaaa cccagaagaa tggaacccag aaagattctt atccgaaaag 1320

gaatccatgg acttgtacaa gaccatggcc ttcggtggtg gtaagagagt ttgtgctggt 1380

tctttgcaag ctatggtcat ctcttgtatc ggtattggta gattagtcca agattttgaa 1440

tggaaattga aagatgacgc tgaagaagat gtcaacactt taggtttaac cactcaaaag 1500

ttgcacccat tattggcttt gatcaaccct cgaaagtaa 1539

<210> 17

<211> 301

<212> DNA

<213> Artificial sequence

<220>

<223> Sc Tpi1 terminator

<400> 17

agattaatat aattatataa aaatattatc ttcttttctt tatatctagt gttatgtaaa 60

ataaattgat gactacggaa agctttttta tattgtttct ttttcattct gagccactta 120

aatttcgtga atgttcttgt aagggacggt agatttacaa gtgatacaac aaaaagcaag 180

gcgctttttc taataaaaag aagaaaagca tttaacaatt gaacacctct atatcaacga 240

agaatattac tttgtctcta aatccttgta aaatgtgtac gatctctata tgggttactc 300

a 301

<210> 18

<211> 403

<212> DNA

<213> Artificial sequence

<220>

<223> Ag lox_TEF1 promoter

<400> 18

taccgttcgt ataatgtatg ctatacgaag ttatgtcccc gccgggtcac ccggccagcg 60

acatggaggc ccagaatacc ctccttgaca gtcttgacgt gcgcagctca ggggcatgat 120

gtgactgtcg cccgtacatt tagcccatac atccccatgt ataatcattt gcatccatac 180

attttgatgg ccgcacggcg cgaagcaaaa attacggctc ctcgctgcag acctgcgagc 240

agggaaacgc tcccctcaca gacgcgttga attgtcccca cgccgcgccc ctgtagagaa 300

atataaaagg ttaggatttg ccactgaggt tcttctttca tatacttcct tttaaaatct 360

tgctaggata cagttctcac atcacatccg aacataaaca aca 403

<210> 19

<211> 810

<212> DNA

<213> Artificial sequence

<220>

<223> KANMX

<400> 19

atgggtaagg aaaagactca cgtttcgagg ccgcgattaa attccaacat ggatgctgat 60

ttatatgggt ataaatgggc tcgcgataat gtcgggcaat caggtgcgac aatctatcga 120

ttgtatggga agcccgatgc gccagagttg tttctgaaac atggcaaagg tagcgttgcc 180

aatgatgtta cagatgagat ggtcagacta aactggctga cggaatttat gcctcttccg 240

accatcaagc attttatccg tactcctgat gatgcatggt tactcaccac tgcgatcccc 300

ggcaaaacag cattccaggt attagaagaa tatcctgatt caggtgaaaa tattgttgat 360

gcgctggcag tgttcctgcg ccggttgcat tcgattcctg tttgtaattg tccttttaac 420

agcgatcgcg tatttcgttt ggctcaggcg caatcacgaa tgaataacgg tttggttgat 480

gcgagtgatt ttgatgacga gcgtaatggc tggcctgttg aacaagtctg gaaagaaatg 540

cataagcttt tgccattctc accggattca gtcgtcactc atggtgattt ctcacttgat 600

aaccttattt ttgacgaggg gaaattaata ggttgtattg atgttggacg agtcggaatc 660

gcagaccgat accaggatct tgccatccta tggaactgcc tcggtgagtt ttctccttca 720

ttacagaaac ggctttttca aaaatatggt attgataatc ctgatatgaa taaattgcag 780

tttcatttga tgctcgatga gtttttctaa 810

<210> 20

<211> 285

<212> DNA

<213> Artificial sequence

<220>

<223> Ag Tef1_lox terminator

<400> 20

atcagtactg acaataaaaa gattcttgtt ttcaagaact tgtcatttgt atagtttttt 60

tatattgtag ttgttctatt ttaatcaaat gttagcgtga tttatatttt ttttcgcctc 120

gacatcatct gcccagatgc gaagttaagt gcgcagaaag taatatcatg cgtcaatcgt 180

atgtgaatgc tggtcgctat actgctgtcg attcgatact aacgccgcca tccagtgtcg 240

aaaacgagct cataacttcg tataatgtat gctatacgaa cggta 285

<210> 21

<211> 1575

<212> DNA

<213> Arabidopsis thaliana

<400> 21

atggaatctt tagtcgttca caccgtcaat gccatctggt gtattgtcat tgttggtatt 60

ttctctgttg gttaccacgt ttacggtcgt gccgttgttg aacaatggag aatgagaaga 120

tctttgaaat tgcaaggtgt caagggtcca ccaccatcca ttttcaacgg taatgtctct 180

gaaatgcaaa gaatccaatc tgaagctaag cactgttccg gtgacaacat catttctcac 240

gattactcct cctctttgtt ccctcacttt gaccactgga gaaagcaata cggtagaatc 300

tacacctact ccactggttt gaaacaacat ttgtacatca accatccaga aatggtcaag 360

gaattatctc aaaccaacac tttgaactta ggtcgtatca ctcacatcac caagagattg 420

aacccaatct taggtaacgg tatcatcact tccaacggtc cacactgggc tcatcaaaga 480

agaattattg cttacgaatt cacccacgac aaaatcaagg gtatggtcgg tttgatggtc 540

gaatctgcca tgccaatgtt gaacaaatgg gaagaaatgg ttaagagagg tggtgaaatg 600

ggttgtgaca tccgtgttga cgaagatttg aaggatgttt ctgctgatgt cattgctaag 660

gcttgtttcg gttcctcttt ctccaagggt aaggctatct tctccatgat cagagacttg 720

ttgactgcca tcactaagag atctgttttg ttcagattca acggtttcac cgacatggtt 780

ttcggttcca agaagcatgg tgatgtcgat atcgatgctt tggaaatgga attggaatct 840

tctatctggg aaaccgttaa ggaaagagaa attgaatgta aggacactca caagaaggat 900

ttgatgcaat taatcttgga aggtgccatg agatcttgtg acggtaactt gtgggacaag 960

tctgcttaca gaagatttgt tgtcgacaac tgtaaatcca tctactttgc cggtcacgac 1020

tctactgctg tctccgtttc ctggtgtttg atgttgctag ctttgaaccc atcctggcaa 1080

gtcaagatca gagatgaaat cttatcttct tgtaagaacg gtattccaga tgctgaatcc 1140

attccaaact tgaagaccgt taccatggtc attcaagaaa ctatgagatt gtacccacca 1200

gctccaattg tcggtagaga agcttccaag gacatcagat taggtgactt ggttgttcca 1260

aagggtgttt gtatctggac tttgattcca gctttgcacc gtgacccaga aatctggggt 1320

ccagatgcta acgacttcaa gccagaaaga ttctctgaag gtatttccaa ggcttgtaaa 1380

tacccacaat cttacatccc attcggtttg ggtccaagaa cctgtgtcgg taagaacttc 1440

ggtatgatgg aagtcaaagt tttggtttct ttgattgttt ccaagttctc tttcaccttg 1500

tctccaactt accaacactc tccatctcac aagttgttgg ttgaacctca acacggtgtt 1560

gtcattagag tcgtt 1575

<210> 22

<211> 1000

<212> DNA

<213> Artificial sequence

<220>

<223> Kl prom 6 promoter

<400> 22

caaagggggg gcagggacag ggatacgaca agggctgggg aaaaaaaaaa agatagatac 60

gattggccgg gtaagcctgg ggaaatgtag caagtgcggg taagttaaaa ggtaaccacg 120

tgactccgga agagtcacgt ggttacggac ttttttctct agatctcagc tttttatcgg 180

tcttaccctg ccctcctgcc ccctgcccct tccctttgcc ccaaaaagaa aggaaatctg 240

ttggatttcg ctcaggccat ccctttcgtt aatatcggtt atcgctttac acactgcaca 300

tccttctgtc caaaaggaat ccagaagttt agcttttcct tcctttccca cagacattag 360

cctaggccct ctctcatcat ttgcatgcct cagccaatgt accaagaata acgcaacgag 420

gttgggaaat tttaacccaa caatcgatgc agatgtgaca agagattaga cacgttccag 480

ataccagatt acacagcttg tgctagcaga gtgacatatg gtggtgttgt gtctcgttta 540

gtacctgtaa tcgagagtgt tcaaatcagt cgatttgaac acccttactg ccactgaata 600

ttgattgaat accgtttatt gaaggtttta tgagtgatct tctttcggtc caggacaatt 660

tgttgagctt tttctatgta gagttccgtc cctttttttt ttttttttgc tttctcgcac 720

ttactagcac tatttttttt tcacacacta aaacacttta ttttaatcta tatatatata 780

tatatatata tgtaggaatg gaatcacaga catttgatac tcatcctcat ccttattaat 840

tcttgtttta atttgtttga cttagccaaa ccaccaatct caacccatcg tatttcaggt 900

attgtgtgtc tagtgtgtct ctggtatacg gaaataagtg ccagaagtaa ggaagaaaca 960

aagaacaagt gtctgaatac tactagcctc tcttttcata 1000

<210> 23

<211> 2133

<212> DNA

<213> Arabidopsis thaliana

<400> 23

atgtcctctt cttcttcttc ttctacttcc atgattgatt tgatggctgc catcatcaag 60

ggtgaaccag tcattgtctc tgacccagcc aacgcttctg cttacgaatc cgttgctgct 120

gaattgtcct ccatgttgat tgaaaacaga caattcgcta tgattgtcac tacttccatt 180

gctgtcttga ttggttgtat cgtcatgttg gtctggagaa gatccggttc cggtaactcc 240

aagagagttg aaccattgaa gccattagtc atcaagccaa gagaagaaga aattgatgac 300

ggtagaaaga aggtcaccat cttctttggt actcaaaccg gtactgctga aggttttgct 360

aaggctttgg gtgaagaagc caaagctaga tacgaaaaga ccagattcaa gatcgttgac 420

ttggacgact acgctgctga tgacgacgaa tacgaagaaa agttgaagaa ggaagatgtt 480

gccttcttct tcttggctac ttacggtgat ggtgaaccaa ctgacaatgc tgccagattc 540

tacaaatggt tcaccgaagg taacgacaga ggtgaatggt taaagaactt gaaatacggt 600

gttttcggtc taggtaacag acaatacgaa cacttcaaca aggttgccaa ggttgtcgat 660

gacatcttgg ttgaacaagg tgctcaaaga ttagtccaag tcggtttggg tgatgatgac 720

caatgtatcg aagatgactt cactgcttgg agagaagctt tgtggccaga attggacacc 780

atcttaagag aagaaggtga taccgctgtt gccaccccat acactgctgc tgttttggaa 840

tacagagttt ctatccacga ctctgaagat gccaagttca acgacatcaa catggctaac 900

ggtaacggtt acactgtttt cgacgctcaa cacccataca aggccaatgt tgctgtcaag 960

agagaattgc acactccaga atctgatcgt tcttgtatcc acttggaatt tgacattgct 1020

ggttctggtt tgacctacga aaccggtgac cacgtcggtg tcttatgtga caacttgtct 1080

gaaactgtcg atgaagcttt gagattattg gacatgtctc cagacactta tttctccttg 1140

catgctgaaa aggaagatgg tactccaatt tcttcttcct tgcctcctcc attcccacca 1200

tgtaacttga gaaccgcttt aaccagatac gcttgtttgc tatcctctcc aaagaagtcc 1260

gctttggttg ctttggctgc tcacgcttct gacccaactg aagctgaaag attgaaacat 1320

ttggcttccc cagctggtaa ggatgaatac tccaaatggg ttgttgaatc tcaaagatct 1380

ttgttggaag tcatggctga attcccatct gccaagccac cattgggtgt tttcttcgcc 1440

ggtgttgctc caagattgca accaagattt tactccatct cttcttctcc aaagattgct 1500

gaaaccagaa ttcacgttac ctgtgccttg gtctacgaaa agatgccaac cggtagaatt 1560

cacaagggtg tttgttccac ctggatgaag aacgctgttc catacgaaaa gtctgaaaac 1620

tgttcttctg ctccaatctt cgtccgtcaa tccaacttca agttgccatc tgactccaag 1680

gtcccaatca tcatgatcgg tccaggtact ggtttagctc cattcagagg tttcttgcaa 1740

gaaagattgg ccttagttga atctggtgtc gaattgggtc cttctgtttt gttcttcggt 1800

tgtagaaacc gtcgtatgga cttcatctac gaagaagaat tgcaaagatt tgtcgaatct 1860

ggtgctttgg ctgaattgtc cgttgctttc tctcgtgaag gtccaaccaa agaatacgtt 1920

caacacaaga tgatggacaa agcctccgac atctggaaca tgatctccca aggtgcttac 1980

ttgtacgttt gtggtgatgc taaaggtatg gccagagatg tccacagatc tttacatacc 2040

attgcccaag aacaaggttc catggactcc accaaggctg aaggtttcgt taagaacttg 2100

caaacttctg gtcgttactt gagagatgtt tgg 2133

<210> 24

<211> 301

<212> DNA

<213> Artificial sequence

<220>

<223> Sc Pdc1 terminator

<400> 24

agcgatttaa tctctaatta ttagttaaag ttttataagc atttttatgt aacgaaaaat 60

aaattggttc atattattac tgcactgtca cttaccatgg aaagaccaga caagaagttg 120

ccgacagtct gttgaattgg cctggttagg cttaagtctg ggtccgcttc tttacaaatt 180

tggagaattt ctcttaaacg atatgtatat tcttttcgtt ggaaaagatg tcttccaaaa 240

aaaaaaccga tgaattagtg gaaccaagga aaaaaaaaga ggtatccttg attaaggaac 300

a 301

<210> 25

<211> 1000

<212> DNA

<213> Artificial sequence

<220>

<223> Kl prom 3 promoter

<400> 25

gagcctgtcc aagcaaatgc cttctcataa atggtgccaa agacccgcaa gcccaaagca 60

attacccccc aaaaagaaat gatatagtgc aagatacgta tatgaccatg acttgactag 120

gtgaaacagt gcagaaacag ccgcacaaaa gcagccctaa ccctcagagt cgattttact 180

ctttcaggta ataaagcctc gacatcaatt ttagacagaa gccaggctgg cctcgagatt 240

atagccatag gcaagcaaga ggagagaagg ggaggccccc catggggggc ctcccccccg 300

ctgtcaaggt ttggcagaac ctagcttcat taggccacta gcccagccta aaacgtcaac 360

gggcaggagg aacactccca caagacggcg tagtattctc gattcataac cattttctca 420

atcgaattac acagaacaca ccgtacaaac ctctctatca taactactta atagtcacac 480

acgtactcgt ctaaatacac atcatcgtcc tacaagttca tcaaagtgtt ggacagacaa 540

ctataccagc atggatctct tgtatcggtt cttttctccc gctctctcgc aataacaatg 600

aacactgggt caatcatagc ctacacaggt gaacagagta gcgtttatac agggtttata 660

cggtgattcc tacggcaaaa atttttcatt tctaaaaaaa aaaagaaaaa tttttctttc 720

caacgctaga aggaaaagaa aaatctaatt aaattgattt ggtgattttc tgagagttcc 780

ctttttcata tatcgaattt tgaatataaa aggagatcga aaaaattttt ctattcaatc 840

tgttttctgg ttttatttga tagttttttt gtgtattatt attatggatt agtactggtt 900

tatatgggtt tttctgtata acttcttttt attttagttt gtttaatctt attttgagtt 960

acattatagt tccctaactg caagagaagt aacattaaaa 1000

<210> 26

<211> 1443

<212> DNA

<213> Stevia rebaudiana

<400> 26

atggacgcta tggccaccac tgaaaagaag cctcacgtta tctttattcc attcccagct 60

caatctcata tcaaggctat gttgaaattg gctcaattat tgcaccacaa gggtttgcaa 120

atcacttttg tcaacaccga cttcattcac aaccaattct tggaatcttc tggtcctcac 180

tgtttggacg gtgctccagg tttcagattc gaaaccattc cagatggtgt ttcccactct 240

ccagaagcct ccatcccaat cagagaatcc ttgttgagat ctattgaaac caacttcttg 300

gaccgtttca tcgatttggt taccaaattg ccagacccac caacctgtat catttctgac 360

ggtttcttgt ccgttttcac catcgatgct gccaagaaat tgggtattcc agtcatgatg 420

tactggactt tggctgcttg tggtttcatg ggtttctacc atattcactc tttgattgaa 480

aagggtttcg ctccattaaa ggatgcttct tacttgacca acggttactt ggacaccgtc 540

attgactggg ttccaggtat ggaaggtatc agattgaaag atttcccatt ggactggtct 600

actgacttga atgacaaggt cttgatgttc actactgaag ctccacaaag atctcataag 660

gtttctcacc acatcttcca cactttcgat gaattagaac catctatcat caagactcta 720

tccttgagat acaaccatat ctacaccatt ggtccattac aattgttgtt ggaccaaatc 780

ccagaagaaa agaagcaaac cggtatcact tctttgcacg gttactcttt agtcaaggaa 840

gaaccagaat gtttccaatg gttacaatcc aaggaaccaa actctgttgt ctacgttaac 900

tttggttcca ccactgttat gtccttggaa gatatgactg aatttggttg gggtttggct 960

aactctaacc actacttctt atggatcatc agatctaact tggtcattgg tgaaaacgcc 1020

gttttgcctc cagaattgga agaacacatc aagaagagag gtttcattgc ttcctggtgt 1080

tctcaagaaa aggtcttgaa gcacccatct gttggtggtt tcttgaccca ctgtggttgg 1140

ggttccacca ttgaatccct atctgctggt gttccaatga tctgttggcc atactcctgg 1200

gaccaattga ctaactgtcg ttacatctgt aaggaatggg aagttggttt ggaaatgggt 1260

actaaggtca agagagatga agtcaagaga ttagtccaag aattgatggg tgaaggtggt 1320

cacaagatga gaaacaaagc caaggactgg aaggaaaagg ccagaattgc tattgctcca 1380

aacggttctt cctccttgaa catcgataaa atggttaagg aaatcactgt cttggctcga 1440

aac 1443

<210> 27

<211> 301

<212> DNA

<213> Artificial sequence

<220>

<223> Sc TDH1 terminator

<400> 27

aataaagcaa tcttgatgag gataatgatt tttttttgaa tatacataaa tactaccgtt 60

tttctgctag attttgtgaa gacgtaaata agtacatatt actttttaag ccaagacaag 120

attaagcatt aactttaccc ttttctcttc taagtttcaa tactagttat cactgtttaa 180

aagttatggc gagaacgtcg gcggttaaaa tatattaccc tgaacgtggt gaattgaagt 240

tctaggatgg tttaaagatt tttccttttt gggaaataag taaacaatat attgctgcct 300

t 301

<210> 28

<211> 1000

<212> DNA

<213> Artificial sequence

<220>

<223> Kl prom 2 promoter

<400> 28

gagcctgtcc aagcaaatgc cttctcataa atggtgccaa agacccgcaa gcccaaagca 60

attacccccc aaaaagaaat gatatagtgc aagatacgta tatgaccatg acttgactag 120

gtgaaacagt gcagaaacag ccgcacaaaa gcagccctaa ccctcagagt cgattttact 180

ctttcaggta ataaagcctc gacatcaatt ttagacagaa gccaggctgg cctcgagatt 240

atagccatag gcaagcaaga ggagagaagg ggaggccccc catggggggc ctcccccccg 300

ctgtcaaggt ttggcagaac ctagcttcat taggccacta gcccagccta aaacgtcaac 360

gggcaggagg aacactccca caagacggcg tagtattctc gattcataac cattttctca 420

atcgaattac acagaacaca ccgtacaaac ctctctatca taactactta atagtcacac 480

acgtactcgt ctaaatacac atcatcgtcc tacaagttca tcaaagtgtt ggacagacaa 540

ctataccagc atggatctct tgtatcggtt cttttctccc gctctctcgc aataacaatg 600

aacactgggt caatcatagc ctacacaggt gaacagagta gcgtttatac agggtttata 660

cggtgattcc tacggcaaaa atttttcatt tctaaaaaaa aaaagaaaaa tttttctttc 720

caacgctaga aggaaaagaa aaatctaatt aaattgattt ggtgattttc tgagagttcc 780

ctttttcata tatcgaattt tgaatataaa aggagatcga aaaaattttt ctattcaatc 840

tgttttctgg ttttatttga tagttttttt gtgtattatt attatggatt agtactggtt 900

tatatgggtt tttctgtata acttcttttt attttagttt gtttaatctt attttgagtt 960

acattatagt tccctaactg caagagaagt aacattaaaa 1000

<210> 29

<211> 1380

<212> DNA

<213> Stevia rebaudiana

<400> 29

atggctgaac aacaaaagat caagaaatct ccacacgtct tgttgattcc attcccattg 60

caaggtcaca tcaacccatt catccaattc ggtaagagat tgatttccaa gggtgtcaag 120

accactttag tcaccactat tcacacttta aactccactt taaaccactc taacactact 180

accacctcta ttgaaatcca agccatttct gacggttgtg acgaaggtgg tttcatgtct 240

gctggtgaat cttacttgga aactttcaag caagtcggtt ccaagtcttt ggctgatttg 300

atcaagaaat tgcaatccga aggtactacc atcgatgcta tcatctacga ctccatgact 360

gaatgggttt tggatgttgc cattgaattt ggtattgacg gtggttcttt cttcacccaa 420

gcctgtgttg ttaactcttt gtactaccac gtccacaagg gtttgatctc tctaccatta 480

ggtgaaaccg tttccgtccc aggtttccca gtcttgcaaa gatgggaaac tccattgatc 540

ttacaaaacc atgaacaaat ccaatctcca tggtcccaaa tgttgtttgg tcaattcgct 600

aacattgacc aagctagatg ggttttcacc aactctttct acaagttgga agaagaagtc 660

attgaatgga ccagaaagat ctggaacttg aaggttatcg gtccaactct accatccatg 720

tacttggaca agagattgga tgacgacaag gacaacggtt tcaacttgta caaggctaac 780

catcacgaat gtatgaactg gttggatgac aagccaaagg aatctgttgt ttacgttgct 840

ttcggttctt tggtcaagca tggtccagaa caagttgaag aaatcaccag agctttgatt 900

gactccgatg ttaacttctt atgggttatc aagcacaagg aagaaggtaa attgccagaa 960

aacttgtctg aagttatcaa gaccggtaag ggtttgattg ttgcttggtg taagcaattg 1020

gatgttttgg ctcacgaatc cgtcggttgt ttcgtcactc actgtggttt caactctact 1080

ttggaagcta tctccttggg tgttccagtt gttgccatgc ctcaattctc tgaccaaacc 1140

accaacgcca aattgttgga tgaaatcttg ggtgtcggtg tccgtgtcaa ggctgatgaa 1200

aacggtattg ttagaagagg taacttagct tcctgtatca agatgatcat ggaagaagaa 1260

cgtggtgtca ttatcagaaa gaatgctgtc aaatggaagg acttggctaa ggttgctgtc 1320

cacgaaggtg gttcctctga caatgacatt gttgaatttg tctctgaatt gatcaaagcg 1380

<210> 30

<211> 1374

<212> DNA

<213> Stevia rebaudiana

<400> 30

atggaaaaca agactgaaac cactgttaga agaagaagaa gaatcatctt attcccagtt 60

ccattccaag gtcacattaa cccaatcttg caattggcta acgtcttata ctccaagggt 120

ttctccatca ccatcttcca caccaacttc aacaaaccta aaacttccaa ctacccacac 180

ttcaccttca gatttatctt ggacaacgac ccacaagatg aaagaatttc taacttgcca 240

acccatggtc cattggccgg tatgagaatt ccaatcatca acgaacacgg tgctgacgaa 300

ttgagaagag aattggaatt gttgatgttg gcttctgaag aagatgaaga agtctcttgt 360

ttgatcactg atgctttatg gtactttgct caatctgttg ctgactcttt gaacttgaga 420

agattagtct tgatgacctc ttctttgttc aacttccacg ctcacgtttc tctaccacaa 480

tttgatgaat tgggttactt ggacccagat gacaagacca gattggaaga acaagcctcc 540

ggtttcccaa tgttgaaggt caaggatatc aagtctgcct actccaactg gcaaatcttg 600

aaggaaattt tgggtaagat gatcaagcaa accaaggctt cttctggtgt catctggaac 660

tccttcaagg aattggaaga atctgaattg gaaaccgtca tcagagaaat tccagctcca 720

tctttcttga ttccattacc aaagcatttg actgcttcct cctcttctct attggaccac 780

gacagaactg ttttccaatg gttggaccaa caaccaccat cttccgtctt atacgtttcc 840

tttggttcca cttctgaagt tgacgaaaag gacttcttgg aaattgctcg tggtttggtt 900

gactccaagc aatctttctt atgggttgtc agaccaggtt tcgtcaaggg ttccacctgg 960

gttgaacctt tgccagacgg tttcttgggt gaaagaggta gaattgtcaa atgggttcca 1020

caacaagaag ttttggctca cggtgccatt ggtgctttct ggactcactc tggttggaac 1080

tctactttgg aatccgtttg tgaaggtgtt ccaatgattt tctctgactt cggtttggac 1140

caaccattga atgctcgtta catgtccgat gttttgaagg ttggtgtcta cttggaaaac 1200

ggttgggaac gtggtgaaat tgctaacgcc atcagaagag tcatggtcga tgaagaaggt 1260

gaatacatca gacaaaatgc tcgtgtcttg aaacaaaagg ctgatgtttc tttgatgaag 1320

ggtggttctt cttacgaatc tttggaatct ttggtttcct acatctccag tctc 1374

<210> 31

<211> 602

<212> DNA

<213> Artificial sequence

<220>

<223> Sc Eno1 terminator

<400> 31

aagcttttga ttaagccttc tagtccaaaa aacacgtttt tttgtcattt atttcatttt 60

cttagaatag tttagtttat tcattttata gtcacgaatg ttttatgatt ctatataggg 120

ttgcaaacaa gcatttttca ttttatgtta aaacaatttc aggtttacct tttattctgc 180

ttgtggtgac gcgtgtatcc gcccgctctt ttggtcaccc atgtatttaa ttgcataaat 240

aattcttaaa agtggagcta gtctatttct atttacatac ctctcatttc tcatttcctc 300

caagcttttg attaagcctt ctagtccaaa aaacacgttt ttttgtcatt tatttcattt 360

tcttagaata gtttagttta ttcattttat agtcacgaat gttttatgat tctatatagg 420

gttgcaaaca agcatttttc attttatgtt aaaacaattt caggtttacc ttttattctg 480

cttgtggtga cgcgtgtatc cgcccgctct tttggtcacc catgtattta attgcataaa 540

taattcttaa aagtggagct agtctatttc tatttacata cctctcattt ctcatttcct 600

cc 602

<210> 32

<211> 600

<212> DNA

<213> Artificial sequence

<220>

<223> Sc_TDH3.pro

<400> 32

ttagtcaaaa aattagcctt ttaattctgc tgtaacccgt acatgcccaa aatagggggc 60

gggttacaca gaatatataa catcgtaggt gtctgggtga acagtttatt cctggcatcc 120

actaaatata atggagcccg ctttttaagc tggcatccag aaaaaaaaag aatcccagca 180

ccaaaatatt gttttcttca ccaaccatca gttcataggt ccattctctt agcgcaacta 240

cagagaacag gggcacaaac aggcaaaaaa cgggcacaac ctcaatggag tgatgcaacc 300

tgcctggagt aaatgatgac acaaggcaat tgacccacgc atgtatctat ctcattttct 360

tacaccttct attaccttct gctctctctg atttggaaaa agctgaaaaa aaaggttgaa 420

accagttccc tgaaattatt cccctacttg actaataagt atataaagac ggtaggtatt 480

gattgtaatt ctgtaaatct atttcttaaa cttcttaaat tctactttta tagttagtct 540

tttttttagt tttaaaacac caagaactta gtttcgaata aacacacata aacaaacaaa 600

<210> 33

<211> 4248

<212> DNA

<213> Artificial sequence

<220>

<223> ALNQ_007_38000 CpO for S. cerevisiae

<400> 33

atgtctgctt tgaacaccga tgctttggaa tctcaaccag acttcaagtt ccaaagacaa 60

aagagattga tgtctccatt tatgtctaag aaggttccac caatcccaac caaagaagaa 120

agaaagccat acggtgaata ccacaccaac atcttattca gaattatgtt ctggtggttg 180

aaccctatct tgaacgtcgg ttacaagaga actttgactg aacaagactt gttctatttg 240

gacaactccc aaaccatgga cactttatac gaaactttca aatcccactt gaagaccact 300

atcgaaaagt ccatgaagaa gtacttgcaa gaaaaatact ctaaggaagg taagacctac 360

gacccatctt ccattccaac tgctgaagat ttgaaggact tccaaattcc aatctacgct 420

atcccattgt gtttattcaa gactttgtac tggcaatact ctttgggtaa tttgtacaag 480

gtcttgtctg actgtacttc tgctactacc ccattgttgc aaaagaagtt aatcaacttc 540

gttcaaatga agtctttcac cgctttgggt tctaccggta agggcgttgg ttacgccatc 600

ggtgtgtgtt tgatgatctt cttccaagcc attaccgtca accatgcttt ccacaacttg 660

caaatttgtg gtgccaaatc caaggctatt ttgactagaa tgttgttgga caagtctatg 720

tctgttgatg ctagaggtaa ccacttcttc ccagcctcca aggtccaatc tatgatctct 780

accgatttga acagagtcga tttggccatc ggtttcttcc cattcgcttt gacttgtgtt 840

tttccaattg ctatctgtat cggtttgtta atctggaacg ttggtgtctc cgccttggtt 900

ggtattgcca tcttcgttgc taacgttggt ttgttggctg tttccatccc aagattgatg 960

agattcagaa tcaaagctat ggtttttacc gacaagcgtg tcactttgat gaaggaattg 1020

ttgaagaact tcaagatgat caagttctac tcttgggaaa actcttacgc tagaagaatc 1080

caagatgctc gtttcaagga aatgaagttg atcttgtcat tacaatcttt aagaaacatt 1140

gtcatgtccg tttctttcgc catgccaact ttggcttcta tggctacttt ctgtaccgct 1200

ttcgatatca cttctggtaa gaacgctgct tccttgttct cctctttgtc tttattccaa 1260

gttttatcca tgcaattcat gttggctcca gttgccttaa acaccgctgc tgacatgatg 1320

gtttctatga agaaattcaa ccagttcttg gctcacgctg atttggatcc tgaacaatac 1380

agaatcgaag aattccacga tgataagttg gccgttaagg ttgacaacgc caccttcgaa 1440

tgggacacct tcgatgatga caaggtcgaa gacccagctt tagaatttga aaaacaagat 1500

aatgactcct tggaaaaagt ttcctcccac aacaccgttg actacgactc tactgaaaag 1560

atcagaaacg acacttcttc tatcgattcc accaagattt tggaaaagac tgctttccct 1620

ggtttgagaa acatcaactt ggaaatcaaa aagggtgaat tcgttgttgt taccggttcc 1680

attggtgctg gtaaatcctc tttgctacaa gctatctctg gtttgatgaa aagagtctcc 1740

ggtaaggttt acgtcgatgg tgacttgttg ttgtgtggtt acccttgggt tcaaaacgct 1800

actatcagag acaacatctt gttcggttta ccattcgacc aagaaaagta cgaccaagtt 1860

gtttacgctt gttctttgca atctgacttc aaccaattcc aaggtggtga catgactgaa 1920

gttggtgaaa gaggtattac cttgtctggt ggtcaaaagg ctagaattaa cttggccaga 1980

tccgtctacg ctgacaagga cattattttg ttggatgacg ttttgtctgc tgtcgatgct 2040

aaggttggta gacatattgt cgatacctgt ttgttgggtt tattgaagga caagacccgt 2100

atcatggcta cccaccaatt gtctttaatt gactctgctg acagaatgat tttcttgaac 2160

ggtgatggtt ctattgactg tggtactatt tccgaattaa aggaccgtaa cgaaaaattg 2220

aacgaattgt tgtctcacca aaaggacaag gccaacgact ctgatgaaga attggaattg 2280

caagaagaaa tcgaatctaa ggaacaacac ttgaaggaag atttgtctga agttaagcac 2340

gaaatcaagg aagaacaaaa gaagatggaa atctccggtg atgtcggtga agaattcgaa 2400

cacgctgacg aacacaagga aattgttaga attattggtg atgaggaaag agctgtcaac 2460

gctttgaagg ccgatgtcta catcaactac gctaaattgg ccttcggtaa gttgggtcta 2520

ttctccttga tgttgttcgt caccgttgct gctttgcaaa cttactgtaa catgttcact 2580

aacacctggt tatccttctg gattgaagaa aagttccatg gtagatccaa gtccttctac 2640

atgggtattt acatcatgtt cgctttcttg tacactttct tcctagctgc ctttttctac 2700

tctatgtgtt acttctgtaa cagagcttcc aagtatttga actacaaggc ctccgaaaag 2760

attttgcacg ttccaatgtc tttcatggac atttctccaa tcggtcgtgt tttgaataga 2820

ttcaccaagg acaccgatgt cttggacaac gaaattttgg accaattcag acaattcttg 2880

tccccattct gtaacgccat tggtactatc gtcttgtgca tcatctacat tccatggttc 2940

gctattgccg tcccattgat tgtcactttc tacgtcttgg tcgccaacta ctaccaagct 3000

tctgctcgtg aaatcaagag attggaagct gtcaagcgtt ctttggtctt tggtcacttc 3060

aacgaagctc tatctggtaa ggaaactatc aaggcttaca gagctatcga cagagtcaag 3120

caaagattga acaaattgat cgatgggcaa aacgaagctt actttttgac cattgttaac 3180

caaagatggt tgggtgccaa tttgtctatc ttgtctttct gtatggtttt catcatctct 3240

ttcttgtgtg tcttcagagt cttcaacatt tctgctgctt ccactggttt attattgact 3300

tacgttatca acttgaccaa taccatcact atgatgatga gagctatgac ccaagtcgaa 3360

aacgaattta actccgttga gagattgaac cactacgctt tcgacttagt ccaagaagct 3420

ccatacgaaa tcccagaaaa cgatccacca caagactggc caaagtacgg tgaaatcatt 3480

ttcaaggatg tttccatgag atacagacca gaattgccat tcgttttgaa gaacatcaac 3540

ctatccatcg gtaagggtga aaagattggt ttctgtggta gaaccggtgc cggtaagtct 3600

actttcatga cttgtttgta cagaatttct gagttcgaag gtaccatcgt tatcgatgac 3660

gtcgatatct ccaagttggg tttgcacaaa ttgcgttcta agttgactat tatcccacaa 3720

gacccagtct tattcgttgg ttccatcaga gaaaacttag acccatttgg tgaatactct 3780

gacgaagaat tatgggaagc tttgaccatc tccggtttga tcaacaaaga agacttgaac 3840

gaggttaaga agcaaaatga aaatgacgac aacttgaaca agttccactt gattagaatg 3900

gtcgaagatg atggtgttaa cttctccatc ggtgaacgtc aattgattgc tctagccaga 3960

gctttggtca gaaagactaa gattttgatc ttggacgaag ctacttcttc tgtcgattac 4020

gctactgact ccagaattca aaagaccatt gctactgaat tcgacgactg tatgatcttg 4080

tgtatcgctc acagattaaa caccatcttg aactacgaca agatcgtcgt catggacaaa 4140

ggtgaaatcg ttgaattcga taagccaaga tctttgttca tgagagaaga aggtgttttc 4200

agatccatgt gtgaacaagc taacatcacc attgaagatt ttccataa 4248

<210> 34

<211> 4248

<212> DNA

<213> Issatchenkia orientalis

<400> 34

atgtcggcgc ttaatacgga tgccttagag agtcagcctg acttcaagtt ccagagacaa 60

aagaggttga tgtctccatt tatgtcgaaa aaagtgcctc ctatacctac aaaggaagag 120

aggaaaccct atggggagta ccatacaaac atactatttc gtattatgtt ttggtggttg 180

aatcctattt tgaatgtcgg gtacaaaagg acattgactg aacaggattt attctatctt 240

gataatagcc agactatgga caccctctat gagaccttca aaagccatct aaagacgaca 300

attgagaaat caatgaaaaa ataccttcag gagaaataca gtaaagaggg gaagacatat 360

gacccaagta gtatacctac agctgaagac ttaaaagatt tccaaatacc catttatgca 420

atcccattgt gcttgttcaa aactctatac tggcagtata gtcttggtaa tctctacaaa 480

gtattatccg actgtacatc tgctacaaca cctttattgc agaagaaact cattaatttt 540

gttcagatga aatcctttac cgcattagga agtacgggga aaggtgtagg gtacgccatc 600

ggtgtatgct tgatgatctt cttccaagca ataactgtca atcatgcctt tcataatttg 660

caaatctgtg gtgccaaatc taaggcgatt cttacgagaa tgttattgga taaatcaatg 720

tcagtcgatg ccagaggtaa tcattttttt cctgctagta aagttcagag catgatatcc 780

acagatttga atagggtaga tttggctatt ggctttttcc catttgcact tacgtgtgta 840

tttccaattg ctatttgtat aggcttgctt atttggaacg ttggtgtgtc agcattagtg 900

ggaattgcca ttttcgttgc caatgtcggt ctcttagccg tttctatacc tagacttatg 960

cggttcagga taaaggccat ggtattcaca gacaagagag ttactttaat gaaagagctg 1020

ttaaaaaatt ttaaaatgat caagttctat agctgggaaa attcatacgc cagaaggatc 1080

caggatgcca gattcaagga gatgaaattg attttgtctt tacagtcttt aagaaatatt 1140

gtgatgtcag tttcatttgc tatgccgaca ttggcttcaa tggcaacatt ttgtactgcc 1200

tttgatatca caagtggtaa aaatgctgcc tctttattct cctctctttc tctcttccaa 1260

gttttatcaa tgcaattcat gttagcccca gttgccctta atactgctgc tgatatgatg 1320

gtgtcaatga aaaagttcaa tcaattttta gctcatgctg acttggatcc agagcagtat 1380

cgtatagaag aatttcacga cgataaattg gcggtgaaag ttgataatgc cacttttgaa 1440

tgggatacgt ttgacgatga taaagttgaa gatcctgctc ttgaatttga aaaacaggac 1500

aatgacagtc ttgaaaaagt ttccagtcat aatacggtcg attatgacag taccgaaaag 1560

attagaaatg atacaagctc gatagattct accaaaatct tggagaaaac agcatttcct 1620

ggcctaagaa acataaatct agagattaag aaaggcgaat ttgttgttgt tacaggtagt 1680

atcggtgctg gtaaatcatc ccttctccag gccatctcgg gattgatgaa aagagtatct 1740

ggtaaggttt atgttgatgg tgacttattg ctatgcggtt atccatgggt tcaaaatgct 1800

acgattcggg acaacatttt gtttggtttg ccatttgacc aagaaaagta cgaccaagtt 1860

gtttatgctt gttcattgca gagcgacttc aatcagttcc aaggtggtga catgaccgag 1920

gttggtgaac gaggtattac attatctggt ggtcaaaagg ctagaatcaa cttggcaaga 1980

tctgtatatg ctgacaagga tataatttta cttgatgatg ttttaagtgc tgttgatgcg 2040

aaggtgggtc gacatatcgt tgatacttgc cttcttggtt tgttaaagga taaaactaga 2100

attatggcaa ctcaccaact aagtttgatt gactctgcag atcgaatgat tttcctcaat 2160

ggggatggaa gtattgattg cggtaccatc tcagaattga aagacagaaa tgaaaaactg 2220

aacgaacttt tgtctcatca aaaggataag gcaaatgact ccgacgaaga gttagaattg 2280

caagaagaaa tcgagtcgaa agaacaacat ctcaaagaag atttatctga ggtgaaacat 2340

gaaatcaaag aagaacagaa gaagatggaa ataagcggtg atgtaggaga agagtttgaa 2400

catgcagatg aacataaaga gattgttagg attattggtg atgaagaaag agccgtgaat 2460

gccctgaagg cggatgttta tatcaattat gctaaacttg catttggtaa actcggattg 2520

ttttcactga tgttgtttgt cacagttgct gctttacaga cttactgcaa tatgtttacc 2580

aacacatggt tatctttttg gatagaagaa aaattccacg gcagatccaa aagtttttac 2640

atggggatct acattatgtt tgccttctta tacacatttt tccttgctgc atttttctat 2700

tcaatgtgct atttctgcaa tagggcttcc aagtatctta attataaagc ttcagaaaaa 2760

atcttgcatg ttccaatgtc cttcatggat atttctccaa ttggtcgagt tttgaataga 2820

tttacaaaag atactgatgt gttagataac gagatactag atcaatttag acagtttttg 2880

agtcccttct gcaatgctat cggtaccatt gttctatgta ttatttacat tccatggttt 2940

gcaattgctg ttcccttaat tgttacattt tatgttttgg ttgccaatta ctaccaagcc 3000

agcgctagag agatcaaaag gttagaagca gttaaaaggt cgttggtctt tggccatttc 3060

aatgaagcat tatccggaaa ggagacaatc aaagcttata gggcaatcga cagagtcaag 3120

caaaggttga acaaattgat tgatgggcag aacgaggctt attttctaac cattgttaac 3180

cagagatggt taggtgccaa tttatcgatc ttatcatttt gtatggtctt cattatctcg 3240

ttcttgtgtg ttttcagagt tttcaatatc agtgcagcgt cgactggttt acttttaacc 3300

tatgtcataa atttgacaaa taccattact atgatgatga gagctatgac gcaagttgaa 3360

aatgagttca attcagttga aagattaaac cattatgcct ttgatcttgt ccaggaggcc 3420

ccttatgaga ttcctgagaa tgatccaccc caggactggc ctaagtatgg tgaaattatt 3480

ttcaaagatg ttagtatgag atatagacca gaattaccat ttgttttgaa gaatatcaac 3540

ttaagtattg ggaaaggtga gaaaattgga ttttgtggaa gaaccggtgc tggtaagtct 3600

acgttcatga cttgcttgta caggatttcc gaatttgaag gaactattgt tattgatgat 3660

gttgatatca gtaaattggg tttacataaa ctaagatcca aattaactat tattccacaa 3720

gatccagtgt tatttgtcgg ttcgatccga gagaatctgg atccatttgg cgagtattct 3780

gatgaagaat tgtgggaggc acttacaatt tccggtttga tcaacaagga agatctaaac 3840

gaagtaaaaa aacagaacga aaatgatgat aacttaaaca aattccacct tatcagaatg 3900

gtggaggatg atggtgtgaa tttctctatt ggagagagac agttgattgc acttgccaga 3960

gctttggtta ggaaaaccaa aattctaatc ttagatgagg caacatcaag tgttgactat 4020

gccaccgatt caagaatcca aaagaccatt gccaccgaat tcgacgactg tatgatactg 4080

tgtattgctc acagattgaa tacgattcta aactacgata agattgtcgt tatggataag 4140

ggtgagattg ttgagtttga taaaccaaga tcattgttta tgagggagga aggggtcttt 4200

aggtctatgt gtgagcaggc aaatatcaca atcgaagatt tcccttaa 4248

<210> 35

<211> 1415

<212> PRT

<213> Issatchenkia orientalis

<400> 35

Met Ser Ala Leu Asn Thr Asp Ala Leu Glu Ser Gln Pro Asp Phe Lys

1 5 10 15

Phe Gln Arg Gln Lys Arg Leu Met Ser Pro Phe Met Ser Lys Lys Val

20 25 30

Pro Pro Ile Pro Thr Lys Glu Glu Arg Lys Pro Tyr Gly Glu Tyr His

35 40 45

Thr Asn Ile Leu Phe Arg Ile Met Phe Trp Trp Leu Asn Pro Ile Leu

50 55 60

Asn Val Gly Tyr Lys Arg Thr Leu Thr Glu Gln Asp Leu Phe Tyr Leu

65 70 75 80

Asp Asn Ser Gln Thr Met Asp Thr Leu Tyr Glu Thr Phe Lys Ser His

85 90 95

Leu Lys Thr Thr Ile Glu Lys Ser Met Lys Lys Tyr Leu Gln Glu Lys

100 105 110

Tyr Ser Lys Glu Gly Lys Thr Tyr Asp Pro Ser Ser Ile Pro Thr Ala

115 120 125

Glu Asp Leu Lys Asp Phe Gln Ile Pro Ile Tyr Ala Ile Pro Leu Cys

130 135 140

Leu Phe Lys Thr Leu Tyr Trp Gln Tyr Ser Leu Gly Asn Leu Tyr Lys

145 150 155 160

Val Leu Ser Asp Cys Thr Ser Ala Thr Thr Pro Leu Leu Gln Lys Lys

165 170 175

Leu Ile Asn Phe Val Gln Met Lys Ser Phe Thr Ala Leu Gly Ser Thr

180 185 190

Gly Lys Gly Val Gly Tyr Ala Ile Gly Val Cys Leu Met Ile Phe Phe

195 200 205

Gln Ala Ile Thr Val Asn His Ala Phe His Asn Leu Gln Ile Cys Gly

210 215 220

Ala Lys Ser Lys Ala Ile Leu Thr Arg Met Leu Leu Asp Lys Ser Met

225 230 235 240

Ser Val Asp Ala Arg Gly Asn His Phe Phe Pro Ala Ser Lys Val Gln

245 250 255

Ser Met Ile Ser Thr Asp Leu Asn Arg Val Asp Leu Ala Ile Gly Phe

260 265 270

Phe Pro Phe Ala Leu Thr Cys Val Phe Pro Ile Ala Ile Cys Ile Gly

275 280 285

Leu Leu Ile Trp Asn Val Gly Val Ser Ala Leu Val Gly Ile Ala Ile

290 295 300

Phe Val Ala Asn Val Gly Leu Leu Ala Val Ser Ile Pro Arg Leu Met

305 310 315 320

Arg Phe Arg Ile Lys Ala Met Val Phe Thr Asp Lys Arg Val Thr Leu

325 330 335

Met Lys Glu Leu Leu Lys Asn Phe Lys Met Ile Lys Phe Tyr Ser Trp

340 345 350

Glu Asn Ser Tyr Ala Arg Arg Ile Gln Asp Ala Arg Phe Lys Glu Met

355 360 365

Lys Leu Ile Leu Ser Leu Gln Ser Leu Arg Asn Ile Val Met Ser Val

370 375 380

Ser Phe Ala Met Pro Thr Leu Ala Ser Met Ala Thr Phe Cys Thr Ala

385 390 395 400

Phe Asp Ile Thr Ser Gly Lys Asn Ala Ala Ser Leu Phe Ser Ser Leu

405 410 415

Ser Leu Phe Gln Val Leu Ser Met Gln Phe Met Leu Ala Pro Val Ala

420 425 430

Leu Asn Thr Ala Ala Asp Met Met Val Ser Met Lys Lys Phe Asn Gln

435 440 445

Phe Leu Ala His Ala Asp Leu Asp Pro Glu Gln Tyr Arg Ile Glu Glu

450 455 460

Phe His Asp Asp Lys Leu Ala Val Lys Val Asp Asn Ala Thr Phe Glu

465 470 475 480

Trp Asp Thr Phe Asp Asp Asp Lys Val Glu Asp Pro Ala Leu Glu Phe

485 490 495

Glu Lys Gln Asp Asn Asp Ser Leu Glu Lys Val Ser Ser His Asn Thr

500 505 510

Val Asp Tyr Asp Ser Thr Glu Lys Ile Arg Asn Asp Thr Ser Ser Ile

515 520 525

Asp Ser Thr Lys Ile Leu Glu Lys Thr Ala Phe Pro Gly Leu Arg Asn

530 535 540

Ile Asn Leu Glu Ile Lys Lys Gly Glu Phe Val Val Val Thr Gly Ser

545 550 555 560

Ile Gly Ala Gly Lys Ser Ser Leu Leu Gln Ala Ile Ser Gly Leu Met

565 570 575

Lys Arg Val Ser Gly Lys Val Tyr Val Asp Gly Asp Leu Leu Leu Cys

580 585 590

Gly Tyr Pro Trp Val Gln Asn Ala Thr Ile Arg Asp Asn Ile Leu Phe

595 600 605

Gly Leu Pro Phe Asp Gln Glu Lys Tyr Asp Gln Val Val Tyr Ala Cys

610 615 620

Ser Leu Gln Ser Asp Phe Asn Gln Phe Gln Gly Gly Asp Met Thr Glu

625 630 635 640

Val Gly Glu Arg Gly Ile Thr Leu Ser Gly Gly Gln Lys Ala Arg Ile

645 650 655

Asn Leu Ala Arg Ser Val Tyr Ala Asp Lys Asp Ile Ile Leu Leu Asp

660 665 670

Asp Val Leu Ser Ala Val Asp Ala Lys Val Gly Arg His Ile Val Asp

675 680 685

Thr Cys Leu Leu Gly Leu Leu Lys Asp Lys Thr Arg Ile Met Ala Thr

690 695 700

His Gln Leu Ser Leu Ile Asp Ser Ala Asp Arg Met Ile Phe Leu Asn

705 710 715 720

Gly Asp Gly Ser Ile Asp Cys Gly Thr Ile Ser Glu Leu Lys Asp Arg

725 730 735

Asn Glu Lys Leu Asn Glu Leu Leu Ser His Gln Lys Asp Lys Ala Asn

740 745 750

Asp Ser Asp Glu Glu Leu Glu Leu Gln Glu Glu Ile Glu Ser Lys Glu

755 760 765

Gln His Leu Lys Glu Asp Leu Ser Glu Val Lys His Glu Ile Lys Glu

770 775 780

Glu Gln Lys Lys Met Glu Ile Ser Gly Asp Val Gly Glu Glu Phe Glu

785 790 795 800

His Ala Asp Glu His Lys Glu Ile Val Arg Ile Ile Gly Asp Glu Glu

805 810 815

Arg Ala Val Asn Ala Leu Lys Ala Asp Val Tyr Ile Asn Tyr Ala Lys

820 825 830

Leu Ala Phe Gly Lys Leu Gly Leu Phe Ser Leu Met Leu Phe Val Thr

835 840 845

Val Ala Ala Leu Gln Thr Tyr Cys Asn Met Phe Thr Asn Thr Trp Leu

850 855 860

Ser Phe Trp Ile Glu Glu Lys Phe His Gly Arg Ser Lys Ser Phe Tyr

865 870 875 880

Met Gly Ile Tyr Ile Met Phe Ala Phe Leu Tyr Thr Phe Phe Leu Ala

885 890 895

Ala Phe Phe Tyr Ser Met Cys Tyr Phe Cys Asn Arg Ala Ser Lys Tyr

900 905 910

Leu Asn Tyr Lys Ala Ser Glu Lys Ile Leu His Val Pro Met Ser Phe

915 920 925

Met Asp Ile Ser Pro Ile Gly Arg Val Leu Asn Arg Phe Thr Lys Asp

930 935 940

Thr Asp Val Leu Asp Asn Glu Ile Leu Asp Gln Phe Arg Gln Phe Leu

945 950 955 960

Ser Pro Phe Cys Asn Ala Ile Gly Thr Ile Val Leu Cys Ile Ile Tyr

965 970 975

Ile Pro Trp Phe Ala Ile Ala Val Pro Leu Ile Val Thr Phe Tyr Val

980 985 990

Leu Val Ala Asn Tyr Tyr Gln Ala Ser Ala Arg Glu Ile Lys Arg Leu

995 1000 1005

Glu Ala Val Lys Arg Ser Leu Val Phe Gly His Phe Asn Glu Ala

1010 1015 1020

Leu Ser Gly Lys Glu Thr Ile Lys Ala Tyr Arg Ala Ile Asp Arg

1025 1030 1035

Val Lys Gln Arg Leu Asn Lys Leu Ile Asp Gly Gln Asn Glu Ala

1040 1045 1050

Tyr Phe Leu Thr Ile Val Asn Gln Arg Trp Leu Gly Ala Asn Leu

1055 1060 1065

Ser Ile Leu Ser Phe Cys Met Val Phe Ile Ile Ser Phe Leu Cys

1070 1075 1080

Val Phe Arg Val Phe Asn Ile Ser Ala Ala Ser Thr Gly Leu Leu

1085 1090 1095

Leu Thr Tyr Val Ile Asn Leu Thr Asn Thr Ile Thr Met Met Met

1100 1105 1110

Arg Ala Met Thr Gln Val Glu Asn Glu Phe Asn Ser Val Glu Arg

1115 1120 1125

Leu Asn His Tyr Ala Phe Asp Leu Val Gln Glu Ala Pro Tyr Glu

1130 1135 1140

Ile Pro Glu Asn Asp Pro Pro Gln Asp Trp Pro Lys Tyr Gly Glu

1145 1150 1155

Ile Ile Phe Lys Asp Val Ser Met Arg Tyr Arg Pro Glu Leu Pro

1160 1165 1170

Phe Val Leu Lys Asn Ile Asn Leu Ser Ile Gly Lys Gly Glu Lys

1175 1180 1185

Ile Gly Phe Cys Gly Arg Thr Gly Ala Gly Lys Ser Thr Phe Met

1190 1195 1200

Thr Cys Leu Tyr Arg Ile Ser Glu Phe Glu Gly Thr Ile Val Ile

1205 1210 1215

Asp Asp Val Asp Ile Ser Lys Leu Gly Leu His Lys Leu Arg Ser

1220 1225 1230

Lys Leu Thr Ile Ile Pro Gln Asp Pro Val Leu Phe Val Gly Ser

1235 1240 1245

Ile Arg Glu Asn Leu Asp Pro Phe Gly Glu Tyr Ser Asp Glu Glu

1250 1255 1260

Leu Trp Glu Ala Leu Thr Ile Ser Gly Leu Ile Asn Lys Glu Asp

1265 1270 1275

Leu Asn Glu Val Lys Lys Gln Asn Glu Asn Asp Asp Asn Leu Asn

1280 1285 1290

Lys Phe His Leu Ile Arg Met Val Glu Asp Asp Gly Val Asn Phe

1295 1300 1305

Ser Ile Gly Glu Arg Gln Leu Ile Ala Leu Ala Arg Ala Leu Val

1310 1315 1320

Arg Lys Thr Lys Ile Leu Ile Leu Asp Glu Ala Thr Ser Ser Val

1325 1330 1335

Asp Tyr Ala Thr Asp Ser Arg Ile Gln Lys Thr Ile Ala Thr Glu

1340 1345 1350

Phe Asp Asp Cys Met Ile Leu Cys Ile Ala His Arg Leu Asn Thr

1355 1360 1365

Ile Leu Asn Tyr Asp Lys Ile Val Val Met Asp Lys Gly Glu Ile

1370 1375 1380

Val Glu Phe Asp Lys Pro Arg Ser Leu Phe Met Arg Glu Glu Gly

1385 1390 1395

Val Phe Arg Ser Met Cys Glu Gln Ala Asn Ile Thr Ile Glu Asp

1400 1405 1410

Phe Pro

1415

<210> 36

<211> 4134

<212> DNA

<213> Artificial sequence

<220>

<223> ALNQ_214_12000

<400> 36

atgaagtctg acaacattgc tatggaagac ttgccagact ccaaatactt gaaacaacgt 60

agattattga ccccattgat gtctaagaag gtcccaccaa ttccatctga agacgaaaga 120

aaggcttacg gtgaatacta caccaaccca gtctctcgta tgatgttctg gtggttgaac 180

ccaatcctaa aagtcggtta cagaagaact ttgactgaaa acgacttgtt ctacctagaa 240

gatagacaaa gaactgaaac tttgtacgaa attttcagag gttacctaga cgaagaaatc 300

gctagagctt ggaaaaagtc tcaagaatcc tctgacgacc caagagaatt caagttgcca 360

atttacatta ttccattgtg tttgttcaag accatgaaat gggaatactc cagaggtatc 420

ttgcaaaaga ttttgggtga ctgtgcttct gctaccaccc cattattgca gaaaaagctc 480

atcaactttg tgcaagttaa gactttctct aacgtcggta acaccggtca aggtgttggt 540

tacgctattg gtgtctgttt gatgatcttc ttccaagttc taatgttgac tcacgctttc 600

cacaacttcc aaatctccgg tgctaaggct aaggctgttt tgaccagatt gttgttggac 660

aagtctttga ctgtcgatgc tagaggtaac cactacttcc cagcctccaa gatccaatct 720

atgatttcca ctgacttgaa cagaattgac ttggctgttg gtttcgctcc agtcggtttt 780

gtcaccattt tcccaatcat tatctgtatt gctttgttga tttggaacgt cggtgtttct 840

gctttggttg gtattggtgt tttcattgct aacattttcg ttttgggttt gttcgtttct 900

tccttgatgt tgtacagaga aaaggccatg gttttcactg acaagagagt taacttggtt 960

aaggaattgt tgaagaactt caaaatgatc aaattctact cctgggaaaa ctcttaccaa 1020

gatcgtatcg aaaacgctag aaacaatgaa atgaagtaca tcttgagatt acaattgttg 1080

agaaacttcg tcttctcttt agctttcgcc atgccagttt tggcttccat ggctaccttc 1140

tgtactgctt tcaagatcac cgatggtaaa tccgctgcct ctgttttctc ctccttatct 1200

ttgttcgaag tcttgtcttt acaattcatc ttggctccat tttccttgaa ctctactgtc 1260

gacatgatgg tcagtgttaa gaagattaac caattcttgc aacacaagga cactaaccca 1320

aacgaatttt ctgtcgaaaa gttttctgac tccactttgg ctatcaaggt cgataatgct 1380

tctttcgaat gggacacctt tgaagatgaa gaaaaggact acgaagaaga agctaagact 1440

aaggacaaca tcgaagatga ggaccataac tgtgccactg aaaccattaa gggtaagatc 1500

actgtcgact acaagtctga ttctgattcc atctcttcta ccttgaccaa gggtgtcaag 1560

accgctttcc caggtttgaa caacattaac ctagaaatcg ccaagggtga attcatcgtt 1620

gtcaccggtg ccatcggttc tggtaagtct tctttgttgc aagccatctc tggtttaatg 1680

aagagaactt ctggtgaagt ctacgtcgat ggtgacttgt tgttgtgtgg ttatccatgg 1740

gttcaaaact ccactatcag agaaaacatc ttgttcggtt tgccattcaa caaggaaaga 1800

tacgaccaag ttgtttactc ctgttctttg caatctgatt ttgatcaatt ccaaggtggt 1860

gacatgaccg aagtcggtga aagaggtatc actttgtctg gtggtcaaaa agccagaatt 1920

aacttagcta gatctgtcta tgctgacaag gatatcatct tattggatga tgtcttgtct 1980

gctgttgacg ctaaagtcgg taagcacatc gtcaacacct gtattttggg tctattgggt 2040

ggtaagacca gaattatggc tactcaccaa ttgtctttga ttgattccgc tgatagaatg 2100

gttttcttga acggtgacgg taccattgac ttcggtacca tcccagaatt acgtaagaga 2160

aaccaaaagt tgattgaatt gttacaacac caacgtgacc ctggtcaaga taaagaagat 2220

ttgtctaacg acttggacat tcaaggttct actgatgaag gtcaacaaat cgaacacgct 2280

gatgaacata aggaaatcgt taaaattatc ggtgatgagg aaaaggccgt taatgctttg 2340

tctttccaag tttactacaa ctactgtaag ttggctttcg gtaaattggg ttacatttct 2400

atgttggttt tcattatcgt cagctctttg gaaactttca cccaaatctt caccaacact 2460

tggttgtctt tctggatcga agataagttc gtttccagat ctaagaactt ctacatgggt 2520

atctacatca tgtttgcttt cttatacgct atcatgttgt gtttcttttt gttcttgttg 2580

ggttacttct gtgttaaggc tgctgaaaga ttaaacatta aggcttctag aaagatcttg 2640

cacgttccaa tgtccttcat ggacatttct ccaatcggtc gtgtcttaaa cagattcacc 2700

aaggataccg atgtcttgga caacgaattg ttggaacaat tgatccaatt cttatctcca 2760

ttgttcaact gtttcggtat catcatcttg tgtattgttt acatcccatg gttcgctatc 2820

ggtgttccaa ttatcttggg tttctacttc atcatcgctt cttactacca agcctctgct 2880

agagaaatca agagattgga agctgtcaag agatcctttg ttttcggtca tttccacgaa 2940

gtccttactg gtaaggatac catcaaggct tacaacgcca ttgacagaat gaagttgaaa 3000

ctaaacaagt tgatcgacga acaaaacgaa gcttactact tgactattgc taaccaaaga 3060

tggttgggtg ctaacttggc tatcgtttct ttctctatgg ttttcgttat ttctttctta 3120

tgtatcttca gagttttcaa catctccgcc gcttccactg gtttgttgtt aacctacgtt 3180

atcgccttga ctgactctat caccatgatt atgagagcta tgacccaagt cgaaaacgaa 3240

ttcaactccg tcgaacgtgt caaccactac gcttttgact tgatccaaga agccccatac 3300

gaaatcccag aaaacgaccc agctgaagac tggccacaac acggtaagat cgaattcaag 3360

gacgtttcca tgagatacag acctgaattg ccattcgttt tgaagaacat taacttgtcc 3420

gtcagagaac aagagaaaat tggtttctgt ggtagaactg gtgccggtaa gtccactttc 3480

atgacctgtt tgtacagaat cactgaatac gaaggtttga tctccatcga cggtgtcgat 3540

atctctagat tgggtttgca cagattgaga tccaagttga ccattattcc tcaagaccca 3600

gttctattcg ttggtaccat tagagaaaac ttggacccat tcaccgaaca ctccgatgac 3660

gaattgtggg aagctttggc catttccggt ttgatcgaac gtgaagactt ggaagtcgtc 3720

aagggtcaag aaaagattgg tggtaacgat tccggtaagt tgcacaagtt ccacttggtt 3780

cgtatggttg aagacgatgg tatcaacttc tctttgggtg agagacaatt gattgctttg 3840

gctagagcct tggttagaaa gtccaagatc ttaatcttgg acgaagctac ttcttccgtc 3900

gactacgcta ctgattccaa gattcaaaga accattgcct ccgaattcag agactgtact 3960

attttgtgta tcgcccatag attgaacacc atcttaggtt acgacaagat cgtcgttatg 4020

gacaacggtg aaatcgttga atttgaaaac ccaaagttgt tgttcatgcg tgaaaactcc 4080

gttttcagat ccatgtgtga acaagctaac attaccatca atgactttga ataa 4134

<210> 37

<211> 4134

<212> DNA

<213> Issatchenkia orientalis

<400> 37

atgaagtcag ataacattgc aatggaggac ctacccgact ccaaatactt gaaacagaga 60

cgattattaa ctccgttgat gtcaaaaaaa gttccaccta ttccaagtga agatgagagg 120

aaggcatacg gggaatatta tacgaatccg gtatcacgga tgatgttttg gtggttaaat 180

cccattttga aggtgggata taggcgaaca ttgacggaga atgatctttt ctaccttgaa 240

gacagacaac gtacagagac attatatgaa atatttcgtg gttacttgga tgaggaaatt 300

gcacgtgcat ggaaaaaatc tcaagaaagc tcagatgatc caagagagtt caagcttccg 360

atctatatta tccctttatg tttatttaag acaatgaaat gggaatacag ccggggaatt 420

ctccagaaaa tcttgggtga ttgtgcttct gcaacgaccc cactattaca gaaaaaacta 480

atcaactttg tccaggtcaa gactttcagt aatgtcggaa atactggtca gggtgtagga 540

tatgctattg gcgtttgctt gatgattttc tttcaagttt taatgttaac tcatgcattt 600

cacaatttcc aaatttcggg tgcaaaggca aaagctgttt tgacaagatt gctcttggat 660

aaatcgttga ctgttgatgc cagaggcaac cattattttc cagcgagtaa gattcaaagc 720

atgatttcta ctgatttgaa tagaatagac cttgctgtcg gatttgcacc agtggggttt 780

gttactatat tccctattat tatctgcatt gccttattga tttggaatgt tggagtctcg 840

gcattggttg gtattggggt attcattgca aacatttttg tgttgggact ttttgtatca 900

agtctaatgt tatacaggga gaaggcgatg gtattcaccg acaaaagagt caatttggtt 960

aaggaactat tgaaaaattt taaaatgatt aagttctaca gttgggaaaa ctcttatcag 1020

gatagaattg aaaatgcaag gaacaacgaa atgaaatata ttttgaggtt acaattgcta 1080

agaaattttg tgttttcgtt agcttttgcg atgcctgttt tggcatcaat ggctacattt 1140

tgtacagcct ttaagataac tgacggcaaa agtgccgcat ctgtgttttc atctctctca 1200

ttgtttgaag ttttatcgct acaatttatt ttggcccctt tctcactaaa ttctactgtg 1260

gatatgatgg tttcagttaa aaagataaac cagtttctgc agcataaaga taccaatcca 1320

aatgagttca gcgttgaaaa gttcagtgat agtacattgg caatcaaggt cgataatgca 1380

tcatttgaat gggatacgtt tgaggatgaa gagaaagatt atgaagagga agctaaaact 1440

aaagacaaca ttgaagatga agatcataat tgtgctacgg aaacaatcaa gggaaaaata 1500

acagtggact ataagagcga cagtgactca atttctagta ctttaacgaa aggggttaaa 1560

actgcatttc ctggactaaa taatatcaat cttgaaattg caaaagggga attcattgtt 1620

gttactggtg caattggttc cggcaaatcc tctctacttc aggccatttc tgggctaatg 1680

aagagaacat caggggaagt gtatgttgat ggtgatttgt tgttatgtgg ttacccgtgg 1740

gtacaaaact caacaatacg agagaatata ctatttggat taccatttaa taaggagagg 1800

tatgaccaag tcgtgtattc atgctcgttg cagagtgatt ttgatcaatt tcaaggaggt 1860

gatatgacgg aagttggcga gagagggata accttatcag gaggccaaaa ggccagaatt 1920

aatttagctc ggagtgttta tgctgataag gatattattt tattagacga cgttctcagt 1980

gcggtcgacg ctaaagttgg caagcatatt gtgaatacat gcatcttagg attattggga 2040

ggtaaaacaa gaatcatggc tacccaccaa ctaagtttga tcgactctgc tgatcgtatg 2100

gtttttctca atggagatgg aactattgat tttggtacta ttcctgagct aagaaagaga 2160

aaccagaagc tgattgagtt actacaacat caaagggatc caggtcaaga taaagaggat 2220

ctctcaaatg atttggatat tcaaggaagc acagatgagg gtcagcaaat tgagcatgca 2280

gacgagcata aagagatagt caagattatt ggtgacgagg aaaaagcagt taatgcattg 2340

agtttccagg tttattataa ctattgtaag cttgcatttg gtaagcttgg atatatttcg 2400

atgttggtat tcattattgt ttctagtttg gagaccttca cccaaatatt caccaatact 2460

tggttgtcat tttggatcga ggataaattt gttagtagat ccaaaaattt ctatatggga 2520

atatacatca tgtttgcatt tttgtatgca ataatgctat gtttttttct ctttttactg 2580

ggatattttt gtgtaaaggc agcagagaga ctaaatatta aagcatccag gaagattcta 2640

catgttccaa tgtcttttat ggacatatca cctattggta gagtcttgaa tcggtttact 2700

aaagatacag atgtattaga caatgaattg ttagagcaat taattcaatt tttaagccca 2760

ctattcaact gttttggtat tatcatattg tgcattgttt atataccatg gtttgctatt 2820

ggtgtcccta taattcttgg attttatttt ataatagcca gttattatca ggccagtgca 2880

agagaaatca agagattaga ggctgtaaag aggtcgtttg tttttggcca ttttcacgaa 2940

gttctaacag ggaaagacac catcaaagca tataatgcta ttgatcggat gaaattgaag 3000

ctgaacaaat tgattgatga acagaatgaa gcttattatc taacaatcgc caatcagaga 3060

tggttaggag caaatttggc gattgtctca ttttcaatgg tttttgttat ttcgtttctg 3120

tgtatcttta gggttttcaa cataagtgca gcatccactg gtttgctttt gacctacgtc 3180

atagcactga cagattctat taccatgatt atgagagcaa tgactcaagt tgagaatgag 3240

ttcaactctg tggaacgggt caaccattat gcatttgatc ttatacaaga agcaccatat 3300

gaaataccgg agaatgatcc cgctgaggat tggccacaac atggcaaaat tgaattcaaa 3360

gatgtgagta tgagatatag accggaacta ccatttgttt tgaaaaatat caatttgagt 3420

gttagagaac aagaaaagat tggattttgt ggtagaacag gtgcaggtaa gtctacattt 3480

atgacatgtc tatataggat aacagaatac gaaggcctta tatcaatcga tggtgttgat 3540

attagccgat tagggttgca tagactacga tctaaattga ccattatacc gcaagacccg 3600

gtattatttg ttggtaccat tagggagaac ctcgatccat ttacagagca ttctgatgat 3660

gaattatggg aagcgcttgc gatatctgga ttgattgagc gggaagatct agaagtcgtc 3720

aagggacaag agaagatagg tgggaatgat agtgggaagt tacacaagtt ccacctagtt 3780

cgaatggttg aggatgatgg catcaatttt tcacttggtg agaggcagtt gattgcctta 3840

gccagggcat tagttaggaa aagcaagata ttgatattgg atgaggctac atcgagtgtt 3900

gactatgcta cagactctaa aatccagcga acgattgcta gtgagtttag ggattgtact 3960

atattatgta ttgctcatcg attgaacacc attttaggtt atgataaaat tgtcgttatg 4020

gacaatggtg agattgttga atttgagaat cccaaattgt tgtttatgag ggagaatagt 4080

gtatttcgat ccatgtgtga gcaggcaaac atcaccatca atgattttga ataa 4134

<210> 38

<211> 1377

<212> PRT

<213> Issatchenkia orientalis

<400> 38

Met Lys Ser Asp Asn Ile Ala Met Glu Asp Leu Pro Asp Ser Lys Tyr

1 5 10 15

Leu Lys Gln Arg Arg Leu Leu Thr Pro Leu Met Ser Lys Lys Val Pro

20 25 30

Pro Ile Pro Ser Glu Asp Glu Arg Lys Ala Tyr Gly Glu Tyr Tyr Thr

35 40 45

Asn Pro Val Ser Arg Met Met Phe Trp Trp Leu Asn Pro Ile Leu Lys

50 55 60

Val Gly Tyr Arg Arg Thr Leu Thr Glu Asn Asp Leu Phe Tyr Leu Glu

65 70 75 80

Asp Arg Gln Arg Thr Glu Thr Leu Tyr Glu Ile Phe Arg Gly Tyr Leu

85 90 95

Asp Glu Glu Ile Ala Arg Ala Trp Lys Lys Ser Gln Glu Ser Ser Asp

100 105 110

Asp Pro Arg Glu Phe Lys Leu Pro Ile Tyr Ile Ile Pro Leu Cys Leu

115 120 125

Phe Lys Thr Met Lys Trp Glu Tyr Ser Arg Gly Ile Leu Gln Lys Ile

130 135 140

Leu Gly Asp Cys Ala Ser Ala Thr Thr Pro Leu Leu Gln Lys Lys Leu

145 150 155 160

Ile Asn Phe Val Gln Val Lys Thr Phe Ser Asn Val Gly Asn Thr Gly

165 170 175

Gln Gly Val Gly Tyr Ala Ile Gly Val Cys Leu Met Ile Phe Phe Gln

180 185 190

Val Leu Met Leu Thr His Ala Phe His Asn Phe Gln Ile Ser Gly Ala

195 200 205

Lys Ala Lys Ala Val Leu Thr Arg Leu Leu Leu Asp Lys Ser Leu Thr

210 215 220

Val Asp Ala Arg Gly Asn His Tyr Phe Pro Ala Ser Lys Ile Gln Ser

225 230 235 240

Met Ile Ser Thr Asp Leu Asn Arg Ile Asp Leu Ala Val Gly Phe Ala

245 250 255

Pro Val Gly Phe Val Thr Ile Phe Pro Ile Ile Ile Cys Ile Ala Leu

260 265 270

Leu Ile Trp Asn Val Gly Val Ser Ala Leu Val Gly Ile Gly Val Phe

275 280 285

Ile Ala Asn Ile Phe Val Leu Gly Leu Phe Val Ser Ser Leu Met Leu

290 295 300

Tyr Arg Glu Lys Ala Met Val Phe Thr Asp Lys Arg Val Asn Leu Val

305 310 315 320

Lys Glu Leu Leu Lys Asn Phe Lys Met Ile Lys Phe Tyr Ser Trp Glu

325 330 335

Asn Ser Tyr Gln Asp Arg Ile Glu Asn Ala Arg Asn Asn Glu Met Lys

340 345 350

Tyr Ile Leu Arg Leu Gln Leu Leu Arg Asn Phe Val Phe Ser Leu Ala

355 360 365

Phe Ala Met Pro Val Leu Ala Ser Met Ala Thr Phe Cys Thr Ala Phe

370 375 380

Lys Ile Thr Asp Gly Lys Ser Ala Ala Ser Val Phe Ser Ser Leu Ser

385 390 395 400

Leu Phe Glu Val Leu Ser Leu Gln Phe Ile Leu Ala Pro Phe Ser Leu

405 410 415

Asn Ser Thr Val Asp Met Met Val Ser Val Lys Lys Ile Asn Gln Phe

420 425 430

Leu Gln His Lys Asp Thr Asn Pro Asn Glu Phe Ser Val Glu Lys Phe

435 440 445

Ser Asp Ser Thr Leu Ala Ile Lys Val Asp Asn Ala Ser Phe Glu Trp

450 455 460

Asp Thr Phe Glu Asp Glu Glu Lys Asp Tyr Glu Glu Glu Ala Lys Thr

465 470 475 480

Lys Asp Asn Ile Glu Asp Glu Asp His Asn Cys Ala Thr Glu Thr Ile

485 490 495

Lys Gly Lys Ile Thr Val Asp Tyr Lys Ser Asp Ser Asp Ser Ile Ser

500 505 510

Ser Thr Leu Thr Lys Gly Val Lys Thr Ala Phe Pro Gly Leu Asn Asn

515 520 525

Ile Asn Leu Glu Ile Ala Lys Gly Glu Phe Ile Val Val Thr Gly Ala

530 535 540

Ile Gly Ser Gly Lys Ser Ser Leu Leu Gln Ala Ile Ser Gly Leu Met

545 550 555 560

Lys Arg Thr Ser Gly Glu Val Tyr Val Asp Gly Asp Leu Leu Leu Cys

565 570 575

Gly Tyr Pro Trp Val Gln Asn Ser Thr Ile Arg Glu Asn Ile Leu Phe

580 585 590

Gly Leu Pro Phe Asn Lys Glu Arg Tyr Asp Gln Val Val Tyr Ser Cys

595 600 605

Ser Leu Gln Ser Asp Phe Asp Gln Phe Gln Gly Gly Asp Met Thr Glu

610 615 620

Val Gly Glu Arg Gly Ile Thr Leu Ser Gly Gly Gln Lys Ala Arg Ile

625 630 635 640

Asn Leu Ala Arg Ser Val Tyr Ala Asp Lys Asp Ile Ile Leu Leu Asp

645 650 655

Asp Val Leu Ser Ala Val Asp Ala Lys Val Gly Lys His Ile Val Asn

660 665 670

Thr Cys Ile Leu Gly Leu Leu Gly Gly Lys Thr Arg Ile Met Ala Thr

675 680 685

His Gln Leu Ser Leu Ile Asp Ser Ala Asp Arg Met Val Phe Leu Asn

690 695 700

Gly Asp Gly Thr Ile Asp Phe Gly Thr Ile Pro Glu Leu Arg Lys Arg

705 710 715 720

Asn Gln Lys Leu Ile Glu Leu Leu Gln His Gln Arg Asp Pro Gly Gln

725 730 735

Asp Lys Glu Asp Leu Ser Asn Asp Leu Asp Ile Gln Gly Ser Thr Asp

740 745 750

Glu Gly Gln Gln Ile Glu His Ala Asp Glu His Lys Glu Ile Val Lys

755 760 765

Ile Ile Gly Asp Glu Glu Lys Ala Val Asn Ala Leu Ser Phe Gln Val

770 775 780

Tyr Tyr Asn Tyr Cys Lys Leu Ala Phe Gly Lys Leu Gly Tyr Ile Ser

785 790 795 800

Met Leu Val Phe Ile Ile Val Ser Ser Leu Glu Thr Phe Thr Gln Ile

805 810 815

Phe Thr Asn Thr Trp Leu Ser Phe Trp Ile Glu Asp Lys Phe Val Ser

820 825 830

Arg Ser Lys Asn Phe Tyr Met Gly Ile Tyr Ile Met Phe Ala Phe Leu

835 840 845

Tyr Ala Ile Met Leu Cys Phe Phe Leu Phe Leu Leu Gly Tyr Phe Cys

850 855 860

Val Lys Ala Ala Glu Arg Leu Asn Ile Lys Ala Ser Arg Lys Ile Leu

865 870 875 880

His Val Pro Met Ser Phe Met Asp Ile Ser Pro Ile Gly Arg Val Leu

885 890 895

Asn Arg Phe Thr Lys Asp Thr Asp Val Leu Asp Asn Glu Leu Leu Glu

900 905 910

Gln Leu Ile Gln Phe Leu Ser Pro Leu Phe Asn Cys Phe Gly Ile Ile

915 920 925

Ile Leu Cys Ile Val Tyr Ile Pro Trp Phe Ala Ile Gly Val Pro Ile

930 935 940

Ile Leu Gly Phe Tyr Phe Ile Ile Ala Ser Tyr Tyr Gln Ala Ser Ala

945 950 955 960

Arg Glu Ile Lys Arg Leu Glu Ala Val Lys Arg Ser Phe Val Phe Gly

965 970 975

His Phe His Glu Val Leu Thr Gly Lys Asp Thr Ile Lys Ala Tyr Asn

980 985 990

Ala Ile Asp Arg Met Lys Leu Lys Leu Asn Lys Leu Ile Asp Glu Gln

995 1000 1005

Asn Glu Ala Tyr Tyr Leu Thr Ile Ala Asn Gln Arg Trp Leu Gly

1010 1015 1020

Ala Asn Leu Ala Ile Val Ser Phe Ser Met Val Phe Val Ile Ser

1025 1030 1035

Phe Leu Cys Ile Phe Arg Val Phe Asn Ile Ser Ala Ala Ser Thr

1040 1045 1050

Gly Leu Leu Leu Thr Tyr Val Ile Ala Leu Thr Asp Ser Ile Thr

1055 1060 1065

Met Ile Met Arg Ala Met Thr Gln Val Glu Asn Glu Phe Asn Ser

1070 1075 1080

Val Glu Arg Val Asn His Tyr Ala Phe Asp Leu Ile Gln Glu Ala

1085 1090 1095

Pro Tyr Glu Ile Pro Glu Asn Asp Pro Ala Glu Asp Trp Pro Gln

1100 1105 1110

His Gly Lys Ile Glu Phe Lys Asp Val Ser Met Arg Tyr Arg Pro

1115 1120 1125

Glu Leu Pro Phe Val Leu Lys Asn Ile Asn Leu Ser Val Arg Glu

1130 1135 1140

Gln Glu Lys Ile Gly Phe Cys Gly Arg Thr Gly Ala Gly Lys Ser

1145 1150 1155

Thr Phe Met Thr Cys Leu Tyr Arg Ile Thr Glu Tyr Glu Gly Leu

1160 1165 1170

Ile Ser Ile Asp Gly Val Asp Ile Ser Arg Leu Gly Leu His Arg

1175 1180 1185

Leu Arg Ser Lys Leu Thr Ile Ile Pro Gln Asp Pro Val Leu Phe

1190 1195 1200

Val Gly Thr Ile Arg Glu Asn Leu Asp Pro Phe Thr Glu His Ser

1205 1210 1215

Asp Asp Glu Leu Trp Glu Ala Leu Ala Ile Ser Gly Leu Ile Glu

1220 1225 1230

Arg Glu Asp Leu Glu Val Val Lys Gly Gln Glu Lys Ile Gly Gly

1235 1240 1245

Asn Asp Ser Gly Lys Leu His Lys Phe His Leu Val Arg Met Val

1250 1255 1260

Glu Asp Asp Gly Ile Asn Phe Ser Leu Gly Glu Arg Gln Leu Ile

1265 1270 1275

Ala Leu Ala Arg Ala Leu Val Arg Lys Ser Lys Ile Leu Ile Leu

1280 1285 1290

Asp Glu Ala Thr Ser Ser Val Asp Tyr Ala Thr Asp Ser Lys Ile

1295 1300 1305

Gln Arg Thr Ile Ala Ser Glu Phe Arg Asp Cys Thr Ile Leu Cys

1310 1315 1320

Ile Ala His Arg Leu Asn Thr Ile Leu Gly Tyr Asp Lys Ile Val

1325 1330 1335

Val Met Asp Asn Gly Glu Ile Val Glu Phe Glu Asn Pro Lys Leu

1340 1345 1350

Leu Phe Met Arg Glu Asn Ser Val Phe Arg Ser Met Cys Glu Gln

1355 1360 1365

Ala Asn Ile Thr Ile Asn Asp Phe Glu

1370 1375

Claims

1.一种能够产生甜菊醇糖苷的重组宿主，所述重组宿主过表达介导甜菊醇糖苷转运的多肽，并且所述多肽的氨基酸序列如SEQ ID NO: 35或SEQ ID NO: 38所示或为与二者之任一具有至少99%序列同一性且来源于Issatchenkiaorientalis的氨基酸序列。

2.一种能够产生甜菊醇糖苷的重组宿主，所述重组宿主已被修饰，以导致介导甜菊醇糖苷转运的多肽的产生缺陷，并且所述多肽的氨基酸序列如SEQ ID NO: 35或SEQ ID NO:38所示或为与二者之任一具有至少99%序列同一性且来源于Issatchenkiaorientalis的氨基酸序列。

3.根据权利要求1所述的重组宿主，所述重组宿主具有编码多肽的重组核酸，所述多肽的氨基酸序列如SEQ ID NO: 35或SEQ ID NO: 38所示或为与二者之任一具有至少99%序列同一性且来源于Issatchenkiaorientalis的氨基酸序列。

4.根据权利要求1-3中任一项所述的重组宿主，其包含一种或更多种编码以下多肽的重组核苷酸序列：

具有对映-柯巴基焦磷酸合酶活性的多肽；

具有对映-贝壳杉烯合酶活性的多肽；

具有对映-贝壳杉烯氧化酶活性的多肽；以及

具有贝壳杉烯酸13-羟化酶活性的多肽。

5.根据权利要求1-3中任一项所述的重组宿主，其包含编码具有NADPH-细胞色素p450还原酶活性的多肽的重组核酸序列。

6.根据权利要求1-3中任一项所述的重组宿主，其包含编码以下项中的一种或更多种的重组核酸序列：

（i）具有UGT74G1活性的多肽；

（ii）具有UGT2活性的多肽；

（iii）具有UGT85C2活性的多肽；和

（iv）具有UGT76G1活性的多肽。

7.根据权利要求1-3中任一项所述的重组宿主，其中所述宿主属于Saccharomyces、 Aspergillus、Pichia、Kluyveromyces、Candida、Hansenula、Humicola、Issatchenkia、 Trichosporon、Brettanomyces、Pachysolen、Yarrowia、Yamadazyma或Escherichia属中的一种。

8.根据权利要求7所述的重组宿主，其中所述重组宿主是Saccharomyces cerevisiae细胞、Yarrowia lipolitica细胞、Candida krusei细胞、Issatchenkia orientalis细胞或Escherichia coli细胞。

9.根据权利要求1-3中任一项所述的重组宿主，其中所述宿主产生香叶基香叶基二磷酸（GGPP）的能力被上调。

10.根据权利要求1-3中任一项所述的重组宿主，其包含编码以下项中的一种或更多种的核酸序列：

具有羟甲基戊二酰基-辅酶A还原酶活性的多肽；或者

具有法尼基-焦磷酸合成酶活性的多肽。

11.一种制备甜菊醇糖苷的方法，所述方法包括在合适的发酵培养基中发酵根据权利要求1-10中任一项所述的重组宿主，以及任选地回收所述甜菊醇糖苷。

12.根据权利要求11所述的制备甜菊醇糖苷的方法，其中所述方法以工业规模进行。