CN111263815A

CN111263815A - 用于高效生成瑞鲍迪苷的豌豆贝壳杉烯氧化酶

Info

Publication number: CN111263815A
Application number: CN201880051961.1A
Authority: CN
Inventors: G.威赫曼; A.康科耶; T.马哈德库尔-米道斯
Original assignee: Amyris Inc
Current assignee: Amyris Inc
Priority date: 2017-08-11
Filing date: 2018-08-10
Publication date: 2020-06-09
Also published as: RU2020109765A; EP3665287A1; RU2020109765A3; CA3071029A1; SG11202001058TA; AU2018314249A2; JP7487099B2; AU2018314249A1; US20200165651A1; MX2020001537A; MA49836A; BR112020002708A2; JP2020533954A; KR20200035981A; WO2019033064A1

Abstract

本发明提供了在宿主细胞中改进生成甜菊糖苷类化合物的组合物和方法。在一些实施方案，所述宿主细胞进行遗传修饰以包含编码豌豆(Pisum sativum)贝壳杉烯氧化酶或其变体贝壳杉烯氧化酶的异源核苷酸序列。在一些实施方案，所述宿主细胞还包含一种或多种异源核苷酸序列，其编码能够在所述宿主细胞中生成甜菊糖苷类化合物的途径的其他酶。本发明所述的组合物和方法提供了异源生成甜菊糖苷类化合物(包括但不限于瑞鲍迪苷D和瑞鲍迪苷M)的有效途径。

Description

用于高效生成瑞鲍迪苷的豌豆贝壳杉烯氧化酶

1.相关申请的交叉引用

本申请要求并享有于2017年8月11日提交的美国临时申请号62/544,718以及于2017年8月11日提交的国际申请号PCT/US2017/046637的优先权，其内容均通过引用其整体并入本申请。

2.发明领域

本发明涉及某些贝壳杉烯氧化酶(KO)，包含所述贝壳杉烯氧化酶的组合物，包含所述贝壳杉烯氧化酶的宿主细胞，及其用于生成瑞鲍迪苷(包括瑞鲍迪苷D和瑞鲍迪苷M)的方法。

3.发明背景

需要源自天然来源的零热量甜味剂来限制高糖消耗(例如，糖尿病类和肥胖症)的不良影响。瑞鲍迪苷M(RebM)是由甜叶菊植物(Stevia rebaudiana Bertoni)生成的许多甜味化合物之一。在所有的瑞鲍迪苷中，RebM具有最高的效力(比蔗糖甜约200-300倍)，口感最纯净。然而，RebM仅由甜叶菊植物少量生成，并且仅占甜菊糖苷(steviol glycoside)总含量的一小部分(<1.0％)，Ohta et al.,2010,J.Appl.Glycosci.,57,199-209(2010)。因此，希望使用生物技术途径来生成RebM，从而使其能够大量且高纯度地生成。

为了使用生物技术经济地生成产品，从原料到产品的生物转化中的每个步骤需有利地具有高转化效率(理想地>90％)。在我们生成RebM的酵母工程中，我们在RebM的途径中发现了明显的局限性，所述途径可将内根-贝壳杉烯(ent-kaurene)转化为异贝壳杉烯酸(kaurenoic acid)(图1A和图1B)。

KO酶存在于各种植物中，并且通常用于生成植物激素赤霉素。植物细胞中赤霉素的含量比工业生产酵母中生成的RebM的含量低几个数量级，因此，大多KO酶不能承载商业生产RebM所需的高通量。通常，来自甜叶菊(Stevia rebaudiana(Sr.KO))的KO酶(Sr.KO)已被用于在经工程化以生成RebM的酵母中将内根-贝壳杉烯转化为异贝壳杉烯酸。传统的看法是此植物生成高水平的甜菊糖苷，因此所述Sr.KO酶应该已进化为比大多数其他KO酶具有更高的转化率或处理更高的通量。

在具有高碳通量以生成RebM的酵母菌株中，发现所述Sr.KO对异贝壳杉烯酸的转化效率低(25.6％)，并且形成了很高水平的上游中间代谢物(内根-贝壳杉烯、贝壳杉烯醇、和贝壳杉烯醛)(图1C)。

为了高效且高纯度地生成RebM，需要能够高效生成异贝壳杉烯酸的改进酶。本发明提供的组合物和方法满足了此种需求，并且还提供了相关优点。

4.发明摘要

本发明提供了改进的将贝壳杉烯转化为异贝壳杉烯酸的组合物和方法。所述这些组合物和方法部分基于令人惊奇的发现，即某些贝壳杉烯氧化酶(KO)能够以非常高的效率将贝壳杉烯转化为异贝壳杉烯酸。假设市场对RebM的需求为每年50亿吨，即使使用新的KO进行应变性能方面的适度改进(例如，改进了10％)，则也可能在未来节省超过一千万美元的生产成本。

本发明所述的某些KO还能够生成含有很少或不含残留贝壳杉烯醇或贝壳杉烯醛的异贝壳杉烯酸。如此，在某些实施方案，本发明所述的组合物和方法可降低下游加工成本以得到具有高产量甜菊糖苷类化合物(例如RebM)的组合物。

一方面，本发明提供了经遗传修饰的宿主细胞及其用于生成工业上有用的化合物的方法。一方面，本发明提供了经遗传修饰的宿主细胞，其包含：编码豌豆(Pisum sativum)贝壳杉烯氧化酶的异源核酸。在一些实施方案，所述经遗传修饰的宿主细胞还包含能够生成甜菊醇和/或甜菊糖苷类化合物的一种或多种酶途径。

在某些实施方案，本发明提供了经遗传修饰的宿主细胞，其包含编码贝壳杉烯氧化酶的异源核酸，所述贝壳杉烯氧化酶包含与豌豆(Pisum sativum)贝壳杉烯氧化酶的序列(例如，SEQ ID NO：1)具有至少80％、85％、90％、或95％序列同一性的氨基酸序列。在某些实施方案，所述经遗传修饰的宿主细胞能够以大于30％、35％、40％、45％、50％、55％、60％、65％、70％、75％、80％、85％、90％、95％、96％、97％、或98％的效率将贝壳杉烯转化为异贝壳杉烯酸。在某些实施方案，所述经遗传修饰的宿主细胞是酵母细胞。在某些实施方案，所述经遗传修饰的宿主细胞是酿酒酵母(Saccharomyces cerevisiae)细胞。

另一方面，本发明提供了生成异源甜菊糖苷的方法，所述方法包含：在适于制备所述甜菊糖苷化合物的条件下，在含有碳源的培养基中培养本发明提供的能够生成本发明所述甜菊糖苷的经遗传修饰的宿主细胞群；和从所述培养基中回收所述甜菊糖苷。在一些实施方案，异源甜菊糖苷是选自由RebD和RebM组成的组。

另一方面，本发明提供了生成RebD的方法，所述方法包含：在适于制备所述RebD的条件下，在含有碳源的培养基中培养本发明提供的能够生成本发明所述RebD的经遗传修饰的宿主细胞群；和从所述培养基中回收所述RebD。

另一方面，本发明提供了生成RebM的方法，所述方法包含：在适于制备所述RebM的条件下，在含有碳源的培养基中培养本发明提供的能够生成本发明所述RebM的经遗传修饰的宿主细胞群；和从所述培养基中回收所述RebM。

另一方面，本发明提供了生成异贝壳杉烯酸的方法，所述方法包含：在适于形成异贝壳杉烯酸的条件下，使贝壳杉烯与本发明所述的贝壳杉烯氧化酶接触，所述贝壳杉烯氧化酶能够将贝壳杉烯转化为异贝壳杉烯酸。

在一些实施方案，所述宿主细胞是酵母细胞。在一些实施方案，所述酵母是酿酒酵母(Saccharomyces cerevisiae)。在一些实施方案，所述宿主细胞以高效率生成RebD或RebM。在一些实施方案，与不含所述豌豆(Pisum sativum)贝壳杉烯氧化酶的酵母细胞相比，所述宿主细胞生成增加量的RebD或RebM。

5.附图简要说明

图1A提供了法呢基焦磷酸转化为甜菊醇的示意图。

图1B提供了香叶基香叶基焦磷酸(GGPP)转化为RebM的示意图。

图1C提供了将内根-贝壳杉烯转化为贝壳杉烯醇，再将贝壳杉烯醇转化为贝壳杉烯醛，然后将贝壳杉烯醛转化为异贝壳杉烯酸的示意图。

图1D提供了甲羟戊酸途径的示意图。

图2提供了甜菊醇转化为RebM的示例性途径。

图3A提供了“着陆垫(landingpad)”设计的示意图，所述设计用于插入单独的KO酶以筛选酵母中异贝壳杉烯酸的生成。

图3B提供了用于筛选酵母中异贝壳杉烯酸生成转化的KO遗传构建体的示意图。

图4提供了图解说明在体内用不同的贝壳杉烯氧化酶生成的异贝壳杉烯酸的相对增加量的图表。

图5提供了条形图，其图解说明了将内根-贝壳杉烯、贝壳杉烯醇和贝壳杉烯醛的相对水平归一化为在高通量生成RebM的酵母菌株中体内生成的异贝壳杉烯酸的总量。

图6提供了图解说明含有Sr.KO或Ps.KO的高通量菌株中RebM滴度的相对水平的图表。

6.具体实施方式

6.1术语定义

本发明使用的术语“异源的/异源性/异源”是指通常在自然界中不存在的物质。术语“异源核苷酸序列”是指自然界中在给定细胞中通常不存在的核苷酸序列。因此，异源核苷酸序列可以是：(a)相对于其宿主细胞是外源的(即，对所述细胞而言是“外源的”)；(b)天然存在于所述宿主细胞中(即“内源性/內源的/內源”)，但在所述细胞中以非天然量存在(即，比所述宿主细胞中天然存在的量更多或更少)；或(c)天然存在于所述宿主细胞中，但位于其天然基因座之外。术语“异源酶”是指自然界中通常在给定细胞中不存在的酶。所述术语包括以下酶：(a)对给定细胞而言是外源的(即，由非天然存在于所述宿主细胞中或不在所述宿主细胞的给定环境中天然存在的核苷酸序列编码)；和(b)天然存在于所述宿主细胞中(例如，所述酶由细胞内源的核苷酸序列编码)，但在所述宿主细胞中以非天然量(例如，大于或小于所述天然存在的量)生成。

另一方面，本发明使用的术语“天然的”或“内源的/内源性/內源”涉及分子，特别是酶和核酸，表示在它们起源或在自然界中发现的生物体中表达的分子，与表达水平无关，所述表达水平可低于、等于或高于天然微生物体中分子的表达水平。应理解，天然酶或天然多核苷酸的表达可在重组微生物中进行修饰。

本发明使用的术语“亲本细胞”是指与本发明公开的经遗传修饰的宿主细胞具有相同遗传背景的细胞，除了其不包含工程化到所述经修饰的宿主细胞中的一种或多种特定遗传修饰，譬如，选自由以下组成的组的一种或多种修饰：甜菊醇途径的酶的异源表达，甜菊糖苷途径的酶的异源表达，香叶基香叶基焦磷酸合酶的异源表达，柯巴基焦磷酸合酶的异源表达，贝壳杉烯合酶的异源表达，贝壳杉烯氧化酶(例如，豌豆(Pisum sativum)贝壳杉烯氧化酶)的异源表达，甜菊醇合酶(异贝壳杉烯酸羟化酶)的异源表达，细胞色素P450还原酶的异源表达，UGT74G1的异源表达，UGT76G1的异源表达，UGT85C2的异源表达，91D的异源表达，和UGT40087或其变体的异源表达。

本发明使用的术语“天然存在的”是指天然存在的那些物质。譬如，存在于生物体中的贝壳杉烯氧化酶是天然存在的贝壳杉烯氧化酶，其可从自然界中的来源分离得到并且在实验室中未被人有意修饰。相反，本发明使用的术语“非天然存在的”是指在自然界中未发现但通过人为干预生成的那些物质。

术语“培养基”是指培养基和/或发酵培养基。

术语“发酵组合物”是指组合物，所述组合物包含经遗传修饰的宿主细胞和由所述经遗传修饰的宿主细胞生成的产物或代谢物。发酵组合物的实例是全细胞培养液，其可以是容器(例如，烧瓶、平板或发酵罐)的全部内容物，包括细胞、水相和由所述经遗传修饰的宿主细胞生成的化合物。

本发明使用的术语“生成量”通常是指由本发明提供的经遗传修饰的宿主细胞生成的甜菊醇或甜菊糖苷的量。在一些实施方案，生成量表示为由所述宿主细胞生成的甜菊醇或甜菊糖苷的产量。在其他实施方案，生成量表示为生成所述甜菊醇或甜菊糖苷时所述宿主细胞的生产率。

本发明使用的术语“生产率/生产力”是指由宿主细胞生成甜菊醇或甜菊糖苷的量，表示为每单位量的发酵液中生成的甜菊醇或甜菊糖苷的量(按重量计)，其中所述宿主细胞根据时间(每小时)进行培养(按体积计)。

本发明使用的术语“产量/产率”是指由宿主细胞生成的甜菊醇或甜菊糖苷的量，表示为宿主细胞消耗的每单位量的碳源生成的甜菊醇或甜菊糖苷的量，按重量计。

本发明使用的术语化合物(例如，RebM2、甜菊糖苷类化合物或其他化合物)的“不可检测水平”是指化合物的水平/含量太低而不能通过标准技术来测定和/或分析所述化合物。譬如，所述术语包括由实施例6中所述的分析方法无法检测的化合物的水平。

术语“贝壳杉烯(kaurene)”是指化合物贝壳杉烯，包括贝壳杉烯的任何立体异构体。在特定实施方案，所述术语是指在本领域中称为内根-贝壳杉烯的对映异构体。在特定实施方案，所述术语是指具有以下结构的化合物：

术语“贝壳杉烯醇(kaurenol)”是指化合物贝壳杉烯醇，包括贝壳杉烯醇的任何立体异构体。在特定实施方案，所述术语是指在本领域中称为内根-贝壳杉烯醇的对映异构体。在特定实施方案，所述术语是指具有以下结构的化合物：

术语“贝壳杉烯醛(kaurenal)”是指化合物贝壳杉烯醛，包括贝壳杉烯醛的任何立体异构体。在特定实施方案，所述术语是指在本领域中称为内根-贝壳杉烯醛的对映异构体。在特定实施方案，所述术语是指具有以下结构的化合物：

术语“异贝壳杉烯酸(kaurenoic acid)”是指化合物异贝壳杉烯酸，包括异贝壳杉烯酸的任何立体异构体。在特定实施方案，所述术语是指在本领域中称为内根-异贝壳杉烯酸的对映异构体。在特定实施方案，所述术语是指具有以下结构的化合物：

本发明使用的术语“甜菊糖苷/甜菊糖苷类化合物”是指甜菊醇的糖苷，包括但不限于，天然存在的甜菊糖苷类化合物，例如天然存在的甜菊单糖苷、甜菊双糖苷、甜茶苷、杜克苷B、杜克苷A、瑞鲍迪苷B、瑞鲍迪苷G、甜菊苷(stevioside)、瑞鲍迪苷C、瑞鲍迪苷F、瑞鲍迪苷A、瑞鲍迪苷I、瑞鲍迪苷E、瑞鲍迪苷H、瑞鲍迪苷L、瑞鲍迪苷K、瑞鲍迪苷J、瑞鲍迪苷M、瑞鲍迪苷D、瑞鲍迪苷N、瑞鲍迪苷O，合成甜菊糖苷类化合物例如酶促糖基化的甜菊糖苷类化合物及其组合。

本发明使用的术语“变体”是指通过氨基酸插入、缺失、突变和/或置换而不同于具体列举的“参考”多肽(例如，野生型序列)的多肽，但保留与所述参考多肽基本相似的活性。在一些实施方案，所述变体通过重组DNA技术(例如诱变)而产生。在一些实施方案，变体多肽与其参考多肽的不同之处在于一个碱基残基置换另一个碱基残基(即，Arg置换Lys)，一个疏水残基置换另一个疏水残基(即，Leu置换Ile)，或一个芳香族残基置换另一个芳香族残基(即，Phe置换Tyr)等。在一些实施方案，变体包括类似物，其中实现保守置换导致所述参考序列的基本结构类似。此类保守置换的实例包括但不限于，谷氨酸置换天冬氨酸，反之亦然；谷氨酰胺置换天冬酰胺，反之亦然；丝氨酸置换苏氨酸，反之亦然；赖氨酸置换精氨酸，反之亦然；或者任何异亮氨酸、缬氨酸或亮氨酸之间的彼此置换。

在上下文中或两个或更多个核酸或蛋白质序列中，本发明使用的术语“序列同一性”或“同一性百分比”是指两个或更多个序列或子序列是相同，或所述序列或子序列具有特定百分比的相同的氨基酸残基或核苷酸。譬如，当进行比较和比对以在比较窗口上进行最大对应，或者使用序列比较算法或通过手动比对和目视检查进行测定的指定区域时，所述序列可在所述指定区域与参考序列具有至少60％，至少65％，至少70％，至少75％，至少80％，至少85％，至少90％，至少91％，至少92％，至少93％，至少94％，至少95％，至少96％，至少97％，至少98％，至少99％，或更高的同一性。譬如，通过计算所述序列中相同核苷酸(或氨基酸残基)的数量除以总核苷酸(或氨基酸残基)的长度减去任何空位(gap)的长度的比值来确定同一性百分比。

为方便起见，可使用本领域已知的计算机程序和数学算法来确定两个序列之间的同一性程度。计算序列同一性百分比的此类算法通常考虑所述比较区域上的序列空位和错配。比较和比对序列的程序，如Clustal W(序列比对W)(Thompson et al.,(1994)NucleicAcids Res.,22:4673-4680)，Clustal Omega(序列比对ω)(Sievers et al.,(2011)Molecular Systems Biology.,7:539)，ALIGN(Myers et al.,(1988)CABIOS,4:11-17)，FASTA(Pearson et al.,(1988)PNAS,85:2444-2448；Pearson(1990),Methods Enzymol.,183:63-98)，以及空位的BLAST(Altschul et al.,(1997)Nucleic Acids Res.,25:3389-3402)，均可用于此目的。所述BLAST或BLAST 2.0(Altschul et al.,J.Mol.Biol.215:403-10,1990)可从若干来源得到，包括国家生物信息中心(NCBI)和因特网，用于与序列分析程序BLASTP、BLASTN、BLASTX、TBLASTN和TBLASTX结合使用。更多信息可从NCBI网站上获悉。

在一些实施方案，序列比对和同一性百分比计算可使用BLAST程序采用其标准默认参数来确定。对于核苷酸序列比对和序列同一性计算，BLASTN程序可以其默认参数(空位开放罚分(Gap opening penalty)＝5，空位延伸罚分(Gap extension penalty)＝2，核匹配(Nucleic match)＝1，核不匹配(Nucleic mismatch)＝-3，期望值(Expectation value)＝10.0，字大小(Word size)＝11，查询范围中的最大匹配数＝0)进行使用。对于多肽序列比对和序列同一性计算，BLASTP程序可以其默认参数(比对矩阵(Alignment matrix)＝BLOSUM62；空位损失(Gap costs):存在(Existence)＝11，扩展(Extension)＝1；组成调整(Compositional adjustments)＝条件组成得分(Conditional compositional score)，矩阵调整；期望值＝10.0；字大小(Word size)＝6；查询范围中的最大匹配数＝0)进行使用。或者，使用以下程序和参数：克隆管理组件(Clone Manager Suite)的比对加强版(AlignPlus)软件，版本5(Sci-Ed软件)；DNA比较：总体比较(Global comparison)，标准线性评分矩阵(Standard Linear Scoring matrix)，不匹配罚分＝2，开放空位罚分＝4，延伸空位罚分＝1。在本发明所述的实施方案中，使用BLASTN或BLASTP程序使用其默认参数来计算序列同一性。氨基酸比较：总体比较，BLOSUM 62评分矩阵。在本发明所述的实施方案中，使用Clustal W使用建议的默认参数进行两个或更多个序列的序列比对(Dealign输入序列：无；Mbed样聚类引导树(Mbed-like clustering guide-tree)：是；Mbed样聚类迭代(Mbed-likeclustering iteration)：是；组合迭代次数：默认(0)；最大引导树迭代(Max guide treeiterations)：默认；最大HMM迭代：默认；指令(Order)：输入)。

6.2宿主细胞

本发明提供了能够以高效率从贝壳杉烯生成异贝壳杉烯酸的宿主细胞。在某些实施方案，所述宿主细胞可从作为起始物料的贝壳杉烯生成异贝壳杉烯酸。在特定实施方案，所述宿主细胞可从培养基中的碳源生成异贝壳杉烯酸。在特定实施方案，所述宿主细胞可从培养基中的碳源生成异贝壳杉烯酸，并可进一步由所述异贝壳杉烯酸生成RebA或RebD。在特定实施方案，所述宿主细胞可进一步由所述RebD生成瑞鲍迪苷M(RebM)。

在特定实施方案，所述宿主细胞包含豌豆(Pisum sativum)贝壳杉烯氧化酶的酶活性。豌豆贝壳杉烯氧化酶能够高效地将贝壳杉烯转化为异贝壳杉烯酸。在某些实施方案，豌豆贝壳杉烯氧化酶能够以大于30％的效率将贝壳杉烯转化为异贝壳杉烯酸。在某些实施方案，豌豆贝壳杉烯氧化酶能够以大于35％的效率将贝壳杉烯转化为异贝壳杉烯酸。在某些实施方案，豌豆贝壳杉烯氧化酶能够以大于40％的效率将贝壳杉烯转化为异贝壳杉烯酸。在某些实施方案，豌豆贝壳杉烯氧化酶能够以大于95％的效率将贝壳杉烯转化为异贝壳杉烯酸。在某些实施方案，豌豆贝壳杉烯氧化酶能够以大于50％的效率将贝壳杉烯转化为异贝壳杉烯酸。在某些实施方案，豌豆贝壳杉烯氧化酶能够以大于55％的效率将贝壳杉烯转化为异贝壳杉烯酸。在某些实施方案，豌豆贝壳杉烯氧化酶能够以约58％的效率将贝壳杉烯转化为异贝壳杉烯酸。在某些实施方案，豌豆贝壳杉烯氧化酶能够以大于30％、35％、40％、45％、50％、55％、60％、65％、70％、75％、80％、85％、90％、或95％的效率将贝壳杉烯转化为异贝壳杉烯酸。

在某些实施方案，所述宿主细胞能够以大于30％的效率将贝壳杉烯转化为异贝壳杉烯酸。在某些实施方案，所述宿主细胞能够以大于35％的效率将贝壳杉烯转化为异贝壳杉烯酸。在某些实施方案，所述宿主细胞能够以大于40％的效率将贝壳杉烯转化为异贝壳杉烯酸。在某些实施方案，所述宿主细胞能够以大于45％的效率将贝壳杉烯转化为异贝壳杉烯酸。在某些实施方案，所述宿主细胞能够以大于50％的效率将贝壳杉烯转化为异贝壳杉烯酸。在某些实施方案，所述宿主细胞能够以大于55％的效率将贝壳杉烯转化为异贝壳杉烯酸。在某些实施方案，所述宿主细胞能够以约58％的效率将贝壳杉烯转化为异贝壳杉烯酸。在某些实施方案，所述宿主细胞能够以大于30％、35％、40％、45％、50％、55％、60％、65％、70％、75％、80％、85％、90％、或95％的效率将贝壳杉烯转化为异贝壳杉烯酸。

转化效率可通过本领域技术人员显而易见的任何技术进行测定。在某些实施方案，转化效率可通过在适于形成异贝壳杉烯酸的条件下，使贝壳杉烯与酶或宿主细胞接触来测定。效率可通过将所生成的异贝壳杉烯酸的摩尔量与所得组合物中的贝壳杉烯和异贝壳杉烯酸的总量进行比较来测定。效率还可通过将所得组合物中的异贝壳杉烯酸和异贝壳杉烯酸的下游产物的总量与贝壳杉烯、贝壳杉烯醇、贝壳杉烯醛、异贝壳杉烯酸和异贝壳杉烯酸的下游产物的总量进行比较来测定。譬如，包含图5中所示Ps.KO的菌株的转化效率是通过将所得组合物(即，甜菊醇，1葡萄糖+甜菊醇，2葡萄糖+甜菊醇，3葡萄糖+甜菊醇，4葡萄糖+甜菊醇，5葡萄糖+甜菊醇，和6葡萄糖+甜菊醇)中图2中所示的异贝壳杉烯酸和所有下游化合物的总量与图2中所示的贝壳杉烯、贝壳杉烯醇、贝壳杉烯醛、异贝壳杉烯酸和异贝壳杉烯酸的所有下游产物的总量进行比较来测定。

在某些实施方案，本发明提供了包含贝壳杉烯氧化酶的宿主细胞，所述贝壳杉烯氧化酶包含SEQ ID NO：1的氨基酸序列。在某些实施方案，本发明提供了包含贝壳杉烯氧化酶的宿主细胞，所述贝壳杉烯氧化酶包含与SEQ ID NO：1的氨基酸序列基本相同的氨基酸序列。在某些实施方案，本发明提供了包含贝壳杉烯氧化酶的宿主细胞，所述贝壳杉烯氧化酶包含与SEQ ID NO：1的氨基酸序列具有至少60％同一性的氨基酸序列。在某些实施方案，本发明提供了包含贝壳杉烯氧化酶的宿主细胞，所述贝壳杉烯氧化酶包含与SEQ ID NO：1的氨基酸序列具有至少65％同一性的氨基酸序列。在某些实施方案，本发明提供了包含贝壳杉烯氧化酶的宿主细胞，所述贝壳杉烯氧化酶包含与SEQ ID NO：1的氨基酸序列具有至少70％同一性的氨基酸序列。在某些实施方案，本发明提供了包含贝壳杉烯氧化酶的宿主细胞，所述贝壳杉烯氧化酶包含与SEQ ID NO：1的氨基酸序列具有至少75％同一性的氨基酸序列。在某些实施方案，本发明提供了包含贝壳杉烯氧化酶的宿主细胞，所述贝壳杉烯氧化酶包含与SEQ ID NO：1的氨基酸序列具有至少80％同一性的氨基酸序列。在某些实施方案，本发明提供了包含贝壳杉烯氧化酶的宿主细胞，所述贝壳杉烯氧化酶包含与SEQ IDNO：1的氨基酸序列具有至少85％同一性的氨基酸序列。在某些实施方案，本发明提供了包含贝壳杉烯氧化酶的宿主细胞，所述贝壳杉烯氧化酶包含与SEQ ID NO：1的氨基酸序列具有至少90％同一性的氨基酸序列。在某些实施方案，本发明提供了包含贝壳杉烯氧化酶的宿主细胞，所述贝壳杉烯氧化酶包含与SEQ ID NO：1的氨基酸序列具有至少95％同一性的氨基酸序列。在某些实施方案，本发明提供了包含贝壳杉烯氧化酶的宿主细胞，所述贝壳杉烯氧化酶包含与SEQ ID NO：1的氨基酸序列具有至少96％同一性的氨基酸序列。在某些实施方案，本发明提供了包含贝壳杉烯氧化酶的宿主细胞，所述贝壳杉烯氧化酶包含与SEQID NO：1的氨基酸序列具有至少97％同一性的氨基酸序列。在某些实施方案，本发明提供了包含贝壳杉烯氧化酶的宿主细胞，所述贝壳杉烯氧化酶包含与SEQ ID NO：1的氨基酸序列具有至少98％同一性的氨基酸序列。在某些实施方案，本发明提供了包含贝壳杉烯氧化酶的宿主细胞，所述贝壳杉烯氧化酶包含与SEQ ID NO：1的氨基酸序列具有至少99％同一性的氨基酸序列。在某些实施方案，本发明提供了包含贝壳杉烯氧化酶的宿主细胞，所述贝壳杉烯氧化酶包含与SEQ ID NO：1的氨基酸序列具有至少60％、至少99％、或至少60％和99％之间任一百分比同一性的氨基酸序列。

在某些实施方案，本发明提供了包含贝壳杉烯氧化酶的宿主细胞，所述贝壳杉烯氧化酶包含本发明所述的氨基酸序列，并能够将贝壳杉烯转化为异贝壳杉烯酸。在某些实施方案，本发明提供了包含贝壳杉烯氧化酶的宿主细胞，所述贝壳杉烯氧化酶包含本发明所述的氨基酸序列，并能够氧化各个贝壳杉烯、贝壳杉烯醇、和贝壳杉烯醛的19位。在某些实施方案，本发明提供了包含贝壳杉烯氧化酶的宿主细胞，所述贝壳杉烯氧化酶能够以大于30％、35％、40％、45％、50％、55％、60％、65％、70％、75％、80％、85％、90％、95％、96％、或97％的效率将贝壳杉烯转化为异贝壳杉烯酸，和其中所述贝壳杉烯氧化酶包含与SEQ IDNO：1的氨基酸序列具有至少95％序列同一性的氨基酸序列。

在某些实施方案，本发明提供了包含核酸的宿主细胞，所述核酸编码包含SEQ IDNO：1的氨基酸序列的豌豆(Pisum sativum)贝壳杉烯氧化酶。在某些实施方案，本发明提供了包含核酸的宿主细胞，所述核酸编码包含与SEQ ID NO：1的氨基酸序列基本相同的氨基酸序列的多肽。在某些实施方案，本发明提供了包含核酸的宿主细胞，所述核酸编码包含与SEQ ID NO：1的氨基酸序列具有至少60％同一性的氨基酸序列的多肽。在某些实施方案，本发明提供了包含核酸的宿主细胞，所述核酸编码包含与SEQ ID NO：1的氨基酸序列具有至少65％同一性的氨基酸序列的多肽。在某些实施方案，本发明提供了包含核酸的宿主细胞，所述核酸编码包含与SEQ ID NO：1的氨基酸序列具有至少70％同一性的氨基酸序列的多肽。在某些实施方案，本发明提供了包含核酸的宿主细胞，所述核酸编码包含与SEQ ID NO：1的氨基酸序列具有至少75％同一性的氨基酸序列的多肽。在某些实施方案，本发明提供了包含核酸的宿主细胞，所述核酸编码包含与SEQ ID NO：1的氨基酸序列具有至少80％同一性的氨基酸序列的多肽。在某些实施方案，本发明提供了包含核酸的宿主细胞，所述核酸编码包含与SEQ ID NO：1的氨基酸序列具有至少85％同一性的氨基酸序列的多肽。在某些实施方案，本发明提供了包含核酸的宿主细胞，所述核酸编码包含与SEQ ID NO：1的氨基酸序列具有至少90％同一性的氨基酸序列的多肽。在某些实施方案，本发明提供了包含核酸的宿主细胞，所述核酸编码包含与SEQ ID NO：1的氨基酸序列具有至少95％同一性的氨基酸序列的多肽。在某些实施方案，本发明提供了包含核酸的宿主细胞，所述核酸编码包含与SEQ ID NO：1的氨基酸序列具有至少96％同一性的氨基酸序列的多肽。在某些实施方案，本发明提供了包含核酸的宿主细胞，所述核酸编码包含与SEQ ID NO：1的氨基酸序列具有至少97％同一性的氨基酸序列的多肽。在某些实施方案，本发明提供了包含核酸的宿主细胞，所述核酸编码包含与SEQ ID NO：1的氨基酸序列具有至少98％同一性的氨基酸序列的多肽。在某些实施方案，本发明提供了包含核酸的宿主细胞，所述核酸编码包含与SEQ ID NO：1的氨基酸序列具有至少99％同一性的氨基酸序列的多肽。在某些实施方案，本发明提供了包含核酸的宿主细胞，所述核酸编码包含与SEQ ID NO：1的氨基酸序列具有至少60％、至少99％、或60％和99％之间任一百分比同一性的氨基酸序列的多肽。

在某些实施方案，本发明提供了包含异源核酸的宿主细胞，所述异源核酸包含SEQID NO：14的核苷酸序列，所述异源核酸编码具有SEQ ID NO：1的序列的豌豆(Pisumsativum)贝壳杉烯氧化酶。在某些实施方案，本发明提供了包含异源核酸的宿主细胞，所述异源核酸包含与SEQ ID NO：14的核苷酸序列具有至少60％，至少65％，至少70％，至少75％，至少80％，至少85％，至少90％，至少95％，至少96％，至少97％，至少98％，或至少99％同一性的核苷酸序列。

在某些实施方案，所述宿主细胞包含上述豌豆(Pisum sativum)贝壳杉烯氧化酶多肽的变体。在某些实施方案，相对于豌豆(Pisum sativum)贝壳杉烯氧化酶多肽，所述变体可包含多达15、10、9、8、7、6、5、4、3、2、或1个氨基酸置换。在某些实施方案，相对于豌豆(Pisum sativum)贝壳杉烯氧化酶多肽，所述变体可包含多达15、10、9、8、7、6、5、4、3、2、或1个保守氨基酸置换。在某些实施方案，本发明所述的任何核酸可以例如通过密码子优化对所述宿主细胞进行优化。

在本发明所述的实施方案中，任何合适的方法可用于确定两种多肽的相应氨基酸位置或相应环路(loop)位置。在某些实施方案，贝壳杉烯氧化酶和参考序列SEQ ID NO：1的所述序列均可采用Clustal(W)使用其默认参数进行比对。在其他实施方案，贝壳杉烯氧化酶和参考序列SEQ ID NO：1的所述序列均可采用结构比对()进行比对，例如SWISS-MODEL，其是蛋白质结构同源性建模服务器，可通过ExPASy网络服务器或DeepView(Swiss Pdb-Viewer)程序访问。

在某些实施方案，贝壳杉烯如图1C所示。在某些实施方案，豌豆(Pisum sativum)贝壳杉烯氧化酶或变体豌豆(Pisum sativum)贝壳杉烯氧化酶能够催化氧化贝壳杉烯的C-19位以形成贝壳杉烯醇。在某些实施方案，豌豆贝壳杉烯氧化酶或变体豌豆贝壳杉烯氧化酶能够催化氧化贝壳杉烯醇的C-19位以形成贝壳杉烯醛。在某些实施方案，豌豆贝壳杉烯氧化酶或变体豌豆贝壳杉烯氧化酶能够催化氧化贝壳杉烯醛的C-19位以形成异贝壳杉烯酸。在某些实施方案，豌豆贝壳杉烯氧化酶或变体豌豆贝壳杉烯氧化酶能够催化氧化贝壳杉烯的C-19位以形成贝壳杉烯醇，氧化贝壳杉烯醇的C-19位以形成贝壳杉烯醛，以及催化氧化贝壳杉烯醛的C-19位以形成异贝壳杉烯酸。

在某些实施方案，RebD如图2所示。在某些实施方案，所述宿主细胞还包含能够将异贝壳杉烯酸转化为甜菊醇的一种或多种酶。在某些实施方案，所述宿主细胞还包含能够将甜菊醇转化为一种或多种甜菊糖苷类化合物的一种或多种酶。在某些实施方案，所述宿主细胞还包含能够将RebA转化为RebD的一种或多种酶。在某些实施方案，所述宿主细胞还包含能够将RebD转化为RebM的一种或多种酶。

尽管所述宿主细胞的豌豆(Pisum sativum)贝壳杉烯氧化酶或任何变体豌豆(Pisum sativum)贝壳杉烯氧化酶接受以贝壳杉烯为底物，但贝壳杉烯的来源可以是本领域技术人员认为合适的任何来源。在某些实施方案，豌豆贝壳杉烯氧化酶或任何变体豌豆贝壳杉烯氧化酶可与贝壳杉烯接触。在某些实施方案，所述宿主细胞可与贝壳杉烯接触。在某些实施方案，豌豆贝壳杉烯氧化酶或任何变体豌豆贝壳杉烯氧化酶可与包含贝壳杉烯、贝壳杉烯醇、和贝壳杉烯醛中的一种或多种的组合物接触。在某些实施方案，所述组合物包含贝壳杉烯。在某些实施方案，所述组合物包含贝壳杉烯醇。在某些实施方案，所述组合物包含贝壳杉烯醛。在某些实施方案，所述组合物衍生自从甜叶菊(Stevia rebaudiana)叶中分离的天然产物。在某些实施方案，所述组合物是微生物衍生的。在某些实施方案，可使所述宿主细胞与包含一种或多种碳源的组合物接触。

在某些实施方案，可采用本领域已知的任何合适的方法筛选适于催化所需反应的任何变体豌豆(Pisum sativum)贝壳杉烯氧化酶。例如，可通过表达编码变体豌豆贝壳杉烯氧化酶的异源核酸并筛选生成能够在底物的所需位置(例如，贝壳杉烯、贝壳杉烯醇、和/或贝壳杉烯醛的C-19位)催化氧化的功能性变体豌豆贝壳杉烯氧化酶的细胞，在体内检测合适的变体豌豆贝壳杉烯氧化酶。示例性筛选方法记载于以下实施例中。在另一实施例，可通过使变体豌豆贝壳杉烯氧化酶与底物(例如，贝壳杉烯、贝壳杉烯醇、和/或贝壳杉烯醛)接触来体外筛选合适的变体豌豆贝壳杉烯氧化酶。在此实施例中，可通过测定异贝壳杉烯酸、甜菊醇或甜菊糖苷(例如RebD)的存在来进行检测，以确定变体豌豆贝壳杉烯氧化酶是否是合适的酶。可通过LC-MS或本领域其他已知方法来分析反应，参见例如WO 2013/022989。

在某些实施方案，如果变体豌豆(Pisum sativum)贝壳杉烯氧化酶在体内能够以大于30％、40％、50％、60％、70％、80％、90％、95％、96％、或97％的效率将贝壳杉烯转化为异贝壳杉烯酸，则所述变体豌豆贝壳杉烯氧化酶被认为适合于将贝壳杉烯转化为异贝壳杉烯酸。

在某些实施方案，如果变体豌豆(Pisum sativum)贝壳杉烯氧化酶在体内能够以大于30％、40％、50％、60％、70％、80％、90％、95％、96％、或97％的效率将贝壳杉烯转化为贝壳杉烯醇，则所述变体豌豆贝壳杉烯氧化酶被认为适合于将贝壳杉烯转化为贝壳杉烯醇。

在某些实施方案，如果变体豌豆(Pisum sativum)贝壳杉烯氧化酶在体内能够以大于30％、40％、50％、60％、70％、80％、90％、95％、96％、或97％的效率将贝壳杉烯醇转化为贝壳杉烯醛，则所述变体豌豆贝壳杉烯氧化酶被认为适合于将贝壳杉烯醇转化为贝壳杉烯醛。

在某些实施方案，如果变体豌豆(Pisum sativum)贝壳杉烯氧化酶在体内能够以大于30％、40％、50％、60％、70％、80％、90％、95％、96％、或97％的效率将贝壳杉烯醛转化为异贝壳杉烯酸，则所述变体豌豆贝壳杉烯氧化酶被认为适合于将贝壳杉烯醛转化为异贝壳杉烯酸。

在某些实施方案，如果体内转化效率大于30％、40％、50％、60％、70％、80％、90％、95％、96％、或97％，则变体豌豆(Pisum sativum)贝壳杉烯氧化酶被认为适合于将贝壳杉烯转化为异贝壳杉烯酸，其中所述转化效率是通过在所得组合物中图2中所示的异贝壳杉烯酸和所有下游化合物的总量除以图2中所示的贝壳杉烯、贝壳杉烯醇、贝壳杉烯醛、异贝壳杉烯酸、和所有下游化合物的总量(乘以100％)来计算得到。

在有利的实施方案中，所述宿主细胞可包含能够制备贝壳杉烯的一种或多种酶途径，所述途径可单独或一起采用。在某些实施方案，所述宿主细胞包含能够将香叶基香叶基焦磷酸转化为贝壳杉烯的一种或多种酶。有用的酶和编码所述酶的核酸均是本领域技术人员已知的。在某些实施方案，所述宿主细胞包含能够将香叶基香叶基焦磷酸转化为贝壳杉烯的一种或多种酶。在进一步有利的实施方案中，所述宿主细胞包含能够将异贝壳杉烯酸转化为甜菊醇和/或甜菊糖苷类化合物的一种或多种酶途径，所述途径可单独或一起采用。有用的酶和编码所述酶的核酸均是本领域技术人员已知的。特别有用的酶和核酸均描述于以下章节中，并进一步描述于例如US 2014/0329281A1、US 2014/0357588A1、US 2015/0159188、WO 2016/038095A2和US 2016/0198748A1中。

在进一步的实施方案中，所述宿主细胞还包含能够从碳源制备香叶基香叶基焦磷酸的一种或多种酶。所述这些包括DXP途径的酶类和MEV途径的酶类。有用的酶和编码所述酶的核酸均是本领域技术人员已知的。每种途径的示例性酶类描述如下，并进一步描述于例如US 2016/0177341A1中。所述MEV途径也如图1D所示。

在某些实施方案，所述另外的酶是天然的。在有利的实施方案中，所述另外的酶是异源的。在某些实施方案，两种酶可在一种多肽中进行组合。

6.3非天然存在的贝壳杉烯氧化酶多肽和核酸

另一方面，本发明提供了非天然存在的变体贝壳杉烯氧化酶，所述变体贝壳杉烯氧化酶包括与参考序列(例如，SEQ ID NO：1)相比的氨基酸残基的修饰，但仍保留贝壳杉烯氧化酶将贝壳杉烯转化为异贝壳杉烯酸，将贝壳杉烯转化为贝壳杉烯醇、将贝壳杉烯醇转化为贝壳杉烯醛、和/或将贝壳杉烯醛转化为异贝壳杉烯酸的活性。在某些实施方案，与参考序列(例如，SEQ ID NO：1)相比，非天然存在的变体贝壳杉烯氧化酶可在某些氨基酸位置或位点包括多达20、15、10、9、8、7、6、5、4、3、2或1个氨基酸置换、缺失、添加和/或插入。在某些实施方案，非天然存在的变体贝壳杉烯氧化酶包含本发明所述的任何变体贝壳杉烯氧化酶。

另一方面，本发明提供了非天然存在的变体贝壳杉烯氧化酶，所述贝壳杉烯氧化酶包括与参考序列(例如，SEQ ID NO：15)相比的核酸残基的修饰，然而，当翻译成蛋白质时，所述蛋白质保持贝壳杉烯氧化酶将贝壳杉烯转化为异贝壳杉烯酸，将贝壳杉烯转化为贝壳杉烯醇、将贝壳杉烯醇转化为贝壳杉烯醛、和/或将贝壳杉烯醛转化为异贝壳杉烯酸的活性。在某些实施方案，非天然存在的变体贝壳杉烯氧化酶可编码本发明所述的任何变体贝壳杉烯氧化酶。

6.4细胞株

本发明提供的宿主细胞有用的组合物和方法包括古细菌细胞、原核细胞或真核细胞。

合适的原核宿主包括但不限于，多种革兰氏阳性、革兰氏阴性或革兰氏变种细菌中的任一种。实例包括但不限于，属于以下属的细胞：土壤杆菌属(Agrobacterium)，脂环酸芽孢杆菌属(Alicyclobacillus)，鱼腥藻属(Anabaena)，蓝细菌属(Anacystis)，节细菌属(Arthrobacter)，固氮菌属(Azobacter)，芽孢杆菌属(Bacillus)，短杆菌属(Brevibacterium)，着色菌属(Chromatium)，梭菌属(Clostridium)，棒状杆菌属(Corynebacterium)，肠杆菌属(Enterobacter)，欧文氏菌属(Erwinia)，埃希氏杆菌属(Escherichia)，乳酸杆菌属(Lactobacillus)，乳球菌属(Lactococcus)，中慢生根瘤菌属(Mesorhizobium)，甲基杆菌属(Methylobacterium)，细杆菌属(Microbacterium)，席藻属(Phormidium)，假单胞菌属(Pseudomonas)，红细菌属(Rhodobacter)，红假单胞菌属(Rhodopseudomonas)，红螺菌属(Rhodospirillum)，红球菌属(Rhodococcus)，沙门氏菌属(Salmonella)，栅藻属(Scenedesmun)，沙雷氏菌属(Serratia)，志贺氏菌属(Shigella)，葡萄球菌属(Staphlococcus)，链霉菌属(Strepromyces)，Synnecoccus和发酵单胞菌属(Zymomonas)。原核菌株的实例包括但不限于：枯草芽孢杆菌(Bacillus subtilis)，解淀粉芽孢杆菌(Bacillus amyloliquefacines)，产氨短杆菌(Brevibacterium ammoniagenes)，嗜氨短杆菌(Brevibacterium immariophilum)，拜氏梭菌(Clostridium beigerinckii)，阪崎肠杆菌(Enterobactersakazakii)，大肠杆菌(Escherichia coli)，乳酸乳球菌(Lactococcus lactis)，百脉根根瘤菌(Mesorhizobium loti)，绿脓假单胞菌(Pseudomonas aeruginosa)，迈氏假单胞菌(Pseudomonas mevalonii)，普迪卡假单胞菌(Pseudomonas pudica)，荚膜红细菌(Rhodobactercapsulatus)，类球红细菌(Rhodobactersphaeroides)，深红红螺菌(Rhodospirillum rubrum)，肠道沙门氏菌(Salmonella enterica)，伤寒沙门氏菌(Salmonella typhi)，鼠伤寒沙门氏菌(Salmonella typhimurium)，痢疾志贺氏杆菌(Shigella dysenteriae)，福氏志贺菌(Shigella flexneri)，宋内志贺菌(Shigella sonne)和金黄色葡萄球菌(Staphylococcusaureus)。在特定实施方案中，所述宿主细胞是大肠杆菌(Escherichia coli)细胞。

合适的古细菌宿主包括但不限于属于以下属的细胞：气火菌属(Aeropyrum)，古菌状菌属(Archaeglobus)，盐杆菌属(Halobacterium)，产甲烷球菌属(Methanococcus)，甲烷细菌属(Methanobacterium)，火球菌属(Pyrococcus),硫化叶菌属(Sulfolobus)，和热原体属(Thermoplasma)。古细菌菌株的实例包括但不限于：闪烁古生球菌(Archaeoglobusfulgidus)，盐杆菌属(Halobacterium sp.)，詹氏甲烷球菌(Methanococcus jannaschii)，嗜热自养甲烷杆菌(Methanobacterium thermoautotrophicum)，嗜酸热原体(Thermoplasma acidophilum)，火山热原体(Thermoplasma volcanium)，嗜热古菌(Pyrococcus horikoshii)，Pyrococcus abyssi，和敏捷气热菌(Aeropyrumpernix)。

合适的真核宿主包括但不限于真菌细胞、藻类细胞、昆虫细胞和植物细胞。在一些实施方案，可用于本发明方法的酵母包括已经与微生物保藏中心(例如，IFO、ATCC等)一起保藏并属于以下属的酵母：芽孢酵母属(Aciculoconidium)，神食酵母属(Ambrosiozyma)，节束酵母属(Arthroascus)，Arxiozyma，阿舒囊霉属(Ashbya)，Babjevia，本森顿酵母属(Bensingtonia)，Botryoascus，Botryozyma，酒香酵母属(Brettanomyces)，布勒掷孢酵母属(Bullera)，布勒担孢酵母属(Bulleromyces)，念珠菌属(Candida)，固囊酵母属(Citeromyces)，棒孢酵母属(Clavispora)，隐球菌属(Cryptococcus)，Cystofilobasidium，德巴利氏酵母属(Debaryomyces)，Dekkara，Dipodascopsis，双足囊菌属(Dipodascus)，Eeniella，Endomycopsella，Eremascus，假囊酵母属(Eremothecium)，担孢酵母属(Erythrobasidium)，Fellomyces，线黑粉酵母属(Filobasidium)，耐碱酵母属(Galactomyces)，地丝菌属(Geotrichum)，季氏酵母属(Guilliermondella)，孢汉逊酵母属(Hanseniaspora)，汉逊酵母属(Hansenula)，Hasegawaea，胶珊瑚属(Holtermannia)，Hormoascus属，生丝毕赤酵母属(Hyphopichia)，伊萨酵母属(Issatchenkia)，克勒克酵母属(Kloeckera)，孢克勒克酵母属(Kloeckeraspora)，克鲁维酵母属(Kluyveromyces)，Kondoa属，Kuraishia属，克氏担孢酵母属(Kurtzmanomyces)，白冬孢酵母属(Leucosporidium)，油脂酵母属(Lipomyces)，娄德酵母属(Lodderomyces)，马拉色氏霉菌属(Malassezia)，梅奇酵母属(Metschnikowia)，木拉克酵母属(Mrakia)，油脂酵母属无性属(Myxozyma)，拿逊酵母属(Nadsonia)，Nakazawaea，针孢酵母属(Nematospora)，甲醇诱导型酵母属(Ogataea)，卵孢酵母属(Oosporidium)，管囊酵母属(Pachysolen)，厚壁孢酵母(Phachytichospora)，巴西仙草(Phaffia)，毕赤酵母属(Pichia)，红冬孢酵母属(Rhodosporidium)，红酵母属(Rhodotorula)，酵母属(Saccharomyces)，类酵母属(Saccharomycodes)，覆膜孢酵母属(Saccharomycopsis)，Saitoella，Sakaguchia，Saturnospora，裂芽酵母孢子菌属(Schizoblastosporion)，裂殖酵母属(Schizosaccharomyces)，许旺酵母属(Schwanniomyces)，锁掷酵母属(Sporidiobolus)，掷孢酵母属(Sporobolomyces)，原孢酵母属(Sporopachydermia)，冠孢酵母属(Stephanoascus)，梗孢酵母属(Sterigmatomyces)，拟梗孢酵母属(Sterigmatosporidium)，Symbiotaphrina，合轴酵母属(Sympodiomyces)，Sympodiomycopsis，有孢圆酵母属(Torulaspora)，Trichosporiella，毛孢子菌属(Trichosporon)，三角酵母属(Trigonopsis)，Tsuchiyaea，Udeniomyces，Waltomyces，威克酵母属(Wickerhamia)，拟威克酵母属(Wickerhamiella)，拟威尔酵母属(Williopsis)，Yamadazyma，耶氏酵母属(Yarrowia)，接合囊酵母属(Zygoascus)，接合酵母属(Zygosaccharomyces)，接合拟威尔酵母属(Zygowilliopsis)，和Zygozyma等等。

在一些实施方案，所述宿主微生物是酿酒酵母(Saccharomyces cerevisiae)，巴斯德毕赤酵母(Pichia pastoris)，粟酒裂殖酵母(Schizosaccharomyces pombe)，布鲁赛尔德克酵母(Dekkera bruxellensis)，乳酸克鲁维酵母(Kruyveromyces lactis，先前称为乳酸酵母(Saccharomyces lactis))，马克斯克鲁维酵母(Kluveromyces marxianus)，Arxula adeninivorans或多形汉逊酵母(Hansenula polymorpha)(现称为毕赤酵母(Pichia angusta))。在一些实施方案，所述宿主微生物是念珠菌属的菌株，例如解脂假丝酵母(Candida lipolytica)，吉利蒙假丝酵母(Candida guilliermondii)，克鲁斯假丝酵母(Candida krusei)，假热带假丝酵母(Candida pseudotropicalis)或产朊假丝酵母(Candida utilis)的菌株。

在特定实施方案，所述宿主微生物是酿酒酵母(Saccharomyces cerevisiae)。在一些实施方案，所述宿主是酿酒酵母(Saccharomyces cerevisiae)的菌株，所述酿酒酵母的菌株是选自由贝克氏(Baker’s)酵母、CBS 7959、CBS 7960、CBS 7961、CBS 7962、CBS7963、CBS 7964、IZ-1904、TA、BG-1、CR-1、SA-1、M-26、Y-904、PE-2、PE-5、VR-1、BR-1、BR-2、ME-2、VR-2、MA-3、MA-4、CAT-1、CB-1、NR-1、BT-1、和AL-1组成的组。在一些实施方案，所述宿主微生物是酿酒酵母(Saccharomyces cerevisiae)的菌株，所述酿酒酵母的菌株是选自由PE-2、CAT-1、VR-1、BG-1、CR-1、和SA-1组成的组。在特定实施方案，酿酒酵母(Saccharomyces cerevisiae)的菌株是PE-2。在另一特定实施方案，酿酒酵母(Saccharomyces cerevisiae)的菌株是CAT-1。在另一特定实施方案，酿酒酵母(Saccharomyces cerevisiae)的菌株是BG-1。

在一些实施方案，所述宿主微生物是适于工业发酵的微生物。在特定实施方案，所述微生物被调节为在高溶剂浓度、高温、扩大的底物利用、营养限制、由糖和盐引起的渗透应力、酸度、亚硫酸盐和细菌污染、或其组合下存活，所述这些是公认的工业发酵环境的应力条件。

6.5甜菊醇和甜菊糖苷生物合成途径

在一些实施方案，通过工程化所述细胞以表达编码所述途径的一种或多种酶的多核苷酸和/或多肽，在本发明提供的经遗传修饰的宿主细胞中激活甜菊醇生物合成途径和/或甜菊糖苷生物合成途径。图1B示出了示例性甜菊醇生物合成途径。图2示出了由香叶基香叶基焦磷酸转化得到各种甜菊糖苷类化合物的示例性甜菊糖苷生物合成途径。

因此，在一些实施方案，本发明提供的经遗传修饰的宿主细胞包含编码多肽的异源多核苷酸，所述多肽具有香叶基香叶基焦磷酸合酶(GGPPS)活性。在一些实施方案，本发明提供的经遗传修饰的宿主细胞包含编码多肽的异源多核苷酸，所述多肽具有柯巴基焦磷酸合酶或内根-柯巴基焦磷酸合酶(CDPS；也称为内根-柯巴基二磷酸合酶或CPS)活性。在一些实施方案，本发明提供的经遗传修饰的宿主细胞包含编码多肽的异源多核苷酸，所述多肽具有贝壳杉烯合酶(KS；也称为内根-贝壳杉烯合酶)活性。在特定实施方案，本发明提供的经遗传修饰的宿主细胞包含编码多肽的异源多核苷酸，所述多肽具有本发明所述的贝壳杉烯氧化酶(KO；也称为内根-贝壳杉烯19-氧化酶)活性。在一些实施方案，本发明提供的经遗传修饰的宿主细胞包含编码多肽的异源多核苷酸，所述多肽具有甜菊醇合酶(也称为内根-异贝壳杉烯酸13-羟化酶或KAH)活性。在一些实施方案，本发明提供的经遗传修饰的宿主细胞包含编码多肽的异源多核苷酸，所述多肽具有细胞色素P450还原酶(CPR)活性。

在一些实施方案，本发明提供的经遗传修饰的宿主细胞包含编码具有UGT74G1活性的多肽的异源多核苷酸。在一些实施方案，本发明提供的经遗传修饰的宿主细胞包含编码具有UGT76G1活性的多肽的异源多核苷酸。在一些实施方案，本发明提供的经遗传修饰的宿主细胞包含编码具有UGT85C2活性的多肽的异源多核苷酸。在一些实施方案，本发明提供的经遗传修饰的宿主细胞包含编码具有UGT91D活性的多肽的异源多核苷酸。在一些实施方案，本发明提供的经遗传修饰的宿主细胞包含编码具有UDP-糖基转移酶活性的多肽的异源多核苷酸。

在某些实施方案，所述宿主细胞包含变体。在某些实施方案，相对于相关多肽，所述变体可包含多达15、10、9、8、7、6、5、4、3、2或1个氨基酸置换。在某些实施方案，相对于参考多肽，所述变体可包含多达15、10、9、8、7、6、5、4、3、2或1个保守氨基酸置换。在某些实施方案，可针对所述宿主细胞优化本发明所述的任何核酸，例如进行密码子优化。

以下描述了甜菊醇生物合成途径和/或甜菊糖苷生物合成途径的示例性核酸和酶。

6.5.1香叶基香叶基焦磷酸合酶(GGPPS)

香叶基香叶基焦磷酸合酶(EC 2.5.1.29)催化法呢基焦磷酸转化为香叶基香叶基焦磷酸。酶的示例性实例包括甜叶菊(Stevia rebaudiana，登录号ABD92926)，藤仓赤霉(Gibberella fujikuroi，登录号CAA75568)，小家鼠(Mus musculus，登录号AAH69913)，假微型海链藻(Thalassiosira pseudonana，登录号XP_002288339)，棒状链霉菌(Streptomyces clavuligerus，登录号ZP_05004570)，嗜酸热硫化叶菌(Sulfulobusacidocaldarius，登录号BAA43200)，聚球藻属(Synechococcus sp.，登录号ABC98596)，拟南芥(Arabidopsis thaliana，登录号NP_195399)，和三孢布拉霉(Blakeslea trispora，登录号AFC92798.1)的那些酶，以及US2014/0329281A1中示出的那些酶。编码所述这些酶的核酸可用于本发明提供的细胞和方法。在某些实施方案，本发明提供了使用核酸的细胞和方法，所述核酸与这些GGPPS核酸中的至少一种具有至少80％、85％、90％、或95％序列同一性。在某些实施方案，本发明提供了使用核酸的细胞和方法，所述核酸编码与这些GGPPS酶中的至少一种具有至少80％、85％、90％、或95％序列同一性的多肽。

6.5.2柯巴基焦磷酸合酶(CDPS)

柯巴基焦磷酸合酶(EC 5.5.1.13)催化香叶基香叶基焦磷酸转化为柯巴基焦磷酸。酶的示例性实例包括甜叶菊(Stevia rebaudiana，登录号AAB87091)，棒状链霉菌(Streptomyces clavuligerus，登录号EDY51667)，慢生型大豆根瘤菌(Bradyrhizobiumjaponicum，登录号AAC28895.1)，玉米(Zea mays，登录号AY562490)，拟南芥(Arabidopsisthaliana，登录号NM_116512)，和稻(Oryza sativa，登录号Q5MQ85.1)的那些酶，以及US2014/0329281A1中示出的那些酶。编码所述这些酶的核酸可用于本发明提供的细胞和方法。在某些实施方案，本发明提供了使用核酸的细胞和方法，所述核酸与这些CDPS核酸中的至少一种具有至少80％、85％、90％、或95％序列同一性。在某些实施方案，本发明提供了使用核酸的细胞和方法，所述核酸编码与这些CDPS酶中的至少一种具有至少80％、85％、90％、或95％序列同一性的多肽。

6.5.3贝壳杉烯合酶(KS)

贝壳杉烯合酶(EC 4.2.3.19)催化柯巴基焦磷酸转化为贝壳杉烯和二磷酸。酶的示例性实例包括慢生型大豆根瘤菌(Bradyrhizobium japonicum，登录号AAC28895.1)，暗球腔菌属(Phaeosphaeria sp.，登录号O13284)，拟南芥(Arabidopsis thaliana，登录号Q9SAK2)，和白云杉(Piceaglauca，登录号ADB55711.1)的那些酶，以及US2014/0329281A1中示出的那些酶。编码所述这些酶的核酸可用于本发明提供的细胞和方法。在某些实施方案，本发明提供了使用核酸的细胞和方法，所述核酸与这些KS核酸中的至少一种具有至少80％、85％、90％、或95％序列同一性。在某些实施方案，本发明提供了使用核酸的细胞和方法，所述核酸编码与这些KS酶中的至少一种具有至少80％、85％、90％、或95％序列同一性的多肽。

6.5.4双功能柯巴基焦磷酸合酶(CDPS)和贝壳杉烯合酶(KS)

还可使用CDPS-KS双功能酶(EC 5.5.1.13和EC 4.2.3.19)。酶的示例性实例包括桃拟茎点霉(Phomopsis amygdali，登录号BAG30962)，小立碗藓(Physcomitrellapatens，登录号BAF61135)，和藤仓赤霉(Gibberella fujikuroi，登录号Q9UVY5.1)的那些酶，以及US 2014/0329281A1、US 2014/0357588A1、US 2015/0159188和WO 2016/038095A2中示出的那些酶。编码所述这些酶的核酸可用于本发明提供的细胞和方法。在某些实施方案，本发明提供了使用核酸的细胞和方法，所述核酸与这些CDPS-KS核酸中的至少一种具有至少80％、85％、90％、或95％序列同一性。在某些实施方案，本发明提供了使用核酸的细胞和方法，所述核酸编码与这些CDPS-KS酶中的至少一种具有至少80％、85％、90％、或95％序列同一性的多肽。

6.5.5内根-贝壳杉烯氧化酶(KO)

内根-贝壳杉烯氧化酶(EC 1.14.13.78；也称为贝壳杉烯氧化酶)如本发明所述。编码所述这些酶的核酸可用于本发明提供的细胞和方法。在某些实施方案，本发明提供了使用核酸的细胞和方法，所述核酸与这些贝壳杉烯氧化酶核酸中的至少一种具有至少80％、85％、90％、或95％序列同一性。在某些实施方案，本发明提供了使用核酸的细胞和方法，所述核酸编码与这些贝壳杉烯氧化酶中的至少一种具有至少80％、85％、90％、或95％序列同一性的多肽。

6.5.6甜菊醇合酶(KAH)

甜菊醇合酶或异贝壳杉烯酸羟化酶(KAH，EC 1.14.13)催化异贝壳杉烯酸转化为甜菊醇。酶的示例性实例包括甜叶菊(Stevia rebaudiana，登录号ACD93722)，甜叶菊(Stevia rebaudiana，SEQ ID NO：10)，拟南芥(Arabidopsis thaliana，登录号NP_197872)，葡萄(Vitis vinifera，登录号XP_002282091)，和紫花苜蓿(Medicagotrunculata，登录号ABC59076)的那些酶，以及US 2014/0329281A1、US 2014/0357588A1、US2015/0159188和WO 2016/038095A2中示出的那些酶。编码所述这些酶的核酸可用于本发明提供的细胞和方法。在某些实施方案，本发明提供了使用核酸的细胞和方法，所述核酸与这些KAH核酸中的至少一种具有至少80％、85％、90％、或95％序列同一性。在某些实施方案，本发明提供了使用核酸的细胞和方法，所述核酸编码与这些KAH酶中的至少一种具有至少80％、85％、90％、或95％序列同一性的多肽。

6.5.7细胞色素P450还原酶(CPR)

细胞色素P450还原酶(EC 1.6.2.4)能够帮助或促进上述KO和/或KAH的活性。酶的示例性实例包括甜叶菊(Stevia rebaudiana，登录号ABB88839)，拟南芥(Arabidopsisthaliana，登录号NP_194183)，藤仓赤霉(Gibberellafujikuroi，登录号CAE09055)，青蒿(Artemisia annua，登录号ABC47946.1)的那些酶，以及US 2014/0329281A1、US 2014/0357588A1、US 2015/0159188和WO 2016/038095A2中示出的那些酶。编码所述这些酶的核酸可用于本发明提供的细胞和方法。在某些实施方案，本发明提供了使用核酸的细胞和方法，所述核酸与这些CPR核酸中的至少一种具有至少80％、85％、90％、或95％序列同一性。在某些实施方案，本发明提供了使用核酸的细胞和方法，所述核酸编码与这些CPR酶中的至少一种具有至少80％、85％、90％、或95％序列同一性的多肽。

6.5.8UDP糖基转移酶74G1(UGT74G1)

UGT74G1能够作为尿苷5'-二磷酸葡糖基：甜菊醇19-COOH转移酶起作用和作为尿苷5'-二磷酸葡糖基：甜菊醇-13-O-葡糖苷19-COOH转移酶起作用。如图2所示，UGT74G1能够将甜菊醇转化为19-糖苷。UGT74G1还能够将甜菊单糖苷转化为甜茶苷。UGT74G1还可将甜菊双糖苷转化为甜菊苷。酶的示例性实例包括甜叶菊(Stevia rebaudiana)的那些酶(例如，Richman etal.,2005,PlantJ.41:56-67和US 2014/0329281和WO 2016/038095A2以及登录号AAR06920.1描述的那些)。编码所述这些酶的核酸可用于本发明提供的细胞和方法。在某些实施方案，本发明提供了使用核酸的细胞和方法，所述核酸与这些UGT74G1核酸中的至少一种具有至少80％、85％、90％、或95％序列同一性。在某些实施方案，本发明提供了使用核酸的细胞和方法，所述核酸编码与这些UGT74G1酶中的至少一种具有至少80％、85％、90％、或95％序列同一性的多肽。

6.5.9UDP糖基转移酶76G1(UGT76G1)

UGT76G1能够将葡萄糖基团部分转移至受体分子(即甜菊醇1,2-糖苷)的C-13-O-葡萄糖的C-3'处。因此，UGT76G1能够作为尿苷5'-二磷酸葡萄糖基：甜菊醇13-O-1,2葡萄糖苷C-3'葡萄糖基转移酶起作用和作为尿苷5'-二磷酸葡萄糖基：甜菊醇-19-O-葡萄糖、13-O-1,2双糖苷C-3'葡萄糖基转移酶起作用。如图2所示，UGT76G1能够将甜菊双糖苷转化为RebB。UGT76G1还能够将甜菊苷转化为RebA。UGT76G1还能够将RebD转换为RebM。酶的示例性实例包括甜叶菊(Stevia rebaudiana)的那些酶(例如，Richman etal.,2005,PlantJ.41:56-67和US 2014/0329281A1和WO 2016/038095A2以及登录号AAR06912.1描述的那些)。编码所述这些酶的核酸可用于本发明提供的细胞和方法。在某些实施方案，本发明提供了使用核酸的细胞和方法，所述核酸与这些UGT76G1核酸中的至少一种具有至少80％、85％、90％、或95％序列同一性。在某些实施方案，本发明提供了使用核酸的细胞和方法，所述核酸编码与这些UGT76G1酶中的至少一种具有至少80％、85％、90％、或95％序列同一性的多肽。

6.5.10UDP糖基转移酶85C2(UGT85C2)

UGT85C2能够作为尿苷5'-二磷酸葡糖基：甜菊醇13-OH转移酶起作用和作为尿苷5'-二磷酸葡糖基：甜菊醇-19-O-葡糖苷13-OH转移酶起作用。因此，如图2所示，UGT85C2能够将甜菊醇转化为甜菊单糖苷，并还能够将19-糖苷转化为甜茶苷。酶的示例性实例包括甜叶菊(Stevia rebaudiana)的那些酶(例如Richman etal.,2005,PlantJ.41:56-67和US2014/0329281A1、WO 2016/038095A2以及登录号AAR06916.1描述的那些)。编码所述这些酶的核酸可用于本发明提供的细胞和方法。在某些实施方案，本发明提供了使用核酸的细胞和方法，所述核酸与这些UGT85C2核酸中的至少一种具有至少80％、85％、90％、或95％序列同一性。在一些实施方案，本发明提供了使用核酸的细胞和方法，所述核酸编码与这些UGT85C2酶中的至少一种具有至少80％、85％、90％、或95％序列同一性的多肽。

6.5.11UDP-糖基转移酶91D(UGT91D)

UGT91D能够作为尿苷5'-二磷酸葡糖基：甜菊醇-13-O-葡糖苷转移酶起作用，将葡萄糖基团部分转移至受体分子(甜菊醇-13-O-葡萄糖苷(甜菊单糖苷))的13-O-葡萄糖的C-2'处，以生成甜菊双糖苷。UGT91D还能够作为尿苷5'-二磷酸葡糖基：甜茶苷转移酶起作用，将葡萄糖基团部分转移至受体分子(甜茶苷)的13-O-葡萄糖的C-2'处，以提供甜菊苷，如图2所示。UGT91D也称为UGT91D2、UGT91D2e或UGT91D-like3。UGT91D酶的示例性实例包括甜叶菊(Stevia rebaudiana)的那些酶(例如，UGT序列的登录号为ACE87855.1，以及US2014/0329281A1，WO2016/038095A2和SEQ ID NO：7描述的那些)。编码所述这些酶的核酸可用于本发明提供的细胞和方法。在某些实施方案，本发明提供了使用核酸的细胞和方法，所述核酸与这些UGT91D核酸中的至少一种具有至少80％、85％、90％、或95％序列同一性。在某些实施方案，本发明提供了使用核酸的细胞和方法，所述核酸编码与这些UGT91D酶中的至少一种具有至少80％、85％、90％、或95％序列同一性的多肽。

6.5.12能够将RebA转化为RebD的尿苷二磷酸依赖性糖基转移酶(UGT_AD)

尿苷二磷酸依赖性糖基转移酶(UGT_AD)能够将葡萄糖基团部分转移至RebA的19-O-葡萄糖的C-2’位置以生成RebD，如图2所示。UGT_AD还能够将葡萄糖基团部分转移至甜菊苷(stevioside)的19-O-葡萄糖的C-2’位置以生成RebE。UGT有用的实例包括来自稻(Oryzasativa)的Os_UGT_91C1(在Houghton-Larsen等人的专利申请WO 2013/022989A2中也称为EUGT11；XP_015629141.1)，以及来自番茄(Solanum lycopersicum)的Sl_UGT_101249881(在Markosyan等人的专利申请WO2014/193888A1中也称为UGTSL2；XP_004250485.1)。有用的UGT还包括UGT40087(XP_004982059.1)，sr.UGT_9252778(SEQ ID NO:16)，Bd_UGT10840(XP_003560669.1)，Hv_UGT_V1(BAJ94055.1)，Bd_UGT10850(XP_010230871.1)，和Ob_UGT91B1_like(XP_006650455.1)。任何UGT或UGT变体均可用于本发明所述的组合物和方法。编码所述这些酶的核酸可用于本发明提供的细胞和方法。在某些实施方案，本发明提供了使用核酸的细胞和方法，所述核酸与UGT中的至少一种具有至少80％、85％、90％、或95％序列同一性。在某些实施方案，本发明提供了使用核酸的细胞和方法，所述核酸编码与所述这些UGT中的至少一种具有至少80％、85％、90％、或95％序列同一性的多肽。在某些实施方案，本发明提供了编码本发明所述的UGT变体的核酸。

在某些实施方案，所述经遗传修饰的宿主细胞包含编码UDP-糖基转移酶的异源核酸，所述UDP-糖基转移酶包含与UGT40087的序列(例如，SEQ ID NO：17或SEQ ID NO：18)具有至少80％、85％、90％、或95％序列同一性的氨基酸序列。在某些实施方案，所述经遗传修饰的宿主细胞能够以大于90％、95％、96％、或97％的效率将RebA转化为RebD。在某些实施方案，所述经遗传修饰的宿主细胞包含UDP-糖基转移酶，所述UDP-糖基转移酶包含糖受体结构域，其中所述糖受体结构域的所述氨基酸序列与SEQ ID NO：17或SEQ ID NO：18的所述糖受体结构域的所述氨基酸序列具有至少84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、或99％序列同一性。在某些实施方案，所述经遗传修饰的宿主细胞包含UDP-糖基转移酶，所述UDP-糖基转移酶包含loop1氨基酸序列，变体loop1氨基酸序列，loop2氨基酸序列，变体loop2氨基酸序列，loop3_1氨基酸序列，变体loop3_1氨基酸序列，loop3_2氨基酸序列，变体loop3_2氨基酸序列，loop4_1氨基酸序列，变体loop4_1氨基酸序列，loop4_2氨基酸序列，或其任何组合。在某些实施方案，所述经遗传修饰的宿主细胞包含UDP-糖基转移酶，所述UDP-糖基转移酶包含与SEQ ID NO：17或SEQID NO：18的糖受体结构域具有至少61％、65％、70％、75％、80％、85％、90％、或95％序列同一性的氨基酸序列，并进一步包含SEQ ID NO：17或SEQ ID NO：18的loop4_1氨基酸序列。

本发明使用的术语“变体loop1”氨基酸序列是指与SEQ ID NO：17或SEQ ID NO：18的参考loop1氨基酸序列(或具有SEQ ID NO：28的所述序列的UGT40087的经修饰的loop1序列)相差1、2、3、4、5、6、7、8、9或10个氨基酸插入、缺失、突变和/或置换的氨基酸序列，但允许包含变体loop1氨基酸序列的UDP-糖基转移酶，插入分别对应于SEQ ID NO：17或SEQ IDNO：18的loop1氨基酸序列位置的位置处，以催化RebA向RebD转化、和/或甜菊苷向RebE转化。

本发明使用的术语“变体loop2”氨基酸序列是指与SEQ ID NO：17或SEQ ID NO：18的参考loop2氨基酸序列相差1、2、3、4、5、6、7、8、9或10个氨基酸插入、缺失、突变和/或置换的氨基酸序列，但允许包含变体loop2氨基酸序列的UDP-糖基转移酶，插入分别对应于SEQID NO：17或SEQ ID NO：18的loop2氨基酸序列位置的位置处，以催化RebA向RebD转化、和/或甜菊苷向RebE转化。

本发明使用的术语“变体loop3_1”氨基酸序列是指与SEQ ID NO：17或SEQ ID NO：18的参考loop3_1氨基酸序列相差1、2、3、4、5、6、7、8、9或10个氨基酸插入、缺失、突变和/或置换的氨基酸序列，但允许包含变体loop3_1氨基酸序列的UDP-糖基转移酶，插入分别对应于SEQ ID NO：17或SEQ ID NO：18的loop3_1氨基酸序列位置的位置处，以催化RebA向RebD转化、和/或甜菊苷向RebE转化。本发明使用的术语“变体loop3_2”氨基酸序列是指与SEQID NO：17或SEQ ID NO：18的参考loop3_2氨基酸序列相差1、2、3、4、5、6、7、8、9或10个氨基酸插入、缺失、突变和/或置换的氨基酸序列，但允许包含变体loop3_2氨基酸序列的UDP-糖基转移酶，插入分别对应于SEQ ID NO：17或SEQ ID NO：18的loop3_2氨基酸序列位置的位置处，以催化RebA向RebD转化、和/或甜菊苷向RebE转化。在某些实施方案，变体loop3_2氨基酸序列与所述参考loop3_2氨基酸序列相差1、2、3、4、5、6、7、8、9、10个、或多达30个氨基酸插入、缺失、突变和/或置换。

本发明使用的术语“变体loop4_1”氨基酸序列是指与SEQ ID NO：17或SEQ ID NO：18的参考loop4_1氨基酸序列相差1、2、3、4、5、6、7、8、9、10个、或多达30个氨基酸插入、缺失、突变和/或置换的氨基酸序列，但允许包含变体loop4_1氨基酸序列的UDP-糖基转移酶，插入对应于SEQ ID NO：17或SEQ ID NO：18的loop4_1氨基酸序列位置的位置处，以催化RebA向RebD转化、和/或甜菊苷向RebE转化。

在某些实施方案，所述宿主细胞包含UGT40087的功能结构域，其中所述UGT40087包含SEQ ID NO：17或SEQ ID NO：18的氨基酸序列。在某些实施方案，所述宿主细胞包含多肽，所述多肽包含UGT40087的N-末端糖受体结构域，所述UGT40087包含SEQ ID NO：17或SEQID NO：18的氨基酸序列。在某些实施方案，所述宿主细胞包含多肽，所述多肽包含UGT40087的C-末端糖受体结构域，所述UGT40087包含SEQ ID NO：17或SEQ ID NO：18的氨基酸序列。在某些实施方案，UGT40087的所述糖受体结构域包含SEQ ID NO：18的约1至214位氨基酸位置(其对应于SEQ ID NO：17的氨基酸位置1至215)。在某些实施方案，UGT40087的所述糖供体结构域包含SEQ ID NO：18的约215至435位氨基酸位置(其对应于SEQ ID NO：17的氨基酸位置216至436)。在某些实施方案，UGT40087的所述糖受体结构域包含SEQ ID NO：17的约1至215位氨基酸位置。在某些实施方案，UGT40087的所述糖供体结构域包含SEQ ID NO：17的约216至436位氨基酸位置。在某些实施方案，相对于SEQ ID NO：18，UGT40087的所述糖受体结构域和所述糖供体结构域分别包含比1至214或215至435更窄的氨基酸残基范围。在某些实施方案，相对于SEQ ID NO：17，UGT40087的所述糖受体结构域和所述糖供体结构域分别包含比1至215或216至436更窄的氨基酸残基范围。

在某些实施方案，所述宿主细胞包含多肽，所述多肽包含与SEQ ID NO：17或SEQID NO：18的N-末端糖受体结构域的氨基酸序列基本上相同的氨基酸序列。在某些实施方案，所述宿主细胞包含多肽，所述多肽包含与SEQ ID NO：17或SEQ ID NO：18的N-末端糖受体结构域的氨基酸序列具有至少60％同一性的氨基酸序列。在某些实施方案，所述宿主细胞包含多肽，所述多肽包含与SEQ ID NO：17或SEQ ID NO：18的N-末端糖受体结构域的氨基酸序列具有至少65％同一性的氨基酸序列。在某些实施方案，所述宿主细胞包含多肽，所述多肽包含与SEQ ID NO：17或SEQ ID NO：18的N-末端糖受体结构域的氨基酸序列具有至少70％同一性的氨基酸序列。在某些实施方案，所述宿主细胞包含多肽，所述多肽包含与SEQID NO：17或SEQ ID NO：18的N-末端糖受体结构域的氨基酸序列具有至少75％同一性的氨基酸序列。在某些实施方案，所述宿主细胞包含多肽，所述多肽包含与SEQ ID NO：17或SEQID NO：18的N-末端糖受体结构域的氨基酸序列具有至少80％同一性的氨基酸序列。在某些实施方案，所述宿主细胞包含多肽，所述多肽包含与SEQ ID NO：17或SEQ ID NO：18的N-末端糖受体结构域的氨基酸序列具有至少85％同一性的氨基酸序列。在某些实施方案，所述宿主细胞包含多肽，所述多肽包含与SEQ ID NO：17或SEQ ID NO：18的N-末端糖受体结构域的氨基酸序列具有至少90％同一性的氨基酸序列。在某些实施方案，所述宿主细胞包含多肽，所述多肽包含与SEQ ID NO：17或SEQ ID NO：18的N-末端糖受体结构域的氨基酸序列具有至少95％同一性的氨基酸序列。在某些实施方案，所述宿主细胞包含多肽，所述多肽包含与SEQ ID NO：17或SEQ ID NO：18的N-末端糖受体结构域的氨基酸序列具有至少96％同一性的氨基酸序列。在某些实施方案，所述宿主细胞包含多肽，所述多肽包含与SEQ ID NO：17或SEQ ID NO：18的N-末端糖受体结构域的氨基酸序列具有至少97％同一性的氨基酸序列。在某些实施方案，所述宿主细胞包含多肽，所述多肽包含与SEQ ID NO：17或SEQ ID NO：18的N-末端糖受体结构域的氨基酸序列具有至少98％同一性的氨基酸序列。在某些实施方案，所述宿主细胞包含多肽，所述多肽包含与SEQ ID NO：17或SEQ ID NO：18的N-末端糖受体结构域的氨基酸序列具有至少99％同一性的氨基酸序列。在某些实施方案，本发明提供了包含多肽的宿主细胞，所述多肽包含与SEQ ID NO：17或SEQ ID NO：18的N-末端糖受体结构域的氨基酸序列具有至少60％，至少99％，或60％和99％之间的任何百分比同一性的氨基酸序列。

在某些实施方案，所述宿主细胞包含编码UGT40087的核酸，所述UGT40087包含SEQID NO：17或SEQ ID NO：18的N-末端糖受体结构域的氨基酸序列。在某些实施方案，所述宿主细胞包含编码多肽的核酸，所述多肽包含与SEQ ID NO：17或SEQ ID NO：18的N-末端糖受体结构域的氨基酸序列基本上相同的氨基酸序列。在某些实施方案，所述宿主细胞包含编码多肽的核酸，所述多肽包含与SEQ ID NO：17或SEQ ID NO：18的N-末端糖受体结构域的氨基酸序列具有至少60％同一性的氨基酸序列。在某些实施方案，所述宿主细胞包含编码多肽的核酸，所述多肽包含与SEQ ID NO：17或SEQ ID NO：18的N-末端糖受体结构域的氨基酸序列具有至少65％同一性的氨基酸序列。在某些实施方案，所述宿主细胞包含编码多肽的核酸，所述多肽包含与SEQ ID NO：17或SEQ ID NO：18的N-末端糖受体结构域的氨基酸序列具有至少70％同一性的氨基酸序列。在某些实施方案，所述宿主细胞包含编码多肽的核酸，所述多肽包含与SEQ ID NO：17或SEQ ID NO：18的N-末端糖受体结构域的氨基酸序列具有至少75％同一性的氨基酸序列。在某些实施方案，所述宿主细胞包含编码多肽的核酸，所述多肽包含与SEQ ID NO：17或SEQ ID NO：18的N-末端糖受体结构域的氨基酸序列具有至少80％同一性的氨基酸序列。在某些实施方案，所述宿主细胞包含编码多肽的核酸，所述多肽包含与SEQ ID NO：17或SEQ ID NO：18的N-末端糖受体结构域的氨基酸序列具有至少85％同一性的氨基酸序列。在某些实施方案，所述宿主细胞包含编码多肽的核酸，所述多肽包含与SEQ ID NO：17或SEQ ID NO：18的N-末端糖受体结构域的氨基酸序列具有至少90％同一性的氨基酸序列。在某些实施方案，所述宿主细胞包含编码多肽的核酸，所述多肽包含与SEQ ID NO：17或SEQ ID NO：18的N-末端糖受体结构域的氨基酸序列具有至少95％同一性的氨基酸序列。在某些实施方案，所述宿主细胞包含编码多肽的核酸，所述多肽包含与SEQID NO：17或SEQ ID NO：18的N-末端糖受体结构域的氨基酸序列具有至少96％同一性的氨基酸序列。在某些实施方案，所述宿主细胞包含编码多肽的核酸，所述多肽包含与SEQ IDNO：17或SEQ ID NO：18的N-末端糖受体结构域的氨基酸序列具有至少97％同一性的氨基酸序列。在某些实施方案，所述宿主细胞包含编码多肽的核酸，所述多肽包含与SEQ ID NO：17或SEQ ID NO：18的N-末端糖受体结构域的氨基酸序列具有至少98％同一性的氨基酸序列。在某些实施方案，所述宿主细胞包含编码多肽的核酸，所述多肽包含与SEQ ID NO：17或SEQID NO：18的N-末端糖受体结构域的氨基酸序列具有至少99％同一性的氨基酸序列。

在某些实施方案，当比较和分析UGT40087和另一UDP-糖基转移酶的三维模型结构时，它们揭示了在N-末端糖受体结构域具有显著构象差异的四个环路(loop)(即，loop1、loop2、loop3和loop4)。来自所述两个UGT之间相应环路(loop)序列交换的实验结果表明UGT40087的loop1、loop2、loop3_1、loop3_2和loop4_1可以与其各自、来自其他UDP-糖基转移酶的相应环路(loop)序列进行置换，所述其他UDP-糖基转移酶能够将RebA转化为RebD。在所述这些实施方案中，设计了两个版本的loop3(即，loop3_1和loop3_2)和loop4(即，loop4_1和loop4_2)来考虑两个可能的环路(loop)长度。

因此，在某些实施方案，所述宿主细胞包含UDP-糖基转移酶，所述UDP-糖基转移酶包含与SEQ ID NO：17或SEQ ID NO：18的N-末端糖受体结构域的氨基酸序列具有至少84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、或99％同一性的氨基酸序列。在某些实施方案，所述宿主细胞包含编码UDP-糖基转移酶的异源核酸，所述UDP-糖基转移酶包含与SEQ ID NO：17或SEQ ID NO：18的N-末端糖受体结构域的氨基酸序列具有至少84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、或99％同一性的氨基酸序列。在某些实施方案，所述UDP-糖基转移酶在分别对应于SEQ ID NO：17或SEQ ID NO：18的所述loop1位置的所述UDP-糖基转移酶的位置处还包含UGT40087(即，SEQ ID NO：17或SEQ ID NO：18)的loop1氨基酸序列。在某些实施方案，SEQ ID NO：17或SEQ ID NO：18的所述loop1氨基酸序列具有SEQ ID NO：30的氨基酸序列。在某些实施方案，所述loop1氨基酸序列具有SEQ ID NO：28的序列。在某些实施方案，所述UDP-糖基转移酶在分别对应于SEQ ID NO：17或SEQ ID NO：18的所述loop1位置的所述UDP-糖基转移酶的位置处还包含变体loop1氨基酸序列。所述变体loop1氨基酸序列是指与SEQ ID NO：17或SEQ ID NO：18的所述参考loop1氨基酸序列或具有SEQ ID NO：28的所述loop1氨基酸序列不同的氨基酸序列，但允许包含所述变体loop1氨基酸的所述UDP-糖基转移酶保留其将RebA转化为RebD和/或将甜菊苷转化为RebE的活性。

在某些实施方案，所述UDP-糖基转移酶在分别对应于SEQ ID NO：17或SEQ ID NO：18的所述loop2位置的所述UDP-糖基转移酶的位置处还包含UGT40087(即，SEQ ID NO：17或SEQ ID NO：18)的loop2氨基酸序列。在某些实施方案，SEQ ID NO：17或SEQ ID NO：18的所述loop2氨基酸序列具有SEQ ID NO：24的氨基酸序列。在某些实施方案，所述UDP-糖基转移酶在分别对应于SEQ ID NO：17或SEQ ID NO：18的所述loop2位置的所述UDP-糖基转移酶的位置处还包含变体loop2氨基酸序列。所述变体loop2氨基酸序列是指与SEQ ID NO：17或SEQ ID NO：18的所述参考loop2氨基酸序列不同的氨基酸序列，但允许包含所述变体loop2氨基酸的所述UDP-糖基转移酶保留其将RebA转化为RebD和/或将甜菊苷转化为RebE的活性。

在某些实施方案，所述UDP-糖基转移酶在分别对应于SEQ ID NO：17或SEQ ID NO：18的所述loop3_1位置的所述UDP-糖基转移酶的位置处还包含UGT40087(即，SEQ ID NO：17或SEQ ID NO：18)的loop3_1氨基酸序列。在某些实施方案，SEQ ID NO：17或SEQ ID NO：18的所述loop3_1氨基酸序列具有SEQ ID NO：25的氨基酸序列。在某些实施方案，所述UDP-糖基转移酶在分别对应于SEQ ID NO：17或SEQ ID NO：18的所述loop3_1位置的所述UDP-糖基转移酶的位置处还包含变体loop3_1氨基酸序列。所述变体loop3_1氨基酸序列是指与SEQID NO：17或SEQ ID NO：18的所述参考loop3_1氨基酸序列不同的氨基酸序列，但允许包含所述变体loop3_1氨基酸的所述UDP-糖基转移酶保留其将RebA转化为RebD和/或将甜菊苷转化为RebE的活性。

在某些实施方案，所述UDP-糖基转移酶在分别对应于SEQ ID NO：17或SEQ ID NO：18的所述loop3_2位置的所述UDP-糖基转移酶的位置处还包含UGT40087(即，SEQ ID NO：17或SEQ ID NO：18)的loop3_2氨基酸序列。在某些实施方案，SEQ ID NO：17或SEQ ID NO：18的所述loop3_2氨基酸序列具有SEQ ID NO：26的氨基酸序列。在某些实施方案，所述UDP-糖基转移酶在分别对应于SEQ ID NO：17或SEQ ID NO：18的所述loop3_2位置的所述UDP-糖基转移酶的位置处还包含变体loop3_2氨基酸序列。所述变体loop3_2氨基酸序列是指与SEQID NO：17或SEQ ID NO：18的所述参考loop3_2氨基酸序列不同的氨基酸序列，但允许包含所述变体loop3_2氨基酸的所述UDP-糖基转移酶保留其将RebA转化为RebD和/或将甜菊苷转化为RebE的活性。

在某些实施方案，所述UDP-糖基转移酶在分别对应于SEQ ID NO：17或SEQ ID NO：18的所述loop4_1位置的所述UDP-糖基转移酶的位置处还包含UGT40087(即，SEQ ID NO：17或SEQ ID NO：18)的loop4_1氨基酸序列。在某些实施方案，SEQ ID NO：17或SEQ ID NO：18的所述loop4_1氨基酸序列具有SEQ ID NO：27的氨基酸序列。在某些实施方案，所述UDP-糖基转移酶在分别对应于SEQ ID NO：17或SEQ ID NO：18的所述loop4_1位置的所述UDP-糖基转移酶的位置处还包含变体loop4_1氨基酸序列。所述变体loop4_1氨基酸序列是指与SEQID NO：17或SEQ ID NO：18的所述参考loop4_1氨基酸序列不同的氨基酸序列，但允许包含所述变体loop4_1氨基酸的所述UDP-糖基转移酶保留其将RebA转化为RebD和/或将甜菊苷转化为RebE的活性。

在某些实施方案，所述UDP-糖基转移酶在分别对应于SEQ ID NO：17或SEQ ID NO：18的所述loop4_2位置的所述UDP-糖基转移酶的位置处还包含UGT40087(即，SEQ ID NO：17或SEQ ID NO：18)的loop4_2氨基酸序列。SEQ ID NO：17或SEQ ID NO：18的所述loop4_2氨基酸序列具有SEQ ID NO：28的氨基酸序列。

在某些实施方案，所述宿主细胞包含UDP-糖基转移酶，所述UDP-糖基转移酶包含与SEQ ID NO：17或SEQ ID NO：18的N-末端糖受体结构域的氨基酸序列具有至少84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、或99％同一性的氨基酸序列，或包含编码其UDP-糖基转移酶的异源核酸，和进一步包含以下的任何组合：

(a)位于分别对应于SEQ ID NO：17或SEQ ID NO：18的所述loop1位置的所述UDP-糖基转移酶的位置处的SEQ ID NO：17或SEQ ID NO：18的所述loop1氨基酸序列、SEQ ID NO：30的序列、或变体loop1氨基酸序列；

(b)位于分别对应于SEQ ID NO：17或SEQ ID NO：18的所述loop2位置的所述UDP-糖基转移酶的位置处的SEQ ID NO：17或SEQ ID NO：18的所述loop2氨基酸序列、或变体loop2氨基酸序列；

(c)位于分别对应于SEQ ID NO：17或SEQ ID NO：18的所述loop 3_1位置的所述UDP-糖基转移酶的位置处的SEQ ID NO：17或SEQ ID NO：18的所述loop3_1氨基酸序列、或变体loop3_1氨基酸序列；

(d)位于分别对应于SEQ ID NO：17或SEQ ID NO：18的所述loop3_2位置的所述UDP-糖基转移酶的位置处的SEQ ID NO：17或SEQ ID NO：18的所述loop3_2氨基酸序列、或变体loop3_2氨基酸序列；

(e)位于分别对应于SEQ ID NO：17或SEQ ID NO：18的所述loop4_1位置的所述UDP-糖基转移酶的位置处的SEQ ID NO：17或SEQ ID NO：18的所述loop4_1氨基酸序列、或变体loop4_1氨基酸序列；和

(f)位于分别对应于SEQ ID NO：17或SEQ ID NO：18的所述loop4_2位置的所述UDP-糖基转移酶的位置处的SEQ ID NO：17或SEQ ID NO：18的所述loop4_2氨基酸序列。

在某些实施方案，当比较和分析能够将RebA转化为RebD的UDP-糖基转移酶的三维模型结构时，发现UGT40087的loop4_1，当掺入另一UDP-糖基转移酶的相应loop4_1位置(和置换其天然loop4_1氨基酸序列)时，导致变体UDP-糖基转移酶在其将RebA转化为RebD的能力方面具有优异活性。参见实施例12。所述这些结果表明，任何合适的UDP-糖基转移酶的所述loop4_1氨基酸序列可用SEQ ID NO：17或SEQ ID NO：18的所述loop4_1氨基酸序列置换，从而将RebA转化为RebD。

因此，在某些实施方案，所述宿主细胞包含UDP-糖基转移酶，所述UDP-糖基转移酶包含与SEQ ID NO：17或SEQ ID NO：18的所述N-末端糖受体结构域的所述氨基酸序列具有至少61％、65％、70％、75％、80％、85％、90％、或95％同一性的氨基酸序列，和进一步包含UGT40087(即，SEQ ID NO：17或SEQ ID NO：18)的所述loop4_1氨基酸序列(即，SEQ ID NO：27)。在某些实施方案，所述宿主细胞包含编码UDP-糖基转移酶的异源核酸，所述UDP-糖基转移酶包含与SEQ ID NO：17或SEQ ID NO：18的所述N-末端糖受体结构域的所述氨基酸序列具有至少61％、65％、70％、75％、80％、85％、90％、或95％同一性的氨基酸序列，和进一步包含SEQ ID NO：17或SEQ ID NO：18的所述loop4_1氨基酸序列(即，SEQ ID NO：27)。在某些实施方案中，包含与SEQ ID NO：17或SEQ ID NO：18具有至少50％、55％、60％、65％、70％、75％、80％、85％、90％、或95％同一性的氨基酸序列的任何合适的UDP-糖基转移酶可用于将来自SEQ ID NO：17或SEQ ID NO：18的所述loop4_1氨基酸序列整合到其相应的loop4_1位置(置换其天然loop4_1氨基酸序列)。譬如，Ob_UGT91B_like、Hv_UGT_V1、Sl_UGT_101249881、Sr.UGT_g252778、Os_UGT_91C1、Bd_UGT10840、Bd_UGT10850、或Si91Dlike可用作碱基以将来自SEQ ID NO：17或SEQ ID NO：18的所述loop4_1氨基酸序列整合在其相应的loop4_1位置。在某些实施方案，所述UDP-糖基转移酶包含SEQ ID NO：33的氨基酸序列。

在某些实施方案，所述宿主细胞包含多肽，所述多肽包含与SEQ ID NO：17或SEQID NO：18的C-末端糖供体结构域的氨基酸序列基本上相同的氨基酸序列。在某些实施方案，所述宿主细胞包含多肽，所述多肽包含与SEQ ID NO：17或SEQ ID NO：18的所述C-末端糖供体结构域的所述氨基酸序列具有至少60％同一性的氨基酸序列。在某些实施方案，所述宿主细胞包含多肽，所述多肽包含与SEQ ID NO：17或SEQ ID NO：18的所述C-末端糖供体结构域的所述氨基酸序列具有至少65％同一性的氨基酸序列。在某些实施方案，所述宿主细胞包含多肽，所述多肽包含与SEQ ID NO：17或SEQ ID NO：18的所述C-末端糖供体结构域的所述氨基酸序列具有至少70％同一性的氨基酸序列。在某些实施方案，所述宿主细胞包含多肽，所述多肽包含与SEQ ID NO：17或SEQ ID NO：18的所述C-末端糖供体结构域的所述氨基酸序列具有至少75％同一性的氨基酸序列。在某些实施方案，所述宿主细胞包含多肽，所述多肽包含与SEQ ID NO：17或SEQ ID NO：18的所述C-末端糖供体结构域的所述氨基酸序列具有至少80％同一性的氨基酸序列。在某些实施方案，所述宿主细胞包含多肽，所述多肽包含与SEQ ID NO：17或SEQ ID NO：18的所述C-末端糖供体结构域的所述氨基酸序列具有至少85％同一性的氨基酸序列。在某些实施方案，所述宿主细胞包含多肽，所述多肽包含与SEQ ID NO：17或SEQ ID NO：18的所述C-末端糖供体结构域的所述氨基酸序列具有至少90％同一性的氨基酸序列。在某些实施方案，所述宿主细胞包含多肽，所述多肽包含与SEQID NO：17或SEQ ID NO：18的所述C-末端糖供体结构域的所述氨基酸序列具有至少95％同一性的氨基酸序列。在某些实施方案，所述宿主细胞包含多肽，所述多肽包含与SEQ ID NO：17或SEQ ID NO：18的所述C-末端糖供体结构域的所述氨基酸序列具有至少96％同一性的氨基酸序列。在某些实施方案，所述宿主细胞包含多肽，所述多肽包含与SEQ ID NO：17或SEQ ID NO：18的所述C-末端糖供体结构域的所述氨基酸序列具有至少97％同一性的氨基酸序列。在某些实施方案，所述宿主细胞包含多肽，所述多肽包含与SEQ ID NO：17或SEQ IDNO：18的所述C-末端糖供体结构域的所述氨基酸序列具有至少98％同一性的氨基酸序列。在某些实施方案，所述宿主细胞包含多肽，所述多肽包含与SEQ ID NO：17或SEQ ID NO：18的所述C-末端糖供体结构域的所述氨基酸序列具有至少99％同一性的氨基酸序列。

在某些实施方案，所述宿主细胞包含编码UGT40087的核酸，所述UGT40087包含SEQID NO：17或SEQ ID NO：18的所述C-末端糖供体结构域的所述氨基酸序列。在某些实施方案，所述宿主细胞包含编码多肽的核酸，所述多肽包含与SEQ ID NO：17或SEQ ID NO：18的所述C-末端糖供体结构域的所述氨基酸序列基本上相同的氨基酸序列。在某些实施方案，所述宿主细胞包含编码多肽的核酸，所述多肽包含与SEQ ID NO：17或SEQ ID NO：18的所述C-末端糖供体结构域的氨基酸序列具有至少60％同一性的氨基酸序列。在某些实施方案，所述宿主细胞包含编码多肽的核酸，所述多肽包含与SEQ ID NO：17或SEQ ID NO：18的所述C-末端糖供体结构域的氨基酸序列具有至少65％同一性的氨基酸序列。在某些实施方案，所述宿主细胞包含编码多肽的核酸，所述多肽包含与SEQ ID NO：17或SEQ ID NO：18的所述C-末端糖供体结构域的氨基酸序列具有至少70％同一性的氨基酸序列。在某些实施方案，所述宿主细胞包含编码多肽的核酸，所述多肽包含与SEQ ID NO：17或SEQ ID NO：18的所述C-末端糖供体结构域的氨基酸序列具有至少75％同一性的氨基酸序列。在某些实施方案，所述宿主细胞包含编码多肽的核酸，所述多肽包含与SEQ ID NO：17或SEQ ID NO：18的所述C-末端糖供体结构域的氨基酸序列具有至少80％同一性的氨基酸序列。在某些实施方案，所述宿主细胞包含编码多肽的核酸，所述多肽包含与SEQ ID NO：17或SEQ ID NO：18的所述C-末端糖供体结构域的氨基酸序列具有至少85％同一性的氨基酸序列。在某些实施方案，所述宿主细胞包含编码多肽的核酸，所述多肽包含与SEQ ID NO：17或SEQ ID NO：18的所述C-末端糖供体结构域的氨基酸序列具有至少90％同一性的氨基酸序列。在某些实施方案，所述宿主细胞包含编码多肽的核酸，所述多肽包含与SEQ ID NO：17或SEQ ID NO：18的所述C-末端糖供体结构域的氨基酸序列具有至少95％同一性的氨基酸序列。在某些实施方案，所述宿主细胞包含编码多肽的核酸，所述多肽包含与SEQ ID NO：17或SEQ ID NO：18的所述C-末端糖供体结构域的氨基酸序列具有至少96％同一性的氨基酸序列。在某些实施方案，所述宿主细胞包含编码多肽的核酸，所述多肽包含与SEQ ID NO：17或SEQ ID NO：18的所述C-末端糖供体结构域的氨基酸序列具有至少97％同一性的氨基酸序列。在某些实施方案，所述宿主细胞包含编码多肽的核酸，所述多肽包含与SEQ ID NO：17或SEQ ID NO：18的所述C-末端糖供体结构域的氨基酸序列具有至少98％同一性的氨基酸序列。在某些实施方案，所述宿主细胞包含编码多肽的核酸，所述多肽包含与SEQ ID NO：17或SEQ ID NO：18的所述C-末端糖供体结构域的氨基酸序列具有至少99％同一性的氨基酸序列。

因此，在某些实施方案，所述宿主细胞包含UDP-糖基转移酶，所述UDP-糖基转移酶包含与SEQ ID NO：17或SEQ ID NO：18的所述C-末端糖供体结构域的所述氨基酸序列具有至少60％、65％、70％、75％、80％、85％、90％、或95％同一性的氨基酸序列。在某些实施方案，所述宿主细胞包含编码UDP-糖基转移酶的异源核酸，所述UDP-糖基转移酶包含与SEQID NO：17或SEQ ID NO：18的所述C-末端糖供体结构域的所述氨基酸序列具有至少60％、65％、70％、75％、80％、85％、90％、或95％同一性的氨基酸序列。在某些实施方案，所述UDP-糖基转移酶还包含来自其他UDP-糖基转移酶的C-末端糖供体结构域。具有合适的C-末端糖供体结构域的其他UDP-糖基转移酶的实例包括Ob_UGT91B_like、Hv_UGT_V1、SI_UGT_101249881、Sr.UGT_g252778、Os_UGT_91C1、Bd_UGT10840、Bd_UGT10850、或Si91Dlike。

在某些实施方案，发现所述N-末端糖受体结构域中的某些氨基酸残基可将非功能性、推定的UDP-糖基转移酶的催化活性恢复为活性UDP-糖基转移酶。因此，所述宿主细胞包含UDP-糖基转移酶，所述UDP-糖基转移酶包含与SEQ ID NO：17或SEQ ID NO：18的所述N-末端糖受体结构域的所述氨基酸序列具有至少60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、或99％同一性的氨基酸序列，和进一步包含一个或多个以下氨基酸残基：

(a)缬氨酸，所述缬氨酸位于对应于SEQ ID NO：18的氨基酸位置11的所述UDP-糖基转移酶的氨基酸位置处；

(b)异亮氨酸，所述异亮氨酸位于对应于SEQ ID NO：18的氨基酸位置12的所述UDP-糖基转移酶的氨基酸位置处；

(c)脯氨酸，所述脯氨酸位于对应于SEQ ID NO：18的氨基酸位置55的所述UDP-糖基转移酶的氨基酸位置处；

(d)谷氨酸，所述谷氨酸位于对应于SEQ ID NO：18的氨基酸位置90的所述UDP-糖基转移酶的氨基酸位置处；

(e)丝氨酸，所述丝氨酸位于对应于SEQ ID NO：18的氨基酸位置203的所述UDP-糖基转移酶的氨基酸位置处；

(f)谷氨酸，所述谷氨酸位于对应于SEQ ID NO：18的氨基酸位置223的所述UDP-糖基转移酶的氨基酸位置处；或

(g)缬氨酸，所述缬氨酸位于对应于SEQ ID NO：18的氨基酸位置413的所述UDP-糖基转移酶的氨基酸位置处，

其中，对应于SEQ ID NO：18的所述氨基酸位置的所述UDP-糖基转移酶的所述氨基酸位置均通过序列比对进行确定。

在某些实施方案，所述宿主细胞包含UDP-糖基转移酶，所述UDP-糖基转移酶包含SEQ ID NO：32的氨基酸序列。

在某些实施方案，所述宿主细胞包含上述UGT40087多肽的变体。在某些实施方案，相对于所述UGT40087多肽，所述变体可包含多达15、10、9、8、7、6、5、4、3、2、或1个氨基酸置换。在某些实施方案，相对于所述UGT40087多肽，所述变体可包含多达15、10、9、8、7、6、5、4、3、2、或1个保守氨基酸置换。在某些实施方案，可针对所述宿主细胞优化本发明所述的任何核酸，例如进行密码子优化。有用的核酸包括SEQ ID NO：35和SEQ ID NO：36。

6.6MEV途径生成FPP和/或GGPP

在一些实施方案中，本发明提供的经遗传修饰的宿主细胞包含MEV途径的一种或多种异源酶，其可用于形成FPP和/或GGPP。参见图1D。在一些实施方案，所述MEV途径的一种或多种酶包含使乙酰-CoA与丙二酰-CoA缩合以形成乙酰乙酰-CoA的酶。在一些实施方案，所述MEV途径的一种或多种酶包含使两分子乙酰-CoA缩合以形成乙酰乙酰-CoA的酶。在一些实施方案，所述MEV途径的一种或多种酶包含使乙酰乙酰-CoA与乙酰-CoA缩合以形成HMG-CoA的酶。在一些实施方案，所述MEV途径的一种或多种酶包含使HMG-CoA转化为甲羟戊酸的酶。在一些实施方案，所述MEV途径的一种或多种酶包含使甲羟戊酸磷酸化为甲羟戊酸5-磷酸的酶。在一些实施方案，所述MEV途径的一种或多种酶包含使甲羟戊酸5-磷酸转化为甲羟戊酸5-焦磷酸的酶。在一些实施方案，所述MEV途径的一种或多种酶包含使甲羟戊酸5-焦磷酸转化为异戊烯焦磷酸的酶。

在一些实施方案，所述MEV途径的一种或多种酶选自由乙酰-CoA硫解酶，乙酰乙酰-CoA合酶，HMG-CoA合酶，HMG-CoA还原酶，甲羟戊酸激酶，磷酸甲羟戊酸激酶和甲羟戊酸焦磷酸脱羧酶组成的组。在一些实施方案，关于能够催化形成乙酰乙酰-CoA的所述MEV途径的酶，所述经遗传修饰的宿主细胞包含使两分子乙酰-CoA缩合以形成乙酰乙酰-CoA的酶，例如乙酰-CoA硫解酶；或者使乙酰-CoA与丙二酰-CoA缩合以形成乙酰乙酰-CoA的酶，例如乙酰乙酰-CoA合酶。在一些实施方案，所述经遗传修饰的宿主细胞包含使两分子乙酰-CoA缩合以形成乙酰乙酰-CoA的酶，例如乙酰-CoA硫解酶；和使乙酰-CoA与丙二酰-CoA缩合以形成乙酰乙酰-CoA的酶，例如乙酰乙酰-CoA合酶。

在一些实施方案，所述宿主细胞包含编码所述MEV途径的一种以上酶的一种或多种异源核苷酸序列。在一些实施方案，所述宿主细胞包含编码所述MEV途径的两种酶的一种或多种异源核苷酸序列。在一些实施方案，所述宿主细胞包含一种或多种异源核苷酸序列，所述异源核苷酸序列编码可将HMG-CoA转化为甲羟戊酸的酶和可将甲羟戊酸转化为甲羟戊酸5-磷酸的酶。在一些实施方案，所述宿主细胞包含编码所述MEV途径的三种酶的一种或多种异源核苷酸序列。在一些实施方案，所述宿主细胞包含编码所述MEV途径的四种酶的一种或多种异源核苷酸序列。在一些实施方案，所述宿主细胞包含编码所述MEV途径的五种酶的一种或多种异源核苷酸序列。在一些实施方案，所述宿主细胞包含编码所述MEV途径的六种酶的一种或多种异源核苷酸序列。在一些实施方案，所述宿主细胞包含编码所述MEV途径的七种酶的一种或多种异源核苷酸序列。在一些实施方案，所述宿主细胞包含编码所述MEV途径的所有酶的多种异源核酸。

在一些实施方案，所述经遗传修饰的宿主细胞还包含编码酶的异源核酸，所述酶可将异戊烯焦磷酸(IPP)转化为二甲基烯丙基焦磷酸(DMAPP)。在一些实施方案，所述经遗传修饰的宿主细胞还包含编码酶的异源核酸，所述酶可使IPP和/或DMAPP分子缩合以形成聚异戊二烯基化合物。在一些实施方案，所述经遗传修饰的宿主细胞还包含编码酶的异源核酸，所述酶可修饰IPP或聚异戊二烯基以形成类异戊二烯化合物，例如FPP。

6.6.1乙酰-CoA转化为乙酰乙酰-CoA

在一些实施方案，所述经遗传修饰的宿主细胞包含编码酶的异源核苷酸序列，所述酶可使两分子的乙酰辅酶A缩合以形成乙酰乙酰-CoA，例如乙酰-CoA硫解酶。编码此种酶的核苷酸序列的示例性实例包括但不限于：(NC_000913REGION：2324131.2325315；大肠杆菌(Escherichia coli))，(D49362；脱氮副球菌(Paracoccus denitrificans))和(L20428；酿酒酵母(Saccharomyces cerevisiae))。

乙酰-CoA硫解酶催化两分子乙酰-CoA的可逆缩合反应以生成乙酰乙酰-CoA，但此反应在热力学上是不利的；乙酰乙酰-CoA硫解作用优于乙酰乙酰-CoA合成。乙酰乙酰-CoA合酶(AACS)(或者称为乙酰-CoA：丙二酰-CoA酰基转移酶；EC 2.3.1.194)使乙酰-CoA与丙二酰-CoA缩合以形成乙酰乙酰-CoA。与乙酰-CoA硫解酶相反，由于丙二酰-CoA的相关脱羧反应，AACS催化的乙酰乙酰-CoA合成基本上是能量有利的反应。此外，AACS对乙酰乙酰-CoA未显示出硫解活性，因此所述反应是不可逆的。

在包含乙酰-CoA硫解酶和异源性ADA和/或磷酸转乙酰酶(PTA)的宿主细胞中，有利于乙酰乙酰-CoA硫解的乙酰-CoA硫解酶催化的可逆反应可导致大的乙酰-CoA库。鉴于ADA的可逆活性，此乙酰-CoA库可反过来驱动ADA朝向将乙酰-CoA转化为乙醛的逆向反应，从而减少了ADA对乙酰-CoA生成提供的益处。类似地，PTA的活性是可逆的，因此，大的乙酰-CoA库可驱使PTA朝向将乙酰-CoA转化为乙酰磷酸的逆向反应。因此，在一些实施方案，为了提供对乙酰-CoA的强拉力以驱动ADA和PTA的正向反应，本发明提供的经遗传修饰的宿主细胞的所述MEV途径利用乙酰乙酰-CoA合酶使乙酰-CoA和丙二酰-CoA形成乙酰乙酰-CoA。

在一些实施方案中，AACS是来自链霉菌属(Streptomyces sp.)菌株CL190(Okamura etal.,Proc NatlAcadSci USA 107(25):11265-70(2010))。链霉菌属(Streptomyces sp.)菌株CL190的代表性AACS核苷酸序列包括登录号AB540131.1。链霉菌属(Streptomyces sp.)菌株CL190的代表性AACS蛋白质序列包括登录号D7URV0、BAJ10048。可用于本发明提供的组合物和方法的其他乙酰乙酰-CoA合酶包括但不限于，链霉菌属(Streptomyces sp.)(AB183750；KO-3988BAD86806)；S.anulatus菌株9663(FN178498；CAX48662)；链霉菌属KO-3988(AB212624；BAE78983)；游动放线菌属(Actinoplanes sp.)A40644(AB113568；BAD07381)；链霉菌属C(NZ_ACEW010000640；ZP_05511702)；达松维尔拟诺卡氏菌(Nocardiopsis dassonvillei)DSM 43111(NZ_ABUI01000023；ZP_04335288)；溃疡分枝杆菌(Mycobacterium ulcerans)Agy99(NC_008611；YP_907152)；海鱼分枝杆菌(Mycobacterium marinum)M(NC_010612；YP_001851502)；链霉菌属Mg1(NZ_DS570501；ZP_05002626)；链霉菌属AA4(NZ_ACEV01000037；ZP_05478992)；玫瑰孢链霉菌(S.roseosporus)NRRL 15998(NZ_ABYB01000295；ZP_04696763)；链霉菌属ACTE(NZ_ADFD01000030；ZP_06275834)；产绿色链霉菌(S.viridochromogenes)DSM 40736(NZ_ACEZ01000031；ZP_05529691)；弗兰克氏菌属(Frankia sp.)CcI3(NC_007777；YP_480101)；巴西诺卡菌(Nocardia brasiliensis)(NC_018681；YP_006812440.1)；和chelonae放线菌(Austwickia chelonae)(NZ_BAGZ01000005；ZP_10950493.1)。其他合适的乙酰乙酰-CoA合酶包括美国专利申请公开号2010/0285549和2011/0281315中描述的那些，其内容通过引用其整体并入本发明。

也可用于本发明提供的组合物和方法的乙酰乙酰-CoA合酶包括那些被称为本发明所述的任何乙酰乙酰-CoA合酶的“衍生物”的分子。此种“衍生物”具有以下特征：(1)它与本发明所述的任何乙酰乙酰-CoA合酶具有基本同源性；和(2)能够催化乙酰-CoA与丙二酰-CoA的不可逆缩合反应以生成乙酰乙酰-CoA。如果衍生物的氨基酸序列与乙酰乙酰-CoA合酶的氨基酸序列为至少80％、更优选至少90％、最优选至少95％相同，则称乙酰乙酰-CoA合酶的衍生物与乙酰乙酰-CoA合酶具有“基本同源性”。

6.6.2乙酰乙酰-CoA转化为HMG-CoA

在一些实施方案，所述宿主细胞包含编码酶的异源核苷酸序列，所述酶可使乙酰乙酰-CoA与另一分子的乙酰-CoA缩合以形成3-羟基-3-甲基戊二酰-CoA(HMG-CoA)，例如HMG-CoA合酶。编码此种酶的核苷酸序列的示例性实例包括但不限于：(NC_001145.互补19061.20536；酿酒酵母)，(X96617；酿酒酵母)，(X83882；拟南芥)，(AB037907；griseola北里孢菌(Kitasatospora griseola))，(BT007302；智人(Homo sapiens))，和(NC_002758，基因座标签为SAV2546，GeneID(基因ID)为1122571；金黄色葡萄球菌(Staphylococcusaureus))。

6.6.3HMG-CoA转化为甲羟戊酸

在一些实施方案，所述宿主细胞包含编码酶的异源核苷酸序列，所述酶可使HMG-CoA转化为甲羟戊酸，例如HMG-CoA还原酶。在一些实施方案，HMG-CoA还原酶是使用NADH的羟甲基戊二酰-CoA还原酶-CoA还原酶。HMG-CoA还原酶(EC 1.1.1.34；EC 1.1.1.88)催化(S)-HMG-CoA还原脱酰为(R)-甲羟戊酸，并可以分为两类，I类和II类HMGr(HMG-CoA还原酶)。I类包括来自真核生物和大多数古细菌的酶，II类包括某些原核生物和古细菌的HMG-CoA还原酶。除了序列的差异外，两类酶在其辅因子特异性方面也不同。与仅使用NADPH的I类酶不同，II类HMG-CoA还原酶在区分NADPH和NADH的能力方面不同。参见，例如Hedl etal.,Journal of Bacteriology 186(7):1927-1932(2004)。选择的II类HMG-CoA还原酶的辅因子特异性提供如下。

选择的II类HMG-CoA还原酶的辅因子特异性

用于本发明提供的组合物和方法的有用的HMG-CoA还原酶包括能够利用NADH作为辅因子的HMG-CoA还原酶，例如来自迈氏假单胞菌(P.mevalonii)，闪烁古生球菌(A.fulgidus)或金黄色葡萄球菌(S.aureus)的HMG-CoA还原酶。在特定实施方案，所述HMG-CoA还原酶仅能够利用NADH作为辅因子，例如来自迈氏假单胞菌(P.mevalonii)，波美罗伊硅杆菌(S.pomeroyi)或食酸代尔夫特菌(D.acidovorans)的HMG-CoA还原酶。

在一些实施方案，使用NADH的HMG-CoA还原酶来自迈氏假单胞菌(Pseudomonasmevalonii)。先前已描述了编码HMG-CoA还原酶(EC 1.1.1.88)的迈氏假单胞菌(Pseudomonas mevalonii)的野生型mvaA基因的序列。参见Beach and Rodwell,J.Bacteriol.171:2994-3001(1989)。代表性的迈氏假单胞菌(Pseudomonas mevalonii)的mvaA核苷酸序列包括登录号M24015。迈氏假单胞菌(Pseudomonas mevalonii)的代表性HMG-CoA还原酶蛋白质序列包括登录号AAA25837、P13702、MVAA_PSEMV。

在一些实施方案，使用NADH的HMG-CoA还原酶来自波美罗伊硅杆菌(Silicibacterpomeroyi)。代表性的波美罗伊硅杆菌(Silicibacter pomeroyi)的HMG-CoA还原酶核苷酸序列包括登录号NC_006569.1。波美罗伊硅杆菌(Silicibacter pomeroyi)的代表性HMG-CoA还原酶蛋白质序列包括登录号YP_164994。

在一些实施方案，所述使用NADH的HMG-CoA还原酶来自食酸代尔夫特菌(Delftiaacidovorans)。食酸代尔夫特菌(Delftia acidovorans)的代表性HMG-CoA还原酶核苷酸序列包括NC_010002REGION：互补(319980..321269)。食酸代尔夫特菌(Delftiaacidovorans)的代表性HMG-CoA还原酶蛋白质序列包括登录号YP_001561318。

在一些实施方案，所述使用NADH的HMG-CoA还原酶来自马铃薯(Solanumtuberosum)(Crane et al.,J.Plant Physiol.159:1301-1307(2002))。

在本发明提供的组合物和方法中还可采用的使用NADH的HMG-CoA还原酶包括那些被称为任何本发明所述的使用NADH的HMG-CoA还原酶的“衍生物”的分子，例如来自迈氏假单胞菌(P.mevalonii)，波美罗伊硅杆菌(S.pomeroyi)和食酸代尔夫特菌(D.acidovorans)的使用NADH的HMG-CoA还原酶的“衍生物”的分子。此种“衍生物”具有以下特征：(1)它与任何本发明所述的使用NADH的HMG-CoA还原酶具有基本同源性；和(2)能够催化(S)-HMG-CoA还原脱酰为(R)-甲羟戊酸，同时优先使用NADH作为辅因子。如果所述衍生物的氨基酸序列与使用NADH的HMG-CoA还原酶的氨基酸序列为至少80％，更优选至少90％，最优选至少95％相同，则使用NADH的HMG-CoA还原酶的衍生物与使用NADH的HMG-CoA还原酶具有“基本同源性”。

本发明使用的短语“使用NADH/NADH-使用的”是指所述使用NADH的HMG-CoA还原酶对NADH作为辅因子相对NADPH作为辅因子具有选择性，譬如，通过证明对NADH的比活性高于对NADPH的比活性。在一些实施方案，对作为辅因子的NADH的选择性表示为k_cat ^(NADH)/k_cat ^(NADPH)比值。在一些实施方案，所述使用NADH的HMG-CoA还原酶具有至少5、10、15、20、25或大于25的k_cat ^(NADH)/k_cat ^(NADPH)比值。在一些实施方案，所述使用NADH的HMG-CoA还原酶仅使用NADH。譬如，仅使用NADH的使用NADH的HMG-CoA还原酶显示出一定活性，其中NADH作为体外唯一的辅助因子提供，并且当NADPH作为唯一辅因子提供时不显示可检测的活性。可利用本领域已知的任何确定辅因子特异性的方法来鉴定优先选择NADH作为辅因子的HMG-CoA还原酶，包括Kim et al.,Protein Science 9:1226-1234(2000)；和Wilding et al.,J.Bacteriol.182(18):5147-52(2000)中描述的那些，其内容均通过引用其整体并入本发明。

在一些实施方案，所述使用NADH的HMG-CoA还原酶被设计为对NADH相较NAPDH具有选择性，例如，通过辅因子结合口袋的定点诱变来设计。工程化设计NADH选择性的方法记载在Watanabe et al.,Microbiology 153:3044-3054(2007)中，用于确定HMG-CoA还原酶的辅因子特异性的方法记载在Kim et al.,Protein Sci.9:1226-1234(2000)中，其内容均通过引用其整体并入本发明。

在一些实施方案，所述使用NADH的HMG-CoA还原酶衍生自天然包含甲羟戊酸降解途径的宿主物种，例如，使作为其唯一碳源的甲羟戊酸分解代谢的宿主物种。在所述这些实施方案中，所述使用NADH的HMG-CoA还原酶，其通常催化在其天然宿主细胞内的内化的(R)-甲羟戊酸氧化酰化为(S)-HMG-CoA，用于催化所述逆向反应，即，在包含甲羟戊酸生物合成途径的经遗传修饰的宿主细胞中，使(S)-HMG-CoA还原脱酰为(R)-甲羟戊酸。能够在甲羟戊酸作为其唯一碳源上生长的原核生物已记载在：Anderson et al.,J.Bacteriol,171(12):6468-6472(1989)；Beach et al.,J.Bacteriol.171:2994-3001(1989)；Bensch et al.,J.Biol.Chem.245:3755-3762；Fimongnari et al.,Biochemistry 4:2086-2090(1965)；Siddiqi etal.,Biochem.Biophys.Res.Commun.8:110-113(1962)；Siddiqi et al.,J.Bacteriol.93:207-214(1967)；和Takatsuji et al.,Biochem.Biophys.Res.Commun.110:187-193(1983)中，其内容均通过引用其整体并入本发明。

在本发明提供的组合物和方法的一些实施方案中，所述宿主细胞包含使用NADH的HMGr(HMG-CoA还原酶)和使用NADPH的HMG-CoA还原酶。编码使用NADPH的HMG-CoA还原酶的核苷酸序列的示例性实例包括但不限于：(NM_206548；黑腹果蝇(Drosophilamelanogaster))，(NC_002758，基因座标签为SAV2545，基因ID(GeneID)为1122570；金黄色葡萄球菌(Staphylococcus aureus))，(AB015627；链霉菌属(Streptomyces sp.)KO3988)，(AX128213，提供编码截短的HMG-CoA还原酶的序列；酿酒酵母(Saccharomycescerevisiae))，和(NC_001145：互补(115734.118898；酿酒酵母(Saccharomycescerevisiae))。

6.6.4甲羟戊酸转化为甲羟戊酸-5-磷酸

在一些实施方案，所述宿主细胞包含编码酶的异源核苷酸序列，所述酶可将甲羟戊酸转化为甲羟戊酸5-磷酸，例如甲羟戊酸激酶。编码此种酶的核苷酸序列的示例性实例包括但不限于：(L77688；拟南芥(Arabidopsis thaliana))，和(X55875；酿酒酵母(Saccharomyces cerevisiae))。

6.6.5甲羟戊酸-5-磷酸转化为甲羟戊酸-5-焦磷酸

在一些实施方案，所述宿主细胞包含编码酶的异源核苷酸序列，所述酶可将甲羟戊酸5-磷酸转化为甲羟戊酸5-焦磷酸，例如磷酸甲羟戊酸激酶。编码此种酶的核苷酸序列的示例性实例包括但不限于：(AF429385；巴西橡胶树(Hevea brasiliensis))，(NM_006556；智人(Homo sapiens))，和(NC_001145.互补712315.713670；酿酒酵母(Saccharomyces cerevisiae))。

6.6.6甲羟戊酸-5-焦磷酸转化为IPP

在一些实施方案，所述宿主细胞包含编码酶的异源核苷酸序列，所述酶可将甲羟戊酸5-焦磷酸转化为异戊烯焦磷酸(IPP)，例如甲羟戊酸焦磷酸脱羧酶。编码此种酶的核苷酸序列的示例性实例包括但不限于：(X97557；酿酒酵母(Saccharomyces cerevisiae))，(AF290095；屎肠球菌(Enterococcus faecium))，和(U49260；智人(Homo sapiens))。

6.6.7IPP转化为DMAPP

在一些实施方案，所述宿主细胞还包含编码酶的异源核苷酸序列，所述酶可将通过MEV途径生成的IPP转化为二甲基烯丙基焦磷酸(DMAPP)，例如IPP异构酶。编码此种酶的核苷酸序列的示例性实例包括但不限于：(NC_000913，3031087.3031635；大肠杆菌(Escherichia coli))，和(AF082326；雨生红球藻(Haematococcus pluvialis))。

6.6.8聚异戊二烯合酶

在一些实施方案，所述宿主细胞还包含编码聚异戊二烯合酶的异源性核苷酸序列，所述聚异戊二烯合酶可使IPP和/或DMAPP分子缩合以形成含有多于5个碳的聚异戊二烯基化合物。

在一些实施方案，所述宿主细胞包含编码酶的异源核苷酸序列，所述酶可将一分子IPP与一分子DMAPP缩合以形成一分子香叶基焦磷酸(“GPP”)，例如GPP合酶。编码此种酶的核苷酸序列的示例性实例包括但不限于：(AF513111；巨冷杉(Abies grandis))，(AF513112；巨冷杉)，(AF513113；巨冷杉)，(AY534686；金鱼草(Antirrhinum majus))，(AY534687；金鱼草)，(Y17376；拟南芥(Arabidopsis thaliana))，(AE016877，基因座AP11092；蜡样芽胞杆菌(Bacillus cereus)；ATCC 14579)，(AJ243739；甜橙(Citrussinensis))，(AY534745；仙女扇(Clarkia breweri))，(AY953508；齿小蠹(Ips pini))，(DQ286930；番茄(Lycopersicon esculentum))，(AF182828；胡椒薄荷(Mentha xpiperita))，(AF182827；胡椒薄荷)，(MPI249453；胡椒薄荷)，(PZE431697，基因座CAD24425；玉米黄质副球菌(Paracoccuszeaxanthinifaciens))，(AY866498；胡黄连(Picrorhiza kurrooa))，(AY351862；葡萄(Vitis vinifera))，和(AF203881，基因座AAF12843；运动发酵单胞菌(Zymomonas mobilis))。

在一些实施方案，所述宿主细胞包含编码酶的异源核苷酸序列，所述酶可将两分子IPP与一分子DMAPP缩合，或者将IPP分子添加至GPP分子中，以形成法呢基焦磷酸(“FPP”)分子，例如FPP合酶。编码此种酶的核苷酸序列的示例性实例包括但不限于：(ATU80605；拟南芥)，(ATHFPS2R；拟南芥)，(AAU36376；青蒿(Artemisia annua))，(AF461050；欧洲普通牛(Bos taurus))，(D00694；大肠杆菌K-12)，(AE009951，基因座AAL95523；具核梭杆菌具核亚种(Fusobacterium nucleatum subsp.nucleatum)ATCC25586)，(GFFPPSGEN；藤仓赤霉(Gibberella fujikuroi))，(CP000009，基因座AAW60034；氧化葡萄糖杆菌(Gluconobacteroxydans)621H)，(AF019892；向日葵(Helianthus annuus))，(HUMFAPS；智人(Homosapiens))，(KLPFPSQCR；乳酸克鲁维酵母(Kluyveromyces lactis))，(LAU15777；白羽扇豆(Lupinus albus))，(LAU20771；白羽扇豆)，(AF309508；小鼠(Mus musculus))，(NCFPPSGEN；粗糙脉孢菌(Neurospora crassa))，(PAFPS1；灰白银胶菊(Partheniumargentatum))，(PAFPS2；灰白银胶菊)，(RATFAPS；褐家鼠(Rattus norvegicus))，(YSCFPP；酿酒酵母)，(D89104；粟酒裂殖酵母(Schizosaccharomyces pombe))，(CP000003，基因座AAT87386；酿脓链球菌(Streptococcus pyogenes))，(CP000017，基因座AAZ51849；酿脓链球菌)，(NC_008022，基因座YP_598856；酿脓链球菌MGAS10270)，(NC_008023，基因座YP_600845；酿脓链球菌MGAS2096)，(NC_008024，基因座YP_602832；酿脓链球菌MGAS10750)，(MZEFPS；玉米(Zea mays))，(AE000657，基因座AAC06913；风产液菌(Aquifex aeolicus)VF5)，(NM_202836；拟南芥)，(D84432，基因座BAA12575；枯草芽孢杆菌(Bacillussubtilis))，(U12678，基因座AAC28894；慢生型大豆根瘤菌(Bradyrhizobiumjaponicum)USDA 110)，(BACFDPS；嗜热脂肪土芽孢杆菌(Geobacillus stearothermophilus))，(NC_002940，基因座NP_873754；杜克雷嗜血杆菌(Haemophilus ducreyi)35000HP)，(L42023，基因座AAC23087；流感嗜血杆菌(Haemophilus influenzae)RdKW20)，(J05262；智人(Homosapiens))，(YP_395294；沙克乳酸杆菌沙克亚种(Lactobacillus sakei subsp.sakei)23K)，(NC_005823，基因座YP_000273；Copenhageni str.Fiocruz钩端螺旋体血清变型(Leptospira interrogans serovar Copenhageni str.Fiocruz)L1-130)，(AB003187；藤黄微球菌(Micrococcus luteus))，(NC_002946，基因座YP_208768；淋病奈瑟氏菌(Neisseria gonorrhoeae)FA 1090)，(U00090，基因座AAB91752；根瘤菌属(Rhizobiumsp.)NGR234)，(J05091；酿酒酵母)，(CP000031，基因座AAV93568；Silicibacter pomeroyiDSS-3)，(AE008481，基因座AAK99890；肺炎链球菌(Streptococcus pneumoniae)R6)，和(NC_004556，基因座NP 779706；木质部难养菌特曼库拉1(Xylella fastidiosaTemecula1)。

在一些实施方案，所述宿主细胞还包含编码酶的异源核苷酸序列，所述酶将IPP和DMAPP或IPP和FPP进行结合以形成香叶基香叶基焦磷酸(“GGPP”)。编码此种酶的核苷酸序列的示例性实例包括但不限于：(ATHGERPYRS；拟南芥)，(BT005328；拟南芥)，(NM_119845；拟南芥)，(NZ_AAJM01000380，基因座ZP_00743052；苏云金芽孢杆菌血清变型(Bacillusthuringiensis serovar israelensis)，ATCC 35646sq1563)，(CRGGPPS；长春花(Catharanthus roseus))，(NZ_AABF02000074，基因座ZP_00144509；具核梭杆菌文森特亚种(Fusobacterium nucleatum subsp.vincentii)，ATCC 49256)，(GFGGPPSGN；藤仓赤霉(Gibberella fujikuroi))，(AY371321；银杏(Ginkgo biloba))，(AB055496；巴西橡胶树(Hevea brasiliensis))，(AB017971；智人(Homo sapiens))，(MCI276129；卢西坦毛霉(Mucor circinelloides f.lusitanicus))，(AB016044；小鼠(Mus musculus))，(AABX01000298，基因座NCU01427；粗糙脉孢菌(Neurospora crassa))，(NCU20940；粗糙脉孢菌)，(NZ_AAKL01000008，基因座ZP_00943566；青枯雷尔氏菌(Ralstonia solanacearum)UW551)，(AB118238；褐家鼠(Rattus norvegicus))，(SCU31632；酿酒酵母)，(AB016095；细长聚球藻(Synechococcus elongates))，(SAGGPS；白芥子(Sinapis alba))，(SSOGDS；嗜酸热硫化叶菌(Sulfolobus acidocaldarius))，(NC_007759，基因座YP_461832；aciditrophicus互养菌(Syntrophus aciditrophicus)SB)，(NC_006840，基因座YP_204095；费氏弧菌(Vibrio fischeri)ES114)，(NM_112315；拟南芥)，(ERWCRTE；成团泛菌(Pantoea agglomerans))，(D90087，基因座BAA14124；菠萝泛菌(Pantoea ananatis))，(X52291，基因座CAA36538；荚膜红细菌(Rhodobacter capsulatus))，(AF195122，基因座AAF24294；类球红细菌(Rhodobacter sphaeroides))，和(NC_004350，基因座NP_721015；变异链球菌(Streptococcus mutans)UA159)。

虽然上文描述了甲羟戊酸途径的酶的实例，但在某些实施方案，所述DXP途径的酶在本发明所述的宿主细胞、组合物和方法中可用作生成DMAPP和IPP的替代途径或另外的途径。酶以及编码所述DXP途径的酶的核酸是本领域公知的以及在现有技术WO2012/135591A2表征的那些。

6.7生成甜菊糖苷类化合物的方法

另一方面，本发明提供了生成甜菊糖苷的方法，所述方法包含以下步骤：(a)在适于制备甜菊糖苷化合物的条件下，在含有碳源的培养基中培养能够生成所述甜菊糖苷的任何本发明所述的经遗传修饰的宿主细胞群；和(b)从所述培养基中回收所述甜菊糖苷化合物。

在一些实施方案，与不包含一种或多种修饰的亲本细胞相比，或者与仅包含所述经遗传修饰的宿主细胞的一种或多种修饰的子集，但在遗传上是相同的亲本细胞相比，所述经遗传修饰的宿主细胞生成增加量的甜菊糖苷。在一些实施方案，所述增加的量为至少1％、5％、10％、15％、20％、25％、30％、35％、40％、45％、50％、55％、60％、65％、70％、75％、80％、85％、90％、95％、100％、或大于100％，例如，以产量、生成量、生产率计，或以克/升细胞培养物，毫克/克干细胞重量计，或者基于每单位体积的细胞培养物，基于每单位干细胞重量，基于每单位时间的每单位体积的细胞培养物，或基于每单位时间的每单位干细胞重量计。

在一些实施方案，所述宿主细胞生成升高水平的甜菊糖苷，其大于约10克/升发酵培养基。在一些此类实施方案中，所述甜菊糖苷以从约10至约50克/升细胞培养物，超过约15克/升细胞培养物，超过约20克/升细胞培养物，超过约25克/升细胞培养物，超过约30克/升细胞培养物的量生成。

在一些实施方案，所述宿主细胞生成升高水平的甜菊糖苷，其大于约50毫克每克干细胞重量。在一些此类实施方案中，所述甜菊糖苷以从约50至约1500毫克，超过约100毫克，超过约150毫克，超过约200毫克，超过约250毫克，超过约500毫克，超过约750毫克，或超过约1000毫克每克干细胞重量的量生成。

在一些实施方案，所述宿主细胞生成升高水平的甜菊糖苷，其比由亲本细胞生成的甜菊糖苷水平高至少约10％，至少约15％，至少约20％，至少约25％，至少约30％，至少约35％，至少约40％，至少约45％，至少约50％，至少约60％，至少约70％，至少约80％，至少约90％，至少约2倍，至少约2.5倍，至少约5倍，至少约10倍，至少约20倍，至少约30倍，至少约40倍，至少约50倍，至少约75倍，至少约100倍，至少约200倍，至少约300倍，至少约400倍，至少约500倍，或至少约1000倍或更多，基于每单位体积细胞培养物。

在一些实施方案，所述宿主细胞生成升高水平的甜菊糖苷，其比由亲本细胞生成的甜菊糖苷水平高至少约10％，至少约15％，至少约20％，至少约25％，至少约30％，至少约35％，至少约40％，至少约45％，至少约50％，至少约60％，至少约70％，至少约80％，至少约90％，至少约2倍，至少约2.5倍，至少约5倍，至少约10倍，至少约20倍，至少约30倍，至少约40倍，至少约50倍，至少约75倍，至少约100倍，至少约200倍，至少约300倍，至少约400倍，至少约500倍，或至少约1000倍或更多，基于每单位干细胞重量。

在一些实施方案，所述宿主细胞生成升高水平的甜菊糖苷，其比由亲本细胞生成的甜菊糖苷水平高至少约10％，至少约15％，至少约20％，至少约25％，至少约30％，至少约35％，至少约40％，至少约45％，至少约50％，至少约60％，至少约70％，至少约80％，至少约90％，至少约2倍，至少约2.5倍，至少约5倍，至少约10倍，至少约20倍，至少约30倍，至少约40倍，至少约50倍，至少约75倍，至少约100倍，至少约200倍，至少约300倍，至少约400倍，至少约500倍，或至少约1000倍或更多，基于每单位时间的每单位体积细胞培养物。

在一些实施方案，所述宿主细胞生成升高水平的甜菊糖苷，其比由亲本细胞生成的甜菊糖苷水平高至少约10％，至少约15％，至少约20％，至少约25％，至少约30％，至少约35％，至少约40％，至少约45％，至少约50％，至少约60％，至少约70％，至少约80％，至少约90％，至少约2倍，至少约2.5倍，至少约5倍，至少约10倍，至少约20倍，至少约30倍，至少约40倍，至少约50倍，至少约75倍，至少约100倍，至少约200倍，至少约300倍，至少约400倍，至少约500倍，或至少约1000倍或更多，基于每单位时间的每单位干细胞重量。

在大多实施方案中，所述宿主细胞生成的升高水平的甜菊糖苷是由诱导化合物进行诱导。在不存在所述诱导化合物情况下，可容易地操作此种宿主细胞。然后加入所述诱导化合物以诱导所述宿主细胞生成升高水平的甜菊糖苷。在其他实施方案，通过改变培养条件，例如改变生长温度、培养基成分等，可诱导所述宿主细胞生成升高水平的甜菊糖苷。

6.8培养基和培养条件

用于微生物培养物的维持和生长的物料和方法是微生物学或发酵科学领域的技术人员所熟知的(参见，例如Bailey et al.,Biochemical Engineering Fundamentals,second edition,McGraw Hill,New York,1986)。根据宿主细胞、发酵和过程/方法的特定要求，必须考虑适当的培养基，pH值，温度，以及需氧、微需氧或厌氧条件的要求。

本发明提供的生成甜菊糖苷类化合物的方法可在合适的容器(包括但不限于细胞培养板、烧瓶或发酵罐)中在合适的培养基(例如，含或不含泛酸补充)中进行。此外，所述方法可以本领域已知的任何发酵规模进行，以支持微生物产物的工业生产。可使用任何合适的发酵罐，包括搅拌槽发酵罐，气升式发酵罐，气泡发酵罐或其任何组合。在利用酿酒酵母(Saccharomyces cerevisiae)作为宿主细胞的特定实施方案中，菌株可在发酵罐中生长，详细记载如Kosaric,et al,Ullmann's Encyclopedia of Industrial Chemistry,SixthEdition,Volume 12,pages 398-473,Wiley-VCH Verlag GmbH&Co.KDaA,Weinheim,Germany中所述。

在一些实施方案，所述培养基是其中能够生成甜菊糖苷的经遗传修饰的微生物可以存活，即保持生长和活力的任何培养基。在一些实施方案，所述培养基是包含可同化的碳源、氮源和磷酸盐源的水性介质。此种培养基还可包括适当的盐类、矿物质类、金属类和其他营养物类。在一些实施方案，将所述碳源和每种必需细胞营养物增量地或连续地添加到发酵培养基中，并将每种所需营养物通过使细胞生长，譬如，根据基于将碳源转化成生物量的细胞的代谢或呼吸功能的预定细胞生长曲线，保持在基本有效同化所需的最低水平。

用于培养微生物的合适条件和合适的培养基是本领域熟知的。在一些实施方案，所述合适的培养基补充有一种或多种另外的试剂，例如诱导物(例如，当编码基因产物的一个或多个核苷酸序列受诱导型启动子的控制时)，阻抑物(例如，当编码基因产物的一个或多个核苷酸序列受阻抑型启动子的控制时)，或选择剂(例如，选择包含所述经遗传修饰的微生物的抗生素)。

在一些实施方案，所述碳源是单糖(简单糖)、二糖、多糖、不可发酵的碳源、或其一种或多种组合。合适的单糖的非限制性实例包括葡萄糖、半乳糖、甘露糖、果糖、木糖、核糖、和其组合。合适的二糖的非限制性实例包括蔗糖、乳糖、麦芽糖、海藻糖、纤维二糖、和其组合。合适的多糖的非限制性实例包括淀粉、糖原、纤维素、几丁质、和其组合。合适的不可发酵碳源的非限制性实例包括乙酸盐和甘油。

所述培养基中碳源(例如葡萄糖)的浓度应促进细胞生长，但不能高到抑制所用微生物的生长。通常，培养物采用碳源(例如葡萄糖)进行，所述碳源以达到所需生长水平和生物量的水平、但以不可检测水平(检测限为约<0.1g/L)进行添加。在其他实施方案，所述培养基中碳源(例如葡萄糖)的浓度大于约1g/L，优选大于约2g/L，更优选大于约5g/L。此外，所述培养基中碳源(例如葡萄糖)的浓度通常小于约100g/L，优选小于约50g/L，更优选小于约20g/L。应当注意，对培养组分浓度的提及可以指初始和/或正在进行的组分浓度。在一些情况下，可能需要在培养期间使所述培养基耗尽碳源。

可用于合适培养基的可同化氮的来源包括但不限于简单氮源、有机氮源和复合氮源。此类氮源包括无水氨，铵盐类，以及动物、植物和/或微生物来源的物质。合适的氮源包括但不限于，蛋白质水解产物类，微生物生物量水解产物类，蛋白胨，酵母提取物，硫酸铵，尿素和氨基酸类。通常，所述培养基中所述氮源的浓度大于约0.1g/L，优选大于约0.25g/L，更优选大于约1.0g/L。然而，超过一定浓度，向所述培养基中添加氮源对于微生物的生长是不利的。因此，所述培养基中所述氮源的浓度小于约20g/L，优选小于约10g/L，更优选小于约5g/L。此外，在某些情况下，可能需要在培养期间使所述培养基耗尽所述氮源。

有效的培养基可含有其他化合物，例如无机盐类、维生素类、痕量金属类、或生长促进剂类。此类其他化合物也可存在于有效培养基中的碳源、氮源或矿物源中，或者可特异性地添加至所述培养基中。

所述培养基还可含有合适的磷酸盐源。此类磷酸盐源包括无机磷酸盐源和有机磷酸盐源。优选的磷酸盐源包括但不限于磷酸的盐类，例如单或二元磷酸钠和磷酸钾、磷酸铵、和其混合物。通常，所述培养基中磷酸盐的浓度大于约1.0g/L，优选大于约2.0g/L，更优选大于约5.0g/L。然而，超过一定浓度，向所述培养基中添加磷酸盐对于微生物的生长是不利的。因此，所述培养基中所述磷酸盐的浓度通常小于约20g/L，优选小于约15g/L，更优选小于约10g/L。

合适的培养基还可包括镁源，优选地以生理学上可接受的盐的形式，例如七水合硫酸镁，尽管可使用浓度为贡献相似量的镁的其他镁源。通常，所述培养基中镁的浓度大于约0.5g/L，优选大于约1.0g/L，更优选大于约2.0g/L。然而，超过一定浓度，向所述培养基中添加镁对于微生物的生长是不利的。因此，所述培养基中镁的浓度通常小于约10g/L，优选小于约5g/L，更优选小于约3g/L。此外，在某些情况下，可能需要在培养期间使所述培养基耗尽镁源。

在一些实施方案，所述培养基还可包含生物学上可接受的螯合剂，例如二水合柠檬酸三钠。在此种情况下，所述培养基中螯合剂的浓度大于约0.2g/L，优选大于约0.5g/L，更优选大于约1g/L。然而，超过一定浓度，向所述培养基中添加螯合剂对于微生物的生长是不利的。因此，所述培养基中螯合剂的浓度通常小于约10g/L，优选小于约5g/L，更优选小于约2g/L。

所述培养基最初还可包括生物学上可接受的酸或碱以维持所述培养基的所需pH值。生物学上可接受的酸包括但不限于，盐酸、硫酸、硝酸、磷酸、和其混合物。生物学上可接受的碱包括但不限于，氢氧化铵、氢氧化钠、氢氧化钾、和其混合物。在一些实施方案，使用的碱是氢氧化铵。

所述培养基还可包括生物学上可接受的钙源，包括但不限于氯化钙。通常，所述培养基中所述钙源(例如氯化钙二水合物)的浓度在约5mg/L至约2000mg/L的范围内，优选在约20mg/L至约1000mg/L的范围内，更优选在约50mg/L至约500mg/L的范围内。

所述培养基还可包括氯化钠。通常，所述培养基中氯化钠的浓度在约0.1g/L至约5g/L的范围内，优选在约1g/L至约4g/L的范围内，更优选在约2g/L至约4g/L的范围内。

在一些实施方案，所述培养基还可包含痕量金属。此类痕量金属可作为储备溶液添加至所述培养基中，为方便起见，可与其余培养基分开制备。通常，添加至所述培养基中的此痕量金属溶液的量大于约1mL/L，优选大于约5mL/L，更优选大于约10mL/L。然而，超过一定浓度，向所述培养基中添加痕量金属对于微生物的生长是不利的。因此，添加至所述培养基中的此痕量金属溶液的量通常小于约100mL/L，优选小于约50mL/L，更优选小于约30mL/L。应注意的是，除了在储备溶液中添加痕量金属之外，各个组分可单独进行添加，各自在与上述痕量金属溶液范围所规定的组分的量相对应的范围内。

所述培养基可包括其他维生素类，例如泛酸、生物素、钙、泛酸盐、肌醇、吡哆醇-HCl和硫胺素-HCl。此类维生素可作为储备溶液添加至所述培养基中，为方便起见，可与其余培养基分开制备。然而，超过一定浓度，向所述培养基中添加维生素类不利于微生物的生长。

本发明所述的发酵方法可以常规培养模式进行，所述培养模式包括但不限于分批、补料分批、细胞再循环、连续和半连续。在一些实施方案，所述发酵以补料分批模式进行。在此种情况下，所述培养基中的一些组分在培养期间被耗尽，所述组分包括在发酵的生成阶段期间的泛酸。在一些实施方案，所述培养物可在开始时(例如，生成阶段)补充相对高浓度的此类组分，使得在需要添加之前支持生长和/或甜菊糖苷生成一段时间。所述这些组分的优选范围在整个培养过程中通过添加来维持，所述添加以培养物耗尽的水平进行添加。可通过例如定期对培养基取样并测定浓度来监测所述培养基中组分的水平。或者，一旦开发出标准培养程序，所述添加可在整个培养期间的特定时间对应于已知水平以定时间隔进行。如本领域技术人员将认识到的，随着所述培养基的细胞密度增加，培养期间营养物的消耗速率亦将增加。此外，为了避免将外来微生物引入培养基中，可使用本领域已知的无菌添加方法进行添加。此外，在培养期间可加入少量消泡剂。

所述培养基的温度可以是适于经遗传修饰的细胞生长和/或甜菊糖苷生成的任何温度。譬如，在用接种物接种培养基之前，所述培养基可保持在约20℃至约45℃的温度范围内，优选保持在约25℃至约40℃的温度范围内，更优选保持在约28℃至约32℃的温度范围内。

可通过向所述培养基中添加酸或碱来控制所述培养基的pH值。在此种情况下，当氨用于控制pH时，其也方便地用作所述培养基中的氮源。优选地，所述pH值保持在约3.0至约8.0，更优选保持在约3.5至约7.0，最优选保持在约4.0至约6.5。

在一些实施方案，在培养期间监测所述培养基的碳源浓度，例如葡萄糖浓度。可使用已知技术监测所述培养基的葡萄糖浓度，例如，采用葡萄糖氧化酶试验或高压液相色谱，其可用于监测上清液(例如，所述培养基的无细胞组分)中的葡萄糖浓度。如前所述，所述碳源浓度应保持低于发生细胞生长抑制的水平。虽然此浓度可能因生物体而异，但对于葡萄糖作为碳源，细胞生长抑制发生在葡萄糖浓度大于约60g/L时，并可通过试验容易地确定。因此，当葡萄糖用作碳源时，优选将葡萄糖加入发酵罐中并保持在检测限以下。或者，所述培养基中的葡萄糖浓度维持在约1g/L至约100g/L的范围内，更优选地维持在约2g/L至约50g/L的范围内，更优选地维持在约5g/L至约20g/L的范围内。尽管通过添加例如基本上纯的葡萄糖溶液，可将所述碳源浓度维持在所需水平，但通过添加初始培养基的等分试样来维持的所述培养基的所述碳源浓度是可接受的，并且可能是优选的。使用初始培养基的等分试样是可取的，因为可同时维持所述培养基中的其他营养物(例如，氮源和磷酸盐源)的浓度。同样，通过添加痕量金属溶液的等份试样，亦可在所述培养基中维持所述痕量金属浓度。

其他合适的发酵培养基和方法记载在例如WO 2016/196321中。

6.9发酵组合物

另一方面，本发明提供了发酵组合物，其包含本发明所述的经遗传修饰的宿主细胞和由所述经遗传修饰的宿主细胞生成的甜菊糖苷类化合物。所述发酵组合物可进一步包含培养基。在某些实施方案，所述发酵组合物包含经遗传修饰的宿主细胞，和进一步包含RebA、RebD和RebM。在某些实施方案，本发明提供的发酵组合物包含RebM，作为由所述经遗传修饰的宿主细胞生成的甜菊糖苷类化合物的主要组分。在某些实施方案，所述发酵组合物包含RebA：RebD：RebM比例为至少1：7：50的RebA、RebD和RebM。在某些实施方案，所述发酵组合物包含RebA：RebD：RebM比例为至少1：7：50至1：100：1000的RebA、RebD和RebM。在某些实施方案，所述发酵组合物包含RebA：RebD：RebM比例为至少1：7：50至1：200：2000的RebA、RebD和RebM。在某些实施方案，所述RebA、RebD和RebM的比例是基于与所述经遗传修饰的宿主细胞和所述培养基相关的甜菊糖苷类化合物的总含量。在某些实施方案，所述RebA、RebD和RebM的比例是基于所述培养基中甜菊糖苷类化合物的总含量。在某些实施方案，所述RebA、RebD和RebM的比例是基于与所述经遗传修饰的宿主细胞相关的甜菊糖苷类化合物的总含量。

在某些实施方案，本发明提供的发酵组合物包含不可检测水平的RebM2。在某些实施方案，本发明提供的发酵组合物包含不可检测水平的非天然存在的甜菊糖苷类化合物。在某些实施方案，当本发明提供的发酵组合物进行GC色谱分析时，在可检测水平上，在RebA峰和RebB峰之间不产生“甜菊醇+2葡萄糖”峰。

6.10甜菊糖苷类化合物的回收

一旦甜菊糖苷由所述宿主细胞生成，便可使用本领域已知的任何合适的分离和纯化方法将其回收或分离用于后续应用。在一些实施方案，通过离心将包含甜菊糖苷的有机相从发酵物分离得到。在其他实施方案，包含甜菊糖苷的有机相自发地从发酵物中分离得到。在其他实施方案，通过将破乳剂和/或成核剂添加至发酵反应中，将包含甜菊糖苷的有机相从发酵物分离得到。破乳剂的示例性实例包括絮凝剂类和凝结剂类。成核剂的示例性实例包括甜菊糖苷本身的液滴和有机溶剂类，例如十二烷、肉豆蔻酸异丙酯和油酸甲酯。

在所述这些细胞中生成的甜菊糖苷可存在于培养物上清液中和/或与所述宿主细胞结合。在甜菊糖苷与宿主细胞结合的实施方案中，所述甜菊糖苷的回收可包括透化或裂解所述细胞的方法。或者或同时，可使用回收方法来回收所述培养基中的甜菊糖苷，所述回收方法包括但不限于，色谱法、萃取法、溶剂萃取法、膜分离法、电渗析法、反渗透法、蒸馏法、化学衍生化方法和结晶法。

在一些实施方案，将甜菊糖苷与可存在于有机相中的其他产物进行分离。在一些实施方案，使用吸附法、蒸馏法、气液萃取(汽提)法、液-液萃取(溶剂萃取)法、真空萃取法、蒸发、超滤法、和标准色谱技术来实现分离。其他合适的发酵培养基和方法记载在例如美国专利申请公开号2016/0185813中。

6.11制备经遗传修饰的细胞的方法

本发明还提供了用于生成宿主细胞的方法，所述宿主细胞经遗传工程改造以包含一种或多种上述修饰，例如编码豌豆(Pisum sativum)贝壳杉烯氧化酶的一种或多种异源核酸，和/或生物合成途径酶，例如用于甜菊糖苷化合物的生物合成途径酶。异源酶在宿主细胞中的表达可通过在所述宿主细胞中引入包含编码所述酶的核苷酸序列的核酸来实现，编码所述酶的所述核苷酸序列受允许在所述宿主细胞中表达的调节元件的控制。在一些实施方案，所述核酸是染色体外质粒。在其他实施方案，所述核酸是染色体整合载体，其可将所述核苷酸序列整合到所述宿主细胞的染色体中。

可通过本领域技术人员已知的任何方法，且不限于这些方法，将编码这些蛋白质的核酸引入所述宿主细胞中(参见，例如Hinnen et al.(1978)Proc.Natl.Acad.Sci.USA75:1292-3；Cregg et al.(1985)Mol.Cell.Biol.5:3376-3385；Goeddel et al.eds,1990,Methods in Enzymology,vol.185,Academic Press,Inc.,CA；Krieger,1990,GeneTransfer and Expression--A Laboratory Manual,Stockton Press,NY；Sambrook etal.,1989,Molecular Cloning--A Laboratory Manual,Cold Spring HarborLaboratory,NY；和Ausubel et al.,eds.,Current Edition,Current Protocols inMolecular Biology,Greene Publishing Associates andWiley Interscience,NY)。示例性技术包括但不限于原生质球法、电穿孔法、PEG1000介导的转化、和乙酸锂或氯化锂介导的转化。

可通过修饰编码所述酶的基因的转录来改变宿主细胞中酶的拷贝数。其可通过例如修饰编码所述酶的所述核苷酸序列的拷贝数(例如，通过使用包含所述核苷酸序列的更高或更低拷贝数的表达载体，或通过将所述核苷酸序列另外的拷贝引入所述宿主细胞的基因组中，或通过删除或破坏所述宿主细胞基因组中的所述核苷酸序列)，通过改变操纵子的多顺反子mRNA上的编码序列的顺序或将操纵子分解成各自具有其自身控制元件的单个基因，或通过增加核苷酸序列可操作连接的启动子或操纵子的强度来实现。或者或另外，可通过改变编码酶的mRNA的翻译水平来改变宿主细胞中酶的拷贝数。其可通过譬如改变mRNA的稳定性，改变核糖体结合位点的序列，改变核糖体结合位点和酶编码序列的起始密码子之间的距离或序列，改变位于酶编码区起始密码子“上游”或邻接5'侧的整个跨顺反子区域，使用发夹和特化序列稳定mRNA转录物的3'末端，修改酶的密码子使用，改变用于酶的生物合成的稀有密码子tRNA的表达，和/或增加酶的稳定性，例如通过其编码序列的突变来实现。

宿主细胞中酶的活性可以多种方式改变，包括但不限于，表达在宿主细胞中表现出增加或降低的溶解度的酶的修饰形式；表达酶的改变形式，所述酶缺乏抑制所述酶活性的结构域；表达酶的修饰形式，所述酶具有更高或更低的Kcat或更低或更高的Km的底物；或表达酶的改变形式，所述酶或多或少受到所述途径中另一分子的反馈或前馈调节的影响。

在一些实施方案，用于经遗传修饰的宿主细胞的核酸包含一种或多种选择标记，所述选择标记可用于选择转化的宿主细胞和对所述宿主细胞施加选择性压力以维持外源DNA。

在一些实施方案，所述选择标记是抗生素抗性标记。抗生素抗性标记的示例性实例包括但不限于，BLA、NAT1、PAT、AUR1-C、PDR4、SMR1、CAT、小鼠dhfr、HPH、DSDA、KAN^R、和SHBLE基因产物。来自大肠杆菌的BLA基因产物对β-内酰胺抗生素(例如，窄谱头孢菌素类、头孢霉素类、和碳青霉烯类(厄他培南)、头孢孟多和头孢哌酮)具有抗性，以及对除了替莫西林(temocillin)之外的所有抗革兰氏阴性细菌青霉素类具有抗性；来自诺尔斯链霉菌(S.noursei)的NAT1基因产物对诺尔丝菌素具有抗性；来自产绿色链霉菌(S.viridochromogenes)Tu94的PAT基因产物对双丙氨膦(bialophos)具有抗性；来自酿酒酵母的AUR1-C基因产物对Auerobasidin A(AbA)具有抗性；PDR4基因产物对浅蓝菌素具有抗性；SMR1基因产物对甲嘧磺隆具有抗性；来自Tn9转座子的CAT基因产物对氯霉素具有抗性；小鼠dhfr基因产物对甲氨蝶呤具有抗性；肺炎克雷伯氏菌(Klebsiella pneumonia)的HPH基因产物对潮霉素B具有抗性；大肠杆菌的DSDA基因产物使细胞在D-丝氨酸作为唯一氮源的平板上生长；Tn903转座子的KAN^R基因对G418具有抗性；和来自印度斯坦异壁链霉菌(Streptoalloteichus hindustanus)的SHBLE基因产物对Zeocin(博来霉素)具有抗性。在一些实施方案，在分离本发明公开的经遗传修饰的宿主细胞后，删除所述抗生素抗性标记。

在一些实施方案，所述选择标记拯救所述经遗传修饰的微生物中的营养缺陷型(例如，营养性营养缺陷型)。在此类实施方案中，亲本微生物包含一种或多种基因产物中的功能性破坏，所述一种或多种基因产物在氨基酸或核苷酸生物合成途径中起作用，并且当非功能性使得亲本细胞不能在培养基中生长而不补充一种或多种营养素时。此类基因产物包括但不限于酵母中的HIS3、LEU2、LYS1、LYS2、MET15、TRP1、ADE2、和URA3基因产物。然后可通过用编码所述破坏的基因产物的功能性拷贝的表达载体或染色体整合构建体来转化亲本细胞，从而拯救营养缺陷型表型，并可基于所述亲本细胞的所述营养缺陷型表型的缺失来选择生成的经遗传修饰的宿主细胞。利用URA3、TRP1和LYS2基因作为选择标记具有显著的优势，因为正选择和负选择均是可能的。通过URA3、TRP1和LYS2突变的营养缺陷型互补进行正选择，而负选择则基于特异性抑制剂，即5-氟-乳清酸(FOA)、5-氟邻氨基苯甲酸、和氨基己二酸(aAA)，其分别阻止原养型菌株生长但分别使URA3、TRP1和LYS2突变体生长。在其他实施方案，所述选择标记拯救可通过已知选择方法鉴定的其他非致死缺陷或表型。

本发明描述了可用于本发明公开的方法、组合物和生物体的特定基因和蛋白；然而，人们将认识到这些基因的绝对同一性是不必要的。譬如，可对包含编码多肽或酶的序列的特定基因或多核苷酸进行变化并筛选活性。通常，此类变化包括保守突变和沉默突变。可使用本领域已知的方法筛选此类经修饰或经突变的多核苷酸和多肽以表达功能性酶。

由于遗传密码的固有简并性，编码基本上相同或功能等同的多肽的其他多核苷酸也可用于克隆和表达编码此类酶的多核苷酸。

如本领域技术人员将理解的，修饰编码序列以增强其在特定宿主中的表达可能是有利的。所述遗传密码是冗余的，具有64个可能的密码子，但大多数生物体通常使用这些密码子的子集。在物种中最常使用的密码子称为最佳密码子，而那些未经常使用的密码子被分类为稀有密码子或低使用密码子。在有时被称为“密码子优化”或“控制物种密码子偏倚”的过程中，密码子可被置换以反映所述宿主的优选密码子使用。可使用密码子使用表容易地确定其他宿主细胞的密码子优化，或者可使用商业上可获得的软件，例如来自Integrated DNA Technologies的CodonOp(www.idtdna.com/CodonOptfrom)进行密码子优化。

可制备含有特定原核或真核宿主(Murray et al.,1989,Nucl Acids Res.17:477-508)优选的密码子的优化编码序列，例如，与由非优化序列生成的转录物相比，以提高翻译速率或以生成具有所需特性(例如更长的半衰期)的重组RNA转录物。还可修改翻译终止密码子以反映宿主偏好。譬如，酿酒酵母和哺乳动物的典型终止密码子分别是UAA和UGA。单子叶植物类的典型终止密码子是UGA，而昆虫和大肠杆菌通常使用UAA作为终止密码子(Dalphin et al.,1996,Nucl Acids Res.24:216-8)。

本领域技术人员将认识到，由于遗传密码的简并性质，可使用与其核苷酸序列不同的多种DNA分子来编码本发明给定的酶。引用编码上述生物合成酶的天然DNA序列在本发明中仅用于说明本发明的实施方案，并且本发明包括任何序列的DNA分子，所述序列编码本发明方法中所用酶的多肽和蛋白质的氨基酸序列。以类似的方式，多肽通常可在其氨基酸序列中耐受一个或多个氨基酸置换、缺失和插入，而不会损失或显著损失所需活性。本发明包括具有与本发明所述特定蛋白质不同的氨基酸序列的此类多肽，只要所述经修饰的多肽或变体多肽具有所述参照多肽的酶促合成代谢活性或分解代谢活性即可。此外，由本发明所示的DNA序列编码的氨基酸序列仅阐明了本发明的实施方案。

此外，可用于本发明提供的组合物和方法的酶的同源物包含在本发明公开内容中。在一些实施方案，当氨基酸序列具有至少约30％、40％、50％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、或99％同一性时，两种蛋白质(或所述蛋白质的区域)基本上是同源的。为了确定两个氨基酸序列或两个核酸序列的同一性百分比，比对所述序列以达到最佳比较目的(例如，可在第一和第二氨基酸或核酸序列中的一个或两个中引入空位用于最佳比对，并且可忽略非同源序列用于比较目的)。在一个实施方案，为比较目的而比对的参考序列的长度为所述参考序列长度的至少30％，通常至少40％，更通常至少50％，甚至更通常至少60％，甚至更通常至少70％、80％、90％、100％。然后比较相应氨基酸位置或核苷酸位置处的氨基酸残基或核苷酸。当所述第一序列中的位置被与所述第二序列中的相应位置的相同氨基酸残基或核苷酸占据时，那么所述分子在此位置具有同一性(本发明使用的氨基酸或核酸“同一性”等同于氨基酸或核酸“同源性”)。两个序列之间的同一性百分比是所述序列共有的相同位置的数量的函数，考虑到空位的数量和每个空位的长度，需引入这些空位以实现所述两个序列的最佳比对。

当“同源/同源性”用于提及蛋白质或肽时，将认识到不相同的残基位置通常因保守氨基酸置换而不同。“保守氨基酸置换”是其中氨基酸残基被具有相似化学性质(例如，电荷或疏水性)的侧链(R基团)的另一氨基酸残基置换的氨基酸置换。通常，保守氨基酸置换不会显著改变蛋白质的功能特性。在通过保守置换使两个或两个以上氨基酸序列彼此不同的情况下，可以向上调节序列同一性百分比或同源性程度以校正所述置换的保守性质。进行此种调节的方法是本领域技术人员所熟知的(参见，例如Pearson W.R.,1994,Methodsin Mol Biol 25:365-89)。

以下六组各自含有彼此保守置换的氨基酸：1)丝氨酸(S)，苏氨酸(T)；2)天冬氨酸(D)，谷氨酸(E)；3)天冬酰胺(N)，谷氨酰胺(Q)；4)精氨酸(R)，赖氨酸(K)；5)异亮氨酸(I)，亮氨酸(L)，丙氨酸(A)，缬氨酸(V)；和6)苯丙氨酸(F)，酪氨酸(Y)，色氨酸(W)。

通常使用序列分析软件来测定多肽的序列同源性，其也称为序列同一性百分比。用于将分子序列与含有来自不同生物体的大量序列的数据库进行比较的典型算法是计算机程序BLAST。当搜索含有来自大量不同生物体的序列的数据库时，通常比较氨基酸序列。

此外，编码前述酶(或本发明提及的任何其他酶类(或控制或调节其表达的任何调节元件))的任何基因可通过遗传/蛋白质工程技术进行优化，例如本领域普通技术人员已知的定向进化或合理诱变。此种作用使本领域普通技术人员能够优化所述酶在酵母中的表达和活性。

此外，编码所述这些酶的基因可从其他真菌和细菌物种中鉴定得到，并且可表达调节此途径。多种生物体可作为所述这些酶的来源，包括但不限于，酵母属(Saccharomycesspp.)，包括酿酒酵母(S.cerevisiae)和葡萄汁酵母(S.uvarum)；克鲁维酵母菌属(Kluyveromyces spp.)，包括耐热克鲁维酵母(K.thermotolerans)，乳酸克鲁维酵母(K.lactis)，和马修斯克鲁维酵母(K.marxianus)；毕赤酵母属(Pichia spp.)；汉逊酵母属(Hansenula spp.)，包括多型汉逊酵母(H.polymorpha)；假丝酵母属(Candida spp.)；丝孢酵母属(Trichosporon spp.)；Yamadazyma酵母属，包括Y.spp.Stipitis，球有孢圆酵母(Torulaspora pretoriensis)，东方伊萨酵母(Issatchenkia orientalis)；裂殖酵母属(Schizosaccharomyces spp.)，包括粟酒裂殖酵母(S.pombe)；隐球菌属(Cryptococcusspp.)；曲霉属(Aspergillus spp.)；脉孢菌属(Neurospora spp.)；或黑粉菌属(Ustilagospp.)。来自厌氧真菌的基因来源包括但不限于，梨囊鞭菌属(Piromyces spp.)，根囊鞭菌属(Orpinomyces spp.)，或新美鞭菌属(Neocallimastixspp.)。可用的原核酶的来源包括但不限于，大肠杆菌(Escherichia coli)，运动发酵单胞菌(Zymomonas mobilis)，金黄色葡萄球菌(Staphylococcus aureus)，芽孢杆菌属(Bacillus spp.)，梭菌属(Clostridiumspp.)，棒状杆菌属(Corynebacterium spp.)，假单胞菌属(Pseudomonas spp.)，乳球菌属(Lactococcus spp.)，肠杆菌属(Enterobacterspp.)和沙门氏菌属(Salmonella spp.)。

本领域技术人员已知的技术可适于鉴定其他同源基因和同源酶。通常，类似基因和/或类似酶可通过功能分析进行鉴定，并具有功能相似性。本领域技术人员已知的技术可适用于鉴定类似基因和类似酶。譬如，为了鉴定同源或类似的UDP糖基转移酶，PTA，或任何生物合成途径基因、蛋白质、或酶，技术可包括但不限于使用基于目的基因/酶的公开序列的引物通过PCR来克隆基因的技术，或通过使用设计用于扩增目的基因中的保守区域的简并引物的简并PCR技术。此外，本领域技术人员可使用技术来鉴定具有功能同源性或相似性的同源或类似的基因、蛋白质、或酶。技术包括通过用于所述活性的体外酶测定法来检测细胞或细胞培养物的酶的催化活性(例如，如本发明所述或如Kiritani,K.,Branched-ChainAmino Acids Methods Enzymology,1970中所述)，然后通过纯化技术来分离具有所述活性的酶，通过诸如埃德曼(Edman)降解、设计可能的核酸序列的PCR引物、通过PCR来扩增所述DNA序列以及克隆所述核酸序列等技术来确定所述酶的所述蛋白质序列。为了鉴定同源或类似基因和/或同源或类似酶、类似基因和/或类似酶或蛋白质，技术还包括将关于候选基因或酶的数据同诸如BRENDA、KEGG或MetaCYC的数据库进行比较。可根据本发明的教导，在上述数据库中鉴定候选基因或酶。

7.实施例

实施例1：能够高通量生成法呢基焦磷酸(FPP)和类异戊二烯法呢烯的基础酵母菌株(base yeast strain)的生成

通过在GAL1或GAL10启动子的控制下表达甲羟戊酸途径的基因(图1D)，从野生型酿酒酵母(Saccharomyces cerevisiae)菌株(CEN.PK2)产生法呢烯生成菌株。所述菌株包含来自酿酒酵母的以下染色体整合的甲羟戊酸途径基因：乙酰辅酶A硫解酶，HMG-CoA合酶，HMG-CoA还原酶，甲羟戊酸激酶，磷酸甲羟戊酸激酶，甲羟戊酸焦磷酸脱羧酶，和IPP：DMAPP异构酶。本发明所述的所有基因使用公众可获得的算法或其他合适算法进行密码子优化。此外，所述菌株包含来自青蒿(Artemisinin annua)的法呢烯合酶的六个拷贝，也受GAL1或GAL10启动子的控制。所述菌株还含有GAL80基因的缺失和受GAL4oc启动子控制的GAL4的另外拷贝，其中酿酒酵母的GAL4基因的编码序列受其天然启动子(PGAL4oc；参见例如Griggs&Johnston(1991)PNAS 88(19):8597-8601)的“有效组成型”形式的调节控制。最后，编码鲨烯合酶的ERG9基因通过用酵母基因MET3的启动子置换所述天然启动子而进行下调(Westfall et al PNAS 2012)。

实施例2.能够高通量生成瑞鲍迪苷A(RebA)的基础酵母菌株的生成

图1B示出了从FPP至甜菊醇的示例性生物合成途径。图2示出了从甜菊醇至糖苷RebM的示例性生物合成途径。为了将上述法呢烯基础菌株高通量转化为C-20类异戊二烯的贝壳杉烯，将香叶基香叶基焦磷酸合酶(GGPPS)的六个拷贝整合到基因组中，然后将柯巴基焦磷酸合酶和贝壳杉烯合酶各自的四个拷贝整合到基因组中。表1列出了用于将FPP转化为RebA的所有基因和启动子。此时，从所述菌株中除去法呢烯合酶的六个拷贝。一旦证实新菌株生成了内根-贝壳杉烯，则将用于将内根-贝壳杉烯转化为RebA的剩余基因插入所述基因组中。除了具有两个拷贝的Sr.KAH酶(表1)之外，将每个基因与单拷贝整合。包含表1中所述的所有基因的菌株主要生成RebA。酶UGT91D_like3具有某些将RebA转化为瑞鲍迪苷D(RebD)的低活性。我们测定了UGT91D_like3的单拷贝能够在上述酵母菌株中在体内将菌株中大约(3％)的RebA转化为RebD(图3和表2)。然后，UGT76G1可将RebD转化为最终产品瑞鲍迪苷M(RebM)。

实施例3.筛选将贝壳杉烯更高效转化为异贝壳杉烯酸的贝壳杉烯氧化酶(KO)

为了生成对RebM具有高通量的菌株，在GAL1启动子下，用基因UGT40087的单拷贝转化实施例2中所述的菌株(如实施例8和PCT申请AM-7400PCT中的表和图所述，其在本发明中作为附件)。所述菌株主要生成RebM。为了在体内筛选不同的KO等位基因以将贝壳杉烯转化为异贝壳杉烯酸，将此RebM菌株中的甜叶菊(Stevia rebaudiana)KO基因除去，并替换为仅包含GAL1启动子和终止子的着陆垫，其在启动子和终止子之间具有F-CphI限制性序列(图3)。现在，此种筛选菌株不含任何KO酶，仅产生内根-贝壳杉烯。

对由文献中所述得到的13种KO酶(表1)进行密码子优化，以在酿酒酵母中最佳表达，并合成了与图3A中所述的着陆垫中PGAL1和F-CphI序列侧翼的酵母终止子同源的60bp序列。对每个合成的KO基因进行单独测试(具有单拷贝)，以检测上述酵母菌株中在体内将内根-贝壳杉烯转化为异贝壳杉烯酸的能力。用KO供体DNA和含有核酸内切酶F-CphI的质粒转化酵母，以切割着陆垫中的DNA。使用每个转化中特定KO基因内部的反向引物和GAL1启动子末端的通用正向引物，通过菌落PCR来验证正确的整合。图3B示出了正确的F-CphI切割和与KO DNA同源重组后的最终遗传构建体。

表1.在酵母中测试了将贝壳杉烯更高效转化为异贝壳杉烯酸的贝壳杉烯氧化酶

图4示出了KO筛选的结果。与来自甜叶菊(Srvia rebaudiana)的KO酶(Sr.KO)相比，发现一种来自豌豆(Pisum sativum)(豌豆(gardenpea))的KO酶(Ps.KO)具有将内根-贝壳杉烯转化为异贝壳杉烯酸的增强的能力(提高了约3.5倍)。用于在酵母细胞中表达的豌豆(Pisum sativum)KO酶的密码子优化的核酸序列示出为SEQ ID NO：15。

实施例4.具有改进的将内根-贝壳杉烯转化为异贝壳杉烯酸的高通量RebM菌株的生成

然后在对RebM具有非常高通量的菌株中测试了Ps.KO对Sr.KO的活性。KO酶通常在大多数植物中起作用以生成植物激素赤霉素。植物细胞中赤霉素的含量比工业生产酵母中生成的RebM的含量低几个数量级，因此，预计KO酶不会携带商业化生产生成RebM所需的高通量。表3列出了与用于最初筛选KO酶的菌株(即KO“基础菌株”)相比，具有更高RebM通量的菌株中包含的所有基因和启动子。将表3中所有基因插入酵母基因组中。KO酶通过三轮随后的氧化反应，使内根-贝壳杉烯生成异贝壳杉烯酸。反应和中间体的顺序为：第一次氧化将内根-贝壳杉烯转化为贝壳杉烯醇(K-OL)，第二次氧化将贝壳杉烯醇转化为贝壳杉烯醛(K-AL)，第三次氧化将贝壳杉烯醛转化为异贝壳杉烯酸(-酸)(图1C)。为了最大通量将内根-贝壳杉烯转化为RebM，KO酶应将内根-贝壳杉烯完全氧化为K-酸。不完全的转化将浪费碳，降低总体RebM滴度，并产生潜在有毒的中间体化合物。图5中的数据表明，在对RebM具有高碳通量的菌株中，Sr.KO等位基因积累了大量上游中间产物，即内根-贝壳杉烯、贝壳杉烯醇(K-OL)、和贝壳杉烯醛(K-AL)，而Ps.KO酶显示这些中间产物的积累明显减少。

图6显示，由于与Sr.KO相比，由Ps.KO生成更高量的异贝壳杉烯酸，因此Ps.KO增加了在细胞中生成RebM的量。在高通量RebM菌株中，与具有Sr.KO的相同菌株相比，具有Ps.KO的菌株中RebM滴度增加了16％。更高的RebM滴度是由于在Ps.KO菌株中生成了更多的异贝壳杉烯酸。

实施例5.酵母培养条件

将经验证含有预期的贝壳杉烯氧化酶基因的酵母菌落挑选到含有鸟种培养基(Bird Seed Media，BSM，最初由van Hoek et al.,Biotechnology and Bioengineering68(5),2000,pp.517-523记载)的96孔微量滴定板中，所述鸟种培养基(Bird Seed Media)含有20g/L蔗糖和37.5g/L硫酸铵。将细胞在30℃下在高容量微量滴定板孵化器中进行培养，在1000RPM和80％湿度下振荡3天，直至所述培养物耗尽碳。通过从饱和培养物中取14.4μL并稀释至360μL新鲜培养基中，将生长饱和的培养物传代培养至含有BSM的新鲜平板中，所述BMS含有40g/L蔗糖和150g/L硫酸铵。在提取和分析之前，将所述生成培养基中的细胞在30℃下在高容量微量滴定板振荡器中，在1000RPM和80％湿度下再培养3天。培养完成后，将全细胞培养液用360μL 100％乙醇稀释，用箔纸进行密封，并以1250rpm振荡30分钟以提取瑞鲍迪苷类化合物。将490μL 50：50的乙醇：水加入到新的1.1mL测定板中，并将10μL培养物/乙醇混合物加入所述测定板中。将所述混合物离心以使任何固体沉淀，将400μL溶液转移至新的1.1mL板中并通过LC-MS进行测定。

实施例6.分析方法

甜菊醇和甜菊糖苷类化合物的质谱分析：

通过LC-MS质谱仪(AB QTrap 4000)，使用Sigma Ascentis Express Peptide ES-C18(5cm,2.1mm,2.7μm；part#53301-U)，采用以下梯度来分析样品：

质谱仪在负离子多反应监测模式下进行操作。根据真实标准品以及MRM跃迁来测定，通过保留时间来确定每种瑞鲍迪苷异构体：

贝壳杉烯的定量：

使用配备有有限热质量炉和火焰离子化检测器的气相色谱仪来测定培养液中内根-贝壳杉烯的滴度。用等份的培养液和甲醇来提取培养液样品，并在密封的容器中振摇30分钟，以从细胞中回收内根-贝壳杉烯。然后将所述培养液：甲醇溶液的240μL等分试样用1mL乙酸乙酯稀释，密封，并再振摇30分钟，以将内根-贝壳杉烯萃取到有机相中。适当地稀释有机相以使其落入所述测定试验的线性范围内，并等分到样品瓶中。样品以适当的分流比进样以落入所述线性范围内。样品分离在AgilentDB-1MS LTM II色谱柱上进行，使用氢气作为恒压模式下的载气，使用温度梯度：(1)起始温度为150℃持续0min，(2)将温度以25℃/min升高至230℃，(3)将温度以1800℃/min升高至320℃，并保持1分钟。使用真实可信的内根-贝壳杉烯标准品进行外部校准来确定内根-贝壳杉烯的量。

异贝壳杉烯酸、贝壳杉烯醇和贝壳杉烯醛的定量：

使用配备有可变波长检测器的高压液相色谱仪来测定培养液中的异贝壳杉烯酸、贝壳杉烯醇和贝壳杉烯醛的滴度。将培养液样品(100μL)稀释到300μL乙醇中，并在密封容器中振摇30分钟。将200μL水加至培养液：乙醇混合物中，混合并离心。将所得溶液的等分试样(避免细胞沉淀)转移至样品瓶中，并采用HPLC进行分析。采用以下溶剂在AglientEclipse Plus C18 USP L1(4.6mmx 50mmx 1.8μm)上进行样品分离：

·流动相A：0.1％甲酸的水溶液(v/v)

·流动相B：0.1％甲酸的乙腈溶液(v/v)

溶剂梯度：

时间(min)	通道A(％)	通道B(％)
			0.00	50	50
2.50	50	50
			5.75	0	100
8.00	0	100
			8.10	50	50
9.0	50	50

使用UV吸光度在200nm处来检测分析物，并通过外部校准(相对于甜菊醇标准品的相对响应因子)进行定量。

用于图6所示数据的瑞鲍迪苷M定量方法：

培养液中瑞鲍迪苷M的滴度使用配备有三重四极杆质谱仪的高压液相色谱仪进行测定。将培养液样品等分到在50：50/乙醇：水中稀释200至800倍的微量离心管(Eppendorf)中，混合20分钟，离心成沉淀细胞和碎片，将等分的上清液转移至样品瓶中进行分析。样品以流动注入模式运行，其中基于MRM跃迁的信号强度对分析物进行定量。流动相为40％水+0.1％甲酸和60％乙腈+0.1％甲酸，流速为1.1mL/min。瑞鲍迪苷M的浓度由其响应归一化为内标物(瑞鲍迪苷N)的响应来确定。

表2.用于将FPP转换为RebA的酶的基因、启动子和氨基酸序列

¹去除前65个氨基酸，并用蛋氨酸代替

表3.生成RebM的菌株中酶的基因、启动子、拷贝数和氨基酸序列

酶名称	基因拷贝数	登录号或序列ID	启动子
				三孢布拉氏霉菌(Btrispora).GGPPS	6	AFC92798.1	PGAL1
内根-CDPS_Os	4	Q5MQ85.1<sup>1</sup>	PGAL1
				KS_Pg	4	ADB55711.1	PGAL1
Sr.KO	1	AAQ63464.1	PGAL1
				Sr.KAH	3	SEQ ID :10	PGAL1
ATR2	1	NP_194750.1	PGAL3
				UGT85C2	2	AAR06916.1	PGAL1或PGAL10
UGT74G1	2	AAR06920.1	PGAL1或PGAL10
				UGT91D_like3	2	SEQ ID NO:7	PGAL1或PGAL10
UGT76G1	4	AAR06912.1	PGAL1或PGAL10

¹去除前65个氨基酸，并用蛋氨酸代替

本说明书中引用的所有出版物、专利和专利申请均通过引用并入本发明，如同每个单独的出版物或专利申请被具体和单独地指出通过引用并入。尽管为了清楚理解的目的，已通过举例说明和实施例详细地描述了前述发明，但根据本发明的教导，对本领域普通技术人员显而易见的是，在不脱离所附权利要求的精神或范围的情况下，可对其进行某些改变/变化和修改/修饰。

序列表

>序列_ID_1

MDTLTLSLGFLSLFLFLFLLKRSTHKHSKLSHVPVVPGLPVIGNLLQLKEKKPHKTFTKMAQKYGPIFSIKAGSSKIIVLNTAHLAKEAMVTRYSSISKRKLSTALTILTSDKCMVAMSDYNDFHKMVKKHILASVLGANAQKRLRFHREVMMENMSSKFNEHVKTLSDSAVDFRKIFVSELFGLALKQALGSDIESIYVEGLTATLSREDLYNTLVVDFMEGAIEVDWRDFFPYLKWIPNKSFEKKIRRVDRQRKIIMKALINEQKKRLTSGKELDCYYDYLVSEAKEVTEEQMIMLLWEPIIETSDTTLVTTEWAMYELAKDKNRQDRLYEELLNVCGHEKVTDEELSKLPYLGAVFHETLRKHSPVPIVPLRYVDEDTELGGYHIPAGSEIAINIYGCNMDSNLWENPDQWIPERFLDEKYAQADLYKTMAFGGGKRVCAGSLQAMLIACTAIGRLVQEFEWELGHGEEENVDTMGLTTHRLHPLQVKLKPRNRIY

>序列_ID_2

MDAVTGLLTVPATAITIGGTAVALAVALIFWYLKSYTSARRSQSNHLPRVPEVPGVPLLGNLLQLKEKKPYMTFTRWAATYGPIYSIKTGATSMVVVSSNEIAKEALVTRFQSISTRNLSKALKVLTADKTMVAMSDYDDYHKTVKRHILTAVLGPNAQKKHRIHRDIMMDNISTQLHEFVKNNPEQEEVDLRKIFQSELFGLAMRQALGKDVESLYVEDLKITMNRDEIFQVLVVDPMMGAIDVDWRDFFPYLKWVPNKKFENTIQQMYIRREAVMKSLIKENKKRIASGEKLNSYIDYLLSEAQTLTDQQLLMSLWEPIIESSDTTMVTTEWAMYELAKNPKLQDRLYRDIKSVCGSEKITEEHLSQLPYITAIFHETLRRHSPVPIIPLRHVHEDTVLGGYHVPAGTELAVNIYGCNMDKNVWENPEEWNPERFMKENETIDFQKTMAFGGGKRVCAGSLQALLTASIGIGRMVQEFEWKLKDMTQEEVNTIGLTTQMLRPLRAIIKPRI

>序列_ID_3

MAFFSMISILLGFVISSFIFIFFFKKLLSFSRKNMSEVSTLPSVPVVPGFPVIGNLLQLKEKKPHKTFTRWSEIYGPIYSIKMGSSSLIVLNSTETAKEAMVTRFSSISTRKLSNALTVLTCDKSMVATSDYDDFHKLVKRCLLNGLLGANAQKRKRHYRDALIENVSSKLHAHARDHPQEPVNFRAIFEHELFGVALKQAFGKDVESIYVKELGVTLSKDEIFKVLVHDMMEGAIDVDWRDFFPYLKWIPNKSFEARIQQKHKRRLAVMNALIQDRLKQNGSESDDDCYLNFLMSEAKTLTKEQIAILVWETIIETADTTLVTTEWAIYELAKHPSVQDRLCKEIQNVCGGEKFKEEQLSQVPYLNGVFHETLRKYSPAPLVPIRYAHEDTQIGGYHVPAGSEIAINIYGCNMDKKRWERPEDWWPERFLDDGKYETSDLHKTMAFGAGKRVCAGALQASLMAGIAIGRLVQEFEWKLRDGEEENVDTYGLTSQKLYPLMAIINPRRS

>序列_ID_4

MAVATDPLGCMQKLVQMLQAPPYVAAAVQSSALLLTFFIGDWRKRRRSPLPLLPAIPGIPVLGNLLQLKEKKPHKTFAQWSETYGPIYSIKAGASTVIVLNSSDLAKEAMVTRYSSISSRKLSKALTILTADKCMVAMSDYNDFHKLVKRYILANVLGANAQKRLRQRRDTMIDNISRELFACVKDSSSESVNFRKIFESELFGLALKETFGRDMESLYVDGLGTTLLREDLFRTLVIDPMEGAIEVDWRDFFPYLRWIPNKGVEDRIRKMDFRRRVTMKSLMEEKKKQIAAGEDLNCYSEFLLSEAKSLTEEQISMLLWEIIIETSDTTLVVTEWAMYELAQNPKRQERLYQHIQSVCGSAKITEENLSQLPYLTAVFHETLRKYSPVSIVPLRYAHEDTQLGGYFIPAGSEVAVNIYACNMDKKQWESPEEWKPERFLDESYDPMDLYKTMAFGGGKRVCAGAPKAMLIACTTLGRLVQGFTWKLREGEEDKVDTLGLTARKLQPLHIVAKPRIN

>序列_ID_5

MAVVTDPLASMQLLANTIPAPPYAAAAVLGGVSLVLSVFFVADCRKKRRNFLPPVPAVPGVPVLGNLLQLKEKKPHKTFARWAETYGAVYSIRTGASTVIVLNTTEVAKEAMVTRYGSISSRKLSKALTILTADKCMVAMSDYNEFHKMVKRYILANVLGANAQKKHRQRRDAMIENISRELFAHVKEFPLDTVNFRKIFEAELFRLALKETLGKDIESIYVDGLGTTLPREDLFRILVIDPMEGAIEVDWRDFFPYLRWIPNKRVENKIRNMDFRRRMTMKKLMEEPKKRIAAGEETYCYADFLLSEAKTLTEDQISMLLWETIIETSDTTLVVTEWAMYELSKDPRRQDYLYQQIQSVCGSATLTEENLSQLPYLTAIFHETLRKHSPVPVVPLRYAHEDTQLGGYFVPAGSEIAVNIYACNMDKDHWESPEEWKPERFLDDKYDPMDLHKTMAFGGGKRVCAGALKAMLIACTTIGRMVQEFEWKLREGEEEKVDTLGLTARKLQPLHVVIKPRNN

>序列_ID_6

MSKSNSMNSTSHETLFQQLVLGLDRMPLMDVHWLIYVAFGAWLCSYVIHVLSSSSTVKVPVVGYRSVFEPTWLLRLRFVWEGGSIIGQGYNKFKDSIFQVRKLGTDIVIIPPNYIDEVRKLSQDKTRSVEPFINDFAGQYTRGMVFLQSDLQNRVIQQRLTPKLVSLTKVMKEELDYALTKEMPDMKNDEWVEVDISSIMVRLISRISARVFLGPEHCRNQEWLTTTAEYSESLFITGFILRVVPHILRPFIAPLLPSYRTLLRNVSSGRRVIGDIIRSQQGDGNEDILSWMRDAATGEEKQIDNIAQRMLILSLASIHTTAMTMTHAMYDLCACPEYIEPLRDEVKSVVGASGWDKTALNRFHKLDSFLKESQRFNPVFLLTFNRIYHQSMTLSDGTNIPSGTRIAVPSHAMLQDSAHVPGPTPPTEFDGFRYSKIRSDSNYAQKYLFSMTDSSNMAFGYGKYACPGRFYASNEMKLTLAILLLQFEFKLPDGKGRPRNITIDSDMIPDPRARLCVRKRSLRDE

>序列_ID_7

MNKFNSMNNTINETLLRQLVSGLDEIPLMDIHWLIYVAFGAWLCSYVIHLLSSPSTVNVPFVGYRSVFEPTWFLRLRFVWEGGSIISQGYSKFKDSIFQVRKLGTDIVIIPPNYIDEVRKLSQDKTRSVEPFINDFAGDYTRGMVFLQSDLQNRVIQQRLTPKLVSLTKVMKEELDYALTKGMPDMKDDEWVEADIASIMVRLISRISARVFLGPEHCRNQEWLTTTAEYSESLFMTGFILRVVPHILRPFVAPLLPSYRTLLRSVSSGRKVIGDIIRSQQGSENEDILSWMVEAATGEEKQVDNIAQRMLILSLASIHTTAMTMTHAMYDLCARPEYTKPLREEVKGVVGASGWDKTALNRLHKLDSFLKESQRFNPVFLLTFNRIYHQPMTLSDGTNLPSGTRIAVPSHAMLQDSAHVPGPAPPTDFDGFRYSKIRSDSNYAQKYLFSMTDSSNMAFGYGKYACPGRFYASNEMKLTLAILLLQFEFKLPDGKGRPRNITIDSDMVPDPRARLCVRKRSLREE

>序列_ID_8

MDLQTMAPMGSAAIAIGGPAVAVAGGISLLFLKSFLSQQPGNPNHLPSVPAVPGVPLLGNLLELKEKKPYKTFTKWAETYGPIYSIKTGATSMVVVNSNQLAKEAMVTRFDSISTRKLSKALQILTADKTMVAMSDYDDYHKTVKRNLLTSILGPAAQKRHRAHRDAMGDNLSRQLHALALNSPQEAINFRQIFQSELFTLAFKQTFGRDIESIFVGDLGTTMTREEMFQILVVDPMMGAIDVDWRDFFPYLKWIPNAKLEEKIEQMYIRRKAVMKAVIQEHRKRIDSGENLDSYIDFLLAEAQPLTEKQLLMSLWEPIIETSDTTMVTTEWAMYELSKHPNKQQRLYNEIRNICGSEKITEEKLCKMPYLSAVFHETLRVHSPVSIIPLRYVHENTELGGYHVPAGTELAVNIYGCNMEREIWENPEEWSPERFLAENEPVNLQKTMAFGAGKRVCAGAMQAMLLACVGIGRMVQEFEWRLKDDVEEDVNTLGLTTQRLNPMLAVIKPRN

>序列_ID_9

MDGVIDMQTIPLRTAIAIGGTAVALVVALYFWFLRSYASPSHHSNHLPPVPEVPGVPVLGNLLQLKEKKPYMTFTKWAEMYGPIYSIRTGATSMVVVSSNEIAKEVVVTRFPSISTRKLSYALKVLTEDKSMVAMSDYHDYHKTVKRHILTAVLGPNAQKKFRAHRDTMMENVSNELHAFFEKNPNQEVNLRKIFQSQLFGLAMKQALGKDVESIYVKDLETTMKREEIFEVLVVDPMMGAIEVDWRDFFPYLKWVPNKSFENIIHRMYTRREAVMKALIQEHKKRIASGENLNSYIDYLLSEAQTLTDKQLLMSLWEPIIESSDTTMVTTEWAMYELAKNPNMQDRLYEEIQSVCGSEKITEENLSQLPYLYAVFQETLRKHCPVPIMPLRYVHENTVLGGYHVPAGTEVAINIYGCNMDKKVWENPEEWNPERFLSEKESMDLYKTMAFGGGKRVCAGSLQAMVISCIGIGRLVQDFEWKLKDDAEEDVNTLGLTTQKLHPLLALINPRKS

>序列_ID_10

MEAFVPGGAGAAAAAVGGFVAAAALAERAGVIAPRKRPNAPPAVPGLPIIGNLHQLKEKKPHQTFAKWAEIYGPIYTIRTGASSVVVLNSTEVAKEAMVAKFSSISTRKLSKALTVLTRDKSMVATSDYCDFHKMVKRYVMSSMLGTSAQKQFRDIRDMMIHNMLSTFHKLVKDDPHAPLIFRDVFKDELFRLSMIQSLGEDVSSVYVDEFGRDISKEEIYNATVTDMMMCAIEVDWRDFFPYLSWVPNKSFETRVFTTETRRTAVMRALIKQQKERIVRGEAKTCYLDFLLAENTLTDEQLMMLVWEALIEAADTTLVTTEWAMYELAKNPDKQERLYQEIREVCGDETVTEEHLPRLPYLNAVFHETLRRHSPVPLIPPRFVHEDTKLAGYDVPAGTEMVINLYGCNMNRKEWESPEEWVPERFAGGRLEVADMYKTMAFGAGRRACAGSLQATHIACAAVARFVQEFGWRLREGDEEKVDTVQLTAYKLHPLHVHLTRRGRM

>序列_ID_11

MLETKVIAHHVSHSPCAAIPGGLPVLGNLLQLTEKKPHRTFTAWSKEHGPIFTIKVGSVPQAVVNNSEIAKEVLVTKFASISKRQMPMALRVLTRDKTMVAMSDYGEEHRMLKKLVMTNLLGPTTQNKNRSLRDDALIGMIEGVLAELKASPTSPKVVNVRDYVQRSLFPFALQQVFGYIPDQVEVLELGTCVSTWDMFDALVVAPLSAVINVDWRDFFPALRWIPNRSVEDLVRTVDFKRNSIMKALIRAQRMRLANLKEPPRCYADIALTEATHLTEKQLEMSLWEPIIESADTTLVTSEWAMYEIAKNPDCQDRLYREIVSVAGTERMVTEDDLPNMPYLGAIIKETLRKYTPVPLIPSRFVEEDITLGGYDIPKGYQILVNLFAIANDPAVWSNPEKWDPERMLANKKVDMGFRDFSLMPFGAGKRMCAGITQAMFIIPMNVAALVQHCEWRLSPQEISNINNKIEDVVYLTTHKLSPLSCEATPRISHRLP

>序列_ID_12

MMDDTTSPYSTYHSVRSIRNQSAWALAPIAVFICYVVLRHNRKSVPAASAGSHSILEPLWLARLRFIRDSRFIIGQGYSKFKDTIFKVTKVGADIIVVAPKYVEEIRRLSRDTGRSVEPFIHDFAGELLGGLNFLESDLQTRVVQQKLTPNLKTIVPVMEDEMHYALVSELDSCLDGSEHWTRVDMIHMLSRIVSRISARIFLGPKYCRNDLWLKTTAEYTENLFLTGTLLRFVPRMLQKWIAPLLPSFRQLQENRQAARKIISEILTDHQPEKHDETSDNGDPYPDILTLMFQAARGKEKDIEDIAQHTLLLSLSSIHTTALTMTQALYDLCAYPQYLDPVKHEIADTLQSEGSWSKAMLDKLHMMDSLLRESQRLSPVFLLTFNRILHTPLTLSNGIHLPKGTRIAAPSDAILNDPSLVPGPQPADTFDPFRYINHSTGDAKKTKTNFQTTSLQNMAFGYGKYACPGRFYVANEIKLVLGHLLMHYEFKFPPGMGRPVNSTVDTDMYPDLGARLLVRKRKMEE

>序列_ID_13

MESLVAALPAGGAAAAAAFGGLVAAAALAGKVGLVGSKKHLNAPPAVSGLPLIGNLHQLKEKKPHQTFTKWAEIYGPIYTIRTGSSTVVVLNSAQVAKEAMIAKFSSISTRKLSKALSALTRDKTMVATSDYGDFHKMIKRYIMTFMLGTSGQKQFRDTRNMMVDNMLNTFHTLLMDDPNSPLNFREVFKNELFRLSLVQALGEDVSSIYVEEYGKVISKEEIYKATVVDMMMCAIEVDWRDFFPYLSWIPNRTFETRVLTTEARRTTVMQALIKQQKERIARGETRISYLDFLLAENTLTDEQLLMLVWEAVIEAADTTLVTTEWAMYEIAKHPEKQEYLYQEIQKVCGNKTVTEDHLPELPYLNAVFHETMRRHSPVPLVPPRLVHENTNLAGYEVPAGTEIIINLYGCNMNKNDWAEPEEWKPERFLDGRFEAVDMHKTMAFGAGRRACAGSMQAMNISCTAIGRFVQEFAWRLEEGDEDKVDTIQLTTNRLYPLHVYLAPRGRK

>SEQ ID NO:14AY245442.1内根-贝壳杉烯氧化酶mRNA[豌豆(Pisum sativum)]

GTGGTGAAGCAACTAGCAGTGGCAGCCATGGATACTCTCACACTTTCTTTGGGTTTTTTATCTCTCTTTTTGTTCCTCTTCTTACTAAAGAGATCTACTCACAAACATTCCAAGCTTTCCCATGTACCAGTGGTTCCAGGTTTGCCAGTGATTGGGAATCTGCTGCAATTGAAAGAGAAGAAACCTCACAAGACATTCACAAAGATGGCTCAGAAATATGGACCCATTTTTTCCATCAAAGCTGGTTCTTCCAAAATCATTGTTCTCAACACTGCTCATCTTGCTAAAGAGGCAATGGTGACTAGATATTCATCAATTTCAAAAAGGAAGCTATCAACTGCACTGACGATTCTAACTTCGGATAAATGCATGGTTGCTATGAGCGACTACAATGATTTTCACAAAATGGTTAAAAAACATATTCTTGCAAGTGTTCTTGGAGCCAATGCACAGAAGCGACTCCGTTTTCACAGAGAGGTTATGATGGAAAATATGTCTAGTAAGTTTAATGAACATGTGAAGACCCTCTCAGATTCTGCTGTTGATTTTAGGAAAATATTTGTGTCTGAACTTTTCGGATTAGCACTAAAGCAAGCTCTGGGAAGTGATATTGAATCCATTTATGTGGAGGGTTTGACGGCTACATTATCAAGAGAGGACTTATATAACACTCTAGTGGTTGATTTTATGGAGGGTGCAATTGAGGTGGATTGGAGAGATTTCTTCCCGTACCTGAAATGGATTCCAAATAAGAGCTTCGAGAAGAAAATCCGTAGAGTCGATCGCCAAAGAAAAATTATCATGAAGGCACTAATTAATGAGCAAAAGAAGCGGTTGACATCAGGAAAAGAATTAGATTGTTATTATGATTACCTAGTATCAGAAGCTAAAGAAGTGACTGAAGAACAAATGATCATGCTGCTCTGGGAGCCAATTATTGAGACATCCGATACTACCTTAGTCACGACAGAATGGGCTATGTATGAACTTGCCAAAGACA

>序列_ID_15

ATGGATACCTTAACTTTGTCTTTAGGTTTCTTATCTTTGTTCTTATTTTTATTCTTGTTAAAGAGATCTACTCACAAGCACTCCAAGTTATCCCACGTTCCAGTTGTTCCAGGTTTGCCTGTCATTGGTAACTTATTGCAATTGAAAGAAAAGAAGCCACACAAGACTTTCACCAAGATGGCTCAAAAGTACGGTCCAATTTTCTCCATCAAAGCCGGTTCTTCTAAAATCATTGTTTTAAACACTGCCCACTTGGCTAAAGAAGCTATGGTTACTAGATATTCTTCCATCTCCAAGAGAAAGTTGTCTACTGCTTTGACCATCTTGACTTCTGATAAGTGCATGGTTGCTATGTCCGATTATAACGACTTCCACAAGATGGTTAAGAAGCACATCTTGGCTTCTGTTTTGGGTGCCAACGCCCAAAAGAGATTGCGTTTCCACAGAGAAGTCATGATGGAAAACATGTCTTCCAAATTCAATGAACATGTCAAGACTTTGTCTGATTCTGCTGTTGACTTCAGAAAGATTTTCGTTTCTGAATTATTTGGTTTGGCTTTGAAGCAAGCTTTGGGTTCCGATATCGAATCTATCTACGTTGAAGGTTTGACTGCTACTTTATCTAGAGAAGATTTGTATAACACCTTGGTCGTCGACTTCATGGAAGGTGCTATCGAAGTTGATTGGAGAGACTTTTTCCCTTATTTGAAGTGGATTCCAAACAAATCCTTCGAAAAGAAGATCAGAAGAGTTGATAGACAAAGAAAAATTATCATGAAAGCTTTGATCAACGAACAAAAGAAAAGATTGACCTCTGGTAAGGAATTGGACTGTTACTACGATTACTTAGTTTCTGAAGCTAAGGAAGTCACCGAAGAACAAATGATCATGTTGTTGTGGGAACCAATTATTGAGACTTCTGATACTACTTTAGTTACCACCGAATGGGCTATGTATGAGTTGGCTAAGGACAAGAACCGTCAAGACAGATTGTACGAAGAATTGTTGAACGTTTGTGGTCACGAAAAGGTTACTGATGAAGAATTGTCCAAGTTGCCATACTTAGGTGCTGTCTTTCACGAAACCTTGCGTAAACACTCTCCAGTTCCAATCGTCCCATTGAGATACGTTGATGAAGATACCGAATTGGGTGGTTATCATATTCCTGCCGGTTCCGAAATCGCTATCAACATTTACGGTTGTAATATGGATTCCAACTTGTGGGAGAACCCAGATCAATGGATCCCTGAAAGATTTTTAGATGAAAAATACGCCCAAGCTGATTTGTATAAGACTATGGCTTTCGGTGGTGGTAAAAGAGTCTGTGCTGGTTCCTTACAAGCTATGTTGATTGCCTGTACTGCTATTGGTAGATTGGTTCAAGAATTTGAATGGGAATTGGGTCACGGTGAAGAAGAAAACGTTGACACCATGGGTTTAACTACCCATAGATTACACCCATTGCAAGTCAAATTAAAGCCAAGAAACAGAATTTACTAA

>SEQ ID NO:16(sr.UGT_g252778)

MATNDDDRKQLHVAMFPWLAFGHILPFLELSKLIAQNGHKVSFLSTTRNIQRLPSHLTPLINLVKLTLPRVQELPEDAEATTDIKHDDQDHLLNASDGLQPEVTRFLEEESPDWIIFDYSYYWLPPVAAELGISRAFFMTFPTWTMALTRLPSDQLTAEDLMTLSKISFKKHEIVNLMYGTSTQGDLYRLTMACNGSDCILIRCCYEFEPQWLTLLEKLLPVPVVPVGLLPPEIHGDEKDDDTWVSVKEWLDGQHKGHVVYVALGSEAMVSKDELGELALGLELSGLPFFWALRKPPGSTESDSVELPDGFMERTRNRGVVWTSWAPQLRILSHESVCGFLTHCGVSSIVEGLMFGHPLIMLPIFGDQIMNAQVLADKQVGIEIPRNEEDGWFTKESVAKSLRSVVVDDEGEIYKANARELSKIFSDTDLGKKYISHFIDFLMMEIVKT*

SEQ ID NO:17(UGT40087版本1)

MDASDSSPLHIVIFPWLAFGHMLASLELAERLAARGHRVSFVSTPRNISRLRPVPPALAPLIDFVALPLPRVDGLPDGAEATSDIPPGKTELHLKALDGLAAPFAAFLDAACADGSTNKVDWLFLDNFQYWAAAAAADHKIPCALNLTFAASTSAEYGVPRVEPPVDGSTASILQRFVLTLEKCQFVIQRACFELEPEPLPLLSDIFGKPVIPYGLVPPCPPAEGHKREHGNAALSWLDKQQPESVLFIALGSEPPVTVEQLHEIALGLELAGTTFLWALKKPNGLLLEADGDILPPGFEERTRDRGLVAMGWVPQPIILAHSSVGAFLTHGGWASTIEGVMSGHPMLFLTFLDEQRINAQLIERKKAGLRVPRREKDGSYDRQGIAGAIRAVMCEEESKSVFAANAKKMQEIVSDRNCQEKYIDELIQRLGSFEK

SEQ ID NO:18(UGT40087版本2)

MDASSSPLHIVIFPWLAFGHMLASLELAERLAARGHRVSFVSTPRNISRLRPVPPALAPLIDFVALPLPRVDGLPDGAEATSDIPPGKTELHLKALDGLAAPFAAFLDAACADGSTNKVDWLFLDNFQYWAAAAAADHKIPCALNLTFAASTSAEYGVPRVEPPVDGSTASILQRFVLTLEKCQFVIQRACFELEPEPLPLLSDIFGKPVIPYGLVPPCPPAEGHKREHGNAALSWLDKQQPESVLFIALGSEPPVTVEQLHEIALGLELAGTTFLWALKKPNGLLLEADGDILPPGFEERTRDRGLVAMGWVPQPIILAHSSVGAFLTHGGWASTIEGVMSGHPMLFLTFLDEQRINAQLIERKKAGLRVPRREKDGSYDRQGIAGAIRAVMCEEESKSVFAANAKKMQEIVSDRNCQEKYIDELIQRLGSFEK

SEQ ID NO:19(来自Os_UGT_91C1的loop2)

EGLPDGAESTNDVPHDRPDMV

SEQ ID NO:20(来自Os_UGT_91C1的loop3_1)

SEFLGTACAD

SEQ ID NO:21(来自Os_UGT_91C1的loop3_2)

SEFLGTACADWVIVDVFHH

SEQ ID NO:22(来自Os_UGT_91C1的loop4_1)

ADRRLERAETESPAAAGQGRPAAAPTFEVARMKLIRTKGSSGM

SEQ ID NO:23(来自Os_UGT_91C1的loop4_2)

MMLLGSAHMIASIADRRLERAETESPAAAGQGRPAAAPTFEVARMKLIRTKGSSGM

SEQ ID NO:24(来自UGT40087的loop2)

DGLPDGAEATSDIPPGKT

SEQ ID NO:25(来自UGT40087的loop3_1)

AAFLDAACADGSTNKVD

SEQ ID NO:26(来自UGT40087的loop3_2)

AAFLDAACADGSTNKVDWLFLDNFQY

SEQ ID NO:27(来自UGT40087的loop4_1)

GVPRVEPPVDGSTA

SEQ ID NO:28(来自UGT40087的loop4_2)

LNLTFAASTSAEYGVPRVEPPVDGSTA

SEQ ID NO:29(来自存在于UGT40087_loop1中的Os_UGT_91C1的经修饰的loop1)

TPRNISRLPPVPPALAP

SEQ ID NO:30(来自存在于Os_UGT_91C1_loop1中的UGT40087的经修饰的loop1)

TPRNISRLRPVRPALAP

SEQ ID NO:31(来自具有SEQ ID NO:8的Os_UGT_91C1的loop1)

TPRNISRLPPVRPALAP

SEQ ID NO:32(来自具有SEQ ID NO:11的UGT40087的loop1)

TPRNISRLRPVPPALAP

SEQ ID NO:33(UGT40087/Si91Dlike嵌合体)

MDASSSPLHIVIFPWLAFGHMLASLELAERLAARGHRVSFVSTPRNISRLRPVPPALAPLIDFVALPLPRVDGLPDGAEATSDIPPGKTELHLKALDGLAAPFAAFLDAACADGSTNKVDWLFLDNFQYWAAAAAADHKIPCALNLTFAASTSAEYGVPRVEPPVDGSTASILQRFVLTLEKCQFVIQRACFELEPEPLPLLSDIFGKPVIPYGLVPPCPPAQGHIEHDNAALSWLDKQQPESVLFIALGSEPPVTVEQLHEIALGLELAGTTFLWALKKPNGLLLEADGDILPPGFEERTRDRGLVAMGWVPQLSILAHSSVGAFLTHGGWSSTIEGAMSGHPMVFLTFLDEQRINAQLIERKKAGLRVPRCEKDGSYDRQGIAGAIRAVMCEEESKSVFAANAKKMQEIINDRKCQERYIDELIQRLRSFEK

SEQ ID NO:34(Os_UGT_91C1_loop4_1)

MDSGYSSSYAAAAGMHVVICPWLAFGHLLPCLDLAQRLASRGHRVSFVSTPRNISRLPPVRPALAPLVAFVALPLPRVEGLPDGAESTNDVPHDRPDMVELHRRAFDGLAAPFSEFLGTACADWVIVDVFHHWAAAAALEHKVPCAMMLLGSAHMIASIGVPRVEPPVDGSTASLAERFSLTLSRSSLVVGRSCVEFEPETVPLLSTLRGKPITFLGLMPPLHEGRREDGEDATVRWLDAQPAKSVVYVALGSEVPLGVEKVHELALGLELAGTRFLWALRKPTGVSDADLLPAGFEERTRGRGVVATRWVPQMSILAHAAVGAFLTHCGWNSTIEGLMFGHPLIMLPIFGDQGPNARLIEAKNAGLQVARNDGDGSFDREGVAAAIRAVAVEEESSKVFQAKAKKLQEIVADMACHERYIDGFIQQLRSYKD

SEQ ID NO:35(具有SEQ ID NO：17的UGT40087的未经优化的核酸序列)

SEQ ID NO:36(UGT40087-1密码子优化的核酸序列)

ATGGATGCTTCCAGTAGTCCTTTACACATCGTTATCTTTCCATGGTTAGCTTTCGGTCATATGTTGGCTTCCTTGGAATTGGCTGAGAGATTGGCTGCTCGTGGTCACAGAGTCTCCTTCGTTTCCACCCCTAGAAACATCTCTAGATTACGTCCAGTTCCACCAGCTTTAGCTCCATTGATTGATTTTGTCGCTTTGCCATTGCCTAGAGTCGATGGTTTACCAGATGGTGCCGAAGCTACCTCTGACATTCCACCAGGTAAGACCGAATTACACTTGAAGGCTTTGGACGGTTTGGCTGCTCCATTCGCCGCTTTTTTGGACGCTGCCTGTGCTGATGGTTCCACCAACAAGGTTGATTGGTTGTTTTTGGACAACTTCCAATACTGGGCTGCCGCTGCCGCTGCTGATCACAAAATTCCTTGCGCCTTAAACTTGACTTTTGCCGCTTCCACCTCCGCTGAATACGGTGTTCCACGTGTTGAACCACCAGTTGACGGTTCCACTGCCTCCATCTTACAAAGATTTGTCTTAACCTTAGAAAAATGTCAATTCGTTATCCAAAGAGCTTGTTTCGAATTGGAACCTGAACCATTGCCATTGTTGTCCGACATTTTCGGTAAGCCAGTCATCCCATACGGTTTAGTTCCTCCATGTCCACCAGCTGAAGGTCACAAAAGAGAACACGGTAACGCTGCTTTGTCCTGGTTGGATAAGCAACAACCAGAATCTGTTTTGTTCATCGCTTTGGGTTCTGAACCACCTGTTACCGTCGAACAATTGCACGAAATCGCTTTGGGTTTAGAATTGGCCGGTACCACCTTCTTGTGGGCCTTGAAAAAGCCAAACGGTTTGTTGTTAGAAGCCGATGGTGATATTTTGCCACCAGGTTTCGAAGAAAGAACTAGAGATAGAGGTTTAGTCGCTATGGGTTGGGTTCCACAACCAATTATCTTGGCCCATTCCTCTGTTGGTGCCTTTTTGACTCACGGTGGTTGGGCCTCCACTATTGAAGGTGTCATGTCCGGTCACCCTATGTTGTTCTTAACCTTCTTGGACGAACAACGTATCAACGCCCAATTGATCGAAAGAAAAAAGGCTGGTTTAAGAGTCCCAAGAAGAGAAAAGGATGGTTCCTACGACAGACAAGGTATTGCTGGTGCTATTAGAGCCGTCATGTGTGAAGAAGAATCTAAGTCTGTCTTCGCTGCTAACGCTAAGAAAATGCAAGAGATCGTTTCTGACAGAAACTGTCAAGAAAAGTACATCGACGAATTGATTCAAAGATTGGGTTCTTTCGAAAAGTAA

Claims

1.能够生成一种或多种甜菊糖苷的经遗传修饰的酿酒酵母(Saccharomycescerevisiae)宿主细胞，其包含编码贝壳杉烯(kaurene)氧化酶的异源核酸，所述贝壳杉烯氧化酶包含与SEQ ID NO：1具有至少80％、85％、90％、或95％序列同一性的氨基酸序列。

2.根据权利要求1所述的经遗传修饰的酿酒酵母宿主细胞，其能够以大于30％、35％、40％、45％、50％、或55％的效率将贝壳杉烯转化为异贝壳杉烯酸(kaurenoic acid)。

3.根据前述权利要求任一项所述的经遗传修饰的酿酒酵母宿主细胞，其中，所述贝壳杉烯氧化酶包含具有SEQ ID NO：1的所述序列的氨基酸序列。

4.根据前述权利要求任一项所述的经遗传修饰的酿酒酵母宿主细胞，其中，所述贝壳杉烯氧化酶能够氧化贝壳杉烯、贝壳杉烯醇(kaurenol)和/或贝壳杉烯醛(kaurenal)的C19位。

5.根据前述权利要求任一项所述的经遗传修饰的酿酒酵母宿主细胞，其中，所述贝壳杉烯氧化酶由异源核酸编码，其中所述异源核酸包含与SEQ ID NO：15具有至少80％、85％、90％、或95％序列同一性的核苷酸序列。

6.根据前述权利要求任一项所述的经遗传修饰的酿酒酵母宿主细胞，其中，所述贝壳杉烯氧化酶由具有SEQ ID NO：15的所述序列的异源核酸编码。

7.根据前述权利要求任一项所述的经遗传修饰的酿酒酵母宿主细胞，其能够以大于30％、35％、40％、45％、50％、或55％的效率将贝壳杉烯转化为异贝壳杉烯酸，和其中所述贝壳杉烯氧化酶包含与SEQ ID NO：1具有至少95％序列同一性的氨基酸序列。

8.根据前述权利要求任一项所述的经遗传修饰的酿酒酵母宿主细胞，其中，所述贝壳杉烯氧化酶是多肽，所述多肽具有与SEQ ID NO：1的功能结构域具有至少80％、85％、90％、或95％序列同一性的功能结构域。

9.根据前述权利要求26所述的经遗传修饰的酿酒酵母宿主细胞，其能够以大于55％的效率将贝壳杉烯转化为异贝壳杉烯酸。

10.根据前述权利要求任一项所述的经遗传修饰的酿酒酵母宿主细胞，其能够生成异贝壳杉烯酸。

11.根据前述权利要求任一项所述的经遗传修饰的酿酒酵母宿主细胞，其能够生成甜菊醇(steviol)。

12.根据前述权利要求任一项所述的经遗传修饰的酿酒酵母宿主细胞，其能够生成RebD。

13.根据前述权利要求任一项所述的经遗传修饰的酿酒酵母宿主细胞，其能够生成RebM。

14.根据前述权利要求任一项所述的经遗传修饰的酿酒酵母宿主细胞，其能够以至少10：1、100：1、或1000：1的比例生成RebM和RebM2。

15.根据前述权利要求任一项所述的经遗传修饰的酿酒酵母宿主细胞，其中，所述经遗传修饰的宿主细胞生成不可检测水平的RebM2。

16.根据前述权利要求任一项所述的经遗传修饰的酿酒酵母宿主细胞，其中，所述经遗传修饰的宿主细胞还包含一种或多种异源核酸，所述一种或多种异源核酸编码制备甜菊醇的途径的一种或多种酶。

17.根据前述权利要求任一项所述的经遗传修饰的酿酒酵母宿主细胞，其中，所述经遗传修饰的宿主细胞还包含一种或多种异源核酸，所述一种或多种异源核酸编码制备甜菊糖苷的途径的一种或多种酶。

18.根据前述权利要求任一项所述的经遗传修饰的酿酒酵母宿主细胞，其中，所述经遗传修饰的宿主细胞还包含一种或多种异源核酸，所述一种或多种异源核酸编码制备RebA的途径的一种或多种酶。

19.根据前述权利要求任一项所述的经遗传修饰的酿酒酵母宿主细胞，其中，所述经遗传修饰的宿主细胞还包含一种或多种异源核酸，所述一种或多种异源核酸编码制备RebM的途径的一种或多种酶。

20.根据前述权利要求任一项所述的经遗传修饰的酿酒酵母宿主细胞，其中，所述经遗传修饰的宿主细胞还包含一种或多种异源核酸，所述一种或多种异源核酸编码制备RebE的途径的一种或多种酶。

21.根据前述权利要求任一项所述的经遗传修饰的酿酒酵母宿主细胞，其中，所述途径的所述一种或多种酶包含香叶基香叶基焦磷酸合酶。

22.根据前述权利要求任一项所述的经遗传修饰的酿酒酵母宿主细胞，其中，所述途径的所述一种或多种酶包含柯巴基焦磷酸合酶。

23.根据前述权利要求任一项所述的经遗传修饰的酿酒酵母宿主细胞，其中，所述途径的所述一种或多种酶包含内根-贝壳杉烯(ent-kaurene)合酶。

24.根据前述权利要求任一项所述的经遗传修饰的酿酒酵母宿主细胞，其中，所述途径的所述一种或多种酶包含异贝壳杉烯酸羟化酶。

25.根据前述权利要求任一项所述的经遗传修饰的酿酒酵母宿主细胞，其中，所述途径的所述一种或多种酶包含细胞色素P450还原酶。

26.根据前述权利要求任一项所述的经遗传修饰的酿酒酵母宿主细胞，其中，所述途径的所述一种或多种酶包含一种或多种尿苷5'-二磷酸依赖性糖基转移酶。

27.根据前述权利要求任一项所述的经遗传修饰的酿酒酵母宿主细胞，其中，所述途径的所述一种或多种酶包含Os_UGT_91C1，Sl_UGT_101249881，UGT40087，sr.UGT_9252778，Bd_UGT10840，Hv_UGT_V1，Bd_UGT10850，或Ob_UGT91B1_like。

28.根据前述权利要求任一项所述的经遗传修饰的酿酒酵母宿主细胞，其中，所述途径的所述一种或多种酶包含UGT74G1，UGT76G1，UGT85C2，UGT91D，或UGT40087或其变体。

29.根据前述权利要求任一项所述的经遗传修饰的酿酒酵母宿主细胞，其中，所述途径的所述一种或多种酶包含香叶基香叶基焦磷酸合酶，柯巴基焦磷酸合酶，内根-贝壳杉烯合酶，贝壳杉烯氧化酶，异贝壳杉烯酸羟化酶，细胞色素P450还原酶，UGT_AD，UGT74G1，UGT76G1，UGT85C2，和UGT91D。

30.根据前述权利要求任一项所述的经遗传修饰的酿酒酵母宿主细胞，其中，所述途径的所述一种或多种酶包含香叶基香叶基焦磷酸合酶，柯巴基焦磷酸合酶，内根-贝壳杉烯合酶，贝壳杉烯氧化酶，异贝壳杉烯酸羟化酶，细胞色素P450还原酶，UGT40087或其变体，UGT74G1，UGT76G1，UGT85C2，和UGT91D。

31.根据前述权利要求任一项所述的经遗传修饰的酿酒酵母宿主细胞，其中，所述UGT40087是根据SEQ ID NO：17、SEQ ID NO：18或SEQ ID NO：33的序列。

32.根据前述权利要求任一项所述的经遗传修饰的酿酒酵母宿主细胞，其中，所述途径的所述一种或多种酶包含双功能的柯巴基焦磷酸合酶和贝壳杉烯合酶。

33.根据前述权利要求任一项所述的经遗传修饰的酿酒酵母宿主细胞，其中，编码所述途径的一种或多种酶的所述一种或多种异源核酸受单一转录调节因子的控制。

34.根据前述权利要求任一项所述的经遗传修饰的酿酒酵母宿主细胞，其中，编码所述途径的一种或多种酶的所述一种或多种异源核酸受多种异源转录调节因子的控制。

35.根据前述权利要求任一项所述的经遗传修饰的酿酒酵母宿主细胞，其中，所述细胞是选自由细菌细胞、真菌细胞、藻类细胞、昆虫细胞、和植物细胞组成的组。

36.根据前述权利要求任一项所述的经遗传修饰的酿酒酵母宿主细胞，其中，所述细胞是酵母细胞。

37.根据前述权利要求任一项所述的经遗传修饰的酿酒酵母宿主细胞，其中，所述酵母是酿酒酵母(Saccharomyces cerevisiae)。

38.生成异贝壳杉烯酸的方法：

(a)在适于制备RebD的条件下，在含有碳源的培养基中培养前述权利要求任一项所述的经遗传修饰的酿酒酵母宿主细胞群；和

(b)从所述培养基中回收所述异贝壳杉烯酸化合物。

39.生成RebD的方法：

(a)在适于制备RebD的条件下，在含有碳源的培养基中培养前述权利要求任一项所述的经遗传修饰的宿主细胞群；和

(b)从所述培养基中回收所述RebD化合物。

40.生成RebM的方法：

(a)在适于制备RebM的条件下，在含有碳源的培养基中培养前述权利要求任一项所述的经遗传修饰的宿主细胞群；和

(b)从所述培养基中回收所述RebM化合物。

41.生成异贝壳杉烯酸的方法：

(a)在适于形成异贝壳杉烯酸的条件下，使贝壳杉烯与前述权利要求任一项所述的贝壳杉烯氧化酶接触，所述贝壳杉烯氧化酶能够将贝壳杉烯转化为异贝壳杉烯酸；和

(b)从所述培养基中回收所述异贝壳杉烯酸化合物。

42.发酵组合物，其包含：

(a)经遗传修饰的宿主细胞，其包含：

(i)异源核酸，所述异源核酸编码前述权利要求任一项所述的贝壳杉烯氧化酶，所述贝壳杉烯氧化酶能够将贝壳杉烯转化为异贝壳杉烯酸；和

(b)由所述经遗传修饰的宿主细胞生成的甜菊糖苷类化合物。

43.根据权利要求42所述的发酵组合物，其中所述甜菊糖苷类化合物包含RebA、RebD和RebM，其RebA：RebD：RebM之比为至少1：7：50。

44.非天然存在的贝壳杉烯氧化酶，其与SEQ ID NO：1具有至少80％、85％、90％、或95％序列同一性。

45.非天然存在的贝壳杉烯氧化酶，其能够在体内以大于30％、35％、40％、45％、50％、或55％的效率将贝壳杉烯转化为异贝壳杉烯酸。

46.非天然存在的核酸，其编码权利要求44或45所述的非天然存在的贝壳杉烯氧化酶。

47.生成甜菊糖苷的方法：

(a)在适于制备甜菊糖苷的条件下，在含有碳源的培养基中培养前述权利要求任一项所述的经遗传修饰的宿主细胞群。