CN113631698A

CN113631698A - 用于高效生成瑞鲍迪苷的abc转运蛋白

Info

Publication number: CN113631698A
Application number: CN202080023632.3A
Authority: CN
Inventors: G·A·维克曼; S·隆德; J·勒尔曼; 江汉笑; 熊一
Original assignee: Amyris Inc
Current assignee: Amyris Inc
Priority date: 2019-01-24
Filing date: 2020-01-23
Publication date: 2021-11-09
Also published as: BR112021014143A2; KR20210120027A; MX2021008747A; WO2020154549A3; CA3127249A1; AU2020211408A1; EP3914700A2; WO2020154549A2; JP7518838B2; US20220106619A1; JP2022523665A; SG11202107656TA

Abstract

本发明提供了用于改进甜菊糖苷生成量的经遗传修饰的宿主细胞、组合物和方法。在一些实施方案，所述宿主细胞经遗传修饰以包含异源核酸表达盒，所述异源核酸表达盒表达能够将甜菊糖苷转运至细胞外空间或转运至细胞内细胞器的腔空间的ABC转运蛋白。在一些实施方案，所述宿主细胞进一步包含一种或多种异源核苷酸序列，所述一种或多种异源核苷酸序列编码能够在所述宿主细胞中生成一种或多种甜菊糖苷的途径的其他酶。本发明所述的宿主细胞、组合物和方法提供了异源生成甜菊糖苷(包括但不限于，瑞鲍迪苷D和瑞鲍迪苷M)的有效途径。

Description

用于高效生成瑞鲍迪苷的ABC转运蛋白

1.相关申请的交叉引用

本申请要求并享有于2019年1月24日提交的、发明名称为“ABC TRANSPORTERS FORTHE HIGH EFFICIENCY PRODUCTION OF REBAUDIOSIDES”的美国临时专利申请序列号62/796,228的优先权，此临时申请的内容在此通过引用完全并入本申请。

2.发明领域

本发明涉及特定的ABC转运蛋白(ABC-transporter)、包含所述ABC转运蛋白的宿主细胞，以及其用于生成甜菊醇和/或瑞鲍迪苷(包括瑞鲍迪苷D和瑞鲍迪苷M)的方法。

3.发明背景

需要源自天然来源的低热量甜味剂来限制高糖消耗对健康的影响。甜叶菊植物(Stevia rebaudiana Bertoni)产生多种甜味的糖基化二萜，称为甜菊糖苷(steviolglycoside)。在所有已知的甜菊糖苷中，Reb M的效力最高(比蔗糖甜约200-300倍)，并具有最吸引人的风味特征。然而，Reb M仅由甜叶菊植物少量生成，并且仅占甜菊糖苷总含量的一小部分(<1.0％)，因此从甜菊叶中分离Reb M是不切实际的。需要其他获得Reb M的方法。其中一种方法是应用合成生物学来设计微生物(例如，酵母)，其可从可持续原料来源生成大量Reb M。

为了使用合成生物技术经济地生成产品，从原料到产品的生物转化中的每个步骤均需具有高转化效率(理想情况下>90％)。在我们对酵母进行工程改造以生成RebM时，我们注意到Reb M的细胞溶质积聚抑制了工程化到酵母中的甜菊糖苷代谢途径，从而限制了发酵运行的总产量。此种抑制可能是由于参与甜菊糖苷生物合成的一种或多种酶的产物抑制或终产物抑制所致。因此，需要减轻产物抑制的新机制，以提高生物合成Reb M生成量的转化效率。

4.发明摘要

本发明提供了用于改进Reb M的生成量的经遗传修饰的宿主细胞、组合物和方法。所述这些组合物和方法部分基于某些异源ABC转运蛋白在宿主细胞中的表达，所述宿主细胞经遗传修饰以生成甜菊糖苷类化合物，例如Reb M。所述这些ABC转运蛋白能够将某些甜菊糖苷，优选Reb M和/或相关的高分子量甜菊糖苷瑞鲍迪苷D(Reb D)，从胞质溶胶转运至细胞外空间或转运至亚细胞器的腔内，例如酵母液泡。某些甜菊糖苷(如Reb D和Reb M)的螯合可通过减轻由甜菊糖苷积聚引起的产物抑制来提高甜菊糖苷代谢途径的效率。

在本发明的一个方面，本发明提供了经遗传修饰的宿主细胞及其用于生成工业上有用的化合物的方法。一方面，本发明提供了能够生成一种或多种甜菊糖苷(steviolglycoside)的经遗传修饰的宿主细胞，其中所述宿主细胞包含编码ABC转运蛋白的异源核酸，所述ABC转运蛋白具有与选自由下列组成的组的氨基酸序列具有至少80％序列同一性的氨基酸序列：SEQ ID NO：1、SEQ ID NO：2、SEQ ID NO：3、SEQ ID NO：4、SEQ ID NO：5、SEQID NO：6、SEQ ID NO：7、SEQ ID NO：8、SEQ ID NO：28、SEQ ID NO：29、和SEQ ID NO：30。

在本发明的一个实施方案中，所述ABC转运蛋白具有氨基酸序列，所述氨基酸序列具有选自由下列组成的组的序列：SEQ ID NO：1、SEQ ID NO：2、SEQ ID NO：3、SEQ ID NO：4、SEQ ID NO：5、SEQ ID NO：6、SEQ ID NO：7、SEQ ID NO：8、SEQ ID NO：28、SEQ ID NO：29、和SEQ ID NO：30。在另一实施方案，本发明的所述经遗传修饰的宿主细胞包含核酸，所述核酸编码香叶基香叶基焦磷酸合酶(GGPPS)、内根-柯巴基焦磷酸合酶(ent-copalylpyrophosphate synthase，CPS)、内根-贝壳杉烯合酶(ent-kaurene synthase，KS)、内根-贝壳杉烯19-氧化酶(ent-kaurene 19-oxidase，KO)、内根-异贝壳杉烯酸13-羟化酶(ent-kaurenoic acid 13-hydroxylase，KAH)、细胞色素p450还原酶(CPR)、以及一种或多种UDP-葡萄糖基转移酶(UGT)。在进一步的实施方案，所述一种或多种UDP-葡萄糖基转移酶(UGT)选自EUGT11、UGT85C2、UGT74G1、UGT91D_like3、UGT76G1、和UGT40087。在本发明的另一实施方案中，所述香叶基香叶基焦磷酸合酶(GGPPS)具有与SEQ ID NO：9具有至少80％序列同一性的氨基酸序列，所述内根-柯巴基焦磷酸合酶(CPS)具有与SEQ ID NO：10具有至少80％序列同一性的氨基酸序列，所述内根-贝壳杉烯合酶(KS)具有与SEQ ID NO：11具有至少80％序列同一性的氨基酸序列，所述内根-贝壳杉烯19-氧化酶(KO)具有与SEQ ID NO：12具有至少80％序列同一性的氨基酸序列，所述内根-异贝壳杉烯酸13-羟化酶(KAH)具有与SEQ IDNO：13具有至少80％序列同一性的氨基酸序列，所述细胞色素p450还原酶(CPR)具有与SEQID NO：14具有至少80％序列同一性的氨基酸序列，和所述一种或多种UDP-葡萄糖基转移酶(UGT)具有与选自由下列组成的组的氨基酸序列具有至少80％序列同一性的氨基酸序列：SEQ ID NO：15、SEQ ID NO：16、SEQ ID NO：17、SEQ ID NO：18、SEQ ID NO：19、SEQ ID NO：27。

在本发明的特定实施方案中，所述香叶基香叶基焦磷酸合酶(GGPPS)具有SEQ IDNO：9的氨基酸序列，所述内根-柯巴基焦磷酸合酶(CPS)具有SEQ ID NO：10的氨基酸序列，所述内根-贝壳杉烯合酶(KS)具有SEQ ID NO：11的氨基酸序列，所述内根-贝壳杉烯19-氧化酶(KO)包含SEQ ID NO：12的氨基酸序列，所述内根-异贝壳杉烯酸13-羟化酶(KAH)包含SEQ ID NO：13的氨基酸序列，所述细胞色素p450还原酶(CPR)包含SEQ ID NO：14的氨基酸序列，和所述一种或多种UDP-葡萄糖基转移酶(UGT)包含选自由下列组成的组的氨基酸序列：SEQ ID NO：15、SEQ ID NO：16、SEQ ID NO：17、SEQ ID NO：18、SEQ ID NO：19、SEQ IDNO：27。

在实施方案中，所述宿主细胞选自细菌细胞、真菌细胞、藻类细胞、昆虫细胞和植物细胞。在另一实施方案，所述宿主细胞是酿酒酵母(Saccharomyces cerevisiae)细胞。

在本发明的实施方案中，所述ABC转运蛋白具有氨基酸序列，所述氨基酸序列具有SEQ ID NO：1的所述序列。

在另一实施方案，所述ABC转运蛋白具有氨基酸序列，所述氨基酸序列具有SEQ IDNO：2的所述序列。

在进一步的实施方案，所述ABC转运蛋白具有氨基酸序列，所述氨基酸序列具有SEQ ID NO：3的所述序列。

又在另一实施方案，所述ABC转运蛋白具有氨基酸序列，所述氨基酸序列具有SEQID NO：4的所述序列。

在附加实施方案，所述ABC转运蛋白具有氨基酸序列，所述氨基酸序列具有SEQ IDNO：5的所述序列。

在实施方案中，所述ABC转运蛋白具有氨基酸序列，所述氨基酸序列具有SEQ IDNO：6的所述序列。

在另一实施方案，所述ABC转运蛋白具有氨基酸序列，所述氨基酸序列具有SEQ IDNO：7的所述序列。

又在另一实施方案，所述ABC转运蛋白具有氨基酸序列，所述氨基酸序列具有SEQID NO：8的所述序列。

又在另一实施方案，所述ABC转运蛋白具有氨基酸序列，所述氨基酸序列具有SEQID NO：28的所述序列。

又在另一实施方案，所述ABC转运蛋白具有氨基酸序列，所述氨基酸序列具有SEQID NO：29的所述序列。

又在另一实施方案，所述ABC转运蛋白具有氨基酸序列，所述氨基酸序列具有SEQID NO：30的所述序列。

在本发明的实施方案中，所述一种或多种甜菊糖苷选自瑞鲍迪苷A(Reb A)、瑞鲍迪苷B(Reb B)、Reb D、瑞鲍迪苷E(Reb E)、或Reb M。在另一实施方案，所述一种或多种甜菊糖苷包含Reb M。

在一个实施方案，大部分所述一种或多种甜菊糖苷积聚在细胞器的腔内。在另一实施方案，大部分所述一种或多种甜菊糖苷积聚在细胞外。

另一方面，本发明提供了表达ABC转运蛋白的异源核酸表达盒的核酸序列。在实施方案中，所述异源核酸表达盒的所述核苷酸序列具有SEQ ID NO：20、SEQ ID NO：21、SEQ IDNO：22、SEQ ID NO：23、SEQ ID NO：24、SEQ ID NO：25、SEQ ID NO：26、或SEQ ID NO：27的编码序列，其中所述编码序列可操作地连接至异源启动子。

另一方面，本发明提供了生成甜菊醇或一种或多种甜菊糖苷的方法，其包含：在适于制备甜菊醇或一种或多种甜菊糖苷的条件下，在含有碳源的培养基中培养本发明所述的宿主细胞的种群以生成培养液(culture broth)；和从所述培养液回收所述甜菊醇或一种或多种甜菊糖苷。

另一方面，本发明提供了生成Reb D的方法，其包含：在适于制备Reb D的条件下，在含有碳源的培养基中培养本发明所述的宿主细胞的种群以生成培养液；和从所述培养液回收所述Reb D化合物。

另一方面，本发明提供了生成Reb M的方法，其包含：在适于制备Reb M的条件下，在含有碳源的培养基中培养本发明所述的宿主细胞的种群以生成培养液；和从所述培养液回收所述Reb M化合物。

5.附图简要说明

图1是示出从天然酵母代谢物法呢基焦磷酸(FPP)到甜菊醇的酶促途径的示意图。

图2是示出从甜菊醇到瑞鲍迪苷M的酶促途径的示意图。

图3是用于将转运蛋白插入Reb M菌株的着陆垫(landing pad)DNA构建体的示意图。构建体的每一端均包含来自酵母SFM1基因下游的500bp DNA序列，以促进此基因座处的同源重组。在此基因座处插入着陆垫不会删除任何基因。着陆垫包含全长GAL1启动子，然后是F-CphI核酸内切酶的识别位点及来自原生酵母基因HEM13的终止子。

图4是上清液中存在的Reb D+Reb M的百分比图表。具有不同过表达转运蛋白的酵母菌株均在微量滴定板中生长。此图报告了去除细胞后在上清液中检测到的Reb D+Reb M(以微摩尔为单位)的百分比。亲本菌株不包含过表达的转运蛋白。将上清液中测得的Reb D+Reb M的量除以全细胞培养液中测得的Reb D+Reb M的量，得到上清液中Reb D+Reb M的百分比。

图5是全细胞培养液中总甜菊糖苷相对于亲本的图表。具有不同过表达转运蛋白的酵母菌株均在微量滴定板中生长。此图报告了相对于亲本菌株，在全细胞培养液(细胞和上清液)中检测到的所有甜菊糖苷(以微摩尔为单位)的总和。亲本菌株不包含过表达的转运蛋白。

图6是全细胞培养液中Reb D+Reb M的量相对于亲本的图表。具有不同过表达转运蛋白的酵母菌株均在微量滴定板中生长。此图报告了相对于亲本菌株，在全细胞培养液(细胞和上清液)中检测到的Reb D+Reb M(以微摩尔为单位)的总和。亲本菌株不包含过表达的转运蛋白。

图7是上清液中总甜菊糖苷相对于亲本的图表。具有不同过表达转运蛋白的酵母菌株均在微量滴定板中生长。此图报告了相对于亲本菌株，在去除细胞后在上清液中检测到的所有甜菊糖苷(以微摩尔为单位)的总和。亲本菌株不包含过表达的转运蛋白。

图8示出了所生成的所有甜菊糖苷位于上清液中的百分比。具有不同过表达转运蛋白的酵母菌株均在微量滴定板中生长。此图报告了在上清液中检测到的由细胞生成的所有甜菊糖苷的百分比(以微摩尔为单位)。将上清液中测得的总甜菊糖苷的量除以全细胞培养液中测得的总甜菊糖苷的量，得到上清液中总甜菊糖苷的百分比。

图9是全细胞培养液中Reb D+Reb M的量相对于亲本的图表。表达GFP标记及未标记版本的BPT1和T4_Fungal_5转运蛋白的酵母菌株均在微量滴定板中生长。比较了GFP标记及未标记版本的转运蛋白的相对活性。数据表明，转运蛋白的GFP标记版本与未标记版本的行为相似。

图10是一组表达GFP标记的BPT1的酵母的明场(A)和荧光(B)图像的显微照片。

图11是一组表达GFP标记的T4_Fungal_5转运蛋白的酵母的明场(A)和荧光(B)图像的显微照片。

图12是全细胞培养液中Reb M的量相对于具有野生型T4_Fungal_5的亲本的图表。经由易错PCR及选择得到的表达转运蛋白T4_Fungal_5及其变体(分离株_1-8(Isolate_1–8))的酵母菌株均在微量滴定板中生长。此图报告了相对于未诱变的T4_Fungal_5，在表达经诱变的T4_Fungal_5转运蛋白变体(分离株_1-8)的酵母菌株的全细胞培养液(细胞和上清液)中检测到的Reb M滴度(以微摩尔为单位)。数据表明，与T4_Fungal_5相比，分离株_1-8的表达使得酵母菌株的Reb M生成量提高。

图13是全细胞培养液中总甜菊糖苷的Reb M比例相对于具有野生型T4_Fungal_5的亲本的图表。经由易错PCR及选择得到的表达转运蛋白T4_Fungal_5及其变体(分离株_1-8(Isolate_1–8))的酵母菌株均在微量滴定板中生长。此图报告了相对于未诱变的T4_Fungal_5，在表达经诱变的T4_Fungal_5转运蛋白变体(分离株_1-8)的酵母菌株的全细胞培养液(细胞和上清液)中检测到的Reb M与所有甜菊糖苷总和的比率(以微摩尔为单位)。数据表明，与T4_Fungal_5转运蛋白相比，分离株_1-8的表达使得所有甜菊糖苷中Reb M的占比增加。换言之，分离株_1-8显示出对Reb M的底物偏好增加。

图14是由表达T4_Fungal_5或Fungal_5_muA转运蛋白的菌株生成的全细胞培养液和上清液级分中Reb M的量的图表。在PGAL3(强度低于PGAL1)的控制下表达T4_Fungal_5或Fungal_5_muA的酵母菌株均在微量滴定板中生长。此图报告了在酵母菌株的全细胞培养液(细胞和上清液)及上清液级分中检测到的Reb M滴度(以微摩尔为单位)。数据证实，当在酵母菌株中表达时，Fungal_5_muA确实赋予了改进的性能：当两种转运蛋白均在较低的启动子强度下表达时，具有Fungal_5_muA的菌株比具有野生型T4_Fungal_5的菌株在全细胞培养液中生成多30％的Reb M以及多40％的细胞外Reb M。

图15是全细胞培养液中Reb M的量相对于具有Fungal_5_muA的亲本的图表。表达转运蛋白Fungal_5_muA及其8个变体的酵母菌株均在微量滴定板中生长，其中1、2或3个突变回复为野生型T4_Fungal_5序列。此图报告了在表达相对于Fungal_5_muA的8个Fungal_5_muA变体的酵母菌株的全细胞培养液(细胞和上清液)中检测到的Reb M滴度(以微摩尔为单位)。数据证明了不同突变对Reb M生成量的影响，尤其有趣的是E1320V回复的有益作用。

图16是全细胞培养液中总甜菊糖苷相对于具有Fungal_5_muA的亲本的图表。表达转运蛋白Fungal_5_muA及其8个变体的酵母菌株均在微量滴定板中生长，其中1、2或3个突变回复为野生型T4_Fungal_5序列。此图报告了在表达相对于Fungal_5_muA的8个Fungal_5_muA变体的酵母菌株的全细胞培养液(细胞和上清液)中检测到的所有甜菊糖苷的总和(以微摩尔为单位)。数据证明了不同突变对TSG生成量的影响。结合图15，其不仅说明了活性差异，还说明了底物偏好。

6.具体实施方式

6.1术语定义

本发明使用的术语“异源的/异源性/异源”是指通常在自然界中不存在的物质。术语“异源核苷酸序列”是指自然界中在给定细胞中通常不存在的核苷酸序列。因此，异源核苷酸序列可以是：(a)相对于其宿主细胞是外源的(即，对所述细胞而言是“外源的”)；(b)天然存在于所述宿主细胞中(即“内源性/內源的/內源”)，但在所述细胞中以非天然量存在(即，比所述宿主细胞中天然存在的量更多或更少)；或(c)天然存在于所述宿主细胞中，但位于其天然基因座之外。

另一方面，本发明使用的术语“原生的/天然的(native)”或“内源的/内源性/內源”涉及分子，特别是酶和核酸，表示在它们起源或在自然界中发现的生物体中表达的分子。应理解，原生酶或原生多核苷酸的表达可在重组微生物中进行修饰。

本发明使用的术语“异源核酸表达盒(cassette)”是指包含编码序列的核酸序列，所述编码序列可操作地连接至足以在宿主细胞中表达所述编码序列的一个或多个调节元件。在实施方案中，“ABC转运蛋白表达盒”是指异源核酸表达盒，其中所述异源核酸包含ABC转运蛋白多肽的所述编码序列。调节元件的非限制性实例包括启动子、增强子、沉默子、终止子和多聚腺苷酸加尾(poly-A)信号。

本发明使用的术语“ABC转运蛋白”和“ATP结合盒转运蛋白”是指膜相关多肽的超家族，其将三磷酸腺苷(ATP)水解与各种底物跨生物膜的易位偶联。

本发明使用的术语“CEN.PK.BPT1”是指ABC转运蛋白，其具有以下氨基酸序列(SEQID NO：1)：

MSSLEVVDGCPYGYRPYPDSGTNALNPCFISVISAWQAVFFLLIGSYQLWKLYKNNKVPPRFKNFPTLPSKINSRHLTHLTNVCFQSTLIICELALVSQSSDRVYPFILKKALYLNLLFNLGISLPTQYLAYFKSTFSMGNQLFYYMFQILLQLFLILQRYYHGSSNERLTVISGQTAMILEVLLLFNSVAIFIYDLCIFEPINELSEYYKKNGWYPPVHVLSYITFIWMNKLIVETYRNKKIKDPNQLPLPPVDLNIKSISKEFKANWELEKWLNRNSLWRAIWKSFGRTISVAMLYETTSDLLSVVQPQFLRIFIDGLNPETSSKYPPLNGVFIALTLFVISVVSVFLTNQFYIGIFEAGLGIRGSLASLVYQKSLRLTLAERNEKSTGDILNLMSVDVLRIQRFFENAQTIIGAPIQIIVVLTSLYWLLGKAVIGGLVTMAIMMPINAFLSRKVKKLSKTQMKYKDMRIKTITELLNAIKSIKLYAWEEPMMARLNHVRNDMELKNFRKIGIVSNLIYFAWNCVPLMVTCSTFGLFSLFSDSPLSPAIVFPSLSLFNILNSAIYSVPSMINTIIETSVSMERLKSFLLSDEIDDSFIERIDPSADERALPAIEMNNITFLWKSKEVLTSSQSGDNLRTDEESIIGSSQIALKNIDHFEAKRGDLVCVVGRVGAGKSTFLKAILGQLPCMSGSRDSIPPKLIIRSSSVAYCSQESWIMNASVRENILFGHKFDQDYYDLTIKACQLLPDLKILPDGDETLVGEKGISLSGGQKARLSLARAVYSRADIYLLDDILSAVDAEVSKNIIEYVLIGKTALLKNKTIILTTNTVSILKHSQMIYALENGEIVEQGNYEDVMNRKNNTSKLKKLLEEFDSPIDNGNESDVQTEHRSESEVDEPLQLKVTESETEDEVVTESELELIKANSRRASLATLRPRPFVGAQLDSVKKTAQKAEKTEVGRVKTKIYLAYIKACGVLGVVLFFLFMILTRVFDLAENFWLKYWSESNEKNGSNERVWMFVGVYSLIGVASAAFNNLRSIMMLLYCSIRGSKKLHESMAKSVIRSPMTFFETTPVGRIINRFSSDMDAVDSNLQYIFSFFFKSILTYLVTVILVGYNMPWFLVFNMFLVVIYIYYQTFYIVLSRELKRLISISYSPIMSLMSESLNGYSIIDAYDHFERFIYLNYEKIQYNVDFVFNFRSTNRWLSVRLQTIGATIVLATAILALATMNTKRQLSSGMVGLLMSYSLEVTGSLTWIVRTTVTIETNIVSVERIVEYCELPPEAQSINPEKRPDENWPSKGGIEFKNYSTKYRENLDPVLNNINVKIEPCEKVGIVGRTGAGKSTLSLALFRILEPTEGKIIIDGIDISDIGLFDLRSHLAIIPQDAQAFEGTVKTNLDPFNRYSEDELKRAVEQAHLKPHLEKMLHSKPRGDDSNEEDGNVNDILDVKINENGSNLSVGQRQLLCLARALLNRSKILVLDEATASVDMETDKIIQDTIRREFKDRTILTIAHRIDTVLDSDKIIVLDQGSVREFDSPSKLLSDKTSIFYSLCEKGGYLK*；并由以下核酸序列（SEQ ID NO：20）编码：

ATGTCTTCACTAGAAGTGGTAGATGGGTGCCCCTATGGATACCGACCATATCCAGATAGTGGCACAAATGCATTAAATCCATGTTTTATATCAGTAATATCCGCCTGGCAAGCCGTCTTTTTCCTATTGATTGGTAGCTATCAATTGTGGAAACTTTATAAGAACAATAAAGTACCACCCAGATTTAAGAACTTTCCTACATTACCAAGTAAAATCAACAGTCGACATCTAACGCATTTGACCAATGTTTGCTTTCAGTCCACGCTTATAATTTGTGAACTGGCCTTGGTATCCCAATCTAGCGATAGGGTTTATCCATTTATACTAAAGAAGGCTCTGTACTTGAATCTCCTTTTCAATTTGGGTATTTCTCTCCCTACTCAATACTTAGCTTATTTTAAAAGTACATTTTCAATGGGCAACCAGCTTTTCTATTACATGTTTCAAATTCTTCTACAGCTCTTCTTGATATTGCAGAGGTACTATCATGGTTCTAGTAACGAAAGGCTTACTGTTATTAGCGGACAAACTGCTATGATTTTAGAAGTGCTCCTTCTTTTCAATTCTGTGGCAATTTTTATTTATGATCTATGCATTTTTGAGCCAATTAACGAATTATCTGAATACTACAAGAAAAATGGGTGGTATCCCCCCGTTCATGTACTATCCTATATTACATTTATCTGGATGAACAAACTGATTGTGGAAACTTACCGTAACAAGAAAATCAAAGATCCTAACCAGTTACCATTGCCGCCAGTAGATCTGAATATTAAGTCGATAAGTAAGGAATTTAAGGCTAACTGGGAATTGGAAAAATGGTTGAATAGAAATTCTCTTTGGAGGGCCATTTGGAAGTCATTTGGTAGGACTATTTCTGTGGCTATGCTGTATGAAACGACATCTGATTTACTTTCTGTAGTACAGCCCCAGTTTCTACGGATATTCATAGATGGTTTGAACCCGGAAACATCTTCTAAATATCCTCCTTTAAATGGTGTATTTATTGCTCTAACCCTTTTCGTAATCAGCGTGGTTTCTGTGTTCCTCACCAATCAATTTTATATTGGAATTTTTGAGGCTGGTTTGGGGATAAGAGGCTCTTTAGCTTCTTTAGTGTATCAGAAGTCCTTAAGATTGACGCTAGCAGAGCGTAACGAAAAATCTACTGGTGACATCTTAAATTTGATGTCTGTGGATGTGTTAAGGATCCAGCGGTTTTTCGAAAATGCCCAAACCATTATTGGCGCTCCTATTCAGATTATTGTTGTATTAACTTCCCTGTACTGGTTGCTAGGAAAGGCTGTTATTGGAGGGTTGGTTACTATGGCTATTATGATGCCTATCAATGCCTTCTTATCTAGAAAGGTAAAAAAGCTATCAAAAACTCAAATGAAGTATAAGGACATGAGAATCAAGACTATTACAGAGCTTTTGAATGCTATAAAATCTATTAAATTATACGCCTGGGAGGAACCTATGATGGCAAGATTGAATCATGTTCGTAATGATATGGAGTTGAAAAATTTTCGGAAAATTGGTATAGTGAGCAATCTGATATATTTTGCGTGGAATTGTGTACCTTTAATGGTGACATGTTCCACATTTGGCTTATTTTCTTTATTTAGTGATTCTCCGTTATCTCCTGCCATTGTCTTCCCTTCATTATCTTTATTTAATATTTTGAACAGTGCCATCTATTCCGTTCCATCCATGATAAATACCATTATAGAGACAAGCGTTTCTATGGAAAGATTAAAGTCATTCCTACTTAGTGACGAAATTGATGATTCGTTCATCGAACGTATTGATCCTTCAGCGGATGAAAGAGCGTTACCTGCTATAGAGATGAATAATATTACATTTTTATGGAAATCAAAAGAAGTATTAACATCTAGCCAATCTGGAGATAATTTGAGGACAGATGAAGAGTCTATTATCGGATCTTCTCAAATTGCGTTGAAGAATATCGATCATTTTGAAGCAAAAAGGGGTGATTTAGTTTGTGTTGTTGGTCGGGTAGGAGCTGGTAAATCAACATTTTTGAAGGCAATTCTTGGTCAACTTCCTTGCATGAGTGGTTCTAGGGACTCGATACCACCTAAACTGATCATTAGATCATCGTCTGTAGCCTACTGTTCACAAGAATCCTGGATAATGAACGCATCTGTAAGAGAAAACATTCTATTTGGTCACAAGTTCGACCAAGATTATTATGACCTCACTATTAAAGCATGTCAATTGCTACCCGATTTGAAAATACTACCAGATGGTGATGAAACTTTGGTAGGTGAAAAGGGCATTTCCCTATCAGGCGGTCAGAAGGCCCGTCTTTCATTAGCCAGAGCGGTGTACTCGAGAGCAGATATTTATTTGTTGGATGACATTTTATCTGCTGTTGATGCAGAAGTTAGTAAAAATATTATTGAATATGTTTTGATCGGAAAGACGGCTTTATTAAAAAATAAAACAATTATTTTAACTACCAATACTGTATCAATTTTAAAACATTCGCAGATGATATATGCGCTAGAAAACGGTGAAATTGTTGAACAAGGGAATTATGAGGATGTAATGAACCGTAAGAACAATACTTCAAAACTGAAAAAATTACTAGAGGAATTTGATTCTCCGATTGATAATGGAAATGAAAGCGATGTCCAAACTGAACACCGATCCGAAAGTGAAGTGGATGAACCTCTGCAGCTTAAAGTAACTGAATCAGAAACTGAGGATGAGGTTGTTACTGAGAGTGAATTAGAACTAATCAAAGCCAATTCTAGAAGAGCTTCTCTAGCTACGCTAAGACCTAGACCCTTTGTGGGAGCACAATTGGATTCCGTGAAGAAAACGGCGCAAAAGGCCGAGAAGACAGAGGTGGGAAGAGTCAAAACAAAGATTTATCTTGCGTATATTAAGGCTTGTGGAGTTTTAGGTGTTGTTTTATTTTTCTTGTTTATGATATTAACAAGGGTTTTCGACTTAGCAGAGAATTTTTGGTTAAAGTACTGGTCAGAATCTAATGAAAAAAATGGTTCAAATGAAAGGGTTTGGATGTTTGTTGGTGTGTATTCCTTAATCGGAGTAGCATCGGCCGCATTCAATAATTTACGGAGTATTATGATGCTACTGTATTGTTCTATTAGGGGTTCTAAGAAACTGCATGAAAGCATGGCCAAATCTGTAATTAGAAGTCCTATGACTTTCTTTGAGACTACACCAGTTGGAAGGATCATAAACAGGTTCTCATCTGATATGGATGCAGTGGACAGTAATCTACAGTACATTTTCTCCTTTTTTTTCAAATCAATACTAACCTATTTGGTTACTGTTATATTAGTCGGGTACAATATGCCATGGTTTTTAGTGTTCAATATGTTTTTGGTGGTTATCTATATTTACTATCAAACATTTTACATTGTGCTATCTAGGGAGCTAAAAAGATTGATCAGTATATCTTACTCTCCGATTATGTCCTTAATGAGTGAGAGCTTGAACGGTTATTCTATTATTGATGCATACGATCATTTTGAGAGATTCATCTATCTAAATTATGAAAAAATCCAATACAACGTTGATTTTGTCTTCAACTTTAGATCAACGAATAGATGGTTATCCGTGAGATTGCAAACTATTGGTGCTACAATTGTTTTGGCTACTGCAATCTTAGCACTAGCAACAATGAATACTAAAAGGCAACTAAGTTCGGGTATGGTTGGTCTACTAATGAGCTATTCATTAGAGGTTACAGGTTCATTGACTTGGATTGTAAGGACAACTGTGACGATTGAAACCAACATTGTATCAGTGGAGAGAATTGTTGAGTACTGCGAATTACCACCTGAAGCACAGTCCATTAACCCTGAAAAGAGGCCAGATGAAAATTGGCCATCAAAGGGTGGTATTGAATTCAAAAACTATTCCACAAAATACAGAGAAAATTTGGATCCAGTGCTGAATAATATTAACGTGAAGATTGAGCCATGTGAAAAGGTTGGGATTGTTGGCAGAACAGGTGCAGGGAAGTCTACACTGAGCCTGGCATTATTTAGAATACTAGAACCTACCGAAGGTAAAATTATTATTGACGGCATTGATATATCCGACATAGGTCTGTTCGATTTAAGAAGCCATTTGGCAATTATTCCTCAGGATGCACAAGCTTTTGAAGGTACAGTAAAGACCAATTTGGACCCTTTCAATCGTTATTCAGAAGATGAACTTAAAAGGGCTGTTGAGCAGGCACATTTAAAGCCTCATCTGGAAAAAATGCTGCACAGTAAACCAAGAGGTGATGATTCTAATGAAGAGGATGGCAATGTTAATGATATTCTGGATGTCAAGATTAATGAGAACGGTAGTAACTTGTCAGTGGGGCAAAGACAACTACTATGTTTGGCAAGAGCGCTGCTAAACCGTTCCAAAATATTGGTCCTTGATGAAGCAACGGCTTCTGTGGATATGGAAACCGATAAAATTATCCAAGACACTATAAGAAGAGAATTTAAGGACCGTACCATCTTAACAATTGCACATCGTATCGACACTGTATTGGACAGTGATAAGATAATTGTTCTTGACCAGGGTAGTGTGAGGGAATTCGATTCACCCTCGAAATTGTTATCCGATAAAACGTCTATTTTTTACAGTCTTTGTGAGAAAGGTGGGTATTTGAAATAA。

本发明使用的术语“T4_Fungal_1”是指ABC转运蛋白，其具有以下氨基酸序列(SEQID NO：2)：MSLELSNSTLCDSYWAVDDFTACGRQLVESWVSVPLVLSALVVAFNLLRNSLASEKTDPYSKLDAEQQPLLQNGHALYTSSIESDNTDIFQRHFDIALLKPVKDDGKPIGVVRIVYRDTAEKLKVALEEILLISQTVLAFLALSRLEDISESRFLLVKYINFSLWLYLTVITSARLLNVTKGFSANRVDLWYHCAILYNLQWFNSVMLFRSALLHHVSGTYGYWFYVTQFVINTLLCLTNGLEKLSDKPAIVYEEEGVIPSPETTSSLIDIMTYGYLDKMVFSSYWKPITMEEVWGLRYDDYSHDVLIRFHKLKSSIRFTLRLFLQFKKELALQTLCTCIEALLIFVPPLCLKKILEYIESPHTKSRSMAWFYVLIMFGSGVIACSFSGRGLFLGRRICTRMRSILIGEIYSKALRRRLGSTDKEKTTEEEDDKSAKSKKEDEPSNKELGGIINLMAVDAFKVSEIGGYLHYFPNSFVMAAVAIYMLYKLLGWSSLIGTATLIAILPINYMLVEKLSKYQKQMLLVTDKRIQKTNEAFQNIRIIKYFAWEDKFADTIMKIREEELGYLVGRCVVWALLIFLWLVVPTIVTLITFYAYTVIQGNPLTSPIAFTALSLFTLLRGPLDALADMLSMVMQCKVSLDRVEDFLNEPETTKYQQLSAPRGPNSPLIGFENATFYWSKNSKAEFALKDLNIDFKVGKLNVVIGPTGSGKSSLLLALLGEMDLDKGNVFLPGAIPRDDLTPNPVTGLMESVAYCSQTAWLLNATVKDNIIFASPFNQERYDAVIHACGLTRDLSILEAGDETEIGEKGITLSGGQKQRVSLARALYSSASYLLLDDCLSAVDSHTAVHIYDYCINGELMKGRTCILVSHNVSLTVKEADFVVMMDNGRIKAQGSVDELMQEGLLNEEVVKSVMQSRSASTANLAALDDNSPISSEAIAEGLAKKTQKPEQSKKSKLIEDETKSDGSVKPEIYYAYFRYFGNPALWIMIAFLFIGSQSVNVYQSYWLRRWSAIEDKRDLSAFSNSNDMTLFLFPTFHSINWHRPLVNYALQPFGLAVEERSTMYYITIYTLIGLAFATLGSSRVILTFIGGLNVSRKIFKDLLDKLLHAKLRFFDQTPIGRIMNRFSKDIEAIDQELALYAEEFVTYLISCLSTLVVVCAVTPAFLVAGVLILLVYYGVGVLYLELSRDLKRFESITKSPIHQHFSETLVGMTTIRAYGDERRFLKQNFEKIDVNNRPFWYVWVNNRWLAYRSDMIGAFIIFFAAAFAVAYSDKIDAGLAGISLSFSVSFRYTAVWVVRMYAYVEMSMNSVERVQEYIEQTPQEPPKYLPQDPVNSWPSNGVIDVQNICIRYSPELPRVIDNVSFHVNAGEKIGVVGRTGAGKSTIITSFFRFVDLESGSIKIDGLDISKIGLKPLRKGLTIIPQDPTLFSGTIRSNLDIFGEYGDLQMFEALRRVNLISVDDYQRIVDGNGAAVADETAQARGDNVNKFLDLDSTVSEGGGNLSQGERQLLCLARSILKMPKILMLDEATASIDYESDAKIQATIREEFSSSTVLTIAHRLKTIIDYDKILLLDHGKVKEYDHPYKLITNKKSDFRKMCQDTGEFDDLVNLAKQAYRK*；并由以下核酸序列(SEQ ID NO：21)编码：

本发明使用的术语“T4_Fungal_10”是指ABC转运蛋白，其具有以下氨基酸序列(SEQ ID NO：3)：

MGQSERAALIAFASRNTTECWLCRDKEGFGPISYYGDFTVCFIDGVLLNFAALFMLIFGTYQVVKLSKKEHPGIKYRRDWLLFSRITLVGCFLLFTSMAAYYSSEKHESIALTSQYTLTLMSIFVALMLHWVEYHRSRISNGIVLFYWLFETLFQGSKWVNFSIRHAYNLNHEWPVSYSVYILTIFQTISAFMILILEAGFEKPLPSYQRVIESYSKQKRNPVDNSHIFQRLSFSWMTELMKTGYKKYLTEQDLYKLPKSFGAKEISHKFSERWQYQLKHKANPSLAWALLSTFGGKILLGGIFKVAYDILQFTQPQLLRILIKFVSDYTSTPEPQLPLVRGVMLSIAMFVVSVVQTSILHQYFLNAFDTGMHIKSGMTSVIYQKALVLSSEASASSSTGDIVNLMSVDVQRLQDLTQWGQIIWSGPFQIILCLVSLYKLLGPCMWVGVIIMIIMIPINSVIVRIQKKLQKIQMKNKDERTRVTSEILNNIKSLKVYGWEIPYKAKLDHVRNDKELKNLKKMGCTLALASFQFNIVPFLVSCSTFAVFVFTEDRPLSTDLVFPALTLFNLLSFPLAVVPNAISSFIEASVSVNRLYAFLTNEELQTDAVHREPKVNNIGDEGVKVSDATFLWQRKPEYKVALKNINFSAKKGELTCIVGKVGSGKSALIQSLLGDLIRVKGYAAVHGSVAYVSQVAWIMNGTVKDNIIFGHKYDPEFYELTIKACALAIDLSMLPDGDQTLVGEKGISLSGGQKARLSLARAVYARADTYLLDDPLAAVDEHVAKHLIEHVLGPHGLLHSKTKVLATNKISVLSIADSITLMENGEIIQQGTYEETNNTTDSPLSKLISEFGKKGKATPSQSTTSLTKLATSDLGSSSDSKVSDVSIDVSQLDTENLTEAEELKSLRRASMATLGSIGFDDDENIARREHREQGKVKWDIYMEYARACNPRSVCVFLFFIVLSMLLSVLGNFWLKHWSEVNTGEGYNPHAARYLLIYFALGVGSALATLIQTIVLWVFCTIHGSRYLHDAMATSVLKAPMSFFETTPIGRILNRFSNDIYKVDEVLGRTFSQFFANVVKVSFTIIVICMATWQFIFIILPLSVLYIYYQQYYLRTSRELRRLDSVTRSPIYAHFQETLGGLTTIRGYSQQTRFVHINQTRVDNNMSAFYPSVNANRWLAFRLEFIGSIIILGSSMLAVIRLGNGTLTAGMIGLSLSFALQITQSLNWIVRMTVEVETNIVSVERIKEYAELKSEAPYIIEDHRPPASWPEKGDVKFVNYSTRYRPELELILKDINLHILPKEKIGIVGRTGAGKSSLTLALFRIIEAASGHIIIDGIPIDSIGLADLRHRLSIIPQDSQIFEGTIRENIDPSKQYTDEQIWDALELSHLKNHVKNMGPDGLETMLSEGGGNLSVGQRQLMCLARALLISSKILVLDEATAAVDVETDQLIQKTIREAFKERTILTIAHRINTIMDSDRIIVLDKGRVTEFDTPANLLNKKDSIFYSLCVEAGLAE*；并由以下核酸序列(SEQ ID NO：22)编码：

本发明使用的术语“T4_Fungal_2”是指ABC转运蛋白，其具有以下氨基酸序列(SEQID NO：4)：MSSLEVVDGCPYGYRPYPDSGTNALNPCFISVISAWQAVFFLLIGSYQLWKLYKNNKVPPRFKNFPTLPSKINSRHLTHLTNVCFQSTLIICELALVSQSSDRVYPFILKKALYLNLLFNLGISLPTQYLAYFKSTFSMGNQLFYYMFQILLQLFLILQRYYHGSSNERLTVISGQTAMILEVLLLFNSVAIFIYDLCIFEPINELSEYYKKNGWYPPVHVLSYITFIWMNKLIVETYRNKKIKDPNQLPLPPVDLNIKSISKEFKANWELEKWLNRNSLWRAIWKSFGRTISVAMLYETTSDLLSVVQPQFLRIFIDGFNPETSSKYPPLNGVFIALTLFVISVVSVFLTNQFYIGIFEAGLGIRGSLASLVYQKSLRLTLAERNEKSTGDILNLMSVDVLRIQRFFENAQTIIGAPIQIIVVLTSLYWLLGKAVVGGLVTMAIMMPINAFLSRKVKKLSKTQMKYKDMRIKTITELLNAIKSIKLYAWEEPMMARLNHVRNDMELKNFRKIGIVSNLIYFAWNCVPLMVTCSTFGLFSLFSDSPLSPAIVFPSLSLFNILNSAIYSVPSMINTIIETSVSMERLKSFLLSDEIDDSFIERIDPSADERALPAIEMNNITFLWKSKEVLASSQSGDNLRTDEESIIGSSQIALKNIDHFEAKRGDLVCVVGRVGAGKSTFLKAILGQLPCMSGSRDSIPPKLIIRSSSVAYCSQESWIMNASVRENILFGHKFDQNYYDLTIKACQLLPDLKILPDGDETLVGEKGISLSGGQKARLSLARAVYSRADIYLLDDILSAVDAEVSKNIIEYVLIGKTALLKNKTIILTTNTVSILKHSQMIYALENGEIVEQGNYEDVMNRKNNTSKLKKLLEEFDSPIDNGNESDVQTEHRSESEVDEPLQLKVTESETEDEVVTESELELIKANSRRASLATLRPRPFVGAQLDSVKKTAQEAEKTEVGRVKTKVYLAYIKACGVLGVVLFFLFMILTRVFDLAENFWLKYWSESNEKNGSNERVWMFVGVYSLIGVASAAFNNLRSIMMLLYCSIRGSKKLHESMAKSVIRSPMTFFETTPVGRIINRFSSDMDAVDSNLQYIFSFFFKSILTYLVTVILVGYNMPWFLVFNMFLVVIYIYYQTFYIVLSRELKRLISISYSPIMSLMSESLNGYSIIDAYDHFERFIYLNYEKIQYNVDFVFNFRSTNRWLSVRLQTIGATIVLATAILALATMNTKRQLSSGMVGLLMSYSLEVTGSLTWIVRTTVMIETNIVSVERIVEYCELPPEAQSINPEKRPDENWPSKGGIEFKNYSTKYRENLDPVLNNINVKIEPCEKVGIVGRTGAGKSTLSLALFRILEPTEGKIIIDGIGISDIGLFDLRSHLAIIPQDAQAFEGTVKTNLDPFNRYSEDELKRAVEQAHLKPHLEKMLHSKPRGDDSNEEDGNVNDILDVKINENGSNLSVGQRQLLCLARALLNRSKILVLDEATASVDMETDKIIQDTIRREFKDRTILTIAHRIDTVLDSDKIIVLDQGSVREFDSPSKLLSDKTSIFYSLCEKGGYLK*；并由以下核酸序列(SEQ ID NO：23)编码：

本发明使用的术语“T4_Fungal_3”是指ABC转运蛋白，其具有以下氨基酸序列(SEQID NO：5)：MNSYNESAPTGCSFWDNDDISPCIRKSLLDSYLPAAIVVGSLLYLLLIGAQQIKTHRKLYAKDETQPLLEPANGSPTDYSNTYGTIDYEEEQSTAELTTSQKHFDISRLEPLKDDGTPLGLVKYVQRDGWEKVKLILEFVILIFQLVIAVVALFVPSLNQEWEGYKLTPIVRVFVWIFLFALGSIRALNKSGPFPLANISLLYYIVNIVPSALSFRSVLIHPQNSQLVNYYYSFQFINNTLLFLLLGSARVFDHPSVLFDTDDGVKPSPENNSNFFEIVTYSWIDPLIFKAYKTPLQFNDIWGLRIDDYAYFLLRRFKDLGFTRTFTYKIFYFSKGDLAAQALWASIDSMLIFGPSLLLKRILEYVDNPGMTSRNMAWLYVLTMFFIQISDSLVSGRSLYLGRRVCIRMKALIIGEVYAKALRRRMTSPEELIEEVDPKDGKAPIADQTSKEESKSTELGGIINLMAVDASKVSELCSYLHFFVNSFFMIIVAVTLLYRLLGWSALAGSSSILILLPLNYKLASKIGEFQKEMLGITDNRIQKLNEAFQSIRIIKFFAWEENFAKEIMKVRNEEIRYLRYRVIVWTCSAFVWFITPTLVTLISFYFYVVFQGKILTTPVAFTALSLFNLLRSPLDQLSDMLSFMVQSKVSLDRVQKFLEEQESDKYEQLTHTRGANSPEVGFENATLSWNKGSKNDFQLKDIDIAFKVGKLNVIIGPTGSGKTSLLLGLLGEMQLTNGKIFLPGSTPRDELIPNPETGMTEAVAYCSQIAWLLNDTVKNNIVFAAPFNQQRYDAVIDACGLTRDLKVLDAGDATEIGEKGITLSGGQKQRVSLARALYSNARHVLLDDCLSAVDSHTAAWIYENCITGPLMKDRTCILVSHNVALTVRDAAWIVAMDNGRVLEQGTCEDLLSSGSLGHDDLVSTVISSRSQSSVNLKQLNVSDTSEIHQKLKKIAESDKADQLDEERLSPRGKLIEDETKSSGAVSWEVYKFYGRAFGGVFIWFVFVAAFAASQGSNIMQSVWLKIWAAANDKLVSPAFTMSIDRSLNALKEGFRASVASVEWSRPLGGEMFRVYGEESSHSSGYYITIYALIGLSYALISAFRVYVVFMGGIVASNKIFEDMLTKIFNAKLRFFDSTPIGRIMNRFSKDTESIDQELAPYAEGFIVSVLQCGATILLICIITPGFIVFAAFIVIIYYYIGALYLASSRELKRYDSITVSPIHQHFSETLVGVTTIRAYGDERRFMRQNLEKIDNNNRSFFYLWVANRWLALRVDFVGALVSLLSAAFVMLSIGHIDAGMAGLSLSYAIAFTQSALWVVRLYSVVEMNMNSVERLEEYLNIDQEPDREIPDNKPPSSWPETGEIEVDDVSLRYAPSLPKVIKNVSFKVEPRSKIGIVGRTGAGKSTIITAFFRFVDPESGSIKIDGIDITSIGLKDLRNAVTIIPQDPTLFTGTIRSNLDPFNQYSDAEIFESLKRVNLVSTDEPTSGSSSDNIEDSNENVNKFLNLNNTVSEGGSNLSQGQRQLTCLARSLLKSPKIILLDEATASIDYNTDSKIQTTIREEFSDSTILTIAHRLRSIIDYDKILVMDAGRVVEYDDPYKLISDQNSLFYSMCSNSGELDTLVKLAKEAFIAKRNKK*；并由以下核酸序列(SEQ IDNO：24)编码：

本发明使用的术语“T4_Fungal_4”是指ABC转运蛋白，其具有以下氨基酸序列(SEQID NO：6)：MSSLEVVDGCPYGYRPYPDSGTNALNPCFISVISAWQAVFFLLIGSYQLWKLYKNNKVPPRFKNFPTLPSKINSRHLTHLTNVCFQSTLIICELALVSQSSDRVYPFILKKALYLNLLFNLGISLPTQYLAYFKSTFSMGNQLFYYMFQILLQLFLILQRYYHGSSNERLTVISGQTAMILEVLLLFNSVAIFIYDLCIFEPINELSEYYKKNGWYPPVHVLSYITFIWMNKLIVETYRNKKIKDPNQLPLPPVDLNIKSISKEFKANWELEKWLNRNSLWRAIWKSFGRTISVAMLYETTSDLLSVVQPQFLRIFIDGFNPETSSKYPPLNGVFIALTLFVISVVSVFLTNQFYIGIFEAGLGIRGSLASLVYQKSLRLTLAERNEKSTGDILNLMSVDVLRIQRFFENAQTIIGAPIQIIVVLTSLYWLLGKAVIGGLVTMAIMMPINAFLSRKVKKLSKTQMKYKDMRIKTITELLNAIKSIKLYAWEEPMMARLNHVRNDMELKNFRKIGIVSNLIYFAWNCVPLMVTCSTFGLFSLFSDSPLSPAIVFPSLSLFNILNSAIYSVPSMINTIIETSVSMERLKSFLLSDEIDDSFIERIDPSADERALPAIEMNNITFLWKSKEVLASSQSRDNLRTDEESIIGSSQIALKNIDHFEAKRGDLVCVVGRVGAGKSTFLKAILGQLPCMSGSRDSIPPKLIIRSSSVAYCSQESWIMNASVRENILFGHKFDQNYYDLTIKACQLLPDLKILPDGDETLVGEKGISLSGGQKARLSLARAVYSRADIYLLDDILSAVDAEVSKNIIEYVLIGKTALLKNKTIILTTNTVSILKHSQMIYALENGEIVEQGNYEDVMNRKNNTSKLKKLLEEFDSPIDNGNESDVQTEHRSESEVDEPLQLKVTESETEDEVVTESELELIKANSRRASLATLRPRPFVGAQLDSVKKTAQEAEKTEVGRVKTKVYLAYIKACGVLGVVLFFLFMILTRVFDLAENFWLKYWSESNEKNGSNERVWMFVGVYSLIGVASAAFNNLRSIMMLLYCSIRGSKKLHESMAKSVIRSPMTFFETTPVGRIINRFSSDMDAVDSNLQYIFSFFFKSILTYLVTVILVGYNMPWFLVFNMFLVVIYIYYQTFYIVLSRELKRLISISYSPIMSLMSESLNGYSIIDAYDHFERFIYLNYEKIQYNVDFVFNFRSTNRWLSVRLQTIGATIVLATAILALATMNTKRQLSSGMVGLLMSYSLEVTGSLTWIVRTTVMIETNIVSVERIVEYCELPPEAQSINPEKRPDENWPSKGGIEFKNYSTKYRENLDPVLNNINVKIEPCEKVGIVGRTGAGKSTLSLALFRILEPTEGKIIIDGIDISDIGLFDLRSHLAIIPQDAQAFEGTVKTNLDPFNRYSEDELKRAVEQAHLKPHLEKMLHSKPRGDDSNEEDGNVNDILDVKINENGSNLSVGQRQLLCLARALLNRSKILVLDEATASVDMETDKIIQDTIRREFKDRTILTIAHRIDTVLDSDKIIVLDQGSVREFDSPSKLLSDKTSIFYSLCEKGGYLK*；并由以下核酸序列(SEQ ID NO：25)编码：

本发明使用的术语“T4_Fungal_5”是指ABC转运蛋白，其具有以下氨基酸序列(SEQID NO：7)：MTSPGSEKCTPRSDEDLERSEPQLQRRLLTPFLLSKKVPPIPKEDERKPYPYLKTNPLSQILFWWLNPLLRVGYKRTLDPNDFYYLEHSQDIETTYSNYEMHLARILEKDRAKARAKDPTLTDEDLKNREYPKNAVIKALFLTFKWKYLWSIFLKLLSDIVLVLNPLLSKALINFVDEKMYNPDMSVGRGVGYAIGVTFMLGTSGILINHFLYLSLTVGAHCKAVLTTAIMNKSFRASAKSKHEYPSGRVTSLMSTDLARIDLAIGFQPFAITVPVPIGVAIALLIVNIGVSALAGIAVFLVCIVVISASSKSLLKMRKGANQYTDARISYMREILQNMRIIKFYSWEDAYEKSVVTERNSEMSIILKMQSIRNFLLALSLSLPAIISMVAFLVLYGVSNDKNPGNIFSSISLFSVLAQQTMMLPMALATGADAKIGLERLRQYLQSGDIEKEYEDHEKPGDRDVVLPDNVAVELNNASFIWEKFDDADDNDGNSEKTKEVVVTSKSSLTDSSHIDKSTDSADGEYIKSVFEGFNNINLTIKKGEFVIITGPIGSGKSSLLVALAGFMKKTSGTLGVNGTMLLCGQPWVQNCTVRDNILFGLEYDEARYDRVVEVCALGDDLKMFTAGDQTEIGERGITLSGGQKARINLARAVYANKDIILLDDVLSAVDARVGKLIVDDCLTSFLGDKTRILATHQLSLIEAADRVIYLNGDGTIHIGTVQELLESNEGFLKLMEFSRKSESEDEEDVEAANEKDVSLQKAVSVVQEQDAHAGVLIGQEERAVNGIEWDIYKEYLHEGRGKLGIFAIPTIIMLLVLDVFTSIFVNVWLSFWISHKFKARSDGFYIGLYVMFVILSVIWITAEFVVMGYFSSTAARRLNLKAMKRVLHTPMHFLDVTPMGRILNRFTKDTDVLDNEIGEQARMFLHPAAYVIGVLILCIIYIPWFAIAIPPLAILFTFITNFYIASSREVKRIEAIQRSLVYNNFNEVLNGLQTLKAYNATSRFMEKNKRLLNRMNEAYLLVIANQRWISVNLDLVSCCFVFLISMLSVFRVFDINASSVGLVVTSVLQIGGLMSLIMRAYTTVENEMNSVERLCHYANKLEQEAPYIMNETKPRPTWPEHGAIEFKHASMRYREGLPLVLKDLTISVKGGEKIGICGRTGAGKSTIMNALYRLTELAEGSITIDGVEISQLGLYDLRSKLAIIPQDPVLFRGTIRKNLDPFGQNDDETLWDALRRSGLVEGSILNTIKSQSKDDPNFHKFHLDQTVEDEGANFSLGERQLIALARALVRNSKILILDEATSSVDYETDSKIQKTISTEFSHCTILCIAHRLKTILTYDRILVLEKGEVEEFDTPRVLYSKNGVFRQMCERSEITSADFV*；并由以下核酸序列(SEQ ID NO：26)编码：

本发明使用的术语“T4_Fungal_8”是指ABC转运蛋白，其具有以下氨基酸序列(SEQID NO：8)：MSGSNSNSNLDAISDSCPFWRYDDITECGRVQYINYYLPITLVGVSLLYLFKNAIQHYYRKPQEIKPSVASELLGSNLTDLPNENKPLLSESTQALYTNPDSNKTGFSLKEEHFSINKVTLTEIHSNKHDAVKIVRRNWLEKLRVFLEWVLCALQLCIYISVWSKYTNTQEDFPMHASISGLMLWSLLLLVVSLRLANINQNISWINSGPGNLWALSFACYLSLFCGSVLPLRSIYIGHITDEIASTFYKLQFYLSLTLFLLLFTSQAGNRFAIIYKSTPDITPSPEPIVSIASYITWAWVDKFLWKAHQNYIEMKDVWGLMVEDYSILVIKRFNHFVQNKTKSRTFSFNLIHFFMKFIAIQGAWATISSVISFVPTMLLRRILEYVEDQSTAPLNLAWMYIFLMFLARILTAICAAQALFLGRRVCIRMKAIIISEIYSKALRRKISPNSTKEPTDVVDPQELNDKQHVDGDEESATTANLGAIINLMAVDAFKVSEICAYLHSFIEAIIMTIVALFLLYRLIGWSALVGSAMIICFLPLNFKLASLLGTLQKKSLAITDKRIQKLNEAFQAIRIIKFFSWEENFEKDIQNTRDEELNMLLKRSIVWALSSLVWFITPSIVTSASFAVYIYVQGQTLTTPVAFTALSLFALLRNPLDMLSDMLSFVIQSKVSLDRVQEFLNEEETKKYEQLTVSRNKLGLQNATFTWDKNNQDFKLKNLTIDFKIGKLNVIVGPTGSGKTSLLMGLLGEMELLNGKVFVPSLNPREELVVEADGMTNSIAYCSQAAWLLNDTVRNNILFNAPYNENRYNAVISACGLKRDFEILSAGDQTEIGEKGITLSGGQKQRVSLARSLYSSSRHLLLDDCLSAVDSHTALWIYENCITGPLMEGRTCVLVSHNVALTLKNADWVIIMENGRVKEQGEPVELLQKGSLGDDSMVKSSILSRTASSVNISETNSKISSGPKAPAESDNANEESTTCGDRSKSSGKLIAEETKSNGVVSLDVYKWYAVFFGGWKMISFLCFIFLFAQMISISQAWWLRAWASNNTLKVFSNLGLQTMRPFALSLQGKEASPVTLSAVFPNGSLTTATEPNHSNAYYLSIYLGIGVFQALCSSSKAIINFVAGIRASRKIFNLLLKNVLYAKLRFFDSTPIGRIMNRFSKDIESIDQELTPYMEGAFGSLIQCVSTIIVIAYITPQFLIVAAIVMLLFYFVAYFYMSGARELKRLESMSRSPIHQHFSETLVGITTIRAFSDERRFLVDNMKKIDDNNRPFFYLWVCNRWLSYRIELIGALIVLAAGSFILLNIKSIDSGLAGISLGFAIQFTDGALWVVRLYSNVEMNMNSVERLKEYTTIEQEPSNVGALVPPCEWPQNGKIEVKDLSLRYAAGLPKVIKNVTFTVDSKCKVGIVGRTGAGKSTIITALFRFLDPETGYIKIDDVDITTIGLKRLRQSITIIPQDPTLFTGTLKTNLDPYNEYSEAEIFEALKRVNLVSSEELGNPSTSDSTSVHSANMNKFLDLENEVSEGGSNLSQGQRQLICLARSLLRCPKVILLDEATASIDYNSDSKIQATIREEFSNSTILTIAHRLRSIIDYDKILVMDAGEVKEYDHPYSLLLNRDSIFYHMCEDSGELEVLIQLAKESFVKKLNAN；并由以下核酸序列(SEQ ID NO：27)编码：

ATGTCAGGTTCAAATTCGAATTCAAATCTAGATGCAATAAGTGATTCATGCCCATTTTGGCGCTATGATGATATTACAGAGTGTGGAAGAGTGCAGTATATCAATTACTACCTTCCAATAACATTGGTAGGCGTTTCTCTCTTGTATTTATTCAAAAACGCGATCCAACATTATTACAGAAAGCCTCAAGAAATTAAGCCTAGTGTTGCTTCCGAATTATTGGGCTCAAATCTCACAGACCTTCCGAATGAAAACAAGCCTTTACTATCGGAGAGTACACAAGCATTATACACTAATCCGGATTCGAATAAGACAGGATTCTCTCTAAAAGAGGAGCATTTCTCTATAAATAAAGTTACACTTACGGAAATTCATTCCAATAAGCATGACGCTGTGAAGATCGTAAGGAGAAACTGGCTTGAAAAATTAAGAGTGTTCTTAGAATGGGTTCTATGCGCCTTACAACTTTGCATCTACATTTCAGTCTGGTCGAAATACACTAATACCCAAGAGGATTTCCCAATGCACGCATCTATCTCAGGTCTAATGTTATGGTCTCTACTCTTGTTAGTAGTGTCATTGAGGTTGGCAAACATCAACCAGAATATAAGCTGGATCAATTCAGGACCGGGAAACTTATGGGCCCTTTCATTTGCATGTTATCTATCACTATTCTGCGGATCCGTTTTGCCATTGAGATCTATCTATATCGGTCATATCACAGATGAAATTGCATCAACATTTTATAAGTTGCAATTTTACCTAAGTTTGACACTATTCTTGTTACTTTTCACCTCTCAAGCGGGAAATCGGTTTGCCATTATCTATAAAAGTACACCAGATATAACACCGTCTCCTGAACCTATTGTGTCGATTGCAAGTTATATCACTTGGGCATGGGTAGATAAATTTCTTTGGAAAGCGCATCAAAATTATATCGAAATGAAAGATGTTTGGGGTCTAATGGTGGAAGACTATTCCATTCTCGTAATAAAGAGATTCAATCATTTTGTTCAGAATAAAACCAAGTCTAGGACATTTTCATTTAACTTAATCCACTTTTTCATGAAATTTATCGCCATTCAAGGTGCCTGGGCAACAATTTCGTCAGTTATTAGTTTTGTTCCAACAATGTTGCTCAGACGTATTTTGGAGTATGTTGAAGATCAATCAACTGCTCCATTAAATTTGGCTTGGATGTATATTTTTCTTATGTTCCTTGCCAGAATTTTAACTGCCATATGTGCTGCTCAGGCGCTATTTTTAGGGAGAAGGGTTTGTATCAGAATGAAGGCTATCATAATTTCTGAAATCTACTCCAAGGCTTTGAGAAGAAAAATTTCTCCAAATTCCACTAAGGAGCCAACTGATGTCGTTGATCCACAGGAATTAAATGACAAACAACACGTTGATGGAGATGAAGAATCAGCAACCACTGCAAATCTTGGTGCTATCATTAATTTGATGGCGGTGGATGCTTTCAAAGTATCCGAAATATGTGCGTATTTGCACTCCTTTATAGAGGCGATCATCATGACCATTGTTGCATTATTCCTTTTATATCGGTTAATAGGCTGGTCTGCTTTAGTTGGTAGTGCAATGATTATTTGCTTCTTACCATTGAACTTCAAACTTGCCAGCTTGTTAGGGACACTCCAAAAGAAATCCTTGGCAATCACAGATAAAAGAATTCAGAAACTAAACGAAGCTTTCCAGGCCATTCGTATTATCAAATTCTTCTCTTGGGAAGAGAATTTTGAAAAGGACATACAAAACACAAGGGATGAAGAATTAAATATGCTTTTAAAAAGGTCTATCGTTTGGGCTCTTTCTTCTCTTGTTTGGTTCATTACCCCCTCTATTGTCACATCCGCTTCTTTTGCAGTCTATATTTATGTGCAAGGCCAAACTTTAACTACTCCGGTAGCATTTACTGCACTATCTCTATTTGCTCTACTAAGAAATCCGTTAGACATGCTTTCTGATATGTTGTCTTTTGTTATTCAATCCAAGGTCTCTTTGGATAGAGTCCAAGAATTTTTAAATGAAGAGGAGACGAAAAAGTATGAGCAATTAACCGTATCAAGAAATAAACTTGGGTTGCAAAACGCTACTTTTACATGGGATAAAAATAATCAAGATTTCAAGTTAAAAAACCTAACTATTGATTTCAAAATTGGGAAATTAAACGTTATTGTAGGTCCAACTGGATCTGGTAAAACATCATTGTTAATGGGATTATTGGGTGAAATGGAGCTATTGAACGGAAAAGTTTTCGTCCCTTCGCTCAATCCTAGGGAAGAGTTGGTTGTAGAGGCCGATGGAATGACTAATTCAATCGCGTACTGCTCCCAAGCTGCCTGGTTGCTAAATGATACTGTCAGGAACAATATTCTATTCAATGCGCCTTATAATGAGAATAGATATAATGCCGTCATCTCTGCGTGTGGTTTGAAACGCGACTTCGAGATCTTAAGCGCTGGTGATCAGACAGAGATTGGCGAAAAGGGTATAACACTTTCTGGTGGTCAAAAACAAAGAGTCTCGTTGGCCAGATCATTGTATTCTTCATCAAGACATTTGCTGTTAGATGATTGTTTGAGTGCCGTAGACTCGCACACGGCCTTATGGATCTACGAAAATTGTATAACAGGCCCATTAATGGAAGGAAGAACATGTGTATTGGTTTCTCACAATGTTGCATTAACTTTAAAAAATGCAGATTGGGTTATCATTATGGAAAATGGTAGAGTAAAAGAACAAGGCGAACCAGTAGAATTGCTACAGAAGGGGTCCCTTGGGGATGACTCCATGGTGAAATCATCAATTTTGTCCCGTACGGCGTCCTCAGTTAATATTTCAGAAACTAACAGTAAGATTTCTAGTGGTCCGAAGGCTCCAGCGGAATCGGATAATGCCAATGAGGAGTCCACCACCTGTGGAGATCGTTCAAAGTCAAGCGGCAAGCTAATCGCTGAAGAAACAAAATCAAACGGTGTTGTTTCCCTGGACGTCTATAAGTGGTATGCCGTGTTTTTCGGTGGATGGAAGATGATATCATTTTTGTGTTTCATTTTCTTGTTTGCCCAAATGATCAGTATTTCACAGGCCTGGTGGTTGCGTGCTTGGGCCTCCAACAACACTCTAAAAGTTTTCTCCAACCTTGGATTGCAAACAATGAGGCCATTCGCTTTGTCCTTACAAGGAAAAGAAGCTTCTCCTGTGACTCTTAGTGCTGTTTTCCCAAATGGCAGTCTAACAACAGCCACGGAACCAAATCACTCGAACGCGTATTATCTATCAATATATTTGGGTATTGGTGTATTCCAGGCTTTATGTTCATCTTCGAAAGCAATTATAAACTTTGTGGCCGGTATTAGAGCTTCCAGGAAAATATTCAATTTATTGTTGAAAAATGTGTTATACGCCAAGCTGAGATTTTTTGATTCTACTCCAATAGGAAGAATAATGAACAGATTTTCTAAAGACATCGAATCAATAGATCAAGAATTGACTCCTTATATGGAAGGTGCATTTGGTTCCTTAATACAATGTGTTTCCACAATTATCGTCATTGCATACATTACTCCCCAATTTTTGATTGTCGCGGCGATTGTCATGTTATTGTTTTATTTTGTTGCCTACTTTTACATGTCAGGAGCAAGAGAATTAAAGCGTCTTGAATCGATGTCACGCTCTCCTATTCATCAGCACTTCTCTGAGACTCTTGTGGGTATCACGACTATTCGAGCATTTTCTGACGAGCGGCGTTTTCTGGTTGATAATATGAAGAAAATTGATGATAATAATAGGCCTTTCTTTTACTTATGGGTCTGTAATAGATGGCTATCTTACAGAATCGAGCTGATAGGCGCCCTTATTGTTTTGGCTGCAGGTAGTTTCATCTTATTGAACATAAAATCGATCGATTCTGGTTTGGCCGGTATTTCATTGGGTTTCGCTATACAATTTACCGATGGTGCCCTTTGGGTTGTTAGGTTATATTCCAACGTTGAAATGAATATGAATTCCGTCGAAAGGTTAAAAGAGTACACCACCATCGAGCAAGAACCTTCTAACGTTGGTGCCTTGGTACCTCCTTGCGAATGGCCACAAAATGGTAAAATCGAAGTCAAGGATTTATCTTTACGCTATGCAGCTGGTCTACCAAAGGTTATAAAAAATGTCACATTCACCGTCGATTCAAAGTGTAAAGTAGGTATTGTTGGCAGGACTGGTGCTGGTAAATCTACTATTATCACAGCCCTTTTCAGATTCTTAGACCCTGAAACTGGTTATATCAAAATCGATGACGTTGATATAACAACCATTGGTTTAAAACGTTTGCGCCAATCTATCACTATTATTCCACAGGACCCAACCCTTTTCACCGGTACTTTGAAAACCAATCTCGATCCATACAACGAATATTCGGAAGCTGAAATTTTCGAAGCTCTAAAACGTGTCAACCTTGTTTCCTCAGAAGAACTTGGTAATCCTTCTACTTCGGATTCAACCTCGGTACATTCAGCAAATATGAATAAGTTTTTGGATTTGGAAAATGAAGTCAGTGAAGGTGGTTCCAACCTCTCACAAGGACAACGTCAATTGATATGTTTGGCCCGTTCATTATTGCGGTGTCCAAAGGTAATTCTACTTGATGAAGCCACAGCTTCAATCGATTATAACTCAGACTCTAAAATCCAGGCTACTATAAGGGAAGAATTCAGTAATAGTACCATTCTCACGATTGCTCATCGTTTACGATCAATTATTGATTATGATAAAATACTTGTTATGGATGCTGGGGAGGTTAAAGAATATGATCATCCTTACTCCTTATTGTTGAATCGTGATAGTATATTCTATCATATGTGTGAAGATAGTGGAGAATTAGAAGTCTTGATACAATTAGCCAAAGAATCATTTGTCAAAAAGCTCAATGCAAATTGA。

本发明使用的术语“亲本细胞”是指与本发明公开的经遗传修饰的宿主细胞具有相同遗传背景的细胞，除了其不包含工程化到所述经修饰的宿主细胞中的一种或多种特定遗传修饰，譬如，选自由以下组成的组的一种或多种修饰：甜菊醇途径的酶的异源表达，甜菊糖苷途径的酶的异源表达，香叶基香叶基焦磷酸合酶的异源表达，柯巴基焦磷酸合酶的异源表达，贝壳杉烯合酶的异源表达，贝壳杉烯氧化酶(例如，豌豆(Pisum sativum)贝壳杉烯氧化酶)的异源表达，甜菊醇合酶(异贝壳杉烯酸羟化酶)的异源表达，细胞色素P450还原酶的异源表达，EUGT11的异源表达，UGT74G1的异源表达，UGT76G1的异源表达，UGT85C2的异源表达，UGT91D的异源表达，和UGT40087或其变体的异源表达。

本发明使用的术语“天然存在的”是指天然存在的那些物质。譬如，存在于生物体中的ABC转运蛋白可从自然界中的来源分离得到并且在实验室中未被人有意修饰，其就是天然存在的ABC转运蛋白。相反，本发明使用的术语“非天然存在的”是指在自然界中未发现但通过人为干预生成的那些物质。

术语“培养基”是指培养基和/或发酵培养基。

术语“发酵组合物”是指组合物，所述组合物包含经遗传修饰的宿主细胞和由所述经遗传修饰的宿主细胞生成的产物或代谢物。发酵组合物的实例是全细胞培养液，其可以是容器(例如，烧瓶、平板或发酵罐)的全部内容物，包括细胞、水相和由所述经遗传修饰的宿主细胞生成的化合物。

本发明使用的术语“生成量”通常是指由本发明提供的经遗传修饰的宿主细胞生成的甜菊醇或甜菊糖苷的量。在一些实施方案，生成量表示为由所述宿主细胞生成的甜菊醇或甜菊糖苷的产量。在其他实施方案，生成量表示为生成所述甜菊醇或甜菊糖苷时所述宿主细胞的生产率。

本发明使用的术语“生产率/生产力”是指由宿主细胞生成甜菊醇或甜菊糖苷的量，表示为每单位量的发酵液中生成的甜菊醇或甜菊糖苷的量(按重量计)，其中所述宿主细胞根据时间(每小时)进行培养(按体积计)。

本发明使用的术语“产量/产率”是指由宿主细胞生成的甜菊醇或甜菊糖苷的量，表示为宿主细胞消耗的每单位量的碳源生成的甜菊醇或甜菊糖苷的量，按重量计。

本发明使用的术语化合物(例如，RebM、甜菊糖苷类化合物或其他化合物)的“不可检测水平”是指化合物的水平/含量太低而不能通过标准技术进行测定和/或分析以检测所述化合物。譬如，所述术语包括由本领域已知分析方法无法检测到的化合物的水平。

术语“贝壳杉烯(kaurene)”是指化合物贝壳杉烯，包括贝壳杉烯的任何立体异构体。在特定实施方案，所述术语是指在本领域中称为内根-贝壳杉烯的对映异构体。在特定实施方案，所述术语是指具有以下结构的化合物：

术语“贝壳杉烯醇(kaurenol)”是指化合物贝壳杉烯醇，包括贝壳杉烯醇的任何立体异构体。

在特定实施方案，所述术语是指在本领域中称为内根-贝壳杉烯醇的对映异构体。在特定实施方案，所述术语是指具有以下结构的化合物：

术语“贝壳杉烯醛(kaurenal)”是指化合物贝壳杉烯醛，包括贝壳杉烯醛的任何立体异构体。

在特定实施方案，所述术语是指在本领域中称为内根-贝壳杉烯醛的对映异构体。在特定实施方案，所述术语是指具有以下结构的化合物：

术语“贝壳杉烯酸/异贝壳杉烯酸(kaurenoic acid)”是指化合物异贝壳杉烯酸，包括异贝壳杉烯酸的任何立体异构体。在特定实施方案，所述术语是指在本领域中称为内根-异贝壳杉烯酸的对映异构体。在特定实施方案，所述术语是指具有以下结构的化合物：

术语“甜菊醇(steviol)”是指化合物甜菊醇，包括甜菊醇的任何立体异构体。在特定实施方案，所述术语是指具有以下结构的化合物：

本发明使用的术语“甜菊糖苷/甜菊醇糖苷/甜菊糖苷类化合物(steviolglycoside(s))”是指甜菊醇的糖苷，包括但不限于，天然存在的甜菊糖苷类化合物，例如天然存在的甜菊单糖苷、甜菊双糖苷、甜茶苷、杜克苷B、杜克苷A、瑞鲍迪苷B、瑞鲍迪苷G、甜菊苷(stevioside)、瑞鲍迪苷C、瑞鲍迪苷F、瑞鲍迪苷A、瑞鲍迪苷I、瑞鲍迪苷E、瑞鲍迪苷H、瑞鲍迪苷L、瑞鲍迪苷K、瑞鲍迪苷J、瑞鲍迪苷M、瑞鲍迪苷D、瑞鲍迪苷N、瑞鲍迪苷O，合成甜菊糖苷类化合物例如酶促糖基化的甜菊糖苷类化合物，及其组合。

本发明使用的术语“瑞鲍迪苷M”是指具有以下结构的化合物：

本发明使用的术语“变体”是指通过氨基酸插入、缺失、突变和/或置换而不同于具体列举的“参考”多肽(例如，野生型序列)的多肽，但保留与所述参考多肽基本相似的活性。在一些实施方案，所述变体通过重组DNA技术或通过诱变而产生。在一些实施方案，变体多肽与其参考多肽的不同之处在于一个碱基残基置换另一个碱基残基(即，Arg置换Lys)，一个疏水残基置换另一个疏水残基(即，Leu置换Ile)，或一个芳香族残基置换另一个芳香族残基(即，Phe置换Tyr)等。在一些实施方案，变体包括类似物，其中实现保守置换导致所述参考序列的基本结构类似。此类保守置换的实例包括但不限于，谷氨酸置换天冬氨酸，反之亦然；谷氨酰胺置换天冬酰胺，反之亦然；丝氨酸置换苏氨酸，反之亦然；赖氨酸置换精氨酸，反之亦然；或者任何异亮氨酸、缬氨酸或亮氨酸之间的彼此置换。

在上下文中或两个或更多个核酸或蛋白质序列中，本发明使用的术语“序列同一性”或“同一性百分比”是指两个或更多个序列或子序列是相同，或所述序列或子序列具有特定百分比的相同氨基酸残基或核苷酸。譬如，当进行比较和比对以在比较窗口上进行最大对应，或者使用序列比较算法或通过手动比对和目视检查进行测定的指定区域时，所述序列可在所述指定区域与参考序列具有至少60％，至少65％，至少70％，至少75％，至少80％，至少85％，至少90％，至少91％，至少92％，至少93％，至少94％，至少95％，至少96％，至少97％，至少98％，至少99％，或更高的同一性。譬如，通过计算所述序列中相同核苷酸(或氨基酸残基)的数量除以总核苷酸(或氨基酸残基)的长度减去任何空位(gap)的长度的比值来确定同一性百分比。

为方便起见，可使用本领域已知的计算机程序和数学算法来确定两个序列之间的同一性程度。计算序列同一性百分比的此类算法通常考虑所述比较区域上的序列空位和错配。用于比较和比对序列的程序，如Clustal W(序列比对W)(Thompson et al.,(1994)Nucleic Acids Res.,22:4673-4680)，ALIGN(Myers et al.,(1988)CABIOS,4:11-17)，FASTA(Pearson et al.,(1988)PNAS,85:2444-2448；Pearson(1990),Methods Enzymol.,183:63-98)，以及空位的BLAST(Altschul et al.,(1997)Nucleic Acids Res.,25:3389-3402)，均可用于此目的。所述BLAST或BLAST 2.0(Altschul et al.,J.Mol.Biol.215:403-10,1990)可从若干来源得到，包括国家生物信息中心(NCBI)和因特网，用于与序列分析程序BLASTP、BLASTN、BLASTX、TBLASTN和TBLASTX结合使用。更多信息可从NCBI网站上获悉。

在某些实施方案，序列比对和同一性百分比计算可使用BLAST程序采用其标准默认参数来确定。对于核苷酸序列比对和序列同一性计算，BLASTN程序可以其默认参数(空位开放罚分(Gap opening penalty)＝5，空位延伸罚分(Gap extension penalty)＝2，核匹配(Nucleic match)＝2，核不匹配(Nucleic mismatch)＝-3，期望值(Expectation value)＝10.0，字长(Word size)＝11，查询范围中的最大匹配数＝0)进行使用。对于多肽序列比对和序列同一性计算，BLASTP程序可以其默认参数(比对矩阵(Alignment matrix)＝BLOSUM62；空位罚分(Gap costs):存在(Existence)＝11，延伸(Extension)＝1；组成调整(Compositional adjustments)＝条件组成得分(Conditional compositional score)，矩阵调整；期望值＝10.0；字长(Word size)＝6；查询范围中的最大匹配数＝0)进行使用。或者，使用以下程序和参数：克隆管理组件(Clone Manager Suite)的比对加强版(AlignPlus)软件，版本5(Sci-Ed软件)；DNA比较：总体比较/整体联配(Global comparison)，标准线性打分矩阵(Standard Linear Scoring matrix)，不匹配罚分＝2，开放空位罚分＝4，延伸空位罚分＝1。氨基酸比较：总体比较，BLOSUM 62打分矩阵。在本发明所述的实施方案中，使用BLASTN或BLASTP程序使用其默认参数来计算序列同一性。在本发明所述的实施方案中，使用Clustal W使用建议的默认参数进行两个或更多个序列的序列比对(Dealign输入序列：否；Mbed样聚类引导树(Mbed-like clustering guide-tree)：是；Mbed样聚类迭代(Mbed-like clustering iteration)：是；组合迭代次数：默认(0)；最大引导树迭代次数(Max guide tree iterations)：默认；最大HMM迭代次数：默认；指令(Order)：输入(input))。

6.2ABC转运蛋白、核酸、表达盒和宿主细胞

一方面，本发明提供了表达ABC转运蛋白的重组核酸。本发明的ABC转运蛋白可通过针对已知ABC转运蛋白序列的基于序列的搜索来识别。已知ABC转运蛋白的示例性序列数据库由(Kovalchuk and Driessen,Phylogenetic Analysis of Fungal ABCTransporters,BMC Genomics,2010,11:177)提供。ABC转运蛋白BLAST数据库也可由其他生物体生成。在优选实施方案，真菌序列数据库来自(1)多形汉逊酵母(Hansenulapolymorpha)DL-1(NRRL-Y-7560)、(2)解脂耶氏酵母(Yarrowia lipolytica)ATCC 18945、(3)食腺嘌呤芽生葡萄孢酵母(Arxula adeninivorans)ATCC 76597、(4)酿酒酵母(S.cerevisiae)CAT-1、(5)斯达氏油脂酵母(Lipomyces starkeyi)ATCC 58690、(6)马克斯克鲁维酵母(Kluyveromyces marxianus)、(7)马克斯克鲁维酵母DMKU3-1042、(8)法夫驹形氏酵母(Komagataella phaffii)NRRL Y-11430、(9)酿酒酵母MBG3370、(10)酿酒酵母MBG3373、(11)乳酸克鲁维酵母(K.lactis)ATCC 8585、(12)产朊假丝酵母(Candidautilis)ATCC 22023、(13)毕赤酵母(Pichia pastoris)ATCC 28485、和(14)米曲霉(Aspergillus oryzae)NRRL5590，作为本发明ABC转运蛋白的来源。

使用Biopython或任何其他合适的序列分析软件，通过tblastn算法来分析由各种生物体的从头基因组测序、组装和注释生成的核苷酸ORF序列。tblastn算法使用BLAST将已知ABC转运蛋白的蛋白质序列与每个生物体的核苷酸ORF序列的经翻译DNA在所有6个可能的阅读框中进行比对。示例性BLAST参数均是标准的，E值(evalue)＝1e-25(表4和表5)。随后可过滤命中(hit)以确保至少2000个核苷酸的整体联配。

在本发明的其他实施方案中，可使用Uniprot API从Uniprot中提取生物体的整个蛋白质组，以创建用于BLAST搜索的数据库。blastp算法可应用于Uniprot派生数据库。在一个实施方案，BLAST参数可以是标准的，E值(evalue)＝0.001。在特定实施方案，可基于≥40％的同一性截断百分比和≥60％的对齐长度截断百分比来执行过滤。在优选实施方案，命中(hit)必须匹配来自所述参考的610个种子序列中的至少一个。

一旦确定了核苷酸序列，便可设计引物来扩增经由PCR扩增的每个完整ORF。理想情况下，每个PCR引物均应与启动子和终止子的所述启动子和终止子DNA序列具有侧翼同源性，所述启动子和终止子用于异源核苷酸表达盒并添加至两端，以促进经扩增的基因同源重组到着陆垫靶位点，以产生特定的ABC转运蛋白表达盒。每个ABC转运蛋白基因可作为单拷贝单独转化到本发明所述的亲本Reb M酵母菌株中，并筛选在体内过表达时增加产物滴度的能力。

在某些实施方案，所述重组核酸编码具有SEQ ID NO：1至SEQ ID NO：8中任一个提供的氨基酸序列的多肽。在某些实施方案，所述重组核酸包含SEQ ID NO：20至SEQ ID NO：27中任一个提供的核苷酸序列。

本发明还提供了宿主细胞，所述宿主细胞包含一种或多种本发明提供的能够生成甜菊糖苷类化合物的ABC转运蛋白多肽或核酸。在某些实施方案，所述宿主细胞可由培养基中的碳源生成甜菊糖苷类化合物。在特定实施方案，所述宿主细胞可由培养基中的碳源生成甜菊醇，并且可进一步由甜菊醇生成Reb A或Reb D。在特定实施方案，所述宿主细胞可进一步由Reb D生成Reb M。在特定实施方案，Reb D和/或Reb M被转运至一种或多种细胞器的腔内。在特定实施方案，Reb D和/或Reb M被转运至细胞外空间(即，上清液)。

在某些实施方案，与缺乏ABC转运蛋白表达盒的亲本宿主细胞相比，根据上述实施方案表达ABC转运蛋白的宿主细胞生成高出至少20％、至少30％、至少40％、至少50％、至少60％、至少70％、至少80％、至少90％、或至少100％的总甜菊糖苷(TSG)。

在某些实施方案，与缺乏ABC转运蛋白表达盒的亲本宿主细胞相比，根据上述实施方案表达ABC转运蛋白的宿主细胞在上清液中生成高出至少20％、至少30％、至少40％、至少50％、至少60％、至少70％、或至少75％的TSG。在特定实施方案，与缺乏ABC转运蛋白表达盒的亲本宿主细胞相比，根据上述实施方案表达ABC转运蛋白的宿主细胞在上清液中生成高出至少2倍、至少3倍、至少4倍、或至少5倍的TSG。

在有利的实施方案中，所述宿主细胞可包含能够制备异贝壳杉烯酸的一种或多种酶促途径，所述途径可单独使用或一同使用。如本发明所述，所述宿主细胞包含本发明提供的甜叶菊(Stevia rebaudiana)异贝壳杉烯酸羟化酶，其能够将异贝壳杉烯酸转化为甜菊醇。在某些实施方案，所述宿主细胞还包含能够将法呢基焦磷酸转化为香叶基香叶基焦磷酸的一种或多种酶。在某些实施方案，所述宿主细胞还包含能够将香叶基香叶基焦磷酸转化为柯巴基焦磷酸的一种或多种酶。在某些实施方案，所述宿主细胞还包含能够将柯巴基焦磷酸转化为贝壳杉烯的一种或多种酶。在某些实施方案，所述宿主细胞还包含能够将贝壳杉烯转化为异贝壳杉烯酸的一种或多种酶。在某些实施方案，所述宿主细胞还包含能够将甜菊醇转化为一种或多种甜菊糖苷的一种或多种酶。在某些实施方案，所述宿主细胞还包含能够一同将甜菊醇转化为Reb A的1、2、3、4或更多种酶。在某些实施方案，宿主细胞还包含能够将Reb A转化为Reb D的一种或多种酶。在某些实施方案，所述宿主细胞还包含能够将Reb D转化为Reb M的一种或多种酶。有用的酶和编码所述酶的核酸均是本领域技术人员已知的。特别有用的酶和核酸均描述于以下章节中，并进一步描述于例如US 2014/0329281A1、US 2014/0357588A1、US 2015/0159188、WO 2016/038095A2和US 2016/0198748A1中。

在进一步的实施方案，所述宿主细胞还包含能够由碳源制备香叶基香叶基焦磷酸的一种或多种酶。所述这些包括DXP途径的酶类和MEV途径的酶类。有用的酶和编码所述酶的核酸均是本领域技术人员已知的。每种途径的示例性酶类如下所述，并进一步描述于例如US 2016/0177341A1中，其通过引用其全文并入本发明。

在某些实施方案，所述宿主细胞包含选自由以下组成的组的一种或多种或所有类异戊二烯途径酶：(a)使两分子乙酰辅酶A缩合形成乙酰乙酰辅酶A的酶(例如，乙酰辅酶A硫解酶)；(b)使乙酰乙酰辅酶A与另一分子乙酰辅酶A缩合形成3-羟基-3-甲基戊二酰-辅酶A(HMG-CoA)的酶(例如，HMG-CoA合酶)；(c)使HMG-CoA转化为甲羟戊酸的酶(例如，HMG-CoA还原酶)；(d)使甲羟戊酸转化为甲羟戊酸5-磷酸的酶(例如，甲羟戊酸激酶)；(e)使甲羟戊酸5-磷酸转化为甲羟戊酸5-焦磷酸的酶(例如，磷酸甲羟戊酸激酶)；(f)使甲羟戊酸5-焦磷酸转化为异戊烯二磷酸(IPP)的酶(例如，甲羟戊酸焦磷酸脱羧酶)；(g)使IPP转化为二甲基烯丙基焦磷酸(DMAPP)的酶(例如，IPP异构酶)；(h)可缩合IPP和/或DMAPP分子以形成含有五个以上碳原子的聚异戊二烯基化合物的聚异戊二烯合酶；(i)使IPP与DMAPP缩合形成香叶基焦磷酸(GPP)的酶(例如，GPP合酶)；(j)使两分子IPP与一分子DMAPP缩合的酶(例如，FPP合酶)；(k)使IPP与GPP缩合形成法呢基焦磷酸(FPP)的酶(例如，FPP合酶)；(l)使IPP与DMAPP缩合形成香叶基香叶基焦磷酸(GGPP)的酶；和(m)使IPP与FPP缩合形成GGPP的酶。

在某些实施方案，所述另外的酶是原生或天然的。在有利的实施方案中，所述另外的酶是异源的。在某些实施方案，两种或两种以上的酶可在一种多肽中进行组合。

6.3细胞菌株

可用于本发明提供的组合物和方法的宿主细胞包括古细菌细胞、原核细胞或真核细胞。

合适的原核宿主包括但不限于，多种革兰氏阳性、革兰氏阴性或革兰氏变种细菌中的任一种。实例包括但不限于，属于以下属的细胞：土壤杆菌属(Agrobacterium)，脂环酸芽孢杆菌属(Alicyclobacillus)，鱼腥藻属(Anabaena)，蓝细菌属(Anacystis)，节细菌属(Arthrobacter)，固氮菌属(Azobacter)，芽孢杆菌属(Bacillus)，短杆菌属(Brevibacterium)，着色菌属(Chromatium)，梭菌属(Clostridium)，棒状杆菌属(Corynebacterium)，肠杆菌属(Enterobacter)，欧文氏菌属(Erwinia)，埃希氏杆菌属(Escherichia)，乳酸杆菌属(Lactobacillus)，乳球菌属(Lactococcus)，中慢生根瘤菌属(Mesorhizobium)，甲基杆菌属(Methylobacterium)，细杆菌属(Microbacterium)，席藻属(Phormidium)，假单胞菌属(Pseudomonas)，红细菌属(Rhodobacter)，红假单胞菌属(Rhodopseudomonas)，红螺菌属(Rhodospirillum)，红球菌属(Rhodococcus)，沙门氏菌属(Salmonella)，栅藻属(Scenedesmun)，沙雷氏菌属(Serratia)，志贺氏菌属(Shigella)，葡萄球菌属(Staphlococcus)，链霉菌属(Strepromyces)，聚球蓝细菌属(Synnecoccus)和发酵单胞菌属(Zymomonas)。原核菌株的实例包括但不限于：枯草芽孢杆菌(Bacillussubtilis)，解淀粉芽孢杆菌(Bacillus amyloliquefacines)，产氨短杆菌(Brevibacterium ammoniagenes)，嗜氨短杆菌(Brevibacterium immariophilum)，拜氏梭菌(Clostridium beigerinckii)，阪崎肠杆菌(Enterobacter sakazakii)，大肠杆菌(Escherichia coli)，乳酸乳球菌(Lactococcus lactis)，百脉根中生根瘤菌(Mesorhizobium loti)，绿脓假单胞菌(Pseudomonas aeruginosa)，迈氏假单胞菌(Pseudomonas mevalonii)，普迪卡假单胞菌(Pseudomonas pudica)，荚膜红细菌(Rhodobacter capsulatus)，类球红细菌(Rhodobacter sphaeroides)，深红红螺菌(Rhodospirillum rubrum)，肠道沙门氏菌(Salmonella enterica)，伤寒沙门氏菌(Salmonella typhi)，鼠伤寒沙门氏菌(Salmonella typhimurium)，痢疾志贺氏菌(Shigella dysenteriae)，福氏志贺菌(Shigella flexneri)，宋内志贺菌(Shigellasonne)和金黄色葡萄球菌(Staphylococcus aureus)。在特定实施方案，所述宿主细胞是大肠杆菌(Escherichia coli)细胞。

合适的古细菌宿主包括但不限于属于以下属的细胞：气火菌属(Aeropyrum)，古球菌属(Archaeglobus)，盐杆菌属(Halobacterium)，产甲烷球菌属(Methanococcus)，甲烷杆菌属(Methanobacterium)，火球菌属(Pyrococcus)，硫化叶菌属(Sulfolobus)，和热原体属(Thermoplasma)。古细菌菌株的实例包括但不限于：闪烁古生球菌(Archaeoglobusfulgidus)，盐杆菌属(Halobacterium sp.)，詹氏甲烷球菌(Methanococcus jannaschii)，嗜热自养甲烷杆菌(Methanobacterium thermoautotrophicum)，嗜酸热原体(Thermoplasma acidophilum)，火山热原体(Thermoplasma volcanium)，掘越氏热球菌(Pyrococcus horikoshii)，深海火球菌(Pyrococcus abyssi)，和敏捷气热菌(Aeropyrumpernix)。

合适的真核宿主包括但不限于真菌细胞、藻类细胞、昆虫细胞和植物细胞。在一些实施方案，可用于本发明方法的酵母包括已被微生物保藏中心(例如，IFO、ATCC等)保藏并属于以下属的酵母：芽孢酵母属(Aciculoconidium)，神食酵母属(Ambrosiozyma)，节束酵母属(Arthroascus)，Arxiozyma，阿舒囊霉属(Ashbya)，Babjevia，本森顿酵母属(Bensingtonia)，Botryoascus，Botryozyma，酒香酵母属(Brettanomyces)，布勒掷孢酵母属(Bullera)，布勒担孢酵母属(Bulleromyces)，假丝酵母属(Candida)，固囊酵母属(Citeromyces)，棒孢酵母属(Clavispora)，隐球菌属(Cryptococcus)，产黑色素酵母属(Cystofilobasidium)，德巴利氏酵母属(Debaryomyces)，德克酵母属(Dekkara)，拟双足囊菌属(Dipodascopsis)，双足囊菌属(Dipodascus)，Eeniella，Endomycopsella，Eremascus，假囊酵母属(Eremothecium)，担孢酵母属(Erythrobasidium)，Fellomyces，线黑粉酵母属(Filobasidium)，耐碱酵母属(Galactomyces)，地丝菌属(Geotrichum)，季氏酵母属(Guilliermondella)，有孢汉逊酵母属(Hanseniaspora)，汉逊酵母属(Hansenula)，Hasegawaea，胶珊瑚属(Holtermannia)，Hormoascus，生丝毕赤酵母属(Hyphopichia)，伊萨酵母属(Issatchenkia)，克勒克酵母属(Kloeckera)，孢克勒克酵母属(Kloeckeraspora)，克鲁维酵母属(Kluyveromyces)，Kondoa，Kuraishia，克氏担孢酵母属(Kurtzmanomyces)，白冬孢酵母属(Leucosporidium)，油脂酵母属(Lipomyces)，路德酵母属(Lodderomyces)，马拉色氏霉菌属(Malassezia)，梅奇酵母属(Metschnikowia)，木拉克酵母属(Mrakia)，油脂酵母属无性属(Myxozyma)，拿逊酵母属(Nadsonia)，Nakazawaea，针孢酵母属(Nematospora)，甲醇诱导型酵母属(Ogataea)，卵孢酵母属(Oosporidium)，管囊酵母属(Pachysolen)，厚壁孢酵母(Phachytichospora)，法夫酵母属(Phaffia)，毕赤酵母属(Pichia)，红冬孢酵母属(Rhodosporidium)，红酵母属(Rhodotorula)，酵母属(Saccharomyces)，类酵母属(Saccharomycodes)，覆膜孢酵母属(Saccharomycopsis)，齐藤酵母属(Saitoella)，Sakaguchia，Saturnospora，裂芽酵母孢子菌属(Schizoblastosporion)，裂殖酵母属(Schizosaccharomyces)，许旺酵母属(Schwanniomyces)，锁掷酵母属(Sporidiobolus)，掷孢酵母属(Sporobolomyces)，原孢酵母属(Sporopachydermia)，冠孢酵母属(Stephanoascus)，梗孢酵母属(Sterigmatomyces)，拟梗孢酵母属(Sterigmatosporidium)，Symbiotaphrina，合轴酵母属(Sympodiomyces)，Sympodiomycopsis，有孢圆酵母属(Torulaspora)，Trichosporiella，毛孢子菌属(Trichosporon)，三角酵母属(Trigonopsis)，Tsuchiyaea，Udeniomyces，Waltomyces，威克酵母属(Wickerhamia)，拟威克酵母属(Wickerhamiella)，拟威尔酵母属(Williopsis)，Yamadazyma，耶氏酵母属(Yarrowia)，接合囊酵母属(Zygoascus)，接合酵母属(Zygosaccharomyces)，接合拟威尔酵母属(Zygowilliopsis)，和Zygozyma等等。

在一些实施方案，所述宿主微生物是酿酒酵母(Saccharomyces cerevisiae)，巴斯德毕赤酵母(Pichia pastoris)，粟酒裂殖酵母(Schizosaccharomyces pombe)，布鲁赛尔德克酵母(Dekkera bruxellensis)，乳酸克鲁维酵母(Kruyveromyces lactis，此前称为乳酸酵母(Saccharomyces lactis))，马克斯克鲁维酵母(Kluveromyces marxianus)，食腺嘌呤芽生葡萄孢酵母(Arxula adeninivorans)，或多形汉逊酵母(Hansenula polymorpha)(现称为安格斯毕赤酵母(Pichia angusta))。在一些实施方案，所述宿主微生物是假丝酵母属(Candida)的菌株，例如解脂假丝酵母(Candida lipolytica)，吉利蒙假丝酵母(Candida guilliermondii)，克鲁斯假丝酵母(Candida krusei)，假热带假丝酵母(Candida pseudotropicalis)或产朊假丝酵母(Candida utilis)的菌株。

在特定实施方案，所述宿主微生物是酿酒酵母(Saccharomyces cerevisiae)。在一些实施方案，所述宿主是酿酒酵母(Saccharomyces cerevisiae)的菌株，所述酿酒酵母的菌株是选自由贝克氏(Baker’s)酵母、CBS 7959、CBS 7960、CBS 7961、CBS 7962、CBS7963、CBS 7964、IZ-1904、TA、BG-1、CR-1、SA-1、M-26、Y-904、PE-2、PE-5、VR-1、BR-1、BR-2、ME-2、VR-2、MA-3、MA-4、CAT-1、CB-1、NR-1、BT-1、和AL-1组成的组。在一些实施方案，所述宿主微生物是酿酒酵母(Saccharomyces cerevisiae)的菌株，所述酿酒酵母的菌株是选自由PE-2、CAT-1、VR-1、BG-1、CR-1、和SA-1组成的组。在特定实施方案，酿酒酵母(Saccharomyces cerevisiae)的菌株是PE-2。在另一特定实施方案，酿酒酵母(Saccharomyces cerevisiae)的菌株是CAT-1。在另一特定实施方案，酿酒酵母(Saccharomyces cerevisiae)的菌株是BG-1。

在一些实施方案，所述宿主微生物是适于工业发酵的微生物。在特定实施方案，所述微生物适应于在高溶剂浓度、高温、扩大的底物利用率、营养限制、由糖和盐引起的渗透应力、酸度、亚硫酸盐和细菌污染、或其组合下存活，所述这些是公认的工业发酵环境的应激条件。

6.4甜菊醇和甜菊糖苷生物合成途径

在一些实施方案，通过工程化所述细胞以表达编码所述途径的一种或多种酶的多核苷酸和/或多肽，在本发明提供的经遗传修饰的宿主细胞中激活甜菊醇生物合成途径和/或甜菊糖苷生物合成途径。图1示出了示例性甜菊醇生物合成途径。

因此，在一些实施方案，本发明提供的经遗传修饰的宿主细胞包含编码多肽的异源多核苷酸，所述多肽具有香叶基香叶基焦磷酸合酶(GGPPS)活性。在一些实施方案，本发明提供的经遗传修饰的宿主细胞包含编码多肽的异源多核苷酸，所述多肽具有柯巴基焦磷酸合酶或内根-柯巴基二磷酸合酶(CDPS；也称为内根-柯巴基焦磷酸合酶或CPS)活性。在一些实施方案，本发明提供的经遗传修饰的宿主细胞包含编码多肽的异源多核苷酸，所述多肽具有贝壳杉烯合酶(KS；也称为内根-贝壳杉烯合酶)活性。在特定实施方案，本发明提供的经遗传修饰的宿主细胞包含编码多肽的异源多核苷酸，所述多肽具有本发明所述的贝壳杉烯氧化酶(KO；也称为内根-贝壳杉烯19-氧化酶)活性。在特定实施方案，本发明提供的经遗传修饰的宿主细胞包含编码多肽的异源多核苷酸，根据本发明提供的实施方案，所述多肽具有异贝壳杉烯酸羟化酶多肽(KAH；也称为甜菊醇合酶)活性。在一些实施方案，本发明提供的经遗传修饰的宿主细胞包含编码多肽的异源多核苷酸，所述多肽具有细胞色素P450还原酶(CPR)活性。

在一些实施方案，本发明提供的经遗传修饰的宿主细胞包含编码具有UGT74G1活性的多肽的异源多核苷酸。在一些实施方案，本发明提供的经遗传修饰的宿主细胞包含编码具有UGT76G1活性的多肽的异源多核苷酸。在一些实施方案，本发明提供的经遗传修饰的宿主细胞包含编码具有UGT85C2活性的多肽的异源多核苷酸。在一些实施方案，本发明提供的经遗传修饰的宿主细胞包含编码具有UGT91D活性的多肽的异源多核苷酸。在一些实施方案，本发明提供的经遗传修饰的宿主细胞包含编码具有UGT_AD活性的多肽的异源多核苷酸。如下所述，UGT_AD是指尿苷二磷酸依赖性糖基转移酶，其能够将葡萄糖基团部分转移至RebA的19-O-葡萄糖的C-2'位置以生成RebD。

在某些实施方案，所述宿主细胞包含变体酶。在某些实施方案，相对于相关多肽，所述变体可包含多达15、10、9、8、7、6、5、4、3、2或1个氨基酸置换。在某些实施方案，相对于参考多肽，所述变体可包含多达15、10、9、8、7、6、5、4、3、2或1个保守氨基酸置换。在某些实施方案，可针对所述宿主细胞优化本发明所述的任何核酸，例如进行密码子优化。

以下描述了甜菊醇生物合成途径和/或甜菊糖苷生物合成途径的示例性核酸和酶。

6.4.1香叶基香叶基焦磷酸合酶(GGPPS)

香叶基香叶基焦磷酸合酶(EC 2.5.1.29)催化法呢基焦磷酸转化为香叶基香叶基焦磷酸。酶的示例性实例包括甜叶菊(Stevia rebaudiana，登录号ABD92926)，藤仓赤霉(Gibberella fujikuroi，登录号CAA75568)，小家鼠(Mus musculus，登录号AAH69913)，假微型海链藻(Thalassiosira pseudonana，登录号XP_002288339)，棒状链霉菌(Streptomyces clavuligerus，登录号ZP_05004570)，嗜酸热硫化叶菌(Sulfulobusacidocaldarius，登录号BAA43200)，聚球藻属(Synechococcus sp.，登录号ABC98596)，拟南芥(Arabidopsis thaliana，登录号NP_195399)，和三孢布拉霉(Blakeslea trispora，登录号AFC92798.1)的那些酶，以及US2014/0329281A1中示出的那些酶。编码所述这些酶的核酸可用于本发明提供的细胞和方法。在某些实施方案，本发明提供了使用核酸的细胞和方法，所述核酸与这些GGPPS核酸中的至少一种具有至少80％、85％、90％、或95％序列同一性。在某些实施方案，本发明提供了使用核酸的细胞和方法，所述核酸编码与这些GGPPS酶中的至少一种具有至少80％、85％、90％、或95％序列同一性的多肽。

6.4.2柯巴基焦磷酸合酶(CDPS)

柯巴基焦磷酸合酶(EC 5.5.1.13)催化香叶基香叶基焦磷酸转化为柯巴基焦磷酸。酶的示例性实例包括甜叶菊(Stevia rebaudiana，登录号AAB87091)，棒状链霉菌(Streptomyces clavuligerus，登录号EDY51667)，慢生型大豆根瘤菌(Bradyrhizobiumjaponicum，登录号AAC28895.1)，玉米(Zea mays，登录号AY562490)，拟南芥(Arabidopsisthaliana，登录号NM_116512)，和稻(Oryza sativa，登录号Q5MQ85.1)的那些酶，以及US2014/0329281A1中示出的那些酶。编码所述这些酶的核酸可用于本发明提供的细胞和方法。在某些实施方案，本发明提供了使用核酸的细胞和方法，所述核酸与这些CDPS核酸中的至少一种具有至少80％、85％、90％、或95％序列同一性。在某些实施方案，本发明提供了使用核酸的细胞和方法，所述核酸编码与这些CDPS酶中的至少一种具有至少80％、95％、90％、或95％序列同一性的多肽。

6.4.3贝壳杉烯合酶(KS)

贝壳杉烯合酶(EC 4.2.3.19)催化柯巴基焦磷酸转化为贝壳杉烯和二磷酸。酶的示例性实例包括慢生型大豆根瘤菌(Bradyrhizobium japonicum，登录号AAC28895.1)，暗球腔菌属(Phaeosphaeria sp.，登录号O13284)，拟南芥(Arabidopsis thaliana，登录号Q9SAK2)，和白云杉(Picea glauca，登录号ADB55711.1)的那些酶，以及US2014/0329281A1中示出的那些酶。编码所述这些酶的核酸可用于本发明提供的细胞和方法。在某些实施方案，本发明提供了使用核酸的细胞和方法，所述核酸与这些KS核酸中的至少一种具有至少80％、85％、90％、或95％序列同一性。在某些实施方案，本发明提供了使用核酸的细胞和方法，所述核酸编码与这些KS酶中的至少一种具有至少80％、85％、85％、90％、或95％序列同一性的多肽。

6.4.4双功能柯巴基焦磷酸合酶(CDPS)和贝壳杉烯合酶(KS)

还可使用CDPS-KS双功能酶(EC 5.5.1.13和EC 4.2.3.19)。酶的示例性实例包括桃拟茎点霉(Phomopsis amygdali，登录号BAG30962)，小立碗藓(Physcomitrella patens，登录号BAF61135)，和藤仓赤霉(Gibberella fujikuroi，登录号Q9UVY5.1)的那些酶，以及US 2014/0329281A1、US 2014/0357588A1、US 2015/0159188和WO 2016/038095A2中示出的那些酶。编码所述这些酶的核酸可用于本发明提供的细胞和方法。在某些实施方案，本发明提供了使用核酸的细胞和方法，所述核酸与这些CDPS-KS核酸中的至少一种具有至少80％、85％、90％、或95％序列同一性。在某些实施方案，本发明提供了使用核酸的细胞和方法，所述核酸编码与这些CDPS-KS酶中的至少一种具有至少80％、85％、90％、或95％序列同一性的多肽。

6.4.5内根-贝壳杉烯氧化酶(KO)

内根-贝壳杉烯氧化酶(EC 1.14.13.78；本发明也称为贝壳杉烯氧化酶)催化将贝壳杉烯转化为异贝壳杉烯酸。酶的示例性实例包括稻(Oryza sativa，登录号Q5Z5R4)，藤仓赤霉(Gibberella fujikuroi，登录号O94142)，拟南芥(Arabidopsis thaliana，登录号Q93ZB2)，甜叶菊(Stevia rebaudiana，登录号AAQ63464.1)，和豌豆(Pisum sativum，Uniprot号Q6XAF4)的那些酶，以及US 2014/0329281A1、US2014/0357588A1、US 2015/0159188和WO 2016/038095A2中示出的那些酶。编码所述这些酶的核酸可用于本发明提供的细胞和方法。在某些实施方案，本发明提供了使用核酸的细胞和方法，所述核酸与这些KO核酸中的至少一种具有至少80％、85％、90％、或95％序列同一性。在某些实施方案，本发明提供了使用核酸的细胞和方法，所述核酸编码与这些KO酶中的至少一种具有至少80％、85％、90％、或95％序列同一性的多肽。

6.4.6甜菊醇合酶(KAH)

甜菊醇合酶或异贝壳杉烯酸羟化酶(KAH，EC 1.14.13)催化异贝壳杉烯酸转化为甜菊醇。酶的示例性实例包括甜叶菊(Stevia rebaudiana，登录号ACD93722)，甜叶菊(Stevia rebaudiana，SEQ ID NO：10)，拟南芥(Arabidopsis thaliana，登录号NP_197872)，葡萄(Vitis vinifera，登录号XP_002282091)，和紫花苜蓿(Medicagotrunculata，登录号ABC59076)的那些酶，以及US 2014/0329281A1、US 2014/0357588A1、US2015/0159188和WO 2016/038095A2中示出的那些酶。编码所述这些酶的核酸可用于本发明提供的细胞和方法。在某些实施方案，本发明提供了使用核酸的细胞和方法，所述核酸与这些KAH核酸中的至少一种具有至少80％、85％、90％、或95％序列同一性。在某些实施方案，本发明提供了使用核酸的细胞和方法，所述核酸编码与这些KAH酶中的至少一种具有至少80％、85％、90％、或95％序列同一性的多肽。

6.4.7细胞色素P450还原酶(CPR)

细胞色素P450还原酶(EC 1.6.2.4)对于上述KO和/或KAH的活性是必需的。酶的示例性实例包括甜叶菊(Stevia rebaudiana，登录号ABB88839)，拟南芥(Arabidopsisthaliana，登录号NP_194183)，藤仓赤霉(Gibberella fujikuroi，登录号CAE09055)，和青蒿(Artemisia annua，登录号ABC47946.1)的那些酶，以及US 2014/0329281A1、US 2014/0357588A1、US 2015/0159188和WO 2016/038095A2中示出的那些酶。编码所述这些酶的核酸可用于本发明提供的细胞和方法。在某些实施方案，本发明提供了使用核酸的细胞和方法，所述核酸与这些CPR核酸中的至少一种具有至少80％、85％、90％、或95％序列同一性。在某些实施方案，本发明提供了使用核酸的细胞和方法，所述核酸编码与这些CPR酶中的至少一种具有至少80％、85％、90％、或95％序列同一性的多肽。

6.4.8 UDP糖基转移酶74G1(UGT74G1)

UGT74G1能够作为尿苷5'-二磷酸葡糖基：甜菊醇19-COOH转移酶起作用和作为尿苷5'-二磷酸葡糖基：甜菊醇-13-O-葡糖苷19-COOH转移酶起作用。如图1所示，UGT74G1能够将甜菊醇转化为19-糖苷。UGT74G1还能够将甜菊单糖苷转化为甜茶苷。UGT74G1还可将甜菊双糖苷转化为甜菊苷。酶的示例性实例包括甜叶菊(Stevia rebaudiana)的那些酶(例如，Richman et al.,2005,Plant J.41:56-67和US 2014/0329281和WO 2016/038095A2以及登录号AAR06920.1描述的那些)。编码所述这些酶的核酸可用于本发明提供的细胞和方法。在某些实施方案，本发明提供了使用核酸的细胞和方法，所述核酸与这些UGT74G1核酸中的至少一种具有至少80％、85％、90％、或95％序列同一性。在某些实施方案，本发明提供了使用核酸的细胞和方法，所述核酸编码与这些UGT74G1酶中的至少一种具有至少80％、85％、90％、或95％序列同一性的多肽。

6.4.9 UDP糖基转移酶76G1(UGT76G1)

UGT76G1能够将葡萄糖基团部分转移至受体分子(即甜菊醇1,2-糖苷)的C-13-O-葡萄糖的C-3'处。因此，UGT76G1能够作为尿苷5'-二磷酸葡糖基：甜菊醇13-O-1,2葡糖苷C-3'葡萄糖基转移酶起作用和作为尿苷5'-二磷酸葡糖基：甜菊醇-19-O-葡萄糖、13-O-1,2双糖苷C-3'葡萄糖基转移酶起作用。UGT76G1能够将甜菊双糖苷转化为Reb B。UGT76G1还能够将甜菊苷转化为Reb A。UGT76G1还能够将Reb D转化为Reb M。酶的示例性实例包括甜叶菊(Stevia rebaudiana)的那些酶(例如，Richman et al.,2005,Plant J.41:56-67和US2014/0329281A1和WO 2016/038095A2以及登录号AAR06912.1描述的那些)。编码所述这些酶的核酸可用于本发明提供的细胞和方法。在某些实施方案，本发明提供了使用核酸的细胞和方法，所述核酸与这些UGT76G1核酸中的至少一种具有至少80％、85％、90％、或95％序列同一性。在某些实施方案，本发明提供了使用核酸的细胞和方法，所述核酸编码与这些UGT76G1酶中的至少一种具有至少80％、85％、90％、或95％序列同一性的多肽。

6.4.10 UDP糖基转移酶85C2(UGT85C2)

UGT85C2能够作为尿苷5'-二磷酸葡糖基：甜菊醇13-OH转移酶起作用和作为尿苷5'-二磷酸葡糖基：甜菊醇-19-O-葡糖苷13-OH转移酶起作用。UGT85C2能够将甜菊醇转化为甜菊单糖苷，并还能够将19-糖苷转化为甜茶苷。酶的示例性实例包括甜叶菊(Steviarebaudiana)的那些酶(例如Richman et al.,2005,Plant J.41:56-67和US 2014/0329281A1、WO 2016/038095A2以及登录号AAR06916.1描述的那些)。编码所述这些酶的核酸可用于本发明提供的细胞和方法。在某些实施方案，本发明提供了使用核酸的细胞和方法，所述核酸与这些UGT85C2核酸中的至少一种具有至少80％、85％、90％、或95％序列同一性。在某些实施方案，本发明提供了使用核酸的细胞和方法，所述核酸编码与这些UGT85C2酶中的至少一种具有至少80％、85％、90％、或95％序列同一性的多肽。

6.4.11 UDP-糖基转移酶91D(UGT91D)

UGT91D能够作为尿苷5'-二磷酸葡糖基：甜菊醇-13-O-葡糖苷转移酶起作用，将葡萄糖基团部分转移至受体分子(甜菊醇-13-O-葡萄糖苷(甜菊单糖苷))的13-O-葡萄糖的C-2'处，以生成甜菊双糖苷。UGT91D还能够作为尿苷5'-二磷酸葡糖基：甜茶苷转移酶起作用，将葡萄糖基团部分转移至受体分子(甜茶苷)的13-O-葡萄糖的C-2'处，以提供甜菊苷。UGT91D也称为UGT91D2、UGT91D2e或UGT91D-like3。UGT91D酶的示例性实例包括甜叶菊(Stevia rebaudiana)的那些酶(例如，登录号为ACE87855.1的UGT序列，以及US2014/0329281A1，WO2016/038095A2和SEQ ID NO：7描述的那些)。编码所述这些酶的核酸可用于本发明提供的细胞和方法。在某些实施方案，本发明提供了使用核酸的细胞和方法，所述核酸与这些UGT91D核酸中的至少一种具有至少80％、85％、90％、或95％序列同一性。在某些实施方案，本发明提供了使用核酸的细胞和方法，所述核酸编码与这些UGT91D酶中的至少一种具有至少80％、85％、90％、或95％序列同一性的多肽。

6.4.12能够将Reb A转化为Reb D的尿苷二磷酸依赖性糖基转移酶(UGT_AD)

尿苷二磷酸依赖性糖基转移酶(UGT_AD)能够将葡萄糖基团部分转移至Reb A的19-O-葡萄糖的C-2’位置以生成Reb D。UGT_AD还能够将葡萄糖基团部分转移至甜菊苷(stevioside)的19-O-葡萄糖的C-2’位置以生成Reb E。UGT有用的实例包括来自稻(Oryzasativa)的Os_UGT_91C1(在Houghton-Larsen等人的专利申请WO 2013/022989A2中也称为EUGT11；XP_015629141.1)，以及来自番茄(Solanum lycopersicum)的Sl_UGT_101249881(在Markosyan等人的专利申请WO2014/193888A1中也称为UGTSL2；XP_004250485.1)。有用的UGT还包括UGT40087(XP_004982059.1；如WO 2018/031955中所述)，sr.UGT_9252778，Bd_UGT10840(XP_003560669.1)，Hv_UGT_V1(BAJ94055.1)，Bd_UGT10850(XP_010230871.1)，和Ob_UGT91B1_like(XP_006650455.1)。任何UGT或UGT变体均可用于本发明所述的组合物和方法。编码所述这些酶的核酸可用于本发明提供的细胞和方法。在某些实施方案，本发明提供了使用核酸的细胞和方法，所述核酸与UGT中的至少一种具有至少80％、85％、90％、或95％序列同一性。在某些实施方案，本发明提供了使用核酸的细胞和方法，所述核酸编码与所述这些UGT中的至少一种具有至少80％、85％、90％、或95％序列同一性的多肽。在某些实施方案，本发明提供了编码本发明所述的UGT变体的核酸。

6.5 MEV途径生成FPP和/或GGPP

在一些实施方案，本发明提供的经遗传修饰的宿主细胞包含MEV途径的一种或多种异源酶，其可用于形成FPP和/或GGPP。在一些实施方案，所述MEV途径的一种或多种酶包含使乙酰-CoA与丙二酰-CoA缩合以形成乙酰乙酰-CoA的酶。在一些实施方案，所述MEV途径的一种或多种酶包含使两分子乙酰-CoA缩合以形成乙酰乙酰-CoA的酶。在一些实施方案，所述MEV途径的一种或多种酶包含使乙酰乙酰-CoA与乙酰-CoA缩合以形成HMG-CoA的酶。在一些实施方案，所述MEV途径的一种或多种酶包含使HMG-CoA转化为甲羟戊酸的酶。在一些实施方案，所述MEV途径的一种或多种酶包含使甲羟戊酸磷酸化为甲羟戊酸5-磷酸的酶。在一些实施方案，所述MEV途径的一种或多种酶包含使甲羟戊酸5-磷酸转化为甲羟戊酸5-焦磷酸的酶。在一些实施方案，所述MEV途径的一种或多种酶包含使甲羟戊酸5-焦磷酸转化为异戊烯焦磷酸的酶。在一些实施方案，所述MEV途径的一种或多种酶包含使异戊烯焦磷酸转化为二甲基烯丙基二磷酸的酶。

在一些实施方案，所述MEV途径的一种或多种酶选自由乙酰-CoA硫解酶，乙酰乙酰-CoA合酶，HMG-CoA合酶，HMG-CoA还原酶，甲羟戊酸激酶，磷酸甲羟戊酸激酶，甲羟戊酸焦磷酸脱羧酶，和异戊基二磷酸：二甲基烯丙基二磷酸异构酶(IDI或IPP异构酶)组成的组。在一些实施方案，关于能够催化形成乙酰乙酰-CoA的所述MEV途径的酶，所述经遗传修饰的宿主细胞包含使两分子乙酰-CoA缩合以形成乙酰乙酰-CoA的酶，例如乙酰-CoA硫解酶；或者使乙酰-CoA与丙二酰-CoA缩合以形成乙酰乙酰-CoA的酶，例如乙酰乙酰-CoA合酶。在一些实施方案，所述经遗传修饰的宿主细胞包含使两分子乙酰-CoA缩合以形成乙酰乙酰-CoA的酶，例如乙酰-CoA硫解酶；和使乙酰-CoA与丙二酰-CoA缩合以形成乙酰乙酰-CoA的酶，例如乙酰乙酰-CoA合酶。

在一些实施方案，所述宿主细胞包含编码所述MEV途径的一种以上酶的一种或多种异源核苷酸序列。在一些实施方案，所述宿主细胞包含编码所述MEV途径的两种酶的一种或多种异源核苷酸序列。在一些实施方案，所述宿主细胞包含一种或多种异源核苷酸序列，所述一种或多种异源核苷酸序列编码可将HMG-CoA转化为甲羟戊酸的酶和可将甲羟戊酸转化为甲羟戊酸5-磷酸的酶。在一些实施方案，所述宿主细胞包含编码所述MEV途径的三种酶的一种或多种异源核苷酸序列。在一些实施方案，所述宿主细胞包含编码所述MEV途径的四种酶的一种或多种异源核苷酸序列。在一些实施方案，所述宿主细胞包含编码所述MEV途径的五种酶的一种或多种异源核苷酸序列。在一些实施方案，所述宿主细胞包含编码所述MEV途径的六种酶的一种或多种异源核苷酸序列。在一些实施方案，所述宿主细胞包含编码所述MEV途径的七种酶的一种或多种异源核苷酸序列。在一些实施方案，所述宿主细胞包含编码所述MEV途径的所有酶的多种异源核酸。

在一些实施方案，所述经遗传修饰的宿主细胞还包含编码酶的异源核酸，所述酶可将异戊烯焦磷酸(IPP)转化为二甲基烯丙基焦磷酸(DMAPP)。在一些实施方案，所述经遗传修饰的宿主细胞还包含编码酶的异源核酸，所述酶可使IPP和/或DMAPP分子缩合以形成聚异戊二烯基化合物。在一些实施方案，所述经遗传修饰的宿主细胞还包含编码酶的异源核酸，所述酶可修饰IPP或聚异戊二烯基以形成类异戊二烯化合物，例如FPP。

6.5.1乙酰-CoA转化为乙酰乙酰-CoA

在一些实施方案，所述经遗传修饰的宿主细胞包含编码酶的异源核苷酸序列，所述酶可使两分子的乙酰辅酶A缩合以形成乙酰乙酰-CoA，例如乙酰-CoA硫解酶。编码此种酶的核苷酸序列的示例性实例包括但不限于：(NC_000913REGION(区域)：2324131.2325315；大肠杆菌(Escherichia coli))，(D49362；脱氮副球菌(Paracoccus denitrificans))和(L20428；酿酒酵母(Saccharomyces cerevisiae))。

乙酰-CoA硫解酶催化两分子乙酰-CoA的可逆缩合反应以生成乙酰乙酰-CoA，但此反应在热力学上是不利的；乙酰乙酰-CoA硫解作用优于乙酰乙酰-CoA合成作用。乙酰乙酰-CoA合酶(AACS)(或者称为乙酰-CoA：丙二酰-CoA酰基转移酶；EC 2.3.1.194)使乙酰-CoA与丙二酰-CoA缩合以形成乙酰乙酰-CoA。与乙酰-CoA硫解酶相反，由于丙二酰-CoA的相关脱羧反应，AACS催化的乙酰乙酰-CoA合成基本上是能量有利的反应。此外，AACS对乙酰乙酰-CoA未表现出硫解活性，因此所述反应是不可逆的。

在包含乙酰-CoA硫解酶和异源性ADA和/或磷酸转乙酰酶(PTA)的宿主细胞中，有利于乙酰乙酰-CoA硫解的乙酰-CoA硫解酶催化的可逆反应可导致大的乙酰-CoA库。鉴于ADA的可逆活性，此乙酰-CoA库可反过来驱动ADA朝向将乙酰-CoA转化为乙醛的逆向反应，从而减少了ADA对乙酰-CoA生成提供的益处。类似地，PTA的活性是可逆的，因此，大的乙酰-CoA库可驱使PTA朝向将乙酰-CoA转化为乙酰磷酸的逆向反应。因此，在一些实施方案，为了提供对乙酰-CoA的强拉力以驱动ADA和PTA的正向反应，本发明提供的经遗传修饰的宿主细胞的所述MEV途径利用乙酰乙酰-CoA合酶使乙酰-CoA和丙二酰-CoA形成乙酰乙酰-CoA。

在一些实施方案，AACS是来自链霉菌属(Streptomyces sp.)菌株CL190(Okamuraet al.,Proc Natl Acad Sci USA 107(25):11265-70(2010))。链霉菌属(Streptomycessp.)菌株CL190的代表性AACS核苷酸序列包括登录号AB540131.1。链霉菌属(Streptomycessp.)菌株CL190的代表性AACS蛋白质序列包括登录号D7URV0、BAJ10048。可用于本发明提供的组合物和方法的其他乙酰乙酰-CoA合酶包括但不限于，链霉菌属(Streptomyces sp.)(AB183750；KO-3988BAD86806)；无环链霉菌(S.anulatus)菌株9663(FN178498；CAX48662)；链霉菌属KO-3988(AB212624；BAE78983)；游动放线菌属(Actinoplanes sp.)A40644(AB113568；BAD07381)；链霉菌属C(NZ_ACEW010000640；ZP_05511702)；达松维尔拟诺卡氏菌(Nocardiopsis dassonvillei)DSM 43111(NZ_ABUI01000023；ZP_04335288)；溃疡分枝杆菌(Mycobacterium ulcerans)Agy99(NC_008611；YP_907152)；海鱼分枝杆菌(Mycobacterium marinum)M(NC_010612；YP_001851502)；链霉菌属Mg1(NZ_DS570501；ZP_05002626)；链霉菌属AA4(NZ_ACEV01000037；ZP_05478992)；玫瑰孢链霉菌(S.roseosporus)NRRL 15998(NZ_ABYB01000295；ZP_04696763)；链霉菌属ACTE(NZ_ADFD01000030；ZP_06275834)；产绿色链霉菌(S.viridochromogenes)DSM 40736(NZ_ACEZ01000031；ZP_05529691)；弗兰克氏菌属(Frankia sp.)CcI3(NC_007777；YP_480101)；巴西诺卡菌(Nocardia brasiliensis)(NC_018681；YP_006812440.1)；和Austwickiachelonae放线菌(Austwickia chelonae)(NZ_BAGZ01000005；ZP_10950493.1)。其他合适的乙酰乙酰-CoA合酶包括美国专利申请公开号2010/0285549和2011/0281315中描述的那些，其内容均通过引用其整体并入本发明。

亦可用于本发明提供的组合物和方法的乙酰乙酰-CoA合酶包括那些被称为本发明所述的任何乙酰乙酰-CoA合酶的“衍生物”的分子。此种“衍生物”具有以下特征：(1)它与本发明所述的任何乙酰乙酰-CoA合酶具有基本同源性；和(2)能够催化乙酰-CoA与丙二酰-CoA的不可逆缩合反应以形成乙酰乙酰-CoA。如果衍生物的氨基酸序列与乙酰乙酰-CoA合酶的氨基酸序列为至少80％、更优选至少90％、最优选至少95％相同，则称乙酰乙酰-CoA合酶的衍生物与乙酰乙酰-CoA合酶具有“基本同源性”。

6.5.2乙酰乙酰-CoA转化为HMG-CoA

在一些实施方案，所述宿主细胞包含编码酶的异源核苷酸序列，所述酶可使乙酰乙酰-CoA与另一分子的乙酰-CoA缩合以形成3-羟基-3-甲基戊二酰-CoA(HMG-CoA)，例如HMG-CoA合酶。编码此种酶的核苷酸序列的示例性实例包括但不限于：(NC_001145.补体19061.20536；酿酒酵母)，(X96617；酿酒酵母)，(X83882；拟南芥)，(AB037907；griseola北里孢菌(Kitasatospora griseola))，(BT007302；智人(Homo sapiens))，和(NC_002758，基因座标签为SAV2546，GeneID(基因ID)为1122571；金黄色葡萄球菌(Staphylococcusaureus))。

6.5.3 HMG-CoA转化为甲羟戊酸

在一些实施方案，所述宿主细胞包含编码酶的异源核苷酸序列，所述酶可使HMG-CoA转化为甲羟戊酸，例如HMG-CoA还原酶。在一些实施方案，HMG-CoA还原酶是使用NADH的羟甲基戊二酰-CoA还原酶-CoA还原酶。HMG-CoA还原酶(EC 1.1.1.34；EC 1.1.1.88)催化(S)-HMG-CoA还原脱酰为(R)-甲羟戊酸，并可以分为两类，I类和II类HMGr(HMG-CoA还原酶)。I类包括来自真核生物和大多数古细菌的酶，II类包括某些原核生物和古细菌的HMG-CoA还原酶。除了序列的差异外，两类酶在其辅因子特异性方面也不同。与仅使用NADPH的I类酶不同，II类HMG-CoA还原酶在区分NADPH和NADH的能力方面不同。参见，例如Hedl etal.,Journal of Bacteriology 186(7):1927-1932(2004)。选择的II类HMG-CoA还原酶的辅因子特异性提供如下。

选择的II类HMG-CoA还原酶的辅因子特异性

用于本发明提供的组合物和方法的有用的HMG-CoA还原酶包括能够利用NADH作为辅因子的HMG-CoA还原酶，例如来自迈氏假单胞菌(P.mevalonii)，闪烁古生球菌(A.fulgidus)或金黄色葡萄球菌(S.aureus)的HMG-CoA还原酶。在特定实施方案，所述HMG-CoA还原酶仅能够利用NADH作为辅因子，例如来自迈氏假单胞菌(P.mevalonii)，波美罗伊硅杆菌(S.pomeroyi)或食酸代尔夫特菌(D.acidovorans)的HMG-CoA还原酶。

在一些实施方案，所述使用NADH的HMG-CoA还原酶来自迈氏假单胞菌(Pseudomonas mevalonii)。先前已描述了编码HMG-CoA还原酶(EC 1.1.1.88)的迈氏假单胞菌(Pseudomonas mevalonii)的野生型mvaA基因的序列。参见Beach and Rodwell,J.Bacteriol.171:2994-3001(1989)。迈氏假单胞菌(Pseudomonas mevalonii)的代表性mvaA核苷酸序列包括登录号M24015。迈氏假单胞菌(Pseudomonas mevalonii)的代表性HMG-CoA还原酶蛋白质序列包括登录号AAA25837、P13702、MVAA_PSEMV。

在一些实施方案，所述使用NADH的HMG-CoA还原酶来自波美罗伊硅杆菌(Silicibacter pomeroyi)。波美罗伊硅杆菌(Silicibacter pomeroyi)的代表性HMG-CoA还原酶核苷酸序列包括登录号NC_006569.1。波美罗伊硅杆菌(Silicibacter pomeroyi)的代表性HMG-CoA还原酶蛋白质序列包括登录号YP_164994。

在一些实施方案，所述使用NADH的HMG-CoA还原酶来自食酸代尔夫特菌(Delftiaacidovorans)。食酸代尔夫特菌(Delftia acidovorans)的代表性HMG-CoA还原酶核苷酸序列包括NC_010002REGION：补体(319980..321269)。食酸代尔夫特菌(Delftiaacidovorans)的代表性HMG-CoA还原酶蛋白质序列包括登录号YP_001561318。

在一些实施方案，所述使用NADH的HMG-CoA还原酶来自马铃薯(Solanumtuberosum)(Crane et al.,J.Plant Physiol.159:1301-1307(2002))。

在本发明提供的组合物和方法中还可采用的使用NADH的HMG-CoA还原酶包括那些被称为任何本发明所述的使用NADH的HMG-CoA还原酶的“衍生物”的分子，例如来自迈氏假单胞菌(P.mevalonii)，波美罗伊硅杆菌(S.pomeroyi)和食酸代尔夫特菌(D.acidovorans)的使用NADH的HMG-CoA还原酶的“衍生物”的分子。此种“衍生物”具有以下特征：(1)它与任何本发明所述的使用NADH的HMG-CoA还原酶具有基本同源性；和(2)能够催化(S)-HMG-CoA还原脱酰为(R)-甲羟戊酸，同时优先使用NADH作为辅因子。如果所述衍生物的氨基酸序列与使用NADH的HMG-CoA还原酶的氨基酸序列为至少80％，更优选至少90％，最优选至少95％相同，则称使用NADH的HMG-CoA还原酶的衍生物与使用NADH的HMG-CoA还原酶具有“基本同源性”。

本发明使用的短语“使用NADH/NADH-使用的”是指所述使用NADH的HMG-CoA还原酶对NADH作为辅因子相对NADPH作为辅因子具有选择性，譬如，通过证明对NADH的比活性高于对NADPH的比活性。在一些实施方案，对作为辅因子的NADH的选择性表示为k_cat ^(NADH)/k_cat ^(NADPH)比值。在一些实施方案，所述使用NADH的HMG-CoA还原酶具有至少5、10、15、20、25或大于25的k_cat ^(NADH)/k_cat ^(NADPH)比值。在一些实施方案，所述使用NADH的HMG-CoA还原酶仅使用NADH。譬如，仅使用NADH的使用NADH的HMG-CoA还原酶显示出一定活性，其中NADH作为体外唯一的辅因子提供，并且当NADPH作为唯一辅因子提供时显示出不可检测的活性。可利用本领域已知的任何确定辅因子特异性的方法来鉴定优先选择NADH作为辅因子的HMG-CoA还原酶，包括Kim et al.,Protein Science 9:1226-1234(2000)；和Wilding et al.,J.Bacteriol.182(18):5147-52(2000)中描述的那些，其内容均通过引用其整体并入本发明。

在一些实施方案，所述使用NADH的HMG-CoA还原酶被设计为对NADH相较NAPDH具有选择性，例如，通过辅因子结合口袋的定点诱变来设计。工程化设计NADH选择性的方法记载在Watanabe et al.,Microbiology 153:3044-3054(2007)中，用于确定HMG-CoA还原酶的辅因子特异性的方法记载在Kim et al.,Protein Sci.9:1226-1234(2000)中，其内容均通过引用其整体并入本发明。

在一些实施方案，所述使用NADH的HMG-CoA还原酶衍生自天然包含甲羟戊酸降解途径的宿主物种，例如，使作为其唯一碳源的甲羟戊酸分解代谢的宿主物种。在所述这些实施方案中，所述使用NADH的HMG-CoA还原酶，其通常催化在其原生宿主细胞内的内化的(R)-甲羟戊酸氧化酰化为(S)-HMG-CoA，用于催化所述逆向反应，即，在包含甲羟戊酸生物合成途径的经遗传修饰的宿主细胞中，使(S)-HMG-CoA还原脱酰为(R)-甲羟戊酸。能够在作为其唯一碳源的甲羟戊酸上生长的原核生物已记载在：Anderson et al.,J.Bacteriol,171(12):6468-6472(1989)；Beach et al.,J.Bacteriol.171:2994-3001(1989)；Bensch etal.,J.Biol.Chem.245:3755-3762；Fimongnari et al.,Biochemistry 4:2086-2090(1965)；Siddiqi et al.,Biochem.Biophys.Res.Commun.8:110-113(1962)；Siddiqi etal.,J.Bacteriol.93:207-214(1967)；和Takatsuji et al.,Biochem.Biophys.Res.Commun.110:187-193(1983)中，其内容均通过引用其整体并入本发明。

在本发明提供的组合物和方法的一些实施方案中，所述宿主细胞包含使用NADH的HMGr(HMG-CoA还原酶)和使用NADPH的HMG-CoA还原酶。编码使用NADPH的HMG-CoA还原酶的核苷酸序列的示例性实例包括但不限于：(NM_206548；黑腹果蝇(Drosophilamelanogaster))，(NC_002758，基因座标签为SAV2545，基因ID(GeneID)为1122570；金黄色葡萄球菌(Staphylococcus aureus))，(AB015627；链霉菌属(Streptomyces sp.)KO3988)，(AX128213，提供编码截短的HMG-CoA还原酶的序列；酿酒酵母(Saccharomycescerevisiae))，和(NC_001145：补体(115734.118898；酿酒酵母(Saccharomycescerevisiae))。

6.5.4甲羟戊酸转化为甲羟戊酸-5-磷酸

在一些实施方案，所述宿主细胞包含编码酶的异源核苷酸序列，所述酶可将甲羟戊酸转化为甲羟戊酸5-磷酸，例如甲羟戊酸激酶。编码此种酶的核苷酸序列的示例性实例包括但不限于：(L77688；拟南芥(Arabidopsis thaliana))，和(X55875；酿酒酵母(Saccharomyces cerevisiae))。

6.5.5甲羟戊酸-5-磷酸转化为甲羟戊酸-5-焦磷酸

在一些实施方案，所述宿主细胞包含编码酶的异源核苷酸序列，所述酶可将甲羟戊酸5-磷酸转化为甲羟戊酸5-焦磷酸，例如磷酸甲羟戊酸激酶。编码此种酶的核苷酸序列的示例性实例包括但不限于：(AF429385；巴西橡胶树(Hevea brasiliensis))，(NM_006556；智人(Homo sapiens))，和(NC_001145.补体712315.713670；酿酒酵母(Saccharomyces cerevisiae))。

6.5.6甲羟戊酸-5-焦磷酸转化为IPP

在一些实施方案，所述宿主细胞包含编码酶的异源核苷酸序列，所述酶可将甲羟戊酸5-焦磷酸转化为异戊烯焦磷酸(IPP)，例如甲羟戊酸焦磷酸脱羧酶。编码此种酶的核苷酸序列的示例性实例包括但不限于：(X97557；酿酒酵母(Saccharomyces cerevisiae))，(AF290095；屎肠球菌(Enterococcus faecium))，和(U49260；智人(Homo sapiens))。

6.5.7 IPP转化为DMAPP

在一些实施方案，所述宿主细胞还包含编码酶的异源核苷酸序列，所述酶可将通过MEV途径生成的IPP转化为二甲基烯丙基焦磷酸(DMAPP)，例如IPP异构酶。编码此种酶的核苷酸序列的示例性实例包括但不限于：(NC_000913，3031087.3031635；大肠杆菌(Escherichia coli))，和(AF082326；雨生红球藻(Haematococcus pluvialis))。

6.5.8聚异戊二烯合酶

在一些实施方案，所述宿主细胞还包含编码聚异戊二烯合酶的异源核苷酸序列，所述聚异戊二烯合酶可使IPP和/或DMAPP分子缩合以形成含有多于5个碳的聚异戊二烯基化合物。

在一些实施方案，所述宿主细胞包含编码酶的异源核苷酸序列，所述酶可将一分子IPP与一分子DMAPP缩合以形成一分子香叶基焦磷酸(“GPP”)，例如GPP合酶。编码此种酶的核苷酸序列的示例性实例包括但不限于：(AF513111；巨冷杉(Abies grandis))，(AF513112；巨冷杉)，(AF513113；巨冷杉)，(AY534686；金鱼草(Antirrhinum majus))，(AY534687；金鱼草)，(Y17376；拟南芥(Arabidopsis thaliana))，(AE016877，基因座AP11092；蜡样芽胞杆菌(Bacillus cereus)；ATCC 14579)，(AJ243739；甜橙(Citrussinensis))，(AY534745；仙女扇(Clarkia breweri))，(AY953508；齿小蠹(Ips pini))，(DQ286930；番茄(Lycopersicon esculentum))，(AF182828；胡椒薄荷(Mentha xpiperita))，(AF182827；胡椒薄荷)，(MPI249453；胡椒薄荷)，(PZE431697，基因座CAD24425；玉米黄质副球菌(Paracoccus zeaxanthinifaciens))，(AY866498；胡黄连(Picrorhiza kurrooa))，(AY351862；葡萄(Vitis vinifera))，和(AF203881，基因座AAF12843；运动发酵单胞菌(Zymomonas mobilis))。

在一些实施方案，所述宿主细胞包含编码酶的异源核苷酸序列，所述酶可将两分子IPP与一分子DMAPP缩合，或者将IPP分子添加至GPP分子中，以形成法呢基焦磷酸(“FPP”)分子，例如FPP合酶。编码此种酶的核苷酸序列的示例性实例包括但不限于：(ATU80605；拟南芥)，(ATHFPS2R；拟南芥)，(AAU36376；青蒿(Artemisia annua))，(AF461050；普通牛(Bostaurus))，(D00694；大肠杆菌K-12)，(AE009951，基因座AAL95523；具核梭杆菌具核亚种(Fusobacterium nucleatum subsp.nucleatum)ATCC25586)，(GFFPPSGEN；藤仓赤霉(Gibberella fujikuroi))，(CP000009，基因座AAW60034；氧化葡萄糖杆菌(Gluconobacteroxydans)621H)，(AF019892；向日葵(Helianthus annuus))，(HUMFAPS；智人(Homosapiens))，(KLPFPSQCR；乳酸克鲁维酵母(Kluyveromyces lactis))，(LAU15777；白羽扇豆(Lupinus albus))，(LAU20771；白羽扇豆)，(AF309508；小家鼠(Mus musculus))，(NCFPPSGEN；粗糙脉孢菌(Neurospora crassa))，(PAFPS1；灰白银胶菊(Partheniumargentatum))，(PAFPS2；灰白银胶菊)，(RATFAPS；褐家鼠(Rattus norvegicus))，(YSCFPP；酿酒酵母)，(D89104；粟酒裂殖酵母(Schizosaccharomyces pombe))，(CP000003，基因座AAT87386；酿脓链球菌(Streptococcus pyogenes))，(CP000017，基因座AAZ51849；酿脓链球菌)，(NC_008022，基因座YP_598856；酿脓链球菌MGAS10270)，(NC_008023，基因座YP_600845；酿脓链球菌MGAS2096)，(NC_008024，基因座YP_602832；酿脓链球菌MGAS10750)，(MZEFPS；玉米(Zea mays))，(AE000657，基因座AAC06913；风产液菌(Aquifex aeolicus)VF5)，(NM_202836；拟南芥)，(D84432，基因座BAA12575；枯草芽孢杆菌(Bacillussubtilis))，(U12678，基因座AAC28894；慢生型大豆根瘤菌(Bradyrhizobium japonicum)USDA 110)，(BACFDPS；嗜热脂肪土芽孢杆菌(Geobacillus stearothermophilus))，(NC_002940，基因座NP_873754；杜克雷嗜血杆菌(Haemophilus ducreyi)35000HP)，(L42023，基因座AAC23087；流感嗜血杆菌(Haemophilus influenzae)Rd KW20)，(J05262；智人(Homosapiens))，(YP_395294；沙克乳酸杆菌沙克亚种(Lactobacillus sakei subsp.sakei)23K)，(NC_005823，基因座YP_000273；Copenhageni str.Fiocruz钩端螺旋体血清变型(Leptospira interrogans serovar Copenhageni str.Fiocruz)L1-130)，(AB003187；藤黄微球菌(Micrococcus luteus))，(NC_002946，基因座YP_208768；淋病奈瑟氏菌(Neisseria gonorrhoeae)FA 1090)，(U00090，基因座AAB91752；根瘤菌属(Rhizobiumsp.)NGR234)，(J05091；酿酒酵母)，(CP000031，基因座AAV93568；波美罗伊硅杆菌(Silicibacter pomeroyi)DSS-3)，(AE008481，基因座AAK99890；肺炎链球菌(Streptococcus pneumoniae)R6)，和(NC_004556，基因座NP 779706；木质部难养菌特曼库拉1(Xylella fastidiosa Temecula1)。

在一些实施方案，所述宿主细胞还包含编码酶的异源核苷酸序列，所述酶可将IPP和DMAPP或IPP和FPP进行结合以形成香叶基香叶基焦磷酸(“GGPP”)。编码此种酶的核苷酸序列的示例性实例包括但不限于：(ATHGERPYRS；拟南芥)，(BT005328；拟南芥)，(NM_119845；拟南芥)，(NZ_AAJM01000380，基因座ZP_00743052；苏云金芽孢杆菌血清变型(Bacillus thuringiensis serovar israelensis)，ATCC 35646sq1563)，(CRGGPPS；长春花(Catharanthus roseus))，(NZ_AABF02000074，基因座ZP_00144509；具核梭杆菌文森特亚种(Fusobacterium nucleatum subsp.vincentii)，ATCC 49256)，(GFGGPPSGN；藤仓赤霉(Gibberella fujikuroi))，(AY371321；银杏(Ginkgo biloba))，(AB055496；巴西橡胶树(Hevea brasiliensis))，(AB017971；智人(Homo sapiens))，(MCI276129；卢西坦毛霉(Mucor circinelloides f.lusitanicus))，(AB016044；小家鼠(Mus musculus))，(AABX01000298，基因座NCU01427；粗糙脉孢菌(Neurospora crassa))，(NCU20940；粗糙脉孢菌)，(NZ_AAKL01000008，基因座ZP_00943566；青枯雷尔氏菌(Ralstonia solanacearum)UW551)，(AB118238；褐家鼠(Rattus norvegicus))，(SCU31632；酿酒酵母)，(AB016095；细长聚球藻(Synechococcus elongates))，(SAGGPS；白芥子(Sinapis alba))，(SSOGDS；嗜酸热硫化叶菌(Sulfolobus acidocaldarius))，(NC_007759，基因座YP_461832；aciditrophicus互养菌(Syntrophus aciditrophicus)SB)，(NC_006840，基因座YP_204095；费氏弧菌(Vibrio fischeri)ES114)，(NM_112315；拟南芥)，(ERWCRTE；成团泛菌(Pantoea agglomerans))，(D90087，基因座BAA14124；菠萝泛菌(Pantoea ananatis))，(X52291，基因座CAA36538；荚膜红细菌(Rhodobacter capsulatus))，(AF195122，基因座AAF24294；类球红细菌(Rhodobacter sphaeroides))，和(NC_004350，基因座NP_721015；变异链球菌(Streptococcus mutans)UA159)。

虽然上文描述了甲羟戊酸途径的酶的实例，但在某些实施方案，所述DXP途径的酶在本发明所述的宿主细胞、组合物和方法中可用作生成DMAPP和IPP的替代途径或另外的途径。所述DXP途径的酶以及编码所述酶的核酸是本领域公知的并已在现有技术例如WO2012/135591A2中进行表征。

6.6生成甜菊糖苷类化合物的方法

另一方面，本发明提供了生成甜菊糖苷的方法，所述方法包含以下步骤：(a)在适于制备甜菊糖苷化合物的条件下，在含有碳源的培养基中培养能够生成所述甜菊糖苷的任何本发明所述的经遗传修饰的宿主细胞的种群；和(b)从所述培养基回收所述甜菊糖苷化合物。

在一些实施方案，与不包含一种或多种修饰的亲本细胞相比，或者与仅包含所述经遗传修饰的宿主细胞的一种或多种修饰的子集，但在遗传上是相同的亲本细胞相比，所述经遗传修饰的宿主细胞生成增加量的甜菊糖苷。在一些实施方案，所述增加的量为至少1％、5％、10％、15％、20％、25％、30％、35％、40％、45％、50％、55％、60％、65％、70％、75％、80％、85％、90％、95％、100％、或大于100％，例如，以产量、生成量、生产率计，或以克/升细胞培养物，毫克/克干细胞重量计，或者基于每单位体积的细胞培养物，基于每单位干细胞重量，基于每单位时间的每单位体积的细胞培养物，或基于每单位时间的每单位干细胞重量计，进行测定。

在一些实施方案，所述宿主细胞生成升高水平的甜菊糖苷，其大于约1克/升发酵培养基。在一些实施方案，所述宿主细胞生成升高水平的甜菊糖苷，其大于约5克/升发酵培养基。在一些实施方案，所述宿主细胞生成升高水平的甜菊糖苷，其大于约10克/升发酵培养基。在一些实施方案，所述甜菊糖苷以从约10至约50克/升细胞培养物，从约10至约15克/升细胞培养物，超过约15克/升细胞培养物，超过约20克/升细胞培养物，超过约25克/升细胞培养物，超过约30克/升细胞培养物的量生成。

在一些实施方案，所述宿主细胞生成升高水平的甜菊糖苷，其大于约50毫克每克干细胞重量。在一些此类实施方案中，所述甜菊糖苷以从约50至约1500毫克，超过约100毫克，超过约150毫克，超过约200毫克，超过约250毫克，超过约500毫克，超过约750毫克，或超过约1000毫克每克干细胞重量的量生成。

在一些实施方案，所述宿主细胞生成升高水平的甜菊糖苷，其比由亲本细胞生成的甜菊糖苷水平高至少约10％，至少约15％，至少约20％，至少约25％，至少约30％，至少约35％，至少约40％，至少约45％，至少约50％，至少约60％，至少约70％，至少约80％，至少约90％，至少约2倍，至少约2.5倍，至少约5倍，至少约10倍，至少约20倍，至少约30倍，至少约40倍，至少约50倍，至少约75倍，至少约100倍，至少约200倍，至少约300倍，至少约400倍，至少约500倍，或至少约1000倍或更多，基于每单位体积细胞培养物。

在一些实施方案，所述宿主细胞生成升高水平的甜菊糖苷，其比由亲本细胞生成的甜菊糖苷水平高至少约10％，至少约15％，至少约20％，至少约25％，至少约30％，至少约35％，至少约40％，至少约45％，至少约50％，至少约60％，至少约70％，至少约80％，至少约90％，至少约2倍，至少约2.5倍，至少约5倍，至少约10倍，至少约20倍，至少约30倍，至少约40倍，至少约50倍，至少约75倍，至少约100倍，至少约200倍，至少约300倍，至少约400倍，至少约500倍，或至少约1000倍或更多，基于每单位干细胞重量。

在一些实施方案，所述宿主细胞生成升高水平的甜菊糖苷，其比由亲本细胞生成的甜菊糖苷水平高至少约10％，至少约15％，至少约20％，至少约25％，至少约30％，至少约35％，至少约40％，至少约45％，至少约50％，至少约60％，至少约70％，至少约80％，至少约90％，至少约2倍，至少约2.5倍，至少约5倍，至少约10倍，至少约20倍，至少约30倍，至少约40倍，至少约50倍，至少约75倍，至少约100倍，至少约200倍，至少约300倍，至少约400倍，至少约500倍，或至少约1000倍或更多，基于每单位时间的每单位体积细胞培养物。

在一些实施方案，所述宿主细胞生成升高水平的甜菊糖苷，其比由亲本细胞生成的甜菊糖苷水平高至少约10％，至少约15％，至少约20％，至少约25％，至少约30％，至少约35％，至少约40％，至少约45％，至少约50％，至少约60％，至少约70％，至少约80％，至少约90％，至少约2倍，至少约2.5倍，至少约5倍，至少约10倍，至少约20倍，至少约30倍，至少约40倍，至少约50倍，至少约75倍，至少约100倍，至少约200倍，至少约300倍，至少约400倍，至少约500倍，或至少约1000倍或更多，基于每单位时间的每单位干细胞重量。

在大多实施方案中，所述宿主细胞生成的升高水平的甜菊糖苷是在诱导化合物存在下进行诱导。在不存在所述诱导化合物情况下，可容易地操作此种宿主细胞。然后加入所述诱导化合物以诱导所述宿主细胞生成升高水平的甜菊糖苷。在其他实施方案，通过改变培养条件，例如改变生长温度、培养基成分等，可诱导所述宿主细胞生成升高水平的甜菊糖苷。

6.7培养基和培养条件

用于微生物培养物的维持和生长的物料和方法是微生物学或发酵科学领域的技术人员所熟知的(参见，例如Bailey et al.,Biochemical Engineering Fundamentals,second edition,McGraw Hill,New York,1986)。根据宿主细胞、发酵和过程/方法的特定要求，必须考虑适当的培养基，pH值，温度，以及需氧、微需氧或厌氧条件的要求。

本发明提供的生成甜菊糖苷类化合物的方法可在合适的容器(包括但不限于细胞培养板、微量滴定板、烧瓶或发酵罐)中于合适的培养基(例如，含或不含泛酸补充)中进行。此外，所述方法可以本领域已知的任何发酵规模进行，以支持微生物产物的工业生产。可使用任何合适的发酵罐，包括搅拌槽式发酵罐，气升式发酵罐，气泡式发酵罐，或其任何组合。在利用酿酒酵母(Saccharomyces cerevisiae)作为宿主细胞的特定实施方案中，菌株可在发酵罐中生长，详细记载如Kosaric,et al,Ullmann's Encyclopedia of IndustrialChemistry,Sixth Edition,Volume 12,pages 398-473,Wiley-VCH Verlag GmbH&Co.KDaA,Weinheim,Germany中所述。

在一些实施方案，所述培养基是其中能够生成甜菊糖苷的经遗传修饰的微生物可以存活，即保持生长和活力的任何培养基。在一些实施方案，所述培养基是包含可同化的碳源、氮源和磷源(phosphate source)的水性培养基。此种培养基还可包括适当的盐类、矿物质类、金属类和其他营养物类。在一些实施方案，将所述碳源和每种必需细胞营养物增量地或连续地添加到发酵培养基中，并将每种所需营养物通过使细胞生长，譬如，根据基于将碳源转化成生物量的细胞的代谢或呼吸功能的预定细胞生长曲线，保持在基本有效同化所需的最低水平。

用于培养微生物的合适条件和合适的培养基是本领域熟知的。在一些实施方案，所述合适的培养基补充有一种或多种另外的试剂，例如诱导物(例如，当编码基因产物的一个或多个核苷酸序列受诱导型启动子的控制时)，阻抑物(例如，当编码基因产物的一个或多个核苷酸序列受阻抑型启动子的控制时)，或选择剂(例如，选择包含所述遗传修饰的微生物的抗生素)。

在一些实施方案，所述碳源是单糖(简单糖)、二糖、多糖、不可发酵的碳源、或其一种或多种组合。合适的单糖的非限制性实例包括葡萄糖、半乳糖、甘露糖、果糖、木糖、核糖、和其组合。合适的二糖的非限制性实例包括蔗糖、乳糖、麦芽糖、海藻糖、纤维二糖、和其组合。合适的多糖的非限制性实例包括淀粉、糖原、纤维素、几丁质、和其组合。合适的不可发酵碳源的非限制性实例包括乙酸盐和甘油。

所述培养基中碳源(例如葡萄糖)的浓度足以促进细胞生长，但不能高到抑制所用微生物的生长。通常，培养物采用碳源(例如葡萄糖)进行，所述碳源以达到所需生长水平和所需生物量的水平进行添加。在其他实施方案，所述培养基中碳源(例如葡萄糖)的浓度大于约1g/L，优选大于约2g/L，更优选大于约5g/L。此外，所述培养基中碳源(例如葡萄糖)的浓度通常小于约100g/L，优选小于约50g/L，更优选小于约20g/L。应当注意，对培养组分浓度的提及可以指初始和/或正在进行的组分浓度。在一些案例中，可能需要在培养期间使所述培养基耗尽碳源。

可用于合适培养基的可同化氮的来源包括但不限于简单氮源、有机氮源和复合氮源。此类氮源包括无水氨，铵盐类，以及动物、植物和/或微生物来源的物质。合适的氮源包括但不限于，蛋白质水解产物类，微生物生物质水解产物类，蛋白胨，酵母提取物，硫酸铵，尿素和氨基酸类。通常，所述培养基中所述氮源的浓度大于约0.1g/L，优选大于约0.25g/L，更优选大于约1.0g/L。然而，超过一定浓度，向所述培养基中添加氮源对于微生物的生长是不利的。因此，所述培养基中所述氮源的浓度小于约20g/L，优选小于约10g/L，更优选小于约5g/L。此外，在一些实施例中，可能需要在培养期间使所述培养基耗尽所述氮源。

有效的培养基可含有其他化合物，例如无机盐类、维生素类、痕量金属类、或生长促进剂类。此类其他化合物也可存在于有效培养基中的碳源、氮源或矿物源中，或者可特异性地添加至所述培养基中。

所述培养基还可含有合适的磷源。此类磷源包括无机磷源和有机磷源。优选的磷源包括但不限于磷酸盐类，例如单或二元磷酸钠及单或二元磷酸钾、磷酸铵、和其混合物。通常，所述培养基中磷酸盐的浓度大于约1.0g/L，优选大于约2.0g/L，更优选大于约5.0g/L。然而，超过一定浓度，向所述培养基中添加磷酸盐对于微生物的生长是不利的。因此，所述培养基中所述磷酸盐的浓度通常小于约20g/L，优选小于约15g/L，更优选小于约10g/L。

合适的培养基还可包括镁源，优选地以生理学上可接受的盐的形式，例如七水合硫酸镁，尽管可使用浓度为贡献相似量的镁的其他镁源。通常，所述培养基中镁的浓度大于约0.5g/L，优选大于约1.0g/L，更优选大于约2.0g/L。然而，超过一定浓度，向所述培养基中添加镁对于微生物的生长是不利的。因此，所述培养基中镁的浓度通常小于约10g/L，优选小于约5g/L，更优选小于约3g/L。此外，在一些实施例中，可能需要在培养期间使所述培养基耗尽镁源。

在一些实施方案，所述培养基还可包含生物学上可接受的螯合剂，例如二水合柠檬酸三钠。在此类实施例中，所述培养基中螯合剂的浓度大于约0.2g/L，优选大于约0.5g/L，更优选大于约1g/L。然而，超过一定浓度，向所述培养基中添加螯合剂对于微生物的生长是不利的。因此，所述培养基中螯合剂的浓度通常小于约10g/L，优选小于约5g/L，更优选小于约2g/L。

所述培养基最初还可包括生物学上可接受的酸或碱以维持所述培养基的所需pH值。生物学上可接受的酸包括但不限于，盐酸、硫酸、硝酸、磷酸、和其混合物。生物学上可接受的碱包括但不限于，氢氧化铵、氢氧化钠、氢氧化钾、和其混合物。在一些实施方案，使用的碱是氢氧化铵。

所述培养基还可包括生物学上可接受的钙源，包括但不限于氯化钙。通常，所述培养基中所述钙源(例如氯化钙二水合物)的浓度在约5mg/L至约2000mg/L的范围内，优选在约20mg/L至约1000mg/L的范围内，更优选在约50mg/L至约500mg/L的范围内。

所述培养基还可包括氯化钠。通常，所述培养基中氯化钠的浓度在约0.1g/L至约5g/L的范围内，优选在约1g/L至约4g/L的范围内，更优选在约2g/L至约4g/L的范围内。

在一些实施方案，所述培养基还可包含痕量金属。此类痕量金属可作为储备溶液添加至所述培养基中，为方便起见，可与培养基的其余部分分开制备。通常，添加至所述培养基中的此痕量金属溶液的量大于约1mL/L，优选大于约5mL/L，更优选大于约10mL/L。然而，超过一定浓度，向所述培养基中添加痕量金属对于微生物的生长是不利的。因此，添加至所述培养基中的此痕量金属溶液的量通常小于约100mL/L，优选小于约50mL/L，更优选小于约30mL/L。应注意的是，除了在储备溶液中添加痕量金属之外，各个组分可单独进行添加，各自在与上述痕量金属溶液范围所规定的组分的量相对应的范围内。

在一些实施方案，所述培养基可包括其他维生素类，例如泛酸、生物素、钙、泛酸盐、肌醇、吡哆醇-HCl和硫胺素-HCl。此类维生素可作为储备溶液添加至所述培养基中，为方便起见，可与培养基的其余部分分开制备。然而，超过一定浓度，向所述培养基中添加维生素类不利于微生物的生长。

本发明所述的发酵方法可以常规培养模式进行，所述培养模式包括但不限于分批、补料分批、细胞再循环、连续和半连续。在一些实施方案，所述发酵以补料分批模式进行。在此类案例中，所述培养基中的一些组分在培养期间被耗尽，所述组分包括在发酵的生成阶段期间的泛酸。在一些实施方案，所述培养物可在开始时(例如，生成阶段)补充相对高浓度的此类组分，使得在需要添加之前支持生长和/或甜菊糖苷生成一段时间。所述这些组分的优选范围在整个培养过程中通过添加来维持，所述添加以培养物耗尽的水平进行添加。可通过例如定期对培养基取样并测定浓度来监测所述培养基中组分的水平。或者，一旦开发出标准培养程序，所述添加可在整个培养期间的特定时间对应于已知水平以一定时间间隔进行。如本领域技术人员将认识到的，随着所述培养基的细胞密度增加，培养期间营养物的消耗速率亦将增加。此外，为了避免将外来微生物引入培养基中，可使用本领域已知的无菌添加方法进行添加。此外，在培养期间可加入少量消泡剂。

所述培养基的温度可以是适于经遗传修饰的细胞生长和/或甜菊糖苷生成的任何温度。譬如，在用接种物接种培养基之前，所述培养基可置于并保持在约20℃至约45℃的温度范围，优选保持在约25℃至约40℃的温度范围，更优选保持在约28℃至约32℃的温度范围。

可通过向所述培养基中添加酸或碱来控制所述培养基的pH值。在此类案例中，当氨用于控制pH时，其也方便地用作所述培养基中的氮源。优选地，所述pH值保持在约3.0至约8.0，更优选保持在约3.5至约7.0，最优选保持在约4.0至约6.5。

在一些实施方案，在培养期间监测所述培养基的碳源浓度，例如葡萄糖浓度。可使用已知技术监测所述培养基的葡萄糖浓度，例如，采用葡萄糖氧化酶试验或高压液相色谱，其可用于监测上清液(例如，所述培养基的无细胞组分)中的葡萄糖浓度。所述碳源浓度通常保持低于发生细胞生长抑制的水平。虽然此浓度可能因生物体而异，但对于葡萄糖作为碳源，细胞生长抑制发生在葡萄糖浓度大于约60g/L时，并可通过试验容易地确定。因此，当葡萄糖用作碳源时，优选将葡萄糖加入发酵罐中并保持在检测限以下。或者，所述培养基中的葡萄糖浓度维持在约1g/L至约100g/L的范围内，更优选地维持在约2g/L至约50g/L的范围内，更优选地维持在约5g/L至约20g/L的范围内。尽管通过添加例如基本上纯的葡萄糖溶液，可将所述碳源浓度维持在所需水平，但通过添加初始培养基的等分试样来维持所述培养基的所述碳源浓度是可接受的，并且可能是优选的。使用初始培养基的等分试样是可取的，因为可同时维持所述培养基中其他营养物(例如，氮源和磷源)的浓度。同样，通过添加痕量金属溶液的等份试样，亦可在所述培养基中维持所述痕量金属浓度。

其他合适的发酵培养基和方法记载在例如WO 2016/196321中。

6.8发酵组合物

另一方面，本发明提供了发酵组合物，其包含本发明所述的经遗传修饰的宿主细胞和由所述经遗传修饰的宿主细胞生成的甜菊糖苷类化合物。所述发酵组合物可进一步包含培养基。在某些实施方案，所述发酵组合物包含经遗传修饰的宿主细胞，和进一步包含Reb A、Reb D和Reb M。在某些实施方案，本发明提供的发酵组合物包含Reb M，作为由所述经遗传修饰的宿主细胞生成的甜菊糖苷类化合物的主要组分。在某些实施方案，所述发酵组合物包含Reb A：Reb D：Reb M之比为至少1：7：50的RebA、RebD和RebM。在某些实施方案，所述发酵组合物包含Reb A：Reb D：Reb M之比为至少1：7：50至1：100：1000的RebA、RebD和RebM。在某些实施方案，所述发酵组合物包含Reb A：Reb D：Reb M之比为至少1：7：50至1：200：2000。在某些实施方案，所述Reb A、Reb D和Reb M的比例是基于与所述经遗传修饰的宿主细胞和所述培养基相关的甜菊糖苷类化合物的总含量。在某些实施方案，所述Reb A、Reb D和Reb M的比例是基于所述培养基中甜菊糖苷类化合物的总含量。在某些实施方案，所述Reb A、Reb D和Reb M的比例是基于与所述经遗传修饰的宿主细胞相关的甜菊糖苷类化合物的总含量。

在某些实施方案，本发明提供的发酵组合物包含不可检测水平的Reb M2。在某些实施方案，本发明提供的发酵组合物包含不可检测水平的非天然存在的甜菊糖苷类化合物。

6.9甜菊糖苷类化合物的回收

一旦甜菊糖苷由所述宿主细胞生成，便可使用本领域已知的任何合适的分离和纯化方法将其回收或分离用于后续应用。在一些实施方案，通过离心将包含甜菊糖苷的澄清水相从发酵物分离得到。在其他实施方案，通过将破乳剂添加至发酵反应中，将包含甜菊糖苷的澄清水相从发酵物分离得到。破乳剂的示例性实例包括絮凝剂类和凝结剂类。

在所述这些细胞中生成的甜菊糖苷可存在于培养物上清液中和/或与所述宿主细胞结合。在甜菊糖苷与宿主细胞结合的实施方案中，所述甜菊糖苷的回收可包括改善甜菊糖苷从细胞中释放的方法。在一些实施方案，这可采取用热水或缓冲液处理，有或没有表面活性剂，有或没有添加缓冲剂或盐的方式来清洗细胞的形式。在一些实施方案，所述温度是认为适合释放甜菊糖苷类化合物的任何温度。在一些实施方案，所述温度是从40℃至95℃；或从60℃至90℃；或从75℃到85℃的范围。在一些实施方案，所述温度是40℃、45℃、50℃、55℃、65℃、70℃、75℃、80℃、85℃、90℃、或95℃。在一些实施方案，物理或化学细胞破坏可用于增强甜菊糖苷类化合物从宿主细胞释放。或者和/或随后，可使用分离单元操作来回收所述培养基中的甜菊糖苷，所述分离单元操作包括但不限于，溶剂萃取法、膜澄清法、膜浓缩法、吸附法、色谱法、蒸发法、化学衍生化法、结晶法和干燥法。

6.10制备经遗传修饰的细胞的方法

本发明还提供了用于生成宿主细胞的方法，所述宿主细胞经遗传工程改造以包含一种或多种上述修饰，例如，编码甜叶菊(Stevia rebaudiana)异贝壳杉烯酸羟化酶和/或生物合成途径酶(例如用于甜菊糖苷化合物的生物合成途径酶)的一种或多种异源核酸。异源酶在宿主细胞中的表达可通过在所述宿主细胞中引入包含编码所述酶的核苷酸序列的核酸来实现，所述核酸受允许在所述宿主细胞中表达的调节元件的控制。在一些实施方案，所述核酸是染色体外质粒。在其他实施方案，所述核酸是染色体整合载体，其可将所述核苷酸序列整合到所述宿主细胞的染色体中。在其他实施方案，所述核酸是线性双链DNA片段，其可通过同源性将核苷酸序列整合到宿主细胞的染色体中。

可通过本领域技术人员已知的任何方法，且不限于这些方法，将编码这些蛋白质的核酸引入所述宿主细胞中(参见，例如Hinnen et al.(1978)Proc.Natl.Acad.Sci.USA75:1292-3；Cregg et al.(1985)Mol.Cell.Biol.5:3376-3385；Goeddel et al.eds,1990,Methods in Enzymology,vol.185,Academic Press,Inc.,CA；Krieger,1990,GeneTransfer and Expression--A Laboratory Manual,Stockton Press,NY；Sambrook etal.,1989,Molecular Cloning--A Laboratory Manual,Cold Spring HarborLaboratory,NY；和Ausubel et al.,eds.,Current Edition,Current Protocols inMolecular Biology,Greene Publishing Associates and Wiley Interscience,NY)。示例性技术包括但不限于原生质球法、电穿孔法、PEG1000介导的转化、和乙酸锂或氯化锂介导的转化。

可通过修饰编码所述酶的基因的转录来改变宿主细胞中酶的量。其可通过例如以下方式来实现：通过修饰编码所述酶的所述核苷酸序列的拷贝数(例如，通过使用包含所述核苷酸序列的更高或更低拷贝数的表达载体，或通过将所述核苷酸序列另外的拷贝引入所述宿主细胞的基因组中，或通过删除或破坏所述宿主细胞基因组中的所述核苷酸序列)，通过改变操纵子的多顺反子mRNA上的编码序列的顺序或将操纵子分解成各自具有其自身控制元件的单个基因，或通过增加核苷酸序列可操作连接的启动子或操纵子的强度。或者，此外，可通过修饰编码所述酶的mRNA的翻译水平来改变宿主细胞中酶的拷贝数。其可通过譬如以下方式来实现：通过修饰mRNA的稳定性，修饰核糖体结合位点的序列，修饰核糖体结合位点与酶编码序列的起始密码子之间的距离或序列，修饰位于酶编码区起始密码子“上游”或邻接5'侧的整个顺反子间区，使用发夹和特化序列稳定mRNA转录物的3'端，修饰酶的密码子用法，改变用于酶的生物合成的稀有密码子tRNA的表达，和/或通过例如突变其编码序列来提高酶的稳定性。

宿主细胞中酶的活性可以多种方式改变，包括但不限于，表达所述酶的经修饰形式(其在宿主细胞中表现出增加或降低的溶解度)；表达所述酶的经改变形式(其缺乏通过其抑制所述酶的活性的结构域)；表达所述酶的经修饰形式(其具有较高或较低Kcat或较低或较高Km的底物)；或表达所述酶的经改变形式(其或多或少受到所述途径中另一分子的反馈或前馈调节的影响)。

在一些实施方案，用于遗传修饰宿主细胞的核酸包含一种或多种选择标记，所述选择标记可用于选择转化的宿主细胞和对所述宿主细胞施加选择性压力以维持外源DNA。

在一些实施方案，所述选择标记是抗生素抗性标记。抗生素抗性标记的示例性实例包括但不限于，BLA、NAT1、PAT、AUR1-C、PDR4、SMR1、CAT、小鼠dhfr、HPH、DSDA、KAN^R、和SHBLE基因产物。来自大肠杆菌(E.coli)的BLA基因产物赋予对β-内酰胺抗生素(例如，窄谱头孢菌素类、头孢霉素类、和碳青霉烯类(厄他培南)、头孢孟多和头孢哌酮)的抗性，以及赋予对除了替莫西林(temocillin)之外的所有抗革兰氏阴性细菌青霉素类的抗性；来自诺尔斯链霉菌(S.noursei)的NAT1基因产物赋予对诺尔丝菌素的抗性；来自产绿色链霉菌(S.viridochromogenes)Tu94的PAT基因产物赋予对双丙氨膦(bialophos)的抗性；来自酿酒酵母的AUR1-C基因产物赋予对Auerobasidin A(AbA)的抗性；PDR4基因产物赋予对浅蓝菌素的抗性；SMR1基因产物赋予对甲嘧磺隆的抗性；来自Tn9转座子的CAT基因产物赋予对氯霉素的抗性；小鼠dhfr基因产物赋予对甲氨蝶呤的抗性；肺炎克雷伯氏菌(Klebsiellapneumonia)的HPH基因产物赋予对潮霉素B的抗性；大肠杆菌的DSDA基因产物使细胞在D-丝氨酸作为唯一氮源的平板上生长；Tn903转座子的KAN^R基因赋予对G418的抗性；和来自印度斯坦异壁链霉菌(Streptoalloteichus hindustanus)的SH BLE基因产物赋予对Zeocin(博来霉素)的抗性。在一些实施方案，在分离本发明公开的经遗传修饰的宿主细胞后，删除所述抗生素抗性标记。

在一些实施方案，所述选择标记拯救所述经遗传修饰的微生物中的营养缺陷型(例如，营养性营养缺陷型)。在此类实施方案中，亲本微生物包含一种或多种基因产物中的功能性破坏，所述一种或多种基因产物在氨基酸或核苷酸生物合成途径中起作用，并且当无功能性时使得亲本细胞无法在不补充一种或多种营养物的培养基中生长。此类基因产物包括但不限于酵母中的HIS3、LEU2、LYS1、LYS2、MET15、TRP1、ADE2、和URA3基因产物。然后可通过用编码所述经破坏的基因产物的功能性拷贝的表达载体或染色体整合构建体来转化亲本细胞，从而拯救营养缺陷型表型，并可基于所述亲本细胞的所述营养缺陷型表型的缺失来选择生成的经遗传修饰的宿主细胞。利用URA3、TRP1和LYS2基因作为选择标记具有显著的优势，因为正选择和负选择均是可能的。通过URA3、TRP1和LYS2突变的营养缺陷型互补进行正选择，而负选择则是基于特异性抑制剂，即5-氟-乳清酸(FOA)、5-氟邻氨基苯甲酸、和氨基己二酸(aAA)，其分别阻止原养型菌株生长但分别使URA3、TRP1和LYS2突变体生长。在其他实施方案，所述选择标记拯救可通过已知选择方法鉴定的其他非致死性缺陷或表型。

本发明描述了可用于本发明公开的方法、组合物和生物体的特定基因和蛋白质；然而，人们将认识到这些基因的绝对同一性是不必要的。譬如，可对包含编码多肽或酶的序列的特定基因或多核苷酸进行变化并筛选活性。通常，此类变化包括保守突变和沉默突变。可使用本领域已知的方法筛选此类经修饰或经突变的多核苷酸和多肽以表达功能性酶。

由于遗传密码的固有简并性，编码基本上相同或功能等同的多肽的其他多核苷酸也可用于克隆和表达编码此类酶的多核苷酸。

如本领域技术人员将理解的，修饰编码序列以增强其在特定宿主中的表达可能是有利的。所述遗传密码是冗余的，具有64个可能的密码子，但大多数生物体通常使用这些密码子的子集。在物种中最常使用的密码子称为最佳密码子，而那些未经常使用的密码子被分类为稀有密码子或低使用率密码子。在有时被称为“密码子优化”或“控制物种密码子偏性”的过程中，密码子可被置换以反映所述宿主的优选密码子用法。可使用密码子用法表容易地确定其他宿主细胞的密码子优化，或者可使用商业上可获得的软件，例如来自Integrated DNA Technologies的CodonOp(www.idtdna.com/CodonOptfrom)进行密码子优化。

可制备含有由特定原核或真核宿主优选的密码子的优化编码序列(Murray etal.,1989,Nucl Acids Res.17:477-508)，例如，与由非优化序列生成的转录物相比，以提高翻译速率或以生成具有期望性质(例如更长的半衰期)的重组RNA转录物。还可修饰翻译终止密码子以反映宿主偏好。譬如，酿酒酵母和哺乳动物的典型终止密码子分别是UAA和UGA。单子叶植物类的典型终止密码子是UGA，而昆虫和大肠杆菌通常使用UAA作为终止密码子(Dalphin et al.,1996,Nucl Acids Res.24:216-8)。

本领域技术人员将认识到，由于遗传密码的简并性质，可使用与其核苷酸序列不同的多种DNA分子来编码本发明给定的酶。引用编码上述生物合成酶的原生DNA序列在本发明中仅用于说明本发明的实施方案，并且本发明包括任何序列的DNA分子，所述序列编码本发明方法中所用酶的多肽和蛋白质的氨基酸序列。以类似的方式，多肽通常可在其氨基酸序列中耐受一个或多个氨基酸置换、缺失和插入，而不会损失或显著损失所需活性。本发明包括具有与本发明所述特定蛋白质不同的氨基酸序列的此类多肽，只要所述经修饰的多肽或变体多肽具有所述参考多肽的酶促合成代谢活性或分解代谢活性即可。此外，由本发明所示的DNA序列编码的氨基酸序列仅阐明了本发明的实施方案。

此外，可用于本发明提供的组合物和方法的酶的同源物均包含在本发明公开内容中。在一些实施方案，当氨基酸序列具有至少约30％、40％、50％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、或99％同一性时，两种蛋白质(或所述蛋白质的区域)基本上是同源的。为了确定两个氨基酸序列或两个核酸序列的同一性百分比，比对所述序列以达到最佳比较目的(例如，为了最佳比对，可在第一和第二氨基酸或核酸序列中的一个或两个中引入空位，并且出于比较目的，可忽略非同源序列)。在一个实施方案，出于比较目的而比对的参考序列的长度为所述参考序列长度的至少30％，通常至少40％，更通常至少50％，甚至更通常至少60％，甚至更通常至少70％、80％、90％、100％。然后比较相应氨基酸位置或核苷酸位置处的氨基酸残基或核苷酸。当所述第一序列中的位置被与所述第二序列中的相应位置的相同氨基酸残基或核苷酸占据时，那么所述分子在此位置均是相同的(本发明使用的氨基酸或核酸“同一性”等同于氨基酸或核酸“同源性”)。两个序列之间的同一性百分比是所述序列共有的相同位置的数量的函数，考虑到空位的数量和每个空位的长度，需引入这些空位以实现所述两个序列的最佳比对。

当“同源/同源性”用于提及蛋白质或肽时，将认识到不相同的残基位置通常因保守氨基酸置换而不同。“保守氨基酸置换”是其中氨基酸残基被具有相似化学性质(例如，电荷或疏水性)的侧链(R基团)的另一氨基酸残基置换的氨基酸置换。通常，保守氨基酸置换不会显著改变蛋白质的功能特性。在通过保守置换使两个或两个以上氨基酸序列彼此不同的情况下，可以向上调节序列同一性百分比或同源性程度以校正所述置换的保守性质。进行此种调节的方法是本领域技术人员所熟知的(参见，例如Pearson W.R.,1994,Methodsin Mol Biol 25:365-89)。

以下六组各自含有彼此保守置换的氨基酸：1)丝氨酸(S)，苏氨酸(T)；2)天冬氨酸(D)，谷氨酸(E)；3)天冬酰胺(N)，谷氨酰胺(Q)；4)精氨酸(R)，赖氨酸(K)；5)异亮氨酸(I)，亮氨酸(L)，丙氨酸(A)，缬氨酸(V)；和6)苯丙氨酸(F)，酪氨酸(Y)，色氨酸(W)。

通常使用序列分析软件来测定多肽的序列同源性，其亦称为序列同一性百分比。用于将分子序列与含有来自不同生物体的大量序列的数据库进行比较的典型算法是计算机程序BLAST。当搜索含有来自大量不同生物体的序列的数据库时，通常对氨基酸序列进行比较。

此外，编码前述酶(或本发明提及的任何其他酶类(或控制或调节其表达的任何调节元件))的任何基因可通过遗传/蛋白质工程技术进行优化，例如本领域普通技术人员已知的定向进化或合理诱变。此种作用使本领域普通技术人员能够优化所述酶在酵母中的表达和活性。

此外，编码所述这些酶的基因可从其他真菌和细菌物种中鉴定得到，并且可表达对此途径的调节。多种生物体可作为所述这些酶的来源，包括但不限于，酵母属(Saccharomyces spp.)，包括酿酒酵母(S.cerevisiae)和葡萄汁酵母(S.uvarum)；克鲁维酵母菌属(Kluyveromyces spp.)，包括耐热克鲁维酵母(K.thermotolerans)，乳酸克鲁维酵母(K.lactis)，和马克斯克鲁维酵母(K.marxianus)；毕赤酵母属(Pichia spp.)；汉逊酵母属(Hansenula spp.)，包括多形汉逊酵母(H.polymorpha)；假丝酵母属(Candida spp.)；丝孢酵母属(Trichosporon spp.)；接合糖酵母属(Yamadazyma spp.)，包括树干接合糖酵母(Y.spp.Stipitis)，比勒陀利亚有孢圆酵母(Torulaspora pretoriensis)，东方伊萨酵母(Issatchenkia orientalis)；裂殖酵母属(Schizosaccharomyces spp.)，包括粟酒裂殖酵母(S.pombe)；隐球酵母属(Cryptococcus spp.)；曲霉属(Aspergillus spp.)；脉孢菌属(Neurospora spp.)；或黑粉菌属(Ustilago spp.)。来自厌氧真菌的基因来源包括但不限于，梨囊鞭菌属(Piromyces spp.)，根囊鞭菌属(Orpinomyces spp.)，或新美鞭菌属(Neocallimastix spp.)。可用的原核酶的来源包括但不限于，大肠杆菌(Escherichiacoli)，运动发酵单胞菌(Zymomonas mobilis)，金黄色葡萄球菌(Staphylococcusaureus)，芽孢杆菌属(Bacillus spp.)，梭菌属(Clostridium spp.)，棒状杆菌属(Corynebacterium spp.)，假单胞菌属(Pseudomonas spp.)，乳球菌属(Lactococcusspp.)，肠杆菌属(Enterobacter spp.)和沙门氏菌属(Salmonella spp.)。

本领域技术人员已知的技术可适于鉴定其他同源基因和同源酶。通常，类似基因和/或类似酶可通过功能分析进行鉴定，并具有功能相似性。本领域技术人员已知的技术可适用于鉴定类似基因和类似酶。譬如，为了鉴定同源或类似的UDP糖基转移酶，KAH，或任何生物合成途径基因、蛋白质、或酶，技术可包括但不限于使用基于目的基因/酶的公开序列的引物进行PCR，或通过使用设计用于扩增目的基因中的保守区域的简并引物进行简并PCR，来克隆基因。此外，本领域技术人员可使用技术来鉴定具有功能同源性或相似性的同源或类似的基因、蛋白质、或酶。技术包括通过针对所述活性的体外酶测定法来检测细胞或细胞培养物中酶的催化活性(例如，如本发明所述或如Kiritani,K.,Branched-ChainAmino Acids Methods Enzymology,1970中所述)，然后通过纯化技术来分离具有所述活性的酶，通过诸如埃德曼(Edman)降解等技术确定所述酶的所述蛋白质序列，设计可能的核酸序列的PCR引物，通过PCR来扩增所述DNA序列，以及克隆所述核酸序列。为了鉴定同源或类似基因和/或同源或类似酶、类似基因和/或类似酶或蛋白质，技术还包括将关于候选基因或酶的数据同诸如BRENDA、KEGG或MetaCYC的数据库进行比较。可根据本发明的教导，在上述数据库中识别候选基因或酶。

7.实施例

实施例1.酵母转化方法

在优化的乙酸锂转化中，使用标准分子生物学技术将各DNA构建体整合到酿酒酵母(Saccharomyces cerevisiae)(CEN.PK2)中。简言之，细胞在30℃、振摇(200rpm)的酵母提取物蛋白胨右旋糖(YPD)培养基中生长过夜，在100mL YPD中稀释至OD600为0.1，然后生长至OD600为0.6–0.8。对于每次转化，通过离心收获5mL培养物，在5mL无菌水中清洗，再次离心，重悬于1mL 100mM乙酸锂中，并转移至微量离心管中。将细胞离心(13,000x g)30s，移除上清液，并将细胞重悬于由240μL 50％PEG、36μL 1M乙酸锂、10μL煮鲑鱼精DNA和74μL供体DNA组成的转化混合物中。供体DNA包括携带F-CphI内切酶基因的质粒，所述F-CphI内切酶基因在酵母TDH3启动子下表达(参见实施例4)。在42℃下热激40分钟后，将细胞在含有适当抗生素的YPD培养基中回收过夜，以选择已吸收F-CphI质粒的细胞。回收过夜后，细胞通过离心法进行短暂离心并铺板在含有适当抗生素的YPD培养基上，以选择已吸收F-CphI质粒的细胞。DNA整合通过菌落PCR确证，其中使用了对所述整合具有特异性的引物。

实施例2：能够高通量生成法呢基焦磷酸(FPP)和类异戊二烯法呢烯的基础酵母菌株(base yeast strain)的生成

通过在GAL1或GAL10启动子的控制下表达甲羟戊酸途径的基因，从野生型酿酒酵母菌株(CEN.PK2)生成法呢烯生成菌株。此菌株包含来自酿酒酵母的以下染色体整合的甲羟戊酸途径基因：乙酰-CoA硫解酶，HMG-CoA合酶，HMG-CoA还原酶，甲羟戊酸激酶，磷酸甲羟戊酸激酶，甲羟戊酸焦磷酸脱羧酶，和IPP：DMAPP异构酶。此外，所述菌株还包含来自青蒿(Artemisia annua)的法呢烯合酶的多个拷贝，亦受GAL1或GAL10启动子的控制。使用公开可获得的算法或其他合适的算法对本发明所述的所有异源基因进行密码子优化。所述菌株还包含GAL80基因的缺失，编码鲨烯合酶的ERG9基因通过用酵母基因MET3的启动子替换所述原生启动子而进行下调(Westfall et al.,Proc.Natl.Acad.Sci.USA109(3),2012,pp.E111-E118)。在美国专利号8,415,136和美国专利号8,236,512中记载了生成酿酒酵母菌株的方法的实例，所述菌株可高通量生成类异戊二烯类化合物，其全部内容均并入本发明。

实施例3.能够高通量生成Reb M的基础酵母菌株的生成

图1示出了由FPP到甜菊醇的示例性生物合成途径。图2示出了由甜菊醇到糖苷RebM的示例性生物合成途径。为了将上述法呢烯基础菌株高通量转化为C20类异戊二烯类贝壳杉烯，将香叶基香叶基焦磷酸合酶(GGPPS)的四个拷贝整合到基因组中，然后将柯巴基焦磷酸合酶的两个拷贝以及贝壳杉烯合酶的单个拷贝整合到基因组中。此时，法呢烯合酶的所有拷贝均从菌株中除去。一旦新菌株被确证可产生内根-贝壳杉烯，则将剩余的可将内根-贝壳杉烯转化为Reb M的基因插入到基因组中。表1列出了用于将FPP转化为Reb M的所有基因和启动子。除了整合了两个基因拷贝的Sr.KAH酶外，贝壳杉烯合酶后的每个基因均被整合为单个拷贝。包含表1中所述的所有基因的菌株主要生成Reb M。

表1.用于将FPP转化为Reb M的酶的基因、启动子和氨基酸序列

酶名称	SEQ ID	启动子
			Bt.GGPPS	SEQ ID NO:9	PGAL1
内根(Ent)-Os,CDPS	SEQ ID NO:10<sup>1</sup>	PGAL1
			内根(Ent)-Pg.Ks	SEQ ID NO:11	PGAL1
Ps.KO	SEQ ID NO:12	PGAL1
			Sr.KAH	SEQ ID NO:13	PGAL1
At.CPR	SEQ ID NO:14	PGAL3
			UGT85C2	SEQ ID NO:15	PGAL10
UGT74G1	SEQ ID NO:16	PGAL1
			UGT91D_like3	SEQ ID NO:17	PGAL1
UGT76G1	SEQ ID NO:18	PGAL10
			UGT40087	SEQ ID NO:19	PGAL1

¹前65个氨基酸被移除并被替换为蛋氨酸

实施例4.用于筛选甜菊糖苷转运蛋白的菌株的生成

为了在生成Reb M的菌株中在体内快速筛选甜菊糖苷转运蛋白，将着陆垫(landing pad)插入到上述菌株中。着陆垫由位于SFM1开放阅读框下游基因组区域的构建体两端的500bp基因座靶向DNA序列组成(参见图3)。在内部，着陆垫包含GAL1启动子和酵母终止子，其分别位于核酸内切酶识别位点(F-CphI)的两侧。

实施例5：酵母培养条件

将过表达转运蛋白蛋白质的酵母菌落挑选到含有鸟种培养基(Bird Seed Media，BSM，最初由van Hoek et al.,Biotechnology and Bioengineering 68(5),2000,pp.517-523记载)的96孔微量滴定板中，所述鸟种培养基(Bird Seed Media)含有20g/L蔗糖、3.75g/L硫酸铵、以及1g/L赖氨酸。将细胞于28℃下在高容量微量滴定板孵化器中，于1000rpm和80％湿度下振摇培养3天，直至所述培养物耗尽碳。通过从饱和培养物中取14.4μL并稀释至360μL新鲜培养基中，将生长饱和的培养物传代培养至含有BSM的新鲜平板中，所述BSM含有40g/L蔗糖和3.75g/L硫酸铵。在提取和分析之前，将所述生成培养基中的细胞于30℃下在高容量微量滴定板振荡器中，于1000rpm和80％湿度下再培养3天。

实施例6：用于分析甜菊糖苷类化合物的全细胞培养液样品制备条件

为了分析培养物中生成的所有甜菊糖苷类化合物的量，在培养完成后，将全细胞培养液(whole cell broth)用628μL 100％乙醇稀释，用箔密封件进行密封，并在1250rpm下振摇30s以提取甜菊糖苷类化合物。将314μL水直接添加至每个孔中以稀释所述提取液。将板短暂离心以使固体沉淀。将208μL的含有0.48mg/L瑞鲍迪苷N的50：50乙醇：水混合物(内标)转移至新的250μL测定板，并将2μL培养物/乙醇混合物添加至测定板中。将板用箔密封件进行密封以进行分析。

实施例7：用于分析甜菊糖苷类化合物的培养物上清液样品制备条件

为了分析生成并排泄至培养基中的所有甜菊糖苷类化合物的量，在培养完成后，将全细胞培养液以2000x g离心5分钟以使细胞沉淀。将所得上清液的240μL等分试样转移至空的96孔微量滴定板中。上清液样品用480μL 100％乙醇稀释，用箔密封件进行密封，并以1250rpm的速度振摇30秒以提取甜菊糖苷类化合物。将240μL水添加至每个孔中以稀释所述提取液。将板短暂离心以使任何固体沉淀。将208μL的含有0.48mg/L瑞鲍迪苷N的50：50乙醇：水混合物(内标)转移至新的250μL测定板，并将2μL培养物/乙醇混合物添加至测定板中。将板用箔密封件进行密封以进行分析。

实施例8：分析方法

针对甜菊糖苷类化合物检测的样品通过具有RapidFire 365系统自动进样器和C8柱的质谱仪(Agilent 6470-QQQ)，采用表2和表3所示的配置进行分析。

表2.RapidFire 365系统配置

表3. 6470-QQQ MS方法配置

离子源	AJS ESI
		时间滤波峰宽	0.02min
停止时间	无限制/作为泵
		扫描方式	MRM
分流阀	进MS
		台达(Delta)EMV	(+)0/(-)300
离子模式(极性)	负
		气温度	250℃
气流量	11L/min
		喷雾器	30psi
鞘气温度	350℃
		鞘气流量	11L/min
负模式毛细管V	2500V

来自质谱仪的色谱图的峰面积用于生成校准曲线。相关化合物的摩尔比是通过采用真实标准品通过外部校准对每种化合物的摩尔量进行定量，然后取适当的比例来确定。

实施例9.筛选能够在体内增加甜菊糖苷类化合物滴度的转运蛋白

在没有表达额外转运蛋白的所述Reb M生成菌株中，发现大约80％的较高分子量甜菊糖苷Reb D和Reb M均与生物量相关(参见图4)。此种生物量相关可能归因于Reb D和Reb M均未被有效转运出细胞并保留在细胞质中所致。Reb D和Reb M的积聚可能导致产物抑制，此举会降低经由甜菊糖苷代谢途径的碳通量。因此，将甜菊糖苷类化合物(尤其是RebD和Reb M)转运出细胞质并进入培养基(上清液)的一种或多种转运蛋白的表达有望减轻产物抑制，从而增加经由所述途径的碳通量，进而产生更高的甜菊糖苷滴度。为了鉴定能够将较高分子量的甜菊糖苷输出到细胞外从而缓解产物抑制的转运蛋白，我们筛选了从多种真菌中鉴定出的多种转运蛋白，以提高总甜菊糖苷滴度，尤其是较高分子量糖苷(即Reb D和Reb M)的滴度。

使用CEN.PK2作为基因组DNA来源，所有被注释为来自酿酒酵母(S.cerevisiae)基因组的转运蛋白的蛋白质均经由PCR进行扩增。每个PCR引物均与着陆垫中的PGAL1和酵母终止子DNA序列具有40bp的侧翼同源性(参见图3)，所述PGAL1和酵母终止子DNA序列被添加至两端以促进经扩增基因同源重组到着陆垫中。除了筛选在CEN.PK2中发现的所有内源性酿酒酵母(S.cerevisiae)转运蛋白之外，亦对来自少量真菌和其他酿酒酵母菌株的ABC转运蛋白进行了扩展生物信息学搜索。

为了制作真菌ABC转运蛋白文库，我们首先从Kovalchuk和Driessen的出版物“真菌ABC转运蛋白的系统发育分析(Phylogenetic Analysis of Fungal ABCTransporters)”(Kovalchuk and Driessen,BMC Genomics,11,2010,pp.177-197)获得氨基酸序列，其中对27种真菌物种进行了ABC转运蛋白的系统发育分析。从此文献来源中，总共挑选了610个氨基酸序列，其中包括指定为属于ABC-C、ABC-D和ABC-G亚家族的所有转运蛋白。接下来，我们为以下真菌开发了内部BLAST数据库：(1)多形汉逊酵母(Hansenulapolymorpha)DL-1(NRRL-Y-7560)、(2)解脂耶氏酵母(Yarrowia lipolytica)ATCC 18945、(3)食腺嘌呤芽生葡萄孢酵母(Arxula adeninivorans)ATCC 76597、(4)酿酒酵母(S.cerevisiae)CAT-1、(5)斯达氏油脂酵母(Lipomyces starkeyi)ATCC 58690、(6)马克斯克鲁维酵母(Kluyveromyces marxianus)、(7)马克斯克鲁维酵母DMKU3-1042、(8)法夫驹形氏酵母(Komagataella phaffii)NRRL Y-11430、(9)酿酒酵母MBG3370、(10)酿酒酵母MBG3373、(11)乳酸克鲁维酵母(K.lactis)ATCC 8585、(12)产朊假丝酵母(Candidautilis)ATCC 22023、(13)毕赤酵母(Pichia pastoris)ATCC 28485、和(14)米曲霉(Aspergillus oryzae)NRRL5590。

对于我们已通过从头基因组测序、组装和注释工作获得内部核苷酸ORF序列的生物体，我们使用Biopython应用了tBLASTn。tBLASTn算法允许使用BLAST在六个可能的阅读框中，将蛋白质序列(在此案例中，来自Kovalchuk和Driessen的610个种子序列(BMCGenomics,11,2010,pp.177-197))与每个生物体的核苷酸ORF序列的经翻译DNA进行快速比对。tBLASTn参数均是标准的，E值(evalue)＝1e^-25(参见表4)。所有计算均通过biopythonAPI(从PyPI下载的v 1.70)使用Python 2.7.12和Ubuntu16.04.5LTS(GNU/Linux 4.4.0-138-generic x86_64)执行。随后过滤命中(hit)以确保至少2000个核苷酸的整体联配。所有符合这些标准的匹配均被带至工作流程的下一步。

表4.tBLASTn默认参数

对于其余无内部基因组序列的生物体，使用Uniprot API从Uniprot获得生物体的整个蛋白质组，以创建用于BLASTp搜索的数据库。在大多数情况下，Uniprot对我们拥有内部基因组DNA的物种具有准确的条目，但在其他情况下，与内部真菌菌株接近但不完全匹配。在后一种情况下，我们依赖于基因序列足够相似的高概率，以至于针对Uniprot参考设计的引物仍然可扩增内部基因组DNA。然后我们使用Biopython将BLASTp应用于Uniprot派生数据库。BLAST参数均是标准的，E值(evalue)＝0.001(参见表5)。可基于≥40％的同一性截断百分比和≥60％的对齐长度截断百分比来执行后续过滤。所有计算均通过biopythonAPI(从PyPI下载的v 1.70)使用Python 2.7.12和Ubuntu 16.04.5LTS(GNU/Linux 4.4.0-138-generic x86_64)执行。命中(hit)必须匹配来自所述参考的610个种子序列中的至少一个。然后使用Uniprot ID映射服务到EMBL标识符，将命中转换为核苷酸序列。欧洲分子生物学实验室允许从Uniprot条目提取核苷酸序列。我们将符合这些标准的任何命中或匹配结果用于工作流程的下一步。

表5.BLASTp默认参数

一旦识别出所有核苷酸序列，便设计引物以经由PCR扩增每个完整的ORF。每个PCR引物均与着陆垫中的PGAL1和酵母终止子DNA序列具有40bp的侧翼同源性(图3)，所述PGAL1和酵母终止子DNA序列被添加至两端以促进经扩增基因同源重组到着陆垫中。将每个转运蛋白基因作为单拷贝单独转化到上述Reb M生成酵母菌株中，并筛选在体内过表达时增加产物滴度的能力。

实施例11：使得体内甜菊糖苷生成量增加的转运蛋白的过表达

体内酿酒酵母(S.cerevisiae)转运蛋白筛选发现，与不含过表达转运蛋白的亲本Reb M菌株相比，当过表达时，8种转运蛋白在统计学上增加了总甜菊糖苷(TSG)生成量(参见图5)。TSG计算为由细胞生成的所有甜菊糖苷的微摩尔总和(由全细胞培养液提取物测定)。所有已识别的转运蛋白均属于称为ABC转运蛋白的转运蛋白类别。所述这些转运蛋白的过表达使TSG相对于亲本从20％增至两倍。转运蛋白过表达引起的TSG增加可能是由于所有甜菊糖苷或只是一部分甜菊糖苷的转运增加所致。因此，亦分析了数据以确定转运蛋白过表达仅对较高分子量的甜菊糖苷Reb D和Reb M的影响。在增加TSG的8种转运蛋白中，其中7种还增加了Reb D和Reb M的总生成量，如图6所示。随着转运蛋白的过表达，Reb D和RebM的增加范围从30％增至两倍增加不等。

实施例12：甜菊糖苷类化合物的细胞外和细胞内转运

8个Reb M菌株中的7个携带过表达的转运蛋白，使得全细胞培养液中的总甜菊糖苷增加，同时亦增加了上清液中的总甜菊糖苷含量(图7)。虽然四种转运蛋白使全细胞培养液中的总甜菊糖苷增加了近两倍(图5)，但上清液中TSG的典型增加较少，范围为35％至70％(图7)。然而，转运蛋白T4_Fungal_5使上清液中的TSG增加了大约五倍(图7)。图5和图7示出的数据表明，具有某些过表达转运蛋白的菌株生成更多的TSG，但TSG的增加并不总是表现为上清液中TSG的线性增加。

明确观察位于上清液中生成的总甜菊糖苷的比例(图8)表明，大多数转运蛋白(八分之六)上清液中的TSG比例低于亲本。这表明转运蛋白正在从胞质溶胶移除甜菊糖苷，从而减轻产物抑制并使得更多的产物形成，但它们并未将甜菊糖苷转运至培养基中。相反，这些转运蛋白最有可能将甜菊糖苷类化合物转运至液泡或其他一些细胞区室中。相比之下，转运蛋白T4_Fungal_5使得所生成的TSG几乎100％位于上清液中(图8)。这表明T4_Fungal_5可能是质膜转运蛋白，其能够从细胞的细胞质中移除甜菊糖苷并将其转运出细胞，进入培养基。此外，图4所示数据表明，转运蛋白T4_Fungal_5将较高分子量的甜菊糖苷Reb D和RebM输出至细胞外并进入培养基；事实上，几乎100％的Reb D和Reb M均位于上清液级分中。

转运蛋白筛选的命中结果之一是内源性酿酒酵母(S.cerevisiae)ABC转运蛋白BPT1。此蛋白质在酵母基因组数据库(Saccharomyces Genome Database)中被注释为定位于液泡。转运蛋白T4_Fungal_2和T4_Fungal_4均具有与CEN.PK2 BPT1具有99％同一性的蛋白质序列，分别源自酿酒酵母菌株CAT-1和MBG3373；它们均是BPT1的等位基因。所有其他转运蛋白在蛋白质序列方面与BPT1具有30-43％同一性，并代表可跨膜转运甜菊糖苷的新型ABC转运蛋白(参见表6)。在输出甜菊糖苷类化合物的其余非BPT1转运蛋白中，无任何蛋白质序列与任何其他蛋白质的同一性高于53％，这表明其余5种蛋白质均是独特的序列。

表6.增加甜菊糖苷滴度的所有转运蛋白的同一性百分比

实施例13：BPT1和T4_Fungal_5细胞定位

为了确定所述Reb M生成菌株中过表达的BPT1和T4_Fungal_5蛋白的细胞定位，我们创建了GFP-转运蛋白融合蛋白。每个转运蛋白(BPT1或T4_Fungal_5)蛋白质均有GFP蛋白质融合至转运蛋白的C端；GFP-转运蛋白融合蛋白质经由GAL1启动子表达并含有酵母终止子。如实施例4中所述构建菌株，唯一区别是使用转运蛋白-GFP融合蛋白质代替仅转运蛋白的蛋白质。具有正确整合的转运蛋白-GFP构建体的细胞经由菌落PCR进行确证，如实施例5中所述进行培养，并确证其活性等同于含有转运蛋白(其不含C端GFP标记)的菌株(图9)。

为了经由GFP可视化蛋白质定位，如实施例5中所述进行细胞繁殖，但在生成培养基中2天后进行收获，用于观察。细胞用等体积的PBS清洗两次，然后在PBS中重悬至OD₆₀₀为1.0。使用安装在载玻片上的1％琼脂糖垫固定细胞，并使用标准荧光显微镜在488nm激发下或在明场下在油浸中以100倍放大倍数进行可视化观察。表达BPT1 C末端标记有GFP的细胞显示出与定位于液泡的融合蛋白一致的荧光模式(图10)。这是预期的结果，因为据报道BPT1通常定位于酵母中的液泡(Sharma et al.,Eukaryot.Cell1(3),2002,pp.391-400)。C末端标记的T4_Fungal_5蛋白显示出不同的GFP定位，与定位于质膜的蛋白质一致(图11)。

实施例14：使用易错PCR和生长选择定向进化T4_Fungal_5蛋白

转运蛋白T4_Fungal_5从细胞质主动移除Reb D和Reb M(参见图4)。Reb D是Reb M的直接底物(图2)，因此从胞质溶胶移除Reb D会减少酵母生成的Reb M总量。因此，T4_Fungal_5经历了酶进化，以增加其整体活性及其对Reb M的特异性。T4_Fungal_5的DNA编码序列(CDS)使用GeneMorph II随机诱变试剂盒(安捷伦科技公司)经由易错PCR进行诱变，并将所得DNA文库转化到与实施例11中提及的转运蛋白筛选中使用的酵母菌株相似的Reb M酵母菌株中，但具有两个额外的UGT76G1的拷贝，其均在GAL1启动子下表达。使用野生型T4_Fungal_5转运蛋白进行额外的转化作为对照。如实施例1中所述进行转化。过夜回收后，将培养物转移至补充有选择性抗生素的生成培养基中以继续生长。监测培养物的OD₆₀₀并使用新鲜含抗生素的生成培养基对培养物进行连续稀释以避免碳饥饿。每天对培养物取样以获得此两种甘油储备液档案，并在含抗生素的YPD琼脂平板上铺板以形成单个菌落。使用实施例6、7和8中所述方法来评估和比较来自每个每日样品的88个菌落的所述TSG及Reb M滴度。根据此数据，确定了生成具有等于或大于对照菌株(表达野生型T4_Fungal_5)的TSG滴度的菌落的最高百分比的时间点。从此时间点开始，从甘油储备液中接种其他菌落，挑选并筛选900个菌落。筛选确定了8个分离株，它们将Reb M滴度提高了26％至47％，并将Reb M/TSG比值提高了10％(图12和图13)。图12和图13所示数据表明，在T4_Fungal_5转运蛋白中鉴定的突变提高了对甜菊糖苷的总体活性及对Reb M的特异性。

T4_Fungal_5基因的Sanger测序显示所有8个分离株均具有相同的核酸置换，产生4个氨基酸置换：V666A、Y942N、L956P和E1320V。此突变等位基因命名为“Fungal_5_muA”。为了验证Fungal_5_muA与提高滴度和特异性的因果关系，突变等位基因从分离株之一进行扩增并重新引入亲本菌株中。所得菌株重现了表型并证明Fungal_5_muA在提高甜菊糖苷生成量和特异性方面的应用。当T4_Fungal_5和Fungal_5_muA在较弱的GAL3启动子下表达时，与具有野生型T4_Fungal_5的菌株相比，具有Fungal_5_muA的菌株在全细胞培养液中生成的Reb M高出30％，并且在细胞外生成的Reb M高出40％(图14)，这与早期数据一致。

实施例15：Fungal_5_muA的进一步改进

为了通过去除潜在的有害突变来进一步改进Fungal_5_muA，我们创建了额外的T4_Fungal_5突变变体，其具有在Fungal_5_muA中识别的1、2或3个氨基酸置换，并将它们引入到实施例14中用于筛选T4_Fungal_5诱变文库的酵母菌株中。尽管Fungal_5_muA中V666A的单次回复对TSG或Reb M产生的影响可忽略不计，但E1320V的回复是有益的，并且V666AY942N L956P三重突变体生成的TSG比Fungal_5_muA菌株高出14％，而生成的Reb M高出12％(图15和图16)。然而，与V666A Y942N L956P三重突变体相比，L956P在所述三重突变体(V666A Y942N)中的进一步回复导致Reb M减少10％以及TSG减少19％。与Fungal_5_muA菌株相比，单个Y942N突变菌株生成的TSG高出21％，但生成的Reb M的量则少10％。所述这些数据表明，Y942N突变有利于T4_Fungal_5在输出甜菊糖苷方面的总体活性，但在其对Reb M的特异性方面有负面影响。

本说明书中引用的所有出版物、专利和专利申请均通过引用并入本发明，如同每个单独的出版物或专利申请被具体和单独地指出通过引用并入。尽管出于清楚理解的目的，已通过举例说明和示例的方式对上述发明进行了一些详细描述，但根据本发明教导，对于本领域普通技术人员而言将显而易见的是，在不脱离所附权利要求书的精神或范围的情况下，可对其进行某些改变/变化以及修改/修饰。

Claims

1.能够生成一种或多种甜菊糖苷(steviol glycoside)的经遗传修饰的宿主细胞，所述经遗传修饰的宿主细胞包含编码ABC转运蛋白的异源核酸，所述ABC转运蛋白包含与选自由下列组成的组的氨基酸序列具有至少80％序列同一性的氨基酸序列：SEQ ID NO：1、SEQID NO：2、SEQ ID NO：3、SEQ ID NO：4、SEQ ID NO：5、SEQ ID NO：6、SEQ ID NO：7、SEQ IDNO：8、SEQ ID NO：28、SEQ ID NO：29、和SEQ ID NO：30。

2.根据权利要求1所述的经遗传修饰的宿主细胞，其中所述ABC转运蛋白包含氨基酸序列，所述氨基酸序列具有选自由下列组成的组的序列：SEQ ID NO：1、SEQ ID NO：2、SEQ IDNO：3、SEQ ID NO：4、SEQ ID NO：5、SEQ ID NO：6、SEQ ID NO：7、和SEQ ID NO：8。

3.根据前述权利要求任一项所述的经遗传修饰的宿主细胞，其进一步包含核酸，所述核酸编码香叶基香叶基焦磷酸合酶(GGPPS)、内根-柯巴基焦磷酸合酶(ent-copalylpyrophosphate synthase，CPS)、内根-贝壳杉烯合酶(ent-kaurene synthase，KS)、内根-贝壳杉烯19-氧化酶(ent-kaurene 19-oxidase，KO)、内根-异贝壳杉烯酸13-羟化酶(ent-kaurenoic acid 13-hydroxylase，KAH)、细胞色素p450还原酶(CPR)、以及一种或多种UDP-葡萄糖基转移酶(UGT)。

4.根据权利要求3所述的经遗传修饰的宿主细胞，其中所述一种或多种UDP-葡萄糖基转移酶(UGT)选自由下列组成的组：UGT85C2、UGT74G1、UGT91D_like3、UGT76G1、EUGT11、和UGT40087。

5.根据权利要求4所述的经遗传修饰的宿主细胞，其中所述香叶基香叶基焦磷酸合酶(GGPPS)包含与SEQ ID NO：9具有至少80％序列同一性的氨基酸序列，所述内根-柯巴基焦磷酸合酶(CPS)包含与SEQ ID NO：10具有至少80％序列同一性的氨基酸序列，所述内根-贝壳杉烯合酶(KS)包含与SEQ ID NO：11具有至少80％序列同一性的氨基酸序列，所述内根-贝壳杉烯19-氧化酶(KO)包含与SEQ ID NO：12具有至少80％序列同一性的氨基酸序列，所述内根-异贝壳杉烯酸13-羟化酶(KAH)包含与SEQ ID NO：13具有至少80％序列同一性的氨基酸序列，所述细胞色素p450还原酶(CPR)包含与SEQ ID NO：14具有至少80％序列同一性的氨基酸序列，和所述一种或多种UDP-葡萄糖基转移酶(UGT)包含与选自由下列组成的组的氨基酸序列具有至少80％序列同一性的氨基酸序列：SEQ ID NO：15、SEQ ID NO：16、SEQID NO：17、SEQ ID NO：18、SEQ ID NO：19。

6.根据权利要求5所述的经遗传修饰的宿主细胞，其中所述香叶基香叶基焦磷酸合酶(GGPPS)包含SEQ ID NO：9的氨基酸序列，所述内根-柯巴基焦磷酸合酶(CPS)包含SEQ IDNO：10的氨基酸序列，所述内根-贝壳杉烯合酶(KS)包含SEQ ID NO：11的氨基酸序列，所述内根-贝壳杉烯19-氧化酶(KO)包含SEQ ID NO：12的氨基酸序列，所述内根-异贝壳杉烯酸13-羟化酶(KAH)包含SEQ ID NO：13的氨基酸序列，所述细胞色素p450还原酶(CPR)包含SEQID NO：14的氨基酸序列，和所述一种或多种UDP-葡萄糖基转移酶(UGT)包含选自由下列组成的组的氨基酸序列：SEQ ID NO：15、SEQ ID NO：16、SEQ ID NO：17、SEQ ID NO：18、SEQ IDNO：19。

7.根据前述权利要求任一项所述的经遗传修饰的宿主细胞，其中所述宿主细胞选自细菌细胞、真菌细胞、藻类细胞、昆虫细胞和植物细胞。

8.根据权利要求7所述的经遗传修饰的宿主细胞，其中所述宿主细胞是酿酒酵母(Saccharomyces cerevisiae)细胞。

9.根据前述权利要求任一项所述的经遗传修饰的宿主细胞，其中所述ABC转运蛋白包含具有SEQ ID NO：1的所述序列的氨基酸序列。

10.根据前述权利要求任一项所述的经遗传修饰的宿主细胞，其中所述ABC转运蛋白包含具有SEQ ID NO：2的所述序列的氨基酸序列。

11.根据前述权利要求任一项所述的经遗传修饰的宿主细胞，其中所述ABC转运蛋白包含具有SEQ ID NO：3的所述序列的氨基酸序列。

12.根据前述权利要求任一项所述的经遗传修饰的宿主细胞，其中所述ABC转运蛋白包含具有SEQ ID NO：4的所述序列的氨基酸序列。

13.根据前述权利要求任一项所述的经遗传修饰的宿主细胞，其中所述ABC转运蛋白包含具有SEQ ID NO：5的所述序列的氨基酸序列。

14.根据前述权利要求任一项所述的经遗传修饰的宿主细胞，其中所述ABC转运蛋白包含具有SEQ ID NO：6的所述序列的氨基酸序列。

15.根据前述权利要求任一项所述的经遗传修饰的宿主细胞，其中所述ABC转运蛋白包含具有SEQ ID NO：7的所述序列的氨基酸序列。

16.根据权利要求15所述的经遗传修饰的宿主细胞，其中所述ABC转运蛋白包含相对于SEQ ID NO：7的所述氨基酸序列的一个或多个氨基酸置换。

17.根据权利要求16所述的经遗传修饰的宿主细胞，其中所述一个或多个氨基酸置换选自V666A、Y942N、L956P、和E1320V。

18.根据前述权利要求任一项所述的经遗传修饰的宿主细胞，其中所述ABC转运蛋白包含具有SEQ ID NO：8的所述序列的氨基酸序列。

19.根据前述权利要求任一项所述的经遗传修饰的宿主细胞，其中所述ABC转运蛋白包含具有SEQ ID NO：28的所述序列的氨基酸序列。

20.根据前述权利要求任一项所述的经遗传修饰的宿主细胞，其中所述ABC转运蛋白包含具有SEQ ID NO：29的所述序列的氨基酸序列。

21.根据前述权利要求任一项所述的经遗传修饰的宿主细胞，其中所述ABC转运蛋白包含具有SEQ ID NO：30的所述序列的氨基酸序列。

22.根据前述权利要求任一项所述的经遗传修饰的宿主细胞，其中所述一种或多种甜菊糖苷选自由下列组成的组：Reb A、Reb B、Reb D、Reb E、和Reb M。

23.根据权利要求22所述的经遗传修饰的宿主细胞，其中所述一种或多种甜菊糖苷包含Reb M。

24.多核苷酸，其包含前述权利要求任一项所述的异源核酸的核苷酸序列。

25.根据权利要求24所述的多核苷酸，其中所述异源核酸的所述核苷酸序列包含选自由下列组成的组的编码序列：SEQ ID NO：20、SEQ ID NO：21、SEQ ID NO：22、SEQ ID NO：23、SEQ ID NO：24、SEQ ID NO：25、SEQ ID NO：26、和SEQ ID NO：27，其中所述编码序列可操作地连接至异源启动子。

26.生成甜菊醇或一种或多种甜菊糖苷的方法，其包含下列步骤：

(a)在适于制备甜菊醇或一种或多种甜菊糖苷的条件下，在含有碳源的培养基中培养权利要求1-23任一项所述的宿主细胞的种群以生成培养液(culture broth)；和

(b)从所述培养液回收所述甜菊醇或一种或多种甜菊糖苷。

27.生成Reb D的方法，其包含下列步骤：

(a)在适于制备Reb D的条件下，在含有碳源的培养基中培养权利要求1-23任一项所述的宿主细胞的种群以生成培养液；和

(b)从所述培养液回收所述Reb D化合物。

28.生成Reb M的方法，其包含下列步骤：

(a)在适于制备Reb M的条件下，在含有碳源的培养基中培养权利要求1-23任一项所述的宿主细胞的种群以生成培养液；和

(b)从所述培养液回收所述Reb M化合物。

29.根据权利要求1或2所述的经遗传修饰的宿主细胞，其中至少50％的所述一种或多种甜菊糖苷积聚在细胞器的腔内。

30.根据权利要求1或2所述的经遗传修饰的宿主细胞，其中至少50％的所述一种或多种甜菊糖苷积聚在细胞外。

31.根据权利要求1-23任一项所述的经遗传修饰的宿主细胞，其进一步包含UDP-葡萄糖基转移酶(UGT)，所述UDP-葡萄糖基转移酶(UGT)具有与SEQ ID NO：18的所述氨基酸序列具有至少80％序列同一性的氨基酸序列。

32.根据权利要求1-23任一项所述的经遗传修饰的宿主细胞，其进一步包含UDP-葡萄糖基转移酶(UGT)，所述UDP-葡萄糖基转移酶(UGT)具有SEQ ID NO：18的氨基酸序列。

33.能够生成类异戊二烯化合物的经遗传修饰的宿主细胞，所述经遗传修饰的宿主细胞包含编码ABC转运蛋白的异源核酸，所述ABC转运蛋白包含与选自由下列组成的组的氨基酸序列具有至少80％序列同一性的氨基酸序列：SEQ ID NO：1、SEQ ID NO：2、SEQ ID NO：3、SEQ ID NO：4、SEQ ID NO：5、SEQ ID NO：6、SEQ ID NO：7、SEQ ID NO：8、SEQ ID NO：28、SEQID NO：29、SEQ ID NO：30。

34.根据权利要求33所述的经遗传修饰的宿主细胞，其中所述ABC转运蛋白包含氨基酸序列，所述氨基酸序列具有选自由下列组成的组的序列：SEQ ID NO：1、SEQ ID NO：2、SEQID NO：3、SEQ ID NO：4、SEQ ID NO：5、SEQ ID NO：6、SEQ ID NO：7、SEQ ID NO：8、SEQ IDNO：。

35.根据权利要求33或34所述的经遗传修饰的宿主细胞，其进一步包含编码紫穗槐-4,11-二烯合酶的核酸及编码紫穗槐-4,11-二烯氧化酶的核酸。

36.根据权利要求35所述的经遗传修饰的宿主细胞，其中所述类异戊二烯化合物选自青蒿醇、青蒿醛、和青蒿酸。

37.根据权利要求36任一项所述的经遗传修饰的宿主细胞，其中所述宿主细胞选自细菌细胞、真菌细胞、藻类细胞、昆虫细胞和植物细胞。

38.根据权利要求37所述的经遗传修饰的宿主细胞，其中所述宿主细胞是酿酒酵母(Saccharomyces cerevisiae)细胞。

39.根据权利要求33-38任一项所述的经遗传修饰的宿主细胞，其中所述ABC转运蛋白包含具有SEQ ID NO：1的所述序列的氨基酸序列。

40.根据权利要求33-38任一项所述的经遗传修饰的宿主细胞，其中所述ABC转运蛋白包含具有SEQ ID NO：2的所述序列的氨基酸序列。

41.根据权利要求33-38任一项所述的经遗传修饰的宿主细胞，其中所述ABC转运蛋白包含具有SEQ ID NO：3的所述序列的氨基酸序列。

42.根据权利要求33-38任一项所述的经遗传修饰的宿主细胞，其中所述ABC转运蛋白包含具有SEQ ID NO：4的所述序列的氨基酸序列。

43.根据权利要求33-38任一项所述的经遗传修饰的宿主细胞，其中所述ABC转运蛋白包含具有SEQ ID NO：5的所述序列的氨基酸序列。

44.根据权利要求33-38任一项所述的经遗传修饰的宿主细胞，其中所述ABC转运蛋白包含具有SEQ ID NO：6的所述序列的氨基酸序列。

45.根据权利要求33-38任一项所述的经遗传修饰的宿主细胞，其中所述ABC转运蛋白包含具有SEQ ID NO：7的所述序列的氨基酸序列。

46.根据权利要求33-38任一项所述的经遗传修饰的宿主细胞，其中所述ABC转运蛋白包含具有SEQ ID NO：8的所述序列的氨基酸序列。

47.生成青蒿酸的方法，其包含下列步骤：

(a)在适于制备青蒿酸的条件下，在含有碳源的培养基中培养权利要求33-46任一项所述的宿主细胞的种群以生成培养液；和

(b)从所述培养液回收所述青蒿酸。

48.生成类异戊二烯化合物的方法，其包含下列步骤：

(a)在适于制备所述类异戊二烯化合物的条件下，在含有碳源的培养基中培养权利要求33所述的宿主细胞的种群以生成培养液；和

(b)从所述培养液回收所述类异戊二烯化合物。