CN107567492A

CN107567492A - Udp‑糖基转移酶

Info

Publication number: CN107567492A
Application number: CN201680016548.2A
Authority: CN
Inventors: 维克托·马里厄斯·波尔; 约翰尼斯·古斯塔夫·恩斯特·范·莱文; 普利斯希勒·扎尔特简斯; 凯瑟琳娜·佩特罗内拉·安东尼娅·玛丽亚·科伦
Original assignee: DSM IP Assets BV
Current assignee: DSM IP Assets BV
Priority date: 2015-03-16
Filing date: 2016-03-16
Publication date: 2018-01-09
Anticipated expiration: 2036-03-16
Also published as: CN107567492B; BR112017019625A2; CN115851470A; US20180044645A1; CA2979931A1; WO2016146711A1; US20200224180A1; EP3271457B1; EP3271457A1; US10604743B2; EP3862426A2; US10947515B2; EP3862426A3; US20210147815A1; US11459548B2

Abstract

本发明涉及具有UDP‑糖基转移酶活性特别地具有UGT2活性并且与在SEQ ID NO:1、3、6、9、11、14、17、20、22、25中的一个中列出的氨基酸序列具有至少85％同一性的多肽。本申请还涉及包含编码所述多肽的重组核酸序列的重组宿主以及用其制备糖基化二萜如甜菊醇糖苷的用途。所述宿主细胞还可包含甜菊醇糖苷生物合成途径的酶。

Description

UDP-糖基转移酶

发明领域

本发明涉及一种重组宿主，其包含编码变体UDP-糖基转移酶(UGT) 多肽的重组核酸序列。本发明还涉及一种使用这种重组宿主制备糖基化二萜的方法，并且涉及一种可得自这种方法的发酵液。本发明还涉及一种通过这种方法获得或可从这种发酵液获得的糖基化二萜，并且涉及一种包含两种或更多种此类糖基化二萜的组合物。此外，本发明涉及一种包含这种糖基化二萜或这种组合物的食品、饲料或饮料。本发明还涉及一种使用上述重组宿主将第一糖基化二萜转化为第二糖基化二萜的方法。此外，本发明涉及变体UGT多肽、编码此类多肽的核酸序列、包含这种多核苷酸序列的核酸构建体以及一种使用上述重组宿主产生变体UGT多肽的方法。

发明背景

多年生草本植物甜叶菊(Stevia rebaudiana Bert.)的叶子积聚大量被称为甜菊醇糖苷的具有强烈甜味的化合物。虽然这些化合物的生物功能尚不清楚，但它们作为替代性高效甜味剂具有商业意义。

这些甜的甜菊醇糖苷的功能和感官特性表现为优于许多高效甜味剂的功能和感官特性。此外，研究表明甜菊苷能够降低II型糖尿病患者的血糖水平，并且能够降低轻度高血压患者的血压。

甜菊醇糖苷积聚在甜叶菊叶中，其中它们可占叶干重的10％至20％。甜菊苷和莱鲍迪甙A均是热和pH稳定的，并且适用于碳酸饮料和许多其他食物。甜菊苷比蔗糖甜110与270倍之间，莱鲍迪甙A比蔗糖甜150与 320倍之间。此外，莱鲍迪甙D也是在甜叶菊叶中积聚的高效二萜糖苷甜味剂。它可比蔗糖甜约200倍。莱鲍迪甙M是另一种高效二萜糖苷甜味剂。它在某些甜叶菊品种叶中以痕量存在，但已表明其具有优异的味道特征。

传统上已从甜叶菊植物中提取了甜菊醇糖苷。在甜叶菊中，(-)-贝壳杉烯酸(赤霉酸(GA)生物合成中的中间体)被转化成四环二萜甜菊醇，其然后通过多步糖基化途径进行以形成各种甜菊醇糖苷。然而，产率可以是可变的，并且受到农业和环境条件的影响。此外，甜叶菊种植需要大量的土地面积、在收获前的很长时间、密集劳动以及用于提取和纯化糖苷的额外成本。

最近，使用发酵工艺生产甜菊醇糖苷的兴趣日益增长。WO2013/110673 和WO2015/007748中描述了可用于产生至少甜菊醇糖苷莱鲍迪甙A和莱鲍迪甙D的微生物。

此类微生物的进一步改进是令人希望的，以便可产生更高量的甜菊醇糖苷和/或另外或新的甜菊醇糖苷和/或更高量的特异性甜菊醇糖苷和/或具有期望比例的不同甜菊醇糖苷的甜菊醇糖苷的混合物。

发明概述

在甜叶菊中，甜菊醇由GGPP合成，所述GGPP由脱氧木酮糖5-磷酸途径形成。两种二萜环化酶(-)-柯巴基二磷酸合酶(CPS)和(-)-贝壳杉烯合酶(KS)的活性导致形成(-)-贝壳杉烯，所述(-)-贝壳杉烯然后在三步反应中通过(-)-贝壳杉烯氧化酶(KO)氧化以形成(-)-贝壳杉烯酸。

在甜叶菊叶中，(-)-贝壳杉烯酸然后通过对映-贝壳杉烯酸13-羟化酶 (KAH)羟基化以形成甜菊醇。甜菊醇然后通过一系列UDP-糖基转移酶 (UGT)糖基化，从而形成许多甜菊醇糖苷。具体地说，这些分子可被视为甜菊醇分子，其羧基氢原子被葡萄糖分子代替以形成酯，并且羟基氢被葡萄糖和鼠李糖的组合代替以形成缩醛。

这些途径可在重组宿主例如酵母如酵母属(Saccharomyces)和耶氏酵母属(Yarrowia)中重建。

本发明涉及新的变体UDP-糖基转移酶(UGT)多肽的鉴定，其与当前已知的那些相比通常具有改进的性质。这些多肽可用于产生重组宿主，所述重组宿主产生更高量的甜菊醇糖苷和/或另外或新的甜菊醇糖苷和/或更高量的特异性甜菊醇糖苷和/或具有期望比例的不同甜菊醇糖苷的甜菊醇糖苷的混合物。

因此，本发明还涉及一种能够产生糖基化二萜(即二萜糖苷如甜菊醇糖苷)的重组宿主，所述糖基化二萜如甜菊单糖苷、甜菊双糖苷、甜菊苷、莱鲍迪甙A、莱鲍迪甙B、莱鲍迪甙C、莱鲍迪甙D、莱鲍迪甙E、莱鲍迪甙F、莱鲍迪甙M、甜茶苷、杜克苷A、甜菊醇-13-单糖苷、甜菊醇-19-单糖苷或13-[(β-D-吡喃葡萄糖基)氧基)贝壳衫-16-烯-18-酸2-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖基酯甜菊醇-19-双糖苷，

因此，本发明涉及一种重组宿主，其包含通常具有UDP-糖基转移酶 (UGT)活性如UGT2活性的重组核酸序列，所述重组核酸序列编码多肽，所述多肽：

a.与SEQ ID NO:1中列出的氨基酸序列具有至少约85％同一性；

b.与SEQ ID NO:3中列出的氨基酸序列具有至少约85％同一性；

c.与SEQ ID NO:6中列出的氨基酸序列具有至少约85％同一性；

d.与SEQ ID NO:9中列出的氨基酸序列具有至少约85％同一性；

e.与SEQ ID NO:11中列出的氨基酸序列具有至少约85％同一性；

f.与SEQ ID NO:14中列出的氨基酸序列具有至少约85％同一性；

g.与SEQ ID NO:17中列出的氨基酸序列具有至少约85％同一性；

h.与SEQ ID NO:20中列出的氨基酸序列具有至少约85％同一性；

i.与SEQ ID NO:22中列出的氨基酸序列具有至少约85％同一性；或

j.与SEQ ID NO:25中列出的氨基酸序列具有至少约85％同一性。

本发明还涉及：

–一种用于制备糖基化二萜的方法，所述方法包括在合适的发酵培养基中发酵本发明的重组宿主，并且任选地回收糖基化二萜；

–一种发酵液，其包含能够通过本发明的方法获得的糖基化二萜；

–一种通过这种方法获得或能够从这种发酵液获得的糖基化二萜；

–一种包含两种或更多种此类二萜的组合物；

–一种包含这种糖基化二萜的食品、饲料或饮料；

–一种用于将第一糖基化二萜转化为第二糖基化二萜的方法，所述方法包括：

–使所述第一糖基化二萜与本发明的重组宿主、源自这种重组宿主的无细胞提取物或源自其任一者的酶制剂接触；

–从而将所述第一糖基化二萜转化为所述第二糖基化二萜。

–一种具有UGT2活性的多肽，其中所述多肽选自由以下各项组成的组：

(a)包含在SEQ ID NO:1、3、6、9、11、14、17、20、22或25中的任一个中列出的氨基酸序列的多肽；或

(b)包含与SEQ ID NO:1、3、6、9、11、14、17、20、22或25中的任一个的氨基酸序列具有至少约85％序列同一性的氨基酸序列的多肽；或

(c)由包含在SEQ ID NO:2、4、5、7、8、10、12、13、15、16、 18、19、21、23、24或26中的任一个中列出的多核苷酸序列的多核苷酸编码的多肽；或

(d)由包含与SEQ ID NO:2、4、5、7、8、10、12、13、15、16、 18、19、21、23、24或26中的任一个中的多肽编码序列具有至少50％序列同一性的多核苷酸序列的多核苷酸编码的多肽；或

(e)由优选在至少低严格性条件下与SEQ ID NO:2、4、5、7、8、 10、12、13、15、16、18、19、21、23、24或26中的任一个的互补链杂交的多核苷酸编码的多肽；或

(f)由优选在至少低严格性条件下与同SEQ ID NO:2、4、5、7、8、 10、12、13、15、16、18、19、21、23、24或26中的任一个具有至少50％序列同一性的多核苷酸的互补链杂交的多核苷酸编码的多肽；或

(g)在(a)、(b)、(c)、(d)、(e)或(f)中定义的多肽的片段。

–一种编码这种多肽的多核苷酸序列；

–一种包含这种多核苷酸序列的核酸构建体；以及

–一种产生本发明的多肽的方法，所述方法包括：

(a)在有利于通过本发明的重组宿主产生所述多肽的条件下培养宿主细胞，以及任选地

(b)回收所述多肽。

附图说明

图1示出了质粒pUG7-EcoRV的示意性图示。

图2示出了(A)设计ERG20、tHMG1和BTS1过度表达盒并且(B) 整合到酵母基因组中的方法的示意性图示。(C)示出了在通过Cre重组酶除去KANMX标记后的最终情况。

图3示出了ERG9敲低构建体的示意性图示。所述构建体由ERG9的 500bp长的3'部分、TRP1启动子的98bp、TRP1开放阅读框和终止子、随后ERG9的400bp长的下游序列组成。由于在ERG9开放阅读框末端处引入Xbal位点，所以最后一个氨基酸变成Ser，并且终止密码子变成Arg。新的终止密码子位于TPR1启动子中，从而导致18个氨基酸的延伸。

图4示出了UGT2如何整合到基因组中的示意性图示。A.在转化中使用的不同片段；B.整合后的情况；C.在Cre重组酶表达后的情况)。

图5示出了从GGPP至甜菊醇的途径如何整合到基因组中的示意性图示。A.在转化中使用的不同片段；B.在整合后的情况。

图6示出了携带CRE基因的pSH65质粒，其用于除去抗生素标志物。

图7示出了质粒pUG7-NAT的图谱。

图8示出了用Nat选择标记从STV008置换UGT2_1a。

图9示出了从STV008除去NAT标记。

图10示出了将UGT2基因整合在Chr09.01基因座处。

图11示出了携带UGT2的不同变体的酵母属菌株中的莱鲍迪甙A的产生。

图12示出了表达UGT2的不同变体的酵母属菌株中的莱鲍迪甙M的产生，作为表达UGT2_1a的酵母属菌株中的莱鲍迪甙M产生的百分比。

图13示出了携带基因tHMG和UGT2_1a的质粒MB6969的图谱。

图14示出了携带基因tHMG的质粒MB6856的图谱。

图15示出了携带基因tHMG的质粒MB6857的图谱。

图16示出了携带基因GGS的质粒MB6948的图谱。

图17示出了携带基因GGS的质粒MB6958的图谱。

图18示出了携带基因UGT1、UGT3和UGT4的质粒MB7015的图谱。

图19示出了携带基因tHMG和GGS的质粒MB6986的图谱。

图20示出了携带基因tCPS_SR、tKS_SR、KAH_4、KO_Gib和CPR_3 的质粒MB7059的图谱。

图21示出了携带基因tCPS_SR、tKS_SR、KAH_4、KO_Gib和CPR_3 的质粒MB7100的图谱。

图22示出了携带基因tHMG和GGS的质粒MB6988的图谱。

图23示出了携带基因tCPS_SR、tKS_SR、KAH_4、KO_Gib和CPR_3 的质粒MB7044的图谱。

图24示出了携带基因tCPS_SR、tKS_SR、KAH_4、KO_Gib和CPR_3 的质粒MB7094的图谱。

图25示出了携带CRE基因的质粒MB6128的图谱，其用于除去抗生素标志物。

图26示出了在由gsy1整合侧翼侧接的基因UGT2、KanMX、UGT1 和KAH_4的质粒中组装的方法。

图27示出了图26的质粒的扩增和转化至耶氏酵母属的方法。

图28示出了表达UGT2的不同变体的耶氏酵母属菌株中的莱鲍迪甙A 的产生。

图29示出了表达UGT2的不同变体的耶氏酵母属菌株中的莱鲍迪甙M 的产生，作为表达UGT2_1a的耶氏酵母属菌株中的莱鲍迪甙M产生的百分比。

图30示出了表达UGT2_6b(左图)或UGT2_7b(右图)的菌株中的 RebA(上图)和RebM(下图)的产生。

图31示出了导致甜菊醇糖苷的生物合成的潜在途径的示意性图示。

图32示出了导致甜菊醇糖苷的生物合成的潜在途径的示意性图示。用星号示出的化合物是13-[(β-D-吡喃葡萄糖基)氧基]贝壳杉-16-烯-18-酸 2-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖基酯。

序列表的描述

序列的描述在表13中列出。本文描述的序列可参考序列表或参考本文所列的任何数据库登录号进行定义，例如在表13中。

发明详述

在本说明书和所附权利要求书中，词语“包含”、“包括”和“具有”以及变化形式应被解释为包含性的。也就是说，这些词语意图表达在上下文允许的情况下可包含未具体叙述的其他要素或整数。

不使用数量词修饰时在本文中用于指代一个或一个以上(即一个或至少一个)的语法对象。举例来说，“要素”可意指一个要素或多于一个要素。

在本文，“莱鲍迪甙”可缩写为“reb”。即，例如莱鲍迪甙A和rebA意图表示同一分子。

在涉及细胞、核酸、蛋白质或载体使用时，术语“重组”指示细胞、核酸、蛋白质或载体已通过引入异源核酸或蛋白质或改变天然核酸或蛋白质来进行修饰，或者指示细胞源自如此修饰的细胞。因此，例如，重组细胞表达在细胞的天然(非重组)形式中未发现的基因或者表达以其他形式异常表达、低表达或完全未表达的天然基因。术语“重组的”与“遗传修饰的” 同义。

本发明涉及具有UDP-糖基转移酶(UGT)活性的新的变体多肽。出于本发明的目的，具有UGT活性的多肽是具有糖基转移酶活性(EC 2.4)的多肽，即可充当单糖单元从活化的核苷酸糖(也称为“糖基供体”)转移至糖基受体分子(通常为醇)的催化剂的多肽。用于UGT的糖基供体通常是核苷酸糖尿苷二磷酸葡萄糖(尿嘧啶二磷酸葡萄糖，UDP-葡萄糖)。本发明的多肽通常具有UGT活性，并且本发明的多核苷酸序列通常编码这种多肽。通常，本发明的多肽是具有UGT2型活性的变体多肽。

根据本发明，因此提供了多肽，通常为具有UGT活性的多肽，其中所述多肽选自由以下各项组成的组：

(c)由包含在SEQ ID NO:2、4、5、7、8、10、12、13、15、16、18、 19、21、23、24或26中的任一个中列出的多核苷酸序列的多核苷酸编码的多肽；或

(d)由包含与SEQ ID NO:2、4、5、7、8、10、12、13、15、16、18、 19、21、23、24或26中的任一个中的多肽编码序列具有至少50％序列同一性的多核苷酸序列的多核苷酸编码的多肽；或

(e)由优选在至少低严格性条件下与SEQ ID NO:2、4、5、7、8、10、 12、13、15、16、18、19、21、23、24或26中的任一个的互补链杂交的多核苷酸编码的多肽；或

(g)在(a)、(b)、(c)、(d)、(e)或(f)中定义的多肽的片段。

这种多肽可包含与SEQ ID NO:1、3、6、9、11、14、17、20、22或 25中的任一个具有至少约86％序列同一性、至少约87％、至少约88％、至少约89％、至少约90％、至少约91％、至少约92％、至少约93％、至少约 94％、至少约95％、至少约96％、至少约97％、至少约98％、至少约99％序列同一性的氨基酸序列。

因此，本发明涉及：

-通常具有UGT活性的多肽，所述多肽包含与SEQ ID NO:1具有至少约86％序列同一性、至少约87％、至少约88％、至少约89％、至少约90％、至少约91％、至少约92％、至少约93％、至少约94％、至少约95％、至少约96％、至少约97％、至少约98％、至少约99％序列同一性的氨基酸序列；

-通常具有UGT活性的多肽，所述多肽包含与SEQ ID NO 3具有至少约86％序列同一性、至少约87％、至少约88％、至少约89％、至少约90％、至少约91％、至少约92％、至少约93％、至少约94％、至少约95％、至少约96％、至少约97％、至少约98％、至少约99％序列同一性的氨基酸序列；

-通常具有UGT活性的多肽，所述多肽包含与SEQ ID NO:6具有至少约86％序列同一性、至少约87％、至少约88％、至少约89％、至少约90％、至少约91％、至少约92％、至少约93％、至少约94％、至少约95％、至少约96％、至少约97％、至少约98％、至少约99％序列同一性的氨基酸序列；

-通常具有UGT活性的多肽，所述多肽包含与SEQ ID NO:9具有至少约86％序列同一性、至少约87％、至少约88％、至少约89％、至少约90％、至少约91％、至少约92％、至少约93％、至少约94％、至少约95％、至少约96％、至少约97％、至少约98％、至少约99％序列同一性的氨基酸序列；

-通常具有UGT活性的多肽，所述多肽包含与SEQ ID NO:11具有至少约86％序列同一性、至少约87％、至少约88％、至少约89％、至少约90％、至少约91％、至少约92％、至少约93％、至少约94％、至少约95％、至少约96％、至少约97％、至少约98％、至少约99％序列同一性的氨基酸序列；

-通常具有UGT活性的多肽，所述多肽包含与SEQ ID NO:14具有至少约86％序列同一性、至少约87％、至少约88％、至少约89％、至少约90％、至少约91％、至少约92％、至少约93％、至少约94％、至少约95％、至少约96％、至少约97％、至少约98％、至少约99％序列同一性的氨基酸序列；

-通常具有UGT活性的多肽，所述多肽包含与SEQ ID NO:17具有至少约86％序列同一性、至少约87％、至少约88％、至少约89％、至少约90％、至少约91％、至少约92％、至少约93％、至少约94％、至少约95％、至少约96％、至少约97％、至少约98％、至少约99％序列同一性的氨基酸序列；

-通常具有UGT活性的多肽，所述多肽包含与SEQ ID NO:20具有至少约86％序列同一性、至少约87％、至少约88％、至少约89％、至少约90％、至少约91％、至少约92％、至少约93％、至少约94％、至少约95％、至少约96％、至少约97％、至少约98％、至少约99％序列同一性的氨基酸序列；

-通常具有UGT活性的多肽，所述多肽包含与SEQ ID NO:22具有至少约86％序列同一性、至少约87％、至少约88％、至少约89％、至少约90％、至少约91％、至少约92％、至少约93％、至少约94％、至少约95％、至少约96％、至少约97％、至少约98％、至少约99％序列同一性的氨基酸序列；以及

-通常具有UGT活性的多肽，所述多肽包含与SEQ ID NO:25具有至少约86％序列同一性、至少约87％、至少约88％、至少约89％、至少约90％、至少约91％、至少约92％、至少约93％、至少约94％、至少约95％、至少约96％、至少约97％、至少约98％、至少约99％序列同一性的氨基酸序列。

如本文所用，术语“多肽”是指包含通过肽键连接的氨基酸残基并含有多于五个氨基酸残基的分子。氨基酸由单字母或三字母名称标识。如本文所用的术语“蛋白质”与术语“多肽”同义，并且还可指两种或更多种多肽。因此，术语“蛋白质”、“肽”和“多肽”可互换使用。多肽可任选地进行修饰(例如，糖基化、磷酸化、酰化、法尼基化、异戊二烯化、磺化等)以增加官能度。展现活性的多肽可被称为酶。应理解，作为遗传密码简并的结果，可产生编码给定多肽的许多核苷酸序列。

本发明的多肽可包含信号肽和/或前肽序列。在本发明的多肽包含信号肽和/或前肽的情况下，可在成熟多肽序列上计算序列同一性。

本发明的多肽通常具有UGT活性，并且更优选地具有UGT2活性。图 31和32示出了可通过具有UGT2的多肽催化的反应的非详尽列表。

具有UGT2活性的多肽是充当尿苷5'-二磷酸葡糖基:甜菊醇-13-O-糖苷转移酶(也称为甜菊醇-13-单葡糖苷1,2-转葡糖基酶)的多肽，其将葡萄糖部分转移至受体分子甜菊醇-13-O-糖苷的13-O-葡萄糖的C-2'。通常，合适的UGT2多肽也充当尿苷5'-二磷酸葡糖基:甜茶苷转移酶，其将葡萄糖部分转移至受体分子甜茶苷13-O-葡萄糖的C-2'。

具有UGT2活性的多肽也可催化利用除甜菊醇-13-O-糖苷和甜茶苷以外的甜菊醇糖苷底物的反应，例如，功能性UGT2多肽可利用甜菊苷作为底物，从而将葡萄糖部分转移至19-O-葡萄糖残基的C-2'以产生莱鲍迪甙E。功能性UGT2多肽还可利用莱鲍迪甙A作为底物，从而将葡萄糖部分转移至19-O-葡萄糖残基的C-2'以产生莱鲍迪甙D。

具有UGT2活性的多肽也可催化利用甜菊醇-19-糖苷或甜茶苷作为底物的反应，例如，功能性UGT2多肽可利用甜菊醇-19-糖苷或甜茶苷作为底物，从而将葡萄糖部分转移至19位以分别产生甜菊醇-19-双糖苷或 13-[(β-D-吡喃葡萄糖基)氧基)贝壳杉-16-烯-18-酸2-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖基酯。

然而，功能性UGT2多肽通常不将葡萄糖部分转移至在C-13位具有 1,3-结合的葡萄糖的甜菊醇化合物，即将葡萄糖部分转移至甜菊醇1,3-双糖苷和1,3-甜菊苷通常不会发生。

具有UGT2活性的多肽也可从除尿苷二磷酸葡萄糖以外的供体转移糖部分。例如，具有UGT2活性的多肽充当尿苷5'-二磷酸D-木糖基:甜菊醇 -13-O-糖苷转移酶，其将木糖部分转移至受体分子甜菊醇-13-O-糖苷的 13-O-葡萄糖的C-2'。作为另一个实例，具有UGT2活性的多肽可充当尿苷 5'-二磷酸L-鼠李糖基:甜菊醇-13-O-糖苷转移酶，其将鼠李糖部分转移至受体分子甜菊醇的13-O-葡萄糖的C-2'。

一种或多种上述活性可用于定义具有UGT2活性的多肽。与UGT2_1a 多肽(SEQ IDNO:27)相比，本发明的多肽可在一种或多种上述活性方面具有改善的UGT2活性。

本发明的多肽可用于将重组细胞中的甜菊醇糖苷的产生导向所需的甜菊醇糖苷，如莱鲍迪甙A、莱鲍迪甙D或莱鲍迪甙M。例如，优先催化甜菊醇-13-单糖苷转化为甜菊双糖苷和/或甜茶苷转化为甜菊苷的UGT2多肽可有助于使产生转向莱鲍迪甙A，而优先催化甜菊苷转化为rebE或甜茶苷转化为在19位具有另外糖的化合物的UGT2多肽可有助于使产生转向莱鲍迪甙M。也就是说，在13位添加糖部分的优先可有助于使产生转向莱鲍迪甙A，而在19位添加糖部分的优先可有助于使产生转向莱鲍迪甙M。

本发明还提供了编码如本文所述的多肽的多核苷酸序列。

这种多核苷酸序列可选自由以下各项组成的组：

(a)包含SEQ ID NO:2、4、5、7、8、10、12、13、15、16、18、19、 21、23、24或26中的任一个或包含与SEQ ID NO:2、4、5、7、8、10、 12、13、15、16、18、19、21、23、24或26中的任一个的多核苷酸序列具有至少30％序列同一性的多核苷酸序列的多核苷酸序列；或

(b)优选在至少低严格性条件下与SEQ ID NO:2、4、5、7、8、10、 12、13、15、16、18、19、21、23、24或26中的任一个的互补链杂交的多核苷酸序列；或

(c)优选在至少低严格性条件下与同SEQ ID NO:2、4、5、7、8、10、 12、13、15、16、18、19、21、23、24或26中的任一个具有至少30％序列同一性的多核苷酸的互补链杂交的多核苷酸序列；

(d)作为在(a)、(b)或(c)中任一项所定义的多核苷酸序列的遗传密码简并性的结果的简并物的多核苷酸序列；或

(e)为在(a)、(b)、(c)或(d)中定义的核苷酸序列的互补物的多核苷酸序列。

本发明的多核苷酸序列可与SEQ ID NO:2、4、5、7、8、10、12、13、 15、16、18、19、21、23、24或26中的任一个具有至少40％、至少50％、至少60％、优选至少70％、更优选至少80％、最优选至少90％、最优选至少93％、最优选至少约95％、最优选至少约96％、最优选至少约97％、甚至最优选至少约98％以及甚至更优选至少99％的序列同一性。

如在本发明中使用的术语“核酸”是指包含至少5个核苷酸单元的核苷酸聚合物。核酸是指核糖核苷酸聚合物(RNA)、脱氧核苷酸聚合物(DNA) 或任一类型的核酸的修饰形式或其合成形式或上述中的任一种的混合聚合物。核酸可包括通过天然存在和/或非天然存在的核酸键连接在一起的天然存在的核酸和修饰的核酸中的任一者或两者。核酸分子可被化学或生物化学修饰或可含有非天然或衍生化的核酸碱基，如本领域的技术人员所容易了解的。此类修饰包括例如标记、甲基化、以类似物替换一个或多个天然存在的核酸、核苷酸间修饰如不带电键联(例如，膦酸甲酯、磷酸三酯、氨基磷酸酯、氨基甲酸酯等)、带电键联(例如，硫代磷酸酯、二硫代磷酸酯等)、悬垂(pendent)部分(例如，多肽)、嵌入剂(例如，吖啶、补骨脂素等)、螯合剂、烷基化剂以及修饰的键联(例如，α异头核酸等)。术语核酸还旨在包括任何拓扑构象，包括单链(有义链和反义链)、双链、部分双链体、三链体、发夹、环形和挂锁构象。还包括在经由氢键合和其他化学相互作用在结合至指定序列的能力方面模拟核酸的合成分子。此类分子在本领域中是已知的并且包括例如其中肽键联取代分子骨架中的磷酸酯键的那些分子。提及核酸序列涵盖其互补物，除非另有说明。因此，提及具有特定序列的核酸分子应理解为涵盖其互补链及其互补序列。互补链也适用于例如反义疗法、杂交探针和PCR引物。术语“核酸”、“多核苷酸”和“多核苷酸序列”可在本文中互换使用。

如本文所用的，术语“杂交”是指寡聚化合物的基本上互补链的配对。一种配对机制涉及寡聚化合物链的互补核苷酸碱基(核苷酸)之间的氢键合，所述氢键合可以是沃森-克里克(Watson-Crick)、霍氏或反霍氏氢键合。例如，腺嘌呤与胸腺嘧啶是通过形成氢键配对的互补核酸。杂交可在不同情形下发生。本文使用“严格杂交”或“在低严格条件、中等严格条件、高严格条件或非常高严格条件下杂交”来描述用于杂交和洗涤的条件，更具体地说，寡聚化合物将与其靶序列而与最小数量的其他序列杂交的条件。因此，寡聚化合物将与靶序列杂交至比与其他序列杂交可检测到的更高程度。对于进行杂交反应的指导可见于Current Protocols in Molecular Biology,John Wiley&Sons,N.Y.(1989),6.3.1-6:3.6中。在所述参考文献中描述了水性和非水性方法并且可使用任一方法。严格条件是序列依赖性的并且将在不同情况下有所不同。通常，对于在限定离子强度和pH下的寡聚化合物而言，严格条件被选择为低于热熔点(Tm)约5℃。Tm是50％寡聚化合物与完全匹配探针杂交时所处的温度(在确定离子强度和pH下)。还可通过添加去稳定剂如甲酰胺来实现严格条件。

特异性杂交条件的实例如下所示：1)在约45℃下在6X氯化钠/柠檬酸钠(SSC)中、随后至少在50℃下在0.2X SSC、0.1％SDS中洗涤2次的低严格杂交条件(对于低严格条件而言，洗涤的温度可增加至55℃)；2)在约45℃下在6X SSC中、随后在60℃下在0.2X SSC、0.1％SDS中洗涤一次或多次的中等严格杂交条件；3)在约45℃下在6X SSC中、随后在65℃下在0.2X SSC、0.1％SDS中洗涤一次或多次的高严格杂交条件；以及4) 非常高严格杂交条件是在65℃下0.5M磷酸钠、7％SDS，随后在65℃下在 0.2X SSC、1％SDS中洗涤一次或多次。

通常，高严格条件如高杂交温度和任选的低盐浓度仅允许高度相似的序列之间的杂交，而低严格条件如低杂交温度和任选的高盐浓度允许在序列相似性更小时的杂交。

本发明还提供了包含本发明的多核苷酸序列的核酸构建体。

术语“核酸构建体”是指单链或双链的核酸分子，其从天然存在的基因中分离或已经被修饰以含有以否则将不会在自然中存在的方式组合和并置的核酸的区段。当核酸构建体含有表达编码序列所需要的所有控制序列时，术语核酸构建体与术语“表达盒”的含义相同，其中所述控制序列可操作地连接至所述编码序列。

本发明的核酸可以是表达载体，其中本发明的多核苷酸序列与至少一个用于在宿主细胞中表达多核苷酸序列的控制序列可操作地连接。

如本文所用的术语“可操作地连接”是指物理地连接并且彼此有功能性关系的两个或多个核酸序列元件。例如，如果启动子能够起始或调控编码序列的转录或表达，则启动子可操作地连接至编码序列，在这种情况下，所述编码序列应被理解为在启动子的“控制下”。通常，当两个核酸序列可操作地连接时，它们将处于相同的取向并且通常也在同一阅读框中。它们通常将是基本上连续的，尽管这可能不是必需的。

表达载体包含编码本发明多肽的多核苷酸，其可操作地连接至用于在体外或在宿主细胞中表达和/或翻译多核苷酸的适当控制序列(如启动子以及转录和翻译终止信号)。

表达载体可以是能够方便地进行重组DNA程序并能使多核苷酸表达的任何载体(例如，质粒或病毒)。载体的选择通常将取决于所述载体与待引入所述载体的细胞的相容性。载体可以是线性或闭合的环状质粒。载体可以是自主复制型载体，即作为染色体外实体而存在、其复制独立于染色体复制的载体，例如，质粒、染色体外元件、微型染色体或人工染色体。

或者，载体可以是当被引入宿主细胞时整合至基因组中并与其已整合至其中的染色体一起复制的载体。整合型克隆载体可随机或在预定靶基因座处整合在宿主细胞的染色体中。本发明的载体可包含一个或多个选择性标记，其允许容易地选择转化的细胞。

本发明还提供了一种重组宿主，其包含编码本发明多肽的重组核酸序列。

也就是说，本发明的重组宿主可包含例如编码以下多肽的重组核酸序列，所述多肽：

a.与SEQ ID NO:1中列出的氨基酸序列具有至少约85％同一性；

b.与SEQ ID NO:3中列出的氨基酸序列具有至少约85％同一性；

c.与SEQ ID NO:6中列出的氨基酸序列具有至少约85％同一性；

d.与SEQ ID NO:9中列出的氨基酸序列具有至少约85％同一性；

e.与SEQ ID NO:11中列出的氨基酸序列具有至少约85％同一性；

f.与SEQ ID NO:14中列出的氨基酸序列具有至少约85％同一性；

g.与SEQ ID NO:17中列出的氨基酸序列具有至少约85％同一性；

h.与SEQ ID NO:20中列出的氨基酸序列具有至少约85％同一性；

i.与SEQ ID NO:22中列出的氨基酸序列具有至少约85％同一性；或

j.与SEQ ID NO:25中列出的氨基酸序列具有至少约85％同一性。

本发明的重组宿主可包含编码本文所述的本发明多肽的任何多核苷酸。本发明的重组宿主通常能够表达本发明的多肽。

通常，本发明的重组宿主能够产生糖基化二萜，如甜菊醇糖苷。例如，本发明的重组宿主可能够产生例如甜菊醇-13-单糖苷、甜菊醇-19-单糖苷、 13-[(β-D-吡喃葡萄糖基)氧基]贝壳杉-16-烯-18-酸2-O-β-D-吡喃葡萄糖基 -β-D-吡喃葡萄糖基酯、甜茶苷、甜菊苷、甜菊醇-19-双糖苷、甜菊双糖苷、 rebA、rebE、rebD或rebM中的一种或多种。

根据本发明的重组宿主可包含一个或多个编码以下中的一种或多种的重组核苷酸序列：

具有对映-柯巴基焦磷酸合酶活性的多肽；

具有对映-贝壳杉烯合酶活性的多肽；

具有对映-贝壳杉烯氧化酶活性的多肽；以及

具有贝壳杉烯酸13-羟化酶活性的多肽。

出于本发明的目的，具有对映-柯巴基焦磷酸合酶(EC 5.5.1.13)的多肽能够催化化学反应：

所述酶具有一种底物，香叶基香叶基焦磷酸；以及一种产物，对映-柯巴基焦磷酸。所述酶参与赤霉素生物的合成。所述酶属于异构酶家族，特别是分子内裂解酶的类别。所述酶类别的系统名称是对映-柯巴基-二磷酸裂解酶(脱环)。通常使用的其他名称包括具有对映-柯巴基焦磷酸合酶、对映-贝壳杉烯合酶A和对映-贝壳杉烯合成酶A。

编码对映-柯巴基焦磷酸合酶的合适核酸序列可例如包含在 WO2015/007748的SEQ ID.NO:1、3、5、7、17、19、59、61、141、142、 151、152、153、154、159、160、182或184中列出的序列。

出于本发明的目的，具有对映-贝壳杉烯合酶活性(EC 4.2.3.19)的多肽是能够催化以下化学反应的多肽：

因此，所述酶具有一种底物，对映-柯巴基二磷酸；以及两种产物，对映-贝壳杉烯和二磷酸。

所述酶属于裂解酶家族，特别是作用于磷酸盐/酯的碳-氧裂解酶。所述酶类别的系统名称是对映-柯巴基二磷酸二磷酸-裂解酶(环化，对映-贝壳杉烯形成)。常用的其它名称包括对映-贝壳杉烯合酶B、对映-贝壳杉烯合成酶B、对映-柯巴基-二磷酸二磷酸-裂解酶和(环化)。所述酶参与双萜类生物合成。

编码对映-贝壳杉烯合酶的合适核酸序列可例如包含在 WO2015/007748的SEQID.NO:9、11、13、15、17、19、63、65、143、 144、155、156、157、158、159、160、183或184中列出的序列。

对映-柯巴基二磷酸合酶还可具有与相同蛋白质分子相关联的不同对映-贝壳杉烯合酶活性。由对映-贝壳杉烯合酶催化的反应是赤霉素的生物合成途径中的下一步骤。两种类型的酶活性是不同的，并且定点诱变以抑制蛋白质的对映-贝壳杉烯合酶活性导致对映-柯巴基焦磷酸的积累。

因此，本发明中使用的单个核苷酸序列可编码具有对映-柯巴基焦磷酸合酶活性和对映-贝壳杉烯合酶活性的多肽。或者，两种活性可被两个不同的分离的核苷酸序列编码。

出于本发明的目的，具有对映-贝壳杉烯氧化酶活性(EC 1.14.13.78) 的多肽是能够催化对映-贝壳杉烯的4-甲基的三次连续氧化以产生贝壳杉烯酸的多肽。这种活性通常需要细胞色素P450的存在。

编码对映-贝壳杉烯氧化酶的合适核酸序列可例如包含在 WO2015/007748的SEQID.NO:21、23、25、67、85、145、161、162、163、 180或186中列出的序列。

出于本发明的目的，具有贝壳杉烯酸13-羟化酶活性(EC 1.14.13)的多肽是能够催化使用NADPH和O₂形成甜菊醇(对映-贝壳杉-16-烯-13-醇 -19-酸)的多肽。这种活性也可称为对映-贝壳杉烯酸13-羟化酶活性。

编码贝壳杉烯酸 13-羟化酶的合适核酸序列可例如包含在 WO2015/007748的SEQID.NO:27、29、31、33、69、89、91、93、95、 97、146、164、165、166、167或185中列出的序列。

本发明的重组宿主可包含编码具有NADPH-细胞色素p450还原酶活性的多肽的重组核酸序列。也就是说，本发明的重组宿主可能够表达编码具有NADPH-细胞色素p450还原酶活性的多肽的核苷酸序列。出于本发明的目的，具有NADPH-细胞色素P450还原酶活性(EC 1.6.2.4；也称为NADPH: 高铁血红蛋白氧化还原酶、NADPH:血红素蛋白氧化还原酶、NADPH:P450 氧化还原酶、P450还原酶、POR、CPR、CYPOR)的多肽通常是一种这样的多肽，其为膜结合酶，从而允许电子从含有FAD和FMN的酶NADPH: 细胞色素P450还原酶(POR；EC1.6.2.4)转移至真核细胞的微粒体中的细胞色素P450。

根据前述权利要求中任一项所述的重组宿主，其包含一个或多个编码以下中的一种或多种的重组核酸序列：

(i)具有UGT74G1活性(UGT3活性)的多肽；

(ii)具有UGT85C2活性(UGT1活性)的多肽；以及

(iii)具有UGT76G1活性(UGT4活性)的多肽。

图31和32示出了导致甜菊醇糖苷的生物合成的潜在途径的示意性图示。

本发明的重组宿主通常将包含至少一种编码具有UGT1活性的多肽的重组核酸、至少一种编码具有UGT2活性的多肽的重组核酸、至少一种编码具有UGT3活性的多肽的重组核酸以及至少一种编码具有UGT4活性的多肽的重组核酸。一种核酸可编码两种或更多种此类多肽。

编码本发明的多肽的核酸可用于将重组细胞中的甜菊醇糖苷的产生导向期望的甜菊醇糖苷，如莱鲍迪甙A、莱鲍迪甙D或莱鲍迪甙M。例如，编码优先催化甜菊醇-13-单糖苷转化为甜菊双糖苷和/或甜茶苷转化为甜菊苷的UGT2多肽的重组核酸可有助于使产生转向莱鲍迪甙A，而编码优先催化甜菊苷转化为rebE或甜茶苷转化为在19位具有另外糖的化合物的 UGT2多肽的重组核酸可有助于使产生转向莱鲍迪甙M。也就是说，在13 位添加糖部分的优先可有助于使产生转向莱鲍迪甙A，而在19位添加糖部分的优先可有助于使产生转向莱鲍迪甙M。

本发明的重组宿主可包含编码能够催化向甜菊醇中添加C-13-葡萄糖的多肽的核苷酸序列。也就是说，本发明的重组宿主可包含能够催化将甜菊醇转化为甜菊醇单糖苷的反应的UGT。

本发明的这种重组宿主可包含编码具有由UDP-糖基转移酶(UGT) UGT85C2所示的活性的多肽的核苷酸序列，由此宿主转化后的核苷酸序列赋予所述宿主将甜菊醇转化为甜菊醇单糖苷的能力。

UGT85C2活性是将葡萄糖单元转移至甜菊醇的13-OH。因此，合适的 UGT85C2可充当尿苷5'-二磷酸葡糖基:甜菊醇13-OH转移酶和尿苷5'-二磷酸葡糖基:甜菊醇-19-O-糖苷13-OH转移酶。功能性UGT85C2多肽还可催化葡糖基转移酶反应，所述反应利用除甜菊醇和甜菊醇-19-O-糖苷以外的甜菊醇糖苷底物。此类序列可在本文中称为UGT1序列。

本发明的重组宿主可包含编码具有UGT活性的多肽的核苷酸序列，可包含编码能够催化向甜菊醇或甜菊醇单糖苷添加C-13-葡萄糖的多肽的核苷酸序列。也就是说，本发明的重组体可包含能够催化将甜菊醇单糖苷转化为甜菊双糖苷的反应的UGT。因此，这种重组宿主可能够将甜菊单糖苷转化为甜菊双糖苷。这种核苷酸序列的表达可赋予宿主产生至少甜菊双糖苷的能力。

本发明的重组微生物也包含编码具有UGT活性的多肽的核苷酸序列，可包含编码能够催化向甜菊双糖苷添加C-19-葡萄糖的多肽的核苷酸序列。也就是说，本发明的微生物可包含能够催化将甜菊双糖苷转化为甜菊苷的反应的UGT。因此，这种微生物可能够将甜菊双糖苷转化为甜菊苷。这种核苷酸序列的表达可赋予微生物产生至少甜菊苷的能力。

因此，本发明的微生物还可包含编码具有由UDP-糖基转移酶(UGT) UGT74G1所示活性的多肽的核苷酸序列，由此微生物转化后的核苷酸序列赋予细胞将甜菊双糖苷转化为甜菊苷的能力。

合适的UGT74G1多肽可能够将葡萄糖单元分别转移至甜菊醇的 13-OH或19-COOH。合适的UGT74G1多肽可充当尿苷5'-二磷酸葡糖基: 甜菊醇19-COOH转移酶和尿苷5'-二磷酸葡糖基:甜菊醇-13-O-糖苷 19-COOH转移酶。功能性UGT74G1多肽还可催化使用除甜菊醇和甜菊醇 -13-O-糖苷以外的甜菊醇糖苷底物或者从除尿苷二磷酸葡萄糖以外的供体转移糖部分的糖基转移酶反应。此类序列可在本文中称为UGT3序列。

本发明的重组宿主可包含编码能够催化甜菊苷的C-13位置处的葡萄糖的C-3'的葡糖基化的多肽的核苷酸序列。也就是说，本发明的重组宿主可包含UGT，所述UGT能够催化甜菊苷至莱鲍迪甙A的反应。因此，这种重组宿主可能够将甜菊苷转化为莱鲍迪甙A。这种核苷酸序列的表达可赋予宿主产生至少莱鲍迪甙A的能力。

因此，本发明的重组微生物还可包含编码具有由UDP-糖基转移酶 (UGT)UGT76G1所示的活性的多肽的核苷酸序列，由此微生物转化后的核苷酸序列赋予细胞将甜菊苷转化为莱鲍迪甙A的能力。

合适的UGT76G1向受体分子甜菊醇1,2糖苷的C-13-O-葡萄糖的C-3' 添加葡萄糖部分。因此，UGT76G1例如充当尿苷5'-二磷酸葡糖基:甜菊醇 13-O-1,2葡糖苷C-3'葡糖基转移酶和尿苷5'-二磷酸葡糖基:甜菊醇-19-O-葡萄糖、13-O-1,2双糖苷C-3'葡糖基转移酶。功能性UGT76G1多肽还可催化葡糖基转移酶反应，所述反应使用含有除葡萄糖以外的糖的甜菊醇糖苷底物，例如甜菊醇鼠李糖苷和甜菊醇木糖苷。此类序列可在本文中称为UGT4 序列。

本发明的重组宿主通常包含编码具有上述所有四种UGT活性的多肽的核苷酸序列。给定核酸可编码具有一种或多种上述活性的多肽。例如，核酸编码具有两种、三种或四种上述活性的多肽。优选地，本发明的重组宿主包含UGT1、UGT2和UGT3以及UGT4活性。合适的UGT1、UGT3 和UGT4序列在WO2015/007748的表1中进行了描述。

本发明的重组宿主可包含编码具有UGT2活性的额外多肽的重组核酸序列。也就是说，本发明的重组宿主可包含编码本发明的变体UGT2和本发明的一种或多种另外的不同变体或任何另一不同的UGT2的核酸序列。

使用编码UGT2_1b、UGT2_2b、UGT2_3b、UGT2_4b、UGT2_5b、 UGT2_6b、UGT2_7b、UGT2_8b、UGT2_9b或UGT2_10b多肽(或如本文所述的相关多肽)的核酸序列可适用于改进rebA产生。

使用编码UGT2_7b多肽(或如本文所述的相关多肽)的核酸序列可适用于改进rebM的产生。

在本发明的重组宿主中，可上调宿主产生香叶基香叶基二磷酸(GGPP) 的能力。在本发明的上下文中上调意味着重组宿主比等同的非重组宿主产生更多的GGPP。

因此，本发明的重组宿主可包含编码羟甲基戊二酰基-辅酶A还原酶、法尼基-焦磷酸合成酶和香叶基香叶基二磷酸合酶的一个或多个核苷酸序列，由此微生物转化后的所述核苷酸序列赋予微生物产生提高水平的GGPP 的能力。因此，根据本发明的重组宿主可包含编码羟甲基戊二酰基-辅酶A 还原酶、法尼基-焦磷酸合成酶和香叶基香叶基二磷酸合酶中的一种或多种的一个或多个重组核酸序列。

因此，本发明的重组宿主可包含编码以下中的一种或多种的核酸序列：

具有羟甲基戊二酰基-辅酶A还原酶活性的多肽；

具有法尼基-焦磷酸合成酶活性的多肽；

具有香叶基香叶基二磷酸合酶活性的多肽。

如本文所定义的宿主或宿主细胞是适于遗传操作的生物体，以及可以适用于目标产物的工业生产的细胞密度培养的生物体。合适的宿主可以是微生物，例如可维持在发酵装置中的微生物。宿主细胞可以是在自然界中发现的宿主细胞或源自遗传操作或传统诱变后的亲本宿主细胞的宿主细胞。

如本文所用的，重组宿主是用如本文定义的一个或多个核苷酸序列进行遗传修饰或转化/转染的宿主。所述一个或多个此类核苷酸序列的存在改变微生物产生二萜糖苷、特别是一种或多种甜菊醇糖苷的能力。非重组宿主，即未转化/转染或遗传修饰的宿主通常不包含一个或多个使得细胞能够产生二萜糖苷的核苷酸序列。因此，非重组宿主通常是不天然地产生二萜糖苷的宿主，但是天然产生二萜或二萜糖苷并且已经根据本发明进行了修饰(且因此具有改变的产生二萜糖苷的能力)的宿主被认为是根据本发明的重组宿主。

特别地，可行的是选自由对映-柯巴基焦磷酸合酶、对映-贝壳杉烯合酶、对映-贝壳杉烯氧化酶和贝壳杉烯酸13-羟化酶、UGT、羟甲基戊二酰基-辅酶A还原酶、法尼基-焦磷酸合成酶、香叶基香叶基二磷酸合酶和NADPH- 细胞色素p450还原酶组成的组的酶对宿主是天然的，并且用一个或多个编码这些酶的核苷酸序列转化对赋予宿主细胞产生二萜糖苷的能力而言可以不是必须的。根据本发明的优选宿主可以是能够天然产生GGPP(即以其非重组形式)的重组宿主。

宿主微生物产生二萜糖苷的进一步改进可通过传统菌株改良获得。

宿主细胞可以是原核、古细菌或真核宿主细胞。

原核宿主细胞可以是但不限于细菌宿主细胞。真核宿主细胞可以是但不限于酵母、真菌、变形虫、藻类、动物、昆虫宿主细胞。

真核宿主细胞可以是真菌宿主细胞。“真菌”包括真菌(Eumycotina)亚门的所有物种(Alexopoulos,C.J.,1962,在Introductory Mycology,John Wiley&Sons,Inc.(约翰威立出版有限公司),纽约)。因此，术语真菌包括丝状真菌和酵母等等。

“丝状真菌”在本文中定义为真核微生物，其包括真菌和卵菌亚门的所有丝状形式(如由Hawksworth等人，1995，同上所定义)。丝状真菌是以由壳多糖、纤维素、葡聚糖、壳聚糖、甘露聚糖以及其它复合多糖构成的菌丝壁为特征。营养体生长是通过菌丝延长，并且碳代谢是专性需氧的。丝状真菌菌株包括但不限于以下各项的菌株：枝顶孢属(Acremonium)、曲霉属(Aspergillus)、伞菌属(Agaricus)、短梗霉属(Aureobasidium)、隐球菌属(Cryptococcus)、棒囊壳属(Corynascus)、金孢子菌属(Chrysosporium)、网孢菌属(Filibasidium)、镰孢菌属(Fusarium)、腐质霉属(Humicola)、稻瘟病菌属(Magnaporthe)、红曲霉属(Monascus)、毛霉菌属(Mucor)、毁丝霉属(Myceliophthora)、被孢霉属(Mortierella)、新美鞭菌属 (Neocallimastix)、脉孢菌属(Neurospora)、拟青霉属(Paecilomyces)、青霉菌属(Penicillium)、梨囊鞭菌属(Piromyces)、平革菌属(Phanerochaete)、柄孢壳菌属(Podospora)、密孔菌属(Pycnoporus)、根霉菌属(Rhizopus)、裂褶菌属(Schizophyllum)、粪壳菌属(Sordaria)、踝节菌属(Talaromyces)、篮状菌属(Rasmsonia)、热子囊菌属(Thermoascus)、梭孢壳属(Thielavia)、弯颈霉属(Tolypocladium)、栓菌属(Trametes)以及木霉属(Trichoderma)。可充当宿主细胞的优选丝状真菌菌株属于以下物种：黑曲霉(Aspergillus niger)、米曲霉(Aspergillusoryzae)、烟曲霉(Aspergillus fumigatus)、产黄青霉(Penicillium chrysogenum)、桔青霉(Penicillium citrinum)、枝顶孢霉(Acremonium chrysogenum)、里氏木霉(Trichoderma reesei)、埃默森篮状菌(Rasamsonia emersonii)(先前称为埃默森踝节菌(Talaromyces emersonii))、酱油曲霉(Aspergillus sojae)、鲁克文金孢子菌(Chrysosporium lucknowense)、嗜热毁丝霉(Myceliophtora thermophyla)。用于比较转化和未转化细胞的发酵特征的参考宿主细胞包括例如黑曲霉CBS120.49、CBS 513.88；米曲霉ATCC16868、ATCC 20423、IF0 4177、ATCC 1011、ATCC 9576、ATCC14488-14491、ATCC11601、ATCC12892；烟曲霉AF293 (CBS101355)；产黄青霉CBS 455.95；桔青霉ATCC 38065；产黄青霉P2；枝顶孢霉ATCC 36225、ATCC 48272；里氏木霉ATCC 26921、ATCC 56765、 ATCC26921；酱油曲霉ATCC11906；鲁克文金孢子菌ATCC44006以及所有这些菌株的衍生株。作为丝状真菌宿主细胞特别优选的是黑曲霉CBS 513.88及其衍生株。

真核宿主细胞可以是酵母细胞。优选的酵母宿主细胞可选自以下属：酵母属(例如，酿酒酵母(S.cerevisiae)、贝酵母(S.bayanus)、巴斯德酵母(S.pastorianus)、卡尔斯伯酵母(S.carlsbergensis))、酒香酵母属 (Brettanomyces)、克鲁维酵母属(Kluyveromyces)、假丝酵母属(Candida) (例如，克鲁斯假丝酵母(C.krusei)、拉考夫假丝酵母(C.revkaufi)、铁红假丝酵母(C.pulcherrima)、热带假丝酵母(C.tropicalis)、产朊假丝酵母(C.utilis))、伊萨酵母属(Issatchenkia)(例如，东方伊萨酵母(I.orientalis))、毕赤酵母属(Pichia)(例如，巴斯德毕赤酵母(P.pastoris))、裂殖酵母属(Schizosaccharomyces)、汉逊酵母属(Hansenula)、克勒克酵母属(Kloeckera)、管囊酵母属(Pachysolen)、许旺酵母属(Schwanniomyces)、毛孢子菌属(Trichosporon)、耶氏酵母属(例如，解脂耶氏酵母(Y.lipolytica) (先前分类为解脂假丝酵母(Candidalipolytica)))、Yamadazyma。

原核宿主细胞可以是细菌宿主细胞。细菌宿主细胞可以是革兰氏阴性或革兰氏阳性细菌。细菌的实例包括但不限于，属于以下属的细菌：芽孢杆菌属(Bacillus)(例如，枯草芽孢杆菌(B.subtilis)、解淀粉芽孢杆菌(B. amyloliquefaciens)、地衣芽孢杆菌(B.licheniformis)、潘蒂芽孢杆菌(B. puntis)、巨大芽孢杆菌(B.megaterium)、嗜碱芽孢杆菌(B.halodurans)、短小芽孢杆菌(B.pumilus))、不动杆菌(Acinetobacter)、诺卡氏菌属 (Nocardia)、黄杆菌属(Xanthobacter)、埃希氏杆菌属(Escherichia)(例如，大肠杆菌(例如，菌株DH 1OB、Stbl2、DH5-α、DB3、DB3.1)、DB4、 DB5、JDP682和ccdA-over(例如，美国申请号09/518,188)))、链霉菌属 (Streptomyces)、欧文氏菌属(Erwinia)、克雷白氏杆菌属(Klebsiella)、沙雷氏菌属(Serratia)(粘质沙雷氏菌(S.marcessans))、假单胞菌属(Pseudomonas)(例如，铜绿假单胞菌(P.aeruginosa))、沙门氏菌属 (Salmonella)(例如，鼠伤寒沙门氏菌(S.typhimurium)、伤寒沙门氏菌(S. typhi))。细菌还包括但不限于光合细菌(例如，绿色非硫细菌(例如，绿弯菌属(Choroflexus)细菌(例如橙黄绿弯菌(C.aurantiacus))、绿丝菌属 (Chloronema)(例如，巨大绿丝菌(C.gigateum)))、绿色硫细菌(例如，绿菌属(Chlorobium)细菌(例如，泥生绿菌(C.limicola))、暗网菌属(Pelodictyon)(例如，微黄暗网菌(P.luteolum))、紫色硫细菌(例如，着色菌属(Chromatium)(例如，奥氏着色菌(C.okenii)))以及紫色非硫细菌(例如，红螺菌属(Rhodospirillum)(例如，深红红螺菌(R.rubrum))、红细菌属(Rhodobacter)(例如类球红细菌(R.sphaeroides)、荚膜红细菌(R.capsulatus))和红微菌属(Rhodomicrobium)细菌(例如万尼氏红微菌(R.vanellii)))。

宿主细胞可以是来自非微生物生物体的宿主细胞。此类细胞的实例包括但不限于昆虫细胞(例如，果蝇属(Drosophila)(例如，黑腹果蝇(D. melanogaster))、夜蛾属(Spodoptera)(例如，草地贪夜蛾(S.frugiperda) Sf9或Sf21细胞)和粉纹夜蛾属(Trichoplusa)(例如，High-Five细胞))；线虫细胞(例如，秀丽线虫(C.elegans)细胞)；禽类细胞；两栖动物细胞 (例如，非洲爪蟾(Xenopus laevis)细胞)；爬行动物细胞；以及哺乳动物细胞(例如NIH3T3、293、CHO、COS、VERO、C127、BHK、Per-C6、 Bowes黑色素瘤和HeLa细胞)。

本发明还提供了一种用于产生本发明的多肽的方法，所述方法包括：

(a)在有利于通过本发明的重组宿主细胞产生所述多肽的条件下培养所述重组宿主细胞，以及任选地

(b)回收所述多肽。

根据本发明的重组宿主可能够在本领域中已知的任何合适的碳源上生长，并且将其转化为糖基化二萜，例如，甜菊醇糖苷。重组宿主可能够直接转化植物生物质、纤维素、半纤维素、果胶、鼠李糖、半乳糖、岩藻糖、麦芽糖、麦芽糖糊精、核糖、核酮糖或淀粉、淀粉衍生物、蔗糖、乳糖和甘油。因此，优选的宿主表达酶如用于将纤维素转化成葡萄糖单体和将半纤维素转化成木糖和阿拉伯糖单体所需的纤维素酶(内切纤维素酶和外切纤维素酶)和半纤维素酶(例如内切和外切木聚糖酶、阿拉伯糖酶)，能够将果胶转化成葡萄糖醛酸和半乳糖醛酸的果胶酶或将淀粉转化成葡萄糖单体的淀粉酶。优选地，宿主能够转化选自由以下各项组成的组的碳源：葡萄糖、木糖、阿拉伯糖、蔗糖、乳糖和甘油。宿主细胞可例如是WO03/062430、 WO06/009434、EP1499708B1、WO2006096130或WO04/099381中所描述的真核宿主细胞。

因此，另一方面，本发明还提供了一种用于制备糖基化二萜如甜菊醇糖苷的方法，所述方法包括发酵本发明的重组宿主，所述重组宿主能够在合适的发酵培养基中产生至少一种糖基化二萜；以及任选地回收所述糖基化二萜。

糖基化萜烯(例如甜菊醇糖苷)可以是甜菊醇-19-单糖苷、甜菊醇-19- 双糖苷、甜菊醇-19-三糖苷、甜菊醇-13-单糖苷、甜茶苷、13-[(β-D-吡喃葡萄糖基)氧基)贝壳杉-16-烯-18-酸2-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖基酯、甜菊双糖苷、甜菊苷、莱鲍迪甙E、莱鲍迪甙B、莱鲍迪甙A、莱鲍迪甙D或莱鲍迪甙M。因此，本发明提供了一种用于产生一种或多种此类甜菊醇糖苷的方法。

在用于产生糖基化二萜的方法中使用的发酵培养基可以是允许特定真核宿主细胞生长的任何合适的发酵培养基。发酵培养基的基本要素是本领域的技术人员已知的，并且可适用于所选择的宿主细胞。

优选地，发酵培养基包含选自由以下各项组成的组的碳源：植物生物质、纤维素、半纤维素、果胶、鼠李糖、半乳糖、岩藻糖、果糖、麦芽糖、麦芽糖糊精、核糖、核酮糖或淀粉、淀粉衍生物、蔗糖、乳糖、脂肪酸、甘油三酯和甘油。优选地，发酵培养基还包含氮源，如尿素；或铵盐，如硫酸铵、氯化铵、硝酸铵或磷酸铵。

根据本发明的发酵方法可以分批、分批补料或连续模式进行。也可应用单独的水解和发酵(SHF)方法或同时糖化和发酵(SSF)方法。这些发酵方法模式的组合对于最佳生产率来说也可以是可行的。如果在发酵方法中使用淀粉、纤维素、半纤维素或果胶作为碳源，则SSF方法可以是特别有吸引力的，其中可需要添加水解酶如纤维素酶、半纤维素酶或果胶酶以水解底物。

在用于制备糖基化二萜的方法中使用的重组宿主可以是如上文所定义的任何合适的重组宿主。在所述方法中使用根据本发明的重组真核重组宿主可以是有利的，因为大多数真核细胞不需要用于繁殖的无菌条件并且对噬菌体感染不敏感。此外，真核宿主细胞可在低pH下生长以防止细菌污染。

根据本发明的重组宿主可以是兼性厌氧微生物。兼性厌氧重组宿主可以需氧方式繁殖至高细胞浓度。然后可在高细胞密度下进行这种厌氧阶段，这显著地降低了所需的发酵体积并且可使需氧微生物污染的风险最小化。

用于产生根据本发明的糖基化二萜的发酵方法可以是需氧或厌氧发酵方法。

厌氧发酵方法可在本文中定义为在不存在氧的情况下运行或者基本上不消耗氧(优选小于5、2.5或1mmol/L/h)，并且其中有机分子充当电子供体和电子受体两者的发酵方法。根据本发明的发酵方法也可首先在需氧条件下运行，且随后在厌氧条件下运行。

发酵方法也可在限氧或微需氧条件下进行。或者，发酵方法可首先在需氧条件下运行，且随后在限氧条件下运行。限氧发酵方法是其中氧消耗受到从气体到液体的氧传递的限制的过程。氧限制的程度由进入气流的量和组成以及所用发酵设备的实际混合/传质特性决定。

在根据本发明的方法中产生糖基化二萜可在宿主细胞的生长阶段期间、固定(稳定状态)阶段期间或在两个阶段期间发生。在不同的温度下运行发酵方法可以是可行的。

用于产生糖基化二萜的方法可在对于重组宿主来说最佳的温度下进行。对于每种转化的重组宿主而言，最佳生长温度可不同并且是本领域的技术人员已知的。最佳温度可高于野生型生物的最适温度以在非无菌条件下在最低感染敏感性和最低冷却成本的条件下有效生长生物体。或者，所述方法可在对于重组宿主的生长来说不是最佳的温度下进行。

用于产生根据本发明的糖基化二萜的方法可在任何合适的pH值下进行。如果重组宿主是酵母，则发酵培养基中的pH优选具有低于6、优选低于5.5、优选低于5、优选低于4.5、优选低于4、优选低于pH 3.5或低于 pH 3.0或低于pH 2.5、优选高于pH 2的值。在这些低pH值下进行发酵的优点是可防止发酵培养基中污染细菌的生长。

这种方法可在工业规模上进行。这种方法的产物是一种或多种糖基化二萜，如一种或多种甜菊醇糖苷，例如13-[(β-D-吡喃葡萄糖基)氧基) 贝壳杉-16-烯-18-酸2-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖基酯、甜菊双糖苷、甜菊苷、莱鲍迪甙E、莱鲍迪甙B、莱鲍迪甙A、莱鲍迪甙D或莱鲍迪甙M中的一种或多种。

从发酵培养基中回收糖基化二萜可通过本领域已知的方法进行，例如通过蒸馏、真空萃取、溶剂萃取或蒸发。

在用于产生根据本发明的糖基化二萜的方法中，实现高于5mg/l发酵液、优选高于10mg/l、优选高于20mg/l、优选高于30mg/l发酵液、优选高于40mg/l、更优选高于50mg/l、优选高于60mg/l、优选高于70、优选高于80mg/l、优选高于100mg/l、优选高于1g/l、优选高于5g/l、优选高于10g/l、例如高于20g/l的浓度可以是可行的，但通常达约200g/l、如达约150g/l、如达约100g/l、例如达约70g/l的浓度。此类浓度可以是总发酵液或上清液的浓度。

本发明还提供了一种包含能够通过本发明的用于制备糖基化二萜的方法获得的糖基化二萜的发酵液。

在微生物中表达一种或多种糖基化二萜的情况下，可需要处理此类细胞以释放它们。优选地，在细胞外产生至少一种糖基化二萜，如甜菊醇糖苷，例如rebA或rebM。

本发明还提供了一种通过根据本发明的用于制备糖基化二萜的方法获得的或能够从本发明的发酵液获得的糖基化二萜。这种糖基化二萜可以是非天然存在的糖基化二萜，也就是说不在植物中产生的糖基化二萜。

本发明还提供了一种包含能够通过本发明的用于制备糖基化二萜的方法获得或能够从本发明的发酵液获得的两种或更多种糖基化二萜的组合物。在这种组合物中，一种或多种糖基化二萜可以是非天然存在的糖基化二萜，也就是说不在植物中产生的糖基化二萜。

此外，本发明提供了一种用于将第一糖基化二萜转化为第二糖基化二萜的方法，所述方法包括：

–从而将所述第一糖基化二萜转化为所述第二糖基化二萜。

在这种方法中，第二糖基化二萜可以是甜菊醇-19-双糖苷、甜菊双糖苷、甜菊苷、RebE、RebD或13-[(β-D-吡喃葡萄糖基)氧基)贝壳杉-16-烯-18- 酸2-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖基酯。

在这种方法中，第一糖基化二萜可以是甜菊醇-13-单糖苷、甜菊醇-19- 单糖苷、甜茶苷、甜菊苷、莱鲍迪甙A或13-[(β-D-吡喃葡萄糖基)氧基) 贝壳杉-16-烯-18-酸2-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖基酯，并且第二糖基化二萜是甜菊醇-19-双糖苷、甜菊双糖苷、甜菊苷、RebE、RebD或 13-[(β-D-吡喃葡萄糖基)氧基)贝壳杉-16-烯-18-酸2-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖基酯。

这些是与通过本发明的具有UGT2活性的多肽催化的反应相关的第一和第二甜菊醇糖苷。

也就是说，本发明涉及一种生物转变或生物转化方法。

通过根据本发明的发酵方法产生的甜菊醇糖苷或组合物可用于对于此类化合物来说已知的任何应用中。特别地，它们可例如用作甜味剂，例如用于食品或饮料中。因此，根据本发明，提供了一种包含本发明的糖基化二萜如甜菊醇糖苷或组合物的食品、饲料或饮料。

例如，本发明的糖基化二萜或组合物可被配制成软饮料、配制为桌面甜味剂、口香糖、乳制品如酸奶(例如原味酸奶)、蛋糕、谷物或基于谷类的食物、营养食品、药物、食用凝胶、糖果产品、化妆品、牙膏或其它口腔组合物等。此外，本发明的糖基化二萜或组合物可用作甜味剂，不仅用于饮料、食品和其它专门用于人消费的产品，而且用于具有改进的特性的动物饲料和草料中。

因此，本发明尤其提供了一种包含根据本发明的方法制备的二萜或糖基化二萜的食品、饲料或饮料。

在食品、饮料、药物、化妆品、桌面产品、口香糖的制造过程中，可使用诸如混合、捏合、溶解、酸洗、渗透、渗滤、喷洒、雾化、灌注和其它方法的常规方法。

本发明的糖基化二萜例如甜菊醇糖苷或组合物可以干或液体的形式使用。它可在食品热处理之前或之后加入。甜味剂的量取决于使用目的。它可单独添加或与其它化合物组合添加。

根据本发明的方法产生的化合物可与一种或多种其它非热量或热量甜味剂掺混。这种掺混可用于改进风味或时间特征或稳定性。广泛范围的非热量和热量甜味剂二者可适用于与本发明的糖基化二萜或组合物掺混。例如，非热量甜味剂如罗汉果苷、莫纳甜、阿斯巴甜、安赛蜜盐、环磺酸盐、三氯蔗糖、糖精盐或赤藓糖醇。适用于与本发明的糖基化二萜或组合物掺混的热量甜味剂包括糖醇和碳水化合物如蔗糖、葡萄糖、果糖和HFCS。还可使用甜味氨基酸，如甘氨酸、丙氨酸或丝氨酸。

本发明的糖基化二萜或组合物可与甜味剂抑制剂如天然甜味剂抑制剂组合使用。它可与鲜味增强剂如氨基酸或其盐组合。

本发明的糖基化二萜或组合物可与多元醇或糖醇、碳水化合物、生理活性物质或功能成分(例如类胡萝卜素、膳食纤维、脂肪酸、皂苷、抗氧化剂、营养食品、类黄酮、异硫氰酸酯、苯酚、植物甾醇或甾烷醇(植物甾醇和植物甾烷醇)、多元醇、益生元、益生菌、植物雌激素、大豆蛋白、硫化物/硫醇、氨基酸、蛋白质、维生素、矿物质和/或基于健康益处如心血管、降胆固醇或抗炎分类的物质组合。

具有本发明的糖基化二萜或组合物的组合物可包括调味剂、芳香组分、核苷酸、有机酸、有机酸盐、无机酸、苦味化合物、蛋白质或蛋白质水解产物、表面活性剂、类黄酮、收敛剂化合物、维生素、膳食纤维、抗氧化剂、脂肪酸和/或盐。

本发明的糖基化二萜或组合物可作为高强度甜味剂应用，以产生具有改进的味道特征的零卡路里、低卡路里或糖尿病人用饮料和食品。它也可用于不能使用糖的饮料、食品、药物和其他产品中。

此外，本发明的糖基化二萜或组合物可用作甜味剂，不仅用于饮料、食品和其它专门用于人消费的产品，而且用于具有改进的特性的动物饲料和草料中。

本发明的糖基化二萜或组合物可用作甜味化合物的产品的实例可以是酒精饮料，如伏特加酒、葡萄酒、啤酒、烈酒、清酒等；天然果汁、提神饮料、碳酸软饮料、减肥饮料、零卡路里饮料、低卡路里饮料和食物、酸奶饮料、速溶果汁、速溶咖啡、粉末型速溶饮料、罐装产品、糖浆、发酵大豆酱、酱油、醋、调味品、蛋黄酱、番茄酱、咖喱、汤、速食肉汤、酱油粉、醋粉、多种类型的饼干、香米饼、咸饼干、面包、巧克力、焦糖、糖果、口香糖、果冻、布丁、蜜饯和腌菜、鲜奶油、果酱、橘子酱、糖花膏、奶粉、冰淇淋、冰糕、包装在瓶中的蔬菜和水果、罐装和煮熟的豆类、在甜味酱中煮熟的肉和食物、农业蔬菜食品、海鲜、火腿、香肠、鱼火腿、鱼香肠、鱼酱、油炸鱼制品、干制海产品、冷冻食品、腌渍海带、腊肉、烟草、医药产品等。原则上它可具有无限应用。

甜味组合物包含饮料，其非限制性实例包括非碳酸化和碳酸饮料，如可乐、姜汁汽水、根汁汽水、苹果汁、水果味软饮料(例如柑橘味软饮料，如柠檬莱姆或橙汁)、软饮料粉等；来自水果或蔬菜的果汁、包括榨汁等的果汁、含有果粒的果汁、水果饮料、果汁饮料、含果汁的饮料、具有水果调味料的饮料、蔬菜汁、含蔬菜的汁以及含水果和蔬菜的混合果汁；运动饮料、能量饮料、接近水的饮料等(例如具有天然或合成调味剂的水)；茶类或喜欢型饮料如咖啡、可可、红茶、绿茶、乌龙茶等；含乳成分饮料如乳饮料、含乳成分咖啡、牛奶咖啡、奶茶、果奶饮料、饮用酸奶、乳酸菌饮料等；以及乳制品。

通常，甜味组合物中存在的甜味剂的量取决于甜味组合物的具体类型及其所需的甜度而广泛变化。本领域的普通技术人员可容易确定加入到甜味组合物中的甜味剂的适当量。

本发明的糖基化二萜或组合物可以干或液体形式使用。它可在食品热处理之前或之后加入。甜味剂的量取决于使用目的。它可单独添加或与其它化合物组合添加。

因此，本发明的组合物可通过本领域的技术人员已知的提供成分的均匀或均质混合物的任何方法来制备。这些方法包括干混、喷雾干燥、团聚、湿法制粒、压实、共结晶等。

呈固体形式时，本发明的糖基化二萜或组合物可以适于递送到待甜化的食物中的任何形式提供给消费者，所述形式包括小袋、小包、散装袋或盒、方块、片剂、喷雾或可溶解的条。所述组合物可以单位剂量或散装形式递送。

对于液体甜味剂体系和组合物而言，应开发方便范围的流体、半流体、糊状和膏状形式、使用任何形状或形式的适当包装材料的适当包装，其便于携带或分配或储存或运输含有任何上述甜味剂产品或上述产品的组合的任何组合。

所述组合物可包含多种填充剂、功能成分、着色剂、调味剂。

术语“序列同源性”或“序列同一性”在本文中可互换使用。出于本发明的目的，在此定义为了确定两个氨基酸序列或两个核酸序列的序列同源性或序列同一性的百分比，出于最佳比较目的比对所述序列。为了优化两个序列之间的比对，可在比较的两个序列中的任一个中引入空位。这种比对可在所比较的序列的全长上进行。或者，比对可在更短的长度上进行，例如在约20、约50、约100或更多个核酸/碱基或氨基酸上进行。序列同一性是在所报告的比对区域上两个序列之间的相同匹配的百分比。

两个序列之间的序列比较和序列同一性百分比的确定可使用数学算法来完成。本领域的技术人员将意识到以下事实：若干不同的计算机程序可用于比对两个序列并确定两个序列之间的同一性(Kruskal,J.B.(1983)An overview of sequence comparisonIn D.Sankoff and J.B.Kruskal,(编辑), Time warps,string edits andmacromolecules:the theory and practice of sequence comparison,第1-44页AddisonWesley)。两个氨基酸序列之间或两个核苷酸序列之间的序列同一性百分比可使用用于两个序列的比对的 Needleman和Wunsch算法来确定(Needleman,S.B.和Wunsch,C.D.(1970)J.Mol.Biol.48,443-453)。氨基酸序列和核苷酸序列两者均可通过所述算法进行比对。Needleman-Wunsch算法已在计算机程序NEEDLE中实现。出于本发明的目的，使用了来自EMBOSS包的NEEDLE程序(2.8.0版或更高版本,EMBOSS:The European Molecular BiologyOpen Software Suite (2000)Rice,P.Longden,I.和Bleasby,A.Trends in Genetics 16,(6)第 276-277页,http://emboss.bioinformatics.nl/)。对于蛋白质序列而言，EBLOSUM62用于取代矩阵。对于核苷酸序列而言，使用EDNAFULL。所使用的任选参数是空位开放罚分为10，以及空位延伸罚分为0.5。技术人员将理解的是，所有这些不同的参数将产生稍微不同的结果，但是当使用不同的算法时，两个序列的总体同一性百分比没有显著改变。

在通过如上所述的程序NEEDLE进行比对后，查询序列与本发明的序列之间的序列同一性的百分比计算如下：在两个序列中显示相同氨基酸或相同核苷酸的比对中的相应位置的数目除以在减去比对中的总空位数后比对的总长度。如本文定义的同一性可通过使用NOBRIEF选项从NEEDLE 获得，并且在程序的输出中标记为“最长同一性”。

本发明的核酸和蛋白质序列可进一步用作“查询序列”以进行针对公共数据库的检索，以例如鉴定其它家族成员或相关序列。此类搜索可使用 Altschul等人(1990)J.Mol.Biol.215:403—10的NBLAST和XBLAST 程序(2.0版)进行。BLAST核苷酸搜索可用NBLAST程序(得分＝100、字长＝12)来进行，以获得与本发明的核酸分子同源的核苷酸序列。BLAST 蛋白质搜索可用XBLAST程序(得分＝50、字长＝3)来进行，以获得与本发明的蛋白分子同源的氨基酸序列。为了获得用于比较目的的空位比对，可利用如在Altschul等人,(1997)Nucleic Acids Res.25(17):3389-3402 中描述的空位BLAST。当利用BLAST和空位BLAST程序时，可使用相应程序(例如XBLAST和NBLAST)的默认参数。参见美国国家生物技术信息中心http://www.ncbi.nlm.nih.gov/的主页。

本发明的一些实施方案：

1.一种重组宿主，其包含编码多肽的重组核酸序列，所述多肽：

a.与SEQ ID NO:1中列出的氨基酸序列具有至少约85％同一性；

b.与SEQ ID NO:3中列出的氨基酸序列具有至少约85％同一性；

c.与SEQ ID NO:6中列出的氨基酸序列具有至少约85％同一性；

d.与SEQ ID NO:9中列出的氨基酸序列具有至少约85％同一性；

e.与SEQ ID NO:11中列出的氨基酸序列具有至少约85％同一性；

f.与SEQ ID NO:14中列出的氨基酸序列具有至少约85％同一性；

g.与SEQ ID NO:17中列出的氨基酸序列具有至少约85％同一性；

h.与SEQ ID NO:20中列出的氨基酸序列具有至少约85％同一性；

i.与SEQ ID NO:22中列出的氨基酸序列具有至少约85％同一性；或

j.与SEQ ID NO:25中列出的氨基酸序列具有至少约85％同一性。

2.根据实施方案1所述的重组宿主，其能够产生糖基化二萜，如甜菊醇糖苷。

3.根据实施方案1或2所述的重组宿主，其包含一个或多个重组核苷酸序列，所述重组核苷酸序列编码：

具有对映-柯巴基焦磷酸合酶活性的多肽；

具有对映-贝壳杉烯合酶活性的多肽；

具有对映-贝壳杉烯氧化酶活性的多肽；以及

具有贝壳杉烯酸13-羟化酶活性的多肽。

4.根据前述实施方案中任一项所述的重组宿主，其包含重组核酸序列，所述重组核酸序列编码具有NADPH-细胞色素p450还原酶活性的多肽。

5.根据前述实施方案中任一项所述的重组宿主，其包含编码以下中的一种或多种的重组核酸序列：

(i)具有UGT74G1(UGT3)活性的多肽；

(ii)具有UGT85C2(UGT1)活性的多肽；以及

(iii)具有UGT76G1(UGT4)活性的多肽。

6.根据前述实施方案中任一项所述的重组宿主，其包含重组核酸序列，所述重组核酸序列编码具有UGT2活性的额外多肽。

7.根据前述实施方案中任一项所述的重组宿主，其中所述宿主属于以下属中的一种：酵母属、曲霉属、毕赤酵母属、克鲁维酵母属、假丝酵母属、汉逊酵母属、腐质霉属、伊萨酵母属、毛孢子菌属、酒香酵母属、管囊酵母属、耶氏酵母属、Yamadazyma或埃希氏杆菌属。

8.根据实施方案7所述的重组宿主，其中所述重组宿主是酿酒酵母细胞、解脂耶氏酵母细胞、克鲁斯假丝酵母细胞、东方伊萨酵母细胞或大肠杆菌细胞。

9.根据前述实施方案中任一项所述的重组宿主，其中所述宿主产生香叶基香叶基二磷酸(GGPP)的能力被上调。

10.根据前述实施方案中任一项所述的重组宿主，其包含一个或多个重组核酸序列，所述重组核酸序列编码羟甲基戊二酰基-辅酶A还原酶、法尼基-焦磷酸合成酶和香叶基香叶基二磷酸合酶。

11.根据前述实施方案中任一项所述的重组宿主，其包含核酸序列，所述核酸序列编码以下中的一种或多种：

具有羟甲基戊二酰基-辅酶A还原酶活性的多肽；

具有法尼基-焦磷酸合成酶活性的多肽；

具有香叶基香叶基二磷酸合酶活性的多肽。

12.一种用于制备糖基化二萜的方法，所述方法包括在合适的发酵培养基中发酵根据实施方案2至11中任一项所述的重组宿主，并且任选地回收所述糖基化二萜。

13.根据实施方案12中任一项所述的方法，其用于制备糖基化二萜，其中所述方法以工业规模进行。

14.一种发酵液，其包含能够通过根据实施方案12或13所述的方法获得的糖基化二萜。

15.一种糖基化二萜，其通过根据实施方案12或13所述的方法获得或能够从根据实施方案14所述的发酵液获得。

16.一种组合物，其包含通过根据实施方案12或13所述的方法获得或能够从根据实施方案14所述的发酵液获得的两种或更多种糖基化二萜。

17.一种食品、饲料或饮料，其包含根据实施方案15的糖基化二萜或根据实施方案16的组合物。

18.一种用于将第一糖基化二萜转化为第二糖基化二萜的方法，所述方法包括：

–使所述第一糖基化二萜与根据实施方案1至11中任一项所述的重组宿主、源自这种重组宿主的无细胞提取物或源自上述任一者的酶制剂接触；

–从而将所述第一糖基化二萜转化为所述第二糖基化二萜。

19.根据实施方案18所述的方法，其中所述第二糖基化二萜是甜菊醇 -19-双糖苷、甜菊双糖苷、甜菊苷、RebE、RebD或13-[(β-D-吡喃葡萄糖基)氧基)贝壳杉-16-烯-18-酸2-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖基酯。 20.根据权利要求19所述的方法，其中所述第一糖基化二萜是甜菊醇 -13-单糖苷、甜菊醇-19-单糖苷、甜茶苷、甜菊苷、莱鲍迪甙A或13-[(β-D- 吡喃葡萄糖基)氧基)贝壳杉-16-烯-18-酸2-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖基酯，并且所述第二糖基化二萜是甜菊醇-19-双糖苷、甜菊双糖苷、甜菊苷、RebE、RebD或13-[(β-D-吡喃葡萄糖基)氧基)贝壳杉-16-烯-18- 酸2-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖基酯。

21.一种具有UGT2活性的多肽，其中所述多肽选自由以下各项组成的组：

(d)由包含与SEQ ID NO:2、4、5、7、8、10、12、13、15、16、18、 19、21、23、24或26中的任一个中的多肽编码序列具有至少30％序列同一性的多核苷酸序列的多核苷酸编码的多肽；或

(f)由优选在至少低严格性条件下与同SEQ ID NO:2、4、5、7、8、 10、12、13、15、16、18、19、21、23、24或26中的任一个具有至少30％序列同一性的多核苷酸的互补链杂交的多核苷酸编码的多肽；或

(g)在(a)、(b)、(c)、(d)、(e)或(f)中定义的多肽的片段。

22.根据实施方案21的多肽，其包含具有与SEQ ID NO:1、3、6、9、 11、14、17、20、22或25中的任一个具有至少约86％序列同一性、至少约87％、至少约88％、至少约89％、至少约90％、至少约91％、至少约92％、至少约93％、至少约94％、至少约95％、至少约96％、至少约97％、至少约98％、至少约99％序列同一性的氨基酸序列的多肽。

23.一种多核苷酸序列，其编码根据实施方案21或22所述的多肽。

24.根据实施方案23所述的多核苷酸序列，其中所述多核苷酸序列选自由以下各项组成的组：

(b)在优选至少低严格性条件下与SEQ ID NO:2、4、5、7、8、10、 12、13、15、16、18、19、21、23、24或26中的任一个的互补链杂交的多核苷酸序列；或

(c)在优选至少低严格性条件下与同SEQ ID NO:2、4、5、7、8、10、 12、13、15、16、18、19、21、23、24或26中的任一个具有至少30％序列同一性的多核苷酸的互补链杂交的多核苷酸序列；

25.根据实施方案5所述的多核苷酸序列，其与SEQ ID NO:2、4、5、7、 8、10、12、13、15、16、18、19、21、23、24或26中的任一个具有至少 60％、优选至少70％、更优选至少80％、最优选至少90％、最优选至少93％、最优选至少约95％、最优选至少约96％、最优选至少约97％、甚至最优选至少约98％以及甚至更优选至少99％的序列同一性。

26.一种核酸构建体，其包含如实施方案23至25中任一项所述的多核苷酸序列。

27.根据实施方案26所述的核酸构建体，其是表达载体，其中根据实施方案23至25中任一项所述的多核苷酸序列与至少一个用于在宿主细胞中表达所述多核苷酸序列的控制序列可操作地连接。

28.一种产生如实施方案21或22所述的多肽的方法，所述方法包括：

(a)在有利于通过根据实施方案1的宿主细胞产生所述多肽的条件下培养所述宿主细胞，并且任选地

(b)回收所述多肽。

本文对作为现有技术给出的专利文件或其他事项的引用不应被视为承认所述文件或事项是已知的或者其所含的信息是在任何权利要求的优先权日的公知常识的一部分。

本文列出的每个参考文献的公开内容均以引用的方式整体并入本文。

通过以下实施例进一步说明本发明：

实施例

实施例1：酿酒酵母中ERG20、BTS1和tHMG的过度表达

对于ERG20、BTS1tHMG1的过度表达而言，使用W02013/076280中描述的技术将表达盒设计为整合在一个基因座中。为了扩增整合基因座的 5'和3'整合侧翼，使用了来自CEN.PK酵母菌株(van Dijken等人.Enzyme and Microbial Technology 26(2000)706-714)的合适的引物和基因组 DNA。不同的基因在DNA2.0作为盒(含有同源序列、启动子、基因、终止子、同源序列)订购。这些盒中的基因侧接组成型启动子和终止子。参见表1。将来自DNA2.0的含有ERG20、tHMG1和BTS1盒的质粒DNA 溶解至100ng/μl的浓度。在50μl PCR混合物中，20ng模板与20pmol的引物一起使用。将材料溶解至0.5μg/μl的浓度。

表1：过度表达构建体的组成

启动子	ORF	终止子
			Eno2(SEQ ID NO:30)	ERG20(SEQ ID NO:31)	Adh1(SEQ ID NO:32)
Fba1(SEQ ID NO:33)	tHMG1(SEQ ID NO:34)	Adh2(SEQ ID NO:35)
			Tef1(SEQ ID NO:36)	BTS1(SEQ ID NO:37)	Gmp1(SEQ ID NO:38)

为了扩增选择标记，使用了pUG7-EcoRV构建体(图1)和合适的引物。使用Zymoclean凝胶DNA回收试剂盒(ZymoResearch)从凝胶中纯化 KanMX片段。将酵母菌株Cen.PK113-3C用表2中所列的片段转化。

表2：用于转化ERG20、tHMG1和BTS1的DNA片段

片段
	5’YPRcTau3
ERG20盒
	tHMG1盒
KanMX盒
	BTS1盒
3’YPRcTau3

在30℃下在YEPhD(酵母提取物植物蛋白胨葡萄糖；来自BD的BBL 植物蛋白胨)中转化和恢复2.5小时后，将细胞与200μg/ml G418(Sigma) 一起接种在YEPhD琼脂上。将板在30℃下孵育4天。通过诊断PCR和测序确定正确的整合。用蛋白质上LC/MS证实过度表达。图2中示出了 ERG20、tHMG1和BTS1的组装示意图。此菌株被命名为STV002。

此菌株中CRE-重组酶的表达导致KanMX标记的外重组。用诊断PCR 确定ERG20、tHMG和BTS1的存在和正确外重组。

实施例2.Erg9的敲低

为了降低Erg9的表达，设计并使用了Erg9敲低构建体，所述构建体含有修饰的3'端，其继续进入驱动TRP1表达的TRP1启动子。

将含有Erg9-KD片段的构建体转化到到大肠杆菌TOP10细胞中。将转化体在2PY(2次植物蛋白胨酵母提取物)、sAMP培养基中生长。将质粒 DNA用QIAprep旋转小量制备试剂盒(Qiagen)分离并用SalI-HF(New England Biolabs)消化。为了浓缩，将DNA用乙醇沉淀。将所述片段转化到酿酒酵母中，并将菌落接种在无色氨酸的无机培养基(Verduyn等人,1992. Yeast 8:501-517)琼脂板上。通过诊断PCR和测序证实Erg9-KD构建体的正确整合。进行的Erg9-KD构建体的转化的示意图在图3中示出。所述菌株被命名为STV003。

实施例3.UGT21a的过度表达

对于UGT2_1a的过度表达，使用如专利申请号W02013/076280和 WO2013/144257中所描述的技术。将UGT2_1a在DNA2.0作为盒(含有同源序列、启动子、基因、终止子、同源序列)订购。关于细节，参见表3。为了获得含有标记和Cre-重组酶的片段，使用如专利申请号WO2013/135728中所描述的技术。使用赋予对诺尔丝菌素的抗性的NAT标记用于选择。

表3：过度表达构建体的组成

合适的引物用于扩增。为了扩增整合基因座的5'和3'整合侧翼，使用了来自CEN.PK酵母菌株的合适的引物和基因组DNA。

用表4中列出的片段转化酿酒酵母酵母菌株STV003，并将转化混合物接种在含有50μg/ml诺尔丝菌素(来自Jena Bioscience的Lexy NTC)的 YEPhD琼脂板上。

表4：用于转化UGT2 1a的DNA片段

片段
	5’Chr09.01
UGT2_1a盒
	NAT-CR
RE
	3’Chr09.01

CRE重组酶的表达通过半乳糖的存在活化。为了诱导CRE重组酶的表达，将转化体在YEPh半乳糖培养基上重新划线。这导致位于lox位点之间的标记的外重组。通过诊断PCR证实了UGT2_1a的正确整合和NAT标记的外重组。所得菌株被命名为STV004。进行的UGT2_1a构建体的转化的示意图在图4中示出。

实施例4.RebA的产生途径的过度表达:CPS、KS、KO、KAH、CPR、UGT1、UGT3和UGT4。

使用在专利申请号WO2013/076280和WO2013/144257中描述的技术将导致RebA产生的所有途径基因设计为整合在一个基因座中。为了扩增整合基因座的5'和3'整合侧翼，使用了来自CEN.PK酵母菌株的合适的引物和基因组DNA。不同的基因在DNA2.0作为盒(含有同源序列、启动子、基因、终止子、同源序列)订购(参见表5总述)。将来自DNA2.0的DNA溶解至100ng/μl。将此储备溶液进一步稀释至5ng/μl，其中1μl用于50 μl-PCR混合物中。所述反应物含有25pmol的每种引物。在扩增后，用 NucleoSpin 96PCR清洁试剂盒(Macherey-Nagel)纯化DNA，或者使用乙醇沉淀浓缩。

表5用于RebA的产生途径的序列

将到RebA的途径的所有片段(标记和侧翼)(参见表6总述)转化到酿酒酵母菌株STV004中。在20℃下在YEPhD中过夜恢复后，将转化混合物接种在含有200μg/ml G418的YEPhD琼脂上。将这些在25℃下孵育3 天，并在室温下孵育一夜。

表6.用于转化CPS、KS、KO、KanMX、KAH、CPR、UGT1、UGT3和UGT4的DNA片段

片段
	5’INT1
CPS盒
	KS盒
KO盒
	KanMX盒
KAH盒
	CPR盒
UGT1盒
	UGT3盒
UGT4盒
	3’INT1

通过诊断PCR和序列分析(3500基因分析仪,Applied Biosystems)证实了正确的整合。序列反应用BigDye终止子v3.1循环测序试剂盒(Life Technologies)进行。每个反应(10μl)均含有50ng模板和3.2pmol引物。将产物通过乙醇/EDTA沉淀纯化，溶解在10μlHiDi甲酰胺中并施加到装置上。所述菌株被命名为STV006。从GGPP到RebA的途径如何整合到基因组中的示意图在图5中示出。表7列出了实施例1至5中使用的菌株。

表7.菌株列表

实施例5.STV006的KanMX选择标记的去除

为了去除菌株中存在的KanMX标记，将含有CRE重组酶的质粒pSH65 (图6)转化到STV006中。首先在含有20μg/ml腐草霉素(Invitrogen) 的YEPD上选择转化体，然后在YEP半乳糖培养基上重新划线以诱导CRE 重组酶表达。通过诊断PCR确定标记的正确外重组。在产生实验中证实了此无标记物菌株的RebA产生。STV006的无标记形式被称为STV008。

实施例6.通过NAT选择标记去除STV008中的UGT2 1a

为了去除位于STV008的Chr09.01基因座处的UGT2_1a，使用含有与 Chr09.01整合侧翼(图8)同源的额外50nt序列的引物，从质粒pUG7-NAT (图7)扩增了诺尔丝菌素选择(NAT)标记和周围的lox位点。将PCR 产物用NucleoSpin凝胶和PCR清洁试剂盒(Macherey-Nagel)纯化，并转化到STV008中。在含有50μg/ml诺尔丝菌素(来自Jena Bioscience的Lexy NTC)的YEPD上选择转化体。通过诊断PCR证实了NAT标记的正确整合和UGT2_1a的不存在。这种新的菌株被命名为STV009。

实施例7.STV009的Nat选择标记的去除

为了能够使用相同的整合基因座来测试UGT2变体，必须从菌株 STV009中去除NAT标记(图9)。因此，将位于质粒pSH65上的CRE重组酶转化到STV009中，并在含有20μg/ml腐草霉素的YEPD上选择转化体。将菌落在YEP半乳糖琼脂板上重新划线。将板在30℃下孵育。通过诊断PCR证实通过CRE重组酶去除NAT标记。在产生实验中，显示STV009 ΔNAT菌株与其亲本STV009积累相同量的甜茶苷。所述新的菌株被称为 STV053。

实施例8.Chr09.01基因座处UGT2基因变体的整合

将编码UGT2活性的不同基因变体(SEQ ID NO:4、7、10、12、15、 18、21、23和28)通过使用用于重组的含有50bp侧翼同源区段的若干单独的DNA片段单独地整合到Chr09.01基因座中(图10)。

用来自CEN.PK酵母菌株(van Dijken等.Enzyme and Microbial Technology 26(2000)706-714)的基因组DNA的合适引物扩增5'-和 3'-Chr09.01整合侧翼。对于5'-侧翼而言，反向引物含有与待使用的启动子序列同源的延伸的50bp序列，即ScENO1启动子(SEQID NO:60)。3'- 侧翼的正向引物含有50bp接头延伸。

从pUG7-EcoRV构建体扩增KanMX选择标记。正向引物含有与 KIGAP1(SEQ ID NO:61)终止子同源的另外50bp序列。反向引物也具有 50bp接头延伸。

不同的UGT2基因变体在SGI-DNA订购。它们的开放阅读框的上游侧接50bp的pScENO1启动子(SEQ ID NO:60)，以及下游侧接50bp的 Klgap1T终止子(SEQ ID NO:61)。通过使用与这些启动子和终止子序列退火的引物，从SGI-DNA构建体扩增了基因。

使用NucleoSpin 96PCR清洁试剂盒(Macherey-Nagel)纯化PCR产物。对于待测试的每种UGT2变体，组合了等摩尔量的5'-Chr09.01侧翼、ENO1 启动子、UGT2基因、KIGAP1终止子、KanMX选择标记和3'-Chr09.01侧翼。制备含有UGT2_1a的一种另外的混合物。将这些混合物转化到STV053 中并接种在含有200μg/ml G418的YEPD上。

对于每种UGT2变体而言，在产生实验中测试了若干重复转化体。

实施例9.用酿酒酵母产生莱鲍迪甙A

将预培养物与来自YEPD琼脂的菌落物质一起接种。将预培养物在具有葡萄糖作为碳源的200μl无机培养基中生长。将预培养物在27℃、750 rpm和80％湿度的Infors孵育箱中孵育72小时。

使用40μl预培养物来接种具有葡萄糖作为碳源的2.5ml无机培养基。将主要培养物在27℃、550rpm、80％湿度下在Infors孵育箱中孵育120小时。通过来回移液将培养物良好均化，并将1ml培养物转移到96孔板中。将96孔板在95℃下在水浴中孵育15分钟并冷却至室温。向每个孔中添加 0.5ml乙腈，并通过来回移液均化。通过在3000xg下离心10分钟来使细胞碎片沉淀。将上清液在33％乙腈中稀释200倍。

使用LC/MS分析样品的RebA。使用RebA(RV0141-94,DAE Pyung Co. Ltd.)作为标准。发现与含有UGT2_1a的菌株相比，如所描述的具有特定 UGT2基因变体的菌株产生更高的RebA滴度，如表8和图11中所示。

表8：表达UGT2变体酶的酵母属菌株中的莱鲍迪甙A产生

UGT2变体	RebA(mg/L)
		UGT2_1b	30,8
UGT2_2b	38,4
		UGT2_3b	40,6
UGT2_4b	26,5
		UGT2_5b	41,8
UGT2_6b	28,1
		UGT2_7b	33,3
UGT2_8b	25,2
		UGT2_9b	26,7
UGT2_1a	25,0

实施例10：用酿酒酵母产生莱鲍迪甙M

使用40μl预培养物来接种具有葡萄糖作为碳源的2.5ml无机培养基。将主要培养物在27℃、550rpm、80％湿度下在Infors孵育箱中孵育120小时。通过来回移液将培养物良好均化，并将1ml培养物转移到96孔板中。将96孔板在95℃下在水浴中孵育15分钟并冷却至室温。向每个孔中添加0.5ml乙腈，并通过来回移液均化。通过在3000xg下离心10分钟来使细胞碎片沉淀。将上清液在33％乙腈中稀释200倍。

通过用配备有Acella LC和Waters Acquity UPLC BEH酰胺1.7μm 2.1*150mm柱的LTQ轨道阱(Thermo)分析的LC和MS来确认RebM的存在。用于分离的洗脱液是A：10mM于MilliQ水中的乙酸铵，B：乙腈，并且梯度以65％A开始，并且将此保持1.5分钟，然后在0.5分钟内增加至 95％B，并将此保持0.5分钟，之后在65％A下再生1.5分钟。流速是0.6ml/ 分钟，并且柱温保持在50C。以电喷雾负电离模式进行质谱分析，从m/z 100-1800以7500的分辨率进行扫描。Reb M在tr＝0.72分钟时洗脱，刚好在tr＝0.63时的reb D之后。Reb M的特征在于m/z 1289.5286的去质子化分子。能使用精确的质量分析来估计元素组成。

发现与含有UGT2_1a的菌株相比，如所描述的具有特定UGT2基因变体的菌株产生更高的RebM滴度，如图12和表9中所示。

表9.相较于UGT2 1a的百分比，表达UGT2变体酶的酵母属菌株中的莱鲍迪甙M产生

UGT2变体	RebM(相对于UGT2_1a)
		UGT2_7b	555
UGT2_9b	256
		UGT2_1a	100

实施例11：甜菊醇糖苷产生菌株ML14094(MAT-A谱系)的描述

将接合型MATA和MATB的两种解脂耶氏酵母菌株工程化以用于甜菊醇糖苷的产生。将这些菌株接合，二倍体孢子形成，并选择具有甜菊醇糖苷产生的孢子。将这些孢子中的一个进一步开发用于产生甜菊醇糖苷，包括产生莱鲍迪甙A。

步骤1：用5个限定的DNA片段转化菌株ML10371(MAT-A、lys1-、 ura3-、leu2-)。所有转化通过乙酸锂/PEG真菌转化方案方法进行，并在适当的基本培养基YPD+100μg/ml诺尔丝菌素或YPD+100μg/ml潮霉素上选择转化体。

1)在质粒MB6969(图13)的HindIII/NotI消化后通过凝胶纯化分离的7.0kb DNA片段。此构建体编码用于过度表达连接至一起侧接lox位点 (Guldener等人，1996，Lambert等人，2007)的pPGM启动子(SEQ ID NO: 62)和xprT终止子(SEQ ID NO:69)以及HPH潮霉素抗性基因的UGT2_1a (SEQ ID NO:29)的合成构建体，以及用于过度表达缺乏连接至pHSP启动子(SEQ ID NO:63)和cwpT终止子(SEQ ID NO:70)的5'膜锚定序列 (tHMGopt：SEQ IDNO:75)的密码子优化的解脂耶氏酵母羟甲基戊二酰基-辅酶A还原酶开放阅读框的合成构建体。

2)在MB6856(图14)的HindIII/SspI消化后通过凝胶纯化分离的2.7 kb DNA片段。此构建体编码连接至pHYPO启动子(SEQ ID NO:64)和 gpdT终止子(SEQ ID NO:71)的tHMGopt(SEQ ID NO:75)。

3)在MB6857(图15)的SspI消化后通过凝胶纯化分离的2.5kb DNA 片段。此构建体编码连接至pHSP启动子(SEQ ID NO:63)和cwpT终止子(SEQ ID NO:70)的tHMGopt(SEQ IDNO:75)。

4)在MB6948(图16)的SspI消化后通过凝胶纯化分离的2.0kb DNA 片段。此构建体编码用于过度表达连接至pHSP启动子(SEQ ID NO:63) 和cwpT终止子(SEQ ID NO:70)的密码子优化的解脂耶氏酵母香叶基- 香叶基-焦磷酸合成酶(GGSopt：SEQ ID NO:76)的合成构建体。

5)在MB6958(图17)的HindIII/SspI消化后通过凝胶纯化分离的2.2 kb DNA片段。此构建体编码连接至pHYPO启动子(SEQ ID NO:64)和 gpdT终止子(SEQ ID NO:71)的GGSopt(SEQ ID NO:76)。所得菌株被指定为ML13462。

步骤2.用在质粒MB7015(图18)的SfiI消化后通过凝胶纯化分离的 9.7kb片段转化菌株ML13462。此构建体编码用于过度表达连接至pENO (SEQ ID NO:65)启动子和gpdT终止子(SEQ ID NO:71)的UGT1(SEQ ID NO:77)，连接至pHSP启动子(SEQ ID NO:63)和pgmT终止子(SEQ ID NO:72)的UGT3(SEQ ID NO:78)，连接至pCWP(SEQ NO:66)启动子和pgkT终止子(SEQ ID NO:73)的UGT4(SEQ ID NO:79)，以及 lox-侧接的诺尔丝菌素抗性标记(NAT)的合成构建体。注意，lox位点的放置允许随后通过CRE重组酶介导的重组去除诺尔丝菌素抗性。诺尔丝菌素抗性分离株被指定为ML13500。

步骤3.用在质粒MB6986(图19)的PvuI/SapI消化后通过凝胶纯化分离的9.1kb片段转化菌株ML13500。此构建体编码连接至pHSP启动子 (SEQ ID NO:63)和cwpT终止子(SEQID NO:70)的tHMGopt(SEQ ID NO:75)、lox侧接的URA3冲击(URA3blaster)原养型标记以及连接至 pHYPO启动子(SEQ ID NO:64)和gpdT终止子(SEQ ID NO:71)的GGSopt (SEQ IDNO:76)。在缺乏尿嘧啶的基本培养基上选择转化体。一种选择的尿嘧啶原养型被指定为ML13723。

步骤4.用在质粒MB7059(图20)的SfiI消化后通过凝胶纯化分离的 18.1kb片段转化菌株ML13723。MB7059编码连接至pCWP启动子(SEQ ID NO:66)和cwpT终止子(SEQ ID NO:70)的tCPS_SR(SEQ ID NO:80)，连接至pHYPO启动子(SEQ ID NO:64)和gpdT终止子(SEQID NO:71) 的tKS_SR(SEQ ID NO:81)，连接至pHSP启动子(SEQ ID NO:63)和 pgmT终止子(SEQ ID NO:72)的KAH_4(SEQ ID NO:92)，连接至pTPI 启动子(SEQ ID NO:67)和pgkT终止子(SEQ ID NO:73)的KO_Gib(SEQ ID NO:83)，连接至pENO启动子(SEQ ID NO:65)和xprT终止子(SEQ ID NO:69)的CPR_3(SEQ ID NO:84)，以及天然解脂耶氏酵母LEU2基因座。一种选择的莱鲍迪甙A产生转化体被指定为ML14032。

步骤5.将菌株ML14032划线至YPD并生长过夜，然后划线至5-FOA 板，以允许在步骤3中引入的URA3标记的重组介导的丧失。一种选择的 5-FOA抗性转化体被指定为ML14093。

步骤6.用在质粒MB7100(图21)的SfiI消化后通过凝胶纯化分离的 19.0kb片段转化菌株ML14093。MB7100编码连接至pHYPO启动子(SEQ ID NO:64)和cwpT终止子(SEQ IDNO:70)的tCPS_SR(SEQ ID NO:80)，连接至pCWP启动子(SEQ ID NO:66)和gpdT终止子(SEQID NO:71) 的tKS_SR(SEQ ID NO:81)，连接至pHSP启动子(SEQ ID NO:63)和 pgmT终止子(SEQ ID NO:72)的KAH_4(SEQ ID NO:82)，连接至pENO 启动子(SEQ ID NO:65)和pgkT终止子(SEQ ID NO:73)的KO_Gib(SEQ ID NO:83)，连接至pTPI启动子(SEQ ID NO:67)和xprT终止子(SEQ ID NO:69)的CPR_3(SEQ ID NO:84)，以及URA3冲击原养型标记。在缺乏尿嘧啶的基本培养基上选择转化体。一种选择的莱鲍迪甙A产生尿嘧啶原养型被指定为ML14094。

实施例12.甜菊醇糖苷产生菌株ML14087(MAT-B谱系)的描述:

步骤1.用5个限定的DNA片段转化菌株ML13206(MAT-B、ade1-、 ure2-、leu2-)。所有转化通过乙酸锂/PEG真菌转化方案方法进行，并在适当的基本培养基YPD+100μg/ml诺尔丝菌素或YPD+100μg/ml潮霉素上选择转化体。

1)在质粒MB6969(图13)的HindIII/NotI消化后通过凝胶纯化分离的7.0kb DNA片段。此构建体编码用于过度表达连接至一起侧接lox位点 (Guldener等人，1996，Lambert等人，2007)的pPGM(SEQ ID NO:62) 启动子和xprT终止子(SEQ ID NO:69)以及HPH潮霉素抗性基因的 UGT2_1a(SEQ ID NO:29)的密码子对优化的(CpO)ORF的合成构建体，以及用于过度表达缺乏连接至pHSP启动子(SEQ ID NO:63)和cwpT 终止子(SEQ ID NO:70)的5'膜锚定序列(tHMGopt：SEQ ID NO:75)的密码子优化的解脂耶氏酵母羟甲基戊二酰基-辅酶A还原酶开放阅读框的合成构建体。

4)在MB6948的SspI消化后通过凝胶纯化分离的2.0kb DNA片段(图 16)。此构建体编码用于过度表达连接至pHSP启动子(SEQ ID NO:63)和 cwpT终止子(SEQ ID NO:70)的密码子优化的解脂耶氏酵母香叶基-香叶基-焦磷酸合成酶(GGSopt：SEQ ID NO:76)的合成构建体。

5)在MB6958(图17)的HindIII/SspI消化后通过凝胶纯化分离的2.2 kb DNA片段。此构建体编码连接至pHYPO(SEQ ID NO:64)启动子和gpdT终止子(SEQ ID NO:71)的GGSopt(SEQ ID NO:76)。所得菌株被指定为ML13465。

步骤2.用2个限定的DNA片段转化菌株ML13465：

1).在质粒MB7015(图18)的SfiI消化后通过凝胶纯化分离的9.7kb 片段。此构建体编码用于过度表达连接至pENO启动子(SEQ Id NO:65) 和gpdT(SEQ ID NO:71)终止子的UGT1(SEQ ID NO:77)，连接至pHSP 启动子(SEQ ID NO:63)和pgmT终止子(SEQ ID NO:72)的UGT3(SEQ ID NO:78)，连接至pCWP启动子(SEQ NO:66)和pgkT终止子(SEQ ID NO:73)的UGT4(SEQ ID NO:79)，以及lox-侧接的诺尔丝菌素抗性标记 (NAT)的合成构建体。注意，lox位点的放置允许随后通过CRE重组酶介导的重组去除诺尔丝菌素抗性。

2).在质粒MB6988(图22)的PvuI/SapI消化后通过凝胶纯化分离的 9.1kb片段。此构建体编码连接至pHSP启动子(SEQ ID NO:63)和cwpT 终止子(SEQ ID NO:70)的tHMGopt(SEQ ID NO:75)、lox侧接的URA2 冲击原养型标记以及连接至pHYPO启动子(SEQ ID NO:64)和gpdT终止子(SEQ ID NO:71)的GGSopt(SEQ ID NO:76)。在YPD+100μg/ml 诺尔丝菌素上选择菌株，并将复制物接种到缺乏尿嘧啶的基本培养基上。一种诺尔丝菌素抗性尿嘧啶原养型分离株被指定为ML13490

步骤3.将菌株ML13490划线至YPD并生长过夜，然后划线至5-FOA 板，以允许在以上步骤3中引入的URA2标记的重组介导的丧失。一种选择的5-FOA抗性转化体被指定为ML13501。

步骤4.用在质粒MB6988(图22)的PvuI/SapI消化后通过凝胶纯化分离的9.1kb片段转化菌株ML13501。在缺乏尿嘧啶的基本培养基上选择转化体。一种选择的尿嘧啶原养型微生物被指定为ML13724。

步骤5.用在质粒MB7044(图23)的SfiI消化后通过凝胶纯化分离的 18.1kb片段转化菌株ML13724。MB7044编码连接至pHYPO启动子 (SEQ ID NO:64)和cwpT终止子(SEQ IDNO:70)的tCPS_SR(SEQ ID NO:80)，连接至pCWP启动子(SEQ ID NO:66)和gpdT终止子(SEQID NO:70)的tKS_SR(SEQ ID NO:81)，连接至pHSP启动子(SEQ ID NO: 63)和pgmT终止子(SEQ ID NO:72)的KAH_4(SEQ ID NO:82)，连接至pENO启动子(SEQ ID NO:65)和pgkT终止子(SEQ ID NO:73)的 KO_Gib(SEQ ID NO:83)，连接至pTPI启动子(SEQ ID NO:67)和xprT终止子(SEQ ID NO:69)的CPR_3(SEQ ID NO:84)以及LEU2基因座。一种选择的莱鲍迪甙A产生转化体被指定为ML14044。

步骤6.将菌株ML14044划线至YPD并生长过夜，且然后划线至5-FOA 板，以允许在以上步骤4中引入的URA2标记的重组介导的损失。一种选择的5’-FOA抗性转化体被指定为ML14076。

步骤7.用在质粒MB7094(图24)的SfiI消化后通过凝胶纯化分离的 19.0kb片段转化菌株ML14076。MB7094编码连接至pHYPO启动子(SEQ ID NO:64)和cwpT终止子(SEQ IDNO:70)的tCPS_SR(SEQ ID NO:80)，连接至pCWP启动子(SEQ ID NO:66)和gpdT终止子(SEQID NO:71) 的tKS_SR(SEQ ID NO:81)，连接至pHSP启动子(SEQ ID NO:63)和 pgmT终止子(SEQ ID NO:72)的KAH_4(SEQ ID NO:82)，连接至pENO 启动子(SEQ ID NO:65)和pgkT终止子(SEQ ID NO:73)的KO_Gib(SEQ ID NO:83)，连接至pTPI启动子(SEQ ID NO:67)和xprT终止子(SEQ ID NO:69)的CPR_3(SEQ ID NO:84)以及URA2冲击原养型标记。在缺乏尿嘧啶的基本培养基上选择转化体。一种选择的莱鲍迪甙A产生尿嘧啶原养型被指定为ML14087。

实施例13.接合MATA和MATB谱系并选择甜菊醇糖苷产生子代

允许具有互补营养缺陷(ADE1+lys1-和ade1-LYS1+)的相对接合型 (ML14094和ML14087)的菌株接合，然后接种在仅允许二倍体生长的选择性培养基(缺乏腺嘌呤和赖氨酸的基本培养基)上。然后诱导二倍体细胞(ML14143)通过饥饿进行减数分裂和孢子形成，并将所得的单倍体子代复制接种以鉴定具有潮霉素和诺尔丝菌素抗性的原养型分离株。一种选择的莱鲍迪甙A产生菌株被指定为ML14737

实施例14.使菌株不含UGT2 1a

在用MB6128(图25)转化后从菌株ML14737去除潮霉素抗生素标记和诺尔丝菌素抗生素标记，所述MB6128编码用于组成型过度表达CRE重组酶的构建体。CRE重组酶通过在Lox66和Lox71位点上的重组而缺失抗生素标记。非活性Lox72位点留在基因组中(Guldener等人，1996，Lambert 等人，2007)。质粒MB6128是一种CEN质粒，其在解脂耶氏酵母中以附加体的形式复制并且其含有在天然解脂耶氏酵母pHHF启动子和hhfT终止子控制下的CRE重组酶编码区以及在天然解脂耶氏酵母pTEF1启动子和 xprT终止子控制下的neoR(编码G418抗性)。在YPD+G418上选择 MB6128转化体并通过成功的Cre-Lox重组筛选丧失潮霉素和诺尔丝菌素抗性的转化体后，将敏感菌落生长在非选择性培养基上以去除MB6128 CEN质粒(CEN质粒自发丧失)。所得到的不含抗生素标记的变体被指定为ML14869。由于UGT2_1a连同潮霉素抗性的丧失，此菌株不再产生莱鲍迪甙A，而是产生中间体甜茶苷。

实施例15.UGT2基因的转化

将UGT2基因变体和作为对照的UGT2_1a放置在解脂耶氏酵母pHSP 启动子(SEQ IDNO:63)后面，并与解脂耶氏酵母终止子gpdT(SEQ ID NO: 71)组合。与UGT1(SEQ ID NO:77)、KAH_4(SEQ ID NO:82)、lox-侧接的G418抗性标记(KanMX)和解脂耶氏酵母GSY1整合侧翼一起，将每个UGT2在酿酒酵母中组装到CEN质粒p417[5-3]上的构建体中(参见图26)。

表10.在构建具有UGT2变体的菌株中使用的启动子、ORF和终止子

将这些构建体(对于每个UGT2为一个)用作PCR中的模板以扩增5'- 部分和3'-部分(参见图27)。这个5'部分由3'-GSY1整合侧翼的开始与 KanMX开放阅读框的结束之间的一切组成。3'-部分由KanMX开放阅读框的第二个密码子与5'-GSY1整合侧翼的结束之间的一切组成。

对于UGT2测试而言，将每个5'-部分和3'-部分组合转化到菌株 ML14869中。在含有G418的YPD培养基上选择转化体。从每个转化中选择12个菌落用于产生实验。

实施例16.用解脂耶氏酵母产生RebA

将预培养物与来自YEPh-D琼脂的菌落物质一起接种。将预培养物在具有葡萄糖作为碳源的200μl YEP中生长。将预培养物在27℃、750rpm 和80％湿度的Infors孵育箱中孵育72小时。使用40μl预培养物来接种具有葡萄糖作为碳源的2.5mlYEP。将主要培养物在27℃、550rpm、80％湿度下在Infors孵育箱中孵育120小时。在120小时后，将主培养物以2750rpm 离心10分钟。从上清液中取出100μl，并在55％乙腈中稀释2.5倍。在33％乙腈中进一步稀释。

结果在图28和表11中示出。可以看出，表达变体UGT2的菌株产生更高的RebA滴度。

表11：表达UGT2变体酶的耶氏酵母属菌株中的莱鲍迪甙A的产生

样品	RebA(mg/L)
		UGT2_2b	254
UGT2_3b	396
		UGT2_5b	422
UGT2_9b	246
		UGT2_10b	249
UGT2_1a	198

实施例17.用解脂耶氏酵母产生RebM

结果在图29和表12中示出。可以看出，表达变体UGT2的菌株产生更高的RebM滴度。

表12：表达UGT2变体酶的耶氏酵母属菌株中的莱鲍迪甙M的产生

样品	RebM(mg/L)
		UGT2_7b	37,5
UGT2_1a	23,3

实施例18：

为了评估UGT2的不同变体对生物反应器中甜菊醇糖苷产生的影响，选择了实施例15中描述的菌株中的两种。一个菌株表达UGT2_6b，另一菌株表达UGT2_7b。应用的发酵方案是补料分批发酵，并且每日采集全发酵液样品以用于使用LC/MS分析甜菊醇糖苷。

如可在图30中看出的，与表达UGT2_7b的菌株相比，表达UGT2_6b 的菌株产生更多的RebA。然而，与表达UGT2_6b的菌株相比，表达 UGT2_7b的菌株产生显著更多的RebM。两种菌株均产生比RebM更多的 RebA。在发酵结束时，在表达UGT2_6b的菌株的情况下，RebA浓度为 RebM浓度的20倍，而在表达UGT2_7b的菌株中，RebA浓度为RebM浓度的4倍。不同的产物比率反映了UGT2性质的内在差异，其中与UGT2_6b 相比，UGT2_7b在19位上具有更高的葡萄糖糖基化活性。将分别来自甜菊苷和RebA的19位上的糖基化反应的产物如RebE和RebD通过UGT4 的活性进一步转化为RebM，参见图32。

这说明通过使用在此描述的UGT2的不同变体，生产能够被有效地导向目标产物。

表13：序列表的描述

序列表

<110> 帝斯曼知识产权资产管理有限公司

<120> UDP-糖基转移酶

<130> 30995-WO-PCT

<150> US62/133606

<151> 2015-03-16

<160> 84

<170> SIPOSequenceListing 1.0

<210> 1

<211> 473

<212> PRT

<213> 人工序列()

<220>

<223> UGT2_1b变体

<400> 1

Met Ala Thr Ser Asp Ser Ile Val Asp Asp Arg Lys Lys Leu His Ile

1 5 10 15

Val Met Phe Pro Trp Leu Ala Phe Gly His Ile Ile Pro Tyr Leu Gln

20 25 30

Leu Ala Lys Leu Ile Ala Glu Lys Gly His Lys Val Ser Phe Leu Ser

35 40 45

Thr Thr Arg Asn Ile Gln Arg Leu Ser Ser His Ile Ser Pro Leu Ile

50 55 60

Asn Phe Val Lys Leu Thr Leu Pro Arg Val Gln Glu Leu Pro Glu Asp

65 70 75 80

Ala Glu Ala Thr Thr Asp Val His Pro Glu Asp Ile Pro Tyr Leu Lys

85 90 95

Leu Ala Ser Asp Gly Leu Gln Glu Pro Leu Thr Arg Phe Leu Glu Ser

100 105 110

Ser Ser Pro Asp Trp Ile Ile Tyr Asp Tyr Thr His Tyr Trp Leu Pro

115 120 125

Glu Ile Ala Ala Ser Leu Gly Val Ala Arg Ala His Phe Ser Val Thr

130 135 140

Thr Pro Trp Ala Leu Ala Phe Met Gly Pro Ser Ala Asp Ala Met Ile

145 150 155 160

Asn Gly Ser Asp Gly Arg Thr Glu Val Glu Asp Phe Thr Val Pro Pro

165 170 175

Lys Trp Ile Pro Phe Pro Thr Thr Val Ala Trp Arg Lys His Asp Leu

180 185 190

Ala Arg Leu Val Pro Tyr Lys Ala Pro Gly Ile Ser Asp Gly Tyr Arg

195 200 205

Met Gly Leu Val Leu Lys Gly Cys Asp Cys Leu Leu Ser Arg Thr Tyr

210 215 220

His Glu Phe Gly Thr Gln Trp Leu Pro Leu Leu Glu Glu Leu His Gln

225 230 235 240

Val Pro Val Val Pro Val Gly Leu Leu Pro Pro Ser Ile Pro Gly Asp

245 250 255

Glu Lys Asp Glu Asn Trp Val Ser Ile Lys Asp Trp Leu Asp Lys Gln

260 265 270

Glu Lys Gly Ser Val Val Tyr Val Ala Leu Gly Ser Glu Val Leu Leu

275 280 285

Thr Glu Glu Glu Val Val Glu Leu Ala Leu Gly Leu Glu Leu Ser Gly

290 295 300

Leu Pro Phe Phe Trp Ala Tyr Arg Lys Pro Lys Gly Pro Ala Lys Ser

305 310 315 320

Asp Ser Val Glu Leu Pro Asp Gly Phe Val Glu Arg Thr Arg Asp Arg

325 330 335

Gly Leu Val Trp Thr Ser Trp Ala Pro Gln Leu Arg Ile Leu Ser His

340 345 350

Glu Ser Val Gly Gly Phe Val Thr His Cys Gly Ser Gly Ser Ile Val

355 360 365

Glu Gly Leu Met Phe Gly His Pro Leu Ile Met Leu Pro Ile Phe Gly

370 375 380

Asp Gln Pro Leu Asn Ala Arg Leu Leu Glu Asp Lys Gln Val Gly Ile

385 390 395 400

Glu Ile Pro Arg Asn Glu Glu Asp Gly Cys Leu Thr Lys Glu Ser Val

405 410 415

Ala Glu Ser Leu Arg Leu Val Val Val Glu Lys Glu Gly Glu Ile Tyr

420 425 430

Arg Glu Lys Ala Arg Glu Met Ser Lys Val Tyr Ser Asp Thr Lys Arg

435 440 445

Glu Lys Glu Tyr Val Asp Gln Phe Val Asp Tyr Leu Glu Lys Asn Ala

450 455 460

Arg Ala Val Ala Ile Asp His Glu Ser

465 470

<210> 2

<211> 1419

<212> DNA

<213> 人工序列()

<220>

<223> UGT2_1b CpO用于酿酒酵母

<400> 2

atggccactt ctgactccat cgttgatgac agaaagaagt tgcacatcgt tatgttccca 60

tggttagctt tcggtcacat tatcccatac ttgcaattgg ctaaattgat tgctgaaaag 120

ggtcacaaag tctctttctt gtccaccacc agaaacatcc aaagattatc ttctcacatt 180

tctccattga tcaacttcgt caagttgact ttaccaagag ttcaagaatt gccagaagat 240

gctgaagcta ccaccgatgt ccatccagaa gatatcccat acttgaagtt ggcttctgat 300

ggtttgcaag aaccattgac tagattcttg gaatcttctt ctccagactg gattatctac 360

gactacactc actactggtt accagaaatt gctgcctctt tgggtgttgc tcgtgctcat 420

ttctccgtta ccactccatg ggctttggct ttcatgggtc catctgctga tgctatgatc 480

aacggttctg atggtagaac cgaagtcgaa gacttcaccg ttccaccaaa atggatccca 540

ttcccaacca ctgtcgcttg gagaaagcac gatttggcca gattagttcc atacaaggcc 600

ccaggtatct ctgacggtta cagaatgggt ttagtcttga agggttgtga ctgtttgttg 660

tccagaactt accatgaatt cggtactcaa tggttacctt tgttggaaga attgcaccaa 720

gtcccagttg ttccagttgg tttgttgcct ccttctatcc caggtgacga aaaggacgaa 780

aactgggttt ccatcaagga ctggttagat aagcaagaaa agggttccgt tgtctacgtt 840

gctttgggtt ctgaagtctt gttgactgaa gaagaagttg ttgaattggc tttgggtttg 900

gaattgtccg gtctaccatt tttctgggct tacagaaagc caaagggtcc agctaagtct 960

gactctgttg aattgccaga tggtttcgtc gaaagaacca gagacagagg tttggtctgg 1020

acttcctggg ctccacaatt gagaattttg tcccacgaat ctgttggtgg tttcgttacc 1080

cactgtggtt ctggttccat tgtcgaaggt ttgatgttcg gtcacccatt gatcatgttg 1140

ccaatcttcg gtgaccaacc attgaacgct agattattgg aagacaagca agtcggtatt 1200

gaaatcccaa gaaacgaaga agacggttgt ttgaccaagg aatctgttgc cgaatctcta 1260

agattggttg ttgtcgaaaa ggaaggtgaa atctacagag aaaaggctag agaaatgtcc 1320

aaggtttact ctgataccaa gagagaaaag gaatatgtcg accaatttgt tgactacttg 1380

gaaaagaacg ctcgtgccgt tgccattgac cacgaaagc 1419

<210> 3

<211> 473

<212> PRT

<213> 人工序列()

<220>

<223> UGT2_2b变体

<400> 3

Met Ala Thr Ser Asp Ser Ile Val Asp Asp Arg Lys Lys Leu His Ile

1 5 10 15

Val Met Phe Pro Trp Leu Ala Phe Gly His Ile Ile Pro Tyr Leu Gln

20 25 30

Leu Ala Lys Leu Ile Ala Glu Lys Gly His Lys Val Ser Phe Leu Ser

35 40 45

Thr Thr Arg Asn Ile Gln Arg Leu Ser Ser His Ile Ser Pro Leu Ile

50 55 60

Asn Phe Val Lys Leu Thr Leu Pro Arg Val Gln Glu Leu Pro Glu Asp

65 70 75 80

Ala Glu Ala Thr Thr Asp Val His Pro Glu Asp Ile Pro Tyr Leu Lys

85 90 95

Lys Ala Ser Asp Gly Leu Gln Pro Glu Val Thr Glu Phe Leu Glu Gln

100 105 110

His Ser Pro Asp Trp Ile Ile Tyr Asp Tyr Thr His Tyr Trp Leu Pro

115 120 125

Ser Ile Ala Thr Lys His Gly Val Ser Arg Ala His Phe Ser Val Thr

130 135 140

Thr Pro Trp Ala Ile Ala Tyr Met Gly Pro Thr Ala Asp Ala Met Ile

145 150 155 160

Asn Gly Ser Asp Gly Arg Thr Thr Pro Glu Asp Phe Thr Val Pro Pro

165 170 175

Lys Trp Phe Pro Phe Pro Thr Lys Val Cys Trp Arg Lys His Asp Leu

180 185 190

Ala Arg Leu Val Pro Tyr Lys Ala Pro Gly Ile Ser Asp Gly Tyr Arg

195 200 205

Met Gly Leu Val Leu Lys Gly Cys Asp Cys Leu Leu Ser Arg Thr Tyr

210 215 220

His Glu Phe Gly Thr Gln Trp Leu Pro Leu Leu Glu Glu Leu His Gln

225 230 235 240

Val Pro Val Val Pro Val Gly Leu Leu Pro Pro Ser Ile Pro Gly Asp

245 250 255

Glu Lys Asp Glu Asn Trp Val Ser Ile Lys Asp Trp Leu Asp Lys Gln

260 265 270

Glu Lys Gly Ser Val Val Tyr Val Ala Leu Gly Ser Glu Val Leu Leu

275 280 285

Thr Glu Glu Glu Val Val Glu Leu Ala Leu Gly Leu Glu Leu Ser Gly

290 295 300

Leu Pro Phe Phe Trp Ala Tyr Arg Lys Pro Lys Gly Pro Ala Lys Ser

305 310 315 320

Asp Ser Val Glu Leu Pro Asp Gly Phe Val Glu Arg Thr Arg Asp Arg

325 330 335

Gly Leu Val Trp Thr Ser Trp Ala Pro Gln Leu Arg Ile Leu Ser His

340 345 350

Glu Ser Val Gly Gly Phe Val Thr His Cys Gly Ser Gly Ser Ile Val

355 360 365

Glu Gly Leu Met Phe Gly His Pro Leu Ile Met Leu Pro Ile Phe Gly

370 375 380

Asp Gln Pro Leu Asn Ala Arg Leu Leu Glu Asp Lys Gln Val Gly Ile

385 390 395 400

Glu Ile Gln Arg Asn Glu Glu Asp Gly Cys Leu Thr Lys Glu Ser Val

405 410 415

Ala Glu Ser Leu Arg Leu Val Val Val Glu Lys Glu Gly Glu Ile Tyr

420 425 430

Arg Glu Lys Ala Arg Glu Met Ser Lys Val Tyr Ser Asp Thr Lys Arg

435 440 445

Glu Lys Glu Tyr Val Asp Gln Phe Val Asp Tyr Leu Glu Lys Asn Ala

450 455 460

Arg Ala Val Ala Ile Asp His Glu Ser

465 470

<210> 4

<211> 1419

<212> DNA

<213> 人工序列()

<220>

<223> UGT2_2b CpO用于酿酒酵母

<400> 4

atggccactt ctgactccat cgttgatgac agaaagaagt tgcacatcgt tatgttccca 60

tggttagctt tcggtcacat tatcccatac ttgcaattgg ctaaattgat tgctgaaaag 120

ggtcacaaag tctctttctt gtccaccacc agaaacatcc aaagattatc ttctcacatt 180

tctccattga tcaacttcgt caagttgact ttaccaagag ttcaagaatt gccagaagat 240

gctgaagcta ccaccgatgt ccatccagaa gatatcccat acttgaagaa ggcttctgat 300

ggtttgcaac cagaagtcac tgaattcttg gaacaacact ctccagactg gattatctac 360

gactacactc actactggtt accatccatt gctactaagc acggtgtttc tcgtgctcat 420

ttctccgtta ccactccatg ggctattgct tacatgggtc caactgctga tgctatgatc 480

aacggttctg atggtagaac cactccagaa gacttcaccg ttccaccaaa atggttccca 540

ttcccaacca aggtctgttg gagaaagcac gatttggcca gattagttcc atacaaggcc 600

ccaggtatct ctgacggtta cagaatgggt ttagtcttga agggttgtga ctgtttgttg 660

tccagaactt accatgaatt cggtactcaa tggttacctt tgttggaaga attgcaccaa 720

gtcccagttg ttccagttgg tttgttgcct ccttctatcc caggtgacga aaaggacgaa 780

aactgggttt ccatcaagga ctggttagat aagcaagaaa agggttccgt tgtctacgtt 840

gctttgggtt ctgaagtctt gttgactgaa gaagaagttg ttgaattggc tttgggtttg 900

gaattgtccg gtctaccatt tttctgggct tacagaaagc caaagggtcc agctaagtct 960

gactctgttg aattgccaga tggtttcgtc gaaagaacca gagacagagg tttggtctgg 1020

acttcctggg ctccacaatt gagaattttg tcccacgaat ctgttggtgg tttcgttacc 1080

cactgtggtt ctggttccat tgtcgaaggt ttgatgttcg gtcacccatt gatcatgttg 1140

ccaatcttcg gtgaccaacc attgaacgct agattattgg aagacaagca agtcggtatt 1200

gaaatccaaa gaaacgaaga agacggttgt ttgaccaagg aatctgttgc cgaatctcta 1260

agattggttg ttgtcgaaaa ggaaggtgaa atctacagag aaaaggctag agaaatgtcc 1320

aaggtttact ctgataccaa gagagaaaag gaatatgtcg accaatttgt tgactacttg 1380

gaaaagaacg ctcgtgccgt tgccattgac cacgaaagc 1419

<210> 5

<211> 1419

<212> DNA

<213> 人工序列()

<220>

<223> UGT2_2b CpO用于解脂耶氏酵母

<400> 5

atggccacct ccgactccat tgtcgacgac cgaaagaagc tccacattgt catgttcccc 60

tggctcgcct ttggccacat cattccctac ctccagctcg ccaagctcat tgctgagaag 120

ggccacaagg tttctttcct ctccaccacc cgaaacatcc agcgactctc ttcccacatc 180

tctcccctca tcaactttgt caagctcacc ctcccccgag tccaggagct tcccgaggat 240

gctgaggcca ccactgatgt ccaccccgag gacatcccct acctcaagaa ggcttccgac 300

ggtctgcagc ccgaggtcac tgagtttctc gagcagcact ctcccgactg gatcatctac 360

gactacaccc actactggct cccctccatt gccaccaagc acggtgtctc tcgagcccac 420

ttctccgtca ccaccccctg ggccattgct tacatgggtc ccactgccga tgccatgatc 480

aacggttccg acggccgaac cactcccgag gacttcactg tccctcccaa gtggttcccc 540

ttccccacca aggtctgctg gcgaaagcac gatctcgccc gactcgtccc ctacaaggcc 600

cccggtatct ccgacggtta ccgaatgggt ctggtcctca agggctgtga ctgcctcctc 660

tctcgaacct accacgagtt cggcacccag tggctccccc tccttgagga gctgcaccag 720

gtccccgttg tccccgtcgg tctgctccct ccctccatcc ccggtgacga gaaggacgag 780

aactgggttt ccatcaagga ctggctcgac aagcaggaga agggctctgt tgtctacgtt 840

gctctcggct ccgaggttct gctcaccgag gaagaggttg ttgagctggc tctcggtctg 900

gagctgtccg gcctcccctt cttctgggcc taccgaaagc ccaagggccc cgccaagtcc 960

gactccgtcg agctgcccga cggtttcgtc gagcgaaccc gagatcgagg tctggtctgg 1020

acctcttggg ctccccagct ccgaatcctc tcccacgagt ccgttggtgg tttcgtcacc 1080

cactgcggtt ccggctccat cgtcgagggt ctgatgttcg gccaccctct catcatgctc 1140

cccatcttcg gtgaccagcc cctcaacgcc cgactgctcg aggataagca ggtcggtatc 1200

gagatccagc gaaacgaaga ggacggctgt ctgaccaagg agtccgtcgc cgagtctctc 1260

cgactcgttg ttgtcgagaa agagggtgag atctaccgag agaaggcccg agagatgtcc 1320

aaggtctact ccgacaccaa gcgtgagaag gagtacgtcg accagttcgt cgactacctc 1380

gagaagaacg cccgagctgt tgccattgac cacgagtct 1419

<210> 6

<211> 473

<212> PRT

<213> 人工序列()

<220>

<223> UGT2_3b变体

<400> 6

Met Ala Thr Ser Asp Ser Ile Val Asp Asp Arg Lys Lys Leu His Ile

1 5 10 15

Val Met Phe Pro Trp Leu Ala Phe Gly His Ile Ile Pro Tyr Leu Gln

20 25 30

Leu Ala Lys Leu Ile Ala Glu Lys Gly His Lys Val Ser Phe Leu Ser

35 40 45

Thr Thr Arg Asn Ile Gln Arg Leu Ser Ser His Ile Ser Pro Leu Ile

50 55 60

Asn Phe Val Lys Leu Thr Leu Pro Arg Val Gln Glu Leu Pro Glu Asp

65 70 75 80

Ala Glu Ala Thr Thr Asp Val His Pro Glu Asp Ile Pro Tyr Leu Lys

85 90 95

Lys Ala Ser Asp Gly Leu Gln Pro Glu Val Thr Glu Phe Leu Glu Gln

100 105 110

His Ser Pro Asp Trp Ile Ile Tyr Asp Tyr Thr His Tyr Trp Leu Pro

115 120 125

Ser Ile Ala Thr Lys His Gly Val Ser Arg Ala His Phe Ser Val Thr

130 135 140

Thr Pro Trp Ala Ile Ala Tyr Met Gly Pro Thr Ala Asp Ala Met Ile

145 150 155 160

Asn Gly Ser Asp Gly Arg Thr Thr Pro Glu Asp Phe Thr Val Pro Pro

165 170 175

Lys Trp Phe Pro Phe Pro Thr Lys Val Cys Trp Arg Lys His Asp Leu

180 185 190

Ala Arg Leu Val Pro Tyr Lys Ala Pro Gly Ile Ser Asp Gly Tyr Arg

195 200 205

Met Gly Leu Val Leu Lys Gly Ser Asp Leu Leu Leu Ser Arg Ser Tyr

210 215 220

His Glu Phe Gly Thr Glu Trp Leu Arg Leu Leu Glu Thr Leu His Arg

225 230 235 240

Val Pro Val Val Pro Val Gly Leu Leu Pro Pro Glu Ile Pro Gly Asp

245 250 255

Gly Glu Asp Glu Ser Trp Val Ser Ile Lys Asp Trp Leu Asp Lys Lys

260 265 270

Glu Lys Gly Ser Val Val Tyr Val Ala Leu Gly Ser Glu Val Leu Val

275 280 285

Ser Gln Glu Glu Leu Asn Glu Leu Ala Leu Gly Leu Glu Leu Ser Gly

290 295 300

Leu Pro Phe Val Trp Ala Tyr Arg Lys Pro Lys Gly Pro Ala Lys Ser

305 310 315 320

Asp Ser Val Glu Leu Pro Asp Gly Phe Glu Glu Arg Thr Arg Gly Arg

325 330 335

Gly Val Val Trp Thr Ser Trp Ala Pro Gln Leu Arg Ile Leu Ser His

340 345 350

Glu Ser Val Ala Gly Phe Leu Thr His Cys Gly Ser Gly Ser Ile Val

355 360 365

Glu Gly Leu Met Phe Gly His Pro Leu Ile Met Leu Pro Leu Phe Gly

370 375 380

Asp Gln Pro Leu Asn Ala Arg Leu Leu Glu Asp Lys Gln Val Gly Ile

385 390 395 400

Glu Ile Pro Arg Asp Glu Glu Asp Gly Cys Leu Thr Lys Glu Ser Val

405 410 415

Ala Arg Ser Leu Arg Leu Val Met Val Glu Lys Glu Gly Glu Ile Tyr

420 425 430

Arg Glu Lys Ala Arg Glu Met Ser Lys Ile Tyr Asn Asn Thr Glu Val

435 440 445

Glu Asp Gln Tyr Val Ser Gln Phe Val Glu Tyr Leu Glu Lys Asn Ala

450 455 460

Arg Ala Val Ala Ile Asp His Glu Ser

465 470

<210> 7

<211> 1419

<212> DNA

<213> 人工序列()

<220>

<223> UGT2_3b CpO用于酿酒酵母

<400> 7

atggccactt ctgactccat cgttgatgac agaaagaagt tgcacatcgt tatgttccca 60

tggttagctt tcggtcacat tatcccatac ttgcaattgg ctaaattgat tgctgaaaag 120

ggtcacaaag tctctttctt gtccaccacc agaaacatcc aaagattatc ttctcacatt 180

tctccattga tcaacttcgt caagttgact ttaccaagag ttcaagaatt gccagaagat 240

gctgaagcta ccaccgatgt ccatccagaa gatatcccat acttgaagaa ggcttctgat 300

ggtttgcaac cagaagtcac tgaattcttg gaacaacact ctccagactg gattatctac 360

gactacactc actactggtt accatccatt gctactaagc acggtgtttc tcgtgctcat 420

ttctccgtta ccactccatg ggctattgct tacatgggtc caactgctga tgctatgatc 480

aacggttctg atggtagaac cactccagaa gacttcaccg ttccaccaaa atggttccca 540

ttcccaacca aggtctgttg gagaaagcac gatttggcca gattagttcc atacaaggcc 600

ccaggtatct ctgacggtta cagaatgggt ttagtcttga agggttctga cttgttgttg 660

tccagatctt accatgaatt cggtactgaa tggttaagat tgttggaaac tttgcacaga 720

gtcccagttg ttccagttgg tttgttgcct cctgaaatcc caggtgacgg tgaagacgaa 780

tcttgggttt ccatcaagga ctggttagat aagaaggaaa agggttccgt tgtctacgtt 840

gctttgggtt ctgaagtctt ggtttctcaa gaagaattga acgaattggc tttgggtttg 900

gaattgtccg gtctaccatt tgtctgggct tacagaaagc caaagggtcc agctaagtct 960

gactctgttg aattgccaga tggtttcgaa gaaagaacca gaggtagagg tgttgtctgg 1020

acttcctggg ctccacaatt gagaattttg tcccacgaat ctgttgctgg tttcttgacc 1080

cactgtggtt ctggttccat tgtcgaaggt ttgatgttcg gtcacccatt gatcatgttg 1140

ccattgttcg gtgaccaacc attgaacgct agattattgg aagacaagca agtcggtatt 1200

gaaatcccaa gagatgaaga agacggttgt ttgaccaagg aatctgttgc ccgttctcta 1260

agattggtta tggtcgaaaa ggaaggtgaa atctacagag aaaaggctag agaaatgtcc 1320

aagatctaca acaacaccga agtcgaagac caatatgtct cccaatttgt tgaatacttg 1380

gaaaagaacg ctcgtgccgt tgccattgac cacgaaagc 1419

<210> 8

<211> 1419

<212> DNA

<213> 人工序列()

<220>

<223> UGT2_3b CpO用于解脂耶氏酵母

<400> 8

atggccacct ccgactccat tgtcgacgac cgaaagaagc tccacattgt catgttcccc 60

tggctcgcct ttggccacat catcccttac ctccagctcg ccaagctcat tgctgagaag 120

ggccacaagg tttccttcct ctccaccacc cgaaacatcc agcgactctc ctcccacatc 180

tctcctctca tcaactttgt caagctcacc ctcccccgag tccaggagct gcccgaggat 240

gctgaggcca ccaccgatgt ccaccccgag gacatcccct acctcaagaa ggcctccgat 300

ggcctccagc ccgaggtcac cgagttcctc gagcagcact ctcccgactg gatcatctac 360

gactacaccc actactggct cccctccatt gccaccaagc acggtgtctc tcgagcccac 420

ttctccgtca ccaccccctg ggccattgcc tacatgggtc ccactgctga cgccatgatc 480

aacggttccg acggccgaac cactcccgag gacttcactg tccctcccaa gtggttcccc 540

ttccccacca aggtctgctg gcgaaagcac gacctcgccc gactcgtccc ctacaaggct 600

cccggtatct ccgacggcta ccgaatgggt ctggtcctca agggctctga tctcctcctc 660

tctcgatctt accacgagtt cggcaccgag tggctccgac tgctcgagac tctccaccga 720

gtccccgttg tccccgtcgg tctgctccct cccgagatcc ccggtgacgg tgaggacgag 780

tcttgggttt ccatcaagga ctggctcgac aagaaggaga agggctccgt tgtctacgtt 840

gctctcggtt ccgaggttct tgtctcccaa gaggagctta acgagctggc tctcggtctg 900

gagctgtccg gtctgccctt tgtctgggcc taccgaaagc ccaagggccc cgccaagtcc 960

gactccgtcg agcttcccga cggtttcgag gagcgaaccc gaggccgagg tgttgtctgg 1020

acctcttggg ctccccagct ccgaatcctc tcccacgagt ccgtcgccgg tttcctcacc 1080

cactgcggtt ccggctccat tgttgagggt ctgatgttcg gccaccccct catcatgctc 1140

cccctcttcg gtgaccagcc cctcaacgcc cgacttctcg aggacaagca ggtcggtatt 1200

gagatccccc gagatgaaga ggacggctgt ctgaccaagg agtctgttgc ccgatctctg 1260

cgactcgtca tggtcgagaa ggaaggtgag atctaccgag agaaggcccg agagatgtcc 1320

aagatctaca acaacaccga ggtcgaggac cagtacgttt cccagttcgt cgagtacctt 1380

gagaagaacg cccgagctgt tgccattgac cacgaatca 1419

<210> 9

<211> 473

<212> PRT

<213> 人工序列()

<220>

<223> UGT2_4b变体

<400> 9

Met Ala Thr Ser Asp Ser Ile Val Asp Asp Arg Lys Lys Leu His Ile

1 5 10 15

Val Met Phe Pro Trp Leu Ala Phe Gly His Ile Ile Pro Tyr Leu Glu

20 25 30

Leu Ser Lys Leu Ile Ala Gln Lys Gly His Lys Val Ser Phe Leu Ser

35 40 45

Thr Thr Lys Asn Ile Asp Arg Leu Ser Ser His Ile Ser Pro Leu Ile

50 55 60

Asn Val Val Gln Leu Thr Leu Pro Arg Val Gln Glu Leu Pro Glu Asp

65 70 75 80

Ala Glu Ala Thr Thr Asp Val His Pro Glu Asp Ile Pro Tyr Leu Lys

85 90 95

Leu Ala Ser Asp Gly Leu Gln Glu Pro Leu Thr Arg Phe Leu Glu Ser

100 105 110

Ser Ser Pro Asp Trp Ile Ile Tyr Asp Tyr Thr His Tyr Trp Leu Pro

115 120 125

Glu Ile Ala Ala Ser Leu Gly Val Ala Arg Ala His Phe Ser Val Thr

130 135 140

Thr Pro Trp Ala Leu Ala Phe Met Gly Pro Ser Ala Asp Ala Met Ile

145 150 155 160

Asn Gly Ser Asp Gly Arg Thr Glu Val Glu Asp Phe Thr Val Pro Pro

165 170 175

Lys Trp Ile Pro Phe Pro Thr Thr Val Ala Trp Arg Lys His Asp Leu

180 185 190

Ala Arg Leu Val Pro Tyr Lys Ala Pro Gly Ile Ser Asp Gly Tyr Arg

195 200 205

Met Gly Leu Val Leu Lys Gly Cys Asp Cys Leu Leu Ser Arg Thr Tyr

210 215 220

His Glu Phe Gly Thr Gln Trp Leu Pro Leu Leu Glu Glu Leu His Gln

225 230 235 240

Val Pro Val Val Pro Val Gly Leu Leu Pro Pro Ser Ile Pro Gly Asp

245 250 255

Glu Lys Asp Glu Asn Trp Val Ser Ile Lys Asp Trp Leu Asp Lys Gln

260 265 270

Glu Lys Gly Ser Val Val Tyr Val Ala Leu Gly Ser Glu Val Leu Leu

275 280 285

Thr Glu Glu Glu Val Val Glu Leu Ala Leu Gly Leu Glu Leu Ser Gly

290 295 300

Leu Pro Phe Phe Trp Ala Tyr Arg Lys Pro Lys Gly Pro Ala Lys Ser

305 310 315 320

Asp Ser Val Glu Leu Pro Asp Gly Phe Val Glu Arg Thr Arg Asp Arg

325 330 335

Gly Leu Val Trp Thr Ser Trp Ala Pro Gln Leu Arg Ile Leu Ser His

340 345 350

Glu Ser Val Ala Gly Phe Leu Thr His Cys Gly Ser Gly Ser Ile Val

355 360 365

Glu Gly Leu Met Phe Gly His Pro Leu Ile Met Leu Pro Leu Phe Gly

370 375 380

Asp Gln Pro Leu Asn Ala Arg Leu Leu Glu Asp Lys Gln Val Gly Ile

385 390 395 400

Glu Ile Pro Arg Asp Glu Glu Asp Gly Cys Leu Thr Lys Glu Ser Val

405 410 415

Ala Arg Ser Leu Arg Leu Val Met Val Glu Lys Glu Gly Glu Ile Tyr

420 425 430

Arg Glu Lys Ala Arg Glu Met Ser Lys Ile Tyr Asn Asn Thr Glu Val

435 440 445

Glu Asp Gln Tyr Val Ser Gln Phe Val Glu Tyr Leu Glu Lys Asn Ala

450 455 460

Arg Ala Val Ala Ile Asp His Glu Ser

465 470

<210> 10

<211> 1419

<212> DNA

<213> 人工序列()

<220>

<223> UGT2_4b CpO用于酿酒酵母

<400> 10

atggccactt ctgactccat cgttgatgac agaaagaagt tgcacatcgt tatgttccca 60

tggttagctt tcggtcacat tatcccatac ttggaattgt ccaaattgat tgctcaaaag 120

ggtcacaaag tctctttctt gtccaccacc aagaacatcg acagattatc ttctcacatt 180

tctccattga tcaacgttgt ccaattgact ttaccaagag ttcaagaatt gccagaagat 240

gctgaagcta ccaccgatgt ccatccagaa gatatcccat acttgaagtt ggcttctgat 300

ggtttgcaag aaccattgac tagattcttg gaatcttctt ctccagactg gattatctac 360

gactacactc actactggtt accagaaatt gctgcctctt tgggtgttgc tcgtgctcat 420

ttctccgtta ccactccatg ggctttggct ttcatgggtc catctgctga tgctatgatc 480

aacggttctg atggtagaac cgaagtcgaa gacttcaccg ttccaccaaa atggatccca 540

ttcccaacca ctgtcgcttg gagaaagcac gatttggcca gattagttcc atacaaggcc 600

ccaggtatct ctgacggtta cagaatgggt ttagtcttga agggttgtga ctgtttgttg 660

tccagaactt accatgaatt cggtactcaa tggttacctt tgttggaaga attgcaccaa 720

gtcccagttg ttccagttgg tttgttgcct ccttctatcc caggtgacga aaaggacgaa 780

aactgggttt ccatcaagga ctggttagat aagcaagaaa agggttccgt tgtctacgtt 840

gctttgggtt ctgaagtctt gttgactgaa gaagaagttg ttgaattggc tttgggtttg 900

gaattgtccg gtctaccatt tttctgggct tacagaaagc caaagggtcc agctaagtct 960

gactctgttg aattgccaga tggtttcgtc gaaagaacca gagacagagg tttggtctgg 1020

acttcctggg ctccacaatt gagaattttg tcccacgaat ctgttgctgg tttcttgacc 1080

cactgtggtt ctggttccat tgtcgaaggt ttgatgttcg gtcacccatt gatcatgttg 1140

ccattgttcg gtgaccaacc attgaacgct agattattgg aagacaagca agtcggtatt 1200

gaaatcccaa gagatgaaga agacggttgt ttgaccaagg aatctgttgc ccgttctcta 1260

agattggtta tggtcgaaaa ggaaggtgaa atctacagag aaaaggctag agaaatgtcc 1320

aagatctaca acaacaccga agtcgaagac caatatgtct cccaatttgt tgaatacttg 1380

gaaaagaacg ctcgtgccgt tgccattgac cacgaaagc 1419

<210> 11

<211> 473

<212> PRT

<213> 人工序列()

<220>

<223> UGT2_5b变体

<400> 11

Met Ala Thr Ser Asp Ser Ile Val Asp Asp Arg Lys Lys Leu His Ile

1 5 10 15

Val Met Phe Pro Trp Leu Ala Phe Gly His Ile Ile Pro Tyr Leu Glu

20 25 30

Leu Ser Lys Leu Ile Ala Gln Lys Gly His Lys Val Ser Phe Leu Ser

35 40 45

Thr Thr Lys Asn Ile Asp Arg Leu Ser Ser His Ile Ser Pro Leu Ile

50 55 60

Asn Val Val Gln Leu Thr Leu Pro Arg Val Gln Glu Leu Pro Glu Asp

65 70 75 80

Ala Glu Ala Thr Thr Asp Val His Pro Glu Asp Ile Pro Tyr Leu Lys

85 90 95

Lys Ala Ser Asp Gly Leu Gln Pro Glu Val Thr Glu Phe Leu Glu Gln

100 105 110

His Ser Pro Asp Trp Ile Ile Tyr Asp Tyr Thr His Tyr Trp Leu Pro

115 120 125

Ser Ile Ala Thr Lys His Gly Val Ser Arg Ala His Phe Ser Val Thr

130 135 140

Thr Pro Trp Ala Ile Ala Tyr Met Gly Pro Thr Ala Asp Ala Met Ile

145 150 155 160

Asn Gly Ser Asp Gly Arg Thr Thr Pro Glu Asp Phe Thr Val Pro Pro

165 170 175

Lys Trp Phe Pro Phe Pro Thr Lys Val Cys Trp Arg Lys His Asp Leu

180 185 190

Ala Arg Leu Val Pro Tyr Lys Ala Pro Gly Ile Ser Asp Gly Tyr Arg

195 200 205

Met Gly Leu Val Leu Lys Gly Ser Asp Leu Leu Leu Ser Arg Ser Tyr

210 215 220

His Glu Phe Gly Thr Glu Trp Leu Arg Leu Leu Glu Thr Leu His Arg

225 230 235 240

Val Pro Val Val Pro Val Gly Leu Leu Pro Pro Glu Ile Pro Gly Asp

245 250 255

Gly Glu Asp Glu Ser Trp Val Ser Ile Lys Asp Trp Leu Asp Lys Lys

260 265 270

Glu Lys Gly Ser Val Val Tyr Val Ala Leu Gly Ser Glu Val Leu Val

275 280 285

Ser Gln Glu Glu Leu Asn Glu Leu Ala Leu Gly Leu Glu Leu Ser Gly

290 295 300

Leu Pro Phe Val Trp Ala Tyr Arg Lys Pro Lys Gly Pro Ala Lys Ser

305 310 315 320

Asp Ser Val Glu Leu Pro Asp Gly Phe Glu Glu Arg Thr Arg Gly Arg

325 330 335

Gly Val Val Trp Thr Ser Trp Ala Pro Gln Leu Arg Ile Leu Ser His

340 345 350

Glu Ser Val Gly Gly Phe Val Thr His Cys Gly Ser Gly Ser Ile Val

355 360 365

Glu Gly Leu Met Phe Gly His Pro Leu Ile Met Leu Pro Ile Phe Gly

370 375 380

Asp Gln Pro Leu Asn Ala Arg Leu Leu Glu Asp Lys Gln Val Gly Ile

385 390 395 400

Glu Ile Pro Arg Asn Glu Glu Asp Gly Cys Leu Thr Lys Glu Ser Val

405 410 415

Ala Glu Ser Leu Arg Leu Val Val Val Glu Lys Glu Gly Glu Ile Tyr

420 425 430

Arg Glu Lys Ala Arg Glu Met Ser Lys Val Tyr Ser Asp Thr Lys Arg

435 440 445

Glu Lys Glu Tyr Val Asp Gln Phe Val Asp Tyr Leu Glu Lys Asn Ala

450 455 460

Arg Ala Val Ala Ile Asp His Glu Ser

465 470

<210> 12

<211> 1419

<212> DNA

<213> 人工序列()

<220>

<223> UGT2_5b CpO用于酿酒酵母

<400> 12

atggccactt ctgactccat cgttgatgac agaaagaagt tgcacatcgt tatgttccca 60

tggttagctt tcggtcacat tatcccatac ttggaattgt ccaaattgat tgctcaaaag 120

ggtcacaaag tctctttctt gtccaccacc aagaacatcg acagattatc ttctcacatt 180

tctccattga tcaacgttgt ccaattgact ttaccaagag ttcaagaatt gccagaagat 240

gctgaagcta ccaccgatgt ccatccagaa gatatcccat acttgaagaa ggcttctgat 300

ggtttgcaac cagaagtcac tgaattcttg gaacaacact ctccagactg gattatctac 360

gactacactc actactggtt accatccatt gctactaagc acggtgtttc tcgtgctcat 420

ttctccgtta ccactccatg ggctattgct tacatgggtc caactgctga tgctatgatc 480

aacggttctg atggtagaac cactccagaa gacttcaccg ttccaccaaa atggttccca 540

ttcccaacca aggtctgttg gagaaagcac gatttggcca gattagttcc atacaaggcc 600

ccaggtatct ctgacggtta cagaatgggt ttagtcttga agggttctga cttgttgttg 660

tccagatctt accatgaatt cggtactgaa tggttaagat tgttggaaac tttgcacaga 720

gtcccagttg ttccagttgg tttgttgcct cctgaaatcc caggtgacgg tgaagacgaa 780

tcttgggttt ccatcaagga ctggttagat aagaaggaaa agggttccgt tgtctacgtt 840

gctttgggtt ctgaagtctt ggtttctcaa gaagaattga acgaattggc tttgggtttg 900

gaattgtccg gtctaccatt tgtctgggct tacagaaagc caaagggtcc agctaagtct 960

gactctgttg aattgccaga tggtttcgaa gaaagaacca gaggtagagg tgttgtctgg 1020

acttcctggg ctccacaatt gagaattttg tcccacgaat ctgttggtgg tttcgttacc 1080

cactgtggtt ctggttccat tgtcgaaggt ttgatgttcg gtcacccatt gatcatgttg 1140

ccaatcttcg gtgaccaacc attgaacgct agattattgg aagacaagca agtcggtatt 1200

gaaatcccaa gaaacgaaga agacggttgt ttgaccaagg aatctgttgc cgaatctcta 1260

agattggttg ttgtcgaaaa ggaaggtgaa atctacagag aaaaggctag agaaatgtcc 1320

aaggtttact ctgataccaa gagagaaaag gaatatgtcg accaatttgt tgactacttg 1380

gaaaagaacg ctcgtgccgt tgccattgac cacgaaagc 1419

<210> 13

<211> 1419

<212> DNA

<213> 人工序列()

<220>

<223> UGT2_5b CpO用于解脂耶氏酵母

<400> 13

atggccacct ccgactccat tgtcgacgac cgaaagaagc tccacattgt catgttcccc 60

tggctcgcct tcggccacat catcccttac ctggagctgt ccaagctcat tgcccagaag 120

ggccacaagg tttctttcct ctccaccacc aagaacattg accgactctc ctcccacatc 180

tctcctctca tcaacgttgt ccagctcacc ctcccccgag tccaggagct tcccgaggat 240

gctgaggcca ccaccgacgt ccaccccgag gacatcccct acctcaagaa ggcctccgat 300

ggcctccagc ccgaggtcac cgagttcctc gagcagcact cccccgactg gatcatctac 360

gactacaccc actactggct cccctccatt gccaccaagc acggtgtctc tcgagcccac 420

ttctccgtca ccaccccctg ggccattgcc tacatgggtc ccactgccga cgccatgatc 480

aacggttccg acggccgaac cacccccgag gatttcactg tccctcccaa gtggttcccc 540

ttccccacca aggtctgctg gcgaaagcac gacctcgctc gactcgtccc ctacaaggcc 600

cccggtatct ccgacggtta ccgaatgggt ctggttctca agggctccga tctcctcctc 660

tctcgatctt accacgagtt tggtactgag tggctccgac tgctcgagac tctccaccga 720

gtccccgttg tccccgtcgg cctcctccct cccgagatcc ccggtgatgg tgaggacgag 780

tcttgggttt ccatcaagga ctggctcgac aagaaggaga agggctctgt tgtctacgtt 840

gctctcggtt ccgaggtcct tgtctctcaa gaggagctta acgagcttgc tctgggcctc 900

gagctgtccg gcctcccctt cgtctgggcc taccgaaagc ccaagggtcc cgccaagtcc 960

gactccgtcg agctgcccga cggtttcgag gagcgaaccc gaggccgagg tgttgtctgg 1020

acctcttggg ctccccagct ccgaatcctc tcccacgagt ccgtcggtgg ctttgtcacc 1080

cactgcggtt ccggctccat cgtcgagggt ctgatgtttg gccaccccct catcatgctc 1140

cccatcttcg gtgaccagcc cctcaacgcc cgactccttg aggacaagca ggtcggtatt 1200

gagatccccc gaaacgagga agatggttgt ctgaccaagg agtctgttgc tgagtctctg 1260

cgactcgttg ttgtcgagaa agagggtgag atctaccggg agaaggcccg agagatgtcc 1320

aaggtctact ccgacaccaa gcgagagaag gagtacgtcg accagttcgt cgactacctc 1380

gagaagaacg cccgagctgt tgccattgac cacgaatcc 1419

<210> 14

<211> 473

<212> PRT

<213> 人工序列()

<220>

<223> UGT2_6b变体

<400> 14

Met Ala Thr Ser Asp Ser Ile Val Asp Asp Arg Lys Lys Leu His Ile

1 5 10 15

Val Met Phe Pro Trp Leu Ala Phe Gly His Ile Ile Pro Tyr Leu Glu

20 25 30

Leu Ser Lys Leu Ile Ala Gln Lys Gly His Lys Val Ser Phe Leu Ser

35 40 45

Thr Thr Lys Asn Ile Asp Arg Leu Ser Ser His Ile Ser Pro Leu Ile

50 55 60

Asn Val Val Gln Leu Thr Leu Pro Arg Val Gln Glu Leu Pro Glu Asp

65 70 75 80

Ala Glu Ala Thr Thr Asp Val His Pro Glu Asp Ile Pro Tyr Leu Lys

85 90 95

Lys Ala Ser Asp Gly Leu Gln Pro Glu Val Thr Glu Phe Leu Glu Gln

100 105 110

His Ser Pro Asp Trp Ile Ile Tyr Asp Tyr Thr His Tyr Trp Leu Pro

115 120 125

Ser Ile Ala Thr Lys His Gly Val Ser Arg Ala His Phe Ser Val Thr

130 135 140

Thr Pro Trp Ala Ile Ala Tyr Met Gly Pro Thr Ala Asp Ala Met Ile

145 150 155 160

Asn Gly Ser Asp Gly Arg Thr Thr Pro Glu Asp Phe Thr Val Pro Pro

165 170 175

Lys Trp Phe Pro Phe Pro Thr Lys Val Cys Trp Arg Lys His Asp Leu

180 185 190

Ala Arg Leu Val Pro Tyr Lys Ala Pro Gly Ile Ser Asp Gly Tyr Arg

195 200 205

Met Gly Leu Val Ile Lys Gly Cys Asp Cys Leu Leu Ser Lys Thr Tyr

210 215 220

His Glu Phe Gly Thr Gln Trp Leu Arg Leu Leu Glu Thr Leu His Arg

225 230 235 240

Lys Pro Val Ile Pro Val Gly Leu Leu Pro Pro Ser Ile Pro Gly Ser

245 250 255

Asp Lys Asp Asp Ser Trp Val Ser Ile Lys Glu Trp Leu Asp Gly Gln

260 265 270

Glu Lys Gly Ser Val Val Tyr Val Ala Leu Gly Ser Glu Val Leu Val

275 280 285

Thr Gln Asp Glu Val Val Glu Leu Ala His Gly Leu Glu Leu Ser Gly

290 295 300

Leu Pro Phe Val Trp Ala Tyr Arg Asn Pro Lys Gly Pro Ala Lys Ser

305 310 315 320

Asp Ser Val Glu Leu Pro Asp Gly Phe Val Glu Arg Val Arg Asp Arg

325 330 335

Gly Leu Val Trp Thr Ser Trp Ala Pro Gln Leu Arg Ile Leu Ser His

340 345 350

Glu Ser Val Cys Gly Phe Leu Thr His Cys Gly Ser Gly Ser Ile Val

355 360 365

Glu Gly Leu Met Phe Gly His Pro Leu Ile Met Leu Pro Ile Phe Gly

370 375 380

Asp Gln Pro Leu Asn Ala Arg Leu Leu Glu Asp Lys Gln Val Gly Ile

385 390 395 400

Glu Ile Pro Arg Asn Glu Glu Asp Gly Ser Phe Thr Arg Asp Ser Val

405 410 415

Ala Glu Ser Leu Arg Leu Val Met Val Glu Glu Glu Gly Lys Ile Tyr

420 425 430

Arg Glu Lys Ala Lys Glu Met Ser Lys Leu Phe Gly Asp Lys Asp Leu

435 440 445

Gln Asp Gln Tyr Val Asp Asp Phe Val Glu Tyr Leu Gln Lys His Arg

450 455 460

Arg Ala Val Ala Ile Asp His Glu Ser

465 470

<210> 15

<211> 1419

<212> DNA

<213> 人工序列()

<220>

<223> UGT2_6b CpO用于酿酒酵母

<400> 15

atggccactt ctgactccat cgttgatgac agaaagaagt tgcacatcgt tatgttccca 60

tggttagctt tcggtcacat tatcccatac ttggaattgt ccaaattgat tgctcaaaag 120

ggtcacaaag tctctttctt gtccaccacc aagaacatcg acagattatc ttctcacatt 180

tctccattga tcaacgttgt ccaattgact ttaccaagag ttcaagaatt gccagaagat 240

gctgaagcta ccaccgatgt ccatccagaa gatatcccat acttgaagaa ggcttctgat 300

ggtttgcaac cagaagtcac tgaattcttg gaacaacact ctccagactg gattatctac 360

gactacactc actactggtt accatccatt gctactaagc acggtgtttc tcgtgctcat 420

ttctccgtta ccactccatg ggctattgct tacatgggtc caactgctga tgctatgatc 480

aacggttctg atggtagaac cactccagaa gacttcaccg ttccaccaaa atggttccca 540

ttcccaacca aggtctgttg gagaaagcac gatttggcca gattagttcc atacaaggcc 600

ccaggtatct ctgacggtta cagaatgggt ttagtcatca agggttgtga ctgtttgttg 660

tccaagactt accatgaatt cggtactcaa tggttaagat tgttggaaac tttgcacaga 720

aagccagtta tcccagttgg tttgttgcct ccttctatcc caggttctga caaggacgac 780

tcttgggttt ccatcaagga atggttagat ggtcaagaaa agggttccgt tgtctacgtt 840

gctttgggtt ctgaagtctt ggttactcaa gacgaagttg ttgaattggc tcacggtttg 900

gaattgtccg gtctaccatt tgtctgggct tacagaaacc caaagggtcc agctaagtct 960

gactctgttg aattgccaga tggtttcgtc gaaagagtta gagacagagg tttggtctgg 1020

acttcctggg ctccacaatt gagaattttg tcccacgaat ctgtttgtgg tttcttgact 1080

cactgtggtt ctggttctat cgtcgaaggt ttgatgttcg gtcatccttt gatcatgttg 1140

cctatctttg gtgaccaacc attgaacgct agattgttgg aagacaagca agttggtatt 1200

gaaattccaa gaaacgaaga agatggttct ttcaccagag actctgttgc tgaatctttg 1260

agattagtca tggttgaaga agaaggtaag atctacagag aaaaggccaa ggaaatgtcc 1320

aagttgtttg gtgacaaaga tttgcaagac caatacgtcg atgacttcgt cgaatacttg 1380

caaaagcacc gtcgtgccgt tgccattgac cacgaatca 1419

<210> 16

<211> 1419

<212> DNA

<213> 人工序列()

<220>

<223> UGT2_6b CpO用于解脂耶氏酵母

<400> 16

atggctactt ccgactccat tgtcgacgac cgaaagaagc tccacattgt catgttcccc 60

tggctcgcct ttggccacat cattccctac ctcgagcttt ccaagctcat tgcccagaag 120

ggccacaagg tttctttcct ctccaccacc aagaacattg accgactctc ctcccacatc 180

tctcctctca tcaacgttgt ccagctcacc ctcccccgag tccaggagct gcccgaggac 240

gccgaggcca ccaccgatgt ccaccccgag gatatcccct acctcaagaa ggcctccgac 300

ggtctgcagc ccgaggtcac cgagttcctc gagcagcact ctcccgactg gatcatctac 360

gactacaccc actactggct cccctccatt gccaccaagc acggtgtctc tcgagcccac 420

ttctccgtca ccaccccctg ggccattgcc tacatgggcc ccactgctga cgccatgatc 480

aacggttccg atggccgaac cacccccgag gacttcactg tccctcccaa gtggttcccc 540

ttccccacca aggtctgctg gcgaaagcac gatctggccc gactcgttcc ctacaaggcc 600

cccggtatct ccgacggcta ccgaatgggt ctggtcatca agggctgcga ctgtctgctc 660

tccaagacct accacgagtt tggcacccag tggctccgac tcctcgagac tctccaccga 720

aagcccgtca tccccgtcgg tctgctccct ccctccatcc ccggctccga caaggacgac 780

tcttgggttt ccatcaagga gtggctcgac ggccaggaga agggctctgt tgtctacgtt 840

gctctcggtt ccgaggttct cgtcacccag gacgaggttg ttgagctggc ccacggtctg 900

gagctgtccg gcctcccctt cgtctgggct taccgaaacc ccaagggtcc cgccaagtcc 960

gactccgtcg agcttcccga tggtttcgtc gagcgagtcc gagatcgagg tctggtctgg 1020

acctcttggg ctccccagct ccgaatcctc tcccacgagt ccgtctgtgg tttcctcacc 1080

cactgcggtt ccggctccat cgtcgagggt ctgatgttcg gccaccccct catcatgctc 1140

cccatcttcg gtgaccagcc cctcaacgcc cgactccttg aggacaagca ggtcggtatc 1200

gagatccccc gaaacgaaga ggacggttcc ttcacccgag actctgttgc tgagtctctc 1260

cgactcgtca tggtcgagga agagggtaag atctaccgag agaaggccaa ggagatgtcc 1320

aagctgttcg gtgacaagga tctccaggac cagtacgtcg acgactttgt cgagtacctc 1380

cagaagcacc gacgagctgt tgccattgac cacgagtct 1419

<210> 17

<211> 473

<212> PRT

<213> 人工序列()

<220>

<223> UGT2_7b变体

<400> 17

Met Ala Thr Ser Asp Ser Ile Val Asp Asp Arg Lys Lys Leu His Ile

1 5 10 15

Val Met Phe Pro Trp Leu Ala Phe Gly His Ile Ile Pro Tyr Leu Glu

20 25 30

Leu Ser Lys Leu Ile Ala Gln Lys Gly His Lys Val Ser Phe Leu Ser

35 40 45

Thr Thr Lys Asn Ile Asp Arg Leu Ser Ser His Ile Ser Pro Leu Ile

50 55 60

Asn Val Val Gln Leu Thr Leu Pro Arg Val Gln Glu Leu Pro Glu Asp

65 70 75 80

Ala Glu Ala Thr Thr Asp Val His Pro Glu Asp Ile Pro Tyr Leu Lys

85 90 95

Lys Ala Ser Asp Gly Leu Gln Pro Glu Val Thr Glu Phe Leu Glu Gln

100 105 110

His Ser Pro Asp Trp Ile Ile Tyr Asp Tyr Thr His Tyr Trp Leu Pro

115 120 125

Glu Ile Ala Lys Ser Leu Gly Val Ser Arg Ala His Phe Ser Val Thr

130 135 140

Thr Pro Trp Ala Ile Ala Tyr Ile Gly Pro Thr Ala Asp Ala Met Ile

145 150 155 160

Asn Gly Ser Asp Tyr Arg Thr Glu Leu Glu Asp Phe Thr Val Pro Pro

165 170 175

Lys Trp Phe Pro Phe Pro Thr Thr Val Cys Trp Arg Lys His Asp Leu

180 185 190

Ala Arg Leu Val Pro Tyr Lys Ala Pro Gly Ile Ser Asp Gly Tyr Arg

195 200 205

Met Gly Leu Val Ile Lys Gly Cys Asp Cys Leu Leu Ser Lys Thr Tyr

210 215 220

His Glu Phe Gly Thr Gln Trp Leu Arg Leu Leu Glu Thr Leu His Arg

225 230 235 240

Lys Pro Val Ile Pro Val Gly Leu Leu Pro Pro Ser Ile Pro Gly Ser

245 250 255

Asp Lys Asp Asp Ser Trp Val Ser Ile Lys Glu Trp Leu Asp Gly Gln

260 265 270

Glu Lys Gly Ser Val Val Tyr Val Ala Leu Gly Ser Glu Val Leu Val

275 280 285

Thr Gln Asp Glu Val Val Glu Leu Ala His Gly Leu Glu Leu Ser Gly

290 295 300

Leu Pro Phe Val Trp Ala Tyr Arg Asn Pro Lys Gly Pro Ala Lys Ser

305 310 315 320

Asp Ser Val Glu Leu Pro Asp Gly Phe Val Glu Arg Val Arg Asp Arg

325 330 335

Gly Leu Val Trp Thr Ser Trp Ala Pro Gln Leu Arg Ile Leu Ser His

340 345 350

Glu Ser Val Cys Gly Phe Leu Thr His Cys Gly Ser Gly Ser Ile Val

355 360 365

Glu Gly Leu Met Phe Gly His Pro Leu Ile Met Leu Pro Ile Phe Gly

370 375 380

Asp Gln Pro Leu Asn Ala Arg Leu Leu Glu Asp Lys Gln Val Gly Ile

385 390 395 400

Glu Ile Pro Arg Asn Glu Glu Asp Gly Ser Phe Thr Arg Asp Ser Val

405 410 415

Ala Glu Ser Leu Arg Leu Val Met Val Glu Glu Glu Gly Lys Ile Tyr

420 425 430

Arg Glu Lys Ala Lys Glu Met Ser Lys Leu Phe Gly Asp Lys Asp Leu

435 440 445

Gln Asp Gln Tyr Val Asp Asp Phe Val Glu Tyr Leu Gln Lys His Arg

450 455 460

Arg Ala Val Ala Ile Asp His Glu Ser

465 470

<210> 18

<211> 1419

<212> DNA

<213> 人工序列()

<220>

<223> UGT2_7b CpO用于酿酒酵母

<400> 18

atggccactt ctgactccat cgttgatgac agaaagaagt tgcacatcgt tatgttccca 60

tggttagctt tcggtcacat tatcccatac ttggaattgt ccaaattgat tgctcaaaag 120

ggtcacaaag tctctttctt gtccaccacc aagaacatcg acagattatc ttctcacatt 180

tctccattga tcaacgttgt ccaattgact ttaccaagag ttcaagaatt gccagaagat 240

gctgaagcta ccaccgatgt ccatccagaa gatatcccat acttgaagaa ggcttctgat 300

ggtttgcaac cagaagtcac tgaattcttg gaacaacact ctccagactg gattatctac 360

gactacactc actactggtt accagaaatt gctaagtctt tgggtgtttc tcgtgctcat 420

ttctccgtta ccactccatg ggctattgct tacattggtc caactgctga tgctatgatc 480

aacggttctg attacagaac cgaattggaa gacttcaccg ttccaccaaa atggttccca 540

ttcccaacca ctgtctgttg gagaaagcac gatttggcca gattagttcc atacaaggcc 600

ccaggtatct ctgacggtta cagaatgggt ttagtcatca agggttgtga ctgtttgttg 660

tccaagactt accatgaatt cggtactcaa tggttaagat tgttggaaac tttgcacaga 720

aagccagtta tcccagttgg tttgttgcct ccttctatcc caggttctga caaggacgac 780

tcttgggttt ccatcaagga atggttagat ggtcaagaaa agggttccgt tgtctacgtt 840

gctttgggtt ctgaagtctt ggttactcaa gacgaagttg ttgaattggc tcacggtttg 900

gaattgtccg gtctaccatt tgtctgggct tacagaaacc caaagggtcc agctaagtct 960

gactctgttg aattgccaga tggtttcgtc gaaagagtta gagacagagg tttggtctgg 1020

acttcctggg ctccacaatt gagaattttg tcccacgaat ctgtttgtgg tttcttgact 1080

cactgtggtt ctggttctat cgtcgaaggt ttgatgttcg gtcatccttt gatcatgttg 1140

cctatctttg gtgaccaacc attgaacgct agattgttgg aagacaagca agttggtatt 1200

gaaattccaa gaaacgaaga agatggttct ttcaccagag actctgttgc tgaatctttg 1260

agattagtca tggttgaaga agaaggtaag atctacagag aaaaggccaa ggaaatgtcc 1320

aagttgtttg gtgacaaaga tttgcaagac caatacgtcg atgacttcgt cgaatacttg 1380

caaaagcacc gtcgtgccgt tgccattgac cacgaatca 1419

<210> 19

<211> 1419

<212> DNA

<213> 人工序列()

<220>

<223> UGT2_7b CpO用于解脂耶氏酵母

<400> 19

atggccacct ccgactccat tgttgacgac cgaaagaagc tccacattgt catgttcccc 60

tggctcgcct tcggccacat cattccctac ctcgagcttt ccaagctcat tgcccagaag 120

ggccacaagg tttctttcct ctccaccacc aagaacattg accgactctc ctcccacatc 180

tctcctctca tcaacgttgt ccagctcacc ctcccccgag tccaggagct gcccgaggat 240

gctgaggcca ccaccgacgt ccaccccgag gatatcccct acctcaagaa ggcctccgat 300

ggtctgcagc ccgaggtcac cgagttcctc gagcagcact ctcccgactg gatcatctac 360

gactacaccc actactggct ccccgagatt gccaagtctc tcggtgtctc tcgagcccac 420

ttctccgtca ccaccccctg ggccattgct tacatcggtc ccactgctga cgccatgatc 480

aacggctccg actaccgaac tgaactcgag gacttcactg ttcctcccaa gtggttcccc 540

ttccccacca ccgtctgctg gcgaaagcac gatctcgccc gactggtccc ctacaaggct 600

cccggtatct ccgacggcta ccgaatgggt ctggtcatca agggttgcga ctgtctgctc 660

tccaagacct accacgagtt tggcacccag tggctgcgac tcctcgagac tctccaccga 720

aagcccgtca tccccgtcgg tctgctgccc ccttccatcc ccggttccga caaggacgac 780

tcttgggttt ccatcaagga gtggctcgac ggccaggaga agggctctgt tgtctacgtt 840

gctctcggct ccgaggttct cgtcacccag gacgaggttg tcgagctggc ccacggtctg 900

gagctgtccg gtctgccctt cgtctgggcc taccgaaacc ccaagggccc cgccaagtcc 960

gactccgtcg agcttcccga tggtttcgtc gagcgagtcc gagatcgagg tctggtctgg 1020

acctcttggg ctccccagct ccgaatcctc tcccacgagt ccgtctgcgg tttcctcacc 1080

cactgtggtt ccggctccat tgtcgagggt ctgatgttcg gccaccccct catcatgctc 1140

cccatcttcg gtgaccagcc cctcaacgcc cgactccttg aggacaagca ggtcggtatc 1200

gagatccccc gaaacgaaga ggacggctct ttcacccgag actccgttgc cgagtctctc 1260

cgactcgtca tggtcgagga agagggtaag atctaccgag agaaggccaa ggagatgtcc 1320

aagctctttg gtgacaagga tctccaggac cagtacgtcg acgactttgt cgagtacctc 1380

cagaagcacc gacgagctgt tgccatcgac cacgagtcg 1419

<210> 20

<211> 473

<212> PRT

<213> 人工序列()

<220>

<223> UGT2_8b

<400> 20

Met Ala Thr Ser Asp Ser Ile Val Asp Asp Arg Lys Gln Leu His Ile

1 5 10 15

Val Met Phe Pro Trp Leu Ala Phe Gly His Ile Ile Pro Tyr Leu Glu

20 25 30

Leu Ser Lys Leu Ile Ala Glu Lys Gly His Lys Val Ser Phe Leu Ser

35 40 45

Thr Pro Lys Asn Ile Gln Arg Leu Ser Ser His Leu Ser Pro Leu Ile

50 55 60

Asn Val Val Gln Leu Pro Leu Pro Arg Val Gln Glu Leu Pro Glu Asp

65 70 75 80

Ala Glu Ala Thr Thr Asp Val His Pro Glu Asp Ile Pro Tyr Leu Lys

85 90 95

Lys Ala Ser Asp Gly Leu Gln Pro Glu Val Thr Glu Phe Leu Glu Gln

100 105 110

His Ser Pro Asp Trp Ile Ile Tyr Asp Tyr Thr His Tyr Trp Leu Pro

115 120 125

Ser Ile Ala Thr Lys His Gly Val Ser Arg Ala His Phe Ser Val Thr

130 135 140

Thr Pro Trp Ala Ile Ala Tyr Met Gly Pro Thr Ala Asp Ala Met Ile

145 150 155 160

Asn Gly Ser Asp Gly Arg Thr Thr Pro Glu Asp Phe Thr Val Pro Pro

165 170 175

Lys Trp Phe Pro Phe Pro Thr Lys Val Cys Trp Arg Lys His Asp Leu

180 185 190

Ala Arg Leu Val Pro Tyr Lys Ala Pro Gly Ile Ser Asp Gly Tyr Arg

195 200 205

Met Gly Leu Val Ile Lys Gly Cys Asp Cys Leu Leu Ser Lys Thr Tyr

210 215 220

His Glu Phe Gly Thr Gln Trp Leu Arg Leu Leu Glu Thr Leu His Arg

225 230 235 240

Lys Pro Val Ile Pro Val Gly Leu Leu Pro Pro Ser Ile Pro Gly Ser

245 250 255

Asp Lys Asp Asp Ser Trp Val Ser Ile Lys Glu Trp Leu Asp Gly Gln

260 265 270

Glu Lys Gly Ser Val Val Tyr Val Ala Leu Gly Ser Glu Val Leu Val

275 280 285

Thr Gln Asp Glu Val Val Glu Leu Ala His Gly Leu Glu Leu Ser Gly

290 295 300

Leu Pro Phe Val Trp Ala Tyr Arg Asn Pro Lys Gly Pro Ala Lys Ser

305 310 315 320

Asp Ser Val Glu Leu Pro Asp Gly Phe Val Glu Arg Val Arg Asp Arg

325 330 335

Gly Leu Val Trp Thr Ser Trp Ala Pro Gln Leu Arg Ile Leu Ser His

340 345 350

Glu Ser Val Cys Gly Phe Leu Thr His Cys Gly Ser Gly Ser Ile Val

355 360 365

Glu Gly Leu Met Phe Gly His Pro Leu Ile Met Leu Pro Ile Phe Gly

370 375 380

Asp Gln Pro Leu Asn Ala Arg Leu Leu Glu Asp Lys Gln Val Gly Ile

385 390 395 400

Glu Ile Pro Arg Asn Glu Glu Asp Gly Ser Phe Thr Arg Asp Ser Val

405 410 415

Ala Glu Ser Leu Arg Leu Val Met Val Glu Glu Glu Gly Lys Ile Tyr

420 425 430

Arg Glu Lys Ala Lys Glu Met Ser Lys Leu Phe Gly Asp Lys Asp Leu

435 440 445

Gln Asp Gln Tyr Val Asp Asp Phe Val Glu Tyr Leu Gln Lys His Arg

450 455 460

Arg Ala Val Ala Ile Asp His Glu Ser

465 470

<210> 21

<211> 1419

<212> DNA

<213> 人工序列()

<220>

<223> UGT_8b CpO用于酿酒酵母

<400> 21

atggccactt ctgactccat cgttgatgac agaaagcaat tgcacatcgt tatgttccca 60

tggttagctt tcggtcacat tatcccatac ttggaattgt ccaaattgat tgctgaaaag 120

ggtcacaaag tctctttctt gtccacccca aagaacatcc aaagattatc ttctcacttg 180

tctccattga tcaacgttgt ccaattgcca ttaccaagag ttcaagaatt gccagaagat 240

gctgaagcta ccaccgatgt ccatccagaa gatatcccat acttgaagaa ggcttctgat 300

ggtttgcaac cagaagtcac tgaattcttg gaacaacact ctccagactg gattatctac 360

gactacactc actactggtt accatccatt gctactaagc acggtgtttc tcgtgctcat 420

ttctccgtta ccactccatg ggctattgct tacatgggtc caactgctga tgctatgatc 480

aacggttctg atggtagaac cactccagaa gacttcaccg ttccaccaaa atggttccca 540

ttcccaacca aggtctgttg gagaaagcac gatttggcca gattagttcc atacaaggcc 600

ccaggtatct ctgacggtta cagaatgggt ttagtcatca agggttgtga ctgtttgttg 660

tccaagactt accatgaatt cggtactcaa tggttaagat tgttggaaac tttgcacaga 720

aagccagtta tcccagttgg tttgttgcct ccttctatcc caggttctga caaggacgac 780

tcttgggttt ccatcaagga atggttagat ggtcaagaaa agggttccgt tgtctacgtt 840

gctttgggtt ctgaagtctt ggttactcaa gacgaagttg ttgaattggc tcacggtttg 900

gaattgtccg gtctaccatt tgtctgggct tacagaaacc caaagggtcc agctaagtct 960

gactctgttg aattgccaga tggtttcgtc gaaagagtta gagacagagg tttggtctgg 1020

acttcctggg ctccacaatt gagaattttg tcccacgaat ctgtttgtgg tttcttgact 1080

cactgtggtt ctggttctat cgtcgaaggt ttgatgttcg gtcatccttt gatcatgttg 1140

cctatctttg gtgaccaacc attgaacgct agattgttgg aagacaagca agttggtatt 1200

gaaattccaa gaaacgaaga agatggttct ttcaccagag actctgttgc tgaatctttg 1260

agattagtca tggttgaaga agaaggtaag atctacagag aaaaggccaa ggaaatgtcc 1320

aagttgtttg gtgacaaaga tttgcaagac caatacgtcg atgacttcgt cgaatacttg 1380

caaaagcacc gtcgtgccgt tgccattgac cacgaatca 1419

<210> 22

<211> 473

<212> PRT

<213> 人工序列()

<220>

<223> UGT2_9b变体

<400> 22

Met Ala Thr Ser Asp Ser Ile Val Asp Asp Arg Lys Lys Leu His Ile

1 5 10 15

Val Met Phe Pro Trp Leu Ala Phe Gly His Ile Ile Pro Tyr Leu Gln

20 25 30

Leu Ser Lys Leu Leu Ala Gln Lys Gly His Lys Val Ser Phe Ile Ser

35 40 45

Thr Pro Arg Asn Ile Gln Arg Leu Ser Ser His Ile Ser Pro Leu Ile

50 55 60

Asn Leu Val Gln Leu Pro Leu Pro Arg Val Asp Asn Leu Pro Glu Asp

65 70 75 80

Ala Glu Ala Thr Thr Asp Val His Pro Glu Asp Ile Pro Tyr Leu Lys

85 90 95

Lys Ala Ser Asp Gly Leu Gln Pro Glu Val Thr Glu Phe Leu Glu Gln

100 105 110

His Ser Pro Asp Trp Ile Ile Tyr Asp Tyr Thr His Tyr Trp Leu Pro

115 120 125

Glu Ile Ala Lys Ser Leu Gly Val Ser Arg Ala His Phe Ser Val Thr

130 135 140

Thr Pro Trp Ala Ile Ala Tyr Met Gly Pro Thr Ala Asp Ala Met Ile

145 150 155 160

Asn Gly Ser Asp Tyr Arg Thr Glu Leu Glu Asp Phe Thr Val Pro Pro

165 170 175

Lys Trp Phe Pro Phe Pro Thr Thr Val Cys Trp Arg Lys His Asp Leu

180 185 190

Ala Arg Leu Val Pro Tyr Lys Ala Pro Gly Ile Ser Asp Gly Tyr Arg

195 200 205

Met Gly Leu Val Leu Lys Gly Ser Asp Leu Leu Leu Ser Arg Ser Tyr

210 215 220

His Glu Phe Gly Thr Glu Trp Leu Arg Leu Leu Glu Thr Leu His Arg

225 230 235 240

Val Pro Val Val Pro Val Gly Leu Leu Pro Pro Glu Ile Pro Gly Asp

245 250 255

Gly Glu Asp Glu Ser Trp Val Ser Ile Lys Asp Trp Leu Asp Lys Lys

260 265 270

Glu Lys Gly Ser Val Val Tyr Val Ala Leu Gly Ser Glu Val Leu Val

275 280 285

Ser Gln Glu Glu Leu Asn Glu Leu Ala Leu Gly Leu Glu Leu Ser Gly

290 295 300

Leu Pro Phe Val Trp Ala Tyr Arg Lys Pro Lys Gly Pro Ala Lys Ser

305 310 315 320

Asp Ser Val Glu Leu Pro Asp Gly Phe Glu Glu Arg Thr Arg Gly Arg

325 330 335

Gly Val Val Trp Thr Ser Trp Ala Pro Gln Leu Arg Ile Leu Ser His

340 345 350

Glu Ser Val Cys Gly Phe Leu Thr His Cys Gly Ser Gly Ser Ile Val

355 360 365

Glu Gly Leu Met Phe Gly His Pro Leu Ile Met Leu Pro Ile Phe Gly

370 375 380

Asp Gln Pro Leu Asn Ala Arg Leu Leu Glu Asp Lys Gln Val Gly Ile

385 390 395 400

Glu Ile Pro Arg Asn Glu Glu Asp Gly Ser Leu Thr Lys Glu Ser Val

405 410 415

Ala Arg Ser Leu Arg Ser Val Val Val Glu Glu Glu Gly Lys Ile Tyr

420 425 430

Arg Glu Lys Ala Lys Glu Met Ser Lys Leu Phe Gly Asp Lys Asp Leu

435 440 445

Gln Asp Gln Tyr Val Asp Asp Phe Val Glu Tyr Leu Gln Lys His Arg

450 455 460

Arg Ala Val Ala Ile Asp His Glu Ser

465 470

<210> 23

<211> 1419

<212> DNA

<213> 人工序列()

<220>

<223> UGT2_9b CpO用于酿酒酵母

<400> 23

atggccactt ctgactccat cgttgatgac agaaagaagt tgcacatcgt tatgttccca 60

tggttagctt tcggtcacat tatcccatac ttgcaattgt ccaaattgtt ggctcaaaag 120

ggtcacaaag tctctttcat ctccacccca agaaacatcc aaagattatc ttctcacatt 180

tctccattga tcaacttggt ccaattgcca ttaccaagag ttgacaactt gccagaagat 240

gctgaagcta ccaccgatgt ccatccagaa gatatcccat acttgaagaa ggcttctgat 300

ggtttgcaac cagaagtcac tgaattcttg gaacaacact ctccagactg gattatctac 360

gactacactc actactggtt accagaaatt gctaagtctt tgggtgtttc tcgtgctcat 420

ttctccgtta ccactccatg ggctattgct tacatgggtc caactgctga tgctatgatc 480

aacggttctg attacagaac cgaattggaa gacttcaccg ttccaccaaa atggttccca 540

ttcccaacca ctgtctgttg gagaaagcac gatttggcca gattagttcc atacaaggcc 600

ccaggtatct ctgacggtta cagaatgggt ttagtcttga agggttctga cttgttgttg 660

tccagatctt accatgaatt cggtactgaa tggttaagat tgttggaaac tttgcacaga 720

gtcccagttg ttccagttgg tttgttgcct cctgaaatcc caggtgacgg tgaagacgaa 780

tcttgggttt ccatcaagga ctggttagat aagaaggaaa agggttccgt tgtctacgtt 840

gctttgggtt ctgaagtctt ggtttctcaa gaagaattga acgaattggc tttgggtttg 900

gaattgtccg gtctaccatt tgtctgggct tacagaaagc caaagggtcc agctaagtct 960

gactctgttg aattgccaga tggtttcgaa gaaagaacca gaggtagagg tgttgtctgg 1020

acttcctggg ctccacaatt gagaattttg tcccacgaat ctgtttgtgg tttcttgact 1080

cactgtggtt ctggttccat tgtcgaaggt ttgatgttcg gtcatccatt gatcatgttg 1140

ccaatctttg gtgaccaacc tttgaacgcc agattattgg aagacaagca agttggtatt 1200

gaaattccaa gaaacgaaga agacggttct ttgaccaagg aatctgttgc cagatctttg 1260

agatctgttg ttgtcgaaga agaaggtaag atctacagag aaaaggccaa ggaaatgtcc 1320

aaattgtttg gtgacaagga tttgcaagat caatatgtcg atgacttcgt cgaatactta 1380

caaaagcacc gtcgtgctgt tgccattgac catgaaagc 1419

<210> 24

<211> 1419

<212> DNA

<213> 人工序列()

<220>

<223> UGT2_9b CpO用于解脂耶氏酵母

<400> 24

atggccacct ccgactccat tgtcgacgac cgaaagaagc tccacattgt catgttcccc 60

tggctcgcct ttggccacat cattccctac ctccagctct ccaagctcct cgcccagaag 120

ggccacaagg tttctttcat ctccactccc cgaaacatcc agcgactctc ctcccacatc 180

tctcctctca tcaacctcgt ccagctcccc ctcccccgag tcgacaacct ccccgaggat 240

gctgaggcca ccaccgatgt ccaccccgag gacatcccct acctcaagaa ggcctccgac 300

ggcctccagc ccgaggtcac cgagttcctc gagcagcact cccccgactg gatcatctac 360

gactacaccc actactggct ccccgagatt gccaagtctc tcggtgtctc tcgagcccac 420

ttctccgtca ccaccccctg ggccattgct tacatgggtc ccactgccga tgccatgatc 480

aacggctccg actaccgaac cgagcttgag gacttcaccg tccctcccaa gtggttcccc 540

ttccccacca ccgtctgctg gcgaaagcac gatctcgccc gactcgtccc ctacaaggct 600

cccggtatct ccgacggtta ccgaatgggc ctcgttctca agggttccga tctgctgctc 660

tcccgatctt accacgagtt tggtactgag tggctgcgac tcctcgagac tctgcaccga 720

gtccccgttg tccccgtcgg tctgctccct cccgagatcc ccggtgacgg tgaggacgag 780

tcttgggttt ccatcaagga ctggctcgac aagaaggaga agggctccgt cgtctacgtt 840

gccctcggct ccgaggttct cgtttcccaa gaggagctta acgagcttgc tctcggcctc 900

gagctgtccg gtctgccctt tgtctgggcc taccgaaagc ccaagggccc cgccaagtcc 960

gactccgtcg agctgcccga cggcttcgag gagcgaaccc gaggtcgagg tgttgtctgg 1020

acctcttggg ctccccagct ccgaatcctc tcccacgagt ccgtctgtgg tttcctgacc 1080

cactgcggtt ccggctctat cgtcgagggt ctgatgttcg gccaccccct catcatgctc 1140

cccatcttcg gtgaccagcc cctcaacgcc cgacttctcg aggacaagca ggtcggtatt 1200

gagatccccc gaaacgaaga ggacggctct ctcaccaagg agtctgttgc tcgatctctg 1260

cgatccgtcg ttgtcgagga agagggtaag atctaccgag agaaggccaa ggagatgtcc 1320

aagctgttcg gtgacaagga tctgcaggac cagtacgtcg acgacttcgt cgagtacctc 1380

cagaagcacc gacgagctgt tgccattgac cacgaatcc 1419

<210> 25

<211> 473

<212> PRT

<213> 人工序列()

<220>

<223> UGT2_10b变体

<400> 25

Met Ala Thr Ser Asp Ser Ile Val Asp Asp Arg Lys Lys Leu His Ile

1 5 10 15

Val Met Phe Pro Trp Leu Ala Phe Gly His Ile Ile Pro Tyr Leu Glu

20 25 30

Leu Ser Lys Leu Ile Ala Gln Lys Gly His Lys Val Ser Phe Leu Ser

35 40 45

Thr Thr Lys Asn Ile Asp Arg Leu Ser Ser His Ile Ser Pro Leu Ile

50 55 60

Asn Phe Val Lys Leu Thr Leu Pro Arg Val Gln Glu Leu Pro Glu Asp

65 70 75 80

Ala Glu Ala Thr Thr Asp Val His Pro Glu Asp Ile Pro Tyr Leu Lys

85 90 95

Lys Ala Ser Asp Gly Leu Gln Pro Glu Val Thr Glu Phe Leu Glu Gln

100 105 110

His Ser Pro Asp Trp Ile Ile Tyr Asp Tyr Thr His Tyr Trp Leu Pro

115 120 125

Glu Ile Ala Lys Ser Leu Gly Val Ser Arg Ala His Phe Ser Val Thr

130 135 140

Thr Pro Trp Ala Ile Ala Tyr Met Gly Pro Thr Ala Asp Ala Met Ile

145 150 155 160

Asn Gly Ser Asp Tyr Arg Thr Glu Leu Glu Asp Phe Thr Val Pro Pro

165 170 175

Lys Trp Phe Pro Phe Pro Thr Thr Val Cys Trp Arg Lys His Asp Leu

180 185 190

Ala Arg Leu Val Pro Tyr Lys Ala Pro Gly Ile Ser Asp Gly Tyr Arg

195 200 205

Met Gly Leu Val Ile Lys Gly Cys Asp Cys Leu Leu Ser Lys Thr Tyr

210 215 220

His Glu Phe Gly Thr Gln Trp Leu Arg Leu Leu Glu Glu Leu His Arg

225 230 235 240

Val Pro Val Ile Pro Val Gly Leu Leu Pro Pro Ser Ile Pro Gly Ser

245 250 255

Asp Lys Asp Asp Ser Trp Val Ser Ile Lys Glu Trp Leu Asp Gly Gln

260 265 270

Glu Lys Gly Ser Val Val Tyr Val Ala Leu Gly Ser Glu Val Leu Val

275 280 285

Thr Gln Glu Glu Val Val Glu Leu Ala His Gly Leu Glu Leu Ser Gly

290 295 300

Leu Pro Phe Phe Trp Ala Tyr Arg Lys Pro Lys Gly Pro Ala Lys Ser

305 310 315 320

Asp Ser Val Glu Leu Pro Asp Gly Phe Val Glu Arg Val Arg Asp Arg

325 330 335

Gly Leu Val Trp Thr Ser Trp Ala Pro Gln Leu Arg Ile Leu Ser His

340 345 350

Glu Ser Val Ala Gly Phe Leu Thr His Cys Gly Ser Gly Ser Ile Val

355 360 365

Glu Gly Leu Met Phe Gly His Pro Leu Ile Met Leu Pro Ile Phe Gly

370 375 380

Asp Gln Pro Leu Asn Ala Arg Leu Leu Glu Asp Lys Gln Val Gly Ile

385 390 395 400

Glu Ile Pro Arg Asn Glu Glu Asp Gly Ser Phe Thr Arg Asp Ser Val

405 410 415

Ala Glu Ser Leu Arg Leu Val Met Val Glu Glu Glu Gly Lys Ile Tyr

420 425 430

Arg Glu Lys Ala Lys Glu Met Ser Lys Leu Phe Gly Asp Lys Asp Leu

435 440 445

Gln Asp Gln Tyr Val Asp Asp Phe Val Glu Tyr Leu Gln Lys His Arg

450 455 460

Arg Ala Val Ala Ile Asp His Glu Ser

465 470

<210> 26

<211> 1419

<212> DNA

<213> 人工序列()

<220>

<223> UGT2_10b CpO用于解脂耶氏酵母

<400> 26

atggccacct ccgactccat tgttgacgac cgaaagaagc tccacattgt catgttcccc 60

tggctcgcct ttggccacat catcccctat ctcgagcttt ccaagctcat tgcccagaag 120

ggccacaagg tttccttcct ctccaccacc aagaacattg accgactctc ctcccacatc 180

tctcccctca tcaactttgt caagctcacc ctcccccgag tccaggagct gcccgaggac 240

gccgaggcca ccactgatgt ccaccccgag gatatcccct acctcaagaa ggcctccgac 300

ggcctccagc ccgaggtcac tgagttcctc gagcagcact ctcccgactg gatcatctac 360

gactacaccc actactggct ccccgagatt gccaagtctc tcggtgtctc tcgagcccac 420

ttctccgtca ccaccccctg ggccattgct tacatgggtc ccactgccga tgccatgatc 480

aacggttccg actaccgaac cgagcttgag gacttcaccg tccctcccaa gtggttcccc 540

ttccccacca ccgtctgctg gcgaaagcac gatctggccc gactcgtccc ctacaaggct 600

cccggtatct ccgacggtta ccgaatgggc ctcgtcatca agggctgcga ctgtctgctc 660

tccaagacct accacgagtt cggtactcag tggctccgac ttctcgagga gctgcaccga 720

gtccccgtca tccccgttgg tctgctccct ccctccatcc ccggctctga caaggacgac 780

tcttgggttt ccatcaagga gtggctcgac ggccaggaga agggctccgt tgtctacgtt 840

gctctcggtt ccgaggttct cgtcacccag gaagaggttg tcgagcttgc tcacggtctg 900

gagctgtccg gtctgccctt cttctgggcc taccgaaagc ccaagggtcc cgccaagtcc 960

gactccgtcg agcttcccga tggtttcgtc gagcgagtcc gagatcgagg tctggtctgg 1020

acctcttggg ctccccagct ccgaatcctc tcccacgagt ccgttgctgg tttcctcacc 1080

cactgcggtt ccggctccat tgtcgagggc ctcatgttcg gccaccctct catcatgctc 1140

cccatcttcg gtgaccagcc cctcaacgcc cgactccttg aggacaagca ggtcggtatc 1200

gagatccccc gaaacgagga agatggttct ttcacccgag actctgttgc cgagtctctg 1260

cgactcgtca tggtcgagga agagggtaag atctaccgag agaaggccaa ggagatgtcc 1320

aagctctttg gcgacaagga cctccaggac cagtacgtcg acgactttgt cgagtacctc 1380

cagaagcacc gacgagctgt tgccattgac cacgaaagc 1419

<210> 27

<211> 473

<212> PRT

<213> 甜叶菊()

<400> 27

Met Ala Thr Ser Asp Ser Ile Val Asp Asp Arg Lys Gln Leu His Val

1 5 10 15

Ala Thr Phe Pro Trp Leu Ala Phe Gly His Ile Leu Pro Tyr Leu Gln

20 25 30

Leu Ser Lys Leu Ile Ala Glu Lys Gly His Lys Val Ser Phe Leu Ser

35 40 45

Thr Thr Arg Asn Ile Gln Arg Leu Ser Ser His Ile Ser Pro Leu Ile

50 55 60

Asn Val Val Gln Leu Thr Leu Pro Arg Val Gln Glu Leu Pro Glu Asp

65 70 75 80

Ala Glu Ala Thr Thr Asp Val His Pro Glu Asp Ile Pro Tyr Leu Lys

85 90 95

Lys Ala Ser Asp Gly Leu Gln Pro Glu Val Thr Arg Phe Leu Glu Gln

100 105 110

His Ser Pro Asp Trp Ile Ile Tyr Asp Tyr Thr His Tyr Trp Leu Pro

115 120 125

Ser Ile Ala Ala Ser Leu Gly Ile Ser Arg Ala His Phe Ser Val Thr

130 135 140

Thr Pro Trp Ala Ile Ala Tyr Met Gly Pro Ser Ala Asp Ala Met Ile

145 150 155 160

Asn Gly Ser Asp Gly Arg Thr Thr Val Glu Asp Leu Thr Thr Pro Pro

165 170 175

Lys Trp Phe Pro Phe Pro Thr Lys Val Cys Trp Arg Lys His Asp Leu

180 185 190

Ala Arg Leu Val Pro Tyr Lys Ala Pro Gly Ile Ser Asp Gly Tyr Arg

195 200 205

Met Gly Leu Val Leu Lys Gly Ser Asp Cys Leu Leu Ser Lys Cys Tyr

210 215 220

His Glu Phe Gly Thr Gln Trp Leu Pro Leu Leu Glu Thr Leu His Gln

225 230 235 240

Val Pro Val Val Pro Val Gly Leu Leu Pro Pro Glu Ile Pro Gly Asp

245 250 255

Glu Lys Asp Glu Thr Trp Val Ser Ile Lys Lys Trp Leu Asp Gly Lys

260 265 270

Gln Lys Gly Ser Val Val Tyr Val Ala Leu Gly Ser Glu Val Leu Val

275 280 285

Ser Gln Thr Glu Val Val Glu Leu Ala Leu Gly Leu Glu Leu Ser Gly

290 295 300

Leu Pro Phe Val Trp Ala Tyr Arg Lys Pro Lys Gly Pro Ala Lys Ser

305 310 315 320

Asp Ser Val Glu Leu Pro Asp Gly Phe Val Glu Arg Thr Arg Asp Arg

325 330 335

Gly Leu Val Trp Thr Ser Trp Ala Pro Gln Leu Arg Ile Leu Ser His

340 345 350

Glu Ser Val Cys Gly Phe Leu Thr His Cys Gly Ser Gly Ser Ile Val

355 360 365

Glu Gly Leu Met Phe Gly His Pro Leu Ile Met Leu Pro Ile Phe Gly

370 375 380

Asp Gln Pro Leu Asn Ala Arg Leu Leu Glu Asp Lys Gln Val Gly Ile

385 390 395 400

Glu Ile Pro Arg Asn Glu Glu Asp Gly Cys Leu Thr Lys Glu Ser Val

405 410 415

Ala Arg Ser Leu Arg Ser Val Val Val Glu Lys Glu Gly Glu Ile Tyr

420 425 430

Lys Ala Asn Ala Arg Glu Leu Ser Lys Ile Tyr Asn Asp Thr Lys Val

435 440 445

Glu Lys Glu Tyr Val Ser Gln Phe Val Asp Tyr Leu Glu Lys Asn Ala

450 455 460

Arg Ala Val Ala Ile Asp His Glu Ser

465 470

<210> 28

<211> 1422

<212> DNA

<213> 人工序列()

<220>

<223> UGT2_1a CpO用于酿酒酵母

<400> 28

atggctacat ctgattctat tgttgatgac aggaagcagt tgcatgtggc tactttccct 60

tggcttgctt tcggtcatat actgccttac ctacaactat caaaactgat agctgaaaaa 120

ggacataaag tgtcattcct ttcaacaact agaaacattc aaagattatc ttcccacata 180

tcaccattga ttaacgtcgt tcaattgaca cttccaagag tacaggaatt accagaagat 240

gctgaagcta caacagatgt gcatcctgaa gatatccctt acttgaaaaa ggcatccgat 300

ggattacagc ctgaggtcac tagattcctt gagcaacaca gtccagattg gatcatatac 360

gactacactc actattggtt gccttcaatt gcagcatcac taggcatttc tagggcacat 420

ttcagtgtaa ccacaccttg ggccattgct tacatgggtc catccgctga tgctatgatt 480

aacggcagtg atggtagaac taccgttgaa gatttgacaa ccccaccaaa gtggtttcca 540

tttccaacta aagtctgttg gagaaaacac gacttagcaa gactggttcc atacaaggca 600

ccaggaatct cagacggcta tagaatgggt ttagtcctta aagggtctga ctgcctattg 660

tctaagtgtt accatgagtt tgggacacaa tggctaccac ttttggaaac attacaccaa 720

gttcctgtcg taccagttgg tctattacct ccagaaatcc ctggtgatga gaaggacgag 780

acttgggttt caatcaaaaa gtggttagac gggaagcaaa aaggctcagt ggtatatgtg 840

gcactgggtt ccgaagtttt agtatctcaa acagaagttg tggaacttgc cttaggtttg 900

gaactatctg gattgccatt tgtctgggcc tacagaaaac caaaaggccc tgcaaagtcc 960

gattcagttg aattgccaga cggctttgtc gagagaacta gagatagagg gttggtatgg 1020

acttcatggg ctccacaatt gagaatcctg agtcacgaat ctgtgtgcgg tttcctaaca 1080

cattgtggtt ctggttctat agttgaagga ctgatgtttg gtcatccact tatcatgttg 1140

ccaatctttg gtgaccagcc tttgaatgca cgtctgttag aagataaaca agttggaatt 1200

gaaatcccac gtaatgagga agatggatgt ttaaccaagg agtctgtggc cagatcatta 1260

cgttccgttg tcgttgaaaa ggaaggcgaa atctacaagg ccaatgcccg tgaactttca 1320

aagatctaca atgacacaaa agtagagaag gaatatgttt ctcaatttgt agattaccta 1380

gagaaaaacg ctagagccgt agctattgat catgaatcct aa 1422

<210> 29

<211> 1422

<212> DNA

<213> 人工序列()

<220>

<223> UGT2_1a CpO用于解脂耶氏酵母

<400> 29

atggccacct ccgactccat tgtcgacgac cgaaagcagc tgcacgttgc caccttcccc 60

tggctcgcct ttggccacat tctgccctac ctccagctct ccaagctcat tgctgagaag 120

ggccacaagg tttctttcct gtccaccacc cgaaacatcc agcgactctc ctcccacatc 180

tctcctctca tcaacgttgt ccagctcacc ctcccccgag tccaggagct ccccgaggat 240

gccgaggcca ccactgatgt ccaccccgag gacatcccct acctcaagaa ggcctccgac 300

ggtctgcagc ccgaggtcac ccgattcctc gagcagcact ctcccgactg gatcatctac 360

gactacaccc actactggct cccctccatt gctgcttctc tcggtatctc tcgagcccac 420

ttctccgtca ccaccccctg ggccattgct tacatgggcc cctctgctga cgccatgatc 480

aacggttccg acggccgaac caccgtcgag gatctcacca cccctcccaa gtggttcccc 540

ttccccacca aggtctgctg gcgaaagcac gatctcgccc gactcgtccc ctacaaggcc 600

cccggtatct ccgacggtta ccgaatgggt ctggttctca agggctccga ctgtctgctc 660

tccaagtgct accacgagtt tggtacccag tggctccccc tgctcgagac tctgcaccag 720

gtccccgttg tccccgtcgg tctgctccct cccgagatcc ccggtgacga gaaggacgag 780

acttgggttt ccatcaagaa gtggctcgac ggcaagcaga agggctccgt cgtctacgtt 840

gctctcggct ccgaggttct tgtctcccag actgaggtcg tcgagctcgc cctcggtctg 900

gagctctccg gtctgccctt cgtctgggcc taccgaaagc ccaagggtcc cgccaagtcc 960

gactccgtcg agctccccga cggtttcgtc gagcgaactc gagatcgagg tctggtctgg 1020

acctcttggg ctccccagct ccgaatcctc tcccacgagt ccgtctgcgg tttcctgacc 1080

cactgtggtt ccggctccat tgtcgagggc ctcatgttcg gccaccccct catcatgctg 1140

cccatcttcg gtgaccagcc cctcaacgcc cgactcctcg aggacaagca ggtcggtatc 1200

gagatccccc gaaacgaaga ggacggctgc ctcaccaagg agtctgttgc ccgatctctg 1260

cgatctgttg ttgtcgagaa agagggtgag atctacaagg ccaacgcccg agagctctcc 1320

aagatctaca acgacaccaa ggtcgagaag gagtacgttt cccagtttgt cgactacctc 1380

gagaagaacg cccgagctgt cgccattgac cacgagagtt aa 1422

<210> 30

<211> 600

<212> DNA

<213> 人工序列()

<220>

<223> ScEno2启动子

<400> 30

gtgtcgacgc tgcgggtata gaaagggttc tttactctat agtacctcct cgctcagcat 60

ctgcttcttc ccaaagatga acgcggcgtt atgtcactaa cgacgtgcac caacttgcgg 120

aaagtggaat cccgttccaa aactggcatc cactaattga tacatctaca caccgcacgc 180

cttttttctg aagcccactt tcgtggactt tgccatatgc aaaattcatg aagtgtgata 240

ccaagtcagc atacacctca ctagggtagt ttctttggtt gtattgatca tttggttcat 300

cgtggttcat taattttttt tctccattgc tttctggctt tgatcttact atcatttgga 360

tttttgtcga aggttgtaga attgtatgtg acaagtggca ccaagcatat ataaaaaaaa 420

aaagcattat cttcctacca gagttgattg ttaaaaacgt atttatagca aacgcaattg 480

taattaattc ttattttgta tcttttcttc ccttgtctca atcttttatt tttattttat 540

ttttcttttc ttagtttctt tcataacacc aagcaactaa tactataaca tacaataata 600

<210> 31

<211> 1056

<212> DNA

<213> 酿酒酵母()

<400> 31

atggcttctg aaaaggaaat cagaagagaa cgtttcttga atgttttccc aaaattggtt 60

gaagaattga acgcttctct attagcttac ggtatgccaa aggaagcttg tgactggtac 120

gctcactctt tgaactacaa caccccaggt ggtaagttga acagaggtct atccgttgtt 180

gacacctacg ccattttgtc caacaagacc gtcgaacaat taggtcaaga agaatacgaa 240

aaggttgcca tcttaggttg gtgtatcgaa ttgttgcaag cttacttctt ggttgctgat 300

gacatgatgg acaaatctat caccagaaga ggtcaaccat gttggtacaa ggttccagaa 360

gtcggtgaaa ttgccatcaa cgatgctttc atgttggaag ctgccatcta caagttgttg 420

aagtctcact tcagaaacga aaagtactac attgacatca ctgaattatt ccacgaagtt 480

actttccaaa ccgaattggg tcaattgatg gacttgatta ccgctccaga agataaggtc 540

gatttgtcca aattttcctt gaagaaacac tctttcattg tcactttcaa gactgcttac 600

tactcctttt acttgcctgt tgctttggcc atgtatgtcg ctggtatcac cgatgaaaag 660

gacttgaagc aagctcgtga tgtcttgatt ccattaggtg aatacttcca aatccaagat 720

gactacttgg actgtttcgg tactccagaa caaatcggta agattggtac tgatatccaa 780

gacaacaagt gttcctgggt tatcaacaag gctttggaat tggcttctgc tgaacaaaga 840

aagactttgg acgaaaacta cggtaagaag gactctgttg ctgaagctaa gtgtaagaag 900

atcttcaacg atttgaaaat tgaacaatta taccatgaat acgaagaatc tattgccaag 960

gacttgaaag ccaagatctc tcaagtcgac gaatccagag gtttcaaggc tgatgtcttg 1020

actgctttct tgaacaaggt ctacaagaga tcaaaa 1056

<210> 32

<211> 301

<212> DNA

<213> 人工序列()

<220>

<223> Adh1终止子

<400> 32

agcgaatttc ttatgattta tgatttttat tattaaataa gttataaaaa aaataagtgt 60

atacaaattt taaagtgact cttaggtttt aaaacgaaaa ttcttattct tgagtaactc 120

tttcctgtag gtcaggttgc tttctcaggt atagcatgag gtcgctctta ttgaccacac 180

ctctaccggc atgccgagca aatgcctgca aatcgctccc catttcaccc aattgtagat 240

atgctaactc cagcaatgag ttgatgaatc tcggtgtgta ttttatgtcc tcagaggaca 300

a 301

<210> 33

<211> 600

<212> DNA

<213> 人工序列()

<220>

<223> Sc Fba1启动子

<400> 33

ctacttggct tcacatacgt tgcatacgtc gatatagata ataatgataa tgacagcagg 60

attatcgtaa tacgtaatag ttgaaaatct caaaaatgtg tgggtcatta cgtaaataat 120

gataggaatg ggattcttct atttttcctt tttccattct agcagccgtc gggaaaacgt 180

ggcatcctct ctttcgggct caattggagt cacgctgccg tgagcatcct ctctttccat 240

atctaacaac tgagcacgta accaatggaa aagcatgagc ttagcgttgc tccaaaaaag 300

tattggatgg ttaataccat ttgtctgttc tcttctgact ttgactcctc aaaaaaaaaa 360

aatctacaat caacagatcg cttcaattac gccctcacaa aaactttttt ccttcttctt 420

cgcccacgtt aaattttatc cctcatgttg tctaacggat ttctgcactt gatttattat 480

aaaaagacaa agacataata cttctctatc aatttcagtt attgttcttc cttgcgttat 540

tcttctgttc ttctttttct tttgtcatat ataaccataa ccaagtaata catattcaaa 600

<210> 34

<211> 1575

<212> DNA

<213> 酿酒酵母()

<400> 34

atggaccaat tggtcaagac tgaagtcacc aagaaatctt tcactgctcc agtccaaaag 60

gcttccactc cagttttgac caacaagacc gtcatctccg gttccaaggt taaatctttg 120

tcctctgctc aatcttcctc ctctggtcca tcttcttctt ctgaagaaga tgattccaga 180

gatatcgaat ctttggacaa gaaaatcaga ccattggaag aattggaagc tctattgtcc 240

tctggtaaca ctaagcaatt aaagaacaag gaagttgctg ctttggttat ccacggtaaa 300

ttgccattgt acgctttgga aaagaaatta ggtgacacca ccagagctgt tgctgtcaga 360

agaaaggctt tgtccatttt ggctgaagct ccagtcttgg cttccgacag attaccatac 420

aagaactacg actacgaccg tgtctttggt gcttgttgtg aaaatgtcat tggttacatg 480

ccattaccag ttggtgtcat tggtccattg gttatcgacg gtacttctta ccacatccca 540

atggctacca ctgaaggttg tttggttgct tctgccatga gaggttgtaa ggccatcaac 600

gctggtggtg gtgctaccac cgttttgact aaggatggta tgaccagagg tcctgttgtc 660

agattcccaa ctttgaagag atctggtgct tgtaagatct ggttggattc tgaagaaggt 720

caaaacgcca tcaagaaggc tttcaactcc acttccagat tcgctagatt gcaacacatt 780

caaacttgtt tagctggtga cttgttgttc atgagattca gaaccaccac tggtgacgct 840

atgggtatga acatgatctc caagggtgtt gaatactctt tgaagcaaat ggttgaagaa 900

tacggttggg aagatatgga agttgtctct gtttctggta actactgtac cgacaagaag 960

ccagctgcca tcaactggat cgaaggtcgt ggtaagtccg ttgttgctga agctaccatt 1020

ccaggtgacg ttgtcagaaa ggttttgaaa tctgatgttt ctgctttagt cgaattgaac 1080

attgccaaga acttggtcgg ttctgccatg gctggttccg tcggtggttt caacgctcat 1140

gccgctaact tggtcactgc tgttttcttg gctttaggtc aagatccagc tcaaaatgtc 1200

gaatcctcta actgtatcac tttgatgaag gaagttgacg gtgatttgag aatttctgtt 1260

tccatgccat ccattgaagt cggtactatc ggtggtggta ctgtcttgga accacaaggt 1320

gccatgttgg acttgttggg tgttcgtggt ccacacgcta ccgctccagg tactaacgcc 1380

agacaattgg ccagaattgt tgcctgtgcc gtcttggctg gtgaattgtc tctatgtgcc 1440

gctttggctg ctggtcactt ggttcaatct cacatgaccc acaacagaaa gcctgctgaa 1500

ccaaccaaac caaacaactt ggatgctact gacattaaca gattaaagga cggttctgtc 1560

acctgtatca agtct 1575

<210> 35

<211> 301

<212> DNA

<213> 人工序列()

<220>

<223> Adh2终止子

<400> 35

agcggatctc ttatgtcttt acgatttata gttttcatta tcaagtatgc ctatattagt 60

atatagcatc tttagatgac agtgttcgaa gtttcacgaa taaaagataa tattctactt 120

tttgctccca ccgcgtttgc tagcacgagt gaacaccatc cctcgcctgt gagttgtacc 180

cattcctcta aactgtagac atggtagctt cagcagtgtt cgttatgtac ggcatcctcc 240

aacaaacagt cggttatagt ttgtcctgct cctctgaatc gtgtccctcg atatttctca 300

t 301

<210> 36

<211> 600

<212> DNA

<213> 人工序列()

<220>

<223> Sc Tef1启动子

<400> 36

ttggctgata atagcgtata aacaatgcat actttgtacg ttcaaaatac aatgcagtag 60

atatatttat gcatattaca tataatacat atcacatagg aagcaacagg cgcgttggac 120

ttttaatttt cgaggaccgc gaatccttac atcacaccca atcccccaca agtgatcccc 180

cacacaccat agcttcaaaa tgtttctact ccttttttac tcttccagat tttctcggac 240

tccgcgcatc gccgtaccac ttcaaaacac ccaagcacag catactaaat ttcccctctt 300

tcttcctcta gggtgtcgtt aattacccgt actaaaggtt tggaaaagaa aaaagacacc 360

gcctcgtttc tttttcttcg tcgaaaaagg caataaaaat ttttatcacg tttctttttc 420

ttgaaaattt ttttttttga tttttttctc tttcgatgac ctcccattga tatttaagtt 480

aataaacggt cttcaatttc tcaagtttca gtttcatttt tcttgttcta ttacaacttt 540

ttttacttct tgctcattag aaagaaagca tagcaatcta atctaagttt taattacaaa 600

<210> 37

<211> 1005

<212> DNA

<213> 酿酒酵母()

<400> 37

atggaagcta agattgacga attgatcaac aacgaccctg tctggtcctc tcaaaacgaa 60

tctttgatct ccaagccata caaccacatc ttgttgaagc caggtaagaa cttcagatta 120

aacttgattg ttcaaatcaa cagagttatg aacttgccaa aggaccaatt ggccattgtt 180

tcccaaattg tcgaattgtt gcacaactcc tctctattga tcgatgacat tgaagataat 240

gctccattaa gaagaggtca aaccacttct catttgattt tcggtgtccc atccaccatc 300

aacactgcta actacatgta cttcagagcc atgcaattgg tttctcaatt gaccaccaag 360

gaaccattat accacaactt gatcactatc tttaacgaag aattgattaa cttgcaccgt 420

ggtcaaggtt tggacatcta ctggagagat ttcttgccag aaattattcc aactcaagaa 480

atgtacttga acatggtcat gaacaagact ggtggtttat tcagattgac tttacgtttg 540

atggaagctt tgtctccatc ttcccaccac ggtcactctt tggttccatt catcaatcta 600

ttaggtatca tctaccaaat cagagatgat tacttgaact tgaaggactt ccaaatgtcc 660

tctgaaaagg gtttcgctga agatatcact gaaggtaaat tgtctttccc aattgtccac 720

gccttgaact ttaccaagac caagggtcaa actgaacaac acaacgaaat tttgagaatc 780

ttattgttga gaacttctga caaggacatc aagttgaaat tgatccaaat cttggaattc 840

gataccaact ctttggctta caccaagaac ttcatcaacc aattggttaa catgatcaag 900

aatgacaacg aaaacaaata cttgccagac ttggcttccc actccgatac cgctaccaac 960

ttgcacgacg aattgttgta cattattgac catttgtctg agtta 1005

<210> 38

<211> 301

<212> DNA

<213> 人工序列()

<220>

<223> Sc Gmp1终止子

<400> 38

agtctgaaga atgaatgatt tgatgatttc tttttccctc catttttctt actgaatata 60

tcaatgatat agacttgtat agtttattat ttcaaattaa gtagctatat atagtcaaga 120

taacgtttgt ttgacacgat tacattattc gtcgacatct tttttcagcc tgtcgtggta 180

gcaatttgag gagtattatt aattgaatag gttcattttg cgctcgcata aacagttttc 240

gtcagggaca gtatgttgga atgagtggta attaatggtg acatgacatg ttatagcaat 300

a 301

<210> 39

<211> 600

<212> DNA

<213> 人工序列()

<220>

<223> Sc Pgk1启动子

<400> 39

gggccagaaa aaggaagtgt ttccctcctt cttgaattga tgttaccctc ataaagcacg 60

tggcctctta tcgagaaaga aattaccgtc gctcgtgatt tgtttgcaaa aagaacaaaa 120

ctgaaaaaac ccagacacgc tcgacttcct gtcttcctat tgattgcagc ttccaatttc 180

gtcacacaac aaggtcctag cgacggctca caggttttgt aacaagcaat cgaaggttct 240

ggaatggcgg gaaagggttt agtaccacat gctatgatgc ccactgtgat ctccagagca 300

aagttcgttc gatcgtactg ttactctctc tctttcaaac agaattgtcc gaatcgtgtg 360

acaacaacag cctgttctca cacactcttt tcttctaacc aagggggtgg tttagtttag 420

tagaacctcg tgaaacttac atttacatat atataaactt gcataaattg gtcaatgcaa 480

gaaatacata tttggtcttt tctaattcgt agtttttcaa gttcttagat gctttctttt 540

tctctttttt acagatcatc aaggaagtaa ttatctactt tttacaacaa atataaaaca 600

<210> 40

<211> 1001

<212> DNA

<213> 人工序列()

<220>

<223> Kl prom 12启动子

<400> 40

cgtaaaaact aaaacgagcc cccaccaaag aacaaaaaag aaggtgctgg gcccccactt 60

tcttcccttg cacgtgatag gaagatggct acagaaacaa gaagatggaa atcgaaggaa 120

agagggagac tggaagctgt aaaaactgaa atgaaaaaaa aaaaaaaaaa aaaaaaacaa 180

gaagctgaaa atggaagact gaaatttgaa aaatggtaaa aaaaaaaaag aaacacgaag 240

ctaaaaacct ggattccatt ttgagaagaa gcaagaaagg taagtatggt aacgaccgta 300

caggcaagcg cgaaggcaaa tggaaaagct ggagtccgga agataatcat ttcatcttct 360

tttgttagaa cagaacagtg gatgtccctc atctcggtaa cgtattgtcc atgccctaga 420

actctctgtc cctaaaaaga ggacaaaaac ccaatggttt ccccagcttc cagtggagcc 480

accgatccca ctggaaacca ctggacagga agagaaaatc acggacttcc tctattgaag 540

gataattcaa cactttcacc agatcccaaa tgtcccgccc ctattcccgt gttccatcac 600

gtaccataac ttaccatttc atcacgttct ctatggcaca ctggtactgc ttcgactgct 660

ttgcttcatc ttctctatgg gccaatgagc taatgagcac aatgtgctgc gaaataaagg 720

gatatctaat ttatattatt acattataat atgtactagt gtggttattg gtaattgtac 780

ttaattttga tatataaagg gtggatcttt ttcattttga atcagaattg gaattgcaac 840

ttgtctcttg tcactattac ttaatagtaa ttatatttct tattaacctt ttttttaagt 900

caaaacacca aggacaagaa ctactcttca aaggtatttc aagttatcat acgtgtcaca 960

cacgcttcac agtttcaagt aaaaaaaaag aatattacac a 1001

<210> 41

<211> 2229

<212> DNA

<213> 甜叶菊()

<400> 41

atgtgtaaag ctgtttccaa ggaatactct gacttgttgc aaaaggatga agcctccttc 60

accaaatggg atgatgacaa agttaaggac catttagaca ctaacaagaa cttgtaccca 120

aacgatgaaa tcaaggaatt cgtcgaatct gtcaaagcta tgttcggttc catgaatgat 180

ggtgaaatca acgtttccgc ttacgacacc gcttgggttg ctttggttca agacgttgat 240

ggttccggtt ctccacaatt cccatcttct ttggaatgga ttgccaacaa ccaattgtct 300

gatggttctt ggggtgacca tttgttattc tctgctcacg acagaattat taacacttta 360

gcttgtgtca ttgctttgac ttcctggaat gtccatccat ccaagtgtga aaagggtttg 420

aacttcttga gagaaaacat ctgtaagttg gaagatgaaa atgctgaaca catgccaatt 480

ggtttcgaag ttaccttccc atctttgatt gatatcgcca agaagttgaa catcgaagtc 540

ccagaagaca ccccagcttt gaaggaaatc tacgccagaa gagatatcaa gttgaccaaa 600

atcccaatgg aagttttgca caaggttcca accaccttgt tgcactcttt ggaaggtatg 660

ccagacttgg aatgggaaaa gttgttaaag ttgcaatgta aggacggttc tttcttgttc 720

tctccatctt ctaccgcctt tgctttgatg caaactaagg acgaaaagtg tctacaatac 780

ttaactaata tcgttaccaa attcaacggt ggtgtcccaa acgtttaccc tgttgacttg 840

tttgaacaca tctgggttgt tgacagattg caacgtttgg gtattgctcg ttatttcaag 900

tctgaaatca aggactgtgt tgaatacatc aacaagtact ggactaagaa cggtatctgt 960

tgggctcgta acacccacgt tcaagatatc gacgacactg ctatgggttt cagagtcttg 1020

agagctcatg gttacgatgt caccccagat gtcttcagac aattcgaaaa ggatggtaag 1080

ttcgtttgtt ttgccggtca atccactcaa gccgtcactg gtatgttcaa cgtctacaga 1140

gcttctcaaa tgttgttccc aggtgaaaga atcctagaag acgctaagaa gttctcctac 1200

aactacttga aagaaaagca atctactaac gaattgttgg acaaatggat cattgccaaa 1260

gacttaccag gtgaagtcgg ttacgctttg gatattccat ggtacgcttc tctaccaaga 1320

ttagaaacca gatactactt ggaacaatac ggtggtgaag acgatgtctg gatcggtaag 1380

accttgtaca gaatgggtta cgtttccaac aacacttact tggaaatggc caaattggac 1440

tacaacaact acgtcgccgt cttacaattg gaatggtaca ccattcaaca atggtacgtt 1500

gacattggta ttgaaaagtt tgaatccgac aacatcaagt ccgtcttggt ttcctactac 1560

ttggctgctg cttccatctt tgaaccagaa agatccaagg aaagaattgc ttgggctaag 1620

accaccatct tggttgacaa gatcacttct attttcgact cttcccaatc ttccaaggaa 1680

gatatcaccg ctttcattga caaattcaga aacaagtctt cttccaagaa gcactccatt 1740

aacggtgaac catggcacga agttatggtt gctttgaaga agactttgca cggttttgct 1800

ttggatgctt tgatgactca ctctcaagat attcaccctc aattacacca agcttgggaa 1860

atgtggttaa ccaagttgca agatggtgtc gatgtcactg ctgaattgat ggttcaaatg 1920

atcaacatga ctgccggtag atgggtttct aaggaattgt tgactcaccc tcaataccaa 1980

cgtttgtcca ccgtcaccaa ctctgtctgt cacgacatca ctaagttgca caacttcaaa 2040

gaaaactcca ctactgtcga ttctaaggtt caagaattgg ttcaattagt tttctctgac 2100

accccagatg acttggacca agacatgaag caaactttct tgactgtcat gaagaccttc 2160

tactacaagg cttggtgtga cccaaacacc atcaacgacc atatttctaa ggtcttcgaa 2220

attgttatc 2229

<210> 42

<211> 2271

<212> DNA

<213> 甜叶菊()

<400> 42

atgacttctc acggtggtca aaccaaccca accaacttga ttattgacac caccaaggaa 60

agaatccaaa agcaattcaa gaatgttgaa atctccgttt cctcctacga cactgcttgg 120

gttgccatgg ttccatctcc aaactcccca aagtctccat gtttcccaga atgtttgaac 180

tggttaatca acaaccaatt gaacgatggt tcctggggtt tagtcaatca cacccacaac 240

cacaatcacc cattgttgaa ggactctcta tcctccactt tggcttgtat cgttgctttg 300

aagagatgga acgttggtga agaccaaatc aacaagggtt tgtcctttat tgaatccaac 360

ttggcttctg ctactgaaaa gtcccaacca tctcctatcg gttttgacat cattttccca 420

ggtttattgg aatacgctaa gaacttggac atcaacttat tatctaagca aaccgatttc 480

tccttgatgt tgcacaagag agaattggaa caaaagagat gtcactccaa cgaaatggac 540

ggttacttgg cttacatttc tgaaggtttg ggtaacttgt acgactggaa catggtcaag 600

aaataccaaa tgaagaacgg ttccgttttc aactctccat ctgctaccgc tgctgctttc 660

atcaaccatc aaaacccagg ttgtttgaac tacttgaact ctttgttgga caaattcggt 720

aacgctgttc caactgtcta cccacacgat ttgtttatca gattatccat ggttgacacc 780

attgaacgtt tgggtatttc tcatcacttc agagtcgaaa tcaagaacgt tttggatgaa 840

acttacagat gttgggttga aagagatgaa caaatcttca tggatgtcgt cacttgtgcc 900

ttggccttca gattattgag aattaacggt tacgaagttt ctccagaccc attggctgaa 960

atcactaacg aattggcttt gaaggacgaa tacgccgctt tggaaactta ccatgcctct 1020

cacatcttat accaagaaga cttgtcctct ggtaagcaaa tcttgaagtc tgctgacttc 1080

ttgaaggaaa ttatctctac tgattctaac agattgtcca agttgattca caaggaagtt 1140

gaaaacgcct tgaaattccc aatcaacact ggtttggaaa gaattaacac cagaagaaac 1200

atccaattat acaacgttga caacactaga atcttgaaga ctacttatca ctcttccaac 1260

atctccaaca ctgactactt gagattggct gtcgaagatt tctacacctg tcaatctatt 1320

tacagagaag aattgaaggg tttggaaaga tgggttgtcg aaaacaaatt ggaccaattg 1380

aaatttgcta gacaaaagac cgcctactgt tacttctccg ttgctgccac tttgtcctct 1440

ccagaattat ctgacgccag aatctcctgg gctaagaatg gtatcttgac caccgttgtc 1500

gatgacttct tcgatattgg tggtaccatt gacgaattga ccaacttgat tcaatgtgtt 1560

gaaaagtgga acgtcgatgt cgataaggac tgttgttctg aacacgtcag aatcttattc 1620

ttggctttga aagatgctat ctgttggatc ggtgacgaag ctttcaaatg gcaagctcgt 1680

gacgttacct ctcacgtcat ccaaacctgg ttggaattga tgaactctat gttgagagaa 1740

gccatctgga cccgtgatgc ttacgtccca actttgaacg aatacatgga aaatgcttac 1800

gtttctttcg ctttgggtcc aattgtcaag cctgctattt acttcgttgg tccaaagttg 1860

tccgaagaaa ttgttgaatc ttctgaatac cacaacttgt tcaaattgat gtctactcaa 1920

ggtcgtttgt tgaacgatat ccactctttc aagcgtgaat tcaaggaagg taagttgaat 1980

gctgttgctt tgcatttgtc taacggtgaa tctggtaagg tcgaagaaga agttgtcgaa 2040

gaaatgatga tgatgatcaa gaacaagaga aaggaattga tgaagttgat ctttgaagaa 2100

aacggttcta ttgtcccaag agcttgtaag gatgctttct ggaacatgtg tcacgtcttg 2160

aacttcttct acgctaacga tgacggtttc actggtaaca ccatcttaga caccgtcaag 2220

gacatcattt acaacccatt agtcttggtt aacgaaaacg aagaacaaag a 2271

<210> 43

<211> 301

<212> DNA

<213> 人工序列()

<220>

<223> Sc Tal1终止子

<400> 43

aggaagtatc tcggaaatat taatttaggc catgtcctta tgcacgtttc ttttgatact 60

tacgggtaca tgtacacaag tatatctata tatataaatt aatgaaaatc ccctatttat 120

atatatgact ttaacgagac agaacagttt tttatttttt atcctatttg atgaatgata 180

cagtttctta ttcacgtgtt atacccacac caaatccaat agcaataccg gccatcacaa 240

tcactgtttc ggcagcccct aagatcagac aaaacatccg gaaccacctt aaatcaacgt 300

c 301

<210> 44

<211> 1575

<212> DNA

<213> 藤仓赤霉菌()

<400> 44

atgtccaagt ctaactccat gaactccact tctcacgaaa ctttattcca acaattggtt 60

ttgggtttgg acagaatgcc attgatggat gtccactggt tgatctacgt tgctttcggt 120

gcttggttat gttcctacgt cattcacgtt ttgtcctctt cttctaccgt caaggttcca 180

gttgtcggtt acagatccgt tttcgaacca acctggttat tgagattaag atttgtctgg 240

gaaggtggtt ccattattgg tcaaggttac aacaaattca aggactctat cttccaagtc 300

agaaagttgg gtactgacat tgttatcatc ccaccaaact acatcgatga agtcagaaag 360

ttgtcccaag acaagaccag atctgttgaa ccattcatca acgatttcgc tggtcaatac 420

accagaggta tggtctttct acaatctgat ttgcaaaacc gtgtcatcca acaaagattg 480

actccaaagt tggtttcttt gactaaggtc atgaaggaag aattggacta cgctttgacc 540

aaggaaatgc cagacatgaa gaacgacgaa tgggttgaag ttgacatttc ttccatcatg 600

gtcagattga tctccagaat ctctgcccgt gttttcttgg gtccagaaca ctgtcgtaac 660

caagaatggt tgaccaccac tgctgaatac tctgaatctt tattcatcac tggtttcatc 720

ttgagagttg tcccacacat cttaagacca ttcattgctc cattgttgcc ttcttacaga 780

actttgttga gaaatgtctc ttctggtaga agagttatcg gtgatatcat cagatctcaa 840

caaggtgatg gtaacgaaga tatcttgtcc tggatgagag atgctgctac cggtgaagaa 900

aagcaaattg acaacattgc tcaaagaatg ttgatcttgt ctttggcttc cattcacacc 960

accgccatga ccatgaccca tgccatgtac gacttgtgtg cctgtccaga atacattgaa 1020

ccattacgtg acgaagtcaa atccgttgtt ggtgcttctg gttgggacaa gactgctttg 1080

aacagattcc acaagttgga ctctttcttg aaggaatctc aaagattcaa cccagttttc 1140

ttgttgactt tcaacagaat ctaccatcaa tccatgactt tgtccgatgg taccaacatt 1200

ccatctggta ccagaattgc tgttccatct cacgctatgt tgcaagattc tgctcacgtt 1260

ccaggtccaa ctcctccaac tgaatttgac ggtttcagat actccaagat cagatctgac 1320

tctaactatg ctcaaaagta cttgttctcc atgaccgatt cttccaacat ggctttcggt 1380

tacggtaagt acgcttgtcc aggtcgtttc tacgcctcca acgaaatgaa attgactttg 1440

gccattttgt tgttgcaatt tgaattcaaa ttgccagatg gtaagggtag accaagaaac 1500

atcactatcg actctgacat gattccagac ccaagagcta gattatgtgt cagaaagaga 1560

tctctacgtg acgaa 1575

<210> 45

<211> 301

<212> DNA

<213> 人工序列()

<220>

<223> Sc Tpi1终止子

<400> 45

agattaatat aattatataa aaatattatc ttcttttctt tatatctagt gttatgtaaa 60

ataaattgat gactacggaa agctttttta tattgtttct ttttcattct gagccactta 120

aatttcgtga atgttcttgt aagggacggt agatttacaa gtgatacaac aaaaagcaag 180

gcgctttttc taataaaaag aagaaaagca tttaacaatt gaacacctct atatcaacga 240

agaatattac tttgtctcta aatccttgta aaatgtgtac gatctctata tgggttactc 300

a 301

<210> 46

<211> 403

<212> DNA

<213> 人工序列()

<220>

<223> Ag lox_TEF1启动子

<400> 46

taccgttcgt ataatgtatg ctatacgaag ttatgtcccc gccgggtcac ccggccagcg 60

acatggaggc ccagaatacc ctccttgaca gtcttgacgt gcgcagctca ggggcatgat 120

gtgactgtcg cccgtacatt tagcccatac atccccatgt ataatcattt gcatccatac 180

attttgatgg ccgcacggcg cgaagcaaaa attacggctc ctcgctgcag acctgcgagc 240

agggaaacgc tcccctcaca gacgcgttga attgtcccca cgccgcgccc ctgtagagaa 300

atataaaagg ttaggatttg ccactgaggt tcttctttca tatacttcct tttaaaatct 360

tgctaggata cagttctcac atcacatccg aacataaaca aca 403

<210> 47

<211> 810

<212> DNA

<213> 人工序列()

<220>

<223> KANMX

<400> 47

atgggtaagg aaaagactca cgtttcgagg ccgcgattaa attccaacat ggatgctgat 60

ttatatgggt ataaatgggc tcgcgataat gtcgggcaat caggtgcgac aatctatcga 120

ttgtatggga agcccgatgc gccagagttg tttctgaaac atggcaaagg tagcgttgcc 180

aatgatgtta cagatgagat ggtcagacta aactggctga cggaatttat gcctcttccg 240

accatcaagc attttatccg tactcctgat gatgcatggt tactcaccac tgcgatcccc 300

ggcaaaacag cattccaggt attagaagaa tatcctgatt caggtgaaaa tattgttgat 360

gcgctggcag tgttcctgcg ccggttgcat tcgattcctg tttgtaattg tccttttaac 420

agcgatcgcg tatttcgttt ggctcaggcg caatcacgaa tgaataacgg tttggttgat 480

gcgagtgatt ttgatgacga gcgtaatggc tggcctgttg aacaagtctg gaaagaaatg 540

cataagcttt tgccattctc accggattca gtcgtcactc atggtgattt ctcacttgat 600

aaccttattt ttgacgaggg gaaattaata ggttgtattg atgttggacg agtcggaatc 660

gcagaccgat accaggatct tgccatccta tggaactgcc tcggtgagtt ttctccttca 720

ttacagaaac ggctttttca aaaatatggt attgataatc ctgatatgaa taaattgcag 780

tttcatttga tgctcgatga gtttttctaa 810

<210> 48

<211> 285

<212> DNA

<213> 人工序列()

<220>

<223> Ag Tef1_lox终止子

<400> 48

atcagtactg acaataaaaa gattcttgtt ttcaagaact tgtcatttgt atagtttttt 60

tatattgtag ttgttctatt ttaatcaaat gttagcgtga tttatatttt ttttcgcctc 120

gacatcatct gcccagatgc gaagttaagt gcgcagaaag taatatcatg cgtcaatcgt 180

atgtgaatgc tggtcgctat actgctgtcg attcgatact aacgccgcca tccagtgtcg 240

aaaacgagct cataacttcg tataatgtat gctatacgaa cggta 285

<210> 49

<211> 1575

<212> DNA

<213> 拟南芥()

<400> 49

atggaatctt tagtcgttca caccgtcaat gccatctggt gtattgtcat tgttggtatt 60

ttctctgttg gttaccacgt ttacggtcgt gccgttgttg aacaatggag aatgagaaga 120

tctttgaaat tgcaaggtgt caagggtcca ccaccatcca ttttcaacgg taatgtctct 180

gaaatgcaaa gaatccaatc tgaagctaag cactgttccg gtgacaacat catttctcac 240

gattactcct cctctttgtt ccctcacttt gaccactgga gaaagcaata cggtagaatc 300

tacacctact ccactggttt gaaacaacat ttgtacatca accatccaga aatggtcaag 360

gaattatctc aaaccaacac tttgaactta ggtcgtatca ctcacatcac caagagattg 420

aacccaatct taggtaacgg tatcatcact tccaacggtc cacactgggc tcatcaaaga 480

agaattattg cttacgaatt cacccacgac aaaatcaagg gtatggtcgg tttgatggtc 540

gaatctgcca tgccaatgtt gaacaaatgg gaagaaatgg ttaagagagg tggtgaaatg 600

ggttgtgaca tccgtgttga cgaagatttg aaggatgttt ctgctgatgt cattgctaag 660

gcttgtttcg gttcctcttt ctccaagggt aaggctatct tctccatgat cagagacttg 720

ttgactgcca tcactaagag atctgttttg ttcagattca acggtttcac cgacatggtt 780

ttcggttcca agaagcatgg tgatgtcgat atcgatgctt tggaaatgga attggaatct 840

tctatctggg aaaccgttaa ggaaagagaa attgaatgta aggacactca caagaaggat 900

ttgatgcaat taatcttgga aggtgccatg agatcttgtg acggtaactt gtgggacaag 960

tctgcttaca gaagatttgt tgtcgacaac tgtaaatcca tctactttgc cggtcacgac 1020

tctactgctg tctccgtttc ctggtgtttg atgttgctag ctttgaaccc atcctggcaa 1080

gtcaagatca gagatgaaat cttatcttct tgtaagaacg gtattccaga tgctgaatcc 1140

attccaaact tgaagaccgt taccatggtc attcaagaaa ctatgagatt gtacccacca 1200

gctccaattg tcggtagaga agcttccaag gacatcagat taggtgactt ggttgttcca 1260

aagggtgttt gtatctggac tttgattcca gctttgcacc gtgacccaga aatctggggt 1320

ccagatgcta acgacttcaa gccagaaaga ttctctgaag gtatttccaa ggcttgtaaa 1380

tacccacaat cttacatccc attcggtttg ggtccaagaa cctgtgtcgg taagaacttc 1440

ggtatgatgg aagtcaaagt tttggtttct ttgattgttt ccaagttctc tttcaccttg 1500

tctccaactt accaacactc tccatctcac aagttgttgg ttgaacctca acacggtgtt 1560

gtcattagag tcgtt 1575

<210> 50

<211> 1000

<212> DNA

<213> 人工序列()

<220>

<223> Kl prom 6启动子

<400> 50

caaagggggg gcagggacag ggatacgaca agggctgggg aaaaaaaaaa agatagatac 60

gattggccgg gtaagcctgg ggaaatgtag caagtgcggg taagttaaaa ggtaaccacg 120

tgactccgga agagtcacgt ggttacggac ttttttctct agatctcagc tttttatcgg 180

tcttaccctg ccctcctgcc ccctgcccct tccctttgcc ccaaaaagaa aggaaatctg 240

ttggatttcg ctcaggccat ccctttcgtt aatatcggtt atcgctttac acactgcaca 300

tccttctgtc caaaaggaat ccagaagttt agcttttcct tcctttccca cagacattag 360

cctaggccct ctctcatcat ttgcatgcct cagccaatgt accaagaata acgcaacgag 420

gttgggaaat tttaacccaa caatcgatgc agatgtgaca agagattaga cacgttccag 480

ataccagatt acacagcttg tgctagcaga gtgacatatg gtggtgttgt gtctcgttta 540

gtacctgtaa tcgagagtgt tcaaatcagt cgatttgaac acccttactg ccactgaata 600

ttgattgaat accgtttatt gaaggtttta tgagtgatct tctttcggtc caggacaatt 660

tgttgagctt tttctatgta gagttccgtc cctttttttt ttttttttgc tttctcgcac 720

ttactagcac tatttttttt tcacacacta aaacacttta ttttaatcta tatatatata 780

tatatatata tgtaggaatg gaatcacaga catttgatac tcatcctcat ccttattaat 840

tcttgtttta atttgtttga cttagccaaa ccaccaatct caacccatcg tatttcaggt 900

attgtgtgtc tagtgtgtct ctggtatacg gaaataagtg ccagaagtaa ggaagaaaca 960

aagaacaagt gtctgaatac tactagcctc tcttttcata 1000

<210> 51

<211> 2133

<212> DNA

<213> 拟南芥()

<400> 51

atgtcctctt cttcttcttc ttctacttcc atgattgatt tgatggctgc catcatcaag 60

ggtgaaccag tcattgtctc tgacccagcc aacgcttctg cttacgaatc cgttgctgct 120

gaattgtcct ccatgttgat tgaaaacaga caattcgcta tgattgtcac tacttccatt 180

gctgtcttga ttggttgtat cgtcatgttg gtctggagaa gatccggttc cggtaactcc 240

aagagagttg aaccattgaa gccattagtc atcaagccaa gagaagaaga aattgatgac 300

ggtagaaaga aggtcaccat cttctttggt actcaaaccg gtactgctga aggttttgct 360

aaggctttgg gtgaagaagc caaagctaga tacgaaaaga ccagattcaa gatcgttgac 420

ttggacgact acgctgctga tgacgacgaa tacgaagaaa agttgaagaa ggaagatgtt 480

gccttcttct tcttggctac ttacggtgat ggtgaaccaa ctgacaatgc tgccagattc 540

tacaaatggt tcaccgaagg taacgacaga ggtgaatggt taaagaactt gaaatacggt 600

gttttcggtc taggtaacag acaatacgaa cacttcaaca aggttgccaa ggttgtcgat 660

gacatcttgg ttgaacaagg tgctcaaaga ttagtccaag tcggtttggg tgatgatgac 720

caatgtatcg aagatgactt cactgcttgg agagaagctt tgtggccaga attggacacc 780

atcttaagag aagaaggtga taccgctgtt gccaccccat acactgctgc tgttttggaa 840

tacagagttt ctatccacga ctctgaagat gccaagttca acgacatcaa catggctaac 900

ggtaacggtt acactgtttt cgacgctcaa cacccataca aggccaatgt tgctgtcaag 960

agagaattgc acactccaga atctgatcgt tcttgtatcc acttggaatt tgacattgct 1020

ggttctggtt tgacctacga aaccggtgac cacgtcggtg tcttatgtga caacttgtct 1080

gaaactgtcg atgaagcttt gagattattg gacatgtctc cagacactta tttctccttg 1140

catgctgaaa aggaagatgg tactccaatt tcttcttcct tgcctcctcc attcccacca 1200

tgtaacttga gaaccgcttt aaccagatac gcttgtttgc tatcctctcc aaagaagtcc 1260

gctttggttg ctttggctgc tcacgcttct gacccaactg aagctgaaag attgaaacat 1320

ttggcttccc cagctggtaa ggatgaatac tccaaatggg ttgttgaatc tcaaagatct 1380

ttgttggaag tcatggctga attcccatct gccaagccac cattgggtgt tttcttcgcc 1440

ggtgttgctc caagattgca accaagattt tactccatct cttcttctcc aaagattgct 1500

gaaaccagaa ttcacgttac ctgtgccttg gtctacgaaa agatgccaac cggtagaatt 1560

cacaagggtg tttgttccac ctggatgaag aacgctgttc catacgaaaa gtctgaaaac 1620

tgttcttctg ctccaatctt cgtccgtcaa tccaacttca agttgccatc tgactccaag 1680

gtcccaatca tcatgatcgg tccaggtact ggtttagctc cattcagagg tttcttgcaa 1740

gaaagattgg ccttagttga atctggtgtc gaattgggtc cttctgtttt gttcttcggt 1800

tgtagaaacc gtcgtatgga cttcatctac gaagaagaat tgcaaagatt tgtcgaatct 1860

ggtgctttgg ctgaattgtc cgttgctttc tctcgtgaag gtccaaccaa agaatacgtt 1920

caacacaaga tgatggacaa agcctccgac atctggaaca tgatctccca aggtgcttac 1980

ttgtacgttt gtggtgatgc taaaggtatg gccagagatg tccacagatc tttacatacc 2040

attgcccaag aacaaggttc catggactcc accaaggctg aaggtttcgt taagaacttg 2100

caaacttctg gtcgttactt gagagatgtt tgg 2133

<210> 52

<211> 301

<212> DNA

<213> 人工序列()

<220>

<223> Sc Pdc1终止子

<400> 52

agcgatttaa tctctaatta ttagttaaag ttttataagc atttttatgt aacgaaaaat 60

aaattggttc atattattac tgcactgtca cttaccatgg aaagaccaga caagaagttg 120

ccgacagtct gttgaattgg cctggttagg cttaagtctg ggtccgcttc tttacaaatt 180

tggagaattt ctcttaaacg atatgtatat tcttttcgtt ggaaaagatg tcttccaaaa 240

aaaaaaccga tgaattagtg gaaccaagga aaaaaaaaga ggtatccttg attaaggaac 300

a 301

<210> 53

<211> 1000

<212> DNA

<213> 人工序列()

<220>

<223> Kl prom 3启动子

<400> 53

gagcctgtcc aagcaaatgc cttctcataa atggtgccaa agacccgcaa gcccaaagca 60

attacccccc aaaaagaaat gatatagtgc aagatacgta tatgaccatg acttgactag 120

gtgaaacagt gcagaaacag ccgcacaaaa gcagccctaa ccctcagagt cgattttact 180

ctttcaggta ataaagcctc gacatcaatt ttagacagaa gccaggctgg cctcgagatt 240

atagccatag gcaagcaaga ggagagaagg ggaggccccc catggggggc ctcccccccg 300

ctgtcaaggt ttggcagaac ctagcttcat taggccacta gcccagccta aaacgtcaac 360

gggcaggagg aacactccca caagacggcg tagtattctc gattcataac cattttctca 420

atcgaattac acagaacaca ccgtacaaac ctctctatca taactactta atagtcacac 480

acgtactcgt ctaaatacac atcatcgtcc tacaagttca tcaaagtgtt ggacagacaa 540

ctataccagc atggatctct tgtatcggtt cttttctccc gctctctcgc aataacaatg 600

aacactgggt caatcatagc ctacacaggt gaacagagta gcgtttatac agggtttata 660

cggtgattcc tacggcaaaa atttttcatt tctaaaaaaa aaaagaaaaa tttttctttc 720

caacgctaga aggaaaagaa aaatctaatt aaattgattt ggtgattttc tgagagttcc 780

ctttttcata tatcgaattt tgaatataaa aggagatcga aaaaattttt ctattcaatc 840

tgttttctgg ttttatttga tagttttttt gtgtattatt attatggatt agtactggtt 900

tatatgggtt tttctgtata acttcttttt attttagttt gtttaatctt attttgagtt 960

acattatagt tccctaactg caagagaagt aacattaaaa 1000

<210> 54

<211> 1443

<212> DNA

<213> 甜叶菊()

<400> 54

atggacgcta tggccaccac tgaaaagaag cctcacgtta tctttattcc attcccagct 60

caatctcata tcaaggctat gttgaaattg gctcaattat tgcaccacaa gggtttgcaa 120

atcacttttg tcaacaccga cttcattcac aaccaattct tggaatcttc tggtcctcac 180

tgtttggacg gtgctccagg tttcagattc gaaaccattc cagatggtgt ttcccactct 240

ccagaagcct ccatcccaat cagagaatcc ttgttgagat ctattgaaac caacttcttg 300

gaccgtttca tcgatttggt taccaaattg ccagacccac caacctgtat catttctgac 360

ggtttcttgt ccgttttcac catcgatgct gccaagaaat tgggtattcc agtcatgatg 420

tactggactt tggctgcttg tggtttcatg ggtttctacc atattcactc tttgattgaa 480

aagggtttcg ctccattaaa ggatgcttct tacttgacca acggttactt ggacaccgtc 540

attgactggg ttccaggtat ggaaggtatc agattgaaag atttcccatt ggactggtct 600

actgacttga atgacaaggt cttgatgttc actactgaag ctccacaaag atctcataag 660

gtttctcacc acatcttcca cactttcgat gaattagaac catctatcat caagactcta 720

tccttgagat acaaccatat ctacaccatt ggtccattac aattgttgtt ggaccaaatc 780

ccagaagaaa agaagcaaac cggtatcact tctttgcacg gttactcttt agtcaaggaa 840

gaaccagaat gtttccaatg gttacaatcc aaggaaccaa actctgttgt ctacgttaac 900

tttggttcca ccactgttat gtccttggaa gatatgactg aatttggttg gggtttggct 960

aactctaacc actacttctt atggatcatc agatctaact tggtcattgg tgaaaacgcc 1020

gttttgcctc cagaattgga agaacacatc aagaagagag gtttcattgc ttcctggtgt 1080

tctcaagaaa aggtcttgaa gcacccatct gttggtggtt tcttgaccca ctgtggttgg 1140

ggttccacca ttgaatccct atctgctggt gttccaatga tctgttggcc atactcctgg 1200

gaccaattga ctaactgtcg ttacatctgt aaggaatggg aagttggttt ggaaatgggt 1260

actaaggtca agagagatga agtcaagaga ttagtccaag aattgatggg tgaaggtggt 1320

cacaagatga gaaacaaagc caaggactgg aaggaaaagg ccagaattgc tattgctcca 1380

aacggttctt cctccttgaa catcgataaa atggttaagg aaatcactgt cttggctcga 1440

aac 1443

<210> 55

<211> 301

<212> DNA

<213> 人工序列()

<220>

<223> Sc TDH1终止子

<400> 55

aataaagcaa tcttgatgag gataatgatt tttttttgaa tatacataaa tactaccgtt 60

tttctgctag attttgtgaa gacgtaaata agtacatatt actttttaag ccaagacaag 120

attaagcatt aactttaccc ttttctcttc taagtttcaa tactagttat cactgtttaa 180

aagttatggc gagaacgtcg gcggttaaaa tatattaccc tgaacgtggt gaattgaagt 240

tctaggatgg tttaaagatt tttccttttt gggaaataag taaacaatat attgctgcct 300

t 301

<210> 56

<211> 1000

<212> DNA

<213> 人工序列()

<220>

<223> Kl prom 2启动子

<400> 56

gagcctgtcc aagcaaatgc cttctcataa atggtgccaa agacccgcaa gcccaaagca 60

attacccccc aaaaagaaat gatatagtgc aagatacgta tatgaccatg acttgactag 120

gtgaaacagt gcagaaacag ccgcacaaaa gcagccctaa ccctcagagt cgattttact 180

ctttcaggta ataaagcctc gacatcaatt ttagacagaa gccaggctgg cctcgagatt 240

atagccatag gcaagcaaga ggagagaagg ggaggccccc catggggggc ctcccccccg 300

ctgtcaaggt ttggcagaac ctagcttcat taggccacta gcccagccta aaacgtcaac 360

gggcaggagg aacactccca caagacggcg tagtattctc gattcataac cattttctca 420

atcgaattac acagaacaca ccgtacaaac ctctctatca taactactta atagtcacac 480

acgtactcgt ctaaatacac atcatcgtcc tacaagttca tcaaagtgtt ggacagacaa 540

ctataccagc atggatctct tgtatcggtt cttttctccc gctctctcgc aataacaatg 600

aacactgggt caatcatagc ctacacaggt gaacagagta gcgtttatac agggtttata 660

cggtgattcc tacggcaaaa atttttcatt tctaaaaaaa aaaagaaaaa tttttctttc 720

caacgctaga aggaaaagaa aaatctaatt aaattgattt ggtgattttc tgagagttcc 780

ctttttcata tatcgaattt tgaatataaa aggagatcga aaaaattttt ctattcaatc 840

tgttttctgg ttttatttga tagttttttt gtgtattatt attatggatt agtactggtt 900

tatatgggtt tttctgtata acttcttttt attttagttt gtttaatctt attttgagtt 960

acattatagt tccctaactg caagagaagt aacattaaaa 1000

<210> 57

<211> 1380

<212> DNA

<213> 甜叶菊()

<400> 57

atggctgaac aacaaaagat caagaaatct ccacacgtct tgttgattcc attcccattg 60

caaggtcaca tcaacccatt catccaattc ggtaagagat tgatttccaa gggtgtcaag 120

accactttag tcaccactat tcacacttta aactccactt taaaccactc taacactact 180

accacctcta ttgaaatcca agccatttct gacggttgtg acgaaggtgg tttcatgtct 240

gctggtgaat cttacttgga aactttcaag caagtcggtt ccaagtcttt ggctgatttg 300

atcaagaaat tgcaatccga aggtactacc atcgatgcta tcatctacga ctccatgact 360

gaatgggttt tggatgttgc cattgaattt ggtattgacg gtggttcttt cttcacccaa 420

gcctgtgttg ttaactcttt gtactaccac gtccacaagg gtttgatctc tctaccatta 480

ggtgaaaccg tttccgtccc aggtttccca gtcttgcaaa gatgggaaac tccattgatc 540

ttacaaaacc atgaacaaat ccaatctcca tggtcccaaa tgttgtttgg tcaattcgct 600

aacattgacc aagctagatg ggttttcacc aactctttct acaagttgga agaagaagtc 660

attgaatgga ccagaaagat ctggaacttg aaggttatcg gtccaactct accatccatg 720

tacttggaca agagattgga tgacgacaag gacaacggtt tcaacttgta caaggctaac 780

catcacgaat gtatgaactg gttggatgac aagccaaagg aatctgttgt ttacgttgct 840

ttcggttctt tggtcaagca tggtccagaa caagttgaag aaatcaccag agctttgatt 900

gactccgatg ttaacttctt atgggttatc aagcacaagg aagaaggtaa attgccagaa 960

aacttgtctg aagttatcaa gaccggtaag ggtttgattg ttgcttggtg taagcaattg 1020

gatgttttgg ctcacgaatc cgtcggttgt ttcgtcactc actgtggttt caactctact 1080

ttggaagcta tctccttggg tgttccagtt gttgccatgc ctcaattctc tgaccaaacc 1140

accaacgcca aattgttgga tgaaatcttg ggtgtcggtg tccgtgtcaa ggctgatgaa 1200

aacggtattg ttagaagagg taacttagct tcctgtatca agatgatcat ggaagaagaa 1260

cgtggtgtca ttatcagaaa gaatgctgtc aaatggaagg acttggctaa ggttgctgtc 1320

cacgaaggtg gttcctctga caatgacatt gttgaatttg tctctgaatt gatcaaagcg 1380

<210> 58

<211> 1374

<212> DNA

<213> 甜叶菊()

<400> 58

atggaaaaca agactgaaac cactgttaga agaagaagaa gaatcatctt attcccagtt 60

ccattccaag gtcacattaa cccaatcttg caattggcta acgtcttata ctccaagggt 120

ttctccatca ccatcttcca caccaacttc aacaaaccta aaacttccaa ctacccacac 180

ttcaccttca gatttatctt ggacaacgac ccacaagatg aaagaatttc taacttgcca 240

acccatggtc cattggccgg tatgagaatt ccaatcatca acgaacacgg tgctgacgaa 300

ttgagaagag aattggaatt gttgatgttg gcttctgaag aagatgaaga agtctcttgt 360

ttgatcactg atgctttatg gtactttgct caatctgttg ctgactcttt gaacttgaga 420

agattagtct tgatgacctc ttctttgttc aacttccacg ctcacgtttc tctaccacaa 480

tttgatgaat tgggttactt ggacccagat gacaagacca gattggaaga acaagcctcc 540

ggtttcccaa tgttgaaggt caaggatatc aagtctgcct actccaactg gcaaatcttg 600

aaggaaattt tgggtaagat gatcaagcaa accaaggctt cttctggtgt catctggaac 660

tccttcaagg aattggaaga atctgaattg gaaaccgtca tcagagaaat tccagctcca 720

tctttcttga ttccattacc aaagcatttg actgcttcct cctcttctct attggaccac 780

gacagaactg ttttccaatg gttggaccaa caaccaccat cttccgtctt atacgtttcc 840

tttggttcca cttctgaagt tgacgaaaag gacttcttgg aaattgctcg tggtttggtt 900

gactccaagc aatctttctt atgggttgtc agaccaggtt tcgtcaaggg ttccacctgg 960

gttgaacctt tgccagacgg tttcttgggt gaaagaggta gaattgtcaa atgggttcca 1020

caacaagaag ttttggctca cggtgccatt ggtgctttct ggactcactc tggttggaac 1080

tctactttgg aatccgtttg tgaaggtgtt ccaatgattt tctctgactt cggtttggac 1140

caaccattga atgctcgtta catgtccgat gttttgaagg ttggtgtcta cttggaaaac 1200

ggttgggaac gtggtgaaat tgctaacgcc atcagaagag tcatggtcga tgaagaaggt 1260

gaatacatca gacaaaatgc tcgtgtcttg aaacaaaagg ctgatgtttc tttgatgaag 1320

ggtggttctt cttacgaatc tttggaatct ttggtttcct acatctccag tctc 1374

<210> 59

<211> 602

<212> DNA

<213> 人工序列()

<220>

<223> Sc Eno1终止子

<400> 59

aagcttttga ttaagccttc tagtccaaaa aacacgtttt tttgtcattt atttcatttt 60

cttagaatag tttagtttat tcattttata gtcacgaatg ttttatgatt ctatataggg 120

ttgcaaacaa gcatttttca ttttatgtta aaacaatttc aggtttacct tttattctgc 180

ttgtggtgac gcgtgtatcc gcccgctctt ttggtcaccc atgtatttaa ttgcataaat 240

aattcttaaa agtggagcta gtctatttct atttacatac ctctcatttc tcatttcctc 300

caagcttttg attaagcctt ctagtccaaa aaacacgttt ttttgtcatt tatttcattt 360

tcttagaata gtttagttta ttcattttat agtcacgaat gttttatgat tctatatagg 420

gttgcaaaca agcatttttc attttatgtt aaaacaattt caggtttacc ttttattctg 480

cttgtggtga cgcgtgtatc cgcccgctct tttggtcacc catgtattta attgcataaa 540

taattcttaa aagtggagct agtctatttc tatttacata cctctcattt ctcatttcct 600

cc 602

<210> 60

<211> 600

<212> DNA

<213> 酿酒酵母()

<400> 60

ccgcggaacc gccagatatt cattacttga cgcaaaagcg tttgaaataa tgacgaaaaa 60

gaaggaagaa aaaaaaagaa aaataccgct tctaggcggg ttatctactg atccgagctt 120

ccactaggat agcacccaaa cacctgcata tttggacgac ctttacttac accaccaaaa 180

accactttcg cctctcccgc ccctgataac gtccactaat tgagcgatta cctgagcggt 240

cctcttttgt ttgcagcatg agacttgcat actgcaaatc gtaagtagca acgtgtcaag 300

gtcaaaactg tatggaaacc ttgtcacctc acttaattct agctagccta ccctgcaagt 360

caagaggtgt ccgtgattcc tagccacctc aaggtatgcc tctccccgga aactgtggcc 420

ttttctggca cacatgatct ccacgatttc aacatataaa tagcttttga taatggcaat 480

attaatcaaa tttattttac ttctttcttg taacatctct cttgtaatcc cttattcctt 540

ctagctattt ttcataaaaa accaagcaac tgcttatcaa cacacaaaca ctaaatcaaa 600

<210> 61

<211> 301

<212> DNA

<213> 乳酸克鲁维酵母()

<400> 61

aattactctt ttaagttaac gaacgctttt gatgagacta acgatatttc aagtgattcc 60

attttttact tctaagtttt tatcaccttt atcttaacca ttctatgcca gtctttgctt 120

tatggacttt gattcaaatt atgaagggaa gtttttacgc caaataaaaa ctactacaac 180

aaattattaa aaaaaatgac gaataatatg aagtgtctaa cgactgccaa aattattcat 240

tcctttttta tacacataac catttcactt catttactgg tttgagtggt ttattacgtc 300

g 301

<210> 62

<211> 803

<212> DNA

<213> 解脂耶氏酵母()

<400> 62

taccaaccac agattacgac ccattcgcag tcacagttca ctagggtttg ggttgcatcc 60

gttgagagtg gtttgttttt aaccttctcc atgtgctcac tcaggttttg ggttcagatc 120

aaatcaaggc gtgaaccact gtttgaggac aaatgtgaca caaccaacca gtgtcagggg 180

caagtccgtg acaaagggga agatacaatg caattactga cagttacgga ctgcctcgat 240

gccctaacct tgccccaaaa taagacaact gtcctcgttt aagcgcaacc ctattcagcg 300

tcacgtcata atagcgtttg gatagcacta gtctatgagg agcgttttat gttgcggtga 360

gggcgattgg tgctcatatg ggttcaattg aggtggtgga acgagcttag tcttcaattg 420

aggtgcgagc gacacaattg ggtgtcacgt ggcctaattg acctcggatc gtggagtccc 480

cagttataca gcaaccacga ggtgcatgag taggagacgt caccagacaa tagggttttt 540

ttggactgga gagggtaggg caaaagcgct caacgggctg tttggggagc tatgggggag 600

gaattggcga tatttgtgag gttgacggct ccgatttgcg tgttttgtcg cttctgcatc 660

tccccatacc catatcttcc ctccccacct ctttccacga taattttacg gatcagcaat 720

aaggttcctt ctcctagttt ccacgtccat atatatctat gctgcgtcgt ccttttcgtg 780

acatcaccaa aacacataca aaa 803

<210> 63

<211> 995

<212> DNA

<213> 解脂耶氏酵母()

<400> 63

ctgtacctgc tgtggaccac gcacggcgga acgtaccgta caaatatttt cttgctcaca 60

tgactctctc tcggccgcgc acgccggtgg caaattgctc ttgcattggc tctgtctcta 120

gacgtccaaa ccgtccaaag tggcagggtg acgtgatgcg acgcacgaag gagatggccc 180

ggtggcgagg aaccggacac ggcgagccgg cgggaaaaaa ggcggaaaac gaaaagcgaa 240

gggcacaatc tgacggtgcg gctgccacca acccaaggag gctattttgg gtcgctttcc 300

atttcacatt cgccctcaat ggccactttg cggtggtgaa catggtttct gaaacaaccc 360

cccagaatta gagtatattg atgtgtttaa gattgggttg ctatttggcc attgtggggg 420

agggtagcga cgtggaggac attccagggc gaattgagcc tagaaagtgg taccattcca 480

accgtctcag tcgtccgaat tgatcgctat aactatcacc tctctcacat gtctacttcc 540

ccaaccaaca tccccaacct cccccacact aaagttcacg ccaataatgt aggcactctt 600

tctgggtgtg ggacagcaga gcaatacgga ggggagatta cacaacgagc cacaattggg 660

gagatggtag ccatctcact cgacccgtcg acttttggca acgctcaatt acccaccaaa 720

tttgggctgg agttgagggg accgtgttcc agcgctgtag gaccagcaac acacacggta 780

tcaacagcaa ccaacgcccc cgctaatgca cccagtactg cgcaggtgtg ggccaggtgc 840

gttccagatg cgagttggcg aaccctaagc cgacagtgta ctttttggga cgggcagtag 900

caatcgtggg cggagacccc ggtgtatata aaggggtgga gaggacggat tattagcacc 960

aacacacaca cttatactac atgctagcca caaaa 995

<210> 64

<211> 1004

<212> DNA

<213> 解脂耶氏酵母()

<400> 64

gtcagaaggg gcagctctaa acgaagaact gcggtcaggt gacacaactt tttccatctc 60

agggtgtgtc gcgtgtgctt catccaaact ttagttgggg ttcgggttcg cgcgagatga 120

tcacgtgccc tgatttggtg tcgtcccccg tcgcgctgcg cacgtgattt atttatttcc 180

ggtggctgct gtctacgcgg ggccttctct gcccttctgt ttcaaccttc gggcggttct 240

cgtaaccagc agtagcaatc catttcgaaa ctcaaagagc taaaaacgtt aaacctcagc 300

agtcgctcga cgaatgggct gcggttggga agcccacgag gcctatagcc agagcctcga 360

gttgacagga gcccagacgc cttttccaac ggcaactttt atataaaatg gcaatgtatt 420

catgcaattg cggccgtgtc aggttggaga cactggacca cactctccat tgcttcctga 480

ggagatggat cattgctagt gcatctacgc gcagcaatcc cgcaagctcg acaaccgtag 540

atgggctttg gtgggccaat caattacgca acccgcacgt taaattgtat gaggaaggaa 600

ggccacggta caaagtgggt ggtcttcacc cagtggttgt tggtggcgtc atgcagacca 660

tgcattgggg atagcacagg gttggggtgt cttgtggact caatgggtga aaggagatgg 720

aaaagggcgg tgaaaagtgg tagaatcgaa atccctgacg tcaatttata aagtaaaatg 780

cgtttctgcc attttgctcc cctccttctt tcgcaatcgc ctccccaaaa gttgtcgtgg 840

cagtacacat gcttgcatac aatgaagcta atccggcttg ctcagtagtt gctatatcca 900

ggcatggtgt gaaacccctc aaagtatata taggagcggt gagccccagt ctggggtctt 960

ttctctccat ctcaaaacta ctttctcaca tgctagccac aaaa 1004

<210> 65

<211> 1422

<212> DNA

<213> 解脂耶氏酵母()

<400> 65

atttcttgtg tgtgcggcaa acgtagcaat tgcaactgca taaacgatga ttgtaaaagt 60

atcacacttt gctcagacag gttagattca cctggtacga gggcagtgtc ttaaaggttc 120

catctacctc ggcccttgtt tcttgaagag tggtcaatat gtgttttata cagctgaaat 180

ttcccctgta tgttgagatc gtgtatattg gtcataatct gggctcttta gtcgatccca 240

gttttctcgg gcaagttttt ttctccacaa agtaccgctg gaaaactcta tgtgacttgt 300

tgacagatta cttgggttat ctgcgggata tgtcttggat aggcaaccgg gcatatatca 360

ccgggcggac tgttggttct gtacgtacat acagcacttt gagctcatgt ctcacacgca 420

accatggtgc gtggaggctt tggcatcctt tctacttgta gtggctatag tacttgcagt 480

ccaagcaaac atgagtatgt gcttgtatgt actgaaaccc gtctacggta atattttaga 540

gtgtggaact atgggatgag tgctcattcg atactatgtt gtcacccgat ttgccgtttg 600

cgaggtaaga cacattcggt ggttcaggcg gctacttgta tgtagcatcc acgttcatgt 660

tttgtggatc agattaatgg tatggatatg cacggggcgt ttccccggta acgtgtaggc 720

agtccagtgc aacccagaca gctgagctct ctatagccgt gcgtgtgcgg tcatatcacg 780

ctacacttag ctacagaata aagctcggta gcgccaacag cgttgacaaa tagctcaagg 840

gcgtggagca cagggtttag gaggttttaa tgggcgagaa ggcgcgtaga tgtagtcttc 900

ctcggtccca tcggtaatca cgtgtgtgcc gatttgcaag acgaaaagcc acgagaataa 960

accgggagag gggatggaag tccccgaaca gcaaccagcc cttgccctcg tggacataac 1020

ctttcacttg ccagaactct aagcgtcacc acggtataca agcgcacgta gaagattgtg 1080

gaagtcgtgt tggagactgt tgatttgggc ggtggagggg ggtatttgag agcaagtttg 1140

agatttgtgc cattgagggg gaggttattg tggccatgca gtcggatttg ccgtcacggg 1200

accgcaacat gcttttcatt gcagtccttc aactatccat ctcacctccc ccaatggctt 1260

ttaactttcg aatgacgaaa gcacccccct ttgtacagat gactatttgg gaccaatcca 1320

atagcgcaat tgggtttgca tcatgtataa aaggagcaat cccccactag ttataaagtc 1380

acaagtatct cagtataccc gtctaaccac acatttatca cc 1422

<210> 66

<211> 865

<212> DNA

<213> 解脂耶氏酵母()

<400> 66

atgctcactt ttgttgtcct gatgatctcc cgttatttcg ccgctcctct ggaaaccatc 60

cgcccgcaaa tcccctctgc ccatcttgac aatgcacaat gcatcattct cagcctgcat 120

gaatgcgaaa gatggcaata ttggtggagg aggcgacggc ggtaaacaat ggagatagag 180

accacaaaag agacctggag acccaaaatg gactcacgac aactccccca ctcccccact 240

ccccatctcc ccctgggcat cagttgccca tcggtatctc aactgtcgca ctagttagcg 300

caaccatcac atactttaga cgccaaacaa tgggacaact catcgcgccg aactatgggc 360

agattttaac tcgcacaaca ttaccccaac tctaaaaggt aacctcgacc ggaaaacggg 420

aagacaggat cagcaaccgt gatcgacaga atcttcaggg cactacagtt gatagacata 480

ggttatgttg gtaggtctag acgggcctcg gggaattgac cccaccagtt gcaagtcacg 540

tgcccctgat acagctagtt tagcacatct gcccactacg tctggacgca ccatggtggt 600

gccagtcgcg tgaactcaaa cacccactag cctcgggaag gattcagtta aatccgcacc 660

ttatttccaa cacaaagaag cggttggcgg acaaagaaca tgtcctttct ggggcactgt 720

acattccagg actctgttca aggtcaaata tacaaaacac agatagagaa acatagacag 780

ctgcggcctt ataaatacct gggcgcactt ctctcttttt ccctcctcat cacacattcg 840

ttcaccacta agtcactcgt tcaaa 865

<210> 67

<211> 880

<212> DNA

<213> 解脂耶氏酵母()

<400> 67

aaacaaaaga gctgaaatca tatccttcag tagtagtata gtcctgttat cacagcatca 60

attacccccg tccaagtaag ttgattggga tttttgttta cagatacagt aatatacttg 120

actatttctt tacaggtgac tcagaaagtg catgttggaa atgagccaca gaccaagaca 180

agatatgaca aaattgcact attcgatgca gaattcgacg gtgtttccat tggtgttatg 240

acattcatct gcattcatac aaaaaagtct tggtagtggt acttttgcgt tattacctcc 300

gatatctacg caccccccaa cccccctgct acagtaaaga gtgtgagtct actgtacatg 360

cttactaaac cacctactgt acagcgaaac ccctcagcaa aatcacacaa tcagctcatt 420

acaacacacc caatgacctc accacaaatt ctatacgcct tttgacgcca ttattacagt 480

agcttgcaac gccgttgtct taggttccat ttttagtgct ctattacctc acttaacccg 540

tataggcaga tcaggccatg gcactaagtg tagagctaga ggttgatatc gccacgagtg 600

ctccatcagg gctagggtgg ggttagaaat acagtccgtg cgcactcaaa aggcgtccgg 660

gttagggcat ccgataatat cgcctggact cggcgccata ttctcgactt ctgggcgcgt 720

tgtattcatc tcctccgctt cccaacactt ccacccgttt ctccatccca accaatagaa 780

tagggtaacc ttattcggga cactttcgtc atacatagtc agatatacaa gcaatgtcac 840

tctccttcgt actcgtacat acaacacaac tacattcaaa 880

<210> 68

<211> 1000

<212> DNA

<213> 解脂耶氏酵母()

<400> 68

caattcatgt atcgtgtcaa ttcatgtatc gtgtcaattc atgtatcgtg tcaatactta 60

tatctcaagt ggttgcatcg caaacagcca tcgcatactc cactctactc tcactgagtt 120

cactcttacc cggctccacc ttctagaagc caccaccgat ccaccgacga tgatcagtcc 180

accacttgct ctgaatgtgc gttggagctg caccatgatt gatgacgtca ccgccattca 240

gatagggcaa aagacgagcg ccaatcgcaa caatgggcga gtgtcgacga ctcccccgct 300

ctctgcggtt tcagcgactc caaccgtcgc caaaagaccg tcattttcgt ctaaagcgca 360

gcccagccca tctcttctaa aagattccag aaagataggg ttcaccaact acgcaccaat 420

atgtacagta tcgtagctac tccggcttgg ctgatctgag agatagagat ggctccgaaa 480

cgcggaaaac ggcggggtcg gaccgatcac gtgacacgta ctcatccgtc gcgccccgag 540

cgccatttca acaccaaata ctcccggtca cgtgccaccc cgcccgctct acccacgaga 600

tgtttctaca ctatacactg ccacgccgtc atacctgcag ctaggttaac attcgattaa 660

ttagtggagt caccagtgta caggactatg gcggaaaccg ggttacacaa accggcccgg 720

aatagcagca ttataccgct ggacgagatc accgtcaata aattgcgtcg ttactcggga 780

caaccattgc tcctccggct acacctgctc aaaggacttg ttccacactc ttccccagct 840

ctcccacgca aacaaagaga gcaaccttaa gtggacagct catgagcact cccctcgttt 900

gctgcccacg ctcgattata taaagaccag cggatcccct tctatttgga cttgcatcaa 960

ccaaccacaa cccacaccaa gcacacaaag cacaagaaca 1000

<210> 69

<211> 127

<212> DNA

<213> 解脂耶氏酵母()

<400> 69

aattaacaga tagtttgccg gtgataattc tcttaacctc ccacactcct ttgacataac 60

gatttatgta acgaaactga aatttgacca gatattgttg taaatagaaa atctggcttg 120

taggtgg 127

<210> 70

<211> 200

<212> DNA

<213> 解脂耶氏酵母()

<400> 70

gttttttgat caatgatcca atggctttca catacccccc cacgcctata attaaaacac 60

agagaaatat aatctaactt aataaatatt acggagaatc tttcgagtgt tcagcagaaa 120

tatagccatt gtaacaaaag ccggctatcg accgctttat cgaagaatat ttcccgcccc 180

ccagtggcca aacgatatcg 200

<210> 71

<211> 200

<212> DNA

<213> 解脂耶氏酵母()

<400> 71

ctatccgaag atcaagagcg aagcaagttg taagtccagg acatgtttcc cgcccacgcg 60

agtgatttat aacacctctc ttttttgaca cccgctcgcc ttgaaattca tgtcacataa 120

attatagtca acgacgtttg aataacttgt cttgtagttc gatgatgatc atatgattac 180

attaatagta attactgtat 200

<210> 72

<211> 200

<212> DNA

<213> 解脂耶氏酵母()

<400> 72

acttcgagct aatccagtag cttacgttac ccaggggcag gtcaactggc tagccacgag 60

tctgtcccag gtcgcaattt agtgtaataa acaatatata tattgagtct aaagggaatt 120

gtagctattg tgattgtgtg attttcgtct tgctggttct tattgtgtcc cattcgtttc 180

atcctgatga ggacccctgg 200

<210> 73

<211> 200

<212> DNA

<213> 解脂耶氏酵母()

<400> 73

gctatttaca gcatgtgtaa tgaggaatat aacgttgatt gaattgtttg tgaaaaatgt 60

agaaaatttc agtgaagttg tgttttctat atagtaagca cttttggtac aagtatctgc 120

acatccctgc atgttacaag cctgatcatg cagggcaata ttctgactat aaatatacct 180

cgatatttta gcaagctata 200

<210> 74

<211> 300

<212> DNA

<213> 解脂耶氏酵母()

<400> 74

atgtggtgat tgctgttgtg caagcctttg ctcgttttct gctgtatgta atttaaagaa 60

cgattgtatg aatcgaagtc aaggtgagtg tagtttgaga agtgtaaccc cagtgtcata 120

gctgtgtact ccattcattg aagggtgtag tcgtgtttta ttgcatgagc gcctattact 180

cgtataagta actgttttgt aacacttcat gaacggagat ggtatgaaca gaagtaataa 240

tatcctggaa gtcagctgtg cccagaggtg tgtgtgggtg tggcatactt tgggacaaca 300

<210> 75

<211> 1503

<212> DNA

<213> 人工序列()

<220>

<223> tHMG CpO用于解脂耶氏酵母

<400> 75

atgacccagt ctgtgaaggt ggttgagaag cacgttccta tcgtcattga gaagcccagc 60

gagaaggagg aggacacctc ttctgaagac tccattgagc tgactgtcgg aaagcagccc 120

aagcccgtga ccgagacccg ttctctggac gacttggagg ctatcatgaa ggcaggtaag 180

accaagctcc tggaggacca cgaggttgtc aagctctctc tcgaaggcaa gctccctttg 240

tatgctcttg agaagcagct tggtgacaac acccgagctg ttggcatccg acgatctatc 300

atctcccagc agtctaatac caagactctt gagacctcaa agctccctta cctgcactac 360

gactacgacc gtgtttttgg agcctgttgc gagaacgtta ttggttacat gcctctcccc 420

gttggtgttg ctggccccat gaacattgat ggcaagaact accacattcc tatggccacc 480

actgagggtt gtcttgttgc ctcaaccatg cgaggttgca aggccatcaa cgccggtggc 540

ggtgttacca ctgtgcttac tcaggacggt atgacacgag gtccttgtgt ttccttcccc 600

tctctcaagc gggctggagc cgctaagatc tggcttgatt ccgaggaggg tctcaagtcc 660

atgcgaaagg ccttcaactc cacctctcga tttgctcgtc tccagtctct tcactctacc 720

cttgctggta acctgctgtt tattcgattc cgaaccacca ctggtgatgc catgggcatg 780

aacatgatct ccaagggcgt cgaacactct ctggccgtca tggtcaagga gtacggcttc 840

cctgatatgg acattgtgtc tgtctcgggt aactactgca ctgacaagaa gcccgcagcg 900

atcaactgga tcgaaggccg aggcaagagt gttgttgccg aagccaccat ccctgctcac 960

attgtcaagt ctgttctcaa aagtgaggtt gacgctcttg ttgagctcaa catcagcaag 1020

aatctgatcg gtagtgccat ggctggctct gtgggaggtt tcaatgcaca cgccgcaaac 1080

ctggtgaccg ccatctacct tgccactggc caggatcctg ctcagaatgt cgagtcttcc 1140

aactgcatca cgctgatgag caacgtcgac ggtaacctgc tcatctccgt ttccatgcct 1200

tctatcgagg tcggtaccat tggtggaggt actattttgg agccccaggg tgctatgctg 1260

gagatgcttg gcgtgcgagg tcctcacatc gagacccccg gtgccaacgc ccaacagctt 1320

gctcgcatca ttgcttctgg agttcttgca gcggagcttt cgctgtgttc tgctcttgct 1380

gccggccatc ttgtgcaaag tcatatgacc cacaaccgtt cccaggctcc tactccggcc 1440

aagcagtctc aggccgatct gcagcgtctc caaaacggtt cgaatatctg cattcggtca 1500

tag 1503

<210> 76

<211> 984

<212> DNA

<213> 人工序列()

<220>

<223> GGS CpO用于解脂耶氏酵母

<400> 76

atggattata acagcgcgga tttcaaggag atctggggca aggccgccga caccgcgctg 60

ctgggaccgt acaactacct cgccaacaac cggggccaca acatcagaga acacttgatc 120

gcagcgttcg gagcggttat caaggtggac aagagcgatc tcgaaaccat ttcgcacatc 180

accaagattt tgcataactc gtcgctgctt gttgatgacg tggaagacaa ctcgatgctc 240

cgacgaggcc tgccggcagc ccattgtctg tttggagtcc cccaaaccat caactccgcc 300

aactacatgt actttgtggc tctgcaggag gtgctcaagc tcaagtctta tgatgccgtc 360

tccattttca ccgaggaaat gatcaacttg catagaggtc agggtatgga tctctactgg 420

agagaaacac tcacttgccc ctcggaagac gagtatctgg agatggtggt gcacaagacc 480

ggaggactgt ttcggctggc tctgagactt atgctgtcgg tggcatcgaa acaggaggac 540

catgaaaaga tcaactttga tctcacacac cttaccgaca cactgggagt catttaccag 600

attctggatg attacctcaa cctgcagtcc acggaattga ccgagaacaa gggattctgc 660

gaagatatca gcgaaggaaa gttttcgttt ccgctgattc acagcatccg gaccaacccg 720

gataaccacg agattctcaa cattctcaaa cagcgaacaa gcgacgcttc actcaaaaag 780

tacgccgtgg actacatgag aacagaaacc aagagtttcg actactgcct caagagaatc 840

caggccatgt cactcaaggc aagttcgtac attgatgatc tcgcagcagc cggccacgat 900

gtctccaagt tgcgagccat tttgcattat tttgtgtcca cctctgactg tgaggagaga 960

aagtactttg aggatgcgca gtga 984

<210> 77

<211> 1446

<212> DNA

<213> 人工序列()

<220>

<223> UGT1 CpO用于解脂耶氏酵母

<400> 77

atggacgcca tggccaccac cgagaagaag ccccacgtca tcttcatccc cttccccgcc 60

cagtcccaca tcaaggccat gctcaagctc gcccagctcc tccaccacaa gggcctccag 120

atcacctttg tcaacaccga cttcatccac aaccagttcc tcgagtcctc cggcccccac 180

tgtctggacg gtgctcccgg tttccgattt gagactatcc ccgatggtgt ctcccactcc 240

cccgaggcct ccatccccat ccgagagtct ctgctccgat ccattgagac taacttcctc 300

gaccgattca ttgatctcgt caccaagctc cccgatcctc ccacctgtat catctccgac 360

ggtttcctgt ccgttttcac cattgatgct gccaagaagc tcggtatccc cgtcatgatg 420

tactggactc tggctgcctg tggtttcatg ggtttctacc acatccactc tctgatcgag 480

aagggctttg ctcctctcaa ggacgcctcc tacctcacca acggttacct cgacaccgtc 540

attgactggg tccccggtat ggagggtatc cgactcaagg acttccccct cgactggtcc 600

accgacctca acgacaaggt tctcatgttc accaccgagg ctccccagcg atcccacaag 660

gtttcccacc acatcttcca caccttcgac gagctcgagc cctccatcat caagactctg 720

tctctgcgat acaaccacat ctacaccatt ggccccctcc agctcctcct cgaccagatc 780

cccgaggaga agaagcagac cggtatcacc tctctgcacg gctactctct cgtcaaggaa 840

gagcccgagt gcttccagtg gctccagtcc aaggagccca actccgttgt ctacgtcaac 900

tttggctcca ccaccgtcat gtctctcgag gacatgaccg agtttggctg gggtctggcc 960

aactccaacc actacttcct gtggatcatc cgatccaacc tcgtcattgg cgagaacgcc 1020

gttctgcctc ccgagctcga ggagcacatc aagaagcgag gcttcattgc ctcttggtgc 1080

tcccaggaga aggttctcaa gcacccctcc gtcggtggtt tcctgaccca ctgcggctgg 1140

ggctccacca ttgagtctct gtccgctggt gtccccatga tctgctggcc ctactcctgg 1200

gaccagctca ccaactgccg atacatctgc aaggagtggg aggttggtct ggagatgggt 1260

accaaggtca agcgagatga ggtcaagcga ctcgtccagg agctcatggg cgagggtggt 1320

cacaagatgc gaaacaaggc caaggactgg aaggagaagg cccgaattgc cattgccccc 1380

aacggctctt cttctctcaa cattgacaag atggtcaagg agatcactgt tctcgctcga 1440

aactaa 1446

<210> 78

<211> 1383

<212> DNA

<213> 人工序列()

<220>

<223> UGT3 CpO用于解脂耶氏酵母

<400> 78

atggccgagc agcagaagat caagaagtct ccccacgttc tgctcatccc cttccctctg 60

cagggccaca tcaacccctt catccagttc ggcaagcgac tcatctccaa gggtgtcaag 120

accactctgg tcaccaccat ccacaccctc aactccactc tcaaccactc caacaccacc 180

accacctcca tcgagatcca ggccatctcc gacggctgtg acgagggtgg tttcatgtct 240

gctggtgagt cttacctcga gactttcaag caggtcggtt ccaagtctct ggctgacctc 300

atcaagaagc tccagtccga gggtaccacc attgacgcca tcatctacga ctccatgacc 360

gagtgggttc tcgatgtcgc catcgagttt ggtattgacg gtggctcctt cttcacccag 420

gcctgtgtcg tcaactctct ctactaccac gtccacaagg gtctgatctc tctgcccctc 480

ggcgagactg tctccgtccc cggtttcccc gttctgcagc gatgggagac tcctctcatt 540

ctccagaacc acgagcagat ccagtccccc tggtcccaga tgctcttcgg ccagttcgcc 600

aacattgacc aggcccgatg ggttttcacc aactccttct acaagctcga ggaagaggtc 660

attgagtgga cccgaaagat ctggaacctc aaggtcattg gccccaccct cccctccatg 720

tacctcgaca agcgactcga tgacgacaag gacaacggtt tcaacctcta caaggccaac 780

caccacgagt gcatgaactg gctcgacgac aagcccaagg agtccgttgt ctacgttgcc 840

tttggctctc tggtcaagca cggccccgag caggttgagg agatcacccg agctctgatt 900

gactccgatg tcaacttcct gtgggtcatc aagcacaagg aagagggtaa gctccccgag 960

aacctgtccg aggtcatcaa gaccggcaag ggcctcattg ttgcctggtg caagcagctc 1020

gacgttctcg cccacgagtc cgtcggctgc tttgtcaccc actgcggttt caactccacc 1080

ctcgaggcta tctctctcgg tgtccccgtt gttgccatgc cccagttctc cgaccagacc 1140

accaacgcca agctcctcga tgagattctc ggtgtcggtg tccgagtcaa ggctgacgag 1200

aacggtattg tccgacgagg taacctggct tcttgtatca agatgatcat ggaggaagag 1260

cgaggtgtca tcatccgaaa gaacgccgtc aagtggaagg atctggccaa ggttgctgtc 1320

cacgagggtg gctcttccga caacgacatt gtcgagtttg tctccgagct catcaaggcc 1380

taa 1383

<210> 79

<211> 1377

<212> DNA

<213> 人工序列()

<220>

<223> UGT4 CpO用于解脂耶氏酵母

<400> 79

atggagaaca agaccgagac taccgtccga cgacgacgac gaatcattct cttccccgtc 60

cccttccagg gccacatcaa ccccattctg cagctcgcca acgttctgta ctccaagggc 120

ttctccatca ccatcttcca caccaacttc aacaagccca agacctccaa ctacccccac 180

ttcactttcc gattcatcct cgacaacgac ccccaggacg agcgaatctc caacctgccc 240

acccacggtc ctctggctgg tatgcgaatc cccatcatca acgagcacgg tgctgacgag 300

ctccgacgag agctcgagct gctcatgctc gcctccgaag aggacgagga agtctcctgt 360

ctgatcaccg atgctctgtg gtactttgcc cagtccgtcg ccgactctct caacctgcga 420

cgactcgttc tcatgacctc ctctctgttc aacttccacg cccacgtttc tctgccccag 480

tttgacgagc tcggttacct cgaccccgat gacaagaccc gactcgagga gcaggcttcc 540

ggtttcccca tgctcaaggt caaggacatc aagtccgcct actccaactg gcagattctc 600

aaggagattc tcggcaagat gatcaagcag accaaggcct cctccggtgt catctggaac 660

tccttcaagg agctcgagga gtccgagctc gagactgtca tccgagagat ccccgctccc 720

tctttcctca tccccctgcc caagcacctc accgcttcct cctcttctct gctcgaccac 780

gaccgaaccg tctttcagtg gctcgaccag cagccccctt cctccgtcct ctacgtttcc 840

ttcggctcca cctccgaggt cgacgagaag gacttcctcg agattgctcg aggcctcgtt 900

gactccaagc agtccttcct gtgggttgtc cgacccggct ttgtcaaggg ctccacctgg 960

gttgagcccc tgcccgatgg tttcctcggt gagcgaggcc gaattgtcaa gtgggtcccc 1020

cagcaggaag ttctggccca cggtgccatt ggtgccttct ggacccactc cggctggaac 1080

tccactctcg agtccgtctg cgagggtgtc cccatgatct tctccgactt tggcctcgac 1140

cagcccctca acgcccgata catgtccgat gttctcaagg tcggtgtcta cctcgagaac 1200

ggctgggagc gaggtgagat tgccaacgcc atccgacgag tcatggtcga cgaggaaggt 1260

gagtacatcc gacagaacgc ccgagtcctc aagcagaagg ccgatgtctc tctcatgaag 1320

ggtggttctt cttacgagtc tctcgagtct ctcgtttcct acatctcttc tttgtaa 1377

<210> 80

<211> 2232

<212> DNA

<213> 人工序列()

<220>

<223> tCPS_SR CpO用于解脂耶氏酵母

<400> 80

atgtgcaagg ctgtttccaa ggagtactcc gatctgctcc agaaggacga ggcctctttc 60

accaagtggg acgacgacaa ggtcaaggac cacctcgaca ccaacaagaa cctctacccc 120

aacgacgaga tcaaggagtt tgtcgagtcc gtcaaggcca tgttcggctc catgaacgac 180

ggcgagatta atgtctctgc ttacgacacc gcctgggttg ctctggtcca ggatgtcgac 240

ggttccggct ctcctcagtt cccttcctct ctcgagtgga tcgccaacaa ccagctgtcc 300

gacggttctt ggggtgacca cctgctcttc tctgctcacg accgaatcat caacaccctg 360

gcctgtgtca ttgctctgac ctcttggaac gtccacccct ccaagtgcga gaagggtctg 420

aacttcctcc gagagaacat ctgcaagctc gaggacgaga acgccgagca catgcccatt 480

ggcttcgagg tcaccttccc ctctctgatt gacattgcca agaagctcaa cattgaggtc 540

cccgaggaca cccccgctct caaggagatc tacgctcgac gagacatcaa gctcaccaag 600

atccccatgg aggttctcca caaggtcccc accactctcc tccactctct cgagggtatg 660

cccgatctcg agtgggagaa gctgctcaag ctgcagtgca aggacggctc tttcctcttc 720

tccccctctt ccactgcctt cgccctcatg cagaccaagg acgagaagtg tctccagtac 780

ctcaccaaca ttgtcaccaa gttcaacggt ggtgtcccca acgtctaccc cgttgacctc 840

tttgagcaca tctgggttgt tgaccgactc cagcgactcg gtatcgcccg atacttcaag 900

tccgagatca aggactgtgt cgagtacatc aacaagtact ggaccaagaa cggtatctgc 960

tgggcccgaa acacccacgt ccaggacatt gacgacaccg ccatgggctt ccgagttctg 1020

cgagcccacg gctacgatgt cacccccgat gtctttcgac agtttgagaa ggacggcaag 1080

tttgtctgtt tcgccggtca gtccacccag gccgtcaccg gtatgttcaa cgtctaccga 1140

gcttctcaga tgctcttccc cggtgagcga atcctcgagg acgccaagaa gttctcctac 1200

aactacctca aggagaagca gtccaccaac gagctgctcg acaagtggat cattgccaag 1260

gatctgcccg gtgaggttgg ctacgccctc gacatcccct ggtacgcctc tctgccccga 1320

ctggagactc gatactacct cgagcagtac ggtggtgagg acgatgtctg gatcggtaag 1380

accctgtacc gaatgggcta cgtttccaac aacacctacc tcgagatggc caagctcgac 1440

tacaacaact acgttgccgt cctccagctc gagtggtaca ccatccagca gtggtacgtc 1500

gacattggta tcgagaagtt cgagtccgac aacatcaagt ccgtccttgt ctcctactac 1560

ctcgctgctg cctccatctt cgagcccgag cgatccaagg agcgaattgc ctgggccaag 1620

accaccatcc tcgtcgacaa gatcacctcc atcttcgact cctcccagtc ctccaaggaa 1680

gatatcaccg ccttcattga caagttccga aacaagtcct cctccaagaa gcactccatc 1740

aacggcgagc cctggcacga ggtcatggtt gctctcaaga aaactctcca cggctttgcc 1800

ctcgacgctc tgatgaccca ctctcaggac atccaccccc agctccacca ggcctgggag 1860

atgtggctca ccaagctcca ggacggtgtt gatgtcactg ctgagctcat ggtccagatg 1920

atcaacatga ccgccggccg atgggtttcc aaggagctcc tcacccaccc ccagtaccag 1980

cgactctcca ctgtcaccaa ctctgtctgc cacgacatca ccaagctcca caacttcaag 2040

gagaactcca ccaccgtcga ctccaaggtc caggagctgg tccagctcgt tttctccgac 2100

acccccgatg atctcgacca ggacatgaag cagaccttcc tgactgtcat gaaaactttc 2160

tactacaagg cctggtgcga ccccaacacc atcaacgacc acatctccaa ggtctttgag 2220

attgtgattt aa 2232

<210> 81

<211> 2274

<212> DNA

<213> 人工序列()

<220>

<223> tKS-SR CpO用于解脂耶氏酵母

<400> 81

atgacctccc acggcggcca gaccaacccc accaacctca tcattgacac caccaaggag 60

cgaatccaga agcagttcaa gaacgtcgag atctccgttt cctcctacga caccgcctgg 120

gtcgccatgg tcccctctcc caactccccc aagtctccct gcttccccga gtgtctcaac 180

tggctcatca acaaccagct caacgacggc tcttggggtc tggtcaacca cacccacaac 240

cacaaccacc ccctcctcaa ggactctctc tcttccactc tcgcctgcat tgttgctctc 300

aagcgatgga acgttggcga ggaccagatc aacaagggtc tgtctttcat tgagtccaac 360

ctcgcctccg ccaccgagaa gtcccagccc tcccccattg gctttgatat catcttcccc 420

ggtctgctcg agtacgccaa gaacctcgat atcaacctgc tctccaagca gaccgacttc 480

tctctcatgc tgcacaagcg agagctcgag cagaagcgat gccactccaa cgagatggac 540

ggctacctgg cctacatttc cgagggtctg ggtaacctct acgactggaa catggtcaag 600

aagtaccaga tgaagaacgg ttccgttttc aactccccct ctgccaccgc tgctgccttc 660

atcaaccacc agaaccccgg ctgtctcaac tacctcaact ctctgctcga caagtttggt 720

aacgccgtcc ccactgtcta cccccacgat ctcttcatcc gactctccat ggtcgacacc 780

attgagcgac tcggtatttc ccaccacttc cgagtcgaga tcaagaacgt tctcgatgag 840

acttaccgat gctgggttga gcgagatgag cagatcttca tggacgttgt cacctgtgct 900

ctggccttcc gactcctccg aatcaacggt tacgaggttt cccccgaccc cctcgccgag 960

atcaccaacg agctggctct caaggacgag tacgccgccc tcgagactta ccacgcttct 1020

cacattctgt accaagagga tctgtcctcc ggcaagcaga ttctcaagtc cgccgacttc 1080

ctcaaggaga tcatctccac tgactccaac cgactctcca agctcatcca caaggaagtc 1140

gagaacgctc tcaagttccc catcaacacc ggtctggagc gaatcaacac ccgacgaaac 1200

atccagctct acaacgtcga caacacccga attctcaaga ccacctacca ctcttccaac 1260

atctccaaca ccgactacct gcgactcgcc gtcgaggact tctacacctg ccagtccatc 1320

taccgagagg agctcaaggg tctggagcga tgggttgtcg agaacaagct cgaccagctc 1380

aagtttgccc gacaaaagac tgcctactgc tacttctccg ttgctgccac cctctcttct 1440

cccgagctct ccgacgcccg aatctcttgg gccaagaacg gtatcctgac cactgttgtc 1500

gacgacttct ttgacattgg tggcaccatt gacgagctga ccaacctcat ccagtgcgtc 1560

gagaagtgga acgtcgacgt tgacaaggac tgttgttccg agcacgtccg aatcctcttc 1620

ctggctctca aggacgccat ctgctggatc ggtgacgagg ccttcaagtg gcaggctcga 1680

gatgtcactt cccacgtcat ccagacctgg ctcgagctca tgaactccat gctgcgagag 1740

gccatctgga cccgagatgc ctacgtcccc accctcaacg agtacatgga gaacgcctac 1800

gtcagctttg ctctcggtcc cattgtcaag cccgccatct actttgtcgg tcccaagctg 1860

tccgaggaga ttgtcgagtc ctccgagtac cacaacctct tcaagctcat gtccacccag 1920

ggccgactcc tcaacgatat ccactccttc aagcgagagt tcaaggaagg taagctcaac 1980

gccgttgctc tgcacctgtc caacggtgag tccggcaagg tcgaggaaga ggtcgtcgag 2040

gagatgatga tgatgatcaa gaacaagcga aaggagctca tgaagctcat cttcgaggag 2100

aacggctcca ttgtcccccg agcctgcaag gacgccttct ggaacatgtg ccacgtcctc 2160

aacttcttct acgccaacga cgacggtttc accggcaaca ccattctcga caccgtcaag 2220

gacatcatct acaaccctct ggttctggtc aacgagaacg aggagcagag gtaa 2274

<210> 82

<211> 1578

<212> DNA

<213> 人工序列()

<220>

<223> KAH_4 CpO用于解脂耶氏酵母

<400> 82

atggagtctc tggttgtcca caccgtcaac gccatctggt gcattgtcat tgtcggtatc 60

ttctccgtcg gctaccacgt ctacggccga gctgttgtcg agcagtggcg aatgcgacga 120

tctctcaagc tccagggtgt caagggtcct cctccctcca tcttcaacgg taacgtttcc 180

gagatgcagc gaatccagtc cgaggccaag cactgctccg gtgacaacat catctcccac 240

gactactctt cttctctgtt cccccacttt gaccactggc gaaagcagta cggccgaatc 300

tacacctact ccactggcct caagcagcac ctctacatca accaccccga gatggtcaag 360

gagctctccc agaccaacac cctcaacctc ggccgaatca cccacatcac caagcgactc 420

aaccccattc tcggtaacgg tatcatcacc tccaacggcc cccactgggc ccaccagcga 480

cgaatcattg cctacgagtt cacccacgac aagatcaagg gtatggtcgg tctgatggtc 540

gagtccgcca tgcccatgct caacaagtgg gaggagatgg tcaagcgagg tggtgagatg 600

ggctgtgaca tccgagtcga cgaggacctc aaggatgtct ccgctgacgt cattgccaag 660

gcctgtttcg gctcttcctt ctccaagggc aaggccatct tctccatgat ccgagatctg 720

ctcaccgcca tcaccaagcg atccgtcctc ttccgattca acggtttcac cgacatggtt 780

ttcggctcca agaagcacgg tgacgttgac attgacgctc tcgagatgga gctcgagtcc 840

tccatctggg agactgtcaa ggagcgagag attgagtgca aggacaccca caagaaggac 900

ctcatgcagc tcattctcga gggtgccatg cgatcttgtg acggtaacct gtgggacaag 960

tctgcttacc gacgattcgt tgtcgacaac tgcaagtcca tctactttgc cggccacgac 1020

tccaccgccg tttccgtttc ttggtgcctc atgctgctcg ctctcaaccc ctcttggcag 1080

gtcaagatcc gagatgagat tctgtcctcc tgcaagaacg gtatccccga cgccgagtcc 1140

atccccaacc tcaagaccgt caccatggtc atccaggaga ctatgcgact ctaccctccc 1200

gctcccattg tcggccgaga ggcctccaag gacattcgac tcggtgatct ggttgtcccc 1260

aagggtgtct gtatctggac cctcatcccc gctctgcacc gagatcccga gatctggggt 1320

cccgacgcca acgacttcaa gcccgagcga ttctccgagg gtatctccaa ggcctgcaag 1380

tacccccagt cctacatccc ctttggcctc ggcccccgaa cctgtgtcgg caagaacttt 1440

ggtatgatgg aggtcaaggt cctcgtttct ctgattgtct ccaagttctc cttcactctg 1500

tctcccacct accagcactc tccctcccac aagctgctcg tcgagcccca gcacggtgtt 1560

gtcatccgag ttgtataa 1578

<210> 83

<211> 1578

<212> DNA

<213> 人工序列()

<220>

<223> KO_Gib CpO用于解脂耶氏酵母

<400> 83

atgtccaagt ccaactccat gaactccacc tcccacgaga ctctcttcca gcagctcgtt 60

ctcggcctcg accgaatgcc cctcatggac gtccactggc tcatctacgt tgcctttggt 120

gcctggctct gctcctacgt catccacgtt ctgtcctctt cctccactgt caaggtcccc 180

gtcgtcggtt accgatccgt tttcgagccc acctggctcc tccgactgcg attcgtctgg 240

gagggtggtt ccatcattgg ccagggctac aacaagttca aggactccat cttccaggtc 300

cgaaagctcg gtaccgacat tgtcatcatc cctcccaact acattgacga ggtccgaaag 360

ctctcccagg acaagacccg atccgtcgag cccttcatca acgactttgc cggccagtac 420

acccgaggta tggtctttct gcagtccgat ctccagaacc gagtcatcca gcagcgactc 480

acccccaagc ttgtctctct caccaaggtc atgaaggaag agctcgacta cgctctgacc 540

aaggagatgc ccgacatgaa gaacgacgag tgggttgagg tcgacatctc ttccatcatg 600

gtccgactca tctctcgaat ctccgcccga gttttcctcg gccccgagca ctgccgaaac 660

caggagtggc tcaccaccac cgccgagtac tccgagtctc tcttcatcac cggcttcatc 720

ctccgagttg tcccccacat tctccgaccc ttcattgctc ctctgctgcc ctcttaccga 780

accctgctgc gaaacgtttc ttccggccga cgagtcattg gtgatatcat ccgatcccag 840

cagggtgacg gtaacgagga catcctctct tggatgcgag atgctgccac tggtgaggag 900

aagcagatcg acaacattgc ccagcgaatg ctcattctgt ctctcgcctc catccacacc 960

accgccatga ccatgaccca cgccatgtac gatctgtgtg cctgccccga gtacattgag 1020

cccctccgag atgaggtcaa gtccgtcgtt ggtgcttctg gctgggacaa gaccgctctc 1080

aaccgattcc acaagctcga ctctttcctc aaggagtccc agcgattcaa ccccgttttc 1140

ctgctcacct tcaaccgaat ctaccaccag tccatgaccc tctccgatgg taccaacatc 1200

ccctccggta cccgaattgc tgtcccctct cacgccatgc tccaggactc cgcccacgtc 1260

cccggtccca ctcctcccac tgagttcgac ggtttccgat actccaagat ccgatccgac 1320

tccaactacg cccagaagta cctcttctcc atgaccgact cttccaacat ggcctttggc 1380

tacggtaagt acgcctgccc cggccgattc tacgcctcca acgagatgaa gctgactctg 1440

gccattctgc tcctccagtt tgagttcaag ctccccgacg gtaagggccg accccgaaac 1500

atcaccatcg actccgacat gatccccgac ccccgagctc gactctgtgt ccgaaagcga 1560

tctctgcgtg acgagtaa 1578

<210> 84

<211> 2133

<212> DNA

<213> 人工序列()

<220>

<223> CPR_3 CpO用于解脂耶氏酵母

<400> 84

atgtcctcct cttcttcttc ttccacctcc atgattgatc tcatggctgc catcatcaag 60

ggtgagcccg tcattgtctc cgaccccgcc aacgcctccg cctacgagtc cgttgctgcc 120

gagctgtcct ccatgctcat cgagaaccga cagtttgcca tgatcgtcac cacctccatt 180

gctgttctca ttggctgcat tgtcatgctc gtctggcgac gatctggctc cggtaactcc 240

aagcgagtcg agcccctcaa gcccctggtc atcaagcccc gagaagagga gatcgacgac 300

ggccgaaaga aggtcaccat cttctttggc acccagaccg gtactgctga gggcttcgcc 360

aaggctctcg gtgaggaagc caaggctcga tacgaaaaga cccgattcaa gattgtcgac 420

ctcgatgatt acgctgccga tgacgacgag tacgaggaga agctcaagaa agaggacgtt 480

gccttcttct tcctcgccac ctacggtgac ggtgagccca ccgacaacgc tgcccgattc 540

tacaagtggt tcaccgaggg taacgaccga ggcgagtggc tcaagaacct caagtacggt 600

gttttcggtc tgggcaaccg acagtacgag cacttcaaca aggttgccaa ggttgtcgac 660

gacatcctcg tcgagcaggg tgcccagcga ctcgtccagg tcggcctcgg tgatgatgac 720

cagtgcatcg aggacgactt cactgcctgg cgagaggctc tgtggcccga gctcgacacc 780

attctgcgag aggaaggtga caccgccgtt gccaccccct acaccgccgc cgtcctcgag 840

taccgagtct ccatccacga ctccgaggat gccaagttca acgacatcaa catggccaac 900

ggtaacggct acaccgtctt tgacgcccag cacccctaca aggccaacgt cgccgtcaag 960

cgagagctcc acacccccga gtccgaccga tcttgtatcc acctcgagtt tgacattgct 1020

ggttccggtc tgacctacga gactggtgac cacgttggtg tcctctgtga caacctgtcc 1080

gagactgtcg acgaggctct gcgactcctc gacatgtccc ccgacactta cttctctctg 1140

cacgccgaga aagaggacgg tactcccatc tcttcttctc tgccccctcc cttccctccc 1200

tgcaacctgc gaaccgctct gacccgatac gcctgcctcc tctcttctcc caagaagtct 1260

gctctcgttg ctctggccgc ccacgcctcc gaccccaccg aggctgagcg actcaagcac 1320

ctcgcctctc ccgctggcaa ggacgagtac tccaagtggg ttgtcgagtc ccagcgatct 1380

ctgctcgagg tcatggccga gttcccctcc gccaagcccc ctctcggtgt tttcttcgcc 1440

ggtgttgctc cccgactcca gccccgattc tactccatct cctcttcccc caagatcgcc 1500

gagactcgaa tccacgttac ctgtgctctg gtctacgaga agatgcccac cggccgaatc 1560

cacaagggtg tctgctccac ctggatgaag aacgccgttc cctacgagaa gtccgagaac 1620

tgttcctctg ctcccatctt tgtccgacag tccaacttca agctcccctc cgactccaag 1680

gtccccatca tcatgattgg ccccggtacc ggcctcgccc ccttccgagg cttcctgcag 1740

gagcgactcg ccctcgtcga gtccggtgtc gagctcggcc cctccgtcct cttctttggc 1800

tgccgaaacc gacgaatgga cttcatctac gaagaggagc tccagcgatt cgtcgagtcc 1860

ggtgctctcg ccgagctctc cgttgccttc tcccgagagg gtcccaccaa ggagtacgtc 1920

cagcacaaga tgatggacaa ggcctccgac atctggaaca tgatctccca gggcgcctac 1980

ctctacgtct gcggtgacgc caagggtatg gcccgagatg tccaccgatc tctgcacacc 2040

attgcccagg agcagggctc catggactcc accaaggccg agggtttcgt caagaacctc 2100

cagacctccg gccgatacct ccgagatgtc tgg 2133

Claims

a.与SEQ ID NO:1中列出的氨基酸序列具有至少约85％同一性；

b.与SEQ ID NO:3中列出的氨基酸序列具有至少约85％同一性；

c.与SEQ ID NO:6中列出的氨基酸序列具有至少约85％同一性；

d.与SEQ ID NO:9中列出的氨基酸序列具有至少约85％同一性；

e.与SEQ ID NO:11中列出的氨基酸序列具有至少约85％同一性；

f.与SEQ ID NO:14中列出的氨基酸序列具有至少约85％同一性；

g.与SEQ ID NO:17中列出的氨基酸序列具有至少约85％同一性；

h.与SEQ ID NO:20中列出的氨基酸序列具有至少约85％同一性；

i.与SEQ ID NO:22中列出的氨基酸序列具有至少约85％同一性；或

j.与SEQ ID NO:25中列出的氨基酸序列具有至少约85％同一性。

2.根据权利要求1所述的重组宿主，其能够产生糖基化二萜，如甜菊醇糖苷。

3.根据权利要求1或2所述的重组宿主，其包含一个或更多个重组核苷酸序列，所述重组核苷酸序列编码：

具有对映-柯巴基焦磷酸合酶活性的多肽；

具有对映-贝壳杉烯合酶活性的多肽；

具有对映-贝壳杉烯氧化酶活性的多肽；以及

具有贝壳杉烯酸13-羟化酶活性的多肽。

4.根据前述权利要求中任一项所述的重组宿主，其包含重组核酸序列，所述重组核酸序列编码具有NADPH-细胞色素p450还原酶活性的多肽。

5.根据前述权利要求中任一项所述的重组宿主，其包含编码以下中的一种或更多种的重组核酸序列：

(i)具有UGT74G1(UGT3)活性的多肽；

(ii)具有UGT85C2(UGT1)活性的多肽；以及

(iii)具有UGT76G1(UGT4)活性的多肽。

6.根据前述权利要求中任一项所述的重组宿主，其包含重组核酸序列，所述重组核酸序列编码具有UGT2活性的额外多肽。

7.根据前述权利要求中任一项所述的重组宿主，其中所述宿主属于以下属中的一种：酵母属(Saccharomyces)、曲霉属(Aspergillus)、毕赤酵母属(Pichia)、克鲁维酵母属(Kluyveromyces)、假丝酵母属(Candida)、汉逊酵母属(Hansenula)、腐质霉属(Humicola)、伊萨酵母属(Issatchenkia)、毛孢子菌属(Trichosporon)、酒香酵母属(Brettanomyces)、管囊酵母属(Pachysolen)、耶氏酵母属(Yarrowia)、Yamadazyma或埃希氏杆菌属(Escherichia)。

8.根据权利要求7所述的重组宿主，其中所述重组宿主是酿酒酵母(Saccharomycescerevisiae)细胞、解脂耶氏酵母(Yarrowia lipolitica)细胞、克鲁斯假丝酵母(Candidakrusei)细胞、东方伊萨酵母(Issatchenkia orientalis)细胞或大肠杆菌(Escherichiacoli)细胞。

9.根据前述权利要求中任一项所述的重组宿主，其中所述宿主产生香叶基香叶基二磷酸(GGPP)的能力被上调。

10.根据前述权利要求中任一项所述的重组宿主，其包含一个或更多个重组核酸序列，所述重组核酸序列编码羟甲基戊二酰基-辅酶A还原酶、法尼基-焦磷酸合成酶和香叶基香叶基二磷酸合酶。

11.根据前述权利要求中任一项所述的重组宿主，其包含编码以下中的一种或更多种的核酸序列：

具有羟甲基戊二酰基-辅酶A还原酶活性的多肽；

具有法尼基-焦磷酸合成酶活性的多肽；

具有香叶基香叶基二磷酸合酶活性的多肽。

12.一种用于制备糖基化二萜的方法，所述方法包括在合适的发酵培养基中发酵根据权利要求2至11中任一项所述的重组宿主，并且任选地回收所述糖基化二萜。

13.根据权利要求12中任一项所述的方法，其用于制备糖基化二萜，其中所述方法以工业规模进行。

14.一种发酵液，其包含能够通过根据权利要求12或13所述的方法获得的糖基化二萜。

15.一种糖基化二萜，其通过根据权利要求12或13所述的方法获得或能够从根据权利要求14所述的发酵液获得。

16.一种组合物，其包含通过根据权利要求12或13所述方法获得或能够从根据权利要求14所述的发酵液获得的两种或更多种糖基化二萜。

17.一种食品、饲料或饮料，其包含根据权利要求15所述的糖基化二萜或根据权利要求16所述的组合物。

–使所述第一糖基化二萜与根据权利要求1至11中任一项所述的重组宿主、源自这种重组宿主的无细胞提取物或源自上述任一者的酶制剂接触；

–从而将所述第一糖基化二萜转化为所述第二糖基化二萜。

19.根据权利要求18所述的方法，其中所述第二糖基化二萜是甜菊醇-19-双糖苷、甜菊双糖苷、甜菊苷、RebE、RebD或13-[(β-D-吡喃葡萄糖基)氧基)贝壳杉-16-烯-18-酸2-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖基酯。

20.根据权利要求19所述的方法，其中所述第一糖基化二萜是甜菊醇-13-单糖苷、甜菊醇-19-单糖苷、甜茶苷、甜菊苷、莱鲍迪甙A或13-[(β-D-吡喃葡萄糖基)氧基)贝壳杉-16-烯-18-酸2-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖基酯，并且所述第二糖基化二萜是甜菊醇-19-双糖苷、甜菊双糖苷、甜菊苷、RebE、RebD或13-[(β-D-吡喃葡萄糖基)氧基)贝壳杉-16-烯-18-酸2-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖基酯。

(c)由包含在SEQ ID NO:2、4、5、7、8、10、12、13、15、16、18、19、21、23、24或26中的任一个中列出的多核苷酸序列的多核苷酸编码的多肽；或

(d)由包含与SEQ ID NO:2、4、5、7、8、10、12、13、15、16、18、19、21、23、24或26中的任一个中的多肽编码序列具有至少30％序列同一性的多核苷酸序列的多核苷酸编码的多肽；或

(e)由在优选至少低严格性条件下与SEQ ID NO:2、4、5、7、8、10、12、13、15、16、18、19、21、23、24或26中的任一个的互补链杂交的多核苷酸编码的多肽；或

(f)由在优选至少低严格性条件下与同SEQ ID NO:2、4、5、7、8、10、12、13、15、16、18、19、21、23、24或26中的任一个具有至少30％序列同一性的多核苷酸的互补链杂交的多核苷酸编码的多肽；或

(g)在(a)、(b)、(c)、(d)、(e)或(f)中定义的多肽的片段。

22.根据权利要求21所述的多肽，其包含具有与SEQ ID NO:1、3、6、9、11、14、17、20、22或25中的任一个具有至少约86％序列同一性、至少约87％、至少约88％、至少约89％、至少约90％、至少约91％、至少约92％、至少约93％、至少约94％、至少约95％、至少约96％、至少约97％、至少约98％、至少约99％序列同一性的氨基酸序列的多肽。

23.一种多核苷酸序列，其编码根据权利要求21或22所述的多肽。

24.根据权利要求23所述的多核苷酸序列，其中所述多核苷酸序列选自由以下各项组成的组：

(a)包含SEQ ID NO:2、4、5、7、8、10、12、13、15、16、18、19、21、23、24或26中的任一个或包含与SEQ ID NO:2、4、5、7、8、10、12、13、15、16、18、19、21、23、24或26中的任一个的多核苷酸序列具有至少30％序列同一性的多核苷酸序列的多核苷酸序列；或

(b)在优选至少低严格性条件下与SEQ ID NO:2、4、5、7、8、10、12、13、15、16、18、19、21、23、24或26中的任一个的互补链杂交的多核苷酸序列；或

(c)在优选至少低严格性条件下与同SEQ ID NO:2、4、5、7、8、10、12、13、15、16、18、19、21、23、24或26中的任一个具有至少30％序列同一性的多核苷酸的互补链杂交的多核苷酸序列；

(d)作为(a)、(b)或(c)中任一项所定义的多核苷酸序列的遗传密码简并性的结果的简并物的多核苷酸序列；或

(e)为(a)、(b)、(c)或(d)中定义的核苷酸序列的互补物的多核苷酸序列。

25.根据权利要求5所述的多核苷酸序列，其与SEQ ID NO:2、4、5、7、8、10、12、13、15、16、18、19、21、23、24或26中的任一个具有至少60％、优选至少70％、更优选至少80％、最优选至少90％、最优选至少93％、最优选至少约95％、最优选至少约96％、最优选至少约97％、甚至最优选至少约98％以及甚至更优选至少99％的序列同一性。

26.一种核酸构建体，其包含权利要求23至25中任一项所述的多核苷酸序列。

27.根据权利要求26所述的核酸构建体，其是表达载体，其中根据权利要求23至25中任一项所述的多核苷酸序列与至少一个用于在宿主细胞中表达所述多核苷酸序列的控制序列可操作地连接。

28.一种产生权利要求21或22所述的多肽的方法，所述方法包括：

(a)在有利于通过根据权利要求1所述的宿主细胞产生所述多肽的条件下培养所述宿主细胞，并且任选地

(b)回收所述多肽。