CN107922913B - 甜菊醇糖苷转运 - Google Patents
甜菊醇糖苷转运 Download PDFInfo
- Publication number
- CN107922913B CN107922913B CN201680047069.7A CN201680047069A CN107922913B CN 107922913 B CN107922913 B CN 107922913B CN 201680047069 A CN201680047069 A CN 201680047069A CN 107922913 B CN107922913 B CN 107922913B
- Authority
- CN
- China
- Prior art keywords
- polypeptide
- leu
- ile
- lys
- ser
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P19/00—Preparation of compounds containing saccharide radicals
- C12P19/44—Preparation of O-glycosides, e.g. glucosides
- C12P19/56—Preparation of O-glycosides, e.g. glucosides having an oxygen atom of the saccharide radical directly bound to a condensed ring system having three or more carbocyclic rings, e.g. daunomycin, adriamycin
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07H—SUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
- C07H15/00—Compounds containing hydrocarbon or substituted hydrocarbon radicals directly attached to hetero atoms of saccharide radicals
- C07H15/20—Carbocyclic rings
- C07H15/24—Condensed ring systems having three or more rings
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/37—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi
- C07K14/39—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi from yeasts
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1048—Glycosyltransferases (2.4)
- C12N9/1051—Hexosyltransferases (2.4.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y204/00—Glycosyltransferases (2.4)
- C12Y204/01—Hexosyltransferases (2.4.1)
- C12Y204/01017—Glucuronosyltransferase (2.4.1.17)
Landscapes
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- Molecular Biology (AREA)
- Microbiology (AREA)
- Medicinal Chemistry (AREA)
- Mycology (AREA)
- General Chemical & Material Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Biomedical Technology (AREA)
- Gastroenterology & Hepatology (AREA)
- Biophysics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
Abstract
一种能够产生甜菊醇糖苷的重组宿主,所述重组宿主过表达介导甜菊醇糖苷转运的多肽,所述多肽包含SEQ ID NO:35或SEQ ID NO:38所示的氨基酸序列或与二者之任一具有至少约50%序列同一性的氨基酸序列。一种能够产生甜菊醇糖苷的重组宿主,所述重组宿主已被修饰,优选在其基因组中被修饰,以导致介导甜菊醇糖苷转运的多肽的产生缺陷,并且所述多肽包含SEQ ID NO:35或SEQ ID NO:38所示的氨基酸序列或与二者之任一具有至少约50%序列同一性的氨基酸序列。
Description
发明领域
本发明涉及能够产生甜菊醇糖苷的重组宿主。本发明还涉及使用这种重组宿主制备甜菊醇糖苷的方法。本发明还涉及包含甜菊醇糖苷的发酵液、甜菊醇糖苷和包含两种或更多种甜菊醇糖苷的组合物。本发明还涉及包含甜菊醇糖苷或含有两种或更多种甜菊醇糖苷的组合物的食品、饲料或饮料。
发明背景
多年生草本植物甜叶菊(Stevia rebaudiana Bert.)的叶子积聚大量被称为甜菊醇糖苷的具有强烈甜味的化合物。虽然这些化合物的生物功能尚不清楚,但它们作为替代性高效甜味剂具有商业意义。
这些甜的甜菊醇糖苷的功能和感官特性表现为优于许多高效甜味剂的功能和感官特性。此外,研究表明甜菊苷能够降低II型糖尿病患者的血糖水平,并且能够降低轻度高血压患者的血压。
甜菊醇糖苷积聚在甜叶菊叶中,其中它们可占叶干重的10%至20%。甜菊苷和莱鲍迪甙A均是热和pH稳定的,并且适用于碳酸饮料和许多其他食物。甜菊苷比蔗糖甜110与270倍之间,莱鲍迪甙A比蔗糖甜150与 320倍之间。此外,莱鲍迪甙D也是在甜叶菊叶中积聚的高效二萜糖苷甜味剂。它可比蔗糖甜约200倍。莱鲍迪甙M是另一种高效二萜糖苷甜味剂。它在某些甜叶菊品种叶中以痕量存在,但已表明其具有优异的味道特征。
传统上已从甜叶菊植物中提取了甜菊醇糖苷。在甜叶菊中,(-)-贝壳杉烯酸(赤霉酸(GA)生物合成中的中间体)被转化成四环二萜甜菊醇,其然后通过多步糖基化途径进行以形成各种甜菊醇糖苷。然而,产率可以是可变的,并且受到农业和环境条件的影响。此外,甜叶菊种植需要大量的土地面积、在收获前的很长时间、密集劳动以及用于提取和纯化糖苷的额外成本。
最近,使用发酵工艺生产甜菊醇糖苷的兴趣日益增长。 WO2013/110673和WO2015/007748中描述了可用于产生至少甜菊醇糖苷莱鲍迪甙A、莱鲍迪甙D和莱鲍迪甙M的微生物。
此类微生物的进一步改进是令人希望的,以便可产生更高量的甜菊醇糖苷和/或另外或新的甜菊醇糖苷和/或更高量的特异性甜菊醇糖苷和/或具有期望比例的不同甜菊醇糖苷的甜菊醇糖苷的混合物。
发明概述
本发明基于鉴定能够介导甜菊醇糖苷转运的蛋白质。
因此,可以在重组宿主(例如微生物细胞)中过表达一种或更多种这样的蛋白质以增加甜菊醇糖苷转运出宿主。或者,可以修饰宿主(例如微生物细胞),以相较于相应的未修饰版本的宿主表达更少一种或更多种这样的蛋白质。在这种情况下,宿主内可以保留更多甜菊醇糖苷,其然后被糖基化成包含更高数量的糖部分的甜菊醇糖苷。
因此,本发明涉及重组宿主,例如细胞,诸如微生物细胞,其产生甜菊醇糖苷到宿主外的程度高于不过表达所述蛋白质的相应宿主。这可便于更容易地回收甜菊醇糖苷。本发明还涉及能够产生甜菊醇糖苷的重组宿主,其过表达介导甜菊醇糖苷转运的异源多肽。
因此,本发明涉及能够产生甜菊醇糖苷的重组宿主,其过表达介导甜菊醇糖苷转运的多肽,并且所述多肽包含SEQ ID NO:35或SEQ ID NO: 38所示的氨基酸序列或与二者之任一具有至少约50%序列同一性的氨基酸序列。
本发明还涉及能够产生甜菊醇糖苷的重组宿主,其已被修饰,优选在其基因组中被修饰,以导致介导甜菊醇糖苷转运的多肽的产生缺陷,并且所述多肽包含SEQ ID NO:35或SEQ ID NO:38所示的氨基酸序列或与二者之任一具有至少约50%序列同一性的氨基酸序列。
本发明还涉及(在宿主内和/或在宿主外)包含甜菊醇糖苷的重组宿主,所述甜菊醇糖苷相较于未根据本发明修饰的相应宿主具有更高或更低的平均糖基化数。
本发明还涉及:
-一种制备甜菊醇糖苷的方法,其包括在合适的发酵培养基中发酵根据前述权利要求中任一项所述的重组宿主,以及任选地回收所述甜菊醇糖苷;
-发酵液,其包含能够通过本发明的方法获得的甜菊醇糖苷;
-通过本发明的方法或发酵液获得的甜菊醇糖苷;
-组合物,其包含两种或更多种本发明的或通过本发明的方法能够获得的甜菊醇糖苷;
-包含本发明的甜菊醇糖苷或组合物的食品、饲料或饮料。
附图简介
图1示出了质粒pUG7-KanMX的示意图。
图2示出了设计(A)ERG20、tHMG1和BTS1过表达盒并整合 (B)到酵母基因组中的方法的示意图。(C)显示了通过Cre重组酶移除 KANMX标记后的最终情形。
图3示出了ERG9敲低(knock down)构建体的示意图。其由ERG9 的500bp长的3'部分、TRP1启动子的98bp、TRP1开放阅读框和终止子、随后的ERG9的400bp长的下游序列组成。由于在ERG9开放阅读框末端引入了XbaI位点,所以最后一个氨基酸变成Ser,终止密码子变成 Arg。新的终止密码子位于TPR1启动子中,从而导致18个氨基酸的延伸。
图4示出了UGT2_1a如何整合到基因组中的示意图。A.转化中使用的不同片段;B.整合后的情形;C.Cre重组酶表达后的情形。
图5示出了从GGPP到RebA的途径如何整合到基因组中的示意图。
A.转化中使用的不同片段;B.整合后的情形。
图6示出了KAH和CPR如何整合到基因组中的示意图。A.转化中使用的不同片段;B.整合后的情形。
图7示出了质粒pUG7-NAT的示意图。
图8示出了CPS如何整合到基因组中的示意图。A.转化中使用的不同片段;B.整合后的情形。
图9示出了质粒Sc_2_5-2_a.bbn的示意图。
图10示出了质粒pUG7-HYG的示意图。
图11示出了转运体基因ALNQ_007_38000和ALNQ_214_12000如何整合到基因组中的示意图。A.转化中使用的不同片段;B.整合后的情形。
图12示出了具有过表达的转运体ALNQ_007_38000和 ALNQ_214_12000的菌株的上清液中的莱鲍迪甙A产生。
图13示出了具有过表达的转运体ALNQ_007_38000和 ALNQ_214_12000的菌株的上清液中的莱鲍迪甙B产生。
图14示出了导致甜菊醇糖苷生物合成的潜在途径的示意图。以星号显示的化合物是13-[(β-D-吡喃葡萄糖基)氧基)贝壳杉-16-烯-18-酸2-O-β-D- 吡喃葡萄糖基-β-D-吡喃葡萄糖基酯。
序列表说明
表15中示出了序列说明。可以参考序列表或者参考也示于表15中的数据库登录号来定义本文所述的序列。
发明详述
在本说明书和所附权利要求书中,词语“包含”、“包括”和“具有”以及变化形式应被解释为包含性的。也就是说,这些词语意图表达在上下文允许的情况下可包含未具体叙述的其他要素或整数。
不使用数量词修饰时在本文中指代一个/种或多于一个/种(即一个/种或至少一个/种)的语法对象。举例来说,“要素”可意指一个/种要素或多于一个/种要素。
本发明涉及鉴定能够介导甜菊醇糖苷转运的多肽。这种多肽可以直接介导甜菊醇糖苷转运,即可以是转运体蛋白,或者可以间接介导甜菊醇糖苷转运。这种多肽可以能够介导一种或更多种甜菊醇糖苷的转运。
本发明涉及过表达或具有降低表达的这种多肽的重组宿主。根据上下文,术语重组宿主或重组细胞可以互换使用。
如本文所述的这种多肽可以在能够产生一种或多种甜菊醇糖苷的重组宿主(例如重组宿主细胞)中过表达。这种细胞与不过表达所述多肽的相应细胞相比可以能够产生更多的一种或多种细胞外甜菊醇糖苷。也就是说,与相应的非重组细胞相比,根据本发明的重组细胞可以具有增加或减少的甜菊醇糖苷转运。
因此,本发明提供了能够产生甜菊醇糖苷的重组宿主,其过表达多肽,所述多肽是能够介导甜菊醇糖苷转运的多肽,并且所述多肽包含SEQ ID NO:35或SEQ ID NO:38所示的氨基酸序列或者与二者之任一具有至少约50%序列同一性的氨基酸序列。
还可以在宿主(例如重组宿主细胞)中修饰这种多肽的表达,使得与未经类似修饰的相应细胞相比,这种多肽的表达降低。以这种方式,与未经类似修饰的相应细胞相比,一种或多种细胞外甜菊醇糖苷的量可降低。这可以允许:与未经类似修饰的相应细胞相比,一种或多种细胞内甜菊醇糖苷的糖基化增加。因此,这种宿主与未经类似修饰的相应细胞相比可以包含具有更高平均糖基化数的甜菊醇糖苷。
因此,本发明提供了能够产生甜菊醇糖苷的重组宿主,其已被修饰,优选在其基因组中被修饰,以导致多肽的产生缺陷,所述多肽是能够介导甜菊醇糖苷转运的多肽,并且所述多肽包含SEQ ID NO:35或SEQ ID NO:38所示的氨基酸序列或与二者之任一具有至少约50%序列同一性的氨基酸序列。
本发明的宿主细胞是重组宿主细胞。从这个意义上讲,“重组”表示宿主细胞是非天然存在的宿主细胞,例如通过使用重组技术引入一个或多个核酸而被修饰。用于修饰宿主细胞以获得本发明重组宿主细胞的核酸可以是天然存在的核酸或非天然存在的核酸。
因此,关于本发明的宿主使用时,“重组”表示细胞已通过引入一种或多种异源核酸或蛋白质或改变天然核酸或蛋白质而被修饰,或者细胞来源于如此修饰的细胞。在本文中使用时,术语“异源”是指并非天然存在于宿主细胞中的核酸或氨基酸序列。换句话说,核酸或氨基酸序列与宿主细胞中天然存在的核酸或氨基酸序列不同。
本发明涉及能够产生甜菊醇糖苷的重组宿主,其过表达介导甜菊醇糖苷转运的异源多肽。这种异源多肽可以获自或来源于不同于宿主的属或种的属或种。因此,如果重组宿主是酵母,则介导甜菊醇糖苷转运的异源多肽可以获自或来源于不同的酵母属或种。
例如,如果宿主细胞是Saccharomyces(例如S.cerevisiae、S. bayanus、S.pastorianus、S.carlsbergensis),则介导甜菊醇糖苷转运的异源多肽可以获自或来源于Candida(例如C.krusei、C.revkaufi、C. pulcherrima、C.tropicalis、C.utilis)、Issatchenkia(例如I.orientalis)或Yarrowia(例如Y.lipolytica(以前归类为Candidalipolytica))。
例如,如果宿主细胞是Candida(例如C.krusei、C.revkaufi、C. pulcherrima、C.tropicalis、C.utilis),则介导甜菊醇糖苷转运的异源多肽可以获自或来源于Saccharomyces(例如S.cerevisiae、S.bayanus、S. pastorianus、S.carlsbergensis)、Issatchenkia(例如I.orientalis)或 Yarrowia(例如Y.lipolytica(以前归类为Candidalipolytica))。
例如,如果宿主细胞是Issatchenkia(例如I.orientalis),则介导甜菊醇糖苷转运的异源多肽可以获自或来源于Saccharomyces(例如S. cerevisiae、S.bayanus、S.pastorianus、S.carlsbergensis)、Candida(例如C.krusei、C.revkaufi、C.pulcherrima、C.tropicalis、C.utilis)或 Yarrowia(例如Y.lipolytica(以前归类为Candida lipolytica))。
例如,如果宿主细胞是Yarrowia(例如Y.lipolytica(以前归类为 Candidalipolytica)),则介导甜菊醇糖苷转运的异源多肽可以获自或来源于Saccharomyces(例如S.cerevisiae、S.bayanus、S.pastorianus、S. carlsbergensis)、Candida(例如C.krusei、C.revkaufi、C.pulcherrima、 C.tropicalis、C.utilis)或Issatchenkia(例如I.orientalis))。
如果宿主细胞是Saccharomyces cerevisiae,则介导甜菊醇糖苷转运的异源多肽可以获自或来源于Yarrowia lipolytica(以前归类为Candida lipolytica)、Candidakrusei或Issatchenkia orientalis。
如果宿主细胞是Yarrowia lipolytica,则介导甜菊醇糖苷转运的异源多肽可以获自或来源于Saccharomyces cerevisiae、Yarrowia lipolytica(以前归类为Candidalipolytica)或Candida krusei或Issatchenkia orientalis。
如果宿主细胞是Candida krusei或Issatchenkia orientalis,则介导甜菊醇糖苷转运的异源多肽可以获自或来源于Saccharomyces cerevisiae或 Yarrowialipolytica。
术语“来源于”也涵盖术语“源自”、“获自”、“能够获自”、“分离自”和“由……产生”,其通常表示一种指定材料来源于另一种指定材料或者具有可以参照另一种指定材料描述的特征。在本文中使用时,“来源于”微生物的物质(例如,核酸分子或多肽)可以表示该物质对于该微生物是天然的或者是该微生物的天然物质,但也可以表示已从天然版本改变的物质。
因此,例如,重组细胞可表达在天然(非重组)形式的细胞内不存在的本文所定义的多肽。或者,可修饰重组细胞以使编码本文所定义的多肽的天然基因的表达程度高于天然“非重组”形式的细胞内发生的程度。
或者,可修饰重组细胞以使编码本文所定义的多肽的天然基因的表达程度低于天然“非重组”形式的细胞内发生的程度。
在本发明的细胞中,可以过表达本文所定义的多肽。在本文中,“过表达的”、“过表达”等意味着重组宿主细胞比不过表达所述多肽的相应细胞表达更多的多肽,或者所述多肽在通常不表达该蛋白质的细胞中表达。或者,可以通过表达具有更高比活性的变体多肽来实现过表达。
本发明的重组细胞可以被修饰,优选在其基因组中,以导致如本文所定义的多肽的产生缺陷。
这种细胞可以来自亲本宿主细胞并且与亲本宿主细胞相比被修饰,优选在其基因组中被修饰,以获得与其所来源自的亲本宿主细胞相比不同的基因型和/或不同的表型。
已被修饰(优选在其基因组中)以导致如本文所定义的多肽产生缺陷的这种细胞是已被修饰(优选在其基因组中)以导致表型特征的突变宿主细胞,其中当与未被修饰的亲本微生物宿主细胞相比并且在相同条件下分析时,所述细胞:a)产生更少产物或基本上不产生产物,和/或b)产生具有降低的活性或降低的比活性的产物或者没有活性或没有比活性的产物,以及这些可能性中的一种或多种的组合。
这种重组宿主可以是编码如本文所述的多肽的核酸序列的全部或部分敲除。
术语“重组”与“经遗传修饰”同义。
因此,本发明涉及过表达被鉴定为具有甜菊醇糖苷转运介导活性的多肽或所述多肽缺陷的重组宿主:通常,宿主是可用于产生甜菊醇糖苷的宿主。给定的重组宿主产生甜菊醇糖苷的能力可以是非重组形式的宿主的性质,或者可以是引入一种或多种重组核酸序列(即编码导致产生甜菊醇糖苷的酶)的结果。
出于本发明的目的,具有甜菊醇糖苷转运介导活性的多肽(即介导甜菊醇糖苷转运的多肽)是对穿过细胞膜转运一种或多种甜菊醇糖苷有影响的多肽。影响可以是直接的,即多肽可以是转运体蛋白或包含功能性转运体区域。或者,影响可以是间接的,即多肽不是转运体蛋白,但其活性仍然对甜菊醇糖苷转运有影响。
通常,效果是这样的:提高多肽的表达水平增加穿过细胞膜转运一种或多种甜菊醇糖苷的量(与多肽的表达水平更低的相应细胞相比)。相反,降低多肽的表达水平可以降低穿过细胞膜转运一种或多种甜菊醇糖苷的量(与多肽的表达水平更高的相应细胞相比)。
通常,本发明的重组宿主能够产生甜菊醇糖苷。例如,本发明的重组宿主可以能够产生例如但不限于甜菊醇-13-单糖苷、甜菊醇-19-单糖苷、 13-[(β-D-吡喃葡萄糖基)氧基)贝壳杉-16-烯-18-酸2-O-β-D-吡喃葡萄糖基-β- D-吡喃葡萄糖基酯、甜茶苷、甜菊苷、甜菊醇-19-双糖苷、甜菊醇双糖苷、rebA、rebB、rebC、rebD、rebE或rebM中的一种或更多种。本发明的重组宿主可以能够产生在Ceunen和Geuns,Journal of Natural Products 76(6),1201-1228,2013中所示的甜菊醇糖苷中的一种或多种。
因此,本发明的细胞可以是这样的细胞,其中相较于不过表达或不具有本发明细胞的降低水平的表达的相应细胞,与细胞内相比的细胞外甜菊醇糖苷的总量更高或更低。
或者,相较于不过表达或不具有本发明细胞的降低水平的表达的相应细胞,本发明的细胞可以具有相同的与细胞内相比的细胞外甜菊醇糖苷的总量,但在细胞内外可以具有改变的甜菊醇糖苷分布。
因此,本发明的重组宿主能够产生甜菊醇糖苷。例如,本发明的重组宿主可以能够产生例如甜菊醇-13-单糖苷、甜菊醇-19-单糖苷、13-[(β-D- 吡喃葡萄糖基)氧基)贝壳杉-16-烯-18-酸2-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖基酯、甜茶苷、甜菊苷、甜菊醇-19-双糖苷、甜菊醇双糖苷、rebA、 rebB、rebC、rebD、rebE或rebM中的一种或更多种。
因此,本发明的重组宿主可以是这样的,其中细胞产生的rebA的至少约10%、至少约20%、至少约30%、至少约40%、至少约50%在细胞外。
因此,本发明的重组宿主可以是这样的,其中细胞产生的rebD的至少约10%、至少约20%、至少约30%、至少约40%、至少约50%在细胞外。
因此,本发明的重组宿主可以是这样的,其中细胞产生的rebM的至少约10%、至少约20%、至少约30%、至少约40%、至少约50%在细胞外。
本发明的重组宿主可以是这样的,其中细胞产生的rebA的不超过约 50%、不超过约40%、不超过约30%、不超过约20%、不超过约10%在细胞外。
本发明的重组宿主可以是这样的,其中细胞产生的rebD的不超过约 50%、不超过约40%、不超过约30%、不超过约20%、不超过约10%在细胞外。
本发明的重组宿主可以是这样的,其中细胞产生的rebM的不超过约 50%、不超过约40%、不超过约30%、不超过约20%、不超过约10%在细胞外。
本发明的重组细胞可以是这样的,其中甜菊醇糖苷的平均糖基化数为至少3、至少4、至少5、至少6或更大。与未根据本发明修饰的相应细胞相比,平均糖基化数可以增加或降低。例如,当过表达如本文所述的多肽时,平均糖基化可降低。例如,当本发明多肽的表达降低时,平均糖基化可增加(特别是在细胞本身中)。
平均糖基化可以指本发明的重组细胞的上清液中的平均糖基化或培养液(沉淀+上清液)中的平均糖基化。
因此,本发明提供了能够产生甜菊醇糖苷的重组细胞,所述重组细胞或者过表达下述多肽或者在下述多肽的表达方面有缺陷,所述多肽包含 SEQ ID NO:35或SEQ ID NO:38所示的氨基酸序列或者与二者之任一具有至少约50%序列同一性的氨基酸序列。这种氨基酸序列具有甜菊醇糖苷转运的作用,即是甜菊醇糖苷转运的介导物。
所述多肽还可以被定义为包含以下氨基酸序列(或与其具有至少约 45%序列同一性的氨基酸序列)的多肽:
MSALNTDALESQPDFKFQRQKRLMSPFMSKKVPPIPTKEERKPYGEYHTNILFRIMFWWLNPIL NVGYKRTLTEQDLFYLDNSQTMDTLYETFKSHLKTTIEKSMKKYLQEKYSKEGKTYDPSSIPTAE DLKDFQIPIYAIPLCLFKTLYWQYSLGNLYKVLSDCTSATTPLLQKKLINFVQMKSFTALGSTGKG VGYAIGVCLMIFFQAITVNHAFHNLQICGAKSKAILTRMLLDKSMSVDARGNHFFPASKVQSMIST DLNRVDLAIGFFPFALTCVFPIAICIGLLIWNVGVSALVGIAIFVANVGLLAVSIPRLMRFRIKAMVFT DKRVTLMKELLKNFKMIKFYSWENSYARRIQDARFKEMKLILSLQSLRNIVMSVSFAMPTLASMA TFCTAFDITSGKNAASLFSSLSLFQVLSMQFMLAPVALNTAADMMVSMKKFNQFLAHADLDPEQ YRIEEFHDDKLAVKVDNATFEWDTFDDDKVEDPALEFEKQDNDSLEKVSSHNTVDYDSTEKIRN DTSSIDSTKILEKTAFPGLRNINLEIKKGEFVVVTGSIGAGKSSLLQAISGLMKRVSGKVYVDGDLL LCGYPWVQNATIRDNILFGLPFDQEKYDQVVYACSLQSDFNQFQGGDMTEVGERGITLSGGQK ARINLARSVYADKDIILLDDVLSAVDAKVGRHIVDTCLLGLLKDKTRIMATHQLSLIDSADRMIFLNG DGSIDCGTISELKDRNEKLNELLSHQKDKANDSDEELELQEEIESKEQHLKEDLSEVKHEIKEEQK KMEISGDVGEEFEHADEHKEIVRIIGDEERAVNALKADVYINYAKLAFGKLGLFSLMLFVTVAALQ TYCNMFTNTWLSFWIEEKFHGRSKSFYMGIYIMFAFLYTFFLAAFFYSMCYFCNRASKYLNYKA SEKILHVPMSFMDISPIGRVLNRFTKDTDVLDNEILDQFRQFLSPFCNAIGTIVLCIIYIPWFAIAVPL IVTFYVLVANYYQASAREIKRLEAVKRSLVFGHFNEALSGKETIKAYRAIDRVKQRLNKLIDGQNE AYFLTIVNQRWLGANLSILSFCMVFIISFLCVFRVFNISAASTGLLLTYVINLTNTITMMMRAMTQV ENEFNSVERLNHYAFDLVQEAPYEIPENDPPQDWPKYGEIIFKDVSMRYRPELPFVLKNINLSIG KGEKIGFCGRTGAGKSTFMTCLYRISEFEGTIVIDDVDISKLGLHKLRSKLTIIPQDPVLFVGSIRE NLDPFGEYSDEELWEALTISGLINKEDLNEVKKQNENDDNLNKFHLIRMVEDDGVNFSIGERQLI ALARALVRKTKILILDEATSSVDYATDSRIQKTIATEFDDCMILCIAHRLNTILNYDKIVVMDKGEIVE FDKPRSLFMREEGVFRSMCEQANITIEDFP(SEQ ID NO:35);或
MKSDNIAMEDLPDSKYLKQRRLLTPLMSKKVPPIPSEDERKAYGEYYTNPVSRMMFWWLNPILK VGYRRTLTENDLFYLEDRQRTETLYEIFRGYLDEEIARAWKKSQESSDDPREFKLPIYIIPLCLFKT MKWEYSRGILQKILGDCASATTPLLQKKLINFVQVKTFSNVGNTGQGVGYAIGVCLMIFFQVLML THAFHNFQISGAKAKAVLTRLLLDKSLTVDARGNHYFPASKIQSMISTDLNRIDLAVGFAPVGFVT IFPIIICIALLIWNVGVSALVGIGVFIANIFVLGLFVSSLMLYREKAMVFTDKRVNLVKELLKNFKMIK FYSWENSYQDRIENARNNEMKYILRLQLLRNFVFSLAFAMPVLASMATFCTAFKITDGKSAASVF SSLSLFEVLSLQFILAPFSLNSTVDMMVSVKKINQFLQHKDTNPNEFSVEKFSDSTLAIKVDNASF EWDTFEDEEKDYEEEAKTKDNIEDEDHNCATETIKGKITVDYKSDSDSISSTLTKGVKTAFPGLN NINLEIAKGEFIVVTGAIGSGKSSLLQAISGLMKRTSGEVYVDGDLLLCGYPWVQNSTIRENILFGLPFNKERYDQVVYSCSLQSDFDQFQGGDMTEVGERGITLSGGQKARINLARSVYADKDIILLDD VLSAVDAKVGKHIVNTCILGLLGGKTRIMATHQLSLIDSADRMVFLNGDGTIDFGTIPELRKRNQK LIELLQHQRDPGQDKEDLSNDLDIQGSTDEGQQIEHADEHKEIVKIIGDEEKAVNALSFQVYYNY CKLAFGKLGYISMLVFIIVSSLETFTQIFTNTWLSFWIEDKFVSRSKNFYMGIYIMFAFLYAIMLCFF LFLLGYFCVKAAERLNIKASRKILHVPMSFMDISPIGRVLNRFTKDTDVLDNELLEQLIQFLSPLFN CFGIIILCIVYIPWFAIGVPIILGFYFIIASYYQASAREIKRLEAVKRSFVFGHFHEVLTGKDTIKAYNA IDRMKLKLNKLIDEQNEAYYLTIANQRWLGANLAIVSFSMVFVISFLCIFRVFNISAASTGLLLTYVI ALTDSITMIMRAMTQVENEFNSVERVNHYAFDLIQEAPYEIPENDPAEDWPQHGKIEFKDVSMR YRPELPFVLKNINLSVREQEKIGFCGRTGAGKSTFMTCLYRITEYEGLISIDGVDISRLGLHRLRSKLTIIPQDPVLFVGTIRENLDPFTEHSDDELWEALAISGLIEREDLEVVKGQEKIGGNDSGKLHKFH LVRMVEDDGINFSLGERQLIALARALVRKSKILILDEATSSVDYATDSKIQRTIASEFRDCTILCIAH RLNTILGYDKIVVMDNGEIVEFENPKLLFMRENSVFRSMCEQANITINDFE(SEQ ID NO:38)
通常具有甜菊醇糖苷转运介导活性的多肽可以包含这样的氨基酸序列,所述氨基酸序列与SEQ ID NO:35具有至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约 90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约 95%、至少约96%、至少约97%、至少约98%或至少约99%的序列同一性。
通常具有甜菊醇糖苷转运介导活性的多肽可以包含这样的氨基酸序列,所述氨基酸序列与SEQ ID NO:38具有至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约 90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约 95%、至少约96%、至少约97%、至少约98%或至少约99%的序列同一性。
由存在于本发明的重组宿主中的重组核酸编码的、通常具有甜菊醇糖苷转运介导活性的多肽可以包含氨基酸序列,所述氨基酸序列是本文所述氨基酸序列的片段,例如这种氨基酸序列的截短版本。
也就是说,本发明还涉及重组宿主,其过表达如本文所述的具有甜菊醇糖苷转运介导活性的多肽的生物学活性片段。
本发明多肽的生物活性片段包括这样的多肽,其包含与SEQ ID NO: 35或SEQ IDNO:38的氨基酸序列足够同一或来源于SEQ ID NO:35或 SEQ ID NO:38的氨基酸序列的氨基酸序列,其比SEQ ID NO:35或SEQ ID NO:38中给出的全长多肽包含更少氨基酸,但展示出相应全长多肽的至少一种生物学活性。
通常,生物活性片段包含具有本发明多肽的至少一种活性的结构域或基序。本发明多肽的生物活性片段可以是这样的多肽,例如,其长度为约 10、约25、约50、约100或更多个氨基酸或至少约100个氨基酸、至少 150、200、250、300、350、400、600、1000个氨基酸或长度达到本发明多肽的氨基酸总数。此外,多肽的其他区域缺失的其他生物学活性部分可以通过重组技术制备,并且可以评估其的一种或多种天然形式本发明多肽的生物学活性。本发明的特征还在于编码本发明多肽的上述生物活性片段的核酸片段。
本发明的重组宿主可以过表达这种多肽或所述多肽缺陷。
本发明的重组宿主可以包含编码多于一种这种多肽(例如两种、三种、四种或更多种这种多肽)的重组核酸序列。如此编码的多肽可以相同或不同。
可以修饰本发明的重组细胞以降低多于一种这种多肽(例如2、3、4 或更多种这种多肽)的表达水平。
由存在于重组宿主中的重组核酸编码的过表达的多肽可以是可获自或来源于或发现于Pichia属的生物体中的多肽,例如可获自或来源于或发现于Pichia kudriavzeii的多肽。
如本文所用,术语“多肽”是指包含通过肽键连接的氨基酸残基并含有多于五个氨基酸残基的分子。氨基酸由单字母或三字母名称标识。如本文所用的术语“蛋白质”与术语“多肽”同义,并且还可指两种或更多种多肽。因此,术语“蛋白质”、“肽”和“多肽”可互换使用。多肽可任选地进行修饰 (例如,糖基化、磷酸化、酰化、法尼基化、异戊二烯化、磺化等)以增加官能度。展现活性的多肽可被称为酶。应理解,作为遗传密码简并的结果,可产生编码给定多肽的许多核苷酸序列。
由用于本发明的重组宿主的重组核酸所编码的多肽可以包含信号肽和/ 或前肽序列。如果本发明的多肽包含信号肽和/或前肽,可以在成熟多肽序列上计算序列同一性。
用于在本发明的重组宿主中使用的重组核酸序列可以以核酸构建体的形式提供。术语“核酸构建体”是指单链或双链的核酸分子,其从天然存在的基因中分离或已经被修饰以含有以否则将不会在自然中存在的方式组合和并置的核酸的区段。当核酸构建体含有表达编码序列所需要的所有控制序列时,术语核酸构建体与术语“表达盒”的含义相同,其中所述控制序列可操作地连接至所述编码序列。
用于在本发明的重组宿主中使用的重组核酸序列可以以表达载体的形式提供,其中多核苷酸序列可操作地连接到至少一个控制序列用于在重组宿主细胞中表达多核苷酸序列。
如本文所用的术语“可操作地连接”是指物理地连接并且彼此有功能性关系的两个或多个核酸序列元件。例如,如果启动子能够起始或调控编码序列的转录或表达,则启动子可操作地连接至编码序列,在这种情况下,所述编码序列应被理解为在启动子的“控制下”。通常,当两个核酸序列可操作地连接时,它们将处于相同的取向并且通常也在同一阅读框中。它们通常将是基本上连续的,尽管这可能不是必需的。
表达载体包含编码本文所述多肽的多核苷酸,其可操作地连接至用于在体外或在宿主细胞中表达和/或翻译多核苷酸的适当控制序列(如启动子以及转录和翻译终止信号)。
表达载体可以是能够方便地进行重组DNA程序并能使多核苷酸表达的任何载体(例如,质粒或病毒)。载体的选择通常将取决于所述载体与待引入所述载体的细胞的相容性。载体可以是线性或闭合的环状质粒。载体可以是自主复制型载体,即作为染色体外实体而存在、其复制独立于染色体复制的载体,例如,质粒、染色体外元件、微型染色体或人工染色体。
或者,载体可以是当被引入宿主细胞时整合至基因组中并与其已整合至其中的染色体一起复制的载体。整合型克隆载体可随机或在预定靶基因座处整合在宿主细胞的染色体中。载体可包含一个或多个选择性标记,其允许容易地选择转化的细胞。
可以根据本领域技术人员熟知的方法生成能够产生甜菊醇糖苷的重组宿主,所述重组宿主已被修饰(优选在其基因组中被修饰)以导致本文所述多肽的产生缺陷。可以修饰编码本文所述多肽的序列,使得发生更少或不发生多肽的表达。例如,可以部分或全部缺失编码本文所述多肽的序列。
本发明的重组宿主可以包含如本文所述的任何多肽。本发明的重组宿主可以过表达本文所述的任何多肽或有本文所述的任何多肽的缺陷。通常,本发明的重组宿主能够产生甜菊醇糖苷。例如,本发明的重组宿主可以能够产生例如甜菊醇-13-单糖苷、甜菊醇-19-单糖苷、13-[(β-D-吡喃葡萄糖基)氧基)贝壳杉-16-烯-18-酸2-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖基酯、甜茶苷、甜菊苷、甜菊醇-19-双糖苷、甜菊醇双糖苷、rebA、rebE、rebD或rebM中的一种或更多种。
本发明的重组宿主可包含编码具有UDP-糖基转移酶(UGT)活性的一种或多种多肽的一种或多种重组核酸序列。
为了本发明的目的,具有UGT活性的多肽是具有糖基转移酶活性 (EC 2.4)的多肽,即可以充当催化剂以将单糖单元从活化的核苷酸糖 (又称“糖基供体”)转移到糖基受体分子(通常是醇)的多肽。UGT的糖基供体典型地是核苷酸糖尿苷二磷酸葡萄糖(尿嘧啶-二磷酸葡萄糖, UDP-葡萄糖)。
可以选择这种另外的UGT以产生期望的甜菊醇糖苷。Humphrey等人, PlantMolecular Biology(2006)61:47-62和Mohamed等人,J.Plant Physiology 168(2011)1136-1141中示出了甜菊醇糖苷形成的示意图。另外,图14示出了甜菊醇糖苷形成的示意图。
因此,本发明的重组宿主可包含一个或多个编码以下项中的一种或多种的重组核酸序列:
(i)具有UGT74G1活性的多肽;
(ii)具有UGT2活性的多肽;
(iii)具有UGT85C2活性的多肽;和
(iv)具有UGT76G1活性的多肽。
适用于本发明的重组酵母可包含编码能够催化向甜菊醇中添加C-13- 葡萄糖的多肽的核苷酸序列。也就是说,适用于本发明方法的重组酵母可包含能够催化将甜菊醇转化为甜菊单糖苷的反应的UGT。
适用于本发明方法的这种重组酵母可包含编码具有由UDP-糖基转移酶(UGT)UGT85C2所示的活性的多肽的核苷酸序列,由此酵母转化后,核苷酸序列赋予所述酵母将甜菊醇转化为甜菊单糖苷的能力。
UGT85C2活性是将葡萄糖单元转移至甜菊醇的13-OH。因此,合适的UGT85C2可充当尿苷5'-二磷酸葡糖基:甜菊醇13-OH转移酶和尿苷5'- 二磷酸葡糖基:甜菊醇-19-O-糖苷13-OH转移酶。功能性UGT85C2多肽还可催化葡糖基转移酶反应,所述反应利用除甜菊醇和甜菊醇-19-O-糖苷以外的甜菊醇糖苷底物。此类序列可在本文中称为UGT1序列。
适用于本发明的重组酵母可以包含编码具有UGT2活性的多肽的核苷酸序列。
具有UGT2活性的多肽是充当尿苷5'-二磷酸葡萄糖基:甜菊醇-13-O-糖苷转移酶(又称甜菊醇-13-单葡萄糖苷1,2-转葡萄糖基酶)的多肽,其将葡萄糖部分转移到受体分子甜菊醇-13-O-糖苷的13-O-葡萄糖的C-2'。典型地,适合的UGT2多肽还可以充当将葡萄糖部分转移到受体分子甜茶苷的 13-O-葡萄糖的C-2’的尿苷5'-二磷酸葡萄糖基:甜茶苷转移酶。
具有UGT2活性的多肽也可以催化利用除甜菊醇-13-O-糖苷和甜茶苷以外的甜菊醇糖苷底物的反应,例如,功能性UGT2多肽可利用甜菊苷作为底物,从而将葡萄糖部分转移至19-O-葡萄糖残基的C-2'以产生莱鲍迪甙E。功能性UGT2多肽也可以利用莱鲍迪甙A作为底物,从而将葡萄糖部分转移至19-O-葡萄糖残基的C-2'以产生莱鲍迪甙D。然而,功能性UGT2多肽可以是这样的多肽,其不将葡萄糖部分转移至在C-13位具有 1,3-结合的葡萄糖的甜菊醇化合物,即将葡萄糖部分转移至甜菊醇1,3-双糖苷和1,3-甜菊苷通常不会发生。
具有UGT2活性的多肽也可以从除尿苷二磷酸葡萄糖以外的供体转移糖部分。例如,具有UGT2活性的多肽充当尿苷5'-二磷酸D-木糖基:甜菊醇-13-O-糖苷转移酶,其将木糖部分转移至受体分子甜菊醇-13-O-糖苷的 13-O-葡萄糖的C-2'。作为另一个实例,具有UGT2活性的多肽可充当尿苷 5'-二磷酸L-鼠李糖基:甜菊醇-13-O-糖苷转移酶,其将鼠李糖部分转移至受体分子甜菊醇的13-O-葡萄糖的C-2'。
适用于本发明方法的重组酵母可以包含编码具有UGT活性的多肽的核苷酸序列,可以包含编码能够催化向甜菊双糖苷添加C-19-葡萄糖的多肽的核苷酸序列。也就是说,本发明的重组酵母可以包含能够催化将甜菊双糖苷转化成甜菊苷的反应的UGT。因此,这种重组酵母可以能够将甜菊双糖苷转化为甜菊苷。这种核苷酸序列的表达可以赋予重组酵母生产至少甜菊苷的能力。
因此,适用于本发明方法的重组酵母还可以包含编码具有由UDP-糖基转移酶(UGT)UGT74G1所示的活性的多肽的核苷酸序列,由此当转化酵母后,所述核苷酸序列赋予细胞将甜菊双糖苷转化为甜菊苷的能力。
合适的UGT74G1多肽可以能够将葡萄糖单元分别转移至甜菊醇的13- OH和/或19-COOH。合适的UGT74G1多肽可充当尿苷5'-二磷酸葡糖基: 甜菊醇19-COOH转移酶和/或尿苷5'-二磷酸葡糖基:甜菊醇-13-O-糖苷19- COOH转移酶。功能性UGT74G1多肽还可催化使用除甜菊醇和甜菊醇- 13-O-糖苷以外的甜菊醇糖苷底物或者从除尿苷二磷酸葡萄糖以外的供体转移糖部分的糖基转移酶反应。此类序列可在本文中称为UGT3序列。
适用于本发明方法的重组酵母可包含编码能够催化甜菊苷的C-13位置处的葡萄糖的C-3'的葡糖基化的多肽的核苷酸序列。也就是说,适用于本发明方法的重组酵母可包含UGT,所述UGT能够催化甜菊苷转化至莱鲍迪甙A的反应。因此,这种重组酵母可以能够将甜菊苷转化为莱鲍迪甙 A。这种核苷酸序列的表达可赋予酵母产生至少莱鲍迪甙A的能力。
适用于本发明方法的重组酵母可以因此还包含编码具有由UDP-糖基转移酶(UGT)UGT76G1所示的活性的多肽的核苷酸序列,由此当转化酵母后所述核苷酸序列赋予该酵母将甜菊苷转化为莱鲍迪甙A的能力。
合适的UGT76G1向受体分子甜菊醇1,2糖苷的C-13-O-葡萄糖的C-3' 添加葡萄糖部分。因此,UGT76G1充当例如尿苷5'-二磷酸葡糖基:甜菊醇 13-O-1,2葡糖苷C-3'葡糖基转移酶和尿苷5'-二磷酸葡糖基:甜菊醇-19-O-葡萄糖、13-O-1,2双糖苷C-3'葡糖基转移酶。功能性UGT76G1多肽还可催化葡糖基转移酶反应,所述反应使用含有除葡萄糖以外的糖的甜菊醇糖苷底物,例如甜菊醇鼠李糖苷和甜菊醇木糖苷。此类序列可在本文中称为 UGT4序列。UGT4可以替代地或者另外地能够将RebD转化为RebM。
适用于本发明方法的重组酵母通常包含编码至少一种具有UGT1活性的多肽、至少一种具有UGT2活性的多肽、至少一种具有UGT3活性的多肽和至少一种具有UGT4活性的多肽的核苷酸序列。这些核酸序列中的一种或更多种可以是重组的。给定的核酸可编码具有一种或更多种上述活性的多肽。例如,核酸编码具有两种、三种或四种上述活性的多肽。优选地,用于本发明方法的重组酵母包含UGT1、UGT2和UGT3以及UGT4 活性。合适的UGT1、UGT2、UGT3和UGT4序列在WO2015/007748的表1中进行了描述。
本发明的重组宿主可以包含两种或更多种编码具有任何一种UGT活性(例如,UGT1、UGT2、UGT3或UGT4活性)的多肽的核酸序列。当本发明的重组宿主包含两种或更多种编码具有任何一种UGT活性的多肽的核酸序列时,这些核酸序列可以相同或不同,和/或可编码相同或不同的多肽。特别地,本发明的重组宿主可以包含编码两种不同UGT2多肽的核酸序列。
根据本发明的重组宿主可以包含编码以下项中的一种或更多种的一种或更多种重组核苷酸序列:
具有对映-柯巴基焦磷酸合酶活性的多肽;
具有对映-贝壳杉烯合酶活性的多肽;
具有对映-贝壳杉烯氧化酶活性的多肽;以及
具有贝壳杉烯酸13-羟化酶活性的多肽。
出于本发明的目的,具有对映-柯巴基焦磷酸合酶(EC 5.5.1.13)的多肽能够催化化学反应:
所述酶具有一种底物,香叶基香叶基焦磷酸;以及一种产物,对映-柯巴基焦磷酸。所述酶参与赤霉素生物的合成。所述酶属于异构酶家族,特别是分子内裂解酶的类别。所述酶类别的系统名称是对映-柯巴基-二磷酸裂解酶(脱环)。通常使用的其他名称包括具有对映-柯巴基焦磷酸合酶、对映-贝壳杉烯合酶A和对映-贝壳杉烯合成酶A。
编码对映-柯巴基焦磷酸合酶的合适核酸序列可例如包含在 WO2015/007748的SEQ ID.NO:1、3、5、7、17、19、59、61、141、 142、151、152、153、154、159、160、182或184中列出的序列。
出于本发明的目的,具有对映-贝壳杉烯合酶活性(EC 4.2.3.19)的多肽是能够催化以下化学反应的多肽:
因此,所述酶具有一种底物,对映-柯巴基二磷酸;以及两种产物,对映-贝壳杉烯和二磷酸。
所述酶属于裂解酶家族,特别是作用于磷酸盐/酯的碳-氧裂解酶。所述酶类别的系统名称是对映-柯巴基二磷酸二磷酸-裂解酶(环化,对映-贝壳杉烯形成)。常用的其它名称包括对映-贝壳杉烯合酶B、对映-贝壳杉烯合成酶B、对映-柯巴基-二磷酸二磷酸-裂解酶和(环化)。所述酶参与双萜类生物合成。
编码对映-贝壳杉烯合酶的合适核酸序列可例如包含在 WO2015/007748的SEQID.NO:9、11、13、15、17、19、63、65、143、 144、155、156、157、158、159、160、183或184中列出的序列。
对映-柯巴基二磷酸合酶还可具有与相同蛋白质分子相关联的不同对映 -贝壳杉烯合酶活性。由对映-贝壳杉烯合酶催化的反应是赤霉素的生物合成途径中的下一步骤。两种类型的酶活性是不同的,并且定点诱变以抑制蛋白质的对映-贝壳杉烯合酶活性导致对映-柯巴基焦磷酸的积累。
因此,本发明重组宿主中使用的单个核苷酸序列可编码具有对映-柯巴基焦磷酸合酶活性和对映-贝壳杉烯合酶活性的多肽。或者,两种活性可被两个不同的分离的核苷酸序列编码。
出于本发明的目的,具有对映-贝壳杉烯氧化酶活性(EC 1.14.13.78) 的多肽是能够催化对映-贝壳杉烯的4-甲基的三次连续氧化以产生贝壳杉烯酸的多肽。这种活性通常需要细胞色素P450的存在。
编码对映-贝壳杉烯氧化酶的合适核酸序列可例如包含在WO2015/007748的SEQID.NO:21、23、25、67、85、145、161、162、 163、180或186中列出的序列。
出于本发明的目的,具有贝壳杉烯酸13-羟化酶活性(EC 1.14.13)的多肽是能够催化使用NADPH和O2形成甜菊醇(对映-贝壳杉-16-烯-13-醇- 19-酸)的多肽。这种活性也可称为对映-贝壳杉烯酸13-羟化酶活性。
编码贝壳杉烯酸13-羟化酶的合适核酸序列可例如包含在 WO2015/007748的SEQID.NO:27、29、31、33、69、89、91、93、95、 97、146、164、165、166、167或185中列出的序列。
本发明的重组宿主可包含编码具有NADPH-细胞色素p450还原酶活性的多肽的重组核酸序列。也就是说,本发明的重组宿主可能够表达编码具有NADPH-细胞色素p450还原酶活性的多肽的核苷酸序列。出于本发明的目的,具有NADPH-细胞色素P450还原酶活性(EC1.6.2.4;也称为 NADPH:高铁血红蛋白氧化还原酶、NADPH:血红素蛋白氧化还原酶、NADPH:P450氧化还原酶、P450还原酶、POR、CPR、CYPOR)的多肽通常是一种这样的多肽,其为膜结合酶,从而允许电子从含有FAD和 FMN的酶NADPH:细胞色素P450还原酶(POR;EC1.6.2.4)转移至真核细胞的微粒体中的细胞色素P450。
在本发明的重组宿主中,可上调宿主产生香叶基香叶基二磷酸 (GGPP)的能力。在本发明的上下文中上调意味着重组宿主比等同的非重组宿主产生更多的GGPP。
因此,本发明的重组宿主可包含编码羟甲基戊二酰基-辅酶A还原酶、法尼基-焦磷酸合成酶和香叶基香叶基二磷酸合酶的一个或多个核苷酸序列,由此宿主转化后的所述核苷酸序列赋予宿主产生提高水平的GGPP 的能力。因此,根据本发明的重组宿主可包含编码羟甲基戊二酰基-辅酶A 还原酶、法尼基-焦磷酸合成酶和香叶基香叶基二磷酸合酶中的一种或多种的一个或多个重组核酸序列。
因此,本发明的重组宿主可包含编码以下中的一种或多种的核酸序列:
具有羟甲基戊二酰基-辅酶A还原酶活性的多肽;
具有法尼基-焦磷酸合成酶活性的多肽;和
本发明的重组宿主可以是例如多细胞生物或其细胞或单细胞生物。本发明的宿主可以是原核、古细菌或真核宿主细胞。
原核宿主细胞可以是但不限于细菌宿主细胞。真核宿主细胞可以是但不限于酵母、真菌、变形虫、藻类、动物、昆虫宿主细胞。
真核宿主细胞可以是真菌宿主细胞。“真菌”包括真菌(Eumycotina) 亚门的所有物种(Alexopoulos,C.J.,1962,在Introductory Mycology,John Wiley&Sons,Inc.(约翰威立出版有限公司),纽约)。因此,术语真菌包括丝状真菌和酵母等等。
“丝状真菌”在本文中定义为真核微生物,其包括真菌和卵菌亚门的所有丝状形式(如由Hawksworth等人,1995,同上所定义)。丝状真菌是以由壳多糖、纤维素、葡聚糖、壳聚糖、甘露聚糖以及其它复合多糖构成的菌丝壁为特征。营养体生长是通过菌丝延长,并且碳代谢是专性需氧的。丝状真菌菌株包括但不限于以下各项的菌株:Acremonium、Aspergillus、Agaricus、Aureobasidium、Cryptococcus、Corynascus、 Chrysosporium、Filibasidium、Fusarium、Humicola、Magnaporthe、 Monascus、Mucor、Myceliophthora、Mortierella、Neocallimastix、 Neurospora、Paecilomyces、Penicillium、Piromyces、Phanerochaete、 Podospora、Pycnoporus、Rhizopus、Schizophyllum、Sordaria、Talaromyces、Rasmsonia、Thermoascus、Thielavia、Tolypocladium、 Trametes以及Trichoderma。可充当宿主细胞的优选丝状真菌菌株属于以下物种:Aspergillus niger、Aspergillus oryzae、Aspergillus fumigatus、 Penicillium chrysogenum、Penicilliumcitrinum、Acremonium chrysogenum、 Trichoderma reesei、Rasamsonia emersonii(先前称为Talaromyces emersonii)、Aspergillus sojae、Chrysosporium lucknowense、Myceliophtora thermophyla。用于比较转化和未转化细胞的发酵特征的参考宿主细胞包括例如Aspergillus niger CBS120.49、CBS 513.88;Aspergillus oryzae ATCC16868、ATCC 20423、IF0 4177、ATCC 1011、ATCC 9576、 ATCC14488-14491、ATCC 11601、ATCC12892;Aspergillus fumigatus AF293(CBS101355);P.chrysogenum CBS 455.95;Penicillium citrinum ATCC 38065;Penicillium chrysogenum P2;Acremoniumchrysogenum ATCC 36225、ATCC 48272;Trichoderma reesei ATCC 26921、ATCC 56765、ATCC 26921;Aspergillus sojae ATCC11906;Chrysosporium lucknowense ATCC44006以及所有这些菌株的衍生株。作为丝状真菌宿主细胞特别优选的是Aspergillus niger CBS513.88及其衍生株。
真核宿主细胞可以是酵母细胞。优选的酵母宿主细胞可选自以下属:酵母属(例如,S.cerevisiae、S.bayanus、S.pastorianus、S. carlsbergensis)、Brettanomyces、Kluyveromyces、Candida(例如,C. krusei、C.revkaufi、C.pulcherrima、C.tropicalis、C.utilis)、Issatchenkia (例如,I.orientalis)、Pichia(例如,P.pastoris和P.kudriavzevii)、 Schizosaccharomyces、Hansenula、Kloeckera、Pachysolen、Schwanniomyces、Trichosporon、Yarrowia(例如,Y.lipolytica)(先前分类为Candidalipolytica))、Yamadazyma。
原核宿主细胞可以是细菌宿主细胞。细菌宿主细胞可以是革兰氏阴性或革兰氏阳性细菌。细菌的实例包括但不限于,属于以下属的细菌: Bacillus(例如,B.subtilis、B.amyloliquefaciens、B.licheniformis、B. puntis、B.megaterium、B.halodurans、B.pumilus)、Acinetobacter、 Nocardia、Xanthobacter、Escherichia(例如,大肠杆菌(例如,菌株DH 1OB、Stbl2、DH5-α、DB3、DB3.1)、DB4、DB5、JDP682和ccdA-over (例如,美国申请号09/518,188)))、Streptomyces、Erwinia、 Klebsiella、Serratia(S.marcessans)、Pseudomonas(例如,P. aeruginosa)、Salmonella(例如,S.typhimurium、S.typhi)。细菌还包括但不限于光合细菌(例如,绿色非硫细菌(例如,Choroflexus细菌(例如C.aurantiacus)、Chloronema(例如,C.gigateum))、绿色硫细菌(例如,Chlorobium细菌(例如,C.limicola)、Pelodictyon(例如,P. luteolum)、紫色硫细菌(例如,Chromatium(例如,C.okenii))以及紫色非硫细菌(例如,Rhodospirillum(例如,R.rubrum)、Rhodobacter (例如R.sphaeroides、R.capsulatus)和Rhodomicrobium细菌(例如 R.vanellii))。
宿主细胞可以是来自非微生物生物体的宿主细胞。此类细胞的实例包括但不限于昆虫细胞(例如,Drosophila(例如,D.melanogaster)、 Spodoptera(例如,S.frugiperdaSf9或Sf21细胞)和Trichoplusa(例如, High-Five细胞));线虫细胞(例如,C.elegans细胞);禽类细胞;两栖动物细胞(例如,Xenopus laevis细胞);爬行动物细胞;以及哺乳动物细胞(例如NIH3T3、293、CHO、COS、VERO、C127、BHK、Per- C6、Bowes黑色素瘤和HeLa细胞)。
根据本发明的重组宿主可能够在本领域中已知的任何合适的碳源上生长,并且将其转化为甜菊醇糖苷。重组宿主可能够直接转化植物生物质、纤维素、半纤维素、果胶、鼠李糖、半乳糖、岩藻糖、麦芽糖、麦芽糖糊精、核糖、核酮糖或淀粉、淀粉衍生物、蔗糖、乳糖和甘油。因此,优选的宿主表达酶如用于将纤维素转化成葡萄糖单体和将半纤维素转化成木糖和阿拉伯糖单体所需的纤维素酶(内切纤维素酶和外切纤维素酶)和半纤维素酶(例如内切和外切木聚糖酶、阿拉伯糖酶),能够将果胶转化成葡萄糖醛酸和半乳糖醛酸的果胶酶或将淀粉转化成葡萄糖单体的淀粉酶。优选地,宿主能够转化选自由以下各项组成的组的碳源:葡萄糖、木糖、阿拉伯糖、蔗糖、乳糖和甘油。宿主细胞可例如是WO03/062430、 WO06/009434、EP1499708B1、WO2006096130或WO04/099381中所描述的真核宿主细胞。
因此,另一方面,本发明还提供了一种用于制备甜菊醇糖苷的方法,所述方法包括发酵本发明的重组宿主,所述重组宿主能够在合适的发酵培养基中产生至少一种甜菊醇糖苷;以及任选地回收所述甜菊醇糖苷。
在用于产生甜菊醇糖苷的方法中使用的发酵培养基可以是允许特定真核宿主细胞生长的任何合适的发酵培养基。发酵培养基的基本要素是本领域的技术人员已知的,并且可适用于所选择的宿主细胞。
优选地,发酵培养基包含选自由以下各项组成的组的碳源:植物生物质、纤维素、半纤维素、果胶、鼠李糖、半乳糖、岩藻糖、果糖、麦芽糖、麦芽糖糊精、核糖、核酮糖或淀粉、淀粉衍生物、蔗糖、乳糖、脂肪酸、甘油三酯和甘油。优选地,发酵培养基还包含氮源,如尿素;或铵盐,如硫酸铵、氯化铵、硝酸铵或磷酸铵。
根据本发明的发酵方法可以分批、分批补料或连续模式进行。也可应用单独的水解和发酵(SHF)方法或同时糖化和发酵(SSF)方法。这些发酵方法模式的组合对于最佳生产率来说也可以是可行的。如果在发酵方法中使用淀粉、纤维素、半纤维素或果胶作为碳源,则SSF方法可以是特别有吸引力的,其中可需要添加水解酶如纤维素酶、半纤维素酶或果胶酶以水解底物。
在用于制备甜菊醇糖苷的方法中使用的重组宿主可以是如上文所定义的任何合适的重组宿主。在所述方法中使用根据本发明的重组真核重组宿主可以是有利的,因为大多数真核细胞不需要用于繁殖的无菌条件并且对噬菌体感染不敏感。此外,真核宿主细胞可在低pH下生长以防止细菌污染。
根据本发明的重组宿主可以是兼性厌氧微生物。兼性厌氧重组宿主可以需氧方式繁殖至高细胞浓度。然后可在高细胞密度下进行这种厌氧阶段,这显著地降低了所需的发酵体积并且可使需氧微生物污染的风险最小化。
用于产生根据本发明的甜菊醇糖苷的发酵方法可以是需氧或厌氧发酵方法。
厌氧发酵方法可在本文中定义为在不存在氧的情况下运行或者基本上不消耗氧(优选小于5、2.5或1mmol/L/h),并且其中有机分子充当电子供体和电子受体两者的发酵方法。根据本发明的发酵方法也可首先在需氧条件下运行,且随后在厌氧条件下运行。
发酵方法也可在限氧或微需氧条件下进行。或者,发酵方法可首先在需氧条件下运行,且随后在限氧条件下运行。限氧发酵方法是其中氧消耗受到从气体到液体的氧传递的限制的过程。氧限制的程度由进入气流的量和组成以及所用发酵设备的实际混合/传质特性决定。
在根据本发明的方法中产生甜菊醇糖苷可在宿主细胞的生长阶段期间、固定(稳定状态)阶段期间或在两个阶段期间发生。在不同的温度下运行发酵方法可以是可行的。
用于产生甜菊醇糖苷的方法可在对于重组宿主来说最佳的温度下进行。对于每种转化的重组宿主而言,最佳生长温度可不同并且是本领域的技术人员已知的。最佳温度可高于野生型生物的最适温度以在非无菌条件下在最低感染敏感性和最低冷却成本的条件下有效生长生物体。或者,所述方法可在对于重组宿主的生长来说不是最佳的温度下进行。
用于产生根据本发明的甜菊醇糖苷的方法可在任何合适的pH值下进行。如果重组宿主是酵母,则发酵培养基中的pH优选具有低于6、优选低于5.5、优选低于5、优选低于4.5、优选低于4、优选低于pH 3.5或低于pH 3.0或低于pH 2.5、优选高于pH 2的值。在这些低pH值下进行发酵的优点是可防止发酵培养基中污染细菌的生长。
这种方法可在工业规模上进行。这种方法的产物是一种或多种甜菊醇糖苷。
从发酵培养基中回收甜菊醇糖苷可通过本领域已知的方法进行,例如通过蒸馏、真空萃取、溶剂萃取或蒸发。
在用于产生根据本发明的甜菊醇糖苷的方法中,实现高于5mg/l发酵液、优选高于10mg/l、优选高于20mg/l、优选高于30mg/l发酵液、优选高于40mg/l、更优选高于50mg/l、优选高于60mg/l、优选高于70、优选高于80mg/l、优选高于100mg/l、优选高于1g/l、优选高于5g/l、优选高于10g/l,例如至少约15g/L,例如至少约20g/l的浓度是可行的。
本发明还提供了一种包含能够通过本发明的用于制备甜菊醇糖苷的方法获得的甜菊醇糖苷的发酵液。
在本发明的重组宿主中表达一种或多种甜菊醇糖苷的情况下,可需要处理此类细胞以释放它们。优选地,在细胞外产生至少一种甜菊醇糖苷,例如rebA或rebM。
本发明还提供了一种通过根据本发明的用于制备甜菊醇糖苷的方法获得的或能够从本发明的发酵液获得的甜菊醇糖苷。这种甜菊醇糖苷可以是非天然存在的甜菊醇糖苷,也就是说不在植物中产生的甜菊醇糖苷。
还提供了通过本发明的方法能够获得的组合物(其通常包含一种或多种甜菊醇糖苷)。本发明还提供了一种包含能够通过用于制备甜菊醇糖苷的本发明的方法获得的或能够从本发明的发酵液获得的两种或更多种甜菊醇糖苷的组合物。在这种组合物中,一种或多种甜菊醇糖苷可以是非天然存在的甜菊醇糖苷,也就是说不在植物中产生的甜菊醇糖苷。这些都是本发明的组合物。
本发明的组合物可用于对于此类化合物来说已知的任何应用中。特别地,这样的组合物可例如用作甜味剂,例如用于食品或饮料中。因此,根据本发明,提供了一种包含本发明的组合物的食品、饲料或饮料。
例如,本发明的组合物可被配制成软饮料、配制为桌面甜味剂、口香糖、乳制品如酸奶(例如原味酸奶)、蛋糕、谷物或基于谷类的食物、营养食品、药物、食用凝胶、糖果产品、化妆品、牙膏或其它口腔组合物等。此外,本发明的组合物可用作甜味剂,不仅用于饮料、食品和其它专门用于人消费的产品,而且用于具有改进的特性的动物饲料和草料中。
因此,本发明尤其提供了一种包含本发明的组合物的食品、饲料或饮料。
在食品、饮料、药物、化妆品、桌面产品、口香糖的制造过程中,可使用诸如混合、捏合、溶解、酸浸、渗透、渗滤、喷洒、雾化、灌注和其它方法的常规方法。
本发明的组合物可以干或液体的形式使用。它可在食品热处理之前或之后加入。甜味剂的量取决于使用目的。它可单独添加或与其它化合物组合添加。
本发明的组合物可与一种或多种其它非热量或热量甜味剂掺混。这种掺混可用于改进风味或时间特征或稳定性。广泛范围的非热量和热量甜味剂二者可适用于与本发明的组合物掺混。例如,非热量甜味剂如罗汉果苷、莫纳甜、阿斯巴甜、安赛蜜盐、环磺酸盐、三氯蔗糖、糖精盐或赤藓糖醇。适用于与本发明的甜菊醇糖苷或组合物掺混的热量甜味剂包括糖醇和碳水化合物如蔗糖、葡萄糖、果糖和HFCS。还可使用甜味氨基酸,如甘氨酸、丙氨酸或丝氨酸。
本发明的组合物可与甜味剂抑制剂如天然甜味剂抑制剂组合使用。它可与鲜味增强剂如氨基酸或其盐组合。
本发明的组合物可与多元醇或糖醇、碳水化合物、生理活性物质或功能成分(例如类胡萝卜素、膳食纤维、脂肪酸、皂苷、抗氧化剂、营养品、类黄酮、异硫氰酸酯、苯酚、植物甾醇或甾烷醇(植物甾醇和植物甾烷醇)、多元醇、益生元、益生菌、植物雌激素、大豆蛋白、硫化物/硫醇、氨基酸、蛋白质、维生素、矿物质和/或基于健康益处如心血管、降胆固醇或抗炎分类的物质组合。
本发明的组合物可包括调味剂、芳香组分、核苷酸、有机酸、有机酸盐、无机酸、苦味化合物、蛋白质或蛋白质水解产物、表面活性剂、类黄酮、收敛剂化合物、维生素、膳食纤维、抗氧化剂、脂肪酸和/或盐。
本发明的组合物可作为高强度甜味剂应用,以产生具有改进的味道特征的零卡路里、低卡路里或糖尿病人用饮料和食品。它也可用于不能使用糖的饮料、食品、药物和其他产品中。
此外,本发明的组合物可用作甜味剂,不仅用于饮料、食品和其它专门用于人消费的产品,而且用于具有改进的特性的动物饲料和草料中。
本发明的组合物可用作甜味化合物的产品的实例可以是酒精饮料,如伏特加酒、葡萄酒、啤酒、烈酒、清酒等;天然果汁、提神饮料、碳酸软饮料、减肥饮料、零卡路里饮料、低卡路里饮料和食物、酸奶饮料、速溶果汁、速溶咖啡、粉末型速溶饮料、罐装产品、糖浆、发酵大豆酱、酱油、醋、调味品、蛋黄酱、番茄酱、咖喱、汤、速食肉汤、酱油粉、醋粉、多种类型的饼干、香米饼、咸饼干、面包、巧克力、焦糖、糖果、口香糖、果冻、布丁、蜜饯和腌菜、鲜奶油、果酱、橘子酱、糖花膏、奶粉、冰淇淋、冰糕、包装在瓶中的蔬菜和水果、罐装和煮熟的豆类、在甜味酱中煮熟的肉和食物、农业蔬菜食品、海鲜、火腿、香肠、鱼火腿、鱼香肠、鱼酱、油炸鱼制品、干制海产品、冷冻食品、腌渍海带、腊肉、烟草、医药产品等。原则上它可具有无限应用。
甜味组合物包括饮料,其非限制性实例包括非碳酸和碳酸饮料,如可乐、姜汁汽水、根汁汽水、苹果汁、水果味软饮料(例如柑橘味软饮料,如柠檬莱姆或橙汁)、软饮料粉等;来自水果或蔬菜的汁、包括榨汁等的汁、含有果粒的果汁、水果饮料、果汁饮料、含果汁的饮料、具有水果调味料的饮料、蔬菜汁、含蔬菜的汁以及含水果和蔬菜的混合汁;运动饮料、能量饮料、近水(near water)等的饮料(例如具有天然或合成调味剂的水);茶类或喜好型饮料如咖啡、可可、红茶、绿茶、乌龙茶等;含乳成分饮料如乳饮料、含乳成分咖啡、牛奶咖啡、奶茶、果奶饮料、饮用酸奶、乳酸菌饮料等;以及乳制品。
通常,甜味组合物中存在的甜味剂的量取决于甜味组合物的具体类型及其所需的甜度而广泛变化。本领域的普通技术人员可容易确定加入到甜味组合物中的甜味剂的适当量。
在食品、饮料、药物、化妆品、桌面产品、口香糖的制造过程中,可使用诸如混合、捏合、溶解、酸浸、渗透、渗滤、喷洒、雾化、灌注和其它方法的常规方法。
因此,掺入了本发明的组合物的组合物可通过本领域的技术人员已知的提供成分的均匀或均质混合物的任何方法来制备。这些方法包括干混、喷雾干燥、团聚、湿法制粒、压实、共结晶等。
呈固体形式时,本发明的组合物可以适于递送到待甜化的食物中的任何形式提供给消费者,所述形式包括小袋、小包、散装袋或盒、方块、片剂、喷雾或可溶解的条。所述组合物可以单位剂量或散装形式递送。
对于液体甜味剂体系和组合物而言,应开发方便范围的流体、半流体、糊状和膏状形式、使用任何形状或形式的适当包装材料的适当包装,其便于携带或分配或储存或运输含有任何上述甜味剂产品或上述产生的产品的组合的任何组合。
本发明的组合物可包含多种填充剂、功能成分、着色剂、调味剂。
术语“序列同源性”或“序列同一性”或“同源性”或“同一性”在本文中可互换使用。出于本发明的目的,在此定义为了确定两个氨基酸序列或两个核酸序列的序列同源性或序列同一性的百分比,出于最佳比较目的比对所述序列。为了优化两个序列之间的比对,可在比较的两个序列中的任一个中引入空位。这种比对可在所比较的序列的全长上进行。或者,比对可在更短的长度上进行,例如在约20、约50、约100或更多个核酸/碱基或氨基酸上进行。序列同一性是在所报告的比对区域上两个序列之间的相同匹配的百分比。
两个序列之间的序列比较和序列同一性百分比的确定可使用数学算法来完成。本领域的技术人员将意识到以下事实:若干不同的计算机程序可用于比对两个序列并确定两个序列之间的同一性(Kruskal,J.B.(1983) An overview of sequence comparison InD.Sankoff and J.B.Kruskal,(编辑),Time warps,string edits and macromolecules:the theory and practice of sequence comparison,第1-44页Addison Wesley)。两个氨基酸序列之间或两个核苷酸序列之间的序列同一性百分比可使用用于两个序列的比对的Needleman和Wunsch算法来确定(Needleman,S.B.和Wunsch,C.D. (1970)J.Mol.Biol.48,443-453)。氨基酸序列和核苷酸序列两者均可通过所述算法进行比对。Needleman-Wunsch算法已在计算机程序NEEDLE 中实现。出于本发明的目的,使用了来自EMBOSS包的NEEDLE程序 (2.8.0版或更高版本,EMBOSS:The European Molecular Biology Open SoftwareSuite(2000)Rice,P.Longden,I.和Bleasby,A.Trends in Genetics 16,(6)第276-277页,http://emboss.bioinformatics.nl/)。对于蛋白质序列而言,EBLOSUM62用于取代矩阵。对于核苷酸序列而言,使用 EDNAFULL。所使用的任选参数是空位开放罚分为10,以及空位延伸罚分为0.5。技术人员将理解的是,所有这些不同的参数将产生稍微不同的结果,但是当使用不同的算法时,两个序列的总体同一性百分比没有显著改变。
在通过如上所述的程序NEEDLE进行比对后,查询序列与本发明的序列之间的序列同一性的百分比计算如下:在两个序列中显示相同氨基酸或相同核苷酸的比对中的相应位置的数目除以在减去比对中的总空位数后比对的总长度。如本文定义的同一性可通过使用NOBRIEF选项从NEEDLE 获得,并且在程序的输出中标记为“最长同一性”。
本发明的核酸和蛋白质序列可进一步用作“查询序列”以进行针对公共数据库的检索,以例如鉴定其它家族成员或相关序列。此类搜索可使用Altschul等人(1990)J.Mol.Biol.215:403—10的NBLAST和XBLAST程序 (2.0版)进行。BLAST核苷酸搜索可用NBLAST程序(得分=100、字长=12)来进行,以获得与本发明的核酸分子同源的核苷酸序列。BLAST蛋白质搜索可用XBLAST程序(得分=50、字长=3)来进行,以获得与本发明的蛋白分子同源的氨基酸序列。为了获得用于比较目的的空位比对,可利用如在Altschul等人,(1997)Nucleic Acids Res.25(17):3389-3402中描述的空位BLAST。当利用BLAST和空位BLAST程序时,可使用相应程序(例如XBLAST和NBLAST)的默认参数。参见美国国家生物技术信息中心http://www.ncbi.nlm.nih.gov/的主页。
标准遗传技术,例如在宿主细胞中过表达酶、宿主细胞的遗传修饰或杂交技术是本领域已知的方法,例如Sambrook和Russel(2001) “Molecular Cloning:A LaboratoryManual(第3版),Cold Spring Harbor Laboratory,Cold Spring Harbor LaboratoryPress或F.Ausubel等编,“Current protocols in molecular biology”,GreenPublishing and Wiley Interscience,New York(1987)中所述。转化、遗传修饰真菌宿主细胞的方法等从例如EP-A-0 635 574、WO 98/46772、WO 99/60102和WO 00/37671、WO90/14423、EP-A-0481008、EP-A-0635 574和US6,265,186 中获知。
本发明的一些实施方式:
1.一种能够产生甜菊醇糖苷的重组宿主,所述重组宿主过表达介导甜菊醇糖苷转运的多肽,并且所述多肽包含SEQ ID NO:35或SEQ ID NO: 38所示的氨基酸序列或与二者之任一具有至少约50%序列同一性的氨基酸序列。
2.一种能够产生甜菊醇糖苷的重组宿主,所述重组宿主已被修饰,优选在其基因组中被修饰,以导致介导甜菊醇糖苷转运的多肽的产生缺陷,并且所述多肽包含SEQ IDNO:35或SEQ ID NO:38所示的氨基酸序列或与二者之任一具有至少约50%序列同一性的氨基酸序列。
3.根据实施方式1所述的重组宿主,所述重组宿主包含编码多肽的重组核酸,所述多肽包含SEQ ID NO:35或SEQ ID NO:38所示氨基酸序列或与二者之任一具有至少约50%序列同一性的氨基酸序列。
4.根据前述实施方式中任一种所述的重组宿主,其包含一种或更多种编码以下多肽的重组核苷酸序列:
具有对映-柯巴基焦磷酸合酶活性的多肽;
具有对映-贝壳杉烯合酶活性的多肽;
具有对映-贝壳杉烯氧化酶活性的多肽;以及
具有贝壳杉烯酸13-羟化酶活性的多肽。
5.根据前述实施方式中任一种所述的重组宿主,其包含编码具有 NADPH-细胞色素p450还原酶活性的多肽的重组核酸序列。
6.根据前述实施方式中任一种所述的重组宿主,其包含编码以下项中的一种或更多种的重组核酸序列:
(i)具有UGT74G1活性的多肽;
(ii)具有UGT2活性的多肽;
(iii)具有UGT85C2活性的多肽;和
(iv)具有UGT76G1活性的多肽。
7.根据前述实施方式中任一种所述的重组宿主,其中所述宿主属于Saccharomyces、Aspergillus、Pichia、Kluyveromyces、Candida、 Hansenula、Humicola、Issatchenkia、Trichosporon、Brettanomyces、 Pachysolen、Yarrowia、Yamadazyma或Escherichia属中的一种。
8.根据实施方式7所述的重组宿主,其中所述重组宿主是 Saccharomycescerevisiae细胞、Yarrowia lipolitica细胞、Candida krusei细胞、Issatchenkiaorientalis细胞或Escherichia coli细胞。
9.根据前述实施方式中任一种所述的重组宿主,其中所述宿主产生香叶基香叶基二磷酸(GGPP)的能力被上调。
10.根据前述实施方式中任一种所述的重组宿主,其包含编码以下项中的一种或多种的核酸序列:
具有羟甲基戊二酰基-辅酶A还原酶活性的多肽;或者
具有法尼基-焦磷酸合成酶活性的多肽
11.一种能够产生甜菊醇糖苷的重组宿主,所述重组宿主过表达介导甜菊醇糖苷转运的异源多肽。
12.一种制备甜菊醇糖苷的方法,所述方法包括在合适的发酵培养基中发酵根据前述实施方式中任一种所述的重组宿主,以及任选地回收所述甜菊醇糖苷。
13.根据实施方式12所述的制备甜菊醇糖苷的方法,任选地其中所述方法以工业规模进行。
14.一种发酵液,其包含通过根据实施方式12或13所述的方法能够获得的甜菊醇糖苷。
15.通过根据实施方式12或13所述的方法获得的或者从根据实施方式14所述的发酵液获得的甜菊醇糖苷。
16.通过根据实施方式12或13所述的方法能够获得的组合物,包含两种或更多种通过根据实施方式12或13所述的方法获得的甜菊醇糖苷的组合物或从根据实施方式14所述的发酵液获得的组合物。
17.一种食品、饲料或饮料,其包含根据权利要求15所述的甜菊醇糖苷或根据权利要求16所述的组合物。
在本文对专利文件或作为现有技术给出的其他材料的引用不应被认为承认该文件或材料是已知的或它包含的信息是任何这些权利要求的优先权日时公知常识的一部分。
在本文所述的每个参考文献的披露均通过引用以其全部内容并入本文。
本发明通过以下实施例来进一步说明:
实施例
概述
标准遗传技术(如在宿主细胞中过表达酶以及宿主细胞的另外遗传修饰)是本领域已知的方法,例如在Sambrook和Russel(2001)"Molecular Cloning:A LaboratoryManual(第3版),Cold Spring Harbor Laboratory,Cold Spring Harbor LaboratoryPress,或F.Ausubel等人编辑,"Current protocols in molecular biology",GreenPublishing and Wiley Interscience,New York (1987)中所描述的。用于真菌宿主细胞的转化和遗传修饰的方法从例如 EP-A-0 635 574、WO 98/46772、WO 99/60102和WO 00/37671中获知。
实施例1.在S.cerevisiae中过表达ERG20、BTS1和tHMG
使用如WO2013/076280中描述的技术将表达盒整合至一个位点以过表达ERG20、BTS1和tHMG1。使用合适的引物和源于CEN.PK酵母菌株 (van Dijken等人Enzyme andMicrobial Technology 26(2000)706-714)的基因组DNA扩增整合位点的5’和3’整合侧翼。在DNA2.0,不同的基因被整理为盒子(包含同源序列、启动子、基因、终止子、同源序列)。这些盒子中的基因的侧翼是组成型启动子和终止子。参见表1。溶解来源于 DNA2.0的含有ERG20、tHMG1和BTS1盒子的质粒DNA至浓度为 100ng/μl。在50μl PCR混合物中,使用20ng模板和20pmol引物。材料被溶解至浓度为0.5μg/μl。
表1:过表达构建体的组分
启动子 | 开放阅读框 | 终止子 |
Eno2(SEQ ID NO:1) | ERG20(SEQ ID NO:2) | Adh1(SEQ ID NO:3) |
Fba1(SEQ ID NO:4) | tHMG1(SEQ ID NO:5) | Adh2(SEQ ID NO:6) |
Tef1(SEQ ID NO:7) | Bts1(SEQ ID NO:8) | Gmp1(SEQ ID NO:9) |
使用pUG7-EcoRV构建体(图1)和合适的引物来扩增选择标记。使用Zymoclean GelDNA Recovery试剂盒(ZymoResearch)从凝胶中纯化 KanMX片段。使用在表2中列出的片段转化酵母菌株Cen.PK113-3C。
表2:用于ERG20、tHMG1和BTS1的转化的DNA片段
片段 |
5’YPRcTau3 |
ERG20盒 |
tHMG1盒 |
KanMX盒 |
BTS1盒 |
3’YPRcTau3 |
转化后,在30℃下于YEPhD(酵母膏植物蛋白胨葡萄糖;BBL植物蛋白胨来源于BD)中复苏2.5小时,然后将细胞涂布在含200μg/ml G418 (Sigma)的YEPhD琼脂上。在30℃下培养平板4天。利用诊断PCR和测序技术确定正确的整合。通过对蛋白质进行LC/MS证实过表达。图2 阐释了组装ERG20、tHMG1和BTS1的原理图。该菌株被命名为 STV002。
该菌株中CRE重组酶的表达导致KanMX标记的向外重组。利用诊断 PCR确定正确的向外重组以及ERG20、tHMG1和BTS1的存在。
实施例2.敲低Erg9
为了降低Erg9的表达,设计并使用含有修饰的3’末端的Erg9敲低构建体,其中所述3’末端延续至驱动TRP1表达的TRP1启动子。
转化含有Erg9-KD片段的构建体至E.coli TOP10细胞。转化株生长于 2PY(2倍的植物蛋白胨和酵母膏)-sAMP培养基中。使用QIAprep Spin Miniprep kit(Qiagen)分离质粒DNA,然后用SalI-HF(New England Biolabs)消化。用乙醇沉淀DNA以浓缩。转化所述片段至S.cerevisiae,然后将菌落涂布到不含色氨酸的矿质培养基(Verduyn等人,1992.Yeast8:501-517)琼脂板上。利用诊断PCR和测序技术确定正确整合的Erg9- KD构建体。图 3 阐释了执行Erg9-KD构建体的转化的原理图。该菌株被命名为STV003。
实施例3.过表达UGT2_1a
使用如专利申请号WO2013/076280和WO2013/144257中描述的技术过表达UGT2_1a。在DNA2.0,UGT2_1a被整理为一个盒子(包含同源序列、启动子、基因、终止子、同源序列)。细节请参见表3。使用如专利申请号WO2013/135728中描述的技术以获得含有标记和Cre重组酶的片段。用具有诺尔丝菌素抗性的NAT标记进行筛选。
表3:过表达构建体的组分
启动子 | 开放阅读框 | 终止子 |
Pgk1(SEQ ID NO:10) | UGT2_1a(SEQ ID NO:11) | Adh2(SEQ ID NO:6) |
使用合适的引物进行扩增。使用合适的引物和源于CEN.PK酵母菌株的基因组DNA以扩增整合位点的5’和3’整合侧翼。
使用表4中列出的片段转化S.cerevisiae酵母菌株STV003,然后将转化混合物涂布在含有50μg/ml诺尔丝菌素(Lexy NTC来源于Jena Bioscience)的YEPhD琼脂板上。
表4:用于UGT21a的转化的DNA片段
半乳糖能够激活CRE重组酶的表达。为了诱导CRE重组酶的表达,将转化株再次划线至YEPh半乳糖培养基上。这导致了位于lox位置之间的标记的向外重组。利用诊断PCR证实UGT2_1a的正确整合和NAT标记的向外重组。由此产生的菌株被命名为STV004。图4阐释了执行 UGT2_1a构建体的转化的原理图。
实施例4.过表达RebA产生通路:CPS、KS、KO、KAH、CPR、UGT1、UGT3和UGT4
使用如专利申请号WO2013/076280和WO2013/144257中描述的技术将所有导致RebA产生的通路基因设计整合至一个位点。使用合适的引物和源于CEN.PK酵母菌株的基因组DNA以扩增整合位点的5’和3’整合侧翼。在DNA2.0,不同的基因被整理为盒(包含同源序列、启动子、基因、终止子、同源序列)(概述请参见表5)。溶解来源于DNA2.0的 DNA至100ng/μl。将该原液进一步稀释至5ng/μl,然后取1μl用于50μl- PCR混合物中。反应包含25pmol每种引物。扩增后,使用NucleoSpin 96 PCR Clean-up试剂盒(Macherey-Nagel)纯化DNA或者利用乙醇沉淀以浓缩DNA。
表5.用于RebA产生通路的序列
启动子 | ORF | SEQ ID | 终止子 |
Kl prom 12.pro(SEQ ID NO:12) | trCPS_SR | 13 | Sc ADH2.ter(SEQ ID NO:9) |
Sc PGK1.pro(SEQ ID NO:10) | trKS_SR | 14 | Sc TAL1.ter(SEQ ID NO:15) |
Sc ENO2.pro(SEQ ID NO:1) | KO_2 | 16 | Sc TPI1.ter(SEQ ID NO:17) |
Ag lox_TEF1.pro(SEQ ID NO:18) | KANMX | 19 | Ag TEF1_lox.ter(SEQ ID NO:20) |
Sc TEF1.pro(SEQ ID NO:7) | KAH_4 | 21 | Sc GPM1.ter(SEQ ID NO:9) |
Kl prom 6.pro(SEQ ID NO:22) | CPR_3 | 23 | Sc PDC1.ter(SEQ ID NO:24) |
Kl prom 3.pro(SEQ ID NO:25) | UGT1_SR | 26 | Sc TDH1.ter(SEQ ID NO:27) |
Kl prom 2.pro(SEQ ID NO:28) | UGT3_SR | 29 | Sc ADH1.ter(SEQ ID NO:3) |
Sc FBA1.pro(SEQ ID NO:4) | UGT4_SR | 30 | Sc ENO1.ter(SEQ ID NO:31) |
将所有RebA通路、标记和侧翼(概述请参见表6)转化至S. cerevisiae酵母菌株STV004。在20℃下于YEPhD中过夜恢复后,将转化混合物涂布至含有200μg/ml G418的YEPhD琼脂上。在25℃下培养3天并在室温下培养一夜。
表6.用于CPS、KS、KO、KanMX、KAH、CPR、UGT1、UGT3和UGT4的转化的DNA片段
片段 |
5’INT1 |
CPS盒 |
KS盒 |
KO盒 |
KanMX盒 |
KAH盒 |
CPR盒 |
UGT1盒 |
UGT3盒 |
UGT4盒 |
3’INT1 |
利用诊断PCR和序列分析(3500基因分析仪,Applied Biosystems) 证实正确的整合。使用BigDye Terminator v3.1循环测序试剂盒(Life Technologies)完成测序反应。每个反应(10μl)包含50ng模板和3.2pmol 引物。通过用乙醇/EDTA沉淀来纯化产物,然后将其溶解在10μl HiDi甲酰胺中并应用于仪器。该菌株被命名为STV016。图5阐释了将GGPP到RebA的通路整合至基因组的示意图。表7示出了在实施例1到5中使用的菌株。
实施例5:构建菌株STV027
为了从菌株STV016的染色体中除去KanMX标记,用表达Cre重组酶(Güldender,2002)的质粒pSH65转化该菌株。随后,通过在非选择性培养基(2%葡萄糖的YEP)上生长来去除(cured)菌株中的质粒 pSH65。所产生的不含KanMX且不含pSH65的菌株(通过涂布在含200 μg G418/ml或20μg腐草霉素/ml的平板上来确定,此时不应发生生长)被命名为STV027。利用诊断PCR进一步证实KanMX标记不存在。所得的菌株被命名为STV027。
实施例6:构建菌株STV035
为了引入额外拷贝的KAH和CPR,使用可用的PCR片段(参见表6 和表7)。使用合适的引物从pUG7-EcoRV(图1)扩增KanMX选择标记片段。为了扩增整合基因座的5'和3'整合侧翼,使用合适的引物和来自 CEN.PK酵母菌株的基因组DNA。
根据Gietz方法用这些片段转化STV027(表7)。在30℃下在 YEPhD中恢复2小时后,将转化混合物涂布在含有200μg/ml G418的 YEPhD琼脂上。将它们在30℃下孵育4天。
表7.用于将KanMX、KAH和CPR转化到STV027的DNA片段。
片段 |
5’Chr11.04 |
KanMX盒 |
KAH盒 |
CPR盒 |
3’Chr11.04 |
图6示出了KAH和CPR如何整合到基因组中的示意图。利用诊断PCR证实正确的整合。所得菌株被命名为STV035。
实施例7:构建菌株STV058
为了整合第二拷贝的CPS,将该基因与TDH3启动子和ADH2终止子一起扩增。
表8.CPS盒(2)中的序列
由于STV035中存在KanMX标记,所以使用合适的引物从pUG7- NAT(图7)扩增NAT标记。为了扩增整合基因座的5'和3'整合侧翼,使用合适的引物和来自CEN.PK酵母菌株的基因组DNA。
表9.用于将CPS和NAT转化到STV035的DNA片段。
片段 |
5’Chr2.06 |
CPS盒(2) |
NAT |
3’Chr2.06 |
将用于整合第二拷贝的CPS的不同片段(表9)组合并转化到 STV035。恢复后,将转化混合物涂布在含有50μg/ml诺尔丝菌素的YEPhD琼脂板上。将它们在30℃下孵育3天。利用诊断PCR证实正确的整合。新菌株被命名为STV058。图8示出了CPS如何整合到基因组中的示意图。
表10.菌株表
实施例8.在S.cerevisiae菌株STV058中表达I.orientalisALNQ_007_38000和
ALNQ_214_12000
为了表达ALNQ_007_38000(SEQ ID NO:33)和ALNQ_214_12000 (SEQ ID NO:36),使用专利申请号WO2013/076280和 WO2013/144257中所述的技术将表达盒设计成整合在S.cerevisiae STV058 Chr01.05基因座中。为了扩增整合基因座的5'和3'整合侧翼,使用合适的引物和来自CEN.PK酵母菌株的基因组DNA。
使用合适的引物从I.orientalis CBS5147基因组DNA扩增两种转运体基因。将PCR扩增子亚克隆在Zero Blunt TOPO载体(Life Technologies) 中。使用BspMI或BsaI将基因克隆到Sc_2_5-2_a.bbn载体中,其中它们的侧翼为组成型启动子Kl_ENO1或Sc_GPM1和Sc_TAL1终止子,从而导致每个转运体基因有两个表达盒。在50μl PCR混合物中PCR扩增表达盒6次。使用NucleoSpin Gel和PCR Clean-up试剂盒(Machery Nagel)纯化和浓缩PCR产物。
为了扩增选择标记,使用pUG7-HygB构建体(图10)和合适的引物。使用NucleoSpinGel和PCR Clean-up试剂盒(Machery Nagel)纯化和浓缩PCR产物。用表11中列出的片段转化酵母菌株S.cerevisiae STV058。体内组装如图11所示。
表11:转化到S.cerevisiae STV058的片段
转化并在30℃下在YEPhD中恢复2小时后,将细胞涂布在含有200 μg/ml HygB(Invitrogen)的YEPhD琼脂上。将板在30℃下孵育2天。通过将转化体重新划线在含有200μg/ml HygB的YEPhD琼脂上来将其纯化。利用诊断PCR确定正确的整合和组装。
实施例9.发酵STV058以及ALNQ_007_38000和ALNQ_214_12000转运体过表达菌株
用来自YEPh-D琼脂的菌落物质接种预培养物。使预培养物在96半深孔板中含有葡萄糖作为碳源的200μl矿质培养基中生长。将预培养物在 27℃、750rpm和80%湿度的Infors培养箱中孵育72小时。
使用40μl预培养物接种24深孔板中含有葡萄糖作为碳源的2.5ml矿质培养基。将这些生产培养物在27℃、550rpm、80%湿度的Infors培养箱中孵育120小时。将生产培养物充分均化,并将0.5ml培养物转移到96 孔板中。该样品被用作全培养液样品。剩余的生产培养物通过以3000×g 离心10分钟来沉淀。离心后,将0.5上清液转移到96孔板中。该样品被用作上清液样品。将全培养液96孔板和上清液96孔板在90℃水浴中孵育 10分钟,然后冷却至室温。向每个孔中加入0.25ml乙腈并均化。然后将板以3000×g离心10分钟以沉淀细胞材料和碎片。将全培养液和上清液样品在33%乙腈中稀释200倍。使用LC/MS分析样品的RebA和其他甜菊醇糖苷。我们发现:与亲本菌株相比,具有所述的特定转运体基因过表达的菌株在上清液级分中产生更高滴度的莱鲍迪甙A或其他甜菊醇糖苷,例如莱鲍迪甙B。结果概述请参见表12、13。
表12.上清液和培养液中莱鲍迪甙A的浓度
菌株 | Reb A上清液(mg/L) | Reb A培养液(mg/L) |
STV058 | 29 | 137 |
ENO1p_ALNQ_007_38000 | 51 | 95 |
GPM1p_ALNQ_007_38000 | 53 | 79 |
ENO1p_ALNQ_214_12000 | 171 | 178 |
GPM1p_ALNQ_214_12000 | 155 | 151 |
过表达ALNQ_007_38000转运体或ALNQ_214_12000转运体的菌株在上清液中具有提高水平的莱鲍迪甙A。通过ALNQ_214_12000转运蛋白的过表达,与参考菌株相比,上清液中RebA的量增加至5-6倍。还参见图12。
表13.上清液和培养液中莱鲍迪甙B的浓度
菌株 | Reb B上清液(mg/L) | Reb B培养液(mg/L) |
STV058 | 7 | 41 |
ENO1p_ALNQ_007_38000 | 124 | 139 |
GPM1p_ALNQ_007_38000 | 165 | 170 |
ENO1p_ALNQ_214_12000 | 15 | 19 |
GPM1p_ALNQ_214_12000 | 15 | 17 |
过表达ALNQ_007_38000转运体或ALNQ_214_12000转运体的菌株在上清液中具有提高水平的莱鲍迪甙B。在ALNQ_007_38000转运体的情况下,这还导致培养液中RebB浓度更高。还参见图13。观察到如此大量的RebB被输出到上清液中解释了培养液中的莱鲍迪甙A产生降低(表 12),因为上清液中的莱鲍迪甙B不再可用作莱鲍迪甙A产生(其在细胞内发生)的底物。对于莱鲍迪甙A或莱鲍迪甙A下游产物的细胞外生产,因此ALNQ_007_38000(或等同物)转运体可以是包含这种转运体的宿主 (例如I.orientalis)中缺失的靶标,结合更特异地转运莱鲍迪甙A的转运体(例如ALNQ_214_12000转运体)的过表达。
过表达ALNQ_007_38000转运体或ALNQ_214_12000转运体的菌株在培养液中具有降低水平的莱鲍迪甙M。因为这两种转运体有效输出甜菊醇糖苷例如莱鲍迪甙A和莱鲍迪甙B,所以在细胞内可获得的用于朝向莱鲍迪甙M转化的这些中间体较少。因此,这些转运体(或等同物)可以是会具有这种转运体的宿主(例如I.orientalis)中缺失的靶标,以增加莱鲍迪甙M产生。
表14.上清液和培养液中的莱鲍迪甙M浓度
菌株 | Reb M培养液(mg/L) |
STV058 | 60 |
ENO1p_ALNQ_007_38000 | 25 |
GPM1p_ALNQ_007_38000 | 13 |
ENO1p_ALNQ_214_12000 | 7 |
GPM1p_ALNQ_214_12000 | 2 |
表15.序列表说明
序列表
<110> 帝斯曼知识产权资产管理有限公司
<120> 甜菊醇糖苷转运
<130> 31190-WO-PCT
<150> 62/204704
<151> 2015-08-13
<160> 38
<170> PatentIn version 3.5
<210> 1
<211> 600
<212> DNA
<213> Artificial sequence
<220>
<223> ScEno2 promoter
<400> 1
gtgtcgacgc tgcgggtata gaaagggttc tttactctat agtacctcct cgctcagcat 60
ctgcttcttc ccaaagatga acgcggcgtt atgtcactaa cgacgtgcac caacttgcgg 120
aaagtggaat cccgttccaa aactggcatc cactaattga tacatctaca caccgcacgc 180
cttttttctg aagcccactt tcgtggactt tgccatatgc aaaattcatg aagtgtgata 240
ccaagtcagc atacacctca ctagggtagt ttctttggtt gtattgatca tttggttcat 300
cgtggttcat taattttttt tctccattgc tttctggctt tgatcttact atcatttgga 360
tttttgtcga aggttgtaga attgtatgtg acaagtggca ccaagcatat ataaaaaaaa 420
aaagcattat cttcctacca gagttgattg ttaaaaacgt atttatagca aacgcaattg 480
taattaattc ttattttgta tcttttcttc ccttgtctca atcttttatt tttattttat 540
ttttcttttc ttagtttctt tcataacacc aagcaactaa tactataaca tacaataata 600
<210> 2
<211> 1056
<212> DNA
<213> Saccharomyces cerevisiae
<400> 2
atggcttctg aaaaggaaat cagaagagaa cgtttcttga atgttttccc aaaattggtt 60
gaagaattga acgcttctct attagcttac ggtatgccaa aggaagcttg tgactggtac 120
gctcactctt tgaactacaa caccccaggt ggtaagttga acagaggtct atccgttgtt 180
gacacctacg ccattttgtc caacaagacc gtcgaacaat taggtcaaga agaatacgaa 240
aaggttgcca tcttaggttg gtgtatcgaa ttgttgcaag cttacttctt ggttgctgat 300
gacatgatgg acaaatctat caccagaaga ggtcaaccat gttggtacaa ggttccagaa 360
gtcggtgaaa ttgccatcaa cgatgctttc atgttggaag ctgccatcta caagttgttg 420
aagtctcact tcagaaacga aaagtactac attgacatca ctgaattatt ccacgaagtt 480
actttccaaa ccgaattggg tcaattgatg gacttgatta ccgctccaga agataaggtc 540
gatttgtcca aattttcctt gaagaaacac tctttcattg tcactttcaa gactgcttac 600
tactcctttt acttgcctgt tgctttggcc atgtatgtcg ctggtatcac cgatgaaaag 660
gacttgaagc aagctcgtga tgtcttgatt ccattaggtg aatacttcca aatccaagat 720
gactacttgg actgtttcgg tactccagaa caaatcggta agattggtac tgatatccaa 780
gacaacaagt gttcctgggt tatcaacaag gctttggaat tggcttctgc tgaacaaaga 840
aagactttgg acgaaaacta cggtaagaag gactctgttg ctgaagctaa gtgtaagaag 900
atcttcaacg atttgaaaat tgaacaatta taccatgaat acgaagaatc tattgccaag 960
gacttgaaag ccaagatctc tcaagtcgac gaatccagag gtttcaaggc tgatgtcttg 1020
actgctttct tgaacaaggt ctacaagaga tcaaaa 1056
<210> 3
<211> 301
<212> DNA
<213> Artificial sequence
<220>
<223> Adh1 terminator
<400> 3
agcgaatttc ttatgattta tgatttttat tattaaataa gttataaaaa aaataagtgt 60
atacaaattt taaagtgact cttaggtttt aaaacgaaaa ttcttattct tgagtaactc 120
tttcctgtag gtcaggttgc tttctcaggt atagcatgag gtcgctctta ttgaccacac 180
ctctaccggc atgccgagca aatgcctgca aatcgctccc catttcaccc aattgtagat 240
atgctaactc cagcaatgag ttgatgaatc tcggtgtgta ttttatgtcc tcagaggaca 300
a 301
<210> 4
<211> 600
<212> DNA
<213> Artificial sequence
<220>
<223> Sc Fba1 promoter
<400> 4
ctacttggct tcacatacgt tgcatacgtc gatatagata ataatgataa tgacagcagg 60
attatcgtaa tacgtaatag ttgaaaatct caaaaatgtg tgggtcatta cgtaaataat 120
gataggaatg ggattcttct atttttcctt tttccattct agcagccgtc gggaaaacgt 180
ggcatcctct ctttcgggct caattggagt cacgctgccg tgagcatcct ctctttccat 240
atctaacaac tgagcacgta accaatggaa aagcatgagc ttagcgttgc tccaaaaaag 300
tattggatgg ttaataccat ttgtctgttc tcttctgact ttgactcctc aaaaaaaaaa 360
aatctacaat caacagatcg cttcaattac gccctcacaa aaactttttt ccttcttctt 420
cgcccacgtt aaattttatc cctcatgttg tctaacggat ttctgcactt gatttattat 480
aaaaagacaa agacataata cttctctatc aatttcagtt attgttcttc cttgcgttat 540
tcttctgttc ttctttttct tttgtcatat ataaccataa ccaagtaata catattcaaa 600
<210> 5
<211> 1575
<212> DNA
<213> Saccharomyces cerevisiae
<400> 5
atggaccaat tggtcaagac tgaagtcacc aagaaatctt tcactgctcc agtccaaaag 60
gcttccactc cagttttgac caacaagacc gtcatctccg gttccaaggt taaatctttg 120
tcctctgctc aatcttcctc ctctggtcca tcttcttctt ctgaagaaga tgattccaga 180
gatatcgaat ctttggacaa gaaaatcaga ccattggaag aattggaagc tctattgtcc 240
tctggtaaca ctaagcaatt aaagaacaag gaagttgctg ctttggttat ccacggtaaa 300
ttgccattgt acgctttgga aaagaaatta ggtgacacca ccagagctgt tgctgtcaga 360
agaaaggctt tgtccatttt ggctgaagct ccagtcttgg cttccgacag attaccatac 420
aagaactacg actacgaccg tgtctttggt gcttgttgtg aaaatgtcat tggttacatg 480
ccattaccag ttggtgtcat tggtccattg gttatcgacg gtacttctta ccacatccca 540
atggctacca ctgaaggttg tttggttgct tctgccatga gaggttgtaa ggccatcaac 600
gctggtggtg gtgctaccac cgttttgact aaggatggta tgaccagagg tcctgttgtc 660
agattcccaa ctttgaagag atctggtgct tgtaagatct ggttggattc tgaagaaggt 720
caaaacgcca tcaagaaggc tttcaactcc acttccagat tcgctagatt gcaacacatt 780
caaacttgtt tagctggtga cttgttgttc atgagattca gaaccaccac tggtgacgct 840
atgggtatga acatgatctc caagggtgtt gaatactctt tgaagcaaat ggttgaagaa 900
tacggttggg aagatatgga agttgtctct gtttctggta actactgtac cgacaagaag 960
ccagctgcca tcaactggat cgaaggtcgt ggtaagtccg ttgttgctga agctaccatt 1020
ccaggtgacg ttgtcagaaa ggttttgaaa tctgatgttt ctgctttagt cgaattgaac 1080
attgccaaga acttggtcgg ttctgccatg gctggttccg tcggtggttt caacgctcat 1140
gccgctaact tggtcactgc tgttttcttg gctttaggtc aagatccagc tcaaaatgtc 1200
gaatcctcta actgtatcac tttgatgaag gaagttgacg gtgatttgag aatttctgtt 1260
tccatgccat ccattgaagt cggtactatc ggtggtggta ctgtcttgga accacaaggt 1320
gccatgttgg acttgttggg tgttcgtggt ccacacgcta ccgctccagg tactaacgcc 1380
agacaattgg ccagaattgt tgcctgtgcc gtcttggctg gtgaattgtc tctatgtgcc 1440
gctttggctg ctggtcactt ggttcaatct cacatgaccc acaacagaaa gcctgctgaa 1500
ccaaccaaac caaacaactt ggatgctact gacattaaca gattaaagga cggttctgtc 1560
acctgtatca agtct 1575
<210> 6
<211> 301
<212> DNA
<213> Artificial sequence
<220>
<223> Adh2 terminator
<400> 6
agcggatctc ttatgtcttt acgatttata gttttcatta tcaagtatgc ctatattagt 60
atatagcatc tttagatgac agtgttcgaa gtttcacgaa taaaagataa tattctactt 120
tttgctccca ccgcgtttgc tagcacgagt gaacaccatc cctcgcctgt gagttgtacc 180
cattcctcta aactgtagac atggtagctt cagcagtgtt cgttatgtac ggcatcctcc 240
aacaaacagt cggttatagt ttgtcctgct cctctgaatc gtgtccctcg atatttctca 300
t 301
<210> 7
<211> 600
<212> DNA
<213> Artificial sequence
<220>
<223> Sc Tef1 promoter
<400> 7
ttggctgata atagcgtata aacaatgcat actttgtacg ttcaaaatac aatgcagtag 60
atatatttat gcatattaca tataatacat atcacatagg aagcaacagg cgcgttggac 120
ttttaatttt cgaggaccgc gaatccttac atcacaccca atcccccaca agtgatcccc 180
cacacaccat agcttcaaaa tgtttctact ccttttttac tcttccagat tttctcggac 240
tccgcgcatc gccgtaccac ttcaaaacac ccaagcacag catactaaat ttcccctctt 300
tcttcctcta gggtgtcgtt aattacccgt actaaaggtt tggaaaagaa aaaagacacc 360
gcctcgtttc tttttcttcg tcgaaaaagg caataaaaat ttttatcacg tttctttttc 420
ttgaaaattt ttttttttga tttttttctc tttcgatgac ctcccattga tatttaagtt 480
aataaacggt cttcaatttc tcaagtttca gtttcatttt tcttgttcta ttacaacttt 540
ttttacttct tgctcattag aaagaaagca tagcaatcta atctaagttt taattacaaa 600
<210> 8
<211> 1005
<212> DNA
<213> Saccharomyces cerevisiae
<400> 8
atggaagcta agattgacga attgatcaac aacgaccctg tctggtcctc tcaaaacgaa 60
tctttgatct ccaagccata caaccacatc ttgttgaagc caggtaagaa cttcagatta 120
aacttgattg ttcaaatcaa cagagttatg aacttgccaa aggaccaatt ggccattgtt 180
tcccaaattg tcgaattgtt gcacaactcc tctctattga tcgatgacat tgaagataat 240
gctccattaa gaagaggtca aaccacttct catttgattt tcggtgtccc atccaccatc 300
aacactgcta actacatgta cttcagagcc atgcaattgg tttctcaatt gaccaccaag 360
gaaccattat accacaactt gatcactatc tttaacgaag aattgattaa cttgcaccgt 420
ggtcaaggtt tggacatcta ctggagagat ttcttgccag aaattattcc aactcaagaa 480
atgtacttga acatggtcat gaacaagact ggtggtttat tcagattgac tttacgtttg 540
atggaagctt tgtctccatc ttcccaccac ggtcactctt tggttccatt catcaatcta 600
ttaggtatca tctaccaaat cagagatgat tacttgaact tgaaggactt ccaaatgtcc 660
tctgaaaagg gtttcgctga agatatcact gaaggtaaat tgtctttccc aattgtccac 720
gccttgaact ttaccaagac caagggtcaa actgaacaac acaacgaaat tttgagaatc 780
ttattgttga gaacttctga caaggacatc aagttgaaat tgatccaaat cttggaattc 840
gataccaact ctttggctta caccaagaac ttcatcaacc aattggttaa catgatcaag 900
aatgacaacg aaaacaaata cttgccagac ttggcttccc actccgatac cgctaccaac 960
ttgcacgacg aattgttgta cattattgac catttgtctg agtta 1005
<210> 9
<211> 301
<212> DNA
<213> Artificial sequence
<220>
<223> Sc Gmp1 terminator
<400> 9
agtctgaaga atgaatgatt tgatgatttc tttttccctc catttttctt actgaatata 60
tcaatgatat agacttgtat agtttattat ttcaaattaa gtagctatat atagtcaaga 120
taacgtttgt ttgacacgat tacattattc gtcgacatct tttttcagcc tgtcgtggta 180
gcaatttgag gagtattatt aattgaatag gttcattttg cgctcgcata aacagttttc 240
gtcagggaca gtatgttgga atgagtggta attaatggtg acatgacatg ttatagcaat 300
a 301
<210> 10
<211> 600
<212> DNA
<213> Artificial sequence
<220>
<223> Sc Pgk1 promoter
<400> 10
gggccagaaa aaggaagtgt ttccctcctt cttgaattga tgttaccctc ataaagcacg 60
tggcctctta tcgagaaaga aattaccgtc gctcgtgatt tgtttgcaaa aagaacaaaa 120
ctgaaaaaac ccagacacgc tcgacttcct gtcttcctat tgattgcagc ttccaatttc 180
gtcacacaac aaggtcctag cgacggctca caggttttgt aacaagcaat cgaaggttct 240
ggaatggcgg gaaagggttt agtaccacat gctatgatgc ccactgtgat ctccagagca 300
aagttcgttc gatcgtactg ttactctctc tctttcaaac agaattgtcc gaatcgtgtg 360
acaacaacag cctgttctca cacactcttt tcttctaacc aagggggtgg tttagtttag 420
tagaacctcg tgaaacttac atttacatat atataaactt gcataaattg gtcaatgcaa 480
gaaatacata tttggtcttt tctaattcgt agtttttcaa gttcttagat gctttctttt 540
tctctttttt acagatcatc aaggaagtaa ttatctactt tttacaacaa atataaaaca 600
<210> 11
<211> 1422
<212> DNA
<213> Artificial sequence
<220>
<223> UGT2_1a CpO for S. cerevisiae
<400> 11
atggctacat ctgattctat tgttgatgac aggaagcagt tgcatgtggc tactttccct 60
tggcttgctt tcggtcatat actgccttac ctacaactat caaaactgat agctgaaaaa 120
ggacataaag tgtcattcct ttcaacaact agaaacattc aaagattatc ttcccacata 180
tcaccattga ttaacgtcgt tcaattgaca cttccaagag tacaggaatt accagaagat 240
gctgaagcta caacagatgt gcatcctgaa gatatccctt acttgaaaaa ggcatccgat 300
ggattacagc ctgaggtcac tagattcctt gagcaacaca gtccagattg gatcatatac 360
gactacactc actattggtt gccttcaatt gcagcatcac taggcatttc tagggcacat 420
ttcagtgtaa ccacaccttg ggccattgct tacatgggtc catccgctga tgctatgatt 480
aacggcagtg atggtagaac taccgttgaa gatttgacaa ccccaccaaa gtggtttcca 540
tttccaacta aagtctgttg gagaaaacac gacttagcaa gactggttcc atacaaggca 600
ccaggaatct cagacggcta tagaatgggt ttagtcctta aagggtctga ctgcctattg 660
tctaagtgtt accatgagtt tgggacacaa tggctaccac ttttggaaac attacaccaa 720
gttcctgtcg taccagttgg tctattacct ccagaaatcc ctggtgatga gaaggacgag 780
acttgggttt caatcaaaaa gtggttagac gggaagcaaa aaggctcagt ggtatatgtg 840
gcactgggtt ccgaagtttt agtatctcaa acagaagttg tggaacttgc cttaggtttg 900
gaactatctg gattgccatt tgtctgggcc tacagaaaac caaaaggccc tgcaaagtcc 960
gattcagttg aattgccaga cggctttgtc gagagaacta gagatagagg gttggtatgg 1020
acttcatggg ctccacaatt gagaatcctg agtcacgaat ctgtgtgcgg tttcctaaca 1080
cattgtggtt ctggttctat agttgaagga ctgatgtttg gtcatccact tatcatgttg 1140
ccaatctttg gtgaccagcc tttgaatgca cgtctgttag aagataaaca agttggaatt 1200
gaaatcccac gtaatgagga agatggatgt ttaaccaagg agtctgtggc cagatcatta 1260
cgttccgttg tcgttgaaaa ggaaggcgaa atctacaagg ccaatgcccg tgaactttca 1320
aagatctaca atgacacaaa agtagagaag gaatatgttt ctcaatttgt agattaccta 1380
gagaaaaacg ctagagccgt agctattgat catgaatcct aa 1422
<210> 12
<211> 1001
<212> DNA
<213> Artificial sequence
<220>
<223> Kl prom 12 promoter
<400> 12
cgtaaaaact aaaacgagcc cccaccaaag aacaaaaaag aaggtgctgg gcccccactt 60
tcttcccttg cacgtgatag gaagatggct acagaaacaa gaagatggaa atcgaaggaa 120
agagggagac tggaagctgt aaaaactgaa atgaaaaaaa aaaaaaaaaa aaaaaaacaa 180
gaagctgaaa atggaagact gaaatttgaa aaatggtaaa aaaaaaaaag aaacacgaag 240
ctaaaaacct ggattccatt ttgagaagaa gcaagaaagg taagtatggt aacgaccgta 300
caggcaagcg cgaaggcaaa tggaaaagct ggagtccgga agataatcat ttcatcttct 360
tttgttagaa cagaacagtg gatgtccctc atctcggtaa cgtattgtcc atgccctaga 420
actctctgtc cctaaaaaga ggacaaaaac ccaatggttt ccccagcttc cagtggagcc 480
accgatccca ctggaaacca ctggacagga agagaaaatc acggacttcc tctattgaag 540
gataattcaa cactttcacc agatcccaaa tgtcccgccc ctattcccgt gttccatcac 600
gtaccataac ttaccatttc atcacgttct ctatggcaca ctggtactgc ttcgactgct 660
ttgcttcatc ttctctatgg gccaatgagc taatgagcac aatgtgctgc gaaataaagg 720
gatatctaat ttatattatt acattataat atgtactagt gtggttattg gtaattgtac 780
ttaattttga tatataaagg gtggatcttt ttcattttga atcagaattg gaattgcaac 840
ttgtctcttg tcactattac ttaatagtaa ttatatttct tattaacctt ttttttaagt 900
caaaacacca aggacaagaa ctactcttca aaggtatttc aagttatcat acgtgtcaca 960
cacgcttcac agtttcaagt aaaaaaaaag aatattacac a 1001
<210> 13
<211> 2229
<212> DNA
<213> Stevia rebaudiana
<400> 13
atgtgtaaag ctgtttccaa ggaatactct gacttgttgc aaaaggatga agcctccttc 60
accaaatggg atgatgacaa agttaaggac catttagaca ctaacaagaa cttgtaccca 120
aacgatgaaa tcaaggaatt cgtcgaatct gtcaaagcta tgttcggttc catgaatgat 180
ggtgaaatca acgtttccgc ttacgacacc gcttgggttg ctttggttca agacgttgat 240
ggttccggtt ctccacaatt cccatcttct ttggaatgga ttgccaacaa ccaattgtct 300
gatggttctt ggggtgacca tttgttattc tctgctcacg acagaattat taacacttta 360
gcttgtgtca ttgctttgac ttcctggaat gtccatccat ccaagtgtga aaagggtttg 420
aacttcttga gagaaaacat ctgtaagttg gaagatgaaa atgctgaaca catgccaatt 480
ggtttcgaag ttaccttccc atctttgatt gatatcgcca agaagttgaa catcgaagtc 540
ccagaagaca ccccagcttt gaaggaaatc tacgccagaa gagatatcaa gttgaccaaa 600
atcccaatgg aagttttgca caaggttcca accaccttgt tgcactcttt ggaaggtatg 660
ccagacttgg aatgggaaaa gttgttaaag ttgcaatgta aggacggttc tttcttgttc 720
tctccatctt ctaccgcctt tgctttgatg caaactaagg acgaaaagtg tctacaatac 780
ttaactaata tcgttaccaa attcaacggt ggtgtcccaa acgtttaccc tgttgacttg 840
tttgaacaca tctgggttgt tgacagattg caacgtttgg gtattgctcg ttatttcaag 900
tctgaaatca aggactgtgt tgaatacatc aacaagtact ggactaagaa cggtatctgt 960
tgggctcgta acacccacgt tcaagatatc gacgacactg ctatgggttt cagagtcttg 1020
agagctcatg gttacgatgt caccccagat gtcttcagac aattcgaaaa ggatggtaag 1080
ttcgtttgtt ttgccggtca atccactcaa gccgtcactg gtatgttcaa cgtctacaga 1140
gcttctcaaa tgttgttccc aggtgaaaga atcctagaag acgctaagaa gttctcctac 1200
aactacttga aagaaaagca atctactaac gaattgttgg acaaatggat cattgccaaa 1260
gacttaccag gtgaagtcgg ttacgctttg gatattccat ggtacgcttc tctaccaaga 1320
ttagaaacca gatactactt ggaacaatac ggtggtgaag acgatgtctg gatcggtaag 1380
accttgtaca gaatgggtta cgtttccaac aacacttact tggaaatggc caaattggac 1440
tacaacaact acgtcgccgt cttacaattg gaatggtaca ccattcaaca atggtacgtt 1500
gacattggta ttgaaaagtt tgaatccgac aacatcaagt ccgtcttggt ttcctactac 1560
ttggctgctg cttccatctt tgaaccagaa agatccaagg aaagaattgc ttgggctaag 1620
accaccatct tggttgacaa gatcacttct attttcgact cttcccaatc ttccaaggaa 1680
gatatcaccg ctttcattga caaattcaga aacaagtctt cttccaagaa gcactccatt 1740
aacggtgaac catggcacga agttatggtt gctttgaaga agactttgca cggttttgct 1800
ttggatgctt tgatgactca ctctcaagat attcaccctc aattacacca agcttgggaa 1860
atgtggttaa ccaagttgca agatggtgtc gatgtcactg ctgaattgat ggttcaaatg 1920
atcaacatga ctgccggtag atgggtttct aaggaattgt tgactcaccc tcaataccaa 1980
cgtttgtcca ccgtcaccaa ctctgtctgt cacgacatca ctaagttgca caacttcaaa 2040
gaaaactcca ctactgtcga ttctaaggtt caagaattgg ttcaattagt tttctctgac 2100
accccagatg acttggacca agacatgaag caaactttct tgactgtcat gaagaccttc 2160
tactacaagg cttggtgtga cccaaacacc atcaacgacc atatttctaa ggtcttcgaa 2220
attgttatc 2229
<210> 14
<211> 2271
<212> DNA
<213> Stevia rebaudiana
<400> 14
atgacttctc acggtggtca aaccaaccca accaacttga ttattgacac caccaaggaa 60
agaatccaaa agcaattcaa gaatgttgaa atctccgttt cctcctacga cactgcttgg 120
gttgccatgg ttccatctcc aaactcccca aagtctccat gtttcccaga atgtttgaac 180
tggttaatca acaaccaatt gaacgatggt tcctggggtt tagtcaatca cacccacaac 240
cacaatcacc cattgttgaa ggactctcta tcctccactt tggcttgtat cgttgctttg 300
aagagatgga acgttggtga agaccaaatc aacaagggtt tgtcctttat tgaatccaac 360
ttggcttctg ctactgaaaa gtcccaacca tctcctatcg gttttgacat cattttccca 420
ggtttattgg aatacgctaa gaacttggac atcaacttat tatctaagca aaccgatttc 480
tccttgatgt tgcacaagag agaattggaa caaaagagat gtcactccaa cgaaatggac 540
ggttacttgg cttacatttc tgaaggtttg ggtaacttgt acgactggaa catggtcaag 600
aaataccaaa tgaagaacgg ttccgttttc aactctccat ctgctaccgc tgctgctttc 660
atcaaccatc aaaacccagg ttgtttgaac tacttgaact ctttgttgga caaattcggt 720
aacgctgttc caactgtcta cccacacgat ttgtttatca gattatccat ggttgacacc 780
attgaacgtt tgggtatttc tcatcacttc agagtcgaaa tcaagaacgt tttggatgaa 840
acttacagat gttgggttga aagagatgaa caaatcttca tggatgtcgt cacttgtgcc 900
ttggccttca gattattgag aattaacggt tacgaagttt ctccagaccc attggctgaa 960
atcactaacg aattggcttt gaaggacgaa tacgccgctt tggaaactta ccatgcctct 1020
cacatcttat accaagaaga cttgtcctct ggtaagcaaa tcttgaagtc tgctgacttc 1080
ttgaaggaaa ttatctctac tgattctaac agattgtcca agttgattca caaggaagtt 1140
gaaaacgcct tgaaattccc aatcaacact ggtttggaaa gaattaacac cagaagaaac 1200
atccaattat acaacgttga caacactaga atcttgaaga ctacttatca ctcttccaac 1260
atctccaaca ctgactactt gagattggct gtcgaagatt tctacacctg tcaatctatt 1320
tacagagaag aattgaaggg tttggaaaga tgggttgtcg aaaacaaatt ggaccaattg 1380
aaatttgcta gacaaaagac cgcctactgt tacttctccg ttgctgccac tttgtcctct 1440
ccagaattat ctgacgccag aatctcctgg gctaagaatg gtatcttgac caccgttgtc 1500
gatgacttct tcgatattgg tggtaccatt gacgaattga ccaacttgat tcaatgtgtt 1560
gaaaagtgga acgtcgatgt cgataaggac tgttgttctg aacacgtcag aatcttattc 1620
ttggctttga aagatgctat ctgttggatc ggtgacgaag ctttcaaatg gcaagctcgt 1680
gacgttacct ctcacgtcat ccaaacctgg ttggaattga tgaactctat gttgagagaa 1740
gccatctgga cccgtgatgc ttacgtccca actttgaacg aatacatgga aaatgcttac 1800
gtttctttcg ctttgggtcc aattgtcaag cctgctattt acttcgttgg tccaaagttg 1860
tccgaagaaa ttgttgaatc ttctgaatac cacaacttgt tcaaattgat gtctactcaa 1920
ggtcgtttgt tgaacgatat ccactctttc aagcgtgaat tcaaggaagg taagttgaat 1980
gctgttgctt tgcatttgtc taacggtgaa tctggtaagg tcgaagaaga agttgtcgaa 2040
gaaatgatga tgatgatcaa gaacaagaga aaggaattga tgaagttgat ctttgaagaa 2100
aacggttcta ttgtcccaag agcttgtaag gatgctttct ggaacatgtg tcacgtcttg 2160
aacttcttct acgctaacga tgacggtttc actggtaaca ccatcttaga caccgtcaag 2220
gacatcattt acaacccatt agtcttggtt aacgaaaacg aagaacaaag a 2271
<210> 15
<211> 301
<212> DNA
<213> Artificial sequence
<220>
<223> Sc Tal1 terminator
<400> 15
aggaagtatc tcggaaatat taatttaggc catgtcctta tgcacgtttc ttttgatact 60
tacgggtaca tgtacacaag tatatctata tatataaatt aatgaaaatc ccctatttat 120
atatatgact ttaacgagac agaacagttt tttatttttt atcctatttg atgaatgata 180
cagtttctta ttcacgtgtt atacccacac caaatccaat agcaataccg gccatcacaa 240
tcactgtttc ggcagcccct aagatcagac aaaacatccg gaaccacctt aaatcaacgt 300
c 301
<210> 16
<211> 1539
<212> DNA
<213> Artificial sequence
<220>
<223> KO_2_ Lactuca_sativa_Sc_CpO
<400> 16
atggatggtg tcattgacat gcaaaccatt ccattgagaa ccgccattgc cattggtggt 60
actgctgttg ctttggttgt tgctctatac ttctggttct tgagatctta cgcttctcca 120
tctcaccact ctaaccattt gccacctgtt ccagaagttc caggtgtccc agtcttgggt 180
aacttgttgc aattgaaaga aaagaagcca tacatgactt tcaccaaatg ggctgaaatg 240
tacggtccaa tctactctat cagaactggt gctacctcca tggttgttgt ttcctctaac 300
gaaattgcca aggaagttgt tgtcactaga ttcccatcca tctccaccag aaagttgtct 360
tacgctttga aggtcttgac tgaagataag tccatggttg ctatgtctga ttaccatgac 420
taccacaaga ccgtcaaaag acacattttg actgctgtct taggtccaaa cgcccaaaag 480
aagttccgtg ctcacagaga caccatgatg gaaaacgttt ccaatgaatt gcatgccttc 540
tttgaaaaga acccaaacca agaagtcaac ttgagaaaga tcttccaatc tcaattgttc 600
ggtttggcca tgaagcaagc tttgggtaag gatgtcgaat ctatctacgt caaggacttg 660
gaaactacca tgaagagaga agaaatcttt gaagtcttgg ttgttgaccc aatgatgggt 720
gccattgaag tcgattggag agacttcttc ccatacttga aatgggttcc aaacaaatct 780
ttcgaaaaca tcattcacag aatgtacacc cgtcgtgaag ctgtcatgaa ggctttgatc 840
caagaacaca agaagagaat tgcttctggt gaaaacttaa actcctacat tgactacttg 900
ttgtctgaag ctcaaacttt gactgacaag caattgttga tgtccctatg ggaaccaatc 960
attgaatctt ccgacaccac catggtcacc actgaatggg ctatgtacga attggctaag 1020
aatccaaaca tgcaagacag attgtacgaa gaaatccaat ctgtttgtgg ttccgaaaag 1080
atcactgaag aaaacttgtc tcaattacca tacttgtacg ctgttttcca agaaactttg 1140
agaaagcact gtccagttcc aatcatgcca ttgagatacg tccacgaaaa caccgttttg 1200
ggtggttacc acgttccagc tggtactgaa gttgctatca acatctatgg ttgtaacatg 1260
gacaagaagg tctgggaaaa cccagaagaa tggaacccag aaagattctt atccgaaaag 1320
gaatccatgg acttgtacaa gaccatggcc ttcggtggtg gtaagagagt ttgtgctggt 1380
tctttgcaag ctatggtcat ctcttgtatc ggtattggta gattagtcca agattttgaa 1440
tggaaattga aagatgacgc tgaagaagat gtcaacactt taggtttaac cactcaaaag 1500
ttgcacccat tattggcttt gatcaaccct cgaaagtaa 1539
<210> 17
<211> 301
<212> DNA
<213> Artificial sequence
<220>
<223> Sc Tpi1 terminator
<400> 17
agattaatat aattatataa aaatattatc ttcttttctt tatatctagt gttatgtaaa 60
ataaattgat gactacggaa agctttttta tattgtttct ttttcattct gagccactta 120
aatttcgtga atgttcttgt aagggacggt agatttacaa gtgatacaac aaaaagcaag 180
gcgctttttc taataaaaag aagaaaagca tttaacaatt gaacacctct atatcaacga 240
agaatattac tttgtctcta aatccttgta aaatgtgtac gatctctata tgggttactc 300
a 301
<210> 18
<211> 403
<212> DNA
<213> Artificial sequence
<220>
<223> Ag lox_TEF1 promoter
<400> 18
taccgttcgt ataatgtatg ctatacgaag ttatgtcccc gccgggtcac ccggccagcg 60
acatggaggc ccagaatacc ctccttgaca gtcttgacgt gcgcagctca ggggcatgat 120
gtgactgtcg cccgtacatt tagcccatac atccccatgt ataatcattt gcatccatac 180
attttgatgg ccgcacggcg cgaagcaaaa attacggctc ctcgctgcag acctgcgagc 240
agggaaacgc tcccctcaca gacgcgttga attgtcccca cgccgcgccc ctgtagagaa 300
atataaaagg ttaggatttg ccactgaggt tcttctttca tatacttcct tttaaaatct 360
tgctaggata cagttctcac atcacatccg aacataaaca aca 403
<210> 19
<211> 810
<212> DNA
<213> Artificial sequence
<220>
<223> KANMX
<400> 19
atgggtaagg aaaagactca cgtttcgagg ccgcgattaa attccaacat ggatgctgat 60
ttatatgggt ataaatgggc tcgcgataat gtcgggcaat caggtgcgac aatctatcga 120
ttgtatggga agcccgatgc gccagagttg tttctgaaac atggcaaagg tagcgttgcc 180
aatgatgtta cagatgagat ggtcagacta aactggctga cggaatttat gcctcttccg 240
accatcaagc attttatccg tactcctgat gatgcatggt tactcaccac tgcgatcccc 300
ggcaaaacag cattccaggt attagaagaa tatcctgatt caggtgaaaa tattgttgat 360
gcgctggcag tgttcctgcg ccggttgcat tcgattcctg tttgtaattg tccttttaac 420
agcgatcgcg tatttcgttt ggctcaggcg caatcacgaa tgaataacgg tttggttgat 480
gcgagtgatt ttgatgacga gcgtaatggc tggcctgttg aacaagtctg gaaagaaatg 540
cataagcttt tgccattctc accggattca gtcgtcactc atggtgattt ctcacttgat 600
aaccttattt ttgacgaggg gaaattaata ggttgtattg atgttggacg agtcggaatc 660
gcagaccgat accaggatct tgccatccta tggaactgcc tcggtgagtt ttctccttca 720
ttacagaaac ggctttttca aaaatatggt attgataatc ctgatatgaa taaattgcag 780
tttcatttga tgctcgatga gtttttctaa 810
<210> 20
<211> 285
<212> DNA
<213> Artificial sequence
<220>
<223> Ag Tef1_lox terminator
<400> 20
atcagtactg acaataaaaa gattcttgtt ttcaagaact tgtcatttgt atagtttttt 60
tatattgtag ttgttctatt ttaatcaaat gttagcgtga tttatatttt ttttcgcctc 120
gacatcatct gcccagatgc gaagttaagt gcgcagaaag taatatcatg cgtcaatcgt 180
atgtgaatgc tggtcgctat actgctgtcg attcgatact aacgccgcca tccagtgtcg 240
aaaacgagct cataacttcg tataatgtat gctatacgaa cggta 285
<210> 21
<211> 1575
<212> DNA
<213> Arabidopsis thaliana
<400> 21
atggaatctt tagtcgttca caccgtcaat gccatctggt gtattgtcat tgttggtatt 60
ttctctgttg gttaccacgt ttacggtcgt gccgttgttg aacaatggag aatgagaaga 120
tctttgaaat tgcaaggtgt caagggtcca ccaccatcca ttttcaacgg taatgtctct 180
gaaatgcaaa gaatccaatc tgaagctaag cactgttccg gtgacaacat catttctcac 240
gattactcct cctctttgtt ccctcacttt gaccactgga gaaagcaata cggtagaatc 300
tacacctact ccactggttt gaaacaacat ttgtacatca accatccaga aatggtcaag 360
gaattatctc aaaccaacac tttgaactta ggtcgtatca ctcacatcac caagagattg 420
aacccaatct taggtaacgg tatcatcact tccaacggtc cacactgggc tcatcaaaga 480
agaattattg cttacgaatt cacccacgac aaaatcaagg gtatggtcgg tttgatggtc 540
gaatctgcca tgccaatgtt gaacaaatgg gaagaaatgg ttaagagagg tggtgaaatg 600
ggttgtgaca tccgtgttga cgaagatttg aaggatgttt ctgctgatgt cattgctaag 660
gcttgtttcg gttcctcttt ctccaagggt aaggctatct tctccatgat cagagacttg 720
ttgactgcca tcactaagag atctgttttg ttcagattca acggtttcac cgacatggtt 780
ttcggttcca agaagcatgg tgatgtcgat atcgatgctt tggaaatgga attggaatct 840
tctatctggg aaaccgttaa ggaaagagaa attgaatgta aggacactca caagaaggat 900
ttgatgcaat taatcttgga aggtgccatg agatcttgtg acggtaactt gtgggacaag 960
tctgcttaca gaagatttgt tgtcgacaac tgtaaatcca tctactttgc cggtcacgac 1020
tctactgctg tctccgtttc ctggtgtttg atgttgctag ctttgaaccc atcctggcaa 1080
gtcaagatca gagatgaaat cttatcttct tgtaagaacg gtattccaga tgctgaatcc 1140
attccaaact tgaagaccgt taccatggtc attcaagaaa ctatgagatt gtacccacca 1200
gctccaattg tcggtagaga agcttccaag gacatcagat taggtgactt ggttgttcca 1260
aagggtgttt gtatctggac tttgattcca gctttgcacc gtgacccaga aatctggggt 1320
ccagatgcta acgacttcaa gccagaaaga ttctctgaag gtatttccaa ggcttgtaaa 1380
tacccacaat cttacatccc attcggtttg ggtccaagaa cctgtgtcgg taagaacttc 1440
ggtatgatgg aagtcaaagt tttggtttct ttgattgttt ccaagttctc tttcaccttg 1500
tctccaactt accaacactc tccatctcac aagttgttgg ttgaacctca acacggtgtt 1560
gtcattagag tcgtt 1575
<210> 22
<211> 1000
<212> DNA
<213> Artificial sequence
<220>
<223> Kl prom 6 promoter
<400> 22
caaagggggg gcagggacag ggatacgaca agggctgggg aaaaaaaaaa agatagatac 60
gattggccgg gtaagcctgg ggaaatgtag caagtgcggg taagttaaaa ggtaaccacg 120
tgactccgga agagtcacgt ggttacggac ttttttctct agatctcagc tttttatcgg 180
tcttaccctg ccctcctgcc ccctgcccct tccctttgcc ccaaaaagaa aggaaatctg 240
ttggatttcg ctcaggccat ccctttcgtt aatatcggtt atcgctttac acactgcaca 300
tccttctgtc caaaaggaat ccagaagttt agcttttcct tcctttccca cagacattag 360
cctaggccct ctctcatcat ttgcatgcct cagccaatgt accaagaata acgcaacgag 420
gttgggaaat tttaacccaa caatcgatgc agatgtgaca agagattaga cacgttccag 480
ataccagatt acacagcttg tgctagcaga gtgacatatg gtggtgttgt gtctcgttta 540
gtacctgtaa tcgagagtgt tcaaatcagt cgatttgaac acccttactg ccactgaata 600
ttgattgaat accgtttatt gaaggtttta tgagtgatct tctttcggtc caggacaatt 660
tgttgagctt tttctatgta gagttccgtc cctttttttt ttttttttgc tttctcgcac 720
ttactagcac tatttttttt tcacacacta aaacacttta ttttaatcta tatatatata 780
tatatatata tgtaggaatg gaatcacaga catttgatac tcatcctcat ccttattaat 840
tcttgtttta atttgtttga cttagccaaa ccaccaatct caacccatcg tatttcaggt 900
attgtgtgtc tagtgtgtct ctggtatacg gaaataagtg ccagaagtaa ggaagaaaca 960
aagaacaagt gtctgaatac tactagcctc tcttttcata 1000
<210> 23
<211> 2133
<212> DNA
<213> Arabidopsis thaliana
<400> 23
atgtcctctt cttcttcttc ttctacttcc atgattgatt tgatggctgc catcatcaag 60
ggtgaaccag tcattgtctc tgacccagcc aacgcttctg cttacgaatc cgttgctgct 120
gaattgtcct ccatgttgat tgaaaacaga caattcgcta tgattgtcac tacttccatt 180
gctgtcttga ttggttgtat cgtcatgttg gtctggagaa gatccggttc cggtaactcc 240
aagagagttg aaccattgaa gccattagtc atcaagccaa gagaagaaga aattgatgac 300
ggtagaaaga aggtcaccat cttctttggt actcaaaccg gtactgctga aggttttgct 360
aaggctttgg gtgaagaagc caaagctaga tacgaaaaga ccagattcaa gatcgttgac 420
ttggacgact acgctgctga tgacgacgaa tacgaagaaa agttgaagaa ggaagatgtt 480
gccttcttct tcttggctac ttacggtgat ggtgaaccaa ctgacaatgc tgccagattc 540
tacaaatggt tcaccgaagg taacgacaga ggtgaatggt taaagaactt gaaatacggt 600
gttttcggtc taggtaacag acaatacgaa cacttcaaca aggttgccaa ggttgtcgat 660
gacatcttgg ttgaacaagg tgctcaaaga ttagtccaag tcggtttggg tgatgatgac 720
caatgtatcg aagatgactt cactgcttgg agagaagctt tgtggccaga attggacacc 780
atcttaagag aagaaggtga taccgctgtt gccaccccat acactgctgc tgttttggaa 840
tacagagttt ctatccacga ctctgaagat gccaagttca acgacatcaa catggctaac 900
ggtaacggtt acactgtttt cgacgctcaa cacccataca aggccaatgt tgctgtcaag 960
agagaattgc acactccaga atctgatcgt tcttgtatcc acttggaatt tgacattgct 1020
ggttctggtt tgacctacga aaccggtgac cacgtcggtg tcttatgtga caacttgtct 1080
gaaactgtcg atgaagcttt gagattattg gacatgtctc cagacactta tttctccttg 1140
catgctgaaa aggaagatgg tactccaatt tcttcttcct tgcctcctcc attcccacca 1200
tgtaacttga gaaccgcttt aaccagatac gcttgtttgc tatcctctcc aaagaagtcc 1260
gctttggttg ctttggctgc tcacgcttct gacccaactg aagctgaaag attgaaacat 1320
ttggcttccc cagctggtaa ggatgaatac tccaaatggg ttgttgaatc tcaaagatct 1380
ttgttggaag tcatggctga attcccatct gccaagccac cattgggtgt tttcttcgcc 1440
ggtgttgctc caagattgca accaagattt tactccatct cttcttctcc aaagattgct 1500
gaaaccagaa ttcacgttac ctgtgccttg gtctacgaaa agatgccaac cggtagaatt 1560
cacaagggtg tttgttccac ctggatgaag aacgctgttc catacgaaaa gtctgaaaac 1620
tgttcttctg ctccaatctt cgtccgtcaa tccaacttca agttgccatc tgactccaag 1680
gtcccaatca tcatgatcgg tccaggtact ggtttagctc cattcagagg tttcttgcaa 1740
gaaagattgg ccttagttga atctggtgtc gaattgggtc cttctgtttt gttcttcggt 1800
tgtagaaacc gtcgtatgga cttcatctac gaagaagaat tgcaaagatt tgtcgaatct 1860
ggtgctttgg ctgaattgtc cgttgctttc tctcgtgaag gtccaaccaa agaatacgtt 1920
caacacaaga tgatggacaa agcctccgac atctggaaca tgatctccca aggtgcttac 1980
ttgtacgttt gtggtgatgc taaaggtatg gccagagatg tccacagatc tttacatacc 2040
attgcccaag aacaaggttc catggactcc accaaggctg aaggtttcgt taagaacttg 2100
caaacttctg gtcgttactt gagagatgtt tgg 2133
<210> 24
<211> 301
<212> DNA
<213> Artificial sequence
<220>
<223> Sc Pdc1 terminator
<400> 24
agcgatttaa tctctaatta ttagttaaag ttttataagc atttttatgt aacgaaaaat 60
aaattggttc atattattac tgcactgtca cttaccatgg aaagaccaga caagaagttg 120
ccgacagtct gttgaattgg cctggttagg cttaagtctg ggtccgcttc tttacaaatt 180
tggagaattt ctcttaaacg atatgtatat tcttttcgtt ggaaaagatg tcttccaaaa 240
aaaaaaccga tgaattagtg gaaccaagga aaaaaaaaga ggtatccttg attaaggaac 300
a 301
<210> 25
<211> 1000
<212> DNA
<213> Artificial sequence
<220>
<223> Kl prom 3 promoter
<400> 25
gagcctgtcc aagcaaatgc cttctcataa atggtgccaa agacccgcaa gcccaaagca 60
attacccccc aaaaagaaat gatatagtgc aagatacgta tatgaccatg acttgactag 120
gtgaaacagt gcagaaacag ccgcacaaaa gcagccctaa ccctcagagt cgattttact 180
ctttcaggta ataaagcctc gacatcaatt ttagacagaa gccaggctgg cctcgagatt 240
atagccatag gcaagcaaga ggagagaagg ggaggccccc catggggggc ctcccccccg 300
ctgtcaaggt ttggcagaac ctagcttcat taggccacta gcccagccta aaacgtcaac 360
gggcaggagg aacactccca caagacggcg tagtattctc gattcataac cattttctca 420
atcgaattac acagaacaca ccgtacaaac ctctctatca taactactta atagtcacac 480
acgtactcgt ctaaatacac atcatcgtcc tacaagttca tcaaagtgtt ggacagacaa 540
ctataccagc atggatctct tgtatcggtt cttttctccc gctctctcgc aataacaatg 600
aacactgggt caatcatagc ctacacaggt gaacagagta gcgtttatac agggtttata 660
cggtgattcc tacggcaaaa atttttcatt tctaaaaaaa aaaagaaaaa tttttctttc 720
caacgctaga aggaaaagaa aaatctaatt aaattgattt ggtgattttc tgagagttcc 780
ctttttcata tatcgaattt tgaatataaa aggagatcga aaaaattttt ctattcaatc 840
tgttttctgg ttttatttga tagttttttt gtgtattatt attatggatt agtactggtt 900
tatatgggtt tttctgtata acttcttttt attttagttt gtttaatctt attttgagtt 960
acattatagt tccctaactg caagagaagt aacattaaaa 1000
<210> 26
<211> 1443
<212> DNA
<213> Stevia rebaudiana
<400> 26
atggacgcta tggccaccac tgaaaagaag cctcacgtta tctttattcc attcccagct 60
caatctcata tcaaggctat gttgaaattg gctcaattat tgcaccacaa gggtttgcaa 120
atcacttttg tcaacaccga cttcattcac aaccaattct tggaatcttc tggtcctcac 180
tgtttggacg gtgctccagg tttcagattc gaaaccattc cagatggtgt ttcccactct 240
ccagaagcct ccatcccaat cagagaatcc ttgttgagat ctattgaaac caacttcttg 300
gaccgtttca tcgatttggt taccaaattg ccagacccac caacctgtat catttctgac 360
ggtttcttgt ccgttttcac catcgatgct gccaagaaat tgggtattcc agtcatgatg 420
tactggactt tggctgcttg tggtttcatg ggtttctacc atattcactc tttgattgaa 480
aagggtttcg ctccattaaa ggatgcttct tacttgacca acggttactt ggacaccgtc 540
attgactggg ttccaggtat ggaaggtatc agattgaaag atttcccatt ggactggtct 600
actgacttga atgacaaggt cttgatgttc actactgaag ctccacaaag atctcataag 660
gtttctcacc acatcttcca cactttcgat gaattagaac catctatcat caagactcta 720
tccttgagat acaaccatat ctacaccatt ggtccattac aattgttgtt ggaccaaatc 780
ccagaagaaa agaagcaaac cggtatcact tctttgcacg gttactcttt agtcaaggaa 840
gaaccagaat gtttccaatg gttacaatcc aaggaaccaa actctgttgt ctacgttaac 900
tttggttcca ccactgttat gtccttggaa gatatgactg aatttggttg gggtttggct 960
aactctaacc actacttctt atggatcatc agatctaact tggtcattgg tgaaaacgcc 1020
gttttgcctc cagaattgga agaacacatc aagaagagag gtttcattgc ttcctggtgt 1080
tctcaagaaa aggtcttgaa gcacccatct gttggtggtt tcttgaccca ctgtggttgg 1140
ggttccacca ttgaatccct atctgctggt gttccaatga tctgttggcc atactcctgg 1200
gaccaattga ctaactgtcg ttacatctgt aaggaatggg aagttggttt ggaaatgggt 1260
actaaggtca agagagatga agtcaagaga ttagtccaag aattgatggg tgaaggtggt 1320
cacaagatga gaaacaaagc caaggactgg aaggaaaagg ccagaattgc tattgctcca 1380
aacggttctt cctccttgaa catcgataaa atggttaagg aaatcactgt cttggctcga 1440
aac 1443
<210> 27
<211> 301
<212> DNA
<213> Artificial sequence
<220>
<223> Sc TDH1 terminator
<400> 27
aataaagcaa tcttgatgag gataatgatt tttttttgaa tatacataaa tactaccgtt 60
tttctgctag attttgtgaa gacgtaaata agtacatatt actttttaag ccaagacaag 120
attaagcatt aactttaccc ttttctcttc taagtttcaa tactagttat cactgtttaa 180
aagttatggc gagaacgtcg gcggttaaaa tatattaccc tgaacgtggt gaattgaagt 240
tctaggatgg tttaaagatt tttccttttt gggaaataag taaacaatat attgctgcct 300
t 301
<210> 28
<211> 1000
<212> DNA
<213> Artificial sequence
<220>
<223> Kl prom 2 promoter
<400> 28
gagcctgtcc aagcaaatgc cttctcataa atggtgccaa agacccgcaa gcccaaagca 60
attacccccc aaaaagaaat gatatagtgc aagatacgta tatgaccatg acttgactag 120
gtgaaacagt gcagaaacag ccgcacaaaa gcagccctaa ccctcagagt cgattttact 180
ctttcaggta ataaagcctc gacatcaatt ttagacagaa gccaggctgg cctcgagatt 240
atagccatag gcaagcaaga ggagagaagg ggaggccccc catggggggc ctcccccccg 300
ctgtcaaggt ttggcagaac ctagcttcat taggccacta gcccagccta aaacgtcaac 360
gggcaggagg aacactccca caagacggcg tagtattctc gattcataac cattttctca 420
atcgaattac acagaacaca ccgtacaaac ctctctatca taactactta atagtcacac 480
acgtactcgt ctaaatacac atcatcgtcc tacaagttca tcaaagtgtt ggacagacaa 540
ctataccagc atggatctct tgtatcggtt cttttctccc gctctctcgc aataacaatg 600
aacactgggt caatcatagc ctacacaggt gaacagagta gcgtttatac agggtttata 660
cggtgattcc tacggcaaaa atttttcatt tctaaaaaaa aaaagaaaaa tttttctttc 720
caacgctaga aggaaaagaa aaatctaatt aaattgattt ggtgattttc tgagagttcc 780
ctttttcata tatcgaattt tgaatataaa aggagatcga aaaaattttt ctattcaatc 840
tgttttctgg ttttatttga tagttttttt gtgtattatt attatggatt agtactggtt 900
tatatgggtt tttctgtata acttcttttt attttagttt gtttaatctt attttgagtt 960
acattatagt tccctaactg caagagaagt aacattaaaa 1000
<210> 29
<211> 1380
<212> DNA
<213> Stevia rebaudiana
<400> 29
atggctgaac aacaaaagat caagaaatct ccacacgtct tgttgattcc attcccattg 60
caaggtcaca tcaacccatt catccaattc ggtaagagat tgatttccaa gggtgtcaag 120
accactttag tcaccactat tcacacttta aactccactt taaaccactc taacactact 180
accacctcta ttgaaatcca agccatttct gacggttgtg acgaaggtgg tttcatgtct 240
gctggtgaat cttacttgga aactttcaag caagtcggtt ccaagtcttt ggctgatttg 300
atcaagaaat tgcaatccga aggtactacc atcgatgcta tcatctacga ctccatgact 360
gaatgggttt tggatgttgc cattgaattt ggtattgacg gtggttcttt cttcacccaa 420
gcctgtgttg ttaactcttt gtactaccac gtccacaagg gtttgatctc tctaccatta 480
ggtgaaaccg tttccgtccc aggtttccca gtcttgcaaa gatgggaaac tccattgatc 540
ttacaaaacc atgaacaaat ccaatctcca tggtcccaaa tgttgtttgg tcaattcgct 600
aacattgacc aagctagatg ggttttcacc aactctttct acaagttgga agaagaagtc 660
attgaatgga ccagaaagat ctggaacttg aaggttatcg gtccaactct accatccatg 720
tacttggaca agagattgga tgacgacaag gacaacggtt tcaacttgta caaggctaac 780
catcacgaat gtatgaactg gttggatgac aagccaaagg aatctgttgt ttacgttgct 840
ttcggttctt tggtcaagca tggtccagaa caagttgaag aaatcaccag agctttgatt 900
gactccgatg ttaacttctt atgggttatc aagcacaagg aagaaggtaa attgccagaa 960
aacttgtctg aagttatcaa gaccggtaag ggtttgattg ttgcttggtg taagcaattg 1020
gatgttttgg ctcacgaatc cgtcggttgt ttcgtcactc actgtggttt caactctact 1080
ttggaagcta tctccttggg tgttccagtt gttgccatgc ctcaattctc tgaccaaacc 1140
accaacgcca aattgttgga tgaaatcttg ggtgtcggtg tccgtgtcaa ggctgatgaa 1200
aacggtattg ttagaagagg taacttagct tcctgtatca agatgatcat ggaagaagaa 1260
cgtggtgtca ttatcagaaa gaatgctgtc aaatggaagg acttggctaa ggttgctgtc 1320
cacgaaggtg gttcctctga caatgacatt gttgaatttg tctctgaatt gatcaaagcg 1380
<210> 30
<211> 1374
<212> DNA
<213> Stevia rebaudiana
<400> 30
atggaaaaca agactgaaac cactgttaga agaagaagaa gaatcatctt attcccagtt 60
ccattccaag gtcacattaa cccaatcttg caattggcta acgtcttata ctccaagggt 120
ttctccatca ccatcttcca caccaacttc aacaaaccta aaacttccaa ctacccacac 180
ttcaccttca gatttatctt ggacaacgac ccacaagatg aaagaatttc taacttgcca 240
acccatggtc cattggccgg tatgagaatt ccaatcatca acgaacacgg tgctgacgaa 300
ttgagaagag aattggaatt gttgatgttg gcttctgaag aagatgaaga agtctcttgt 360
ttgatcactg atgctttatg gtactttgct caatctgttg ctgactcttt gaacttgaga 420
agattagtct tgatgacctc ttctttgttc aacttccacg ctcacgtttc tctaccacaa 480
tttgatgaat tgggttactt ggacccagat gacaagacca gattggaaga acaagcctcc 540
ggtttcccaa tgttgaaggt caaggatatc aagtctgcct actccaactg gcaaatcttg 600
aaggaaattt tgggtaagat gatcaagcaa accaaggctt cttctggtgt catctggaac 660
tccttcaagg aattggaaga atctgaattg gaaaccgtca tcagagaaat tccagctcca 720
tctttcttga ttccattacc aaagcatttg actgcttcct cctcttctct attggaccac 780
gacagaactg ttttccaatg gttggaccaa caaccaccat cttccgtctt atacgtttcc 840
tttggttcca cttctgaagt tgacgaaaag gacttcttgg aaattgctcg tggtttggtt 900
gactccaagc aatctttctt atgggttgtc agaccaggtt tcgtcaaggg ttccacctgg 960
gttgaacctt tgccagacgg tttcttgggt gaaagaggta gaattgtcaa atgggttcca 1020
caacaagaag ttttggctca cggtgccatt ggtgctttct ggactcactc tggttggaac 1080
tctactttgg aatccgtttg tgaaggtgtt ccaatgattt tctctgactt cggtttggac 1140
caaccattga atgctcgtta catgtccgat gttttgaagg ttggtgtcta cttggaaaac 1200
ggttgggaac gtggtgaaat tgctaacgcc atcagaagag tcatggtcga tgaagaaggt 1260
gaatacatca gacaaaatgc tcgtgtcttg aaacaaaagg ctgatgtttc tttgatgaag 1320
ggtggttctt cttacgaatc tttggaatct ttggtttcct acatctccag tctc 1374
<210> 31
<211> 602
<212> DNA
<213> Artificial sequence
<220>
<223> Sc Eno1 terminator
<400> 31
aagcttttga ttaagccttc tagtccaaaa aacacgtttt tttgtcattt atttcatttt 60
cttagaatag tttagtttat tcattttata gtcacgaatg ttttatgatt ctatataggg 120
ttgcaaacaa gcatttttca ttttatgtta aaacaatttc aggtttacct tttattctgc 180
ttgtggtgac gcgtgtatcc gcccgctctt ttggtcaccc atgtatttaa ttgcataaat 240
aattcttaaa agtggagcta gtctatttct atttacatac ctctcatttc tcatttcctc 300
caagcttttg attaagcctt ctagtccaaa aaacacgttt ttttgtcatt tatttcattt 360
tcttagaata gtttagttta ttcattttat agtcacgaat gttttatgat tctatatagg 420
gttgcaaaca agcatttttc attttatgtt aaaacaattt caggtttacc ttttattctg 480
cttgtggtga cgcgtgtatc cgcccgctct tttggtcacc catgtattta attgcataaa 540
taattcttaa aagtggagct agtctatttc tatttacata cctctcattt ctcatttcct 600
cc 602
<210> 32
<211> 600
<212> DNA
<213> Artificial sequence
<220>
<223> Sc_TDH3.pro
<400> 32
ttagtcaaaa aattagcctt ttaattctgc tgtaacccgt acatgcccaa aatagggggc 60
gggttacaca gaatatataa catcgtaggt gtctgggtga acagtttatt cctggcatcc 120
actaaatata atggagcccg ctttttaagc tggcatccag aaaaaaaaag aatcccagca 180
ccaaaatatt gttttcttca ccaaccatca gttcataggt ccattctctt agcgcaacta 240
cagagaacag gggcacaaac aggcaaaaaa cgggcacaac ctcaatggag tgatgcaacc 300
tgcctggagt aaatgatgac acaaggcaat tgacccacgc atgtatctat ctcattttct 360
tacaccttct attaccttct gctctctctg atttggaaaa agctgaaaaa aaaggttgaa 420
accagttccc tgaaattatt cccctacttg actaataagt atataaagac ggtaggtatt 480
gattgtaatt ctgtaaatct atttcttaaa cttcttaaat tctactttta tagttagtct 540
tttttttagt tttaaaacac caagaactta gtttcgaata aacacacata aacaaacaaa 600
<210> 33
<211> 4248
<212> DNA
<213> Artificial sequence
<220>
<223> ALNQ_007_38000 CpO for S. cerevisiae
<400> 33
atgtctgctt tgaacaccga tgctttggaa tctcaaccag acttcaagtt ccaaagacaa 60
aagagattga tgtctccatt tatgtctaag aaggttccac caatcccaac caaagaagaa 120
agaaagccat acggtgaata ccacaccaac atcttattca gaattatgtt ctggtggttg 180
aaccctatct tgaacgtcgg ttacaagaga actttgactg aacaagactt gttctatttg 240
gacaactccc aaaccatgga cactttatac gaaactttca aatcccactt gaagaccact 300
atcgaaaagt ccatgaagaa gtacttgcaa gaaaaatact ctaaggaagg taagacctac 360
gacccatctt ccattccaac tgctgaagat ttgaaggact tccaaattcc aatctacgct 420
atcccattgt gtttattcaa gactttgtac tggcaatact ctttgggtaa tttgtacaag 480
gtcttgtctg actgtacttc tgctactacc ccattgttgc aaaagaagtt aatcaacttc 540
gttcaaatga agtctttcac cgctttgggt tctaccggta agggcgttgg ttacgccatc 600
ggtgtgtgtt tgatgatctt cttccaagcc attaccgtca accatgcttt ccacaacttg 660
caaatttgtg gtgccaaatc caaggctatt ttgactagaa tgttgttgga caagtctatg 720
tctgttgatg ctagaggtaa ccacttcttc ccagcctcca aggtccaatc tatgatctct 780
accgatttga acagagtcga tttggccatc ggtttcttcc cattcgcttt gacttgtgtt 840
tttccaattg ctatctgtat cggtttgtta atctggaacg ttggtgtctc cgccttggtt 900
ggtattgcca tcttcgttgc taacgttggt ttgttggctg tttccatccc aagattgatg 960
agattcagaa tcaaagctat ggtttttacc gacaagcgtg tcactttgat gaaggaattg 1020
ttgaagaact tcaagatgat caagttctac tcttgggaaa actcttacgc tagaagaatc 1080
caagatgctc gtttcaagga aatgaagttg atcttgtcat tacaatcttt aagaaacatt 1140
gtcatgtccg tttctttcgc catgccaact ttggcttcta tggctacttt ctgtaccgct 1200
ttcgatatca cttctggtaa gaacgctgct tccttgttct cctctttgtc tttattccaa 1260
gttttatcca tgcaattcat gttggctcca gttgccttaa acaccgctgc tgacatgatg 1320
gtttctatga agaaattcaa ccagttcttg gctcacgctg atttggatcc tgaacaatac 1380
agaatcgaag aattccacga tgataagttg gccgttaagg ttgacaacgc caccttcgaa 1440
tgggacacct tcgatgatga caaggtcgaa gacccagctt tagaatttga aaaacaagat 1500
aatgactcct tggaaaaagt ttcctcccac aacaccgttg actacgactc tactgaaaag 1560
atcagaaacg acacttcttc tatcgattcc accaagattt tggaaaagac tgctttccct 1620
ggtttgagaa acatcaactt ggaaatcaaa aagggtgaat tcgttgttgt taccggttcc 1680
attggtgctg gtaaatcctc tttgctacaa gctatctctg gtttgatgaa aagagtctcc 1740
ggtaaggttt acgtcgatgg tgacttgttg ttgtgtggtt acccttgggt tcaaaacgct 1800
actatcagag acaacatctt gttcggttta ccattcgacc aagaaaagta cgaccaagtt 1860
gtttacgctt gttctttgca atctgacttc aaccaattcc aaggtggtga catgactgaa 1920
gttggtgaaa gaggtattac cttgtctggt ggtcaaaagg ctagaattaa cttggccaga 1980
tccgtctacg ctgacaagga cattattttg ttggatgacg ttttgtctgc tgtcgatgct 2040
aaggttggta gacatattgt cgatacctgt ttgttgggtt tattgaagga caagacccgt 2100
atcatggcta cccaccaatt gtctttaatt gactctgctg acagaatgat tttcttgaac 2160
ggtgatggtt ctattgactg tggtactatt tccgaattaa aggaccgtaa cgaaaaattg 2220
aacgaattgt tgtctcacca aaaggacaag gccaacgact ctgatgaaga attggaattg 2280
caagaagaaa tcgaatctaa ggaacaacac ttgaaggaag atttgtctga agttaagcac 2340
gaaatcaagg aagaacaaaa gaagatggaa atctccggtg atgtcggtga agaattcgaa 2400
cacgctgacg aacacaagga aattgttaga attattggtg atgaggaaag agctgtcaac 2460
gctttgaagg ccgatgtcta catcaactac gctaaattgg ccttcggtaa gttgggtcta 2520
ttctccttga tgttgttcgt caccgttgct gctttgcaaa cttactgtaa catgttcact 2580
aacacctggt tatccttctg gattgaagaa aagttccatg gtagatccaa gtccttctac 2640
atgggtattt acatcatgtt cgctttcttg tacactttct tcctagctgc ctttttctac 2700
tctatgtgtt acttctgtaa cagagcttcc aagtatttga actacaaggc ctccgaaaag 2760
attttgcacg ttccaatgtc tttcatggac atttctccaa tcggtcgtgt tttgaataga 2820
ttcaccaagg acaccgatgt cttggacaac gaaattttgg accaattcag acaattcttg 2880
tccccattct gtaacgccat tggtactatc gtcttgtgca tcatctacat tccatggttc 2940
gctattgccg tcccattgat tgtcactttc tacgtcttgg tcgccaacta ctaccaagct 3000
tctgctcgtg aaatcaagag attggaagct gtcaagcgtt ctttggtctt tggtcacttc 3060
aacgaagctc tatctggtaa ggaaactatc aaggcttaca gagctatcga cagagtcaag 3120
caaagattga acaaattgat cgatgggcaa aacgaagctt actttttgac cattgttaac 3180
caaagatggt tgggtgccaa tttgtctatc ttgtctttct gtatggtttt catcatctct 3240
ttcttgtgtg tcttcagagt cttcaacatt tctgctgctt ccactggttt attattgact 3300
tacgttatca acttgaccaa taccatcact atgatgatga gagctatgac ccaagtcgaa 3360
aacgaattta actccgttga gagattgaac cactacgctt tcgacttagt ccaagaagct 3420
ccatacgaaa tcccagaaaa cgatccacca caagactggc caaagtacgg tgaaatcatt 3480
ttcaaggatg tttccatgag atacagacca gaattgccat tcgttttgaa gaacatcaac 3540
ctatccatcg gtaagggtga aaagattggt ttctgtggta gaaccggtgc cggtaagtct 3600
actttcatga cttgtttgta cagaatttct gagttcgaag gtaccatcgt tatcgatgac 3660
gtcgatatct ccaagttggg tttgcacaaa ttgcgttcta agttgactat tatcccacaa 3720
gacccagtct tattcgttgg ttccatcaga gaaaacttag acccatttgg tgaatactct 3780
gacgaagaat tatgggaagc tttgaccatc tccggtttga tcaacaaaga agacttgaac 3840
gaggttaaga agcaaaatga aaatgacgac aacttgaaca agttccactt gattagaatg 3900
gtcgaagatg atggtgttaa cttctccatc ggtgaacgtc aattgattgc tctagccaga 3960
gctttggtca gaaagactaa gattttgatc ttggacgaag ctacttcttc tgtcgattac 4020
gctactgact ccagaattca aaagaccatt gctactgaat tcgacgactg tatgatcttg 4080
tgtatcgctc acagattaaa caccatcttg aactacgaca agatcgtcgt catggacaaa 4140
ggtgaaatcg ttgaattcga taagccaaga tctttgttca tgagagaaga aggtgttttc 4200
agatccatgt gtgaacaagc taacatcacc attgaagatt ttccataa 4248
<210> 34
<211> 4248
<212> DNA
<213> Issatchenkia orientalis
<400> 34
atgtcggcgc ttaatacgga tgccttagag agtcagcctg acttcaagtt ccagagacaa 60
aagaggttga tgtctccatt tatgtcgaaa aaagtgcctc ctatacctac aaaggaagag 120
aggaaaccct atggggagta ccatacaaac atactatttc gtattatgtt ttggtggttg 180
aatcctattt tgaatgtcgg gtacaaaagg acattgactg aacaggattt attctatctt 240
gataatagcc agactatgga caccctctat gagaccttca aaagccatct aaagacgaca 300
attgagaaat caatgaaaaa ataccttcag gagaaataca gtaaagaggg gaagacatat 360
gacccaagta gtatacctac agctgaagac ttaaaagatt tccaaatacc catttatgca 420
atcccattgt gcttgttcaa aactctatac tggcagtata gtcttggtaa tctctacaaa 480
gtattatccg actgtacatc tgctacaaca cctttattgc agaagaaact cattaatttt 540
gttcagatga aatcctttac cgcattagga agtacgggga aaggtgtagg gtacgccatc 600
ggtgtatgct tgatgatctt cttccaagca ataactgtca atcatgcctt tcataatttg 660
caaatctgtg gtgccaaatc taaggcgatt cttacgagaa tgttattgga taaatcaatg 720
tcagtcgatg ccagaggtaa tcattttttt cctgctagta aagttcagag catgatatcc 780
acagatttga atagggtaga tttggctatt ggctttttcc catttgcact tacgtgtgta 840
tttccaattg ctatttgtat aggcttgctt atttggaacg ttggtgtgtc agcattagtg 900
ggaattgcca ttttcgttgc caatgtcggt ctcttagccg tttctatacc tagacttatg 960
cggttcagga taaaggccat ggtattcaca gacaagagag ttactttaat gaaagagctg 1020
ttaaaaaatt ttaaaatgat caagttctat agctgggaaa attcatacgc cagaaggatc 1080
caggatgcca gattcaagga gatgaaattg attttgtctt tacagtcttt aagaaatatt 1140
gtgatgtcag tttcatttgc tatgccgaca ttggcttcaa tggcaacatt ttgtactgcc 1200
tttgatatca caagtggtaa aaatgctgcc tctttattct cctctctttc tctcttccaa 1260
gttttatcaa tgcaattcat gttagcccca gttgccctta atactgctgc tgatatgatg 1320
gtgtcaatga aaaagttcaa tcaattttta gctcatgctg acttggatcc agagcagtat 1380
cgtatagaag aatttcacga cgataaattg gcggtgaaag ttgataatgc cacttttgaa 1440
tgggatacgt ttgacgatga taaagttgaa gatcctgctc ttgaatttga aaaacaggac 1500
aatgacagtc ttgaaaaagt ttccagtcat aatacggtcg attatgacag taccgaaaag 1560
attagaaatg atacaagctc gatagattct accaaaatct tggagaaaac agcatttcct 1620
ggcctaagaa acataaatct agagattaag aaaggcgaat ttgttgttgt tacaggtagt 1680
atcggtgctg gtaaatcatc ccttctccag gccatctcgg gattgatgaa aagagtatct 1740
ggtaaggttt atgttgatgg tgacttattg ctatgcggtt atccatgggt tcaaaatgct 1800
acgattcggg acaacatttt gtttggtttg ccatttgacc aagaaaagta cgaccaagtt 1860
gtttatgctt gttcattgca gagcgacttc aatcagttcc aaggtggtga catgaccgag 1920
gttggtgaac gaggtattac attatctggt ggtcaaaagg ctagaatcaa cttggcaaga 1980
tctgtatatg ctgacaagga tataatttta cttgatgatg ttttaagtgc tgttgatgcg 2040
aaggtgggtc gacatatcgt tgatacttgc cttcttggtt tgttaaagga taaaactaga 2100
attatggcaa ctcaccaact aagtttgatt gactctgcag atcgaatgat tttcctcaat 2160
ggggatggaa gtattgattg cggtaccatc tcagaattga aagacagaaa tgaaaaactg 2220
aacgaacttt tgtctcatca aaaggataag gcaaatgact ccgacgaaga gttagaattg 2280
caagaagaaa tcgagtcgaa agaacaacat ctcaaagaag atttatctga ggtgaaacat 2340
gaaatcaaag aagaacagaa gaagatggaa ataagcggtg atgtaggaga agagtttgaa 2400
catgcagatg aacataaaga gattgttagg attattggtg atgaagaaag agccgtgaat 2460
gccctgaagg cggatgttta tatcaattat gctaaacttg catttggtaa actcggattg 2520
ttttcactga tgttgtttgt cacagttgct gctttacaga cttactgcaa tatgtttacc 2580
aacacatggt tatctttttg gatagaagaa aaattccacg gcagatccaa aagtttttac 2640
atggggatct acattatgtt tgccttctta tacacatttt tccttgctgc atttttctat 2700
tcaatgtgct atttctgcaa tagggcttcc aagtatctta attataaagc ttcagaaaaa 2760
atcttgcatg ttccaatgtc cttcatggat atttctccaa ttggtcgagt tttgaataga 2820
tttacaaaag atactgatgt gttagataac gagatactag atcaatttag acagtttttg 2880
agtcccttct gcaatgctat cggtaccatt gttctatgta ttatttacat tccatggttt 2940
gcaattgctg ttcccttaat tgttacattt tatgttttgg ttgccaatta ctaccaagcc 3000
agcgctagag agatcaaaag gttagaagca gttaaaaggt cgttggtctt tggccatttc 3060
aatgaagcat tatccggaaa ggagacaatc aaagcttata gggcaatcga cagagtcaag 3120
caaaggttga acaaattgat tgatgggcag aacgaggctt attttctaac cattgttaac 3180
cagagatggt taggtgccaa tttatcgatc ttatcatttt gtatggtctt cattatctcg 3240
ttcttgtgtg ttttcagagt tttcaatatc agtgcagcgt cgactggttt acttttaacc 3300
tatgtcataa atttgacaaa taccattact atgatgatga gagctatgac gcaagttgaa 3360
aatgagttca attcagttga aagattaaac cattatgcct ttgatcttgt ccaggaggcc 3420
ccttatgaga ttcctgagaa tgatccaccc caggactggc ctaagtatgg tgaaattatt 3480
ttcaaagatg ttagtatgag atatagacca gaattaccat ttgttttgaa gaatatcaac 3540
ttaagtattg ggaaaggtga gaaaattgga ttttgtggaa gaaccggtgc tggtaagtct 3600
acgttcatga cttgcttgta caggatttcc gaatttgaag gaactattgt tattgatgat 3660
gttgatatca gtaaattggg tttacataaa ctaagatcca aattaactat tattccacaa 3720
gatccagtgt tatttgtcgg ttcgatccga gagaatctgg atccatttgg cgagtattct 3780
gatgaagaat tgtgggaggc acttacaatt tccggtttga tcaacaagga agatctaaac 3840
gaagtaaaaa aacagaacga aaatgatgat aacttaaaca aattccacct tatcagaatg 3900
gtggaggatg atggtgtgaa tttctctatt ggagagagac agttgattgc acttgccaga 3960
gctttggtta ggaaaaccaa aattctaatc ttagatgagg caacatcaag tgttgactat 4020
gccaccgatt caagaatcca aaagaccatt gccaccgaat tcgacgactg tatgatactg 4080
tgtattgctc acagattgaa tacgattcta aactacgata agattgtcgt tatggataag 4140
ggtgagattg ttgagtttga taaaccaaga tcattgttta tgagggagga aggggtcttt 4200
aggtctatgt gtgagcaggc aaatatcaca atcgaagatt tcccttaa 4248
<210> 35
<211> 1415
<212> PRT
<213> Issatchenkia orientalis
<400> 35
Met Ser Ala Leu Asn Thr Asp Ala Leu Glu Ser Gln Pro Asp Phe Lys
1 5 10 15
Phe Gln Arg Gln Lys Arg Leu Met Ser Pro Phe Met Ser Lys Lys Val
20 25 30
Pro Pro Ile Pro Thr Lys Glu Glu Arg Lys Pro Tyr Gly Glu Tyr His
35 40 45
Thr Asn Ile Leu Phe Arg Ile Met Phe Trp Trp Leu Asn Pro Ile Leu
50 55 60
Asn Val Gly Tyr Lys Arg Thr Leu Thr Glu Gln Asp Leu Phe Tyr Leu
65 70 75 80
Asp Asn Ser Gln Thr Met Asp Thr Leu Tyr Glu Thr Phe Lys Ser His
85 90 95
Leu Lys Thr Thr Ile Glu Lys Ser Met Lys Lys Tyr Leu Gln Glu Lys
100 105 110
Tyr Ser Lys Glu Gly Lys Thr Tyr Asp Pro Ser Ser Ile Pro Thr Ala
115 120 125
Glu Asp Leu Lys Asp Phe Gln Ile Pro Ile Tyr Ala Ile Pro Leu Cys
130 135 140
Leu Phe Lys Thr Leu Tyr Trp Gln Tyr Ser Leu Gly Asn Leu Tyr Lys
145 150 155 160
Val Leu Ser Asp Cys Thr Ser Ala Thr Thr Pro Leu Leu Gln Lys Lys
165 170 175
Leu Ile Asn Phe Val Gln Met Lys Ser Phe Thr Ala Leu Gly Ser Thr
180 185 190
Gly Lys Gly Val Gly Tyr Ala Ile Gly Val Cys Leu Met Ile Phe Phe
195 200 205
Gln Ala Ile Thr Val Asn His Ala Phe His Asn Leu Gln Ile Cys Gly
210 215 220
Ala Lys Ser Lys Ala Ile Leu Thr Arg Met Leu Leu Asp Lys Ser Met
225 230 235 240
Ser Val Asp Ala Arg Gly Asn His Phe Phe Pro Ala Ser Lys Val Gln
245 250 255
Ser Met Ile Ser Thr Asp Leu Asn Arg Val Asp Leu Ala Ile Gly Phe
260 265 270
Phe Pro Phe Ala Leu Thr Cys Val Phe Pro Ile Ala Ile Cys Ile Gly
275 280 285
Leu Leu Ile Trp Asn Val Gly Val Ser Ala Leu Val Gly Ile Ala Ile
290 295 300
Phe Val Ala Asn Val Gly Leu Leu Ala Val Ser Ile Pro Arg Leu Met
305 310 315 320
Arg Phe Arg Ile Lys Ala Met Val Phe Thr Asp Lys Arg Val Thr Leu
325 330 335
Met Lys Glu Leu Leu Lys Asn Phe Lys Met Ile Lys Phe Tyr Ser Trp
340 345 350
Glu Asn Ser Tyr Ala Arg Arg Ile Gln Asp Ala Arg Phe Lys Glu Met
355 360 365
Lys Leu Ile Leu Ser Leu Gln Ser Leu Arg Asn Ile Val Met Ser Val
370 375 380
Ser Phe Ala Met Pro Thr Leu Ala Ser Met Ala Thr Phe Cys Thr Ala
385 390 395 400
Phe Asp Ile Thr Ser Gly Lys Asn Ala Ala Ser Leu Phe Ser Ser Leu
405 410 415
Ser Leu Phe Gln Val Leu Ser Met Gln Phe Met Leu Ala Pro Val Ala
420 425 430
Leu Asn Thr Ala Ala Asp Met Met Val Ser Met Lys Lys Phe Asn Gln
435 440 445
Phe Leu Ala His Ala Asp Leu Asp Pro Glu Gln Tyr Arg Ile Glu Glu
450 455 460
Phe His Asp Asp Lys Leu Ala Val Lys Val Asp Asn Ala Thr Phe Glu
465 470 475 480
Trp Asp Thr Phe Asp Asp Asp Lys Val Glu Asp Pro Ala Leu Glu Phe
485 490 495
Glu Lys Gln Asp Asn Asp Ser Leu Glu Lys Val Ser Ser His Asn Thr
500 505 510
Val Asp Tyr Asp Ser Thr Glu Lys Ile Arg Asn Asp Thr Ser Ser Ile
515 520 525
Asp Ser Thr Lys Ile Leu Glu Lys Thr Ala Phe Pro Gly Leu Arg Asn
530 535 540
Ile Asn Leu Glu Ile Lys Lys Gly Glu Phe Val Val Val Thr Gly Ser
545 550 555 560
Ile Gly Ala Gly Lys Ser Ser Leu Leu Gln Ala Ile Ser Gly Leu Met
565 570 575
Lys Arg Val Ser Gly Lys Val Tyr Val Asp Gly Asp Leu Leu Leu Cys
580 585 590
Gly Tyr Pro Trp Val Gln Asn Ala Thr Ile Arg Asp Asn Ile Leu Phe
595 600 605
Gly Leu Pro Phe Asp Gln Glu Lys Tyr Asp Gln Val Val Tyr Ala Cys
610 615 620
Ser Leu Gln Ser Asp Phe Asn Gln Phe Gln Gly Gly Asp Met Thr Glu
625 630 635 640
Val Gly Glu Arg Gly Ile Thr Leu Ser Gly Gly Gln Lys Ala Arg Ile
645 650 655
Asn Leu Ala Arg Ser Val Tyr Ala Asp Lys Asp Ile Ile Leu Leu Asp
660 665 670
Asp Val Leu Ser Ala Val Asp Ala Lys Val Gly Arg His Ile Val Asp
675 680 685
Thr Cys Leu Leu Gly Leu Leu Lys Asp Lys Thr Arg Ile Met Ala Thr
690 695 700
His Gln Leu Ser Leu Ile Asp Ser Ala Asp Arg Met Ile Phe Leu Asn
705 710 715 720
Gly Asp Gly Ser Ile Asp Cys Gly Thr Ile Ser Glu Leu Lys Asp Arg
725 730 735
Asn Glu Lys Leu Asn Glu Leu Leu Ser His Gln Lys Asp Lys Ala Asn
740 745 750
Asp Ser Asp Glu Glu Leu Glu Leu Gln Glu Glu Ile Glu Ser Lys Glu
755 760 765
Gln His Leu Lys Glu Asp Leu Ser Glu Val Lys His Glu Ile Lys Glu
770 775 780
Glu Gln Lys Lys Met Glu Ile Ser Gly Asp Val Gly Glu Glu Phe Glu
785 790 795 800
His Ala Asp Glu His Lys Glu Ile Val Arg Ile Ile Gly Asp Glu Glu
805 810 815
Arg Ala Val Asn Ala Leu Lys Ala Asp Val Tyr Ile Asn Tyr Ala Lys
820 825 830
Leu Ala Phe Gly Lys Leu Gly Leu Phe Ser Leu Met Leu Phe Val Thr
835 840 845
Val Ala Ala Leu Gln Thr Tyr Cys Asn Met Phe Thr Asn Thr Trp Leu
850 855 860
Ser Phe Trp Ile Glu Glu Lys Phe His Gly Arg Ser Lys Ser Phe Tyr
865 870 875 880
Met Gly Ile Tyr Ile Met Phe Ala Phe Leu Tyr Thr Phe Phe Leu Ala
885 890 895
Ala Phe Phe Tyr Ser Met Cys Tyr Phe Cys Asn Arg Ala Ser Lys Tyr
900 905 910
Leu Asn Tyr Lys Ala Ser Glu Lys Ile Leu His Val Pro Met Ser Phe
915 920 925
Met Asp Ile Ser Pro Ile Gly Arg Val Leu Asn Arg Phe Thr Lys Asp
930 935 940
Thr Asp Val Leu Asp Asn Glu Ile Leu Asp Gln Phe Arg Gln Phe Leu
945 950 955 960
Ser Pro Phe Cys Asn Ala Ile Gly Thr Ile Val Leu Cys Ile Ile Tyr
965 970 975
Ile Pro Trp Phe Ala Ile Ala Val Pro Leu Ile Val Thr Phe Tyr Val
980 985 990
Leu Val Ala Asn Tyr Tyr Gln Ala Ser Ala Arg Glu Ile Lys Arg Leu
995 1000 1005
Glu Ala Val Lys Arg Ser Leu Val Phe Gly His Phe Asn Glu Ala
1010 1015 1020
Leu Ser Gly Lys Glu Thr Ile Lys Ala Tyr Arg Ala Ile Asp Arg
1025 1030 1035
Val Lys Gln Arg Leu Asn Lys Leu Ile Asp Gly Gln Asn Glu Ala
1040 1045 1050
Tyr Phe Leu Thr Ile Val Asn Gln Arg Trp Leu Gly Ala Asn Leu
1055 1060 1065
Ser Ile Leu Ser Phe Cys Met Val Phe Ile Ile Ser Phe Leu Cys
1070 1075 1080
Val Phe Arg Val Phe Asn Ile Ser Ala Ala Ser Thr Gly Leu Leu
1085 1090 1095
Leu Thr Tyr Val Ile Asn Leu Thr Asn Thr Ile Thr Met Met Met
1100 1105 1110
Arg Ala Met Thr Gln Val Glu Asn Glu Phe Asn Ser Val Glu Arg
1115 1120 1125
Leu Asn His Tyr Ala Phe Asp Leu Val Gln Glu Ala Pro Tyr Glu
1130 1135 1140
Ile Pro Glu Asn Asp Pro Pro Gln Asp Trp Pro Lys Tyr Gly Glu
1145 1150 1155
Ile Ile Phe Lys Asp Val Ser Met Arg Tyr Arg Pro Glu Leu Pro
1160 1165 1170
Phe Val Leu Lys Asn Ile Asn Leu Ser Ile Gly Lys Gly Glu Lys
1175 1180 1185
Ile Gly Phe Cys Gly Arg Thr Gly Ala Gly Lys Ser Thr Phe Met
1190 1195 1200
Thr Cys Leu Tyr Arg Ile Ser Glu Phe Glu Gly Thr Ile Val Ile
1205 1210 1215
Asp Asp Val Asp Ile Ser Lys Leu Gly Leu His Lys Leu Arg Ser
1220 1225 1230
Lys Leu Thr Ile Ile Pro Gln Asp Pro Val Leu Phe Val Gly Ser
1235 1240 1245
Ile Arg Glu Asn Leu Asp Pro Phe Gly Glu Tyr Ser Asp Glu Glu
1250 1255 1260
Leu Trp Glu Ala Leu Thr Ile Ser Gly Leu Ile Asn Lys Glu Asp
1265 1270 1275
Leu Asn Glu Val Lys Lys Gln Asn Glu Asn Asp Asp Asn Leu Asn
1280 1285 1290
Lys Phe His Leu Ile Arg Met Val Glu Asp Asp Gly Val Asn Phe
1295 1300 1305
Ser Ile Gly Glu Arg Gln Leu Ile Ala Leu Ala Arg Ala Leu Val
1310 1315 1320
Arg Lys Thr Lys Ile Leu Ile Leu Asp Glu Ala Thr Ser Ser Val
1325 1330 1335
Asp Tyr Ala Thr Asp Ser Arg Ile Gln Lys Thr Ile Ala Thr Glu
1340 1345 1350
Phe Asp Asp Cys Met Ile Leu Cys Ile Ala His Arg Leu Asn Thr
1355 1360 1365
Ile Leu Asn Tyr Asp Lys Ile Val Val Met Asp Lys Gly Glu Ile
1370 1375 1380
Val Glu Phe Asp Lys Pro Arg Ser Leu Phe Met Arg Glu Glu Gly
1385 1390 1395
Val Phe Arg Ser Met Cys Glu Gln Ala Asn Ile Thr Ile Glu Asp
1400 1405 1410
Phe Pro
1415
<210> 36
<211> 4134
<212> DNA
<213> Artificial sequence
<220>
<223> ALNQ_214_12000
<400> 36
atgaagtctg acaacattgc tatggaagac ttgccagact ccaaatactt gaaacaacgt 60
agattattga ccccattgat gtctaagaag gtcccaccaa ttccatctga agacgaaaga 120
aaggcttacg gtgaatacta caccaaccca gtctctcgta tgatgttctg gtggttgaac 180
ccaatcctaa aagtcggtta cagaagaact ttgactgaaa acgacttgtt ctacctagaa 240
gatagacaaa gaactgaaac tttgtacgaa attttcagag gttacctaga cgaagaaatc 300
gctagagctt ggaaaaagtc tcaagaatcc tctgacgacc caagagaatt caagttgcca 360
atttacatta ttccattgtg tttgttcaag accatgaaat gggaatactc cagaggtatc 420
ttgcaaaaga ttttgggtga ctgtgcttct gctaccaccc cattattgca gaaaaagctc 480
atcaactttg tgcaagttaa gactttctct aacgtcggta acaccggtca aggtgttggt 540
tacgctattg gtgtctgttt gatgatcttc ttccaagttc taatgttgac tcacgctttc 600
cacaacttcc aaatctccgg tgctaaggct aaggctgttt tgaccagatt gttgttggac 660
aagtctttga ctgtcgatgc tagaggtaac cactacttcc cagcctccaa gatccaatct 720
atgatttcca ctgacttgaa cagaattgac ttggctgttg gtttcgctcc agtcggtttt 780
gtcaccattt tcccaatcat tatctgtatt gctttgttga tttggaacgt cggtgtttct 840
gctttggttg gtattggtgt tttcattgct aacattttcg ttttgggttt gttcgtttct 900
tccttgatgt tgtacagaga aaaggccatg gttttcactg acaagagagt taacttggtt 960
aaggaattgt tgaagaactt caaaatgatc aaattctact cctgggaaaa ctcttaccaa 1020
gatcgtatcg aaaacgctag aaacaatgaa atgaagtaca tcttgagatt acaattgttg 1080
agaaacttcg tcttctcttt agctttcgcc atgccagttt tggcttccat ggctaccttc 1140
tgtactgctt tcaagatcac cgatggtaaa tccgctgcct ctgttttctc ctccttatct 1200
ttgttcgaag tcttgtcttt acaattcatc ttggctccat tttccttgaa ctctactgtc 1260
gacatgatgg tcagtgttaa gaagattaac caattcttgc aacacaagga cactaaccca 1320
aacgaatttt ctgtcgaaaa gttttctgac tccactttgg ctatcaaggt cgataatgct 1380
tctttcgaat gggacacctt tgaagatgaa gaaaaggact acgaagaaga agctaagact 1440
aaggacaaca tcgaagatga ggaccataac tgtgccactg aaaccattaa gggtaagatc 1500
actgtcgact acaagtctga ttctgattcc atctcttcta ccttgaccaa gggtgtcaag 1560
accgctttcc caggtttgaa caacattaac ctagaaatcg ccaagggtga attcatcgtt 1620
gtcaccggtg ccatcggttc tggtaagtct tctttgttgc aagccatctc tggtttaatg 1680
aagagaactt ctggtgaagt ctacgtcgat ggtgacttgt tgttgtgtgg ttatccatgg 1740
gttcaaaact ccactatcag agaaaacatc ttgttcggtt tgccattcaa caaggaaaga 1800
tacgaccaag ttgtttactc ctgttctttg caatctgatt ttgatcaatt ccaaggtggt 1860
gacatgaccg aagtcggtga aagaggtatc actttgtctg gtggtcaaaa agccagaatt 1920
aacttagcta gatctgtcta tgctgacaag gatatcatct tattggatga tgtcttgtct 1980
gctgttgacg ctaaagtcgg taagcacatc gtcaacacct gtattttggg tctattgggt 2040
ggtaagacca gaattatggc tactcaccaa ttgtctttga ttgattccgc tgatagaatg 2100
gttttcttga acggtgacgg taccattgac ttcggtacca tcccagaatt acgtaagaga 2160
aaccaaaagt tgattgaatt gttacaacac caacgtgacc ctggtcaaga taaagaagat 2220
ttgtctaacg acttggacat tcaaggttct actgatgaag gtcaacaaat cgaacacgct 2280
gatgaacata aggaaatcgt taaaattatc ggtgatgagg aaaaggccgt taatgctttg 2340
tctttccaag tttactacaa ctactgtaag ttggctttcg gtaaattggg ttacatttct 2400
atgttggttt tcattatcgt cagctctttg gaaactttca cccaaatctt caccaacact 2460
tggttgtctt tctggatcga agataagttc gtttccagat ctaagaactt ctacatgggt 2520
atctacatca tgtttgcttt cttatacgct atcatgttgt gtttcttttt gttcttgttg 2580
ggttacttct gtgttaaggc tgctgaaaga ttaaacatta aggcttctag aaagatcttg 2640
cacgttccaa tgtccttcat ggacatttct ccaatcggtc gtgtcttaaa cagattcacc 2700
aaggataccg atgtcttgga caacgaattg ttggaacaat tgatccaatt cttatctcca 2760
ttgttcaact gtttcggtat catcatcttg tgtattgttt acatcccatg gttcgctatc 2820
ggtgttccaa ttatcttggg tttctacttc atcatcgctt cttactacca agcctctgct 2880
agagaaatca agagattgga agctgtcaag agatcctttg ttttcggtca tttccacgaa 2940
gtccttactg gtaaggatac catcaaggct tacaacgcca ttgacagaat gaagttgaaa 3000
ctaaacaagt tgatcgacga acaaaacgaa gcttactact tgactattgc taaccaaaga 3060
tggttgggtg ctaacttggc tatcgtttct ttctctatgg ttttcgttat ttctttctta 3120
tgtatcttca gagttttcaa catctccgcc gcttccactg gtttgttgtt aacctacgtt 3180
atcgccttga ctgactctat caccatgatt atgagagcta tgacccaagt cgaaaacgaa 3240
ttcaactccg tcgaacgtgt caaccactac gcttttgact tgatccaaga agccccatac 3300
gaaatcccag aaaacgaccc agctgaagac tggccacaac acggtaagat cgaattcaag 3360
gacgtttcca tgagatacag acctgaattg ccattcgttt tgaagaacat taacttgtcc 3420
gtcagagaac aagagaaaat tggtttctgt ggtagaactg gtgccggtaa gtccactttc 3480
atgacctgtt tgtacagaat cactgaatac gaaggtttga tctccatcga cggtgtcgat 3540
atctctagat tgggtttgca cagattgaga tccaagttga ccattattcc tcaagaccca 3600
gttctattcg ttggtaccat tagagaaaac ttggacccat tcaccgaaca ctccgatgac 3660
gaattgtggg aagctttggc catttccggt ttgatcgaac gtgaagactt ggaagtcgtc 3720
aagggtcaag aaaagattgg tggtaacgat tccggtaagt tgcacaagtt ccacttggtt 3780
cgtatggttg aagacgatgg tatcaacttc tctttgggtg agagacaatt gattgctttg 3840
gctagagcct tggttagaaa gtccaagatc ttaatcttgg acgaagctac ttcttccgtc 3900
gactacgcta ctgattccaa gattcaaaga accattgcct ccgaattcag agactgtact 3960
attttgtgta tcgcccatag attgaacacc atcttaggtt acgacaagat cgtcgttatg 4020
gacaacggtg aaatcgttga atttgaaaac ccaaagttgt tgttcatgcg tgaaaactcc 4080
gttttcagat ccatgtgtga acaagctaac attaccatca atgactttga ataa 4134
<210> 37
<211> 4134
<212> DNA
<213> Issatchenkia orientalis
<400> 37
atgaagtcag ataacattgc aatggaggac ctacccgact ccaaatactt gaaacagaga 60
cgattattaa ctccgttgat gtcaaaaaaa gttccaccta ttccaagtga agatgagagg 120
aaggcatacg gggaatatta tacgaatccg gtatcacgga tgatgttttg gtggttaaat 180
cccattttga aggtgggata taggcgaaca ttgacggaga atgatctttt ctaccttgaa 240
gacagacaac gtacagagac attatatgaa atatttcgtg gttacttgga tgaggaaatt 300
gcacgtgcat ggaaaaaatc tcaagaaagc tcagatgatc caagagagtt caagcttccg 360
atctatatta tccctttatg tttatttaag acaatgaaat gggaatacag ccggggaatt 420
ctccagaaaa tcttgggtga ttgtgcttct gcaacgaccc cactattaca gaaaaaacta 480
atcaactttg tccaggtcaa gactttcagt aatgtcggaa atactggtca gggtgtagga 540
tatgctattg gcgtttgctt gatgattttc tttcaagttt taatgttaac tcatgcattt 600
cacaatttcc aaatttcggg tgcaaaggca aaagctgttt tgacaagatt gctcttggat 660
aaatcgttga ctgttgatgc cagaggcaac cattattttc cagcgagtaa gattcaaagc 720
atgatttcta ctgatttgaa tagaatagac cttgctgtcg gatttgcacc agtggggttt 780
gttactatat tccctattat tatctgcatt gccttattga tttggaatgt tggagtctcg 840
gcattggttg gtattggggt attcattgca aacatttttg tgttgggact ttttgtatca 900
agtctaatgt tatacaggga gaaggcgatg gtattcaccg acaaaagagt caatttggtt 960
aaggaactat tgaaaaattt taaaatgatt aagttctaca gttgggaaaa ctcttatcag 1020
gatagaattg aaaatgcaag gaacaacgaa atgaaatata ttttgaggtt acaattgcta 1080
agaaattttg tgttttcgtt agcttttgcg atgcctgttt tggcatcaat ggctacattt 1140
tgtacagcct ttaagataac tgacggcaaa agtgccgcat ctgtgttttc atctctctca 1200
ttgtttgaag ttttatcgct acaatttatt ttggcccctt tctcactaaa ttctactgtg 1260
gatatgatgg tttcagttaa aaagataaac cagtttctgc agcataaaga taccaatcca 1320
aatgagttca gcgttgaaaa gttcagtgat agtacattgg caatcaaggt cgataatgca 1380
tcatttgaat gggatacgtt tgaggatgaa gagaaagatt atgaagagga agctaaaact 1440
aaagacaaca ttgaagatga agatcataat tgtgctacgg aaacaatcaa gggaaaaata 1500
acagtggact ataagagcga cagtgactca atttctagta ctttaacgaa aggggttaaa 1560
actgcatttc ctggactaaa taatatcaat cttgaaattg caaaagggga attcattgtt 1620
gttactggtg caattggttc cggcaaatcc tctctacttc aggccatttc tgggctaatg 1680
aagagaacat caggggaagt gtatgttgat ggtgatttgt tgttatgtgg ttacccgtgg 1740
gtacaaaact caacaatacg agagaatata ctatttggat taccatttaa taaggagagg 1800
tatgaccaag tcgtgtattc atgctcgttg cagagtgatt ttgatcaatt tcaaggaggt 1860
gatatgacgg aagttggcga gagagggata accttatcag gaggccaaaa ggccagaatt 1920
aatttagctc ggagtgttta tgctgataag gatattattt tattagacga cgttctcagt 1980
gcggtcgacg ctaaagttgg caagcatatt gtgaatacat gcatcttagg attattggga 2040
ggtaaaacaa gaatcatggc tacccaccaa ctaagtttga tcgactctgc tgatcgtatg 2100
gtttttctca atggagatgg aactattgat tttggtacta ttcctgagct aagaaagaga 2160
aaccagaagc tgattgagtt actacaacat caaagggatc caggtcaaga taaagaggat 2220
ctctcaaatg atttggatat tcaaggaagc acagatgagg gtcagcaaat tgagcatgca 2280
gacgagcata aagagatagt caagattatt ggtgacgagg aaaaagcagt taatgcattg 2340
agtttccagg tttattataa ctattgtaag cttgcatttg gtaagcttgg atatatttcg 2400
atgttggtat tcattattgt ttctagtttg gagaccttca cccaaatatt caccaatact 2460
tggttgtcat tttggatcga ggataaattt gttagtagat ccaaaaattt ctatatggga 2520
atatacatca tgtttgcatt tttgtatgca ataatgctat gtttttttct ctttttactg 2580
ggatattttt gtgtaaaggc agcagagaga ctaaatatta aagcatccag gaagattcta 2640
catgttccaa tgtcttttat ggacatatca cctattggta gagtcttgaa tcggtttact 2700
aaagatacag atgtattaga caatgaattg ttagagcaat taattcaatt tttaagccca 2760
ctattcaact gttttggtat tatcatattg tgcattgttt atataccatg gtttgctatt 2820
ggtgtcccta taattcttgg attttatttt ataatagcca gttattatca ggccagtgca 2880
agagaaatca agagattaga ggctgtaaag aggtcgtttg tttttggcca ttttcacgaa 2940
gttctaacag ggaaagacac catcaaagca tataatgcta ttgatcggat gaaattgaag 3000
ctgaacaaat tgattgatga acagaatgaa gcttattatc taacaatcgc caatcagaga 3060
tggttaggag caaatttggc gattgtctca ttttcaatgg tttttgttat ttcgtttctg 3120
tgtatcttta gggttttcaa cataagtgca gcatccactg gtttgctttt gacctacgtc 3180
atagcactga cagattctat taccatgatt atgagagcaa tgactcaagt tgagaatgag 3240
ttcaactctg tggaacgggt caaccattat gcatttgatc ttatacaaga agcaccatat 3300
gaaataccgg agaatgatcc cgctgaggat tggccacaac atggcaaaat tgaattcaaa 3360
gatgtgagta tgagatatag accggaacta ccatttgttt tgaaaaatat caatttgagt 3420
gttagagaac aagaaaagat tggattttgt ggtagaacag gtgcaggtaa gtctacattt 3480
atgacatgtc tatataggat aacagaatac gaaggcctta tatcaatcga tggtgttgat 3540
attagccgat tagggttgca tagactacga tctaaattga ccattatacc gcaagacccg 3600
gtattatttg ttggtaccat tagggagaac ctcgatccat ttacagagca ttctgatgat 3660
gaattatggg aagcgcttgc gatatctgga ttgattgagc gggaagatct agaagtcgtc 3720
aagggacaag agaagatagg tgggaatgat agtgggaagt tacacaagtt ccacctagtt 3780
cgaatggttg aggatgatgg catcaatttt tcacttggtg agaggcagtt gattgcctta 3840
gccagggcat tagttaggaa aagcaagata ttgatattgg atgaggctac atcgagtgtt 3900
gactatgcta cagactctaa aatccagcga acgattgcta gtgagtttag ggattgtact 3960
atattatgta ttgctcatcg attgaacacc attttaggtt atgataaaat tgtcgttatg 4020
gacaatggtg agattgttga atttgagaat cccaaattgt tgtttatgag ggagaatagt 4080
gtatttcgat ccatgtgtga gcaggcaaac atcaccatca atgattttga ataa 4134
<210> 38
<211> 1377
<212> PRT
<213> Issatchenkia orientalis
<400> 38
Met Lys Ser Asp Asn Ile Ala Met Glu Asp Leu Pro Asp Ser Lys Tyr
1 5 10 15
Leu Lys Gln Arg Arg Leu Leu Thr Pro Leu Met Ser Lys Lys Val Pro
20 25 30
Pro Ile Pro Ser Glu Asp Glu Arg Lys Ala Tyr Gly Glu Tyr Tyr Thr
35 40 45
Asn Pro Val Ser Arg Met Met Phe Trp Trp Leu Asn Pro Ile Leu Lys
50 55 60
Val Gly Tyr Arg Arg Thr Leu Thr Glu Asn Asp Leu Phe Tyr Leu Glu
65 70 75 80
Asp Arg Gln Arg Thr Glu Thr Leu Tyr Glu Ile Phe Arg Gly Tyr Leu
85 90 95
Asp Glu Glu Ile Ala Arg Ala Trp Lys Lys Ser Gln Glu Ser Ser Asp
100 105 110
Asp Pro Arg Glu Phe Lys Leu Pro Ile Tyr Ile Ile Pro Leu Cys Leu
115 120 125
Phe Lys Thr Met Lys Trp Glu Tyr Ser Arg Gly Ile Leu Gln Lys Ile
130 135 140
Leu Gly Asp Cys Ala Ser Ala Thr Thr Pro Leu Leu Gln Lys Lys Leu
145 150 155 160
Ile Asn Phe Val Gln Val Lys Thr Phe Ser Asn Val Gly Asn Thr Gly
165 170 175
Gln Gly Val Gly Tyr Ala Ile Gly Val Cys Leu Met Ile Phe Phe Gln
180 185 190
Val Leu Met Leu Thr His Ala Phe His Asn Phe Gln Ile Ser Gly Ala
195 200 205
Lys Ala Lys Ala Val Leu Thr Arg Leu Leu Leu Asp Lys Ser Leu Thr
210 215 220
Val Asp Ala Arg Gly Asn His Tyr Phe Pro Ala Ser Lys Ile Gln Ser
225 230 235 240
Met Ile Ser Thr Asp Leu Asn Arg Ile Asp Leu Ala Val Gly Phe Ala
245 250 255
Pro Val Gly Phe Val Thr Ile Phe Pro Ile Ile Ile Cys Ile Ala Leu
260 265 270
Leu Ile Trp Asn Val Gly Val Ser Ala Leu Val Gly Ile Gly Val Phe
275 280 285
Ile Ala Asn Ile Phe Val Leu Gly Leu Phe Val Ser Ser Leu Met Leu
290 295 300
Tyr Arg Glu Lys Ala Met Val Phe Thr Asp Lys Arg Val Asn Leu Val
305 310 315 320
Lys Glu Leu Leu Lys Asn Phe Lys Met Ile Lys Phe Tyr Ser Trp Glu
325 330 335
Asn Ser Tyr Gln Asp Arg Ile Glu Asn Ala Arg Asn Asn Glu Met Lys
340 345 350
Tyr Ile Leu Arg Leu Gln Leu Leu Arg Asn Phe Val Phe Ser Leu Ala
355 360 365
Phe Ala Met Pro Val Leu Ala Ser Met Ala Thr Phe Cys Thr Ala Phe
370 375 380
Lys Ile Thr Asp Gly Lys Ser Ala Ala Ser Val Phe Ser Ser Leu Ser
385 390 395 400
Leu Phe Glu Val Leu Ser Leu Gln Phe Ile Leu Ala Pro Phe Ser Leu
405 410 415
Asn Ser Thr Val Asp Met Met Val Ser Val Lys Lys Ile Asn Gln Phe
420 425 430
Leu Gln His Lys Asp Thr Asn Pro Asn Glu Phe Ser Val Glu Lys Phe
435 440 445
Ser Asp Ser Thr Leu Ala Ile Lys Val Asp Asn Ala Ser Phe Glu Trp
450 455 460
Asp Thr Phe Glu Asp Glu Glu Lys Asp Tyr Glu Glu Glu Ala Lys Thr
465 470 475 480
Lys Asp Asn Ile Glu Asp Glu Asp His Asn Cys Ala Thr Glu Thr Ile
485 490 495
Lys Gly Lys Ile Thr Val Asp Tyr Lys Ser Asp Ser Asp Ser Ile Ser
500 505 510
Ser Thr Leu Thr Lys Gly Val Lys Thr Ala Phe Pro Gly Leu Asn Asn
515 520 525
Ile Asn Leu Glu Ile Ala Lys Gly Glu Phe Ile Val Val Thr Gly Ala
530 535 540
Ile Gly Ser Gly Lys Ser Ser Leu Leu Gln Ala Ile Ser Gly Leu Met
545 550 555 560
Lys Arg Thr Ser Gly Glu Val Tyr Val Asp Gly Asp Leu Leu Leu Cys
565 570 575
Gly Tyr Pro Trp Val Gln Asn Ser Thr Ile Arg Glu Asn Ile Leu Phe
580 585 590
Gly Leu Pro Phe Asn Lys Glu Arg Tyr Asp Gln Val Val Tyr Ser Cys
595 600 605
Ser Leu Gln Ser Asp Phe Asp Gln Phe Gln Gly Gly Asp Met Thr Glu
610 615 620
Val Gly Glu Arg Gly Ile Thr Leu Ser Gly Gly Gln Lys Ala Arg Ile
625 630 635 640
Asn Leu Ala Arg Ser Val Tyr Ala Asp Lys Asp Ile Ile Leu Leu Asp
645 650 655
Asp Val Leu Ser Ala Val Asp Ala Lys Val Gly Lys His Ile Val Asn
660 665 670
Thr Cys Ile Leu Gly Leu Leu Gly Gly Lys Thr Arg Ile Met Ala Thr
675 680 685
His Gln Leu Ser Leu Ile Asp Ser Ala Asp Arg Met Val Phe Leu Asn
690 695 700
Gly Asp Gly Thr Ile Asp Phe Gly Thr Ile Pro Glu Leu Arg Lys Arg
705 710 715 720
Asn Gln Lys Leu Ile Glu Leu Leu Gln His Gln Arg Asp Pro Gly Gln
725 730 735
Asp Lys Glu Asp Leu Ser Asn Asp Leu Asp Ile Gln Gly Ser Thr Asp
740 745 750
Glu Gly Gln Gln Ile Glu His Ala Asp Glu His Lys Glu Ile Val Lys
755 760 765
Ile Ile Gly Asp Glu Glu Lys Ala Val Asn Ala Leu Ser Phe Gln Val
770 775 780
Tyr Tyr Asn Tyr Cys Lys Leu Ala Phe Gly Lys Leu Gly Tyr Ile Ser
785 790 795 800
Met Leu Val Phe Ile Ile Val Ser Ser Leu Glu Thr Phe Thr Gln Ile
805 810 815
Phe Thr Asn Thr Trp Leu Ser Phe Trp Ile Glu Asp Lys Phe Val Ser
820 825 830
Arg Ser Lys Asn Phe Tyr Met Gly Ile Tyr Ile Met Phe Ala Phe Leu
835 840 845
Tyr Ala Ile Met Leu Cys Phe Phe Leu Phe Leu Leu Gly Tyr Phe Cys
850 855 860
Val Lys Ala Ala Glu Arg Leu Asn Ile Lys Ala Ser Arg Lys Ile Leu
865 870 875 880
His Val Pro Met Ser Phe Met Asp Ile Ser Pro Ile Gly Arg Val Leu
885 890 895
Asn Arg Phe Thr Lys Asp Thr Asp Val Leu Asp Asn Glu Leu Leu Glu
900 905 910
Gln Leu Ile Gln Phe Leu Ser Pro Leu Phe Asn Cys Phe Gly Ile Ile
915 920 925
Ile Leu Cys Ile Val Tyr Ile Pro Trp Phe Ala Ile Gly Val Pro Ile
930 935 940
Ile Leu Gly Phe Tyr Phe Ile Ile Ala Ser Tyr Tyr Gln Ala Ser Ala
945 950 955 960
Arg Glu Ile Lys Arg Leu Glu Ala Val Lys Arg Ser Phe Val Phe Gly
965 970 975
His Phe His Glu Val Leu Thr Gly Lys Asp Thr Ile Lys Ala Tyr Asn
980 985 990
Ala Ile Asp Arg Met Lys Leu Lys Leu Asn Lys Leu Ile Asp Glu Gln
995 1000 1005
Asn Glu Ala Tyr Tyr Leu Thr Ile Ala Asn Gln Arg Trp Leu Gly
1010 1015 1020
Ala Asn Leu Ala Ile Val Ser Phe Ser Met Val Phe Val Ile Ser
1025 1030 1035
Phe Leu Cys Ile Phe Arg Val Phe Asn Ile Ser Ala Ala Ser Thr
1040 1045 1050
Gly Leu Leu Leu Thr Tyr Val Ile Ala Leu Thr Asp Ser Ile Thr
1055 1060 1065
Met Ile Met Arg Ala Met Thr Gln Val Glu Asn Glu Phe Asn Ser
1070 1075 1080
Val Glu Arg Val Asn His Tyr Ala Phe Asp Leu Ile Gln Glu Ala
1085 1090 1095
Pro Tyr Glu Ile Pro Glu Asn Asp Pro Ala Glu Asp Trp Pro Gln
1100 1105 1110
His Gly Lys Ile Glu Phe Lys Asp Val Ser Met Arg Tyr Arg Pro
1115 1120 1125
Glu Leu Pro Phe Val Leu Lys Asn Ile Asn Leu Ser Val Arg Glu
1130 1135 1140
Gln Glu Lys Ile Gly Phe Cys Gly Arg Thr Gly Ala Gly Lys Ser
1145 1150 1155
Thr Phe Met Thr Cys Leu Tyr Arg Ile Thr Glu Tyr Glu Gly Leu
1160 1165 1170
Ile Ser Ile Asp Gly Val Asp Ile Ser Arg Leu Gly Leu His Arg
1175 1180 1185
Leu Arg Ser Lys Leu Thr Ile Ile Pro Gln Asp Pro Val Leu Phe
1190 1195 1200
Val Gly Thr Ile Arg Glu Asn Leu Asp Pro Phe Thr Glu His Ser
1205 1210 1215
Asp Asp Glu Leu Trp Glu Ala Leu Ala Ile Ser Gly Leu Ile Glu
1220 1225 1230
Arg Glu Asp Leu Glu Val Val Lys Gly Gln Glu Lys Ile Gly Gly
1235 1240 1245
Asn Asp Ser Gly Lys Leu His Lys Phe His Leu Val Arg Met Val
1250 1255 1260
Glu Asp Asp Gly Ile Asn Phe Ser Leu Gly Glu Arg Gln Leu Ile
1265 1270 1275
Ala Leu Ala Arg Ala Leu Val Arg Lys Ser Lys Ile Leu Ile Leu
1280 1285 1290
Asp Glu Ala Thr Ser Ser Val Asp Tyr Ala Thr Asp Ser Lys Ile
1295 1300 1305
Gln Arg Thr Ile Ala Ser Glu Phe Arg Asp Cys Thr Ile Leu Cys
1310 1315 1320
Ile Ala His Arg Leu Asn Thr Ile Leu Gly Tyr Asp Lys Ile Val
1325 1330 1335
Val Met Asp Asn Gly Glu Ile Val Glu Phe Glu Asn Pro Lys Leu
1340 1345 1350
Leu Phe Met Arg Glu Asn Ser Val Phe Arg Ser Met Cys Glu Gln
1355 1360 1365
Ala Asn Ile Thr Ile Asn Asp Phe Glu
1370 1375
Claims (12)
1.一种能够产生甜菊醇糖苷的重组宿主,所述重组宿主过表达介导甜菊醇糖苷转运的多肽,并且所述多肽的氨基酸序列如SEQ ID NO: 35或SEQ ID NO: 38所示或为与二者之任一具有至少99%序列同一性且来源于Issatchenkiaorientalis的氨基酸序列。
2.一种能够产生甜菊醇糖苷的重组宿主,所述重组宿主已被修饰,以导致介导甜菊醇糖苷转运的多肽的产生缺陷,并且所述多肽的氨基酸序列如SEQ ID NO: 35或SEQ ID NO:38所示或为与二者之任一具有至少99%序列同一性且来源于Issatchenkiaorientalis的氨基酸序列。
3.根据权利要求1所述的重组宿主,所述重组宿主具有编码多肽的重组核酸,所述多肽的氨基酸序列如SEQ ID NO: 35或SEQ ID NO: 38所示或为与二者之任一具有至少99%序列同一性且来源于Issatchenkiaorientalis的氨基酸序列。
4.根据权利要求1-3中任一项所述的重组宿主,其包含一种或更多种编码以下多肽的重组核苷酸序列:
具有对映-柯巴基焦磷酸合酶活性的多肽;
具有对映-贝壳杉烯合酶活性的多肽;
具有对映-贝壳杉烯氧化酶活性的多肽;以及
具有贝壳杉烯酸13-羟化酶活性的多肽。
5.根据权利要求1-3中任一项所述的重组宿主,其包含编码具有NADPH-细胞色素p450还原酶活性的多肽的重组核酸序列。
6.根据权利要求1-3中任一项所述的重组宿主,其包含编码以下项中的一种或更多种的重组核酸序列:
(i)具有UGT74G1活性的多肽;
(ii)具有UGT2活性的多肽;
(iii)具有UGT85C2活性的多肽;和
(iv)具有UGT76G1活性的多肽。
7.根据权利要求1-3中任一项所述的重组宿主,其中所述宿主属于Saccharomyces、 Aspergillus、Pichia、Kluyveromyces、Candida、Hansenula、Humicola、Issatchenkia、 Trichosporon、Brettanomyces、Pachysolen、Yarrowia、Yamadazyma或Escherichia属中的一种。
8.根据权利要求7所述的重组宿主,其中所述重组宿主是Saccharomyces cerevisiae细胞、Yarrowia lipolitica细胞、Candida krusei细胞、Issatchenkia orientalis细胞或Escherichia coli细胞。
9.根据权利要求1-3中任一项所述的重组宿主,其中所述宿主产生香叶基香叶基二磷酸(GGPP)的能力被上调。
10.根据权利要求1-3中任一项所述的重组宿主,其包含编码以下项中的一种或更多种的核酸序列:
具有羟甲基戊二酰基-辅酶A还原酶活性的多肽;或者
具有法尼基-焦磷酸合成酶活性的多肽。
11.一种制备甜菊醇糖苷的方法,所述方法包括在合适的发酵培养基中发酵根据权利要求1-10中任一项所述的重组宿主,以及任选地回收所述甜菊醇糖苷。
12.根据权利要求11所述的制备甜菊醇糖苷的方法,其中所述方法以工业规模进行。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201562204704P | 2015-08-13 | 2015-08-13 | |
US62/204,704 | 2015-08-13 | ||
PCT/EP2016/069357 WO2017025649A1 (en) | 2015-08-13 | 2016-08-15 | Steviol glycoside transport |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107922913A CN107922913A (zh) | 2018-04-17 |
CN107922913B true CN107922913B (zh) | 2022-04-05 |
Family
ID=56800277
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201680047069.7A Active CN107922913B (zh) | 2015-08-13 | 2016-08-15 | 甜菊醇糖苷转运 |
Country Status (5)
Country | Link |
---|---|
US (2) | US20180230505A1 (zh) |
EP (1) | EP3334819A1 (zh) |
CN (1) | CN107922913B (zh) |
CA (1) | CA2993744A1 (zh) |
WO (1) | WO2017025649A1 (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2014273055A1 (en) * | 2013-05-31 | 2015-12-17 | Dsm Ip Assets B.V. | Microorganisms for diterpene production |
ES2906310T3 (es) | 2016-08-12 | 2022-04-18 | Amyris Inc | Glicosiltransferasa dependiente de UDP para la producción de alta eficiencia de rebaudiósidos |
WO2018114995A1 (en) * | 2016-12-22 | 2018-06-28 | Dsm Ip Assets B.V. | Fermentation process for producing steviol glycosides |
WO2019211230A1 (en) | 2018-04-30 | 2019-11-07 | Dsm Ip Assets B.V. | Steviol glycoside transport |
US20210246156A1 (en) * | 2018-06-08 | 2021-08-12 | Purecircle Usa, Inc. | High-purity steviol glycosides |
SG11202107656TA (en) * | 2019-01-24 | 2021-08-30 | Amyris Inc | Abc transporters for the high efficiency production of rebaudiosides |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014122328A1 (en) * | 2013-02-11 | 2014-08-14 | Evolva Sa | Efficient production of steviol glycosides in recombinant hosts |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1990014423A1 (en) | 1989-05-18 | 1990-11-29 | The Infergene Company | Microorganism transformation |
JP3273609B2 (ja) | 1989-07-07 | 2002-04-08 | ユニリーバー・ナームローゼ・ベンノートシヤープ | 発現ベクターのマルチコピー組込みにより形質転換した真菌による蛋白質の製法 |
ES2198410T3 (es) | 1993-07-23 | 2004-02-01 | Dsm Ip Assets B.V. | Cepas recombinantes de hongos filamentosos libres de gen marcador de seleccion: un metodo para obtener dichas cepas y su utilizacion. |
US6265186B1 (en) | 1997-04-11 | 2001-07-24 | Dsm N.V. | Yeast cells comprising at least two copies of a desired gene integrated into the chromosomal genome at more than one non-ribosomal RNA encoding domain, particularly with Kluyveromyces |
PL336345A1 (en) | 1997-04-11 | 2000-06-19 | Dsm Nv | Genic conversion as a tool for constructing recombined filiform fungi |
ID27054A (id) | 1998-05-19 | 2001-02-22 | Dsm Nv | Perbaikan produksi sepalosporin di dalam organisme yang hidup |
EP1141372A2 (en) | 1998-12-22 | 2001-10-10 | Dsm N.V. | Improved in vivo production of cephalosporins |
DE60325457D1 (de) | 2002-01-23 | 2009-02-05 | Royal Nedalco B V | Fermentation von pentosezuckern |
SE0202090D0 (sv) | 2002-05-08 | 2002-07-04 | Forskarpatent I Syd Ab | A modifierd yeast consuming L-arabinose |
EP1626979B1 (en) | 2003-05-02 | 2012-06-06 | Cargill, Incorporated | Genetically modified yeast species and fermentation processes using genetically modified yeast |
CN101052706B (zh) | 2004-07-16 | 2015-02-18 | 帝斯曼知识产权资产管理有限公司 | 发酵木糖的真核细胞的代谢工程 |
EP1863901A1 (en) | 2005-03-11 | 2007-12-12 | Forskarpatent i Syd AB | Arabinose- and xylose-fermenting saccharomyces cerevisiae strains |
US20140303036A1 (en) | 2011-11-23 | 2014-10-09 | Dsm Ip Assets B.V. | Nucleic Acid Assembly System |
EP3444338A1 (en) | 2012-01-23 | 2019-02-20 | DSM IP Assets B.V. | Diterpene production |
WO2013135728A1 (en) | 2012-03-12 | 2013-09-19 | Dsm Ip Assets B.V. | Recombination system |
WO2013144257A1 (en) | 2012-03-27 | 2013-10-03 | Dsm Ip Assets B.V. | Cloning method |
EP3021689B1 (en) | 2013-07-15 | 2021-03-24 | DSM IP Assets B.V. | Diterpene production |
-
2016
- 2016-08-15 US US15/751,526 patent/US20180230505A1/en not_active Abandoned
- 2016-08-15 CA CA2993744A patent/CA2993744A1/en not_active Abandoned
- 2016-08-15 EP EP16756990.4A patent/EP3334819A1/en not_active Withdrawn
- 2016-08-15 CN CN201680047069.7A patent/CN107922913B/zh active Active
- 2016-08-15 WO PCT/EP2016/069357 patent/WO2017025649A1/en active Application Filing
-
2020
- 2020-04-10 US US16/845,736 patent/US11293043B2/en active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014122328A1 (en) * | 2013-02-11 | 2014-08-14 | Evolva Sa | Efficient production of steviol glycosides in recombinant hosts |
Non-Patent Citations (3)
Title |
---|
GenBank登录号:KGK36146.1;NCBI;《NCBI GenBank》;20141007;第1-925位 * |
GenBank登录号:KGK36149.1;NCBI;《NCBI GenBank》;20141007;第1-931位 * |
GenBank登录号:KGK39403.1;NCBI;《NCBI GenBank》;20141007;第1-1415位 * |
Also Published As
Publication number | Publication date |
---|---|
US20180230505A1 (en) | 2018-08-16 |
CA2993744A1 (en) | 2017-02-16 |
CN107922913A (zh) | 2018-04-17 |
WO2017025649A1 (en) | 2017-02-16 |
US20200283816A1 (en) | 2020-09-10 |
US11293043B2 (en) | 2022-04-05 |
EP3334819A1 (en) | 2018-06-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11725223B2 (en) | Microorganisms for diterpene production | |
AU2013211605B2 (en) | Diterpene production | |
AU2014292150B2 (en) | Diterpene production | |
CN107567492B (zh) | Udp-糖基转移酶 | |
US10273519B2 (en) | Diterpene production in Yarrowia | |
CN107922913B (zh) | 甜菊醇糖苷转运 | |
US20160102331A1 (en) | Extracellular diterpene production | |
CN107922465B (zh) | 甜菊醇糖苷转运 | |
CN108138152B (zh) | 贝壳杉烯酸羟化酶 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |