CN113906045A - 贝壳杉烯酸13-羟化酶(kah)变体及其用途 - Google Patents

贝壳杉烯酸13-羟化酶(kah)变体及其用途 Download PDF

Info

Publication number
CN113906045A
CN113906045A CN202080040694.5A CN202080040694A CN113906045A CN 113906045 A CN113906045 A CN 113906045A CN 202080040694 A CN202080040694 A CN 202080040694A CN 113906045 A CN113906045 A CN 113906045A
Authority
CN
China
Prior art keywords
host cell
amino acid
cell
steviol glycosides
kah
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080040694.5A
Other languages
English (en)
Inventor
A·P·克莱因
S·伦德
G·维克曼
I·科里亚基纳
K·霍根
S·博里索瓦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Amyris Inc
Original Assignee
Amyris Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Amyris Inc filed Critical Amyris Inc
Publication of CN113906045A publication Critical patent/CN113906045A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0071Oxidoreductases (1.) acting on paired donors with incorporation of molecular oxygen (1.14)
    • C12N9/0073Oxidoreductases (1.) acting on paired donors with incorporation of molecular oxygen (1.14) with NADH or NADPH as one donor, and incorporation of one atom of oxygen 1.14.13
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • C12N15/81Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/44Preparation of O-glycosides, e.g. glucosides
    • C12P19/56Preparation of O-glycosides, e.g. glucosides having an oxygen atom of the saccharide radical directly bound to a condensed ring system having three or more carbocyclic rings, e.g. daunomycin, adriamycin

Abstract

本文提供了用于甜菊醇糖苷的改良生产的经遗传修饰的宿主细胞、组合物和方法。所述宿主细胞被遗传修饰成含有表达新型的优化的Ro.KAH变体的异源核酸。所述宿主细胞进一步含有一种或多种异源核苷酸序列,所述异源核苷酸序列编码进一步的能够在所述宿主细胞中产生一种或多种甜菊醇糖苷的途径的酶。本文所述的宿主细胞、组合物和方法提供了用于异源生产包括莱鲍迪苷A、莱鲍迪苷D和莱鲍迪苷M在内的甜菊醇糖苷的有效途径。

Description

贝壳杉烯酸13-羟化酶(KAH)变体及其用途
序列表
本申请含有序列表,该序列表已以ASCII格式通过电子方式提交并通过引用的方式整体并入本文。所述ASCII副本创建于2020年4月30日,名称为51494-009WO2_Sequence_Listing_4_30_20_ST25,大小为100,106字节。
技术领域
本公开涉及贝壳杉烯酸13-羟化酶(KAH)变体、包含该变体的宿主细胞以及它们用于生产异源分子的方法。
背景技术
需要源自天然来源的低热量甜味剂,以限制高糖摄入对健康的影响。甜菊植物(甜叶菊(Stevia rebaudiana Bertoni))产生多种称为甜菊醇糖苷的甜味糖基化二萜。在所有已知的甜菊醇糖苷中,Reb M具有最高的效力(比蔗糖甜约300倍),并且具有最吸引人的风味特征。然而,甜菊植物仅会少量生产Reb M,并且产生的Reb M仅占总甜菊醇糖苷含量的一小部分(<1.0%),因此从甜菊叶中分离Reb M是不切实际的。需要获取Reb M的替代方法。一种此类途径是应用合成生物学来设计从可持续原料来源生产大量Reb M的微生物(例如酵母)。
为了使用合成生物学经济地生产产品,从原料到产品的生物转化中每一步都需要具有高转化效率(理想情况下>90%)。在我们对酵母进行工程化以生产Reb M时,我们注意到当使用野生型酶时,特定的酶促步骤在酵母中表现不佳。为了改善微生物中Reb M的生产率和产量,我们试图生产比野生型酶表现更好的变体酶。一种此类酶是贝壳杉烯酸13-羟化酶(KAH),其催化对映贝壳杉烯酸(ent-kaurenoic acid)转化为甜菊醇。
发明内容
本文提供了用于贝壳杉烯酸向甜菊醇的改良转化的组合物和方法。这些组合物和方法部分地基于某些能够将贝壳杉烯酸高效转化为甜菊醇的变体贝壳杉烯酸羟化酶(KAH)的产生。
在一个方面,本发明提供了宿主细胞,该宿主细胞具有与SEQ ID NO:1的序列具有至少90%序列同一性的贝壳杉烯酸羟化酶多肽。
在一个方面,本发明总体上提供了具有SEQ ID NO:1的氨基酸序列的变体贝壳杉烯酸羟化酶多肽,其中该序列进一步含有一个或多个氨基酸取代。
在另一个方面,本发明提供了编码具有SEQ ID NO:1的氨基酸序列的变体贝壳杉烯酸羟化酶多肽的核酸,其中所述序列进一步含有一个或更多个氨基酸取代。在另一个方面,本发明提供了编码本文所述的任何一种变异多肽的核酸。
在又一个方面,本发明提供了含有具有SEQ ID NO:1的氨基酸序列的变体贝壳杉烯酸羟化酶多肽的宿主细胞,其中所述序列进一步含有一个或更多个氨基酸取代。在另一个方面,本发明提供了包含本文所述的任何一种多肽或核酸的宿主细胞。
在另一个方面,本发明提供了含有编码具有SEQ ID NO:1的氨基酸序列的变体贝壳杉烯酸羟化酶多肽的核酸的宿主细胞,其中所述序列进一步含有一个或更多个氨基酸取代。
在一个实施方案中,本发明提供了一个或多个氨基酸取代,所述氨基酸取代选自K69R、V343G、T403V、H491P、P72D、L64D、Q84C、L64G、E206D、Y238C、A210G、L64N、I237C、L11V、N207F、M73G、W8G、E60R、Y55S、N475G、D292P、P161C、K267D、L485F、A396F、R507A、P72T、I132G、N61P、K119V、T220E、P72G、Q513R、S133G、Y506V、K69P、E60G、K224C、M73H、H379G、P72C、K314P、W202A、G466F、N49A、S339G、N160D、T216G、D102Y、F246G、M58P、T220R、R458D、M58G、A68I、S70P、F88V、T240D、L205I、K167G、L232M、S62R、G56D、Q244G、A242D、N49R、Q513G、W29T、L303D、T378D、I508L、W202Q、S505R、R233C、I104D、M258G、K69G、F88D、F88S、A217V、E230C、R507G、G466S、G56S、E230G、Y55G、A503C、S460I、I129R、S245G、F246S、Q84L、S133R、T509V、R507E、R233T、V30F、A68G、G56N、T162G、A68P、S165D、K119Y、W29C、S165P、W29V、I284G、A217L、Q335V、L65S、F53R、Y55P、W202V、K224V、W29A、H164G、Q244D、K291C、L65G、K167S、C327I、K291S、D57G、K167H、N160T、W202C、A242G、F88R、I104N、G466D、N475D、K119S、T123D、T216A、S339A、P161D、I104R、L54G、M171F、L232Y、D293C、V340A、T162A、A297V、I104H、F332L、A236R、K224I、S452D、I104A、V340S、F229Y、A297Y和A297F。在另一个实施方案中,所述一个或多个氨基酸取代选自N146W、A297Y、A236S、V9S、G466F、T283D、T142G、T425V、L459C、T283A、T283G、S460V、S133G、I129V、W52G、S505I、I243T、V340S、S460C、S452D、L118I、S505V、T123D、W52C、S460I、S457G、W52R、W52N、N146T、G466A和W52T。在特定的实施方案中,所述一个或多个氨基酸取代选自A297V、I104H、F332L、A236R、K224I、S452D、I104A、I104A、V340S、F229Y、A297Y和A297F。在优选的实施方案中,所述一个或多个氨基酸取代选自S452D、I104A、V340S、F229Y、A297Y和A297F。在进一步的实施方案中,变异多肽的N末端信号序列被另一种p450多肽的信号序列取代。在一些实施方案中,所述N末端信号序列对应于SEQ ID NO:1的氨基酸1-25。在一些实施方案中,所述的另一种p450多肽的信号序列具有SEQ ID NO:22的氨基酸序列。在一些实施方案中,变异多肽包括氨基酸取代A297Y,并且可能还包括一个或多个额外的氨基酸取代。在一些实施方案中,变异多肽包括包含N146T/A297Y的氨基酸取代,并且可能还包括一个或多个额外的氨基酸取代。在一些实施方案中,变异多肽具有选自N146T/A297Y/G466A、W52T/N146T/A297Y、T142G/N146T/A297Y/G466A、W52T/T142G/N146T/A297Y和W52T/T142G/N146T/A297Y/G466A的氨基酸取代。在优选的实施方案中,变异多肽具有SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20和SEQID NO:21的氨基酸序列。在一些实施方案中,变异多肽具有选自W52T/T142G/G466A、A145G/N14F/A297Y、N146W/A297Y/S460I、W52N/N146W/A297Y、F332L/S452D、N146W/A297Y和Q84R/N146T/A297Y的氨基酸取代。
在本发明的实施方案中,宿主细胞能够产生一种或多种甜菊醇糖苷。在另一个实施方案中,所述一种或多种甜菊醇糖苷选自RebA、RebB、RebD、RebE和RebM。在优选的实施方案中,所述一种或多种甜菊醇糖苷是RebM。
在一个实施方案中,本发明的宿主细胞含有一种或多种编码用于制备甜菊醇糖苷的途径的一种或多种酶的核酸。在另一个实施方案中,所述宿主细胞含有编码香叶基香叶基二磷酸酯合酶的核酸。在又一个实施方案中,所述宿主细胞含有编码柯巴基(copalyl)二磷酸酯合酶的核酸。在另一个实施方案中,所述宿主细胞含有编码对映贝壳杉烯合酶的核酸。在又一个实施方案中,所述宿主细胞含有编码贝壳杉烯氧化酶的核酸。在另一个实施方案中,所述宿主细胞含有编码细胞色素P450还原酶的核酸。在又一个实施方案中,所述宿主细胞含有编码一种或多种尿苷5’-二磷酸酯依赖性糖基转移酶的核酸。在优选的实施方案中,宿主细胞含有一种或多种编码香叶基香叶基二磷酸酯合酶、柯巴基二磷酸酯合酶、对映贝壳杉烯合酶、贝壳杉烯氧化酶、细胞色素P450还原酶、UGT40087、UGT74G1、UGT76G1、UGT85C2、EUGT11和UGT91D的核酸。
在一个实施例中,所述宿主细胞可以是细菌细胞、酵母细胞、藻类细胞、昆虫细胞或植物细胞。在特定的实施方案中,所述宿主细胞是酵母细胞。在优选的实施方案中,所述宿主细胞是酿酒酵母(Saccharomyces cerevisiae)。
在又一个方面,本发明提供了生产一种或多种甜菊醇糖苷的方法,其包括以下步骤:a)在适合于制备一种或多种甜菊醇糖苷的条件下,在具有碳源的培养基中培养本发明的宿主细胞的群体以产生培养肉汤;以及b)从培养肉汤中回收一种或多种甜菊醇糖苷。在优选的实施方案中,所述方法涉及RebM的回收。
在进一步的实施方案中,本发明提供了发酵组合物,其含有包含编码本发明的变体贝壳杉烯酸羟化酶的核酸的宿主细胞,以及一种或多种由宿主细胞产生的甜菊醇糖苷。在优选的实施方案中,发酵组合物含有RebM。
在一个实施例中,贝壳杉烯酸羟化酶多肽具有与SEQ ID NO:1的序列至少90%(例如,至少91%、92%、93%、94%、95%、96%、97%、98%或99%)同一的氨基酸序列。在优选的实施方案中,本发明的宿主细胞具有贝壳杉烯酸羟化酶多肽,其具有SEQ ID NO:1的氨基酸序列。在一些实施方案中,本发明的宿主细胞具有贝壳杉烯酸羟化酶多肽,其具有贝壳杉烯酸羟化酶多肽的氨基酸序列,所述贝壳杉烯酸羟化酶多肽的氨基酸序列包含选自SEQ IDNO:1、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20和SEQ ID NO:21的氨基序列。
在一个方面,本发明提供了含有通过本发明的方法或由本发明的宿主细胞产生的RebM的组合物和食物。在另一个方面,本发明提供了含有无任何其他植物来源材料的甜菊醇糖苷(例如,RebA、RebB、RebD、RebE或RebM)的组合物。在一些实施方案中,甜菊醇糖苷是RebM。
附图说明
图1是示出从原生酵母代谢物法尼基焦磷酸酯(FPP)到莱鲍迪苷M(Reb M)的酶促途径的示意图。
图2是用于将KAH基因插入到Reb M菌株中的着陆垫DNA构建体的示意图。着陆垫由构建体任一端上位于所选择的酵母基因座上游和下游的基因组区域的500bp基因座靶向DNA序列组成。该基因座被选择为使得着陆垫的插入不会删除任何基因。在内部,着陆垫含有GAL启动子,其后面是F-CphI核酸内切酶的识别位点和酵母终止子。核酸内切酶F-CphI切割识别序列,在着陆垫处创建双链断裂,从而促进该位点处Ro.KAH DNA变体的同源重组。
图3是全细胞肉汤中总甜菊醇糖苷(以μM测量)与Rs.KAH对照的比值的图表。使具有不同过表达的KAH基因的酵母菌株在微量滴定板中生长。还示出了不含任何KAH的亲本菌株的数据。深色垂直线代表平均值的95%置信区间(N=8)。
图4是含有位点饱和诱变文库中生成的Ro.KAH突变体的产Reb M酵母全细胞肉汤中的总甜菊醇糖苷(以μM测量)与含野生型Ro.KAH的酵母的比值的图表。使具有不同过表达的KAH基因的酵母菌株在微量滴定板中生长。还示出了不含任何KAH的亲本菌株和含有野生型Ro.KAH和Sr.KAH的酵母菌株的数据。
图5是含组合文库中生成的Ro.KAH突变体的产Reb M酵母的全细胞肉汤中的总甜菊醇糖苷(以μM测量)与含野生型Ro.KAH的酵母(也示出)的比值的图表。使具有不同过表达的KAH基因的酵母菌株在微量滴定板中生长。
图6A-6D示出了衍生自贝壳杉烯酸上的Ro.KAH活性的副产物的杂质C20H32O4+1Glc的提议结构(图6A)以及支持杂质鉴定的实验证据(图6B-6D)。图6B是来自表达野生型Ro.KAH、Sr.KAH、Rs.KAH的酵母培养物,或无KAH的酵母培养物的全细胞肉汤提取物的CAD色谱图的感兴趣区域。标记出了Reb M和C20H32O4+1Glc的峰。图6C是Ro.KAH色谱图中9.5分钟处峰的全质谱图。图6D是Ro.KAH色谱图中9.5分钟处峰的MS2碎片图谱。
图7是示出了通过Ro.KAH A297Y的定点饱和诱变产生的Ro.KAH突变体相对于野生型Ro.KAH的体内活性和产物特异性的改善的图表。活性(y轴)的改善计算如下,
Figure BDA0003386303570000061
特异性(x轴)的改善计算如下,
Figure BDA0003386303570000062
图8是示出了通过Ro.KAH A297Y的组合定点饱和诱变产生的Ro.KAH突变体相对于野生型Ro.KAH的体内活性和产物特异性的改善的图表。活性(y轴)和特异性(x轴)的改善是如图7图例中所描述的那样计算的。
图9是示出了通过Ro.KAH N146W/A297Y的全定点饱和诱变产生的Ro.KAH突变体相对于野生型Ro.KAH N146W/A297Y的体内活性和产物特异性的改善的图表。活性(y轴)和特异性(x轴)的改善是如图7图例中所描述的那样计算的。
具体实施方式
如本文所用,术语“异源的”是指在自然界中通常不存在的。术语“异源核苷酸序列”是指在自然界中通常不会在给定细胞中发现的核苷酸序列。因此,异源核苷酸序列可以是:(a)对其宿主细胞是外源的(即,对于细胞是“外源的”);(b)在宿主细胞中天然存在(即“内源性”)但在细胞中以非自然量存在(即比宿主细胞中天然存在的量多或少);(c)在宿主细胞中天然存在,但位于其天然基因座之外。
如本文所用,关于分子(特别是多肽和多核苷酸)的术语“天然的”或“内源的”是指这样的分子,其在它们起源自的生物体中表达或在自然界中被发现。应当理解,原生多肽或多核苷酸的表达可以在重组生物体中被修饰。
如本文所用,术语“变体”是指在结构或序列上与具体引用的“参考”分子不同的分子,特别是多肽和多核苷酸。在优选的实施方案中,参考是野生型分子。关于多肽和多核苷酸,变体分别是指氨基酸或核苷酸序列的取代、添加或缺失。
如本文所用,术语“异源核酸表达盒”是指包含编码序列的核酸序列,该编码序列可操作地连接至一个或多个足以使编码序列在宿主细胞中表达的调控元件。
如本文所用,术语“贝壳杉烯酸13-羟化酶”或“KAH”是指能够催化对映贝壳杉烯酸转化为甜菊醇的酶。
如本文所用,术语“亲本细胞”是指这样的细胞,其具有与本文所公开的经遗传修饰的宿主细胞同一的遗传背景,不同之处在于它不包含一种或多种被工程改造到经修饰的宿主细胞中的特定遗传修饰,例如,一种或多种选自由以下组成的组的修饰:甜菊醇途径(甜菊醇糖苷途径)的酶的异源表达、甜菊醇糖苷途径的酶的异源表达、香叶基香叶基二磷酸酯合酶的异源表达、柯巴基二磷酸酯合酶的异源表达、贝壳杉烯合酶的异源表达、贝壳杉烯氧化酶的异源表达、甜菊醇合酶(贝壳杉烯酸羟化酶)的异源表达、细胞色素P450还原酶的异源表达、UDP糖基转移酶(包括例如EUGT11、UGT74G1、UGT76G1、UGT85C2、UGT91D和UGT40087或其变体)的异源表达。
如本文所用,术语“培养基”是指培养基和/或发酵培养基。
如本文所用,术语“发酵组合物”是指包含经遗传修饰的宿主细胞和由经遗传修饰的宿主细胞产生的产物或代谢物的组合物。发酵组合物的实例是全细胞肉汤,其可以是容器的全部内容物,包括细胞、水相和由经遗传修饰的宿主细胞产生的化合物。
如本文所用,术语“产量”一般是指由本文提供的经遗传修饰的宿主细胞产生的甜菊醇糖苷的量。在一些实施方案中,产量被表示为宿主细胞的甜菊醇糖苷的产率。在其他实施方案中,产量被表示为宿主细胞产生甜菊醇糖苷的生产率。
如本文所用,术语“产率”是指宿主细胞产生的甜菊醇糖苷的产量,其被表示为按重量计宿主细胞消耗的单位碳源量所产生的甜菊醇糖苷的量。
如本文所用,术语“生产率”是指宿主细胞产生的甜菊醇糖苷的产量,其被表示为随时间推移(每小时)单位量的培养该宿主细胞的发酵肉汤量(按体积计)产生的甜菊醇糖苷的量(按重量计)。
如本文所用,术语“信号序列”或“N末端信号序列”是指在多肽的N末端处将多肽引导至分泌途径(例如,细胞外空间)的短肽(例如,长度为5-50个氨基酸)。信号肽通常在多肽分泌期间被切割。信号序列可以将多肽引导至细胞内区室或细胞器,例如内质网。信号序列可以通过与已知具有使多肽靶向细胞特定区域的功能的肽的同源性或生物活性来鉴定。本领域普通技术人员可以通过使用容易获得的软件(例如,Genetics Computer Group,University of Wisconsin Biotechnology Center,1710University Avenue,Madison,Wis.53705,BLAST的序列分析软件包,或PILEUP/PRETTYBOX程序)鉴定信号肽。信号肽可以是例如与SEQ ID NO:22的氨基酸序列或SEQ ID NO:1的氨基酸1-25基本同一的信号肽。N末端信号序列可以被编码异源N末端信号序列(例如,来自植物p450多肽的N末端信号序列)的相应氨基酸序列替代。
如本文所用,术语“贝壳杉烯酸”是指化合物贝壳杉烯酸,包括贝壳杉烯酸的任何立体异构体。在优选的实施方案中,该术语是指在本领域中作为对映贝壳杉烯酸已知并具有下面的结构的对映异构体:
Figure BDA0003386303570000091
如本文所用,术语“甜菊醇”是指化合物甜菊醇,包括甜菊醇的任何立体异构体。在优选的实施方案中,该术语是指具有下面的结构的化合物:
Figure BDA0003386303570000092
如本文所用,术语“甜菊醇糖苷(steviol glycoside)”是指甜菊醇的糖苷,包括但不限于19-糖苷、甜菊醇单苷(steviolmonoside)、甜菊醇双苷(steviolbioside)、悬钩子苷(rubusoside)、杜克苷B(dulcoside B)、杜克苷A、莱鲍迪苷A(rebaudioside A)、莱鲍迪苷B、莱鲍迪苷C、莱鲍迪苷D、莱鲍迪苷E、莱鲍迪苷F、莱鲍迪苷G、莱鲍迪苷H、莱鲍迪苷I、莱鲍迪苷J、莱鲍迪苷K、莱鲍迪苷L、莱鲍迪苷M、莱鲍迪苷N、莱鲍迪苷O、莱鲍迪苷D2和莱鲍迪苷M2。
如本文所用,术语“莱鲍迪苷M”或“Reb M”是指具有下面的结构的甜菊醇糖苷:
Figure BDA0003386303570000101
如本文所用,术语“序列同一性”或“同一性百分比”在两个或更多个多核苷酸或多肽序列的背景下,是指两个或更多个相同的或具有指定百分比的相同核苷酸或氨基酸残基的序列或子序列。例如,当在比较窗口或如使用序列比较算法或通过手动比对和目视检查测量的指定区域上进行比较和比对以获得最大对应时,所述序列在特定区域上与参考序列可能具有至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或更高同一性的同一性百分比。例如,通过计算序列中同一的核苷酸(或氨基酸残基)的数量除以减去任何空隙长度之后的总核苷酸(或氨基酸残基)长度的比率来确定同一性百分比。
为方便起见,两个序列之间的同一性程度可以使用本领域已知的计算机程序和数学算法确定。此类计算序列同一性百分比的算法一般会考虑比较区域上的序列空隙和错配。比较和比对序列的程序,如Clustal W(Thompson等人(1994)Nuclei Acids Res.,第22卷,第4673-4680页)、ALIGN(Myers等人,(1988)CABIOS,第4卷,第11-17页)、FASTA(Pearson等人,(1988)PNAS,第85卷,第2444-2448页;Pearson(1990)Methods Enzymol.,第183卷,第63-98页)和gapped BLAST(Altschul等人,(1997)Nucleic Acids Res.,第25卷,第3389-3402页)可用于此目的。BLAST或BLAST 2.0(Altschul等人,(1990)J.Mol.Biol.,第215卷,第403-410页)可从包括美国国立生物信息中心(NCBI)和互联网在内的多个来源获得,用于与序列分析程序BLASTP、BLASTN、BLASTX、TBLASTN和TBLASTX结合使用。附加信息可以在NCBI网站上找到。
在某些实施方案中,序列比对和同一性百分比计算可以使用BLAST程序使用其标准默认参数来确定。对于核苷酸序列比对和序列同一性计算,BLASTN程序以其默认参数(空格罚分=5,空格扩展罚分=2,核酸匹配=2,核酸错配=-3,期望值=10.0,字号=11,查询范围内的最大匹配数=0)使用。对于多肽序列比对和序列同一性计算,BLASTP程序以其默认参数(比对矩阵=BLOSUM62;空格成本:存在=11,扩展=1;组成调整=有条件的组成分数、矩阵调整;期望值=10.0;字号=6;查询范围内的最大匹配数=0)使用。替代地,可以使用以下程序和参数:Clone Manager Suite的Align Plus软件,版本5(Sci-Ed软件);DNA比较:全局比较,标准线性评分矩阵,错配罚分=2,空格罚分=4,扩展空格罚分=1。氨基酸比较:全局比较,BLOSUM 62评分矩阵。在本文所述的实施方案中,序列同一性是使用BLASTN或BLASTP程序使用其默认参数计算的。在本文所述的实施方案中,两个或更多个序列的序列比对是使用Clustal W使用建议的默认参数(去比对输入序列:否;Mbed类聚类引导树:是;Mbed类聚类迭代:是;组合迭代次数:默认(0);最大引导树迭代:默认;最大HMM迭代:默认;顺序:输入)进行。
在本发明的某些实施方案中,亲本宿主细胞可包含一种或多种能够制造贝壳杉烯酸的酶促途径。如本文所述,宿主细胞包含本文提供的喜阴悬钩子(Rubus occidentalis)贝壳杉烯酸羟化酶及其变体,其能够将贝壳杉烯酸转化为甜菊醇。在一些实施方案中,宿主细胞进一步包含一种或多种能够将法尼基二磷酸酯转化为香叶基香叶基二磷酸酯的酶。在一些实施方案中,宿主细胞进一步包含一种或多种能够将柯巴基二磷酸酯转化为贝壳杉烯的酶。在一些实施方案中,宿主细胞进一步包含一种或多种能够将贝壳杉烯转化为贝壳杉烯酸的酶。在一些实施方案中,宿主细胞进一步包含一种或多种能够将甜菊醇转化为一种或多种甜菊醇糖苷的酶。在某些实施方案中,宿主细胞进一步包含一种、两种、三种、四种或更多种酶,其一起能够将甜菊醇转化为Reb A。在某些实施方案中,宿主细胞进一步包含一种或多种能够将Reb A转化为Reb D的酶。在某些实施方案中,宿主细胞进一步包含一种或多种能够将Reb D转化为Reb M的酶。有用的酶和编码酶的核酸是本领域技术人员已知的。特别有用的酶和核酸描述于以下部分中并进一步描述于例如US2014/0329281A1、US2014/0357588A1、US2015/0159188、WO2016/038095A2和US2016/0198748A1中。
在进一步的实施方案中,宿主细胞进一步包含一种或多种能够从碳源制备香叶基香叶基二磷酸酯的酶。这些包括DXP途径的酶和MEV途径的酶。有用的酶和编码酶的核酸是本领域技术人员已知的。每个途径的示例性酶描述于下文中,并进一步描述于例如US2016/0177341A1中,其通过引用整体并入本文。
在一些实施方案中,宿主细胞包含选自由以下组成的组的类异戊二烯途径酶中的一种或多种或全部:(a)使两分子的乙酰辅酶A缩合以形成乙酰乙酰辅酶A的酶(例如,乙酰辅酶A硫解酶);(b)使乙酰乙酰辅酶A与另一分子的乙酰辅酶A缩合以形成3-羟基-3-甲基戊二酰辅酶A(HMG辅酶A)的酶(例如HMG辅酶A合酶);(c)使HMG辅酶A转化为甲羟戊酸的酶(例如HMG辅酶A还原酶);(d)使甲羟戊酸转化为甲羟戊酸5-磷酸酯的酶(例如甲羟戊酸激酶);(e)使甲羟戊酸-5-磷酸酯转化为甲羟戊酸-5-焦磷酸酯的酶(例如磷酸甲羟戊酸激酶);(f)使甲羟戊酸-5-焦磷酸酯转化为异戊烯二磷酸酯(IPP)的酶(例如甲羟戊酸焦磷酸酯脱羧酶);(g)使IPP转化为二甲基烯丙基焦磷酸酯(DMAPP)的酶(例如IPP异构酶);(h)可以使IPP和/或DMAPP分子缩合以形成含有超过五个碳的聚戊二烯化合物的聚戊二烯合酶;(i)使IPP与DMAPP缩合以形成香叶基焦磷酸酯(GPP)的酶(例如GPP合酶);(j)使两分子的IPP与一分子的DMAPP缩合的酶(例如FPP合酶);(k)使IPP与GPP缩合以形成法尼基焦磷酸酯(FPP)的酶(例如FPP合酶);(l)使IPP和DMAPP缩合以形成香叶基香叶基焦磷酸酯(GGPP)的酶;以及(m)使IPP和FPP缩合以形成GGPP的酶。
在某些实施方案中,另外的酶是天然的。在有利的实施方案中,另外的酶是异源的。在某些实施方案中,两种或更多种酶可以组合在一种多肽中。
细胞株
本文提供的本发明的宿主细胞包括古细菌、原核细胞和真核细胞。
合适的原核宿主细胞包括但不限于革兰氏阳性菌、革兰氏阴性菌和革兰氏不定菌中的任一种。实例包括但不限于属于下列属的细胞:土壤杆菌属(Agrobacterium)、环脂酸芽孢杆菌属(Alicyclobacillus)、鱼腥藻属(Anabaena)、倒囊藻属(Anacystis)、节杆菌属(Arthrobacter)、固氮菌属(Azobacter)、芽孢杆菌属(Bacillus)、短杆菌属(Brevibacterium)、着色菌属(Chromatium)、梭菌属(Clostridium)、棒杆菌属(Corynebacterium)、肠杆菌属(Enterobacter)、欧文氏菌属(Erwinia)、埃希氏菌属(Escherichia)、乳杆菌属(Lactobacillus)、乳球菌属(Lactococcus)、中间根瘤菌属(Mesorhizobium)、甲基杆菌属(Methylobacterium)、细杆菌属(Microbacterium)、席藻属(Phormidium)、假单胞菌属(Pseudomonas)、红杆菌属(Rhodobacter)、红假单胞菌属(Rhodopseudomonas)、红螺菌属(Rhodospirillum)、红球菌属(Rhodococcus)、沙门氏菌属(Salmonella)、栅藻属(Scenedesmun)、沙雷氏菌属(Serratia)、志贺氏菌属(Shigella)、葡萄球菌属(Staphylococcus)、链霉菌属(Streptomyces)、聚球蓝细菌属(Synechococcus)和发酵单胞菌属(Zymomonas)。原核菌株的实例包括但不限于:枯草芽孢杆菌(Bacillussubtilis)、解淀粉芽孢杆菌(Bacillus amyloliquefacines)、产氨短杆菌(Brevibacterium ammoniagenes)、嗜氨短杆菌(Brevibacterium immariophilum)、拜氏梭菌(Clostridium beijerinckii)、阪崎肠杆菌(Enterobacter sakazakii)、大肠埃希氏菌(Escherichia coli)、乳酸乳球菌(Lactococcus lactis)、百脉根中间根瘤菌(Mesorhizobium loti)、铜绿假单胞菌(Pseudomonas aeruginosa)、迈氏假单胞菌(Pseudomonas mevalonii)、布丁假单胞菌(Pseudomonas pudica)、荚膜红细菌(Rhodobacter capsulatus)、类球红细菌(Rhodobacter sphaeroides)、深红红螺菌(Rhodospirillum rubrum)、肠炎沙门氏菌(Salmonella enterica)、伤寒沙门菌(Salmonella typhi)、鼠伤寒沙门菌(Salmonella typhimurium)、痢疾志贺菌(Shigelladysenteriae)、弗氏志贺菌(Shigella flexneri)、宋氏志贺菌(Shigella sonnei)和金黄色葡萄球菌(Staphylococcus aureus)。在特定的实施方案中,宿主细胞是大肠埃希氏菌细胞。
合适的古细菌宿主包括但不限于属于下列属的细胞:嗜热古菌属(Aeropyrum)、古球菌属(Archaeoglobus)、嗜盐杆菌属(Halobacterium)、甲烷球菌属(Methanococcus)、甲烷杆菌属(Methanobacterium)、火球菌属(Pyrococcus)、硫化叶菌属(Sulfolobus)和热原体属(Thermoplasma)。古细菌株的实例包括但不限于:闪烁古球菌(Archaeoglobusfulgidus)、嗜盐杆菌种(Halobacterium sp.)、詹氏甲烷球菌(Methanococcusjannaschii)、嗜热自养甲烷杆菌(Methanobacterium thermoautotrophicum)、嗜酸热原体(Thermoplasma acidophilum)、火山热原体(Thermoplasma volcanium)、霍氏火球菌(Pyrococcus horikoshii)、深海火球菌(Pyrococcus abyssi)和佩氏嗜热古菌(Aeropyrumpernix)。
合适的真核宿主包括但不限于真菌细胞、藻类细胞、昆虫细胞和植物细胞。在一些实施方案中,可用于本发明方法的酵母包括已在微生物保藏处(例如IFO、ATCC等)保藏并且属于下列属的酵母:芽孢酵母属(Aciculoconidium)、神食酵母属(Ambrosiozyma)、节束酵母属(Arthroascus)、Arxiozyma、棉阿舒囊霉属(Ashbya)、Babjevia、本森顿酵母属(Bensingtonia)、葡状子囊菌属(Botryoascus)、Botryozyma、酒香酵母属(Brettanomyces)、布勒掷孢酵母属(Bullera)、布勒担孢酵母属(Bulleromyces)、念珠菌属(Candida)、固囊酵母属(Citeromyces)、棍孢属(Clavispora)、隐球菌属(Cryptococcus)、微囊藻属(Cystofilobasidium)、德巴利酵母属(Debaryomyces)、Dekkara、Dipodascopsis、双足囊菌属(Dipodascus)、Eeniella、Endomycopsella、Eremascus、假囊酵母属(Eremothecium)、担孢酵母属(Erythrobasidium)、Fellomyces、线黑粉酵母属(Filobasidium)、Galactomyces、地丝菌属(Geotrichum)、季氏酵母属(Guilliermondella)、有孢汉逊酵母属(Hanseniaspora)、汉逊酵母属(Hansenula)、哈瑟酵母菌属(Hasegawaea)、胶珊瑚属(Holtermannia)、Hormoascus、生丝毕赤酵母属(Hyphopichia)、伊萨酵母属(Issatchenkia)、克勒克酵母属(Kloeckera)、克勒克氏孢属(Kloeckeraspora)、克鲁维酵母属(Kluyveromyces)、Kondoa、Kuraishia、克氏担孢酵母属(Kurtzmanomyces)、白冬孢酵母属(Leucosporidium)、油脂酵母属(Lipomyces)、娄德罗菌属(Lodderomyces)、马拉色氏霉菌属(Malasserzia)、梅奇酵母属(Metschnikowia)、木拉克酵母属(Mrakia)、Myxozyma、拿逊酵母属(Nadsonia)、Nakazawaea、针孢酵母属(Nematospora)、Ogataea、Oosporidium、管囊酵母属(Pachysolen)、Phachytichospora、Phaffia、毕赤酵母属(Pichia)、红冬孢酵母属(Rhodosporidium)、红酵母属(Rhodotorula)、酵母属(Saccharomyces)、类酵母属(Saccharomycodes)、复膜孢酵母属(Saccharomycopsis)、Saitoella、Sakaguchia、Saturnospora、Schizoblastoporion、裂殖酵母菌属(Schizosaccharomyces)、许旺酵母属(Schwanniomyces)、锁掷酵母属(Sporidiobolus)、掷孢酵母属(Sporobolomyces)、原孢酵母属(Sporopachydermia)、冠孢酵母属(Stephanoascus)、梗孢酵母属(Sterigmatomyces)、Sterigmatosporidium、Symbiotaphrina、合轴酵母属(Sympodiomyces)、Sympodiomycopsis、有孢圆酵母属(Torulaspora)、Trichosporiella、毛孢子菌属(Trichosporon)、三角酵母属(Trigonopsis)、Tsuchiyaea、Udeniomyces、Waltomyces、威克酵母属(Wickerhamia)、拟威克酵母属(Wickerhamiella)、拟威尔酵母属(Williopsis)、Yamadazyma、子囊菌酵母属(Yarrowia)、接合囊酵母属(Zygoascus)、接合酵母属(Zygosaccharomyces)、接合魏氏酵母亚属(Zygowilliopsis)和配合酵母菌属(Zygozyma)。
在一些实施方案中,宿主微生物是酿酒酵母(Saccharomyces cerevisiae)、巴斯德毕氏酵母(Pichia pastoris)、粟酒裂殖酵母(Schizosaccharomyces pombe)、布鲁塞尔德克酵母(Dekkera bruxellensis)、乳酸克鲁维酵母(Kluyveromyces lactis)(以前称为乳酸酵母(Saccharomyces lactis))、马克斯克鲁维酵母(Kluveromyces marxianus)、Arxula adeninivorans或多形汉森酵母(Hansenula polymorpha)(目前称为安格斯毕赤酵母(Pichia angusta))。在一些实施方案中,宿主微生物是念珠菌属的菌株,诸如解脂念珠菌(Candida lipolytica)、吉利蒙念珠菌(Candida guilliermondii)、克鲁斯念珠菌(Candida krusei)、假热带念珠菌(Candida pseudotropicalis)或产朊念珠菌(Candidautils)。
在优选的实施方案中,宿主微生物是酿酒酵母(Saccharomyces cerevisiae)。在一些实施方案中,宿主是选自面包酵母、CEN.PK2、CBS 7959、CBS 7960、CBS 7961、CBS7962、CBS 7963、CBS 7964、IZ-1904、TA、BG-1、CR-1、SA-1、M-26、Y-904、PE-2、PE-5、VR-1、BR-1、BR-2、ME-2、VR-2、MA-3、MA-4、CAT-1、CB-1、NR-1、BT-1和AL-1的酿酒酵母(Saccharomyces cerevisiae)菌株。在一些实施方案中,宿主微生物是选自PE-2、CAT-1、VR-1、BG-1、CR-1和SA-1的酿酒酵母菌株。在特定的实施方案中,酿酒酵母(Saccharomycescerevisiae)菌株是PE-2。在另一个特定的实施方案中,酿酒酵母(Saccharomycescerevisiae)菌株是CAT-1。在另一个特定的实施方案中,酿酒酵母(Saccharomycescerevisiae)菌株是BG-1。
甜菊醇糖苷生物合成途径
在一些实施方案中,甜菊醇糖苷生物合成途径是通过将细胞工程改造成表达编码能够催化甜菊醇糖苷生物合成的酶的多核苷酸来在经遗传修饰的宿主细胞中激活的。
在一些实施方案中,经遗传修饰的宿主细胞含有编码香叶基香叶基二磷酸酯合酶(GGPPS)的异源多核苷酸、编码柯巴基二磷酸酯合酶(CDPS)的异源多核苷酸、编码贝壳杉烯合酶(KS)的异源多核苷酸、编码贝壳杉烯氧化酶(KO)的异源多核苷酸、编码贝壳杉烯酸羟化酶(KAH)的异源多核苷酸、编码细胞色素P450还原酶(CPR)的异源多核苷酸、编码UDP葡萄糖转移酶的异源多核苷酸、编码UGT74G1的异源多核苷酸、编码UGT76G1的异源多核苷酸、编码UGT85C2的异源多核苷酸、编码UGT91D的异源多核苷酸、编码EUGT11的异源多核苷酸和/或编码UGT40087的异源多核苷酸。在一些实施方案中,经遗传修饰的宿主细胞含有编码变体GGPPS、CDPS、KS、KO、KAH、CPR、UDP葡萄糖转移酶、UGT74G1、UGT76G1、UGT85C2、UGT91D、EUGT11和/或UGT40087的异源多核苷酸。在某些实施方案中,变体酶相对于参考酶可具有1至至多20个氨基酸取代。在某些实施方案中,多核苷酸的编码序列是针对特定宿主细胞进行密码子优化的。
香叶基香叶基二磷酸酯合酶(GGPPS)
香叶基香叶基二磷酸酯合酶(EC 2.5.1.29)催化法尼基焦磷酸酯转化成香叶基香叶基二磷酸酯。香叶基香叶基二磷酸酯合酶的实例包括甜叶菊(登记号)(登记号ABD92926)、藤仓赤霉(Gibberella fujikuroi)(登记号CAA75568)、小家鼠(Mus musculus)(登记号AAH69913)、假微型海链藻(Thalassiosira pseudonana)(登记号XP_002288339)、棒状链霉菌(Streptomyces clavuligerus)(登记号ZP-05004570)、嗜酸热硫化叶菌(Sulfulobus acidocaldarius)(登记号BAA43200)、聚球藻属(Synechococcus)某个种(登记号ABC98596)、拟南芥(Arabidopsis thaliana)(登记号MP_195399)和三孢布拉霉(Blakeslea trispora)(登记号AFC92798.1)的那些,以及US2014/0329281A1中所述的那些。
柯巴基二磷酸酯合酶(CDPS)
柯巴基二磷酸酯合酶(EC 5.5.1.13)催化香叶基香叶基二磷酸酯转化成柯巴基二磷酸酯。柯巴基二磷酸酯合酶的实例包括来自甜叶菊(Stevia rebaudiana)(登记号AAB87091)、棒状链霉菌(Streptomyces clavuligerus)(登记号EDY51667)、大豆慢生根瘤菌(Bradyrhizobioum japonicum)(登记号AAC28895.1)、玉米须(Zea mays)(登记号AY562490)、拟南芥(Arabidopsis thaliana)(登记号NM_116512)和水稻(Oryza sativa)(登记号Q5MQ85.1)的那些,以及US2014/0329281A1中所述的那些。
贝壳杉烯合酶(KS)
贝壳杉烯合酶(EC 4.2.3.19)催化柯巴基二磷酸酯转化成贝壳杉烯和二磷酸酯。酶的实例包括大豆慢生根瘤菌(Bradyrhizobium japonicum)(登记号AAC28895.1)、拟南芥(Arabidopsis thaliana)(登记号Q9SAK2)和白云杉(Picea glauca)(登记号ADB55711.1)的那些,以及US2014/0329281A1中所述的那些。
双功能柯巴基二磷酸酯合酶(CDPS)和贝壳杉烯合酶(KS)
CDPS-KS双功能酶(EC 5.5.1.13和EC 4.2.3.19)也可用于本发明的宿主细胞。实例包括桃拟茎点霉(Phomopsis amygdali)(登记号BAG30962)、暗球腔菌属(Phaeosphaeria)某个种(登记号O13284)、小立碗藓(Physcomitrella patens)(登记号BAF61135)和藤仓赤霉(Gibberella fujikuroi)(登记号Q9UVY5.1)的那些,以及US2014/032928A1、US2014/0357588A1、US2015/0159188和WO2016/038095中所述的那些。
对映贝壳杉烯氧化酶(KO)
对映贝壳杉烯氧化酶(EC 1.14.13.88)在本文中也称为贝壳杉烯氧化酶,催化贝壳杉烯转化成贝壳杉烯酸。酶的示例性实例包括水稻(Oryza sativa)(登记号Q5Z5R4)、藤仓赤霉(Gibberella fujikuroi)(登记号O94142)、拟南芥(Arabidopsis thaliana)(登记号Q93ZB2)、甜叶菊(Stevia rebaudiana)(登记号AAQ63464.1)和豌豆(Pisum sativum)(Uniprot编号Q6XAF4)的那些,以及US2014/0329281A1、US2014/0357588A1、US2015/0159188和WO2016/038095中所述的那些。
贝壳杉烯酸羟化酶(KAH)
贝壳杉烯酸羟化酶(EC 1.14.13)也称为甜菊醇合酶,催化贝壳杉烯酸转化成甜菊醇。酶的实例包括甜叶菊(Stevia rebaudiana)(登记号ACD93722)、拟南芥(Arabidopsisthaliana)(登记号NP_197872)、葡萄(Vitis vinifera)(登记号XP_002282091)和蒺藜苜蓿(Medicago trunculata)(登记号ABC59076)的那些,以及US2014/0329281、US2014/0357588、US2015/0159188和WO2016/038095中所述的那些。在一些实施方案中,贝壳杉烯酸羟化酶多肽可以是变体KAH。在一些实施方案中,变体KAH包含SEQ ID NO:1的氨基酸序列。在一些实施方案中,SEQ ID NO:1的氨基酸序列进一步包括一个或多个氨基酸取代。在一些实施方案中,所述一个或多个氨基酸取代选自K69R、V343G、T403V、H491P、P72D、L64D、Q84C、L64G、E206D、Y238C、A210G、L64N、I237C、L11V、N207F、M73G、W8G、E60R、Y55S、N475G、D292P、P161C、K267D、L485F、A396F、R507A、P72T、I132G、N61P、K119V、T220E、P72G、Q513R、S133G、Y506V、K69P、E60G、K224C、M73H、H379G、P72C、K314P、W202A、G466F、N49A、S339G、N160D、T216G、D102Y、F246G、M58P、T220R、R458D、M58G、A68I、S70P、F88V、T240D、L205I、K167G、L232M、S62R、G56D、Q244G、A242D、N49R、Q513G、W29T、L303D、T378D、I508L、W202Q、S505R、R233C、I104D、M258G、K69G、F88D、F88S、A217V、E230C、R507G、G466S、G56S、E230G、Y55G、A503C、S460I、I129R、S245G、F246S、Q84L、S133R、T509V、R507E、R233T、V30F、A68G、G56N、T162G、A68P、S165D、K119Y、W29C、S165P、W29V、I284G、A217L、Q335V、L65S、F53R、Y55P、W202V、K224V、W29A、H164G、Q244D、K291C、L65G、K167S、C327I、K291S、D57G、K167H、N160T、W202C、A242G、F88R、I104N、G466D、N475D、K119S、T123D、T216A、S339A、P161D、I104R、L54G、M171F、L232Y、D293C、V340A、T162A、A297V、I104H、F332L、A236R、K224I、S452D、I104A、V340S、F229Y、A297Y和A297F。在一些实施方案中,所述一个或多个氨基酸取代选自A297V、I104H、F332L、A236R、K224I、S452D、I104A、I104A、V340S、F229Y、A297Y和A297F。在一些实施方案中,所述一个或多个氨基酸取代选自S452D、I104A、V340S、F229Y、A297Y和A297F。在一些实施方案中,所述一个或多个氨基酸取代选自N146W、A297Y、A236S、V9S、G466F、T283D、T142G、T425V、L459C、T283A、T283G、S460V、S133G、I129V、W52G、S505I、I243T、V340S、S460C、S452D、L118I、S505V、T123D、W52C、S460I、S457G、W52R、W52N、N146T、G466A和W52T。在一些实施方案中,所述一个或多个氨基酸取代选自N146T/A297Y/G466A、W52T/N146T/A297Y、T142G/N146T/A297Y/G466A、W52T/T142G/N146T/A297Y和W52T/T142G/N146T/A297Y/G466A。在一些实施方案中,所述氨基酸取代包括N146T/A297Y/G466A。在一些实施方案中,所述氨基酸取代包括W52T/N146T/A297Y。在一些实施方案中,所述氨基酸取代包括T142G/N146T/A297Y/G466A。在一些实施方案中,所述氨基酸取代包括W52T/T142G/N146T/A297Y。在一些实施方案中,所述氨基酸取代包括W52T/T142G/N146T/A297Y/G466A。在一些实施方案中,所述氨基酸取代包括W52T/T142G/G466A。在一些实施方案中,所述氨基酸取代包括A145G/N146F/A297Y。在一些实施方案中,所述氨基酸取代包括N146W/A297Y/S460I。在一些实施方案中,所述氨基酸取代包括W52N/N146W/A297Y。在一些实施方案中,所述氨基酸取代包括F332L/S452D。在一些实施方案中,所述氨基酸取代包括N146W/A297Y。在一些实施方案中,所述氨基酸取代包括A297Y。在一些实施方案中,所述氨基酸取代包括Q84R/N146T/A297Y。在一些实施方案中,所述变异多肽包括选自以下的氨基酸序列:SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20和SEQ ID NO:21。在一些实施方案中,所述变异多肽包括SEQ ID NO:17的氨基酸序列。在一些实施方案中,所述变异多肽包括SEQ ID NO:18的氨基酸序列。在一些实施方案中,所述变异多肽包括SEQ ID NO:19的氨基酸序列。在一些实施方案中,所述变异多肽包括SEQ ID NO:20的氨基酸序列。在一些实施方案中,所述变异多肽包括SEQ ID NO:21的氨基酸序列。在一些实施方案中,编码N末端信号序列的氨基酸被编码异源植物p450多肽的N末端信号序列的相应氨基酸序列替换。在一些实施方案中,N末端信号序列对应于SEQ ID NO:1的氨基酸1-25。在一些实施方案中,对应于N末端信号序列的氨基酸序列包括SEQ ID NO:22。
细胞色素P450还原酶(CPR)
细胞色素P450还原酶(EC 1.6.2.4)是上述KO和/或KAH活性所必需的。酶的实例包括甜叶菊(Stevia rebaudiana)(登记号ABB88839)、拟南芥(Arabidopsis thaliana)(登记号NP_194183)、藤黑赤霉(Gibberella fujikuroi)(登记号CAE09055)和青蒿(Artemisiaannua)(登记号ABC47946.1)的那些,以及US2014/0329281、US2014/0357588、US2015/0159188和WO2016/038095中所述的那些。
UDP糖基转移酶74G1(UGT74G1)
UGT74G1能够充当尿苷5'-二磷酸葡萄糖基:甜菊醇19-COOH转移酶和充当尿苷5'-二磷酸葡萄糖基:甜菊醇-13-O-葡萄糖苷19-COOH转移酶。因此,UGT74G1能够将甜菊醇转化为19-糖苷;将甜菊醇转化为19-糖苷,将甜菊醇单苷转化为悬钩子苷;以及将甜菊醇双苷转化为甜菊苷(stevioside)。UGT74G1已描述于Richman等人,2005年,Plant J.,第41卷,第56-67页;US2014/0329281;WO2016/038095和登记号AAR06920.1中。
UDP糖基转移酶76G1(UGT76G1)
UGT76G1能够将葡萄糖部分转移到受体分子甜菊醇糖苷的C-3'位置(其中糖苷=Glcb(1->2)Glc)。此化学反应可以发生在受体分子的C-13-O连接葡萄糖或受体分子的C-19-O连接葡萄糖上。因此,UGT76G1能够充当针对以下位置的尿苷5'-二磷酸葡萄糖基转移酶:(1)形成Reb B的β连键中甜菊醇双苷上13-O-连接葡萄糖的C-3'位置;(2)形成Reb A的β连键中甜菊苷上19-O-连接葡萄糖的C-3'位置;以及(3)形成Reb M的β连键中Reb D上19-O-连接葡萄糖的C-3'位置。UGT76G1已描述于Richman等人,2005年,Plant J.,第41卷,第56-67页;US2014/0329281;WO2016/038095和登记号AAR06912.1中。
UDP糖基转移酶85C2(UGT85C2)
UGT85C2能够充当尿苷5'-二磷酸葡萄糖基:甜菊醇13-OH转移酶和充当尿苷5'-二磷酸葡萄糖基:甜菊醇-19-O-葡萄糖苷13-OH转移酶。UGT85C2能够将甜菊醇转化为甜菊醇单苷,也能够将19-糖苷转化为悬钩子苷。UGT85C2酶的实例包括甜叶菊(Steviarebaudiana)的那些:参见例如Richman等人(2005),Plant J.,第41卷,第56-67页;US2014/0329281;WO2016/038095和登记号AAR06916.1中。
UDP糖基转移酶91D(UGT91D)
UGT91D能够充当将葡萄糖部分转移到受体分子甜菊醇-13-O葡萄糖苷(甜菊醇单苷)的13-O-葡萄糖的C-2'上从而产生甜菊醇双苷的尿苷5'-二磷酸葡萄糖基:甜菊醇-13-O-葡萄糖苷转移酶。UGT91D也能够充当将葡萄糖部分转移到受体分子悬钩子苷的13-O-葡萄糖的C-2'上从而产生甜菊苷的尿苷5'-二磷酸葡萄糖基:悬钩子苷转移酶。UGT91D也称为UGT91D2、UGT91D2e或UGT91D-样3。UGT91D酶的实例包括甜叶菊(Stevia rebaudiana)的那些:参见例如登记号ACE87855.1、US2014/0329281和WO2016/038095。
UDP糖基转移酶40087(UGT40087)
UGT40087能够将葡萄糖部分转移到Reb A的19-O-葡萄糖的C-2'位上以产生RebD。UGT40087还能够将葡萄糖部分转移到甜菊苷的19-O-葡萄糖的C-2'位上从而产生Reb E。UGT40087的实例包括登记号XP_004982059.1和WO2018/031955。
另外的能够将Reb A转化为Reb D(UGTAD)的尿苷二磷酸酯依赖性糖基转移酶
除了UGT40087之外,其他UGTAD也能够将葡萄糖部分转移到Reb A的19-O-葡萄糖的C-2'位置上从而产生Reb D。UGTAD也能够将葡萄糖部分转移到甜菊苷的19-O-葡萄糖的C-2'位置上从而产生Reb E。UGTAD的实例包括来自水稻(Oryza sativa)的Os_UGT_91C1(也称为EUGT11(参见WO2013/022989和登记号XP_01529141.1));来自番茄(Solanumlycopersicum)的S1_UGT_101249881(也称为UGTSL2(参见WO2014/193888和登记号XP_0042504851));sr.UGT_925778;Bd_UGT0840(参见登记号XP_003560669.1);Hv_UGT_V1(参见登记号BAJ94055.1);Bd_UGT10850(参见登记号XP_010230871.1);以及OB_UGT91B1_样(参见登记号XP_0066504551)。
MEV途径FPP和/或GGPP产生
在一些实施方案中,本文提供的经遗传修饰的宿主细胞包含一种或多种可用于形成FPP和/或GGPP的MEV途径的异源酶。所述一种或多种MEV途径的酶可以包括使乙酰辅酶A与丙二酰辅酶A缩合形成乙酰乙酰辅酶A的酶;使两分子乙酰辅酶A缩合形成乙酰乙酰辅酶A的酶;使乙酰乙酰辅酶A与乙酰辅酶A缩合形成HMG辅酶A的酶;或使HMG辅酶A转化为甲羟戊酸酯的酶。此外,经遗传修饰的宿主细胞可以包括使甲羟戊酸酯磷酸化为甲羟戊酸5-磷酸酯的MEV途径酶;使甲羟戊酸5-磷酸酯转化为甲羟戊酸-5-焦磷酸酯的MEV途径酶;使甲羟戊酸-5-焦磷酸酯转化为异戊烯焦磷酸酯的MEV途径酶;或使异戊烯焦磷酸酯转化为二甲基烯丙基二磷酸酯的MEV途径酶。特别地,所述一种或多种MEV途径的酶选自乙酰辅酶A硫解酶、乙酰乙酰辅酶A合成酶、HMG辅酶A合酶、HMG辅酶A还原酶、甲羟戊酸酯激酶、磷酸甲羟戊酸酯激酶、甲羟戊酸焦磷酸酯脱羧酶和异戊基二磷酸酯:二甲基烯丙基二磷酸酯异构酶(IDI或IPP异构酶)。本发明的经遗传修饰的宿主细胞可以从一种或多种包含一种或多种MEV途径酶的编码序列的异源核苷酸序列表达一种或多种MEV的异源酶。
在一些实施方案中,经遗传修饰的宿主细胞包含编码可将异戊烯焦磷酸酯(IPP)转化为二甲基烯丙基焦磷酸酯(DMAPP)的酶的异源核酸。此外,宿主细胞可以含有编码可使IPP和/或DMAPP分子缩合形成聚戊二烯基化合物的酶的异源核酸。在一些实施方案中,经遗传修饰的宿主细胞进一步含有编码可修饰IPP或聚戊二烯以形成类异戊二烯化合物(诸如FPP)的酶的异源核酸。
乙酰辅酶A向乙酰乙酰辅酶A的转化
经遗传修饰的宿主细胞可以含有编码可使两分子的乙酰辅酶A缩合形成乙酰乙酰辅酶A的酶(乙酰辅酶A硫解酶)的异源核酸。编码乙酰辅酶A硫解酶的核苷酸序列的实例包括(登记号NC_000913REGION:2324131.2325315(大肠埃希氏菌));(D49362(脱氮副球菌(Paracoccus denitrificans)));以及(L20428(酿酒酵母(Saccharomycescerevisiae)))。
乙酰辅酶A硫解酶催化两分子的乙酰辅酶A可逆地缩合生成乙酰乙酰辅酶A,但该反应在热力学上是处于不利地位的;乙酰乙酰辅酶A硫解与乙酰乙酰辅酶A合成相比处于更有利的地位。乙酰乙酰辅酶A合酶(AACS)(也称为乙酰辅酶A:丙二酰辅酶A酰基转移酶;EC2.3.1.194)使乙酰辅酶A与丙二酰辅酶A缩合形成乙酰乙酰辅酶A。与乙酰辅酶A硫解酶相反,AACS催化的乙酰乙酰辅酶A合成因相关的丙二酰辅酶A脱羧在本质上是一种受能量促进的(energy-favored)反应。此外,AACS对乙酰乙酰辅酶A未表现出硫解活性,因此反应是不可逆的。
在表达乙酰辅酶A硫解酶和异源ADA和/或磷酸转乙酰酶(PTA)的细胞中,由促进乙酰乙酰辅酶A硫解的乙酰辅酶A硫解酶催化的可逆反应可产生大的乙酰辅酶A库(pool)。鉴于ADA的可逆活性,该乙酰辅酶A库可能反过来驱使ADA进行将乙酰辅酶A转化为乙醛的逆反应,从而减少ADA对乙酰辅酶A生成提供的益处。类似地,PTA的活性是可逆的,因此,大量的乙酰辅酶A库可能会驱使PTA进行将乙酰辅酶A转化为乙酰磷酸酯的逆反应。因此,在一些实施方案中,为了提供对乙酰辅酶A的强烈影响力以驱使ADA和PTA的正向反应,本文提供的经遗传修饰的宿主细胞的MEV途径利用乙酰乙酰辅酶A合酶来从乙酰辅酶A和丙二酰辅酶A形成乙酰乙酰辅酶A。
可以使用从链霉菌属某个种(Streptomyces sp.)菌株CL190获得的AACS(参见Okamura等人,(2010),PNAS,第107卷,第11265-11270页)。来自链霉菌属某个种(Streptomyces sp.)菌株CL190的编码核酸序列的代表性AACS包括登记号AB540131.1的序列,相应的AACS蛋白序列包括登记号D7URV0和BAJ10048的序列。其他可用于本发明的乙酰乙酰辅酶A合酶包括链霉菌属某个种(Streptomyces sp.)(参见登记号AB183750、KO-3988BAD86806、KO-3988AB212624和KO-2988BAE78983)、环圈链霉菌(S.anulatus)菌株9663(参见登记号FN178498和CAX48662)、游动放线菌属某个种(Actinoplanes sp.)A40644(参见登记号AB113568和BAD07381)、链霉菌属某个种(Streptomyces sp.)C(参见登记号NZ_ACEW010000640和ZP_05511702)、达氏拟诺卡氏菌(Nocardiopsis dassonvillei)DSM43111(参见登记号NZ_ABUI01000023和ZP_04335288)、溃疡分枝杆菌(Mycobacteriumulcerans)Agy99(参见登记号NC_008611和YP_907152)、海分枝杆菌(Mycobacteriummarinum)M(参见登记号NC_010612和YP_001851502)、链霉菌属某个种(Streptomyces sp.)Mg1(参见登记号NZ_DS570501和ZP_05002626)、链霉菌属某个种(Streptomyces sp.)AA4(参见登记号NZ_ACEV01000037和ZP_05478992)、玫瑰孢链霉菌(S.roseosporus)NRRL15998(参见登记号NZ_ABYB01000295和ZP_04696763)、链霉菌属某个种(Streptomycessp.)ACTE(参见登记号NZ_ADFD01000030和ZP_06275834)、产绿色链霉菌(S.viridochromogenes)DSM 40736(参见登记号NZ_ACEZ01000031和ZP_05529691)、弗兰克菌属某个种(Frankia sp.)CcI3(参见登记号NC_007777和YP_480101)、巴西诺卡菌(Nocardia brasiliensis)(参见登记号NC_018681和YP_006812440.1)和龟嗜皮菌(Austwickia chelonae)(参见登记号NZ_BAGZ01000005和ZP_10950493.1)的乙酰乙酰辅酶A合酶。另外的合适的乙酰乙酰辅酶A合酶包括美国专利申请公布第2010/0285549号和第2011/0281315号中描述的那些。
也可用于本文提供的组合物和方法中的乙酰乙酰辅酶A合酶包括被说成本文所述任何乙酰乙酰辅酶A合酶的“衍生物”的那些分子。此类“衍生物”具有以下特征:(1)它与本文所述的任何乙酰乙酰辅酶A合酶共享实质同源性;以及(2)能够催化乙酰辅酶A与丙二酰辅酶A不可逆地缩合形成乙酰乙酰辅酶A。如果乙酰乙酰辅酶A合酶衍生物的氨基酸序列与乙酰乙酰辅酶A合酶的氨基酸序列至少80%,更优选至少90%,最优选至少95%相同,则该乙酰乙酰辅酶A合酶衍生物被说成与乙酰乙酰辅酶A合酶共享“实质同源性”。
乙酰乙酰辅酶A向HMG辅酶A的转化
在一些实施方案中,宿主细胞包含编码使乙酰乙酰辅酶A与另一分子的乙酰辅酶A缩合形成3-羟基-3-甲基戊二酰辅酶A(HMG辅酶A)(例如,HMG辅酶A合酶)的酶的异源核苷酸序列。编码此酶的核苷酸序列的实例包括:(NC_001145.补体19061.20536;酿酒酵母(Saccharomyces cerevisiae))、(X96617;酿酒酵母(Saccharomyces cerevisiae))、(X83882;拟南芥(Arabidopsis thaliana))、(AB037907;灰北里孢菌(Kitasatosporagriseola))、(BT007302;智人(Homo sapiens))和(NC_002758、基因座标签SAV2546,基因ID1122571;金黄色葡萄球菌(Staphylococcus aureus))。
HMG辅酶A向甲羟戊酸酯的转化
在一些实施方案中,宿主细胞包含编码可使HMG辅酶A转化为甲羟戊酸酯的酶(例如HMG辅酶A还原酶)的异源核苷酸序列。HMG辅酶A还原酶可以是使用NADH的羟甲基戊二酰辅酶A还原酶辅酶A还原酶。HMG辅酶A还原酶(EC 1.1.1.34;EC 1.1.1.88)催化(S)-HMG辅酶A还原脱酰为(R)-甲羟戊酸酯,并且可以被分为两类:I类和II类HMGr。I类包括来自真核生物和大多数古细菌的酶,II类包括某些原核生物和古细菌的HMG辅酶A还原酶。除了序列上的差异外,这两类酶在其辅因子特异性方面也不同。与专门利用NADPH的I类酶不同,II类HMG辅酶A还原酶在区分NADPH和NADH的能力方面有所不同(参见,例如Hedl等人,(2004)Journal of Bacteriology,第186卷,第1927-1932页)。表1中提供了选择的II类HMG辅酶A还原酶的辅因子特异性。
表1
Figure BDA0003386303570000261
可用于本发明的HMG辅酶A还原酶包括能够利用NADH作为辅因子的HMG辅酶A还原酶,例如来自迈氏假单胞菌(P.mevalonii)、闪烁古球菌(A.fulgidus)或金黄色葡萄球菌(S.aureus)的HMG辅酶A还原酶。在特定的实施方案中,HMG辅酶A还原酶能够仅利用NADH作为辅因子,例如来自迈氏假单胞菌(P.mevalonii)、波氏硅杆菌(S.pomeroyi)或食酸代夫特菌(D.acidovorans)的HMG辅酶A还原酶。
在一些实施方案中,使用NADH的HMG辅酶A还原酶来自迈氏假单胞菌(Pseudomonasmevalonii)。编码HMG辅酶A还原酶(EC 1.1.1.88)的迈氏假单胞菌(Pseudomonasmevalonii)的野生型mvaA基因的序列先前已有描述(参见Beach和Rodwell,(1989),J.Bacteriol.,第171卷,第2994-3001页)。迈氏假单胞菌(Pseudomonas mevalonii)的代表性mvaA核苷酸序列包括登记号M24015。迈氏假单胞菌(Pseudomonas mevalonii)的代表性HMG辅酶A还原酶蛋白序列包括登记号AAA25837、P13702和MVAA_PSEMV。
在一些实施方案中,使用NADH的HMG辅酶A还原酶来自波氏硅杆菌(Silicibacterpomeroyi)。波氏硅杆菌(Silicibacter pomeroyi)的代表性HMG辅酶A还原酶核苷酸序列包括登记号NC_006569.1。波氏硅杆菌(Silicibacter pomeroyi)的代表性HMG辅酶A还原酶蛋白质序列包括登记号YP_164994。
在一些实施方案中,使用NADH的HMG辅酶A还原酶来自食酸代夫特菌(Delftiaacidovorans)。食酸代夫特菌(Delftia acidovorans)的代表性HMG辅酶A还原酶核苷酸序列包括NC_010002REGION:补体(319980..321269)。食酸代夫特菌(Delftia acidovorans)的代表性HMG辅酶A还原酶蛋白质序列包括登记号YP_001561318。
在一些实施方案中,使用NADH的HMG辅酶A还原酶来自马铃薯(Solanumtuberosum)(参见Crane等人,(2002),J.Plant Physiol.,第159卷,第1301-1307页)。
可用于本发明的实践中的使用NADH的HMG辅酶A还原酶还包括被说成是本文所述的任何使用NADH的HMG辅酶A还原酶的“衍生物”的那些分子,例如来自迈氏假单胞菌(P.mevalonii)、波氏硅杆菌(S.pomeroyi)和食酸代夫特菌(D.acidovorans)的那些分子。此类“衍生物”具有以下特征:(1)它与本文所述的任何使用NADH的HMG辅酶A还原酶共享实质同源性;以及(2)能够催化(S)-HMG辅酶A还原脱酰为(R)-甲羟戊酸酯,同时优先使用NADH作为辅因子。如果使用NADH的HMG辅酶A还原酶的衍生物的氨基酸序列与使用NADH的HMG辅酶A还原酶的氨基酸序列至少80%,更优选至少90%,最优选至少95%相同,则该使用NADH的HMG辅酶A还原酶的衍生物被说成与使用NADH的HMG辅酶A还原酶共享“实质同源性”。
如本文所用,短语“使用NADH的”是指使用NADH的HMG辅酶A还原酶对作为辅因子的NADH的选择性超过NADPH,例如,通过证明对NADH的比活性高于对NADPH的比活性而证明的。对作为辅因子的NADH的选择性被表示为kcat (NADH)/kcat (NADPH)比率。本发明的使用NADH的HMG辅酶A还原酶可以具有至少5、10、15、20、25或大于25的kcat (NADH)/kcat (NADPH)比率。使用NADH的HMG辅酶A还原酶可以专门使用NADH。例如,专门使用NADH的使用NADH的HMG辅酶A还原酶在NADH在体外作为唯一辅因子提供时表现出一些活性,而在NADPH作为唯一辅因子提供时则没有显示出可检测的活性。可以利用本领域已知的用于确定辅因子特异性的任何方法来鉴定对作为辅因子的NADH具有偏好的HMG辅酶A还原酶(参见例如(Kim等人,(2000),ProteinScience,第9卷,第1226-1234页)和(Wilding等人,(2000),J.Bacteriol.,第182卷,第5147-5152页)。
在一些情况下,例如,通过辅因子结合口袋的定点诱变将使用NADH的HMG辅酶A还原酶工程改造为对NADH的选择性超过对NAPDH的选择性。用于对NADH选择性进行工程改造的方法描述于Watanabe等人(2007),Microbiology,第153卷,第3044-3054页中,而用于确定HMG辅酶A还原酶的辅因子特异性的方法描述于Kim等人(2000),Protein Sci.,第9卷,第1226-1234页中。
使用NADH的HMG辅酶A还原酶可以源自原生地包含甲羟戊酸酯降解途径的宿主物种,例如分解代谢作为其唯一碳源的甲羟戊酸酯的宿主物种。在这些情况下,使用NADH的HMG辅酶A还原酶(其通常在其原生宿主细胞内催化内化的(R)-甲羟戊酸酯氧化酰化为(S)-HMG辅酶A)被用来在包含甲羟戊酸酯生物合成途径的经遗传修饰的宿主细胞中催化逆反应,即(S)-HMG辅酶A向(R)-甲羟戊酸的还原脱酰。能够靠作为其唯一碳源的甲羟戊酸酯生长的原核生物已被描述于:(Anderson等人,(1989),J.Bacteriol,第171卷,第6468-6472页);(Beach等人,(1989),J.Bacteriol.,第171卷,第2994-3001页);Bensch等人,J.Biol.Chem.,第245卷,第3755-3762页);(Fimongnari等人,(1965),Biochemistry,第4卷,第2086-2090卷);Siddiqi等人,(1962),Biochem.Biophys.Res.Commun.,第8卷,第110-113页);(Siddiqi等人,(1967),J.Bacteriol.,第93卷,第207-214页);以及(Takatsuji等人,(1983),Biochem.Biophys.Res.Commun.,第110卷,第187-193卷)中。
宿主细胞可以含有使用NADH的HMGr和使用NADPH的HMG辅酶A还原酶两者。编码使用NADPH的HMG辅酶A还原酶的核苷酸序列的实例包括:(NM_206548;黑腹果蝇(Drosophilamelanogaster))、(NC_002758,基因座标签SAV2545,基因ID1122570;金黄色葡萄球菌(Staphylococcus aureus)),(AB015627;链球菌属某个种(Streptomyces sp.)KO 3988)、(AX128213,提供编码截断的HMG辅酶A还原酶的序列;酿酒酵母)和(NC_001145:补体(115734.118898;酿酒酵母(Saccharomyces cerevisiae))。
甲羟戊酸酯向甲羟戊酸-5-磷酸酯的转化
宿主细胞可以含有编码可使甲羟戊酸酯转化为甲羟戊酸5-磷酸酯的酶(例如甲羟戊酸酯激酶)的异源核苷酸序列。编码此类酶的核苷酸序列的示例性实例包括:(L77688;拟南芥(Arabidopsis thaliana))和(X55875;酿酒酵母(Saccharomyces cerevisiae))。
甲羟戊酸-5-磷酸酯向甲羟戊酸-5-焦磷酸酯的转化
宿主细胞可以含有编码可使甲羟戊酸5-磷酸酯转化为甲羟戊酸-5-焦磷酸酯的酶(例如磷酸甲羟戊酸酯激酶)的异源核苷酸序列。编码此类酶的核苷酸序列的示例性实例包括:(AF429385;巴西三叶胶(Hevea brasiliensis))、(NM_006556;智人(Homo sapiens))和(NC_001145.补体712315.713670;酿酒酵母(Saccharomyces cerevisiae))。
甲羟戊酸-5-焦磷酸酯向IPP的转化
宿主细胞可以含有编码可使甲羟戊酸-5-焦磷酸酯转化为异戊烯二磷酸酯(IPP)的酶(例如甲羟戊酸焦磷酸酯脱羧酶)的异源核苷酸序列。编码此类酶的核苷酸序列的示例性实例包括:(X97557;酿酒酵母(Saccharomyces cerevisiae))、(AF290095;屎肠球菌(Enterococcus faecium))和(U49260;智人(Homo sapiens))。
IPP向DMAPP的转化
宿主细胞可以含有编码可使经由MEV途径产生的IPP转化为二甲基烯丙基焦磷酸酯(DMAPP)的酶(例如IPP异构酶)的异源核苷酸序列。编码此类酶的核苷酸序列的示例性实例包括:(NC_000913,3031087.3031635;大肠埃希氏菌(Escherichia coli))和(AF082326;雨生红球藻(Haematococcus pluvialis))。
聚戊二烯合酶
在一些实施方案中,宿主细胞进一步包含编码可使IPP和/或DMAPP分子缩合形成含有多于五个碳的聚戊二烯化合物的聚戊二烯合酶的异源核苷酸序列。
宿主细胞可以含有编码可使一分子IPP与一分子DMAPP缩合形成一分子香叶基焦磷酸酯(“GPP”)的酶(,例如GPP合酶)的异源核苷酸序列。编码此类酶的核苷酸序列的非限制性实例包括:(AF513111;大冷杉(Abies grandis))、(AF513112;大冷杉(Abiesgrandis))、(AF513113;大冷杉(Abies grandis))、(AY534686;金鱼草(Antirrhinummajus))、(AY534687;金鱼草(Antirrhinum majus))、(Y17376;拟南芥(Arabidopsisthaliana))、(AE016877,基因座AP11092;蜡状芽孢杆菌(Bacillus cereus);ATCC 14579)、(AJ243739;甜橙(Citrus sinensis))、(AY534745;仙女扇(Clarkia breweri))、(AY953508;Ips pini)、(DQ286930;番茄(Lycopersicon esculentum))、(AF182828;辣薄荷(Mentha x piperita))、(AF182827;辣薄荷(Mentha x piperita))、(MPI249453;辣薄荷(Mentha x piperita))、(PZE431697,基因座CAD24425;产玉米黄素副球菌(Paracoccuszeaxanthinifaciens))、(AY866498;胡黄连(Picrorhiza kurrooa))、(AY351862;葡萄(Vitis vinifera))和(AF203881,基因座AAF12843;运动发酵单胞菌(Zymomonasmobilis))。
宿主细胞可以含有编码可使两分子IPP与一分子DMAPP缩合或者将一分子IPP添加至一分子GPP上从而形成一分子香叶基焦磷酸酯(“FPP”)的酶(例如GPP合酶)的异源核苷酸序列。编码FPP合酶的核苷酸序列的非限制性实例包括:(ATU80605;拟南芥(Arabidopsisthaliana))、(ATHFPS2R;拟南芥(Arabidopsis thaliana))、(AAU36376;青蒿素(Artemisiaannua))、(AF461050;欧洲牛(Bos taurus))、(D00694;大肠埃希氏菌(Escherichia coli)K-12)、(AE009951,基因座AAL95523;具核梭杆菌具核亚种(Fusobacterium nucleatumsubsp.nucleatum)ATCC 25586)、(GFFPPSGEN;藤仓赤霉(Gibberella fujikuroi))、(CP000009,基因座AAW60034;氧化葡萄糖杆菌(Gluconobacter oxydans)621H)、(AF019892;向日葵(Helianthus annuus))、(HUMFAPS;智人(Homo sapiens))、(KLPFPSQCR;乳酸克鲁维酵母(Kluyveromyces lactis))、(LAU15777;白羽扇豆(Lupinus albus))、(LAU20771;白羽扇豆(Lupinus albus))、(AF309508;小家鼠(Mus musculus))、(NCFPPSGEN;粗糙脉孢菌(Neurospora crassa))、(PAFPS1;灰白银胶菊(Partheniumargentatum))、(PAFPS2;灰白银胶菊(Parthenium argentatum))、(RATFAPS;褐家鼠(Rattus norvegicus))、(YSCFPP;酿酒酵母(Saccharomyces cerevisiae))、(D89104;粟酒裂殖酵母(Schizosaccharomyces pombe))、(CP000003,基因座AAT87386;酿脓链球菌(Streptococcus pyogenes))、(CP000017,基因座AAZ51849;酿脓链球菌(Streptococcuspyogenes))、(NC_008022,基因座YP_598856;酿脓链球菌(Streptococcus pyogenes)MGAS10270)、(NC_008023,基因座YP_600845;酿脓链球菌(Streptococcus pyogenes)MGAS2096)、(NC_008024,基因座YP_602832;酿脓链球菌(Streptococcus pyogenes)MGAS10750)、(MZEFPS;玉米须(Zea mays))、(AE000657,基因座AAC06913;超嗜热菌(Aquifex aeolicus)VF5)、(NM_202836;拟南芥(Arabidopsis thaliana))、(D84432,基因座BAA12575;枯草芽孢杆菌(Bacillus subtilis))、(U12678,基因座AAC28894;大豆慢生根瘤菌(Bradyrhizobium japonicum)USDA 110)、(BACFDPS;嗜热脂肪地芽孢杆菌(Geobacillus stearothermophilus))、(NC_002940,基因座NP_873754;杜氏嗜血杆菌(Haemophilus ducreyi)35000HP)、(L42023,基因座AAC23087;流感嗜血杆菌(Haemophilusinfluenzae)Rd KW20)、(J05262;智人(Homo sapiens))、(YP_395294;清酒乳杆菌清酒亚种(Lactobacillus sakei subsp.sakei)23K)、(NC_005823,基因座YP_000273;问号钩端螺旋体哥本哈根血清型Fiocruz株(Leptospira interrogans serovar Copenhagenistr.Fiocruz)L1-130)、(AB003187;藤黄微球菌(Micrococcus luteus))、(NC_002946,基因座YP_208768;淋病奈瑟球菌(Neisseria gonorrhoeae)FA 1090)、(U00090,基因座AAB91752;根瘤菌属某个种(Rhizobium sp.)NGR234)、(J05091;酿酒酵母(Saccharomycescerevisae))、(CP000031,基因座AAV93568;波氏硅杆菌(Silicibacter pomeroyi)DSS-3)、(AE008481,基因座AAK99890;肺炎链球菌(Streptococcus pneumoniae)R6)和(NC_004556,基因座NP 779706;苛养木杆菌(Xylella fastidiosa)Temecula1)。
此外,宿主细胞可以含有编码可使IPP和DMAPP或者IPP和FPP组合形成香叶基香叶基焦磷酸酯(“GGPP”)的酶的异源核苷酸序列。编码此类酶的核苷酸序列的非限制性实例包括:(ATHGERPYRS;拟南芥(Arabidopsis thaliana))、(BT005328;拟南芥(Arabidopsisthaliana))、(NM_119845;拟南芥(Arabidopsis thaliana))、(NZ_AAJM01000380,基因座ZP_00743052;苏云金芽孢杆菌以色列血清型(Bacillus thuringiensis serovarisraelensis),ATCC 35646sq1563)、(CRGGPPS;长春花(Catharanthus roseus))、(NZ_AABF02000074,基因座ZP_00144509;具核梭杆菌文氏亚种(Fusobacterium nucleatumsubsp.vincentii),ATCC 49256)、(GFGGPPSGN;藤仓赤霉(Gibberella fujikuroi))、(AY371321;银杏(Ginkgo biloba))、(AB055496;巴西三叶胶(Hevea brasiliensis))、(AB017971;智人(Homo sapiens))、(MCI276129;卷枝毛霉拉斯坦变种(Mucorcircinelloides f.lusitanicus))、(AB016044;小家鼠(Mus musculus))、(AABX01000298,基因座NCU01427;粗糙链孢霉(Neurospora crassa))、(NCU20940;粗糙链孢霉(Neurosporacrassa))、(NZ_AAKL01000008,基因座ZP_00943566;青枯雷尔氏菌(Ralstoniasolanacearum)UW551)、(AB118238;褐家鼠(Rattus norvegicus))、(SCU31632;酿酒酵母(Saccharomyces cerevisiae))、(AB016095;细长聚球藻(Synechococcus elongates))、(SAGGPS;白芥(Sinapis alba))、(SSOGDS;嗜酸热硫化叶菌(Sulfolobusacidocaldarius))、(NC_007759,基因座YP_461832;嗜酸互营菌(Syntrophusaciditrophicus)SB)、(NC_006840,基因座YP_204095;费氏弧菌(Vibrio fischeri)ES114)、(NM_112315;拟南芥(Arabidopsis thaliana))、(ERWCRTE;成团泛菌(Pantoeaagglomerans))、(D90087,基因座BAA14124;Pantoea ananatis)、(X52291,基因座CAA36538;荚膜红杆菌(Rhodobacter capsulatus))、(AF195122,基因座AAF24294;球形红杆菌(Rhodobacter sphaeroides))和(NC_004350,基因座NP_721015;变异链球菌(Streptococcus mutans)UA159)。
虽然上文中描述了甲羟戊酸酯途径的酶的实例,但在某些实施方案中,DXP途径的酶可被用作用于在本文所述宿主细胞、组合物和方法中产生DMAPP和IPP的替代或额外途径。酶和编码DXP途径的酶的核酸是众所周知的并且在本领域,例如WO 2012/135591中被表征。
生产甜菊醇糖苷的方法
本发明提供了通过如下方式进行的甜菊醇糖苷的生产:(a)在适合于制备甜菊醇糖苷化合物的条件下,在具有碳源的培养基中培养本文所述的能够产生甜菊醇糖苷的任何经遗传修饰的宿主细胞的群体;以及(b)从所述培养基中回收甜菊醇糖苷化合物。
与不具有遗传修饰的亲本细胞或仅具有遗传修饰子集但在其他方面遗传同一的亲本细胞相比,经遗传修饰的宿主细胞产生的甜菊醇糖苷量增加。在一些实施方案中,如例如在产量、生产和/或生产率方面测得的,以克/升细胞培养物、毫克/克细胞干重表示,基于每单位体积的细胞培养物、基于每单位细胞干重、基于每单位体积的细胞培养物/单位时间或者基于每单位细胞干重/单位时间计的,增加的量为至少1%、5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、100%或大于100%。
在一些实施方案中,宿主细胞可产生升高的甜菊醇糖苷水平,其高于约1克/升发酵培养基。在一些实施方案中,宿主细胞产生升高的甜菊醇糖苷水平,其高于约5克/升发酵培养基。在一些实施方案中,宿主细胞产生升高的甜菊醇糖苷水平,其高于约10克/升发酵培养基。在一些实施方案中,甜菊醇糖苷以每升细胞培养基约10至约50克、约10至约15克、超过约15克、超过约20克、超过约25克或超过约40克的量产生。
在一些实施方案中,宿主细胞可产生升高的甜菊醇糖苷水平,其高于约50毫克/克细胞干重。在一些此类实施方案中,甜菊醇糖苷以每克细胞干重约50至约1500毫克、超过约100毫克、超过约150毫克、超过约200毫克、超过约250毫克、超过约500毫克、超过约750毫克或超过约1000毫克的量产生。
在一些实施方案中,宿主细胞产生升高的甜菊醇糖苷水平,该水平按每单位体积的细胞培养物计,比亲本细胞产生的甜菊醇糖苷水平高至少约10%、至少约15%、至少约20%、至少约25%、至少约30%、至少约35%、至少约40%、至少约45%、至少约50%、至少约60%、至少约70%、至少约80%、至少约90%、至少约2倍、至少约2.5倍、至少约5倍、至少约10倍、至少约20倍、至少约30倍、至少40倍、至少约50倍、至少约75倍、至少约100倍、至少约200倍、至少约300倍、至少约400倍、至少约500倍或至少约1,000倍或更高倍。
在一些实施方案中,宿主细胞产生升高的甜菊醇糖苷水平,该水平按每单位细胞干重计,比亲本细胞产生的甜菊醇糖苷水平高至少约10%、至少约15%、至少约20%、至少约25%、至少约30%、至少约35%、至少约40%、至少约45%、至少约50%、至少约60%、至少约70%、至少约80%、至少约90%、至少约2倍、至少约2.5倍、至少约5倍、至少约10倍、至少约20倍、至少约30倍、至少40倍、至少约50倍、至少约75倍、至少约100倍、至少约200倍、至少约300倍、至少约400倍、至少约500倍或至少约1,000倍或更高倍。
在一些实施方案中,宿主细胞产生升高的甜菊醇糖苷水平,该水平按每单位体积的细胞培养物/单位时间计,比亲本细胞产生的甜菊醇糖苷水平高至少约10%、至少约15%、至少约20%、至少约25%、至少约30%、至少约35%、至少约40%、至少约45%、至少约50%、至少约60%、至少约70%、至少约80%、至少约90%、至少约2倍、至少约2.5倍、至少约5倍、至少约10倍、至少约20倍、至少约30倍、至少40倍、至少约50倍、至少约75倍、至少约100倍、至少约200倍、至少约300倍、至少约400倍、至少约500倍或至少约1,000倍或更高倍。
在一些实施方案中,宿主细胞产生升高的甜菊醇糖苷水平,该水平按每单位细胞干重/单位时间计,比亲本细胞产生的甜菊醇糖苷水平高至少约10%、至少约15%、至少约20%、至少约25%、至少约30%、至少约35%、至少约40%、至少约45%、至少约50%、至少约60%、至少约70%、至少约80%、至少约90%、至少约2倍、至少约2.5倍、至少约5倍、至少约10倍、至少约20倍、至少约30倍、至少40倍、至少约50倍、至少约75倍、至少约100倍、至少约200倍、至少约300倍、至少约400倍、至少约500倍或至少约1,000倍或更高倍。
在大多数实施方案中,宿主细胞产生升高水平的甜菊醇糖苷可通过诱导化合物的存在来诱导。此类宿主细胞可以在不存在诱导化合物的情况下很容易地被操纵。然后加入诱导化合物以诱导宿主细胞产生升高水平的甜菊醇糖苷。在其他实施方案中,宿主细胞产生升高水平的甜菊醇糖苷可通过改变培养条件(诸如生长温度、培养基成分等)来诱导。
培养基和条件
用于微生物培养物的维持和生长的材料和方法是微生物学或发酵科学领域的技术人员众所周知的(参见,例如,Bailey等人,Biochemical Engineering Fundamentals,第二版,McGraw Hill,New York,1986)。根据宿主细胞、发酵和工艺的具体要求,必须考虑需氧、微需氧或厌氧条件的适当培养基、pH值、温度和要求。
本文提供的生产甜菊醇糖苷的方法可以在合适的容器中在合适的培养基(例如,补充有或未补充泛酸)中进行,所述容器包括但不限于细胞培养板、微量滴定板、烧瓶或发酵罐。此外,该方法可以在本领域已知的任何发酵规模下进行,以支持微生物产品的工业生产。可以使用任何合适的发酵罐,包括搅拌罐发酵罐、气升发酵罐、气泡发酵罐或其任何组合。在使用酿酒酵母(Saccharomyces cerevisiae)作为宿主细胞的特定实施方案中,可以使菌株在如Kosaric等人在Ullmann's Encyclopedia of Industrial Chemistry(第6版,第12卷,第398-473页,Wiley-VCH Verlag GmbH&Co.KDaA,Weinheim,Germany)中所详细描述的发酵罐中生长。
在一些实施方案中,所述培养基是能够产生甜菊醇糖苷的经遗传修饰的微生物可以在其中生存的任何培养基。所述培养基可以是包含可同化的碳源、氮源和磷酸盐源的水性培养基。此类培养基还可以包括适当的盐、矿物质、金属和其他营养物。可以将碳源和每种必需的细胞营养物逐渐地或连续地添加到发酵培养基中,并且可例如根据基于将碳源转化为生物质的细胞的代谢或呼吸功能的预定细胞生长曲线,将每种所需的营养物基本上维持在被生长中的细胞有效同化所需的最低水平。
用于培养微生物的合适的条件和合适的培养基是本领域众所周知的。例如,合适的培养基可以补充有一种或多种额外的剂,诸如诱导剂(例如,当一种或多种编码基因产物的核苷酸序列处于可诱导启动子的控制之下时)、阻遏物(例如,当一种或多种编码基因产物的核苷酸序列处于可抑制启动子的控制之下时),或选择剂(例如,选择用于包含遗传修饰的微生物的抗生素)。
所述碳源可以是单糖(简单糖)、二糖、多糖、不可发酵的碳源,或它们的一种或多种组合。合适的单糖的非限制性实例包括葡萄糖、半乳糖、甘露糖、果糖、木糖、核糖及其组合。合适的二糖的非限制性实例包括蔗糖、乳糖、麦芽糖、海藻糖、纤维二糖及其组合。合适的多糖的非限制性实例包括淀粉、糖原、纤维素、几丁质及其组合。合适的不可发酵碳源的非限制性实例包括乙酸盐和甘油。
培养基中碳源诸如葡萄糖的浓度可能足以促进细胞生长,但不会高到抑制所用微生物的生长。通常,培养物是与按用于达到所需生长和生物质的水平的水平添加的碳源(诸如葡萄糖)一起运行的。培养基中碳源(诸如葡萄糖)的浓度可大于约1g/L,优选大于约2g/L,并且更优选大于约5g/L。此外,培养基中碳源(诸如葡萄糖)的浓度通常小于约100g/L,优选小于约50g/L,并且更优选小于约20g/L。应该注意的是,培养物成分浓度的提及可以指初始和/或持续的成分浓度。在一些情况下,可能需要使培养基中的碳源能够在培养过程耗尽。
可以用于合适培养基中的可同化氮源包括简单氮源、有机氮源和复合氮源。此类氮源包括无水氨,铵盐以及动物、植物和/或微生物来源的物质。合适的氮源包括蛋白质水解物、微生物生物质水解物、蛋白胨、酵母提取物、硫酸铵、尿素和氨基酸。通常,培养基中氮源的浓度大于约0.1g/L,优选大于约0.25g/L,并且更优选大于约1.0g/L。然而,超过一定浓度,氮源在培养基中的添加对微生物的生长不利。因此,培养基中氮源的浓度小于约20g/L,优选小于约10g/L,并且更优选小于约5g/L。进一步地,在一些情况下,可能需要使培养基中的氮源能够在培养过程中耗尽。
有效培养基可以含有其他化合物,诸如无机盐、维生素、痕量金属或生长促进剂。此类其他化合物也可以存在于有效培养基中的碳源、氮源或矿物源中,或者可以专门添加到培养基中。
培养基还可以含有合适的磷酸盐源。此类磷酸盐源包括无机磷酸盐源和有机磷酸盐源。优选的磷酸盐源包括磷酸盐,诸如磷酸二氢钠或磷酸一氢钠和磷酸二氢钾或磷酸一氢钾、磷酸铵,以及它们的混合物。通常,培养基中磷酸盐的浓度大于约1.0g/L,优选大于约2.0g/L,并且更优选大于约5.0g/L。然而,超过一定浓度,磷酸盐在培养基中的添加对微生物的生长不利。因此,培养基中磷酸盐的浓度通常小于约20g/L,优选小于约15g/L,并且更优选小于约10g/L。
合适的培养基还可以包括优选呈生理学上可接受的盐的形式的镁源,诸如七水硫酸镁,但可以使用贡献相似镁量的浓度的其他镁源。通常,培养基中镁的浓度大于约0.5g/L,优选大于约1.0g/L,并且更优选大于约2.0g/L。然而,超过一定浓度,镁在培养基中的添加对微生物的生长不利。因此,培养基中镁的浓度通常小于约10g/L,优选小于约5g/L,并且更优选小于约3g/L。进一步地,在一些情况下,可能需要使培养基中的镁源能够在培养过程中耗尽。
培养基还可以包含生物学上可接受的螯合剂,诸如柠檬酸三钠的二水合物。在此类情况下,培养基中螯合剂的浓度大于约0.2g/L,优选大于约0.5g/L,并且更优选大于约1g/L。然而,超过一定浓度,螯合剂在培养基中的添加对微生物的生长不利。因此,培养基中螯合剂的浓度通常小于约10g/L,优选小于约5g/L,并且更优选小于约2g/L。
培养基还可以初始包含生物学上可接受的酸或碱以维持培养基的期望pH。生物学上可接受的酸包括但不限于盐酸、硫酸、硝酸、磷酸及其混合物。生物学上可接受的碱包括但不限于氢氧化铵、氢氧化钠、氢氧化钾及其混合物。在一些实施方案中,使用的碱是氢氧化铵。
培养基还可以包含生物学上可接受的钙源,包括但不限于氯化钙。通常,培养基中钙源(诸如氯化钙二水合物)的浓度在约5mg/L至约2000mg/L的范围内,优选在约20mg/L至约1000mg/L的范围内,并且更优选在约50mg/L至约500mg/L的范围内。
培养基还可以包含氯化钠。通常,培养基中氯化钠的浓度在约0.1g/L至约5g/L的范围内,优选在约1g/L至约4g/L的范围内,并且更优选在约2g/L至约4g/L的范围内。
培养基还可以包含痕量金属。此类痕量金属可以作为储备溶液添加到培养基中,为方便起见,该储备溶液可以与培养基的其余部分分开制备。通常,添加到培养基中的此类痕量金属溶液的量大于约1ml/L,优选大于约5mL/L,并且更优选大于约10mL/L。然而,超过一定浓度,痕量金属在培养基中的添加对微生物的生长不利。因此,添加到培养基中的此类痕量金属溶液的量通常小于约100mL/L,优选小于约50mL/L,更优选小于约30mL/L。应该注意的是,除了在储备溶液中添加痕量金属外,还可以单独添加各个组分,每个组分均在独立对应于上述痕量金属溶液范围规定的组分量的范围内。
培养基可以包含其他维生素,诸如泛酸盐(pantothenate)、生物素、钙、泛酸盐、肌醇、盐酸吡哆醇和盐酸硫胺素。此类维生素可以作为储备溶液添加到培养基中,为方便起见,该储备溶液可以与培养基的其余部分分开制备。然而,超过一定浓度,维生素在培养基中的添加对微生物的生长不利。
本文所述的发酵方法可在常规培养模式下执行,常规培养模式包括但不限于分批、流加(fed-batch)、细胞再循环、连续和半连续发酵。在一些实施方案中,发酵以流加模式进行。在此种情况下,包括在发酵生产阶段过程中的泛酸盐在内的培养基的一些成分在培养过程中被消耗。在一些实施方案中,可以在例如生产阶段的开始时向培养物中补加相对高浓度的此类组分,以便在需要添加之前支持生长和/或甜菊醇糖苷生产一段时间。在整个培养过程中,随着水平被培养物耗尽,通过添加来保持这些成分的优选范围。培养基中组分的水平可以通过例如定期对培养基取样和测定浓度来监测。替代地,一旦制定了标准培养程序,就可以在整个培养过程中的特定时间以对应于已知水平的计时间隔进行添加。如本领域技术人员将认识到,在培养过程中,随着培养基的细胞密度增加,营养物的消耗速率也增加。此外,为了避免将外来微生物引入培养基中,使用本领域已知的无菌添加方法进行添加。此外,在培养过程中可以添加消泡剂。
培养基的温度可以是适合于经遗传修饰的细胞生长和/或甜菊醇糖苷生产的任何温度。例如,在给培养基接种接种物之前,可以使培养基达到并保持在约20℃至约45℃的范围内的温度,优选地保持在约25℃至约40℃的范围内的温度,更优选地在约28℃至约32℃的范围内的温度。培养基的pH值可以通过向培养基中添加酸或碱来控制。在此类情况下,当氢氧化铵被用于控制pH值时,它也可以方便地用作培养基中的氮源。优选地,将pH值维持在约3.0至约8.0,更优选地约3.5至约7.0,并且最优选地约4.0至约6.5。
在培养期间监测培养基的碳源浓度,诸如葡萄糖浓度。可以使用已知技术监测培养基的葡萄糖浓度,诸如使用葡萄糖氧化酶测试或高压液相色谱,其可用于监测上清液,例如培养基的无细胞组分中的葡萄糖浓度。碳源浓度通常被保持为低于发生细胞生长抑制的水平。虽然此浓度可能因生物体而异,但对于作为碳源的葡萄糖而言,细胞生长抑制发生在葡萄糖浓度高于约60g/L时,并且可以通过试验轻松确定。因此,当葡萄糖被用作碳源时,葡萄糖优选被供给到发酵罐中并被保持为低于检测限。替代地,培养基中的葡萄糖浓度被维持在约1g/L至约100g/L的范围内,更优选地在约2g/L至约50g/L的范围内,并且还更优选在约5g/L至约20g/L的范围内。尽管可以通过添加例如基本纯的葡萄糖溶液将碳源浓度保持在所需水平范围内,但通过添加原始培养基的等分试样来保持培养基的碳源浓度是可以接受的并且可能是优选的。使用原始培养基的等分试样可能是合乎需要的,因为可以同时保持培养基中其他营养物(例如氮源和磷酸盐源)的浓度。同样,通过添加痕量金属溶液的等分试样,可以保持培养基中的痕量金属浓度。
其他合适的发酵培养基和方法描述于例如WO 2016/196321中。
发酵组合物
本文提供了发酵组合物,其含有本文所述的经遗传修饰的宿主细胞和由经遗传修饰的宿主细胞产生的甜菊醇糖苷。发酵组合物可进一步含有培养基。发酵组合物可以含有经遗传修饰的宿主细胞Reb A、Reb D和/或Reb M。本文提供的发酵组合物可以含有作为由经遗传修饰的宿主产生的甜菊醇糖苷的主要成分的Reb M。发酵组合物可以含有比例为至少1:7:50的Reb A、Reb D和Reb M。发酵组合物可以含有比例为至少1:7:50至1:0.5:150的Reb A、Reb D和Reb M。Reb A、Reb D和Reb M的比例可以基于与经遗传修饰的宿主细胞和培养基相关的甜菊醇糖苷的总含量。替代地,Reb A、Reb D和Reb M的比例可以基于培养基中甜菊醇糖苷的总含量。进一步地,Reb A、Reb D和Reb M的比例可以基于与经遗传修饰的宿主细胞相关的甜菊醇糖苷的总含量。
发酵组合物可以含有不可检测水平的Reb M2。此外,发酵组合物可以含有不可检测水平的非天然存在的甜菊醇糖苷。
甜菊醇糖苷的回收
一旦宿主细胞产生甜菊醇糖苷,就可以使用本领域已知的任何合适的分离和纯化方法回收或分离它以供后续使用。例如,可以通过离心将含有甜菊醇糖苷的澄清水相从发酵液中分离出来。替代地,可以通过向发酵反应中加入破乳剂将含有甜菊醇糖苷的澄清水相从发酵液中分离出来。破乳剂的实例包括絮凝剂和凝结剂。
宿主细胞中产生的甜菊醇糖苷可以存在于培养物上清液中并且/或者与宿主细胞相关。在其中一些甜菊醇糖苷与宿主细胞相关的情况下,甜菊醇糖苷的回收可能涉及改善甜菊醇糖苷从细胞中的释放的方法。这可以采取用含有或不含表面活性剂,且含有或不含添加的缓冲剂或盐的热水或缓冲处理液(buffer treatment)洗涤细胞的形式。温度可以是被认为适合于使甜菊醇糖苷释放的任何温度。例如,温度可以在40至95℃或60至90℃或75到85℃的范围内。替代地,温度可以是40、45、50、55、65、70、75、80、85、90或95℃。物理或化学细胞破碎可用于增强甜菊醇糖苷从宿主细胞中的释放。替代地和/或随后,可以使用分离单元操作回收培养基中的甜菊醇糖苷,所述分离单元操作包括溶剂提取、膜澄清、膜浓缩、吸附、层析、蒸发、化学衍生、结晶和干燥。
制作经遗传修饰的细胞的方法
本文还提供了用于生产被遗传工程改造成含有上述一种或多种修饰,例如,一种或多种编码例如针对甜菊醇糖苷化合物的贝壳杉烯酸羟化酶和/或生物合成途径酶的异源核酸的宿主细胞的方法。异源酶在宿主细胞中的表达可以通过向宿主细胞中引入核酸来实现,该核酸包含在允许在宿主细胞中表达的调控元件控制下编码酶的核苷酸序列。核酸可以是染色体外质粒、可以将核苷酸序列整合到宿主细胞染色体中的染色体整合载体,或者可以经由同源性将核苷酸序列整合到宿主细胞染色体中的双链DNA的线性片段。
编码这些蛋白质的核酸可以通过本领域技术人员已知的任何方法引入宿主细胞中(参见,例如Hinnen等人,(1978)Proc.Natl.Acad.Sci.USA,第75卷,第1292-1293卷;Cregg等人,(1985),Mol.Cell.Biol.,第5卷,第3376-3385卷;Goeddel等人,编者,1990,Methods in Enzymology,第185卷,Academic Press,Inc.,CA;Krieger,1990,GeneTransfer and Expression--A Laboratory Manual,Stockton Press,NY;Sambrook等人,1989,Molecular Cloning--A Laboratory Manual,Cold Spring Harbor Laboratory,NY;以及Ausubel等人,编者,现行版,Current Protocols in Molecular Biology,GreenePublishing Associates and Wiley Interscience,NY)。示例性技术包括原生质球(spheroplasting)、电穿孔、PEG 1000介导的转化和乙酸锂或氯化锂介导的转化。
宿主细胞中酶的量可以通过修改编码酶的基因的转录来改变。这可以通过如下方式来实现:修改编码酶的核苷酸序列的拷贝数(例如,通过使用更高或更低拷贝数的包含核苷酸序列的表达载体,或通过将额外拷贝的核苷酸序列引入到宿主细胞的基因组中或通过删除或破坏宿主细胞基因组中的核苷酸序列)、通过改变操纵子的多顺反子mRNA上的编码序列的顺序或将操纵子分解成各具有自己的控制元件的单个基因,或通过增加与核苷酸序列可操作地连接的启动子或操纵子的强度。替代地或此外,宿主细胞中酶的拷贝数可以通过修改编码酶的mRNA的翻译水平来改变。这可以通过如下方式来实现:修改mRNA的稳定性、修改核糖体结合位点的序列、修改核糖体结合位点与酶编码序列的起始密码子之间的距离或序列、修改位于酶编码区的起始密码子的5'侧“上游”或附近的整个顺反子间区域、使用发夹和特化序列稳定mRNA转录物的3'端、修改酶的密码子用法、改变用于酶的生物合成中使用的稀有密码子tRNA的表达,以及/或者例如通过使酶的编码序列突变来增加酶的稳定性。
酶在宿主细胞中的活性可以通过多种方式改变,所述方式包括使在宿主细胞中表现出增加或降低的溶解度的酶的修饰形式表达、使酶的改变形式表达(该改变形式缺乏借以抑制酶活性的结构域)、使对底物具有更高或更低的Kcat或者更低或更高的Km的酶的修饰形式表达、使具有更高或更低热稳定性的酶的修饰形式表达、使在细胞的pH值下具有更高或更低活性的酶的修饰形式表达、使在亚细胞区室或细胞器中具有更高或更低蓄积的酶的修饰形式表达、使具有增加或减少的插入细胞膜或与细胞膜结合的能力的酶表达、使对执行反应所需的辅助蛋白具有更高或更低的亲和力的酶的修饰形式表达、使对必要辅因子或配体具有更高或更低亲和力的酶的修饰形式表达、使在活性位点中具有增加或减少的空间(从而差异地允许或排除该反应的不同底物)的酶的修饰形式表达,或者使或多或少受途径中另一个分子的反馈或前馈调节影响的酶的改变形式表达。
用于遗传修饰宿主细胞的核酸可以含有一种或多种可用于选择转化的宿主细胞和用于对宿主细胞施加选择压力以保持外源DNA的可选择标记物。
可选择标记物可以是抗生素抗性标记物。抗生素抗性标记物的实例包括BLA、NAT1、PAT、AUR1-C、PDR4、SMR1、CAT、小鼠dhfr、HPH、DSDA、KANR和SH BLE基因产物。来自大肠埃希氏菌(E.coli)的BLA基因产物赋予对β-内酰胺类抗生素(例如,窄谱头孢菌素、头霉素和碳青霉烯类(厄他培南)、头孢孟多和头孢哌酮)以及对所有抗革兰氏阴性菌青霉素类抗生素(替莫西林除外)的抗性;来自诺氏链霉菌(S.noursei)的NAT1基因产物赋予对诺尔丝菌素的抗性;来自产绿色链霉菌(S.Viridochromogenes)Tu94的PAT基因产物赋予对双丙氨磷(bialophos)的抗性;来自酿酒酵母(Saccharomyces cerevisiae)的AUR1-C基因产物赋予对金担子素A(Auerobasidin A,AbA)的抗性;PDR4基因产物赋予对浅蓝菌素的抗性;SMR1基因产物赋予对甲嘧黄隆的抗性;来自Tn9转座子的CAT基因产物赋予对氯霉素的抗性;小鼠dhfr基因产物赋予对甲氨蝶呤的抗性;肺炎克雷伯菌(Klebsiella pneumonia)的HPH基因产物赋予对潮霉素B的抗性;大肠埃希氏菌(E.coli)的DSDA基因产物允许细胞在具有作为唯一氮源的D-丝氨酸的平板上生长;Tn903转座子的KANR基因赋予对G418的抗性;来自印度异壁链霉菌(Streptoalloteichus hindustanus)的SH BLE基因产物赋予对Zeocin(博来霉素)的抗性。在分离本文所公开的经遗传修饰的宿主细胞后,可以删除抗生素抗性标记物。
可选择标记物可以通过挽救经遗传修饰的微生物中的营养缺陷体(例如营养型营养缺陷体)而起作用。在营养缺陷体中,亲本微生物在一种或多种在氨基酸或核苷酸生物合成途径中起作用的基因产物中含有功能性破坏,其使亲本细胞无法在未补充一种或多种营养物的培养基中生长。此类基因产物包括酵母中的HIS3、LEU2、LYS1、LYS2、MET15、TRP1、ADE2和URA3基因产物。然后可以通过用编码被破坏的基因产物的功能拷贝的表达载体或染色体整合构建体转化亲本细胞来挽救营养缺陷体表型,并且生成的经遗传修饰的宿主细胞可以基于亲本细胞的营养缺陷体表型的丧失来选择。使用URA3、TRP1和LYS2基因作为可选择标记物具有显著优势,因为正选择和负选择都是可能的。正选择是通过URA3、TRP1和LYS2突变的营养缺陷互补进行的,而负选择是基于特异性抑制剂,即分别阻止原养菌株的生长,但分别允许URA3、TRP1和LYS2突变体的生长的5-氟乳清酸(FOA)、5-氟邻氨基苯甲酸和氨基己二酸(aAA)。可选择标记物可以挽救能够通过已知选择方法鉴定的其他非致死缺陷或表型。
本文描述了在本发明的方法、组合物和宿主细胞中有用的特定基因和蛋白质;然而,这些基因的绝对同一性并不是必需的。例如,可以执行含有编码多肽或酶的序列的特定基因或多核苷酸的变化并针对活性筛选该变化。通常,此类变化涉及保守突变和沉默突变。可以使用本领域已知的方法针对功能性酶的表达筛选此类修饰或突变的多核苷酸和多肽。
由于遗传密码的内在简并性,编码基本相同或功能等效的多肽的其他多核苷酸也可用于表达酶。
修饰编码序列以增强其在特定宿主中的表达可能是有利的。遗传密码是冗余的,有64个可能的密码子,但大多数生物通常使用这些密码子的子集。物种中最常使用的密码子称为最佳密码子,并且那些不经常使用的密码子被归类为稀有或低利用率密码子。在有时被称为“密码子优化”或“物种密码子偏性控制”的过程中,可以替换密码子以反映宿主的偏爱密码子用法。其他宿主细胞的密码子优化可以使用密码子用法表轻松确定,或者可以使用市售软件(诸如来自Integrated DNA Technologies的CodonOp)执行。
可以制备含有特定原核或真核宿主所偏爱的密码子的优化编码序列(Murray等人,(1989),Nucl Acids Res.,第17卷,第477-508页),以增加翻译率或者以产生与从非优化序列产生的转录物相比具有所需特性(诸如更长的半衰期)的重组RNA转录物。还可以修改翻译终止密码子以反映宿主偏好。例如,酿酒酵母(S.cerevisiae)和哺乳动物的典型终止密码子分别是UAA和UGA。单子叶植物的典型终止密码子是UGA,而昆虫和大肠埃希氏菌(E.coli)通常使用UAA作为终止密码子(Dalphin等人,(1996),Nucl Acids Res.,第24卷,第216-218页)。
由于遗传密码的简并性质,在核苷酸序列上不同的多种DNA分子可被用于编码本公开的给定酶。本文中引用编码上述生物合成酶的原生DNA序列仅是为了说明本公开的实施方案,并且本公开包括编码本发明的方法中使用的酶的多肽和蛋白质的氨基酸序列的任何序列的DNA分子。以类似方式,多肽通常可以耐受其氨基酸序列中的一个或多个氨基酸取代、缺失和插入,而不会损失或显著损失所需活性。本发明包括具有与本文所述的特定蛋白质不同的氨基酸序列的此类多肽,只要经修饰的或变异的多肽具有参考多肽的酶活性即可。此外,由本文所示DNA序列编码的氨基酸序列仅说明本发明的实例。
此外,本发明涵盖可用于组合物、方法或宿主细胞的实践的酶的同源物。当氨基酸序列具有至少约30%、40%、50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性时,两种蛋白质(或蛋白质的区域)被认为具有实质同源性。为了确定两个氨基酸序列或两个核酸序列的同一性百分比,对序列进行比对以实现最佳比较目的(例如,可以在第一和第二氨基酸或核酸序列中的一者或两者中引入缺口以实现最佳比对,并且出于对应比较目的,可以忽略非同源序列)。出于比较目的而比对的参考序列的长度可以是参考序列的长度的至少30%,通常至少40%,更通常至少50%,甚至更通常至少60%,甚至更通常至少70%、80%、90%、100%。然后比较相应氨基酸位置或核苷酸位置处的氨基酸残基或核苷酸。当第一序列中的某个位置被与第二序列中的相应位置相同的氨基酸残基或核苷酸占据时,则该分子在该位置是同一的(如本文所用,氨基酸或核酸“同一性”等同于氨基酸或核酸“同源性”)。考虑到缺口的数量和每个缺口的长度,两个序列之间的同一性百分比是序列共有的同一性位置的数量的函数,需要引入这些缺口以实现两个序列的最佳比对。
当针对蛋白质或肽使用“同源的”时,应认识到不同一的残基位置常常因保守氨基酸取代而不同。“保守氨基酸取代”是其中氨基酸残基被另一个带有具有相似化学性质(例如,电荷或疏水性)的侧链(R基团)的氨基酸残基取代的氨基酸取代。一般而言,保守氨基酸取代将不会实质性改变蛋白质的功能特性。在两个或更多个氨基酸序列因保守置换彼此不同的情况下,可向上调整序列同一性百分比或同源性程度以校正该取代的保守性质。作出此调整的手段是本领域技术人员众所周知的(参见,例如,Pearson WR,(1994),Methods inMol Biol,第25卷,第365-389页)。
以下六组各自含有为彼此的保守取代形式的氨基酸:1)丝氨酸(S)、苏氨酸(T);2)天冬氨酸(D)、谷氨酸(E);3)天冬酰胺(N)、谷氨酰胺(Q);4)精氨酸(R)、赖氨酸(K);5)异亮氨酸(I)、亮氨酸(L)、丙氨酸(A)、缬氨酸(V)以及6)苯丙氨酸(F)、酪氨酸(Y)、色氨酸(W)。
多肽的序列同源性也被称为序列同一性百分比,通常使用序列分析软件测量。用于将分子序列与包含来自不同生物体的大量序列的数据库进行比较的典型算法是计算机程序BLAST。当搜索含有来自大量不同生物体的序列的数据库时,通常比较氨基酸序列。
此外,可以通过遗传/蛋白质工程技术,诸如定向进化或合理诱变来优化编码前述酶或者控制或调节其表达的任何调节元件的任何基因。此类作用允许本领域普通技术人员优化酶在酵母中的表达和活性。
此外,可以从其他真菌和细菌物种中鉴定出编码这些酶的基因,并且可以使其表达以调节甜菊醇糖苷途径。多种生物体可以作为这些酶的来源,所述生物体包括酵母菌属某些种(Saccharomyces spp.),包括酿酒酵母(S.cerevisiae)和葡萄汁酵母(S.uvarum);克鲁维酵母属某些种(Kluyveromyces spp.),包括耐热克鲁维酵母(K.thermotolerans)、乳酸克鲁维酵母(K.lactis)和马克斯克鲁维酵母(K.marxianus);毕赤酵母属某些种(Pichia spp.);汉逊酵母属某些种(Hansenula spp.),包括多形汉逊酵母(H.polymorpha);念珠菌属某些种(Candida spp.);毛孢子菌属某些种(Trichosporonspp.);接合糖酵母属(Yamadazyma spp.),包括树干接合糖酵母(Y.Spp.stipitis);球有孢圆酵母(Torulaspora pretoriensis);东方伊萨酵母(Issatchenkia orientalis);裂殖酵母菌属某些种(Schizosaccharomyces spp.),包括粟酒裂殖酵母(S.pombe);隐球菌属某些种(Cryptococcus spp.);曲霉菌属某些种(Aspergillus spp.);链孢霉属某些种(Neurospora spp.)或黑粉菌属某些种(Ustilago spp.)。来自厌氧真菌的基因的来源包括梨囊鞭菌属某些种(Piromyces spp.)、根囊鞭菌属某些种(Orpinomyces spp.)或新丽鞭菌属某些种(Neocallimastix spp.)。有用的原核酶的来源包括大肠埃希氏菌(Escherichiacoli)、运动发酵单胞菌(Zymomonas mobilis)、金黄色葡萄球菌(Staphylococcusaureus)、芽孢杆菌属某些种(Bacillus spp.)、梭菌属某些种(Clostridium spp.)、棒状杆菌属某些种(Corynebacterium spp.)、假单胞菌属某些种(Pseudomonas spp.)、乳球菌属某些种(Lactococcus spp.)、肠杆菌属某些种(Enterobacter spp.)和沙门菌属某些种(Salmonella spp.)。
本领域技术人员已知的技术可能适用于鉴定额外的同源基因和酶。通常,类似基因和/或类似酶可以通过功能分析来鉴定,并且将具有功能相似性。已知适用于鉴定类似基因和类似酶的技术包括PCR、简并PCR、低严谨度核酸杂交、表达克隆和高通量筛选。例如,为了鉴定同源或类似的UDP糖基转移酶、KAH或任何甜菊醇糖苷生物合成途径基因、蛋白质或酶,技术可能包括但不限于通过使用基于公布的目的基因/酶的序列的引物执行PCR来克隆基因,或者通过使用被设计用于扩增目的基因中的保守区域的简并引物执行简并PCR来克隆基因。此外,人们可以使用技术来鉴定具有功能同源性或相似性的同源或类似基因、蛋白质或酶。技术包括针对酶的催化活性通过针对所述活性的体外酶测定法检查细胞或细胞培养物(例如,如本文或Kiritani,K.(Branched-Chain Amino Acids Methods Enzymology,1970)中所述),然后通过纯化分离出具有所述活性的酶,然后通过诸如以下的技术来确定酶的蛋白质序列:Edman降解、针对可能的核酸序列对PCR引物进行设计、通过PCR对所述DNA序列进行扩增,以及对所述核酸序列进行克隆。为了鉴定同源或相似的基因和/或同源或相似的酶、相似基因和/或相似的酶或蛋白质,技术还包括将关于候选基因或酶的数据与诸如BRENDA、KEGG或MetaCYC等的数据库进行比较。候选基因或酶可以根据本文的教导在上述数据库内鉴定。
实施例
实施例1:酵母转化方法
在优化的乙酸锂转化中,使用标准分子生物学技术将每个DNA构建体整合到酿酒酵母(Saccharomyces cerevisiae)(CEN.PK113-7D)中。简而言之,使细胞在酵母提取物蛋白胨右旋糖(YPD)培养基中在30℃于振荡(200rpm)下生长过夜,将该细胞在100mL YPD中稀释至OD600为0.1,并让该细胞生长至OD600为0.6-0.8。对于每次转化,通过离心收获5mL培养物,将其在5mL无菌水中洗涤,再次离心,重新悬浮在1mL 100mM乙酸锂中,并转移到微量离心管中。将细胞离心(13,000x g)30秒,去除上清液,并将细胞重新悬浮在由240μL 50%PEG、36μL 1M乙酸锂、10μL煮鲑鱼精子DNA和74μL供体DNA组成的转化混合物中。对于需要表达核酸内切酶F-CphI的转化,供体DNA包含携带在酵母TDH3启动子下表达的F-CphI基因的质粒。以此类方式表达的F-CphI核酸内切酶切割宿主菌株中被工程改造的特异性识别位点,以促进感兴趣的靶基因的整合。在42℃下热休克40分钟后,使细胞在YPD培养基中过夜恢复,然后将其在选择性培养基上铺板。DNA整合是通过用对整合具有特异性的引物进行的菌落PCR确认的。
实施例2:能够高通量产生法尼基焦磷酸酯(FPP)和类异戊二烯法尼烯的基础菌株的制取
法尼烯生产菌株是从野生型酿酒酵母(Saccharomyces cerevisiae)菌株(CEN.PK113-7D)通过使甲羟戊酸酯途径的基因在原生GAL启动子控制下表达来创建的。该菌株包含来自酿酒酵母(S.cerevisiae)的以下染色体整合的甲羟戊酸酯途径基因:乙酰辅酶A硫解酶、HMG辅酶A合酶、HMG辅酶A还原酶、甲羟戊酸激酶、磷酸甲羟戊酸酯激酶、甲羟戊酸焦磷酸酯脱羧酶和IPP:DMAPP异构酶。此外,该菌株含有来自青蒿素的法尼烯合酶的多个拷贝,其也处在原生GAL1或GAL10启动子的控制下。本文所述的所有异源基因均使用公开可用的或其他合适的算法进行了密码子优化。该菌株还含有GAL80基因的缺失,并且编码角鲨烯合酶的ERG9基因通过用酵母基因MET3的启动子替换原生启动子来进行了下调。创建高通量产生类异戊二烯的酿酒酵母(S.cerevisiae)菌株的方法的实例描述于美国专利第8,415,136号和美国专利第8,236,512中,它们均以其整体并入本文。
实施例3:一系列用于快速筛选新型贝壳杉烯酸羟化酶P450酶的菌株的构建
图1示出了使用贝壳杉烯酸中间体从FPP到Reb M的示例性生物合成途径。通过将香叶基香叶基焦磷酸酯合酶(GGPPS)的6个拷贝、柯巴基二磷酸酯合酶的4个拷贝和贝壳杉烯合酶的4个拷贝整合到基因组中,将上述法尼烯基础菌株进一步工程改造为能以高通量产生C20类异戊二烯贝壳杉烯。随后,从该菌株中去除法尼烯合酶的所有拷贝,并确认该菌株产生对映贝壳杉烯且不产生法尼烯。
贝壳杉烯酸羟化酶(KAH)是催化贝壳杉烯酸氧化产生甜菊醇(参见图1)的细胞色素P450酶,其是产生Reb M所必需的。为筛查新型P450酶在酿酒酵母(S.cerevisiae)中的体内KAH活性,制造了几种菌株,它们含有产生Reb M必需的所有基因,但是它们缺少任何KAH基因拷贝。表1列出了所有使用的Reb M途径基因和启动子。含有表1中描述的所有基因的菌株主要产生贝壳杉烯酸(KAH的底物)。
表1:用于将FPP转化为Reb M的酶的基因、启动子和氨基酸序列。
Figure BDA0003386303570000481
Figure BDA0003386303570000491
*前65个氨基酸被甲硫氨酸取代。
为了测量酿酒酵母(S.cerevisiae)体内KAH变体的活性,最初构建了第一筛选菌株,该菌株含有产生Reb M所需的所有基因,但是它缺少任何KAH基因拷贝(表1和图1)。相反,它含有用于允许快速插入KAH变体的着陆垫(landing pad)(图2)。该着陆垫由构建体任一端上位于所选择的酵母基因座上游和下游的基因组区域(上游基因座和下游基因座)的500bp基因座靶向DNA序列组成,从而使得在该着陆垫被整合到酵母染色体中时该基因座被删除。在内部,着陆垫含有启动子(Promoter)和所选的酵母终止子(Terminator),所述启动子可以是GAL1、GAL3,或酵母GAL调节的任何其他启动子,所述酵母终止子侧接核酸内切酶识别位点(F-CphI)。Ro.KAH(SEQ ID NO:1)的DNA变体与表达核酸内切酶F-CphI的质粒一起被用于转化菌株,所述表达核酸内切酶F-CphI的质粒切割识别序列,在着陆垫处产生双链断裂,并促进Ro.KAH DNA变体在该位点处的同源重组。
制取了第二筛选菌株,其具有与第一筛选菌株相同的工程改造,但是Sr.KO被Ps.KO(SEQ ID NO:10)替换。Ps.KO酶描述于PCT/US2018/046359(用于高效生产莱苞迪甙的豌豆贝壳杉烯氧化酶(PISUM SATIVUM KAURENE OXIDASE FOR HIGH EFFICIENCYPRODUCTION OF REBAUDIOSIDES),于2018年8月10日提交),并且在将贝壳杉烯转化为贝壳杉烯酸方面的活性明显更高(图1)。因此,第二筛选菌株具有更高的通向贝壳杉烯酸(KAHP450的底物)碳通量。
这些菌株及其修饰的衍生物(例如,不同的GAL启动子和酵母终止子可在着陆垫内用于调节KAH基因的表达)被称为缺乏功能性KAH基因的产Reb M酵母。
实施例4:酵母培养条件
将经证实含有预期KAH基因的酵母菌落挑入到含有Bird Seed培养基(BSM,最初由van Hoek等人,Biotechnology and Bioengineering 68(5),2000,第517-523页描述)的96孔微孔板中,该培养基含有20g/L蔗糖、37.5g/L硫酸铵和1g/L赖氨酸。将细胞在高容量微量滴定板培养箱中在30℃于1000rpm和80%湿度下振荡培养3天,直到培养物达到碳耗尽。通过从饱和培养物中取出14.4μL并稀释到360μL新鲜培养基中来将生长饱和的培养物传代培养到含有BSM的新平板中,该BSM含有40g/L蔗糖、150g/L硫酸铵和1g/L赖氨酸。在提取和分析之前,将生产培养基中的细胞在高容量微量滴定板振荡器中在30℃于1000rpm和80%湿度下再培养3天。
实施例5:用于分析甜菊醇糖苷的全细胞肉汤样品制备条件
为了提取细胞产生的所有甜菊醇糖苷(参见图1),在培养完成后,将全细胞肉汤用628μL 100%乙醇稀释,用箔密封件密封,并以1250rpm振荡30秒。将水(314μL)直接添加到每个孔中以稀释提取物,然后将板短暂离心以沉淀固体。将含有0.48mg/L莱鲍迪苷N(用作内标)的乙醇:水混合物(198μL 50:50)分配到新的250μL测定板中,并向该测定板中添加2μL培养物/乙醇混合物。将箔密封件施加到该板上以进行分析。
实施例6:分析方法
使用带有具有C8小柱的RapidFire 365系统自动进样器的质谱仪(Agilent6470-QQQ)对源自产生甜菊醇糖苷的酵母的样品(实施例5)进行常规分析。在该测定中测量了甜菊醇糖苷和不希望有的杂质(缩写为C20H32O4+1Glc)。
表2:RapidFire 365系统配置。
Figure BDA0003386303570000501
Figure BDA0003386303570000511
表3:6470-QQQ MS方法配置。
Figure BDA0003386303570000512
该质谱仪是在负离子多反应监测(MRM)模式下操作的。通过前体离子质量和MRM跃变对每种甜菊醇糖苷进行了鉴定(表4)。C19处不稳定羧酸酯连键处的断裂允许区分位置异构体Reb A和Reb E,而使用该方法无法区分悬钩子苷和甜菊醇双苷(甜菊醇+2Glc)或者甜菊苷和Reb B(甜菊醇+3Glc)。
表4:甜菊醇糖苷和相应前体和产物离子的质量。
Figure BDA0003386303570000513
Figure BDA0003386303570000521
使用来自质谱仪的色谱图的峰面积生成使用真实标准品的校准曲线。相关化合物的摩尔比是通过使用真实标准品,通过外部校准定量每种化合物的以摩尔表示的量,然后取适当的比例来确定。由于缺乏C20H32O4+1Glc的纯化真实标准品,因此仅从相应的峰面积评估不同酵母菌株中C20H32O4+1Glc的相对产量。
为了确定特异性甜菊醇糖苷并为了评估新副产物的存在,还在配备有AcquityUPLC BEH C18柱(15cm,2.1mm,1.7μm,
Figure BDA0003386303570000524
部件编号186002353)的Thermo FisherScientific Vanquish UHPLC系统(表5)上使用超高效液相色谱(UHPLC)分析选定的样品。使用Vanquish核电气溶胶检测器(CAD)(表6)和Thermo Fisher Scientific Q-ExactiveOrbitrap质谱仪(表7)利用柱后分流比5:1(至CAD的为5,至MS的为1)使用Restek二元固定流量分流器进行双重检测。
表5:Vanquish UHPLC色谱条件。
Figure BDA0003386303570000522
表6:Vanquish CAD检测器配置。
Figure BDA0003386303570000523
Figure BDA0003386303570000531
表7:Q-Exactive Orbitrap MS方法配置。离子源条件:
Figure BDA0003386303570000532
扫描设置:
Figure BDA0003386303570000533
Figure BDA0003386303570000541
基于从真实标准品、分子离子和MS碎片模式确定的保留时间,将峰身份归属于甜菊醇糖苷和C20H32O4+1Glc(表8)。
表8:甜菊醇糖苷、它们的保留时间和前体离子。
Figure BDA0003386303570000542
实施例7:来自喜阴悬钩子(Rubus occidentalis)的KAH是具有KAH活性的新型P450酶
先前鉴定的来自植物甜叶悬钩子(Rubus suavissimus)(也称为中国黑莓或中国甜叶)的KAH酶(Rs.KAH;SEQ ID NO:3)被用作用于搜索相关植物黑树莓(喜阴悬钩子(Rubusoccidentalis))的基因组的查询物(query)。喜阴悬钩子(R.occidentalis)的全基因组组装可在(https://www.rosaceae.org/organism/Rubus/occidentalis)公开获得。使用网站上默认的tBLASTn特征和Rs.KAH氨基酸序列作为查询序列,鉴定出了由3号染色体上的五个外显子编码的推定KAH直向同源物。通过将五个外显子的DNA编码序列翻译成单个蛋白质序列(SEQ ID NO:1)来推导推定Ro.KAH的蛋白质序列。生成了推定Ro.KAH蛋白的酵母密码子优化DNA序列(SEQ ID NO:2),并组装了相应的合成DNA序列。
酵母密码子优化的Ro.KAH基因是使用引物进行PCR扩增的,所述引物被设计为与着陆垫中的启动子和酵母终止子DNA序列具有40bp的侧翼同源性(参见图2)。这些侧翼被添加到扩增的基因的末端上,以促进同源重组到宿主菌株的特定基因座处的着陆垫中。用作实验对照的额外的其他KAH基因也用在着陆垫中含有相同40bp侧翼序列的引物进行扩增。将每个KAH基因作为单拷贝单独转化到上述Reb M筛选菌株(实施例3)中,并筛选它们在体内被表达时产生甜菊醇糖苷的能力。实施例3中描述的宿主菌株不能产生甜菊醇糖苷,因为它们缺乏任何KAH基因。因此,为了生产甜菊醇糖苷,引入到转化体中的基因产物必须具有KAH活性,并且能够将贝壳杉烯酸转化为甜菊醇,以便被宿主酵母的UGT基因进一步糖基化。
为了测定在宿主菌株中的体内KAH活性,提取菌株产生的全细胞肉汤中的甜菊醇糖苷并通过质谱法对进行测量(实施例4-6)。计算所有甜菊醇糖苷的总和(以μM计)并将其报告为总甜菊醇糖苷(TSG)。通过将含有特定KAH酶的菌株的TSG测量值针对含有野生型Rs.KAH酶的菌株的TSG测量值作归一化,计算单个KAH变体的活性。
推定Ro.KAH序列在宿主菌株中的过表达证实该基因的蛋白质产物编码KAH活性(图3)。正如预期,没有KAH基因的宿主菌株不会产生任何甜菊醇糖苷。先前鉴定的编码At.KAH(SEQ ID NO:4)或Rs.KAH(SEQ ID NO:3)的基因的表达导致甜菊醇糖苷的产生(图3)。以此这种方式测得的Ro.KAH的活性比At.KAH或Rs.KAH的KAH活性高(分别高出4倍和1.5倍)。
实施例8:野生型Ro.KAH经由定点饱和诱变的进化
在该实施例中,提供了野生型Ro.KAH和在用于产生甜菊醇糖苷(包括Reb M)的酿酒酵母(S.cerevisiae)宿主中表达时改善Ro.KAH活性的特异性突变的活性数据。
使用产生两组文库的简并密码子使Ro.KAH中的每个氨基酸残基发生突变。简并密码子由任一NDT与VHG的组合(第一组)或者与NNY的组合(第二组)组成,其中N代表任何核苷酸腺嘌呤、胸腺嘧啶、鸟嘌呤和胞嘧啶;D代表腺嘌呤、鸟嘌呤和胸腺嘧啶;T代表胸腺嘧啶;V代表腺嘌呤、胞嘧啶和鸟嘌呤;H代表腺嘌呤、胞嘧啶和胸腺嘧啶;G代表鸟嘌呤;Y代表胞嘧啶和鸟嘌呤。简并密码子NDT编码12种不同的氨基酸(R、N、D、C、G、H、I、L、F、S、Y和V),而简并密码子VHG则以相同比例编码9种不同的氨基酸(A、E、K、L、M、P、Q、T和V)。当VHG和NDT以3:4的比例混合时,除色氨酸外的所有氨基酸都以大致等摩尔的量表示。简并密码子NNY编码15种不同的氨基酸(A、C、D、F、G、H、I、L、N、P、R、S、T、V和Y)。每个文库均是使用设计用于引入简并密码子的引物通过PCR构建的,这样每个PCR产物均含有基因变体的混合物,其中19(第一组)或15(第二组)种可能的不同氨基酸在对应于单个蛋白质残基的特定位置处被编码。在每个PCR产物中,Ro.KAH基因变体库的两端侧接40bp的与宿主菌株中着陆垫的启动子和终止子区域同源的序列,如前面的实施例中所述的。
将代表Ro.KAH中单个氨基酸处的变化的每个变体库独立地转化到宿主酵母中,并如上所述筛选突变对KAH活性的影响。对于第1层筛选,每个位点选择24个菌落进行筛选,大致代表该文库的1.4倍采样率。野生型Ro.KAH序列(SEQ ID NO:1)中的每个氨基酸都按照所述发生诱变和筛选。
通过对所有甜菊醇糖苷(总甜菊醇糖苷或TSG;以μM计)进行加和来推导出由KAH产生的甜菊醇的量。通过比较由含有突变氨基酸的菌株产生的TSG与由含有野生型Ro.KAH蛋白的菌株产生的TSG,计算特定突变的影响。在发现Ro.KAH中增加酶体内活性的突变后,使用与上述相同的计算,以更高的复制(N>8)进行第2层筛选,以确认甜菊醇产量的改善。如果突变体产生的甜菊醇糖苷的中位数量比野生型Ro.KAH蛋白产生的甜菊醇糖苷的中位数量高出至少一个标准差,则认为突变改善了Ro.KAH活性。
通过筛选上述两组文库,发现了总共154个独特突变,它们改善了Ro.KAH活性,使其比野生型酶活性高出一个标准差(图4)。表9列出了每个突变相对于野生型Ro.KAH的平均改善倍数。野生型Sr.KAH的活性包括在图4和表9中供参考。注意,Ro.KAH的前六种突变体(S452D、I104A、V340S、F229Y、A297Y、A297F)的活性比野生型Sr.KAH改善了一个标准差或更多个标准差。
表9:使按总甜菊醇糖苷测得的野生型Ro.KAH活性增加了超过一个标准差的Ro.KAH等位基因。列出了相关氨基酸变化和与野生型Ro.KAH相比较的改善倍数。
Figure BDA0003386303570000571
Figure BDA0003386303570000581
Figure BDA0003386303570000591
Figure BDA0003386303570000601
Figure BDA0003386303570000611
实施例9:Ro.KAH经由组合诱变的进化(以全因子方式被靶向用于诱变的24个氨基酸残基)
从实施例8中描述的独特定点饱和诱变命中物中选择两组12个突变,以构建两个全因子组合文库。第一组合文库含有突变L54G、Y55P、F88R、I104A、K119S、T123D、P161D、T162A、S165D、M171F、T216A、K224I,而第二组合文库含有突变F229Y、L232Y、A236R、I284G、K291C、D293C、A297Y、F332L、S339A、V340A、S452D、L485F。这些文库被设计用于创建12种突变之间的所有可能组合,以找到导致体内Ro.KAH活性最高的组合。这些基因是由含有所需突变的PCR扩增片段的混合物组装而成的。每个片段在每个碎片的末端上含有重叠同源性,因此各碎片按顺序重叠;使用PCR在体外将所有片段组装在一起,这重建了全长KAH等位基因。末端5'和3'碎片也与缺乏功能性KAH基因的产Reb M酵母中着陆垫序列的启动子和终止子具有同源性。将组装好的全长文库基因转化到酵母中。
在产Reb M酵母中以0.9x覆盖率筛选第1层组合文库DNA。通过对由含有多个突变氨基酸的菌株产生的TSG与由含有如上所述的野生型Ro.KAH蛋白的菌株产生的TSG(实施例8)进行比较来计算特定突变组合的影响。从组合文库筛选中鉴定出的56个表现最好的KAH等位基因,在N=8次重复时被提升到第2层构象。这些变体中的大多数产生比野生型Ro.KAH高出至少1.4倍的TSG,其中排名居前的变体导致产量改善5.02倍(图5和表10)。有趣的是,大多数改善的变体每个变体仅含有两个或三个突变,只有五个变体含有四个突变,并且没有鉴定出含有超过四个突变的改善变体(表10)。氨基酸取代的最佳组合仅包含两个突变:F332L和S452D。
表10:改善的Ro.KAH等位基因、TSG相对于野生型Ro.KAH活性的改善倍数以及相关的氨基酸变化。
Figure BDA0003386303570000612
Figure BDA0003386303570000621
Figure BDA0003386303570000631
实施例10:贝壳杉烯酸上由Ro.KAH活性的副产物衍生的不希望有的杂质C20H32O4+1Glc的鉴定
使用配备有串联CAD和Orbitrap-MS检测器的UHPLC分析源自表达Ro.KAH的酵母的样品产生的不是图1中描述的Reb M途径的一部分的另外的代谢物(分析详细信息参见实施例6)。对表达Ro.KAH、Sr.KAH、Rs.KAH或不表达KAH的菌株的CAD色谱图的比较鉴定出了一个Ro.KAH特有的峰(图6B)。对高分辨率离子质量和MS/MS碎片化模式的进一步检查确定,该目标峰具有与单糖基化的贝壳杉烯酸+氧+水一致的分子式C26H42O9(图6C和6D)。对于表达Rs.KAH的Reb M产生者,在CAD色谱图中也可检测到具有相同保留时间的小峰,但丰度对于MS表征而言太低。
基于细胞色素P450超家族的已知反应性范围,似乎Ro.KAH可以将贝壳杉烯酸转化为两种产物甜菊醇或环氧化物中的任一种(图6A)。然后,环氧化物可以自发水解为二醇,并在羧酸酯位点(C19)处被Reb M途径的一种糖基转移酶糖基化,从而生成与由新峰检测到的离子质量一致的糖基化二醇产物。虽然已经存在于贝壳杉烯酸核心中的立体中心可能保留在名为C20H32O4+1Glc的二醇中,但C16处的立体化学无法使用本研究中使用的方法测定。
在C16处具有定义的S构型的C20H32O4+1Glc(结构如图6A所示)先前已从若干植物中分离出来。最值得注意的是,它已被鉴定为甜叶悬钩子(R.suavissimus)的甜叶的无味次要成分,其是Rs.KAH的来源(Ohtani等人,Phytochemistry 31(5),1992,第1553-1559页)并且被命名为甜茶苷E(suavioside E)。Stevia phlebophylla A.Gray(一种罕见的墨西哥物种)(Ceunen等人,Carbohydrate Research 379,2013,第1-6页)以及几种紫菀属(Aster)的中国药用植物品种(Cheng等人,Phytochemistry 33(5),1993,第1181-1183页;Tan等人,Journal of Natural Products 56(11),1993,第1917-1922页;Tan等人,MagneticResonance in Chemistry 33(9),1995,第749-754页)和几种粗根树属(Cussonia)的非洲植物品种(Harinantenaina等人,Chemical&Pharmaceutical Bulletin 50(2),2002,第268-271页;Harinantenaina等人,Chemical&Pharmaceutical Bulletin 50(8),2002,第1122-1123页;Harinantenaina等人,Phytochemistry 61(4),2002,第367-372页)似乎产生相同的化合物。
C16处具有定义的R构型的C20H32O4+1Glc(结构如图6A所示)常常被称为paniculoside IV,也已从许多不同的植物中分离出来,所述植物包括但不限于粗根树属(Cussonia)物种(Harinantenaina等人,Chemical&Pharmaceutical Bulletin 50(2),2002,第268-271页;Harinantenaina等人,Chemical&Pharmaceutical Bulletin 50(8),2002,第1122-1123页;Harinantenaina等人,Phytochemistry 61(4),2002,第367-372页)、蚤草属(Pulicaria)物种(Darwish等人,Alexandria Journal of PharmaceuticalSciences 15(1),2001,第21-24页;Rasool等人,Natural Product Communications 3(2),2008,第141-144页;Rasool等人,Natural Product Communications 8(6),2013,第757-759页)、朝鲜五加(Acanthopanax koreanum)(Cai等人,Archives of Pharmacal Research26(9),2003,第731-734页;Cai等人,Phytotherapy Research 18(8),2004,第677-680页)以及其他几种植物。
上述植物源性天然产物的先前分离和表征的报告为图6A中示出的C20H32O4+1Glc的提议结构提供了支持,但不能明确地证实该结构。然而,仅在Ro.KAH存在下的C20H32O4+1Glc的产生证实了,该酶除形成甜菊醇外还形成了副产物。这就需要这样的Ro.KAH酶变体进化,其除了具有改善的整体活性外,还具有改善的产物特异性,即具有增加的甜菊醇形成并同时具有减少的不良副产物的绝对量和相对量。
实施例11:通过靶向46个氨基酸残基的定点饱和诱变改善Ro.KAH A297Y的活性和产物特异性
如实施例10中所述,表达Ro.KAH的酵母不仅产生Reb M和其他次要的甜菊醇糖苷(作为Reb M途径的中间体),而且以约1:2的摩尔比(C20H32O4+1Glc:Reb M)产生不希望有的副产物C20H32O4+1Glc。因此,Ro.KAH的活性和产物特异性的改善都是以下列实施例中描述的文库为目标。
为了进一步改善Ro.KAH的活性和产物特异性,将另一轮定点饱和诱变应用于实施例8中描述的排名靠前的SSM变体之一(Ro.KAH A297Y)上。使Ro.KAH A297Y序列中46种选定氨基酸(F128、I129、I132、L136、L140、A141、T142、G143、L144、A145、N146、Y238、K241、I243、I273、I277、K328、L329、F330、Y331、F332、A333、G334、Q335、E336、T337、T338、A396、V397、I398、E399、L400、P401、P463、F464、G465、G466、G467、P468、R469、I470、I472、G473、Y506、I508和T509)中的每一者均突变为由简并密码子NNS编码的20种不同氨基酸(A、R、N、D、C、E、Q、G、H、I、L、K、M、F、P、S、T、W、Y和V),其中N代表任何核苷酸腺嘌呤、胸腺嘧啶、鸟嘌呤和胞嘧啶,S代表鸟嘌呤和胞嘧啶。Ro.KAH A297Y基因变体的NNS文库是如实施例8中所述,在所需位置处使用含有NNS简并密码子的引物通过PCR构建,并用于转化缺乏功能性KAH基因的产Reb M酵母。
在第1层筛选中测量NNS文库突变体的体内KAH活性。通过比较由突变株产生的RebM滴度与由含有野生型Ro.KAH蛋白的菌株产生的Reb M,计算特定突变(除A297Y以外)的影响。由于下游糖基转移酶在Reb M途径中的高效率,Reb M占TSG的一大部分,而其他甜菊醇糖苷仅以微量存在。使用相对Reb M滴度作为KAH体内活性的度量简化了数据分析,并产生与相对TSG测量相同的变体排名。还使用副产物C20H32O4+1Glc的MS色谱图的峰面积和RebM的滴度(μM),在第1层筛选中相对于野生型Ro.KAH测量了NNS文库突变体的体内KAH产物特异性。通过计算突变体相对于野生型Ro.KAH产生的Reb M(μM)与突变体相对于野生型Ro.KAH产生的副产物C20H32O4+1Glc的比率,估计产物特异性的倍数变化:
Figure BDA0003386303570000661
为蛋白质序列中的每个突变位置筛选了39个分离株,从而使得对于每个独特的变体,在N=1时覆盖率为大约1.2x。在发现似乎会增加酶的体内活性和产物特异性的突变与Ro.KAH A297Y的组合后,使用含有感兴趣的特异性突变体的菌株的更高复制(N=8)进行第2层筛选,以便使用如上所述的计算证实改善。NNS衍生的突变体Ro.KAH等位基因的所得活性和产物特异性以相对于野生型Ro.KAH的改善倍数报告在图7和表11中。
表11:改善的Ro.KAH A297Y等位基因:相关氨基酸变化和相对于野生型Ro.KAH活性和产物特异性的改善倍数。
Figure BDA0003386303570000662
Figure BDA0003386303570000671
鉴定出了23个导致相对于野生型Ro.KAH在活性和产物特异性方面的改善的突变与A297Y的组合,其中大多数改善的变体是由位置141、142和146处的氨基酸取代引起的。来自该定点饱和诱变NNS文库的最佳活性突变体(N146T/A297Y)与野生型Ro.KAH相比提供了5.2倍的体内KAH活性改善。最佳特异性突变体(N146W/A297Y)与野生型Ro.KAH相比在KAH产物特异性方面提供了12.97倍的改善。有趣的是,在活性和特异性方面的最高改善是由相同位置N146处的诱变引起的,但是是由不同的氨基酸取代(分别为T和W)引起的。
实施例12:通过组合的定点饱和诱变改善Ro.KAH A297Y的活性和产物特异性
为了进一步改善Ro.KAH的活性和产物特异性,将组合定点饱和诱变应用于实施例8中描述的排名靠前的SSM变体之一(Ro.KAH A297Y)上。在这种类型的诱变(也称为组合活性位点饱和试验(CAST;Reetz等人,Angewandte Chemie International Edition English44(27),2005,第4192-4196页))中,两个空间上接近的氨基酸残基同时发生突变,这允许源自侧链取向的潜在协同效应。因此,创建了十个文库,其中Ro.KAH A297Y突变体中的以下两个氨基酸残基同时发生突变:F128和F129、L144和A145、A145和N146、K328和F332、F330和G334、F332和T337、A396和V397、V397和I398、R507和I508、I508和T509。每个氨基酸残基突变为12个由简并密码子NDT编码的不同氨基酸(R、N、D、C、G、H、I、L、F、S、Y和V),其中N代表任何核苷酸腺嘌呤、胸腺嘧啶、鸟嘌呤和胞嘧啶,D代表腺嘌呤、鸟嘌呤和胸腺嘧啶;T代表胸腺嘧啶。Ro.KAH A297Y基因变体的NDT文库是如实施例8中所述,在所需位置处使用含有NDT简并密码子的引物通过PCR构建,并用于转化缺乏功能性KAH基因的产Reb M酵母。
如实施例11中所述的那样测量了突变体的体内KAH活性和产物特异性的变化。为蛋白质序列中的每个突变位置筛选了39个分离株,使得对于第1层中的每个独特变体而言,在N=1时覆盖率为大约2x。在发现似乎会增加酶的体内活性和产物特异性的突变与Ro.KAHA297Y的组合后,以含有感兴趣的特异性突变体的菌株的更高复制(N=8)进行了第2层筛选以证实改善。突变体Ro.KAH等位基因的所得活性和产物特异性以相对于野生型Ro.KAH的增加倍数报告于图8中。表12列出了图8中描述的文库命中物的子集,特别是具有被同时引入到Ro.KAH A297Y中的两个(不是仅一个)氨基酸变化的那些。
表12:改善的Ro.KAH A297Y等位基因:相关氨基酸变化和相对于野生型Ro.KAH活性和产物特异性的改善倍数。
Figure BDA0003386303570000681
Figure BDA0003386303570000691
从该组合文库中鉴定出许多相对于野生型Ro.KAH具有产物特异性改善的变体,其中变体A145G/N146F/A297Y导致相对于野生型Ro.KAH的9.6倍的特异性改善。特异性改善的代价是牺牲总活性:相对于亲本Ro.KAH A297Y具有两个氨基酸变化的变体均不具有比亲本酶更好的活性,并且仅少数具有单个氨基酸变化的变体具有比亲本酶更好的活性。当超过一个氨基酸残基同时发生突变时,这并不奇怪。
实施例13:Ro.KAH N146T/A297Y通过全定点饱和诱变的进化
为了进一步改善Ro.KAH N146T/A297Y(排名靠前的活性变体,实施例11)的活性,应用了另一轮定点饱和诱变以分离在将贝壳杉烯酸转化为甜菊醇方面具有甚至更高活性的突变变体(图1)。Ro.KAH N146T/A297Y序列中的每个氨基酸残基均突变为15个由简并密码子NNT编码的不同氨基酸(A、C、D、F、G、H、I、L、N、P、R、S[由两个密码子编码]、T、V和Y),其中N代表任何核苷酸腺嘌呤、胸腺嘧啶、鸟嘌呤和胞嘧啶,T代表胸腺嘧啶。Ro.KAH N146T/A297Y的NNT文库是如实施例8中所述,在所需位置处使用含有NNT简并密码子的引物通过PCR构建,并用于转化缺乏功能性KAH基因的产Reb M酵母。
如实施例11中所述的那样评估了Ro.KAH N146T/A297Y突变体的相对体内KAH活性和产物特异性。为蛋白质序列中的每个突变位置筛选了13个分离株,使得对于第1层中每个独特变体而言,在N=1时覆盖率为大约0.8x。在发现似乎会增加酶的体内活性的Ro.KAHN146T/A297Y中的突变后,以含有感兴趣的特异性突变体的菌株的更高复制(N=8)进行第2层筛选以证实改善。对在第2层中被证实活性得到改善的变体进行第3层验证,其中使用含有与启动子和终止子序列具有同源性的引物,从具有改善的表现的产Reb M菌株对突变变体的DNA序列进行PCR扩增,并将该变体用于转化缺乏KAH基因的产Reb M酵母。第3层消除了第1层和第2层中因酵母基因组中其他地方意外、随机引入的突变产生的假阳性。NNT衍生的突变体Ro.KAH N146T/A297Y等位基因的所得活性和产物特异性以与Ro.KAH N146T/A297Y相比的增加倍数报告于表13中。
表13:改善的Ro.KAH N146T/A297Y等位基因:相关氨基酸变化和相对于Ro.KAHN146T/A297Y活性和产物特异性的改善倍数。
Figure BDA0003386303570000701
鉴定出五个导致在从与Ro.KAH N146T/A297Y相比的1.18至1.25倍的范围内的活性改善的突变。这些突变中的4个也导致适度的特异性改善,排在前两名的变体Q84R/N146T/A297Y和N146T/A297Y/G466A导致1.2倍的特异性改善。
实施例14:Ro.KAH N146W/A297Y通过全定点饱和诱变的进化
为了进一步改善Ro.KAH N146W/A297Y(排名靠前的特异性变体,实施例11)的活性,应用了另一轮定点饱和诱变以分离在将贝壳杉烯酸转化为甜菊醇方面具有甚至更高活性的突变变体(图1)。使Ro.KAH N146W/A297Y序列中的每个氨基酸残基均突变为15个由如实施例13中所述的简并密码子NNT编码的不同氨基酸,并在缺乏功能KAH基因的产Reb M酵母中测试所得突变体。
如实施例11中所述的那样评估了Ro.KAH N146T/A297Y突变体的相对体内KAH活性和产物特异性。如实施例13中所述的那样执行文库覆盖和分层筛选。NNT衍生的突变体Ro.KAH N146W/A297Y等位基因的所得活性和产物特异性以与Ro.KAH N146W/A297Y相比的增加倍数报告在图9和表14中。
表14:改善的Ro.KAH N146W/A297Y等位基因:相关氨基酸变化和与Ro.KAH N146W/A297Y活性和产物特异性相比的改善倍数。
Figure BDA0003386303570000711
Figure BDA0003386303570000721
鉴定出26个导致在从与Ro.KAH N146W/A297Y相比的1.3至2.2倍的范围内的活性改善的突变。同样的26个突变也导致了与Ro.KAH N146W/A297Y相比的特异性改善,排名靠前的变体Ro.KAH N146W/A297Y/S460I导致1.8倍的特异性改善。
实施例15:Ro.KAH N146T/A297Y/G466A通过定点饱和诱变和突变巩固的进化
为了进一步改善具有最高KAH活性的排名靠前的突变变体的活性,对Ro.KAHN146T/A297Y/G466A(实施例13,表13)进行又一轮靶向68个氨基酸的定点饱和诱变,其中许多氨基酸在先前的实施例中被证明可以改善活性(W52、Q84、T123、I129、T142、T216、I265、K267、T283、F332、V340、S452、S457、S460、S505、W52、Q84、T123、I129、T142、R170、M171、L172、P173、S174、F175、H176、Q177、S178、C179、T180、T216、I265、N266、K267、E268、I269、K270、G271、L272、I273、I277、I278、K279、R280、E281、H282、T283、I284、K285、A286、G287、E288、F332、V340、Q409、L410、G411、K412、F413、S414、L415、P416、E417、G418、V419、E420、V421、R422、L423、P424、T425、L426、L427、I428、H429、H430、D431、K432、S452、S457、S460、S505)。使Ro.KAH N146T/A297Y/G466A序列中这68个氨基酸残基中的每一个均突变为如实施例13中所述的15个由简并密码子NNT编码的不同氨基酸,并在缺乏功能KAH基因的产RebM酵母中测试所得突变体。如实施例11中所述的那样评估了Ro.KAH N146T/A297Y突变体的相对体内KAH活性和产物特异性。文库覆盖和分层筛选如实施例13中所述的那样进行。
在该筛选中识别出的命中物非常少,即使这些命中物也只有不太大的活性改善。因此,新的排名靠前的活性命中物Ro.KAH T142G/N146T/A297Y/G466A产生的Reb M比文库亲本Ro.KAH N146T/A297Y/G466A产生的Reb M多不到10%(表15)。有趣的是,Ro.KAHT142G/N146T/A297Y/G466A变体在该组中也具有最好的产物特异性:相对于文库亲本改善1.7倍。特异性突变T142G也在先前数轮的工程化中被鉴定为对活性和产物特异性有益,产生的活性改善随着随后的每轮工程化的进行而减少:在Ro.KAH A297Y(实施例11,表11)中超过4倍,在Ro.KAH N146W/A297Y(实施例14,表14)中为40%。
为了探索突变T142G在其他背景中是否有益,将其与其他排名靠前的有益的突变W52T和G466A组合进行测试。简而言之,从含有所需突变的PCR扩增片段的混合物组装变体Ro.KAH W52T/T142G/N146T/A297Y和Ro.KAH W52T/T142G/N146T/A297Y/G466A的基因序列。每个片段在每个碎片的末端上含有重叠同源性,因此各碎片按顺序重叠;使用PCR在体外将所有片段组装在一起,这重建了全长KAH等位基因。末端5'和3'碎片也与着陆垫序列的启动子和终止子具有同源性。将组装的全长基因转化到缺乏功能KAH基因的产Reb M酵母中,并如实施例11中所述的那样评估它们的相对体内KAH活性和产物特异性。Ro.KAH变体的所得活性和产物特异性以相对于Ro.KAH N146T/A297Y/G466A的增加倍数报告于表15中。
表15:改善的Ro.KAH N146T/A297Y等位基因:相关氨基酸变化和与Ro.KAH N146T/A297Y/G466A活性和产物特异性相比的改善倍数。
Figure BDA0003386303570000731
对于Ro.KAH的新四重和五重突变体,未检测到相对于三重突变体Ro.KAH N146T/A297Y/G466A的显著改善。随着回报随着后每一轮工程化递减,可能已经达到了局部最小值。有趣的是,仅将T142G突变掺入到Ro.KAH W52T/N146T/A297Y序列中导致活性降低但产物特异性改善,而掺入T142G和G466A改善了活性和特异性(表15)。
实施例16:用于改善Ro.KAH变体的体内活性的N末端结构域交换
本实施例提供了具有取代的N末端结构域的修饰的贝壳杉烯酸羟化酶多肽,其表现出改善的活性。
贝壳杉烯酸羟化酶是细胞色素P450酶。大多数真核P450是膜结合蛋白,并且膜相关细胞色素P450酶的高级结构域结构是高度保守的。将植物细胞色素P450酶掺入到具有介导膜靶向的约30-50个氨基酸的N-末端多肽链的内质网(ER)中。P450酶的催化结构域面向内质网的细胞质侧。已经证明,将Sr.KAH的ER相关N末端与其他N末端跨膜结构域,例如来自青蒿素(Artemisia annua)(Aa.CPR)的细胞色素P450还原酶(CPR)的N末端跨膜结构域交换可改善KAH酶的活性。参见PCT/US2019/056153。如下所述,针对Ro.KAH变体测试了类似的途径。
使用TMHMM服务器(可在http://www.cbs.dtu.dk/services/TMHMM/获取)预测Ro.KAH中的跨膜结构域。然后,将它用Aa.CPR(SEQ ID NO:22)的前66个氨基酸替换。探索了不同长度的截断体(从Ro.KAH的N末端去除了23至50个氨基酸),而与这些截断体的N末端融合的Aa.CPR的序列保持不变。从含有重叠同源性的Aa.CPR和Ro.KAH变体的PCR扩增片段的混合物组装嵌合蛋白的基因序列,并将其转化到缺乏功能KAH基因的产Reb M酵母中。如实施例11中所述的那样评估嵌合蛋白的体内KAH活性,并将其作为与无任何结构域交换的相应Ro.KAH变体相比的Reb M滴度增加倍数报告于表16中。确定截断Ro.KAH的前25个氨基酸会导致每个被测试变体的N末端融合活性最高;因此,表16中仅给出了这些嵌合体的数据。
表16:源自N末端结构域交换的Aa.CPR-Ro.KAH融合的等位基因和相对于无结构域交换的Ro.KAH亲本序列的Reb M滴度改善倍数。
Figure BDA0003386303570000741
Figure BDA0003386303570000751
对于所有被测试的Ro.KAH突变体,与Aa.CPR的N末端结构域交换产生的Ro.KAH变体具有10-17%的KAH活性改善。随着N末端结构域交换,嵌合蛋白的产物分布(Reb M和C20H32O4+1Glc的相对滴度)没有变化(数据未示出)。这是预期的,因为副产物的分配可能由P450催化结构域的氨基酸决定,而不是由膜靶向结构域决定。尽管不太大,但由N末端结构域交换引起的KAH活性增加似乎与由Ro.KAH序列内的点突变引起的活性改善相加,为活性改善提供了另一个杠杆。
在本专利说明书中引用的所有出版物、专利和专利申请均以引用的方式并入本文,如同每篇单独的出版物或专利申请被具体且单独地以引用的方式并入。尽管为了清楚理解的目的,已经通过说明和示例的方式对上述发明进行了一些详细的描述,但根据本发明的教导,本领域的普通技术人员将很容易明白,可在不背离所附权利要求书的精神或范围的情况下对本发明作出某些变化和修改。
序列附录
SEQ ID NO:1;Ro.KAH氨基酸序列
MEVTVGSWVALSLVFVSIIVGWAWSVLDWVWLKPKKLERCLREQGLKGNSYWFLYGDMKENSILLKQAKSKPMNLSTSHDIAPQVIPFVDQTVKVYGKNSFDWIGPIPRVNIMNPEELKDVFTKYDDFIKPISNPLFKLLATGLANYEGEKWAKHRRIINPTFHSEKLKRMLPSFHQSCTEMIKEWESLVSKEGSSCELDVWPFLENMTADVISRTAFGTSYKKGRKIFELLREQAIYATKAIQSFYIPGWRFLPTKMNKRMKEINKEIKGLIKGIIIKREHTIKAGEETKDDLLGALMESNLKDIREHGKNNKNFGMSIEDVIEECKLFYFAGQETTSVLLVWTMVLLGQNQNWQDRARQEILQVFGSNKPDFDGLTHLKVVTMILLEVLRLYPAVIELPRTIHKKTQLGKFSLPEGVEVRLPTLLIHHDKELWGDDANEFKPERFSEGVSKATKSRLSFFPFGGGPRICIGQNFAMMEAKLALVLILQHFTFELSPSYAHAPSYRITLQPQYGVPIILHRR
SEQ ID NO:2;Ro.KAH编码核酸序列
ATGGAAGTAACCGTTGGATCTTGGGTAGCTTTGTCCTTAGTCTTCGTTTCTATTATCGTCGGTTGGGCTTGGTCCGTTTTAGATTGGGTCTGGTTGAAACCAAAGAAGTTAGAAAGATGTTTGAGAGAACAAGGTTTAAAGGGTAACTCTTACTGGTTCTTGTATGGTGACATGAAAGAGAACTCTATTTTGTTGAAGCAAGCTAAGTCTAAGCCAATGAACTTATCTACCTCTCACGACATCGCCCCACAAGTTATTCCATTTGTCGACCAAACTGTCAAGGTCTACGGTAAGAACTCTTTCGATTGGATCGGTCCTATTCCAAGAGTCAATATCATGAACCCAGAAGAATTGAAGGATGTTTTCACCAAGTACGATGACTTCATCAAGCCAATTTCTAACCCTTTGTTCAAGTTGTTGGCTACCGGTTTGGCTAATTACGAAGGTGAGAAGTGGGCTAAGCACAGACGTATTATCAACCCAACTTTCCATTCTGAGAAGTTGAAAAGAATGTTGCCATCCTTCCACCAATCTTGTACTGAAATGATCAAGGAATGGGAATCTTTGGTTTCTAAGGAAGGTTCTTCTTGTGAGTTAGACGTCTGGCCATTCTTAGAAAACATGACCGCTGACGTTATTTCTAGAACTGCTTTCGGTACTTCTTACAAGAAGGGTAGAAAGATTTTCGAATTGTTGAGAGAACAAGCTATTTACGCCACCAAGGCTATCCAATCTTTTTACATTCCAGGTTGGCGTTTTTTGCCTACTAAAATGAACAAGAGAATGAAGGAAATCAACAAGGAGATCAAGGGTTTGATTAAGGGTATCATCATCAAAAGAGAACACACTATCAAGGCTGGTGAAGAAACTAAGGATGACTTGTTAGGTGCTTTGATGGAATCTAACTTGAAGGACATTAGAGAACACGGTAAGAACAACAAGAACTTCGGTATGTCTATCGAAGACGTTATCGAAGAGTGTAAGTTGTTCTACTTTGCTGGTCAAGAAACTACTTCTGTTTTGTTAGTTTGGACCATGGTTTTGTTGGGTCAAAATCAAAACTGGCAAGATAGAGCTAGACAAGAAATCTTGCAAGTTTTTGGTTCTAATAAGCCAGACTTCGATGGTTTGACTCACTTGAAAGTTGTCACCATGATTTTATTGGAAGTCTTGAGATTGTACCCAGCTGTTATCGAATTGCCAAGAACCATTCACAAGAAGACTCAATTGGGTAAATTCTCTTTACCTGAAGGTGTTGAAGTTAGATTGCCAACTTTGTTAATCCACCATGATAAGGAATTGTGGGGTGATGACGCTAACGAATTCAAGCCAGAACGTTTCTCTGAAGGTGTTTCTAAGGCTACCAAATCCAGATTGTCCTTTTTTCCTTTCGGTGGTGGTCCTAGAATCTGTATTGGTCAAAACTTTGCTATGATGGAAGCTAAATTGGCTTTGGTTTTGATTTTGCAACACTTCACTTTCGAATTGTCCCCTTCCTACGCCCATGCTCCATCCTACAGAATTACCTTACAACCTCAATATGGTGTCCCTATTATCTTGCACCGTCGTTA
SEQ ID NO:3;Rs.KAH
MEVTVASSVALSLVFISIVVRWAWSVVNWVWFKPKKLERFLREQGLKGNSYRFLYGDMKENSILLKQARSKPMNLSTSHDIAPQVTPFVDQTVKAYGKNSFNWVGPIPRVNIMNPEDLKDVLTKNVDFVKPISNPLIKLLATGIAIYEGEKWTKHRRIINPTFHSERLKRMLPSFHQSCNEMVKEWESLVSKEGSSCELDVWPFLENMSADVISRTAFGTSYKKGQKIFELLREQVIYVTKGFQSFYIPGWRFLPTKMNKRMNEINEEIKGLIRGIIIDREQIIKAGEETNDDLLGALMESNLKDIREHGKNNKNVGMSIEDVIQECKLFYFAGQETTSVLLAWTMVLLGQNQNWQDRARQEVLQVFGSSKPDFDGLAHLKVVTMILLEVLRLYPPVIELIRTIHKKTQLGKLSLPEGVEVRLPTLLIHHDKELWGDDANQFNPERFSEGVSKATKNRLSFFPFGAGPRICIGQNFSMMEAKLALALILQHFTFELSPSHAHAPSHRITLQPQYGVRIILHRR
SEQ ID NO:4;At.KAH
MESLVVHTVNAIWCIVIVGIFSVGYHVYGRAVVEQWRMRRSLKLQGVKGPPPSIFNGNVSEMQRIQSEAKHCSGDNIISHDYSSSLFPHFDHWRKQYGRIYTYSTGLKQHLYINHPEMVKELSQTNTLNLGRITHITKRLNPILGNGIITSNGPHWAHQRRIIAYEFTHDKIKGMVGLMVESAMPMLNKWEEMVKRGGEMGCDIRVDEDLKDVSADVIAKACFGSSFSKGKAIFSMIRDLLTAITKRSVLFRFNGFTDMVFGSKKHGDVDIDALEMELESSIWETVKEREIECKDTHKKDLMQLILEGAMRSCDGNLWDKSAYRRFVVDNCKSIYFAGHDSTAVSVSWCLMLLALNPSWQVKIRDEILSSCKNGIPDAESIPNLKTVTMVIQETMRLYPPAPIVGREASKDIRLGDLVVPKGVCIWTLIPALHRDPEIWGPDANDFKPERFSEGISKACKYPQSYIPFGLGPRTCVGKNFGMMEVKVLVSLIVSKFSFTLSPTYQHSPSHKLLVEPQHGVVIRVV
SEQ ID NO:5;Sr.KAH(野生型甜叶菊(Stevia rebaudiana)贝壳杉烯酸羟化酶)
MEASYLYISILLLLASYLFTTQLRRKSANLPPTVFPSIPIIGHLYLLKKPLYRTLAKIAAKYGPILQLQLGYRRVLVISSPSAAEECFTNNDVIFANRPKTLFGKIVGGTSLGSLSYGDQWRNLRRVASIEILSVHRLNEFHDIRVDENRLLIRKLRSSSSPVTLITVFYALTLNVIMRMISGKRYFDSGDRELEEEGKRFREILDETLLLAGASNVGDYLPILNWLGVKSLEKKLIALQKKRDDFFQGLIEQVRKSRGAKVGKGRKTMIELLLSLQESEPEYYTDAMIRSFVLGLLAAGSDTSAGTMEWAMSLLVNHPHVLKKAQAEIDRVIGNNRLIDESDIGNIPYIGCIINETLRLYPAGPLLFPHESSADCVISGYNIPRGTMLIVNQWAIHHDPKVWDDPETFKPERFQGLEGTRDGFKLMPFGSGRRGCPGEGLAIRLLGMTLGSVIQCFDWERVGDEMVDMTEGLGVTLPKAVPLVAKCKPRSEMTNLLSEL
SEQ ID NO:6;Sr.KO
MDAVTGLLTVPATAITIGGTAVALAVALIFWYLKSYTSARRSQSNHLPRVPEVPGVPLLGNLLQLKEKKPYMTFTRWAATYGPIYSIKTGATSMVVVSSNEIAKEALVTRFQSISTRNLSKALKVLTADKTMVAMSDYDDYHKTVKRHILTAVLGPNAQKKHRIHRDIMMDNISTQLHEFVKNNPEQEEVDLRKIFQSELFGLAMRQALGKDVESLYVEDLKITMNRDEIFQVLVVDPMMGAIDVDWRDFFPYLKWVPNKKFENTIQQMYIRREAVMKSLIKEHKKRIASGEKLNSYIDYLLSEAQTLTDQQLLMSLWEPIIESSDTTMVTTEWAMYELAKNPKLQDRLYRDIKSVCGSEKITEEHLSQLPYITAIFHETLRRHSPVPIIPLRHVHEDTVLGGYHVPAGTELAVNIYGCNMDKNVWENPEEWNPERFMKENETIDFQKTMAFGGGKRVCAGSLQALLTASIGIGRMVQEFEWKLKDMTQEEVNTIGLTTQMLRPLRAIIKPRI
SEQ ID NO:7;Bt.GGPPS
MLTSSKSIESFPKNVQPYGKHYQNGLEPVGKSQEDILLEPFHYLCSNPGKDVRTKMIEAFNAWLKVPKDDLIVITRVIEMLHSASLLIDDVEDDSVLRRGVPAAHHIYGTPQTINCANYVYFLALKEIAKLNKPNMITIYTDELINLHRGQGMELFWRDTLTCPTEKEFLDMVNDKTGGLLRLAVKLMQEASQSGTDYTGLVSKIGIHFQVRDDYMNLQSKNYADNKGFCEDLTEGKFSFPIIHSIRSDPSNRQLLNILKQRSSSIELKQFALQLLENTNTFQYCRDFLRVLEKEAREEIKLLGGNIMLEKIMDVLSVNE
SEQ ID NO:8;Ent-Os.CDPS
MEHARPPQGGDDDVAASTSELPYMIESIKSKLRAARNSLGETTVSAYDTAWIALVNRLDGGGERSPQFPEAIDWIARNQLPDGSWGDAGMFIVQDRLINTLGCVVALATWGVHEEQRARGLAYIQDNLWRLGEDDEEWMMVGFEITFPVLLEKAKNLGLDINYDDPALQDIYAKRQLKLAKIPREALHARPTTLLHSLEGMENLDWERLLQFKCPAGSLHSSPAASAYALSETGDKELLEYLETAINNFDGGAPCTYPVDNFDRLWSVDRLRRLGISRYFTSEIEEYLEYAYRHLSPDGMSYGGLCPVKDIDDTAMAFRLLRLHGYNVSSSVFNHFEKDGEYFCFAGQSSQSLTAMYNSYRASQIVFPGDDDGLEQLRAYCRAFLEERRATGNLRDKWVIANGLPSEVEYALDFPWKASLPRVETRVYLEQYGASEDAWIGKGLYRMTLVNNDLYLEAAKADFTNFQRLSRLEWLSLKRWYIRNNLQAHGVTEQSVLRAYFLAAANIFEPNRAAERLGWARTAILAEAIASHLRQYSANGAADGMTERLISGLASHDWDWRESNDSAARSLLYALDELIDLHAFGNASDSLREAWKQWLMSWTNESQGSTGGDTALLLVRTIEICSGRHGSAEQSLKNSEDYARLEQIASSMCSKLATKILAQNGGSMDNVEGIDQEVDVEMKELIQRVYGSSSNDVSSVTRQTFLDVVKSFCYVAHCSPETIDGHISKVLFEDVN
SEQ ID NO:9;Ent-Pg.KS
MKREQYTILNEKESMAEELILRIKRMFSEIENTQTSASAYDTAWVAMVPSLDSSQQPQFPQCLSWIIDNQLLDGSWGIPYLIIKDRLCHTLACVIALRKWNAGNQNVETGLRFLRENIEGIVHEDEYTPIGFQIIFPAMLEEARGLGLELPYDLTPIKLMLTHREKIMKGKAIDHMHEYDSSLIYTVEGIHKIVDWNKVLKHQNKDGSLFNSPSATACALMHTRKSNCLEYLSSMLQKLGNGVPSVYPINLYARISMIDRLQRLGLARHFRNEIIHALDDIYRYWMQRETSREGKSLTPDIVSTSIAFMLLRLHGYDVPADVFCCYDLHSIEQSGEAVTAMLSLYRASQIMFPGETILEEIKTVSRKYLDKRKENGGIYDHNIVMKDLRGEVEYALSVPWYASLERIENRRYIDQYGVNDTWIAKTSYKIPCISNDLFLALAKQDYNICQAIQQKELRELERWFADNKFSHLNFARQKLIYCYFSAAATLFSPELSAARVVWAKNGVITTVVDDFFDVGGSSEEIHSFVEAVRVWDEAATDGLSENVQILFSALYNTVDEIVQQAFVFQGRDISIHLREIWYRLVNSMMTEAQWARTHCLPSMHEYMENAEPSIALEPIVLSSLYFVGPKLSEEIICHPEYYNLMHLLNICGRLLNDIQGCKREAHQGKLNSVTLYMEENSGTTMEDAIVYLRKTIDESRQLLLKEVLRPSIVPRECKQLHWNMMRILQLFYLKNDGFTSPTEMLGYVNAVIVDPIL
SEQ ID NO:10;Ps.KO
MDTLTLSLGFLSLFLFLFLLKRSTHKHSKLSHVPVVPGLPVIGNLLQLKEKKPHKTFTKMAQKYGPIFSIKAGSSKIIVLNTAHLAKEAMVTRYSSISKRKLSTALTILTSDKCMVAMSDYNDFHKMVKKHILASVLGANAQKRLRFHREVMMENMSSKFNEHVKTLSDSAVDFRKIFVSELFGLALKQALGSDIESIYVEGLTATLSREDLYNTLVVDFMEGAIEVDWRDFFPYLKWIPNKSFEKKIRRVDRQRKIIMKALINEQKKRLTSGKELDCYYDYLVSEAKEVTEEQMIMLLWEPIIETSDTTLVTTEWAMYELAKDKNRQDRLYEELLNVCGHEKVTDEELSKLPYLGAVFHETLRKHSPVPIVPLRYVDEDTELGGYHIPAGSEIAINIYGCNMDSNLWENPDQWIPERFLDEKYAQADLYKTMAFGGGKRVCAGSLQAMLIACTAIGRLVQEFEWELGHGEEENVDTMGLTTHRLHPLQVKLKPRNRIY
SEQ ID NO:11;At.CPR
MSSSSSSSTSMIDLMAAIIKGEPVIVSDPANASAYESVAAELSSMLIENRQFAMIVTTSIAVLIGCIVMLVWRRSGSGNSKRVEPLKPLVIKPREEEIDDGRKKVTIFFGTQTGTAEGFAKALGEEAKARYEKTRFKIVDLDDYAADDDEYEEKLKKEDVAFFFLATYGDGEPTDNAARFYKWFTEGNDRGEWLKNLKYGVFGLGNRQYEHFNKVAKVVDDILVEQGAQRLVQVGLGDDDQCIEDDFTAWREALWPELDTILREEGDTAVATPYTAAVLEYRVSIHDSEDAKFNDINMANGNGYTVFDAQHPYKANVAVKRELHTPESDRSCIHLEFDIAGSGLTYETGDHVGVLCDNLSETVDEALRLLDMSPDTYFSLHAEKEDGTPISSSLPPPFPPCNLRTALTRYACLLSSPKKSALVALAAHASDPTEAERLKHLASPAGKDEYSKWVVESQRSLLEVMAEFPSAKPPLGVFFAGVAPRLQPRFYSISSSPKIAETRIHVTCALVYEKMPTGRIHKGVCSTWMKNAVPYEKSENCSSAPIFVRQSNFKLPSDSKVPIIMIGPGTGLAPFRGFLQERLALVESGVELGPSVLFFGCRNRRMDFIYEEELQRFVESGALAELSVAFSREGPTKEYVQHKMMDKASDIWNMISQGAYLYVCGDAKGMARDVHRSLHTIAQEQGSMDSTKAEGFVKNLQTSGRYLRDVW
SEQ ID NO:12;UGT85C2
MDAMATTEKKPHVIFIPFPAQSHIKAMLKLAQLLHHKGLQITFVNTDFIHNQFLESSGPHCLDGAPGFRFETIPDGVSHSPEASIPIRESLLRSIETNFLDRFIDLVTKLPDPPTCIISDGFLSVFTIDAAKKLGIPVMMYWTLAACGFMGFYHIHSLIEKGFAPLKDASYLTNGYLDTVIDWVPGMEGIRLKDFPLDWSTDLNDKVLMFTTEAPQRSHKVSHHIFHTFDELEPSIIKTLSLRYNHIYTIGPLQLLLDQIPEEKKQTGITSLHGYSLVKEEPECFQWLQSKEPNSVVYVNFGSTTVMSLEDMTEFGWGLANSNHYFLWIIRSNLVIGENAVLPPELEEHIKKRGFIASWCSQEKVLKHPSVGGFLTHCGWGSTIESLSAGVPMICWPYSWDQLTNCRYICKEWEVGLEMGTKVKRDEVKRLVQELMGEGGHKMRNKAKDWKEKARIAIAPNGSSSLNIDKMVKEITVLARN
SEQ ID NO:13;UGT74G1
MAEQQKIKKSPHVLLIPFPLQGHINPFIQFGKRLISKGVKTTLVTTIHTLNSTLNHSNTTTTSIEIQAISDGCDEGGFMSAGESYLETFKQVGSKSLADLIKKLQSEGTTIDAIIYDSMTEWVLDVAIEFGIDGGSFFTQACVVNSLYYHVHKGLISLPLGETVSVPGFPVLQRWETPLILQNHEQIQSPWSQMLFGQFANIDQARWVFTNSFYKLEEEVIEWTRKIWNLKVIGPTLPSMYLDKRLDDDKDNGFNLYKANHHECMNWLDDKPKESVVYVAFGSLVKHGPEQVEEITRALIDSDVNFLWVIKHKEEGKLPENLSEVIKTGKGLIVAWCKQLDVLAHESVGCFVTHCGFNSTLEAISLGVPVVAMPQFSDQTTNAKLLDEILGVGVRVKADENGIVRRGNLASCIKMIMEEERGVIIRKNAVKWKDLAKVAVHEGGSSDNDIVEFVSELIKA
SEQ ID NO:14;UGT91D_样3
MYNVTYHQNSKAMATSDSIVDDRKQLHVATFPWLAFGHILPYLQLSKLIAEKGHKVSFLSTTRNIQRLSSHISPLINVVQLTLPRVQELPEDAEATTDVHPEDIPYLKKASDGLQPEVTRFLEQHSPDWIIYDYTHYWLPSIAASLGISRAHFSVTTPWAIAYMGPSADAMINGSDGRTTVEDLTTPPKWFPFPTKVCWRKHDLARLVPYKAPGISDGYRMGLVLKGSDCLLSKCYHEFGTQWLPLLETLHQVPVVPVGLLPPEIPGDEKDETWVSIKKWLDGKQKGSVVYVALGSEVLVSQTEVVELALGLELSGLPFVWAYRKPKGPAKSDSVELPDGFVERTRDRGLVWTSWAPQLRILSHESVCGFLTHCGSGSIVEGLMFGHPLIMLPIFGDQPLNARLLEDKQVGIEIPRNEEDGCLTKESVARSLRSVVVEKEGEIYKANARELSKIYNDTKVEKEYVSQFVDYLEKNARAVAIDHES
SEQ ID NO:15;UGT76G1
MENKTETTVRRRRRIILFPVPFQGHINPILQLANVLYSKGFSITIFHTNFNKPKTSNYPHFTFRFILDNDPQDERISNLPTHGPLAGMRIPIINEHGADELRRELELLMLASEEDEEVSCLITDALWYFAQSVADSLNLRRLVLMTSSLFNFHAHVSLPQFDELGYLDPDDKTRLEEQASGFPMLKVKDIKSAYSNWQILKEILGKMIKQTKASSGVIWNSFKELEESELETVIREIPAPSFLIPLPKHLTASSSSLLDHDRTVFQWLDQQPPSSVLYVSFGSTSEVDEKDFLEIARGLVDSKQSFLWVVRPGFVKGSTWVEPLPDGFLGERGRIVKWVPQQEVLAHGAIGAFWTHSGWNSTLESVCEGVPMIFSDFGLDQPLNARYMSDVLKVGVYLENGWERGEIANAIRRVMVDEEGEYIRQNARVLKQKADVSLMKGGSSYESLESLVSYISSLSEQ ID NO:16;UGT40087
MDASDSSPLHIVIFPWLAFGHMLASLELAERLAARGHRVSFVSTPRNISRLRPVPPALAPLIDFVALPLPRVDGLPDGAEATSDIPPGKTELHLKALDGLAAPFAAFLDAACADGSTNKVDWLFLDNFQYWAAAAAADHKIPCALNLTFAASTSAEYGVPRVEPPVDGSTASILQRFVLTLEKCQFVIQRACFELEPEPLPLLSDIFGKPVIPYGLVPPCPPAEGHKREHGNAALSWLDKQQPESVLFIALGSEPPVTVEQLHEIALGLELAGTTFLWALKKPNGLLLEADGDILPPGFEERTRDRGLVAMGWVPQPIILAHSSVGAFLTHGGWASTIEGVMSGHPMLFLTFLDEQRINAQLIERKKAGLRVPRREKDGSYDRQGIAGAIRAVMCEEESKSVFAANAKKMQEIVSDRNCQEKYIDELIQRLGSFEK
SEQ ID NO:17;Aa.CPR(1a:66a)-Ro.KAHN146T/A297Y/G466A(26a:523a)
MQSTTSVKLSPFDLMTALLNGKVSFDTSNTSDTNIPLAVFMENRELLMILTTSVAVLIGCVVVLVWVLDWVWLKPKKLERCLREQGLKGNSYWFLYGDMKENSILLKQAKSKPMNLSTSHDIAPQVIPFVDQTVKVYGKNSFDWIGPIPRVNIMNPEELKDVFTKYDDFIKPISNPLFKLLATGLATYEGEKWAKHRRIINPTFHSEKLKRMLPSFHQSCTEMIKEWESLVSKEGSSCELDVWPFLENMTADVISRTAFGTSYKKGRKIFELLREQAIYATKAIQSFYIPGWRFLPTKMNKRMKEINKEIKGLIKGIIIKREHTIKAGEETKDDLLGYLMESNLKDIREHGKNNKNFGMSIEDVIEECKLFYFAGQETTSVLLVWTMVLLGQNQNWQDRARQEILQVFGSNKPDFDGLTHLKVVTMILLEVLRLYPAVIELPRTIHKKTQLGKFSLPEGVEVRLPTLLIHHDKELWGDDANEFKPERFSEGVSKATKSRLSFFPFGAGPRICIGQNFAMMEAKLALVLILQHFTFELSPSYAHAPSYRITLQPQYGVPIILHRR
SEQ ID NO:18;Aa.CPR(1a:66a)-Ro.KAHW52T/N146T/A297Y(26a:523a)
MQSTTSVKLSPFDLMTALLNGKVSFDTSNTSDTNIPLAVFMENRELLMILTTSVAVLIGCVVVLVWVLDWVWLKPKKLERCLREQGLKGNSYTFLYGDMKENSILLKQAKSKPMNLSTSHDIAPQVIPFVDQTVKVYGKNSFDWIGPIPRVNIMNPEELKDVFTKYDDFIKPISNPLFKLLATGLATYEGEKWAKHRRIINPTFHSEKLKRMLPSFHQSCTEMIKEWESLVSKEGSSCELDVWPFLENMTADVISRTAFGTSYKKGRKIFELLREQAIYATKAIQSFYIPGWRFLPTKMNKRMKEINKEIKGLIKGIIIKREHTIKAGEETKDDLLGYLMESNLKDIREHGKNNKNFGMSIEDVIEECKLFYFAGQETTSVLLVWTMVLLGQNQNWQDRARQEILQVFGSNKPDFDGLTHLKVVTMILLEVLRLYPAVIELPRTIHKKTQLGKFSLPEGVEVRLPTLLIHHDKELWGDDANEFKPERFSEGVSKATKSRLSFFPFGGGPRICIGQNFAMMEAKLALVLILQHFTFELSPSYAHAPSYRITLQPQYGVPIILHRR
SEQ ID NO:19;Aa.CPR(1a:66a)-Ro.KAHT142G/N146T/A297Y/G466A(26a:523a)
MQSTTSVKLSPFDLMTALLNGKVSFDTSNTSDTNIPLAVFMENRELLMILTTSVAVLIGCVVVLVWVLDWVWLKPKKLERCLREQGLKGNSYWFLYGDMKENSILLKQAKSKPMNLSTSHDIAPQVIPFVDQTVKVYGKNSFDWIGPIPRVNIMNPEELKDVFTKYDDFIKPISNPLFKLLAGGLATYEGEKWAKHRRIINPTFHSEKLKRMLPSFHQSCTEMIKEWESLVSKEGSSCELDVWPFLENMTADVISRTAFGTSYKKGRKIFELLREQAIYATKAIQSFYIPGWRFLPTKMNKRMKEINKEIKGLIKGIIIKREHTIKAGEETKDDLLGYLMESNLKDIREHGKNNKNFGMSIEDVIEECKLFYFAGQETTSVLLVWTMVLLGQNQNWQDRARQEILQVFGSNKPDFDGLTHLKVVTMILLEVLRLYPAVIELPRTIHKKTQLGKFSLPEGVEVRLPTLLIHHDKELWGDDANEFKPERFSEGVSKATKSRLSFFPFGAGPRICIGQNFAMMEAKLALVLILQHFTFELSPSYAHAPSYRITLQPQYGVPIILHRR
SEQ ID NO:20;Aa.CPR(1a:66a)-Ro.KAHW52T/T142G/N146T/A297Y(26a:523a)
MQSTTSVKLSPFDLMTALLNGKVSFDTSNTSDTNIPLAVFMENRELLMILTTSVAVLIGCVVVLVWVLDWVWLKPKKLERCLREQGLKGNSYTFLYGDMKENSILLKQAKSKPMNLSTSHDIAPQVIPFVDQTVKVYGKNSFDWIGPIPRVNIMNPEELKDVFTKYDDFIKPISNPLFKLLAGGLATYEGEKWAKHRRIINPTFHSEKLKRMLPSFHQSCTEMIKEWESLVSKEGSSCELDVWPFLENMTADVISRTAFGTSYKKGRKIFELLREQAIYATKAIQSFYIPGWRFLPTKMNKRMKEINKEIKGLIKGIIIKREHTIKAGEETKDDLLGYLMESNLKDIREHGKNNKNFGMSIEDVIEECKLFYFAGQETTSVLLVWTMVLLGQNQNWQDRARQEILQVFGSNKPDFDGLTHLKVVTMILLEVLRLYPAVIELPRTIHKKTQLGKFSLPEGVEVRLPTLLIHHDKELWGDDANEFKPERFSEGVSKATKSRLSFFPFGGGPRICIGQNFAMMEAKLALVLILQHFTFELSPSYAHAPSYRITLQPQYGVPIILHRR
SEQ ID NO:21;Aa.CPR(1a:66a)-Ro.KAHW52T/T142G/N146T/A297Y/G466A(26a:523a)
MQSTTSVKLSPFDLMTALLNGKVSFDTSNTSDTNIPLAVFMENRELLMILTTSVAVLIGCVVVLVWVLDWVWLKPKKLERCLREQGLKGNSYTFLYGDMKENSILLKQAKSKPMNLSTSHDIAPQVIPFVDQTVKVYGKNSFDWIGPIPRVNIMNPEELKDVFTKYDDFIKPISNPLFKLLAGGLATYEGEKWAKHRRIINPTFHSEKLKRMLPSFHQSCTEMIKEWESLVSKEGSSCELDVWPFLENMTADVISRTAFGTSYKKGRKIFELLREQAIYATKAIQSFYIPGWRFLPTKMNKRMKEINKEIKGLIKGIIIKREHTIKAGEETKDDLLGYLMESNLKDIREHGKNNKNFGMSIEDVIEECKLFYFAGQETTSVLLVWTMVLLGQNQNWQDRARQEILQVFGSNKPDFDGLTHLKVVTMILLEVLRLYPAVIELPRTIHKKTQLGKFSLPEGVEVRLPTLLIHHDKELWGDDANEFKPERFSEGVSKATKSRLSFFPFGAGPRICIGQNFAMMEAKLALVLILQHFTFELSPSYAHAPSYRITLQPQYGVPIILHRR
SEQ ID NO:22;Aa.CPR信号序列
MQSTTSVKLSPFDLMTALLNGKVSFDTSNTSDTNIPLAVFMENRELLMILTTSVAVLIGCVVVLVW
SEQ ID NO:23;EUGT11
MDSGYSSSYAAAAGMHVVICPWLAFGHLLPCLDLAQRLASRGHRVSFVSTPRNISRLPPVRPALAPLVAFVALPLPRVEGLPDGAESTNDVPHDRPDMVELHRRAFDGLAAPFSEFLGTACADWVIVDVFHHWAAAAALEHKVPCAMMLLGSAHMIASIADRRLERAETESPAAAGQGRPAAAPTFEVARMKLIRTKGSSGMSLAERFSLTLSRSSLVVGRSCVEFEPETVPLLSTLRGKPITFLGLMPPLHEGRREDGEDATVRWLDAQPAKSVVYVALGSEVPLGVEKVHELALGLELAGTRFLWALRKPTGVSDADLLPAGFEERTRGRGVVATRWVPQMSILAHAAVGAFLTHCGWNSTIEGLMFGHPLIMLPIFGDQGPNARLIEAKNAGLQVARNDGDGSFDREGVAAAIRAVAVEEESSKVFQAKAKKLQEIVADMACHERYIDGFIQQLRSYKD。
Figure IDA0003386303650000011
Figure IDA0003386303650000021
Figure IDA0003386303650000031
Figure IDA0003386303650000041
Figure IDA0003386303650000051
Figure IDA0003386303650000061
Figure IDA0003386303650000071
Figure IDA0003386303650000081
Figure IDA0003386303650000091
Figure IDA0003386303650000101
Figure IDA0003386303650000111
Figure IDA0003386303650000121
Figure IDA0003386303650000131
Figure IDA0003386303650000141
Figure IDA0003386303650000151
Figure IDA0003386303650000161
Figure IDA0003386303650000171
Figure IDA0003386303650000181
Figure IDA0003386303650000191
Figure IDA0003386303650000201
Figure IDA0003386303650000211
Figure IDA0003386303650000221
Figure IDA0003386303650000231
Figure IDA0003386303650000241
Figure IDA0003386303650000251
Figure IDA0003386303650000261
Figure IDA0003386303650000271
Figure IDA0003386303650000281
Figure IDA0003386303650000291
Figure IDA0003386303650000301
Figure IDA0003386303650000311
Figure IDA0003386303650000321
Figure IDA0003386303650000331
Figure IDA0003386303650000341
Figure IDA0003386303650000351
Figure IDA0003386303650000361
Figure IDA0003386303650000371
Figure IDA0003386303650000381
Figure IDA0003386303650000391
Figure IDA0003386303650000401
Figure IDA0003386303650000411
Figure IDA0003386303650000421
Figure IDA0003386303650000431
Figure IDA0003386303650000441
Figure IDA0003386303650000451
Figure IDA0003386303650000461
Figure IDA0003386303650000471
Figure IDA0003386303650000481
Figure IDA0003386303650000491
Figure IDA0003386303650000501
Figure IDA0003386303650000511
Figure IDA0003386303650000521
Figure IDA0003386303650000531
Figure IDA0003386303650000541
Figure IDA0003386303650000551
Figure IDA0003386303650000561
Figure IDA0003386303650000571
Figure IDA0003386303650000581
Figure IDA0003386303650000591
Figure IDA0003386303650000601
Figure IDA0003386303650000611
Figure IDA0003386303650000621
Figure IDA0003386303650000631
Figure IDA0003386303650000641
Figure IDA0003386303650000651
Figure IDA0003386303650000661
Figure IDA0003386303650000671
Figure IDA0003386303650000681
Figure IDA0003386303650000691
Figure IDA0003386303650000701
Figure IDA0003386303650000711

Claims (49)

1.一种变异的贝壳杉烯酸羟化酶多肽,其包含SEQ ID NO:1的氨基酸序列,其中所述序列进一步包含一个或多个氨基酸取代。
2.如权利要求1所述的变异多肽,其中所述一个或多个氨基酸取代选自K69R、V343G、T403V、H491P、P72D、L64D、Q84C、L64G、E206D、Y238C、A210G、L64N、I237C、L11V、N207F、M73G、W8G、E60R、Y55S、N475G、D292P、P161C、K267D、L485F、A396F、R507A、P72T、I132G、N61P、K119V、T220E、P72G、Q513R、S133G、Y506V、K69P、E60G、K224C、M73H、H379G、P72C、K314P、W202A、G466F、N49A、S339G、N160D、T216G、D102Y、F246G、M58P、T220R、R458D、M58G、A68I、S70P、F88V、T240D、L205I、K167G、L232M、S62R、G56D、Q244G、A242D、N49R、Q513G、W29T、L303D、T378D、I508L、W202Q、S505R、R233C、I104D、M258G、K69G、F88D、F88S、A217V、E230C、R507G、G466S、G56S、E230G、Y55G、A503C、S460I、I129R、S245G、F246S、Q84L、S133R、T509V、R507E、R233T、V30F、A68G、G56N、T162G、A68P、S165D、K119Y、W29C、S165P、W29V、I284G、A217L、Q335V、L65S、F53R、Y55P、W202V、K224V、W29A、H164G、Q244D、K291C、L65G、K167S、C327I、K291S、D57G、K167H、N160T、W202C、A242G、F88R、I104N、G466D、N475D、K119S、T123D、T216A、S339A、P161D、I104R、L54G、M171F、L232Y、D293C、V340A、T162A、A297V、I104H、F332L、A236R、K224I、S452D、I104A、V340S、F229Y、A297Y和A297F。
3.如权利要求2所述的变异多肽,其中所述一个或多个氨基酸取代选自A297V、I104H、F332L、A236R、K224I、S452D、I104A、I104A、V340S、F229Y、A297Y和A297F。
4.如权利要求3所述的变异多肽,其中所述一个或多个氨基酸取代选自S452D、I104A、V340S、F229Y、A297Y和A297F。
5.如权利要求1所述的变异多肽,其中所述一个或多个氨基酸取代选自N146W、A297Y、A236S、V9S、G466F、T283D、T142G、T425V、L459C、T283A、T283G、S460V、S133G、I129V、W52G、S505I、I243T、V340S、S460C、S452D、L118I、S505V、T123D、W52C、S460I、S457G、W52R、W52N、N146T、G466A和W52T。
6.如权利要求1所述的变异多肽,其中所述一个或多个氨基酸取代包含A297Y。
7.如权利要求1或6所述的变异多肽,其中所述一个或多个氨基酸取代包含N146T。
8.如权利要求1所述的变异多肽,其中所述一个或多个氨基酸取代选自N146T/A297Y/G466A、W52T/N146T/A297Y、T142G/N146T/A297Y/G466A、W52T/T142G/N146T/A297Y和W52T/T142G/N146T/A297Y/G466A。
9.如权利要求1所述的变异多肽,其中所述一个或多个氨基酸取代选自W52T/T142G/G466A、A145G/N146F/A297Y、N146W/A297Y/S460I、W52N/N146W/A297Y、F332L/S452D、N146W/A297Y和Q84R/N146T/A297Y。
10.如前述权利要求中任一项所述的变异多肽,其中编码N末端信号序列的氨基酸被编码异源植物p450多肽的N末端信号序列的相应氨基酸序列替换。
11.如权利要求10所述的变异多肽,其中所述N末端信号序列对应于SEQ ID NO:1的氨基酸1-25。
12.如权利要求11所述的变异多肽,其中所述相应的氨基酸序列包含SEQ ID NO:22。
13.如权利要求12所述的变异多肽,其包含选自SEQ ID NO:17、SEQ ID NO:18、SEQ IDNO:19、SEQ ID NO:20和SEQ ID NO:21的氨基酸序列。
14.一种核酸,其编码前述权利要求中任一项所述的变异多肽。
15.一种宿主细胞,其包含权利要求1至13中任一项所述的多肽或权利要求14所述的核酸。
16.如权利要求15所述的宿主细胞,其中所述宿主细胞能够产生一种或多种甜菊醇糖苷。
17.如权利要求16所述的宿主细胞,其中所述一种或多种甜菊醇糖苷选自RebA、RebB、RebD、RebE和RebM。
18.如权利要求17所述的宿主细胞,其中所述一种或多种甜菊醇糖苷包含RebM。
19.如权利要求15至18中任一项所述的宿主细胞,其进一步包含一种或多种编码一种或多种用于制造甜菊醇糖苷的途径的酶的核酸。
20.如权利要求19所述的宿主细胞,其进一步包含编码香叶基香叶基二磷酸酯合酶的核酸。
21.如权利要求19所述的宿主细胞,其进一步包含编码柯巴基二磷酸酯合酶的核酸。
22.如权利要求19所述的宿主细胞,其进一步包含编码对映贝壳杉烯合酶的核酸。
23.如权利要求19所述的宿主细胞,其进一步包含编码贝壳杉烯氧化酶的核酸。
24.如权利要求19所述的宿主细胞,其进一步包含编码细胞色素P450还原酶的核酸。
25.如权利要求19所述的宿主细胞,其进一步包含编码一种或多种尿苷5’-二磷酸酯依赖性糖基转移酶的核酸。
26.如权利要求19所述的宿主细胞,其进一步包含一种或多种编码香叶基香叶基二磷酸酯合酶、柯巴基二磷酸酯合酶、对映贝壳杉烯合酶、贝壳杉烯氧化酶、细胞色素P450还原酶、UGT40087、UGT74G1、UGT76G1、UGT85C2、EUGT11和UGT91D的核酸。
27.如权利要求15至26中任一项所述的宿主细胞,其中所述细胞选自细菌细胞、酵母细胞、藻类细胞、昆虫细胞和植物细胞。
28.如权利要求27所述的宿主细胞,其中所述细胞是酵母细胞。
29.如权利要求28所述的宿主细胞,其中所述细胞是酿酒酵母。
30.一种用于生产一种或多种甜菊醇糖苷的方法,其包括:
在适合于制备一种或多种甜菊醇糖苷的条件下,在具有碳源的培养基中培养权利要求15至29中任一项所述的宿主细胞的群体以产生培养肉汤;以及
从所述培养肉汤中回收所述一种或多种甜菊醇糖苷。
31.如权利要求30所述的方法,其中所述一种或多种甜菊醇糖苷是RebM。
32.一种发酵组合物,其包含:
宿主细胞,其包含编码权利要求15至29中任一项所述的贝壳杉烯酸羟化酶的核酸;以及
一种或多种由所述宿主细胞产生的甜菊醇糖苷。
33.如权利要求32所述的发酵组合物,其中所述一种或多种甜菊醇糖苷是RebM。
34.一种组合物,其包含通过权利要求31所述的方法生产的RebM。
35.一种宿主细胞,其包含贝壳杉烯酸羟化酶多肽,所述贝壳杉烯酸羟化酶多肽包含与SEQ ID NO:1的氨基酸序列至少90%同一的氨基酸序列。
36.如权利要求35所述的宿主细胞,其中所述贝壳杉烯酸羟化酶多肽的氨基酸序列包含选自SEQ ID NO:1、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20和SEQ IDNO:21的氨基序列。
37.如权利要求35或36所述的宿主细胞,其中所述宿主细胞能够产生一种或多种甜菊醇糖苷。
38.如权利要求37所述的宿主细胞,其中所述一种或多种甜菊醇糖苷选自RebA、RebB、RebD、RebE和RebM。
39.如权利要求38所述的宿主细胞,其中所述一种或多种甜菊醇糖苷是RebM。
40.如权利要求35至39中任一项所述的宿主细胞,其进一步包含一种或多种编码一种或多种用于制造甜菊醇糖苷的途径的酶的核酸。
41.如权利要求40所述的宿主细胞,其进一步包含一种或多种编码香叶基香叶基二磷酸酯合酶、柯巴基二磷酸酯合酶、对映贝壳杉烯合酶、贝壳杉烯氧化酶、细胞色素P450还原酶、UGT40087、UGT74G1、UGT76G1、UGT85C2、EUGT11和UGT91D的核酸。
42.如权利要求35至41中任一项所述的宿主细胞,其中所述细胞选自细菌细胞、酵母细胞、藻类细胞、昆虫细胞和植物细胞。
43.如权利要求42所述的宿主细胞,其中所述细胞是酵母细胞。
44.如权利要求43所述的宿主细胞,其中所述细胞是酿酒酵母。
45.一种用于生产一种或多种甜菊醇糖苷的方法,其包括:
在适合于制备一种或多种甜菊醇糖苷的条件下,在具有碳源的培养基中培养权利要求35至44中任一项所述的宿主细胞的群体以产生培养肉汤;以及
从所述培养肉汤中回收所述一种或多种甜菊醇糖苷。
46.如权利要求45所述的方法,其中所述一种或多种甜菊醇糖苷是RebM。
47.一种发酵组合物,其包含:
宿主细胞,其包含编码权利要求35至44中任一项所述的贝壳杉烯酸羟化酶的核酸;以及
一种或多种由所述宿主细胞产生的甜菊醇糖苷。
48.如权利要求47所述的发酵组合物,其中所述一种或多种甜菊醇糖苷是RebM。
49.一种组合物,其包含通过权利要求46所述的方法生产的RebM。
CN202080040694.5A 2019-05-03 2020-05-01 贝壳杉烯酸13-羟化酶(kah)变体及其用途 Pending CN113906045A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201962842810P 2019-05-03 2019-05-03
US62/842,810 2019-05-03
PCT/US2020/031171 WO2020227148A1 (en) 2019-05-03 2020-05-01 Kaurenoic acid 13-hydroxylase (kah) variants and uses thereof

Publications (1)

Publication Number Publication Date
CN113906045A true CN113906045A (zh) 2022-01-07

Family

ID=73051309

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080040694.5A Pending CN113906045A (zh) 2019-05-03 2020-05-01 贝壳杉烯酸13-羟化酶(kah)变体及其用途

Country Status (11)

Country Link
US (1) US20220282228A1 (zh)
EP (1) EP3962931A4 (zh)
JP (1) JP2022530986A (zh)
KR (1) KR20220005021A (zh)
CN (1) CN113906045A (zh)
AU (1) AU2020268897A1 (zh)
BR (1) BR112021022010A2 (zh)
CA (1) CA3134729A1 (zh)
MX (1) MX2021013124A (zh)
SG (1) SG11202111698SA (zh)
WO (1) WO2020227148A1 (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170240942A1 (en) * 2014-09-09 2017-08-24 Evolva Sa Production of Steviol Glycosides in Recombinant Hosts
CN108396044A (zh) * 2011-08-08 2018-08-14 埃沃尔瓦公司 甜菊醇糖苷类的重组生产

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104928263B (zh) * 2014-03-20 2018-03-23 中国科学院上海生命科学研究院 一种新的贝壳烯酸‑13α‑羟化酶、其编码基因及其应用
CA2973674A1 (en) * 2015-01-30 2016-08-04 Evolva Sa Production of steviol glycosides in recombinant hosts
BR112017025709B1 (pt) * 2015-05-29 2024-03-05 Cargill, Incorporated Método para produzir glicosídeos de esteviol
US10760085B2 (en) * 2015-10-05 2020-09-01 Dsm Ip Assets B.V. Kaurenoic acid hydroxylases
WO2018211032A1 (en) * 2017-05-17 2018-11-22 Evolva Sa Production of steviol glycosides in recombinant hosts
JP2022502068A (ja) * 2018-10-15 2022-01-11 アミリス, インコーポレイテッド レバウジオシドの高効率産生のためのStevia rebaudianaのカウレン酸ヒドロキシラーゼバリアント

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108396044A (zh) * 2011-08-08 2018-08-14 埃沃尔瓦公司 甜菊醇糖苷类的重组生产
US20170240942A1 (en) * 2014-09-09 2017-08-24 Evolva Sa Production of Steviol Glycosides in Recombinant Hosts
CN107109358A (zh) * 2014-09-09 2017-08-29 埃沃尔瓦公司 在重组宿主中生产甜菊醇糖苷

Also Published As

Publication number Publication date
BR112021022010A2 (pt) 2021-12-21
MX2021013124A (es) 2022-01-24
AU2020268897A1 (en) 2021-11-18
US20220282228A1 (en) 2022-09-08
JP2022530986A (ja) 2022-07-05
WO2020227148A9 (en) 2021-07-29
WO2020227148A1 (en) 2020-11-12
EP3962931A1 (en) 2022-03-09
EP3962931A4 (en) 2023-06-14
CA3134729A1 (en) 2020-11-12
KR20220005021A (ko) 2022-01-12
SG11202111698SA (en) 2021-11-29

Similar Documents

Publication Publication Date Title
US11866738B2 (en) UDP-dependent glycosyltransferase for high efficiency production of rebaudiosides
US20200165651A1 (en) Pisum sativum kaurene oxidase for high efficiency production of rebaudiosides
US20210371892A1 (en) Stevia rebaudiana kaurenoic acid hydroxylase variants for high efficiency production of rebaudiosides
CN113906045A (zh) 贝壳杉烯酸13-羟化酶(kah)变体及其用途
RU2795550C2 (ru) Применение кауреноксидазы pisum sativum для высокоэффективного производства ребаудиозидов
US20220106619A1 (en) Abc transporters for the high efficiency production of rebaudiosides
RU2795855C2 (ru) Аbc-транспортеры для высокоэффективного производства ребаудиозидов
RU2777901C2 (ru) Udp-зависимая гликозилтрансфераза для высокоэффективного продуцирования ребаудиозидов
WO2023225604A1 (en) Compositions and methods for improved production of steviol glycosides

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination