CN107889506A

CN107889506A - 迈诺醇的生产

Info

Publication number: CN107889506A
Application number: CN201680036387.3A
Authority: CN
Inventors: M·沙尔克; L·洛奇
Original assignee: Firmenich SA
Current assignee: Firmenich SA
Priority date: 2015-06-30
Filing date: 2016-06-30
Publication date: 2018-04-06
Anticipated expiration: 2036-06-30
Also published as: CA2987487A1; WO2017001641A1; JP2018527892A; JP6856553B2; BR112017028183A2; GB201601249D0; MX2017015827A; ES2933968T3; CN107889506B; EP3317418A1; US20190002925A1; US10385361B2; EP3317418B1

Abstract

本文提供了生产(+)‑迈诺醇的方法，包括：将香叶基香叶基二磷酸与柯巴基二磷酸(CPP)合酶接触以形成(9S,10S)‑柯巴基二磷酸，其中该CPP合酶包含与从SEQ ID NO:1和SEQ ID NO:2中选出的多肽具有至少90％、95％、98％、99％和100％序列同一性的氨基酸序列；并使CPP与香紫苏醇合酶接触以形成(+)‑迈诺醇。

Description

迈诺醇的生产

技术领域

本文提供了使用柯巴基(copalyl)二磷酸合酶和香紫苏醇合酶生产(+)-迈诺醇(manool)的生物化学方法。

背景技术

在大多数生物(微生物、动物和植物)中都可以找到萜烯。这些化合物由五个称为异戊二烯单元的碳单元组成，并按其结构中存在的这些单元的数量分类。因此，单萜、倍半萜和二萜分别是含有10、15和20个碳原子的萜烯。例如倍半萜在植物界广泛存在。许多萜烯(例如倍半萜)分子因其风味和香味性质以及它们的美容、医疗和抗微生物作用而公知。许多萜烯(例如倍半萜)烃和萜类化合物(例如倍半萜类化合物)已被鉴定出。

萜烯的生物合成生产涉及称为萜合酶的酶。这些酶将无环萜烯前体转化成一种或多种萜烯产物。具体而言，二萜合酶通过环化前体香叶基香叶基焦磷酸(GGPP)产生二萜。GGPP的环化通常需要两种酶多肽，在两个连续的酶促反应中组合起作用的I型和II型二萜合酶。II型二萜合酶催化由GGPP的末端双键质子化引发的GGPP的环化/重排，导致环状二萜二磷酸酯中间体。然后该中间体被催化电离引发的环化的I型二萜合酶进一步转化。

二萜合酶存在于植物和其他生物中，并使用底物如香叶基香叶基二磷酸，但它们具有不同的产物特征。编码二萜合酶的基因和cDNA已经被克隆，并且表征了相应的重组酶。

柯巴基二磷酸合酶和香紫苏醇合酶是植物中存在的酶。因此，发现并在生物化学过程中使用这些酶和变体来产生(+)-迈诺醇是合乎需要的。

发明内容

本文提供了生产(+)-迈诺醇的方法，包括：

a)将香叶基香叶基二磷酸与柯巴基二磷酸(CPP)合酶接触以形成(9S,10S)-柯巴基二磷酸，其中该CPP合酶包含与从SEQ ID NO:1和SEQ ID NO:2中选出的多肽具有至少90％、95％、98％、99％或100％序列同一性的氨基酸序列；并且

b)使(9S,10S)-柯巴基二磷酸CPP与香紫苏醇合酶接触以形成(+)-迈诺醇；并且

c)可选地，分离(+)-迈诺醇。

本文还提供了一种多肽，其中该多肽包含与从SEQ ID NO:1和SEQ ID NO:2中选出的多肽具有至少90％、95％、98％、99％或100％序列同一性的氨基酸序列。

本文还提供了编码上述多肽的核酸。

本文还提供了一种核酸，其中该核酸包含与SEQ ID NO 3具有至少90％、95％、98％、99％或100％序列同一性的核苷酸序列。

本文还提供了用核酸转化宿主细胞或非人生物体的方法，该核酸编码具有柯巴基二磷酸合酶活性的多肽和具有香紫苏醇合酶活性的多肽，其中该具有柯巴基二磷酸合酶活性的多肽包含与从SEQ ID NO:1和SEQ ID NO:2中选出的多肽具有至少90％、95％、98％、99％或100％序列同一性的氨基酸序列，并且其中该具有香紫苏醇合酶活性的多肽包含与从SEQ ID NO:4和SEQ ID NO:5中选出的多肽具有至少90％、95％、98％、99％或100％序列同一性的氨基酸序列。本文还提供了通过该方法生产的宿主细胞或非人生物体。

本文还提供了一种表达载体，包含编码CPP合酶的核酸以及编码香紫苏醇合酶的核酸，其中该CPP合酶包含与从SEQ ID NO:1和SEQ ID NO:2中选出的多肽具有至少90％、95％、98％、99％或100％序列同一性的氨基酸序列。

本文还提供了一种非人宿主生物体或细胞，包含至少一种编码具有CPP合酶活性的多肽的核酸和至少一种编码具有香紫苏醇合酶活性的多肽的核酸，其中该具有CPP合酶活性的多肽包含与从SEQ ID NO:1和SEQ ID NO:2中选出的多肽具有至少90％、95％、98％、99％或100％序列同一性的氨基酸序列。

本文还提供了生产(+)迈诺醇的方法，包括培养本发明的宿主生物体或细胞。

附图说明

图1.从香叶基香叶基二磷酸(GGPP)到(+)-迈诺醇的酶途径。

图2.GGPP的体外酶促转化的GCMS分析。A.使用重组SmCPS酶。B.使用重组SsScS酶。C.在单一测定中将SmCPS与SsScS酶组合。

图3.使用表达SmCPS、SsScS和甲羟戊酸途径酶的大肠杆菌细胞生产的(+)-迈诺醇的GCMS分析。A.大肠杆菌培养基提取物的总离子色谱。B.(+)-迈诺醇标准品的总离子色谱。C.色谱A中主峰(保留时间为14.55分钟)的质谱。D.(+)-迈诺醇标准品的质谱。

图4.从香叶基香叶基二磷酸(GGPP)到(+)-迈诺醇和香紫苏醇的酶促途径。

具体实施方式

所使用的缩写

bp 碱基对

kb 千碱基

DNA 脱氧核糖核酸

cDNA 互补DNA

CPP 柯巴基二磷酸

DTT 二硫苏糖醇

FPP 法尼基二磷酸

GGPP 香叶基香叶基二磷酸

GC 气相色谱

IPTG 异丙基-D-硫代半乳糖-吡喃糖苷

LB 溶源性肉汤

MS 质谱

MVA 甲羟戊酸

PCR 聚合酶链式反应

RNA 核糖核酸

mRNA 信使核糖核酸

miRNA 微RNA

siRNA 小干扰RNA

rRNA 核糖体RNA

tRNA 转移RNA

定义

术语“多肽”是指连续聚合的氨基酸残基的氨基酸序列，例如至少15个残基，至少30个残基，至少50个残基。在本文提供的一些实施方案中，多肽包含作为酶的氨基酸序列、其片段或其变体。

术语“分离的”多肽是指通过本领域已知的任何方法或这些方法(包括重组、生物化学和合成法)的组合从天然环境中取出的氨基酸序列。

术语“蛋白”是指任何长度的氨基酸序列，其中氨基酸被共价肽键所连接，并且包括寡肽、肽、多肽和全长蛋白，不管天然生成的还是合成的。

术语“生物功能”、“功能”、“生物活性”或“活性”是指CPP合酶和香紫苏醇合酶活性催化(+)-迈诺醇形成的能力。CPP合酶的“生物功能”、“功能”、“生物活性”或“活性”可以例如指CPP合酶催化从GGPP形成(9S,10S)-柯巴基二磷酸的能力。香紫苏醇合酶的“生物功能”、“功能”、“生物活性”或“活性”可以例如指香紫苏醇合酶催化从(9S,10S)-柯巴基二磷酸形成(+)-迈诺醇的能力。

香紫苏醇合酶可以指一种酶，例如天然存在的酶，它具有如图4所示的催化从赖百当二醇(labdendiol)二磷酸(LPP)形成香紫苏醇的能力。LPP可以由GGPP通过赖百当二醇-二磷酸合酶(LPS)的作用产生(见图4)。为了用于本发明，如上所述的香紫苏醇合酶也具有催化从(9S,10S)-柯巴基二磷酸形成(+)迈诺醇的能力。应该理解，例如，可以在本发明中使用香紫苏醇合酶的变体、片段和截短形式，只要它们具有催化从(9S,10S)-柯巴基二磷酸形成(+)迈诺醇的能力。将进一步理解的是，例如香紫苏醇合酶的变体、片段或截短形式可能已经丧失了从LPP催化香紫苏醇形成的一些或全部能力，而不损害它们适用于本发明的适用性。

术语“核酸序列”、“核酸”和“多核苷酸”可互换使用，意指核苷酸的序列。核酸序列可以是单链或双链脱氧核糖核苷酸，或任何长度的核糖核苷酸，并且包括基因、外显子、内含子、有义和反义互补序列、基因组DNA、cDNA、miRNA、siRNA、mRNA、rRNA、tRNA、重组核酸序列、分离的和纯化的天然产生的DNA和/或RNA序列、合成DNA和RNA序列、片段、引物和核酸探针的编码和非编码序列。本领域技术人员了解，RNA的核酸序列与DNA序列相同，差异在于胸腺嘧啶(T)被替代为尿嘧啶(U)。

“分离的核酸”或“分离的核酸序列”被定义为一种核酸或核酸序列，其所处的环境与天然产生的核酸或核酸序列所处的环境不同。如本文使用的应用于核酸的术语“天然产生的”是指在自然界细胞中发现的核酸。例如，存在于能够从自然界来源中分离出的生物体(例如生物体的细胞)中的核酸序列，并且该核酸序列未经人类在实验室进行特意的改造，那么该核酸序列是天然产生的。

“重组核酸序列”是使用实验室方法(分子克隆)将来自多于一个来源的遗传物质组合在一起所生成的核酸序列，由此创造出不是天然产生并且不能以其它方式在生物有机体中发现的核酸序列。

“重组DNA技术”是指一种用于制备重组核酸序列的分子生物学程序，例如描述于由Weigel和Glazebrook编制的Laboratory Manuals,2002Cold Spring Harbor LabPress；和Sambrook et al.,1989Cold Spring Harbor,NY:Cold Spring HarborLaboratory Press。

术语“基因”是指一种DNA序列，其包含可操作地连接到适当调控区域(例如启动子)的被转录为RNA分子(例如细胞中的mRNA)的区域。因此，基因可以包含多个可操作地连接的序列，诸如启动子、5’前导序列(包含例如参与翻译初始化的序列)、cDNA或基因组DNA的编码区、内含子、外显子和/或3’非翻译序列(包含例如转录终止位点)。

“嵌合基因”是指通常不能在自然界于物种中找到的任何基因，特别是其中核酸序列存在一个或多个部分在性质上彼此不相关联的基因。例如，启动子在性质上与转录区的部分或全部或与另一调控区不相关联。术语“嵌合基因”应当被理解为包括表达构建体，其中启动子或转录调控序列被可操作地连接到一个或多个编码序列或反义(即有义链的反向互补链)或反向重复序列(有义和反义，由此RNA转录物在转录后形成双链RNA)。术语“嵌合基因”还包括这样的基因，其通过组合一个或多个编码序列的部分而获得以产生新基因。

“3’URT”或“3’非翻译序列”(也称为“3’未翻译区”或“3’末端”)是指在基因编码序列的下游发现的核酸序列，其包含例如转录终止位点和(在大多数但非全部的真核mRNA中)多聚腺苷酸化信号诸如AAUAAA或其变体。在转录终止后，mRNA转录物可以在多聚腺苷酸化信号的下游被切去，并且可以添加poly(A)尾，其参与了mRNA向翻译位点例如胞浆的转运。

“基因的表达”包括基因的转录和mRNA向蛋白质的翻译。过表达是指在转基因细胞或生物体中，以mRNA水平、多肽和/或酶活性测量的基因产物的生产超过了在相似遗传背景的非转化细胞或生物体中的生产水平。

如本文中使用的“表达载体”是指使用分子生物学方法和重组DNA技术工程化以将外来或外源DNA递送到宿主细胞中的核酸分子。表达载体典型地包括适合转录核苷酸序列所需的序列。编码区通常编码目的蛋白，但是也可以编码RNA，例如反义RNA、siRNA等。

如本文所使用的“表达载体”包括任何线性的或环状的重组载体，包括但不限于病毒载体、噬菌体和质粒。本领域技术人员根据表达系统能够选择适合的载体。在一个实施方案中，表达载体包括本文实施方案的核酸，其可操作地连接到至少一个调控序列(其控制转录、翻译、起始和终止，诸如转录启动子、操纵子和增强子)或mRNA核糖体结合位点，和可选地包括至少一个选择标记。当调控序列功能性地涉及本文实施方案的核酸时，核苷酸序列是“可操作地连接的”。“调控序列”是指一种核酸序列，其确定本文实施方案的核酸序列的表达水平、并且能够调控可操作地连接到该调控序列的核酸序列的转录速率。调控序列包含启动子、增强子、转录因子、启动子元件等。

“启动子”是指一种核酸序列，其通过提供RNA聚合酶用的结合位点以及适合转录所需的其它因子，包括但不限于转录因子结合位点、抑制子和活化子蛋白结合位点来控制编码序列的表达。术语启动子的含义包括术语“启动子调控序列”。启动子调控序列可以包括可能影响转录、RNA加工或相关编码核酸序列的稳定性的上游和下游元件。启动子包括天然来源的和合成的序列。编码核酸序列通常位于启动子相对于以转录起始位点为起始的转录方向的下游。

术语“组成型启动子”是指未经调控的启动子，其允许其可操作地连接的核酸序列的持续转录。

如本文所使用，术语“可操作地连接”是指处于功能性关系的多核苷酸元件的连接。当核酸与另一核酸序列处于功能性关系时，那么该核酸是“可操作地连接的”。例如，如果启动子或者转录调控序列能够影响编码序列的转录，那么该启动子或者转录调控序列是可操作地连接到该编码序列的。可操作地连接意味着被连接的DNA序列通常是邻接的。与启动子序列相关的核苷酸序列相对于要被转化的植物可以是同源或异源来源的。所述序列还可以是完全或部分合成的。不管来源如何，与启动子序列相关的核酸序列将根据在结合到本文实施方案的多肽后所连接的启动子性质而表达或沉默。相关核酸在所有时间或替代地在特定时间在整个生物体中或在特定组织、细胞或细胞室中可以编码需要表达或抑制的蛋白。此种核苷酸序列特别地编码将所需表型性状赋予给由其改变或转化的宿主细胞或生物体的蛋白质。更特别地，相关核苷酸序列引起在生物体中(+)-迈诺醇合酶的生产。

“靶肽”是指一种氨基酸序列，其将蛋白质或多肽靶向细胞内细胞器(即，线粒体或质体)或细胞外空间(分泌信号肽)。编码靶肽的核酸序列可以被融合到编码蛋白或多肽的氨基末端(例如N-末端)的核酸序列或者可以被用来替换原有的靶多肽。

术语“引物”是指短的核酸序列，其被杂交到模板核酸序列并且被用于与该模板互补的核酸序列的聚合。

如本文所使用的，术语“宿主细胞”或“经转化的细胞”是指被改变以包藏至少一种核酸分子(例如，编码所需蛋白或核酸序列的重组基团，其在转录后产生CPP合酶蛋白和香紫苏醇合酶蛋白或者一起产生(+)-迈诺醇)的细胞(或生物体)。

宿主细胞特别地是细菌细胞、真菌细胞或植物细胞。宿主细胞可以含有已经被整合到该宿主细胞的核或细胞器的基因组中的重组基因。或者，宿主可以含有染色体外的重组基因。同源序列包括直系同源或旁系同源序列。鉴定直系同源物或旁系同源物的方法包括现有技术中已知且在本文中描述的系统发生学方法、序列相似性和杂交方法。

旁系同源物来源于基因复制，其产生具有相似序列和相似功能的两种或更多种基因。旁系同源物典型地聚簇在一起并且通过基因在相关植物物种内的复制而形成。使用成对Blast分析或在基因家族的系统发生分析过程中使用程序诸如CLUSTAL在类似基因的组中发现旁系同源物。在旁系同源物中，共有序列可被鉴定为与相关基因内的序列特征相似，并具有相似的基因功能。

直系同源物或直系同源序列是彼此相似的序列，因为它们在由共同的祖先传下的物种中发现。例如，具有共同祖先的植物物种已知含有具有相同类似序列和功能的许多酶。本领域技术人员能够鉴定直系同源序列并预测直系同源物的功能，例如通过使用CLUSTAL或BLAST程序构建一个物种的基因家族的进化树。

术语“选择性标记物”是指在表达时能够被用来选择包括该选择性标记物的一个或多个细胞的任何基因。以下描述了选择性标记物的例子。本领域技术人员了解不同的抗生素、杀真菌剂、营养缺陷型或除草剂选择标记物可适用于不同的目标物种。

术语“生物体”是指任何非人多细胞或单细胞生物体。诸如植物或微生物。特别地，微生物是细菌、酵母、藻类或真菌。

术语“植物”可互换地使用以包括植物细胞，包括植物原生质体、植物组织、产生再生植物或植物部分的植物细胞组织培养物、或植物器官如根、茎、叶、花、花粉、胚珠、胚、果实等。任何植物均可以用来实施本文实施方案的方法。

对于本文和所附权利要求书中的描述，除非另有说明，“或”的使用意指“和/或”。类似地，“包含(comprise)”、“包含(comprises)”、“包含(comprising)”、“包括(include)”、“包括(includes)”和“包括(including)”可以互换使用并且不旨在限制。

还应当理解的是，在各个实施方案的描述使用术语“包含”的情况下，本领域技术人员能够理解，在一些具体情形中，可以替代地使用语言“基本上由……组成”或“由……组成”来描述一个实施方案。

在一个实施方案中，本文提供了用编码具有柯巴基二磷酸合酶活性的多肽的核酸和编码具有香紫苏醇合酶活性的多肽的核酸转化宿主细胞或非人生物体的方法，其中该具有柯巴基二磷酸活性的多肽包含与从SEQ ID NO:1和SEQ ID NO:2中选出的多肽具有至少90％、95％、98％、99％或100％序列同一性的氨基酸序列。特别地，该具有香紫苏醇合酶活性的多肽包含与从SEQ ID NO:4和SEQ ID NO:5中选出的多肽具有至少90％、95％、98％、99％或100％序列同一性的氨基酸序列。

在一个实施方案中，本文提供的方法包括培养非人宿主生物体或细胞，其能够生产香叶基香叶基二磷酸(GGPP)，并经转化以表达具有柯巴基二磷酸合酶活性的多肽，其中该具有柯巴基二磷酸合酶活性的多肽包含与从SEQ ID NO:1和SEQ ID NO:2中选出的多肽具有至少90％、95％、98％、99％或100％序列同一性的氨基酸序列，并进一步经转化以表达具有香紫苏醇合酶活性的多肽。特别地，该具有香紫苏醇合酶活性的多肽包含与从SEQ IDNO:4和SEQ ID NO:5中选出的多肽具有至少90％、95％、98％、99％或100％序列同一性的氨基酸序列。

本文还提供了一种表达载体，包含编码CPP合酶的核酸，其中该CPP合酶包含多肽，该多肽包含与从SEQ ID NO:1和SEQ ID NO:2中选出的多肽具有至少90％、95％、98％、99％或100％序列同一性的氨基酸序列，并且该表达载体还包含编码香紫苏醇合酶的核酸。特别地，该香紫苏醇合酶具有与从SEQ ID NO:4和SEQ ID NO:5中选出的多肽有至少90％、95％、98％、99％或100％相似或相同的氨基酸序列。在一个具体的实施方案中，这两种酶可以在相同细胞中转化的两种不同的载体上。在另一个实施方案中，这两种酶可以在两种不同的细胞中转化的两种不同的载体上。

本文还提供了非人宿主生物体或细胞，其经转化以包藏至少一种编码CPP合酶的核酸和至少一种编码香紫苏醇酶的核酸，其中该CPP合酶包含多肽，该多肽包含与从SEQ IDNO:1和SEQ ID NO:2中选出的多肽具有至少90％、95％、98％、99％或100％序列同一性的氨基酸序列。特别地，该香紫苏醇合酶具有与从SEQ ID NO:4和SEQ ID NO:5中选出的多肽有至少90％、95％、98％、99％或100％相似或相同的氨基酸序列。

在一个实施方案中，编码本文提供的CPP合酶的核酸包含与序列ID NO:3具有至少90％、95％、98％、99％或100％序列同一性的核苷酸序列。

在一个实施方案中，编码本文提供的CPP合酶的核酸包含与序列ID NO:3具有至少95％、98％、99％或100％序列同一性的核苷酸序列。

在一个实施方案中，编码本文提供的CPP合酶的核酸包含与序列ID NO:3具有至少98％、99％或100％序列同一性的核苷酸序列。

在一个实施方案中，编码本文提供的CPP合酶的核酸包含与序列ID NO:3具有99％或100％序列同一性的核苷酸序列。在一个实施方案中，编码本文提供的CPP合酶的核酸包含与序列ID NO:3相同的核苷酸序列。

在一个实施方案中，CPP合酶包含多肽，该多肽包含与从SEQ ID NO:1和SEQ IDNO:2中选出的多肽具有至少90％、95％、98％、99％或100％序列同一性的氨基酸序列。

在一个实施方案中，CPP合酶包含多肽，该多肽包含与SEQ ID NO:1具有至少90％、95％、98％、99％或100％序列同一性的氨基酸序列。

在一个实施方案中，CPP合酶包含多肽，该多肽包含与SEQ ID NO:1具有至少95％、98％、99％或100％序列同一性的氨基酸序列。

在一个实施方案中，CPP合酶包含多肽，该多肽包含与SEQ ID NO:1具有至少98％、99％或100％序列同一性的氨基酸序列。

在一个实施方案中，CPP合酶包含多肽，该多肽包含与SEQ ID NO:1具有至少99％或100％序列同一性的氨基酸序列。在一个实施方案中，CPP合酶包含多肽，该多肽包含与SEQ ID NO:1相同的氨基酸序列。

在一个实施方案中，CPP合酶包含多肽，该多肽包含与SEQ ID NO:2具有至少90％、95％、98％、99％或100％序列同一性的氨基酸序列。

在一个实施方案中，CPP合酶包含多肽，该多肽包含与SEQ ID NO:2具有至少95％、98％、99％或100％序列同一性的氨基酸序列。

在一个实施方案中，CPP合酶包含多肽，该多肽包含与SEQ ID NO:2具有至少98％、99％或100％序列同一性的氨基酸序列。

在一个实施方案中，CPP合酶包含多肽，该多肽包含与SEQ ID NO:2具有至少99％或100％序列同一性的氨基酸序列。

在一个实施方案中，CPP合酶包含多肽，该多肽包含与SEQ ID NO:2相同的氨基酸序列。

在一个实施方案中，编码香紫苏醇合酶的核酸具有与SEQ ID NO.6有至少90％、95％、98％、99％或100％相似或相同的核苷酸序列。

在一个实施方案中，香紫苏醇合酶具有与SEQ ID NO:4有至少90％、95％、98％、99％或100％相似或相同的氨基酸序列。

在一个实施方案中，香紫苏醇合酶具有与SEQ ID NO:4有至少95％、98％、99％或100％相似或相同的氨基酸序列。

在一个实施方案中，香紫苏醇合酶具有与SEQ ID NO:4有至少98％、99％或100％相似或相同的氨基酸序列。

在一个实施方案中，香紫苏醇合酶具有与SEQ ID NO:4有至少99％或100％相似或相同的氨基酸序列。

在一个实施方案中，香紫苏醇合酶具有与SEQ ID NO:4相同的氨基酸序列。

在一个实施方案中，香紫苏醇合酶具有与SEQ ID NO:5有至少90％、95％、98％、99％或100％相似或相同的氨基酸序列。

在一个实施方案中，香紫苏醇合酶具有与SEQ ID NO:5有至少95％、98％、99％或100％相似或相同的氨基酸序列。

在一个实施方案中，香紫苏醇合酶具有与SEQ ID NO:5有至少98％、99％或100％相似或相同的氨基酸序列。

在一个实施方案中，香紫苏醇合酶具有与SEQ ID NO:5有至少99％或100％相似或相同的氨基酸序列。

在一个实施方案中，香紫苏醇合酶具有与SEQ ID NO:5相同的氨基酸序列。

在另一个实施方案中，本文提供了包含本文所述的核酸的表达载体。表达载体可以包含本文所述的一种或多种核酸。

在另一个实施方案中，本文提供了非人宿主生物体或细胞，其经转化以包藏至少一种本文所述的核酸，从而异源表达或过度表达至少一种本文所述的多肽。

在一个实施方案中，本文提供的非人宿主生物体是植物、原核生物或真菌。

在一个实施方案中，本文提供的非人宿主是微生物，特别是细菌或酵母。

在一个实施方案中，本文提供的非人生物体是大肠杆菌(E.coli)，并且所述酵母是酿酒酵母(Sacchromyces cerevisiae)。

在一个实施方案中，本文提供的非人生物体是酿酒酵母。

在一个实施方案中，细胞是原核细胞。

在其他实施方案中，细胞是细菌细胞。

在一个实施方案中，细胞是真核细胞。

在一个实施方案中，真核细胞是酵母细胞或植物细胞。

在一个实施方案中，生产(+)-迈诺醇的方法以至少98％或98.5％的纯度生产(+)-迈诺醇。

在另一个实施方案中，本文提供的方法还包括使用本领域公知的方法使用化学或生物化学合成或两者的组合将(+)-迈诺醇加工成衍生物。

在一个实施方案中，(+)-迈诺醇衍生物选自烃、醇、缩醛、醛、酸、醚、酮、内酯、乙酸酯和酯。

根据本发明的任何实施方案，所述(+)-迈诺醇衍生物是可选地包含一个、两个或三个氧原子的C₁₀至C₂₅化合物。

在另一个实施方案中，衍生物选自乙酸迈诺醇酯((3R)-3-甲基-5-[(1S,4aS,8aS)-5,5,8a-三甲基-2-亚甲基十氢-1-萘基]-1-戊烯-3-基乙酸酯)、柯巴醇((2E)-3-甲基-5-[(1S,4aS,8aS)-5,5,8a-三甲基-2-亚甲基十氢-1-萘基]-2-戊烯-1-醇)、乙酸柯巴醇酯((2E)-3-甲基-5-[(1S,4aS,8aS)-5,5,8a-三甲基-2-亚甲基十氢-1-萘基]-2-戊烯-1-基乙酸酯)、柯巴醛((2E)-3-甲基-5-[(1S,4aS,8aS)-5,5,8a-三甲基-2-亚甲基十氢-1-萘基]-2-戊烯醛)、(+)-迈诺醇氧基(4-[(1S,4aS,8aS)-5,5,8a-三甲基-2-亚甲基十氢-1-萘基]-2-丁酮)、Z-11((3S,5aR,7aS,11aS,11bR)-3,8,8,11a-四甲基十二氢-3,5a-环氧萘并[2,1-c]氧杂七环)、γ-ambrol(2-[(1S,4aS,8aS)-5,5,8a-三甲基-2-亚甲基十氢-1-萘基]乙醇)和(降龙涎香醚，(3aR,5aS,9aS,9bR)-3a,6,6,9a-四甲基十二氢萘并[2,1-b]呋喃)。

在另一个实施方案中，本文提供的方法还包括使(+)-迈诺醇与合适的反应体系接触以将所述(+)-迈诺醇转化成合适的(+)-迈诺醇衍生物。所述合适的反应体系可以是酶促性质的(例如需要一种或多种酶)或化学性质的(例如需要一种或多种合成化学品)。

例如，可以使用文献中描述的方法(例如美国专利号7,294,492中所述)将(+)-迈诺醇通过酶催化转化成迈诺醇氧基或γ-ambrol，其中所述专利通过引用整体并入本文。

在又一个实施方案中，(+)-迈诺醇衍生物是柯巴醇及其与C₁-C₅羧酸形成的酯。

在又一个实施方案中，(+)-迈诺醇衍生物是与C₁-C₅羧酸形成的(+)-迈诺醇酯。

在一个实施方案中，(+)-迈诺醇衍生物是柯巴醛。

在一个实施方案中，(+)-迈诺醇衍生物是迈诺醇氧基。

在又一个实施方案中，(+)-迈诺醇衍生物是Z-11。

在一个实施方案中，(+)-迈诺醇衍生物是γ-ambrol，或是其及其与C₁-C₅羧酸形成的酯的混合物，特别是γ-ambrol及其酯。

在另一个实施方案中，(+)-迈诺醇衍生物是香紫苏内酯(也称为3a,6,6,9a-四甲基十氢萘并[2,1-b]呋喃-2(1H)-酮及其全部非对映异构体和立体异构体)、3,4a,7,7,10a-五甲基十二氢-1H-苯并[f]色原烯-3-醇或3,4a,7,7,10a-五甲基-4a,5,6,6a,7,8,9,10,10a,10b-十氢-1H-苯并[f]色烯及其所有非对映异构体和立体异构体环酮和开环形式、(1R,2R,4aS,8aS)-1-(2-羟乙基)-2,5,5,8a-四甲基十氢萘-2-醇DOL、γ-ambrol。

在实施例中详细描述了如何能获得所述衍生物(例如三烯烃、乙酸酯或柯巴醇)的具体实例。

例如，根据EP 212254，根据本发明获得的迈诺醇可以被加工成迈诺醇氧基(一种酮，按照已知的方法)，然后被加工成ambrol(一种醇)和降龙涎香醚(一种醚)。

多肽催化特定倍半萜合成的能力可通过进行如本文提供的实施例中详述的酶测定来证实。

多肽还意欲包括截短的多肽，条件是它们保持其(+)-迈诺醇合酶活性和香紫苏醇合酶活性。截短的CPP合酶多肽例如具有如本文前面所定义的CPP合酶的活性。截短的香紫苏醇合酶多肽例如具有如本文前面所定义的香紫苏醇合酶的活性。

如下文所期望的，通过修饰本文所述序列获得的核苷酸序列可以使用本领域已知的任何方法，例如通过引入任何类型的突变，例如缺失、插入或置换突变来进行。这种方法的例子列举在说明书中涉及变体多肽及其制备方法的部分中。

两个肽或核苷酸序列之间的同一性百分比是当产生这两个序列的比对时，两个序列中相同的氨基酸或核苷酸残基的数目的函数。相同的残基被定义为两个序列中在比对的给定位置的相同的残基。本文使用的序列同一性的百分比是从最佳比对中通过将两个序列之间相同的残基数除以最短序列中的残基总数并乘以100计算得到的。最佳比对是同一性百分比最高可能性的比对。可以将空位引入到一个或两个序列中的比对的一个或多个位置中以获得最佳比对。然后将这些空位考虑为用于计算序列同一性百分比的不相同的残基。用于确定氨基酸或核酸序列同一性百分比的比对可以使用计算机程序以及例如在互联网上可公开获得的计算机程序以多种方式实现。优选地，可使用设定为默认参数可从National Center for Biotechnology Information(NCBI)于http://www.ncbi.nlm.nih.gov/BLAST/bl2seq/wblast2.cgi获得的BLAST程序(Tatiana等，FEMSMicrobiol Lett.,1999,174:247-250,1999)来获得肽或核苷酸序列的最佳比对并计算序列同一性的百分比。

要与GGPP体外接触的多肽可以使用标准蛋白或酶提取技术从表达它的任何有机体中提取得到。如果宿主生物体是将本文实施方案的多肽释放到培养基中的单细胞生物体或细胞，那么可以简单地从所述培养基收集所述多肽，例如，通过离心，可选地随后进行洗涤步骤和再悬浮于适合的缓冲液中。如果该生物体或细胞将多肽累积于其细胞中，那么可以通过破裂或裂解该细胞并且进一步从细胞裂解液中提取多肽来获得该多肽。

根据另一个具体实施方案，上述任何实施方案的方法在体内进行。本文提供的这些实施方案是特别有利的，因为可以在不预先分离多肽的情况下在体内进行该方法。该反应直接发生在经转化以表达所述多肽的生物体或细胞内。

因此，例如，(+)迈诺醇可以通过培养本文所述的宿主细胞或生物体由GGPP来生产。

所述生物体或细胞旨在“表达”多肽，前提是所述生物体或细胞经转化以包藏编码所述多肽的核酸，这种核酸被转录至mRNA并且在该宿主生物体或细胞中发现该多肽。术语“表达”涵盖“异源表达”和“过表达”，后者是指mRNA、多肽和/或酶活性的水平高于在未经转化的生物体或细胞中所测量的水平。随后，在致力于描述作为本文具体目的的此种经转化的非人宿主生物体或细胞的说明书部分中，将描述用于转化非人宿主生物体或细胞的适合方法的更详细说明。

特定的生物体或细胞，当其天然地产生FPP或当其不天然地产生FPP但是在使用本文所述的核酸转化之前或与使用所述核酸一起被转化以生产FPP时，即“能够产生FPP”。经转化以比天然存在的生物体或细胞产生更高量的FPP的生物体或细胞也被“能够生产FPP的生物体或细胞”所涵盖。用于转化生物体(例如微生物)以便它们生产FPP的方法在本领域中是已知的。例如，微生物可以用转化。

特定的生物体或细胞，当其天然地产生GGPP或当其不天然地产生GGPP但是在使用本文所述的核酸转化之前或与使用所述核酸一起被转化以生产GGPP时，即“能够产生GGPP”。经转化以比天然存在的生物体或细胞产生更高量的GGPP的生物体或细胞也被“能够生产GGPP的生物体或细胞”所涵盖。用于转化生物体(例如微生物)以便它们生产GGPP的方法在本领域中是已知的。

适合于在体内进行本文实施方案的方法的非人宿主生物体可以是任何非人多细胞或单细胞生物体。在一个具体的实施方式中，用来在体内进行本文实施方案的非人宿主生物体是植物、原核生物或真菌。可以使用任何植物、原核生物或真菌。特别有用的植物是天然产生高量萜烯的那些。在一个更具体的实施方案中，用来在体内进行本文实施方案的方法的非人宿主生物体是微生物。可以使用任何微生物，但根据甚至更具体的实施方案，所述微生物是细菌或酵母。更特别地，所述细菌是大肠杆菌且所述酵母是酿酒酵母。

这些生物体的一些天然不产生GGPP，或者只产生少量的GGPP。为了适合于进行本文实施方案的方法，这些生物体必须经转化以生产所述前体，或以较大的量生产所述前体。如以上所说明的那样，它们可以在使用根据任一上述实施方案所述的核酸进行修饰之前或同时地被如此转化。

生物体可以例如用编码GGPP合酶的核酸进行转化。核酸可以包含在与本文所述的编码CPP合酶或编码香紫苏醇合酶的核酸相同或不同的表达载体中。GGPP合酶可以例如包含SEQ ID NO:7中的氨基酸序列。编码GGPP合酶的核酸可以例如包含SEQ ID NO:8中的核酸序列。可以使用例如本文和本实施例中所描述的转化方法。

生物体可以用编码部分或全部甲羟戊酸途径导致FPP的一种或多种核酸转化。可以使用例如本实施例所述的方法。

也可以使用分离的高等真核细胞而不是完整的生物体作为宿主来体内进行本文实施方案的方法。合适的真核细胞可以是任何非人细胞，但特别是植物或真菌细胞。

根据另一个具体的实施方案，在本文所述的任何实施方案中使用或由本文所述的核酸编码的具有CPP合酶活性和香紫苏醇合酶活性的多肽可以是通过基因工程获得的变体，条件是所述变体保持其CPP合酶活性和香紫苏醇合酶活性。例如，变体CPP合酶多肽具有如本文前面所定义的CPP合酶的活性。变体香紫苏醇合酶多肽例如具有如本文前面所定义的香紫苏醇合酶的活性。

如本文所用，所述多肽意欲作为包含本文鉴定的氨基酸序列的多肽或肽片段，以及截短的或变异的多肽，条件是它们保持如本文所定义的其CPP合酶活性和其香紫苏醇合酶活性。

“保持活性”可以例如意指该多肽保持未突变的或未截短的多肽的至少一些原始活性，例如至少70、80、90、95、97、99或100％的活性。与未突变或未截短的多肽相比，变体或截短的多肽在一些情况下可以具有增加的活性。

变体多肽的例子是由交替mRNA剪接事件或本文所述多肽的蛋白水解切割产生的天然存在的蛋白。归因于蛋白水解的变化包括例如在不同类型的宿主细胞中表达时N-或C-末端的差异，这是由于从本文实施方案的多肽蛋白水解去除一个或多个末端氨基酸引起的。本文实施方案还涵盖了如下文所描述的，通过天然或人工突变本文实施方案的核酸获得的核酸所编码的多肽。

由在氨基和羧基末端融合额外的肽序列产生的多肽变体也可以用在本文实施方案的方法中。特别地，此种融合能够增强多肽的表达，有用于蛋白的纯化或改善多肽在期望环境或表达系统中的酶活性。此种额外的肽序列例如可以是信号肽。因此，本发明包括使用变体多肽(诸如通过与其它寡肽或多肽融合所获得的那些和/或连接到信号肽的那些)的方法。由与另一种功能肽(诸如来自萜生物合成路径的另一种蛋白)融合产生的多肽也可以有利地用于本文实施方案的方法中。

如上所述，编码本文一个实施方案的多肽的核酸是一种有用的工具，用于修饰在体内实施所述方法时打算使用的非人宿主生物体或细胞。

因此，本文还提供了编码根据任何上述实施方案的多肽的核酸。

本文实施方案的核酸可以被定义为包括单链形式或双链形式的脱氧核糖核苷酸或核糖核苷酸聚合物(DNA和/或RNA)。术语“核苷酸序列”应当被理解为包含多核苷酸分子或独立片段形式的寡核苷酸分子或作为较大核酸的组件。本文实施方案的核酸还涵盖某些分离的核苷酸序列，包括基本上不含内源性污染物质的那些分离的核苷酸序列。本文实施方案的核酸可以是截短的，条件是其编码如上所述的本文涵盖的多肽。

在一个实施方案中，本文实施方案的编码CPP合酶的核酸可以天然存在于植物例如丹参(Salvia miltiorrhiza)或其他物种中，或通过修饰SEQ ID NO:3而获得。

在进一步的实施方案中，本文实施方案的编码香紫苏醇合酶的核酸可以天然存在于植物例如南欧丹参(Salvia sclarea)或其他物种中，或者可以通过修饰SEQ ID NO:6而获得。

突变可以是这些核酸的任何种类的突变，例如点突变、缺失突变、插入突变和/或移码突变。可以制备变体核酸以使其核苷酸序列适应特定的表达系统。例如，如果氨基酸由特定密码子编码，则已知细菌表达系统更有效地表达多肽。

由于遗传密码的简并性，多于一个的密码子可以编码相同的氨基酸序列，多个核酸序列可以编码相同的蛋白质或多肽，所有这些DNA序列都涵盖在本文的实施方案中。在适当的情况下，可以对编码CPP合酶和香紫苏醇合酶的核酸序列进行优化以提高在宿主细胞中的表达。例如，可以使用宿主特有的密码子合成本文实施方案的核苷酸以改善表达。

用于转化适合于在体内实施本文实施方案的方法的宿主生物体或细胞的另一个重要工具是包含根据本文实施方案的任何实施方案的核酸的表达载体。因此这里也提供了这种载体。表达载体可以例如包含如本文所述的编码CPP合酶的核酸，编码香紫苏醇合酶的核酸或编码GGPP合酶的核酸中的一种或多种。

经转化以包藏本文实施方案的至少一种核酸以便异源表达或过表达本文实施方案的至少一种多肽的重组非人宿主生物体和细胞，也是实施本文实施方案的方法的非常有用的工具。因此，本文也提供此种非人宿主生物体和细胞。

根据任何上述实施方案的核酸可用于转化非人宿主生物体和细胞，经表达的多肽可以是任何上述多肽。

本文实施方案的非人宿主生物体可以是任何非人多细胞或单细胞生物体。在一个具体的实施方案中，非人类宿主生物是植物、原核生物或真菌。任何植物、原核生物或真菌都适合根据本文提供的方法进行转化。特别有用的植物是天然产生大量萜烯的植物。

在更具体的实施方案中，非人宿主生物体是微生物。任何微生物都适用于本文，但是根据甚至更具体的实施方案，所述微生物是细菌或酵母。最特别的是，所述细菌是大肠杆菌，并且所述酵母是酿酒酵母。

除了完整的生物体，分离的高等真核细胞也可以被转化。作为高等真核细胞，这里是指除酵母细胞之外的任何非人真核细胞。特别的高等真核细胞是植物细胞或真菌细胞。

通过附接共价或非共价连接到多肽主链的修饰基团，变体也可以不同于本文实施方案的多肽。

通过引入N-连接的或O-连接的糖基化位点、和/或添加半胱氨酸残基，所述变体还包括与本文描述的多肽不同的多肽。本领域技术人员能够了解如何修饰氨基酸序列和保留生物活性。

本文提供的实施方案包括但不限于cDNA、基因组DNA和RNA序列。

基因(包括本文实施方案的多核苷酸)可以通过本领域已知的方法基于可获得的核苷酸序列信息(诸如在所附的序列表中发现的)进行克隆。这些包括例如设计表示此种基因的侧翼序列的DNA引物，所述基因的一种是在有义取向上产生的并且初始化有义链的合成，而另一种以反向互补的方式创造并且产生反义链。诸如在聚合酶链反应中使用的那些热稳定的DNA聚合酶通常被用来进行此种实验。或者，表示基因的DNA序列可以被化学合成并且随后导入到DNA载体分子中，所述DNA载体分子可以通过例如相容性细胞(诸如大肠杆菌)来繁殖。

本文提供了通过SEQ ID NO:3和SEQ ID NO:6的突变获得的核酸序列；这种突变可以定期进行。技术人员清楚，可以将一个或多个核苷酸的突变、缺失、插入和/或取代引入到这些DNA序列中。

本文实施方案的编码CPP合酶和香紫苏醇合酶蛋白的核酸序列可以插入到表达载体中和/或包含在插入于表达载体中的嵌合基因中，以在宿主细胞或宿主生物体中产生CPP合酶和香紫苏醇合酶。用于将转基因插入到宿主细胞基因组中的载体在本领域是公知的，并且包括质粒、病毒、粘粒和人工染色体。其中插入了嵌合基因的二元或共整合载体也用于转化宿主细胞。

本文提供的实施方案提供了重组表达载体，其包含编码CPP合酶和香紫苏醇合酶的核酸，其分别与相关的核酸序列例如启动子序列可操作地连接。

或者，启动子序列可能已经存在于载体中，使得要被转录的核酸序列插入到启动子序列下游的载体中。载体通常被工程化以具有复制起点、多克隆位点和选择标记。

实施例

实施例1

二萜合酶基因

两种二萜合酶是将香叶基香叶基二磷酸(GGPP)转化为迈诺醇所必需的：II型和I型二萜合酶。在这些实施例中，对于II型二萜合酶，使用了柯巴基二磷酸(CPP)合酶丹参(Salvia miltiorrhiza)(NCBI登录号ABV57835.1)。为了在大肠杆菌细胞中最佳表达，对cDNA的密码子使用进行优化，除去前58个密码子并添加ATG起始密码子。对于I型二萜合酶，使用来自南欧丹参(Salvia sclarea)(SsScS)的香紫苏醇合酶(NCBI登录号AET21246.1，WO2009095366)。对于大肠杆菌表达(DNA2.0，Menlo Park，CA94025)，对cDNA的密码子使用进行了优化，去除了前50个N端密码子。在体外合成这两种cDNA中的每一种，并将其克隆在侧翼具有NdeI和KpnI限制酶识别位点(DNA 2.0，Menlo Park，CA 94025，USA)的pJ208质粒中。

实施例2

表达质粒

用NdeI和KpnI消化编码cDNA的经修饰的CPP合酶(SmCPS2)和香紫苏醇合酶(SsScS)，并连接到pETDuet-1质粒中，分别提供pETDuet-SmCPS2和pETDuet-1132opt表达质粒。

构建另一个质粒以共表达SmCPS2和SsScS酶以及香叶基香叶基二磷酸(GGPP)合酶。对于GGPP合酶，使用编码GGPP合酶(NCBI登录号AAA24819.1)的来自成团泛菌(Pantoeaagglomerans)的CrtE基因(NCBI登录号M38424.1)。通过密码子优化来合成CrtE基因，并在3'和5'末端添加NcoI和BamHI限制酶识别位点(DNA 2.0,Menlo Park,CA 94025,USA)，并连接到pETDuet-1质粒的NcoI与BamHI位点之间以获得pETDuet-CrtE质粒。用NdeI和KpnI消化编码cDNA的经修饰的SmCPS2并连接到pETDuet-1-CrtE质粒中，从而提供pETDuet-CrtE-SmCPS2构建体。然后使用In-技术(Clontech,Takara Bio Europe)将编码截短的SsScS的优化的cDNA(Sa1132opt)导入到pETDuet-CrtE-SmCPS2质粒中。对于这种克隆，在PCR扩增中使用pETDuet-1132opt作为模板，该PCR扩增使用正向引物SmCPS2-1132Inf_F15’-CTGTTTGAGCCGGTCGCCTAAGGTACCAGAAGGAGATAAATAATGGCGAAAATGAAGGAGAACTTTAAACG-3’和反向引物1132-pET_Inf_R15’-GCAGCGGTTTCTTTACCAGACTCGAGGTCAGAACACGAAGCTCTTC ATGTCCTCT-3’。将PCR产物连接到用KpnI和XhoI限制酶消化的质粒pETDuet-CrtE-SmCPS2中，并使用In-Dry-Down PCRCloning Kit(Clontech,Takara Bio Europe)提供新的质粒pETDuet-CrtE-SmCPS2-SsScS。在该质粒中，CrtE基因处于pETDuet质粒的第一个T7启动子的控制下，编码cDNA的CPP合酶和香紫苏醇合酶在第二个T7启动子控制下在双顺反子构建体中组织。

实施例3

在大肠杆菌中的异源表达和酶活性

使用表达质粒(pETDuet-SmCPS2或pETDuet-1132opt)转化Bl21(DE3)大肠杆菌细胞(Novagene,Madison,WI)。将经转化细胞的单菌落用于接种25ml LB培养基。在37℃温育5至6小时后，将培养物转移至20℃培养箱中并保持1小时以平衡。然后通过加入0.1mM IPTG来诱导蛋白的表达，并将培养物在20℃温育过夜。第二天，通过离心收集细胞，重悬于0.1体积的50mM MOPSO pH7、10％甘油、1mM DTT中并通过超声裂解。通过离心(20,000g，30分钟)清除提取物，并将含有可溶性蛋白的上清液用于进一步实验。

实施例4

体外二萜合酶活性测定

在Teflon密封的玻璃试管中进行酶测定，使用50～100μl蛋白提取物，最终体积为1mL的50mM MOPSO pH7、10％甘油，补充有20mM MgCl₂，和50～200μM纯化的香叶基香叶基二磷酸(GGPP)(按照Keller和Thompson,J.Chromatogr 645(1),161-167,1993所述制备)。将试管在30℃温育5至48小时，酶产物用一倍体积的戊烷萃取两次。在氮流通下浓缩后，通过GC-MS分析提取物并与对照蛋白的提取物(从用空质粒转化的细胞获得)进行比较。GC-MS分析是在装有DB1柱(30m×0.25mm×0.25mm膜厚；Agilent)并连接有5975系列质谱仪的Agilent 6890系列GC系统上进行的。载气是1ml/min的恒定流量的氦气。注射为分流模式，注射器温度设定在260℃，烘箱温度程序升温以10℃/min从100℃升至225℃，然后以30℃/min升至280℃。根据可信标准的保留指数和质谱的一致性来确认产物的特性。

在这些条件下，并使用质粒pETDuet-SmCPS2或pETDuet-1132opt(分别异源表达SmCPS或SsScS酶)转化的来自大肠杆菌细胞的重组蛋白，在溶剂提取物中没有检测到二萜分子的生产(在这些条件下没有检测到含二磷酸的二萜)。然后进行类似的测定，但是在单一测定中将含有重组SmCPS和SsScS的两种蛋白提取物组合。在这些测定中，形成一种主要产物，并且通过质谱和保留指数与可信标准的匹配而鉴定为(+)-迈诺醇(图2)。

实施例5

使用大肠杆菌细胞的体内迈诺醇生产

使用大肠杆菌细胞来评估使用全细胞培养物在体内生产迈诺醇。为了提高内源性法呢基二磷酸(FPP)库在细胞中二萜的生产力的水平，在相同的细胞中共表达了导致FPP的异源完整甲羟戊酸途径。该途径的酶使用含有在两个启动子控制下的两个操纵子中组织的所有基因的单一质粒来表达。该表达质粒的构建描述于专利WO2013064411或Schalk等(2013)J.Am.Chem.Soc.134,18900-18903。简而言之，由大肠杆菌乙酰乙酰-CoA硫解酶(atoB)、金黄色葡萄球菌HMG-CoA合酶(mvaS)、金黄色葡萄球菌HMG-CoA还原酶(mvaA)和酿酒酵母FPP合酶(ERG20)基因组成的第一合成操纵子在体外合成(DNA2.0,Menlo Park,CA,USA)并连接到NcoI-BamHI消化的pACYCDuet-1载体(Invitrogen)中，产生pACYC-29258。从肺炎链球菌(ATCC BAA-334)的基因组DNA扩增出含有甲羟戊酸激酶(MvaK1)、磷酸甲羟戊酸激酶(MvaK2)、二磷酸甲羟戊酸脱羧酶(MvaD)和异戊烯基二磷酸异构酶(idi)的第二操纵子，并连接到pACYC-29258的第二多克隆位点中，提供质粒pACYC-29258-4506。因此该质粒含有编码从乙酰辅酶A到FPP的生物合成途径的所有酶的基因。

将KRX大肠杆菌细胞(Promega)与质粒pACYC-29258-4506和pETDuet-CrtE-SmCPS2-SsScS质粒共转化。在羧苄青霉素(50μg/ml)和氯霉素(34μg/ml)LB-琼脂糖平板上选择经转化的细胞。使用单菌落接种5mL补充有相同抗生素的液体LB培养基。培养物在37℃温育过夜。第二天，用0.2mL过夜培养物接种2mL添加有相同抗生素的TB培养基。在37℃温育6小时后，将培养物冷却至28℃，向各试管中加入0.1mM IPTG,0.2％鼠李糖和1:10体积的癸烷。培养物在28℃下孵育48小时。然后将培养物用2倍体积的MTBE(甲基叔丁基醚)提取两次，将有机相浓缩至500μL，并如上面实施例4中所述通过GC-MS进行分析，不同之处在于烘箱温度于100℃保持1分钟，接着以10℃/分钟的温度梯度升至220℃并以20℃/分钟升至3000℃。在这种培养条件下，迈诺醇作为唯一的二萜产品生产出，产量为300～500mg/L(图3)。

实施例6

使用重组细胞生产(+)-迈诺醇、纯化和NMR分析。

在实施例5中描述的条件下制备一升大肠杆菌培养物，不同之处在于用50g/LAmberlite XAD-4代替癸烷有机相进行固相萃取。将培养基过滤以回收树脂。然后用3倍柱体积的水洗涤树脂，并用3倍柱体积的MTBE洗脱。然后通过硅胶快速色谱法进一步纯化产物，使用由庚烷:MTBE为8:2(v/v)组成的流动相。通过1H-和13C-NMR证实了迈诺醇的结构。使用Bruker Avance 500MHz光谱仪测量旋光度。[α]^D ₂₀＝+26.9°(0.3％,CHCl₃)的值证实了(+)-迈诺醇的生成。

实施例7

根据下面的实验部分，将在上述实施例中获得的迈诺醇转化为其酯(在下文中作为实例被转化为其乙酸酯)：

根据文献(G.Ohloff,Helv.Chim.Acta 41,845(1958))，用20.0g(0.25摩尔)乙酰氯在100ml的二甲基苯胺中在室温下处理32.0g(0.11摩尔)纯结晶(+)-迈诺醇5天。将混合物另外在50℃下加热7小时以达到100％的转化率。冷却后，反应混合物用乙醚稀释，依次用10％H₂SO₄、NaHCO₃水溶液和水洗至中性。干燥(Na₂SO₄)并浓缩后，蒸馏产物(球对球，B.p.＝160°，0.1毫巴)，得到20.01g(79.4％)的乙酸迈诺醇酯，其未经进一步纯化即使用。

MS:M⁺332(0)；m/e:272(27),257(83),137(62),95(90),81(100).

¹H-NMR(CDCl₃):0.67,0.80,0.87,1.54和2.01(5s,3H各自),4.49(s,1H),4.80(s,1H),5.11(m,1H),5.13(m,1H),5.95(m,1H).

¹³C-NMR(CDCl₃):14.5(q),17.4(t),19.4(t),21.7(q),22.2(q),23.5(q),24.2(t),33.5(s),33.6(t),38.3(t),39.0(t),39.3(t),39.8(s),42.2(t),55.6(d),57.2(t),83.4(s),106.4(t),113.0(t),142.0(d),148.6(s),169.9(s).

实施例8

根据下面的实验部分，将在上述实施例中获得的乙酸迈诺醇酯转化为其三烯(在下文中作为实例被转化为香紫苏烯(Sclarene)和(Z+E)泪柏烯((Z+E)-Biformene)：

在室温下向0.4g乙酸迈诺醇酯在4ml环己烷中的溶液中加入0.029g(0.05当量)BF₃.AcOH络合物。在室温下15分钟后，将反应用NaHCO₃水溶液淬灭并用水洗至中性。GC-MS分析显示只有被鉴定为香紫苏烯、(Z)和(E)-泪柏烯的烃。没有检测到乙酸柯巴醇酯。

另一个更多催化剂(0.15当量)的试验给出了相同的结果。

·香紫苏烯:MS:M⁺272(18)；m/e:257(100),149(15),105(15).

·(Z)和(E)-泪柏烯(相同光谱):MS:M⁺272(29)；m/e:257(100),187(27),161(33),105(37).

实施例9

根据下面的实验部分，将上述实施例中获得的迈诺醇转化为柯巴基酯(在下文中作为实例将其转化为乙酸酯)：

在室温下向0.474g(0.826毫摩尔，0.27当量)BF₃.AcOH在100毫升环己烷中的溶液中加入4.4g乙酸酐和12.1g乙酸。在室温下，加入10.0g(33毫摩尔)在15ml环己烷中的纯结晶迈诺醇(缓慢放热)，并用水浴将温度保持在室温。在室温下搅拌30分钟后，GC对照显示没有起始材料。将反应混合物用300ml饱和NaHCO₃水溶液淬灭，并照常处理。通过快速色谱(SiO₂，戊烷/乙醚95:5)和球对球蒸馏(Eb.＝130°，0.1毫巴)纯化粗混合物(9.9g)，得到4.34g(37.1％)的(Z)和(E)-柯巴基乙酸酯的27/73混合物。

·(Z)-柯巴基乙酸酯:

MS:M⁺332(0)；m/e:317(2),272(35)＝,257(100),137(48),95(68),81(70).

¹H-NMR(CDCl₃):0.67,0.80,0.87 1.76和2.04(5s,3H各自),4.86(s,1H),5.35(t:J＝6Hz,1H).

·(E)-柯巴基乙酸酯:

MS:M⁺332(0)；m/e:317(2),272(33)＝,257(100),137(54),95(67),81(74).

¹H-NMR(CDCl₃):0.68,0.80,0.87 1.70和2.06(5s,3H各自),4.82(s,1H),5.31(t:J＝6Hz,1H).

¹³C-NMR(CDCl₃):(在(Z/E)混合物上记录的光谱，仅给出显著信号):61.4(t),106.2(t),117.9(d),143.1(s),148.6(s),171.1(s).

实施例10

根据下面的实验部分，将上述实施例中获得的柯巴基乙酸酯转化为柯巴醇：

将柯巴基乙酸酯(4.17g，12.5毫摩尔)、KOH粒料(3.35g，59.7毫摩尔)、水(1.5g)和EtOH(9.5ml)混合在一起，并在50℃下搅拌3小时。在通常的处理后，得到3.7g粗产物(Z+E)-柯巴醇，并通过快速色谱(SiO₂，戊烷/乙醚7:2)纯化，蒸发溶剂后，进行球对球蒸馏(Eb＝170°，0.1毫巴)提供3.25g(92％)的(Z)和(E)-柯巴醇的27/73混合物。

·(Z)-柯巴醇

MS:M⁺290(3)；m/e:275(18),272(27),257(82),137(71),95(93),81(100),69(70).¹H-NMR(CDCl₃):0.67,0.80,0.87和1.74(4s,3H各自)；4.06(m,2H),4.55(s,1H),4.86(s,1H),5.42(t:J＝6Hz,1H).

·(E)-柯巴醇

MS:M⁺290(3)；m/e:275(27),272(22),257(75),137(75),95(91),81(100),69(68).¹H-NMR(CDCl₃):0.68,0.80,0.87和1.67(4s,3H各自)；4.15(m,2H),4.51(s,1H),4.83(s,1H),5.39(t,J＝6Hz,1H)

¹³C-NMR(CDCl₃):(在(Z/E)混合物上记录的光谱，仅给出显著信号):):59.4(t),106.2(t),123.0(d),140.6(s),148.6(s).

NMR分析与相似化合物的公开光谱很好地一致。例如，参见S.Hasecawa,Y.Hirose,Phytochemistry 19(11),2479(1980)。

序列表

SEQ ID NO:1

SmCPS,来自丹参(S.miltiorrhiza)的全长柯巴基二磷酸合酶

MASLSSTILSRSPAARRRITPASAKLHRPECFATSAWMGSSSKNLSLSYQLNHKKISVATVDAPQVHDHDGTTVHQGHDAVKNIEDPIEYIRTLLRTTGDGRISVSPYDTAWVAMIKDVEGRDGPQFPSSLEWIVQNQLEDGSWGDQKLFCVYDRLVNTIACVVALRSWNVHAHKVKRGVTYIKENVDKLMEGNEEHMTCGFEVVFPALLQKAKSLGIEDLPYDSPAVQEVYHVREQKLKRIPLEIMHKIPTSLLFSLEGLENLDWDKLLKLQSADGSFLTSPSSTAFAFMQTKDEKCYQFIKNTIDTFNGGAPHTYPVDVFGRLWAIDRLQRLGISRFFEPEIADCLSH

IHKFWTDKGVFSGRESEFCDIDDTSMGMRLMRMHGYDVDPNVLRNFKQKDGKFSCYGGQMIESPSPIYNLYRASQLRFPGEEILEDAKRFAYDFLKEKLANNQILDKWVISKHLPDEIKLGLEMPWLATLPRVEAKYYIQYYAGSGDVWIGKTLYRMPEISNDTYHDLAKTDFKRCQAKHQFEWLYMQEWYESCGIEEFGISRKDLLLSYFLATASIFELERTNERIAWAKSQIIAKMITSFFNKETTSEEDKRALLNELGNINGLNDTNGAGREGGAGSIALATLTQFLEGFDRYTRHQLKNAWSVWLTQLQHGEADDAELLTNTLNICAGHIAFREEILAHNEYKALSNLTSKICRQLSFIQSEKEMGVEGEIAAKSSIKNKELEEDMQMLVKLVLEKYGGIDRNIKKAFLAVAKTYYYRAYHAADTIDTHMFKVLFEPVA

SEQ ID NO:2

SmCPS2,来自丹参(S.miltiorrhiza)的截短的柯巴基二磷酸合酶

MATVDAPQVHDHDGTTVHQGHDAVKNIEDPIEYIRTLLRTTGDGRISVSPYDTAWVAMIKDVEGRDGPQFPSSLEWIVQNQLEDGSWGDQKLFCVYDRLVNTIACVVALRSWNVHAHKVKRGVTYIKENVDKLMEGNEEHMTCGFEVVFPALLQKAKSLGIEDLPYDSPAVQEVYHVREQKLKRIPLEIMHKIPTSLLFSLEGLENLDWDKLLKLQSADGSFLTSPSSTAFAFMQTKDEKCYQFIKNTIDTFNGGAPHTYPVDVFGRLWAIDRLQRLGISRFFEPEIADCLSHIHKFWTDKGVFSGRESEFCDIDDTSMGMRLMRMHGYDVDPNVLRNFKQKDGKFSCYGGQMIESPSPIYNLYRASQLRFPGEEILEDAKRFAYDFLKEKLANNQILDKWVISKHLPDEIKLGLEMPWLATLPRVEAKYYIQYYAGSGDVWIGKTLYRMPEISNDTYHDLAKTDFKRCQAKHQFEWLYMQEWYESCGIEEFGISRKDLLLSYFLATASIFELERTNERIAWAKSQIIAKMITSFFNKETTSEEDKRALLNELGNINGLNDTNGAGREGGAGSIALATLTQFLEGFDRYTRHQLKNAWSVWLTQLQHGEADDAELLTNTLNICAGHIAFREEILAHNEYKALSNLTSKICRQLSFIQSEKEMGVEGEIAAKSSIKNKELEEDMQMLVKLVLEKYGGIDRNIKKAFLAVAKTYYYRAYHAADTIDTHMFKVLFEPVA

SEQ ID NO:3

SmCPS2opt,经优化的编码SmCPS2的cDNA

ATGGCAACTGTTGACGCACCTCAAGTCCATGATCACGATGGCACCACCGTTCACCAGGGTCACGACGCGGTGAAGAACATCGAGGACCCGATCGAATACATTCGTACCCTGCTGCGTACCACTGGTGATGGTCGCATCAGCGTCAGCCCGTATGACACGGCGTGGGTGGCGATGATTAAAGACGTCGAGGGTCGCGATGGCCCGCAATTTCCTTCTAGCCTGGAGTGGATTGTCCAAAATCAGCTGGAAGATGGCTCGTGGGGTGACCAGAAGCTGTTTTGTGTTTACGATCGCCTGGTTAATACCATCGCATGTGTGGTTGCGCTGCGTAGCTGGAATGTTCACGCTCATAAAGTCAAACGTGGCGTGACGTATATCAAGGAAAACGTGGATAAGCTGATGGAAGGCAACGAAGAACACATGACGTGTGGCTTCGAGGTTGTTTTTCCAGCCTTGCTGCAGAAAGCAAAGTCCCTGGGTATTGAGGATCTGCCGTACGACTCGCCGGCAGTGCAAGAAGTCTATCACGTCCGCGAGCAGAAGCTGAAACGCATCCCGCTGGAGATTATGCATAAGATTCCGACCTCTCTGCTGTTCTCTCTGGAAGGTCTGGAGAACCTGGATTGGGACAAACTGCTGAAGCTGCAGTCCGCTGACGGTAGCTTTCTGACCAGCCCGAGCAGCACGGCCTTTGCGTTTATGCAGACCAAAGATGAGAAGTGCTATCAATTCATCAAGAATACTATTGATACCTTCAACGGTGGCGCACCGCACACGTACCCAGTAGACGTTTTTGGTCGCCTGTGGGCGATTGACCGTTTGCAGCGTCTGGGTATCAGCCGTTTCTTCGAGCCGGAGATTGCGGACTGCTTGAGCCATATTCACAAATTCTGGACGGACAAAGGCGTGTTCAGCGGTCGTGAGAGCGAGTTCTGCGACATCGACGATACGAGCATGGGTATGCGTCTGATGCGTATGCACGGTTACGACGTGGACCCGAATGTGTTGCGCAACTTCAAGCAAAAAGATGGCAAGTTTAGCTGCTACGGTGGCCAAATGATTGAGAGCCCGAGCCCGATCTATAACTTATATCGTGCGAGCCAACTGCGTTTCCCGGGTGAAGAAATTCTGGAAGATGCGAAGCGTTTTGCGTATGACTTCCTGAAGGAAAAGCTCGCAAACAATCAAATCTTGGATAAATGGGTGATCAGCAAGCACTTGCCGGATGAGATTAAACTGGGTCTGGAGATGCCGTGGTTGGCCACCCTGCCGAGAGTTGAGGCGAAATACTATATTCAGTATTACGCGGGTAGCGGTGATGTTTGGATTGGCAAGACCCTGTACCGCATGCCGGAGATCAGCAATGATACCTATCATGACCTGGCCAAGACCGACTTCAAACGCTGTCAAGCGAAACATCAATTTGAATGGTTATACATGCAAGAGTGGTACGAAAGCTGCGGCATCGAAGAGTTCGGTATCTCCCGTAAAGATCTGCTGCTGTCTTACTTTCTGGCAACGGCCAGCATTTTCGAGCTGGAGCGTACCAATGAGCGTATTGCCTGGGCGAAATCACAAATCATTGCTAAGATGATTACGAGCTTTTTCAATAAAGAAACCACGTCCGAGGAAGATAAACGTGCTCTGCTGAATGAACTGGGCAACATCAACGGTCTGAATGACACCAACGGTGCCGGTCGTGAGGGTGGCGCAGGCAGCATTGCACTGGCCACGCTGACCCAGTTCCTGGAAGGTTTCGACCGCTACACCCGTCACCAGCTGAAGAACGCGTGGTCCGTCTGGCTGACCCAGCTGCAGCATGGTGAGGCAGACGACGCGGAGCTGCTGACCAACACGTTGAATATCTGCGCTGGCCATATCGCGTTTCGCGAAGAGATTCTGGCGCACAACGAGTACAAAGCCCTGAGCAATCTGACCTCTAAAATCTGTCGTCAGCTTAGCTTTATTCAGAGCGAGAAAGAAATGGGCGTGGAAGGTGAGATCGCGGCAAAATCCAGCATCAAGAACAAAGAACTGGAAGAAGATATGCAGATGTTGGTCAAGCTCGTCCTGGAGAAGTATGGTGGCATCGACCGTAATATCAAGAAAGCGTTTCTGGCCGTGGCGAAAACGTATTACTACCGCGCGTACCACGCGGCAGATACCATTGACACCCACATGTTTAAGGTTTTGTTTGAGCCGGTTGCTTAA

SEQ ID NO:4

全长香紫苏醇合酶

MSLAFNVGVTPFSGQRVGSRKEKFPVQGFPVTTPNRSRLIVNCSLTTIDFMAKMKENFKREDDKFPTTTTLRSEDIPSNLCIIDTLQRLGVDQFFQYEINTILDNTFRLWQEKHKVIYGNVTTHAMAFRLLRVKGYEVSSEELAPYGNQEAVSQQTNDLPMIIELYRAANERIYEEERSLEKILAWTTIFLNKQVQDNSIPDKKLHKLVEFYLRNYKGITIRLGARRNLELYDMTYYQALKSTNRFSNLCNEDFLVFAKQDFDIHEAQNQKGLQQLQRWYADCRLDTLNFGRDVVIIANYLASLIIGDHAFDYVRLAFAKTSVLVTIMDDFFDCHGSSQECDKIIELVKEWKENPDAEYGSEELEILFMALYNTVNELAERARVEQGRSVKEFLVKLWVEILSAFKIELDTWSNGTQQSFDEYISSSWLSNGSRLTGLLTMQFVGVKLSDEMLMSEECTDLARHVCMVGRLLNDVCSSEREREENIAGKSYSILLATEKDGRKVSEDEAIAEINEMVEYHWRKVLQIVYKKESILPRRCKDVFLEMAKGTFYAYGINDELTSPQQSKEDMKSFVF

SEQ ID NO:5

截短的香紫苏醇合酶(SsScS).

MAKMKENFKREDDKFPTTTTLRSEDIPSNLCIIDTLQRLGVDQFFQYEINTILDNTFRLWQEKHKVIYGNVTTHAMAFRLLRVKGYEVSSEELAPYGNQEAVSQQTNDLPMIIELYRAANERIYEEERSLEKILAWTTIFLNKQVQDNSIPDKKLHKLVEFYLRNYKGITIRLGARRNLELYDMTYYQALKSTNRFSNLCNEDFLVFAKQDFDIHEAQNQKGLQQLQRWYADCRLDTLNFGRDVVIIANYLASLIIGDHAFDYVRLAFAKTSVLVTIMDDFFDCHGSSQECDKIIELVKEWKENPDAEYGSEELEILFMALYNTVNELAERARVEQGRSVKEFLVKLWVEILSAFKIELDTWSNGTQQSFDEYISSSWLSNGSRLTGLLTMQFVGVKLSDEMLMSEECTDLARHVCMVGRLLNDVCSSEREREENIAGKSYSILLATEKDGRKVSEDEAIAEINEMVEYHWRKVLQIVYKKESILPRRCKDVFLEMAKGTFYAYGINDELTSPQQSKEDMKSFVF

SEQ ID NO:6

1132-2-5_opt,经优化的编码截短的香紫苏醇合酶的cDNA

ATGGCGAAAATGAAGGAGAACTTTAAACGCGAGGACGATAAATTCCCGACGACCACGACCCTGCGCAGCGAGGATATCCCGAGCAACCTGTGCATCATTGATACCCTGCAGCGCCTGGGTGTCGATCAGTTCTTCCAATACGAAATCAATACCATTCTGGACAATACTTTTCGTCTGTGGCAAGAGAAACACAAAGTGATCTACGGCAACGTTACCACCCACGCGATGGCGTTCCGTTTGTTGCGTGTCAAGGGCTACGAGGTTTCCAGCGAGGAACTGGCGCCGTACGGTAATCAGGAAGCAGTTAGCCAACAGACGAATGATCTGCCTATGATCATTGAGCTGTATCGCGCAGCAAATGAGCGTATCTACGAAGAGGAACGCAGCCTGGAAAAGATCCTGGCGTGGACCACGATCTTCCTGAACAAACAAGTTCAAGACAATTCTATTCCTGATAAGAAGCTGCATAAACTGGTCGAATTCTATCTGCGTAATTACAAGGGCATCACGATCCGTCTGGGCGCACGCCGTAACCTGGAGTTGTATGATATGACGTATTACCAGGCTCTGAAAAGCACCAATCGTTTCTCCAATCTGTGTAATGAGGATTTTCTGGTGTTCGCCAAGCAGGATTTTGACATCCACGAGGCGCAAAATCAAAAAGGTCTGCAACAACTGCAACGTTGGTACGCTGACTGTCGCCTGGACACCCTGAATTTCGGTCGCGACGTTGTCATTATTGCAAACTATCTGGCCAGCCTGATCATCGGTGATCACGCATTCGACTACGTCCGCCTGGCCTTCGCTAAGACCAGCGTTCTGGTGACCATTATGGATGATTTCTTCGATTGCCACGGTTCTAGCCAGGAATGCGACAAAATCATTGAGCTGGTGAAAGAGTGGAAAGAAAACCCTGATGCGGAATACGGTTCCGAAGAGTTGGAGATCCTGTTTATGGCCTTGTACAACACCGTGAATGAACTGGCCGAGCGTGCTCGTGTGGAGCAGGGCCGTTCTGTGAAGGAGTTTTTGGTCAAGTTGTGGGTGGAAATCCTGTCCGCGTTCAAGATCGAACTGGATACGTGGTCGAATGGTACGCAACAGAGCTTCGACGAATACATCAGCAGCAGCTGGCTGAGCAATGGCAGCCGTCTGACCGGTTTGCTGACCATGCAATTTGTGGGTGTTAAACTGTCCGATGAAATGCTGATGAGCGAAGAATGCACCGACCTGGCACGCCATGTGTGTATGGTGGGTCGCCTGCTGAACGACGTCTGCAGCAGCGAACGTGAGCGCGAGGAAAACATTGCAGGCAAGAGCTACAGCATCTTGTTGGCCACCGAGAAAGATGGTCGCAAAGTGTCTGAGGACGAAGCAATTGCAGAGATTAATGAAATGGTCGAGTACCACTGGCGTAAGGTTTTGCAGATTGTGTATAAGAAAGAGAGCATCTTGCCGCGTCGCTGTAAGGATGTTTTCTTGGAGATGGCGAAGGGCACGTTCTATGCGTACGGCATTAACGACGAGCTGACGAGCCCGCAACAATCGAAAGAGGACATGAAGAGCTTCGTGTTCTGAGGTAC

SEQ ID NO:7

来自成团泛菌(Pantoea agglomerans)的GGPP合酶

MVSGSKAGVSPHREIEVMRQSIDDHLAGLLPETDSQDIVSLAMREGVMAPGKRIRPLLMLLAARDLRYQGSMPTLLDLACAVELTHTASLMLDDMPCMDNAELRRGQPTTHKKFGESVAILASVGLLSKAFGLIAATGDLPGERRAQAVNELSTAVGVQGLVLGQFRDLNDAALDRTPDAILSTNHLKTGILFSAMLQIVAIASASSPSTRETLHAFALDFGQAFQLLDDLRDDHPETGKDRNKDAGKSTLVNRLGADAARQKLREHIDSADKHLTFACPQGGAIRQFMHLWFGHHLADWSPVMKIA

SEQ ID NO:8

CrtEopt,经优化的编码来自成团泛菌(Pantoea agglomerans)的GGPP合酶的cDNA

ATGGTTTCTGGTTCGAAAGCAGGAGTATCACCTCATAGGGAAATCGAAGTCATGAGACAGTCCATTGATGACCACTTAGCAGGATTGTTGCCAGAAACAGATTCCCAGGATATCGTTAGCCTTGCTATGAGAGAAGGTGTTATGGCACCTGGTAAACGTATCAGACCTTTGCTGATGTTACTTGCTGCAAGAGACCTGAGATATCAGGGTTCTATGCCTACACTACTGGATCTAGCTTGTGCTGTTGAACTGACACATACTGCTTCCTTGATGCTGGATGACATGCCTTGTATGGACAATGCGGAACTTAGAAGAGGTCAACCAACAACCCACAAGAAATTCGGAGAATCTGTTGCCATTTTGGCTTCTGTAGGTCTGTTGTCGAAAGCTTTTGGCTTGATTGCTGCAACTGGTGATCTTCCAGGTGAAAGGAGAGCACAAGCTGTAAACGAGCTATCTACTGCAGTTGGTGTTCAAGGTCTAGTCTTAGGACAGTTCAGAGATTTGAATGACGCAGCTTTGGACAGAACTCCTGATGCTATCCTGTCTACGAACCATCTGAAGACTGGCATCTTGTTCTCAGCTATGTTGCAAATCGTAGCCATTGCTTCTGCTTCTTCACCATCTACTAGGGAAACGTTACACGCATTCGCATTGGACTTTGGTCAAGCCTTTCAACTGCTAGACGATTTGAGGGATGATCATCCAGAGACAGGTAAAGACCGTAACAAAGACGCTGGTAAAAGCACTCTAGTCAACAGATTGGGTGCTGATGCAGCTAGACAGAAACTGAGAGAGCACATTGACTCTGCTGACAAACACCTGACATTTGCATGTCCACAAGGAGGTGCTATAAGGCAGTTTATGCACCTATGGTTTGGACACCATCTTGCTGATTGGTCTCCAGTGATGAAGATCGCCTAA

序列表

<110> 弗门尼舍有限公司(Firmenich S.A.)

<120> 迈诺醇的生产

<130> P230261WO

<150> US 62/187,236

<151> 2015-06-30

<150> GB 1601249.4

<151> 2016-01-22

<160> 10

<170> PatentIn version 3.5

<210> 1

<211> 793

<212> PRT

<213> 丹参(Salvia miltiorrhiza)

<400> 1

Met Ala Ser Leu Ser Ser Thr Ile Leu Ser Arg Ser Pro Ala Ala Arg

1 5 10 15

Arg Arg Ile Thr Pro Ala Ser Ala Lys Leu His Arg Pro Glu Cys Phe

20 25 30

Ala Thr Ser Ala Trp Met Gly Ser Ser Ser Lys Asn Leu Ser Leu Ser

35 40 45

Tyr Gln Leu Asn His Lys Lys Ile Ser Val Ala Thr Val Asp Ala Pro

50 55 60

Gln Val His Asp His Asp Gly Thr Thr Val His Gln Gly His Asp Ala

65 70 75 80

Val Lys Asn Ile Glu Asp Pro Ile Glu Tyr Ile Arg Thr Leu Leu Arg

85 90 95

Thr Thr Gly Asp Gly Arg Ile Ser Val Ser Pro Tyr Asp Thr Ala Trp

100 105 110

Val Ala Met Ile Lys Asp Val Glu Gly Arg Asp Gly Pro Gln Phe Pro

115 120 125

Ser Ser Leu Glu Trp Ile Val Gln Asn Gln Leu Glu Asp Gly Ser Trp

130 135 140

Gly Asp Gln Lys Leu Phe Cys Val Tyr Asp Arg Leu Val Asn Thr Ile

145 150 155 160

Ala Cys Val Val Ala Leu Arg Ser Trp Asn Val His Ala His Lys Val

165 170 175

Lys Arg Gly Val Thr Tyr Ile Lys Glu Asn Val Asp Lys Leu Met Glu

180 185 190

Gly Asn Glu Glu His Met Thr Cys Gly Phe Glu Val Val Phe Pro Ala

195 200 205

Leu Leu Gln Lys Ala Lys Ser Leu Gly Ile Glu Asp Leu Pro Tyr Asp

210 215 220

Ser Pro Ala Val Gln Glu Val Tyr His Val Arg Glu Gln Lys Leu Lys

225 230 235 240

Arg Ile Pro Leu Glu Ile Met His Lys Ile Pro Thr Ser Leu Leu Phe

245 250 255

Ser Leu Glu Gly Leu Glu Asn Leu Asp Trp Asp Lys Leu Leu Lys Leu

260 265 270

Gln Ser Ala Asp Gly Ser Phe Leu Thr Ser Pro Ser Ser Thr Ala Phe

275 280 285

Ala Phe Met Gln Thr Lys Asp Glu Lys Cys Tyr Gln Phe Ile Lys Asn

290 295 300

Thr Ile Asp Thr Phe Asn Gly Gly Ala Pro His Thr Tyr Pro Val Asp

305 310 315 320

Val Phe Gly Arg Leu Trp Ala Ile Asp Arg Leu Gln Arg Leu Gly Ile

325 330 335

Ser Arg Phe Phe Glu Pro Glu Ile Ala Asp Cys Leu Ser His Ile His

340 345 350

Lys Phe Trp Thr Asp Lys Gly Val Phe Ser Gly Arg Glu Ser Glu Phe

355 360 365

Cys Asp Ile Asp Asp Thr Ser Met Gly Met Arg Leu Met Arg Met His

370 375 380

Gly Tyr Asp Val Asp Pro Asn Val Leu Arg Asn Phe Lys Gln Lys Asp

385 390 395 400

Gly Lys Phe Ser Cys Tyr Gly Gly Gln Met Ile Glu Ser Pro Ser Pro

405 410 415

Ile Tyr Asn Leu Tyr Arg Ala Ser Gln Leu Arg Phe Pro Gly Glu Glu

420 425 430

Ile Leu Glu Asp Ala Lys Arg Phe Ala Tyr Asp Phe Leu Lys Glu Lys

435 440 445

Leu Ala Asn Asn Gln Ile Leu Asp Lys Trp Val Ile Ser Lys His Leu

450 455 460

Pro Asp Glu Ile Lys Leu Gly Leu Glu Met Pro Trp Leu Ala Thr Leu

465 470 475 480

Pro Arg Val Glu Ala Lys Tyr Tyr Ile Gln Tyr Tyr Ala Gly Ser Gly

485 490 495

Asp Val Trp Ile Gly Lys Thr Leu Tyr Arg Met Pro Glu Ile Ser Asn

500 505 510

Asp Thr Tyr His Asp Leu Ala Lys Thr Asp Phe Lys Arg Cys Gln Ala

515 520 525

Lys His Gln Phe Glu Trp Leu Tyr Met Gln Glu Trp Tyr Glu Ser Cys

530 535 540

Gly Ile Glu Glu Phe Gly Ile Ser Arg Lys Asp Leu Leu Leu Ser Tyr

545 550 555 560

Phe Leu Ala Thr Ala Ser Ile Phe Glu Leu Glu Arg Thr Asn Glu Arg

565 570 575

Ile Ala Trp Ala Lys Ser Gln Ile Ile Ala Lys Met Ile Thr Ser Phe

580 585 590

Phe Asn Lys Glu Thr Thr Ser Glu Glu Asp Lys Arg Ala Leu Leu Asn

595 600 605

Glu Leu Gly Asn Ile Asn Gly Leu Asn Asp Thr Asn Gly Ala Gly Arg

610 615 620

Glu Gly Gly Ala Gly Ser Ile Ala Leu Ala Thr Leu Thr Gln Phe Leu

625 630 635 640

Glu Gly Phe Asp Arg Tyr Thr Arg His Gln Leu Lys Asn Ala Trp Ser

645 650 655

Val Trp Leu Thr Gln Leu Gln His Gly Glu Ala Asp Asp Ala Glu Leu

660 665 670

Leu Thr Asn Thr Leu Asn Ile Cys Ala Gly His Ile Ala Phe Arg Glu

675 680 685

Glu Ile Leu Ala His Asn Glu Tyr Lys Ala Leu Ser Asn Leu Thr Ser

690 695 700

Lys Ile Cys Arg Gln Leu Ser Phe Ile Gln Ser Glu Lys Glu Met Gly

705 710 715 720

Val Glu Gly Glu Ile Ala Ala Lys Ser Ser Ile Lys Asn Lys Glu Leu

725 730 735

Glu Glu Asp Met Gln Met Leu Val Lys Leu Val Leu Glu Lys Tyr Gly

740 745 750

Gly Ile Asp Arg Asn Ile Lys Lys Ala Phe Leu Ala Val Ala Lys Thr

755 760 765

Tyr Tyr Tyr Arg Ala Tyr His Ala Ala Asp Thr Ile Asp Thr His Met

770 775 780

Phe Lys Val Leu Phe Glu Pro Val Ala

785 790

<210> 2

<211> 736

<212> PRT

<213> 人工序列(Artificial sequence)

<223> 截短的蛋白(Truncated protein)

<400> 2

Met Ala Thr Val Asp Ala Pro Gln Val His Asp His Asp Gly Thr Thr

1 5 10 15

Val His Gln Gly His Asp Ala Val Lys Asn Ile Glu Asp Pro Ile Glu

20 25 30

Tyr Ile Arg Thr Leu Leu Arg Thr Thr Gly Asp Gly Arg Ile Ser Val

35 40 45

Ser Pro Tyr Asp Thr Ala Trp Val Ala Met Ile Lys Asp Val Glu Gly

50 55 60

Arg Asp Gly Pro Gln Phe Pro Ser Ser Leu Glu Trp Ile Val Gln Asn

65 70 75 80

Gln Leu Glu Asp Gly Ser Trp Gly Asp Gln Lys Leu Phe Cys Val Tyr

85 90 95

Asp Arg Leu Val Asn Thr Ile Ala Cys Val Val Ala Leu Arg Ser Trp

100 105 110

Asn Val His Ala His Lys Val Lys Arg Gly Val Thr Tyr Ile Lys Glu

115 120 125

Asn Val Asp Lys Leu Met Glu Gly Asn Glu Glu His Met Thr Cys Gly

130 135 140

Phe Glu Val Val Phe Pro Ala Leu Leu Gln Lys Ala Lys Ser Leu Gly

145 150 155 160

Ile Glu Asp Leu Pro Tyr Asp Ser Pro Ala Val Gln Glu Val Tyr His

165 170 175

Val Arg Glu Gln Lys Leu Lys Arg Ile Pro Leu Glu Ile Met His Lys

180 185 190

Ile Pro Thr Ser Leu Leu Phe Ser Leu Glu Gly Leu Glu Asn Leu Asp

195 200 205

Trp Asp Lys Leu Leu Lys Leu Gln Ser Ala Asp Gly Ser Phe Leu Thr

210 215 220

Ser Pro Ser Ser Thr Ala Phe Ala Phe Met Gln Thr Lys Asp Glu Lys

225 230 235 240

Cys Tyr Gln Phe Ile Lys Asn Thr Ile Asp Thr Phe Asn Gly Gly Ala

245 250 255

Pro His Thr Tyr Pro Val Asp Val Phe Gly Arg Leu Trp Ala Ile Asp

260 265 270

Arg Leu Gln Arg Leu Gly Ile Ser Arg Phe Phe Glu Pro Glu Ile Ala

275 280 285

Asp Cys Leu Ser His Ile His Lys Phe Trp Thr Asp Lys Gly Val Phe

290 295 300

Ser Gly Arg Glu Ser Glu Phe Cys Asp Ile Asp Asp Thr Ser Met Gly

305 310 315 320

Met Arg Leu Met Arg Met His Gly Tyr Asp Val Asp Pro Asn Val Leu

325 330 335

Arg Asn Phe Lys Gln Lys Asp Gly Lys Phe Ser Cys Tyr Gly Gly Gln

340 345 350

Met Ile Glu Ser Pro Ser Pro Ile Tyr Asn Leu Tyr Arg Ala Ser Gln

355 360 365

Leu Arg Phe Pro Gly Glu Glu Ile Leu Glu Asp Ala Lys Arg Phe Ala

370 375 380

Tyr Asp Phe Leu Lys Glu Lys Leu Ala Asn Asn Gln Ile Leu Asp Lys

385 390 395 400

Trp Val Ile Ser Lys His Leu Pro Asp Glu Ile Lys Leu Gly Leu Glu

405 410 415

Met Pro Trp Leu Ala Thr Leu Pro Arg Val Glu Ala Lys Tyr Tyr Ile

420 425 430

Gln Tyr Tyr Ala Gly Ser Gly Asp Val Trp Ile Gly Lys Thr Leu Tyr

435 440 445

Arg Met Pro Glu Ile Ser Asn Asp Thr Tyr His Asp Leu Ala Lys Thr

450 455 460

Asp Phe Lys Arg Cys Gln Ala Lys His Gln Phe Glu Trp Leu Tyr Met

465 470 475 480

Gln Glu Trp Tyr Glu Ser Cys Gly Ile Glu Glu Phe Gly Ile Ser Arg

485 490 495

Lys Asp Leu Leu Leu Ser Tyr Phe Leu Ala Thr Ala Ser Ile Phe Glu

500 505 510

Leu Glu Arg Thr Asn Glu Arg Ile Ala Trp Ala Lys Ser Gln Ile Ile

515 520 525

Ala Lys Met Ile Thr Ser Phe Phe Asn Lys Glu Thr Thr Ser Glu Glu

530 535 540

Asp Lys Arg Ala Leu Leu Asn Glu Leu Gly Asn Ile Asn Gly Leu Asn

545 550 555 560

Asp Thr Asn Gly Ala Gly Arg Glu Gly Gly Ala Gly Ser Ile Ala Leu

565 570 575

Ala Thr Leu Thr Gln Phe Leu Glu Gly Phe Asp Arg Tyr Thr Arg His

580 585 590

Gln Leu Lys Asn Ala Trp Ser Val Trp Leu Thr Gln Leu Gln His Gly

595 600 605

Glu Ala Asp Asp Ala Glu Leu Leu Thr Asn Thr Leu Asn Ile Cys Ala

610 615 620

Gly His Ile Ala Phe Arg Glu Glu Ile Leu Ala His Asn Glu Tyr Lys

625 630 635 640

Ala Leu Ser Asn Leu Thr Ser Lys Ile Cys Arg Gln Leu Ser Phe Ile

645 650 655

Gln Ser Glu Lys Glu Met Gly Val Glu Gly Glu Ile Ala Ala Lys Ser

660 665 670

Ser Ile Lys Asn Lys Glu Leu Glu Glu Asp Met Gln Met Leu Val Lys

675 680 685

Leu Val Leu Glu Lys Tyr Gly Gly Ile Asp Arg Asn Ile Lys Lys Ala

690 695 700

Phe Leu Ala Val Ala Lys Thr Tyr Tyr Tyr Arg Ala Tyr His Ala Ala

705 710 715 720

Asp Thr Ile Asp Thr His Met Phe Lys Val Leu Phe Glu Pro Val Ala

725 730 735

<210> 3

<211> 2211

<212> DNA

<213> 人工序列(Artificial sequence)

<223> 经优化的DNA序列(Optimised DNA sequence)

<400> 3

atggcaactg ttgacgcacc tcaagtccat gatcacgatg gcaccaccgt tcaccagggt 60

cacgacgcgg tgaagaacat cgaggacccg atcgaataca ttcgtaccct gctgcgtacc 120

actggtgatg gtcgcatcag cgtcagcccg tatgacacgg cgtgggtggc gatgattaaa 180

gacgtcgagg gtcgcgatgg cccgcaattt ccttctagcc tggagtggat tgtccaaaat 240

cagctggaag atggctcgtg gggtgaccag aagctgtttt gtgtttacga tcgcctggtt 300

aataccatcg catgtgtggt tgcgctgcgt agctggaatg ttcacgctca taaagtcaaa 360

cgtggcgtga cgtatatcaa ggaaaacgtg gataagctga tggaaggcaa cgaagaacac 420

atgacgtgtg gcttcgaggt tgtttttcca gccttgctgc agaaagcaaa gtccctgggt 480

attgaggatc tgccgtacga ctcgccggca gtgcaagaag tctatcacgt ccgcgagcag 540

aagctgaaac gcatcccgct ggagattatg cataagattc cgacctctct gctgttctct 600

ctggaaggtc tggagaacct ggattgggac aaactgctga agctgcagtc cgctgacggt 660

agctttctga ccagcccgag cagcacggcc tttgcgttta tgcagaccaa agatgagaag 720

tgctatcaat tcatcaagaa tactattgat accttcaacg gtggcgcacc gcacacgtac 780

ccagtagacg tttttggtcg cctgtgggcg attgaccgtt tgcagcgtct gggtatcagc 840

cgtttcttcg agccggagat tgcggactgc ttgagccata ttcacaaatt ctggacggac 900

aaaggcgtgt tcagcggtcg tgagagcgag ttctgcgaca tcgacgatac gagcatgggt 960

atgcgtctga tgcgtatgca cggttacgac gtggacccga atgtgttgcg caacttcaag 1020

caaaaagatg gcaagtttag ctgctacggt ggccaaatga ttgagagccc gagcccgatc 1080

tataacttat atcgtgcgag ccaactgcgt ttcccgggtg aagaaattct ggaagatgcg 1140

aagcgttttg cgtatgactt cctgaaggaa aagctcgcaa acaatcaaat cttggataaa 1200

tgggtgatca gcaagcactt gccggatgag attaaactgg gtctggagat gccgtggttg 1260

gccaccctgc cgagagttga ggcgaaatac tatattcagt attacgcggg tagcggtgat 1320

gtttggattg gcaagaccct gtaccgcatg ccggagatca gcaatgatac ctatcatgac 1380

ctggccaaga ccgacttcaa acgctgtcaa gcgaaacatc aatttgaatg gttatacatg 1440

caagagtggt acgaaagctg cggcatcgaa gagttcggta tctcccgtaa agatctgctg 1500

ctgtcttact ttctggcaac ggccagcatt ttcgagctgg agcgtaccaa tgagcgtatt 1560

gcctgggcga aatcacaaat cattgctaag atgattacga gctttttcaa taaagaaacc 1620

acgtccgagg aagataaacg tgctctgctg aatgaactgg gcaacatcaa cggtctgaat 1680

gacaccaacg gtgccggtcg tgagggtggc gcaggcagca ttgcactggc cacgctgacc 1740

cagttcctgg aaggtttcga ccgctacacc cgtcaccagc tgaagaacgc gtggtccgtc 1800

tggctgaccc agctgcagca tggtgaggca gacgacgcgg agctgctgac caacacgttg 1860

aatatctgcg ctggccatat cgcgtttcgc gaagagattc tggcgcacaa cgagtacaaa 1920

gccctgagca atctgacctc taaaatctgt cgtcagctta gctttattca gagcgagaaa 1980

gaaatgggcg tggaaggtga gatcgcggca aaatccagca tcaagaacaa agaactggaa 2040

gaagatatgc agatgttggt caagctcgtc ctggagaagt atggtggcat cgaccgtaat 2100

atcaagaaag cgtttctggc cgtggcgaaa acgtattact accgcgcgta ccacgcggca 2160

gataccattg acacccacat gtttaaggtt ttgtttgagc cggttgctta a 2211

<210> 4

<211> 575

<212> PRT

<213> 南欧丹参(Salvia sclarea)

<400> 4

Met Ser Leu Ala Phe Asn Val Gly Val Thr Pro Phe Ser Gly Gln Arg

1 5 10 15

Val Gly Ser Arg Lys Glu Lys Phe Pro Val Gln Gly Phe Pro Val Thr

20 25 30

Thr Pro Asn Arg Ser Arg Leu Ile Val Asn Cys Ser Leu Thr Thr Ile

35 40 45

Asp Phe Met Ala Lys Met Lys Glu Asn Phe Lys Arg Glu Asp Asp Lys

50 55 60

Phe Pro Thr Thr Thr Thr Leu Arg Ser Glu Asp Ile Pro Ser Asn Leu

65 70 75 80

Cys Ile Ile Asp Thr Leu Gln Arg Leu Gly Val Asp Gln Phe Phe Gln

85 90 95

Tyr Glu Ile Asn Thr Ile Leu Asp Asn Thr Phe Arg Leu Trp Gln Glu

100 105 110

Lys His Lys Val Ile Tyr Gly Asn Val Thr Thr His Ala Met Ala Phe

115 120 125

Arg Leu Leu Arg Val Lys Gly Tyr Glu Val Ser Ser Glu Glu Leu Ala

130 135 140

Pro Tyr Gly Asn Gln Glu Ala Val Ser Gln Gln Thr Asn Asp Leu Pro

145 150 155 160

Met Ile Ile Glu Leu Tyr Arg Ala Ala Asn Glu Arg Ile Tyr Glu Glu

165 170 175

Glu Arg Ser Leu Glu Lys Ile Leu Ala Trp Thr Thr Ile Phe Leu Asn

180 185 190

Lys Gln Val Gln Asp Asn Ser Ile Pro Asp Lys Lys Leu His Lys Leu

195 200 205

Val Glu Phe Tyr Leu Arg Asn Tyr Lys Gly Ile Thr Ile Arg Leu Gly

210 215 220

Ala Arg Arg Asn Leu Glu Leu Tyr Asp Met Thr Tyr Tyr Gln Ala Leu

225 230 235 240

Lys Ser Thr Asn Arg Phe Ser Asn Leu Cys Asn Glu Asp Phe Leu Val

245 250 255

Phe Ala Lys Gln Asp Phe Asp Ile His Glu Ala Gln Asn Gln Lys Gly

260 265 270

Leu Gln Gln Leu Gln Arg Trp Tyr Ala Asp Cys Arg Leu Asp Thr Leu

275 280 285

Asn Phe Gly Arg Asp Val Val Ile Ile Ala Asn Tyr Leu Ala Ser Leu

290 295 300

Ile Ile Gly Asp His Ala Phe Asp Tyr Val Arg Leu Ala Phe Ala Lys

305 310 315 320

Thr Ser Val Leu Val Thr Ile Met Asp Asp Phe Phe Asp Cys His Gly

325 330 335

Ser Ser Gln Glu Cys Asp Lys Ile Ile Glu Leu Val Lys Glu Trp Lys

340 345 350

Glu Asn Pro Asp Ala Glu Tyr Gly Ser Glu Glu Leu Glu Ile Leu Phe

355 360 365

Met Ala Leu Tyr Asn Thr Val Asn Glu Leu Ala Glu Arg Ala Arg Val

370 375 380

Glu Gln Gly Arg Ser Val Lys Glu Phe Leu Val Lys Leu Trp Val Glu

385 390 395 400

Ile Leu Ser Ala Phe Lys Ile Glu Leu Asp Thr Trp Ser Asn Gly Thr

405 410 415

Gln Gln Ser Phe Asp Glu Tyr Ile Ser Ser Ser Trp Leu Ser Asn Gly

420 425 430

Ser Arg Leu Thr Gly Leu Leu Thr Met Gln Phe Val Gly Val Lys Leu

435 440 445

Ser Asp Glu Met Leu Met Ser Glu Glu Cys Thr Asp Leu Ala Arg His

450 455 460

Val Cys Met Val Gly Arg Leu Leu Asn Asp Val Cys Ser Ser Glu Arg

465 470 475 480

Glu Arg Glu Glu Asn Ile Ala Gly Lys Ser Tyr Ser Ile Leu Leu Ala

485 490 495

Thr Glu Lys Asp Gly Arg Lys Val Ser Glu Asp Glu Ala Ile Ala Glu

500 505 510

Ile Asn Glu Met Val Glu Tyr His Trp Arg Lys Val Leu Gln Ile Val

515 520 525

Tyr Lys Lys Glu Ser Ile Leu Pro Arg Arg Cys Lys Asp Val Phe Leu

530 535 540

Glu Met Ala Lys Gly Thr Phe Tyr Ala Tyr Gly Ile Asn Asp Glu Leu

545 550 555 560

Thr Ser Pro Gln Gln Ser Lys Glu Asp Met Lys Ser Phe Val Phe

565 570 575

<210> 5

<211> 525

<212> PRT

<213> 人工序列(Artificial sequence)

<223> 截短的蛋白(Truncated protein)

<400> 5

Met Ala Lys Met Lys Glu Asn Phe Lys Arg Glu Asp Asp Lys Phe Pro

1 5 10 15

Thr Thr Thr Thr Leu Arg Ser Glu Asp Ile Pro Ser Asn Leu Cys Ile

20 25 30

Ile Asp Thr Leu Gln Arg Leu Gly Val Asp Gln Phe Phe Gln Tyr Glu

35 40 45

Ile Asn Thr Ile Leu Asp Asn Thr Phe Arg Leu Trp Gln Glu Lys His

50 55 60

Lys Val Ile Tyr Gly Asn Val Thr Thr His Ala Met Ala Phe Arg Leu

65 70 75 80

Leu Arg Val Lys Gly Tyr Glu Val Ser Ser Glu Glu Leu Ala Pro Tyr

85 90 95

Gly Asn Gln Glu Ala Val Ser Gln Gln Thr Asn Asp Leu Pro Met Ile

100 105 110

Ile Glu Leu Tyr Arg Ala Ala Asn Glu Arg Ile Tyr Glu Glu Glu Arg

115 120 125

Ser Leu Glu Lys Ile Leu Ala Trp Thr Thr Ile Phe Leu Asn Lys Gln

130 135 140

Val Gln Asp Asn Ser Ile Pro Asp Lys Lys Leu His Lys Leu Val Glu

145 150 155 160

Phe Tyr Leu Arg Asn Tyr Lys Gly Ile Thr Ile Arg Leu Gly Ala Arg

165 170 175

Arg Asn Leu Glu Leu Tyr Asp Met Thr Tyr Tyr Gln Ala Leu Lys Ser

180 185 190

Thr Asn Arg Phe Ser Asn Leu Cys Asn Glu Asp Phe Leu Val Phe Ala

195 200 205

Lys Gln Asp Phe Asp Ile His Glu Ala Gln Asn Gln Lys Gly Leu Gln

210 215 220

Gln Leu Gln Arg Trp Tyr Ala Asp Cys Arg Leu Asp Thr Leu Asn Phe

225 230 235 240

Gly Arg Asp Val Val Ile Ile Ala Asn Tyr Leu Ala Ser Leu Ile Ile

245 250 255

Gly Asp His Ala Phe Asp Tyr Val Arg Leu Ala Phe Ala Lys Thr Ser

260 265 270

Val Leu Val Thr Ile Met Asp Asp Phe Phe Asp Cys His Gly Ser Ser

275 280 285

Gln Glu Cys Asp Lys Ile Ile Glu Leu Val Lys Glu Trp Lys Glu Asn

290 295 300

Pro Asp Ala Glu Tyr Gly Ser Glu Glu Leu Glu Ile Leu Phe Met Ala

305 310 315 320

Leu Tyr Asn Thr Val Asn Glu Leu Ala Glu Arg Ala Arg Val Glu Gln

325 330 335

Gly Arg Ser Val Lys Glu Phe Leu Val Lys Leu Trp Val Glu Ile Leu

340 345 350

Ser Ala Phe Lys Ile Glu Leu Asp Thr Trp Ser Asn Gly Thr Gln Gln

355 360 365

Ser Phe Asp Glu Tyr Ile Ser Ser Ser Trp Leu Ser Asn Gly Ser Arg

370 375 380

Leu Thr Gly Leu Leu Thr Met Gln Phe Val Gly Val Lys Leu Ser Asp

385 390 395 400

Glu Met Leu Met Ser Glu Glu Cys Thr Asp Leu Ala Arg His Val Cys

405 410 415

Met Val Gly Arg Leu Leu Asn Asp Val Cys Ser Ser Glu Arg Glu Arg

420 425 430

Glu Glu Asn Ile Ala Gly Lys Ser Tyr Ser Ile Leu Leu Ala Thr Glu

435 440 445

Lys Asp Gly Arg Lys Val Ser Glu Asp Glu Ala Ile Ala Glu Ile Asn

450 455 460

Glu Met Val Glu Tyr His Trp Arg Lys Val Leu Gln Ile Val Tyr Lys

465 470 475 480

Lys Glu Ser Ile Leu Pro Arg Arg Cys Lys Asp Val Phe Leu Glu Met

485 490 495

Ala Lys Gly Thr Phe Tyr Ala Tyr Gly Ile Asn Asp Glu Leu Thr Ser

500 505 510

Pro Gln Gln Ser Lys Glu Asp Met Lys Ser Phe Val Phe

515 520 525

<210> 6

<211> 1583

<212> DNA

<213> 人工序列(Artificial sequence)

<223> 经优化的DNA序列(Optimised DNA sequence)

<400> 6

atggcgaaaa tgaaggagaa ctttaaacgc gaggacgata aattcccgac gaccacgacc 60

ctgcgcagcg aggatatccc gagcaacctg tgcatcattg ataccctgca gcgcctgggt 120

gtcgatcagt tcttccaata cgaaatcaat accattctgg acaatacttt tcgtctgtgg 180

caagagaaac acaaagtgat ctacggcaac gttaccaccc acgcgatggc gttccgtttg 240

ttgcgtgtca agggctacga ggtttccagc gaggaactgg cgccgtacgg taatcaggaa 300

gcagttagcc aacagacgaa tgatctgcct atgatcattg agctgtatcg cgcagcaaat 360

gagcgtatct acgaagagga acgcagcctg gaaaagatcc tggcgtggac cacgatcttc 420

ctgaacaaac aagttcaaga caattctatt cctgataaga agctgcataa actggtcgaa 480

ttctatctgc gtaattacaa gggcatcacg atccgtctgg gcgcacgccg taacctggag 540

ttgtatgata tgacgtatta ccaggctctg aaaagcacca atcgtttctc caatctgtgt 600

aatgaggatt ttctggtgtt cgccaagcag gattttgaca tccacgaggc gcaaaatcaa 660

aaaggtctgc aacaactgca acgttggtac gctgactgtc gcctggacac cctgaatttc 720

ggtcgcgacg ttgtcattat tgcaaactat ctggccagcc tgatcatcgg tgatcacgca 780

ttcgactacg tccgcctggc cttcgctaag accagcgttc tggtgaccat tatggatgat 840

ttcttcgatt gccacggttc tagccaggaa tgcgacaaaa tcattgagct ggtgaaagag 900

tggaaagaaa accctgatgc ggaatacggt tccgaagagt tggagatcct gtttatggcc 960

ttgtacaaca ccgtgaatga actggccgag cgtgctcgtg tggagcaggg ccgttctgtg 1020

aaggagtttt tggtcaagtt gtgggtggaa atcctgtccg cgttcaagat cgaactggat 1080

acgtggtcga atggtacgca acagagcttc gacgaataca tcagcagcag ctggctgagc 1140

aatggcagcc gtctgaccgg tttgctgacc atgcaatttg tgggtgttaa actgtccgat 1200

gaaatgctga tgagcgaaga atgcaccgac ctggcacgcc atgtgtgtat ggtgggtcgc 1260

ctgctgaacg acgtctgcag cagcgaacgt gagcgcgagg aaaacattgc aggcaagagc 1320

tacagcatct tgttggccac cgagaaagat ggtcgcaaag tgtctgagga cgaagcaatt 1380

gcagagatta atgaaatggt cgagtaccac tggcgtaagg ttttgcagat tgtgtataag 1440

aaagagagca tcttgccgcg tcgctgtaag gatgttttct tggagatggc gaagggcacg 1500

ttctatgcgt acggcattaa cgacgagctg acgagcccgc aacaatcgaa agaggacatg 1560

aagagcttcg tgttctgagg tac 1583

<210> 7

<211> 307

<212> PRT

<213> 成团泛菌(Pantoea agglomerans)

<400> 7

Met Val Ser Gly Ser Lys Ala Gly Val Ser Pro His Arg Glu Ile Glu

1 5 10 15

Val Met Arg Gln Ser Ile Asp Asp His Leu Ala Gly Leu Leu Pro Glu

20 25 30

Thr Asp Ser Gln Asp Ile Val Ser Leu Ala Met Arg Glu Gly Val Met

35 40 45

Ala Pro Gly Lys Arg Ile Arg Pro Leu Leu Met Leu Leu Ala Ala Arg

50 55 60

Asp Leu Arg Tyr Gln Gly Ser Met Pro Thr Leu Leu Asp Leu Ala Cys

65 70 75 80

Ala Val Glu Leu Thr His Thr Ala Ser Leu Met Leu Asp Asp Met Pro

85 90 95

Cys Met Asp Asn Ala Glu Leu Arg Arg Gly Gln Pro Thr Thr His Lys

100 105 110

Lys Phe Gly Glu Ser Val Ala Ile Leu Ala Ser Val Gly Leu Leu Ser

115 120 125

Lys Ala Phe Gly Leu Ile Ala Ala Thr Gly Asp Leu Pro Gly Glu Arg

130 135 140

Arg Ala Gln Ala Val Asn Glu Leu Ser Thr Ala Val Gly Val Gln Gly

145 150 155 160

Leu Val Leu Gly Gln Phe Arg Asp Leu Asn Asp Ala Ala Leu Asp Arg

165 170 175

Thr Pro Asp Ala Ile Leu Ser Thr Asn His Leu Lys Thr Gly Ile Leu

180 185 190

Phe Ser Ala Met Leu Gln Ile Val Ala Ile Ala Ser Ala Ser Ser Pro

195 200 205

Ser Thr Arg Glu Thr Leu His Ala Phe Ala Leu Asp Phe Gly Gln Ala

210 215 220

Phe Gln Leu Leu Asp Asp Leu Arg Asp Asp His Pro Glu Thr Gly Lys

225 230 235 240

Asp Arg Asn Lys Asp Ala Gly Lys Ser Thr Leu Val Asn Arg Leu Gly

245 250 255

Ala Asp Ala Ala Arg Gln Lys Leu Arg Glu His Ile Asp Ser Ala Asp

260 265 270

Lys His Leu Thr Phe Ala Cys Pro Gln Gly Gly Ala Ile Arg Gln Phe

275 280 285

Met His Leu Trp Phe Gly His His Leu Ala Asp Trp Ser Pro Val Met

290 295 300

Lys Ile Ala

305

<210> 8

<211> 924

<212> DNA

<213> 人工序列(Artificial sequence)

<223> 经优化的DNA序列(Optimised DNA sequence)

<400> 8

atggtttctg gttcgaaagc aggagtatca cctcataggg aaatcgaagt catgagacag 60

tccattgatg accacttagc aggattgttg ccagaaacag attcccagga tatcgttagc 120

cttgctatga gagaaggtgt tatggcacct ggtaaacgta tcagaccttt gctgatgtta 180

cttgctgcaa gagacctgag atatcagggt tctatgccta cactactgga tctagcttgt 240

gctgttgaac tgacacatac tgcttccttg atgctggatg acatgccttg tatggacaat 300

gcggaactta gaagaggtca accaacaacc cacaagaaat tcggagaatc tgttgccatt 360

ttggcttctg taggtctgtt gtcgaaagct tttggcttga ttgctgcaac tggtgatctt 420

ccaggtgaaa ggagagcaca agctgtaaac gagctatcta ctgcagttgg tgttcaaggt 480

ctagtcttag gacagttcag agatttgaat gacgcagctt tggacagaac tcctgatgct 540

atcctgtcta cgaaccatct gaagactggc atcttgttct cagctatgtt gcaaatcgta 600

gccattgctt ctgcttcttc accatctact agggaaacgt tacacgcatt cgcattggac 660

tttggtcaag cctttcaact gctagacgat ttgagggatg atcatccaga gacaggtaaa 720

gaccgtaaca aagacgctgg taaaagcact ctagtcaaca gattgggtgc tgatgcagct 780

agacagaaac tgagagagca cattgactct gctgacaaac acctgacatt tgcatgtcca 840

caaggaggtg ctataaggca gtttatgcac ctatggtttg gacaccatct tgctgattgg 900

tctccagtga tgaagatcgc ctaa 924

<210> 9

<211> 71

<212> DNA

<213> 人工序列(Artificial sequence)

<223> 引物序列(Primer sequence)

<400> 9

ctgtttgagc cggtcgccta aggtaccaga aggagataaa taatggcgaa aatgaaggag 60

aactttaaac g 71

<210> 10

<211> 55

<212> DNA

<213> 人工序列(Artificial sequence)

<223> 引物序列(Primer sequence)

<400> 10

gcagcggttt ctttaccaga ctcgaggtca gaacacgaag ctcttcatgt cctct 55

Claims

1.一种生产(+)-迈诺醇的方法，包括：

a.将香叶基香叶基二磷酸与柯巴基二磷酸(CPP)合酶接触以形成(9S,10S)-柯巴基二磷酸，其中该CPP合酶包含与从SEQ ID NO:1和SEQ ID NO:2中选出的多肽具有至少90％、95％、98％、99％和100％序列同一性的氨基酸序列；并且

b.使CPP与香紫苏醇合酶接触以形成(+)-迈诺醇；并且

c.可选地，分离该(+)-迈诺醇。

2.权利要求1所述的方法，其中该CPP合酶包含与从SEQ ID NO:1和SEQ ID NO:2中选出的多肽具有至少95％、98％、99％和100％序列同一性的氨基酸序列。

3.权利要求2所述的方法，其中该CPP合酶包含与从SEQ ID NO:1和SEQ ID NO:2中选出的多肽具有至少98％、99％和100％序列同一性的氨基酸序列。

4.权利要求3所述的方法，其中该CPP合酶包含与从SEQ ID NO:1和SEQ ID NO:2中选出的多肽具有至少99％和100％序列同一性的氨基酸序列。

5.权利要求3所述的方法，其中该CPP合酶包含与从SEQ ID NO:1和SEQ ID NO:2中选出的多肽相同的氨基酸序列。

6.权利要求1～5中任一项所述的方法，其中该香紫苏醇合酶包含与从SEQ ID NO:4和SEQ ID NO:5中选出的多肽具有至少90％、95％、98％、99％和100％序列同一性的氨基酸序列。

7.权利要求6所述的方法，其中该香紫苏醇合酶包含与从SEQ ID NO:4和SEQ ID NO:5中选出的多肽具有至少95％、98％、99％和100％序列同一性的氨基酸序列。

8.权利要求7所述的方法，其中该香紫苏醇合酶包含与从SEQ ID NO:4和SEQ ID NO:5中选出的多肽具有至少98％、99％和100％序列同一性的氨基酸序列。

9.权利要求8所述的方法，其中该香紫苏醇合酶包含与从SEQ ID NO:4和SEQ ID NO:5中选出的多肽具有至少99％和100％序列同一性的氨基酸序列。

10.权利要求9所述的方法，其中该香紫苏醇合酶包含与从SEQ ID NO:4和SEQ ID NO:5中选出的多肽相同的氨基酸序列。

11.权利要求1～10中任一项所述的方法，还包括使用化学或生物化学合成或两者的组合将(+)-迈诺醇加工成(+)-迈诺醇衍生物。

12.权利要求11所述的方法，其中该衍生物是醇、缩醛、醛、酸、醚、酮、内酯、乙酸酯或酯。

13.权利要求12所述的方法，其中该衍生物是从由柯巴醇、柯巴醛、(+)-迈诺醇氧基、Z-11、γ-ambrol和降龙涎香醚构成的群组中选出的。

14.权利要求13所述的方法，其中该(+)-迈诺醇衍生物是柯巴醇。

15.权利要求13所述的方法，其中该(+)-迈诺醇衍生物是柯巴醛。

16.权利要求13所述的方法，其中该(+)-迈诺醇衍生物是迈诺醇氧基。

17.权利要求13所述的方法，其中该(+)-迈诺醇衍生物是Z-11。

18.权利要求13所述的方法，其中该(+)-迈诺醇衍生物是γ-ambrol。

19.权利要求13所述的方法，其中该(+)-迈诺醇衍生物是降龙涎香醚。

20.一种用核酸转化宿主细胞或非人生物体的方法，该核酸编码具有柯巴基二磷酸合酶活性的多肽和具有香紫苏醇合酶活性的多肽，其中该具有柯巴基二磷酸合酶活性的多肽包含与从SEQ ID NO:1和SEQ ID NO:2中选出的多肽具有至少90％、95％、98％、99％和100％序列同一性的氨基酸序列，并且其中该具有香紫苏醇合酶活性的多肽包含与从SEQID NO:4和SEQ ID NO:5中选出的多肽具有至少90％、95％、98％、99％和100％序列同一性的氨基酸序列。

21.权利要求20所述的方法，其中该细胞是原核细胞。

22.权利要求21所述的方法，其中该细胞是细菌细胞。

23.权利要求21所述的方法，其中该细胞是真核细胞。

24.权利要求23所述的方法，其中该真核细胞是酵母细胞或植物细胞。

25.一种表达载体，包含编码CPP合酶的核酸以及编码香紫苏醇合酶的核酸，其中该CPP合酶包含与从SEQ ID NO:1和SEQ ID NO:2中选出的多肽具有至少90％、95％、98％、99％和100％序列同一性的氨基酸序列。

26.权利要求25的表达载体，其中编码CPP酶的核酸具有与由SEQ ID NO.3组成的核酸序列有至少90％、95％、98％、99％和100％序列同一性的核苷酸序列，并且其中编码该香紫苏醇合酶的核酸具有与SEQ ID NO.6有至少90％、95％、98％、99％和100％相似的核苷酸序列。

27.通过权利要求20～24中任一项的方法生产的宿主细胞或非人生物体。

28.一种非人宿主生物体或细胞，包含至少一种编码具有CPP合酶活性的多肽的核酸和至少一种编码具有香紫苏醇合酶活性的多肽的核酸，其中该具有CPP合酶活性的多肽包含与从SEQ ID NO:1和SEQ ID NO:2中选出的多肽具有至少90％、95％、98％、99％或100％序列同一性的氨基酸序列。

29.权利要求28所述的非人宿主生物体或细胞，其中该具有香紫苏醇合酶活性的多肽包含与从SEQ ID NO:4和SEQ ID NO:5中选出的多肽具有至少90％、95％、98％、99％或100％序列同一性的氨基酸序列。

30.权利要求27～29中任一项所述的宿主生物体或细胞，其包含权利要求25或26所述的表达载体。

31.权利要求27～30中任一项所述的宿主生物体或细胞，其能够生产GGPP。

32.一种生产(+)迈诺醇的方法，包括培养权利要求27～31中任一项所述的宿主生物体或细胞。

33.权利要求32所述的方法，其中该宿主生物体或细胞能够生产GGPP。