CN107889506B - 迈诺醇的生产 - Google Patents

迈诺醇的生产 Download PDF

Info

Publication number
CN107889506B
CN107889506B CN201680036387.3A CN201680036387A CN107889506B CN 107889506 B CN107889506 B CN 107889506B CN 201680036387 A CN201680036387 A CN 201680036387A CN 107889506 B CN107889506 B CN 107889506B
Authority
CN
China
Prior art keywords
leu
seq
glu
ala
asp
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201680036387.3A
Other languages
English (en)
Other versions
CN107889506A (zh
Inventor
M·沙尔克
L·洛奇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Firmenich SA
Original Assignee
Firmenich SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Firmenich SA filed Critical Firmenich SA
Publication of CN107889506A publication Critical patent/CN107889506A/zh
Application granted granted Critical
Publication of CN107889506B publication Critical patent/CN107889506B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P5/00Preparation of hydrocarbons or halogenated hydrocarbons
    • C12P5/002Preparation of hydrocarbons or halogenated hydrocarbons cyclic
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y505/00Intramolecular lyases (5.5)
    • C12Y505/01Intramolecular lyases (5.5.1)
    • C12Y505/01012Copalyl diphosphate synthase (5.5.1.12)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/74Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/88Lyases (4.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/90Isomerases (5.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P5/00Preparation of hydrocarbons or halogenated hydrocarbons
    • C12P5/007Preparation of hydrocarbons or halogenated hydrocarbons containing one or more isoprene units, i.e. terpenes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y402/00Carbon-oxygen lyases (4.2)
    • C12Y402/03Carbon-oxygen lyases (4.2) acting on phosphates (4.2.3)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y505/00Intramolecular lyases (5.5)
    • C12Y505/01Intramolecular lyases (5.5.1)
    • C12Y505/01014Syn-copalyl-diphosphate synthase (5.5.1.14)

Landscapes

  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Medicinal Chemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Organic Low-Molecular-Weight Compounds And Preparation Thereof (AREA)

Abstract

本文提供了生产(+)‑迈诺醇的方法,包括:将香叶基香叶基二磷酸与柯巴基二磷酸(CPP)合酶接触以形成(9S,10S)‑柯巴基二磷酸,其中该CPP合酶包含与从SEQ ID NO:1和SEQ ID NO:2中选出的多肽具有至少90%、95%、98%、99%和100%序列同一性的氨基酸序列;并使CPP与香紫苏醇合酶接触以形成(+)‑迈诺醇。

Description

迈诺醇的生产
技术领域
本文提供了使用柯巴基(copalyl)二磷酸合酶和香紫苏醇合酶生产(+)-迈诺醇(manool)的生物化学方法。
背景技术
在大多数生物(微生物、动物和植物)中都可以找到萜烯。这些化合物由五个称为异戊二烯单元的碳单元组成,并按其结构中存在的这些单元的数量分类。因此,单萜、倍半萜和二萜分别是含有10、15和20个碳原子的萜烯。例如倍半萜在植物界广泛存在。许多萜烯(例如倍半萜)分子因其风味和香味性质以及它们的美容、医疗和抗微生物作用而公知。许多萜烯(例如倍半萜)烃和萜类化合物(例如倍半萜类化合物)已被鉴定出。
萜烯的生物合成生产涉及称为萜合酶的酶。这些酶将无环萜烯前体转化成一种或多种萜烯产物。具体而言,二萜合酶通过环化前体香叶基香叶基焦磷酸(GGPP)产生二萜。GGPP的环化通常需要两种酶多肽,在两个连续的酶促反应中组合起作用的I型和II型二萜合酶。II型二萜合酶催化由GGPP的末端双键质子化引发的GGPP的环化/重排,导致环状二萜二磷酸酯中间体。然后该中间体被催化电离引发的环化的I型二萜合酶进一步转化。
二萜合酶存在于植物和其他生物中,并使用底物如香叶基香叶基二磷酸,但它们具有不同的产物特征。编码二萜合酶的基因和cDNA已经被克隆,并且表征了相应的重组酶。
柯巴基二磷酸合酶和香紫苏醇合酶是植物中存在的酶。因此,发现并在生物化学过程中使用这些酶和变体来产生(+)-迈诺醇是合乎需要的。
发明内容
本文提供了生产(+)-迈诺醇的方法,包括:
a)将香叶基香叶基二磷酸与柯巴基二磷酸(CPP)合酶接触以形成(9S,10S)-柯巴基二磷酸,其中该CPP合酶包含与从SEQ ID NO:1和SEQ ID NO:2中选出的多肽具有至少90%、95%、98%、99%或100%序列同一性的氨基酸序列;并且
b)使(9S,10S)-柯巴基二磷酸CPP与香紫苏醇合酶接触以形成(+)-迈诺醇;并且
c)可选地,分离(+)-迈诺醇。
本文还提供了一种多肽,其中该多肽包含与从SEQ ID NO:1和SEQ ID NO:2中选出的多肽具有至少90%、95%、98%、99%或100%序列同一性的氨基酸序列。
本文还提供了编码上述多肽的核酸。
本文还提供了一种核酸,其中该核酸包含与SEQ ID NO 3具有至少90%、95%、98%、99%或100%序列同一性的核苷酸序列。
本文还提供了用核酸转化宿主细胞或非人生物体的方法,该核酸编码具有柯巴基二磷酸合酶活性的多肽和具有香紫苏醇合酶活性的多肽,其中该具有柯巴基二磷酸合酶活性的多肽包含与从SEQ ID NO:1和SEQ ID NO:2中选出的多肽具有至少90%、95%、98%、99%或100%序列同一性的氨基酸序列,并且其中该具有香紫苏醇合酶活性的多肽包含与从SEQ ID NO:4和SEQ ID NO:5中选出的多肽具有至少90%、95%、98%、99%或100%序列同一性的氨基酸序列。本文还提供了通过该方法生产的宿主细胞或非人生物体。
本文还提供了一种表达载体,包含编码CPP合酶的核酸以及编码香紫苏醇合酶的核酸,其中该CPP合酶包含与从SEQ ID NO:1和SEQ ID NO:2中选出的多肽具有至少90%、95%、98%、99%或100%序列同一性的氨基酸序列。
本文还提供了一种非人宿主生物体或细胞,包含至少一种编码具有CPP合酶活性的多肽的核酸和至少一种编码具有香紫苏醇合酶活性的多肽的核酸,其中该具有CPP合酶活性的多肽包含与从SEQ ID NO:1和SEQ ID NO:2中选出的多肽具有至少90%、95%、98%、99%或100%序列同一性的氨基酸序列。
本文还提供了生产(+)迈诺醇的方法,包括培养本发明的宿主生物体或细胞。
附图说明
图1.从香叶基香叶基二磷酸(GGPP)到(+)-迈诺醇的酶途径。
图2.GGPP的体外酶促转化的GCMS分析。A.使用重组SmCPS酶。B.使用重组SsScS酶。C.在单一测定中将SmCPS与SsScS酶组合。
图3.使用表达SmCPS、SsScS和甲羟戊酸途径酶的大肠杆菌细胞生产的(+)-迈诺醇的GCMS分析。A.大肠杆菌培养基提取物的总离子色谱。B.(+)-迈诺醇标准品的总离子色谱。C.色谱A中主峰(保留时间为14.55分钟)的质谱。D.(+)-迈诺醇标准品的质谱。
图4.从香叶基香叶基二磷酸(GGPP)到(+)-迈诺醇和香紫苏醇的酶促途径。
具体实施方式
所使用的缩写
bp 碱基对
kb 千碱基
DNA 脱氧核糖核酸
cDNA 互补DNA
CPP 柯巴基二磷酸
DTT 二硫苏糖醇
FPP 法尼基二磷酸
GGPP 香叶基香叶基二磷酸
GC 气相色谱
IPTG 异丙基-D-硫代半乳糖-吡喃糖苷
LB 溶源性肉汤
MS 质谱
MVA 甲羟戊酸
PCR 聚合酶链式反应
RNA 核糖核酸
mRNA 信使核糖核酸
miRNA 微RNA
siRNA 小干扰RNA
rRNA 核糖体RNA
tRNA 转移RNA
定义
术语“多肽”是指连续聚合的氨基酸残基的氨基酸序列,例如至少15个残基,至少30个残基,至少50个残基。在本文提供的一些实施方案中,多肽包含作为酶的氨基酸序列、其片段或其变体。
术语“分离的”多肽是指通过本领域已知的任何方法或这些方法(包括重组、生物化学和合成法)的组合从天然环境中取出的氨基酸序列。
术语“蛋白”是指任何长度的氨基酸序列,其中氨基酸被共价肽键所连接,并且包括寡肽、肽、多肽和全长蛋白,不管天然生成的还是合成的。
术语“生物功能”、“功能”、“生物活性”或“活性”是指CPP合酶和香紫苏醇合酶活性催化(+)-迈诺醇形成的能力。CPP合酶的“生物功能”、“功能”、“生物活性”或“活性”可以例如指CPP合酶催化从GGPP形成(9S,10S)-柯巴基二磷酸的能力。香紫苏醇合酶的“生物功能”、“功能”、“生物活性”或“活性”可以例如指香紫苏醇合酶催化从(9S,10S)-柯巴基二磷酸形成(+)-迈诺醇的能力。
香紫苏醇合酶可以指一种酶,例如天然存在的酶,它具有如图4所示的催化从赖百当二醇(labdendiol)二磷酸(LPP)形成香紫苏醇的能力。LPP可以由GGPP通过赖百当二醇-二磷酸合酶(LPS)的作用产生(见图4)。为了用于本发明,如上所述的香紫苏醇合酶也具有催化从(9S,10S)-柯巴基二磷酸形成(+)迈诺醇的能力。应该理解,例如,可以在本发明中使用香紫苏醇合酶的变体、片段和截短形式,只要它们具有催化从(9S,10S)-柯巴基二磷酸形成(+)迈诺醇的能力。将进一步理解的是,例如香紫苏醇合酶的变体、片段或截短形式可能已经丧失了从LPP催化香紫苏醇形成的一些或全部能力,而不损害它们适用于本发明的适用性。
术语“核酸序列”、“核酸”和“多核苷酸”可互换使用,意指核苷酸的序列。核酸序列可以是单链或双链脱氧核糖核苷酸,或任何长度的核糖核苷酸,并且包括基因、外显子、内含子、有义和反义互补序列、基因组DNA、cDNA、miRNA、siRNA、mRNA、rRNA、tRNA、重组核酸序列、分离的和纯化的天然产生的DNA和/或RNA序列、合成DNA和RNA序列、片段、引物和核酸探针的编码和非编码序列。本领域技术人员了解,RNA的核酸序列与DNA序列相同,差异在于胸腺嘧啶(T)被替代为尿嘧啶(U)。
“分离的核酸”或“分离的核酸序列”被定义为一种核酸或核酸序列,其所处的环境与天然产生的核酸或核酸序列所处的环境不同。如本文使用的应用于核酸的术语“天然产生的”是指在自然界细胞中发现的核酸。例如,存在于能够从自然界来源中分离出的生物体(例如生物体的细胞)中的核酸序列,并且该核酸序列未经人类在实验室进行特意的改造,那么该核酸序列是天然产生的。
“重组核酸序列”是使用实验室方法(分子克隆)将来自多于一个来源的遗传物质组合在一起所生成的核酸序列,由此创造出不是天然产生并且不能以其它方式在生物有机体中发现的核酸序列。
“重组DNA技术”是指一种用于制备重组核酸序列的分子生物学程序,例如描述于由Weigel和Glazebrook编制的Laboratory Manuals,2002Cold Spring Harbor LabPress;和Sambrook et al.,1989Cold Spring Harbor,NY:Cold Spring HarborLaboratory Press。
术语“基因”是指一种DNA序列,其包含可操作地连接到适当调控区域(例如启动子)的被转录为RNA分子(例如细胞中的mRNA)的区域。因此,基因可以包含多个可操作地连接的序列,诸如启动子、5’前导序列(包含例如参与翻译初始化的序列)、cDNA或基因组DNA的编码区、内含子、外显子和/或3’非翻译序列(包含例如转录终止位点)。
“嵌合基因”是指通常不能在自然界于物种中找到的任何基因,特别是其中核酸序列存在一个或多个部分在性质上彼此不相关联的基因。例如,启动子在性质上与转录区的部分或全部或与另一调控区不相关联。术语“嵌合基因”应当被理解为包括表达构建体,其中启动子或转录调控序列被可操作地连接到一个或多个编码序列或反义(即有义链的反向互补链)或反向重复序列(有义和反义,由此RNA转录物在转录后形成双链RNA)。术语“嵌合基因”还包括这样的基因,其通过组合一个或多个编码序列的部分而获得以产生新基因。
“3’URT”或“3’非翻译序列”(也称为“3’未翻译区”或“3’末端”)是指在基因编码序列的下游发现的核酸序列,其包含例如转录终止位点和(在大多数但非全部的真核mRNA中)多聚腺苷酸化信号诸如AAUAAA或其变体。在转录终止后,mRNA转录物可以在多聚腺苷酸化信号的下游被切去,并且可以添加poly(A)尾,其参与了mRNA向翻译位点例如胞浆的转运。
“基因的表达”包括基因的转录和mRNA向蛋白质的翻译。过表达是指在转基因细胞或生物体中,以mRNA水平、多肽和/或酶活性测量的基因产物的生产超过了在相似遗传背景的非转化细胞或生物体中的生产水平。
如本文中使用的“表达载体”是指使用分子生物学方法和重组DNA技术工程化以将外来或外源DNA递送到宿主细胞中的核酸分子。表达载体典型地包括适合转录核苷酸序列所需的序列。编码区通常编码目的蛋白,但是也可以编码RNA,例如反义RNA、siRNA等。
如本文所使用的“表达载体”包括任何线性的或环状的重组载体,包括但不限于病毒载体、噬菌体和质粒。本领域技术人员根据表达系统能够选择适合的载体。在一个实施方案中,表达载体包括本文实施方案的核酸,其可操作地连接到至少一个调控序列(其控制转录、翻译、起始和终止,诸如转录启动子、操纵子和增强子)或mRNA核糖体结合位点,和可选地包括至少一个选择标记。当调控序列功能性地涉及本文实施方案的核酸时,核苷酸序列是“可操作地连接的”。“调控序列”是指一种核酸序列,其确定本文实施方案的核酸序列的表达水平、并且能够调控可操作地连接到该调控序列的核酸序列的转录速率。调控序列包含启动子、增强子、转录因子、启动子元件等。
“启动子”是指一种核酸序列,其通过提供RNA聚合酶用的结合位点以及适合转录所需的其它因子,包括但不限于转录因子结合位点、抑制子和活化子蛋白结合位点来控制编码序列的表达。术语启动子的含义包括术语“启动子调控序列”。启动子调控序列可以包括可能影响转录、RNA加工或相关编码核酸序列的稳定性的上游和下游元件。启动子包括天然来源的和合成的序列。编码核酸序列通常位于启动子相对于以转录起始位点为起始的转录方向的下游。
术语“组成型启动子”是指未经调控的启动子,其允许其可操作地连接的核酸序列的持续转录。
如本文所使用,术语“可操作地连接”是指处于功能性关系的多核苷酸元件的连接。当核酸与另一核酸序列处于功能性关系时,那么该核酸是“可操作地连接的”。例如,如果启动子或者转录调控序列能够影响编码序列的转录,那么该启动子或者转录调控序列是可操作地连接到该编码序列的。可操作地连接意味着被连接的DNA序列通常是邻接的。与启动子序列相关的核苷酸序列相对于要被转化的植物可以是同源或异源来源的。所述序列还可以是完全或部分合成的。不管来源如何,与启动子序列相关的核酸序列将根据在结合到本文实施方案的多肽后所连接的启动子性质而表达或沉默。相关核酸在所有时间或替代地在特定时间在整个生物体中或在特定组织、细胞或细胞室中可以编码需要表达或抑制的蛋白。此种核苷酸序列特别地编码将所需表型性状赋予给由其改变或转化的宿主细胞或生物体的蛋白质。更特别地,相关核苷酸序列引起在生物体中(+)-迈诺醇合酶的生产。
“靶肽”是指一种氨基酸序列,其将蛋白质或多肽靶向细胞内细胞器(即,线粒体或质体)或细胞外空间(分泌信号肽)。编码靶肽的核酸序列可以被融合到编码蛋白或多肽的氨基末端(例如N-末端)的核酸序列或者可以被用来替换原有的靶多肽。
术语“引物”是指短的核酸序列,其被杂交到模板核酸序列并且被用于与该模板互补的核酸序列的聚合。
如本文所使用的,术语“宿主细胞”或“经转化的细胞”是指被改变以包藏至少一种核酸分子(例如,编码所需蛋白或核酸序列的重组基团,其在转录后产生CPP合酶蛋白和香紫苏醇合酶蛋白或者一起产生(+)-迈诺醇)的细胞(或生物体)。
宿主细胞特别地是细菌细胞、真菌细胞或植物细胞。宿主细胞可以含有已经被整合到该宿主细胞的核或细胞器的基因组中的重组基因。或者,宿主可以含有染色体外的重组基因。同源序列包括直系同源或旁系同源序列。鉴定直系同源物或旁系同源物的方法包括现有技术中已知且在本文中描述的系统发生学方法、序列相似性和杂交方法。
旁系同源物来源于基因复制,其产生具有相似序列和相似功能的两种或更多种基因。旁系同源物典型地聚簇在一起并且通过基因在相关植物物种内的复制而形成。使用成对Blast分析或在基因家族的系统发生分析过程中使用程序诸如CLUSTAL在类似基因的组中发现旁系同源物。在旁系同源物中,共有序列可被鉴定为与相关基因内的序列特征相似,并具有相似的基因功能。
直系同源物或直系同源序列是彼此相似的序列,因为它们在由共同的祖先传下的物种中发现。例如,具有共同祖先的植物物种已知含有具有相同类似序列和功能的许多酶。本领域技术人员能够鉴定直系同源序列并预测直系同源物的功能,例如通过使用CLUSTAL或BLAST程序构建一个物种的基因家族的进化树。
术语“选择性标记物”是指在表达时能够被用来选择包括该选择性标记物的一个或多个细胞的任何基因。以下描述了选择性标记物的例子。本领域技术人员了解不同的抗生素、杀真菌剂、营养缺陷型或除草剂选择标记物可适用于不同的目标物种。
术语“生物体”是指任何非人多细胞或单细胞生物体。诸如植物或微生物。特别地,微生物是细菌、酵母、藻类或真菌。
术语“植物”可互换地使用以包括植物细胞,包括植物原生质体、植物组织、产生再生植物或植物部分的植物细胞组织培养物、或植物器官如根、茎、叶、花、花粉、胚珠、胚、果实等。任何植物均可以用来实施本文实施方案的方法。
对于本文和所附权利要求书中的描述,除非另有说明,“或”的使用意指“和/或”。类似地,“包含(comprise)”、“包含(comprises)”、“包含(comprising)”、“包括(include)”、“包括(includes)”和“包括(including)”可以互换使用并且不旨在限制。
还应当理解的是,在各个实施方案的描述使用术语“包含”的情况下,本领域技术人员能够理解,在一些具体情形中,可以替代地使用语言“基本上由……组成”或“由……组成”来描述一个实施方案。
在一个实施方案中,本文提供了用编码具有柯巴基二磷酸合酶活性的多肽的核酸和编码具有香紫苏醇合酶活性的多肽的核酸转化宿主细胞或非人生物体的方法,其中该具有柯巴基二磷酸活性的多肽包含与从SEQ ID NO:1和SEQ ID NO:2中选出的多肽具有至少90%、95%、98%、99%或100%序列同一性的氨基酸序列。特别地,该具有香紫苏醇合酶活性的多肽包含与从SEQ ID NO:4和SEQ ID NO:5中选出的多肽具有至少90%、95%、98%、99%或100%序列同一性的氨基酸序列。
在一个实施方案中,本文提供的方法包括培养非人宿主生物体或细胞,其能够生产香叶基香叶基二磷酸(GGPP),并经转化以表达具有柯巴基二磷酸合酶活性的多肽,其中该具有柯巴基二磷酸合酶活性的多肽包含与从SEQ ID NO:1和SEQ ID NO:2中选出的多肽具有至少90%、95%、98%、99%或100%序列同一性的氨基酸序列,并进一步经转化以表达具有香紫苏醇合酶活性的多肽。特别地,该具有香紫苏醇合酶活性的多肽包含与从SEQ IDNO:4和SEQ ID NO:5中选出的多肽具有至少90%、95%、98%、99%或100%序列同一性的氨基酸序列。
本文还提供了一种表达载体,包含编码CPP合酶的核酸,其中该CPP合酶包含多肽,该多肽包含与从SEQ ID NO:1和SEQ ID NO:2中选出的多肽具有至少90%、95%、98%、99%或100%序列同一性的氨基酸序列,并且该表达载体还包含编码香紫苏醇合酶的核酸。特别地,该香紫苏醇合酶具有与从SEQ ID NO:4和SEQ ID NO:5中选出的多肽有至少90%、95%、98%、99%或100%相似或相同的氨基酸序列。在一个具体的实施方案中,这两种酶可以在相同细胞中转化的两种不同的载体上。在另一个实施方案中,这两种酶可以在两种不同的细胞中转化的两种不同的载体上。
本文还提供了非人宿主生物体或细胞,其经转化以包藏至少一种编码CPP合酶的核酸和至少一种编码香紫苏醇酶的核酸,其中该CPP合酶包含多肽,该多肽包含与从SEQ IDNO:1和SEQ ID NO:2中选出的多肽具有至少90%、95%、98%、99%或100%序列同一性的氨基酸序列。特别地,该香紫苏醇合酶具有与从SEQ ID NO:4和SEQ ID NO:5中选出的多肽有至少90%、95%、98%、99%或100%相似或相同的氨基酸序列。
在一个实施方案中,编码本文提供的CPP合酶的核酸包含与序列ID NO:3具有至少90%、95%、98%、99%或100%序列同一性的核苷酸序列。
在一个实施方案中,编码本文提供的CPP合酶的核酸包含与序列ID NO:3具有至少95%、98%、99%或100%序列同一性的核苷酸序列。
在一个实施方案中,编码本文提供的CPP合酶的核酸包含与序列ID NO:3具有至少98%、99%或100%序列同一性的核苷酸序列。
在一个实施方案中,编码本文提供的CPP合酶的核酸包含与序列ID NO:3具有至少98%、99%或100%序列同一性的核苷酸序列。
在一个实施方案中,编码本文提供的CPP合酶的核酸包含与序列ID NO:3具有99%或100%序列同一性的核苷酸序列。在一个实施方案中,编码本文提供的CPP合酶的核酸包含与序列ID NO:3相同的核苷酸序列。
在一个实施方案中,CPP合酶包含多肽,该多肽包含与从SEQ ID NO:1和SEQ IDNO:2中选出的多肽具有至少90%、95%、98%、99%或100%序列同一性的氨基酸序列。
在一个实施方案中,CPP合酶包含多肽,该多肽包含与SEQ ID NO:1具有至少90%、95%、98%、99%或100%序列同一性的氨基酸序列。
在一个实施方案中,CPP合酶包含多肽,该多肽包含与SEQ ID NO:1具有至少95%、98%、99%或100%序列同一性的氨基酸序列。
在一个实施方案中,CPP合酶包含多肽,该多肽包含与SEQ ID NO:1具有至少98%、99%或100%序列同一性的氨基酸序列。
在一个实施方案中,CPP合酶包含多肽,该多肽包含与SEQ ID NO:1具有至少99%或100%序列同一性的氨基酸序列。在一个实施方案中,CPP合酶包含多肽,该多肽包含与SEQ ID NO:1相同的氨基酸序列。
在一个实施方案中,CPP合酶包含多肽,该多肽包含与SEQ ID NO:2具有至少90%、95%、98%、99%或100%序列同一性的氨基酸序列。
在一个实施方案中,CPP合酶包含多肽,该多肽包含与SEQ ID NO:2具有至少95%、98%、99%或100%序列同一性的氨基酸序列。
在一个实施方案中,CPP合酶包含多肽,该多肽包含与SEQ ID NO:2具有至少98%、99%或100%序列同一性的氨基酸序列。
在一个实施方案中,CPP合酶包含多肽,该多肽包含与SEQ ID NO:2具有至少99%或100%序列同一性的氨基酸序列。
在一个实施方案中,CPP合酶包含多肽,该多肽包含与SEQ ID NO:2相同的氨基酸序列。
在一个实施方案中,编码香紫苏醇合酶的核酸具有与SEQ ID NO.6有至少90%、95%、98%、99%或100%相似或相同的核苷酸序列。
在一个实施方案中,香紫苏醇合酶具有与SEQ ID NO:4有至少90%、95%、98%、99%或100%相似或相同的氨基酸序列。
在一个实施方案中,香紫苏醇合酶具有与SEQ ID NO:4有至少95%、98%、99%或100%相似或相同的氨基酸序列。
在一个实施方案中,香紫苏醇合酶具有与SEQ ID NO:4有至少98%、99%或100%相似或相同的氨基酸序列。
在一个实施方案中,香紫苏醇合酶具有与SEQ ID NO:4有至少99%或100%相似或相同的氨基酸序列。
在一个实施方案中,香紫苏醇合酶具有与SEQ ID NO:4相同的氨基酸序列。
在一个实施方案中,香紫苏醇合酶具有与SEQ ID NO:5有至少90%、95%、98%、99%或100%相似或相同的氨基酸序列。
在一个实施方案中,香紫苏醇合酶具有与SEQ ID NO:5有至少95%、98%、99%或100%相似或相同的氨基酸序列。
在一个实施方案中,香紫苏醇合酶具有与SEQ ID NO:5有至少98%、99%或100%相似或相同的氨基酸序列。
在一个实施方案中,香紫苏醇合酶具有与SEQ ID NO:5有至少99%或100%相似或相同的氨基酸序列。
在一个实施方案中,香紫苏醇合酶具有与SEQ ID NO:5相同的氨基酸序列。
在另一个实施方案中,本文提供了包含本文所述的核酸的表达载体。表达载体可以包含本文所述的一种或多种核酸。
在另一个实施方案中,本文提供了非人宿主生物体或细胞,其经转化以包藏至少一种本文所述的核酸,从而异源表达或过度表达至少一种本文所述的多肽。
在一个实施方案中,本文提供的非人宿主生物体是植物、原核生物或真菌。
在一个实施方案中,本文提供的非人宿主是微生物,特别是细菌或酵母。
在一个实施方案中,本文提供的非人生物体是大肠杆菌(E.coli),并且所述酵母是酿酒酵母(Sacchromyces cerevisiae)。
在一个实施方案中,本文提供的非人生物体是酿酒酵母。
在一个实施方案中,细胞是原核细胞。
在其他实施方案中,细胞是细菌细胞。
在一个实施方案中,细胞是真核细胞。
在一个实施方案中,真核细胞是酵母细胞或植物细胞。
在一个实施方案中,生产(+)-迈诺醇的方法以至少98%或98.5%的纯度生产(+)-迈诺醇。
在另一个实施方案中,本文提供的方法还包括使用本领域公知的方法使用化学或生物化学合成或两者的组合将(+)-迈诺醇加工成衍生物。
在一个实施方案中,(+)-迈诺醇衍生物选自烃、醇、缩醛、醛、酸、醚、酮、内酯、乙酸酯和酯。
根据本发明的任何实施方案,所述(+)-迈诺醇衍生物是可选地包含一个、两个或三个氧原子的C10至C25化合物。
在另一个实施方案中,衍生物选自乙酸迈诺醇酯((3R)-3-甲基-5-[(1S,4aS,8aS)-5,5,8a-三甲基-2-亚甲基十氢-1-萘基]-1-戊烯-3-基乙酸酯)、柯巴醇((2E)-3-甲基-5-[(1S,4aS,8aS)-5,5,8a-三甲基-2-亚甲基十氢-1-萘基]-2-戊烯-1-醇)、乙酸柯巴醇酯((2E)-3-甲基-5-[(1S,4aS,8aS)-5,5,8a-三甲基-2-亚甲基十氢-1-萘基]-2-戊烯-1-基乙酸酯)、柯巴醛((2E)-3-甲基-5-[(1S,4aS,8aS)-5,5,8a-三甲基-2-亚甲基十氢-1-萘基]-2-戊烯醛)、(+)-迈诺醇氧基(4-[(1S,4aS,8aS)-5,5,8a-三甲基-2-亚甲基十氢-1-萘基]-2-丁酮)、Z-11((3S,5aR,7aS,11aS,11bR)-3,8,8,11a-四甲基十二氢-3,5a-环氧萘并[2,1-c]氧杂七环)、γ-ambrol(2-[(1S,4aS,8aS)-5,5,8a-三甲基-2-亚甲基十氢-1-萘基]乙醇)和
Figure BDA0001517646560000161
(降龙涎香醚,(3aR,5aS,9aS,9bR)-3a,6,6,9a-四甲基十二氢萘并[2,1-b]呋喃)。
在另一个实施方案中,本文提供的方法还包括使(+)-迈诺醇与合适的反应体系接触以将所述(+)-迈诺醇转化成合适的(+)-迈诺醇衍生物。所述合适的反应体系可以是酶促性质的(例如需要一种或多种酶)或化学性质的(例如需要一种或多种合成化学品)。
例如,可以使用文献中描述的方法(例如美国专利号7,294,492中所述)将(+)-迈诺醇通过酶催化转化成迈诺醇氧基或γ-ambrol,其中所述专利通过引用整体并入本文。
在又一个实施方案中,(+)-迈诺醇衍生物是柯巴醇及其与C1-C5羧酸形成的酯。
在又一个实施方案中,(+)-迈诺醇衍生物是与C1-C5羧酸形成的(+)-迈诺醇酯。
在一个实施方案中,(+)-迈诺醇衍生物是柯巴醛。
在一个实施方案中,(+)-迈诺醇衍生物是迈诺醇氧基。
在又一个实施方案中,(+)-迈诺醇衍生物是Z-11。
在一个实施方案中,(+)-迈诺醇衍生物是γ-ambrol,或是其及其与C1-C5羧酸形成的酯的混合物,特别是γ-ambrol及其酯。
在另一个实施方案中,(+)-迈诺醇衍生物是
Figure BDA0001517646560000162
香紫苏内酯(也称为3a,6,6,9a-四甲基十氢萘并[2,1-b]呋喃-2(1H)-酮及其全部非对映异构体和立体异构体)、3,4a,7,7,10a-五甲基十二氢-1H-苯并[f]色原烯-3-醇或3,4a,7,7,10a-五甲基-4a,5,6,6a,7,8,9,10,10a,10b-十氢-1H-苯并[f]色烯及其所有非对映异构体和立体异构体环酮和开环形式、(1R,2R,4aS,8aS)-1-(2-羟乙基)-2,5,5,8a-四甲基十氢萘-2-醇DOL、γ-ambrol。
在实施例中详细描述了如何能获得所述衍生物(例如三烯烃、乙酸酯或柯巴醇)的具体实例。
例如,根据EP 212254,根据本发明获得的迈诺醇可以被加工成迈诺醇氧基(一种酮,按照已知的方法),然后被加工成ambrol(一种醇)和降龙涎香醚(一种醚)。
多肽催化特定倍半萜合成的能力可通过进行如本文提供的实施例中详述的酶测定来证实。
多肽还意欲包括截短的多肽,条件是它们保持其(+)-迈诺醇合酶活性和香紫苏醇合酶活性。截短的CPP合酶多肽例如具有如本文前面所定义的CPP合酶的活性。截短的香紫苏醇合酶多肽例如具有如本文前面所定义的香紫苏醇合酶的活性。
如下文所期望的,通过修饰本文所述序列获得的核苷酸序列可以使用本领域已知的任何方法,例如通过引入任何类型的突变,例如缺失、插入或置换突变来进行。这种方法的例子列举在说明书中涉及变体多肽及其制备方法的部分中。
两个肽或核苷酸序列之间的同一性百分比是当产生这两个序列的比对时,两个序列中相同的氨基酸或核苷酸残基的数目的函数。相同的残基被定义为两个序列中在比对的给定位置的相同的残基。本文使用的序列同一性的百分比是从最佳比对中通过将两个序列之间相同的残基数除以最短序列中的残基总数并乘以100计算得到的。最佳比对是同一性百分比最高可能性的比对。可以将空位引入到一个或两个序列中的比对的一个或多个位置中以获得最佳比对。然后将这些空位考虑为用于计算序列同一性百分比的不相同的残基。用于确定氨基酸或核酸序列同一性百分比的比对可以使用计算机程序以及例如在互联网上可公开获得的计算机程序以多种方式实现。优选地,可使用设定为默认参数可从National Center for Biotechnology Information(NCBI)于http://www.ncbi.nlm.nih.gov/BLAST/bl2seq/wblast2.cgi获得的BLAST程序(Tatiana等,FEMSMicrobiol Lett.,1999,174:247-250,1999)来获得肽或核苷酸序列的最佳比对并计算序列同一性的百分比。
要与GGPP体外接触的多肽可以使用标准蛋白或酶提取技术从表达它的任何有机体中提取得到。如果宿主生物体是将本文实施方案的多肽释放到培养基中的单细胞生物体或细胞,那么可以简单地从所述培养基收集所述多肽,例如,通过离心,可选地随后进行洗涤步骤和再悬浮于适合的缓冲液中。如果该生物体或细胞将多肽累积于其细胞中,那么可以通过破裂或裂解该细胞并且进一步从细胞裂解液中提取多肽来获得该多肽。
根据另一个具体实施方案,上述任何实施方案的方法在体内进行。本文提供的这些实施方案是特别有利的,因为可以在不预先分离多肽的情况下在体内进行该方法。该反应直接发生在经转化以表达所述多肽的生物体或细胞内。
因此,例如,(+)迈诺醇可以通过培养本文所述的宿主细胞或生物体由GGPP来生产。
所述生物体或细胞旨在“表达”多肽,前提是所述生物体或细胞经转化以包藏编码所述多肽的核酸,这种核酸被转录至mRNA并且在该宿主生物体或细胞中发现该多肽。术语“表达”涵盖“异源表达”和“过表达”,后者是指mRNA、多肽和/或酶活性的水平高于在未经转化的生物体或细胞中所测量的水平。随后,在致力于描述作为本文具体目的的此种经转化的非人宿主生物体或细胞的说明书部分中,将描述用于转化非人宿主生物体或细胞的适合方法的更详细说明。
特定的生物体或细胞,当其天然地产生FPP或当其不天然地产生FPP但是在使用本文所述的核酸转化之前或与使用所述核酸一起被转化以生产FPP时,即“能够产生FPP”。经转化以比天然存在的生物体或细胞产生更高量的FPP的生物体或细胞也被“能够生产FPP的生物体或细胞”所涵盖。用于转化生物体(例如微生物)以便它们生产FPP的方法在本领域中是已知的。例如,微生物可以用转化。
特定的生物体或细胞,当其天然地产生GGPP或当其不天然地产生GGPP但是在使用本文所述的核酸转化之前或与使用所述核酸一起被转化以生产GGPP时,即“能够产生GGPP”。经转化以比天然存在的生物体或细胞产生更高量的GGPP的生物体或细胞也被“能够生产GGPP的生物体或细胞”所涵盖。用于转化生物体(例如微生物)以便它们生产GGPP的方法在本领域中是已知的。
适合于在体内进行本文实施方案的方法的非人宿主生物体可以是任何非人多细胞或单细胞生物体。在一个具体的实施方式中,用来在体内进行本文实施方案的非人宿主生物体是植物、原核生物或真菌。可以使用任何植物、原核生物或真菌。特别有用的植物是天然产生高量萜烯的那些。在一个更具体的实施方案中,用来在体内进行本文实施方案的方法的非人宿主生物体是微生物。可以使用任何微生物,但根据甚至更具体的实施方案,所述微生物是细菌或酵母。更特别地,所述细菌是大肠杆菌且所述酵母是酿酒酵母。
这些生物体的一些天然不产生GGPP,或者只产生少量的GGPP。为了适合于进行本文实施方案的方法,这些生物体必须经转化以生产所述前体,或以较大的量生产所述前体。如以上所说明的那样,它们可以在使用根据任一上述实施方案所述的核酸进行修饰之前或同时地被如此转化。
生物体可以例如用编码GGPP合酶的核酸进行转化。核酸可以包含在与本文所述的编码CPP合酶或编码香紫苏醇合酶的核酸相同或不同的表达载体中。GGPP合酶可以例如包含SEQ ID NO:7中的氨基酸序列。编码GGPP合酶的核酸可以例如包含SEQ ID NO:8中的核酸序列。可以使用例如本文和本实施例中所描述的转化方法。
生物体可以用编码部分或全部甲羟戊酸途径导致FPP的一种或多种核酸转化。可以使用例如本实施例所述的方法。
也可以使用分离的高等真核细胞而不是完整的生物体作为宿主来体内进行本文实施方案的方法。合适的真核细胞可以是任何非人细胞,但特别是植物或真菌细胞。
根据另一个具体的实施方案,在本文所述的任何实施方案中使用或由本文所述的核酸编码的具有CPP合酶活性和香紫苏醇合酶活性的多肽可以是通过基因工程获得的变体,条件是所述变体保持其CPP合酶活性和香紫苏醇合酶活性。例如,变体CPP合酶多肽具有如本文前面所定义的CPP合酶的活性。变体香紫苏醇合酶多肽例如具有如本文前面所定义的香紫苏醇合酶的活性。
如本文所用,所述多肽意欲作为包含本文鉴定的氨基酸序列的多肽或肽片段,以及截短的或变异的多肽,条件是它们保持如本文所定义的其CPP合酶活性和其香紫苏醇合酶活性。
“保持活性”可以例如意指该多肽保持未突变的或未截短的多肽的至少一些原始活性,例如至少70、80、90、95、97、99或100%的活性。与未突变或未截短的多肽相比,变体或截短的多肽在一些情况下可以具有增加的活性。
变体多肽的例子是由交替mRNA剪接事件或本文所述多肽的蛋白水解切割产生的天然存在的蛋白。归因于蛋白水解的变化包括例如在不同类型的宿主细胞中表达时N-或C-末端的差异,这是由于从本文实施方案的多肽蛋白水解去除一个或多个末端氨基酸引起的。本文实施方案还涵盖了如下文所描述的,通过天然或人工突变本文实施方案的核酸获得的核酸所编码的多肽。
由在氨基和羧基末端融合额外的肽序列产生的多肽变体也可以用在本文实施方案的方法中。特别地,此种融合能够增强多肽的表达,有用于蛋白的纯化或改善多肽在期望环境或表达系统中的酶活性。此种额外的肽序列例如可以是信号肽。因此,本发明包括使用变体多肽(诸如通过与其它寡肽或多肽融合所获得的那些和/或连接到信号肽的那些)的方法。由与另一种功能肽(诸如来自萜生物合成路径的另一种蛋白)融合产生的多肽也可以有利地用于本文实施方案的方法中。
如上所述,编码本文一个实施方案的多肽的核酸是一种有用的工具,用于修饰在体内实施所述方法时打算使用的非人宿主生物体或细胞。
因此,本文还提供了编码根据任何上述实施方案的多肽的核酸。
本文实施方案的核酸可以被定义为包括单链形式或双链形式的脱氧核糖核苷酸或核糖核苷酸聚合物(DNA和/或RNA)。术语“核苷酸序列”应当被理解为包含多核苷酸分子或独立片段形式的寡核苷酸分子或作为较大核酸的组件。本文实施方案的核酸还涵盖某些分离的核苷酸序列,包括基本上不含内源性污染物质的那些分离的核苷酸序列。本文实施方案的核酸可以是截短的,条件是其编码如上所述的本文涵盖的多肽。
在一个实施方案中,本文实施方案的编码CPP合酶的核酸可以天然存在于植物例如丹参(Salvia miltiorrhiza)或其他物种中,或通过修饰SEQ ID NO:3而获得。
在进一步的实施方案中,本文实施方案的编码香紫苏醇合酶的核酸可以天然存在于植物例如南欧丹参(Salvia sclarea)或其他物种中,或者可以通过修饰SEQ ID NO:6而获得。
突变可以是这些核酸的任何种类的突变,例如点突变、缺失突变、插入突变和/或移码突变。可以制备变体核酸以使其核苷酸序列适应特定的表达系统。例如,如果氨基酸由特定密码子编码,则已知细菌表达系统更有效地表达多肽。
由于遗传密码的简并性,多于一个的密码子可以编码相同的氨基酸序列,多个核酸序列可以编码相同的蛋白质或多肽,所有这些DNA序列都涵盖在本文的实施方案中。在适当的情况下,可以对编码CPP合酶和香紫苏醇合酶的核酸序列进行优化以提高在宿主细胞中的表达。例如,可以使用宿主特有的密码子合成本文实施方案的核苷酸以改善表达。
用于转化适合于在体内实施本文实施方案的方法的宿主生物体或细胞的另一个重要工具是包含根据本文实施方案的任何实施方案的核酸的表达载体。因此这里也提供了这种载体。表达载体可以例如包含如本文所述的编码CPP合酶的核酸,编码香紫苏醇合酶的核酸或编码GGPP合酶的核酸中的一种或多种。
经转化以包藏本文实施方案的至少一种核酸以便异源表达或过表达本文实施方案的至少一种多肽的重组非人宿主生物体和细胞,也是实施本文实施方案的方法的非常有用的工具。因此,本文也提供此种非人宿主生物体和细胞。
根据任何上述实施方案的核酸可用于转化非人宿主生物体和细胞,经表达的多肽可以是任何上述多肽。
本文实施方案的非人宿主生物体可以是任何非人多细胞或单细胞生物体。在一个具体的实施方案中,非人类宿主生物是植物、原核生物或真菌。任何植物、原核生物或真菌都适合根据本文提供的方法进行转化。特别有用的植物是天然产生大量萜烯的植物。
在更具体的实施方案中,非人宿主生物体是微生物。任何微生物都适用于本文,但是根据甚至更具体的实施方案,所述微生物是细菌或酵母。最特别的是,所述细菌是大肠杆菌,并且所述酵母是酿酒酵母。
除了完整的生物体,分离的高等真核细胞也可以被转化。作为高等真核细胞,这里是指除酵母细胞之外的任何非人真核细胞。特别的高等真核细胞是植物细胞或真菌细胞。
通过附接共价或非共价连接到多肽主链的修饰基团,变体也可以不同于本文实施方案的多肽。
通过引入N-连接的或O-连接的糖基化位点、和/或添加半胱氨酸残基,所述变体还包括与本文描述的多肽不同的多肽。本领域技术人员能够了解如何修饰氨基酸序列和保留生物活性。
本文提供的实施方案包括但不限于cDNA、基因组DNA和RNA序列。
基因(包括本文实施方案的多核苷酸)可以通过本领域已知的方法基于可获得的核苷酸序列信息(诸如在所附的序列表中发现的)进行克隆。这些包括例如设计表示此种基因的侧翼序列的DNA引物,所述基因的一种是在有义取向上产生的并且初始化有义链的合成,而另一种以反向互补的方式创造并且产生反义链。诸如在聚合酶链反应中使用的那些热稳定的DNA聚合酶通常被用来进行此种实验。或者,表示基因的DNA序列可以被化学合成并且随后导入到DNA载体分子中,所述DNA载体分子可以通过例如相容性细胞(诸如大肠杆菌)来繁殖。
本文提供了通过SEQ ID NO:3和SEQ ID NO:6的突变获得的核酸序列;这种突变可以定期进行。技术人员清楚,可以将一个或多个核苷酸的突变、缺失、插入和/或取代引入到这些DNA序列中。
本文实施方案的编码CPP合酶和香紫苏醇合酶蛋白的核酸序列可以插入到表达载体中和/或包含在插入于表达载体中的嵌合基因中,以在宿主细胞或宿主生物体中产生CPP合酶和香紫苏醇合酶。用于将转基因插入到宿主细胞基因组中的载体在本领域是公知的,并且包括质粒、病毒、粘粒和人工染色体。其中插入了嵌合基因的二元或共整合载体也用于转化宿主细胞。
本文提供的实施方案提供了重组表达载体,其包含编码CPP合酶和香紫苏醇合酶的核酸,其分别与相关的核酸序列例如启动子序列可操作地连接。
或者,启动子序列可能已经存在于载体中,使得要被转录的核酸序列插入到启动子序列下游的载体中。载体通常被工程化以具有复制起点、多克隆位点和选择标记。
实施例
实施例1
二萜合酶基因
两种二萜合酶是将香叶基香叶基二磷酸(GGPP)转化为迈诺醇所必需的:II型和I型二萜合酶。在这些实施例中,对于II型二萜合酶,使用了柯巴基二磷酸(CPP)合酶丹参(Salvia miltiorrhiza)(NCBI登录号ABV57835.1)。为了在大肠杆菌细胞中最佳表达,对cDNA的密码子使用进行优化,除去前58个密码子并添加ATG起始密码子。对于I型二萜合酶,使用来自南欧丹参(Salvia sclarea)(SsScS)的香紫苏醇合酶(NCBI登录号AET21246.1,WO2009095366)。对于大肠杆菌表达(DNA2.0,Menlo Park,CA94025),对cDNA的密码子使用进行了优化,去除了前50个N端密码子。在体外合成这两种cDNA中的每一种,并将其克隆在侧翼具有NdeI和KpnI限制酶识别位点(DNA 2.0,Menlo Park,CA 94025,USA)的pJ208质粒中。
实施例2
表达质粒
用NdeI和KpnI消化编码cDNA的经修饰的CPP合酶(SmCPS2)和香紫苏醇合酶(SsScS),并连接到pETDuet-1质粒中,分别提供pETDuet-SmCPS2和pETDuet-1132opt表达质粒。
构建另一个质粒以共表达SmCPS2和SsScS酶以及香叶基香叶基二磷酸(GGPP)合酶。对于GGPP合酶,使用编码GGPP合酶(NCBI登录号AAA24819.1)的来自成团泛菌(Pantoeaagglomerans)的CrtE基因(NCBI登录号M38424.1)。通过密码子优化来合成CrtE基因,并在3'和5'末端添加NcoI和BamHI限制酶识别位点(DNA 2.0,Menlo Park,CA 94025,USA),并连接到pETDuet-1质粒的NcoI与BamHI位点之间以获得pETDuet-CrtE质粒。用NdeI和KpnI消化编码cDNA的经修饰的SmCPS2并连接到pETDuet-1-CrtE质粒中,从而提供pETDuet-CrtE-SmCPS2构建体。然后使用In-
Figure BDA0001517646560000251
技术(Clontech,Takara Bio Europe)将编码截短的SsScS的优化的cDNA(Sa1132opt)导入到pETDuet-CrtE-SmCPS2质粒中。对于这种克隆,在PCR扩增中使用pETDuet-1132opt作为模板,该PCR扩增使用正向引物SmCPS2-1132Inf_F15’-CTGTTTGAGCCGGTCGCCTAAGGTACCAGAAGGAGATAAATAATGGCGAAAATGAAGGAGAACTTTAAACG-3’和反向引物1132-pET_Inf_R15’-GCAGCGGTTTCTTTACCAGACTCGAGGTCAGAACACGAAGCTCTTC ATGTCCTCT-3’。将PCR产物连接到用KpnI和XhoI限制酶消化的质粒pETDuet-CrtE-SmCPS2中,并使用In-
Figure BDA0001517646560000261
Dry-Down PCR Cloning Kit(Clontech,Takara Bio Europe)提供新的质粒pETDuet-CrtE-SmCPS2-SsScS。在该质粒中,CrtE基因处于pETDuet质粒的第一个T7启动子的控制下,编码cDNA的CPP合酶和香紫苏醇合酶在第二个T7启动子控制下在双顺反子构建体中组织。
实施例3
在大肠杆菌中的异源表达和酶活性
使用表达质粒(pETDuet-SmCPS2或pETDuet-1132opt)转化Bl21(DE3)大肠杆菌细胞(Novagene,Madison,WI)。将经转化细胞的单菌落用于接种25ml LB培养基。在37℃温育5至6小时后,将培养物转移至20℃培养箱中并保持1小时以平衡。然后通过加入0.1mM IPTG来诱导蛋白的表达,并将培养物在20℃温育过夜。第二天,通过离心收集细胞,重悬于0.1体积的50mM MOPSO pH7、10%甘油、1mM DTT中并通过超声裂解。通过离心(20,000g,30分钟)清除提取物,并将含有可溶性蛋白的上清液用于进一步实验。
实施例4
体外二萜合酶活性测定
在Teflon密封的玻璃试管中进行酶测定,使用50~100μl蛋白提取物,最终体积为1mL的50mM MOPSO pH7、10%甘油,补充有20mM MgCl2,和50~200μM纯化的香叶基香叶基二磷酸(GGPP)(按照Keller和Thompson,J.Chromatogr 645(1),161-167,1993所述制备)。将试管在30℃温育5至48小时,酶产物用一倍体积的戊烷萃取两次。在氮流通下浓缩后,通过GC-MS分析提取物并与对照蛋白的提取物(从用空质粒转化的细胞获得)进行比较。GC-MS分析是在装有DB1柱(30m×0.25mm×0.25mm膜厚;Agilent)并连接有5975系列质谱仪的Agilent 6890系列GC系统上进行的。载气是1ml/min的恒定流量的氦气。注射为分流模式,注射器温度设定在260℃,烘箱温度程序升温以10℃/min从100℃升至225℃,然后以30℃/min升至280℃。根据可信标准的保留指数和质谱的一致性来确认产物的特性。
在这些条件下,并使用质粒pETDuet-SmCPS2或pETDuet-1132opt(分别异源表达SmCPS或SsScS酶)转化的来自大肠杆菌细胞的重组蛋白,在溶剂提取物中没有检测到二萜分子的生产(在这些条件下没有检测到含二磷酸的二萜)。然后进行类似的测定,但是在单一测定中将含有重组SmCPS和SsScS的两种蛋白提取物组合。在这些测定中,形成一种主要产物,并且通过质谱和保留指数与可信标准的匹配而鉴定为(+)-迈诺醇(图2)。
实施例5
使用大肠杆菌细胞的体内迈诺醇生产
使用大肠杆菌细胞来评估使用全细胞培养物在体内生产迈诺醇。为了提高内源性法呢基二磷酸(FPP)库在细胞中二萜的生产力的水平,在相同的细胞中共表达了导致FPP的异源完整甲羟戊酸途径。该途径的酶使用含有在两个启动子控制下的两个操纵子中组织的所有基因的单一质粒来表达。该表达质粒的构建描述于专利WO2013064411或Schalk等(2013)J.Am.Chem.Soc.134,18900-18903。简而言之,由大肠杆菌乙酰乙酰-CoA硫解酶(atoB)、金黄色葡萄球菌HMG-CoA合酶(mvaS)、金黄色葡萄球菌HMG-CoA还原酶(mvaA)和酿酒酵母FPP合酶(ERG20)基因组成的第一合成操纵子在体外合成(DNA2.0,Menlo Park,CA,USA)并连接到NcoI-BamHI消化的pACYCDuet-1载体(Invitrogen)中,产生pACYC-29258。从肺炎链球菌(ATCC BAA-334)的基因组DNA扩增出含有甲羟戊酸激酶(MvaK1)、磷酸甲羟戊酸激酶(MvaK2)、二磷酸甲羟戊酸脱羧酶(MvaD)和异戊烯基二磷酸异构酶(idi)的第二操纵子,并连接到pACYC-29258的第二多克隆位点中,提供质粒pACYC-29258-4506。因此该质粒含有编码从乙酰辅酶A到FPP的生物合成途径的所有酶的基因。
将KRX大肠杆菌细胞(Promega)与质粒pACYC-29258-4506和pETDuet-CrtE-SmCPS2-SsScS质粒共转化。在羧苄青霉素(50μg/ml)和氯霉素(34μg/ml)LB-琼脂糖平板上选择经转化的细胞。使用单菌落接种5mL补充有相同抗生素的液体LB培养基。培养物在37℃温育过夜。第二天,用0.2mL过夜培养物接种2mL添加有相同抗生素的TB培养基。在37℃温育6小时后,将培养物冷却至28℃,向各试管中加入0.1mM IPTG,0.2%鼠李糖和1:10体积的癸烷。培养物在28℃下孵育48小时。然后将培养物用2倍体积的MTBE(甲基叔丁基醚)提取两次,将有机相浓缩至500μL,并如上面实施例4中所述通过GC-MS进行分析,不同之处在于烘箱温度于100℃保持1分钟,接着以10℃/分钟的温度梯度升至220℃并以20℃/分钟升至3000℃。在这种培养条件下,迈诺醇作为唯一的二萜产品生产出,产量为300~500mg/L(图3)。
实施例6
使用重组细胞生产(+)-迈诺醇、纯化和NMR分析。
在实施例5中描述的条件下制备一升大肠杆菌培养物,不同之处在于用50g/LAmberlite XAD-4代替癸烷有机相进行固相萃取。将培养基过滤以回收树脂。然后用3倍柱体积的水洗涤树脂,并用3倍柱体积的MTBE洗脱。然后通过硅胶快速色谱法进一步纯化产物,使用由庚烷:MTBE为8:2(v/v)组成的流动相。通过1H-和13C-NMR证实了迈诺醇的结构。使用Bruker Avance 500MHz光谱仪测量旋光度。[α]D 20=+26.9°(0.3%,CHCl3)的值证实了(+)-迈诺醇的生成。
实施例7
根据下面的实验部分,将在上述实施例中获得的迈诺醇转化为其酯(在下文中作为实例被转化为其乙酸酯):
Figure BDA0001517646560000291
根据文献(G.Ohloff,Helv.Chim.Acta 41,845(1958)),用20.0g(0.25摩尔)乙酰氯在100ml的二甲基苯胺中在室温下处理32.0g(0.11摩尔)纯结晶(+)-迈诺醇5天。将混合物另外在50℃下加热7小时以达到100%的转化率。冷却后,反应混合物用乙醚稀释,依次用10%H2SO4、NaHCO3水溶液和水洗至中性。干燥(Na2SO4)并浓缩后,蒸馏产物(球对球,B.p.=160°,0.1毫巴),得到20.01g(79.4%)的乙酸迈诺醇酯,其未经进一步纯化即使用。
MS:M+332(0);m/e:272(27),257(83),137(62),95(90),81(100).
1H-NMR(CDCl3):0.67,0.80,0.87,1.54和2.01(5s,3H各自),4.49(s,1H),4.80(s,1H),5.11(m,1H),5.13(m,1H),5.95(m,1H).
13C-NMR(CDCl3):14.5(q),17.4(t),19.4(t),21.7(q),22.2(q),23.5(q),24.2(t),33.5(s),33.6(t),38.3(t),39.0(t),39.3(t),39.8(s),42.2(t),55.6(d),57.2(t),83.4(s),106.4(t),113.0(t),142.0(d),148.6(s),169.9(s).
实施例8
根据下面的实验部分,将在上述实施例中获得的乙酸迈诺醇酯转化为其三烯(在下文中作为实例被转化为香紫苏烯(Sclarene)和(Z+E)泪柏烯((Z+E)-Biformene):
Figure BDA0001517646560000301
在室温下向0.4g乙酸迈诺醇酯在4ml环己烷中的溶液中加入0.029g(0.05当量)BF3.AcOH络合物。在室温下15分钟后,将反应用NaHCO3水溶液淬灭并用水洗至中性。GC-MS分析显示只有被鉴定为香紫苏烯、(Z)和(E)-泪柏烯的烃。没有检测到乙酸柯巴醇酯。
另一个更多催化剂(0.15当量)的试验给出了相同的结果。
·香紫苏烯:MS:M+272(18);m/e:257(100),149(15),105(15).
·(Z)和(E)-泪柏烯(相同光谱):MS:M+272(29);m/e:257(100),187(27),161(33),105(37).
实施例9
根据下面的实验部分,将上述实施例中获得的迈诺醇转化为柯巴基酯(在下文中作为实例将其转化为乙酸酯):
Figure BDA0001517646560000302
在室温下向0.474g(0.826毫摩尔,0.27当量)BF3.AcOH在100毫升环己烷中的溶液中加入4.4g乙酸酐和12.1g乙酸。在室温下,加入10.0g(33毫摩尔)在15ml环己烷中的纯结晶迈诺醇(缓慢放热),并用水浴将温度保持在室温。在室温下搅拌30分钟后,GC对照显示没有起始材料。将反应混合物用300ml饱和NaHCO3水溶液淬灭,并照常处理。通过快速色谱(SiO2,戊烷/乙醚95:5)和球对球蒸馏(Eb.=130°,0.1毫巴)纯化粗混合物(9.9g),得到4.34g(37.1%)的(Z)和(E)-柯巴基乙酸酯的27/73混合物。
·(Z)-柯巴基乙酸酯:
MS:M+332(0);m/e:317(2),272(35)=,257(100),137(48),95(68),81(70).
1H-NMR(CDCl3):0.67,0.80,0.87 1.76和2.04(5s,3H各自),4.86(s,1H),5.35(t:J=6Hz,1H).
·(E)-柯巴基乙酸酯:
MS:M+332(0);m/e:317(2),272(33)=,257(100),137(54),95(67),81(74).
1H-NMR(CDCl3):0.68,0.80,0.87 1.70和2.06(5s,3H各自),4.82(s,1H),5.31(t:J=6Hz,1H).
13C-NMR(CDCl3):(在(Z/E)混合物上记录的光谱,仅给出显著信号):61.4(t),106.2(t),117.9(d),143.1(s),148.6(s),171.1(s).
实施例10
根据下面的实验部分,将上述实施例中获得的柯巴基乙酸酯转化为柯巴醇:
Figure BDA0001517646560000311
将柯巴基乙酸酯(4.17g,12.5毫摩尔)、KOH粒料(3.35g,59.7毫摩尔)、水(1.5g)和EtOH(9.5ml)混合在一起,并在50℃下搅拌3小时。在通常的处理后,得到3.7g粗产物(Z+E)-柯巴醇,并通过快速色谱(SiO2,戊烷/乙醚7:2)纯化,蒸发溶剂后,进行球对球蒸馏(Eb=170°,0.1毫巴)提供3.25g(92%)的(Z)和(E)-柯巴醇的27/73混合物。
·(Z)-柯巴醇
MS:M+290(3);m/e:275(18),272(27),257(82),137(71),95(93),81(100),69(70).1H-NMR(CDCl3):0.67,0.80,0.87和1.74(4s,3H各自);4.06(m,2H),4.55(s,1H),4.86(s,1H),5.42(t:J=6Hz,1H).
·(E)-柯巴醇
MS:M+290(3);m/e:275(27),272(22),257(75),137(75),95(91),81(100),69(68).1H-NMR(CDCl3):0.68,0.80,0.87和1.67(4s,3H各自);4.15(m,2H),4.51(s,1H),4.83(s,1H),5.39(t,J=6Hz,1H)
13C-NMR(CDCl3):(在(Z/E)混合物上记录的光谱,仅给出显著信号):):59.4(t),106.2(t),123.0(d),140.6(s),148.6(s).
NMR分析与相似化合物的公开光谱很好地一致。例如,参见S.Hasecawa,Y.Hirose,Phytochemistry 19(11),2479(1980)。
序列表
SEQ ID NO:1
SmCPS,来自丹参(S.miltiorrhiza)的全长柯巴基二磷酸合酶
MASLSSTILSRSPAARRRITPASAKLHRPECFATSAWMGSSSKNLSLSYQLNHKKISVATVDAPQVHDHDGTTVHQGHDAVKNIEDPIEYIRTLLRTTGDGRISVSPYDTAWVAMIKDVEGRDGPQFPSSLEWIVQNQLEDGSWGDQKLFCVYDRLVNTIACVVALRSWNVHAHKVKRGVTYIKENVDKLMEGNEEHMTCGFEVVFPALLQKAKSLGIEDLPYDSPAVQEVYHVREQKLKRIPLEIMHKIPTSLLFSLEGLENLDWDKLLKLQSADGSFLTSPSSTAFAFMQTKDEKCYQFIKNTIDTFNGGAPHTYPVDVFGRLWAIDRLQRLGISRFFEPEIADCLSH
IHKFWTDKGVFSGRESEFCDIDDTSMGMRLMRMHGYDVDPNVLRNFKQKDGKFSCYGGQMIESPSPIYNLYRASQLRFPGEEILEDAKRFAYDFLKEKLANNQILDKWVISKHLPDEIKLGLEMPWLATLPRVEAKYYIQYYAGSGDVWIGKTLYRMPEISNDTYHDLAKTDFKRCQAKHQFEWLYMQEWYESCGIEEFGISRKDLLLSYFLATASIFELERTNERIAWAKSQIIAKMITSFFNKETTSEEDKRALLNELGNINGLNDTNGAGREGGAGSIALATLTQFLEGFDRYTRHQLKNAWSVWLTQLQHGEADDAELLTNTLNICAGHIAFREEILAHNEYKALSNLTSKICRQLSFIQSEKEMGVEGEIAAKSSIKNKELEEDMQMLVKLVLEKYGGIDRNIKKAFLAVAKTYYYRAYHAADTIDTHMFKVLFEPVA
SEQ ID NO:2
SmCPS2,来自丹参(S.miltiorrhiza)的截短的柯巴基二磷酸合酶
MATVDAPQVHDHDGTTVHQGHDAVKNIEDPIEYIRTLLRTTGDGRISVSPYDTAWVAMIKDVEGRDGPQFPSSLEWIVQNQLEDGSWGDQKLFCVYDRLVNTIACVVALRSWNVHAHKVKRGVTYIKENVDKLMEGNEEHMTCGFEVVFPALLQKAKSLGIEDLPYDSPAVQEVYHVREQKLKRIPLEIMHKIPTSLLFSLEGLENLDWDKLLKLQSADGSFLTSPSSTAFAFMQTKDEKCYQFIKNTIDTFNGGAPHTYPVDVFGRLWAIDRLQRLGISRFFEPEIADCLSHIHKFWTDKGVFSGRESEFCDIDDTSMGMRLMRMHGYDVDPNVLRNFKQKDGKFSCYGGQMIESPSPIYNLYRASQLRFPGEEILEDAKRFAYDFLKEKLANNQILDKWVISKHLPDEIKLGLEMPWLATLPRVEAKYYIQYYAGSGDVWIGKTLYRMPEISNDTYHDLAKTDFKRCQAKHQFEWLYMQEWYESCGIEEFGISRKDLLLSYFLATASIFELERTNERIAWAKSQIIAKMITSFFNKETTSEEDKRALLNELGNINGLNDTNGAGREGGAGSIALATLTQFLEGFDRYTRHQLKNAWSVWLTQLQHGEADDAELLTNTLNICAGHIAFREEILAHNEYKALSNLTSKICRQLSFIQSEKEMGVEGEIAAKSSIKNKELEEDMQMLVKLVLEKYGGIDRNIKKAFLAVAKTYYYRAYHAADTIDTHMFKVLFEPVA
SEQ ID NO:3
SmCPS2opt,经优化的编码SmCPS2的cDNA
ATGGCAACTGTTGACGCACCTCAAGTCCATGATCACGATGGCACCACCGTTCACCAGGGTCACGACGCGGTGAAGAACATCGAGGACCCGATCGAATACATTCGTACCCTGCTGCGTACCACTGGTGATGGTCGCATCAGCGTCAGCCCGTATGACACGGCGTGGGTGGCGATGATTAAAGACGTCGAGGGTCGCGATGGCCCGCAATTTCCTTCTAGCCTGGAGTGGATTGTCCAAAATCAGCTGGAAGATGGCTCGTGGGGTGACCAGAAGCTGTTTTGTGTTTACGATCGCCTGGTTAATACCATCGCATGTGTGGTTGCGCTGCGTAGCTGGAATGTTCACGCTCATAAAGTCAAACGTGGCGTGACGTATATCAAGGAAAACGTGGATAAGCTGATGGAAGGCAACGAAGAACACATGACGTGTGGCTTCGAGGTTGTTTTTCCAGCCTTGCTGCAGAAAGCAAAGTCCCTGGGTATTGAGGATCTGCCGTACGACTCGCCGGCAGTGCAAGAAGTCTATCACGTCCGCGAGCAGAAGCTGAAACGCATCCCGCTGGAGATTATGCATAAGATTCCGACCTCTCTGCTGTTCTCTCTGGAAGGTCTGGAGAACCTGGATTGGGACAAACTGCTGAAGCTGCAGTCCGCTGACGGTAGCTTTCTGACCAGCCCGAGCAGCACGGCCTTTGCGTTTATGCAGACCAAAGATGAGAAGTGCTATCAATTCATCAAGAATACTATTGATACCTTCAACGGTGGCGCACCGCACACGTACCCAGTAGACGTTTTTGGTCGCCTGTGGGCGATTGACCGTTTGCAGCGTCTGGGTATCAGCCGTTTCTTCGAGCCGGAGATTGCGGACTGCTTGAGCCATATTCACAAATTCTGGACGGACAAAGGCGTGTTCAGCGGTCGTGAGAGCGAGTTCTGCGACATCGACGATACGAGCATGGGTATGCGTCTGATGCGTATGCACGGTTACGACGTGGACCCGAATGTGTTGCGCAACTTCAAGCAAAAAGATGGCAAGTTTAGCTGCTACGGTGGCCAAATGATTGAGAGCCCGAGCCCGATCTATAACTTATATCGTGCGAGCCAACTGCGTTTCCCGGGTGAAGAAATTCTGGAAGATGCGAAGCGTTTTGCGTATGACTTCCTGAAGGAAAAGCTCGCAAACAATCAAATCTTGGATAAATGGGTGATCAGCAAGCACTTGCCGGATGAGATTAAACTGGGTCTGGAGATGCCGTGGTTGGCCACCCTGCCGAGAGTTGAGGCGAAATACTATATTCAGTATTACGCGGGTAGCGGTGATGTTTGGATTGGCAAGACCCTGTACCGCATGCCGGAGATCAGCAATGATACCTATCATGACCTGGCCAAGACCGACTTCAAACGCTGTCAAGCGAAACATCAATTTGAATGGTTATACATGCAAGAGTGGTACGAAAGCTGCGGCATCGAAGAGTTCGGTATCTCCCGTAAAGATCTGCTGCTGTCTTACTTTCTGGCAACGGCCAGCATTTTCGAGCTGGAGCGTACCAATGAGCGTATTGCCTGGGCGAAATCACAAATCATTGCTAAGATGATTACGAGCTTTTTCAATAAAGAAACCACGTCCGAGGAAGATAAACGTGCTCTGCTGAATGAACTGGGCAACATCAACGGTCTGAATGACACCAACGGTGCCGGTCGTGAGGGTGGCGCAGGCAGCATTGCACTGGCCACGCTGACCCAGTTCCTGGAAGGTTTCGACCGCTACACCCGTCACCAGCTGAAGAACGCGTGGTCCGTCTGGCTGACCCAGCTGCAGCATGGTGAGGCAGACGACGCGGAGCTGCTGACCAACACGTTGAATATCTGCGCTGGCCATATCGCGTTTCGCGAAGAGATTCTGGCGCACAACGAGTACAAAGCCCTGAGCAATCTGACCTCTAAAATCTGTCGTCAGCTTAGCTTTATTCAGAGCGAGAAAGAAATGGGCGTGGAAGGTGAGATCGCGGCAAAATCCAGCATCAAGAACAAAGAACTGGAAGAAGATATGCAGATGTTGGTCAAGCTCGTCCTGGAGAAGTATGGTGGCATCGACCGTAATATCAAGAAAGCGTTTCTGGCCGTGGCGAAAACGTATTACTACCGCGCGTACCACGCGGCAGATACCATTGACACCCACATGTTTAAGGTTTTGTTTGAGCCGGTTGCTTAA
SEQ ID NO:4
全长香紫苏醇合酶
MSLAFNVGVTPFSGQRVGSRKEKFPVQGFPVTTPNRSRLIVNCSLTTIDFMAKMKENFKREDDKFPTTTTLRSEDIPSNLCIIDTLQRLGVDQFFQYEINTILDNTFRLWQEKHKVIYGNVTTHAMAFRLLRVKGYEVSSEELAPYGNQEAVSQQTNDLPMIIELYRAANERIYEEERSLEKILAWTTIFLNKQVQDNSIPDKKLHKLVEFYLRNYKGITIRLGARRNLELYDMTYYQALKSTNRFSNLCNEDFLVFAKQDFDIHEAQNQKGLQQLQRWYADCRLDTLNFGRDVVIIANYLASLIIGDHAFDYVRLAFAKTSVLVTIMDDFFDCHGSSQECDKIIELVKEWKENPDAEYGSEELEILFMALYNTVNELAERARVEQGRSVKEFLVKLWVEILSAFKIELDTWSNGTQQSFDEYISSSWLSNGSRLTGLLTMQFVGVKLSDEMLMSEECTDLARHVCMVGRLLNDVCSSEREREENIAGKSYSILLATEKDGRKVSEDEAIAEINEMVEYHWRKVLQIVYKKESILPRRCKDVFLEMAKGTFYAYGINDELTSPQQSKEDMKSFVF
SEQ ID NO:5
截短的香紫苏醇合酶(SsScS).
MAKMKENFKREDDKFPTTTTLRSEDIPSNLCIIDTLQRLGVDQFFQYEINTILDNTFRLWQEKHKVIYGNVTTHAMAFRLLRVKGYEVSSEELAPYGNQEAVSQQTNDLPMIIELYRAANERIYEEERSLEKILAWTTIFLNKQVQDNSIPDKKLHKLVEFYLRNYKGITIRLGARRNLELYDMTYYQALKSTNRFSNLCNEDFLVFAKQDFDIHEAQNQKGLQQLQRWYADCRLDTLNFGRDVVIIANYLASLIIGDHAFDYVRLAFAKTSVLVTIMDDFFDCHGSSQECDKIIELVKEWKENPDAEYGSEELEILFMALYNTVNELAERARVEQGRSVKEFLVKLWVEILSAFKIELDTWSNGTQQSFDEYISSSWLSNGSRLTGLLTMQFVGVKLSDEMLMSEECTDLARHVCMVGRLLNDVCSSEREREENIAGKSYSILLATEKDGRKVSEDEAIAEINEMVEYHWRKVLQIVYKKESILPRRCKDVFLEMAKGTFYAYGINDELTSPQQSKEDMKSFVF
SEQ ID NO:6
1132-2-5_opt,经优化的编码截短的香紫苏醇合酶的cDNA
ATGGCGAAAATGAAGGAGAACTTTAAACGCGAGGACGATAAATTCCCGACGACCACGACCCTGCGCAGCGAGGATATCCCGAGCAACCTGTGCATCATTGATACCCTGCAGCGCCTGGGTGTCGATCAGTTCTTCCAATACGAAATCAATACCATTCTGGACAATACTTTTCGTCTGTGGCAAGAGAAACACAAAGTGATCTACGGCAACGTTACCACCCACGCGATGGCGTTCCGTTTGTTGCGTGTCAAGGGCTACGAGGTTTCCAGCGAGGAACTGGCGCCGTACGGTAATCAGGAAGCAGTTAGCCAACAGACGAATGATCTGCCTATGATCATTGAGCTGTATCGCGCAGCAAATGAGCGTATCTACGAAGAGGAACGCAGCCTGGAAAAGATCCTGGCGTGGACCACGATCTTCCTGAACAAACAAGTTCAAGACAATTCTATTCCTGATAAGAAGCTGCATAAACTGGTCGAATTCTATCTGCGTAATTACAAGGGCATCACGATCCGTCTGGGCGCACGCCGTAACCTGGAGTTGTATGATATGACGTATTACCAGGCTCTGAAAAGCACCAATCGTTTCTCCAATCTGTGTAATGAGGATTTTCTGGTGTTCGCCAAGCAGGATTTTGACATCCACGAGGCGCAAAATCAAAAAGGTCTGCAACAACTGCAACGTTGGTACGCTGACTGTCGCCTGGACACCCTGAATTTCGGTCGCGACGTTGTCATTATTGCAAACTATCTGGCCAGCCTGATCATCGGTGATCACGCATTCGACTACGTCCGCCTGGCCTTCGCTAAGACCAGCGTTCTGGTGACCATTATGGATGATTTCTTCGATTGCCACGGTTCTAGCCAGGAATGCGACAAAATCATTGAGCTGGTGAAAGAGTGGAAAGAAAACCCTGATGCGGAATACGGTTCCGAAGAGTTGGAGATCCTGTTTATGGCCTTGTACAACACCGTGAATGAACTGGCCGAGCGTGCTCGTGTGGAGCAGGGCCGTTCTGTGAAGGAGTTTTTGGTCAAGTTGTGGGTGGAAATCCTGTCCGCGTTCAAGATCGAACTGGATACGTGGTCGAATGGTACGCAACAGAGCTTCGACGAATACATCAGCAGCAGCTGGCTGAGCAATGGCAGCCGTCTGACCGGTTTGCTGACCATGCAATTTGTGGGTGTTAAACTGTCCGATGAAATGCTGATGAGCGAAGAATGCACCGACCTGGCACGCCATGTGTGTATGGTGGGTCGCCTGCTGAACGACGTCTGCAGCAGCGAACGTGAGCGCGAGGAAAACATTGCAGGCAAGAGCTACAGCATCTTGTTGGCCACCGAGAAAGATGGTCGCAAAGTGTCTGAGGACGAAGCAATTGCAGAGATTAATGAAATGGTCGAGTACCACTGGCGTAAGGTTTTGCAGATTGTGTATAAGAAAGAGAGCATCTTGCCGCGTCGCTGTAAGGATGTTTTCTTGGAGATGGCGAAGGGCACGTTCTATGCGTACGGCATTAACGACGAGCTGACGAGCCCGCAACAATCGAAAGAGGACATGAAGAGCTTCGTGTTCTGAGGTAC
SEQ ID NO:7
来自成团泛菌(Pantoea agglomerans)的GGPP合酶
MVSGSKAGVSPHREIEVMRQSIDDHLAGLLPETDSQDIVSLAMREGVMAPGKRIRPLLMLLAARDLRYQGSMPTLLDLACAVELTHTASLMLDDMPCMDNAELRRGQPTTHKKFGESVAILASVGLLSKAFGLIAATGDLPGERRAQAVNELSTAVGVQGLVLGQFRDLNDAALDRTPDAILSTNHLKTGILFSAMLQIVAIASASSPSTRETLHAFALDFGQAFQLLDDLRDDHPETGKDRNKDAGKSTLVNRLGADAARQKLREHIDSADKHLTFACPQGGAIRQFMHLWFGHHLADWSPVMKIA
SEQ ID NO:8
CrtEopt,经优化的编码来自成团泛菌(Pantoea agglomerans)的GGPP合酶的cDNA
ATGGTTTCTGGTTCGAAAGCAGGAGTATCACCTCATAGGGAAATCGAAGTCATGAGACAGTCCATTGATGACCACTTAGCAGGATTGTTGCCAGAAACAGATTCCCAGGATATCGTTAGCCTTGCTATGAGAGAAGGTGTTATGGCACCTGGTAAACGTATCAGACCTTTGCTGATGTTACTTGCTGCAAGAGACCTGAGATATCAGGGTTCTATGCCTACACTACTGGATCTAGCTTGTGCTGTTGAACTGACACATACTGCTTCCTTGATGCTGGATGACATGCCTTGTATGGACAATGCGGAACTTAGAAGAGGTCAACCAACAACCCACAAGAAATTCGGAGAATCTGTTGCCATTTTGGCTTCTGTAGGTCTGTTGTCGAAAGCTTTTGGCTTGATTGCTGCAACTGGTGATCTTCCAGGTGAAAGGAGAGCACAAGCTGTAAACGAGCTATCTACTGCAGTTGGTGTTCAAGGTCTAGTCTTAGGACAGTTCAGAGATTTGAATGACGCAGCTTTGGACAGAACTCCTGATGCTATCCTGTCTACGAACCATCTGAAGACTGGCATCTTGTTCTCAGCTATGTTGCAAATCGTAGCCATTGCTTCTGCTTCTTCACCATCTACTAGGGAAACGTTACACGCATTCGCATTGGACTTTGGTCAAGCCTTTCAACTGCTAGACGATTTGAGGGATGATCATCCAGAGACAGGTAAAGACCGTAACAAAGACGCTGGTAAAAGCACTCTAGTCAACAGATTGGGTGCTGATGCAGCTAGACAGAAACTGAGAGAGCACATTGACTCTGCTGACAAACACCTGACATTTGCATGTCCACAAGGAGGTGCTATAAGGCAGTTTATGCACCTATGGTTTGGACACCATCTTGCTGATTGGTCTCCAGTGATGAAGATCGCCTAA
序列表
<110> 弗门尼舍有限公司(Firmenich S.A.)
<120> 迈诺醇的生产
<130> P230261WO
<150> US 62/187,236
<151> 2015-06-30
<150> GB 1601249.4
<151> 2016-01-22
<160> 10
<170> PatentIn version 3.5
<210> 1
<211> 793
<212> PRT
<213> 丹参(Salvia miltiorrhiza)
<400> 1
Met Ala Ser Leu Ser Ser Thr Ile Leu Ser Arg Ser Pro Ala Ala Arg
1 5 10 15
Arg Arg Ile Thr Pro Ala Ser Ala Lys Leu His Arg Pro Glu Cys Phe
20 25 30
Ala Thr Ser Ala Trp Met Gly Ser Ser Ser Lys Asn Leu Ser Leu Ser
35 40 45
Tyr Gln Leu Asn His Lys Lys Ile Ser Val Ala Thr Val Asp Ala Pro
50 55 60
Gln Val His Asp His Asp Gly Thr Thr Val His Gln Gly His Asp Ala
65 70 75 80
Val Lys Asn Ile Glu Asp Pro Ile Glu Tyr Ile Arg Thr Leu Leu Arg
85 90 95
Thr Thr Gly Asp Gly Arg Ile Ser Val Ser Pro Tyr Asp Thr Ala Trp
100 105 110
Val Ala Met Ile Lys Asp Val Glu Gly Arg Asp Gly Pro Gln Phe Pro
115 120 125
Ser Ser Leu Glu Trp Ile Val Gln Asn Gln Leu Glu Asp Gly Ser Trp
130 135 140
Gly Asp Gln Lys Leu Phe Cys Val Tyr Asp Arg Leu Val Asn Thr Ile
145 150 155 160
Ala Cys Val Val Ala Leu Arg Ser Trp Asn Val His Ala His Lys Val
165 170 175
Lys Arg Gly Val Thr Tyr Ile Lys Glu Asn Val Asp Lys Leu Met Glu
180 185 190
Gly Asn Glu Glu His Met Thr Cys Gly Phe Glu Val Val Phe Pro Ala
195 200 205
Leu Leu Gln Lys Ala Lys Ser Leu Gly Ile Glu Asp Leu Pro Tyr Asp
210 215 220
Ser Pro Ala Val Gln Glu Val Tyr His Val Arg Glu Gln Lys Leu Lys
225 230 235 240
Arg Ile Pro Leu Glu Ile Met His Lys Ile Pro Thr Ser Leu Leu Phe
245 250 255
Ser Leu Glu Gly Leu Glu Asn Leu Asp Trp Asp Lys Leu Leu Lys Leu
260 265 270
Gln Ser Ala Asp Gly Ser Phe Leu Thr Ser Pro Ser Ser Thr Ala Phe
275 280 285
Ala Phe Met Gln Thr Lys Asp Glu Lys Cys Tyr Gln Phe Ile Lys Asn
290 295 300
Thr Ile Asp Thr Phe Asn Gly Gly Ala Pro His Thr Tyr Pro Val Asp
305 310 315 320
Val Phe Gly Arg Leu Trp Ala Ile Asp Arg Leu Gln Arg Leu Gly Ile
325 330 335
Ser Arg Phe Phe Glu Pro Glu Ile Ala Asp Cys Leu Ser His Ile His
340 345 350
Lys Phe Trp Thr Asp Lys Gly Val Phe Ser Gly Arg Glu Ser Glu Phe
355 360 365
Cys Asp Ile Asp Asp Thr Ser Met Gly Met Arg Leu Met Arg Met His
370 375 380
Gly Tyr Asp Val Asp Pro Asn Val Leu Arg Asn Phe Lys Gln Lys Asp
385 390 395 400
Gly Lys Phe Ser Cys Tyr Gly Gly Gln Met Ile Glu Ser Pro Ser Pro
405 410 415
Ile Tyr Asn Leu Tyr Arg Ala Ser Gln Leu Arg Phe Pro Gly Glu Glu
420 425 430
Ile Leu Glu Asp Ala Lys Arg Phe Ala Tyr Asp Phe Leu Lys Glu Lys
435 440 445
Leu Ala Asn Asn Gln Ile Leu Asp Lys Trp Val Ile Ser Lys His Leu
450 455 460
Pro Asp Glu Ile Lys Leu Gly Leu Glu Met Pro Trp Leu Ala Thr Leu
465 470 475 480
Pro Arg Val Glu Ala Lys Tyr Tyr Ile Gln Tyr Tyr Ala Gly Ser Gly
485 490 495
Asp Val Trp Ile Gly Lys Thr Leu Tyr Arg Met Pro Glu Ile Ser Asn
500 505 510
Asp Thr Tyr His Asp Leu Ala Lys Thr Asp Phe Lys Arg Cys Gln Ala
515 520 525
Lys His Gln Phe Glu Trp Leu Tyr Met Gln Glu Trp Tyr Glu Ser Cys
530 535 540
Gly Ile Glu Glu Phe Gly Ile Ser Arg Lys Asp Leu Leu Leu Ser Tyr
545 550 555 560
Phe Leu Ala Thr Ala Ser Ile Phe Glu Leu Glu Arg Thr Asn Glu Arg
565 570 575
Ile Ala Trp Ala Lys Ser Gln Ile Ile Ala Lys Met Ile Thr Ser Phe
580 585 590
Phe Asn Lys Glu Thr Thr Ser Glu Glu Asp Lys Arg Ala Leu Leu Asn
595 600 605
Glu Leu Gly Asn Ile Asn Gly Leu Asn Asp Thr Asn Gly Ala Gly Arg
610 615 620
Glu Gly Gly Ala Gly Ser Ile Ala Leu Ala Thr Leu Thr Gln Phe Leu
625 630 635 640
Glu Gly Phe Asp Arg Tyr Thr Arg His Gln Leu Lys Asn Ala Trp Ser
645 650 655
Val Trp Leu Thr Gln Leu Gln His Gly Glu Ala Asp Asp Ala Glu Leu
660 665 670
Leu Thr Asn Thr Leu Asn Ile Cys Ala Gly His Ile Ala Phe Arg Glu
675 680 685
Glu Ile Leu Ala His Asn Glu Tyr Lys Ala Leu Ser Asn Leu Thr Ser
690 695 700
Lys Ile Cys Arg Gln Leu Ser Phe Ile Gln Ser Glu Lys Glu Met Gly
705 710 715 720
Val Glu Gly Glu Ile Ala Ala Lys Ser Ser Ile Lys Asn Lys Glu Leu
725 730 735
Glu Glu Asp Met Gln Met Leu Val Lys Leu Val Leu Glu Lys Tyr Gly
740 745 750
Gly Ile Asp Arg Asn Ile Lys Lys Ala Phe Leu Ala Val Ala Lys Thr
755 760 765
Tyr Tyr Tyr Arg Ala Tyr His Ala Ala Asp Thr Ile Asp Thr His Met
770 775 780
Phe Lys Val Leu Phe Glu Pro Val Ala
785 790
<210> 2
<211> 736
<212> PRT
<213> 人工序列(Artificial sequence)
<223> 截短的蛋白(Truncated protein)
<400> 2
Met Ala Thr Val Asp Ala Pro Gln Val His Asp His Asp Gly Thr Thr
1 5 10 15
Val His Gln Gly His Asp Ala Val Lys Asn Ile Glu Asp Pro Ile Glu
20 25 30
Tyr Ile Arg Thr Leu Leu Arg Thr Thr Gly Asp Gly Arg Ile Ser Val
35 40 45
Ser Pro Tyr Asp Thr Ala Trp Val Ala Met Ile Lys Asp Val Glu Gly
50 55 60
Arg Asp Gly Pro Gln Phe Pro Ser Ser Leu Glu Trp Ile Val Gln Asn
65 70 75 80
Gln Leu Glu Asp Gly Ser Trp Gly Asp Gln Lys Leu Phe Cys Val Tyr
85 90 95
Asp Arg Leu Val Asn Thr Ile Ala Cys Val Val Ala Leu Arg Ser Trp
100 105 110
Asn Val His Ala His Lys Val Lys Arg Gly Val Thr Tyr Ile Lys Glu
115 120 125
Asn Val Asp Lys Leu Met Glu Gly Asn Glu Glu His Met Thr Cys Gly
130 135 140
Phe Glu Val Val Phe Pro Ala Leu Leu Gln Lys Ala Lys Ser Leu Gly
145 150 155 160
Ile Glu Asp Leu Pro Tyr Asp Ser Pro Ala Val Gln Glu Val Tyr His
165 170 175
Val Arg Glu Gln Lys Leu Lys Arg Ile Pro Leu Glu Ile Met His Lys
180 185 190
Ile Pro Thr Ser Leu Leu Phe Ser Leu Glu Gly Leu Glu Asn Leu Asp
195 200 205
Trp Asp Lys Leu Leu Lys Leu Gln Ser Ala Asp Gly Ser Phe Leu Thr
210 215 220
Ser Pro Ser Ser Thr Ala Phe Ala Phe Met Gln Thr Lys Asp Glu Lys
225 230 235 240
Cys Tyr Gln Phe Ile Lys Asn Thr Ile Asp Thr Phe Asn Gly Gly Ala
245 250 255
Pro His Thr Tyr Pro Val Asp Val Phe Gly Arg Leu Trp Ala Ile Asp
260 265 270
Arg Leu Gln Arg Leu Gly Ile Ser Arg Phe Phe Glu Pro Glu Ile Ala
275 280 285
Asp Cys Leu Ser His Ile His Lys Phe Trp Thr Asp Lys Gly Val Phe
290 295 300
Ser Gly Arg Glu Ser Glu Phe Cys Asp Ile Asp Asp Thr Ser Met Gly
305 310 315 320
Met Arg Leu Met Arg Met His Gly Tyr Asp Val Asp Pro Asn Val Leu
325 330 335
Arg Asn Phe Lys Gln Lys Asp Gly Lys Phe Ser Cys Tyr Gly Gly Gln
340 345 350
Met Ile Glu Ser Pro Ser Pro Ile Tyr Asn Leu Tyr Arg Ala Ser Gln
355 360 365
Leu Arg Phe Pro Gly Glu Glu Ile Leu Glu Asp Ala Lys Arg Phe Ala
370 375 380
Tyr Asp Phe Leu Lys Glu Lys Leu Ala Asn Asn Gln Ile Leu Asp Lys
385 390 395 400
Trp Val Ile Ser Lys His Leu Pro Asp Glu Ile Lys Leu Gly Leu Glu
405 410 415
Met Pro Trp Leu Ala Thr Leu Pro Arg Val Glu Ala Lys Tyr Tyr Ile
420 425 430
Gln Tyr Tyr Ala Gly Ser Gly Asp Val Trp Ile Gly Lys Thr Leu Tyr
435 440 445
Arg Met Pro Glu Ile Ser Asn Asp Thr Tyr His Asp Leu Ala Lys Thr
450 455 460
Asp Phe Lys Arg Cys Gln Ala Lys His Gln Phe Glu Trp Leu Tyr Met
465 470 475 480
Gln Glu Trp Tyr Glu Ser Cys Gly Ile Glu Glu Phe Gly Ile Ser Arg
485 490 495
Lys Asp Leu Leu Leu Ser Tyr Phe Leu Ala Thr Ala Ser Ile Phe Glu
500 505 510
Leu Glu Arg Thr Asn Glu Arg Ile Ala Trp Ala Lys Ser Gln Ile Ile
515 520 525
Ala Lys Met Ile Thr Ser Phe Phe Asn Lys Glu Thr Thr Ser Glu Glu
530 535 540
Asp Lys Arg Ala Leu Leu Asn Glu Leu Gly Asn Ile Asn Gly Leu Asn
545 550 555 560
Asp Thr Asn Gly Ala Gly Arg Glu Gly Gly Ala Gly Ser Ile Ala Leu
565 570 575
Ala Thr Leu Thr Gln Phe Leu Glu Gly Phe Asp Arg Tyr Thr Arg His
580 585 590
Gln Leu Lys Asn Ala Trp Ser Val Trp Leu Thr Gln Leu Gln His Gly
595 600 605
Glu Ala Asp Asp Ala Glu Leu Leu Thr Asn Thr Leu Asn Ile Cys Ala
610 615 620
Gly His Ile Ala Phe Arg Glu Glu Ile Leu Ala His Asn Glu Tyr Lys
625 630 635 640
Ala Leu Ser Asn Leu Thr Ser Lys Ile Cys Arg Gln Leu Ser Phe Ile
645 650 655
Gln Ser Glu Lys Glu Met Gly Val Glu Gly Glu Ile Ala Ala Lys Ser
660 665 670
Ser Ile Lys Asn Lys Glu Leu Glu Glu Asp Met Gln Met Leu Val Lys
675 680 685
Leu Val Leu Glu Lys Tyr Gly Gly Ile Asp Arg Asn Ile Lys Lys Ala
690 695 700
Phe Leu Ala Val Ala Lys Thr Tyr Tyr Tyr Arg Ala Tyr His Ala Ala
705 710 715 720
Asp Thr Ile Asp Thr His Met Phe Lys Val Leu Phe Glu Pro Val Ala
725 730 735
<210> 3
<211> 2211
<212> DNA
<213> 人工序列(Artificial sequence)
<223> 经优化的DNA序列(Optimised DNA sequence)
<400> 3
atggcaactg ttgacgcacc tcaagtccat gatcacgatg gcaccaccgt tcaccagggt 60
cacgacgcgg tgaagaacat cgaggacccg atcgaataca ttcgtaccct gctgcgtacc 120
actggtgatg gtcgcatcag cgtcagcccg tatgacacgg cgtgggtggc gatgattaaa 180
gacgtcgagg gtcgcgatgg cccgcaattt ccttctagcc tggagtggat tgtccaaaat 240
cagctggaag atggctcgtg gggtgaccag aagctgtttt gtgtttacga tcgcctggtt 300
aataccatcg catgtgtggt tgcgctgcgt agctggaatg ttcacgctca taaagtcaaa 360
cgtggcgtga cgtatatcaa ggaaaacgtg gataagctga tggaaggcaa cgaagaacac 420
atgacgtgtg gcttcgaggt tgtttttcca gccttgctgc agaaagcaaa gtccctgggt 480
attgaggatc tgccgtacga ctcgccggca gtgcaagaag tctatcacgt ccgcgagcag 540
aagctgaaac gcatcccgct ggagattatg cataagattc cgacctctct gctgttctct 600
ctggaaggtc tggagaacct ggattgggac aaactgctga agctgcagtc cgctgacggt 660
agctttctga ccagcccgag cagcacggcc tttgcgttta tgcagaccaa agatgagaag 720
tgctatcaat tcatcaagaa tactattgat accttcaacg gtggcgcacc gcacacgtac 780
ccagtagacg tttttggtcg cctgtgggcg attgaccgtt tgcagcgtct gggtatcagc 840
cgtttcttcg agccggagat tgcggactgc ttgagccata ttcacaaatt ctggacggac 900
aaaggcgtgt tcagcggtcg tgagagcgag ttctgcgaca tcgacgatac gagcatgggt 960
atgcgtctga tgcgtatgca cggttacgac gtggacccga atgtgttgcg caacttcaag 1020
caaaaagatg gcaagtttag ctgctacggt ggccaaatga ttgagagccc gagcccgatc 1080
tataacttat atcgtgcgag ccaactgcgt ttcccgggtg aagaaattct ggaagatgcg 1140
aagcgttttg cgtatgactt cctgaaggaa aagctcgcaa acaatcaaat cttggataaa 1200
tgggtgatca gcaagcactt gccggatgag attaaactgg gtctggagat gccgtggttg 1260
gccaccctgc cgagagttga ggcgaaatac tatattcagt attacgcggg tagcggtgat 1320
gtttggattg gcaagaccct gtaccgcatg ccggagatca gcaatgatac ctatcatgac 1380
ctggccaaga ccgacttcaa acgctgtcaa gcgaaacatc aatttgaatg gttatacatg 1440
caagagtggt acgaaagctg cggcatcgaa gagttcggta tctcccgtaa agatctgctg 1500
ctgtcttact ttctggcaac ggccagcatt ttcgagctgg agcgtaccaa tgagcgtatt 1560
gcctgggcga aatcacaaat cattgctaag atgattacga gctttttcaa taaagaaacc 1620
acgtccgagg aagataaacg tgctctgctg aatgaactgg gcaacatcaa cggtctgaat 1680
gacaccaacg gtgccggtcg tgagggtggc gcaggcagca ttgcactggc cacgctgacc 1740
cagttcctgg aaggtttcga ccgctacacc cgtcaccagc tgaagaacgc gtggtccgtc 1800
tggctgaccc agctgcagca tggtgaggca gacgacgcgg agctgctgac caacacgttg 1860
aatatctgcg ctggccatat cgcgtttcgc gaagagattc tggcgcacaa cgagtacaaa 1920
gccctgagca atctgacctc taaaatctgt cgtcagctta gctttattca gagcgagaaa 1980
gaaatgggcg tggaaggtga gatcgcggca aaatccagca tcaagaacaa agaactggaa 2040
gaagatatgc agatgttggt caagctcgtc ctggagaagt atggtggcat cgaccgtaat 2100
atcaagaaag cgtttctggc cgtggcgaaa acgtattact accgcgcgta ccacgcggca 2160
gataccattg acacccacat gtttaaggtt ttgtttgagc cggttgctta a 2211
<210> 4
<211> 575
<212> PRT
<213> 南欧丹参(Salvia sclarea)
<400> 4
Met Ser Leu Ala Phe Asn Val Gly Val Thr Pro Phe Ser Gly Gln Arg
1 5 10 15
Val Gly Ser Arg Lys Glu Lys Phe Pro Val Gln Gly Phe Pro Val Thr
20 25 30
Thr Pro Asn Arg Ser Arg Leu Ile Val Asn Cys Ser Leu Thr Thr Ile
35 40 45
Asp Phe Met Ala Lys Met Lys Glu Asn Phe Lys Arg Glu Asp Asp Lys
50 55 60
Phe Pro Thr Thr Thr Thr Leu Arg Ser Glu Asp Ile Pro Ser Asn Leu
65 70 75 80
Cys Ile Ile Asp Thr Leu Gln Arg Leu Gly Val Asp Gln Phe Phe Gln
85 90 95
Tyr Glu Ile Asn Thr Ile Leu Asp Asn Thr Phe Arg Leu Trp Gln Glu
100 105 110
Lys His Lys Val Ile Tyr Gly Asn Val Thr Thr His Ala Met Ala Phe
115 120 125
Arg Leu Leu Arg Val Lys Gly Tyr Glu Val Ser Ser Glu Glu Leu Ala
130 135 140
Pro Tyr Gly Asn Gln Glu Ala Val Ser Gln Gln Thr Asn Asp Leu Pro
145 150 155 160
Met Ile Ile Glu Leu Tyr Arg Ala Ala Asn Glu Arg Ile Tyr Glu Glu
165 170 175
Glu Arg Ser Leu Glu Lys Ile Leu Ala Trp Thr Thr Ile Phe Leu Asn
180 185 190
Lys Gln Val Gln Asp Asn Ser Ile Pro Asp Lys Lys Leu His Lys Leu
195 200 205
Val Glu Phe Tyr Leu Arg Asn Tyr Lys Gly Ile Thr Ile Arg Leu Gly
210 215 220
Ala Arg Arg Asn Leu Glu Leu Tyr Asp Met Thr Tyr Tyr Gln Ala Leu
225 230 235 240
Lys Ser Thr Asn Arg Phe Ser Asn Leu Cys Asn Glu Asp Phe Leu Val
245 250 255
Phe Ala Lys Gln Asp Phe Asp Ile His Glu Ala Gln Asn Gln Lys Gly
260 265 270
Leu Gln Gln Leu Gln Arg Trp Tyr Ala Asp Cys Arg Leu Asp Thr Leu
275 280 285
Asn Phe Gly Arg Asp Val Val Ile Ile Ala Asn Tyr Leu Ala Ser Leu
290 295 300
Ile Ile Gly Asp His Ala Phe Asp Tyr Val Arg Leu Ala Phe Ala Lys
305 310 315 320
Thr Ser Val Leu Val Thr Ile Met Asp Asp Phe Phe Asp Cys His Gly
325 330 335
Ser Ser Gln Glu Cys Asp Lys Ile Ile Glu Leu Val Lys Glu Trp Lys
340 345 350
Glu Asn Pro Asp Ala Glu Tyr Gly Ser Glu Glu Leu Glu Ile Leu Phe
355 360 365
Met Ala Leu Tyr Asn Thr Val Asn Glu Leu Ala Glu Arg Ala Arg Val
370 375 380
Glu Gln Gly Arg Ser Val Lys Glu Phe Leu Val Lys Leu Trp Val Glu
385 390 395 400
Ile Leu Ser Ala Phe Lys Ile Glu Leu Asp Thr Trp Ser Asn Gly Thr
405 410 415
Gln Gln Ser Phe Asp Glu Tyr Ile Ser Ser Ser Trp Leu Ser Asn Gly
420 425 430
Ser Arg Leu Thr Gly Leu Leu Thr Met Gln Phe Val Gly Val Lys Leu
435 440 445
Ser Asp Glu Met Leu Met Ser Glu Glu Cys Thr Asp Leu Ala Arg His
450 455 460
Val Cys Met Val Gly Arg Leu Leu Asn Asp Val Cys Ser Ser Glu Arg
465 470 475 480
Glu Arg Glu Glu Asn Ile Ala Gly Lys Ser Tyr Ser Ile Leu Leu Ala
485 490 495
Thr Glu Lys Asp Gly Arg Lys Val Ser Glu Asp Glu Ala Ile Ala Glu
500 505 510
Ile Asn Glu Met Val Glu Tyr His Trp Arg Lys Val Leu Gln Ile Val
515 520 525
Tyr Lys Lys Glu Ser Ile Leu Pro Arg Arg Cys Lys Asp Val Phe Leu
530 535 540
Glu Met Ala Lys Gly Thr Phe Tyr Ala Tyr Gly Ile Asn Asp Glu Leu
545 550 555 560
Thr Ser Pro Gln Gln Ser Lys Glu Asp Met Lys Ser Phe Val Phe
565 570 575
<210> 5
<211> 525
<212> PRT
<213> 人工序列(Artificial sequence)
<223> 截短的蛋白(Truncated protein)
<400> 5
Met Ala Lys Met Lys Glu Asn Phe Lys Arg Glu Asp Asp Lys Phe Pro
1 5 10 15
Thr Thr Thr Thr Leu Arg Ser Glu Asp Ile Pro Ser Asn Leu Cys Ile
20 25 30
Ile Asp Thr Leu Gln Arg Leu Gly Val Asp Gln Phe Phe Gln Tyr Glu
35 40 45
Ile Asn Thr Ile Leu Asp Asn Thr Phe Arg Leu Trp Gln Glu Lys His
50 55 60
Lys Val Ile Tyr Gly Asn Val Thr Thr His Ala Met Ala Phe Arg Leu
65 70 75 80
Leu Arg Val Lys Gly Tyr Glu Val Ser Ser Glu Glu Leu Ala Pro Tyr
85 90 95
Gly Asn Gln Glu Ala Val Ser Gln Gln Thr Asn Asp Leu Pro Met Ile
100 105 110
Ile Glu Leu Tyr Arg Ala Ala Asn Glu Arg Ile Tyr Glu Glu Glu Arg
115 120 125
Ser Leu Glu Lys Ile Leu Ala Trp Thr Thr Ile Phe Leu Asn Lys Gln
130 135 140
Val Gln Asp Asn Ser Ile Pro Asp Lys Lys Leu His Lys Leu Val Glu
145 150 155 160
Phe Tyr Leu Arg Asn Tyr Lys Gly Ile Thr Ile Arg Leu Gly Ala Arg
165 170 175
Arg Asn Leu Glu Leu Tyr Asp Met Thr Tyr Tyr Gln Ala Leu Lys Ser
180 185 190
Thr Asn Arg Phe Ser Asn Leu Cys Asn Glu Asp Phe Leu Val Phe Ala
195 200 205
Lys Gln Asp Phe Asp Ile His Glu Ala Gln Asn Gln Lys Gly Leu Gln
210 215 220
Gln Leu Gln Arg Trp Tyr Ala Asp Cys Arg Leu Asp Thr Leu Asn Phe
225 230 235 240
Gly Arg Asp Val Val Ile Ile Ala Asn Tyr Leu Ala Ser Leu Ile Ile
245 250 255
Gly Asp His Ala Phe Asp Tyr Val Arg Leu Ala Phe Ala Lys Thr Ser
260 265 270
Val Leu Val Thr Ile Met Asp Asp Phe Phe Asp Cys His Gly Ser Ser
275 280 285
Gln Glu Cys Asp Lys Ile Ile Glu Leu Val Lys Glu Trp Lys Glu Asn
290 295 300
Pro Asp Ala Glu Tyr Gly Ser Glu Glu Leu Glu Ile Leu Phe Met Ala
305 310 315 320
Leu Tyr Asn Thr Val Asn Glu Leu Ala Glu Arg Ala Arg Val Glu Gln
325 330 335
Gly Arg Ser Val Lys Glu Phe Leu Val Lys Leu Trp Val Glu Ile Leu
340 345 350
Ser Ala Phe Lys Ile Glu Leu Asp Thr Trp Ser Asn Gly Thr Gln Gln
355 360 365
Ser Phe Asp Glu Tyr Ile Ser Ser Ser Trp Leu Ser Asn Gly Ser Arg
370 375 380
Leu Thr Gly Leu Leu Thr Met Gln Phe Val Gly Val Lys Leu Ser Asp
385 390 395 400
Glu Met Leu Met Ser Glu Glu Cys Thr Asp Leu Ala Arg His Val Cys
405 410 415
Met Val Gly Arg Leu Leu Asn Asp Val Cys Ser Ser Glu Arg Glu Arg
420 425 430
Glu Glu Asn Ile Ala Gly Lys Ser Tyr Ser Ile Leu Leu Ala Thr Glu
435 440 445
Lys Asp Gly Arg Lys Val Ser Glu Asp Glu Ala Ile Ala Glu Ile Asn
450 455 460
Glu Met Val Glu Tyr His Trp Arg Lys Val Leu Gln Ile Val Tyr Lys
465 470 475 480
Lys Glu Ser Ile Leu Pro Arg Arg Cys Lys Asp Val Phe Leu Glu Met
485 490 495
Ala Lys Gly Thr Phe Tyr Ala Tyr Gly Ile Asn Asp Glu Leu Thr Ser
500 505 510
Pro Gln Gln Ser Lys Glu Asp Met Lys Ser Phe Val Phe
515 520 525
<210> 6
<211> 1583
<212> DNA
<213> 人工序列(Artificial sequence)
<223> 经优化的DNA序列(Optimised DNA sequence)
<400> 6
atggcgaaaa tgaaggagaa ctttaaacgc gaggacgata aattcccgac gaccacgacc 60
ctgcgcagcg aggatatccc gagcaacctg tgcatcattg ataccctgca gcgcctgggt 120
gtcgatcagt tcttccaata cgaaatcaat accattctgg acaatacttt tcgtctgtgg 180
caagagaaac acaaagtgat ctacggcaac gttaccaccc acgcgatggc gttccgtttg 240
ttgcgtgtca agggctacga ggtttccagc gaggaactgg cgccgtacgg taatcaggaa 300
gcagttagcc aacagacgaa tgatctgcct atgatcattg agctgtatcg cgcagcaaat 360
gagcgtatct acgaagagga acgcagcctg gaaaagatcc tggcgtggac cacgatcttc 420
ctgaacaaac aagttcaaga caattctatt cctgataaga agctgcataa actggtcgaa 480
ttctatctgc gtaattacaa gggcatcacg atccgtctgg gcgcacgccg taacctggag 540
ttgtatgata tgacgtatta ccaggctctg aaaagcacca atcgtttctc caatctgtgt 600
aatgaggatt ttctggtgtt cgccaagcag gattttgaca tccacgaggc gcaaaatcaa 660
aaaggtctgc aacaactgca acgttggtac gctgactgtc gcctggacac cctgaatttc 720
ggtcgcgacg ttgtcattat tgcaaactat ctggccagcc tgatcatcgg tgatcacgca 780
ttcgactacg tccgcctggc cttcgctaag accagcgttc tggtgaccat tatggatgat 840
ttcttcgatt gccacggttc tagccaggaa tgcgacaaaa tcattgagct ggtgaaagag 900
tggaaagaaa accctgatgc ggaatacggt tccgaagagt tggagatcct gtttatggcc 960
ttgtacaaca ccgtgaatga actggccgag cgtgctcgtg tggagcaggg ccgttctgtg 1020
aaggagtttt tggtcaagtt gtgggtggaa atcctgtccg cgttcaagat cgaactggat 1080
acgtggtcga atggtacgca acagagcttc gacgaataca tcagcagcag ctggctgagc 1140
aatggcagcc gtctgaccgg tttgctgacc atgcaatttg tgggtgttaa actgtccgat 1200
gaaatgctga tgagcgaaga atgcaccgac ctggcacgcc atgtgtgtat ggtgggtcgc 1260
ctgctgaacg acgtctgcag cagcgaacgt gagcgcgagg aaaacattgc aggcaagagc 1320
tacagcatct tgttggccac cgagaaagat ggtcgcaaag tgtctgagga cgaagcaatt 1380
gcagagatta atgaaatggt cgagtaccac tggcgtaagg ttttgcagat tgtgtataag 1440
aaagagagca tcttgccgcg tcgctgtaag gatgttttct tggagatggc gaagggcacg 1500
ttctatgcgt acggcattaa cgacgagctg acgagcccgc aacaatcgaa agaggacatg 1560
aagagcttcg tgttctgagg tac 1583
<210> 7
<211> 307
<212> PRT
<213> 成团泛菌(Pantoea agglomerans)
<400> 7
Met Val Ser Gly Ser Lys Ala Gly Val Ser Pro His Arg Glu Ile Glu
1 5 10 15
Val Met Arg Gln Ser Ile Asp Asp His Leu Ala Gly Leu Leu Pro Glu
20 25 30
Thr Asp Ser Gln Asp Ile Val Ser Leu Ala Met Arg Glu Gly Val Met
35 40 45
Ala Pro Gly Lys Arg Ile Arg Pro Leu Leu Met Leu Leu Ala Ala Arg
50 55 60
Asp Leu Arg Tyr Gln Gly Ser Met Pro Thr Leu Leu Asp Leu Ala Cys
65 70 75 80
Ala Val Glu Leu Thr His Thr Ala Ser Leu Met Leu Asp Asp Met Pro
85 90 95
Cys Met Asp Asn Ala Glu Leu Arg Arg Gly Gln Pro Thr Thr His Lys
100 105 110
Lys Phe Gly Glu Ser Val Ala Ile Leu Ala Ser Val Gly Leu Leu Ser
115 120 125
Lys Ala Phe Gly Leu Ile Ala Ala Thr Gly Asp Leu Pro Gly Glu Arg
130 135 140
Arg Ala Gln Ala Val Asn Glu Leu Ser Thr Ala Val Gly Val Gln Gly
145 150 155 160
Leu Val Leu Gly Gln Phe Arg Asp Leu Asn Asp Ala Ala Leu Asp Arg
165 170 175
Thr Pro Asp Ala Ile Leu Ser Thr Asn His Leu Lys Thr Gly Ile Leu
180 185 190
Phe Ser Ala Met Leu Gln Ile Val Ala Ile Ala Ser Ala Ser Ser Pro
195 200 205
Ser Thr Arg Glu Thr Leu His Ala Phe Ala Leu Asp Phe Gly Gln Ala
210 215 220
Phe Gln Leu Leu Asp Asp Leu Arg Asp Asp His Pro Glu Thr Gly Lys
225 230 235 240
Asp Arg Asn Lys Asp Ala Gly Lys Ser Thr Leu Val Asn Arg Leu Gly
245 250 255
Ala Asp Ala Ala Arg Gln Lys Leu Arg Glu His Ile Asp Ser Ala Asp
260 265 270
Lys His Leu Thr Phe Ala Cys Pro Gln Gly Gly Ala Ile Arg Gln Phe
275 280 285
Met His Leu Trp Phe Gly His His Leu Ala Asp Trp Ser Pro Val Met
290 295 300
Lys Ile Ala
305
<210> 8
<211> 924
<212> DNA
<213> 人工序列(Artificial sequence)
<223> 经优化的DNA序列(Optimised DNA sequence)
<400> 8
atggtttctg gttcgaaagc aggagtatca cctcataggg aaatcgaagt catgagacag 60
tccattgatg accacttagc aggattgttg ccagaaacag attcccagga tatcgttagc 120
cttgctatga gagaaggtgt tatggcacct ggtaaacgta tcagaccttt gctgatgtta 180
cttgctgcaa gagacctgag atatcagggt tctatgccta cactactgga tctagcttgt 240
gctgttgaac tgacacatac tgcttccttg atgctggatg acatgccttg tatggacaat 300
gcggaactta gaagaggtca accaacaacc cacaagaaat tcggagaatc tgttgccatt 360
ttggcttctg taggtctgtt gtcgaaagct tttggcttga ttgctgcaac tggtgatctt 420
ccaggtgaaa ggagagcaca agctgtaaac gagctatcta ctgcagttgg tgttcaaggt 480
ctagtcttag gacagttcag agatttgaat gacgcagctt tggacagaac tcctgatgct 540
atcctgtcta cgaaccatct gaagactggc atcttgttct cagctatgtt gcaaatcgta 600
gccattgctt ctgcttcttc accatctact agggaaacgt tacacgcatt cgcattggac 660
tttggtcaag cctttcaact gctagacgat ttgagggatg atcatccaga gacaggtaaa 720
gaccgtaaca aagacgctgg taaaagcact ctagtcaaca gattgggtgc tgatgcagct 780
agacagaaac tgagagagca cattgactct gctgacaaac acctgacatt tgcatgtcca 840
caaggaggtg ctataaggca gtttatgcac ctatggtttg gacaccatct tgctgattgg 900
tctccagtga tgaagatcgc ctaa 924
<210> 9
<211> 71
<212> DNA
<213> 人工序列(Artificial sequence)
<223> 引物序列(Primer sequence)
<400> 9
ctgtttgagc cggtcgccta aggtaccaga aggagataaa taatggcgaa aatgaaggag 60
aactttaaac g 71
<210> 10
<211> 55
<212> DNA
<213> 人工序列(Artificial sequence)
<223> 引物序列(Primer sequence)
<400> 10
gcagcggttt ctttaccaga ctcgaggtca gaacacgaag ctcttcatgt cctct 55

Claims (25)

1.一种生产(+)-迈诺醇的方法,包括:
a.将香叶基香叶基二磷酸与柯巴基二磷酸(CPP)合酶接触以形成(9S,10S)-柯巴基二磷酸,其中该CPP合酶来自丹参(Salvia miltiorrhiza),并且该CPP合酶的氨基酸序列与从SEQ ID NO:1和SEQ ID NO:2中选出的多肽具有至少99%的序列同一性;并且
b.使(9S,10S)-柯巴基二磷酸与香紫苏醇合酶接触以形成(+)-迈诺醇,该香紫苏醇合酶来自南欧丹参(Salvia sclarea),并且该香紫苏醇合酶的氨基酸序列与从SEQ ID NO:4和SEQ ID NO:5中选出的多肽具有至少99%的序列同一性;并且
c.可选地,分离该(+)-迈诺醇。
2.权利要求1所述的方法,其中该CPP合酶的氨基酸序列与从SEQ ID NO:1和SEQ IDNO:2中选出的多肽相同。
3.权利要求1所述的方法,其中该香紫苏醇合酶的氨基酸序列与从SEQ ID NO:4和SEQID NO:5中选出的多肽相同。
4.权利要求1所述的方法,还包括使用化学或生物化学合成或两者的组合将(+)-迈诺醇加工成(+)-迈诺醇衍生物。
5.权利要求4所述的方法,其中该衍生物是醇、醛、酸、醚、酮、或酯。
6.权利要求4所述的方法,其中该衍生物是缩醛、内酯或乙酸酯。
7.权利要求5或6所述的方法,其中该衍生物是从由柯巴醇、柯巴醛、(+)-迈诺醇氧基、(3S,5aR,7aS,11aS,11bR)-3,8,8,11a-四甲基十二氢-3,5a-环氧萘并[2,1-c]氧杂七环、γ-ambrol和降龙涎香醚构成的群组中选出的。
8.权利要求7所述的方法,其中该(+)-迈诺醇衍生物是柯巴醇。
9.权利要求7所述的方法,其中该(+)-迈诺醇衍生物是柯巴醛。
10.权利要求7所述的方法,其中该(+)-迈诺醇衍生物是迈诺醇氧基。
11.权利要求7所述的方法,其中该(+)-迈诺醇衍生物是(3S,5aR,7aS,11aS,11bR)-3,8,8,11a-四甲基十二氢-3,5a-环氧萘并[2,1-c]氧杂七环。
12.权利要求7所述的方法,其中该(+)-迈诺醇衍生物是γ-ambrol。
13.权利要求7所述的方法,其中该(+)-迈诺醇衍生物是降龙涎香醚。
14.一种用核酸转化宿主细胞或非人生物体的方法,该核酸编码具有柯巴基二磷酸合酶活性的多肽和具有香紫苏醇合酶活性的多肽,其中该具有柯巴基二磷酸合酶活性的多肽来自丹参(Salvia miltiorrhiza),并且其氨基酸序列与从SEQ ID NO:1和SEQ ID NO:2中选出的多肽具有至少99%的序列同一性,并且其中该具有香紫苏醇合酶活性的多肽来自南欧丹参(Salvia sclarea),并且其氨基酸序列与从SEQ ID NO:4和SEQ ID NO:5中选出的多肽具有至少99%的序列同一性。
15.权利要求14所述的方法,其中该细胞是原核细胞。
16.权利要求15所述的方法,其中该细胞是细菌细胞。
17.权利要求15所述的方法,其中该细胞是真核细胞。
18.权利要求17所述的方法,其中该真核细胞是酵母细胞或植物细胞。
19.一种表达载体,包含编码CPP合酶的核酸以及编码香紫苏醇合酶的核酸,其中该CPP合酶的氨基酸序列与从SEQ ID NO:1和SEQ ID NO:2中选出的多肽具有至少99%的序列同一性,其中该编码CPP酶的核酸来自丹参(Salvia miltiorrhiza),其核苷酸序列与由SEQID NO.3组成的核酸序列有至少99%的序列同一性,并且该编码香紫苏醇合酶的核酸来自南欧丹参(Salvia sclarea),其核苷酸序列与SEQ ID NO.6有至少99%相似。
20.通过权利要求14~18中任一项的方法生产的宿主细胞或非人生物体。
21.一种非人宿主生物体或细胞,包含至少一种编码具有CPP合酶活性的多肽的核酸和至少一种编码具有香紫苏醇合酶活性的多肽的核酸,其中该具有CPP合酶活性的多肽来自丹参(Salvia miltiorrhiza),并且其氨基酸序列与从SEQ ID NO:1和SEQ ID NO:2中选出的多肽具有至少99%的序列同一性,其中该具有香紫苏醇合酶活性的多肽来自南欧丹参(Salvia sclarea),并且其氨基酸序列与从SEQ ID NO:4和SEQ ID NO:5中选出的多肽具有至少99%的序列同一性。
22.权利要求20或21所述的宿主生物体或细胞,其包含权利要求19所述的表达载体。
23.权利要求20~22中任一项所述的宿主生物体或细胞,其能够生产GGPP。
24.一种生产(+)迈诺醇的方法,包括培养权利要求20~23中任一项所述的宿主生物体或细胞。
25.权利要求24所述的方法,其中该宿主生物体或细胞能够生产GGPP。
CN201680036387.3A 2015-06-30 2016-06-30 迈诺醇的生产 Active CN107889506B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201562187236P 2015-06-30 2015-06-30
US62/187,236 2015-06-30
GBGB1601249.4A GB201601249D0 (en) 2016-01-22 2016-01-22 Production of manool
GB1601249.4 2016-01-22
PCT/EP2016/065448 WO2017001641A1 (en) 2015-06-30 2016-06-30 Production of manool

Publications (2)

Publication Number Publication Date
CN107889506A CN107889506A (zh) 2018-04-06
CN107889506B true CN107889506B (zh) 2021-09-14

Family

ID=55534814

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201680036387.3A Active CN107889506B (zh) 2015-06-30 2016-06-30 迈诺醇的生产

Country Status (9)

Country Link
US (1) US10385361B2 (zh)
EP (1) EP3317418B1 (zh)
JP (1) JP6856553B2 (zh)
CN (1) CN107889506B (zh)
CA (1) CA2987487A1 (zh)
ES (1) ES2933968T3 (zh)
GB (1) GB201601249D0 (zh)
MX (1) MX2017015827A (zh)
WO (1) WO2017001641A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
MX2020012933A (es) * 2018-07-10 2021-02-15 Firmenich & Cie Metodo de produccion biocatalitica de compuestos terpenicos.
WO2021005097A1 (en) * 2019-07-10 2021-01-14 Firmenich Sa Biocatalytic method for the controlled degradation of terpene compounds

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102016051A (zh) * 2008-01-29 2011-04-13 弗门尼舍有限公司 生产香紫苏醇的方法
CN102906253A (zh) * 2010-03-09 2013-01-30 桑多斯股份公司 具有二萜合酶活性的多肽

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0212254B1 (fr) 1985-08-12 1991-10-09 Firmenich Sa Procédé pour la préparation de composés oxygénés décaliniques
CN101319220B (zh) * 2007-06-05 2010-08-25 中国中医科学院中药研究所 一种丹参二萜合酶基因及其编码产物与应用
PL2773751T3 (pl) 2011-11-01 2017-08-31 Firmenich Sa Cytochrom 450 i jego zastosowanie w enzymatycznym utlenianiu terpenów
EP2880159A1 (en) * 2012-07-30 2015-06-10 Allylix, Inc. Sclareol and labdenediol diphosphate synthase polypeptides encoding nucleic acid molecules and uses thereof

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102016051A (zh) * 2008-01-29 2011-04-13 弗门尼舍有限公司 生产香紫苏醇的方法
CN102906253A (zh) * 2010-03-09 2013-01-30 桑多斯股份公司 具有二萜合酶活性的多肽

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
Discovery and functional characterization of two diterpene synthases for sclareol biosynthesis in Salvia sclarea (L.) and their relevance for perfume manufacture;Anne Caniard et al.;《BMC Plant Biology》;20120726;第12卷(第1期);图1及其图注,第5页右栏倒数第1段至第6页右栏第1段,第7页右栏第2-3段,第9页右栏第2-4段 *
Functional divergence of diterpene syntheses in the medicinal plant Salvia miltiorrhiza;Guanghong Cui ET AL;《PLANT PHYSIOLOGY》;20150615;第169卷;摘要,第1613页左栏最后一段,表S1 *
UniProtKB- G8GJ94;Schalk M.et al.;《UniProt》;20150107;全文 *
UniProtKB-B8PQ84;Gao W.et al.;《UniProt》;20150401;全文 *

Also Published As

Publication number Publication date
ES2933968T3 (es) 2023-02-15
CN107889506A (zh) 2018-04-06
US10385361B2 (en) 2019-08-20
GB201601249D0 (en) 2016-03-09
US20190002925A1 (en) 2019-01-03
JP2018527892A (ja) 2018-09-27
JP6856553B2 (ja) 2021-04-07
WO2017001641A1 (en) 2017-01-05
CA2987487A1 (en) 2017-01-05
EP3317418B1 (en) 2022-11-30
EP3317418A1 (en) 2018-05-09
BR112017028183A2 (pt) 2018-08-28
MX2017015827A (es) 2018-04-10

Similar Documents

Publication Publication Date Title
CN104846020B (zh) 生产香紫苏醇的方法
EP3140409B1 (en) Drimenol synthase and method for producing drimenol
US20210010035A1 (en) Production of manool
US20230148463A9 (en) Method for producing albicanol and/or drimenol
US10385363B2 (en) Drimenol synthases II
CN107889506B (zh) 迈诺醇的生产
US20200056210A1 (en) Sesquiterpene synthases for production of drimenol and mixtures thereof
CN109477120B (zh) 香根草
CN107849586B (zh) 芳香化合物的生产
BR112017028183B1 (pt) Produção de manool

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant