CN110100003A - 迈诺醇的生产 - Google Patents

迈诺醇的生产 Download PDF

Info

Publication number
CN110100003A
CN110100003A CN201780079583.3A CN201780079583A CN110100003A CN 110100003 A CN110100003 A CN 110100003A CN 201780079583 A CN201780079583 A CN 201780079583A CN 110100003 A CN110100003 A CN 110100003A
Authority
CN
China
Prior art keywords
leu
seq
glu
ser
ala
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201780079583.3A
Other languages
English (en)
Other versions
CN110100003B (zh
Inventor
M·沙尔克
L·戴维特
L·洛奇
D·索利斯艾斯卡兰特
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Firmenich SA
Original Assignee
Firmenich SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Firmenich SA filed Critical Firmenich SA
Priority to CN202311395610.1A priority Critical patent/CN117604043A/zh
Publication of CN110100003A publication Critical patent/CN110100003A/zh
Application granted granted Critical
Publication of CN110100003B publication Critical patent/CN110100003B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/02Preparation of oxygen-containing organic compounds containing a hydroxy group
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P5/00Preparation of hydrocarbons or halogenated hydrocarbons
    • C12P5/007Preparation of hydrocarbons or halogenated hydrocarbons containing one or more isoprene units, i.e. terpenes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N1/00Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
    • C12N1/14Fungi; Culture media therefor
    • C12N1/16Yeasts; Culture media therefor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N1/00Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
    • C12N1/20Bacteria; Culture media therefor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • C12N15/81Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/88Lyases (4.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/90Isomerases (5.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y402/00Carbon-oxygen lyases (4.2)
    • C12Y402/03Carbon-oxygen lyases (4.2) acting on phosphates (4.2.3)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/10Plasmid DNA
    • C12N2800/101Plasmid DNA for bacteria
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/10Plasmid DNA
    • C12N2800/102Plasmid DNA for yeast
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12RINDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
    • C12R2001/00Microorganisms ; Processes using microorganisms
    • C12R2001/01Bacteria or Actinomycetales ; using bacteria or Actinomycetales
    • C12R2001/185Escherichia
    • C12R2001/19Escherichia coli
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12RINDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
    • C12R2001/00Microorganisms ; Processes using microorganisms
    • C12R2001/645Fungi ; Processes using fungi
    • C12R2001/85Saccharomyces
    • C12R2001/865Saccharomyces cerevisiae
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y505/00Intramolecular lyases (5.5)
    • C12Y505/01Intramolecular lyases (5.5.1)
    • C12Y505/01012Copalyl diphosphate synthase (5.5.1.12)

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Biomedical Technology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Mycology (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Virology (AREA)
  • Botany (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Organic Low-Molecular-Weight Compounds And Preparation Thereof (AREA)

Abstract

本发明提供了生产(+)‑迈诺醇的方法,包括:使香叶基香叶基二磷酸与柯巴基二磷酸(CPP)合酶接触以形成(9S,10S)‑柯巴基二磷酸,并使CPP与香紫苏醇合酶接触以形成(+)‑迈诺醇及其衍生物。还提供了在该方法中使用的编码CPP合酶和香紫苏醇合酶的核酸。还提供了表达载体和非人宿主生物体以及细胞,其包含如本文所述的编码CPP合酶和香紫苏醇合酶的核酸。

Description

迈诺醇的生产
技术领域
本文提供了使用柯巴基(copalyl)二磷酸合酶和香紫苏醇合酶生产(+)-迈诺醇(manool)的生物化学方法。
背景技术
在大多数生物(微生物、动物和植物)中都可以找到萜烯。这些化合物由称为异戊二烯单元的五个碳单元组成,并按其结构中存在的这些单元的数量分类。因此,单萜、倍半萜和二萜分别是含有10、15和20个碳原子的萜烯。例如,倍半萜在植物界广泛存在。许多倍半萜分子因其风味和香味性质以及它们的美容、医疗和抗微生物作用而公知。许多倍半萜烃和倍半萜类化合物已被鉴定出。
萜烯的生物合成生产涉及称为萜合酶的酶。这些酶将无环萜烯前体转化成一种或多种萜烯产物。具体而言,二萜合酶通过前体香叶基香叶基二磷酸(GGPP)的环化产生二萜。GGPP的环化通常需要两种酶多肽,在两个连续的酶促反应中组合起作用的I型和II型二萜合酶。II型二萜合酶催化由GGPP的末端双键质子化引发的GGPP的环化/重排,导致环状二萜二磷酸酯中间体。然后该中间体被催化电离引发的环化的I型二萜合酶进一步转化。
二萜合酶存在于植物和其他生物中,并使用底物如GGPP,但它们具有不同的产物特征。编码二萜合酶的基因和cDNA已经被克隆,并且表征了相应的重组酶。
柯巴基二磷酸(CPP)合酶和香紫苏醇合酶是植物中存在的酶。因此,需要在生物化学过程中发现和使用这些酶和变体以产生(+)-迈诺醇。
发明内容
本发明提供一种生产(+)-迈诺醇的方法,包括:
a)使香叶基香叶基二磷酸(GGPP)与柯巴基二磷酸(CPP)合酶接触以形成柯巴基二磷酸,其中该CPP合酶包含:
i)与从由SEQ ID NO:14和SEQ ID NO:15构成的群组中选出的多肽具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或100%序列同一性的氨基酸序列;或者
ii)与从由SEQ ID NO:17和SEQ ID NO:18构成的群组中选出的多肽具有至少71%、72%、75%、80%、85%、90%、95%、98%、99%或100%序列同一性的氨基酸序列;或者
iii)与从由SEQ ID NO:20和SEQ ID NO:21构成的群组中选出的多肽具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列;和
b)使CPP与香紫苏醇合酶接触以形成(+)-迈诺醇;并且
c)可选地,分离(+)-迈诺醇。
本文提供的方法还包括进一步将(+)-迈诺醇加工成(+)-迈诺醇衍生物。
本文还提供了具有CPP合酶活性的多肽,其中该多肽包含:
a)与从由SEQ ID NO:14和SEQ ID NO:15构成的群组中选出的多肽具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或100%序列同一性的氨基酸序列;或者
b)与从由SEQ ID NO:17和SEQ ID NO:18构成的群组中选出的多肽具有至少71%、72%、75%、80%、85%、90%、95%、98%、99%或100%序列同一性的氨基酸序列;或者
c)与从由SEQ ID NO:20和SEQ ID NO:21构成的群组中选出的多肽具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。
还提供了具有香紫苏醇合酶活性的多肽,其中该多肽包含与从由SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:23和SEQ ID NO:25构成的群组中选出的多肽具有至少90%、95%、98%、99%或100%序列同一性的氨基酸序列。
本文还提供了编码上述多肽的核酸。
本文还提供了编码CPP合酶的核酸,其中该核酸包含与SEQ ID NO:13、SEQ ID NO:16、SEQ ID NO:19、SEQ ID NO:22、SEQ ID NO:26、SEQ ID NO:29、SEQ ID NO:30、SEQ IDNO:31或SEQ ID NO:32中所示的核酸序列具有至少90%、95%、98%、99%或100%序列同一性的核苷酸序列。
本文进一步提供了编码香紫苏醇合酶的核酸,其中该核酸包含与SEQ ID NO:6、SEQ ID NO:24、SEQ ID NO:27、SEQ ID NO:33或SEQ ID NO:34具有至少90%、95%、98%、99%或100%序列同一性的核苷酸序列。
还提供了包含上述核酸的表达载体,包含上述核酸或包含该表达载体的非人宿主生物体或细胞,能够生产GGPP的非人宿主生物体或细胞,转化非人宿主生物体或细胞的方法,以及培养非人宿主生物体或细胞以生产(+)-迈诺醇的方法。
附图说明
图1.从香叶基香叶基二磷酸(GGPP)到(+)-迈诺醇的酶促途径。
图2.从香叶基香叶基二磷酸(GGPP)到(+)-迈诺醇和香紫苏醇的酶促途径。
图3.GGPP的体外酶促转化的GCMS分析。A.使用重组SmCPS酶。B.使用重组ScScS酶。C.在单次测定中将SmCPS与ScScS酶组合。
图4.使用表达SmCPS、ScScS和甲羟戊酸途径酶的大肠杆菌细胞产生的(+)-迈诺醇的GCMS分析。A.大肠杆菌培养基提取物的总离子色谱图。B.(+)-迈诺醇标准品的总离子色谱图。C.色谱图A中主峰的质谱(保留时间为14.55分钟)。D.(+)-迈诺醇真实标准品的质谱。
图5.使用表达甲羟戊酸途径酶、GGPP合酶、ScSCS和五种不同CPP合酶(来自丹参(Salvia miltiorrhiza)的SmCPS2,来自毛喉鞘蕊花(Coleus forskohlii)的CfCPS1,来自小麦(Triticum aestivum)的TaTps1,来自欧夏至草(Marrubium vulgare)的MvCps3和来自迷迭香(Rosmarinus officinalis)的RoCPS1)的大肠杆菌细胞生产的(+)-迈诺醇的GCMS分析。
图6.使用表达甲羟戊酸途径酶、GGPP合酶、SmCPS2和I类二萜合酶(来自烟草(Nicotiana glutinosa)的NgSCS-del29或来自快乐鼠尾草(Salvia sclarea)的SsScS)的大肠杆菌细胞生产的(+)-迈诺醇的GCMS分析。
图7.通过酵母与六种DNA片段的共转化在体内构建酿酒酵母表达质粒,该六种DNA片段为:a)LEU2酵母标记,b)AmpR大肠杆菌标记,c)酵母复制起点,d)大肠杆菌复制起点,e)用于共表达CrtE和所测试的香紫苏醇合酶编码序列之一的片段,和f)用于表达所测试的柯巴基二磷酸(CPP)合酶编码序列之一的片段。
图8.使用表达GGPP合酶、ScSCS和五种不同截短形式的CPP合酶(来自丹参(Salviamiltiorrhiza)的SmCPS2,来自毛喉鞘蕊花(Coleus和rskohlii)的CfCPS1,来自小麦(Triticum aestivum)的TaTps1,来自欧夏至草(Marrubium vulgare)的MvCps3和来自迷迭香(Rosmarinus officinalis)的RoCPS1)的经修饰的酿酒酵母菌株YST045生产的(+)-迈诺醇的GCMS分析。
具体实施方式
定义
对于本文和所附权利要求的描述,除非另有说明,否则“或”的使用意味着“和/或”。
类似地,各种时态的“含”、“含有”、“包含”和“包括”是可互换的而不是限制性的。
应进一步理解,在各种实施方案的描述使用术语“包含”的情况下,本领域技术人员将理解,在一些特定情况下,可以使用“基本上由……组成”或“由……组成”的语言来替代地描述实施方案。
除非另有说明,否则以下术语具有归属于它们的含义。
术语“多肽”是指连续聚合的氨基酸残基,例如至少15个残基,至少30个残基,至少50个残基的氨基酸序列。在本文提供的一些实施方案中,多肽包含作为酶、其片段或其变体的氨基酸序列。
术语“分离的”多肽是指通过本领域已知的任何方法或这些方法(包括重组、生物化学和合成法)的组合从天然环境中取出的氨基酸序列。
术语“蛋白”是指任何长度的氨基酸序列,其中氨基酸被共价肽键所连接,并且包括寡肽、肽、多肽和全长蛋白,不管天然生成的还是合成的。
术语“生物功能”、“功能”、“生物活性”或“活性”是指CPP合酶和香紫苏醇合酶活性催化(+)-迈诺醇形成的能力。
术语“核酸序列”、“核酸”和“多核苷酸”可互换使用,是指核苷酸的序列。核酸序列可以是任何长度的单链或双链脱氧核糖核苷酸或核糖核苷酸,并且包括基因、外显子、内含子、有义和反义互补序列、基因组DNA、cDNA、miRNA、siRNA、mRNA、rRNA、tRNA、重组核酸序列、分离的和纯化的天然产生的DNA和/或RNA序列、合成的DNA和RNA序列、片段、引物和核酸探针的编码和非编码序列;以及这些序列的互补序列。本领域技术人员了解,RNA的核酸序列与DNA序列相同,差异在于胸腺嘧啶(T)被替代为尿嘧啶(U)。
“分离的核酸”或“分离的核酸序列”被定义为一种核酸或核酸序列,其所处的环境与天然产生的核酸或核酸序列所处的环境不同。如本文使用的如应用于核酸的术语“天然产生的”是指在自然的细胞中发现的核酸。例如,存在于能够从自然源中分离出的生物体(例如生物体的细胞)中的核酸序列,并且该核酸序列未经人类在实验室进行有意地修饰,那么该核酸序列是天然产生的。
本文所用的术语“纯化的”、“基本上纯化的”和“分离的”是指不含通常与本发明化合物天然状态相关的其他不同化合物的状态,因此“纯化的”、“基本上纯化的”和“分离的”对象以重量计包含给定样品的物质的至少0.5%、1%、5%、10%或20%、或至少50%或75%。在一个具体实施方案中,这些术语是指以重量计包含给定样品的物质的至少95%、96%、97%、98%、99%或100%的本发明化合物。如本文所用,术语核酸或蛋白的“纯化的”、“基本上纯化的”和“分离的”,当提及核酸或蛋白时,也指不同于在细胞或生物体中天然存在的纯度或浓度的状态。大于细胞或生物体中天然存在的浓度或浓度的任何程度的纯度或浓度,包括(1)从其他相关结构或化合物中纯化或(2)与结构或化合物的结合(而在细胞或生物体中通常不与其相关联),都属于“分离的”的含义。根据本领域技术人员已知的各种方法和工艺,本文所述的核酸或蛋白,或多类的核酸或蛋白可以分离,或以其他方式与它们通常在性质上不相关的结构或化合物相关联。
如本文所用,动词和名词形式的术语“扩增”是指使用任何合适的扩增方法产生或检测如下文详细描述的天然表达的核酸的重组体。例如,本发明提供用于在体内、体外或试管内扩增(例如通过聚合酶链反应,PCR)天然表达的(例如基因组DNA或mRNA)或重组(例如cDNA)本发明核酸的方法和试剂(例如特异性简并寡核苷酸引物对,寡聚dT引物)。
“重组核酸序列”是使用实验室方法(分子克隆)将来自多于一个源的遗传物质组合在一起所生成的核酸序列,由此创造出不是天然产生并且不能以其他方式在生物有机体中发现的核酸序列。
“重组DNA技术”是指一种用于制备重组核酸序列的分子生物学方法,例如描述于由Weigel和Glazebrook编辑的Laboratory Manuals,2002 Cold Spring Harbor LabPress;和Sambrook等,1989 Cold Spring Harbor,NY:Cold Spring Harbor LaboratoryPress。
术语“基因”是指一种DNA序列,其包含可操作地连接到适当调控区域(例如启动子)的被转录为RNA分子(例如细胞中的mRNA)的区域。因此,基因可以包含多个可操作地连接的序列,诸如启动子、5’前导序列(包含例如参与翻译初始化的序列)、cDNA或基因组DNA的编码区、内含子、外显子和/或3’非翻译序列(包含例如转录终止位点)。
“嵌合基因”是指通常不能在自然界的物种中找到的任何基因,特别是这样一种基因,其中核酸序列存在一个或多个部分在性质上彼此不相关联。例如,启动子在性质上与转录区的部分或全部或与另一调控区不相关联。术语“嵌合基因”应当被理解为包括表达构建体,其中启动子或转录调控序列被可操作地连接到一个或多个编码序列或反义(即有义链的反向互补链)或反向重复序列(有义和反义,由此RNA转录物在转录后形成双链RNA)。术语“嵌合基因”还包括通过组合一个或多个编码序列的部分以产生新基因而获得的基因。
“3’URT”或“3’非翻译序列”(也称为“3’未翻译区”或“3’末端”)是指在基因编码序列的下游发现的核酸序列,其包含例如转录终止位点和(在大多数但非全部的真核mRNA中)多聚腺苷酸化信号诸如AAUAAA或其变体。在转录终止后,mRNA转录物可以在多聚腺苷酸化信号的下游切去,并且可以添加poly(A)尾,其参与了mRNA向翻译位点例如细胞质的运输。
“基因的表达”包括基因的转录和mRNA向蛋白质的翻译。过表达是指在转基因细胞或生物体中,以mRNA、多肽和/或酶活性水平测量的基因产物的生产超过了相似遗传背景的非转化细胞或生物体中的生产水平。
如本文中使用的“表达载体”是指这样一种核酸分子,其使用分子生物学方法和重组DNA技术工程化以将外来或外源DNA递送到宿主细胞中。表达载体典型地包括适合转录核苷酸序列所需的序列。编码区通常编码目的蛋白,但是也可以编码RNA,例如反义RNA、siRNA等。
如本文所使用的“表达载体”包括任何线性的或环状的重组载体,包括但不限于病毒载体、噬菌体和质粒。本领域技术人员根据表达系统能够选择适合的载体。在一个实施方案中,表达载体包括本文实施方案的核酸,其可操作地连接到至少一个调控序列,其控制转录、翻译、起始和终止,诸如转录启动子、操纵子和增强子,或mRNA核糖体结合位点,并且可选地包括至少一个选择标记。当调控序列功能性地涉及本文实施方案的核酸时,核苷酸序列是“可操作地连接的”。“调控序列”是指这样一种核酸序列,其确定本文实施方案的核酸序列的表达水平、并且能够调控可操作地连接到该调控序列的核酸序列的转录速率。调控序列包含启动子、增强子、转录因子、启动子元件等。
“启动子”是指通过提供RNA聚合酶用的结合位点以及适合转录所需的其它因子,包括但不限于转录因子结合位点、抑制子和活化子蛋白结合位点,来控制编码序列的表达的核酸序列。术语启动子的含义包括术语“启动子调控序列”。启动子调控序列可以包括可能影响转录、RNA加工或相关编码核酸序列的稳定性的上游和下游元件。启动子包括天然来源的和合成的序列。编码核酸序列通常位于启动子相对于以转录起始位点为起始的转录方向的下游。
术语“组成型启动子”是指不受调控的启动子,其允许其可操作地连接的核酸序列的持续转录。
如本文使用的,术语“可操作地连接”是指处于功能性关系的多核苷酸元件的连接。当核酸与另一核酸序列处于功能性关系时,那么该核酸是“可操作地连接的”。例如,如果启动子或者转录调控序列能够影响编码序列的转录,那么该启动子或者转录调控序列是可操作地连接到该编码序列的。可操作地连接意味着被连接的DNA序列通常是邻接的。与启动子序列有关的核苷酸序列相对于要被转化的细胞或生物体,例如宿主细胞、植物细胞、植物或微生物可以是同源或异源来源的。所述序列还可以是完全或部分合成的。不管来源如何,与启动子序列有关的核酸序列将根据在结合到本文实施方案的多肽后所连接的启动子性质而表达或沉默。相关核酸在所有时间或替代地在特定时间在整个生物体中或在特定组织、细胞或细胞室中可以编码需要表达或抑制的蛋白。此种核苷酸序列特别地编码将所需表型性状赋予给由其改变或转化的宿主细胞或生物体的蛋白质。更特别地,相关的核苷酸序列导致在宿主细胞或生物体中(+)-迈诺醇合酶的生产。
“靶肽”是指一种氨基酸序列,其将蛋白质或多肽靶向细胞内细胞器(即,线粒体或质体)或细胞外空间(分泌信号肽)。编码靶肽的核酸序列可以被融合到编码蛋白或多肽的氨基末端(例如N-末端)的核酸序列或者可以被用来替换原有的靶多肽。
术语“引物”是指短的核酸序列,其被杂交到模板核酸序列并且被用于与该模板互补的核酸序列的聚合。
如本文所使用的,术语“宿主细胞”或“经转化的细胞”是指被改变以包藏至少一种核酸分子的细胞(或生物体),例如,编码所需蛋白质或核酸序列的重组基因,其在转录时产生CPP合酶蛋白和/或香紫苏醇合酶蛋白或一起产生(+)-迈诺醇。
宿主细胞特别地是细菌细胞、真菌细胞或植物细胞。宿主细胞可以含有已经被整合到该宿主细胞的核或细胞器的基因组中的重组基因。替代地,宿主可以含有染色体外的重组基因。同源序列包括直系同源或旁系同源序列。鉴别直系同源物或旁系同源物的方法包括现有技术中已知且在本文中描述的系统发生学方法、序列相似性和杂交方法。
旁系同源物来源于基因复制,其产生具有相似序列和相似功能的两种或更多种基因。旁系同源物典型地聚簇在一起并且通过基因在相关植物物种内的复制而形成。使用成对Blast分析或在基因家族的系统发生分析过程中使用程序诸如CLUSTAL在类似基因的组中发现旁系同源物。在旁系同源物中,共有序列可被鉴定为其特征在于相关基因中的序列并且具有基因的类似功能。
直系同源物或直系同源序列是彼此相似的序列,因为它们发现于由共同的祖先传下的物种中。例如,具有共同祖先的植物物种已经含有相同类似序列和功能的许多酶。本领域技术人员能够识别直系同源序列并预测直系同源物的功能,例如通过使用CLUSTAL或BLAST程序构建一个物种的基因族的系统发生树。
术语“选择性标记物”是指在表达后能够被用来选择包括该选择性标记物的一种或多种细胞的任何基因。以下描述了选择性标记物的例子。本领域技术人员了解不同的抗生素、杀真菌剂、营养缺陷型或除草剂选择标记物可适用于不同的目标物种。
术语“生物体”是指任何非人多细胞或单细胞生物体。诸如植物或微生物。特别地,微生物是细菌、酵母、藻类或真菌。
术语“植物”可互换使用以包括植物细胞,包括植物原生质体、植物组织、产生再生植物或植物部分的植物细胞组织培养物、或植物器官诸如根、茎、叶、芽、花、叶柄、花瓣、花粉、胚珠、胚、块茎、果实、种子、它们的后代等。任何植物均可以用来实施本文实施方案的方法。
特定实施方案
在一个实施方案中,本文提供了转化宿主细胞或非人生物体的方法,包括用编码具有柯巴基二磷酸合酶活性的多肽的核酸和编码具有香紫苏醇合酶活性的多肽的核酸转化宿主细胞或非人生物体,其中具有柯巴基二磷酸活性的多肽包含:
a)与从由SEQ ID NO:14和SEQ ID NO:15构成的群组中选出的多肽具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或100%序列同一性的氨基酸序列;或者
b)与从由SEQ ID NO:17和SEQ ID NO:18构成的群组中选出的多肽具有至少71%、72%、75%、80%、85%、90%、95%、98%、99%或100%序列同一性的氨基酸序列;或者
c)与从由SEQ ID NO:20和SEQ ID NO:21构成的群组中选出的多肽具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。
在一个实施方案中,具有香紫苏醇合酶活性的多肽包含与从由SEQ ID NO:4、SEQID NO:5、SEQ ID NO:23和SEQ ID NO:25构成的群组中选出的多肽具有至少90%、95%、98%、99%或100%序列同一性的氨基酸序列。
在一个实施方案中,本文提供了一种方法,包括培养非人宿主生物体或细胞,其能够生产香叶基香叶基二磷酸(GGPP),并经转化以表达具有柯巴基二磷酸合酶活性的多肽,其中该具有柯巴基二磷酸合酶活性的多肽包含:
a)与从由SEQ ID NO:14和SEQ ID NO:15构成的群组中选出的多肽具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或100%序列同一性的氨基酸序列;或者
b)与从由SEQ ID NO:17和SEQ ID NO:18构成的群组中选出的多肽具有至少71%、72%、75%、80%、85%、90%、95%、98%、99%或100%序列同一性的氨基酸序列;或者
c)与从由SEQ ID NO:20和SEQ ID NO:21构成的群组中选出的多肽具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列;并且进一步经转化以表达具有香紫苏醇合酶活性的多肽。
特别地,具有香紫苏醇合酶活性的多肽包含与从由SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:23和SEQ ID NO:25构成的群组中选出的多肽肽具有至少90%、95%、98%、99%或100%序列同一性的氨基酸序列。
本文进一步提供了表达载体,其包含编码CPP合酶的核酸,其中该CPP合酶包含多肽,该多肽包含:
a)与SEQ ID NO:14或SEQ ID NO:15具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或100%序列同一性的氨基酸序列;或者
b)与SEQ ID NO:17或SEQ ID NO:18具有至少71%、72%、75%、80%、85%、90%、95%、98%、99%或100%序列同一性的氨基酸序列;或者
c)与SEQ ID NO:20或SEQ ID NO:21具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列;并且此外,该表达载体包含编码香紫苏醇合酶的核酸。
特别地,香紫苏醇合酶包含与SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:23或SEQ IDNO:25具有至少90%、95%、98%、99%或100%序列同一性的氨基酸序列。在一个特定的实施方案中,两种酶,即CPP合酶和香紫苏醇合酶,可以在相同细胞中转化的两种不同的载体或质粒上。在另一个实施方案中,这两种酶可以在两种不同细胞中转化的两种不同的载体上或质粒上。
本文进一步提供了非人宿主生物体或细胞,其包含或经转化以包藏至少一种编码CPP合酶的核酸,其中该CPP合酶包含:
a)包含与SEQ ID NO:14或SEQ ID NO:15具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或100%序列同一性的氨基酸序列的多肽;或者
b)与SEQ ID NO:17或SEQ ID NO:18具有至少71%、72%、75%、80%、85%、90%、95%、98%、99%或100%序列同一性的氨基酸序列;或者
c)与SEQ ID NO:20或SEQ ID NO:21具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列;和至少一种编码香紫苏醇酶的核酸。
特别地,香紫苏醇合酶包含与SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:23或SEQ IDNO:25具有至少90%、95%、98%、99%或100%序列同一性的氨基酸序列。
本文进一步提供了非人宿主生物体或细胞,其包含或经转化以包藏至少一种编码CPP合酶的核酸,其中该CPP合酶包含与从由SEQ ID NO:1和SEQ ID NO:2构成的群组中选出的多肽具有至少90%、95%、98%、99%或100%序列同一性的氨基酸序列;和至少一种编码香紫苏醇酶的核酸,其中香紫苏醇合酶包含与从由SEQ ID NO:23和SEQ ID NO:25构成的群组中选出的多肽具有至少90%、95%、98%、99%或100%序列同一性的氨基酸序列。
在一个实施方案中,编码本文提供的CPP合酶的核酸包含与SEQ ID NO:3、SEQ IDNO:13、SEQ ID NO:16、SEQ ID NO:19、SEQ ID NO:22、SEQ ID NO:26、SEQ ID NO:29、SEQ IDNO:30、SEQ ID NO:31或SEQ ID NO:32具有至少90%、95%、98%、99%或100%序列同一性的核苷酸序列。
在一个实施方案中,编码本文提供的CPP合酶的核酸包含与SEQ ID NO:3、SEQ IDNO:13、SEQ ID NO:NO:16、SEQ ID NO:19、SEQ ID NO:22、SEQ ID NO:26、SEQ ID NO:29、SEQID NO:30、SEQ ID NO:31或SEQ ID NO:32具有至少95%、98%、99%或100%序列同一性的核苷酸序列。
在一个实施方案中,编码本文提供的CPP合酶的核酸包含与SEQ ID NO:3、SEQ IDNO:13、SEQ ID NO:16、SEQ ID NO:19、SEQ ID NO:22、SEQ ID NO:26、SEQ ID NO:29、SEQ IDNO:30、SEQ ID NO:31或SEQ ID NO:32具有至少98%、99%或100%序列同一性的核苷酸序列。
在一个实施方案中,编码本文提供的CPP合酶的核酸包含与SEQ ID NO:3、SEQ IDNO:13、SEQ ID NO:16、SEQ ID NO:19、SEQ ID NO:22、SEQ ID NO:26、SEQ ID NO:29、SEQ IDNO:30、SEQ ID NO:31或SEQ ID NO:32具有99%或100%序列同一性的核苷酸序列。
在一个实施方案中,编码本文提供的CPP合酶的核酸包含SEQ ID NO:3、SEQ IDNO:13、SEQ ID NO:16、SEQ ID NO:19、SEQ ID NO:22、SEQ ID NO:26、SEQ ID NO:29、SEQ IDNO:30、SEQ ID NO:31或SEQ ID NO:32中所示的核苷酸序列。
在一个实施方案中,CPP合酶包含多肽,该多肽包含:
a)与从由SEQ ID NO:14和SEQ ID NO:15构成的群组中选出的多肽具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或100%序列同一性的氨基酸序列;或者
b)与从由SEQ ID NO:17和SEQ ID NO:18构成的群组中选出的多肽具有至少71%、72%、75%、80%、85%、90%、95%、98%、99%或100%序列同一性的氨基酸序列;或者
c)与从由SEQ ID NO:20和SEQ ID NO:21构成的群组中选出的多肽具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。
在一个实施方案中,CPP合酶包含多肽,该多肽包含与SEQ IDNO:14具有至少55%、60%、65%、70%、75%、80%、85%、90%、95%、98%或99%序列同一性的氨基酸序列。
在一个实施方案中,CPP合酶包含多肽,该多肽包含与SEQ ID NO:14具有至少60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或100%序列同一性的氨基酸序列。
在一个实施方案中,CPP合酶包含多肽,该多肽包含与SEQ ID NO:14具有至少70%、75%、80%、85%、90%、95%、98%、99%或100%序列同一性的氨基酸序列。
在一个实施方案中,CPP合酶包含多肽,该多肽包含与SEQ ID NO:14具有至少90%、95%、98%、99%或100%序列同一性的氨基酸序列。
在一个实施方案中,CPP合酶包含多肽,该多肽包含与SEQ ID NO:14具有至少98%、99%或100%序列同一性的氨基酸序列。
在一个实施方案中,CPP合酶包含多肽,该多肽包含SEQ ID NO:14中所示的氨基酸序列。
在一个实施方案中,CPP合酶包含多肽,该多肽包含与SEQ ID NO:15具有至少55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或100%序列同一性的氨基酸序列。
在一个实施方案中,CPP合酶包含多肽,该多肽包含与SEQ ID NO:15具有至少60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或100%序列同一性的氨基酸序列。
在一个实施方案中,CPP合酶包含多肽,该多肽包含与SEQ ID NO:15具有至少70%、75%、80%、85%、90%、95%、98%、99%或100%序列同一性的氨基酸序列。
在一个实施方案中,CPP合酶包含多肽,该多肽包含与SEQ ID NO:15具有至少90%、95%、98%、99%或100%序列同一性的氨基酸序列。
在一个实施方案中,CPP合酶包含多肽,该多肽包含与SEQ ID NO:15具有至少98%、99%或100%序列同一性的氨基酸序列。
在一个实施方案中,CPP合酶包含多肽,该多肽包含SEQ ID NO:15中所示的氨基酸序列。
在一个实施方案中,CPP合酶包含多肽,该多肽包含与SEQ ID NO:17具有至少75%、80%、85%、90%、95%、98%、99%或100%序列同一性的氨基酸序列。
在一个实施方案中,CPP合酶包含多肽,该多肽包含与SEQ ID NO:17具有至少80%、85%、90%、95%、98%、99%或100%序列同一性的氨基酸序列。
在一个实施方案中,CPP合酶包含多肽,该多肽包含与SEQ ID NO:17具有至少90%、95%、98%、99%或100%序列同一性的氨基酸序列。
在一个实施方案中,CPP合酶包含多肽,该多肽包含与SEQ ID NO:17具有至少98%、99%或100%序列同一性的氨基酸序列。
在一个实施方案中,CPP合酶包含多肽,该多肽包含SEQ ID NO:17中所示的氨基酸序列。
在一个实施方案中,CPP合酶包含多肽,该多肽包含与SEQ ID NO:18具有至少75%、80%、85%、90%、95%、98%、99%或100%序列同一性的氨基酸序列。
在一个实施方案中,CPP合酶包含多肽,该多肽包含与SEQ ID NO:18具有至少80%、85%、90%、95%、98%、99%或100%序列同一性的氨基酸序列。
在一个实施方案中,CPP合酶包含多肽,该多肽包含与SEQ ID NO:18具有至少90%、95%、98%、99%或100%序列同一性的氨基酸序列。
在一个实施方案中,CPP合酶包含多肽,该多肽包含与SEQ ID NO:18具有至少98%、99%或100%序列同一性的氨基酸序列。
在一个实施方案中,CPP合酶包含多肽,该多肽包含SEQ ID NO:18中所示的氨基酸序列。
在一个实施方案中,CPP合酶包含多肽,该多肽包含与SEQ ID NO:20具有至少91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。
在一个实施方案中,CPP合酶包含多肽,该多肽包含与SEQ ID NO:20具有至少95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。
在一个实施方案中,CPP合酶包含多肽,该多肽包含与SEQ ID NO:20具有至少98%、99%或100%序列同一性的氨基酸序列。
在一个实施方案中,CPP合酶包含多肽,该多肽包含SEQ ID NO:20中所示的氨基酸序列。
在一个实施方案中,CPP合酶包含多肽,该多肽包含与SEQ ID NO:21具有至少91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。
在一个实施方案中,CPP合酶包含多肽,该多肽包含与SEQ ID NO:21具有至少95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。
在一个实施方案中,CPP合酶包含多肽,该多肽包含与SEQ ID NO:21具有至少98%、99%或100%序列同一性的氨基酸序列。
在一个实施方案中,CPP合酶包含多肽,该多肽包含与SEQ ID NO:21具有至少99%序列同一性的氨基酸序列。
在一个实施方案中,CPP合酶包含多肽,该多肽包含SEQ ID NO:21中所示的氨基酸序列。
在一个实施方案中,编码香紫苏醇合酶的核酸包含与SEQ ID NO:6、SEQ ID NO:24、SEQ ID NO:27、SEQ ID NO:33或SEQ ID NO:34具有至少90%、95%、98%、99%或100%序列同一性的核苷酸序列。
在一个实施方案中,香紫苏醇合酶包含与SEQ ID NO:4具有至少90%、95%、98%、99%或100%序列同一性的氨基酸序列。
在一个实施方案中,香紫苏醇合酶包含与SEQ ID NO:4具有至少95%、98%、99%或100%序列同一性的氨基酸序列。
在一个实施方案中,香紫苏醇合酶包含与SEQ ID NO:4具有至少98%、99%或100%序列同一性的氨基酸序列。
在一个实施方案中,香紫苏醇合酶包含与SEQ ID NO:4具有至少99%序列同一性的氨基酸序列。
在一个实施方案中,香紫苏醇合酶包含SEQ ID NO:4中所示的氨基酸序列。
在一个实施方案中,香紫苏醇合酶包含与SEQ ID NO:5具有至少90%、95%、98%、99%或100%序列同一性的氨基酸序列。
在一个实施方案中,香紫苏醇合酶包含与SEQ ID NO:5具有至少95%、98%、99%或100%序列同一性的氨基酸序列。
在一个实施方案中,香紫苏醇合酶包含与SEQ ID NO:5具有至少98%、99%或100%序列同一性的氨基酸序列。
在一个实施方案中,香紫苏醇合酶包含与SEQ ID NO:5具有至少99%序列同一性的氨基酸序列。
在一个实施方案中,香紫苏醇合酶包含SEQ ID NO:5中所示的氨基酸序列。
在一个实施方案中,香紫苏醇合酶包含与SEQ ID NO:23具有至少90%、95%、98%、99%或100%序列同一性的氨基酸序列。
在一个实施方案中,香紫苏醇合酶包含与SEQ ID NO:23具有至少95%、98%、99%或100%序列同一性的氨基酸序列。
在一个实施方案中,香紫苏醇合酶包含与SEQ ID NO:23具有至少98%、99%或100%序列同一性的氨基酸序列。
在一个实施方案中,香紫苏醇合酶包含与SEQ ID NO:23具有至少99%序列同一性的氨基酸序列。
在一个实施方案中,香紫苏醇合酶包含SEQ ID NO:23中所示的氨基酸序列。
在一个实施方案中,香紫苏醇合酶包含与SEQ ID NO:25具有至少90%、95%、98%、99%或100%序列同一性的氨基酸序列。
在一个实施方案中,香紫苏醇合酶包含与SEQ ID NO:25具有至少95%、98%、99%或100%序列同一性的氨基酸序列。
在一个实施方案中,香紫苏醇合酶包含与SEQ ID NO:25具有至少98%、99%或100%序列同一性的氨基酸序列。
在一个实施方案中,香紫苏醇合酶包含与SEQ ID NO:25具有至少99%序列同一性的氨基酸序列。
在一个实施方案中,香紫苏醇合酶包含SEQ ID NO:25中所示的氨基酸序列。
在另一个实施方案中,本文提供了表达载体,其包含至少一种本文所述的核酸。
在另一个实施方案中,本文提供了非人宿主生物体或细胞,其包含一种或多种表达载体,该表达载体包含编码如本文所述的CPP合酶的核酸和编码如本文所述的香紫苏醇合酶的核酸。
在另一个实施方案中,本文提供了非人宿主生物体或细胞,其包含或经转化以包藏至少一种本文所述的核酸,使得其异源表达或过表达本文所述的至少一种多肽。
在一个实施方案中,本发明提供了经转化的细胞或生物体,其中多肽的表达量高于未经转化的相同细胞或生物体。
本领域已知有几种方法用于产生转基因宿主生物体或细胞,例如植物、真菌、原核生物或高等真核细胞的培养物。适用于细菌、真菌、酵母、植物和哺乳动物细胞宿主的克隆和表达载体描述于例如Pouwels et al.,Cloning Vectors:A Laboratory Manual,1985,Elsevier,New York and Sambrook et al.,Molecular Cloning:A Laboratory Manual,2nd edition,1989,Cold Spring Harbor Laboratory Press。特别是高等植物和/或植物细胞的克隆和表达载体对于技术人员是可用的。参见例如Schardl et al.,Gene,1987,61:1-11。
用于将宿主生物体或细胞转化为包藏转基因核酸的方法是本领域技术人员熟悉的。例如,为了产生转基因植物,目前的方法包括:植物原生质体的电穿孔,脂质体介导的转化,农杆菌介导的转化,聚乙二醇介导的转化,粒子轰击,植物细胞的显微注射和使用病毒的转化。
在一个实施方案中,将经转化的DNA整合到非人宿主生物体和/或细胞的染色体中,从而产生稳定的重组系统。本领域已知的任何染色体整合方法可用于本发明的实践,包括但不限于重组酶介导的盒交换(RMCE),病毒位点特异性染色体插入,腺病毒和原核注射。
在实施生产(+)-迈诺醇的方法的一个实施方案中,本文提供了制备本发明任一实施方案中所述的至少一种具有CPP合酶活性的多肽和至少一种具有香紫苏醇合酶活性的多肽的方法。。
一个实施方案提供了一种生产迈诺醇的方法,包括:
a)使香叶基香叶基二磷酸(GGPP)与本文所述的柯巴基二磷酸(CPP)合酶接触以形成柯巴基二磷酸;并且
b)使CPP与本文所述的香紫苏醇合酶接触以形成(+)-迈诺醇;其中步骤a)包括培养能够生产GGPP并用本文所述的一种或多种核酸或用本文所述的一种或多种表达载体转化的非人宿主生物体或宿主细胞,以便非人宿主生物体或宿主细胞包藏编码本文所述的具有CPP合酶活性的多肽的核酸和编码如本文所述的具有香紫苏醇合酶活性的多肽的核酸,并表达或过表达该多肽。
一个实施方案提供了上述生产迈诺醇的方法,其进一步包括在步骤a)之前,用如下物质转化能够生产GGPP的非人宿主生物体或宿主细胞:
a)至少一种编码多肽的核酸,该多肽包含:
i)与SEQ ID NO:14或SEQ ID NO:15具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或100%序列同一性的氨基酸序列;或者
ii)与SEQ ID NO:17和SEQ ID NO:18具有至少71%、72%、75%、80%、85%、90%、95%、98%、99%或100%序列同一性的氨基酸序列;或者
iii)与SEQ ID NO:20或SEQ ID NO:21具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列;并且
具有CPP合酶活性,使得所述生物体或细胞表达具有CPP合酶活性的所述多肽;和
b)至少一种编码具有本文所述的香紫苏醇合酶活性的多肽的核酸,使得所述生物体或细胞表达具有香紫苏醇合酶活性的所述多肽。
在一个实施方案中,能够生产GGPP的非人宿主生物体或宿主细胞包含:
a)编码包含SEQ ID NO:15的CPP合酶的核酸和编码包含SEQ ID NO:5的香紫苏醇合酶的核酸;或者
b)编码包含SEQ ID NO:18的CPP合酶的核酸和编码包含SEQ ID NO:5的香紫苏醇合酶的核酸;或者
c)编码包含SEQ ID NO:21的CPP合酶的核酸和编码包含SEQ ID NO:5的香紫苏醇合酶的核酸;或者
d)包含SEQ ID NO:16的核酸,其编码CPP合酶,和包含SEQ ID NO:6的核酸,其编码香紫苏醇合酶;或者
e)包含SEQ ID NO:19的核酸,其编码CPP合酶,和包含SEQ ID NO:6的核酸,其编码香紫苏醇合酶;或者
f)包含SEQ ID NO:22的核酸,其编码CPP合酶,和包含SEQ ID NO:6的核酸,其编码香紫苏醇合酶;或者
g)包含SEQ ID NO:26的核酸,其编码CPP合酶,和包含SEQ ID NO:27的核酸,其编码香紫苏醇合酶;或者
h)包含SEQ ID NO:29的核酸,其编码CPP合酶,和包含SEQ ID NO:27的核酸,其编码香紫苏醇合酶;或者
i)包含SEQ ID NO:30的核酸,其编码CPP合酶,和包含SEQ ID NO:27的核酸,其编码香紫苏醇合酶;或者
j)包含SEQ ID NO:31的核酸,其编码CPP合酶,和包含SEQ ID NO:27的核酸,其编码香紫苏醇合酶;或者
k)包含SEQ ID NO:32的核酸,其编码CPP合酶,和包含SEQ ID NO:27的核酸,其编码香紫苏醇合酶;或者
l)编码包含SEQ ID NO:2的CPP合酶的核酸和编码包含SEQ ID NO:23的香紫苏醇合酶的核酸;或者
m)编码包含SEQ ID NO:15的CPP合酶的核酸和编码包含SEQ ID NO:23的香紫苏醇合酶的核酸;或者
n)编码包含SEQ ID NO:18的CPP合酶的核酸和编码包含SEQ ID NO:23的香紫苏醇合酶的核酸;或者
o)编码包含SEQ ID NO:21的CPP合酶的核酸和编码包含SEQ ID NO:23的香紫苏醇合酶的核酸;或者
p)编码包含SEQ ID NO:2的CPP合酶的核酸和编码包含SEQ ID NO:25的香紫苏醇合酶的核酸;或者
q)编码包含SEQ ID NO:15的CPP合酶的核酸和编码包含SEQ ID NO:25的香紫苏醇合酶的核酸;或者
r)编码包含SEQ ID NO:18的CPP合酶的核酸和编码包含SEQ ID NO:25的香紫苏醇合酶的核酸;或者
s)编码包含SEQ ID NO:21的CPP合酶的核酸和编码包含SEQ ID NO:25的香紫苏醇合酶的核酸;或者
t)包含SEQ ID NO:16的核酸,其编码CPP合酶,和包含SEQ ID NO:24的核酸,其编码香紫苏醇合酶;或者
u)包含SEQ ID NO:19的核酸,其编码CPP合酶,和包含SEQ ID NO:24的核酸,其编码香紫苏醇合酶;或者
v)包含SEQ ID NO:22的核酸,其编码CPP合酶,和包含SEQ ID NO:24的核酸,其编码香紫苏醇合酶;或者
w)包含SEQ ID NO:26的核酸,其编码CPP合酶,和包含SEQ ID NO:33的核酸,其编码香紫苏醇合酶;或者
x)包含SEQ ID NO:26的核酸,其编码CPP合酶,和包含SEQ ID NO:34的核酸,其编码香紫苏醇合酶。
y)包含SEQ ID NO:29的核酸,其编码CPP合酶,和包含SEQ ID NO:33的核酸,其编码香紫苏醇合酶;或者
z)包含SEQ ID NO:29的核酸,其编码CPP合酶,和包含SEQ ID NO:34的核酸,其编码香紫苏醇合酶。
aa)包含SEQ ID NO:30的核酸,其编码CPP合酶,和包含SEQ ID NO:33的核酸,其编码香紫苏醇合酶;或者
bb)包含SEQ ID NO:30的核酸,其编码CPP合酶,和包含SEQ ID NO:34的核酸,其编码香紫苏醇合酶
cc)包含SEQ ID NO:31的核酸,其编码CPP合酶,和包含SEQ ID NO:33的核酸,其编码香紫苏醇合酶;或者
dd)包含SEQ ID NO:31的核酸,其编码CPP合酶,和包含SEQ ID NO:34的核酸,其编码香紫苏醇合酶;或者
ee)包含SEQ ID NO:32的核酸,其编码CPP合酶,和包含SEQ ID NO:33的核酸,其编码香紫苏醇合酶;或者
ff)包含SEQ ID NO:32的核酸,其编码CPP合酶,和包含SEQ ID NO:34的核酸,其编码香紫苏醇合酶;
其中上述核酸序列和/或合酶的组合还包含与本文所述列举的SEQ ID NO的变体和各种百分比同一性。
在一个实施方案中,本文提供的非人宿主生物体是植物、原核生物或真菌。
在一个实施方案中,本文提供的非人宿主是微生物,特别是细菌或酵母。
在一个实施方案中,本文提供的细菌是大肠杆菌,酵母是酿酒酵母。
在一个实施方案中,本文提供的非人生物体是酿酒酵母。
在一个实施方案中,细胞是原核细胞。
在其他实施方案中,细胞是细菌细胞。
在一个实施方案中,细胞是真核细胞。
在一个实施方案中,真核细胞是酵母细胞或植物细胞。
在一个实施方案中,可以通过培养本文所述的经转化的细菌或酵母,包括通过发酵来生产迈诺醇,例如描述于Paddon et al.,Nature,2013,496:528-532。
在一个实施方案中,生产(+)-迈诺醇的方法生产出纯度为至少98.5%的(+)-迈诺醇。
在另一个实施方案中,本文提供的方法还包括使用本领域公知的方法使用化学或生物化学合成或两者的组合将(+)-迈诺醇加工成衍生物。
在一个实施方案中,(+)-迈诺醇衍生物从由烃、醇、缩醛、醛、酸、醚、酮、内酯、乙酸酯和酯构成的群组中选出。
根据本发明的任何实施方案,所述(+)-迈诺醇衍生物是可选地包含一个、两个或三个氧原子的C10至C25化合物。
在进一步的实施方案中,衍生物选自乙酸迈诺醇酯(乙酸(3R)-3-甲基-5-[(1S,4aS,8aS)-5,5,8a-三甲基-2-甲亚基十氢-1-萘基]-1-戊烯-3-基酯)、柯巴醇((2E)-3-甲基-5-[(1S,4aS,8aS)-5,5,8a-三甲基-2-甲亚基十氢-1-萘基]-2-戊烯-1-醇)、乙酸柯巴醇酯(乙酸(2E)-3-甲基-5-[(1S,4aS,8aS)-5,5,8a-三甲基-2-甲亚基十氢-1-萘基]-2-戊烯-1-基酯)、柯巴醛((2E)-3-甲基-5-[(1S,4aS,8aS)-5,5,8a-三甲基-2-甲亚基十氢-1-萘基]-2-戊烯醛)、(+)-迈诺醇氧基((+)-manooloxy)(4-[(1S,4aS,8aS)-5,5,8a-三甲基-2-甲亚基十氢-1-萘基]-2-丁酮)、Z-11((3S,5aR,7aS,11aS,11bR)-3,8,8,11a-四甲基十二氢-3,5a-环氧萘并[2,1-c]氧杂七环)、γ-ambrol(2-[(1S,4aS,8aS)-5,5,8a-三甲基-2-甲亚基十氢-1-萘基]乙醇)和(降龙涎香醚,(3aR,5aS,9aS,9bR)-3a,6,6,9a-四甲基十二氢萘并[2,1-b]呋喃)。
在另一个实施方案中,本文提供的方法还包括使(+)-迈诺醇与合适的反应体系接触以将所述(+)-迈诺醇转化成合适的(+)-迈诺醇衍生物。所述合适的反应体系可以是酶促性质的(例如需要一种或多种酶)或化学性质的(例如需要一种或多种合成化学品)。
例如,可以使用文献中描述的方法(例如美国专利号7,294,492中所述)将(+)-迈诺醇通过酶催化转化成迈诺醇氧基或γ-ambrol,其中所述专利通过引用整体并入本文。
在又一个实施方案中,(+)-迈诺醇衍生物是柯巴醇及其与C1-C5羧酸形成的酯。
在又一个实施方案中,(+)-迈诺醇衍生物是与C1-C5羧酸形成的(+)-迈诺醇酯。
在一个实施方案中,(+)-迈诺醇衍生物是柯巴醛。
在一个实施方案中,(+)-迈诺醇衍生物是迈诺醇氧基。
在又一个实施方案中,(+)-迈诺醇衍生物是Z-11。
在一个实施方案中,(+)-迈诺醇衍生物是ambrol,或是其及其与C1-C5羧酸形成的酯的混合物,特别是γ-ambrol及其酯。
在另一个实施方案中,(+)-迈诺醇衍生物是香紫苏内酯(也称为3a,6,6,9a-四甲基十氢萘并[2,1-b]呋喃-2(1H)-酮及其全部非对映异构体和立体异构体)、3,4a,7,7,10a-五甲基十二氢-1H-苯并[f]色原烯-3-醇或3,4a,7,7,10a-五甲基-4a,5,6,6a,7,8,9,10,10a,10b-十氢-1H-苯并[f]色烯及其所有非对映异构体和立体异构体环酮和开环形式、(1R,2R,4aS,8aS)-1-(2-羟乙基)-2,5,5,8a-四甲基十氢萘-2-醇DOL、γ-ambrol。
在实施例中详细描述了如何能获得所述衍生物(例如三烯烃、乙酸酯或柯巴醇)的具体实例。
例如,根据EP 212254,根据本发明获得的迈诺醇可以被加工成迈诺醇氧基(一种酮,按照已知的方法),然后被加工成ambrol(一种醇)和降龙涎香醚(一种醚)。
多肽催化特定倍半萜合成的能力可通过进行本文提供的实施例中详述的酶测定来证实。
多肽也意味着包括截短的多肽,条件是它们保持它们的(+)-迈诺醇合酶活性和它们的香紫苏醇合酶活性。
如下文所期望的,通过修饰本文所述序列获得的核苷酸序列可以使用本领域已知的任何方法,例如通过引入任何类型的突变,例如缺失、插入或置换突变来进行。这种方法的例子列举在说明书中涉及变体多肽及其制备方法的部分中。
两个肽或核苷酸序列之间的同一性百分比是当产生这两个序列的比对时,两个序列中相同的氨基酸或核苷酸残基的数目的函数。相同的残基被定义为两个序列中在比对的给定位置的相同的残基。本文使用的序列同一性的百分比是从最佳比对中通过将两个序列之间相同的残基数除以最短序列中的残基总数并乘以100计算得到的。最佳比对是同一性百分比最高可能性的比对。可以将空位引入到一个或两个序列中的比对的一个或多个位置中以获得最佳比对。然后将这些空位考虑为用于计算序列同一性百分比的不相同的残基。用于确定氨基酸或核酸序列同一性百分比的比对可以使用计算机程序以及例如在互联网上可公开获得的计算机程序以多种方式实现。优选地,可使用设定为默认参数可从National Center for Biotechnology Information(NCBI)于http://www.ncbi.nlm.nih.gov/BLAST/bl2seq/wblast2.cgi获得的BLAST程序(Tatiana等,FEMSMicrobiol Lett.,1999,174:247-250,1999)来获得肽或核苷酸序列的最佳比对并计算序列同一性的百分比。
要与GGPP体外接触的多肽可以使用标准蛋白或酶提取技术从表达它的任何生物体中提取得到。如果宿主生物体是将本文实施方案的多肽释放到培养基中的单细胞生物体或细胞,那么可以简单地从所述培养基收集所述多肽,例如,通过离心,可选地随后进行洗涤步骤和再悬浮于适合的缓冲液中。在另一个实施方案中,GGPP可以与培养基中的多肽接触,其中多肽可以从宿主生物体、单细胞生物或细胞中释放。如果该生物体或细胞将多肽累积于其细胞中,那么可以通过破裂或裂解该细胞来获得该多肽。在从细胞裂解物中进一步提取多肽时,可以使GGPP与多肽接触,或通过与细胞裂解物接触而不必进行这种提取。
根据另一个具体实施方案,上述任何实施方案的方法在体内进行。本文提供的这些实施方案是特别有利的,因为可以在不预先分离多肽的情况下在体内进行该方法。该反应直接发生在经转化以表达所述多肽的生物体或细胞内。
所述生物体或细胞旨在“表达”多肽,条件是所述生物体或细胞经转化以包藏编码所述多肽的核酸,这种核酸被转录至mRNA并且在该宿主生物体或细胞中发现该多肽。术语“表达”涵盖“异源表达”和“过表达”,后者是指mRNA、多肽和/或酶活性的水平高于在未经转化的生物体或细胞中所测量的水平。随后,在致力于描述作为本文具体目的的此种经转化的非人宿主生物体或细胞的说明书部分中,将描述用于转化非人宿主生物体或细胞的适合方法的更详细说明。
特定的生物体或细胞,当其天然地产生GGPP或当其不天然地产生GGPP但是在使用本文所述的核酸转化之前或与使用所述核酸一起被转化以生产GGPP时,即“能够产生GGPP”。经转化以比天然存在的生物体或细胞产生更高量的GGPP的生物体或细胞也被“能够生产GGPP的生物体或细胞”所涵盖。已知几种转化生物(例如微生物)以使它们生产GGPP的方法,例如Schalk et al.,J.Am.Chem.Soc.,2013,134:18900-18903。
适合于在体内进行本文实施方案的方法的非人宿主生物体可以是任何非人多细胞或单细胞生物体。在一个具体的实施方案中,用来在体内进行本文实施方案的非人宿主生物体是植物、原核生物或真菌。可以使用任何植物、原核生物或真菌。特别有用的植物是天然产生高量萜烯的那些。在一个更具体的实施方案中,用来在体内进行本文实施方案的方法的非人宿主生物体是微生物。可以使用任何微生物,但根据甚至更具体的实施方案,所述微生物是细菌或酵母。更特别地,所述细菌是大肠杆菌,而所述酵母是酿酒酵母。
这些生物体的一些天然不产生GGPP,或者只产生少量的GGPP。为了适合于进行本文实施方案的方法,这些生物体必须经转化以生产所述前体,或经工程化以较大的量生产所述前体。如以上所说明的那样,它们可以在使用根据任一上述实施方案所述的核酸进行修饰之前或同时地被如此转化。
在一个实施方案中,用编码本文所述的CPP合酶或其变体的核酸和编码本文所述的香紫苏醇合酶或其变体的核酸转化能够生产GGPP的非人宿主生物体或细胞,其中该能够产生GGPP的非人宿主生物体或细胞已经被工程化以过表达GGPP合酶或用编码GGPP合酶的核酸转化。
在一个实施方案中,非人宿主生物体或细胞包含编码GGPP合酶的核酸,编码本文所述的CPP合酶或其变体的核酸,和编码本文所述的香紫苏醇合酶或其变体的核酸,其中至少一种所述核酸对非人宿主生物体或细胞是异源的。
也可以使用分离的高等真核细胞来代替完整的生物体作为宿主,以在体内实施本文实施方案的方法。合适的真核细胞可以是任何非人细胞,但特别是植物或真菌细胞。
根据另一个实施方案,在本文所述的任何实施方案中使用的或由本文所述的核酸编码的具有CPP合酶活性的多肽可以是通过基因工程获得的变体,条件是所述变体保持其CPP合酶活性。
根据另一个实施方案,在本文所述的任何实施方案中使用的或由本文所述的核酸编码的具有香紫苏醇合酶活性的多肽可以是通过基因工程获得的变体,条件是所述变体保持其香紫苏醇合酶活性或具有迈诺醇合酶活性。。
如本文所用,多肽旨在作为包含本文鉴定的氨基酸序列的多肽或肽片段,以及截短的或变体的多肽,条件是它们保持其CPP合酶活性及其香紫苏醇合酶活性和/或迈诺醇合酶活性。
变体多肽的例子是由交替mRNA剪接事件或本文所述多肽的蛋白水解切割产生的天然存在的蛋白。归因于蛋白水解的变化包括例如在不同类型的宿主细胞中表达时N-或C-末端的差异,这是由于从本文实施方案的多肽蛋白水解去除一个或多个末端氨基酸引起的。本文实施方案还涵盖了如下文所描述的,通过天然或人工突变本文实施方案的核酸获得的核酸所编码的多肽。
由在氨基和羧基末端融合额外的肽序列产生的多肽变体也可以用在本文实施方案的方法中。特别地,此种融合能够增强多肽的表达,有用于蛋白的纯化或改善多肽在期望环境或表达系统中的酶活性。此种额外的肽序列例如可以是信号肽。因此,本发明包括使用变体多肽(诸如通过与其他寡肽或多肽融合所获得的那些和/或连接到信号肽的那些)的方法。由与另一种功能肽(诸如来自萜生物合成路径的另一种蛋白)融合产生的多肽也可以有利地用于本文实施方案的方法中。
变体还可以通过附接与多肽骨架共价或非共价连接的修饰基团而与本文实施方案的多肽不同。
该变体还包括通过引入的N-连接或O-连接的糖基化位点和/或添加半胱氨酸残基而与本文所述多肽不同的多肽。技术人员将认识到如何修饰氨基酸序列并保持生物活性。
因此,在一个实施方案中,本发明提供了制备如任何上述实施方案中所述的,具有CPP合酶活性或香紫苏醇合酶活性或迈诺醇合酶活性的变体多肽的方法,并包括以下步骤:
(a)选择根据上述任一实施方案的核酸;
(b)修饰所选择的核酸以获得至少一种突变核酸;
(c)用突变核酸序列转化宿主细胞或单细胞生物,以表达由突变核酸序列编码的多肽;
(d)筛选具有至少一种修饰特性的多肽;和,
(e)可选地,如果多肽不具有所需的变体CPP合酶活性、香紫苏醇合酶活性或迈诺醇合酶活性,则重复方法步骤(a)至(d),直至获得具有所需变体CPP合酶活性、香紫苏醇合酶活性、或迈诺醇合酶活性的多肽;
(f)可选地,如果在步骤(d)中鉴定出具有所需变体CPP合酶活性或香紫苏醇合酶活性或迈诺醇合酶活性的多肽,则分离步骤(c)中获得的相应突变核酸。
根据一个实施方案,当与具有CPP合酶活性的多肽或香紫苏醇合酶活性组合时制备的变体多肽能够生产(+)-迈诺醇。
在步骤(b)中,可以例如通过随机诱变、位点特异性诱变或DNA改组产生大量突变核酸序列。基因改组的详细程序见于Stemmer,DNA shuffling by random fragmentationand reassembly:in vitro recombination for molecular evolution(Proc Natl AcadSci USA.,1994,91(22):10747-1075)。简而言之,DNA改组是指在试管内已知序列的随机重组过程,涉及至少两种选择用于重组的核酸。例如,可以通过合成含有突变序列的寡核苷酸在特定基因座处引入突变,所述突变序列侧翼为能够连接天然序列片段的限制性位点。连接后,得到的重构序列编码具有所需氨基酸插入、取代或缺失的类似物。或者,可以采用寡核苷酸定向的位点特异性诱变方法来提供改变的基因,其中可以通过取代、缺失或插入来改变预定的密码子。
可以获得并分离突变核酸,其可以根据标准程序用于转化宿主细胞,例如本实施例中公开的那样。
在步骤(d)中,筛选步骤(c)中获得的具有至少一种修饰特性,例如所需的修饰酶活性的多肽。可以筛选表达的多肽的所需酶活性的例子包括增强的或降低的酶活性,如通过KM或Vmax值、修饰的区域化学或立体化学和改变的底物利用或产物分布所测量的。酶活性的筛选可以根据技术人员熟悉的程序和本实施例中公开的程序进行。
步骤(e)提供过程步骤(a)-(d)的重复,其可以优选地并行进行。因此,通过产生大量突变核酸,可以同时用不同的突变核酸转化许多宿主细胞,从而允许随后筛选增加数量的多肽。因此,技术人员可自行决定增加获得所需变体多肽的机会。
除了本文公开的序列中显示的基因序列之外,对于本领域技术人员显而易见的是,DNA序列多态性可存在于给定群体内,这可导致本文公开的多肽的氨基酸序列的变化。由于天然等位基因变异,这种遗传多态性可能存在于来自不同群体或群体内的细胞中。等位变体还可包括功能等同物。
其他实施方案还涉及通过来自具体公开的核酸的此类序列多态性衍生的分子。这些天然变异通常在基因的核苷酸序列或本文公开的多肽的氨基酸序列中产生约1至5%的变化。如上所述,编码本文实施方案的多肽的核酸是修饰非人宿主生物体或在体内进行该方法时使用的细胞的有用工具。
因此,本文还提供了编码根据任何上述实施方案的多肽的核酸。
本文实施方案的核酸可以定义为包括单链或双链形式的脱氧核糖核苷酸或核糖核苷酸聚合物(DNA和/或RNA)。术语“核苷酸序列”还应理解为包含多核苷酸分子或寡核苷酸分子,其形式为单独的片段或作为较大核酸的组分。本文实施方案的核酸还包括某些分离的核苷酸序列,包括基本上不含污染内源物质的核苷酸序列。本文实施方案的核酸可被截短,条件是其编码如上所述本文包括的多肽。
在一个实施方案中,编码CPP合酶的本文实施方案的核酸可以天然存在于植物中,诸如丹参(Salvia miltiorrhiza),或其他物种,例如毛喉鞘蕊花(Coleus forskohlii),小麦(Triticum aestivum),欧夏至草(Marrubium vulgare)或迷迭香(Rosmarinusofficinalis),或者是通过修饰SEQ ID NO:3、SEQ ID NO:13、SEQ ID NO:16、SEQ ID NO:19、SEQ ID NO:22、SEQ ID NO:26、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31或SEQ IDNO:32获得。
在另一个实施方案中,编码香紫苏醇合酶的本文实施方案的核酸可以天然存在于植物中,诸如快乐鼠尾草(Salvia sclarea)或其他物种如烟草(Nicotiana glutinosa),或者可以通过修饰SEQ ID NO:6、SEQ ID NO:24、SEQ ID NO:27、SEQ ID NO:33或SEQ ID NO:34获得。
突变可以是这些核酸的任何种类的突变,例如点突变、缺失突变、插入突变和/或移码突变。可以制备变体核酸以使其核苷酸序列适应特定的表达系统。例如,如果氨基酸由特定密码子编码,则已知细菌表达系统更有效地表达多肽。
由于遗传密码的简并性,多于一个的密码子可以编码相同的氨基酸序列,多个核酸序列可以编码相同的蛋白质或多肽,所有这些DNA序列都涵盖在本文的实施方案中。在适当的情况下,可以对编码CPP合酶和香紫苏醇合酶的核酸序列进行优化以提高在宿主细胞中的表达。例如,可以使用宿主特有的密码子合成本文实施方案的核苷酸以改善表达。
用于转化适合于在体内实施本文实施方案的方法的宿主生物体或细胞的另一个重要工具是包含根据本文实施方案的任何实施方案的核酸的表达载体。因此,本文还提供了这种载体。
经转化以包藏本文实施方案的至少一种核酸以便异源表达或过表达本文实施方案的至少一种多肽的重组非人宿主生物体和细胞,也是实施本文实施方案的方法的非常有用的工具。因此,本文也提供这种非人宿主生物体和细胞。
根据任何上述实施方案的核酸可用于转化非人宿主生物体和细胞,并且经表达的多肽可以是任何上述多肽。
本文实施方案的非人宿主生物体可以是任何非人多细胞或单细胞生物体。在一个具体实施方案中,非人类宿主生物体是植物、原核生物或真菌。任何植物、原核生物或真菌都适合根据本文提供的方法进行转化。特别有用的植物是天然产生大量萜烯的植物。
在更具体的实施方案中,非人宿主生物体是微生物。任何微生物都适用于本文,但是根据甚至更具体的实施方案,所述微生物是细菌或酵母。最特别的是,所述细菌是大肠杆菌,而所述酵母是酿酒酵母。
除了完整的生物体,分离的高等真核细胞也可以被转化。作为高等真核细胞,这里是指除酵母细胞之外的任何非人真核细胞。特别的高等真核细胞是植物细胞或真菌细胞。
本文提供的实施方案包括但不限于cDNA、基因组DNA和RNA序列。
基因(包括本文实施方案的多核苷酸)可以通过本领域已知的方法基于可获得的核苷酸序列信息(诸如在所附的序列表中发现的)进行克隆。这些包括例如设计表示此种基因的侧翼序列的DNA引物,所述基因的一种是在有义取向上产生的并且初始化有义链的合成,而另一种以反向互补的方式创造并且产生反义链。诸如在聚合酶链反应中使用的那些热稳定的DNA聚合酶通常被用来进行此种实验。或者,代表基因的DNA序列可以被化学合成并且随后导入到DNA载体分子中,所述DNA载体分子可以通过例如相容性细胞(诸如大肠杆菌)来繁殖。
本文提供了通过SEQ ID NO:3、SEQ ID NO:13、SEQ ID NO:16、SEQ ID NO:19、SEQID NO:22、SEQ ID NO:26、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31或SEQ ID NO:32,和SEQ ID NO:6、SEQ ID NO:24、SEQ ID NO:27、SEQ ID NO:33或SEQ ID NO:34的突变获得的核酸序列。这种突变可以常规进行。本领域技术人员清楚的是,可以将一个或多个核苷酸的突变、缺失、插入和/或取代引入这些DNA序列中。
本文实施方案的编码CPP合酶和香紫苏醇合酶蛋白的核酸序列可以插入到表达载体中和/或包含在插入于表达载体中的嵌合基因中,以在宿主细胞或宿主生物体中产生CPP合酶和香紫苏醇合酶。用于将转基因插入到宿主细胞基因组中的载体在本领域是公知的,并且包括质粒、病毒、粘粒和人工染色体。其中插入了嵌合基因的二元或共整合载体也用于转化宿主细胞。
本文提供的实施方案提供了重组表达载体,其包含编码CPP合酶和香紫苏醇合酶的核酸,其分别与相关的核酸序列例如启动子序列可操作地连接。
或者,启动子序列可能已经存在于载体中,使得要被转录的核酸序列插入到启动子序列下游的载体中。载体通常被工程化以具有复制起点、多克隆位点和选择标记。
实施例
实施例1
二萜合酶基因。
两种二萜合酶是将香叶基香叶基二磷酸(GGPP)转化为迈诺醇所必需的:II型和I型二萜合酶。在以下实施例中,选择几种II型和I型二萜合酶组合并评价迈诺醇的制备。对于II型合酶,选择了五种柯巴基二磷酸(CPP)合酶:
-来自丹参(Salvia miltiorrhiza)的SmCPS,NCBI登录号ABV57835.1。
-来自毛喉鞘蕊花(Coleus forskohlii)的CfCPS1,NCBI登录号AHW04046.1。
-来自小麦(Triticum aestivum)的TaTps1,NCBI登录号BAH56559.1。
-来自欧夏至草(Marrubium vulgare)的MvCps3,NCBI登录号AIE77092.1。
-来自迷迭香(Rosmarinus officinalis)的RoCPS1,NCBI登录号AHL67261.1。
编码五种CPP合酶的cDNA的密码子使用被修饰以在大肠杆菌(DNA 2.0,MenloPark,CA 94025)中最佳表达,并且在5′-末端和3′-末端分别添加NdeI和KpnI限制性位点。此外,设计cDNA以表达重组CPP合酶,其具有预测的肽信号的缺失(对于SmCPS、CfCPS1、TaTps1、MvCps3和RoCPS1分别为58、63、59、63和67个氨基酸)。
对于I型二萜合酶,使用来自快乐鼠尾草(Salvia sclarea)(SsScS)的香紫苏醇合酶(NCBI登录号AET21246.1,WO2009095366)。优化cDNA的密码子使用用于大肠杆菌表达(DNA 2.0,Menlo Park,CA 94025),去除前50个N-末端密码子,并在5′-末端和3′-末端分别添加NdeI和KpnI限制性位点。所有cDNA在试管内合成并克隆到pJ208或pJ401质粒(DNA2.0,Menlo Park,CA 94025,USA)中。
实施例2
表达质粒。
用NdeI和KpnI消化经修饰的SmCPS编码cDNA(SmCPS2)和香紫苏醇合酶(SsScS)编码cDNA(1132-2-5_opt),并连接到pETDuet-1质粒中,分别提供pETDuet-SmCPS2和pETDuet-1132opt表达质粒。
构建另一种质粒以将SmCPS2和SsScS酶与香叶基香叶基二磷酸(GGPP)合酶共表达。对于GGPP合酶,使用编码GGPP合酶(NCBI登录号AAA24819.1)的成团泛菌(Pantoeaagglomerans)(NCBI登录号M38424.1)的CrtE基因。通过密码子优化合成CrtE基因,并在3′和5′末端添加NcoI和BamHI限制酶识别位点(DNA 2.0,Menlo Park,CA 94025,USA),并连接在pETDuet-1质粒的NcoI和BamHI位点之间,获得pETDuet-CrtE质粒。用NdeI和KpnI消化编码SmCPS2的cDNA,并连接到pETDuet-1-CrtE质粒中,从而提供pETDuet-CrtE-SmCPS2构建体。然后使用技术(Clontech,Takara Bio Europe)将编码截短的SsScS的优化的cDNA(1132-2-5_opt)引入到pETDuet-CrtE-SmCPS2质粒中。对于这种克隆,使用pETDuet-1132opt作为模板进行PCR扩增,该PCR扩增使用正向引物SmCPS2-1132Inf_F15′-CTGTTTGAGCCGGTCGCCTAAGGTACCAGAAGGAGATAAATAATGGCGAAAATGAAGGAGAACTTTAAACG-3′(SEQ ID NO:9)和反向引物1132-pET_Inf_R15′-GCAGCGGTTTCTTTACCAGACTCGAGGTCAGAACACGAAGCTCTTCATGTCCTCT-3′(SEQ ID NO:10)。将PCR产物连接到用KpnI和XhoI限制酶消化的质粒pETDuet-CrtE-SmCPS2中,并使用Dry-Down PCR克隆试剂盒(Clontech,Takara Bio Europe),提供新质粒pETDuet-CrtE-SmCPS2-SsScS。在该质粒中,CrtE基因处于pETDuet质粒的第一个T7启动子的控制下,编码CPP合酶和香紫苏醇合酶的cDNA在第二个T7启动子控制下的双顺反子构建体中组织。
将pETDuet-CrtE-SmCPS2-SsScS质粒用作构建携带其他四种CPP合酶编码酶的新表达质粒的模板。使用NdeI-KpnI限制性消化-连接方法用四种新的CPP合酶编码cDNA之一替换SmCPS2cDNA,提供新质粒pETDuet-CrtE-CfCPS1del63-SsScS,pETDuet-CrtE-TaTps1de159-SsScS,pETDuet-CrtE-MvCps3del63-SsScS和pETDuet-CrtE-RoCPS1de167-SsScS。
实施例3
在大肠杆菌中的异源表达和酶活性。
表达质粒(pETDuet-SmCPS2或pETDuet-1132opt)用于转化B121(DE3)大肠杆菌细胞(Novagene,Madison,WI)。使用经转化细胞的单菌落接种25ml LB培养基。在37℃温育5至6小时后,将培养物转移至20℃培养箱中并保持1小时以进行平衡。然后通过加入0.1mMIPTG来诱导蛋白质的表达,并将培养物在20℃温育过夜。第二天,通过离心收集细胞,重悬于0.1体积的50mMMOPSO(3-吗啉代-2-羟基丙磺酸钠盐,3-(N-吗啉基)-2-羟基丙磺酸钠盐)缓冲液中,pH7、10%甘油、1mM DTT并通过超声裂解。通过离心(在20,000g下30分钟)澄清提取物,并将含有可溶性蛋白质的上清液用于进一步的实验。
实施例4
试管内二萜合酶活性测定。
在Teflon密封的玻璃试管中进行酶测定,使用50~100μl蛋白提取物,最终体积为1mL的50mM MOPSO pH7、10%甘油,补充有20mM MgCl2,和50~200μM纯化的香叶基香叶基二磷酸(GGPP)(按照Keller和Thompson,J.Chromatogr 645(1),161-167所述制备)。将试管在30℃温育5至48小时,酶产物用一倍体积的戊烷萃取两次。在氮流通下浓缩后,通过GC-MS分析提取物并与对照蛋白的提取物(从用空质粒转化的细胞获得)进行比较。GC-MS分析是在装有DB 1柱(30m×0.25mm×0.25mm膜厚;Agilent)并连接有5975系列质谱仪的Agilent6890系列GC系统上进行的。载气是1ml/min的恒定流量的氦气。注射为分流模式,注射器温度设定在260℃,烘箱温度程序升温以10℃/min从100℃升至225℃,然后以30℃/min升至280℃。根据真实标准的保留指数和质谱的一致性来确认产物的特性。
在这些条件下,用来自质粒pETDuet-SmCPS2或pETDuet-1132opt(分别异源表达SmCPS或ScScS酶)转化的大肠杆菌细胞的重组蛋白,在溶剂提取物中未检测到二萜分子的产生(在这些条件下没有检测到含二磷酸的二萜)。然后进行类似的测定,但将单次测定中含有重组SmCPS和SsScS的2种蛋白质提取物组合。在这些测定中,形成一种主要产物,并通过质谱和保留指数与真实标准的匹配鉴定为(+)-迈诺醇(图3)。该实验证明,香紫苏醇合酶可与CPP合酶一起使用以产生迈诺醇。
实施例5
使用大肠杆菌细胞进行体内迈诺醇生产。
使用大肠杆菌细胞来评估使用全细胞培养物的迈诺醇的体内生产。插入实施例2中描述的共表达质粒中的CrtE基因编码具有GGPP合酶活性的酶,其使用法呢基二磷酸(FPP)产生香叶基香叶基二磷酸(GGPP)。为了增加内源性GGPP库的水平并因此提高细胞中二萜的生产力,在相同的细胞中共表达了导致FPP的异源完整甲羟戊酸途径。该途径的酶使用含有在两个启动子控制下的两个操纵子中组织的所有基因的单一质粒来表达。该表达质粒的构建描述于专利申请WO2013064411或Schalk等(J.Am.Chem.Soc.,2013,134:18900-18903)。由大肠杆菌乙酰乙酰-CoA硫解酶(atoB)、金黄色葡萄球菌HMG-CoA合酶(mvaS)、金黄色葡萄球菌HMG-CoA还原酶(mvaA)和酿酒酵母FPP合酶(ERG20)基因组成的第一合成操纵子在试管内合成(DNA2.0,Menlo Park,CA,USA)并连接到NcoI-BamHI消化的pACYCDuet-1载体(Invitrogen)中,产生pACYC-29258。从肺炎链球菌(ATCC BAA-334)的基因组DNA扩增出含有甲羟戊酸激酶(MvaK1)、磷酸甲羟戊酸激酶(MvaK2)、二磷酸甲羟戊酸脱羧酶(MvaD)和异戊烯基二磷酸异构酶(idi)的第二操纵子,并连接到pACYC-29258的第二多克隆位点中,提供质粒pACYC-29258-4506。因此该质粒含有编码从乙酰辅酶A到FPP的生物合成途径的所有酶的基因。
用质粒pACYC-29258-4506和选自pETDuet-CrtE-SmCPS2-SsSc、pETDuet-CrtE-CfCPS1del63-SsScS、pETDuet-CrtE-TaTps1del59-SsScS、pETDuet-CrtE-MvCps3del63-SsScS或pETDuet-CrtE-RoCPS1del67-SsScS的一种质粒共转化KRX大肠杆菌细胞(Promega)。在羧苄青霉素(50μg/ml)和氯霉素(34μg/ml)LB-琼脂糖平板上选择经转化的细胞。使用单菌落接种5mL补充有相同抗生素的液体LB培养基。培养物在37℃温育过夜。第二天,用0.2mL过夜培养物接种2mL添加有相同抗生素的TB培养基。在37℃温育6小时后,将培养物冷却至28℃,向各试管中加入0.1mM IPTG,0.2%鼠李糖和1∶10体积的癸烷。培养物在28℃下温育48小时。然后将培养物用2倍体积的MTBE(甲基叔丁基醚)提取两次,将有机相浓缩至500μL,并如上面实施例4中所述通过GC-MS进行分析,不同之处在于烘箱温度于100℃保持1分钟,接着以10℃/分钟的温度梯度升至220℃并以20℃/分钟升至3000℃。
在这些培养条件下,用II型二萜合酶和快乐鼠尾草香紫苏醇合酶(SsScS)的每种组合生产迈诺醇(图4和图5)。所生产的二萜化合物的量使用内标(α-长叶蒎烯)来定量。下表显示了当ScScS与各种II型二萜合酶结合时,相对于SmCPS/SsScS组合所生产的迈诺醇的量(在这些实验条件下,表达SmCPS和SsScS的细胞生产的迈诺醇浓度为300~500mg/L(图4))。在这些条件下,所生产的迈诺醇的最高相对量是以TaTps1del59组合产生的。
II型二萜合酶 I型二萜合酶 所生产的迈诺醇的相对量
SmCPS2 ScScS 100
CfCPS1del63 ScScS 125.3
TaTps1del59 ScScS 139.4
MvCps3del63 ScScS 14.9
RoCPS1del67 ScScS 77.7
实施例6
使用重组细胞生产(+)-迈诺醇、纯化和NMR分析。
使用SmCPS/SsScS酶组合在实施例5中描述的条件下制备1升大肠杆菌培养物,不同之处在于用50g/L Amberlite XAD-4代替癸烷有机相用于固相萃取。过滤培养基以回收树脂。然后用3倍柱体积的水洗涤树脂,并用3倍柱体积的MTBE洗脱。然后通过硅胶快速色谱法使用由庚烷:MTBE为8:2(v/v)组成的流动相进一步纯化产物。使用Bruker Avance500MHz光谱仪通过1H-和13C-NMR确认迈诺醇的结构。使用Perkin-Elmer 241旋光仪测量旋光度,[α]D 20=+26.9°(0.3%、CHCl3)的值证实了(+)-迈诺醇的生成。
实施例7
使用来自烟草(Nicotiana glutinosa)的香紫苏醇合酶在大肠杆菌细胞中体内生产迈诺醇。
来自植物烟草(Nicotiana glutinosa)的香紫苏醇合酶描述于WO2014/022434中,并显示由赖百当稀二醇(labdenediol)二磷酸(LPP)生产香紫苏醇。评估了WO2014/022434中描述的两种香紫苏醇合酶,NgSCS-del29(对应于WO2014/0224中的SEQ ID NO:78)和NgSCS-del38(对应于WO2014/022434的SEQ ID NO:40),在与实施例5类似的条件下生产(+)-迈诺醇。
设计编码NgSCS-del29的eDNA,其密码子使用对大肠杆菌表达优化,并且分别在5′-末端和3′-末端包括KpnI和XhoI位点。该DNA通过DNA 2.0(Newark,CA 94560)合成。
将pETDuet-CrtE-SmCPS2-SsScS质粒(实施例2)用作构建新表达质粒的模板。用KpnI和XhoI限制性位点消化pETDuet-CrtE-SmCPS2-SsScS质粒,用NgSCS-del29 cDNA替换SsScS cDNA,得到新的pETDuet-CrtE-SmCPS2-del29质粒。
用质粒pACYC-29258-4506(实施例5)和pETDuet-CrtE-SmCPS2-del29质粒共转化KRX大肠杆菌细胞(Promega)。如实施例5中所述,选择经转化的细胞并在生产二萜的条件下培养。使用GC-MS分析来评估二萜的产生,并使用内标(α-长叶蒎烯)定量所生产的二萜化合物。使用二萜合酶SmCPS2和NgSCS-del29的新组合,通过经转化的大肠杆菌细胞生产迈诺醇(图6)。在所用的实验条件下,二萜合酶SmCPS2和NgSCS-del38的组合不产生迈诺醇。因此,所测试的烟草(Nicotiana glutinosa)香紫苏醇合酶中的至少一种也可用于从CPP生产迈诺醇。然而,使用烟草(Nicotiana glutinosa)合酶生产的量远低于SsSCS合酶(见下表)。
II型二萜合酶 I型二萜合酶 所生产的迈诺醇的相对量
SmCPS2 SsScS 100
SmCPS2 NgSCS-del29 3.1
实施例8
根据以下实验部分,将以上实施例中获得的迈诺醇转化为其酯(在下文中作为转化为其乙酸酯的例子):
根据文献(G.Ohloff,Helv.Chim.Acta 41,845(1958)),用20.0g(0.25摩尔)乙酰氯在100m1的二甲基苯胺中在室温下处理32.0g(0.11摩尔)纯结晶(+)-迈诺醇5天。将混合物另外在50℃下加热7小时以达到100%的转化率。冷却后,反应混合物用乙醚稀释,依次用10%H2SO4、NaHCO3水溶液和水洗至中性。干燥(Na2SO4)并浓缩后,蒸馏产物(球对球,B.p.=160°,0.1毫巴),得到20.01g(79.4%)的乙酸迈诺醇酯,其未经进一步纯化即使用。
MS:M+332(0);m/e:272(27),257(83),137(62),95(90),81(100).
1H-NMR(CDCl3):0.67,0.80,0.87,1.54and 2.01(5s,3H各自),4.49(s,1H),4.80(s,1H),5.11(m,1H),5.13(m,1H),5.95(m,1H).
13C-NMR(CDCl3):14.5(q),17.4(t),19.4(t),21.7(q),22.2(q),23.5(q),24.2(t),33.5(s),33.6(t),38.3(t),39.0(t),39.3(t),39.8(s),42.2(t),55.6(d),57.2(t),83.4(s),106.4(t),113.0(t),142.0(d),148.6(s),169.9(s).
实施例9
根据以下实验部分,将上述实施例中得到的乙酸迈诺醇酯转化为其三烯(在下文中作为转化为香紫苏烯(Sclarene)和(Z+E)泪柏烯((Z+E)-Biformene)的例子):
在室温下向0.4g乙酸迈诺醇酯在4ml环己烷中的溶液中加入0.029g(0.05当量)BF3.AcOH络合物。在室温下15分钟后,将反应用NaHCO3水溶液淬灭并用水洗至中性。GC-MS分析显示只有被鉴定为香紫苏烯、(Z)和(E)-泪柏烯的烃。没有检测到乙酸柯巴醇酯。
另一个具有更多催化剂(0.15当量)的试验给出了相同的结果。
·香紫苏烯:MS:M+272(18);m/e:257(100),149(15),105(15).
·(Z)和(E)-泪柏烯(相同光谱:Ms:M+272(29);m/e:257(100),187(27),161(33),105(37).
实施例10
根据以下实验部分,将以上实施例中获得的迈诺醇转化为柯巴基酯(下文作为转化为乙酸酯的例子):
在室温下向0.474g(0.826毫摩尔,0.27当量)BF3.AcOH在100毫升环己烷中的溶液中加入4.4g乙酸酐和12.1g乙酸。在室温下,加入10.0g(33毫摩尔)在15ml环己烷中的纯结晶迈诺醇(缓慢放热),并用水浴将温度保持在室温。在室温下搅拌30分钟后,GC对照显示没有起始材料。将反应混合物用300ml饱和NaHCO3水溶液淬灭,并照常处理。通过快速色谱(SiO2,戊烷/乙醚95:5)和球对球蒸馏(Eb.=130°,0.1毫巴)纯化粗混合物(9.9g),得到4.34g(37.1%)的(Z)和(E)-柯巴基乙酸酯的27/73混合物。
·(Z)-柯巴基乙酸酯:
MS:M+332(0);m/e:317(2),272(35)=,257(100),137(48),95(68),81(70).
1H-NMR(CDCl3):0.67,0.80,0.871.76 and 2.04(5s,3H each),4.86(s,1H),5.35(t:J=6Hz,1H).
·(E)-柯巴基乙酸酯:
MS:M+332(0);m/e:317(2),272(33)=,257(100),137(54),95(67),81(74).
1H-NMR(CDCl3):0.68,0.80,0.871.70 and 2.06(5s,3H each),4.82(s,1H),5.31(t:J=6Hz,1H).
13C-NMR(CDCl3):(在(Z/E)混合物上记录的光谱,仅给出显著信号):61.4(t),106.2(t),117.9(d),143.1(s),148.6(s),171.1(s).
实施例11
根据以下实验部分,将上述实施例中得到的柯巴基乙酸酯转化为柯巴醇:
将柯巴基乙酸酯(4.17g,12.5毫摩尔)、KOH粒料(3.35g,59.7毫摩尔)、水(1.5g)和EtOH(9.5ml)混合在一起,并在50℃下搅拌3小时。在通常的处理后,得到3.7g粗产物(Z+E)-柯巴醇,并通过快速色谱(SiO2,戊烷/乙醚7∶2)纯化,蒸发溶剂后,进行球对球蒸馏(Eb=170°,0.1毫巴)提供3.25g(92%)的(Z)和(E)-柯巴醇的27/73混合物。
·(Z)-柯巴醇
MS:M+290(3);m/e:275(18),272(27),257(82),137(71),95(93),81(100),69(70).
1H-NMR(CDCl3):0.67,0.80,0.87and 1.74(4s,3H各自);4.06(m,2H),4.55(s,1H),4.86(s,1H),5.42(t:J=6Hz,1H).
·(E)-柯巴醇
MS:M+290(3);m/e:275(27),272(22),257(75),137(75),95(91),81(100),69(68).
1H-NMR(CDCl3):0.68,0.80,0.87and 1.67(4s,3H各自);4.15(m,2H),4.51(s,1H),4.83(s,1H),5.39(t,J=6Hz,1H)
13C-NMR(CDCl3):(在(Z/E)混合物上记录的光谱,仅给出显著信号):59.4(t),106.2(t),123.0(d),140.6(s),148.6(s).
实施例12
使用CPP合酶和香紫苏醇合酶的不同组合在酿酒酵母细胞中体内生产迈诺醇。
评估I类和II类二萜合酶的不同组合在酿酒酵母细胞中迈诺醇的生产。
对于II类二萜合酶,选择了五种CPP合酶:
-来自丹参(Salvia miltiorrhiza)的SmCPS,NCBI登录号ABV57835.1。
-来自毛喉鞘蕊花(Coleus forskohlii)的CfCPS1,NCBI登录号AHW04046.1。
-来自小麦(Triticum aestivum)的TaTps1,NCBI登录号BAH56559.1。
-来自欧夏至草(Marrubium vulgare)的MvCps3,NCBI登录号AIE77092.1。
-来自迷迭香(Rosmarinus officinalis)的RoCPS1,NCBI登录号AHL67261.1。
对于I类,选择了来自烟草(Nicotiana glutinosa)的两种推定的香紫苏醇合酶和来自快乐鼠尾草(Salvia sclarea)的一种:
-NgSCS-del38(对应于WO2014/022434的SEQ ID NO:40)。
-NgSCS-del29(对应于WO2014/022434的SEQ ID NO:78)。
-来自快乐鼠尾草(Salvia sclarea)的SsScS,NCBI登录号AET21246.1。
编码不同CPP合酶的DNA的密码子使用被修饰以在酿酒酵母中最佳表达。此外,设计DNA序列以表达重组CPP合酶,其具有预测的肽信号的缺失(对于SmCPS、CfCPS1、TaTps1、MvCps3和RoCPS1分别为58、63、59、63和67个氨基酸)。NgSCS-del38、NgSCS-del29和SaSCSDNA序列也针对酿酒酵母表达进行密码子优化。
为了在酿酒酵母中表达不同基因,使用酵母内源同源重组体在体内构建一组质粒,如先前描述于Kuijpers et al.,Microb Cell Fact.,2013,12∶47。每种质粒由六个DNA片段组成,用于酿酒酵母共转化。这些片段是:
a)LEU2酵母标记,使用引物5′AGGTGCAGTTCGCGTGCAATTATAACGTCGTGGCAACTGTTATCAGTCGTACCGCGCCATTCGACTACGTCGTAAGGCC-3′(SEQ ID NO:44)和5′TCGTGGTCAAGGCGTGCAATTCTCAACACGAGAGTGATTCTTCGGCGTTGTTGCTGACCATCGACGGTCGAGGAGAACTT-3′(SEQ ID NO:45)通过PCR用质粒pESC-LEU(Agilent Technologies,California,USA)作为模板构建;
b)AmpR大肠杆菌标记,使用引物5′-TGGTCAGCAACAACGCCGAAGAATCACTCTCGTGTTGAGAATTGCACGCCTTGACCACGACACGTTAAGGGATTTTGGTCATGAG-3′(SEQ ID NO:37)和5′-AACGCGTACCCTAAGTACGGCACCACAGTGACTATGCAGTCCGCACTTTGCCAATGCCAAAAATGTGCGCGGAACCCCTA-3′(SEQ ID NO:38)通过PCR用质粒pESC-URA作为模板构建;
c)酵母复制起点,使用引物5′-TTGGCATTGGCAAAGTGCGGACTGCATAGTCACTGTGGTGCCGTACTTAGGGTACGCGTTCCTGAACGAAGCATCTGTGCTTCA-3’(SEQ ID NO:39)和5′-CCGAGATGCCAAAGGATAGGTGCTATGTTGATGACTACGACACAGAACTGCGGGTGACATAATGATAGCATTGAAGGATGAGACT-3’(SEQ ID NO:40)通过PCR用pESC-URA作为模板获得;
d)大肠杆菌复制起点,使用引物5′-ATGTCACCCGCAGTTCTGTGTCGTAGTCATCAACATAGCACCTATCCTTTGGCATCTCGGTGAGCAAAAGGCCAGCAAAAGG-3′(SEQ ID NO:41)和5′-CTCAGATGTACGGTGATCGCCACCATGTGACGGAAGCTATCCTGACAGTGTAGCAAGTGCTGAGCGTCAGACCCCGTAGAA-3′(SEQ ID NO:42)通过PCR用质粒PESC-URA作为模板获得;
e)由片段“d”的最后60个核苷酸,酵母基因PGK1的终止密码子下游200个核苷酸,GGPP合酶编码序列CrtE(来自成团泛菌,NCBI登录号M38424.1)密码子优化其在酿酒酵母中的表达,GAL10/GAL1的双向酵母启动子,所测试的香紫苏醇合酶编码序列之一,酵母基因CYC1的终止密码子下游200个核苷酸和序列5′-ATTCCTAGTGACGGCCTTGGGAACTCGATACACGATGTTCAGTAGACCGCTCACACATGG-3′(SEQ ID NO:43)组成的片段,该片段通过DNA合成(DNA2.0,Menlo Park,CA 94025)获得,以及
f)由片段“e”的最后60个核苷酸,酵母基因CYC1的终止密码子下游200个核苷酸,所测试的CPP合酶编码序列之一,GAL10/GAL1的双向酵母启动子和对应于片段“a”开头的60个核苷酸组成的片段,该片段通过DNA合成(DNA 2.0,Menlo Park,CA 94025)获得。
总共构建了15种质粒,其涵盖了上面列出的I类和II类二萜合酶的所有可能组合。下表显示了所有质粒。
质粒名称 II类二萜合酶 I类二萜合酶
Nm SmCPS2 SsScS
Cf CfCPS1del63 SsScS
Mv MvCps3del63 SsScS
Ro RoCPS1del67 SsScS
Ta TaTps1del59 SsScS
Nt_Sm SmCPS2 NgSCS-del38
Nt_Cf CfCPS1del63 NgSCS-del38
Nt_Mv MvCps3del63 NgSCS-del38
Nt_Ro RoCPS1del67 NgSCS-del38
Nt_Ta TaTps1del59 NgSCS-del38
Nt2_Sm SmCPS2 NgSCS-del29
Nt2_Cf CfCPS1del63 NgSCS-del29
Nt2_Mv MvCps3del63 NgSCS-del29
Nt2_Ro RoCPS1del67 NgSCS-del29
Nt2_Ta TaTps1del59 NgSCS-del29
为了增加酿酒酵母细胞中内源性法呢基二磷酸(FPP)库的水平,参与甲羟戊酸途径的所有酵母内源基因的额外拷贝,从编码乙酰-CoA C-乙酰转移酶的ERG10到编码FPP合酶的ERG20,在半乳糖诱导型启动子的控制下,整合到酿酒酵母菌株CEN.PK2-1C(Euroscarf,Frankfurt,Germany)的基因组中,类似于Paddon et al.,Nature,2013,496:528-532中所述。简而言之,三个盒分别整合在LEU2、TRP1和URA3基因座中。包含基因ERG20和截短的HMG1(tHMG1)的第一盒,如Donald et al.,Proc Natl Acad Sci USA,1997,109:E111-8中所述,在双向启动子GAL10/GAL1和基因ERG19和ERG13的控制下,并在GAL10/GAL1启动子控制下,该盒侧接了对应于LEU2的上游和下游部分的两个100核苷酸区域。第二盒,其中基因IDI1和tHMG1在GAL10/GAL1启动子和基因ERG13的控制下,在GAL7启动子区域的控制下,该盒侧接了对应于TRP1的上下游部分的两个100核苷酸区域。具有基因ERG10、ERG12、tHMG1和ERG8的第三盒,均在GAL10/GAL1启动子的控制下,该盒侧接了对应于URA3的上游和下游部分的两个100核苷酸区域。三个盒中的所有基因包括其自身终止子区的200个核苷酸。另外,如在Griggs and Johnston,Proc Natl Acad Sci USA,1991,88:8597-8601中所述,在其自身启动子的突变形式的控制下的GAL4的额外拷贝整合在ERG9启动子区的上游。此外,ERG9的内源启动子被CTR3的酵母启动子区域替换,产生菌株YST035。最后,YST035与菌株CEN.PK2-1D(Euroscarf,Frankfurt,Germany)结合,获得命名为YST045的二倍体菌株。
用体内质粒装配所需的上述片段转化YST045。如Gietz and Woods,MethodsEnzymol.,2002,350:87-96中所述,用乙酸锂方案进行酵母转化。将转化混合物涂布在含有6.7g/L无氨基酸的酵母氮碱(BD Difco,New Jersey,USA),1.6g/L不含亮氨酸的滴注补充物(Sigma Aldrich,Missouri,USA),20g/L葡萄糖和20g/L琼脂的SmLeu培养基上。将板在30℃下温育3至4天。如Westfall et al.,Proc Natl Acad Sci USA,2012,109:E111-118中所述,使用单细胞在培养物中生产迈诺醇。
在这些培养条件下,一些II型和I型二萜合酶的组合产生了迈诺醇。使用GC-MS分析来评估迈诺醇的生产并使用内标进行定量。下表显示了相对于SmCPS/SsScS组合所生产的迈诺醇的量(在这些实验条件下,表达SmCPS和SsScS的细胞所生产的迈诺醇浓度为100至250 mg/L,为所生产的迈诺醇的最高量)。
II类二萜合酶 I类二萜合酶 所生产的迈诺醇的相对量
SmCPS2 SsScS 100
CfCPS1del63 SsScS 67
MvCps3del63 SsScS 1
RoCPS1del67 SsScS 29
TaTps1del59 SsScS 16
SmCPS2 NgSCS-del38 0
CfCPS1del63 NgSCS-del38 0
MvCps3del63 NgSCS-del38 0
RoCPS1del67 NgSCS-del38 0
TaTps1del59 NgSCS-del38 0
SmCPS2 NgSCS-del29 0
CfCPS1del63 NgSCS-del29 0
MvCps3del63 NgSCS-del29 0
RoCPS1del67 NgSCS-del29 0
TaTps1del59 NgSCS-del29 0
序列表
SEQ ID NO:1
SmCPS,来自丹参(Salvia miltiorrhiza)的全长柯巴基二磷酸合酶
SEQ ID NO:2
SmCPS2,来自丹参(S.miltiorrhiza)的截短的柯巴基二磷酸合酶
SEQ ID NO:3
SmCPS2opt,经优化的用于大肠杆菌(E.coli)表达的编码SmCPS2的cDNA
SEQ ID NO:4
来自快乐鼠尾草(Salvia sclarea)的全长香紫苏醇合酶
SEQ ID NO:5
来自快乐鼠尾草(Salvia sclarea)的截短的香紫苏醇合酶(SsScS)
SEQ ID NO:6
1132-2-5_opt,经优化的用于大肠杆菌(E.coli)表达的编码来自快乐鼠尾草(Salvia sclarea)的截短的香紫苏醇合酶的cDNA
SEQ ID NO:7
来自成团泛菌(Pantoea agglomerans)的GGPP合酶
SEQ ID NO:8
CrtEopt,经优化的编码来自成团泛菌(Pantoea agglomerans)的GGPP合酶的cDNA
SEQ ID NO:9
正向引物SmCPS2-1132Inf_F1
SEQ ID NO:10
反向引物1132-pET_Inf_R1
SEQ ID NO:11
CfCPS1,来自毛喉鞘蕊花(Coleus forskohlii)的全长柯巴基二磷酸合酶
SEQ ID NO:12
CfCPS1-del63,来自毛喉鞘蕊花(Coleus forskohlii)的截短的柯巴基二磷酸合酶
SEQ ID NO:13
经优化的用于大肠杆菌(E.coli)表达的编码CfCPS1-del63的cDNA
SEQ ID NO:14
TaTps1,来自小麦(Triticum aestivum)的全长柯巴基二磷酸合酶
SEQ ID NO:15
TaTps1-del59,来自小麦(Triticum aestivum)的截短的柯巴基二磷酸合酶
SEQ ID NO:16
经优化的用于大肠杆菌(E.coli)表达的编码TaTps1-del59的cDNA
SEQ ID NO:17
MvCps3,来自欧夏至草(Marrubium vulgare)的全长柯巴基二磷酸合酶
SEQ ID NO:18
MvCps3-del63,来自欧夏至草(Marrubium vulgare)的截短的柯巴基二磷酸合酶
SEQ ID NO:19
经优化的用于大肠杆菌(E.coli)表达的编码MvCps3-del63的cDNA
SEQ ID NO:20
RoCPS1,来自迷迭香(Rosmarinus officinalis)的全长柯巴基二磷酸合酶
SEQ ID NO:21
RoCPS1-del67,来自迷迭香(Rosmarinus officinalis)的截短的柯巴基二磷酸合酶
SEQ ID NO:22
经优化的用于大肠杆菌(E.coli)表达的编码RoCPS1-del67的cDNA
SEQ ID NO:23
NgSCS-del29,来自烟草(Nicotiana glutinosa)的截短的推定香紫苏醇合酶
SEQ ID NO:24
经优化的用于大肠杆菌(E.coli)表达的编码NgSCS-del29的cDNA
SEQ ID NO:25
NgSCS-del38,来自烟草(Nicotiana glutinosa)的推定香紫苏醇合酶
SEQ ID NO:26
经优化的用于酿酒酵母(Saccharomyces cerevisiae)表达的编码SmCPS2的cDNA
SEQ ID NO:27
经优化的用于酿酒酵母(S.cerevisiae)表达的编码来自快乐鼠尾草(Salviasclarea)的截短的SsScS的cDNA
SEQ ID NO:28
经优化的用于酿酒酵母(S.cerevisiae)表达的编码来自成团泛菌(Pantoeaagglomerans)的GGPP合酶的cDNA
SEQ ID NO:29
经优化的用于酿酒酵母(S.cerevisiae)表达的编码CfCPS1-del63的cDNA
SEQ ID NO:30
经优化的用于酿酒酵母(S.cerevisiae)表达的编码TaTps1-del59的cDNA
SEQ ID NO:31
经优化的用于酿酒酵母(S.cerevisiae)表达的编码MvCps3-del63的cDNA
SEQ ID NO:32
经优化的用于酿酒酵母(S.cerevisiae)表达的编码RoCPS1-del67的cDNA
SEQ ID NO:33
经优化的用于酿酒酵母(S.cerevisiae)表达的编码NgSCS-del29的cDNA
SEQ ID NO:34
经优化的用于酿酒酵母(S.cerevisiae)表达的编码NgSCS-del38的cDNA
SEQ ID NO:35
用于构建片段“a”的引物(URA3酵母标记)
SEQ ID NO:36
用于构建片段“a”的引物(URA3酵母标记)
SEQ ID NO:37
用于构建片段“b”的引物(AmpR大肠杆菌标记)
SEQ ID NO:38
用于构建片段“b”的引物(AmpR大肠杆菌标记)
SEQ ID NO:39
用于构建片段“c”的引物(酵母复制起点)
SEQ ID NO:40
用于构建片段“c”的引物(酵母复制起点)
SEQ ID NO:41
用于构建片段“d”的引物(大肠杆菌复制起点)
SEQ ID NO:42
用于构建片段“d”的引物(大肠杆菌复制起点)
SEQ ID NO:43
通过DNA合成获得的片段“d”的一部分
SEQ ID NO:44
用于构建片段“a”的引物(LEU2酵母标记)
SEQ ID NO:45
用于构建片段“a”的引物(LEU2酵母标记)
SEQUENCE LISTING
<110> 弗门尼舍有限公司(Firmenich S.A.)
<120> 迈诺醇的生产(Production of Manool)
<130> 9950_PCT
<150> EP 16206349.9
<151> 2016-12-22
<160> 45
<170> PatentIn version 3.5
<210> 1
<211> 793
<212> PRT
<213> 丹参(Salvia miltiorrhiza)
<400> 1
Met Ala Ser Leu Ser Ser Thr Ile Leu Ser Arg Ser Pro Ala Ala Arg
1 5 10 15
Arg Arg Ile Thr Pro Ala Ser Ala Lys Leu His Arg Pro Glu Cys Phe
20 25 30
Ala Thr Ser Ala Trp Met Gly Ser Ser Ser Lys Asn Leu Ser Leu Ser
35 40 45
Tyr Gln Leu Asn His Lys Lys Ile Ser Val Ala Thr Val Asp Ala Pro
50 55 60
Gln Val His Asp His Asp Gly Thr Thr Val His Gln Gly His Asp Ala
65 70 75 80
Val Lys Asn Ile Glu Asp Pro Ile Glu Tyr Ile Arg Thr Leu Leu Arg
85 90 95
Thr Thr Gly Asp Gly Arg Ile Ser Val Ser Pro Tyr Asp Thr Ala Trp
100 105 110
Val Ala Met Ile Lys Asp Val Glu Gly Arg Asp Gly Pro Gln Phe Pro
115 120 125
Ser Ser Leu Glu Trp Ile Val Gln Asn Gln Leu Glu Asp Gly Ser Trp
130 135 140
Gly Asp Gln Lys Leu Phe Cys Val Tyr Asp Arg Leu Val Asn Thr Ile
145 150 155 160
Ala Cys Val Val Ala Leu Arg Ser Trp Asn Val His Ala His Lys Val
165 170 175
Lys Arg Gly Val Thr Tyr Ile Lys Glu Asn Val Asp Lys Leu Met Glu
180 185 190
Gly Asn Glu Glu His Met Thr Cys Gly Phe Glu Val Val Phe Pro Ala
195 200 205
Leu Leu Gln Lys Ala Lys Ser Leu Gly Ile Glu Asp Leu Pro Tyr Asp
210 215 220
Ser Pro Ala Val Gln Glu Val Tyr His Val Arg Glu Gln Lys Leu Lys
225 230 235 240
Arg Ile Pro Leu Glu Ile Met His Lys Ile Pro Thr Ser Leu Leu Phe
245 250 255
Ser Leu Glu Gly Leu Glu Asn Leu Asp Trp Asp Lys Leu Leu Lys Leu
260 265 270
Gln Ser Ala Asp Gly Ser Phe Leu Thr Ser Pro Ser Ser Thr Ala Phe
275 280 285
Ala Phe Met Gln Thr Lys Asp Glu Lys Cys Tyr Gln Phe Ile Lys Asn
290 295 300
Thr Ile Asp Thr Phe Asn Gly Gly Ala Pro His Thr Tyr Pro Val Asp
305 310 315 320
Val Phe Gly Arg Leu Trp Ala Ile Asp Arg Leu Gln Arg Leu Gly Ile
325 330 335
Ser Arg Phe Phe Glu Pro Glu Ile Ala Asp Cys Leu Ser His Ile His
340 345 350
Lys Phe Trp Thr Asp Lys Gly Val Phe Ser Gly Arg Glu Ser Glu Phe
355 360 365
Cys Asp Ile Asp Asp Thr Ser Met Gly Met Arg Leu Met Arg Met His
370 375 380
Gly Tyr Asp Val Asp Pro Asn Val Leu Arg Asn Phe Lys Gln Lys Asp
385 390 395 400
Gly Lys Phe Ser Cys Tyr Gly Gly Gln Met Ile Glu Ser Pro Ser Pro
405 410 415
Ile Tyr Asn Leu Tyr Arg Ala Ser Gln Leu Arg Phe Pro Gly Glu Glu
420 425 430
Ile Leu Glu Asp Ala Lys Arg Phe Ala Tyr Asp Phe Leu Lys Glu Lys
435 440 445
Leu Ala Asn Asn Gln Ile Leu Asp Lys Trp Val Ile Ser Lys His Leu
450 455 460
Pro Asp Glu Ile Lys Leu Gly Leu Glu Met Pro Trp Leu Ala Thr Leu
465 470 475 480
Pro Arg Val Glu Ala Lys Tyr Tyr Ile Gln Tyr Tyr Ala Gly Ser Gly
485 490 495
Asp Val Trp Ile Gly Lys Thr Leu Tyr Arg Met Pro Glu Ile Ser Asn
500 505 510
Asp Thr Tyr His Asp Leu Ala Lys Thr Asp Phe Lys Arg Cys Gln Ala
515 520 525
Lys His Gln Phe Glu Trp Leu Tyr Met Gln Glu Trp Tyr Glu Ser Cys
530 535 540
Gly Ile Glu Glu Phe Gly Ile Ser Arg Lys Asp Leu Leu Leu Ser Tyr
545 550 555 560
Phe Leu Ala Thr Ala Ser Ile Phe Glu Leu Glu Arg Thr Asn Glu Arg
565 570 575
Ile Ala Trp Ala Lys Ser Gln Ile Ile Ala Lys Met Ile Thr Ser Phe
580 585 590
Phe Asn Lys Glu Thr Thr Ser Glu Glu Asp Lys Arg Ala Leu Leu Asn
595 600 605
Glu Leu Gly Asn Ile Asn Gly Leu Asn Asp Thr Asn Gly Ala Gly Arg
610 615 620
Glu Gly Gly Ala Gly Ser Ile Ala Leu Ala Thr Leu Thr Gln Phe Leu
625 630 635 640
Glu Gly Phe Asp Arg Tyr Thr Arg His Gln Leu Lys Asn Ala Trp Ser
645 650 655
Val Trp Leu Thr Gln Leu Gln His Gly Glu Ala Asp Asp Ala Glu Leu
660 665 670
Leu Thr Asn Thr Leu Asn Ile Cys Ala Gly His Ile Ala Phe Arg Glu
675 680 685
Glu Ile Leu Ala His Asn Glu Tyr Lys Ala Leu Ser Asn Leu Thr Ser
690 695 700
Lys Ile Cys Arg Gln Leu Ser Phe Ile Gln Ser Glu Lys Glu Met Gly
705 710 715 720
Val Glu Gly Glu Ile Ala Ala Lys Ser Ser Ile Lys Asn Lys Glu Leu
725 730 735
Glu Glu Asp Met Gln Met Leu Val Lys Leu Val Leu Glu Lys Tyr Gly
740 745 750
Gly Ile Asp Arg Asn Ile Lys Lys Ala Phe Leu Ala Val Ala Lys Thr
755 760 765
Tyr Tyr Tyr Arg Ala Tyr His Ala Ala Asp Thr Ile Asp Thr His Met
770 775 780
Phe Lys Val Leu Phe Glu Pro Val Ala
785 790
<210> 2
<211> 736
<212> PRT
<213> 人工序列(Artificial Sequence)
<223> 截短的柯巴基二磷酸合酶
<400> 2
Met Ala Thr Val Asp Ala Pro Gln Val His Asp His Asp Gly Thr Thr
1 5 10 15
Val His Gln Gly His Asp Ala Val Lys Asn Ile Glu Asp Pro Ile Glu
20 25 30
Tyr Ile Arg Thr Leu Leu Arg Thr Thr Gly Asp Gly Arg Ile Ser Val
35 40 45
Ser Pro Tyr Asp Thr Ala Trp Val Ala Met Ile Lys Asp Val Glu Gly
50 55 60
Arg Asp Gly Pro Gln Phe Pro Ser Ser Leu Glu Trp Ile Val Gln Asn
65 70 75 80
Gln Leu Glu Asp Gly Ser Trp Gly Asp Gln Lys Leu Phe Cys Val Tyr
85 90 95
Asp Arg Leu Val Asn Thr Ile Ala Cys Val Val Ala Leu Arg Ser Trp
100 105 110
Asn Val His Ala His Lys Val Lys Arg Gly Val Thr Tyr Ile Lys Glu
115 120 125
Asn Val Asp Lys Leu Met Glu Gly Asn Glu Glu His Met Thr Cys Gly
130 135 140
Phe Glu Val Val Phe Pro Ala Leu Leu Gln Lys Ala Lys Ser Leu Gly
145 150 155 160
Ile Glu Asp Leu Pro Tyr Asp Ser Pro Ala Val Gln Glu Val Tyr His
165 170 175
Val Arg Glu Gln Lys Leu Lys Arg Ile Pro Leu Glu Ile Met His Lys
180 185 190
Ile Pro Thr Ser Leu Leu Phe Ser Leu Glu Gly Leu Glu Asn Leu Asp
195 200 205
Trp Asp Lys Leu Leu Lys Leu Gln Ser Ala Asp Gly Ser Phe Leu Thr
210 215 220
Ser Pro Ser Ser Thr Ala Phe Ala Phe Met Gln Thr Lys Asp Glu Lys
225 230 235 240
Cys Tyr Gln Phe Ile Lys Asn Thr Ile Asp Thr Phe Asn Gly Gly Ala
245 250 255
Pro His Thr Tyr Pro Val Asp Val Phe Gly Arg Leu Trp Ala Ile Asp
260 265 270
Arg Leu Gln Arg Leu Gly Ile Ser Arg Phe Phe Glu Pro Glu Ile Ala
275 280 285
Asp Cys Leu Ser His Ile His Lys Phe Trp Thr Asp Lys Gly Val Phe
290 295 300
Ser Gly Arg Glu Ser Glu Phe Cys Asp Ile Asp Asp Thr Ser Met Gly
305 310 315 320
Met Arg Leu Met Arg Met His Gly Tyr Asp Val Asp Pro Asn Val Leu
325 330 335
Arg Asn Phe Lys Gln Lys Asp Gly Lys Phe Ser Cys Tyr Gly Gly Gln
340 345 350
Met Ile Glu Ser Pro Ser Pro Ile Tyr Asn Leu Tyr Arg Ala Ser Gln
355 360 365
Leu Arg Phe Pro Gly Glu Glu Ile Leu Glu Asp Ala Lys Arg Phe Ala
370 375 380
Tyr Asp Phe Leu Lys Glu Lys Leu Ala Asn Asn Gln Ile Leu Asp Lys
385 390 395 400
Trp Val Ile Ser Lys His Leu Pro Asp Glu Ile Lys Leu Gly Leu Glu
405 410 415
Met Pro Trp Leu Ala Thr Leu Pro Arg Val Glu Ala Lys Tyr Tyr Ile
420 425 430
Gln Tyr Tyr Ala Gly Ser Gly Asp Val Trp Ile Gly Lys Thr Leu Tyr
435 440 445
Arg Met Pro Glu Ile Ser Asn Asp Thr Tyr His Asp Leu Ala Lys Thr
450 455 460
Asp Phe Lys Arg Cys Gln Ala Lys His Gln Phe Glu Trp Leu Tyr Met
465 470 475 480
Gln Glu Trp Tyr Glu Ser Cys Gly Ile Glu Glu Phe Gly Ile Ser Arg
485 490 495
Lys Asp Leu Leu Leu Ser Tyr Phe Leu Ala Thr Ala Ser Ile Phe Glu
500 505 510
Leu Glu Arg Thr Asn Glu Arg Ile Ala Trp Ala Lys Ser Gln Ile Ile
515 520 525
Ala Lys Met Ile Thr Ser Phe Phe Asn Lys Glu Thr Thr Ser Glu Glu
530 535 540
Asp Lys Arg Ala Leu Leu Asn Glu Leu Gly Asn Ile Asn Gly Leu Asn
545 550 555 560
Asp Thr Asn Gly Ala Gly Arg Glu Gly Gly Ala Gly Ser Ile Ala Leu
565 570 575
Ala Thr Leu Thr Gln Phe Leu Glu Gly Phe Asp Arg Tyr Thr Arg His
580 585 590
Gln Leu Lys Asn Ala Trp Ser Val Trp Leu Thr Gln Leu Gln His Gly
595 600 605
Glu Ala Asp Asp Ala Glu Leu Leu Thr Asn Thr Leu Asn Ile Cys Ala
610 615 620
Gly His Ile Ala Phe Arg Glu Glu Ile Leu Ala His Asn Glu Tyr Lys
625 630 635 640
Ala Leu Ser Asn Leu Thr Ser Lys Ile Cys Arg Gln Leu Ser Phe Ile
645 650 655
Gln Ser Glu Lys Glu Met Gly Val Glu Gly Glu Ile Ala Ala Lys Ser
660 665 670
Ser Ile Lys Asn Lys Glu Leu Glu Glu Asp Met Gln Met Leu Val Lys
675 680 685
Leu Val Leu Glu Lys Tyr Gly Gly Ile Asp Arg Asn Ile Lys Lys Ala
690 695 700
Phe Leu Ala Val Ala Lys Thr Tyr Tyr Tyr Arg Ala Tyr His Ala Ala
705 710 715 720
Asp Thr Ile Asp Thr His Met Phe Lys Val Leu Phe Glu Pro Val Ala
725 730 735
<210> 3
<211> 2211
<212> DNA
<213> 人工序列(Artificial Sequence)
<223> 经优化的用于大肠杆菌(E. coli)表达的编码SmCPS2的cDNA
<400> 3
atggcaactg ttgacgcacc tcaagtccat gatcacgatg gcaccaccgt tcaccagggt 60
cacgacgcgg tgaagaacat cgaggacccg atcgaataca ttcgtaccct gctgcgtacc 120
actggtgatg gtcgcatcag cgtcagcccg tatgacacgg cgtgggtggc gatgattaaa 180
gacgtcgagg gtcgcgatgg cccgcaattt ccttctagcc tggagtggat tgtccaaaat 240
cagctggaag atggctcgtg gggtgaccag aagctgtttt gtgtttacga tcgcctggtt 300
aataccatcg catgtgtggt tgcgctgcgt agctggaatg ttcacgctca taaagtcaaa 360
cgtggcgtga cgtatatcaa ggaaaacgtg gataagctga tggaaggcaa cgaagaacac 420
atgacgtgtg gcttcgaggt tgtttttcca gccttgctgc agaaagcaaa gtccctgggt 480
attgaggatc tgccgtacga ctcgccggca gtgcaagaag tctatcacgt ccgcgagcag 540
aagctgaaac gcatcccgct ggagattatg cataagattc cgacctctct gctgttctct 600
ctggaaggtc tggagaacct ggattgggac aaactgctga agctgcagtc cgctgacggt 660
agctttctga ccagcccgag cagcacggcc tttgcgttta tgcagaccaa agatgagaag 720
tgctatcaat tcatcaagaa tactattgat accttcaacg gtggcgcacc gcacacgtac 780
ccagtagacg tttttggtcg cctgtgggcg attgaccgtt tgcagcgtct gggtatcagc 840
cgtttcttcg agccggagat tgcggactgc ttgagccata ttcacaaatt ctggacggac 900
aaaggcgtgt tcagcggtcg tgagagcgag ttctgcgaca tcgacgatac gagcatgggt 960
atgcgtctga tgcgtatgca cggttacgac gtggacccga atgtgttgcg caacttcaag 1020
caaaaagatg gcaagtttag ctgctacggt ggccaaatga ttgagagccc gagcccgatc 1080
tataacttat atcgtgcgag ccaactgcgt ttcccgggtg aagaaattct ggaagatgcg 1140
aagcgttttg cgtatgactt cctgaaggaa aagctcgcaa acaatcaaat cttggataaa 1200
tgggtgatca gcaagcactt gccggatgag attaaactgg gtctggagat gccgtggttg 1260
gccaccctgc cgagagttga ggcgaaatac tatattcagt attacgcggg tagcggtgat 1320
gtttggattg gcaagaccct gtaccgcatg ccggagatca gcaatgatac ctatcatgac 1380
ctggccaaga ccgacttcaa acgctgtcaa gcgaaacatc aatttgaatg gttatacatg 1440
caagagtggt acgaaagctg cggcatcgaa gagttcggta tctcccgtaa agatctgctg 1500
ctgtcttact ttctggcaac ggccagcatt ttcgagctgg agcgtaccaa tgagcgtatt 1560
gcctgggcga aatcacaaat cattgctaag atgattacga gctttttcaa taaagaaacc 1620
acgtccgagg aagataaacg tgctctgctg aatgaactgg gcaacatcaa cggtctgaat 1680
gacaccaacg gtgccggtcg tgagggtggc gcaggcagca ttgcactggc cacgctgacc 1740
cagttcctgg aaggtttcga ccgctacacc cgtcaccagc tgaagaacgc gtggtccgtc 1800
tggctgaccc agctgcagca tggtgaggca gacgacgcgg agctgctgac caacacgttg 1860
aatatctgcg ctggccatat cgcgtttcgc gaagagattc tggcgcacaa cgagtacaaa 1920
gccctgagca atctgacctc taaaatctgt cgtcagctta gctttattca gagcgagaaa 1980
gaaatgggcg tggaaggtga gatcgcggca aaatccagca tcaagaacaa agaactggaa 2040
gaagatatgc agatgttggt caagctcgtc ctggagaagt atggtggcat cgaccgtaat 2100
atcaagaaag cgtttctggc cgtggcgaaa acgtattact accgcgcgta ccacgcggca 2160
gataccattg acacccacat gtttaaggtt ttgtttgagc cggttgctta a 2211
<210> 4
<211> 575
<212> PRT
<213> 快乐鼠尾草(Salvia sclarea)
<400> 4
Met Ser Leu Ala Phe Asn Val Gly Val Thr Pro Phe Ser Gly Gln Arg
1 5 10 15
Val Gly Ser Arg Lys Glu Lys Phe Pro Val Gln Gly Phe Pro Val Thr
20 25 30
Thr Pro Asn Arg Ser Arg Leu Ile Val Asn Cys Ser Leu Thr Thr Ile
35 40 45
Asp Phe Met Ala Lys Met Lys Glu Asn Phe Lys Arg Glu Asp Asp Lys
50 55 60
Phe Pro Thr Thr Thr Thr Leu Arg Ser Glu Asp Ile Pro Ser Asn Leu
65 70 75 80
Cys Ile Ile Asp Thr Leu Gln Arg Leu Gly Val Asp Gln Phe Phe Gln
85 90 95
Tyr Glu Ile Asn Thr Ile Leu Asp Asn Thr Phe Arg Leu Trp Gln Glu
100 105 110
Lys His Lys Val Ile Tyr Gly Asn Val Thr Thr His Ala Met Ala Phe
115 120 125
Arg Leu Leu Arg Val Lys Gly Tyr Glu Val Ser Ser Glu Glu Leu Ala
130 135 140
Pro Tyr Gly Asn Gln Glu Ala Val Ser Gln Gln Thr Asn Asp Leu Pro
145 150 155 160
Met Ile Ile Glu Leu Tyr Arg Ala Ala Asn Glu Arg Ile Tyr Glu Glu
165 170 175
Glu Arg Ser Leu Glu Lys Ile Leu Ala Trp Thr Thr Ile Phe Leu Asn
180 185 190
Lys Gln Val Gln Asp Asn Ser Ile Pro Asp Lys Lys Leu His Lys Leu
195 200 205
Val Glu Phe Tyr Leu Arg Asn Tyr Lys Gly Ile Thr Ile Arg Leu Gly
210 215 220
Ala Arg Arg Asn Leu Glu Leu Tyr Asp Met Thr Tyr Tyr Gln Ala Leu
225 230 235 240
Lys Ser Thr Asn Arg Phe Ser Asn Leu Cys Asn Glu Asp Phe Leu Val
245 250 255
Phe Ala Lys Gln Asp Phe Asp Ile His Glu Ala Gln Asn Gln Lys Gly
260 265 270
Leu Gln Gln Leu Gln Arg Trp Tyr Ala Asp Cys Arg Leu Asp Thr Leu
275 280 285
Asn Phe Gly Arg Asp Val Val Ile Ile Ala Asn Tyr Leu Ala Ser Leu
290 295 300
Ile Ile Gly Asp His Ala Phe Asp Tyr Val Arg Leu Ala Phe Ala Lys
305 310 315 320
Thr Ser Val Leu Val Thr Ile Met Asp Asp Phe Phe Asp Cys His Gly
325 330 335
Ser Ser Gln Glu Cys Asp Lys Ile Ile Glu Leu Val Lys Glu Trp Lys
340 345 350
Glu Asn Pro Asp Ala Glu Tyr Gly Ser Glu Glu Leu Glu Ile Leu Phe
355 360 365
Met Ala Leu Tyr Asn Thr Val Asn Glu Leu Ala Glu Arg Ala Arg Val
370 375 380
Glu Gln Gly Arg Ser Val Lys Glu Phe Leu Val Lys Leu Trp Val Glu
385 390 395 400
Ile Leu Ser Ala Phe Lys Ile Glu Leu Asp Thr Trp Ser Asn Gly Thr
405 410 415
Gln Gln Ser Phe Asp Glu Tyr Ile Ser Ser Ser Trp Leu Ser Asn Gly
420 425 430
Ser Arg Leu Thr Gly Leu Leu Thr Met Gln Phe Val Gly Val Lys Leu
435 440 445
Ser Asp Glu Met Leu Met Ser Glu Glu Cys Thr Asp Leu Ala Arg His
450 455 460
Val Cys Met Val Gly Arg Leu Leu Asn Asp Val Cys Ser Ser Glu Arg
465 470 475 480
Glu Arg Glu Glu Asn Ile Ala Gly Lys Ser Tyr Ser Ile Leu Leu Ala
485 490 495
Thr Glu Lys Asp Gly Arg Lys Val Ser Glu Asp Glu Ala Ile Ala Glu
500 505 510
Ile Asn Glu Met Val Glu Tyr His Trp Arg Lys Val Leu Gln Ile Val
515 520 525
Tyr Lys Lys Glu Ser Ile Leu Pro Arg Arg Cys Lys Asp Val Phe Leu
530 535 540
Glu Met Ala Lys Gly Thr Phe Tyr Ala Tyr Gly Ile Asn Asp Glu Leu
545 550 555 560
Thr Ser Pro Gln Gln Ser Lys Glu Asp Met Lys Ser Phe Val Phe
565 570 575
<210> 5
<211> 525
<212> PRT
<213> 人工序列(Artificial Sequence)
<223> 来自快乐鼠尾草(Salvia sclarea)的截短的香紫苏醇合酶(SsScS)
<400> 5
Met Ala Lys Met Lys Glu Asn Phe Lys Arg Glu Asp Asp Lys Phe Pro
1 5 10 15
Thr Thr Thr Thr Leu Arg Ser Glu Asp Ile Pro Ser Asn Leu Cys Ile
20 25 30
Ile Asp Thr Leu Gln Arg Leu Gly Val Asp Gln Phe Phe Gln Tyr Glu
35 40 45
Ile Asn Thr Ile Leu Asp Asn Thr Phe Arg Leu Trp Gln Glu Lys His
50 55 60
Lys Val Ile Tyr Gly Asn Val Thr Thr His Ala Met Ala Phe Arg Leu
65 70 75 80
Leu Arg Val Lys Gly Tyr Glu Val Ser Ser Glu Glu Leu Ala Pro Tyr
85 90 95
Gly Asn Gln Glu Ala Val Ser Gln Gln Thr Asn Asp Leu Pro Met Ile
100 105 110
Ile Glu Leu Tyr Arg Ala Ala Asn Glu Arg Ile Tyr Glu Glu Glu Arg
115 120 125
Ser Leu Glu Lys Ile Leu Ala Trp Thr Thr Ile Phe Leu Asn Lys Gln
130 135 140
Val Gln Asp Asn Ser Ile Pro Asp Lys Lys Leu His Lys Leu Val Glu
145 150 155 160
Phe Tyr Leu Arg Asn Tyr Lys Gly Ile Thr Ile Arg Leu Gly Ala Arg
165 170 175
Arg Asn Leu Glu Leu Tyr Asp Met Thr Tyr Tyr Gln Ala Leu Lys Ser
180 185 190
Thr Asn Arg Phe Ser Asn Leu Cys Asn Glu Asp Phe Leu Val Phe Ala
195 200 205
Lys Gln Asp Phe Asp Ile His Glu Ala Gln Asn Gln Lys Gly Leu Gln
210 215 220
Gln Leu Gln Arg Trp Tyr Ala Asp Cys Arg Leu Asp Thr Leu Asn Phe
225 230 235 240
Gly Arg Asp Val Val Ile Ile Ala Asn Tyr Leu Ala Ser Leu Ile Ile
245 250 255
Gly Asp His Ala Phe Asp Tyr Val Arg Leu Ala Phe Ala Lys Thr Ser
260 265 270
Val Leu Val Thr Ile Met Asp Asp Phe Phe Asp Cys His Gly Ser Ser
275 280 285
Gln Glu Cys Asp Lys Ile Ile Glu Leu Val Lys Glu Trp Lys Glu Asn
290 295 300
Pro Asp Ala Glu Tyr Gly Ser Glu Glu Leu Glu Ile Leu Phe Met Ala
305 310 315 320
Leu Tyr Asn Thr Val Asn Glu Leu Ala Glu Arg Ala Arg Val Glu Gln
325 330 335
Gly Arg Ser Val Lys Glu Phe Leu Val Lys Leu Trp Val Glu Ile Leu
340 345 350
Ser Ala Phe Lys Ile Glu Leu Asp Thr Trp Ser Asn Gly Thr Gln Gln
355 360 365
Ser Phe Asp Glu Tyr Ile Ser Ser Ser Trp Leu Ser Asn Gly Ser Arg
370 375 380
Leu Thr Gly Leu Leu Thr Met Gln Phe Val Gly Val Lys Leu Ser Asp
385 390 395 400
Glu Met Leu Met Ser Glu Glu Cys Thr Asp Leu Ala Arg His Val Cys
405 410 415
Met Val Gly Arg Leu Leu Asn Asp Val Cys Ser Ser Glu Arg Glu Arg
420 425 430
Glu Glu Asn Ile Ala Gly Lys Ser Tyr Ser Ile Leu Leu Ala Thr Glu
435 440 445
Lys Asp Gly Arg Lys Val Ser Glu Asp Glu Ala Ile Ala Glu Ile Asn
450 455 460
Glu Met Val Glu Tyr His Trp Arg Lys Val Leu Gln Ile Val Tyr Lys
465 470 475 480
Lys Glu Ser Ile Leu Pro Arg Arg Cys Lys Asp Val Phe Leu Glu Met
485 490 495
Ala Lys Gly Thr Phe Tyr Ala Tyr Gly Ile Asn Asp Glu Leu Thr Ser
500 505 510
Pro Gln Gln Ser Lys Glu Asp Met Lys Ser Phe Val Phe
515 520 525
<210> 6
<211> 1583
<212> DNA
<213> 人工序列(Artificial Sequence)
<223> 经优化的用于大肠杆菌(E. coli)表达的编码来自快乐鼠尾草(Salviasclarea)的截短的香紫苏醇合酶的cDNA
<400> 6
atggcgaaaa tgaaggagaa ctttaaacgc gaggacgata aattcccgac gaccacgacc 60
ctgcgcagcg aggatatccc gagcaacctg tgcatcattg ataccctgca gcgcctgggt 120
gtcgatcagt tcttccaata cgaaatcaat accattctgg acaatacttt tcgtctgtgg 180
caagagaaac acaaagtgat ctacggcaac gttaccaccc acgcgatggc gttccgtttg 240
ttgcgtgtca agggctacga ggtttccagc gaggaactgg cgccgtacgg taatcaggaa 300
gcagttagcc aacagacgaa tgatctgcct atgatcattg agctgtatcg cgcagcaaat 360
gagcgtatct acgaagagga acgcagcctg gaaaagatcc tggcgtggac cacgatcttc 420
ctgaacaaac aagttcaaga caattctatt cctgataaga agctgcataa actggtcgaa 480
ttctatctgc gtaattacaa gggcatcacg atccgtctgg gcgcacgccg taacctggag 540
ttgtatgata tgacgtatta ccaggctctg aaaagcacca atcgtttctc caatctgtgt 600
aatgaggatt ttctggtgtt cgccaagcag gattttgaca tccacgaggc gcaaaatcaa 660
aaaggtctgc aacaactgca acgttggtac gctgactgtc gcctggacac cctgaatttc 720
ggtcgcgacg ttgtcattat tgcaaactat ctggccagcc tgatcatcgg tgatcacgca 780
ttcgactacg tccgcctggc cttcgctaag accagcgttc tggtgaccat tatggatgat 840
ttcttcgatt gccacggttc tagccaggaa tgcgacaaaa tcattgagct ggtgaaagag 900
tggaaagaaa accctgatgc ggaatacggt tccgaagagt tggagatcct gtttatggcc 960
ttgtacaaca ccgtgaatga actggccgag cgtgctcgtg tggagcaggg ccgttctgtg 1020
aaggagtttt tggtcaagtt gtgggtggaa atcctgtccg cgttcaagat cgaactggat 1080
acgtggtcga atggtacgca acagagcttc gacgaataca tcagcagcag ctggctgagc 1140
aatggcagcc gtctgaccgg tttgctgacc atgcaatttg tgggtgttaa actgtccgat 1200
gaaatgctga tgagcgaaga atgcaccgac ctggcacgcc atgtgtgtat ggtgggtcgc 1260
ctgctgaacg acgtctgcag cagcgaacgt gagcgcgagg aaaacattgc aggcaagagc 1320
tacagcatct tgttggccac cgagaaagat ggtcgcaaag tgtctgagga cgaagcaatt 1380
gcagagatta atgaaatggt cgagtaccac tggcgtaagg ttttgcagat tgtgtataag 1440
aaagagagca tcttgccgcg tcgctgtaag gatgttttct tggagatggc gaagggcacg 1500
ttctatgcgt acggcattaa cgacgagctg acgagcccgc aacaatcgaa agaggacatg 1560
aagagcttcg tgttctgagg tac 1583
<210> 7
<211> 307
<212> PRT
<213> 成团泛菌(Pantoea agglomerans)
<400> 7
Met Val Ser Gly Ser Lys Ala Gly Val Ser Pro His Arg Glu Ile Glu
1 5 10 15
Val Met Arg Gln Ser Ile Asp Asp His Leu Ala Gly Leu Leu Pro Glu
20 25 30
Thr Asp Ser Gln Asp Ile Val Ser Leu Ala Met Arg Glu Gly Val Met
35 40 45
Ala Pro Gly Lys Arg Ile Arg Pro Leu Leu Met Leu Leu Ala Ala Arg
50 55 60
Asp Leu Arg Tyr Gln Gly Ser Met Pro Thr Leu Leu Asp Leu Ala Cys
65 70 75 80
Ala Val Glu Leu Thr His Thr Ala Ser Leu Met Leu Asp Asp Met Pro
85 90 95
Cys Met Asp Asn Ala Glu Leu Arg Arg Gly Gln Pro Thr Thr His Lys
100 105 110
Lys Phe Gly Glu Ser Val Ala Ile Leu Ala Ser Val Gly Leu Leu Ser
115 120 125
Lys Ala Phe Gly Leu Ile Ala Ala Thr Gly Asp Leu Pro Gly Glu Arg
130 135 140
Arg Ala Gln Ala Val Asn Glu Leu Ser Thr Ala Val Gly Val Gln Gly
145 150 155 160
Leu Val Leu Gly Gln Phe Arg Asp Leu Asn Asp Ala Ala Leu Asp Arg
165 170 175
Thr Pro Asp Ala Ile Leu Ser Thr Asn His Leu Lys Thr Gly Ile Leu
180 185 190
Phe Ser Ala Met Leu Gln Ile Val Ala Ile Ala Ser Ala Ser Ser Pro
195 200 205
Ser Thr Arg Glu Thr Leu His Ala Phe Ala Leu Asp Phe Gly Gln Ala
210 215 220
Phe Gln Leu Leu Asp Asp Leu Arg Asp Asp His Pro Glu Thr Gly Lys
225 230 235 240
Asp Arg Asn Lys Asp Ala Gly Lys Ser Thr Leu Val Asn Arg Leu Gly
245 250 255
Ala Asp Ala Ala Arg Gln Lys Leu Arg Glu His Ile Asp Ser Ala Asp
260 265 270
Lys His Leu Thr Phe Ala Cys Pro Gln Gly Gly Ala Ile Arg Gln Phe
275 280 285
Met His Leu Trp Phe Gly His His Leu Ala Asp Trp Ser Pro Val Met
290 295 300
Lys Ile Ala
305
<210> 8
<211> 924
<212> DNA
<213> 人工序列(Artificial Sequence)
<223> 经优化的编码来自成团泛菌(Pantoea agglomerans)的GGPP合酶的cDNA
<400> 8
atggtttctg gttcgaaagc aggagtatca cctcataggg aaatcgaagt catgagacag 60
tccattgatg accacttagc aggattgttg ccagaaacag attcccagga tatcgttagc 120
cttgctatga gagaaggtgt tatggcacct ggtaaacgta tcagaccttt gctgatgtta 180
cttgctgcaa gagacctgag atatcagggt tctatgccta cactactgga tctagcttgt 240
gctgttgaac tgacacatac tgcttccttg atgctggatg acatgccttg tatggacaat 300
gcggaactta gaagaggtca accaacaacc cacaagaaat tcggagaatc tgttgccatt 360
ttggcttctg taggtctgtt gtcgaaagct tttggcttga ttgctgcaac tggtgatctt 420
ccaggtgaaa ggagagcaca agctgtaaac gagctatcta ctgcagttgg tgttcaaggt 480
ctagtcttag gacagttcag agatttgaat gacgcagctt tggacagaac tcctgatgct 540
atcctgtcta cgaaccatct gaagactggc atcttgttct cagctatgtt gcaaatcgta 600
gccattgctt ctgcttcttc accatctact agggaaacgt tacacgcatt cgcattggac 660
tttggtcaag cctttcaact gctagacgat ttgagggatg atcatccaga gacaggtaaa 720
gaccgtaaca aagacgctgg taaaagcact ctagtcaaca gattgggtgc tgatgcagct 780
agacagaaac tgagagagca cattgactct gctgacaaac acctgacatt tgcatgtcca 840
caaggaggtg ctataaggca gtttatgcac ctatggtttg gacaccatct tgctgattgg 900
tctccagtga tgaagatcgc ctaa 924
<210> 9
<211> 71
<212> DNA
<213> 人工序列(Artificial Sequence)
<223> 引物序列(Primer Sequence)
<400> 9
ctgtttgagc cggtcgccta aggtaccaga aggagataaa taatggcgaa aatgaaggag 60
aactttaaac g 71
<210> 10
<211> 55
<212> DNA
<213> 人工序列(Artificial Sequence)
<223> 引物序列(Primer Sequence)
<400> 10
gcagcggttt ctttaccaga ctcgaggtca gaacacgaag ctcttcatgt cctct 55
<210> 11
<211> 786
<212> PRT
<213> 毛喉鞘蕊花(Coleus forskohlii)
<400> 11
Met Gly Ser Leu Ser Thr Met Asn Leu Asn His Ser Pro Met Ser Tyr
1 5 10 15
Ser Gly Ile Leu Pro Ser Ser Ser Ala Lys Ala Lys Leu Leu Leu Pro
20 25 30
Gly Cys Phe Ser Ile Ser Ala Trp Met Asn Asn Gly Lys Asn Leu Asn
35 40 45
Cys Gln Leu Thr His Lys Lys Ile Ser Lys Val Ala Glu Ile Arg Val
50 55 60
Ala Thr Val Asn Ala Pro Pro Val His Asp Gln Asp Asp Ser Thr Glu
65 70 75 80
Asn Gln Cys His Asp Ala Val Asn Asn Ile Glu Asp Pro Ile Glu Tyr
85 90 95
Ile Arg Thr Leu Leu Arg Thr Thr Gly Asp Gly Arg Ile Ser Val Ser
100 105 110
Pro Tyr Asp Thr Ala Trp Val Ala Leu Ile Lys Asp Leu Gln Gly Arg
115 120 125
Asp Ala Pro Glu Phe Pro Ser Ser Leu Glu Trp Ile Ile Gln Asn Gln
130 135 140
Leu Ala Asp Gly Ser Trp Gly Asp Ala Lys Phe Phe Cys Val Tyr Asp
145 150 155 160
Arg Leu Val Asn Thr Ile Ala Cys Val Val Ala Leu Arg Ser Trp Asp
165 170 175
Val His Ala Glu Lys Val Glu Arg Gly Val Arg Tyr Ile Asn Glu Asn
180 185 190
Val Glu Lys Leu Arg Asp Gly Asn Glu Glu His Met Thr Cys Gly Phe
195 200 205
Glu Val Val Phe Pro Ala Leu Leu Gln Arg Ala Lys Ser Leu Gly Ile
210 215 220
Gln Asp Leu Pro Tyr Asp Ala Pro Val Ile Gln Glu Ile Tyr His Ser
225 230 235 240
Arg Glu Gln Lys Ser Lys Arg Ile Pro Leu Glu Met Met His Lys Val
245 250 255
Pro Thr Ser Leu Leu Phe Ser Leu Glu Gly Leu Glu Asn Leu Glu Trp
260 265 270
Asp Lys Leu Leu Lys Leu Gln Ser Ala Asp Gly Ser Phe Leu Thr Ser
275 280 285
Pro Ser Ser Thr Ala Phe Ala Phe Met Gln Thr Arg Asp Pro Lys Cys
290 295 300
Tyr Gln Phe Ile Lys Asn Thr Ile Gln Thr Phe Asn Gly Gly Ala Pro
305 310 315 320
His Thr Tyr Pro Val Asp Val Phe Gly Arg Leu Trp Ala Ile Asp Arg
325 330 335
Leu Gln Arg Leu Gly Ile Ser Arg Phe Phe Glu Ser Glu Ile Ala Asp
340 345 350
Cys Ile Ala His Ile His Arg Phe Trp Thr Glu Lys Gly Val Phe Ser
355 360 365
Gly Arg Glu Ser Glu Phe Cys Asp Ile Asp Asp Thr Ser Met Gly Val
370 375 380
Arg Leu Met Arg Met His Gly Tyr Asp Val Asp Pro Asn Val Leu Lys
385 390 395 400
Asn Phe Lys Lys Asp Asp Lys Phe Ser Cys Tyr Gly Gly Gln Met Ile
405 410 415
Glu Ser Pro Ser Pro Ile Tyr Asn Leu Tyr Arg Ala Ser Gln Leu Arg
420 425 430
Phe Pro Gly Glu Gln Ile Leu Glu Asp Ala Asn Lys Phe Ala Tyr Asp
435 440 445
Phe Leu Gln Glu Lys Leu Ala His Asn Gln Ile Leu Asp Lys Trp Val
450 455 460
Ile Ser Lys His Leu Pro Asp Glu Ile Lys Leu Gly Leu Glu Met Pro
465 470 475 480
Trp Tyr Ala Thr Leu Pro Arg Val Glu Ala Arg Tyr Tyr Ile Gln Tyr
485 490 495
Tyr Ala Gly Ser Gly Asp Val Trp Ile Gly Lys Thr Leu Tyr Arg Met
500 505 510
Pro Glu Ile Ser Asn Asp Thr Tyr His Glu Leu Ala Lys Thr Asp Phe
515 520 525
Lys Arg Cys Gln Ala Gln His Gln Phe Glu Trp Ile Tyr Met Gln Glu
530 535 540
Trp Tyr Glu Ser Cys Asn Met Glu Glu Phe Gly Ile Ser Arg Lys Glu
545 550 555 560
Leu Leu Val Ala Tyr Phe Leu Ala Thr Ala Ser Ile Phe Glu Leu Glu
565 570 575
Arg Ala Asn Glu Arg Ile Ala Trp Ala Lys Ser Gln Ile Ile Ser Thr
580 585 590
Ile Ile Ala Ser Phe Phe Asn Asn Gln Asn Thr Ser Pro Glu Asp Lys
595 600 605
Leu Ala Phe Leu Thr Asp Phe Lys Asn Gly Asn Ser Thr Asn Met Ala
610 615 620
Leu Val Thr Leu Thr Gln Phe Leu Glu Gly Phe Asp Arg Tyr Thr Ser
625 630 635 640
His Gln Leu Lys Asn Ala Trp Ser Val Trp Leu Arg Lys Leu Gln Gln
645 650 655
Gly Glu Gly Asn Gly Gly Ala Asp Ala Glu Leu Leu Val Asn Thr Leu
660 665 670
Asn Ile Cys Ala Gly His Ile Ala Phe Arg Glu Glu Ile Leu Ala His
675 680 685
Asn Asp Tyr Lys Thr Leu Ser Asn Leu Thr Ser Lys Ile Cys Arg Gln
690 695 700
Leu Ser Gln Ile Gln Asn Glu Lys Glu Leu Glu Thr Glu Gly Gln Lys
705 710 715 720
Thr Ser Ile Lys Asn Lys Glu Leu Glu Glu Asp Met Gln Arg Leu Val
725 730 735
Lys Leu Val Leu Glu Lys Ser Arg Val Gly Ile Asn Arg Asp Met Lys
740 745 750
Lys Thr Phe Leu Ala Val Val Lys Thr Tyr Tyr Tyr Lys Ala Tyr His
755 760 765
Ser Ala Gln Ala Ile Asp Asn His Met Phe Lys Val Leu Phe Glu Pro
770 775 780
Val Ala
785
<210> 12
<211> 724
<212> PRT
<213> 人工序列(Artificial Sequence)
<223> 来自毛喉鞘蕊花(Coleus forskohlii)的截短的柯巴基二磷酸合酶
<400> 12
Met Val Ala Thr Val Asn Ala Pro Pro Val His Asp Gln Asp Asp Ser
1 5 10 15
Thr Glu Asn Gln Cys His Asp Ala Val Asn Asn Ile Glu Asp Pro Ile
20 25 30
Glu Tyr Ile Arg Thr Leu Leu Arg Thr Thr Gly Asp Gly Arg Ile Ser
35 40 45
Val Ser Pro Tyr Asp Thr Ala Trp Val Ala Leu Ile Lys Asp Leu Gln
50 55 60
Gly Arg Asp Ala Pro Glu Phe Pro Ser Ser Leu Glu Trp Ile Ile Gln
65 70 75 80
Asn Gln Leu Ala Asp Gly Ser Trp Gly Asp Ala Lys Phe Phe Cys Val
85 90 95
Tyr Asp Arg Leu Val Asn Thr Ile Ala Cys Val Val Ala Leu Arg Ser
100 105 110
Trp Asp Val His Ala Glu Lys Val Glu Arg Gly Val Arg Tyr Ile Asn
115 120 125
Glu Asn Val Glu Lys Leu Arg Asp Gly Asn Glu Glu His Met Thr Cys
130 135 140
Gly Phe Glu Val Val Phe Pro Ala Leu Leu Gln Arg Ala Lys Ser Leu
145 150 155 160
Gly Ile Gln Asp Leu Pro Tyr Asp Ala Pro Val Ile Gln Glu Ile Tyr
165 170 175
His Ser Arg Glu Gln Lys Ser Lys Arg Ile Pro Leu Glu Met Met His
180 185 190
Lys Val Pro Thr Ser Leu Leu Phe Ser Leu Glu Gly Leu Glu Asn Leu
195 200 205
Glu Trp Asp Lys Leu Leu Lys Leu Gln Ser Ala Asp Gly Ser Phe Leu
210 215 220
Thr Ser Pro Ser Ser Thr Ala Phe Ala Phe Met Gln Thr Arg Asp Pro
225 230 235 240
Lys Cys Tyr Gln Phe Ile Lys Asn Thr Ile Gln Thr Phe Asn Gly Gly
245 250 255
Ala Pro His Thr Tyr Pro Val Asp Val Phe Gly Arg Leu Trp Ala Ile
260 265 270
Asp Arg Leu Gln Arg Leu Gly Ile Ser Arg Phe Phe Glu Ser Glu Ile
275 280 285
Ala Asp Cys Ile Ala His Ile His Arg Phe Trp Thr Glu Lys Gly Val
290 295 300
Phe Ser Gly Arg Glu Ser Glu Phe Cys Asp Ile Asp Asp Thr Ser Met
305 310 315 320
Gly Val Arg Leu Met Arg Met His Gly Tyr Asp Val Asp Pro Asn Val
325 330 335
Leu Lys Asn Phe Lys Lys Asp Asp Lys Phe Ser Cys Tyr Gly Gly Gln
340 345 350
Met Ile Glu Ser Pro Ser Pro Ile Tyr Asn Leu Tyr Arg Ala Ser Gln
355 360 365
Leu Arg Phe Pro Gly Glu Gln Ile Leu Glu Asp Ala Asn Lys Phe Ala
370 375 380
Tyr Asp Phe Leu Gln Glu Lys Leu Ala His Asn Gln Ile Leu Asp Lys
385 390 395 400
Trp Val Ile Ser Lys His Leu Pro Asp Glu Ile Lys Leu Gly Leu Glu
405 410 415
Met Pro Trp Tyr Ala Thr Leu Pro Arg Val Glu Ala Arg Tyr Tyr Ile
420 425 430
Gln Tyr Tyr Ala Gly Ser Gly Asp Val Trp Ile Gly Lys Thr Leu Tyr
435 440 445
Arg Met Pro Glu Ile Ser Asn Asp Thr Tyr His Glu Leu Ala Lys Thr
450 455 460
Asp Phe Lys Arg Cys Gln Ala Gln His Gln Phe Glu Trp Ile Tyr Met
465 470 475 480
Gln Glu Trp Tyr Glu Ser Cys Asn Met Glu Glu Phe Gly Ile Ser Arg
485 490 495
Lys Glu Leu Leu Val Ala Tyr Phe Leu Ala Thr Ala Ser Ile Phe Glu
500 505 510
Leu Glu Arg Ala Asn Glu Arg Ile Ala Trp Ala Lys Ser Gln Ile Ile
515 520 525
Ser Thr Ile Ile Ala Ser Phe Phe Asn Asn Gln Asn Thr Ser Pro Glu
530 535 540
Asp Lys Leu Ala Phe Leu Thr Asp Phe Lys Asn Gly Asn Ser Thr Asn
545 550 555 560
Met Ala Leu Val Thr Leu Thr Gln Phe Leu Glu Gly Phe Asp Arg Tyr
565 570 575
Thr Ser His Gln Leu Lys Asn Ala Trp Ser Val Trp Leu Arg Lys Leu
580 585 590
Gln Gln Gly Glu Gly Asn Gly Gly Ala Asp Ala Glu Leu Leu Val Asn
595 600 605
Thr Leu Asn Ile Cys Ala Gly His Ile Ala Phe Arg Glu Glu Ile Leu
610 615 620
Ala His Asn Asp Tyr Lys Thr Leu Ser Asn Leu Thr Ser Lys Ile Cys
625 630 635 640
Arg Gln Leu Ser Gln Ile Gln Asn Glu Lys Glu Leu Glu Thr Glu Gly
645 650 655
Gln Lys Thr Ser Ile Lys Asn Lys Glu Leu Glu Glu Asp Met Gln Arg
660 665 670
Leu Val Lys Leu Val Leu Glu Lys Ser Arg Val Gly Ile Asn Arg Asp
675 680 685
Met Lys Lys Thr Phe Leu Ala Val Val Lys Thr Tyr Tyr Tyr Lys Ala
690 695 700
Tyr His Ser Ala Gln Ala Ile Asp Asn His Met Phe Lys Val Leu Phe
705 710 715 720
Glu Pro Val Ala
<210> 13
<211> 2175
<212> DNA
<213> 人工序列(Artificial Sequence)
<223> 经优化的用于大肠杆菌(E. coli)表达的编码CfCPS1-del63的cDNA
<400> 13
atggtcgcta ctgtcaatgc tccaccggtc cacgatcaag acgacagcac tgagaatcaa 60
tgtcatgatg ccgtaaacaa tattgaagat ccaatcgagt atatccgtac cctgttgcgc 120
acgacgggtg atggtcgtat cagcgtcagc ccgtacgata ccgcgtgggt ggcgctgatc 180
aaagatctgc agggccgtga cgcaccggag tttccgtcct ctcttgagtg gatcattcaa 240
aaccagctgg ccgacggttc ttggggcgac gccaaatttt tctgcgtgta tgaccgtctg 300
gtgaacacca tcgcgtgcgt cgttgcgctg cgttcctggg acgtccacgc ggaaaaagtt 360
gagcgtggcg tgcgctatat caacgaaaat gtcgaaaagc tgcgcgacgg taatgaagaa 420
cacatgacct gtggctttga agttgttttc ccggcgctcc tgcagcgcgc gaagtctctg 480
ggtattcaag atctgccgta cgatgctccg gtgatccaag agatttatca ctctcgtgag 540
cagaagtcca agcgtatccc gttggagatg atgcacaaag ttccgacgag cctgctgttc 600
agcttggaag gcctggaaaa tctggagtgg gacaaactgc tgaagctgca gagcgcggac 660
ggtagcttcc tgacgagccc gagcagcacc gcatttgcat ttatgcagac ccgtgacccg 720
aagtgttacc aatttattaa gaacacgatt cagacgttta acggtggtgc accgcatacc 780
tatccggtag acgtctttgg tcgcctgtgg gcaattgatc gtctgcagcg tttgggtatc 840
agccgcttct tcgaaagcga aattgcagat tgtatcgcac acatccatcg tttttggacc 900
gagaaaggcg tctttagcgg ccgtgagtct gagttctgtg acatcgatga cacgagcatg 960
ggtgtccgtc tgatgcgtat gcatggctat gatgttgacc cgaacgtgct gaagaatttt 1020
aaaaaagatg acaagtttag ctgctacggc ggtcagatga ttgagagccc gagcccgatt 1080
tataatctgt accgcgcgag ccaactgcgt ttcccgggtg aacagattct ggaagatgcc 1140
aataaattcg cgtatgattt cctgcaggaa aaactggcgc acaatcagat cctggataaa 1200
tgggttatca gcaagcatct gcctgacgaa atcaaattgg gcctggagat gccgtggtat 1260
gcgaccttgc cgcgtgtcga agcgcgttac tacatccagt actatgcggg tagcggcgat 1320
gtctggattg gtaagacgct gtaccgtatg ccagagatta gcaacgacac ctaccatgaa 1380
ttggcaaaga ccgatttcaa gcgttgccaa gcccaacacc agttcgagtg gatttacatg 1440
caagagtggt acgagtcgtg caacatggaa gagttcggta ttagccgcaa agaactgctg 1500
gttgcatatt tcctggccac ggcgagcatc tttgagctgg agcgtgcgaa tgaacgcatt 1560
gcatgggcaa aaagccaaat catttctacc attatcgctt cgttctttaa taaccaaaat 1620
acgagccctg aggataaact ggcgtttctg actgatttca aaaatggcaa cagcaccaac 1680
atggctctgg tgaccctgac ccagttcctg gaaggctttg accgctacac ttcccatcaa 1740
ctgaaaaacg cgtggagcgt ttggctgcgt aagctgcaac agggtgaggg taatggcggt 1800
gccgacgccg agttactggt gaatacgctg aacatttgcg cgggtcacat cgcgttccgt 1860
gaagaaattc tggcacataa tgactataaa acgttgtcga acctgaccag caagatttgt 1920
cgccagctga gccagattca gaatgaaaaa gaattggaaa ccgaaggcca aaagacttcc 1980
attaagaaca aagaactgga agaagatatg cagcgcctgg ttaaactggt tttggagaaa 2040
agccgtgtgg gtatcaatcg tgacatgaag aaaacgttcc tggctgtggt gaaaacctac 2100
tattacaaag cataccactc cgcgcaggca atcgataacc acatgttcaa ggttctgttc 2160
gaaccggtgg cctaa 2175
<210> 14
<211> 757
<212> PRT
<213> 小麦(Triticum aestivum)
<400> 14
Met Leu Thr Phe Thr Ala Ala Leu Arg His Val Pro Val Leu Asp Gln
1 5 10 15
Pro Thr Ser Glu Pro Trp Arg Arg Leu Ser Leu His Leu His Ser Gln
20 25 30
Arg Arg Pro Cys Gly Leu Val Leu Ile Ser Lys Ser Pro Ser Tyr Pro
35 40 45
Glu Val Asp Val Gly Glu Trp Lys Val Asp Glu Tyr Arg Gln Arg Thr
50 55 60
Asp Glu Pro Ser Glu Thr Arg Gln Met Ile Asp Asp Ile Arg Thr Ala
65 70 75 80
Leu Ala Ser Leu Gly Asp Asp Glu Thr Ser Met Ser Val Ser Ala Tyr
85 90 95
Asp Thr Ala Leu Val Ala Leu Val Lys Asn Leu Asp Gly Gly Asp Gly
100 105 110
Pro Gln Phe Pro Ser Cys Ile Asp Trp Ile Val Gln Asn Gln Leu Pro
115 120 125
Asp Gly Ser Trp Gly Asp Pro Ala Phe Phe Met Val Gln Asp Arg Met
130 135 140
Ile Ser Thr Leu Ala Cys Val Val Ala Val Lys Ser Trp Asn Ile Asp
145 150 155 160
Arg Asp Asn Leu Cys Asp Arg Gly Val Leu Phe Ile Lys Glu Asn Met
165 170 175
Ser Arg Leu Val Glu Glu Glu Gln Asp Trp Met Pro Cys Gly Phe Glu
180 185 190
Ile Asn Phe Pro Ala Leu Leu Glu Lys Ala Lys Asp Leu Asp Leu Asp
195 200 205
Ile Pro Tyr Asp His Pro Val Leu Glu Glu Ile Tyr Ala Lys Arg Asn
210 215 220
Leu Lys Leu Leu Lys Ile Pro Leu Asp Val Leu His Ala Ile Pro Thr
225 230 235 240
Thr Leu Leu Phe Ser Val Glu Gly Met Val Asp Leu Pro Leu Asp Trp
245 250 255
Glu Lys Leu Leu Arg Leu Arg Cys Pro Asp Gly Ser Phe His Ser Ser
260 265 270
Pro Ala Ala Thr Ala Ala Ala Leu Ser His Thr Gly Asp Lys Glu Cys
275 280 285
His Ala Phe Leu Asp Arg Leu Ile Gln Lys Phe Glu Gly Gly Val Pro
290 295 300
Cys Ser His Ser Met Asp Thr Phe Glu Gln Leu Trp Val Val Asp Arg
305 310 315 320
Leu Met Arg Leu Gly Ile Ser Arg His Phe Thr Ser Glu Ile Gln Gln
325 330 335
Cys Leu Glu Phe Ile Tyr Arg Arg Trp Thr Gln Lys Gly Leu Ala His
340 345 350
Asn Met His Cys Pro Ile Pro Asp Ile Asp Asp Thr Ala Met Gly Phe
355 360 365
Arg Leu Leu Arg Gln His Gly Tyr Asp Val Thr Pro Ser Val Phe Lys
370 375 380
His Phe Glu Lys Asp Gly Lys Phe Val Cys Phe Pro Met Glu Thr Asn
385 390 395 400
His Ala Ser Val Thr Pro Met His Asn Thr Tyr Arg Ala Ser Gln Phe
405 410 415
Met Phe Pro Gly Asp Asp Asp Val Leu Ala Arg Ala Gly Arg Tyr Cys
420 425 430
Arg Ala Phe Leu Gln Glu Arg Gln Ser Ser Asn Lys Leu Tyr Asp Lys
435 440 445
Trp Ile Ile Thr Lys Asp Leu Pro Gly Glu Val Gly Tyr Thr Leu Asn
450 455 460
Phe Pro Trp Lys Ser Ser Leu Pro Arg Ile Glu Thr Arg Met Tyr Leu
465 470 475 480
Asp Gln Tyr Gly Gly Asn Asn Asp Val Trp Ile Ala Lys Val Leu Tyr
485 490 495
Arg Met Asn Leu Val Ser Asn Asp Leu Tyr Leu Lys Met Ala Lys Ala
500 505 510
Asp Phe Thr Glu Tyr Gln Arg Leu Ser Arg Ile Glu Trp Asn Gly Leu
515 520 525
Arg Lys Trp Tyr Phe Arg Asn His Leu Gln Arg Tyr Gly Ala Thr Pro
530 535 540
Lys Ser Ala Leu Lys Ala Tyr Phe Leu Ala Ser Ala Asn Ile Phe Glu
545 550 555 560
Pro Gly Arg Ala Ala Glu Arg Leu Ala Trp Ala Arg Met Ala Val Leu
565 570 575
Ala Glu Ala Val Thr Thr His Phe Arg His Ile Gly Gly Pro Cys Tyr
580 585 590
Ser Thr Glu Asn Leu Glu Glu Leu Ile Asp Leu Val Ser Phe Asp Asp
595 600 605
Val Ser Gly Gly Leu Arg Glu Ala Trp Lys Gln Trp Leu Met Ala Trp
610 615 620
Thr Ala Lys Glu Ser His Gly Ser Val Asp Gly Asp Thr Ala Leu Leu
625 630 635 640
Phe Val Arg Thr Ile Glu Ile Cys Ser Gly Arg Ile Val Ser Ser Glu
645 650 655
Gln Lys Leu Asn Leu Trp Asp Tyr Ser Gln Leu Glu Gln Leu Thr Ser
660 665 670
Ser Ile Cys His Lys Leu Ala Thr Ile Gly Leu Ser Gln Asn Glu Ala
675 680 685
Ser Met Glu Asn Thr Glu Asp Leu His Gln Gln Val Asp Leu Glu Met
690 695 700
Gln Glu Leu Ser Trp Arg Val His Gln Gly Cys His Gly Ile Asn Arg
705 710 715 720
Glu Thr Arg Gln Thr Phe Leu Asn Val Val Lys Ser Phe Tyr Tyr Ser
725 730 735
Ala His Cys Ser Pro Glu Thr Val Asp Ser His Ile Ala Lys Val Ile
740 745 750
Phe Gln Asp Val Ile
755
<210> 15
<211> 699
<212> PRT
<213> 人工序列(Artificial Sequence)
<223> 来自小麦(Triticum aestivum)的截短的柯巴基二磷酸合酶
<400> 15
Met Tyr Arg Gln Arg Thr Asp Glu Pro Ser Glu Thr Arg Gln Met Ile
1 5 10 15
Asp Asp Ile Arg Thr Ala Leu Ala Ser Leu Gly Asp Asp Glu Thr Ser
20 25 30
Met Ser Val Ser Ala Tyr Asp Thr Ala Leu Val Ala Leu Val Lys Asn
35 40 45
Leu Asp Gly Gly Asp Gly Pro Gln Phe Pro Ser Cys Ile Asp Trp Ile
50 55 60
Val Gln Asn Gln Leu Pro Asp Gly Ser Trp Gly Asp Pro Ala Phe Phe
65 70 75 80
Met Val Gln Asp Arg Met Ile Ser Thr Leu Ala Cys Val Val Ala Val
85 90 95
Lys Ser Trp Asn Ile Asp Arg Asp Asn Leu Cys Asp Arg Gly Val Leu
100 105 110
Phe Ile Lys Glu Asn Met Ser Arg Leu Val Glu Glu Glu Gln Asp Trp
115 120 125
Met Pro Cys Gly Phe Glu Ile Asn Phe Pro Ala Leu Leu Glu Lys Ala
130 135 140
Lys Asp Leu Asp Leu Asp Ile Pro Tyr Asp His Pro Val Leu Glu Glu
145 150 155 160
Ile Tyr Ala Lys Arg Asn Leu Lys Leu Leu Lys Ile Pro Leu Asp Val
165 170 175
Leu His Ala Ile Pro Thr Thr Leu Leu Phe Ser Val Glu Gly Met Val
180 185 190
Asp Leu Pro Leu Asp Trp Glu Lys Leu Leu Arg Leu Arg Cys Pro Asp
195 200 205
Gly Ser Phe His Ser Ser Pro Ala Ala Thr Ala Ala Ala Leu Ser His
210 215 220
Thr Gly Asp Lys Glu Cys His Ala Phe Leu Asp Arg Leu Ile Gln Lys
225 230 235 240
Phe Glu Gly Gly Val Pro Cys Ser His Ser Met Asp Thr Phe Glu Gln
245 250 255
Leu Trp Val Val Asp Arg Leu Met Arg Leu Gly Ile Ser Arg His Phe
260 265 270
Thr Ser Glu Ile Gln Gln Cys Leu Glu Phe Ile Tyr Arg Arg Trp Thr
275 280 285
Gln Lys Gly Leu Ala His Asn Met His Cys Pro Ile Pro Asp Ile Asp
290 295 300
Asp Thr Ala Met Gly Phe Arg Leu Leu Arg Gln His Gly Tyr Asp Val
305 310 315 320
Thr Pro Ser Val Phe Lys His Phe Glu Lys Asp Gly Lys Phe Val Cys
325 330 335
Phe Pro Met Glu Thr Asn His Ala Ser Val Thr Pro Met His Asn Thr
340 345 350
Tyr Arg Ala Ser Gln Phe Met Phe Pro Gly Asp Asp Asp Val Leu Ala
355 360 365
Arg Ala Gly Arg Tyr Cys Arg Ala Phe Leu Gln Glu Arg Gln Ser Ser
370 375 380
Asn Lys Leu Tyr Asp Lys Trp Ile Ile Thr Lys Asp Leu Pro Gly Glu
385 390 395 400
Val Gly Tyr Thr Leu Asn Phe Pro Trp Lys Ser Ser Leu Pro Arg Ile
405 410 415
Glu Thr Arg Met Tyr Leu Asp Gln Tyr Gly Gly Asn Asn Asp Val Trp
420 425 430
Ile Ala Lys Val Leu Tyr Arg Met Asn Leu Val Ser Asn Asp Leu Tyr
435 440 445
Leu Lys Met Ala Lys Ala Asp Phe Thr Glu Tyr Gln Arg Leu Ser Arg
450 455 460
Ile Glu Trp Asn Gly Leu Arg Lys Trp Tyr Phe Arg Asn His Leu Gln
465 470 475 480
Arg Tyr Gly Ala Thr Pro Lys Ser Ala Leu Lys Ala Tyr Phe Leu Ala
485 490 495
Ser Ala Asn Ile Phe Glu Pro Gly Arg Ala Ala Glu Arg Leu Ala Trp
500 505 510
Ala Arg Met Ala Val Leu Ala Glu Ala Val Thr Thr His Phe Arg His
515 520 525
Ile Gly Gly Pro Cys Tyr Ser Thr Glu Asn Leu Glu Glu Leu Ile Asp
530 535 540
Leu Val Ser Phe Asp Asp Val Ser Gly Gly Leu Arg Glu Ala Trp Lys
545 550 555 560
Gln Trp Leu Met Ala Trp Thr Ala Lys Glu Ser His Gly Ser Val Asp
565 570 575
Gly Asp Thr Ala Leu Leu Phe Val Arg Thr Ile Glu Ile Cys Ser Gly
580 585 590
Arg Ile Val Ser Ser Glu Gln Lys Leu Asn Leu Trp Asp Tyr Ser Gln
595 600 605
Leu Glu Gln Leu Thr Ser Ser Ile Cys His Lys Leu Ala Thr Ile Gly
610 615 620
Leu Ser Gln Asn Glu Ala Ser Met Glu Asn Thr Glu Asp Leu His Gln
625 630 635 640
Gln Val Asp Leu Glu Met Gln Glu Leu Ser Trp Arg Val His Gln Gly
645 650 655
Cys His Gly Ile Asn Arg Glu Thr Arg Gln Thr Phe Leu Asn Val Val
660 665 670
Lys Ser Phe Tyr Tyr Ser Ala His Cys Ser Pro Glu Thr Val Asp Ser
675 680 685
His Ile Ala Lys Val Ile Phe Gln Asp Val Ile
690 695
<210> 16
<211> 2100
<212> DNA
<213> 人工序列(Artificial Sequence)
<223> 经优化的用于大肠杆菌(E. coli)表达的编码TaTps1-del59的cDNA
<400> 16
atgtatcgcc aaagaactga tgagccaagc gaaacccgcc agatgatcga tgatattcgc 60
accgctttgg ctagcctggg tgacgatgaa accagcatga gcgtgagcgc atacgacacc 120
gccctggttg ccctggtgaa gaacctggac ggtggcgatg gcccgcagtt cccgagctgc 180
attgactgga ttgttcagaa ccagctgccg gacggtagct ggggcgaccc ggctttcttt 240
atggttcagg accgtatgat cagcaccctg gcctgtgtcg tggccgtgaa atcctggaat 300
atcgatcgtg acaacttgtg cgatcgtggt gtcctgttta tcaaagaaaa catgtcgcgt 360
ctggttgaag aagaacaaga ttggatgcca tgtggcttcg agattaactt tcctgcactg 420
ttggagaaag ctaaagacct ggacttggac attccgtacg atcatcctgt gctggaagag 480
atttacgcga agcgtaatct gaaactgctg aagattccgt tagatgtcct ccatgcgatc 540
ccgacgacgc tgttgttttc cgttgagggt atggtcgatc tgccgctgga ttgggagaaa 600
ctgctgcgtc tgcgttgccc ggacggttct tttcattcta gcccggcggc gacggcagcg 660
gcgctgagcc acacgggtga caaagagtgt cacgccttcc tggaccgcct gattcaaaag 720
ttcgagggtg gcgtcccgtg ctcccacagc atggacacct tcgagcaact gtgggttgtt 780
gaccgtttga tgcgtctggg tatcagccgt cattttacga gcgagatcca gcagtgcttg 840
gagttcatct atcgtcgttg gacccagaaa ggtctggcgc acaatatgca ctgcccgatc 900
ccggacattg atgacactgc gatgggtttt cgtctgttga gacagcacgg ttacgacgtg 960
accccgtcgg ttttcaagca tttcgagaaa gacggcaagt tcgtatgctt cccgatggaa 1020
accaaccatg cgagcgtgac gccgatgcac aatacctacc gtgcgagcca gttcatgttc 1080
ccgggtgatg acgacgtgct ggcccgtgcc ggccgctact gtcgcgcatt cttgcaagag 1140
cgtcagagct ctaacaagtt gtacgataag tggattatca cgaaagatct gccgggtgag 1200
gttggctaca cgctgaactt tccgtggaaa agctccctgc cgcgtattga aactcgtatg 1260
tatctggatc agtacggtgg caataacgat gtctggattg caaaggtcct gtatcgcatg 1320
aacctggtta gcaatgacct gtacctgaaa atggcgaaag ccgactttac cgagtatcaa 1380
cgtctgtctc gcattgagtg gaacggcctg cgcaaatggt attttcgcaa tcatctgcag 1440
cgttacggtg cgaccccgaa gtccgcgctg aaagcgtatt tcctggcgtc ggcaaacatc 1500
tttgagcctg gccgcgcagc cgagcgcctg gcatgggcac gtatggccgt gctggctgaa 1560
gctgtaacga ctcatttccg tcacattggc ggcccgtgct acagcaccga gaatctggaa 1620
gaactgatcg accttgttag cttcgacgac gtgagcggcg gcttgcgtga ggcgtggaag 1680
caatggctga tggcgtggac cgcaaaagaa tcacacggca gcgtggacgg tgacacggca 1740
ctgctgtttg tccgcacgat tgagatttgc agcggccgca tcgtttccag cgagcagaaa 1800
ctgaatctgt gggattacag ccagttagag caattgacca gcagcatctg tcataaactg 1860
gccaccatcg gtctgagcca gaacgaagct agcatggaaa ataccgaaga tctgcaccaa 1920
caagtcgatt tggaaatgca agaactgtca tggcgtgttc accagggttg tcacggtatt 1980
aatcgcgaaa cccgtcaaac cttcctgaat gttgttaagt ctttttatta ctccgcacac 2040
tgcagcccgg aaaccgtgga cagccatatt gcaaaagtga tctttcaaga cgttatctga 2100
<210> 17
<211> 785
<212> PRT
<213> 欧夏至草(Marrubium vulgare)
<400> 17
Met Gly Ser Leu Ser Thr Leu Asn Leu Ile Lys Thr Cys Val Thr Leu
1 5 10 15
Ala Ser Ser Glu Lys Leu Asn Gln Pro Ser Gln Cys Tyr Thr Ile Ser
20 25 30
Thr Cys Met Lys Ser Ser Asn Asn Pro Pro Phe Asn Tyr Tyr Gln Ile
35 40 45
Asn Gly Arg Lys Lys Met Ser Thr Ala Ile Asp Ser Ser Val Asn Ala
50 55 60
Pro Pro Glu Gln Lys Tyr Asn Ser Thr Ala Leu Glu His Asp Thr Glu
65 70 75 80
Ile Ile Glu Ile Glu Asp His Ile Glu Cys Ile Arg Arg Leu Leu Arg
85 90 95
Thr Ala Gly Asp Gly Arg Ile Ser Val Ser Pro Tyr Asp Thr Ala Trp
100 105 110
Ile Ala Leu Ile Lys Asp Leu Asp Gly His Asp Ser Pro Gln Phe Pro
115 120 125
Ser Ser Met Glu Trp Val Ala Asp Asn Gln Leu Pro Asp Gly Ser Trp
130 135 140
Gly Asp Glu His Phe Val Cys Val Tyr Asp Arg Leu Val Asn Thr Ile
145 150 155 160
Ala Cys Val Val Ala Leu Arg Ser Trp Asn Val His Ala His Lys Cys
165 170 175
Glu Lys Gly Ile Lys Tyr Ile Lys Glu Asn Val His Lys Leu Glu Asp
180 185 190
Ala Asn Glu Glu His Met Thr Cys Gly Phe Glu Val Val Phe Pro Ala
195 200 205
Leu Leu Gln Arg Ala Gln Ser Met Gly Ile Lys Gly Ile Pro Tyr Asn
210 215 220
Ala Pro Val Ile Glu Glu Ile Tyr Asn Ser Arg Glu Lys Lys Leu Lys
225 230 235 240
Arg Ile Pro Met Glu Val Val His Lys Val Ala Thr Ser Leu Leu Phe
245 250 255
Ser Leu Glu Gly Leu Glu Asn Leu Glu Trp Glu Lys Leu Leu Lys Leu
260 265 270
Gln Ser Pro Asp Gly Ser Phe Leu Thr Ser Pro Ser Ser Thr Ala Phe
275 280 285
Ala Phe Ile His Thr Lys Asp Arg Lys Cys Phe Asn Phe Ile Asn Asn
290 295 300
Ile Val His Thr Phe Lys Gly Gly Ala Pro His Thr Tyr Pro Val Asp
305 310 315 320
Ile Phe Gly Arg Leu Trp Ala Val Asp Arg Leu Gln Arg Leu Gly Ile
325 330 335
Ser Arg Phe Phe Glu Ser Glu Ile Ala Glu Phe Leu Ser His Val His
340 345 350
Arg Phe Trp Ser Asp Glu Ala Gly Val Phe Ser Gly Arg Glu Ser Val
355 360 365
Phe Cys Asp Ile Asp Asp Thr Ser Met Gly Leu Arg Leu Leu Arg Met
370 375 380
His Gly Tyr His Val Asp Pro Asn Val Leu Lys Asn Phe Lys Gln Ser
385 390 395 400
Asp Lys Phe Ser Cys Tyr Gly Gly Gln Met Met Glu Cys Ser Ser Pro
405 410 415
Ile Tyr Asn Leu Tyr Arg Ala Ser Gln Leu Gln Phe Pro Gly Glu Glu
420 425 430
Ile Leu Glu Glu Ala Asn Lys Phe Ala Tyr Lys Phe Leu Gln Glu Lys
435 440 445
Leu Glu Ser Asn Gln Ile Leu Asp Lys Trp Leu Ile Ser Asn His Leu
450 455 460
Ser Asp Glu Ile Lys Val Gly Leu Glu Met Pro Trp Tyr Ala Thr Leu
465 470 475 480
Pro Arg Val Glu Thr Ser Tyr Tyr Ile His His Tyr Gly Gly Gly Asp
485 490 495
Asp Val Trp Ile Gly Lys Thr Leu Tyr Arg Met Pro Glu Ile Ser Asn
500 505 510
Asp Thr Tyr Arg Glu Leu Ala Arg Leu Asp Phe Arg Arg Cys Gln Ala
515 520 525
Gln His Gln Leu Glu Trp Ile Tyr Met Gln Arg Trp Tyr Glu Ser Cys
530 535 540
Arg Met Gln Glu Phe Gly Ile Ser Arg Lys Glu Val Leu Arg Ala Tyr
545 550 555 560
Phe Leu Ala Ser Gly Thr Ile Phe Glu Val Glu Arg Ala Lys Glu Arg
565 570 575
Val Ala Trp Ala Arg Ser Gln Ile Ile Ser His Met Ile Lys Ser Phe
580 585 590
Phe Asn Lys Glu Thr Thr Ser Ser Asp Gln Lys Gln Ala Leu Leu Thr
595 600 605
Glu Leu Leu Phe Gly Asn Ile Ser Ala Ser Glu Thr Glu Lys Arg Glu
610 615 620
Leu Asp Gly Val Val Val Ala Thr Leu Arg Gln Phe Leu Glu Gly Phe
625 630 635 640
Asp Ile Gly Thr Arg His Gln Val Lys Ala Ala Trp Asp Val Trp Leu
645 650 655
Arg Lys Val Glu Gln Gly Glu Ala His Gly Gly Ala Asp Ala Glu Leu
660 665 670
Cys Thr Thr Thr Leu Asn Thr Cys Ala Asn Gln His Leu Ser Ser His
675 680 685
Pro Asp Tyr Asn Thr Leu Ser Lys Leu Thr Asn Lys Ile Cys His Lys
690 695 700
Leu Ser Gln Ile Gln His Gln Lys Glu Met Lys Gly Gly Ile Lys Ala
705 710 715 720
Lys Cys Ser Ile Asn Asn Lys Glu Val Asp Ile Glu Met Gln Trp Leu
725 730 735
Val Lys Leu Val Leu Glu Lys Ser Gly Leu Asn Arg Lys Ala Lys Gln
740 745 750
Ala Phe Leu Ser Ile Ala Lys Thr Tyr Tyr Tyr Arg Ala Tyr Tyr Ala
755 760 765
Asp Gln Thr Met Asp Ala His Ile Phe Lys Val Leu Phe Glu Pro Val
770 775 780
Val
785
<210> 18
<211> 723
<212> PRT
<213> 人工序列(Artificial Sequence)
<223> 来自欧夏至草(Marrubium vulgare)的截短的柯巴基二磷酸合酶
<400> 18
Met Ala Pro Pro Glu Gln Lys Tyr Asn Ser Thr Ala Leu Glu His Asp
1 5 10 15
Thr Glu Ile Ile Glu Ile Glu Asp His Ile Glu Cys Ile Arg Arg Leu
20 25 30
Leu Arg Thr Ala Gly Asp Gly Arg Ile Ser Val Ser Pro Tyr Asp Thr
35 40 45
Ala Trp Ile Ala Leu Ile Lys Asp Leu Asp Gly His Asp Ser Pro Gln
50 55 60
Phe Pro Ser Ser Met Glu Trp Val Ala Asp Asn Gln Leu Pro Asp Gly
65 70 75 80
Ser Trp Gly Asp Glu His Phe Val Cys Val Tyr Asp Arg Leu Val Asn
85 90 95
Thr Ile Ala Cys Val Val Ala Leu Arg Ser Trp Asn Val His Ala His
100 105 110
Lys Cys Glu Lys Gly Ile Lys Tyr Ile Lys Glu Asn Val His Lys Leu
115 120 125
Glu Asp Ala Asn Glu Glu His Met Thr Cys Gly Phe Glu Val Val Phe
130 135 140
Pro Ala Leu Leu Gln Arg Ala Gln Ser Met Gly Ile Lys Gly Ile Pro
145 150 155 160
Tyr Asn Ala Pro Val Ile Glu Glu Ile Tyr Asn Ser Arg Glu Lys Lys
165 170 175
Leu Lys Arg Ile Pro Met Glu Val Val His Lys Val Ala Thr Ser Leu
180 185 190
Leu Phe Ser Leu Glu Gly Leu Glu Asn Leu Glu Trp Glu Lys Leu Leu
195 200 205
Lys Leu Gln Ser Pro Asp Gly Ser Phe Leu Thr Ser Pro Ser Ser Thr
210 215 220
Ala Phe Ala Phe Ile His Thr Lys Asp Arg Lys Cys Phe Asn Phe Ile
225 230 235 240
Asn Asn Ile Val His Thr Phe Lys Gly Gly Ala Pro His Thr Tyr Pro
245 250 255
Val Asp Ile Phe Gly Arg Leu Trp Ala Val Asp Arg Leu Gln Arg Leu
260 265 270
Gly Ile Ser Arg Phe Phe Glu Ser Glu Ile Ala Glu Phe Leu Ser His
275 280 285
Val His Arg Phe Trp Ser Asp Glu Ala Gly Val Phe Ser Gly Arg Glu
290 295 300
Ser Val Phe Cys Asp Ile Asp Asp Thr Ser Met Gly Leu Arg Leu Leu
305 310 315 320
Arg Met His Gly Tyr His Val Asp Pro Asn Val Leu Lys Asn Phe Lys
325 330 335
Gln Ser Asp Lys Phe Ser Cys Tyr Gly Gly Gln Met Met Glu Cys Ser
340 345 350
Ser Pro Ile Tyr Asn Leu Tyr Arg Ala Ser Gln Leu Gln Phe Pro Gly
355 360 365
Glu Glu Ile Leu Glu Glu Ala Asn Lys Phe Ala Tyr Lys Phe Leu Gln
370 375 380
Glu Lys Leu Glu Ser Asn Gln Ile Leu Asp Lys Trp Leu Ile Ser Asn
385 390 395 400
His Leu Ser Asp Glu Ile Lys Val Gly Leu Glu Met Pro Trp Tyr Ala
405 410 415
Thr Leu Pro Arg Val Glu Thr Ser Tyr Tyr Ile His His Tyr Gly Gly
420 425 430
Gly Asp Asp Val Trp Ile Gly Lys Thr Leu Tyr Arg Met Pro Glu Ile
435 440 445
Ser Asn Asp Thr Tyr Arg Glu Leu Ala Arg Leu Asp Phe Arg Arg Cys
450 455 460
Gln Ala Gln His Gln Leu Glu Trp Ile Tyr Met Gln Arg Trp Tyr Glu
465 470 475 480
Ser Cys Arg Met Gln Glu Phe Gly Ile Ser Arg Lys Glu Val Leu Arg
485 490 495
Ala Tyr Phe Leu Ala Ser Gly Thr Ile Phe Glu Val Glu Arg Ala Lys
500 505 510
Glu Arg Val Ala Trp Ala Arg Ser Gln Ile Ile Ser His Met Ile Lys
515 520 525
Ser Phe Phe Asn Lys Glu Thr Thr Ser Ser Asp Gln Lys Gln Ala Leu
530 535 540
Leu Thr Glu Leu Leu Phe Gly Asn Ile Ser Ala Ser Glu Thr Glu Lys
545 550 555 560
Arg Glu Leu Asp Gly Val Val Val Ala Thr Leu Arg Gln Phe Leu Glu
565 570 575
Gly Phe Asp Ile Gly Thr Arg His Gln Val Lys Ala Ala Trp Asp Val
580 585 590
Trp Leu Arg Lys Val Glu Gln Gly Glu Ala His Gly Gly Ala Asp Ala
595 600 605
Glu Leu Cys Thr Thr Thr Leu Asn Thr Cys Ala Asn Gln His Leu Ser
610 615 620
Ser His Pro Asp Tyr Asn Thr Leu Ser Lys Leu Thr Asn Lys Ile Cys
625 630 635 640
His Lys Leu Ser Gln Ile Gln His Gln Lys Glu Met Lys Gly Gly Ile
645 650 655
Lys Ala Lys Cys Ser Ile Asn Asn Lys Glu Val Asp Ile Glu Met Gln
660 665 670
Trp Leu Val Lys Leu Val Leu Glu Lys Ser Gly Leu Asn Arg Lys Ala
675 680 685
Lys Gln Ala Phe Leu Ser Ile Ala Lys Thr Tyr Tyr Tyr Arg Ala Tyr
690 695 700
Tyr Ala Asp Gln Thr Met Asp Ala His Ile Phe Lys Val Leu Phe Glu
705 710 715 720
Pro Val Val
<210> 19
<211> 2172
<212> DNA
<213> 人工序列(Artificial Sequence)
<223> 经优化的用于大肠杆菌(E. coli)表达的编码MvCps3-del63的cDNA
<400> 19
atggccccgc cggaacaaaa gtacaacagc actgcattag aacacgacac cgagattatt 60
gagatcgagg accacatcga gtgtatccgc cgtctgctgc gtaccgcggg tgatggtcgt 120
attagcgtga gcccgtatga taccgcgtgg attgcactga ttaaagattt ggatggccac 180
gactccccgc aattcccgtc gagcatggaa tgggttgctg ataatcagct gccggacggt 240
agctggggtg acgagcactt cgtttgcgtt tacgatcgcc tggttaatac catcgcatgc 300
gtcgtggcgc tgcgcagctg gaatgtccat gcacataagt gcgagaaagg tattaagtac 360
attaaagaaa atgtccacaa actggaagat gcgaacgaag aacacatgac ttgcggcttc 420
gaagtcgttt ttccggcctt gctgcagcgt gcacagagca tgggtattaa gggcatcccg 480
tacaacgcgc ctgtcattga agaaatttac aattcccgtg agaaaaagct gaaacgtatt 540
ccgatggaag ttgtccacaa agtcgcgacc agcctgctgt tctccctgga aggtctggag 600
aacctggagt gggagaaatt gctgaaactg cagagcccgg acggttcgtt tctgaccagc 660
ccgagctcta cggcattcgc gtttatccat accaaagacc gtaaatgttt taactttatt 720
aacaatatcg ttcatacctt taagggtggt gcaccgcaca cgtaccctgt ggacatcttt 780
ggccgcctgt gggcagtgga tcgcttgcag cgtctgggta ttagccgctt cttcgagagc 840
gagatcgcgg aatttctgag ccacgtgcac cgtttttgga gcgacgaagc gggcgttttc 900
agcggccgtg agagcgtgtt ctgtgatatt gatgacacca gcatgggtct gcgcctgctt 960
cgtatgcatg gctaccatgt agacccaaac gttctgaaga acttcaagca atctgacaag 1020
tttagctgct acggtggcca gatgatggaa tgcagcagcc caatttacaa tctgtaccgt 1080
gcgagccaac tgcaatttcc gggtgaagaa atcttggaag aggctaacaa attcgcgtat 1140
aagtttttgc aagagaaact ggagtccaat cagattctgg acaagtggct gatctccaac 1200
cacctgagcg acgaaatcaa agttggcctg gaaatgccgt ggtatgcgac cttgccgcgc 1260
gttgagacta gctattatat tcaccattac ggcggtggcg acgatgtgtg gattggtaaa 1320
acgctgtatc gcatgccgga aattagcaac gacacctacc gtgagctggc acgtctggac 1380
ttccgccgct gccaggcgca gcaccagttg gaatggatct atatgcaacg ttggtatgag 1440
agctgtcgta tgcaagaatt tggtatttcc cgcaaagaag tcctgcgtgc ctacttcctg 1500
gcctctggca cgattttcga agttgagcgc gccaaagagc gcgtggcgtg ggctcgtagc 1560
caaatcattt cccacatgat caagagcttc ttcaataaag aaaccacgag cagcgatcag 1620
aaacaagcgc tgctgaccga gttgctgttt ggtaacatct ctgcaagcga gactgagaaa 1680
cgtgagctgg atggtgttgt ggttgcgacc ctgcgtcagt tcctggaagg cttcgatatc 1740
ggcacccgtc accaagtgaa ggcagcgtgg gatgtgtggc tgcgtaaagt cgaacagggt 1800
gaggcacatg gtggcgcgga cgccgagttg tgtacgacga cgctgaacac gtgcgcgaat 1860
cagcatctgt ctagccatcc ggactacaat accctgtcga aactcaccaa taagatttgt 1920
cacaagctgt cccaaatcca gcatcagaaa gaaatgaagg gcggtattaa ggcaaagtgc 1980
tctatcaata acaaagaagt ggatatcgag atgcaatggc tggtcaaact ggtcctggag 2040
aaatccggtc tgaaccgcaa ggctaaacaa gcgtttctga gcattgccaa aacctattat 2100
tatcgtgctt actatgccga ccagacgatg gatgcccaca tcttcaaggt cctgtttgaa 2160
ccggtcgtgt aa 2172
<210> 20
<211> 799
<212> PRT
<213> 迷迭香(Rosmarinus officinalis)
<400> 20
Met Thr Ser Met Ser Ser Leu Asn Leu Ser Arg Ala Pro Ala Ile Ser
1 5 10 15
Arg Arg Leu Gln Leu Pro Ala Lys Val Gln Leu Pro Glu Phe Tyr Ala
20 25 30
Val Cys Ser Trp Leu Asn Asn Ser Ser Lys His Thr Pro Leu Ser Cys
35 40 45
His Ile His Arg Lys Gln Leu Ser Lys Val Thr Lys Cys Arg Val Ala
50 55 60
Ser Leu Asp Ala Ser Gln Val Ser Glu Lys Gly Thr Ser Ser Pro Val
65 70 75 80
Gln Thr Pro Glu Glu Val Asn Glu Lys Ile Glu Asn Tyr Ile Glu Tyr
85 90 95
Ile Lys Asn Leu Leu Thr Thr Ser Gly Asp Gly Arg Ile Ser Val Ser
100 105 110
Pro Tyr Asp Thr Ser Ile Val Ala Leu Ile Lys Asp Leu Lys Gly Arg
115 120 125
Asp Thr Pro Gln Phe Pro Ser Cys Leu Glu Trp Ile Ala Gln His Gln
130 135 140
Met Ala Asp Gly Ser Trp Gly Asp Glu Phe Phe Cys Ile Tyr Asp Arg
145 150 155 160
Ile Leu Asn Thr Leu Ala Cys Val Val Ala Leu Lys Ser Trp Asn Val
165 170 175
His Ala Asp Met Ile Glu Lys Gly Val Thr Tyr Val Asn Glu Asn Val
180 185 190
Gln Lys Leu Glu Asp Gly Asn Leu Glu His Met Thr Ser Gly Phe Glu
195 200 205
Ile Val Val Pro Ala Leu Val Gln Arg Ala Gln Asp Leu Gly Ile Gln
210 215 220
Gly Leu Pro Tyr Asp His Pro Leu Ile Lys Glu Ile Ala Asn Thr Lys
225 230 235 240
Glu Gly Arg Leu Lys Lys Ile Pro Lys Asp Met Ile Tyr Gln Lys Pro
245 250 255
Thr Thr Leu Leu Phe Ser Leu Glu Gly Leu Gly Asp Leu Glu Trp Glu
260 265 270
Lys Ile Leu Lys Leu Gln Ser Gly Asp Gly Ser Phe Leu Thr Ser Pro
275 280 285
Ser Ser Thr Ala His Val Phe Met Lys Thr Lys Asp Glu Lys Cys Leu
290 295 300
Lys Phe Ile Glu Asn Ala Val Lys Asn Cys Asn Gly Gly Ala Pro His
305 310 315 320
Thr Tyr Pro Val Asp Val Phe Ala Arg Leu Trp Ala Val Asp Arg Leu
325 330 335
Gln Arg Leu Gly Ile Ser Arg Phe Phe Gln Gln Glu Ile Lys Tyr Phe
340 345 350
Leu Asp His Ile Asn Ser Val Trp Thr Glu Asn Gly Val Phe Ser Gly
355 360 365
Arg Asp Ser Glu Phe Cys Asp Ile Asp Asp Thr Ser Met Gly Ile Arg
370 375 380
Leu Leu Lys Met His Gly Tyr Asp Ile Asp Pro Asn Ala Leu Glu His
385 390 395 400
Phe Lys Gln Gln Asp Gly Lys Phe Ser Cys Tyr Gly Gly Gln Met Ile
405 410 415
Glu Ser Ala Ser Pro Ile Tyr Asn Leu Tyr Arg Ala Ala Gln Leu Arg
420 425 430
Phe Pro Gly Glu Glu Ile Leu Glu Glu Ala Thr Lys Phe Ala Tyr Asn
435 440 445
Phe Leu Gln Glu Lys Ile Ala Asn Asp Gln Phe Gln Glu Lys Trp Val
450 455 460
Ile Ser Asp His Leu Ile Asp Glu Val Lys Leu Gly Leu Lys Met Pro
465 470 475 480
Trp Tyr Ala Thr Leu Pro Arg Val Glu Ala Ala Tyr Tyr Leu Gln Tyr
485 490 495
Tyr Ala Gly Cys Gly Asp Val Trp Ile Gly Lys Val Phe Tyr Arg Met
500 505 510
Pro Glu Ile Ser Asn Asp Thr Tyr Lys Lys Leu Ala Ile Leu Asp Phe
515 520 525
Asn Arg Cys Gln Ala Gln His Gln Phe Glu Trp Ile Tyr Met Gln Glu
530 535 540
Trp Tyr His Arg Ser Ser Val Ser Glu Phe Gly Ile Ser Lys Lys Asp
545 550 555 560
Leu Leu Arg Ala Tyr Phe Leu Ala Ala Ala Thr Ile Phe Glu Pro Glu
565 570 575
Arg Thr Gln Glu Arg Leu Val Trp Ala Lys Thr Gln Ile Val Ser Gly
580 585 590
Met Ile Thr Ser Phe Val Asn Ser Gly Thr Thr Leu Ser Leu His Gln
595 600 605
Lys Thr Ala Leu Leu Ser Gln Ile Gly His Asn Phe Asp Gly Leu Asp
610 615 620
Glu Ile Ile Ser Ala Met Lys Asp His Gly Leu Ala Ala Thr Leu Leu
625 630 635 640
Thr Thr Phe Gln Gln Leu Leu Asp Gly Phe Asp Arg Tyr Thr Arg His
645 650 655
Gln Leu Lys Asn Ala Trp Ser Gln Trp Phe Met Lys Leu Gln Gln Gly
660 665 670
Glu Ala Ser Gly Gly Glu Asp Ala Glu Leu Leu Ala Asn Thr Leu Asn
675 680 685
Ile Cys Ala Gly Leu Ile Ala Phe Asn Glu Asp Val Leu Ser His His
690 695 700
Glu Tyr Thr Thr Leu Ser Thr Leu Thr Asn Lys Ile Cys Lys Arg Leu
705 710 715 720
Thr Gln Ile Gln Asp Lys Lys Thr Leu Glu Val Val Asp Gly Ser Ile
725 730 735
Lys Asp Lys Glu Leu Glu Lys Asp Ile Gln Met Leu Val Lys Leu Val
740 745 750
Leu Glu Glu Asn Gly Gly Gly Val Asp Arg Asn Ile Lys His Thr Phe
755 760 765
Leu Ser Val Phe Lys Thr Phe Tyr Tyr Asn Ala Tyr His Asp Asp Glu
770 775 780
Thr Thr Asp Val His Ile Phe Lys Val Leu Phe Gly Pro Val Val
785 790 795
<210> 21
<211> 733
<212> PRT
<213> 人工序列(Artificial Sequence)
<223> 来自迷迭香(Rosmarinus officinalis)的截短的柯巴基二磷酸合酶
<400> 21
Met Ala Ser Gln Val Ser Glu Lys Gly Thr Ser Ser Pro Val Gln Thr
1 5 10 15
Pro Glu Glu Val Asn Glu Lys Ile Glu Asn Tyr Ile Glu Tyr Ile Lys
20 25 30
Asn Leu Leu Thr Thr Ser Gly Asp Gly Arg Ile Ser Val Ser Pro Tyr
35 40 45
Asp Thr Ser Ile Val Ala Leu Ile Lys Asp Leu Lys Gly Arg Asp Thr
50 55 60
Pro Gln Phe Pro Ser Cys Leu Glu Trp Ile Ala Gln His Gln Met Ala
65 70 75 80
Asp Gly Ser Trp Gly Asp Glu Phe Phe Cys Ile Tyr Asp Arg Ile Leu
85 90 95
Asn Thr Leu Ala Cys Val Val Ala Leu Lys Ser Trp Asn Val His Ala
100 105 110
Asp Met Ile Glu Lys Gly Val Thr Tyr Val Asn Glu Asn Val Gln Lys
115 120 125
Leu Glu Asp Gly Asn Leu Glu His Met Thr Ser Gly Phe Glu Ile Val
130 135 140
Val Pro Ala Leu Val Gln Arg Ala Gln Asp Leu Gly Ile Gln Gly Leu
145 150 155 160
Pro Tyr Asp His Pro Leu Ile Lys Glu Ile Ala Asn Thr Lys Glu Gly
165 170 175
Arg Leu Lys Lys Ile Pro Lys Asp Met Ile Tyr Gln Lys Pro Thr Thr
180 185 190
Leu Leu Phe Ser Leu Glu Gly Leu Gly Asp Leu Glu Trp Glu Lys Ile
195 200 205
Leu Lys Leu Gln Ser Gly Asp Gly Ser Phe Leu Thr Ser Pro Ser Ser
210 215 220
Thr Ala His Val Phe Met Lys Thr Lys Asp Glu Lys Cys Leu Lys Phe
225 230 235 240
Ile Glu Asn Ala Val Lys Asn Cys Asn Gly Gly Ala Pro His Thr Tyr
245 250 255
Pro Val Asp Val Phe Ala Arg Leu Trp Ala Val Asp Arg Leu Gln Arg
260 265 270
Leu Gly Ile Ser Arg Phe Phe Gln Gln Glu Ile Lys Tyr Phe Leu Asp
275 280 285
His Ile Asn Ser Val Trp Thr Glu Asn Gly Val Phe Ser Gly Arg Asp
290 295 300
Ser Glu Phe Cys Asp Ile Asp Asp Thr Ser Met Gly Ile Arg Leu Leu
305 310 315 320
Lys Met His Gly Tyr Asp Ile Asp Pro Asn Ala Leu Glu His Phe Lys
325 330 335
Gln Gln Asp Gly Lys Phe Ser Cys Tyr Gly Gly Gln Met Ile Glu Ser
340 345 350
Ala Ser Pro Ile Tyr Asn Leu Tyr Arg Ala Ala Gln Leu Arg Phe Pro
355 360 365
Gly Glu Glu Ile Leu Glu Glu Ala Thr Lys Phe Ala Tyr Asn Phe Leu
370 375 380
Gln Glu Lys Ile Ala Asn Asp Gln Phe Gln Glu Lys Trp Val Ile Ser
385 390 395 400
Asp His Leu Ile Asp Glu Val Lys Leu Gly Leu Lys Met Pro Trp Tyr
405 410 415
Ala Thr Leu Pro Arg Val Glu Ala Ala Tyr Tyr Leu Gln Tyr Tyr Ala
420 425 430
Gly Cys Gly Asp Val Trp Ile Gly Lys Val Phe Tyr Arg Met Pro Glu
435 440 445
Ile Ser Asn Asp Thr Tyr Lys Lys Leu Ala Ile Leu Asp Phe Asn Arg
450 455 460
Cys Gln Ala Gln His Gln Phe Glu Trp Ile Tyr Met Gln Glu Trp Tyr
465 470 475 480
His Arg Ser Ser Val Ser Glu Phe Gly Ile Ser Lys Lys Asp Leu Leu
485 490 495
Arg Ala Tyr Phe Leu Ala Ala Ala Thr Ile Phe Glu Pro Glu Arg Thr
500 505 510
Gln Glu Arg Leu Val Trp Ala Lys Thr Gln Ile Val Ser Gly Met Ile
515 520 525
Thr Ser Phe Val Asn Ser Gly Thr Thr Leu Ser Leu His Gln Lys Thr
530 535 540
Ala Leu Leu Ser Gln Ile Gly His Asn Phe Asp Gly Leu Asp Glu Ile
545 550 555 560
Ile Ser Ala Met Lys Asp His Gly Leu Ala Ala Thr Leu Leu Thr Thr
565 570 575
Phe Gln Gln Leu Leu Asp Gly Phe Asp Arg Tyr Thr Arg His Gln Leu
580 585 590
Lys Asn Ala Trp Ser Gln Trp Phe Met Lys Leu Gln Gln Gly Glu Ala
595 600 605
Ser Gly Gly Glu Asp Ala Glu Leu Leu Ala Asn Thr Leu Asn Ile Cys
610 615 620
Ala Gly Leu Ile Ala Phe Asn Glu Asp Val Leu Ser His His Glu Tyr
625 630 635 640
Thr Thr Leu Ser Thr Leu Thr Asn Lys Ile Cys Lys Arg Leu Thr Gln
645 650 655
Ile Gln Asp Lys Lys Thr Leu Glu Val Val Asp Gly Ser Ile Lys Asp
660 665 670
Lys Glu Leu Glu Lys Asp Ile Gln Met Leu Val Lys Leu Val Leu Glu
675 680 685
Glu Asn Gly Gly Gly Val Asp Arg Asn Ile Lys His Thr Phe Leu Ser
690 695 700
Val Phe Lys Thr Phe Tyr Tyr Asn Ala Tyr His Asp Asp Glu Thr Thr
705 710 715 720
Asp Val His Ile Phe Lys Val Leu Phe Gly Pro Val Val
725 730
<210> 22
<211> 2202
<212> DNA
<213> 人工序列(Artificial Sequence)
<223> 经优化的用于大肠杆菌(E. coli)表达的编码RoCPS1-del67的cDNA
<400> 22
atggcatcac aagttagcga gaaaggcacc agctccccag ttcaaacgcc agaggaagtg 60
aacgaaaaga tcgagaatta cattgagtat attaaaaatc tgctgactac ttcgggcgac 120
ggccgcatca gcgtcagccc gtacgacacg agcatcgttg ccctgattaa agacctgaag 180
ggtcgtgaca ccccgcagtt tccgtcctgt ctggagtgga ttgcccaaca ccaaatggcc 240
gatggttcct ggggtgatga atttttctgc atttacgacc gcatcctgaa tacgctggct 300
tgtgttgtcg ccctgaagtc ctggaatgtt catgcagaca tgatcgaaaa gggtgtcact 360
tacgttaacg aaaacgtgca gaaactggaa gatggcaatc tggagcacat gacgagcggt 420
ttcgagattg ttgtcccggc gctggttcag agagcgcaag acctgggcat ccagggcctg 480
ccgtatgatc atccgttgat caaagaaatc gcaaacacca aagagggccg cctgaagaaa 540
attcctaaag acatgattta tcagaaaccg actacgctgc tgttcagcct ggaaggcttg 600
ggcgacctgg agtgggaaaa gatcctgaag ttacagtctg gtgatggttc tttcctgacc 660
agcccgagct ctacggccca tgttttcatg aaaaccaaag atgagaagtg tctgaagttt 720
attgaaaatg ccgtcaagaa ttgcaacggt ggcgcgcctc acacctaccc ggtggacgtt 780
ttcgctcgtc tgtgggccgt cgatcgtctg caacgcctgg gcatctcgcg tttcttccag 840
caagagatta agtacttcct ggaccacatt aatagcgtgt ggaccgaaaa cggcgttttc 900
agcggtcgcg acagcgagtt ttgtgatatt gatgacacct ctatgggtat ccgtttgctg 960
aagatgcacg gttacgacat tgacccgaat gccctggagc actttaaaca acaggatggt 1020
aagttctcct gctacggtgg tcagatgatt gagagcgcga gcccgatcta caacctgtac 1080
cgtgctgcgc agctgcgttt tccgggtgaa gagattctgg aagaggccac caaatttgcg 1140
tataattttt tgcaagagaa aattgcaaac gaccaattcc aggaaaaatg ggttattagc 1200
gatcacctta tcgatgaagt gaaactgggt ttgaagatgc cgtggtacgc gacgctgcca 1260
cgtgtcgagg cagcgtatta tctgcagtat tatgcgggct gtggtgatgt gtggatcggc 1320
aaagtgttct accgtatgcc ggaaatcagc aatgacacct acaagaaact ggccatcctg 1380
gatttcaacc gttgccaggc gcaacaccaa ttcgagtgga tctacatgca agagtggtat 1440
catcgtagca gcgtttctga gtttggcatt tccaaaaaag acttgctgcg cgcgtatttt 1500
ctggcggcag cgaccatttt cgaaccggag cgcacccagg aacgtctggt gtgggctaag 1560
acgcaaatcg tcagcggtat gattacgtcc tttgttaata gcggtacgac tctgagcctg 1620
caccagaaaa cggcactgtt gagccaaatc ggtcataact ttgacggcct ggatgagatt 1680
atcagcgcga tgaaagacca cggcctggca gcgacgctgt taacgacctt tcaacagctg 1740
ctggacggct tcgatcgcta cacccgtcat cagctgaaaa acgcgtggag ccagtggttc 1800
atgaagctgc aacagggtga ggcgtcgggt ggcgaagatg ctgagctgct ggctaatacc 1860
ctgaacattt gcgcgggttt gattgcgttt aatgaagatg tgttgagcca ccatgagtac 1920
accaccctga gcaccctgac caacaagatc tgtaagcgct tgactcaaat ccaggataag 1980
aaaacgctgg aagtcgtgga tggtagcatc aaagataaag aactggaaaa agacattcaa 2040
atgctggtga aactggtcct tgaagagaac ggcggtggcg ttgaccgtaa catcaagcac 2100
accttcctga gcgtctttaa aaccttttat tataatgcct atcatgacga tgaaacgacc 2160
gacgtgcaca ttttcaaagt tctgttcggt ccggtcgtgt aa 2202
<210> 23
<211> 766
<212> PRT
<213> 人工序列(Artificial Sequence)
<223> 来自烟草(Nicotiana glutinosa)的截短的推定香紫苏醇合酶
<400> 23
Met Ala Asn Phe His Arg Pro Ser Arg Val Arg Cys Ser His Ser Thr
1 5 10 15
Ala Ser Ser Leu Glu Glu Ala Lys Glu Arg Ile Arg Glu Thr Phe Gly
20 25 30
Lys Asn Glu Leu Ser Pro Ser Ser Tyr Asp Thr Ala Trp Val Ala Met
35 40 45
Val Pro Ser Arg Tyr Ser Met Asn Gln Pro Cys Phe Pro Arg Cys Leu
50 55 60
Asp Trp Ile Leu Glu Asn Gln Arg Glu Asp Gly Ser Trp Gly Leu Asn
65 70 75 80
Pro Ser His Pro Leu Leu Val Lys Asp Ser Leu Ser Ser Thr Leu Ala
85 90 95
Cys Leu Leu Ala Leu Arg Lys Trp Arg Ile Gly Asp Asn Gln Val Gln
100 105 110
Arg Gly Leu Gly Phe Ile Glu Thr His Gly Trp Ala Val Asp Asn Val
115 120 125
Asp Gln Ile Ser Pro Leu Gly Phe Asp Ile Ile Phe Pro Ser Met Ile
130 135 140
Lys Tyr Ala Glu Lys Leu Asn Leu Asp Leu Pro Phe Asp Pro Asn Leu
145 150 155 160
Val Asn Met Met Leu Arg Glu Arg Glu Leu Thr Ile Glu Arg Ala Leu
165 170 175
Lys Asn Glu Phe Glu Gly Asn Met Ala Asn Val Glu Tyr Phe Ala Glu
180 185 190
Gly Leu Gly Glu Leu Cys His Trp Lys Glu Ile Met Leu His Gln Arg
195 200 205
Arg Asn Gly Ser Leu Phe Asp Ser Pro Ala Thr Thr Ala Ala Ala Leu
210 215 220
Ile Tyr His Gln His Asp Glu Lys Cys Phe Gly Tyr Leu Ser Ser Ile
225 230 235 240
Leu Lys Leu His Glu Asn Trp Val Pro Thr Ile Tyr Pro Thr Lys Val
245 250 255
His Ser Asn Leu Phe Phe Val Asp Ala Leu Gln Asn Leu Gly Val Asp
260 265 270
Arg Tyr Phe Lys Thr Glu Leu Lys Ser Val Leu Asp Glu Ile Tyr Arg
275 280 285
Leu Trp Leu Glu Lys Asn Glu Glu Ile Phe Ser Asp Ile Ala His Cys
290 295 300
Ala Met Ala Phe Arg Leu Leu Arg Met Asn Asn Tyr Glu Val Ser Ser
305 310 315 320
Glu Glu Leu Glu Gly Phe Val Asp Gln Glu His Phe Phe Thr Thr Ser
325 330 335
Gly Gly Lys Leu Ile Ser His Val Ala Ile Leu Glu Leu His Arg Ala
340 345 350
Ser Gln Val Asp Ile Gln Glu Gly Lys Asp Leu Ile Leu Asp Lys Ile
355 360 365
Ser Thr Trp Thr Arg Asn Phe Met Glu Gln Glu Leu Leu Asp Asn Gln
370 375 380
Ile Leu Asp Arg Ser Lys Lys Glu Met Glu Phe Ala Met Arg Lys Phe
385 390 395 400
Tyr Gly Thr Phe Asp Arg Val Glu Thr Arg Arg Tyr Ile Glu Ser Tyr
405 410 415
Lys Met Asp Ser Phe Lys Ile Leu Lys Ala Ala Tyr Arg Ser Ser Asn
420 425 430
Ile Asn Asn Ile Asp Leu Leu Lys Phe Ser Glu His Asp Phe Asn Leu
435 440 445
Cys Gln Ala Arg His Lys Glu Glu Leu Gln Gln Ile Lys Arg Trp Phe
450 455 460
Ala Asp Cys Lys Leu Glu Gln Val Gly Ser Ser Gln Asn Tyr Leu Tyr
465 470 475 480
Thr Ser Tyr Phe Pro Ile Ala Ala Ile Leu Phe Glu Pro Glu Tyr Gly
485 490 495
Asp Ala Arg Leu Ala Phe Ala Lys Cys Gly Ile Ile Ala Thr Thr Val
500 505 510
Asp Asp Phe Phe Asp Gly Phe Ala Cys Asn Glu Glu Leu Gln Asn Ile
515 520 525
Ile Glu Leu Val Glu Arg Trp Asp Gly Tyr Pro Thr Val Gly Phe Arg
530 535 540
Ser Glu Arg Val Arg Ile Phe Phe Leu Ala Leu Tyr Lys Met Ile Glu
545 550 555 560
Glu Ile Ala Ala Lys Ala Glu Thr Lys Gln Gly Arg Cys Val Lys Asp
565 570 575
Leu Leu Ile Asn Leu Trp Ile Asp Leu Leu Lys Cys Met Leu Val Glu
580 585 590
Leu Asp Leu Trp Lys Ile Lys Ser Thr Thr Pro Ser Ile Glu Glu Tyr
595 600 605
Leu Ser Ile Ala Cys Val Thr Thr Gly Val Lys Cys Leu Ile Leu Ile
610 615 620
Ser Leu His Leu Leu Gly Pro Lys Leu Ser Lys Asp Val Thr Glu Ser
625 630 635 640
Ser Glu Val Ser Ala Leu Trp Asn Cys Thr Ala Val Val Ala Arg Leu
645 650 655
Asn Asn Asp Ile His Ser Tyr Lys Arg Glu Gln Ala Glu Ser Ser Thr
660 665 670
Asn Met Ala Ala Ile Leu Ile Ser Gln Ser Gln Arg Thr Ile Ser Glu
675 680 685
Glu Glu Ala Ile Arg Gln Ile Lys Glu Met Met Glu Ser Lys Arg Arg
690 695 700
Glu Leu Leu Gly Met Val Leu Gln Asn Lys Glu Ser Gln Leu Pro Gln
705 710 715 720
Val Cys Lys Asp Leu Phe Trp Thr Thr Phe Lys Ala Ala Tyr Ser Ile
725 730 735
Tyr Thr His Gly Asp Glu Tyr Arg Phe Pro Gln Glu Leu Lys Asn His
740 745 750
Ile Asn Asp Val Ile Tyr Lys Pro Leu Asn Gln Tyr Ser Pro
755 760 765
<210> 24
<211> 2301
<212> DNA
<213> 人工序列(Artificial Sequence)
<223> 经优化的用于大肠杆菌(E. coli)表达的编码NgSCS-del29的cDNA
<400> 24
atggctaatt tccatcgccc atcccgtgtt cgttgttccc actctaccgc aagctccctg 60
gaagaggcaa aagagcgcat ccgtgaaacc ttcggcaaaa atgaactctc tccttctagc 120
tatgatacgg cctgggttgc tatggtcccg agccgctaca gcatgaacca gccgtgcttt 180
ccgcgctgcc tggactggat tctggagaac caacgtgagg atggcagctg gggtctgaac 240
ccgagccatc cgttactggt gaaagacagc ttgagcagca cgctggcgtg tttgctggcg 300
ctgcgtaagt ggcgtattgg cgacaaccaa gtccagcgtg gcctgggttt tatcgagact 360
catggttggg cagtggacaa cgtagaccag atctctccac tgggttttga catcattttc 420
ccgagcatga ttaaatatgc ggaaaagctg aatctggatt tgccttttga tccgaacctg 480
gtgaacatga tgctgcgcga gcgcgagctg acgatcgagc gtgcgctgaa aaacgaattt 540
gagggtaata tggctaatgt cgagtacttc gccgagggtt tgggtgagct gtgtcactgg 600
aaagaaatca tgctgcacca acgccgtaac ggtagcctgt tcgactctcc ggcaacgacc 660
gccgcggctc ttatttatca tcagcacgat gagaagtgct tcggctatct gtctagcatc 720
ctgaaattac acgagaactg ggtgccgacc atctatccga ccaaggttca ctccaatctg 780
tttttcgtcg atgcgctgca gaacctgggt gttgaccgtt acttcaaaac cgaactgaag 840
tccgtcctgg atgagatcta ccgtttgtgg ctggagaaaa acgaagagat cttcagcgat 900
attgcgcact gcgcaatggc gtttcgcctg ttgcgcatga ataattacga ggttagcagc 960
gaagaactgg aaggcttcgt ggaccaagaa cattttttca ccacgtcggg tggcaagctg 1020
atcagccacg ttgccatcct ggaactgcac cgtgcaagcc aagtggacat tcaggagggc 1080
aaagacctga tcctggacaa aattagcacc tggactcgca actttatgga acaggaactg 1140
ctggataacc agatcttgga tcgtagcaaa aaagaaatgg aatttgcaat gcgtaagttt 1200
tacggtacgt tcgatcgcgt ggaaacccgt cgttatattg aaagctacaa aatggattcc 1260
ttcaagatcc tgaaggcagc gtaccgtagc tccaacatta acaatattga cctgttgaag 1320
ttcagcgagc acgacttcaa tctctgccag gcgcgtcaca aggaagaact gcagcaaatc 1380
aaacgctggt tcgcagattg caaactggag caagtcggta gcagccagaa ctacttgtac 1440
acctcttact tcccgatcgc ggccattttg ttcgagccgg agtatggcga cgcacgcctg 1500
gcgttcgcga agtgcggtat tatcgcgacc accgttgacg atttttttga cggttttgca 1560
tgtaatgaag aactgcaaaa catcatcgaa ctggtcgaga gatgggacgg ttatccgacg 1620
gttggtttcc gctccgagcg tgtgcgcatt ttctttctgg cgctgtacaa aatgattgaa 1680
gaaattgccg cgaaagcgga aacgaaacag ggccgttgcg tgaaagatct gttgatcaat 1740
ctgtggattg atctgctgaa atgcatgctg gtcgaactgg atctgtggaa aattaagagc 1800
acgaccccga gcattgaaga gtatctgagc attgcctgtg tgacgaccgg cgttaagtgc 1860
ttgatcctga ttagcctgca tctgctgggc ccgaaactga gcaaagacgt gaccgaatcc 1920
agcgaagtta gcgctctgtg gaactgtacg gccgtggttg cgcgcctgaa caacgacatt 1980
catagctaca agcgtgagca agccgagagc agcactaata tggccgcaat cctgatttcg 2040
caaagccagc gtaccatctc agaagaagaa gctatccgcc agatcaaaga gatgatggaa 2100
tcgaaacgcc gtgagctgct gggcatggtg ctgcagaata aagagagcca attgccgcaa 2160
gtctgcaaag acctgttttg gaccaccttc aaagccgcgt acagcattta tacccacggt 2220
gatgagtacc gttttccaca agaactgaag aaccatatca acgatgtcat ctataagccg 2280
ttaaatcaat acagccctta a 2301
<210> 25
<211> 755
<212> PRT
<213> 烟草(Nicotiana glutinosa)
<400> 25
Met Ser His Ser Thr Ala Ser Ser Leu Glu Glu Ala Lys Glu Arg Ile
1 5 10 15
Arg Glu Thr Phe Gly Lys Asn Glu Leu Ser Ser Ser Ser Tyr Asp Thr
20 25 30
Ala Trp Val Ala Met Val Pro Ser Arg Tyr Ser Met Asn Gln Pro Cys
35 40 45
Phe Pro Arg Cys Leu Asp Trp Ile Leu Glu Asn Gln Arg Glu Asp Gly
50 55 60
Ser Trp Gly Leu Asn Pro Ser Leu Pro Leu Leu Val Lys Asp Ser Leu
65 70 75 80
Ser Ser Thr Leu Ala Cys Leu Leu Ala Leu Arg Lys Trp Arg Ile Gly
85 90 95
Asp Asn Gln Val Gln Arg Gly Leu Gly Phe Ile Glu Thr His Gly Trp
100 105 110
Ala Val Asp Asn Val Asp Gln Ile Ser Pro Leu Gly Phe Asp Ile Ile
115 120 125
Phe Pro Ser Met Ile Lys Tyr Ala Glu Lys Leu Asn Leu Asp Leu Pro
130 135 140
Phe Asp Pro Asn Leu Val Asn Met Met Leu Arg Glu Arg Glu Leu Thr
145 150 155 160
Ile Glu Arg Ala Leu Lys Asn Glu Phe Glu Gly Asn Met Ala Asn Val
165 170 175
Glu Tyr Phe Ala Glu Gly Leu Gly Glu Leu Cys His Trp Lys Glu Ile
180 185 190
Met Leu His Gln Arg Arg Asn Gly Ser Pro Phe Asp Ser Pro Ala Thr
195 200 205
Thr Ala Ala Ala Leu Ile Tyr His Gln His Asp Glu Lys Cys Phe Gly
210 215 220
Tyr Leu Ser Ser Ile Leu Lys Leu His Glu Asn Trp Val Pro Thr Ile
225 230 235 240
Tyr Pro Thr Lys Val His Ser Asn Leu Phe Phe Val Asp Ala Leu Gln
245 250 255
Asn Leu Gly Val Asp Arg Tyr Phe Lys Thr Glu Leu Lys Ser Val Leu
260 265 270
Asp Glu Ile Tyr Arg Leu Trp Leu Glu Lys Asn Glu Glu Ile Phe Ser
275 280 285
Asp Ile Ala His Cys Ala Met Ala Phe Arg Leu Leu Arg Met Asn Asn
290 295 300
Tyr Glu Val Ser Ser Glu Glu Leu Glu Gly Phe Val Asp Gln Glu His
305 310 315 320
Phe Phe Thr Thr Ser Gly Gly Lys Leu Ile Ser His Val Ala Ile Leu
325 330 335
Glu Leu His Arg Ala Ser Gln Val Asp Ile Gln Glu Gly Lys Asp Leu
340 345 350
Ile Leu Asp Lys Ile Ser Thr Trp Thr Arg Asn Phe Met Glu Gln Glu
355 360 365
Leu Leu Asp Asn Gln Ile Leu Asp Arg Ser Lys Lys Glu Met Glu Phe
370 375 380
Ala Met Arg Lys Phe Tyr Gly Thr Phe Asp Arg Val Glu Thr Arg Arg
385 390 395 400
Tyr Ile Glu Ser Tyr Lys Met Asp Ser Phe Lys Ile Leu Lys Ala Ala
405 410 415
Tyr Arg Ser Ser Asn Ile Asn Asn Ile Asp Leu Leu Lys Phe Ser Glu
420 425 430
His Asp Phe Asn Leu Cys Gln Ala Arg His Lys Glu Glu Leu Gln Gln
435 440 445
Ile Lys Arg Trp Phe Ala Asp Cys Lys Leu Glu Gln Val Gly Ser Ser
450 455 460
Gln Asn Tyr Leu Tyr Thr Ser Tyr Phe Pro Ile Ala Ala Ile Leu Phe
465 470 475 480
Glu Pro Glu Tyr Gly Asp Ala Arg Leu Ala Phe Ala Lys Cys Gly Ile
485 490 495
Ile Ala Thr Thr Val Asp Asp Phe Phe Asp Gly Phe Ala Cys Asn Glu
500 505 510
Glu Leu Gln Asn Ile Ile Glu Leu Val Glu Arg Trp Asp Gly Tyr Pro
515 520 525
Thr Val Gly Phe Arg Ser Glu Arg Val Arg Ile Phe Phe Leu Ala Leu
530 535 540
Tyr Lys Met Ile Glu Glu Ile Ala Ala Lys Ala Glu Thr Lys Gln Gly
545 550 555 560
Arg Cys Val Lys Asp Leu Leu Ile Asn Leu Trp Ile Asp Leu Leu Lys
565 570 575
Cys Met Leu Val Glu Leu Asp Leu Trp Lys Ile Lys Ser Thr Thr Pro
580 585 590
Ser Ile Glu Glu Tyr Leu Ser Ile Ala Cys Val Thr Thr Gly Val Lys
595 600 605
Cys Leu Ile Leu Ile Ser Leu His Leu Leu Gly Pro Lys Leu Ser Lys
610 615 620
Asp Val Thr Glu Ser Ser Glu Val Ser Ala Leu Trp Asn Cys Thr Ala
625 630 635 640
Val Val Ala Arg Leu Asn Asn Asp Ile His Ser Tyr Lys Arg Glu Gln
645 650 655
Ala Glu Ser Ser Thr Asn Met Val Ala Ile Leu Ile Ser Gln Ser Gln
660 665 670
Arg Thr Ile Ser Glu Glu Glu Ala Ile Arg Gln Ile Lys Glu Met Met
675 680 685
Glu Ser Lys Arg Arg Glu Leu Leu Gly Met Val Leu Gln Asn Lys Glu
690 695 700
Ser Gln Leu Pro Gln Val Cys Lys Asp Leu Phe Trp Thr Thr Phe Lys
705 710 715 720
Ala Ala Tyr Ser Ile Tyr Thr His Gly Asp Glu Tyr Arg Phe Pro Gln
725 730 735
Glu Leu Lys Asn His Ile Asn Asp Val Ile Tyr Lys Pro Leu Asn Gln
740 745 750
Tyr Ser Pro
755
<210> 26
<211> 2211
<212> DNA
<213> 人工序列(Artificial Sequence)
<223> 经优化的用于酿酒酵母(Saccharomyces cerevisiae)表达的编码SmCPS2的cDNA
<400> 26
atggctactg ttgacgctcc acaagttcac gaccacgacg gtactactgt tcaccaaggt 60
cacgacgctg ttaagaacat cgaagaccca atcgaataca tcagaacttt gttgagaact 120
actggtgacg gtagaatctc tgtttctcca tacgacactg cttgggttgc tatgatcaag 180
gacgttgaag gtagagacgg tccacaattc ccatcttctt tggaatggat cgttcaaaac 240
caattggaag acggttcttg gggtgaccaa aagttgttct gtgtttacga cagattggtt 300
aacactatcg cttgtgttgt tgctttgaga tcttggaacg ttcacgctca caaggttaag 360
agaggtgtta cttacatcaa ggaaaacgtt gacaagttga tggaaggtaa cgaagaacac 420
atgacttgtg gtttcgaagt tgttttccca gctttgttgc aaaaggctaa gtctttgggt 480
atcgaagact tgccatacga ctctccagct gttcaagaag tttaccacgt tagagaacaa 540
aagttgaaga gaatcccatt ggaaatcatg cacaagatcc caacttcttt gttgttctct 600
ttggaaggtt tggaaaactt ggactgggac aagttgttga agttgcaatc tgctgacggt 660
tctttcttga cttctccatc ttctactgct ttcgctttca tgcaaactaa ggacgaaaag 720
tgttaccaat tcatcaagaa cactatcgac actttcaacg gtggtgctcc acacacttac 780
ccagttgacg ttttcggtag attgtgggct atcgacagat tgcaaagatt gggtatctct 840
agattcttcg aaccagaaat cgctgactgt ttgtctcaca tccacaagtt ctggactgac 900
aagggtgttt tctctggtag agaatctgaa ttctgtgaca tcgacgacac ttctatgggt 960
atgagattga tgagaatgca cggttacgac gttgacccaa acgttttgag aaacttcaag 1020
caaaaggacg gtaagttctc ttgttacggt ggtcaaatga tcgaatctcc atctccaatc 1080
tacaacttgt acagagcttc tcaattgaga ttcccaggtg aagaaatctt ggaagacgct 1140
aagagattcg cttacgactt cttgaaggaa aagttggcta acaaccaaat cttggacaag 1200
tgggttatct ctaagcactt gccagacgaa atcaagttgg gtttggaaat gccatggttg 1260
gctactttgc caagagttga agctaagtac tacatccaat actacgctgg ttctggtgac 1320
gtttggatcg gtaagacttt gtacagaatg ccagaaatct ctaacgacac ttaccacgac 1380
ttggctaaga ctgacttcaa gagatgtcaa gctaagcacc aattcgaatg gttgtacatg 1440
caagaatggt acgaatcttg tggtatcgaa gaattcggta tctctagaaa ggacttgttg 1500
ttgtcttact tcttggctac tgcttctatc ttcgaattgg aaagaactaa cgaaagaatc 1560
gcttgggcta agtctcaaat catcgctaag atgatcactt ctttcttcaa caaggaaact 1620
acttctgaag aagacaagag agctttgttg aacgaattgg gtaacatcaa cggtttgaac 1680
gacactaacg gtgctggtag agaaggtggt gctggttcta tcgctttggc tactttgact 1740
caattcttgg aaggtttcga cagatacact agacaccaat tgaagaacgc ttggtctgtt 1800
tggttgactc aattgcaaca cggtgaagct gacgacgctg aattgttgac taacactttg 1860
aacatctgtg ctggtcacat cgctttcaga gaagaaatct tggctcacaa cgaatacaag 1920
gctttgtcta acttgacttc taagatctgt agacaattgt ctttcatcca atctgaaaag 1980
gaaatgggtg ttgaaggtga aatcgctgct aagtcttcta tcaagaacaa ggaattggaa 2040
gaagacatgc aaatgttggt taagttggtt ttggaaaagt acggtggtat cgacagaaac 2100
atcaagaagg ctttcttggc tgttgctaag acttactact acagagctta ccacgctgct 2160
gacactatcg acactcacat gttcaaggtt ttgttcgaac cagttgctta a 2211
<210> 27
<211> 1578
<212> DNA
<213> 人工序列(Artificial Sequence)
<223> 经优化的用于酿酒酵母(S. cerevisiae)表达的编码来自快乐鼠尾草(Salviasclarea)的截短的SsScS的cDNA
<400> 27
atggctaaga tgaaggaaaa cttcaagaga gaagacgaca agttcccaac tactactact 60
ttgagatctg aagacatccc atctaacttg tgtatcatcg acactttgca aagattgggt 120
gttgaccaat tcttccaata cgaaatcaac actatcttgg acaacacttt cagattgtgg 180
caagaaaagc acaaggttat ctacggtaac gttactactc acgctatggc tttcagattg 240
ttgagagtta agggttacga agtttcttct gaagaattgg ctccatacgg taaccaagaa 300
gctgtttctc aacaaactaa cgacttgcca atgatcatcg aattgtacag agctgctaac 360
gaaagaatct acgaagaaga aagatctttg gaaaagatct tggcttggac tactatcttc 420
ttgaacaagc aagttcaaga caactctatc ccagacaaga agttgcacaa gttggttgaa 480
ttctacttga gaaactacaa gggtatcact atcagattgg gtgctagaag aaacttggaa 540
ttgtacgaca tgacttacta ccaagctttg aagtctacta acagattctc taacttgtgt 600
aacgaagact tcttggtttt cgctaagcaa gacttcgaca tccacgaagc tcaaaaccaa 660
aagggtttgc aacaattgca aagatggtac gctgactgta gattggacac tttgaacttc 720
ggtagagacg ttgttatcat cgctaactac ttggcttctt tgatcatcgg tgaccacgct 780
ttcgactacg ttagattggc tttcgctaag acttctgttt tggttactat catggacgac 840
ttcttcgact gtcacggttc ttctcaagaa tgtgacaaga tcatcgaatt ggttaaggaa 900
tggaaggaaa acccagacgc tgaatacggt tctgaagaat tggaaatctt gttcatggct 960
ttgtacaaca ctgttaacga attggctgaa agagctagag ttgaacaagg tagatctgtt 1020
aaggaattct tggttaagtt gtgggttgaa atcttgtctg ctttcaagat cgaattggac 1080
acttggtcta acggtactca acaatctttc gacgaataca tctcttcttc ttggttgtct 1140
aacggttcta gattgactgg tttgttgact atgcaattcg ttggtgttaa gttgtctgac 1200
gaaatgttga tgtctgaaga atgtactgac ttggctagac acgtttgtat ggttggtaga 1260
ttgttgaacg acgtttgttc ttctgaaaga gaaagagaag aaaacatcgc tggtaagtct 1320
tactctatct tgttggctac tgaaaaggac ggtagaaagg tttctgaaga cgaagctatc 1380
gctgaaatca acgaaatggt tgaataccac tggagaaagg ttttgcaaat cgtttacaag 1440
aaggaatcta tcttgccaag aagatgtaag gacgttttct tggaaatggc taagggtact 1500
ttctacgctt acggtatcaa cgacgaattg acttctccac aacaatctaa ggaagacatg 1560
aagtctttcg ttttctaa 1578
<210> 28
<211> 924
<212> DNA
<213> 人工序列(Artificial Sequence)
<223> 经优化的用于酿酒酵母(S. cerevisiae)表达的编码来自成团泛菌(Pantoeaagglomerans)的GGPP合酶的cDNA
<400> 28
atggtttctg gttctaaggc tggtgtttct ccacacagag aaatcgaagt tatgagacaa 60
tctatcgacg accacttggc tggtttgttg ccagaaactg actctcaaga catcgtttct 120
ttggctatga gagaaggtgt tatggctcca ggtaagagaa tcagaccatt gttgatgttg 180
ttggctgcta gagacttgag ataccaaggt tctatgccaa ctttgttgga cttggcttgt 240
gctgttgaat tgactcacac tgcttctttg atgttggacg acatgccatg tatggacaac 300
gctgaattga gaagaggtca accaactact cacaagaagt tcggtgaatc tgttgctatc 360
ttggcttctg ttggtttgtt gtctaaggct ttcggtttga tcgctgctac tggtgacttg 420
ccaggtgaaa gaagagctca agctgttaac gaattgtcta ctgctgttgg tgttcaaggt 480
ttggttttgg gtcaattcag agacttgaac gacgctgctt tggacagaac tccagacgct 540
atcttgtcta ctaaccactt gaagactggt atcttgttct ctgctatgtt gcaaatcgtt 600
gctatcgctt ctgcttcttc tccatctact agagaaactt tgcacgcttt cgctttggac 660
ttcggtcaag ctttccaatt gttggacgac ttgagagacg accacccaga aactggtaag 720
gacagaaaca aggacgctgg taagtctact ttggttaaca gattgggtgc tgacgctgct 780
agacaaaagt tgagagaaca catcgactct gctgacaagc acttgacttt cgcttgtcca 840
caaggtggtg ctatcagaca attcatgcac ttgtggttcg gtcaccactt ggctgactgg 900
tctccagtta tgaagatcgc ttaa 924
<210> 29
<211> 2175
<212> DNA
<213> 人工序列(Artificial Sequence)
<223> 经优化的用于酿酒酵母(S. cerevisiae)表达的编码CfCPS1-del63的cDNA
<400> 29
atggttgcta ctgttaacgc tccaccagtt cacgaccaag acgactctac tgaaaaccaa 60
tgtcacgacg ctgttaacaa catcgaagac ccaatcgaat acatcagaac tttgttgaga 120
actactggtg acggtagaat ctctgtttct ccatacgaca ctgcttgggt tgctttgatc 180
aaggacttgc aaggtagaga cgctccagaa ttcccatctt ctttggaatg gatcatccaa 240
aaccaattgg ctgacggttc ttggggtgac gctaagttct tctgtgttta cgacagattg 300
gttaacacta tcgcttgtgt tgttgctttg agatcttggg acgttcacgc tgaaaaggtt 360
gaaagaggtg ttagatacat caacgaaaac gttgaaaagt tgagagacgg taacgaagaa 420
cacatgactt gtggtttcga agttgttttc ccagctttgt tgcaaagagc taagtctttg 480
ggtatccaag acttgccata cgacgctcca gttatccaag aaatctacca ctctagagaa 540
caaaagtcta agagaatccc attggaaatg atgcacaagg ttccaacttc tttgttgttc 600
tctttggaag gtttggaaaa cttggaatgg gacaagttgt tgaagttgca atctgctgac 660
ggttctttct tgacttctcc atcttctact gctttcgctt tcatgcaaac tagagaccca 720
aagtgttacc aattcatcaa gaacactatc caaactttca acggtggtgc tccacacact 780
tacccagttg acgttttcgg tagattgtgg gctatcgaca gattgcaaag attgggtatc 840
tctagattct tcgaatctga aatcgctgac tgtatcgctc acatccacag attctggact 900
gaaaagggtg ttttctctgg tagagaatct gaattctgtg acatcgacga cacttctatg 960
ggtgttagat tgatgagaat gcacggttac gacgttgacc caaacgtttt gaagaacttc 1020
aagaaggacg acaagttctc ttgttacggt ggtcaaatga tcgaatctcc atctccaatc 1080
tacaacttgt acagagcttc tcaattgaga ttcccaggtg aacaaatctt ggaagacgct 1140
aacaagttcg cttacgactt cttgcaagaa aagttggctc acaaccaaat cttggacaag 1200
tgggttatct ctaagcactt gccagacgaa atcaagttgg gtttggaaat gccatggtac 1260
gctactttgc caagagttga agctagatac tacatccaat actacgctgg ttctggtgac 1320
gtttggatcg gtaagacttt gtacagaatg ccagaaatct ctaacgacac ttaccacgaa 1380
ttggctaaga ctgacttcaa gagatgtcaa gctcaacacc aattcgaatg gatctacatg 1440
caagaatggt acgaatcttg taacatggaa gaattcggta tctctagaaa ggaattgttg 1500
gttgcttact tcttggctac tgcttctatc ttcgaattgg aaagagctaa cgaaagaatc 1560
gcttgggcta agtctcaaat catctctact atcatcgctt ctttcttcaa caaccaaaac 1620
acttctccag aagacaagtt ggctttcttg actgacttca agaacggtaa ctctactaac 1680
atggctttgg ttactttgac tcaattcttg gaaggtttcg acagatacac ttctcaccaa 1740
ttgaagaacg cttggtctgt ttggttgaga aagttgcaac aaggtgaagg taacggtggt 1800
gctgacgctg aattgttggt taacactttg aacatctgtg ctggtcacat cgctttcaga 1860
gaagaaatct tggctcacaa cgactacaag actttgtcta acttgacttc taagatctgt 1920
agacaattgt ctcaaatcca aaacgaaaag gaattggaaa ctgaaggtca aaagacttct 1980
atcaagaaca aggaattgga agaagacatg caaagattgg ttaagttggt tttggaaaag 2040
tctagagttg gtatcaacag agacatgaag aagactttct tggctgttgt taagacttac 2100
tactacaagg cttaccactc tgctcaagct atcgacaacc acatgttcaa ggttttgttc 2160
gaaccagttg cttaa 2175
<210> 30
<211> 2100
<212> DNA
<213> 人工序列(Artificial Sequence)
<223> 经优化的用于酿酒酵母(S. cerevisiae)表达的编码TaTps1-del59的cDNA
<400> 30
atgtacagac aaagaactga cgaaccatct gaaactagac aaatgatcga cgacatcaga 60
actgctttgg cttctttggg tgacgacgaa acttctatgt ctgtttctgc ttacgacact 120
gctttggttg ctttggttaa gaacttggac ggtggtgacg gtccacaatt cccatcttgt 180
atcgactgga tcgttcaaaa ccaattgcca gacggttctt ggggtgaccc agctttcttc 240
atggttcaag acagaatgat ctctactttg gcttgtgttg ttgctgttaa gtcttggaac 300
atcgacagag acaacttgtg tgacagaggt gttttgttca tcaaggaaaa catgtctaga 360
ttggttgaag aagaacaaga ctggatgcca tgtggtttcg aaatcaactt cccagctttg 420
ttggaaaagg ctaaggactt ggacttggac atcccatacg accacccagt tttggaagaa 480
atctacgcta agagaaactt gaagttgttg aagatcccat tggacgtttt gcacgctatc 540
ccaactactt tgttgttctc tgttgaaggt atggttgact tgccattgga ctgggaaaag 600
ttgttgagat tgagatgtcc agacggttct ttccactctt ctccagctgc tactgctgct 660
gctttgtctc acactggtga caaggaatgt cacgctttct tggacagatt gatccaaaag 720
ttcgaaggtg gtgttccatg ttctcactct atggacactt tcgaacaatt gtgggttgtt 780
gacagattga tgagattggg tatctctaga cacttcactt ctgaaatcca acaatgtttg 840
gaattcatct acagaagatg gactcaaaag ggtttggctc acaacatgca ctgtccaatc 900
ccagacatcg acgacactgc tatgggtttc agattgttga gacaacacgg ttacgacgtt 960
actccatctg ttttcaagca cttcgaaaag gacggtaagt tcgtttgttt cccaatggaa 1020
actaaccacg cttctgttac tccaatgcac aacacttaca gagcttctca attcatgttc 1080
ccaggtgacg acgacgtttt ggctagagct ggtagatact gtagagcttt cttgcaagaa 1140
agacaatctt ctaacaagtt gtacgacaag tggatcatca ctaaggactt gccaggtgaa 1200
gttggttaca ctttgaactt cccatggaag tcttctttgc caagaatcga aactagaatg 1260
tacttggacc aatacggtgg taacaacgac gtttggatcg ctaaggtttt gtacagaatg 1320
aacttggttt ctaacgactt gtacttgaag atggctaagg ctgacttcac tgaataccaa 1380
agattgtcta gaatcgaatg gaacggtttg agaaagtggt acttcagaaa ccacttgcaa 1440
agatacggtg ctactccaaa gtctgctttg aaggcttact tcttggcttc tgctaacatc 1500
ttcgaaccag gtagagctgc tgaaagattg gcttgggcta gaatggctgt tttggctgaa 1560
gctgttacta ctcacttcag acacatcggt ggtccatgtt actctactga aaacttggaa 1620
gaattgatcg acttggtttc tttcgacgac gtttctggtg gtttgagaga agcttggaag 1680
caatggttga tggcttggac tgctaaggaa tctcacggtt ctgttgacgg tgacactgct 1740
ttgttgttcg ttagaactat cgaaatctgt tctggtagaa tcgtttcttc tgaacaaaag 1800
ttgaacttgt gggactactc tcaattggaa caattgactt cttctatctg tcacaagttg 1860
gctactatcg gtttgtctca aaacgaagct tctatggaaa acactgaaga cttgcaccaa 1920
caagttgact tggaaatgca agaattgtct tggagagttc accaaggttg tcacggtatc 1980
aacagagaaa ctagacaaac tttcttgaac gttgttaagt ctttctacta ctctgctcac 2040
tgttctccag aaactgttga ctctcacatc gctaaggtta tcttccaaga cgttatctaa 2100
<210> 31
<211> 2172
<212> DNA
<213> 人工序列(Artificial Sequence)
<223> 经优化的用于酿酒酵母(S. cerevisiae)表达的编码MvCps3-del63的cDNA
<400> 31
atggctccac cagaacaaaa gtacaactct actgctttgg aacacgacac tgaaatcatc 60
gaaatcgaag accacatcga atgtatcaga agattgttga gaactgctgg tgacggtaga 120
atctctgttt ctccatacga cactgcttgg atcgctttga tcaaggactt ggacggtcac 180
gactctccac aattcccatc ttctatggaa tgggttgctg acaaccaatt gccagacggt 240
tcttggggtg acgaacactt cgtttgtgtt tacgacagat tggttaacac tatcgcttgt 300
gttgttgctt tgagatcttg gaacgttcac gctcacaagt gtgaaaaggg tatcaagtac 360
atcaaggaaa acgttcacaa gttggaagac gctaacgaag aacacatgac ttgtggtttc 420
gaagttgttt tcccagcttt gttgcaaaga gctcaatcta tgggtatcaa gggtatccca 480
tacaacgctc cagttatcga agaaatctac aactctagag aaaagaagtt gaagagaatc 540
ccaatggaag ttgttcacaa ggttgctact tctttgttgt tctctttgga aggtttggaa 600
aacttggaat gggaaaagtt gttgaagttg caatctccag acggttcttt cttgacttct 660
ccatcttcta ctgctttcgc tttcatccac actaaggaca gaaagtgttt caacttcatc 720
aacaacatcg ttcacacttt caagggtggt gctccacaca cttacccagt tgacatcttc 780
ggtagattgt gggctgttga cagattgcaa agattgggta tctctagatt cttcgaatct 840
gaaatcgctg aattcttgtc tcacgttcac agattctggt ctgacgaagc tggtgttttc 900
tctggtagag aatctgtttt ctgtgacatc gacgacactt ctatgggttt gagattgttg 960
agaatgcacg gttaccacgt tgacccaaac gttttgaaga acttcaagca atctgacaag 1020
ttctcttgtt acggtggtca aatgatggaa tgttcttctc caatctacaa cttgtacaga 1080
gcttctcaat tgcaattccc aggtgaagaa atcttggaag aagctaacaa gttcgcttac 1140
aagttcttgc aagaaaagtt ggaatctaac caaatcttgg acaagtggtt gatctctaac 1200
cacttgtctg acgaaatcaa ggttggtttg gaaatgccat ggtacgctac tttgccaaga 1260
gttgaaactt cttactacat ccaccactac ggtggtggtg acgacgtttg gatcggtaag 1320
actttgtaca gaatgccaga aatctctaac gacacttaca gagaattggc tagattggac 1380
ttcagaagat gtcaagctca acaccaattg gaatggatct acatgcaaag atggtacgaa 1440
tcttgtagaa tgcaagaatt cggtatctct agaaaggaag ttttgagagc ttacttcttg 1500
gcttctggta ctatcttcga agttgaaaga gctaaggaaa gagttgcttg ggctagatct 1560
caaatcatct ctcacatgat caagtctttc ttcaacaagg aaactacttc ttctgaccaa 1620
aagcaagctt tgttgactga attgttgttc ggtaacatct ctgcttctga aactgaaaag 1680
agagaattgg acggtgttgt tgttgctact ttgagacaat tcttggaagg tttcgacatc 1740
ggtactagac accaagttaa ggctgcttgg gacgtttggt tgagaaaggt tgaacaaggt 1800
gaagctcacg gtggtgctga cgctgaattg tgtactacta ctttgaacac ttgtgctaac 1860
caacacttgt cttctcaccc agactacaac actttgtcta agttgactaa caagatctgt 1920
cacaagttgt ctcaaatcca acaccaaaag gaaatgaagg gtggtatcaa ggctaagtgt 1980
tctatcaaca acaaggaagt tgacatcgaa atgcaatggt tggttaagtt ggttttggaa 2040
aagtctggtt tgaacagaaa ggctaagcaa gctttcttgt ctatcgctaa gacttactac 2100
tacagagctt actacgctga ccaaactatg gacgctcaca tcttcaaggt tttgttcgaa 2160
ccagttgttt aa 2172
<210> 32
<211> 2202
<212> DNA
<213> 人工序列(Artificial Sequence)
<223> 经优化的用于酿酒酵母(S. cerevisiae)表达的编码RoCPS1-del67的cDNA
<400> 32
atggcttctc aagtttctga aaagggtact tcttctccag ttcaaactcc agaagaagtt 60
aacgaaaaga tcgaaaacta catcgaatac atcaagaact tgttgactac ttctggtgac 120
ggtagaatct ctgtttctcc atacgacact tctatcgttg ctttgatcaa ggacttgaag 180
ggtagagaca ctccacaatt cccatcttgt ttggaatgga tcgctcaaca ccaaatggct 240
gacggttctt ggggtgacga attcttctgt atctacgaca gaatcttgaa cactttggct 300
tgtgttgttg ctttgaagtc ttggaacgtt cacgctgaca tgatcgaaaa gggtgttact 360
tacgttaacg aaaacgttca aaagttggaa gacggtaact tggaacacat gacttctggt 420
ttcgaaatcg ttgttccagc tttggttcaa agagctcaag acttgggtat ccaaggtttg 480
ccatacgacc acccattgat caaggaaatc gctaacacta aggaaggtag attgaagaag 540
atcccaaagg acatgatcta ccaaaagcca actactttgt tgttctcttt ggaaggtttg 600
ggtgacttgg aatgggaaaa gatcttgaag ttgcaatctg gtgacggttc tttcttgact 660
tctccatctt ctactgctca cgttttcatg aagactaagg acgaaaagtg tttgaagttc 720
atcgaaaacg ctgttaagaa ctgtaacggt ggtgctccac acacttaccc agttgacgtt 780
ttcgctagat tgtgggctgt tgacagattg caaagattgg gtatctctag attcttccaa 840
caagaaatca agtacttctt ggaccacatc aactctgttt ggactgaaaa cggtgttttc 900
tctggtagag actctgaatt ctgtgacatc gacgacactt ctatgggtat cagattgttg 960
aagatgcacg gttacgacat cgacccaaac gctttggaac acttcaagca acaagacggt 1020
aagttctctt gttacggtgg tcaaatgatc gaatctgctt ctccaatcta caacttgtac 1080
agagctgctc aattgagatt cccaggtgaa gaaatcttgg aagaagctac taagttcgct 1140
tacaacttct tgcaagaaaa gatcgctaac gaccaattcc aagaaaagtg ggttatctct 1200
gaccacttga tcgacgaagt taagttgggt ttgaagatgc catggtacgc tactttgcca 1260
agagttgaag ctgcttacta cttgcaatac tacgctggtt gtggtgacgt ttggatcggt 1320
aaggttttct acagaatgcc agaaatctct aacgacactt acaagaagtt ggctatcttg 1380
gacttcaaca gatgtcaagc tcaacaccaa ttcgaatgga tctacatgca agaatggtac 1440
cacagatctt ctgtttctga attcggtatc tctaagaagg acttgttgag agcttacttc 1500
ttggctgctg ctactatctt cgaaccagaa agaactcaag aaagattggt ttgggctaag 1560
actcaaatcg tttctggtat gatcacttct ttcgttaact ctggtactac tttgtctttg 1620
caccaaaaga ctgctttgtt gtctcaaatc ggtcacaact tcgacggttt ggacgaaatc 1680
atctctgcta tgaaggacca cggtttggct gctactttgt tgactacttt ccaacaattg 1740
ttggacggtt tcgacagata cactagacac caattgaaga acgcttggtc tcaatggttc 1800
atgaagttgc aacaaggtga agcttctggt ggtgaagacg ctgaattgtt ggctaacact 1860
ttgaacatct gtgctggttt gatcgctttc aacgaagacg ttttgtctca ccacgaatac 1920
actactttgt ctactttgac taacaagatc tgtaagagat tgactcaaat ccaagacaag 1980
aagactttgg aagttgttga cggttctatc aaggacaagg aattggaaaa ggacatccaa 2040
atgttggtta agttggtttt ggaagaaaac ggtggtggtg ttgacagaaa catcaagcac 2100
actttcttgt ctgttttcaa gactttctac tacaacgctt accacgacga cgaaactact 2160
gacgttcaca tcttcaaggt tttgttcggt ccagttgttt aa 2202
<210> 33
<211> 2301
<212> DNA
<213> 人工序列(Artificial Sequence)
<223> 经优化的用于酿酒酵母(S. cerevisiae)表达的编码NgSCS-del29的cDNA
<400> 33
atggctaact tccacagacc atctagagtt agatgttctc actctactgc ttcttctttg 60
gaagaagcta aggaaagaat cagagaaact ttcggtaaga acgaattgtc tccatcttct 120
tacgacactg cttgggttgc tatggttcca tctagatact ctatgaacca accatgtttc 180
ccaagatgtt tggactggat cttggaaaac caaagagaag acggttcttg gggtttgaac 240
ccatctcacc cattgttggt taaggactct ttgtcttcta ctttggcttg tttgttggct 300
ttgagaaagt ggagaatcgg tgacaaccaa gttcaaagag gtttgggttt catcgaaact 360
cacggttggg ctgttgacaa cgttgaccaa atctctccat tgggtttcga catcatcttc 420
ccatctatga tcaagtacgc tgaaaagttg aacttggact tgccattcga cccaaacttg 480
gttaacatga tgttgagaga aagagaattg actatcgaaa gagctttgaa gaacgaattc 540
gaaggtaaca tggctaacgt tgaatacttc gctgaaggtt tgggtgaatt gtgtcactgg 600
aaggaaatca tgttgcacca aagaagaaac ggttctttgt tcgactctcc agctactact 660
gctgctgctt tgatctacca ccaacacgac gaaaagtgtt tcggttactt gtcttctatc 720
ttgaagttgc acgaaaactg ggttccaact atctacccaa ctaaggttca ctctaacttg 780
ttcttcgttg acgctttgca aaacttgggt gttgacagat acttcaagac tgaattgaag 840
tctgttttgg acgaaatcta cagattgtgg ttggaaaaga acgaagaaat cttctctgac 900
atcgctcact gtgctatggc tttcagattg ttgagaatga acaactacga agtttcttct 960
gaagaattgg aaggtttcgt tgaccaagaa cacttcttca ctacttctgg tggtaagttg 1020
atctctcacg ttgctatctt ggaattgcac agagcttctc aagttgacat ccaagaaggt 1080
aaggacttga tcttggacaa gatctctact tggactagaa acttcatgga acaagaattg 1140
ttggacaacc aaatcttgga cagatctaag aaggaaatgg aattcgctat gagaaagttc 1200
tacggtactt tcgacagagt tgaaactaga agatacatcg aatcttacaa gatggactct 1260
ttcaagatct tgaaggctgc ttacagatct tctaacatca acaacatcga cttgttgaag 1320
ttctctgaac acgacttcaa cttgtgtcaa gctagacaca aggaagaatt gcaacaaatc 1380
aagagatggt tcgctgactg taagttggaa caagttggtt cttctcaaaa ctacttgtac 1440
acttcttact tcccaatcgc tgctatcttg ttcgaaccag aatacggtga cgctagattg 1500
gctttcgcta agtgtggtat catcgctact actgttgacg acttcttcga cggtttcgct 1560
tgtaacgaag aattgcaaaa catcatcgaa ttggttgaaa gatgggacgg ttacccaact 1620
gttggtttca gatctgaaag agttagaatc ttcttcttgg ctttgtacaa gatgatcgaa 1680
gaaatcgctg ctaaggctga aactaagcaa ggtagatgtg ttaaggactt gttgatcaac 1740
ttgtggatcg acttgttgaa gtgtatgttg gttgaattgg acttgtggaa gatcaagtct 1800
actactccat ctatcgaaga atacttgtct atcgcttgtg ttactactgg tgttaagtgt 1860
ttgatcttga tctctttgca cttgttgggt ccaaagttgt ctaaggacgt tactgaatct 1920
tctgaagttt ctgctttgtg gaactgtact gctgttgttg ctagattgaa caacgacatc 1980
cactcttaca agagagaaca agctgaatct tctactaaca tggctgctat cttgatctct 2040
caatctcaaa gaactatctc tgaagaagaa gctatcagac aaatcaagga aatgatggaa 2100
tctaagagaa gagaattgtt gggtatggtt ttgcaaaaca aggaatctca attgccacaa 2160
gtttgtaagg acttgttctg gactactttc aaggctgctt actctatcta cactcacggt 2220
gacgaataca gattcccaca agaattgaag aaccacatca acgacgttat ctacaagcca 2280
ttgaaccaat actctccata a 2301
<210> 34
<211> 2268
<212> DNA
<213> 人工序列(Artificial Sequence)
<223> 经优化的用于酿酒酵母(S. cerevisiae)表达的编码NgSCS-del38的cDNA
<400> 34
atgtctcact ctactgcttc ttctttggaa gaagctaagg aaagaatcag agaaactttc 60
ggtaagaacg aattgtcttc ttcttcttac gacactgctt gggttgctat ggttccatct 120
agatactcta tgaaccaacc atgtttccca agatgtttgg actggatctt ggaaaaccaa 180
agagaagacg gttcttgggg tttgaaccca tctttgccat tgttggttaa ggactctttg 240
tcttctactt tggcttgttt gttggctttg agaaagtgga gaatcggtga caaccaagtt 300
caaagaggtt tgggtttcat cgaaactcac ggttgggctg ttgacaacgt tgaccaaatc 360
tctccattgg gtttcgacat catcttccca tctatgatca agtacgctga aaagttgaac 420
ttggacttgc cattcgaccc aaacttggtt aacatgatgt tgagagaaag agaattgact 480
atcgaaagag ctttgaagaa cgaattcgaa ggtaacatgg ctaacgttga atacttcgct 540
gaaggtttgg gtgaattgtg tcactggaag gaaatcatgt tgcaccaaag aagaaacggt 600
tctccattcg actctccagc tactactgct gctgctttga tctaccacca acacgacgaa 660
aagtgtttcg gttacttgtc ttctatcttg aagttgcacg aaaactgggt tccaactatc 720
tacccaacta aggttcactc taacttgttc ttcgttgacg ctttgcaaaa cttgggtgtt 780
gacagatact tcaagactga attgaagtct gttttggacg aaatctacag attgtggttg 840
gaaaagaacg aagaaatctt ctctgacatc gctcactgtg ctatggcttt cagattgttg 900
agaatgaaca actacgaagt ttcttctgaa gaattggaag gtttcgttga ccaagaacac 960
ttcttcacta cttctggtgg taagttgatc tctcacgttg ctatcttgga attgcacaga 1020
gcttctcaag ttgacatcca agaaggtaag gacttgatct tggacaagat ctctacttgg 1080
actagaaact tcatggaaca agaattgttg gacaaccaaa tcttggacag atctaagaag 1140
gaaatggaat tcgctatgag aaagttctac ggtactttcg acagagttga aactagaaga 1200
tacatcgaat cttacaagat ggactctttc aagatcttga aggctgctta cagatcttct 1260
aacatcaaca acatcgactt gttgaagttc tctgaacacg acttcaactt gtgtcaagct 1320
agacacaagg aagaattgca acaaatcaag agatggttcg ctgactgtaa gttggaacaa 1380
gttggttctt ctcaaaacta cttgtacact tcttacttcc caatcgctgc tatcttgttc 1440
gaaccagaat acggtgacgc tagattggct ttcgctaagt gtggtatcat cgctactact 1500
gttgacgact tcttcgacgg tttcgcttgt aacgaagaat tgcaaaacat catcgaattg 1560
gttgaaagat gggacggtta cccaactgtt ggtttcagat ctgaaagagt tagaatcttc 1620
ttcttggctt tgtacaagat gatcgaagaa atcgctgcta aggctgaaac taagcaaggt 1680
agatgtgtta aggacttgtt gatcaacttg tggatcgact tgttgaagtg tatgttggtt 1740
gaattggact tgtggaagat caagtctact actccatcta tcgaagaata cttgtctatc 1800
gcttgtgtta ctactggtgt taagtgtttg atcttgatct ctttgcactt gttgggtcca 1860
aagttgtcta aggacgttac tgaatcttct gaagtttctg ctttgtggaa ctgtactgct 1920
gttgttgcta gattgaacaa cgacatccac tcttacaaga gagaacaagc tgaatcttct 1980
actaacatgg ttgctatctt gatctctcaa tctcaaagaa ctatctctga agaagaagct 2040
atcagacaaa tcaaggaaat gatggaatct aagagaagag aattgttggg tatggttttg 2100
caaaacaagg aatctcaatt gccacaagtt tgtaaggact tgttctggac tactttcaag 2160
gctgcttact ctatctacac tcacggtgac gaatacagat tcccacaaga attgaagaac 2220
cacatcaacg acgttatcta caagccattg aaccaatact ctccataa 2268
<210> 35
<211> 85
<212> DNA
<213> 人工序列(Artificial Sequence)
<223> 引物序列(Primer Sequence)
<400> 35
aggtgcagtt cgcgtgcaat tataacgtcg tggcaactgt tatcagtcgt accgcgccat 60
tgagagtgca ccataccaca gcttt 85
<210> 36
<211> 85
<212> DNA
<213> 人工序列(Artificial Sequence)
<223> 引物序列(Primer Sequence)
<400> 36
tcgtggtcaa ggcgtgcaat tctcaacacg agagtgattc ttcggcgttg ttgctgacca 60
gcggtatttc acaccgcata gggta 85
<210> 37
<211> 85
<212> DNA
<213> 人工序列(Artificial Sequence)
<223> 引物序列(Primer Sequence)
<400> 37
tggtcagcaa caacgccgaa gaatcactct cgtgttgaga attgcacgcc ttgaccacga 60
cacgttaagg gattttggtc atgag 85
<210> 38
<211> 80
<212> DNA
<213> 人工序列(Artificial Sequence)
<223> 引物序列(Primer Sequence)
<400> 38
aacgcgtacc ctaagtacgg caccacagtg actatgcagt ccgcactttg ccaatgccaa 60
aaatgtgcgc ggaaccccta 80
<210> 39
<211> 84
<212> DNA
<213> 人工序列(Artificial Sequence)
<223> 引物序列(Primer Sequence)
<400> 39
ttggcattgg caaagtgcgg actgcatagt cactgtggtg ccgtacttag ggtacgcgtt 60
cctgaacgaa gcatctgtgc ttca 84
<210> 40
<211> 85
<212> DNA
<213> 人工序列(Artificial Sequence)
<223> 引物序列(Primer Sequence)
<400> 40
ccgagatgcc aaaggatagg tgctatgttg atgactacga cacagaactg cgggtgacat 60
aatgatagca ttgaaggatg agact 85
<210> 41
<211> 82
<212> DNA
<213> 人工序列(Artificial Sequence)
<223> 引物序列(Primer Sequence)
<400> 41
atgtcacccg cagttctgtg tcgtagtcat caacatagca cctatccttt ggcatctcgg 60
tgagcaaaag gccagcaaaa gg 82
<210> 42
<211> 81
<212> DNA
<213> 人工序列(Artificial Sequence)
<223> 引物序列(Primer Sequence)
<400> 42
ctcagatgta cggtgatcgc caccatgtga cggaagctat cctgacagtg tagcaagtgc 60
tgagcgtcag accccgtaga a 81
<210> 43
<211> 60
<212> DNA
<213> 人工序列(Artificial Sequence)
<223> 引物序列(Primer Sequence)
<400> 43
attcctagtg acggccttgg gaactcgata cacgatgttc agtagaccgc tcacacatgg 60
<210> 44
<211> 79
<212> DNA
<213> 人工序列(Artificial Sequence)
<223> 引物序列(Primer Sequence)
<400> 44
aggtgcagtt cgcgtgcaat tataacgtcg tggcaactgt tatcagtcgt accgcgccat 60
tcgactacgt cgtaaggcc 79
<210> 45
<211> 80
<212> DNA
<213> 人工序列(Artificial Sequence)
<223> 引物序列(Primer Sequence)
<400> 45
tcgtggtcaa ggcgtgcaat tctcaacacg agagtgattc ttcggcgttg ttgctgacca 60
tcgacggtcg aggagaactt 80

Claims (15)

1.一种生产(+)-迈诺醇的方法,包括:
a)使香叶基香叶基二磷酸(GGPP)与柯巴基二磷酸(CPP)合酶接触以形成柯巴基二磷酸,其中该CPP合酶包含:
a)与SEQ ID NO:14或SEQ ID NO:15具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或100%序列同一性的氨基酸序列;或者
b)与SEQ ID NO:17或SEQ ID NO:18具有至少71%、72%、75%、80%、85%、90%、95%、98%、99%或100%序列同一性的氨基酸序列;或者
c)与SEQ ID NO:20或SEQ ID NO:21具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列;并且
b)使CPP与香紫苏醇合酶接触以形成(+)-迈诺醇;并且
c)可选地,分离(+)-迈诺醇。
2.权利要求1所述的方法,其中该CPP合酶包含:
a)包含与SEQ ID NO:14或SEQ ID NO:15具有至少90%、95%、98%、99%或100%序列同一性的氨基酸序列的多肽;或者
b)包含与SEQ ID NO:17或SEQ ID NO:18具有至少90%、95%、98%、99%或100%序列同一性的氨基酸序列的多肽;或者
c)包含与SEQ ID NO:20或SEQ ID NO:21具有95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的多肽。
3.权利要求1的方法,其中步骤a)包括在有利于CPP生产的条件下培养能够生产GGPP并经转化以表达至少一种多肽的非人宿主生物体或细胞,该至少一种多肽包含:
a)与SEQ ID NO:14或SEQ ID NO:15具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或100%序列同一性的氨基酸序列;或者
b)与SEQ ID NO:17或SEQ ID NO:18具有至少71%、72%、75%、80%、85%、90%、95%、98%、99%或100%序列同一性的氨基酸序列;或者
c)与SEQ ID NO:20或SEQ ID NO:21具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列;
并具有CPP合酶活性。
4.权利要求1或2的方法,其中该方法还包括,在步骤a)之前,用如下物质转化能够生产GGPP的非人宿主生物体或细胞:
a)至少一种编码多肽的核酸,该多肽包含:
a)与SEQ ID NO:14或SEQ ID NO:15具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或100%序列同一性的氨基酸序列;或者
b)与SEQ ID NO:17和SEQ ID NO:18具有至少71%、72%、75%、80%、85%、90%、95%、98%、99%或100%序列同一性的氨基酸序列;或者
c)与SEQ ID NO:20或SEQ ID NO:21具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列;并且
具有CPP合酶活性,使得所述生物体或细胞表达具有CPP合酶活性的所述多肽;和
b)至少一种编码具有香紫苏醇合酶活性的多肽的核酸,使得所述生物体或细胞表达所述具有香紫苏醇合酶活性的多肽。
5.根据权利要求1~4中任一项所述的方法,其中该具有香紫苏醇合酶活性的多肽包含与SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:23或SEQ ID NO:25具有至少90%、95%、98%、99%或100%序列同一性的氨基酸序列。
6.根据权利要求1~5中任一项所述的方法,还包括使用化学或生物化学合成或两者的组合将(+)-迈诺醇加工成(+)-迈诺醇衍生物。
7.根据权利要求6所述的方法,其中该衍生物是醇、缩醛、醛、酸、醚、酮、内酯、乙酸酯和/或酯。
8.根据权利要求6或7所述的方法,其中该衍生物是从由柯巴醇、柯巴醛、迈诺醇氧基、Z-11、γ-ambrol和降龙涎香醚构成的群组中选出的。
9.一种转化宿主细胞或非人生物体的方法,包括用编码具有柯巴基二磷酸合酶活性的多肽的核酸和编码具有香紫苏醇合酶活性的多肽的核酸转化宿主细胞或非人生物体,
其中该具有柯巴基二磷酸活性的多肽包含:
a)与SEQ ID NO:14或SEQ ID NO:15具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或100%序列同一性的氨基酸序列;或者
b)与SEQ ID NO:17或SEQ ID NO:18具有至少71%、72%、75%、80%、85%、90%、95%、98%、99%或100%序列同一性的氨基酸序列;要么
c)与SEQ ID NO:20和SEQ ID NO:21具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列;并且
其中该具有香紫苏醇合酶活性的多肽包含与SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:23或SEQ ID NO:25具有至少90%、95%、98%、99%或100%序列同一性的氨基酸序列。
10.根据权利要求4~9中任一项所述的方法,其中该宿主细胞或非人生物体是植物、原核生物或真菌。
11.根据权利要求4~10中任一项所述的方法,其中该非人宿主生物体或细胞是大肠杆菌(E.coli)或酿酒酵母(Saccharomyces cerevisiae)。
12.一种表达载体,包含:
a)编码具有CPP合酶活性的多肽的核酸,该多肽包含:
a)与SEQ ID NO:14或SEQ ID NO:15具有至少90%、95%、98%、99%或100%序列同一性的氨基酸序列;或者
b)与SEQ ID NO:17或SEQ ID NO:18具有至少95%、98%、99%或100%序列同一性的氨基酸序列;或者
c)与SEQ ID NO:20或SEQ ID NO:21具有98%、99%或100%序列同一性的氨基酸序列;或者
b)编码具有CPP合酶活性的多肽的核酸,该核酸包含与SEQ ID NO:13、SEQ ID NO:16、SEQ ID NO:19、SEQ ID NO:22、SEQ ID NO:26、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31或SEQ ID NO:32所示的核酸序列具有至少90%、95%、98%、99%或100%序列同一性的核苷酸序列。
13.权利要求12的表达载体,还包含:
a)编码具有香紫苏醇合酶活性的多肽的核酸,其中该具有香紫苏醇合酶活性的多肽包含与SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:23或SEQ ID NO:25具有至少90%、95%、98%、99%或100%序列同一性的氨基酸序列;或者
b)编码具有香紫苏醇合酶活性的多肽的核酸,该核酸包含与SEQ ID NO:6、SEQ ID NO:24、SEQ ID NO:27、SEQ ID NO:33或SEQ ID NO:34具有至少90%、95%、98%、99%或100%序列同一性的核苷酸序列。
14.一种非人宿主生物体或细胞,包含:
a)权利要求12或13所述的表达载体;或者
b)编码具有柯巴基二磷酸合酶活性的多肽的核酸和编码具有香紫苏醇合酶活性的多肽的核酸,
其中该具有柯巴基二磷酸活性的多肽包含:
i.与SEQ ID NO:14或SEQ ID NO:15具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或100%序列同一性的氨基酸序列;或者
ii.与SEQ ID NO:17或SEQ ID NO:18具有至少71%、72%、75%、80%、85%、90%、95%、98%、99%或100%序列同一性的氨基酸序列;或者
iii.与SEQ ID NO:20或SEQ ID NO:21具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列;并且
其中该具有香紫苏醇合酶活性的多肽包含与SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:23或SEQ ID NO:25具有至少90%、95%、98%、99%或100%序列同一性的氨基酸序列;并且
其中核酸中的至少一种对非人宿主生物体或细胞是异源的。
15.权利要求14的非人宿主生物体或细胞,其中该非人宿主生物体或细胞是植物、原核生物、真菌、大肠杆菌(Escherichia coli)或酿酒酵母(Saccharomyces cerevisiae)。
CN201780079583.3A 2016-12-22 2017-12-18 迈诺醇的生产 Active CN110100003B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311395610.1A CN117604043A (zh) 2016-12-22 2017-12-18 迈诺醇的生产

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP16206349 2016-12-22
EP16206349.9 2016-12-22
PCT/EP2017/083372 WO2018114839A2 (en) 2016-12-22 2017-12-18 Production of manool

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN202311395610.1A Division CN117604043A (zh) 2016-12-22 2017-12-18 迈诺醇的生产

Publications (2)

Publication Number Publication Date
CN110100003A true CN110100003A (zh) 2019-08-06
CN110100003B CN110100003B (zh) 2023-11-17

Family

ID=57629393

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202311395610.1A Pending CN117604043A (zh) 2016-12-22 2017-12-18 迈诺醇的生产
CN201780079583.3A Active CN110100003B (zh) 2016-12-22 2017-12-18 迈诺醇的生产

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN202311395610.1A Pending CN117604043A (zh) 2016-12-22 2017-12-18 迈诺醇的生产

Country Status (8)

Country Link
US (2) US10752922B2 (zh)
EP (1) EP3559245B1 (zh)
JP (1) JP7160811B2 (zh)
CN (2) CN117604043A (zh)
BR (1) BR112019013014A2 (zh)
ES (1) ES2899121T3 (zh)
MX (2) MX2019006635A (zh)
WO (1) WO2018114839A2 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114150011A (zh) * 2021-11-17 2022-03-08 天津大学 异源合成鼠尾草酸的重组酿酒酵母及构建方法

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
MX2021015192A (es) * 2019-07-10 2022-01-18 Firmenich & Cie Metodo biocatalitico para la degradacion controlada de compuestos de terpeno.
CA3224941A1 (en) * 2021-07-06 2023-01-12 Martinus Julius Beekwilder Recombinant manufacture of c-20 terpenoid alcohols

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009044336A2 (en) * 2007-10-05 2009-04-09 Firmenich Sa Method for producing diterpenes
CN101939430A (zh) * 2008-02-15 2011-01-05 弗门尼舍有限公司 生产香紫苏醇的方法
US20130224809A1 (en) * 2011-11-21 2013-08-29 Joerg Bohlmann Diterpene Synthases And Method For Producing Diterpenoids
WO2014022434A1 (en) * 2012-07-30 2014-02-06 Allylix, Inc. Sclareol and labdenediol diphosphate synthase polypeptides encoding nucleic acid molecules and uses thereof
WO2015113570A1 (en) * 2014-01-31 2015-08-06 University Of Copenhagen Methods for producing diterpenes
WO2015197075A1 (en) * 2014-06-23 2015-12-30 University Of Copenhagen Methods and materials for production of terpenoids
US20160177360A1 (en) * 2013-05-31 2016-06-23 Dsm Ip Assets B.V. Microorganisms for diterpene production

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3681853D1 (de) 1985-08-12 1991-11-14 Firmenich & Cie Verfahren zur herstellung von sauerstoff enthaltenden decalinderivaten.
JPH0696571B2 (ja) * 1986-12-24 1994-11-30 ハリマ化成株式会社 8α,12−エポキシ−13,14,15,16−テトラノルラブダンの製造方法
JPH07206655A (ja) * 1994-01-14 1995-08-08 Pola Chem Ind Inc メラニン産生抑制剤及び皮膚外用剤
US7294492B2 (en) 2005-01-07 2007-11-13 International Flavors & Fragrances Inc. Process for the manufacture of spiroketals
US8617860B2 (en) 2008-01-29 2013-12-31 Firmenich Sa Method for producing sclareol
US10000773B2 (en) 2011-11-01 2018-06-19 Firmenich Sa Cytochrome P450 and use thereof for the enzymatic oxidation of terpenes
US20150339371A1 (en) 2012-06-28 2015-11-26 Nokia Corporation Method and apparatus for classifying significant places into place categories

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009044336A2 (en) * 2007-10-05 2009-04-09 Firmenich Sa Method for producing diterpenes
CN101939430A (zh) * 2008-02-15 2011-01-05 弗门尼舍有限公司 生产香紫苏醇的方法
US20110041218A1 (en) * 2008-02-15 2011-02-17 Firmenich Sa Method for producing sclareol
US20130224809A1 (en) * 2011-11-21 2013-08-29 Joerg Bohlmann Diterpene Synthases And Method For Producing Diterpenoids
WO2014022434A1 (en) * 2012-07-30 2014-02-06 Allylix, Inc. Sclareol and labdenediol diphosphate synthase polypeptides encoding nucleic acid molecules and uses thereof
US20160177360A1 (en) * 2013-05-31 2016-06-23 Dsm Ip Assets B.V. Microorganisms for diterpene production
WO2015113570A1 (en) * 2014-01-31 2015-08-06 University Of Copenhagen Methods for producing diterpenes
WO2015197075A1 (en) * 2014-06-23 2015-12-30 University Of Copenhagen Methods and materials for production of terpenoids

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
TOMONOBU TOYOMASU: "Cloning and Characterization of cDNAs Encoding ent -Copalyl Diphosphate Synthases in Wheat: Insight into the Evolution of Rice Phytoalexin Biosynthetic Genes", 《BIOSCIENCE BIOTECHNOLOGY BIOCHEMISTRY》 *
TOMONOBU TOYOMASU: "Cloning and Characterization of cDNAs Encoding ent -Copalyl Diphosphate Synthases in Wheat: Insight into the Evolution of Rice Phytoalexin Biosynthetic Genes", 《BIOSCIENCE BIOTECHNOLOGY BIOCHEMISTRY》, vol. 73, no. 3, 23 March 2009 (2009-03-23), pages 1 - 2, XP055379832, DOI: 10.1271/bbb.80781 *
YISHENG WU: "Functional characterization of wheat copalyl diphosphate synthases sheds light on the early evolution of labdane- related diterpenoid metabolism in the cereals", 《PHYTOCHEMISTRY》 *
YISHENG WU: "Functional characterization of wheat copalyl diphosphate synthases sheds light on the early evolution of labdane- related diterpenoid metabolism in the cereals", 《PHYTOCHEMISTRY》, vol. 84, no. 1, 1 December 2012 (2012-12-01), pages 4 - 5 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114150011A (zh) * 2021-11-17 2022-03-08 天津大学 异源合成鼠尾草酸的重组酿酒酵母及构建方法

Also Published As

Publication number Publication date
JP7160811B2 (ja) 2022-10-25
ES2899121T3 (es) 2022-03-10
JP2020513755A (ja) 2020-05-21
US20190352673A1 (en) 2019-11-21
WO2018114839A3 (en) 2018-08-30
US10752922B2 (en) 2020-08-25
EP3559245B1 (en) 2021-08-25
MX2021011770A (es) 2021-10-22
CN117604043A (zh) 2024-02-27
EP3559245A2 (en) 2019-10-30
BR112019013014A2 (pt) 2020-01-14
CN110100003B (zh) 2023-11-17
MX2019006635A (es) 2019-08-21
US20210010035A1 (en) 2021-01-14
WO2018114839A2 (en) 2018-06-28

Similar Documents

Publication Publication Date Title
CN101001947A (zh) 遗传修饰的宿主细胞及其用于生产类异戊二烯化合物的应用
US20210010035A1 (en) Production of manool
US20180208948A1 (en) Drimenol synthases i
US11773414B2 (en) Sesquiterpene synthases for production of drimenol and mixtures thereof
CN110691850B (zh) 生产折叶苔醇和/或补身醇的方法
AU2021384448A1 (en) Cannabidiolic acid synthase variants with improved activity for use in production of phytocannabinoids
CN106460014A (zh) 补身醇合酶及生产补身醇的方法
CN112680483A (zh) 山鸡椒醇脱氢酶LcADH31在制备柠檬醛或以其为活性物质的产品中的应用
CN107889506B (zh) 迈诺醇的生产
CN115976118B (zh) 一种生物合成诺卡酮的方法及载体
CN113621633B (zh) 一种杧果萜烯合成酶基因tps1及其应用
CN109477120A (zh) 香根草
US10337031B2 (en) Production of fragrant compounds
CN116529374A (zh) 具有改善的用于生产植物大麻素的活性的橄榄醇酸环化酶变体
Liang et al. MptriA, an acetyltransferase gene involved in pigment biosynthesis in M. purpureus YY-1
BR112017028183B1 (pt) Produção de manool

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant