CN109477120A - 香根草 - Google Patents

香根草 Download PDF

Info

Publication number
CN109477120A
CN109477120A CN201780043135.8A CN201780043135A CN109477120A CN 109477120 A CN109477120 A CN 109477120A CN 201780043135 A CN201780043135 A CN 201780043135A CN 109477120 A CN109477120 A CN 109477120A
Authority
CN
China
Prior art keywords
cus
valencene
leu
seq
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201780043135.8A
Other languages
English (en)
Other versions
CN109477120B (zh
Inventor
M·沙尔克
L·洛奇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Firmenich SA
Original Assignee
Firmenich SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from GBGB1612609.6A external-priority patent/GB201612609D0/en
Application filed by Firmenich SA filed Critical Firmenich SA
Publication of CN109477120A publication Critical patent/CN109477120A/zh
Application granted granted Critical
Publication of CN109477120B publication Critical patent/CN109477120B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/62Carboxylic acid esters
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P5/00Preparation of hydrocarbons or halogenated hydrocarbons
    • C12P5/007Preparation of hydrocarbons or halogenated hydrocarbons containing one or more isoprene units, i.e. terpenes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0012Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7)
    • C12N9/0036Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7) acting on NADH or NADPH (1.6)
    • C12N9/0038Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7) acting on NADH or NADPH (1.6) with a heme protein as acceptor (1.6.2)
    • C12N9/0042NADPH-cytochrome P450 reductase (1.6.2.4)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/88Lyases (4.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/02Preparation of oxygen-containing organic compounds containing a hydroxy group
    • C12P7/22Preparation of oxygen-containing organic compounds containing a hydroxy group aromatic
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/24Preparation of oxygen-containing organic compounds containing a carbonyl group
    • C12P7/26Ketones
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y106/00Oxidoreductases acting on NADH or NADPH (1.6)
    • C12Y106/02Oxidoreductases acting on NADH or NADPH (1.6) with a heme protein as acceptor (1.6.2)
    • C12Y106/02004NADPH-hemoprotein reductase (1.6.2.4), i.e. NADP-cytochrome P450-reductase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y402/00Carbon-oxygen lyases (4.2)
    • C12Y402/03Carbon-oxygen lyases (4.2) acting on phosphates (4.2.3)
    • C12Y402/03073Valencene synthase (4.2.3.73)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y402/00Carbon-oxygen lyases (4.2)
    • C12Y402/03Carbon-oxygen lyases (4.2) acting on phosphates (4.2.3)
    • C12Y402/03113Terpinolene synthase (4.2.3.113)

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

提供一种生产一种或多种倍半萜化合物的方法,包括:使非环状FPP前体与具有萜合酶活性的多肽接触,其中该多肽包含与SEQ ID NO:1具有至少55%序列同一性的氨基酸序列,以产生从异朱栾倍半萜、香根螺‑1(10),7(11)‑二烯和朱栾倍半萜或它们的衍生物中选出的一种或多种萜,或包含异朱栾倍半萜、香根螺‑1(10),7(11)‑二烯和/或朱栾倍半萜中的一种或多种的倍半萜的混合物;并且可选地,分离该一种或多种萜或该混合物。还描述了衍生自香根草的核酸,其编码具有倍半萜合酶活性的多肽,一种多肽,其可用于产生一种或多种倍半萜或包含异朱栾倍半萜、香根螺‑1(10),7(11)‑二烯和/或朱栾倍半萜中的一种或多种的倍半萜的混合物,以及一种非人生物体或细胞,其包含该核酸或包含含有该核酸的表达载体。

Description

香根草
技术领域
本文提供了生产倍半萜、香根草和相关化合物和衍生物的生物化学方法。
背景技术
在大多数生物体(微生物、动物和植物)中发现了萜烯。这些化合物由称为异戊二烯单元的五碳单元构成并且通过存在于它们结构中的这些单元的数目进行分类。因此,单萜、倍半萜和二萜是分别含有10、15和20个碳原子的萜烯。例如,在植物界中广泛地发现有倍半萜。许多倍半萜分子因为它们的风味和芳香特性以及它们的美容、医疗和抗菌效果而众所周知。已经鉴别出许多倍半萜烃和倍半萜类化合物。
发明内容
本文提供了一种生产一种或多种倍半萜化合物的方法,包括使无环法呢基二磷酸(FPP)前体与具有倍半萜合酶活性的多肽接触,其中该多肽包含与SEQ ID NO:1具有至少55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或100%序列同一性的氨基酸序列,以产生一种或多种萜烯或萜烯混合物。该一种或多种萜烯可选自异朱栾倍半萜、香根螺-1(10),7(11)-二烯(spirovetiva-1(10),7(11)-diene)和朱栾倍半萜;或包含异朱栾倍半萜、香根螺-1(10),7(11)-二烯和/或朱栾倍半萜中的一种或多种的萜烯混合物。倍半萜合酶活性可包括异朱栾倍半萜合酶活性、香根螺-1(10),7(11)-二烯合酶活性和/或朱栾倍半萜合酶活性中的一种或多种。该方法可以进一步可选地包括分离包含异朱栾倍半萜、香根螺-1(10),7(11)-二烯和/或朱栾倍半萜中的一种或多种的萜烯混合物。
还提供了一种生产倍半萜化合物或萜烯混合物的方法,包括:
a.使无环法呢基二磷酸(FPP)前体与具有萜合酶活性的多肽接触,其中该多肽包含与SEQ ID NO:1具有至少55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或100%序列同一性的氨基酸序列,以产生从异朱栾倍半萜、香根螺-1(10),7(11)-二烯和朱栾倍半萜中选出的一种或多种萜烯,或包含异朱栾倍半萜、香根螺-1(10),7(11)-二烯和/或朱栾倍半萜中的一种或多种的萜烯混合物;并且
b.可选地,分离从异朱栾倍半萜、香根螺-1(10),7(11)-二烯和朱栾倍半萜中选出的至少一种萜烯,或包含异朱栾倍半萜、香根螺-1(10),7(11)-二烯和/或朱栾倍半萜中的一种或多种的萜烯混合物。
本文进一步提供了来自香根草(Vetiveria zizanoides)(同义词:Chrysopogonzizanioides)的分离的多肽,其包含具有合酶活性的多肽,该合酶包括异朱栾倍半萜合酶、香根螺-1(10),7(11)-二烯合酶和/或朱栾倍半萜合酶。
本文还提供了来自香根草(Vetiveria zizanoides)的分离的核酸分子,其编码具有合酶活性的倍半萜合酶,该合酶活性包括异朱栾倍半萜合酶活性、香根螺-1(10),7(11)-二烯合酶活性和/或朱栾倍半萜合酶活性。
本文还提供了从香根草(Vetiveria zizanoides)中分离或衍生的核酸,其编码具有倍半萜合酶活性的多肽。
还提供了从香根草(Vetiveria zizanoides)中分离或衍生的具有倍半萜合酶活性的多肽,其可用于产生从异朱栾倍半萜、香根螺-1(10),7(11)-二烯和朱栾倍半萜中选出的一种或多种倍半萜,或包含异朱栾倍半萜、香根螺-1(10),7(11)-二烯和/或朱栾倍半萜中的一种或多种的倍半萜的混合物。
本文还提供了一种多肽,其中该多肽包含与SEQ ID NO:1具有至少55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或100%序列同一性的氨基酸序列。
还提供了如本文所述的多肽的用途,用于产生从异朱栾倍半萜、香根螺-1(10),7(11)-二烯和朱栾倍半萜中选出的一种或多种倍半萜,或包含异朱栾倍半萜、香根螺-1(10),7(11)-二烯和/或朱栾倍半萜中的一种或多种的萜烯混合物。还提供了包含异朱栾倍半萜、香根螺-1(10),7(11)-二烯和/或朱栾倍半萜中的至少两种的萜烯混合物;或包含异朱栾倍半萜、香根螺-1(10),7(11)-二烯和朱栾倍半萜的混合物。
本文进一步提供了编码上述多肽的核酸。
此外,本文提供了一种核酸,其包含与选自SEQ ID NO:3和SEQ ID NO:4的序列具有至少55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或100%序列同一性的核苷酸序列。
本文提供了分离的细胞色素P450多肽序列,包含与SEQ ID NO:7、SEQ ID NO:10、SEQ ID NO:12或SEQ ID NO:14具有至少70%、75%、80%、85%、90%、95%、98%、99%或100%序列同一性的氨基酸序列。还提供了一种分离的核酸分子,包含:
a)编码P450多肽的核苷酸序列;或者
b)包含核苷酸序列SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:11或SEQID NO:13的核酸分子。
另外提供了一种表达载体,其包含一种或多种上述核酸,或编码倍半萜合酶的核酸,和细胞色素P450酶,并且可选地伴有编码细胞色素P450还原酶(CPR)的核酸。
还提供了CPR酶,其包含与SEQ ID NO:15具有至少70%、75%、80%、85%、90%、95%、98%、99%或100%序列同一性的氨基酸序列,其可以伴随上述方法中使用的P450多肽,以产生倍半萜衍生物,例如氧化的倍半萜。
还提供了非人宿主生物体或细胞,其包含(1)一种或多种上述核酸分子,或(2)包含所述核酸分子的表达载体。
还提供了上述倍半萜合酶和细胞色素P450酶用于产生氧化的倍半萜的用途,可选地伴随使用CPR酶。
还提供了上述细胞色素P450酶和倍半萜合酶用于生产氧化的倍半萜或氧化的倍半萜化合物的混合物的用途,可选地伴随有异源表达的CPR酶。
附图说明
图1.显示VzTps1718及其衍生物的主要产品的结构和名称。
图2.显示在体外测定中由重组VzTps1718产生的倍半萜的GCMS分析。A.重组VzTps1718蛋白与FPP的温育的倍半萜分布的总离子色谱图。B.在与用空质粒转化的大肠杆菌细胞相同条件下进行的阴性对照。显示对应于鉴定产物的峰:异朱栾倍半萜(化合物1),香根螺-1(10),7(11)-二烯(化合物2)和朱栾倍半萜(化合物3)。标记为MW 204和MW 222的峰分别对应于倍半萜烃和倍半萜烯醇,未确定其结构。FOH:通过大肠杆菌内源酶活性水解FPP产生的法呢醇。
图3.显示VzTps1718产物混合物(图2)中化合物1的质谱和异朱栾倍半萜可信标准品的质谱。
图4.显示VzTps1718产物混合物(图2)中化合物2的质谱和香根螺-1(10),7(11)-二烯可信标准品的质谱。
图5.显示VzTps1718产物混合物(图2)中化合物3的质谱和(+)-朱栾倍半萜可信标准品的质谱。
图6.显示重组VzTps1718酶在工程细菌细胞中体内产生的倍半萜的GCMS分析。显示对应于鉴定产物的峰:异朱栾倍半萜(化合物1),香根螺-1(10),7(11)-二烯(化合物2)和朱栾倍半萜(化合物3)。标记为MW 204和MW 222的峰分别对应于倍半萜烃和倍半萜烯醇,未确定其结构。FOH:通过大肠杆菌内源酶活性水解FPP产生的法呢醇。
图7.显示使用香根草VzCP8201细胞色素P450单加氧酶对VzTps1718的倍半萜产物进行生物转化的GCMS分析。A,使用VzCP8201Bov进行的生物转化。B,使用VzCP8201-12进行的生物转化。C,使用不含重组P450酶的大肠杆菌细胞进行的阴性对照。
图8.显示图7A和7B中14.95分钟的pic的质谱(A)和可信乙酸异朱栾倍半萜烯酯(isovalencenyl)的质谱(B)。
图9.显示使用CYP71D4细胞色素P450单加氧酶对VzTps1718的倍半萜产物进行生物转化的GCMS分析。A,用CYP71D4opt进行的生物转化。B,使用不含重组P450酶的大肠杆菌细胞进行的阴性对照。
图10.显示由大肠杆菌细胞产生的倍半萜化合物的GCMS分析,所述大肠杆菌细胞经工程改造以单独产生重组VzTps1718倍半萜合酶(A),或与功能性VzCP8201细胞色素P450酶一起,(B)或功能性CYP71D4细胞色素P450酶(C)。标有星号的峰对应于由细胞色素P450酶产生的经氧化的化合物。所有其他峰是由VzTps1718倍半萜合酶产生的倍半萜化合物。
具体实施方式
使用的缩写
bp 碱基对
kb 千碱基
DNA 脱氧核糖核酸
cDNA 互补DNA
DTT 二硫苏糖醇
FPP 法尼基二磷酸
GC 气相色谱
IPTG 异丙基-D-硫代半乳糖-吡喃糖苷
LB 溶源性肉汤
MS 质谱
MVA 甲羟戊酸
PCR 聚合酶链反应
RNA 核糖核酸
mRNA 信使核糖核酸
miRNA 微RNA
siRNA 小干扰RNA
rRNA 核糖体RNA
tRNA 转移RNA
定义
术语“多肽”是指连续聚合的氨基酸残基,例如至少15个残基,至少30个残基,至少50个残基的氨基酸序列。在本文提供的一些实施方案中,多肽包含作为酶、其片段或其变体的氨基酸序列。
术语“分离的”多肽是指通过任何方法或本领域已知的方法(包括重组、生物化学和合成法)的组合从天然环境中取出的氨基酸序列。
术语“蛋白”是指任何长度的氨基酸序列,其中氨基酸被共价肽键所连接,并且包括寡肽、肽、多肽和全长蛋白,不管天然生成的还是合成的。
术语“生物学功能”、“功能”、“生物活性”或“活性”是指倍半萜合酶的催化形成一种或多种倍半萜化合物或包含一种或多种倍半萜的混合物的能力。
术语“萜烯混合物”或“倍半萜的混合物”是指萜烯或倍半萜的混合物,其包含异朱栾倍半萜、香根螺-l(10),7(11)-二烯和/或朱栾倍半萜中的一种或多种,并且其中该混合物还可包含另外的萜烯或倍半萜。
术语“核酸序列”、“核酸”和“多核苷酸”可互换使用,是指核苷酸的序列。核酸序列可以是任何长度的单链或双链脱氧核糖核苷酸或核糖核苷酸,并且包括基因、外显子、内含子、有义和反义互补序列、基因组DNA、cDNA、miRNA、siRNA、mRNA、rRNA、tRNA、重组核酸序列、分离的和纯化的天然产生的DNA和/或RNA序列、合成DNA和RNA序列、片段、引物和核酸探针的编码和非编码序列。本领域技术人员了解,RNA的核酸序列与DNA序列相同,差异在于胸腺嘧啶(T)被替代为尿嘧啶(U)。
“分离的核酸”或“分离的核酸序列”被定义为一种核酸或核酸序列,其所处的环境与天然产生的核酸或核酸序列所处的环境不同。如本文使用的如应用于核酸的术语“天然产生的”是指在自然的细胞中发现的核酸。例如,存在于能够从自然源中分离出的生物体(例如生物体的细胞)中的核酸序列,并且该核酸序列未经人类在实验室进行特意的改造,那么该核酸序列是天然产生的。
“重组核酸序列”是使用实验室方法(分子克隆)将来自多于一个源的遗传物质组合在一起所生成的核酸序列,由此创造出不是天然产生并且不能以其他方式在生物有机体中发现的核酸序列。
“重组DNA技术”是指一种用于制备重组核酸序列的分子生物学程序,例如描述于由Weigel和Glazebrook编辑的Laboratory Manuals,2002Cold Spring Harbor LabPress;和Sambrook等,1989Cold Spring Harbor,NY:Cold Spring Harbor LaboratoryPress。
术语“基因”是指一种DNA序列,其包含可操作地连接到适当调控区域(例如启动子)的被转录为RNA分子(例如细胞中的mRNA)的区域。因此,基因可以包含多个可操作地连接的序列,诸如启动子、5’前导序列(包含例如参与翻译初始化的序列)、cDNA或基因组DNA的编码区、内含子、外显子和/或3’非翻译序列(包含例如转录终止位点)。
“嵌合基因”是指通常不能在自然物种中找到的任何基因,特别是这样一种基因,其中核酸序列存在一个或多个部分在性质上彼此不相关联。例如,启动子在性质上与转录区的部分或全部或与另一调控区不相关联。术语“嵌合基因”应当被理解为包括表达构建体,其中启动子或转录调控序列被可操作地连接到一个或多个编码序列或反义(即有义链的反向互补链)或反向重复序列(有义和反义,由此RNA转录物在转录后形成双链RNA)。术语“嵌合基因”还包括通过组合一个或多个编码序列的部分以产生新基因而获得的基因。
“3’URT”或“3’非翻译序列”(也称为“3’未翻译区”或“3’末端”)是指在基因编码序列的下游发现的核酸序列,其包含例如转录终止位点和(在大多数但非全部的真核mRNA中)多聚腺苷酸化信号诸如AAUAAA或其变体。在转录终止后,mRNA转录物可以在多聚腺苷酸化信号的下游切去,并且可以添加poly(A)尾,其参与了mRNA向翻译位点例如细胞质的运输。
“基因的表达”包括基因的转录和mRNA向蛋白质的翻译。过表达是指在转基因细胞或生物体中,以mRNA、多肽和/或酶活性水平测量的基因产物的生产超过了相似遗传背景的非转化细胞或生物体中的生产水平。
如本文中使用的“表达载体”是指这样一种核酸分子,其使用分子生物学方法和重组DNA技术工程化以将外来或外源DNA递送到宿主细胞中。表达载体典型地包括适合转录核苷酸序列所需的序列。编码区通常编码目的蛋白,但是也可以编码RNA,例如反义RNA、siRNA等。
如本文所使用的“表达载体”包括任何线性的或环状的重组载体,包括但不限于病毒载体、噬菌体和质粒。本领域技术人员根据表达系统能够选择适合的载体。在一个实施方案中,表达载体包括本文实施方案的核酸,其可操作地连接到至少一个调控序列,其控制转录、翻译、起始和终止,诸如转录启动子、操纵子和增强子,或mRNA核糖体结合位点,并且可选地包括至少一个选择标记。当调控序列功能性地涉及本文实施方案的核酸时,核苷酸序列是“可操作地连接的”。“调控序列”是指这样一种核酸序列,其确定本文实施方案的核酸序列的表达水平、并且能够调控可操作地连接到该调控序列的核酸序列的转录速率。调控序列包含启动子、增强子、转录因子、启动子元件等。
“启动子”是指通过提供RNA聚合酶用的结合位点以及适合转录所需的其它因子,包括但不限于转录因子结合位点、抑制子和活化子蛋白结合位点,来控制编码序列的表达的核酸序列。术语启动子的含义包括术语“启动子调控序列”。启动子调控序列可以包括可能影响转录、RNA加工或相关编码核酸序列的稳定性的上游和下游元件。启动子包括天然来源的和合成的序列。编码核酸序列通常位于启动子相对于以转录起始位点为起始的转录方向的下游。
术语“组成型启动子”是指不受调控的启动子,其允许其可操作地连接的核酸序列持续转录。
如本文使用的,术语“可操作地连接”是指处于功能性关系的多核苷酸元件的连接。当核酸与另一核酸序列处于功能性关系时,那么该核酸是“可操作地连接的”。例如,如果启动子或者转录调控序列能够影响编码序列的转录,那么该启动子或者转录调控序列是可操作地连接到该编码序列的。可操作地连接意味着被连接的DNA序列通常是邻接的。与启动子序列有关的核苷酸序列相对于要被转化的植物可以是同源或异源来源的。所述序列还可以是完全或部分合成的。不管来源如何,与启动子序列有关的核酸序列将根据在结合到本文实施方案的多肽后所连接的启动子性质而表达或沉默。相关核酸在所有时间或替代地在特定时间在整个生物体中或在特定组织、细胞或细胞室中可以编码需要表达或抑制的蛋白。此种核苷酸序列特别地编码将所需表型性状赋予给由其改变或转化的宿主细胞或生物体的蛋白质。更特别地,相关核苷酸序列引起在生物体中生产倍半萜合酶。
“靶肽”是指一种氨基酸序列,其将蛋白质或多肽靶向细胞内细胞器(即,线粒体或质体)或细胞外空间(分泌信号肽)。编码靶肽的核酸序列可以被融合到编码蛋白或多肽的氨基末端(例如N-末端)的核酸序列或者可以被用来替换原有的靶多肽。
术语“引物”是指短的核酸序列,其被杂交到模板核酸序列并且被用于与该模板互补的核酸序列的聚合。
如本文所使用的,术语“宿主细胞”或“经转化的细胞”是指被改变以包藏至少一种核酸分子的细胞(或生物体)。宿主细胞特别地是细菌细胞、真菌细胞或植物细胞。宿主细胞可以含有已经被整合到该宿主细胞的核或细胞器的基因组中的重组基因。替代地,宿主可以含有染色体外的重组基因。同源序列包括直系同源或旁系同源序列。鉴别直系同源物或旁系同源物的方法包括现有技术中已知且在本文中描述的系统发生学方法、序列相似性和杂交方法。
旁系同源物来源于基因复制,其产生具有相似序列和相似功能的两种或更多种基因。旁系同源物典型地聚簇在一起并且通过基因在相关植物物种内的复制而形成。使用成对Blast分析或在基因家族的系统发生分析过程中使用程序诸如CLUSTAL在类似基因的组中发现旁系同源物。在旁系同源物中,共有序列可被鉴定为其特征在于相关基因中的序列并且具有基因的类似功能。
直系或直系同源序列是彼此相似的序列,因为它们发现于由共同的祖先传下的物种中。例如,具有共同祖先的植物物种已经含有相同类似序列和功能的许多酶。本领域技术人员能够识别直系同源序列并预测直系同源物的功能,例如通过使用CLUSTAL或BLAST程序构建一个物种的基因族的系统发生树。
术语“选择性标记物”是指在表达后能够被用来选择包括该选择性标记物的(一种或多种)细胞的任何基因。以下描述了选择性标记物的例子。本领域技术人员了解不同的抗生素、杀真菌剂、营养缺陷型或除草剂选择标记物可适用于不同的目标物种。
术语“生物体”是指任何非人多细胞或单细胞生物体。诸如植物或微生物。特别地,微生物是细菌、酵母、藻类或真菌。
术语“植物”可互换使用以包括植物细胞,包括植物原生质体、植物组织、产生再生植物或植物部分的植物细胞组织培养物、或植物器官诸如根、茎、叶、花、花粉、胚珠、胚、果实等。任何植物均可以用来实施本文实施方案的方法。
对于本文的说明书和随附权利要求书,除非另有说明,“或”的使用意指“和/或”。类似地,各种时态的“含”、“含有”、“包含”和“包括”可以互换使用并且不旨在限制。
还应当理解的是,在各个实施方案的描述使用术语“包含”的情况下,本领域技术人员能够理解,在一些具体情形中,可以替代地使用语言“基本上由……组成”或“由……组成”来描述一个实施方案。
详细说明
在一个实施方案中,本文提供了一种生产倍半萜化合物的方法,包括:
a.使无环法呢基二磷酸(FPP)前体与具有萜合酶活性的多肽接触,该萜合酶活性是从异朱栾倍半萜合酶活性、香根螺-1(10),7(11)-二烯合酶活性和/或朱栾倍半萜合酶活性中选出的,
其中该多肽包含
与SEQ ID NO:1具有至少55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或100%序列同一性的氨基酸序列,以产生从异朱栾倍半萜、香根螺-1(10),7(11)-二烯和朱栾倍半萜中选出的萜烯;并且
b.可选地,分离从异朱栾倍半萜、香根螺-1(10),7(11)-二烯和朱栾倍半萜中选出的萜烯。
在一个实施方案中,本文提供了一种生产一种或多种倍半萜化合物的方法,包括使无环法呢基二磷酸(FPP)前体与具有倍半萜合酶活性的多肽接触,其中该多肽包含与SEQID NO:1具有至少55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或100%序列同一性的氨基酸序列,以产生从异朱栾倍半萜、香根螺-1(10),7(11)-二烯和朱栾倍半萜中选出的一种或多种萜烯,或包含异朱栾倍半萜、香根螺-1(10),7(11)-二烯和/或朱栾倍半萜中的一种或多种的倍半萜的混合物;并且可选地,分离从异朱栾倍半萜、香根螺-1(10),7(11)-二烯和朱栾倍半萜中选出的一种或多种倍半萜,或包含异朱栾倍半萜、香根螺-1(10),7(11)-二烯和/或朱栾倍半萜中的一种或多种的倍半萜的混合物。
在一个实施方案中,本文提供的方法包括用编码具有倍半萜合酶活性的多肽的核酸来转化宿主细胞或非人宿主生物体的步骤,其中该多肽包含与SEQ ID NO:1具有至少55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或100%序列同一性的氨基酸序列。
在一个实施方案中,本文提供的方法包括用编码具有萜合酶活性的多肽的核酸来转化宿主细胞或非人生物体的步骤,所述萜合酶活性选自异朱栾倍半萜合酶活性、香根螺-1(10),7(11)-二烯合酶活性和朱栾倍半萜合酶活性,其中该多肽包含与SEQ ID NO:1具有至少55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或100%序列同一性的氨基酸序列。
在一个实施方案中,本文提供的方法包括培养能够产生FPP并经转化以表达多肽的非人宿主生物体或细胞,其中该多肽包含与SEQ ID NO:1具有至少55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或100%序列同一性的氨基酸序列。
在进一步的实施方案中,人宿主生物或细胞包含原核细胞,更特别是细菌细胞,甚至更特别是大肠杆菌(E.coli)。
在一个实施方案中,非人宿主生物体或细胞是真核细胞。在另一个实施方案中,非人宿主生物体或细胞是酵母细胞。在进一步的实施方案中,非人宿主生物体或细胞是酿酒酵母(Saccharomyces cerevisiae)。
在进一步的实施方案中,非人生物体或细胞是植物细胞。
在另一个实施方案中,本文提供的方法包括使来自异朱栾倍半萜、香根螺-1(10),7(11)-二烯和朱栾倍半萜的倍半萜与至少一种酶接触以产生倍半萜衍生物。
在一个实施方案中,提供了一种方法,包括使用化学或生物化学合成或两者的组合将倍半萜氧化成衍生物。在一个特定方法中,用细胞色素P450酶进行氧化。在一个实施方案中,P450酶选自分离或衍生自香根草(Vetiveria zizanoides)的P450。在进一步的实施方案中,P450酶选自CYP71D酶家族。在又一个实施方案中,使用选自原核或真核细胞的野生型酶来氧化由使用本文提供的合酶产生的化合物。
在一个实施方案中,编码用于氧化倍半萜的P450酶的核酸可以在相同的质粒中或在包含编码倍半萜合酶的核酸的相同细胞中的单独的质粒或表达载体中找到。
在另一个实施方案中,P450可以在一个细胞中,而倍半萜合酶在另一个细胞中,但一起在培养基中,或共培养以氧化一种或多种萜烯或萜烯混合物。在又一个实施方案中,可以首先生产倍半萜,然后可以提供包含P450的细胞或由细胞产生的P450用于氧化倍半萜。
为了重建P450酶的活性,使细胞色素P450还原酶(CPR)参与从辅因子NADPH(还原型烟酰胺腺嘌呤二核苷酸磷酸)到P450酶活性位点的电子转移。因此,在另一个实施方案中,使用细胞色素P450酶与CPR酶组合进行该方法。在进一步的实施方案中,CPR分离或源自胡椒薄荷(Mentha piperita)。
在进一步的实施方案中,本文提供的酶在细胞中异源表达。
在一个实施方案中,本文提供的P450酶和萜合酶在相同的细胞中表达或过表达。在另一个实施方案中,本文提供的P450酶和萜合酶和CPR酶在相同的细胞中表达或过表达。
在一个实施方案中,提供了上述倍半萜合酶和细胞色素P450酶用于产生氧化的倍半萜的用途,可选地伴随使用CPR酶。
在另一个实施方案中,本文提供了倍半萜合酶和上述细胞色素P450酶用于产生氧化的倍半萜或氧化的倍半萜化合物的混合物的用途,可选地伴随异源表达的CPR酶。
在一个形态中,本文提供了一种生产氧化的倍半萜的方法,包括使用化学或生物化学合成或两者的组合与本文所述的细胞色素P450多肽并伴随CPR酶,将倍半萜氧化成氧化的倍半萜。
在一个实施方案中,本文提供了包含异朱栾倍半萜、香根螺-1(10),7(11)-二烯和朱栾倍半萜的萜烯混合物。
在一个实施方案中,本文提供了包含异朱栾倍半萜、香根螺-1(10),7(11)-二烯和朱栾倍半萜的萜烯混合物,其中相对于彼此的比例,按重量计为约66%至68%的异朱栾倍半萜,约25%至26%的香根螺-1(10),7(11)-二烯和约6%至9%的朱栾倍半萜。本文还提供了包含异朱栾倍半萜衍生物、香根螺-1(10),7(11)-二烯衍生物和朱栾倍半萜衍生物的萜烯混合物,其中相对于彼此的比例,按重量计为约66%至68%的异朱栾倍半萜衍生物,约25%至26%的香根螺-1(10),7(11)-二烯衍生物和约6%至9%的朱栾倍半萜衍生物。
在一个实施方案中,本文提供了表达载体,其包含编码本文所述多肽(合酶)的核酸。
在一个实施方案中,本文提供了非人宿主生物体或细胞,其经转化以携带至少一种本文所述的核酸,从而异源表达或过表达本文提供的至少一种多肽(合酶)。
在一个实施方案中,本文提供了非人宿主生物体或宿主细胞,其包含(1)编码本文所述的具有倍半萜合酶活性的多肽的核酸分子,或(2)包含所述核酸分子的表达载体。
在一个实施方案中,非人宿主生物体或宿主细胞是真核细胞。在另一个实施方案中,非人生物体或细胞是真菌。在进一步的实施方案中,非人生物体或细胞是植物细胞。在又一个实施方案中,非人宿主生物体或细胞是微生物。在另一个实施方案中,非人宿主生物体或细胞是细菌。在进一步的实施方案中,非人宿主生物体或细胞是大肠杆菌(E.coli)。
在一个实施方案中,非人生物体或细胞是酵母。在进一步的实施方案中,非人宿主生物体或细胞是酿酒酵母(Saccharomyces cerevisiae)。
在一个实施方案中,本文提供了从香根草(Vetiveria zizanoides)分离或衍生的核酸,其编码具有倍半萜合酶活性的多肽。
另一个实施方案是从香根草(Vetiveria zizanoides)分离或衍生的具有倍半萜合酶活性的多肽。
在另一个实施方案中,本文提供了具有倍半萜合酶活性的多肽的用途,用于产生从异朱栾倍半萜、香根螺-1(10),7(11)-二烯和朱栾倍半萜中选出的一种或多种倍半萜;或包含异朱栾倍半萜、香根螺-1(10),7(11)-二烯和/或朱栾倍半萜中的一种或多种的倍半萜的混合物。
在另一个实施方案中,本文提供了具有倍半萜合酶活性的多肽的用途,用于产生包含异朱栾倍半萜、香根螺-1(10),7(11)-二烯和/或朱栾倍半萜中的一种或多种的倍半萜化合物的混合物。
在一个实施方案中,具有倍半萜合酶活性的多肽包含与SEQ ID NO:1具有至少55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或100%序列同一性的氨基酸序列。
在一个实施方案中,具有从异朱栾倍半萜合酶活性、香根螺-1(10),7(11)-二烯合酶活性和朱栾倍半萜合酶活性中选出的萜合酶活性的多肽包含氨基酸序列,其具有与SEQID NO:1具有至少55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或100%序列同一性的至少一个序列。
在一个实施方案中,具有包含异朱栾倍半萜合酶活性、香根螺-1(10),7(11)-二烯合酶活性和/或朱栾倍半萜合酶活性的萜合酶活性的多肽包含氨基酸序列,其具有与SEQID NO:1具有至少60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或100%序列同一性的至少一个序列。
在一个实施方案中,具有从异朱栾倍半萜合酶活性、香根螺-1(10),7(11)-二烯合酶活性和朱栾倍半萜合酶活性中选出的萜合酶活性的多肽包含氨基酸序列,其具有与SEQID NO:1具有至少65%、70%、75%、80%、85%、90%、95%、98%、99%或100%序列同一性的至少一个序列。
在一个实施方案中,具有从异朱栾倍半萜合酶活性、香根螺-1(10),7(11)-二烯合酶活性和朱栾倍半萜合酶活性中选出的萜合酶活性的多肽包含氨基酸序列,其具有与SEQID NO:1具有至少70%、75%、80%、85%、90%、95%、98%、99%或100%序列同一性的至少一个序列。
在一个实施方案中,具有从异朱栾倍半萜合酶活性、香根螺-1(10),7(11)-二烯合酶活性和朱栾倍半萜合酶活性中选出的萜合酶活性的多肽包含氨基酸序列,其具有与SEQID NO:1具有至少75%、80%、85%、90%、95%、98%、99%或100%序列同一性的至少一个序列。
在一个实施方案中,具有从异朱栾倍半萜合酶活性、香根螺-1(10),7(11)-二烯合酶活性和朱栾倍半萜合酶活性中选出的萜合酶活性的多肽包含氨基酸序列,其具有与SEQID NO:1具有至少80%、85%、90%、95%、98%、99%或100%序列同一性的至少一个序列。
在一个实施方案中,具有从异朱栾倍半萜合酶活性、香根螺-1(10),7(11)-二烯合酶活性和朱栾倍半萜合酶活性中选出的萜合酶活性的多肽包含氨基酸序列,其具有与SEQID NO:1具有至少85%、90%、95%、98%、99%或100%序列同一性的至少一个序列。
在一个实施方案中,具有从异朱栾倍半萜合酶活性、香根螺-1(10),7(11)-二烯合酶活性和朱栾倍半萜合酶活性中选出的萜合酶活性的多肽包含氨基酸序列,其具有与SEQID NO:1具有至少90%、95%、98%、99%或100%序列同一性的至少一个序列。
在一个实施方案中,具有从异朱栾倍半萜合酶活性、香根螺-1(10),7(11)-二烯合酶活性和朱栾倍半萜合酶活性中选出的萜合酶活性的多肽包含氨基酸序列,其具有与SEQID NO:1具有至少95%、98%、99%或100%序列同一性的至少一个序列。
在一个实施方案中,具有从异朱栾倍半萜合酶活性、香根螺-1(10),7(11)-二烯合酶活性和朱栾倍半萜合酶活性中选出的萜合酶活性的多肽包含氨基酸序列,其具有与SEQID NO:1具有至少98%、99%或100%序列同一性的至少一个序列。
在一个实施方案中,具有从异朱栾倍半萜合酶活性、香根螺-1(10),7(11)-二烯合酶活性和朱栾倍半萜合酶活性中选出的萜合酶活性的多肽包含氨基酸序列,其具有与SEQID NO:1具有至99%或100%序列同一性的至少一个序列。
在一个实施方案中,具有从异朱栾倍半萜合酶活性、香根螺-1(10),7(11)-二烯合酶活性和朱栾倍半萜合酶活性中选出的萜合酶活性的多肽包含氨基酸序列,其具有与SEQID NO:1相同的至少一个序列。
在一个实施方案中,核酸包含与选自SEQ ID NO:3和SEQ ID NO:4的序列具有至少55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或100%序列同一性的核苷酸序列。
在一个实施方案中,核酸包含与选自SEQ ID NO:3和SEQ ID NO:4的序列具有至少60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或100%序列同一性的核苷酸序列。
在一个实施方案中,核酸包含与选自SEQ ID NO:3和SEQ ID NO:4的序列具有至少65%、70%、75%、80%、85%、90%、95%、98%、99%或100%序列同一性的核苷酸序列。
在一个实施方案中,核酸包含与选自SEQ ID NO:3和SEQ ID NO:4的序列具有至少70%、75%、80%、85%、90%、95%、98%、99%或100%序列同一性的核苷酸序列。
在一个实施方案中,核酸包含与选自SEQ ID NO:3和SEQ ID NO:4的序列具有至少75%、80%、85%、90%、95%、98%、99%或100%序列同一性的核苷酸序列。
在一个实施方案中,核酸包含与选自SEQ ID NO:3和SEQ ID NO:4的序列具有至少80%、85%、90%、95%、98%、99%或100%序列同一性的核苷酸序列。
在一个实施方案中,核酸包含与选自SEQ ID NO:3和SEQ ID NO:4的序列具有至少85%、90%、95%、98%、99%或100%序列同一性的核苷酸序列。
在一个实施方案中,核酸包含与选自SEQ ID NO:3和SEQ ID NO:4的序列具有至少90%、95%、98%、99%或100%序列同一性的核苷酸序列。
在一个实施方案中,核酸包含与选自SEQ ID NO:3和SEQ ID NO:4的序列具有至少95%、98%、99%或100%序列同一性的核苷酸序列。
在一个实施方案中,核酸包含与选自SEQ ID NO:3和SEQ ID NO:4的序列具有至少98%、99%或100%序列同一性的核苷酸序列。
在一个实施方案中,核酸包含与选自SEQ ID NO:3和SEQ ID NO:4的序列具有至少99%或100%序列同一性的核苷酸序列。
在一个实施方案中,核酸包含具有与选自SEQ ID NO:3和SEQ ID NO:4的序列相同的序列的核苷酸序列。
在一个实施方案中,核酸包含SEQ ID NO:3。在另一个实施方案中,核酸包含SEQID NO:4。
在一个实施方案中,由本文提供的萜合酶制备的化合物用具有与从SEQ ID NO:7、SEQ ID NO:10、SEQ ID NO:12和SEQ ID NO:14中选出的P450酶(例如但不限于具有P450活性的酶)有70%、75%、80%、85%、90%、95%、98%、99%或100%相同的序列的P450酶氧化。
在一个实施方案中,由本文提供的萜合酶制备的化合物用具有与从SEQ ID NO:7、SEQ ID NO:10、SEQ ID NO:12和SEQ ID NO:14中选出的P450酶(例如但不限于具有P450活性的酶)有75%、80%、85%、90%、95%、98%、99%或100%相同的序列的P450酶氧化。
在一个实施方案中,由本文提供的萜合酶制备的化合物用具有与从SEQ ID NO:7、SEQ ID NO:10、SEQ ID NO:12和SEQ ID NO:14中选出的P450酶(例如但不限于具有P450活性的酶)有80%、85%、90%、95%、98%、99%或100%相同的序列的P450酶氧化。
在一个实施方案中,由本文提供的萜合酶制备的化合物用具有与从SEQ ID NO:7、SEQ ID NO:10、SEQ ID NO:12和SEQ ID NO:14中选出的P450酶(例如但不限于具有P450活性的酶)有85%、90%、95%、98%、99%或100%相同的序列的P450酶氧化。
在一个实施方案中,由本文提供的萜合酶制备的化合物用具有与从SEQ ID NO:7、SEQ ID NO:10、SEQ ID NO:12和SEQ ID NO:14中选出的P450酶(例如但不限于具有P450活性的酶)有90%、95%、98%、99%或100%相同的序列的P450酶氧化。
在一个实施方案中,由本文提供的萜合酶制备的化合物用具有与从SEQ ID NO:7、SEQ ID NO:10、SEQ ID NO:12和SEQ ID NO:14中选出的P450酶(例如但不限于具有P450活性的酶)有95%、98%、99%或100%相同的序列的P450酶氧化。
在一个实施方案中,由本文提供的萜合酶制备的化合物用具有与从SEQ ID NO:7、SEQ ID NO:10、SEQ ID NO:12和SEQ ID NO:14中选出的P450酶(例如但不限于具有P450活性的酶)有98%、99%或100%相同的序列的P450酶氧化。
在一个实施方案中,由本文提供的萜合酶制备的化合物用具有与从SEQ ID NO:7、SEQ ID NO:10、SEQ ID NO:12和SEQ ID NO:14中选出的P450酶(例如但不限于具有P450活性的酶)有99%或100%相同的序列的P450酶氧化。
在一个实施方案中,由本文提供的萜合酶制备的化合物用具有与从SEQ ID NO:7、SEQ ID NO:10、SEQ ID NO:12和SEQ ID NO:14中选出的P450酶(例如但不限于具有P450活性的酶)相同的序列的P450酶氧化。
在一个实施方案中,由本文提供的萜合酶制备的化合物用包含SEQ ID NO:7的P450酶氧化。
在一个实施方案中,由本文提供的萜合酶制备的化合物用包含SEQ ID NO:10的P450酶氧化。
在一个实施方案中,由本文提供的萜合酶制备的化合物由包含SEQ ID NO:12的P450酶氧化。
在一个实施方案中,由本文提供的萜合酶制备的化合物用包含SEQ ID NO:14的P450酶氧化。
在一个实施方案中,P450酶伴有细胞色素P450还原酶(CPR)酶。CPR酶可以衍生自与P450酶相同的植物来源或衍生自与P450酶不同的植物来源。在一个实施方案中,如Jensen和Moller(2010)Phytochemsitry 71,132-141中所述,使用衍生自不同植物来源的CPR来补充P450酶的活性。在一个实施方案中,CPR分离或衍生自胡椒薄荷(Menthapiperita)。
在进一步的实施方案中,CPR酶具有与选自SEQ ID NO:15的CPR酶(例如但不限于具有CPR活性的酶)有70%、75%、80%、85%、90%、95%、98%、99%或100%相同的序列。在另一个实施方案中,CPR酶具有与选自SEQ ID NO:15的CPR酶(例如但不限于具有CPR活性的酶)相同的序列。在另一个实施方案中,CPR酶包含SEQ ID NO:15。
多肽催化倍半萜或特定倍半萜合成的能力可通过进行如本文提供的实施例中详述的酶测定来确认。
多肽也意味着包括截短的多肽,条件是它们保持其倍半萜合酶活性。通过修饰本文所述序列获得的核苷酸序列可以使用本领域已知的任何方法,例如通过引入任何类型的突变,例如缺失,插入或置换突变来进行。这些方法的例子列举在说明书中涉及变体多肽和制备它们的方法的部分中。
两个肽或核苷酸序列之间的同一性百分比是当产生这两个序列的比对时,两个序列中相同的氨基酸或核苷酸残基的数目的函数。相同的残基被定义为两个序列中在比对的给定位置的相同的残基。本文使用的序列同一性的百分比是从最佳比对中通过将两个序列之间相同的残基数除以最短序列中的残基总数并乘以100计算得到的。最佳比对是同一性百分比最高可能性的比对。可以将空位引入到一个或两个序列中的比对的一个或多个位置中以获得最佳比对。然后将这些空位考虑为用于计算序列同一性百分比的不相同的残基。用于确定氨基酸或核酸序列同一性百分比的比对可以使用计算机程序以及例如在互联网上可公开获得的计算机程序以多种方式实现。优选地,可使用设定为默认参数的可从National Center for Biotechnology Information(NCBI)于http://www.ncbi.nlm.nih.gov/BLAST/bl2seq/wblast2.cgi获得的BLAST程序(Tatiana等,FEMSMicrobiol Lett.,1999,174:247-250,1999)来获得蛋白或核酸序列的最佳比对并计算序列同一性的百分比。
要与FPP体外接触的多肽可以使用标准蛋白或酶提取技术从表达它的任何有机体中衍生或提取得到。如果宿主生物体是将本文实施方案的多肽释放到培养基中的单细胞生物体或细胞,那么可以简单地从所述培养基获得,或者通过离心收集,可选地随后进行洗涤步骤和再悬浮于适合的缓冲液中获得该多肽。如果该生物体或细胞将多肽累积于其细胞中,那么可以通过破裂或裂解该细胞并且进一步从细胞裂解液中提取多肽来获得该多肽。
根据另一个具体实施方案,上述任何实施方案的方法在体内进行。本文提供的这些实施方案是特别有利的,因为可以在不预先分离多肽的情况下在体内进行该方法。该反应直接发生在经转化以表达所述多肽的生物体或细胞内。
生物体或细胞旨在“表达”多肽,前提是所述生物体或细胞经转化以携带编码所述多肽的核酸,这种核酸被转录至mRNA并且在该宿主生物体或细胞中发现该多肽。术语“表达”涵盖“异源表达”和“过表达”,后者是指mRNA、多肽和/或酶活性的水平高于在未经转化的生物体或细胞中所测量的水平。随后,在致力于描述作为本文具体目的的此种经转化的非人宿主生物体或细胞的说明书部分中,将描述用于转化非人宿主生物体或细胞的适合方法的更详细说明。
特定的生物体或细胞,当其天然地产生FPP或当其不天然地产生FPP但是在使用本文所述的核酸转化之前或与使用所述核酸一起被转化以生产FPP时,即“能够产生FPP”。经转化以比天然存在的生物体或细胞产生更高量的FPP的生物体或细胞也被“能够生产FPP的生物体或细胞”所涵盖。用于转化生物体(例如微生物)以便它们生产FPP的方法在本领域中是已知的。
适合于在体内进行本文实施方案的方法的非人宿主生物体可以是任何非人多细胞或单细胞生物体。在一个具体的实施方式中,用来在体内进行本文实施方案的非人宿主生物体是植物、原核生物或真菌。可以使用任何植物、原核生物或真菌。特别有用的植物是天然产生高量萜烯的那些。在一个更具体的实施方案中,用来在体内进行本文实施方案的方法的非人宿主生物体是微生物。可以使用任何微生物,但根据甚至更具体的实施方案,所述微生物是细菌或酵母。更特别地,所述细菌是大肠杆菌(E.coli),而所述酵母是酿酒酵母(Saccharomyces cerevisiae)。
这些生物体的一些天然不产生FPP,或者只产生少量的FPP。为了适合于进行本文实施方案的方法,这些生物体必须经转化以生产所述前体,或以较大的量生产所述前体。如以上所说明的那样,它们可以在使用根据任一上述实施方案所述的核酸进行修饰之前进行转化。如上所述,它们也可以同时地被转化。
也可以使用分离的高等真核细胞而不是完整的生物体作为宿主以在体内进行本文实施方案的方法。合适的真核细胞可以包括任何非人细胞、植物或真菌细胞。
根据另一个具体实施方案,在本文所述的任何实施方案中使用的或由本文所述核酸编码的具有倍半萜合酶活性的多肽可以是通过基因工程获得的变体,条件是所述变体保持其倍半萜合酶活性。
如本文所用,多肽旨在作为包含本文鉴定的氨基酸序列的多肽或肽片段,以及截短的或变体多肽,条件是它们保持其倍半萜合酶活性。
变体多肽的例子是由交替mRNA剪接事件或本文所述多肽的蛋白水解切割而产生的天然存在的蛋白。归因于蛋白水解的变化包括例如在不同类型的宿主细胞中表达时N-或C-末端的差异,这是由于从本文实施方案的多肽因蛋白水解去除一个或多个末端氨基酸引起的。本文实施方案还涵盖了如下文所描述的,通过天然或人工突变本文实施方案的核酸获得的核酸所编码的多肽。
由在氨基和羧基末端融合额外的肽序列产生的多肽变体也可以用在本文实施方案的方法中。特别地,此种融合能够增强多肽的表达,有用于蛋白的纯化或改善多肽在期望环境或表达系统中的酶活性。此种额外的肽序列例如可以是信号肽。因此,本发明包括使用变体多肽(诸如通过与其它寡肽或多肽融合所获得的那些和/或连接到信号肽的那些)的方法。由与另一种功能肽(诸如来自萜生物合成路径的另一种蛋白)融合产生的多肽也可以有利地用于本文实施方案的方法中。
如上所述,编码本文一个实施方案的多肽的核酸是用于修饰在体内实施所述方法时打算使用的非人宿主生物体或细胞的一种有用的工具。
因此,本文还提供了编码根据任何上述实施方案的多肽的核酸。
本文实施方案的核酸可以定义为包括单链形式或双链形式的脱氧核糖核苷酸或核糖核苷酸聚合物(DNA和/或RNA)。术语“核苷酸序列”应当被理解为包含多核苷酸分子或寡核苷酸分子,其形式为独立片段或作为较大核酸的组件。本文实施方案的核酸还涵盖某些分离的核苷酸序列,包括基本上不含内源性污染物质的那些分离的核苷酸序列。本文实施方案的核酸可以是截短的,条件是其编码如上所述的本文涵盖的多肽。
在一个实施方案中,编码合酶的本文实施方案的核酸可以天然存在于植物例如香根草(Vetiveria zizanoides)或其他物种中,衍生自香根草(Vetiveria zizanoides)或其他物种,或通过修饰SEQ ID NO:3或SEQ ID NO:4获得。
突变可以是这些核酸的任何种类的突变,例如点突变、缺失突变、插入突变和/或移码突变。还可以制备变体核酸以使其核苷酸序列适应特定的表达系统。例如,如果氨基酸由特定密码子编码,则已知细菌表达系统更有效地表达多肽。
由于遗传密码的简并性,多于一个的密码子可以编码相同的氨基酸序列,多个核酸序列可以编码相同的蛋白质或多肽,所有这些DNA序列都涵盖在本文的实施方案中。在适当的情况下,可以对编码萜合酶的核酸序列进行优化以提高在宿主细胞中的表达。例如,可以使用宿主特有的密码子来合成本文实施方案的核苷酸以改善表达。
通过附接共价或非共价连接到多肽主链的修饰基团,变体也可以不同于本文实施方案的多肽。
通过引入N-连接的或O-连接的糖基化位点、和/或添加半胱氨酸残基,该变体还包括与本文描述的多肽不同的多肽。本领域技术人员能够了解如何修饰氨基酸序列并保留生物活性。
除了本文公开的序列中显示的基因序列之外,对于本领域技术人员显而易见的是,DNA序列多态性可存在于给定群体内,这可导致本文公开的多肽的氨基酸序列的变化。由于天然等位基因变异,这种遗传多态性可能存在于来自不同群体或在群体内的细胞中。等位基因变体还可包括功能等同物。
其他实施方案还涉及通过具体公开的核酸的此类序列多态性衍生的分子。这些天然变异通常在基因的核苷酸序列或本文公开的多肽的氨基酸序列中产生约1%至5%的变化。如上所述,编码本文实施方案的多肽的核酸是修饰非人宿主生物体或细胞并修饰旨在用于本文所述方法的非人宿主生物体或细胞的有用工具。
本文提供的实施方案包括但不限于cDNA、基因组DNA和RNA序列。
基因(包括本文实施方案的多核苷酸)可以通过本领域已知的方法基于可获得的核苷酸序列信息(诸如在所附的序列表中发现的)进行克隆。这些包括例如设计表示此种基因的侧翼序列的DNA引物,所述基因的一种是在有义取向上产生的并且初始化有义链的合成,而另一种以反向互补的方式创造并且产生反义链。诸如在聚合酶链反应中使用的那些热稳定的DNA聚合酶通常被用来进行此种实验。或者,表示基因的DNA序列可以被化学合成并且随后导入到DNA载体分子中,所述DNA载体分子可以通过例如相容性细胞诸如大肠杆菌来繁殖。
本文提供了通过SEQ ID NO:3和SEQ ID NO:4的突变获得的核酸序列;这种突变可以常规进行。技术人员清楚,可以将一个或多个核苷酸的突变、缺失、插入和/或取代引入到这些DNA序列中。
本文实施方案的编码异朱栾倍半萜合酶、香根螺-1(10),7(11)-二烯合酶和朱栾倍半萜合酶蛋白的核酸序列可以插入到表达载体中和/或包含在插入于表达载体中的嵌合基因中,以在宿主细胞或宿主生物体中产生异朱栾倍半萜合酶、香根螺-1(10),7(11)-二烯合酶和朱栾倍半萜合酶。用于将转基因插入到宿主细胞基因组中的载体在本领域是公知的,并且包括质粒、病毒、粘粒和人工染色体。其中插入了嵌合基因的二元或共整合载体也用于转化宿主细胞。
用于转化适于在体内实施本文实施方案的方法的宿主生物体或细胞的另一重要工具是包含根据本文实施方案的任何实施方案的核酸的表达载体。因此,本文还提供了这种载体。
转化以携带本文实施方案的至少一种核酸使得其异源表达或过表达本文实施方案的至少一种多肽的重组非人宿主生物体和细胞也是实施本文实施方案的方法的非常有用的工具。因此,本文还提供了这种非人宿主生物体和细胞。
根据任何上述实施方案的核酸可用于转化非人宿主生物体和细胞,并且所表达的多肽可以是任何上述多肽。
本文实施方案的非人宿主生物体可以是任何非人多细胞或单细胞生物。在一个具体实施方案中,非人宿主生物体是植物、原核生物或真菌。任何植物、原核生物或真菌都适合根据本文提供的方法进行转化。特别有用的植物是天然产生高量萜烯的植物。
在更具体的实施方案中,非人宿主生物体是微生物。
任何微生物都适用于本文,但根据更具体的实施方案,所述微生物是细菌或酵母。最特别地,所述细菌是大肠杆菌(E.coli),而所述酵母是酿酒酵母(Saccharomycescerevisiae)。
也可以转化分离的高等真核细胞,而不是完整的生物。作为高等真核细胞,我们在这里指的是除酵母细胞外的任何非人真核细胞。具体的高等真核细胞是植物细胞或真菌细胞。
上文描述的任何实施方案可以以任何可行的组合与本发明的任何适当表述组合。除非另有说明,否则实施方案不旨在限于任何特定的发明表述。
现在将参考以下实施例和附图进一步描述本发明。
实施例
实施例1:植物材料和总RNA提取。
香根草(Vetiveria zizanoides)植物获自植物苗圃(The Austral PlantsCompany,Les Avirons,The Reunion Island,France)。将这些植物在温室(LullierAgronomy research Station,Geneva,Switzerland)的盆中培养,并通过划分6个月至1年的丛来无性繁殖。为了收获根,将植物从盆中取出并用自来水冲洗。
为了提取RNA,将来自几种植物的根组合,包括幼苗(繁殖后4至6个月)、具有发育良好的致密根系的老植物(繁殖后1至2年)和从盆中取出后在室温下干燥24至36小时的幼苗。将根从植物的地上部分切下并在液氮中冷冻。首先使用Waring Blendor(WaringLaboratory,Torrington,USA)在液氮中粗略切碎根,然后使用研钵和研杵研磨成细粉。按照Kolosova等人(Kolosova N,Miller B,Ralph S,Ellis BE,Douglas C,Ritland K,andBohlmann J,Isolation of high-quality RNAfrom gymnosperm and angiospermtrees.J.Biotechniques,36(5),821-4,2004)中描述的方法提取总RNA,具有以下修改。将体积为20ml的提取缓冲液用于2克研磨组织,并向提取缓冲液中补充2%(w/v)的PVP(聚乙烯吡咯烷酮,Sigma-Aldrich)。对于CTAB(十六烷基三甲基溴化铵,Sigma-Aldrich)提取步骤,将核酸沉淀(pellet)重悬于2ml的TE缓冲液(10mM Tris-HCl,pH8,1mM EDTA)中,用2ml5M NaCl和1ml10%的CTAB进行提取。对于异丙醇沉淀,将核酸沉淀溶解在500μl的TE中。将最终的RNA沉淀重悬于50μl水中。
实施例2:转录组测序。
使用Illumina技术对香根草根转录组进行测序。所有测序步骤均由Fasteris SA(Plan-les-Ouates,CH-1228,Switzerland)进行。使用TruSeq Stranded mRNA文库制备试剂盒(Illumina Inc.)来制备mRNA文库。对片段化和大小选择进行调整以选择和纯化长度为500至550bp的DNA片段。使用MiSeq Reagent Kit V3(Illumina Inc.)在MiSeq测序仪上进行DNA测序。一个完整的流动池用于文库的测序,并进行2X300次测序循环。该测序提供了17,453,393个2X300的重叠配对读数(总共10.5兆个碱基)。
首先使用FastqJoin对配对读数进行预处理,以在重叠末端连接配对末端读数。在该步骤中,可以连接58.3%的配对末端读数,并获得8.5百万个平均大小为430个碱基的连接读数。然后使用CLC Genombic Workbench 7(CLC bio)的CLC bio de novo组装工具组装这些新读数以及未连接的配对末端读数。最后,组装的香根草根转录组含有333,633个独特的重叠群(contig)序列,平均长度为577个碱基,最大长度为15,800个碱基,N50为546个碱基。
实施例3:鉴定新的倍半萜烯编码序列。
使用tBlastn算法(Altschul等,J.Mol.Biol.215,403-410,1990)搜索转录组数据,并使用从相同植物中分离并已描述(WO2010134004和WO2006134523)的已知倍半萜合酶的氨基酸序列作为查询。使用该方法,获得了新的倍半萜编码序列。该cDNA(VzTps1718)(SEQ ID NO:3)长1835个碱基对,并含有编码567个氨基酸长度蛋白的开放阅读框(SEQ IDNO:1)。
将VzTp1718推导的氨基酸序列与公众可获得的序列进行比较。公共数据库中最接近的氨基酸序列是具有NCBI登录号XP_004979711.1的序列。该序列注释为(S)-β-红没药烯合酶样,并从植物小米(Setaria italica)中分离。然而,XP_004979711.1的功能注释是通过自动注释进行的,并且没有公开实验数据来证实该酶的酶活性。这种氨基酸序列XP_004979711.1与VzTps1718氨基酸序列仅具有54%的同一性。
与先前由香根草根(WO2010134004和WO2006134523)表征的倍半萜合酶的比较显示氨基酸序列的序列同一性小于35%。
实施例4:VterTps1718的异源表达和功能表征。
首先对VzTps1718的DNA序列进行密码子优化(SEQ ID NO:4),在体外合成并克隆到pJ401表达质粒(DNA2.0,Menlo Park,CA,USA)中。在KRX大肠杆菌细胞(Promega)中进行VzTps1718合酶(SEQ ID NO:1)的异源表达。用pJ401-VzTps1718表达质粒转化的单个细胞集落用于接种5ml LB培养基。在37℃温育5至6小时后,将培养物转移至25℃培养箱中并保持1小时以进行平衡。然后通过加入1mM IPTG和0.2%鼠李糖诱导蛋白的表达,之后将培养物在25℃温育过夜。第二天,通过离心收集细胞,重悬于0.1体积的50mM MOPSO pH 7,10%甘油中并通过超声处理进行裂解。通过离心(在20,000g下30分钟)澄清提取物,并将含有可溶性蛋白的上清液用于进一步的实验。
含有重组蛋白的粗制大肠杆菌蛋白提取物用于表征酶活性。测定在80μM法呢基二磷酸(FPP,Sigma)和0.1至0.5mg粗蛋白存在下,在2mL 50mM MOPSO pH 7,10%甘油,1mMDTT,15mM MgCl2中进行。将管在25℃温育12至24小时,并用一体积的戊烷萃取两次。在氮气流下浓缩后,通过GC-MS分析提取物,并与来自对照蛋白的测定的提取物进行比较。使用连接到Agilent 5975质量检测器的Agilent 6890系列GC系统进行GC-MS分析。GC配备有0.25mm内径的30m DB-1MS毛细管柱(Agilent)。载气为He,流速恒定为1mL/min。入口温度设定在250℃。初始烘箱温度为80℃,然后以10℃/min的梯度升至220℃,以及以30℃/min的第二梯度升至280℃。产品的鉴定基于质谱和保留指数与可信标准物和内部质谱数据库的比较。
在该体外条件下,VzTps1718酶(SEQ ID NO:1)显示倍半萜合酶活性并将FPP转化为几种萜烯产物,包括倍半萜烃和氧化的倍半萜。主要产物是倍半萜,具有艾里莫芬烷(eremophilane)、香根螺烷(vetispirane)和桉叶烷(eudesmane)骨架。在这些产品中,可以根据保留指数和质谱的一致性鉴定一些化合物:异朱栾倍半萜(化合物1),香根螺-1(10),7(11)-二烯(化合物2)和朱栾倍半萜(化合物3)(图1)。在体外用VzTps1718获得的产物混合物的相对组成在表1中详述。对于鉴定出的倍半萜产物,产物混合物中的相对丰度对于香根螺-1(10),7(11)-二烯为15.6%,对于异朱栾倍半萜为41.6%,并且对于朱栾倍半萜为3.7%。
表1.在体外用重组VzTps1718倍半萜合酶获得的产物混合物的组成。
产生这种产物混合物的倍半萜合酶或产生化合物1或化合物2的合酶是以前未知的。VzTps1718产物的氧化衍生物,尤其是醇、酮、醛和羧酸是香根草油的已知成分,这些衍生物中的一些有助于典型的复杂香根草气味。
实施例5:使用VzTps1718体内生产倍半萜。
对于VzTps1718倍半萜产物的体内生产,用pJ401-VzTps1718表达质粒转化了大肠杆菌细胞,并评估来自内源FPP库的倍半萜的产生。为了提高细胞的生产力,在相同的细胞中表达异源FPP合酶和来自完整异源甲羟戊酸(MVA)途径的酶。含有FPP合酶基因的表达质粒和完整MVA途径的基因的构建描述于专利WO2013064411或Schalk等的(2013)J.Am.Chem.Chem.Soc.134,18900-18903。简言之,制备含有两个操纵子的表达质粒,所述操纵子由编码完整甲羟戊酸途径的酶的基因组成。由大肠杆菌乙酰乙酰辅酶A硫解酶(atoB)、金黄色葡萄球菌(Staphylococcus aureus)HMG-CoA合酶(mvaS)、金黄色葡萄球菌(Staphylococcus aureus)HMG-CoA还原酶(mvaA)和酿酒酵母FPP合酶(ERG20)基因组成的第一合成操纵子是在体外合成(DNA2.0,Menlo Park,CA,USA)并连接到NcoI-BamHI消化的pACYCDuet-1载体(Invitrogen)中,得到pACYC-29258。从肺炎链球菌(Streptococcuspneumoniae)(ATCC BAA-334)的基因组DNA中扩增出含有甲羟戊酸激酶(MvaK1)、磷酸甲羟戊酸激酶(MvaK2)、甲羟戊酸二磷酸脱羧酶(MvaD)和异戊烯二磷酸异构酶(idi)的第二操纵子并连接进入pACYC-29258的第二个多克隆位点,提供了质粒pACYC-29258-4506。因此,该质粒含有编码从乙酰辅酶A到FPP的生物合成途径的所有酶的基因。
用质粒pACYC-29258-4506和质粒pJ401-VzTps1718共转化KRX大肠杆菌细胞(Promega)。在卡那霉素(50μg/ml)和氯霉素(34μg/ml)LB-琼脂糖平板上选择转化的细胞。单菌落用于接种补充有相同抗生素的5mL液体LB培养基。将培养物在37℃温育过夜。第二天,用0.2mL过夜培养物接种2mL补充有相同抗生素的TB培养基。在37℃温育6小时后,将培养物冷却至20℃并向每个管中加入0.1mM IPTG和0.02%鼠李糖。将培养物在20℃温育48小时。然后用2体积的MTBE将培养物萃取两次,将有机相浓缩至500μL,并如上文实施例4中所述通过GC-MS进行分析。
在这些体内条件下,VzTps1817重组酶产生倍半萜的混合物,其具有与体外测定中非常相似的组成(图3-表2)。产物混合物中香根螺-1(10),7(1)-二烯、异朱栾倍半萜和朱栾倍半萜的相对丰度分别为14.7%、39.0%和5.1%。
表2.用重组VzTps1718倍半萜合酶在体内获得的产物混合物的组成。
实施例6:由VzTps1718使用香根草细胞色素P450酶产生的倍半萜的酶促氧化。
使用实施例5中描述并表达异源MVA途径和VzTP1718的大肠杆菌细胞制备用作生物转化测定中的底物的不同倍半萜烃。使用二氧化硅柱上的快速色谱法从1L培养物的提取物中纯化倍半萜烃。所得的含有香根螺-1(10),7(11)-二烯、异朱栾倍半萜和朱栾倍半萜的倍半萜烃混合物用于生化氧化实验。
使用tBlastn算法(Altschul等,J.Mol.Biol.215,403-410,1990)搜索香根草根转录组数据的细胞色素P450编码序列,并使用具有萜烯羟化酶活性的已知细胞色素P450的氨基酸序列(例如WO2013064411的SEQ ID NO:1和2)作为查询。分离了几种编码细胞色素P450的转录物。转录物VzTrspt-9_Locus_8201-12(SEQ ID NO:5)编码506个氨基酸的蛋白VzCP8201-12(SEQ ID NO:7),并显示与细胞色素P450氨基酸序列的同源性。最接近的可公开获得的序列是来自高梁(Sorghum bicolor)或玉米(Zea mays)的推定的细胞色素P450蛋白(例如NCBI登录号XP_002466860.1或DAA50205.1的序列),与VzCP8201-12相比具有小于84%的序列同一性。
设计编码全长VzCP8201-12(SEQ ID NO:7)蛋白的cDNA(SEQ ID NO:8)序列,其具有密码子用途以在细菌中最佳表达。还设计了编码VzCP8201-12(SEQ ID NO:10)的N-末端修饰变体的第二cDNA(SEQ ID NO:9),该修饰包括删除开始20个氨基酸并用MALLLAVFLGLSCLLLLSLW肽替换(SEQ ID NO:17)。合成这两个cDNA并亚克隆到pCWori表达质粒(Barnes,H.J.Method Enzymol.272,3-14;(1996))中,分别提供了pCWori-VzCP8201-12和pCWori-VzCP8201Bov质粒。
对于VzCP8201-12酶(SEQ ID NO:7)的功能表征,蛋白质在大肠杆菌细胞中异源表达。为了重建植物P450的活性,第二种膜蛋白的存在是有帮助的。这种蛋白P450-还原酶(CPR)参与从辅因子NADPH(还原型烟酰胺腺嘌呤二核苷酸磷酸)到P450活性位点的电子转移。已经显示来自一种植物的CPR可以补充来自另一种植物的P450酶的活性(Jensen和Moller(2010)Phytochemsitry 71,132-141)。已经报道了来自不同植物来源的几种编码CPR的DNA序列。我们选择先前从胡椒薄荷(Mentha piperita)分离的CPR(CPRm,未公开的数据,SEQ ID NO:15),优化全长cDNA(SEQ ID NO:6)的密码子使用,并将其克隆到pACYCDuet-1表达质粒(Novagen)的NcoI和HindIII限制性位点中,提供了质粒pACYC-CPRm。
用质粒pCWori-VzCP8201-12或pCWori-VzCP8201Bov并使用pACYC-CPRm质粒来共转化大肠杆菌细胞(BL21StarTM(DE3),Invitrogen)。在羧苄青霉素(50μg/ml)和氯霉素(34μg/ml)LB-琼脂糖平板上选择所转化的细胞。单菌落用于接种补充有相同抗生素的5mL液体LB培养基。将培养物在37℃温育过夜。第二天,用过夜培养物接种20mL补充有相同抗生素的TB培养基,并以0.15的OD起始。在37℃温育2小时后,将培养物冷却至25℃并加入1mM IPTG和75mg/L的δ-氨基乙酰丙酸。24小时后,收获细胞,离心并重悬于4ml补充有5%甘油的50mMpH7.0的磷酸钾缓冲液中。将如上所述制备的倍半萜混合物在乙醇中以10mg/ml稀释,并加入到细胞悬浮液中至终浓度为0.1mg/ml。使转化在25℃下进行24小时,同时适度摇动。用2体积的MTBE(甲基叔丁基醚,Sigma)提取培养基,如实施例4所述通过GCMS来分析提取物。
在该生物转化过程中形成了几种氧化的倍半萜化合物(图7和图8)。主要产物是乙酸异朱栾倍半萜烯酯(图1),其借助于产生异朱栾倍半萜的VzCP8201通过异朱栾倍半萜的氧化(图1),然后借助于背景大肠杆菌酶活性通过异朱栾倍半萜烯醇的乙酰化而形成。
实施例7:使用CYP71D4进行的由VzTps1718产生的倍半萜的酶促氧化。
还评估了来自马铃薯(Solanum tuberosum)(NCBI登录号CAC24711.1)的CYP71D4(SEQ ID NO:12)对由VzTps1718产生的倍半萜烃的氧化。设计并合成(DNA2.0)了编码CYP71D4的N-末端变体的密码子优化的cDNA(SEQ ID NO:13)。在该N-末端变体CYP71D4opt(SEQ ID NO:14)中,开始19个氨基酸被MALLLAVFWSALIILVLS肽(SEQ ID NO:18)取代。将优化的cDNA(SEQ ID NO:13)连接到pCWori表达质粒的NdeI和HindIII限制性位点(Barnes,H.J.Method Enzymol.272,3-14;(1996)),提供了pCWori-CYP71D4opt质粒。如实施例6中所述使用BL21StarTM(DE3)大肠杆菌细胞进行了生物转化,并使用CPRm共表达CYP71D4opt。
因此,使用CYP71D4,由VzTps1718产生的几种倍半萜烃可以转化为倍半萜烯醇。鉴定出了三种产物:努特卡醇、β-岩兰烯醇和异努特卡醇(图9和图1)。这些氧化的倍半萜可以容易地氧化成相应的酮,例如通过生物化学方式或通过化学方式(Oxidation of Alcoholsto Aldehydes and Ketones,G.Tojo和M.Fernadez的Basic Reactions in OrganicSynthesis(2007))以产生主要的香根草油成分努特卡酮、α-岩兰烯酮和β-岩兰烯酮。
实施例8:使用VzTps1718和细胞色素P450酶体内产生氧化的倍半萜化合物。
使用实施例6和7中描述的方法产生的氧化的倍半萜化合物也可以在细菌细胞中获得,所述细菌细胞被工程化以共表达倍半萜合酶(VzTps1718)和细胞色素P450VzCP8201。
构建了包含pCWori+质粒(Barnes H.J(1996)Method Enzymol.272,3-14)的新质粒,其含有由P450、CPR和编码萜合酶的cDNA组成的合成操纵子。设计构建体以在每个cDNA的上游插入核糖体结合位点(RBS)。实施例6中描述的pCWori-VzCP8201Bov质粒含有编码VzCP8201Bov的cDNA(SEQ ID NO:9),其被设计为包括位于编码VzCP8201Bov的cDNA上游的NdeI识别序列以及位于编码VzCP8201Bov的cDNA下游的多接头DNA序列(GTCGACAATTAACCATGGTTAATTAAGCTTATATATG GTACCATATATGAATTCATTAATCTCGAG(SEQ ID NO:19))并含有SalI、NcoI、HindIII、KpnI、EcoRI和XhoI识别序列。修饰经优化的CPRm cDNA以在5'末端在起始密码子之前添加含有间隔序列、SalI识别序列和RBS序列的26bp延伸序列(GTCGACAATTAGGTAAAAAATAAACC(SEQ ID NO:20))并在3'末端添加HindIII识别序列。将优化的CPRm cDNA亚克隆到pCWori-VzCP8201Bov质粒的SalI和HindIII位点之间,提供了pCWori-VzCP8201Bov-CPRm质粒。在pJ401质粒(DNA2.0,Menlo Park,CA,USA)中克隆的VzTps1718的优化cDNA序列含有由HindIII识别序列和RBS序列组成的5'非编码序列(AAGCTAGAGGAGGTAAAAA(SEQ ID NO:21))和由KpnI、EcoRI和XhoI识别位点组成的3'非编码序列(GGTACCATATATGAATTCATTAATCTCGAG(SEQ ID NO:22))。使用HindIII和XhoI限制酶来消化形成VzTps1718-pJ401质粒的插入物,并将其亚克隆到pCWori-VzCP8201Bov-CPRm质粒的相同限制酶识别位点之间。所得到的质粒pCWori:VzCP8201Bov:CPRm:VzTpsl718因此包含一个操纵子,其包括编码VzCP8201Bov的cDNA、编码CPRm的cDNA和编码VzTps1718的cDNA。
将编码N-末端修饰的CYP71D4蛋白(SEQ ID NO:14)的优化的cDNA(SEQ ID NO:13)通过使用NdeI和HindIII限制酶的消化/连接从pCWori-CYP71D4opt质粒(实施例7)转移到pCWori:VzCP8201Bov:CPRm:VzTps1718中。新质粒pCWori:CYP71D4opt:CPRm:VzTpsl718因此包含一个操纵子,其包括编码CYP71D4opt的cDNA、编码CPRm的cDNA和编码VzTps1718的cDNA。
用上述两种pCWori质粒之一和携带完整甲羟戊酸途径(实施例5)的质粒pACYC-29258-4506共转化KRX大肠杆菌细胞(Promega)。在羧苄青霉素(50μg/ml)和氯霉素(34μg/ml)LB-琼脂糖平板上选择所转化的细胞。单菌落用于接种5mL补充有适当抗生素的LB培养基。将培养物在37℃和250rpm温育过夜。第二天,用含有100μg/L羧苄青霉素和17μg/L氯霉素的玻璃培养管中的2mL TB培养基接种200μl的LB预培养物,并在37℃和250rpm温育。培养6小时后(或当培养物在600nm的光密度达到3时),将培养物冷却至20℃并用0.1mM IPTG(异丙基-β-D-1-硫代吡喃半乳糖苷)和0.02%鼠李糖诱导蛋白质的表达,然后添加75μg/L的δ-氨基乙酰丙酸(Sigma)和2%(v/v)的癸烷。在以250rpm振荡温育48小时后,用1体积的MTBE提取整个培养液,并如实施例4中所述通过GCMS进行分析。
图10显示了单独使用工程改造以产生重组VzTps1718倍半萜合酶的大肠杆菌细胞或与VzCP8201或CYP71D4细胞色素P450酶一起所形成的产物的GCMS。这些数据表明,使用该方法,实施例6和7中描述的氧化的倍半萜化合物可以在工程细胞中体内产生。
序列表:
SEQ ID NO:1
VzTps1718的全长氨基酸序列:
MAASITVAAAHGPPAAIPETKRSTVDDVPFQSSVWGDYFVNYTPPASQRSEEWMRERVDELRGEVRRKFKTTMSMAETMVLVDTLERLAIDGHFRKDIDLALSQIHMEGKPAGISSSNKLYIVALGFRLLRQHGFWVSADVFDKFRDSTGKLSKGLSGDVKGLLSLYNAAHMAVPGEKSLDEAIDFTRRCLESAKDRLVAPMSVQVSRALSIPLPRYLPRLEAMHYISEYGQEEDHDAKILELARLDYALVQSLYLKELRELTLWWKELYHSVNLPNTRDRIVEMYFFAFGMLQTEEYSRARLIDSKIIALVSLMDDIYDEHASFEEAQKFNEAIQRWNESAVSDLPEYMRMLYTQILSTFAKFEEVLGPNEKYRVSYAKEAYKLQSMYYFLENKWCHENHMPSFGEHIHLSSMSAGLQVLIVGAWIGAHHAIAKESLEWAITYPEVFRAAGDVGRLLNDIASFKKRKNSKDAPNALECYVREHGVTGEEAAAACAAIVELGWRKINRARMEIHPMLVPAAQMDAKINLTRVCEILYYRGMDGYTFGSDLRDVITSLFIKPAAGGPA
SEQ ID NO:2
包括3’和5’非编码区的VzTps1718野生型cDNA序列:
ACTGGAGTTCAGACGTGTGCTCTTCCGATCTATCGGAGTGAAGTTGAGCAGCTAACTTCACGACTCGTTTGCAGGCTAGCTCGCAACAGAATAGAGAGTGTTACTGCTGGTATATATATATATATATATATGGCTGCGAGCATTACTGTCGCCGCCGCACATGGGCCTCCTGCTGCAATCCCAGAGACCAAACGCAGCACTGTAGACGACGTTCCTTTCCAATCCTCTGTGTGGGGCGACTACTTTGTAAACTACACACCTCCTGCATCACAGAGGTCGGAGGAATGGATGAGGGAGAGGGTTGATGAACTCAGGGGTGAAGTGCGCCGGAAGTTCAAAACGACGATGAGCATGGCCGAGACGATGGTGCTGGTGGACACACTGGAGCGCCTCGCCATCGACGGCCATTTCCGCAAGGATATTGACTTGGCGTTGAGCCAAATCCACATGGAGGGGAAGCCGGCCGGTATTAGCAGCTCCAACAAGCTTTACATCGTCGCCCTGGGATTCCGCTTGCTTAGGCAACATGGCTTCTGGGTATCCGCAGACGTGTTTGACAAGTTTAGGGATAGCACGGGCAAGCTTAGCAAGGGTCTGAGCGGCGACGTGAAGGGTCTGCTGAGCCTATACAACGCGGCTCACATGGCGGTTCCCGGCGAGAAAAGCCTGGACGAAGCCATCGACTTCACAAGGCGCTGCCTCGAGTCTGCCAAGGACAGGCTCGTGGCGCCGATGTCGGTGCAGGTGTCGCGCGCCCTCAGCATTCCTCTCCCCCGCTACCTGCCGCGGCTAGAGGCCATGCACTACATCTCAGAGTATGGGCAGGAGGAGGACCATGACGCCAAGATCCTGGAGCTTGCGAGGCTGGACTATGCCCTTGTCCAGTCTCTCTATCTCAAGGAGCTCAGGGAGCTCACCTTGTGGTGGAAGGAGCTGTATCACAGCGTGAATCTGCCCAACACACGGGACCGCATCGTGGAGATGTACTTCTTTGCATTTGGTATGCTGCAGACGGAGGAGTACTCTCGGGCGCGCCTGATTGATAGCAAGATAATTGCACTGGTCAGCCTGATGGATGACATTTACGACGAACACGCTAGCTTTGAGGAAGCCCAAAAATTCAATGAAGCCATACAGAGATGGAATGAAAGTGCGGTCTCAGACCTACCAGAATACATGCGCATGCTATACACCCAAATACTAAGCACCTTCGCCAAATTTGAGGAAGTTTTGGGGCCCAACGAAAAGTACCGCGTGTCTTACGCCAAAGAGGCGTACAAATTGCAGTCGATGTATTACTTTCTGGAGAACAAATGGTGTCACGAGAACCACATGCCAAGCTTCGGAGAGCACATACATCTTTCTTCCATGTCGGCAGGCTTGCAGGTGTTGATCGTTGGGGCATGGATAGGCGCCCACCACGCCATTGCCAAGGAGTCACTAGAGTGGGCAATCACCTACCCTGAAGTCTTCCGGGCAGCAGGAGATGTTGGCCGTCTCCTCAACGATATCGCTTCATTTAAGAAGAGGAAAAACAGCAAGGACGCGCCCAACGCGCTGGAGTGCTACGTCAGAGAACATGGCGTCACGGGGGAGGAAGCTGCGGCCGCGTGTGCAGCCATTGTAGAGCTCGGGTGGAGGAAGATCAACAGGGCCCGTATGGAGATACATCCTATGCTGGTACCCGCGGCACAAATGGATGCGAAAATCAACCTGACCAGGGTGTGCGAGATTTTATACTACCGTGGTATGGATGGCTACACCTTTGGAAGCGACCTCCGGGATGTCATCACTTCTCTCTTCATCAAGCCGGCGGCCGGGGGCCCTGCATAATT
SEQ ID NO:3
VzTps1718野生型cDNA开放阅读框序列:
ATGGCTGCGAGCATTACTGTCGCCGCCGCACATGGGCCTCCTGCTGCAATCCCAGAGACCAAACGCAGCACTGTAGACGACGTTCCTTTCCAATCCTCTGTGTGGGGCGACTACTTTGTAAACTACACACCTCCTGCATCACAGAGGTCGGAGGAATGGATGAGGGAGAGGGTTGATGAACTCAGGGGTGAAGTGCGCCGGAAGTTCAAAACGACGATGAGCATGGCCGAGACGATGGTGCTGGTGGACACACTGGAGCGCCTCGCCATCGACGGCCATTTCCGCAAGGATATTGACTTGGCGTTGAGCCAAATCCACATGGAGGGGAAGCCGGCCGGTATTAGCAGCTCCAACAAGCTTTACATCGTCGCCCTGGGATTCCGCTTGCTTAGGCAACATGGCTTCTGGGTATCCGCAGACGTGTTTGACAAGTTTAGGGATAGCACGGGCAAGCTTAGCAAGGGTCTGAGCGGCGACGTGAAGGGTCTGCTGAGCCTATACAACGCGGCTCACATGGCGGTTCCCGGCGAGAAAAGCCTGGACGAAGCCATCGACTTCACAAGGCGCTGCCTCGAGTCTGCCAAGGACAGGCTCGTGGCGCCGATGTCGGTGCAGGTGTCGCGCGCCCTCAGCATTCCTCTCCCCCGCTACCTGCCGCGGCTAGAGGCCATGCACTACATCTCAGAGTATGGGCAGGAGGAGGACCATGACGCCAAGATCCTGGAGCTTGCGAGGCTGGACTATGCCCTTGTCCAGTCTCTCTATCTCAAGGAGCTCAGGGAGCTCACCTTGTGGTGGAAGGAGCTGTATCACAGCGTGAATCTGCCCAACACACGGGACCGCATCGTGGAGATGTACTTCTTTGCATTTGGTATGCTGCAGACGGAGGAGTACTCTCGGGCGCGCCTGATTGATAGCAAGATAATTGCACTGGTCAGCCTGATGGATGACATTTACGACGAACACGCTAGCTTTGAGGAAGCCCAAAAATTCAATGAAGCCATACAGAGATGGAATGAAAGTGCGGTCTCAGACCTACCAGAATACATGCGCATGCTATACACCCAAATACTAAGCACCTTCGCCAAATTTGAGGAAGTTTTGGGGCCCAACGAAAAGTACCGCGTGTCTTACGCCAAAGAGGCGTACAAATTGCAGTCGATGTATTACTTTCTGGAGAACAAATGGTGTCACGAGAACCACATGCCAAGCTTCGGAGAGCACATACATCTTTCTTCCATGTCGGCAGGCTTGCAGGTGTTGATCGTTGGGGCATGGATAGGCGCCCACCACGCCATTGCCAAGGAGTCACTAGAGTGGGCAATCACCTACCCTGAAGTCTTCCGGGCAGCAGGAGATGTTGGCCGTCTCCTCAACGATATCGCTTCATTTAAGAAGAGGAAAAACAGCAAGGACGCGCCCAACGCGCTGGAGTGCTACGTCAGAGAACATGGCGTCACGGGGGAGGAAGCTGCGGCCGCGTGTGCAGCCATTGTAGAGCTCGGGTGGAGGAAGATCAACAGGGCCCGTATGGAGATACATCCTATGCTGGTACCCGCGGCACAAATGGATGCGAAAATCAACCTGACCAGGGTGTGCGAGATTTTATACTACCGTGGTATGGATGGCTACACCTTTGGAAGCGACCTCCGGGATGTCATCACTTCTCTCTTCATCAAGCCGGCGGCCGGGGGCCCTGCATAA
SEQ ID NO:4
VzTps1718密码子优化的cDNA序列
ATGGCAGCAAGCATCACGGTCGCCGCAGCACACGGTCCGCCAGCAGCAATCCCGGAAACCAAACGCAGCACCGTGGATGACGTTCCATTTCAATCCTCGGTGTGGGGCGACTACTTCGTCAACTATACGCCGCCGGCGAGCCAGCGTTCCGAAGAGTGGATGCGTGAACGCGTTGACGAACTGCGTGGCGAAGTGCGTCGTAAGTTCAAGACTACCATGAGCATGGCTGAAACCATGGTTCTGGTTGATACCCTGGAGCGCCTTGCAATCGATGGTCATTTTCGTAAAGATATTGACCTGGCACTGAGCCAGATCCACATGGAGGGTAAACCGGCGGGTATTAGCTCGTCTAACAAGCTGTATATCGTTGCGCTGGGCTTTCGTTTGTTGCGTCAGCACGGTTTCTGGGTGAGCGCCGATGTTTTCGATAAATTTCGTGATAGCACGGGCAAACTGTCCAAGGGCCTGAGCGGCGACGTCAAGGGCCTGCTGTCACTGTATAATGCCGCACACATGGCTGTCCCGGGTGAGAAATCTCTGGATGAAGCGATTGACTTTACGCGTCGCTGCCTGGAAAGCGCCAAAGATCGTTTGGTGGCCCCGATGAGCGTCCAGGTTAGCCGCGCCCTGAGCATCCCGCTGCCGCGTTATCTGCCGCGCCTGGAAGCGATGCATTACATCAGCGAGTATGGTCAAGAGGAAGATCACGACGCTAAGATCCTGGAATTGGCGCGCCTGGACTACGCGCTGGTCCAAAGCCTGTACCTGAAAGAACTGCGCGAGCTGACCCTGTGGTGGAAAGAACTGTACCACTCCGTTAATCTGCCGAACACCCGTGACCGCATCGTCGAGATGTATTTCTTTGCGTTTGGTATGTTGCAGACCGAAGAGTACTCTCGTGCTCGCCTGATCGATAGCAAGATTATCGCCCTGGTGAGCCTGATGGATGACATTTATGATGAGCATGCCAGCTTCGAGGAAGCTCAAAAGTTTAACGAAGCAATCCAACGTTGGAATGAAAGCGCGGTTAGCGACTTGCCGGAGTATATGCGCATGCTGTACACCCAAATCCTGAGCACCTTCGCGAAGTTTGAAGAGGTTCTGGGTCCGAACGAAAAATATCGCGTGAGCTATGCGAAAGAGGCGTACAAGCTGCAATCCATGTACTATTTCCTGGAGAACAAATGGTGTCATGAGAATCACATGCCGAGCTTCGGTGAGCACATTCACCTGAGCTCCATGTCCGCGGGTTTGCAAGTGTTGATTGTGGGTGCTTGGATCGGCGCACATCATGCCATTGCAAAAGAGAGCCTGGAGTGGGCGATTACCTACCCTGAAGTTTTTCGTGCCGCGGGCGATGTGGGTCGTCTGTTGAATGACATTGCAAGCTTCAAAAAGCGTAAGAACTCTAAAGACGCCCCGAACGCGCTGGAGTGTTATGTCCGTGAACACGGCGTGACTGGCGAAGAAGCGGCAGCTGCCTGCGCAGCTATTGTTGAGCTGGGTTGGCGTAAGATCAACCGTGCGCGCATGGAAATCCATCCGATGCTGGTCCCGGCGGCGCAGATGGACGCGAAAATCAATTTGACCCGTGTGTGCGAGATCCTGTACTACCGTGGCATGGATGGTTACACCTTCGGTAGCGATTTACGCGATGTGATTACGAGCCTCTTCATTAAGCCTGCGGCTGGCGGCCCGGCGTAA
SEQ ID NO:5
VzTrspt-9_Locus_8201-12,含有5’和3非翻译序列的全长转录物
GATCGTTTCACGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTCAAAAAATGGACTTTCTCAGAATCCCGTTTCTTGTAGCCTTCGTCTTCCTCGCCGTCCTTCTCAGGCTCATCCGGAGCTACATCACATCCTCAGCTCTTCGCCTGCCACCGGGGCCATGGCAGCTGCCGCTCATCGGCAGCCTGCACCACCTCCTGCTGTCGCGCTTCAGCGACCTCCCTCACCGGGCTTTGCGCGAGATGTCCGGCACCTACGGGCCCCTCATGCTGCTCCGCTTCGGCTCCGTGCCCACGCTGGTGGTCTCCTCCGCCGAGGCTGCCCGGGAGGTGATGAGGACCCACGACCTCGCCTTCTGCGACCGCCACCTCGGCGTCACTCTCGACATCGTCACCTGCGGCGGCAAGGACATCATCTGCTCCCCCTACAACGCCCACTGGCGCGAGCTCCGTAAGCTGTGCATGGTCGAGATCTTGAGCCAGCGGCGCGTGCTCTCGTTCCGGAGCATCCGGGAAGAGGAGGTGGCGAGCCTCGTCCGCTCCATCTCCGACGAGTGCGGCGGTGGCCAGCAGCCCGTCAACCTCACTGAAGGGATAAGCCGCATGATAAACGACGTCGCCGCGCGCACGGTCGTCGGCGACCGGTGCAAGTACCAGGATGAATACATGCATGAGCTGGACGAAGTGGTGCGGCTGGCCGGCGGGTTCAACCTGGCGGACCTGTACCCGTCCTCGCGGCTGGTACGGCGGTTCAGCGCCGCCGCGAGGGACGCGAGGAGGTGCCAGAGGAACATGTACCGTATCATCCAGAGCATCATCCAGGAGCGTGAAGCCATGCCGACGCCAGAGCGAGACGAGGAGGACCTCCTCGGCGTCCTCCTCAGGCTGCAGAGAGAAGGTGGCCTGCAGTTTGCTCTCACCAATGAGATAGTCAGCACCGTCATTTACGATATTTTTTCTGCTGGTAGTGAAACATCATCAACTGTTCTAGTATGGGCAATGTCGGAGCTTGTTAAGAATCCACAAGTCATGCGTAAGGCCCAGTCAGAGGTGAGGGATACCTTCAAAGGAAACAACAAGATAACTGAAAGTGATTTGATCAAGTTAAGATATCTACAACTGGTGATCAAGGAGACTTTACGGTTGCATGCTCCGGTACCACTCTTGCTCCCTCGAGAATGCCGTGAGTCATGTCAGATTATGGGTTACGATGTGCTAAAGGGAACCAAGGTATTTGTGAATGCTTGGGCAATAGCAAGGGACACGGGATTATGGTGTGATGGAGAGGAATTTAGGCCAGAAAGGTTTGAAAGTAGCAATATTGATTTCAGGGGTAATGACTTTGAGTTCACACCGTTTGGGGCAGGCAGGAGAGTATGCCCTGGCATCACACTTGGACTGGCCAACCTAGAACTAGCGCTTGCTAGCCTTCTTTATCATTTTGATTGGGATCTGCCCAATGGTGCCAGGTTGGAAGATCTTGATATGGCAGAGGCCTTTGGTATAACGTTAAAAAGGAAGTCCATGCTCTGGCTCAAGGCCAAACCTTACAATAATTTTATACCAAATTAATCAGGTGATTTGTGATGTGAACTATCCCGGTTGCTACTTAGTTTATTATACCCAGAAAGAGTGTGATGGTAATTGTACTATCAATCTTTACTGCAGAACAGTAAATATATCCAGAGTTGGTTCTATGCTTCTGTTATAATGTTTCATCACTCTGTATTAAGTGTGTAGTTATCTGTTTGTTTACTTTTTTTGTAATGATTAAACGATTATCTAATGAGAGTACAAGAATCAAATGAGACTGGTCTAAAAAAAA
SEQ ID NO:6
VzCp8201-12野生型cDNA序列,仅开放阅读框。
ATGGACTTTCTCAGAATCCCGTTTCTTGTAGCCTTCGTCTTCCTCGCCGTCCTTCTCAGGCTCATCCGGAGCTACATCACATCCTCAGCTCTTCGCCTGCCACCGGGGCCATGGCAGCTGCCGCTCATCGGCAGCCTGCACCACCTCCTGCTGTCGCGCTTCAGCGACCTCCCTCACCGGGCTTTGCGCGAGATGTCCGGCACCTACGGGCCCCTCATGCTGCTCCGCTTCGGCTCCGTGCCCACGCTGGTGGTCTCCTCCGCCGAGGCTGCCCGGGAGGTGATGAGGACCCACGACCTCGCCTTCTGCGACCGCCACCTCGGCGTCACTCTCGACATCGTCACCTGCGGCGGCAAGGACATCATCTGCTCCCCCTACAACGCCCACTGGCGCGAGCTCCGTAAGCTGTGCATGGTCGAGATCTTGAGCCAGCGGCGCGTGCTCTCGTTCCGGAGCATCCGGGAAGAGGAGGTGGCGAGCCTCGTCCGCTCCATCTCCGACGAGTGCGGCGGTGGCCAGCAGCCCGTCAACCTCACTGAAGGGATAAGCCGCATGATAAACGACGTCGCCGCGCGCACGGTCGTCGGCGACCGGTGCAAGTACCAGGATGAATACATGCATGAGCTGGACGAAGTGGTGCGGCTGGCCGGCGGGTTCAACCTGGCGGACCTGTACCCGTCCTCGCGGCTGGTACGGCGGTTCAGCGCCGCCGCGAGGGACGCGAGGAGGTGCCAGAGGAACATGTACCGTATCATCCAGAGCATCATCCAGGAGCGTGAAGCCATGCCGACGCCAGAGCGAGACGAGGAGGACCTCCTCGGCGTCCTCCTCAGGCTGCAGAGAGAAGGTGGCCTGCAGTTTGCTCTCACCAATGAGATAGTCAGCACCGTCATTTACGATATTTTTTCTGCTGGTAGTGAAACATCATCAACTGTTCTAGTATGGGCAATGTCGGAGCTTGTTAAGAATCCACAAGTCATGCGTAAGGCCCAGTCAGAGGTGAGGGATACCTTCAAAGGAAACAACAAGATAACTGAAAGTGATTTGATCAAGTTAAGATATCTACAACTGGTGATCAAGGAGACTTTACGGTTGCATGCTCCGGTACCACTCTTGCTCCCTCGAGAATGCCGTGAGTCATGTCAGATTATGGGTTACGATGTGCTAAAGGGAACCAAGGTATTTGTGAATGCTTGGGCAATAGCAAGGGACACGGGATTATGGTGTGATGGAGAGGAATTTAGGCCAGAAAGGTTTGAAAGTAGCAATATTGATTTCAGGGGTAATGACTTTGAGTTCACACCGTTTGGGGCAGGCAGGAGAGTATGCCCTGGCATCACACTTGGACTGGCCAACCTAGAACTAGCGCTTGCTAGCCTTCTTTATCATTTTGATTGGGATCTGCCCAATGGTGCCAGGTTGGAAGATCTTGATATGGCAGAGGCCTTTGGTATAACGTTAAAAAGGAAGTCCATGCTCTGGCTCAAGGCCAAACCTTACAATAATTTTATACCAAATTAA
SEQ ID NO:7
VzCP8201-12,野生型氨基酸序列。
MDFLRIPFLVAFVFLAVLLRLIRSYITSSALRLPPGPWQLPLIGSLHHLLLSRFSDLPHRALREMSGTYGPLMLLRFGSVPTLVVSSAEAAREVMRTHDLAFCDRHLGVTLDIVTCGGKDIICSPYNAHWRELRKLCMVEILSQRRVLSFRSIREEEVASLVRSISDECGGGQQPVNLTEGISRMINDVAARTVVGDRCKYQDEYMHELDEVVRLAGGFNLADLYPSSRLVRRFSAAARDARRCQRNMYRIIQSIIQEREAMPTPERDEEDLLGVLLRLQREGGLQFALTNEIVSTVIYDIFSAGSETSSTVLVWAMSELVKNPQVMRKAQSEVRDTFKGNNKITESDLIKLRYLQLVIKETLRLHAPVPLLLPRECRESCQIMGYDVLKGTKVFVNAWAIARDTGLWCDGEEFRPERFESSNIDFRGNDFEFTPFGAGRRVCPGITLGLANLELALASLLYHFDWDLPNGARLEDLDMAEAFGITLKRKSMLWLKAKPYNNFIPN
SEQ ID NO:8
VzCP8201-228093,编码VzCP8201-12的优化的DNA序列,包括位于5’端的NdeI位点和位于3’端的多接头。
ATGGCACTGTTGTTGGCTGTTTTTTTGGGTTTGAGCTGTTTGTTGCTGTTGAGCTTGTGGCGTCTGATCCGCAGCTACATTACTTCCAGCGCGCTGCGCCTGCCGCCGGGTCCGTGGCAGCTGCCTCTGATTGGCAGCCTGCACCACTTGCTGCTGAGCCGCTTCAGCGACTTGCCGCATCGCGCGCTGAGAGAGATGAGCGGCACCTACGGTCCGCTGATGCTGCTGCGTTTCGGTAGCGTCCCGACCCTGGTTGTCTCTAGCGCGGAAGCGGCTCGTGAAGTCATGCGTACCCACGATCTGGCGTTTTGCGATCGTCACCTGGGTGTGACGCTGGACATCGTAACCTGTGGTGGCAAAGACATCATCTGCAGCCCATACAACGCTCATTGGCGTGAGCTGCGCAAGCTGTGCATGGTTGAAATCCTGAGCCAGCGCCGTGTGCTGAGCTTCCGTTCGATTCGTGAAGAAGAGGTCGCGAGCCTGGTGCGTTCCATTAGCGATGAGTGTGGTGGCGGCCAGCAACCAGTTAACCTGACCGAAGGCATCTCTCGCATGATTAATGACGTCGCCGCACGTACCGTGGTCGGTGACCGCTGCAAGTACCAAGACGAGTACATGCATGAACTGGACGAAGTTGTTCGTCTGGCGGGTGGCTTCAACCTGGCCGATCTGTATCCGAGCTCACGTCTGGTTCGTCGTTTTTCCGCAGCTGCGCGTGACGCGCGTCGCTGTCAGCGTAACATGTACCGCATTATTCAATCTATCATCCAAGAGCGTGAGGCAATGCCGACGCCTGAGCGCGACGAAGAAGATCTTCTGGGTGTCCTGCTGCGTCTGCAGCGCGAGGGTGGTCTGCAGTTTGCGCTGACGAACGAAATTGTTTCGACCGTGATTTACGATATCTTCAGCGCCGGTAGCGAAACCTCCAGCACGGTGTTGGTGTGGGCAATGTCTGAACTGGTCAAAAATCCGCAAGTGATGCGCAAAGCGCAAAGCGAAGTTCGTGACACTTTCAAAGGTAACAATAAGATTACCGAGAGCGACCTGATTAAGCTGCGCTATCTGCAACTGGTTATCAAAGAAACCCTGCGCCTGCACGCACCGGTGCCGCTGCTGCTGCCGCGTGAGTGCCGTGAATCCTGTCAGATCATGGGCTATGACGTTCTGAAGGGTACGAAAGTGTTCGTTAATGCCTGGGCGATTGCACGTGATACGGGTCTGTGGTGCGACGGCGAAGAGTTCCGTCCGGAGCGTTTCGAGTCCAGCAATATCGATTTTCGTGGTAATGATTTTGAGTTCACGCCGTTCGGTGCGGGCCGTCGTGTCTGCCCAGGCATCACCCTGGGCCTGGCCAACTTAGAACTGGCCCTCGCGAGCTTGTTATATCACTTTGACTGGGATCTGCCGAACGGCGCGCGCCTGGAAGATCTGGACATGGCCGAGGCATTTGGTATCACGCTGAAGCGCAAGAGCATGCTGTGGCTGAAAGCAAAACCGTACAATAATTTTATTCCGAACTAA
SEQ ID NO:9
VzCP8201-228092,编码VzCP8201-12-bov的优化的DNA序列,包括位于5’端的NdeI位点和位于3’端的多接头。
ATGGCACTGTTGTTGGCTGTTTTTTTGGGTTTGAGCTGTTTGTTGCTGTTGAGCTTGTGGCGTCTGATCCGCAGCTACATTACTTCCAGCGCGCTGCGCCTGCCGCCGGGTCCGTGGCAGCTGCCTCTGATTGGCAGCCTGCACCACTTGCTGCTGAGCCGCTTCAGCGACTTGCCGCATCGCGCGCTGAGAGAGATGAGCGGCACCTACGGTCCGCTGATGCTGCTGCGTTTCGGTAGCGTCCCGACCCTGGTTGTCTCTAGCGCGGAAGCGGCTCGTGAAGTCATGCGTACCCACGATCTGGCGTTTTGCGATCGTCACCTGGGTGTGACGCTGGACATCGTAACCTGTGGTGGCAAAGACATCATCTGCAGCCCATACAACGCTCATTGGCGTGAGCTGCGCAAGCTGTGCATGGTTGAAATCCTGAGCCAGCGCCGTGTGCTGAGCTTCCGTTCGATTCGTGAAGAAGAGGTCGCGAGCCTGGTGCGTTCCATTAGCGATGAGTGTGGTGGCGGCCAGCAACCAGTTAACCTGACCGAAGGCATCTCTCGCATGATTAATGACGTCGCCGCACGTACCGTGGTCGGTGACCGCTGCAAGTACCAAGACGAGTACATGCATGAACTGGACGAAGTTGTTCGTCTGGCGGGTGGCTTCAACCTGGCCGATCTGTATCCGAGCTCACGTCTGGTTCGTCGTTTTTCCGCAGCTGCGCGTGACGCGCGTCGCTGTCAGCGTAACATGTACCGCATTATTCAATCTATCATCCAAGAGCGTGAGGCAATGCCGACGCCTGAGCGCGACGAAGAAGATCTTCTGGGTGTCCTGCTGCGTCTGCAGCGCGAGGGTGGTCTGCAGTTTGCGCTGACGAACGAAATTGTTTCGACCGTGATTTACGATATCTTCAGCGCCGGTAGCGAAACCTCCAGCACGGTGTTGGTGTGGGCAATGTCTGAACTGGTCAAAAATCCGCAAGTGATGCGCAAAGCGCAAAGCGAAGTTCGTGACACTTTCAAAGGTAACAATAAGATTACCGAGAGCGACCTGATTAAGCTGCGCTATCTGCAACTGGTTATCAAAGAAACCCTGCGCCTGCACGCACCGGTGCCGCTGCTGCTGCCGCGTGAGTGCCGTGAATCCTGTCAGATCATGGGCTATGACGTTCTGAAGGGTACGAAAGTGTTCGTTAATGCCTGGGCGATTGCACGTGATACGGGTCTGTGGTGCGACGGCGAAGAGTTCCGTCCGGAGCGTTTCGAGTCCAGCAATATCGATTTTCGTGGTAATGATTTTGAGTTCACGCCGTTCGGTGCGGGCCGTCGTGTCTGCCCAGGCATCACCCTGGGCCTGGCCAACTTAGAACTGGCCCTCGCGAGCTTGTTATATCACTTTGACTGGGATCTGCCGAACGGCGCGCGCCTGGAAGATCTGGACATGGCCGAGGCATTTGGTATCACGCTGAAGCGCAAGAGCATGCTGTGGCTGAAAGCAAAACCGTACAATAATTTTATTCCGAACTAA
SEQ ID NO:10
VzCP8201-12-bov,VzCP8201-12的N-末端变体的氨基酸序列。
MALLLAVFLGLSCLLLLSLWRLIRSYITSSALRLPPGPWQLPLIGSLHHLLLSRFSDLPHRALREMSGTYGPLMLLRFGSVPTLVVSSAEAAREVMRTHDLAFCDRHLGVTLDIVTCGGKDIICSPYNAHWRELRKLCMVEILSQRRVLSFRSIREEEVASLVRSISDECGGGQQPVNLTEGISRMINDVAARTVVGDRCKYQDEYMHELDEVVRLAGGFNLADLYPSSRLVRRFSAAARDARRCQRNMYRIIQSIIQEREAMPTPERDEEDLLGVLLRLQREGGLQFALTNEIVSTVIYDIFSAGSETSSTVLVWAMSELVKNPQVMRKAQSEVRDTFKGNNKITESDLIKLRYLQLVIKETLRLHAPVPLLLPRECRESCQIMGYDVLKGTKVFVNAWAIARDTGLWCDGEEFRPERFESSNIDFRGNDFEFTPFGAGRRVCPGITLGLANLELALASLLYHFDWDLPNGARLEDLDMAEAFGITLKRKSMLWLKAKPYNNFIPN
SEQ ID NO:11
CYP71D4,野生型cDNA序列,仅开放阅读框。
ATGCAATTCTTGAGCTTGGCTTCCATCTTCCTTTTTCTATCTTTTCTGTTTTTGTTAAGGAAATGGAAAAACTCGAATAGCCAATCGAAAAAATTGCCTCCAGGTCCATGGAAACTTCCTTTACTAGGAAGTATGCTTCATATGGCTGGTGGACTTCCACACCATGTCCTTAGAGATTTAGCCAAAAAATATGGACCACTTATGCATCTTCAACTTGGTGAAGTCTCTGCAGTTGTAGTAACTTCTCCTGATATGGCGAAAGAAGTACTAAAAACTCATGACATCGCTTTCGCCTCTAGGCCTAAACTTTTGGCCCCGGAAATTGTTTGTTACAACAGGTCTGACATTGCCTTTTGCCCCTACGGAGATTACTGGAGACAAATGCGTAAAATTTGTGTCTTGGAATTGTTGAGTGCCAAGAATGTCCGGTCATATGGCTCGATTAGGCGCGATGAAGTTGATCGCCTTGTTAATTTTATCCGGTCATCTTCGGGTGAGCCGGTTAATTTTACTGAAAGGTTGTTTTTGTTCACAAGTTCAATGACATGTAGATCAGCGTTCGGGAAAGTGTTCAAAGAACAGGACAAATTTATACAACTAATCAAAGAAGTGATTGGGTTAGCAGGAGGATTTGATGTGGCTGATATCTTCCCATCATTGAAGTTTCTCCATGTGCTTAGTGGAATGAAAGGTAAAATTATGAACGCTCATCATAAGGTAGATGCAATTGTTGAAGATGTCATCAATGAGCACAAGAAGAAATTTGCAATTGGGAAAACTAATGGTGCATTAGGTGGTGAAGATCTAATTGATGTCCTTATAAGACTTATGAATGATGGAGGCCTTCAATTTCCGATCACCAACGACAACATCAAAGCTATTATTTTCGACATGTTTGCTGCAGGAACAGAGACTTCATCGTCAACACTTGTCTGGGCAATGGTGCAAATGATGAAAAACCCAAGTGTAATCGCCAAAGCTCAAGCAGAAGTGCGAGAAGCCTTTAAAGACAAAGAAACGTTCGATGAAAATGATGTAGAGGAGCTGAAATACTTAAAGTTAGTCATTAAAGAAACTCTAAGACTCCATCCACCAGTTCCACTTTTGGTCCCAAGAGAATGTAGGGAAGAGACGGATATAAACGGCTACACTATTCCTGTGAAGACCAAAGTCATGGTTAATGTTTGGGCATTGGGAAGAGATCCGAAATATTGGGATGATGCAGAAAGTTTTAAGCCAGAGAGATTTGAGCAGCGCTCTGTCGACTTTGTTGGTAACAATTTTGAGTATCTTCCCTTTGGCGGTGGGAGAAGGATTTGTCCCGGGATATCATTTGGCTTAGCTAATGTTTATTTGCCGTTGGCTCATTTGTTATATCACTTCGACTGGAAACTCCCTATTGGAATGGAGCCAAAAGACTTGAACTTGACTGAATTGGTTGGAGTAACTGCTGCCAGAAAAGATGACCTTATTTTGGTTGCCACTCCTTATGAACCACCTCGACAATGA
SEQ ID NO:12
CYP71D4,野生型氨基酸序列。
MQFLSLASIFLFLSFLFLLRKWKNSNSQSKKLPPGPWKLPLLGSMLHMAGGLPHHVLRDLAKKYGPLMHLQLGEVSAVVVTSPDMAKEVLKTHDIAFASRPKLLAPEIVCYNRSDIAFCPYGDYWRQMRKICVLELLSAKNVRSYGSIRRDEVDRLVNFIRSSSGEPVNFTERLFLFTSSMTCRSAFGKVFKEQDKFIQLIKEVIGLAGGFDVADIFPSLKFLHVLSGMKGKIMNAHHKVDAIVEDVINEHKKKFAIGKTNGALGGEDLIDVLIRLMNDGGLQFPITNDNIKAIIFDMFAAGTETSSSTLVWAMVQMMKNPSVIAKAQAEVREAFKDKETFDENDVEELKYLKLVIKETLRLHPPVPLLVPRECREETDINGYTIPVKTKVMVNVWALGRDPKYWDDAESFKPERFEQRSVDFVGNNFEYLPFGGGRRICPGISFGLANVYLPLAHLLYHFDWKLPIGMEPKDLNLTELVGVTAARKDDLILVATPYEPPRQ
SEQ ID NO:13
编码CYP71D4的N-末端变体的密码子优化的cDNA,包括位于5’端的NdeI位点和位于3’端的SalI-HindIII位点。
ATGGCTCTGTTGCTGGCAGTTTTCTGGTCCGCATTGATTATTTTGGTTCTGTCTCGCAAATGGAAAAATAGCAACAGCCAGAGCAAAAAGCTGCCACCAGGCCCGTGGAAACTGCCGTTGCTGGGTAGCATGCTGCACATGGCAGGCGGCCTGCCACACCATGTGCTGCGTGATCTGGCGAAGAAATACGGTCCGTTGATGCATCTGCAGCTGGGTGAAGTGAGCGCGGTCGTGGTGACGAGCCCGGATATGGCGAAAGAAGTGCTGAAGACCCATGATATCGCATTCGCAAGCCGTCCAAAGCTGCTGGCTCCGGAGATTGTCTGCTACAACCGTAGCGACATTGCGTTCTGTCCATACGGCGACTACTGGCGTCAAATGCGTAAGATTTGTGTGCTGGAACTGCTGAGCGCGAAAAATGTGCGCAGCTACGGCAGCATCCGTCGTGACGAGGTTGATCGTCTGGTGAATTTCATTCGTAGCAGCAGCGGCGAGCCGGTTAACTTTACGGAGCGTCTGTTTCTGTTTACCTCCAGCATGACCTGCCGTTCCGCGTTTGGCAAGGTGTTCAAGGAACAGGACAAGTTCATTCAACTGATTAAGGAAGTGATCGGCCTGGCAGGCGGTTTCGATGTGGCCGACATCTTTCCGAGCCTGAAGTTTCTGCACGTGCTGTCTGGTATGAAAGGCAAAATTATGAATGCACACCACAAGGTTGATGCGATCGTTGAAGATGTGATTAATGAACACAAGAAAAAGTTCGCGATTGGTAAGACGAACGGTGCGCTGGGTGGTGAGGATCTGATCGATGTTCTGATTCGCTTGATGAACGACGGTGGTCTGCAGTTTCCGATCACCAATGACAATATCAAAGCGATTATCTTCGACATGTTCGCCGCAGGCACGGAGACGTCTAGCAGCACCCTGGTTTGGGCGATGGTTCAAATGATGAAGAATCCAAGCGTTATTGCAAAAGCCCAAGCGGAAGTTCGTGAAGCGTTTAAAGATAAAGAGACTTTCGACGAAAACGATGTTGAGGAACTGAAGTATCTGAAGCTGGTTATCAAGGAGACGCTGCGTCTGCACCCGCCGGTTCCGCTGCTGGTGCCGCGTGAATGCCGTGAGGAGACGGATATTAATGGTTACACGATTCCGGTTAAAACCAAAGTCATGGTGAATGTGTGGGCGTTGGGCCGTGATCCGAAGTACTGGGACGATGCGGAGAGCTTTAAACCGGAACGCTTCGAACAGCGTAGCGTGGATTTTGTTGGCAATAACTTTGAATATCTGCCATTCGGTGGTGGTCGCCGCATTTGCCCAGGCATTTCTTTCGGTCTGGCAAACGTTTATCTGCCGCTGGCGCATTTGCTGTACCACTTCGACTGGAAATTGCCGATTGGCATGGAACCGAAAGACTTGAACCTGACGGAACTGGTCGGCGTGACGGCGGCTCGTAAGGATGACCTGATTCTGGTCGCAACCCCATACGAACCGCCGCGTCAATAA
SEQ ID NO:14
CYP71D4opt,CYP7D的N-末端变体的氨基酸序列。
MALLLAVFWSALIILVLSRKWKNSNSQSKKLPPGPWKLPLLGSMLHMAGGLPHHVLRDLAKKYGPLMHLQLGEVSAVVVTSPDMAKEVLKTHDIAFASRPKLLAPEIVCYNRSDIAFCPYGDYWRQMRKICVLELLSAKNVRSYGSIRRDEVDRLVNFIRSSSGEPVNFTERLFLFTSSMTCRSAFGKVFKEQDKFIQLIKEVIGLAGGFDVADIFPSLKFLHVLSGMKGKIMNAHHKVDAIVEDVINEHKKKFAIGKTNGALGGEDLIDVLIRLMNDGGLQFPITNDNIKAIIFDMFAAGTETSSSTLVWAMVQMMKNPSVIAKAQAEVREAFKDKETFDENDVEELKYLKLVIKETLRLHPPVPLLVPRECREETDINGYTIPVKTKVMVNVWALGRDPKYWDDAESFKPERFEQRSVDFVGNNFEYLPFGGGRRICPGISFGLANVYLPLAHLLYHFDWKLPIGMEPKDLNLTELVGVTAARKDDLILVATPYEPPRQ
SEQ ID NO:15
来自胡椒薄荷(Mentha piperita)(CPRm)氨基酸序列的P450还原酶
MEPSSQKLSPLEFVAAILKGDYSSGQVEGGPPPGLAAMLMENKDLVMVLTTSVAVLIGCVVVLAWRRAAGSGKYKQPELPKLVVPKAAEPEEAEDDKTKISVFFGTQTGTAEGFAKAFVEEAKARYQQARFKVIDLDDYAADDDEYEEKLKKENLAFFFLASYGDGEPTDNAARFYKWFTEGKDRGEWLNNLQYGVFGLGNRQYEHFNKIAIVVDDLIFEQGGKKLVPVGLGDDDQCIEDDFAAWRELVWPELDKLLRNEDDATVATPYSAAVLQYRVVFHDHIDGLISENGSPNGHANGNTVYDAQHPCRSNVAVKKELHTPASDRSCTHLEFNISGTGLMYETGDHVGVYCENLLETVEEAEKLLNLSPQTYFSVHTDNEDGTPLSGSSLPPPFPPCTLRTALTKYADLTSAPKKSVLVALAEYASDQGEADRLRFLASPSGKEEYAQYILASQRTLLEVMAEFPSAKPPLGVFFAGVAPRLQPRFYSISSSPKIAPFRIHVTCALVYDKSPTGRVHKGICSTWMKNAVPLEESNDCSWAPIFVRNSNFKLPTDPKVPIIMIGPGTGLAPFRGFLQERLALKESGAELGPAILFFGCRNRKMDFIYEDELNDFVKAGVVSELIVAFSREGPMKEYVQHKMSQRASDVWNIISDGGYVYVCGDAKGMARDVHRTLHTIAQEQGSMSSSEAEGMVKNLQTTGRYLRDVW
SEQ ID NO:16
来自胡椒薄荷(Mentha piperita)(CPRm)DNA序列的P450还原酶
ATGGAACCTAGCTCTCAGAAACTGTCTCCGTTGGAATTTGTTGCTGCTATCCTGAAGGGCGACTACAGCAGCGGTCAGGTTGAAGGTGGTCCACCGCCAGGTCTGGCAGCTATGTTGATGGAAAATAAGGATTTGGTGATGGTTCTGACGACGTCCGTGGCAGTCCTGATCGGCTGTGTCGTGGTCCTGGCATGGCGTCGTGCGGCAGGTAGCGGTAAGTACAAGCAACCTGAACTGCCTAAACTGGTGGTCCCGAAAGCAGCCGAACCGGAGGAGGCAGAGGATGATAAAACCAAGATCAGCGTGTTTTTCGGCACCCAAACCGGTACGGCAGAAGGTTTCGCGAAGGCTTTTGTTGAAGAGGCCAAGGCGCGTTATCAGCAGGCCCGTTTCAAAGTTATCGACCTGGACGACTATGCGGCAGACGATGACGAGTACGAAGAGAAACTGAAGAAGGAAAACTTGGCATTCTTCTTCTTGGCGTCCTACGGTGACGGCGAGCCGACGGACAACGCGGCACGCTTTTACAAATGGTTTACGGAGGGTAAGGACCGTGGTGAATGGCTGAACAATCTGCAGTACGGCGTTTTTGGTCTGGGTAACCGTCAATATGAGCATTTCAATAAGATCGCCATTGTCGTCGATGATCTGATCTTCGAGCAAGGTGGCAAGAAGCTGGTTCCGGTGGGTCTGGGTGACGATGACCAGTGCATTGAGGATGATTTTGCGGCGTGGCGTGAACTGGTCTGGCCGGAACTGGATAAACTGCTGCGTAACGAAGACGACGCTACCGTGGCAACCCCGTACAGCGCCGCTGTGCTGCAATACCGCGTGGTTTTCCACGATCACATTGACGGCCTGATTAGCGAAAACGGTAGCCCGAACGGTCATGCTAATGGCAATACCGTGTACGATGCGCAACACCCGTGCCGTAGCAACGTCGCGGTCAAGAAGGAATTGCATACTCCGGCGAGCGATCGCAGCTGCACCCACCTGGAATTTAACATTAGCGGTACCGGCCTGATGTACGAGACGGGTGACCACGTCGGTGTGTATTGCGAGAACCTGTTGGAAACCGTGGAGGAGGCCGAGAAGTTGTTGAACCTGAGCCCGCAGACGTACTTCTCCGTTCACACCGACAACGAGGACGGTACGCCGTTGAGCGGCAGCAGCCTGCCGCCACCGTTTCCGCCGTGCACCTTGCGCACGGCATTGACCAAATACGCAGACTTGACTTCTGCACCGAAAAAGTCGGTGCTGGTGGCGCTGGCCGAGTACGCATCTGACCAGGGTGAAGCGGATCGTTTGCGTTTCTTGGCGAGCCCGAGCGGCAAAGAGGAATATGCACAGTACATCTTGGCAAGCCAGCGCACGCTGCTGGAGGTCATGGCGGAGTTCCCGTCGGCGAAACCGCCGCTGGGTGTCTTTTTCGCGGGTGTCGCTCCGCGCCTGCAGCCGCGTTTCTATTCCATTAGCTCTAGCCCGAAGATCGCACCGTTCCGTATTCACGTGACCTGCGCCCTGGTTTATGACAAATCCCCTACCGGTCGCGTTCATAAGGGCATCTGTAGCACGTGGATGAAAAATGCGGTCCCGCTGGAAGAAAGCAACGATTGTTCCTGGGCTCCGATCTTCGTCCGCAACAGCAACTTCAAGCTGCCGACCGACCCGAAGGTTCCGATTATCATGATTGGTCCGGGTACCGGTCTGGCCCCTTTTCGTGGCTTTTTGCAAGAGCGCTTGGCGTTGAAAGAGAGCGGTGCTGAATTGGGTCCGGCGATCTTGTTCTTTGGTTGCCGTAACCGTAAAATGGACTTTATTTACGAGGATGAACTGAATGATTTCGTCAAAGCGGGCGTTGTCAGCGAGCTGATCGTCGCTTTTAGCCGCGAAGGCCCGATGAAAGAATACGTGCAACACAAAATGAGCCAACGTGCCTCCGATGTGTGGAACATCATTAGCGACGGTGGTTATGTTTATGTTTGCGGTGACGCGAAGGGTATGGCTCGTGATGTTCACCGTACCCTGCATACCATCGCACAGGAGCAAGGTAGCATGTCCAGCTCGGAGGCCGAAGGTATGGTCAAAAACCTGCAAACCACCGGTCGTTACCTGCGTGATGTGTGGTAA
SEQ ID NO:17
肽片段
MALLLAVFLGLSCLLLLSLW
SEQ ID NO:18
肽片段
MALLLAVFWSALIILVLS
SEQ ID NO:19
DNA多接头
GTCGACAATTAACCATGGTTAATTAAGCTTATATATGGTACCATATATGAATTCATTAATCTCGAG
SEQ ID NO:20
含有间隔序列、SalI识别序列和核糖体结合位点(RBS)的26bp延伸序列
GTCGACAATTAGGTAAAAAATAAACC
SEQ ID NO:21
包含HindIII识别位点和RBS序列的5’非编码序列
AAGCTTAAGGAGGTAAAAA
SEQ ID NO:22
包含KpnI、EcoRI和XhoI识别位点的3’非编码序列
GGTACCATATATGAATTCATTAATCTCGAG。
SEQUENCE LISTING
<110> 弗门尼舍有限公司(Firmenich SA)
Schalk, Michel
Rocci, Letizia
<120> 香根草(Vetiver)
<130> 9800/WO
<150> EP17159264.5
<151> 2017-03-03
<150> GB1612609.6
<151> 2016-07-20
<160> 22
<170> PatentIn version 3.5
<210> 1
<211> 567
<212> PRT
<213> 香根草(Vetiveria zizanoides)
<400> 1
Met Ala Ala Ser Ile Thr Val Ala Ala Ala His Gly Pro Pro Ala Ala
1 5 10 15
Ile Pro Glu Thr Lys Arg Ser Thr Val Asp Asp Val Pro Phe Gln Ser
20 25 30
Ser Val Trp Gly Asp Tyr Phe Val Asn Tyr Thr Pro Pro Ala Ser Gln
35 40 45
Arg Ser Glu Glu Trp Met Arg Glu Arg Val Asp Glu Leu Arg Gly Glu
50 55 60
Val Arg Arg Lys Phe Lys Thr Thr Met Ser Met Ala Glu Thr Met Val
65 70 75 80
Leu Val Asp Thr Leu Glu Arg Leu Ala Ile Asp Gly His Phe Arg Lys
85 90 95
Asp Ile Asp Leu Ala Leu Ser Gln Ile His Met Glu Gly Lys Pro Ala
100 105 110
Gly Ile Ser Ser Ser Asn Lys Leu Tyr Ile Val Ala Leu Gly Phe Arg
115 120 125
Leu Leu Arg Gln His Gly Phe Trp Val Ser Ala Asp Val Phe Asp Lys
130 135 140
Phe Arg Asp Ser Thr Gly Lys Leu Ser Lys Gly Leu Ser Gly Asp Val
145 150 155 160
Lys Gly Leu Leu Ser Leu Tyr Asn Ala Ala His Met Ala Val Pro Gly
165 170 175
Glu Lys Ser Leu Asp Glu Ala Ile Asp Phe Thr Arg Arg Cys Leu Glu
180 185 190
Ser Ala Lys Asp Arg Leu Val Ala Pro Met Ser Val Gln Val Ser Arg
195 200 205
Ala Leu Ser Ile Pro Leu Pro Arg Tyr Leu Pro Arg Leu Glu Ala Met
210 215 220
His Tyr Ile Ser Glu Tyr Gly Gln Glu Glu Asp His Asp Ala Lys Ile
225 230 235 240
Leu Glu Leu Ala Arg Leu Asp Tyr Ala Leu Val Gln Ser Leu Tyr Leu
245 250 255
Lys Glu Leu Arg Glu Leu Thr Leu Trp Trp Lys Glu Leu Tyr His Ser
260 265 270
Val Asn Leu Pro Asn Thr Arg Asp Arg Ile Val Glu Met Tyr Phe Phe
275 280 285
Ala Phe Gly Met Leu Gln Thr Glu Glu Tyr Ser Arg Ala Arg Leu Ile
290 295 300
Asp Ser Lys Ile Ile Ala Leu Val Ser Leu Met Asp Asp Ile Tyr Asp
305 310 315 320
Glu His Ala Ser Phe Glu Glu Ala Gln Lys Phe Asn Glu Ala Ile Gln
325 330 335
Arg Trp Asn Glu Ser Ala Val Ser Asp Leu Pro Glu Tyr Met Arg Met
340 345 350
Leu Tyr Thr Gln Ile Leu Ser Thr Phe Ala Lys Phe Glu Glu Val Leu
355 360 365
Gly Pro Asn Glu Lys Tyr Arg Val Ser Tyr Ala Lys Glu Ala Tyr Lys
370 375 380
Leu Gln Ser Met Tyr Tyr Phe Leu Glu Asn Lys Trp Cys His Glu Asn
385 390 395 400
His Met Pro Ser Phe Gly Glu His Ile His Leu Ser Ser Met Ser Ala
405 410 415
Gly Leu Gln Val Leu Ile Val Gly Ala Trp Ile Gly Ala His His Ala
420 425 430
Ile Ala Lys Glu Ser Leu Glu Trp Ala Ile Thr Tyr Pro Glu Val Phe
435 440 445
Arg Ala Ala Gly Asp Val Gly Arg Leu Leu Asn Asp Ile Ala Ser Phe
450 455 460
Lys Lys Arg Lys Asn Ser Lys Asp Ala Pro Asn Ala Leu Glu Cys Tyr
465 470 475 480
Val Arg Glu His Gly Val Thr Gly Glu Glu Ala Ala Ala Ala Cys Ala
485 490 495
Ala Ile Val Glu Leu Gly Trp Arg Lys Ile Asn Arg Ala Arg Met Glu
500 505 510
Ile His Pro Met Leu Val Pro Ala Ala Gln Met Asp Ala Lys Ile Asn
515 520 525
Leu Thr Arg Val Cys Glu Ile Leu Tyr Tyr Arg Gly Met Asp Gly Tyr
530 535 540
Thr Phe Gly Ser Asp Leu Arg Asp Val Ile Thr Ser Leu Phe Ile Lys
545 550 555 560
Pro Ala Ala Gly Gly Pro Ala
565
<210> 2
<211> 1835
<212> DNA
<213> 香根草(Vetiveria zizanoides)
<400> 2
actggagttc agacgtgtgc tcttccgatc tatcggagtg aagttgagca gctaacttca 60
cgactcgttt gcaggctagc tcgcaacaga atagagagtg ttactgctgg tatatatata 120
tatatatata tggctgcgag cattactgtc gccgccgcac atgggcctcc tgctgcaatc 180
ccagagacca aacgcagcac tgtagacgac gttcctttcc aatcctctgt gtggggcgac 240
tactttgtaa actacacacc tcctgcatca cagaggtcgg aggaatggat gagggagagg 300
gttgatgaac tcaggggtga agtgcgccgg aagttcaaaa cgacgatgag catggccgag 360
acgatggtgc tggtggacac actggagcgc ctcgccatcg acggccattt ccgcaaggat 420
attgacttgg cgttgagcca aatccacatg gaggggaagc cggccggtat tagcagctcc 480
aacaagcttt acatcgtcgc cctgggattc cgcttgctta ggcaacatgg cttctgggta 540
tccgcagacg tgtttgacaa gtttagggat agcacgggca agcttagcaa gggtctgagc 600
ggcgacgtga agggtctgct gagcctatac aacgcggctc acatggcggt tcccggcgag 660
aaaagcctgg acgaagccat cgacttcaca aggcgctgcc tcgagtctgc caaggacagg 720
ctcgtggcgc cgatgtcggt gcaggtgtcg cgcgccctca gcattcctct cccccgctac 780
ctgccgcggc tagaggccat gcactacatc tcagagtatg ggcaggagga ggaccatgac 840
gccaagatcc tggagcttgc gaggctggac tatgcccttg tccagtctct ctatctcaag 900
gagctcaggg agctcacctt gtggtggaag gagctgtatc acagcgtgaa tctgcccaac 960
acacgggacc gcatcgtgga gatgtacttc tttgcatttg gtatgctgca gacggaggag 1020
tactctcggg cgcgcctgat tgatagcaag ataattgcac tggtcagcct gatggatgac 1080
atttacgacg aacacgctag ctttgaggaa gcccaaaaat tcaatgaagc catacagaga 1140
tggaatgaaa gtgcggtctc agacctacca gaatacatgc gcatgctata cacccaaata 1200
ctaagcacct tcgccaaatt tgaggaagtt ttggggccca acgaaaagta ccgcgtgtct 1260
tacgccaaag aggcgtacaa attgcagtcg atgtattact ttctggagaa caaatggtgt 1320
cacgagaacc acatgccaag cttcggagag cacatacatc tttcttccat gtcggcaggc 1380
ttgcaggtgt tgatcgttgg ggcatggata ggcgcccacc acgccattgc caaggagtca 1440
ctagagtggg caatcaccta ccctgaagtc ttccgggcag caggagatgt tggccgtctc 1500
ctcaacgata tcgcttcatt taagaagagg aaaaacagca aggacgcgcc caacgcgctg 1560
gagtgctacg tcagagaaca tggcgtcacg ggggaggaag ctgcggccgc gtgtgcagcc 1620
attgtagagc tcgggtggag gaagatcaac agggcccgta tggagataca tcctatgctg 1680
gtacccgcgg cacaaatgga tgcgaaaatc aacctgacca gggtgtgcga gattttatac 1740
taccgtggta tggatggcta cacctttgga agcgacctcc gggatgtcat cacttctctc 1800
ttcatcaagc cggcggccgg gggccctgca taatt 1835
<210> 3
<211> 1704
<212> DNA
<213> 香根草(Vetiveria zizanoides)
<400> 3
atggctgcga gcattactgt cgccgccgca catgggcctc ctgctgcaat cccagagacc 60
aaacgcagca ctgtagacga cgttcctttc caatcctctg tgtggggcga ctactttgta 120
aactacacac ctcctgcatc acagaggtcg gaggaatgga tgagggagag ggttgatgaa 180
ctcaggggtg aagtgcgccg gaagttcaaa acgacgatga gcatggccga gacgatggtg 240
ctggtggaca cactggagcg cctcgccatc gacggccatt tccgcaagga tattgacttg 300
gcgttgagcc aaatccacat ggaggggaag ccggccggta ttagcagctc caacaagctt 360
tacatcgtcg ccctgggatt ccgcttgctt aggcaacatg gcttctgggt atccgcagac 420
gtgtttgaca agtttaggga tagcacgggc aagcttagca agggtctgag cggcgacgtg 480
aagggtctgc tgagcctata caacgcggct cacatggcgg ttcccggcga gaaaagcctg 540
gacgaagcca tcgacttcac aaggcgctgc ctcgagtctg ccaaggacag gctcgtggcg 600
ccgatgtcgg tgcaggtgtc gcgcgccctc agcattcctc tcccccgcta cctgccgcgg 660
ctagaggcca tgcactacat ctcagagtat gggcaggagg aggaccatga cgccaagatc 720
ctggagcttg cgaggctgga ctatgccctt gtccagtctc tctatctcaa ggagctcagg 780
gagctcacct tgtggtggaa ggagctgtat cacagcgtga atctgcccaa cacacgggac 840
cgcatcgtgg agatgtactt ctttgcattt ggtatgctgc agacggagga gtactctcgg 900
gcgcgcctga ttgatagcaa gataattgca ctggtcagcc tgatggatga catttacgac 960
gaacacgcta gctttgagga agcccaaaaa ttcaatgaag ccatacagag atggaatgaa 1020
agtgcggtct cagacctacc agaatacatg cgcatgctat acacccaaat actaagcacc 1080
ttcgccaaat ttgaggaagt tttggggccc aacgaaaagt accgcgtgtc ttacgccaaa 1140
gaggcgtaca aattgcagtc gatgtattac tttctggaga acaaatggtg tcacgagaac 1200
cacatgccaa gcttcggaga gcacatacat ctttcttcca tgtcggcagg cttgcaggtg 1260
ttgatcgttg gggcatggat aggcgcccac cacgccattg ccaaggagtc actagagtgg 1320
gcaatcacct accctgaagt cttccgggca gcaggagatg ttggccgtct cctcaacgat 1380
atcgcttcat ttaagaagag gaaaaacagc aaggacgcgc ccaacgcgct ggagtgctac 1440
gtcagagaac atggcgtcac gggggaggaa gctgcggccg cgtgtgcagc cattgtagag 1500
ctcgggtgga ggaagatcaa cagggcccgt atggagatac atcctatgct ggtacccgcg 1560
gcacaaatgg atgcgaaaat caacctgacc agggtgtgcg agattttata ctaccgtggt 1620
atggatggct acacctttgg aagcgacctc cgggatgtca tcacttctct cttcatcaag 1680
ccggcggccg ggggccctgc ataa 1704
<210> 4
<211> 1704
<212> DNA
<213> 人工序列(Artificial Sequence)
<223> VzTps1718密码子优化的cDNA
<400> 4
atggcagcaa gcatcacggt cgccgcagca cacggtccgc cagcagcaat cccggaaacc 60
aaacgcagca ccgtggatga cgttccattt caatcctcgg tgtggggcga ctacttcgtc 120
aactatacgc cgccggcgag ccagcgttcc gaagagtgga tgcgtgaacg cgttgacgaa 180
ctgcgtggcg aagtgcgtcg taagttcaag actaccatga gcatggctga aaccatggtt 240
ctggttgata ccctggagcg ccttgcaatc gatggtcatt ttcgtaaaga tattgacctg 300
gcactgagcc agatccacat ggagggtaaa ccggcgggta ttagctcgtc taacaagctg 360
tatatcgttg cgctgggctt tcgtttgttg cgtcagcacg gtttctgggt gagcgccgat 420
gttttcgata aatttcgtga tagcacgggc aaactgtcca agggcctgag cggcgacgtc 480
aagggcctgc tgtcactgta taatgccgca cacatggctg tcccgggtga gaaatctctg 540
gatgaagcga ttgactttac gcgtcgctgc ctggaaagcg ccaaagatcg tttggtggcc 600
ccgatgagcg tccaggttag ccgcgccctg agcatcccgc tgccgcgtta tctgccgcgc 660
ctggaagcga tgcattacat cagcgagtat ggtcaagagg aagatcacga cgctaagatc 720
ctggaattgg cgcgcctgga ctacgcgctg gtccaaagcc tgtacctgaa agaactgcgc 780
gagctgaccc tgtggtggaa agaactgtac cactccgtta atctgccgaa cacccgtgac 840
cgcatcgtcg agatgtattt ctttgcgttt ggtatgttgc agaccgaaga gtactctcgt 900
gctcgcctga tcgatagcaa gattatcgcc ctggtgagcc tgatggatga catttatgat 960
gagcatgcca gcttcgagga agctcaaaag tttaacgaag caatccaacg ttggaatgaa 1020
agcgcggtta gcgacttgcc ggagtatatg cgcatgctgt acacccaaat cctgagcacc 1080
ttcgcgaagt ttgaagaggt tctgggtccg aacgaaaaat atcgcgtgag ctatgcgaaa 1140
gaggcgtaca agctgcaatc catgtactat ttcctggaga acaaatggtg tcatgagaat 1200
cacatgccga gcttcggtga gcacattcac ctgagctcca tgtccgcggg tttgcaagtg 1260
ttgattgtgg gtgcttggat cggcgcacat catgccattg caaaagagag cctggagtgg 1320
gcgattacct accctgaagt ttttcgtgcc gcgggcgatg tgggtcgtct gttgaatgac 1380
attgcaagct tcaaaaagcg taagaactct aaagacgccc cgaacgcgct ggagtgttat 1440
gtccgtgaac acggcgtgac tggcgaagaa gcggcagctg cctgcgcagc tattgttgag 1500
ctgggttggc gtaagatcaa ccgtgcgcgc atggaaatcc atccgatgct ggtcccggcg 1560
gcgcagatgg acgcgaaaat caatttgacc cgtgtgtgcg agatcctgta ctaccgtggc 1620
atggatggtt acaccttcgg tagcgattta cgcgatgtga ttacgagcct cttcattaag 1680
cctgcggctg gcggcccggc gtaa 1704
<210> 5
<211> 1825
<212> DNA
<213> 香根草(Vetiveria zizanoides)
<400> 5
gatcgtttca cgtgactgga gttcagacgt gtgctcttcc gatctcaaaa aatggacttt 60
ctcagaatcc cgtttcttgt agccttcgtc ttcctcgccg tccttctcag gctcatccgg 120
agctacatca catcctcagc tcttcgcctg ccaccggggc catggcagct gccgctcatc 180
ggcagcctgc accacctcct gctgtcgcgc ttcagcgacc tccctcaccg ggctttgcgc 240
gagatgtccg gcacctacgg gcccctcatg ctgctccgct tcggctccgt gcccacgctg 300
gtggtctcct ccgccgaggc tgcccgggag gtgatgagga cccacgacct cgccttctgc 360
gaccgccacc tcggcgtcac tctcgacatc gtcacctgcg gcggcaagga catcatctgc 420
tccccctaca acgcccactg gcgcgagctc cgtaagctgt gcatggtcga gatcttgagc 480
cagcggcgcg tgctctcgtt ccggagcatc cgggaagagg aggtggcgag cctcgtccgc 540
tccatctccg acgagtgcgg cggtggccag cagcccgtca acctcactga agggataagc 600
cgcatgataa acgacgtcgc cgcgcgcacg gtcgtcggcg accggtgcaa gtaccaggat 660
gaatacatgc atgagctgga cgaagtggtg cggctggccg gcgggttcaa cctggcggac 720
ctgtacccgt cctcgcggct ggtacggcgg ttcagcgccg ccgcgaggga cgcgaggagg 780
tgccagagga acatgtaccg tatcatccag agcatcatcc aggagcgtga agccatgccg 840
acgccagagc gagacgagga ggacctcctc ggcgtcctcc tcaggctgca gagagaaggt 900
ggcctgcagt ttgctctcac caatgagata gtcagcaccg tcatttacga tattttttct 960
gctggtagtg aaacatcatc aactgttcta gtatgggcaa tgtcggagct tgttaagaat 1020
ccacaagtca tgcgtaaggc ccagtcagag gtgagggata ccttcaaagg aaacaacaag 1080
ataactgaaa gtgatttgat caagttaaga tatctacaac tggtgatcaa ggagacttta 1140
cggttgcatg ctccggtacc actcttgctc cctcgagaat gccgtgagtc atgtcagatt 1200
atgggttacg atgtgctaaa gggaaccaag gtatttgtga atgcttgggc aatagcaagg 1260
gacacgggat tatggtgtga tggagaggaa tttaggccag aaaggtttga aagtagcaat 1320
attgatttca ggggtaatga ctttgagttc acaccgtttg gggcaggcag gagagtatgc 1380
cctggcatca cacttggact ggccaaccta gaactagcgc ttgctagcct tctttatcat 1440
tttgattggg atctgcccaa tggtgccagg ttggaagatc ttgatatggc agaggccttt 1500
ggtataacgt taaaaaggaa gtccatgctc tggctcaagg ccaaacctta caataatttt 1560
ataccaaatt aatcaggtga tttgtgatgt gaactatccc ggttgctact tagtttatta 1620
tacccagaaa gagtgtgatg gtaattgtac tatcaatctt tactgcagaa cagtaaatat 1680
atccagagtt ggttctatgc ttctgttata atgtttcatc actctgtatt aagtgtgtag 1740
ttatctgttt gtttactttt tttgtaatga ttaaacgatt atctaatgag agtacaagaa 1800
tcaaatgaga ctggtctaaa aaaaa 1825
<210> 6
<211> 1521
<212> DNA
<213> 香根草(Vetiveria zizanoides)
<400> 6
atggactttc tcagaatccc gtttcttgta gccttcgtct tcctcgccgt ccttctcagg 60
ctcatccgga gctacatcac atcctcagct cttcgcctgc caccggggcc atggcagctg 120
ccgctcatcg gcagcctgca ccacctcctg ctgtcgcgct tcagcgacct ccctcaccgg 180
gctttgcgcg agatgtccgg cacctacggg cccctcatgc tgctccgctt cggctccgtg 240
cccacgctgg tggtctcctc cgccgaggct gcccgggagg tgatgaggac ccacgacctc 300
gccttctgcg accgccacct cggcgtcact ctcgacatcg tcacctgcgg cggcaaggac 360
atcatctgct ccccctacaa cgcccactgg cgcgagctcc gtaagctgtg catggtcgag 420
atcttgagcc agcggcgcgt gctctcgttc cggagcatcc gggaagagga ggtggcgagc 480
ctcgtccgct ccatctccga cgagtgcggc ggtggccagc agcccgtcaa cctcactgaa 540
gggataagcc gcatgataaa cgacgtcgcc gcgcgcacgg tcgtcggcga ccggtgcaag 600
taccaggatg aatacatgca tgagctggac gaagtggtgc ggctggccgg cgggttcaac 660
ctggcggacc tgtacccgtc ctcgcggctg gtacggcggt tcagcgccgc cgcgagggac 720
gcgaggaggt gccagaggaa catgtaccgt atcatccaga gcatcatcca ggagcgtgaa 780
gccatgccga cgccagagcg agacgaggag gacctcctcg gcgtcctcct caggctgcag 840
agagaaggtg gcctgcagtt tgctctcacc aatgagatag tcagcaccgt catttacgat 900
attttttctg ctggtagtga aacatcatca actgttctag tatgggcaat gtcggagctt 960
gttaagaatc cacaagtcat gcgtaaggcc cagtcagagg tgagggatac cttcaaagga 1020
aacaacaaga taactgaaag tgatttgatc aagttaagat atctacaact ggtgatcaag 1080
gagactttac ggttgcatgc tccggtacca ctcttgctcc ctcgagaatg ccgtgagtca 1140
tgtcagatta tgggttacga tgtgctaaag ggaaccaagg tatttgtgaa tgcttgggca 1200
atagcaaggg acacgggatt atggtgtgat ggagaggaat ttaggccaga aaggtttgaa 1260
agtagcaata ttgatttcag gggtaatgac tttgagttca caccgtttgg ggcaggcagg 1320
agagtatgcc ctggcatcac acttggactg gccaacctag aactagcgct tgctagcctt 1380
ctttatcatt ttgattggga tctgcccaat ggtgccaggt tggaagatct tgatatggca 1440
gaggcctttg gtataacgtt aaaaaggaag tccatgctct ggctcaaggc caaaccttac 1500
aataatttta taccaaatta a 1521
<210> 7
<211> 506
<212> PRT
<213> 香根草(Vetiveria zizanoides)
<400> 7
Met Asp Phe Leu Arg Ile Pro Phe Leu Val Ala Phe Val Phe Leu Ala
1 5 10 15
Val Leu Leu Arg Leu Ile Arg Ser Tyr Ile Thr Ser Ser Ala Leu Arg
20 25 30
Leu Pro Pro Gly Pro Trp Gln Leu Pro Leu Ile Gly Ser Leu His His
35 40 45
Leu Leu Leu Ser Arg Phe Ser Asp Leu Pro His Arg Ala Leu Arg Glu
50 55 60
Met Ser Gly Thr Tyr Gly Pro Leu Met Leu Leu Arg Phe Gly Ser Val
65 70 75 80
Pro Thr Leu Val Val Ser Ser Ala Glu Ala Ala Arg Glu Val Met Arg
85 90 95
Thr His Asp Leu Ala Phe Cys Asp Arg His Leu Gly Val Thr Leu Asp
100 105 110
Ile Val Thr Cys Gly Gly Lys Asp Ile Ile Cys Ser Pro Tyr Asn Ala
115 120 125
His Trp Arg Glu Leu Arg Lys Leu Cys Met Val Glu Ile Leu Ser Gln
130 135 140
Arg Arg Val Leu Ser Phe Arg Ser Ile Arg Glu Glu Glu Val Ala Ser
145 150 155 160
Leu Val Arg Ser Ile Ser Asp Glu Cys Gly Gly Gly Gln Gln Pro Val
165 170 175
Asn Leu Thr Glu Gly Ile Ser Arg Met Ile Asn Asp Val Ala Ala Arg
180 185 190
Thr Val Val Gly Asp Arg Cys Lys Tyr Gln Asp Glu Tyr Met His Glu
195 200 205
Leu Asp Glu Val Val Arg Leu Ala Gly Gly Phe Asn Leu Ala Asp Leu
210 215 220
Tyr Pro Ser Ser Arg Leu Val Arg Arg Phe Ser Ala Ala Ala Arg Asp
225 230 235 240
Ala Arg Arg Cys Gln Arg Asn Met Tyr Arg Ile Ile Gln Ser Ile Ile
245 250 255
Gln Glu Arg Glu Ala Met Pro Thr Pro Glu Arg Asp Glu Glu Asp Leu
260 265 270
Leu Gly Val Leu Leu Arg Leu Gln Arg Glu Gly Gly Leu Gln Phe Ala
275 280 285
Leu Thr Asn Glu Ile Val Ser Thr Val Ile Tyr Asp Ile Phe Ser Ala
290 295 300
Gly Ser Glu Thr Ser Ser Thr Val Leu Val Trp Ala Met Ser Glu Leu
305 310 315 320
Val Lys Asn Pro Gln Val Met Arg Lys Ala Gln Ser Glu Val Arg Asp
325 330 335
Thr Phe Lys Gly Asn Asn Lys Ile Thr Glu Ser Asp Leu Ile Lys Leu
340 345 350
Arg Tyr Leu Gln Leu Val Ile Lys Glu Thr Leu Arg Leu His Ala Pro
355 360 365
Val Pro Leu Leu Leu Pro Arg Glu Cys Arg Glu Ser Cys Gln Ile Met
370 375 380
Gly Tyr Asp Val Leu Lys Gly Thr Lys Val Phe Val Asn Ala Trp Ala
385 390 395 400
Ile Ala Arg Asp Thr Gly Leu Trp Cys Asp Gly Glu Glu Phe Arg Pro
405 410 415
Glu Arg Phe Glu Ser Ser Asn Ile Asp Phe Arg Gly Asn Asp Phe Glu
420 425 430
Phe Thr Pro Phe Gly Ala Gly Arg Arg Val Cys Pro Gly Ile Thr Leu
435 440 445
Gly Leu Ala Asn Leu Glu Leu Ala Leu Ala Ser Leu Leu Tyr His Phe
450 455 460
Asp Trp Asp Leu Pro Asn Gly Ala Arg Leu Glu Asp Leu Asp Met Ala
465 470 475 480
Glu Ala Phe Gly Ile Thr Leu Lys Arg Lys Ser Met Leu Trp Leu Lys
485 490 495
Ala Lys Pro Tyr Asn Asn Phe Ile Pro Asn
500 505
<210> 8
<211> 1524
<212> DNA
<213> 人工序列(Artificial Sequence)
<223> VzCP8201-228093, 编码VzCP8201-12的优化的DNA序列,包括位于5’端的NdeI位点和位于3’端的多接头(VzCP8201-228093, optimized DNA sequence encoding forVzCP8201-12,
including NdeI site at 5'end and polylinker at 3'end)
<400> 8
atggcactgt tgttggctgt ttttttgggt ttgagctgtt tgttgctgtt gagcttgtgg 60
cgtctgatcc gcagctacat tacttccagc gcgctgcgcc tgccgccggg tccgtggcag 120
ctgcctctga ttggcagcct gcaccacttg ctgctgagcc gcttcagcga cttgccgcat 180
cgcgcgctga gagagatgag cggcacctac ggtccgctga tgctgctgcg tttcggtagc 240
gtcccgaccc tggttgtctc tagcgcggaa gcggctcgtg aagtcatgcg tacccacgat 300
ctggcgtttt gcgatcgtca cctgggtgtg acgctggaca tcgtaacctg tggtggcaaa 360
gacatcatct gcagcccata caacgctcat tggcgtgagc tgcgcaagct gtgcatggtt 420
gaaatcctga gccagcgccg tgtgctgagc ttccgttcga ttcgtgaaga agaggtcgcg 480
agcctggtgc gttccattag cgatgagtgt ggtggcggcc agcaaccagt taacctgacc 540
gaaggcatct ctcgcatgat taatgacgtc gccgcacgta ccgtggtcgg tgaccgctgc 600
aagtaccaag acgagtacat gcatgaactg gacgaagttg ttcgtctggc gggtggcttc 660
aacctggccg atctgtatcc gagctcacgt ctggttcgtc gtttttccgc agctgcgcgt 720
gacgcgcgtc gctgtcagcg taacatgtac cgcattattc aatctatcat ccaagagcgt 780
gaggcaatgc cgacgcctga gcgcgacgaa gaagatcttc tgggtgtcct gctgcgtctg 840
cagcgcgagg gtggtctgca gtttgcgctg acgaacgaaa ttgtttcgac cgtgatttac 900
gatatcttca gcgccggtag cgaaacctcc agcacggtgt tggtgtgggc aatgtctgaa 960
ctggtcaaaa atccgcaagt gatgcgcaaa gcgcaaagcg aagttcgtga cactttcaaa 1020
ggtaacaata agattaccga gagcgacctg attaagctgc gctatctgca actggttatc 1080
aaagaaaccc tgcgcctgca cgcaccggtg ccgctgctgc tgccgcgtga gtgccgtgaa 1140
tcctgtcaga tcatgggcta tgacgttctg aagggtacga aagtgttcgt taatgcctgg 1200
gcgattgcac gtgatacggg tctgtggtgc gacggcgaag agttccgtcc ggagcgtttc 1260
gagtccagca atatcgattt tcgtggtaat gattttgagt tcacgccgtt cggtgcgggc 1320
cgtcgtgtct gcccaggcat caccctgggc ctggccaact tagaactggc cctcgcgagc 1380
ttgttatatc actttgactg ggatctgccg aacggcgcgc gcctggaaga tctggacatg 1440
gccgaggcat ttggtatcac gctgaagcgc aagagcatgc tgtggctgaa agcaaaaccg 1500
tacaataatt ttattccgaa ctaa 1524
<210> 9
<211> 1524
<212> DNA
<213> 人工序列(Artificial Sequence)
<223> VzCP8201-228092, 编码VzCP8201-12-bov的优化的DNA序列,包括位于5’端的NdeI位点和位于3’端的多接头(VzCP8201-228092, optimized DNA sequence encodingfor
VzCP8201-12-bov, including NdeI site at 5'end and polylinker at
3'end)
<400> 9
atggcactgt tgttggctgt ttttttgggt ttgagctgtt tgttgctgtt gagcttgtgg 60
cgtctgatcc gcagctacat tacttccagc gcgctgcgcc tgccgccggg tccgtggcag 120
ctgcctctga ttggcagcct gcaccacttg ctgctgagcc gcttcagcga cttgccgcat 180
cgcgcgctga gagagatgag cggcacctac ggtccgctga tgctgctgcg tttcggtagc 240
gtcccgaccc tggttgtctc tagcgcggaa gcggctcgtg aagtcatgcg tacccacgat 300
ctggcgtttt gcgatcgtca cctgggtgtg acgctggaca tcgtaacctg tggtggcaaa 360
gacatcatct gcagcccata caacgctcat tggcgtgagc tgcgcaagct gtgcatggtt 420
gaaatcctga gccagcgccg tgtgctgagc ttccgttcga ttcgtgaaga agaggtcgcg 480
agcctggtgc gttccattag cgatgagtgt ggtggcggcc agcaaccagt taacctgacc 540
gaaggcatct ctcgcatgat taatgacgtc gccgcacgta ccgtggtcgg tgaccgctgc 600
aagtaccaag acgagtacat gcatgaactg gacgaagttg ttcgtctggc gggtggcttc 660
aacctggccg atctgtatcc gagctcacgt ctggttcgtc gtttttccgc agctgcgcgt 720
gacgcgcgtc gctgtcagcg taacatgtac cgcattattc aatctatcat ccaagagcgt 780
gaggcaatgc cgacgcctga gcgcgacgaa gaagatcttc tgggtgtcct gctgcgtctg 840
cagcgcgagg gtggtctgca gtttgcgctg acgaacgaaa ttgtttcgac cgtgatttac 900
gatatcttca gcgccggtag cgaaacctcc agcacggtgt tggtgtgggc aatgtctgaa 960
ctggtcaaaa atccgcaagt gatgcgcaaa gcgcaaagcg aagttcgtga cactttcaaa 1020
ggtaacaata agattaccga gagcgacctg attaagctgc gctatctgca actggttatc 1080
aaagaaaccc tgcgcctgca cgcaccggtg ccgctgctgc tgccgcgtga gtgccgtgaa 1140
tcctgtcaga tcatgggcta tgacgttctg aagggtacga aagtgttcgt taatgcctgg 1200
gcgattgcac gtgatacggg tctgtggtgc gacggcgaag agttccgtcc ggagcgtttc 1260
gagtccagca atatcgattt tcgtggtaat gattttgagt tcacgccgtt cggtgcgggc 1320
cgtcgtgtct gcccaggcat caccctgggc ctggccaact tagaactggc cctcgcgagc 1380
ttgttatatc actttgactg ggatctgccg aacggcgcgc gcctggaaga tctggacatg 1440
gccgaggcat ttggtatcac gctgaagcgc aagagcatgc tgtggctgaa agcaaaaccg 1500
tacaataatt ttattccgaa ctaa 1524
<210> 10
<211> 507
<212> PRT
<213> 人工序列(Artificial Sequence)
<223> VzCP8201-12-bov, VzCP8201-12的N-末端变体的氨基酸序列(VzCP8201-12-bov, amino acid sequence of N-terminal variant of
VzCP8201-12)
<400> 10
Met Ala Leu Leu Leu Ala Val Phe Leu Gly Leu Ser Cys Leu Leu Leu
1 5 10 15
Leu Ser Leu Trp Arg Leu Ile Arg Ser Tyr Ile Thr Ser Ser Ala Leu
20 25 30
Arg Leu Pro Pro Gly Pro Trp Gln Leu Pro Leu Ile Gly Ser Leu His
35 40 45
His Leu Leu Leu Ser Arg Phe Ser Asp Leu Pro His Arg Ala Leu Arg
50 55 60
Glu Met Ser Gly Thr Tyr Gly Pro Leu Met Leu Leu Arg Phe Gly Ser
65 70 75 80
Val Pro Thr Leu Val Val Ser Ser Ala Glu Ala Ala Arg Glu Val Met
85 90 95
Arg Thr His Asp Leu Ala Phe Cys Asp Arg His Leu Gly Val Thr Leu
100 105 110
Asp Ile Val Thr Cys Gly Gly Lys Asp Ile Ile Cys Ser Pro Tyr Asn
115 120 125
Ala His Trp Arg Glu Leu Arg Lys Leu Cys Met Val Glu Ile Leu Ser
130 135 140
Gln Arg Arg Val Leu Ser Phe Arg Ser Ile Arg Glu Glu Glu Val Ala
145 150 155 160
Ser Leu Val Arg Ser Ile Ser Asp Glu Cys Gly Gly Gly Gln Gln Pro
165 170 175
Val Asn Leu Thr Glu Gly Ile Ser Arg Met Ile Asn Asp Val Ala Ala
180 185 190
Arg Thr Val Val Gly Asp Arg Cys Lys Tyr Gln Asp Glu Tyr Met His
195 200 205
Glu Leu Asp Glu Val Val Arg Leu Ala Gly Gly Phe Asn Leu Ala Asp
210 215 220
Leu Tyr Pro Ser Ser Arg Leu Val Arg Arg Phe Ser Ala Ala Ala Arg
225 230 235 240
Asp Ala Arg Arg Cys Gln Arg Asn Met Tyr Arg Ile Ile Gln Ser Ile
245 250 255
Ile Gln Glu Arg Glu Ala Met Pro Thr Pro Glu Arg Asp Glu Glu Asp
260 265 270
Leu Leu Gly Val Leu Leu Arg Leu Gln Arg Glu Gly Gly Leu Gln Phe
275 280 285
Ala Leu Thr Asn Glu Ile Val Ser Thr Val Ile Tyr Asp Ile Phe Ser
290 295 300
Ala Gly Ser Glu Thr Ser Ser Thr Val Leu Val Trp Ala Met Ser Glu
305 310 315 320
Leu Val Lys Asn Pro Gln Val Met Arg Lys Ala Gln Ser Glu Val Arg
325 330 335
Asp Thr Phe Lys Gly Asn Asn Lys Ile Thr Glu Ser Asp Leu Ile Lys
340 345 350
Leu Arg Tyr Leu Gln Leu Val Ile Lys Glu Thr Leu Arg Leu His Ala
355 360 365
Pro Val Pro Leu Leu Leu Pro Arg Glu Cys Arg Glu Ser Cys Gln Ile
370 375 380
Met Gly Tyr Asp Val Leu Lys Gly Thr Lys Val Phe Val Asn Ala Trp
385 390 395 400
Ala Ile Ala Arg Asp Thr Gly Leu Trp Cys Asp Gly Glu Glu Phe Arg
405 410 415
Pro Glu Arg Phe Glu Ser Ser Asn Ile Asp Phe Arg Gly Asn Asp Phe
420 425 430
Glu Phe Thr Pro Phe Gly Ala Gly Arg Arg Val Cys Pro Gly Ile Thr
435 440 445
Leu Gly Leu Ala Asn Leu Glu Leu Ala Leu Ala Ser Leu Leu Tyr His
450 455 460
Phe Asp Trp Asp Leu Pro Asn Gly Ala Arg Leu Glu Asp Leu Asp Met
465 470 475 480
Ala Glu Ala Phe Gly Ile Thr Leu Lys Arg Lys Ser Met Leu Trp Leu
485 490 495
Lys Ala Lys Pro Tyr Asn Asn Phe Ile Pro Asn
500 505
<210> 11
<211> 1509
<212> DNA
<213> 马铃薯(Solanum tuberosum)
<400> 11
atgcaattct tgagcttggc ttccatcttc ctttttctat cttttctgtt tttgttaagg 60
aaatggaaaa actcgaatag ccaatcgaaa aaattgcctc caggtccatg gaaacttcct 120
ttactaggaa gtatgcttca tatggctggt ggacttccac accatgtcct tagagattta 180
gccaaaaaat atggaccact tatgcatctt caacttggtg aagtctctgc agttgtagta 240
acttctcctg atatggcgaa agaagtacta aaaactcatg acatcgcttt cgcctctagg 300
cctaaacttt tggccccgga aattgtttgt tacaacaggt ctgacattgc cttttgcccc 360
tacggagatt actggagaca aatgcgtaaa atttgtgtct tggaattgtt gagtgccaag 420
aatgtccggt catatggctc gattaggcgc gatgaagttg atcgccttgt taattttatc 480
cggtcatctt cgggtgagcc ggttaatttt actgaaaggt tgtttttgtt cacaagttca 540
atgacatgta gatcagcgtt cgggaaagtg ttcaaagaac aggacaaatt tatacaacta 600
atcaaagaag tgattgggtt agcaggagga tttgatgtgg ctgatatctt cccatcattg 660
aagtttctcc atgtgcttag tggaatgaaa ggtaaaatta tgaacgctca tcataaggta 720
gatgcaattg ttgaagatgt catcaatgag cacaagaaga aatttgcaat tgggaaaact 780
aatggtgcat taggtggtga agatctaatt gatgtcctta taagacttat gaatgatgga 840
ggccttcaat ttccgatcac caacgacaac atcaaagcta ttattttcga catgtttgct 900
gcaggaacag agacttcatc gtcaacactt gtctgggcaa tggtgcaaat gatgaaaaac 960
ccaagtgtaa tcgccaaagc tcaagcagaa gtgcgagaag cctttaaaga caaagaaacg 1020
ttcgatgaaa atgatgtaga ggagctgaaa tacttaaagt tagtcattaa agaaactcta 1080
agactccatc caccagttcc acttttggtc ccaagagaat gtagggaaga gacggatata 1140
aacggctaca ctattcctgt gaagaccaaa gtcatggtta atgtttgggc attgggaaga 1200
gatccgaaat attgggatga tgcagaaagt tttaagccag agagatttga gcagcgctct 1260
gtcgactttg ttggtaacaa ttttgagtat cttccctttg gcggtgggag aaggatttgt 1320
cccgggatat catttggctt agctaatgtt tatttgccgt tggctcattt gttatatcac 1380
ttcgactgga aactccctat tggaatggag ccaaaagact tgaacttgac tgaattggtt 1440
ggagtaactg ctgccagaaa agatgacctt attttggttg ccactcctta tgaaccacct 1500
cgacaatga 1509
<210> 12
<211> 502
<212> PRT
<213> 马铃薯(Solanum tuberosum)
<400> 12
Met Gln Phe Leu Ser Leu Ala Ser Ile Phe Leu Phe Leu Ser Phe Leu
1 5 10 15
Phe Leu Leu Arg Lys Trp Lys Asn Ser Asn Ser Gln Ser Lys Lys Leu
20 25 30
Pro Pro Gly Pro Trp Lys Leu Pro Leu Leu Gly Ser Met Leu His Met
35 40 45
Ala Gly Gly Leu Pro His His Val Leu Arg Asp Leu Ala Lys Lys Tyr
50 55 60
Gly Pro Leu Met His Leu Gln Leu Gly Glu Val Ser Ala Val Val Val
65 70 75 80
Thr Ser Pro Asp Met Ala Lys Glu Val Leu Lys Thr His Asp Ile Ala
85 90 95
Phe Ala Ser Arg Pro Lys Leu Leu Ala Pro Glu Ile Val Cys Tyr Asn
100 105 110
Arg Ser Asp Ile Ala Phe Cys Pro Tyr Gly Asp Tyr Trp Arg Gln Met
115 120 125
Arg Lys Ile Cys Val Leu Glu Leu Leu Ser Ala Lys Asn Val Arg Ser
130 135 140
Tyr Gly Ser Ile Arg Arg Asp Glu Val Asp Arg Leu Val Asn Phe Ile
145 150 155 160
Arg Ser Ser Ser Gly Glu Pro Val Asn Phe Thr Glu Arg Leu Phe Leu
165 170 175
Phe Thr Ser Ser Met Thr Cys Arg Ser Ala Phe Gly Lys Val Phe Lys
180 185 190
Glu Gln Asp Lys Phe Ile Gln Leu Ile Lys Glu Val Ile Gly Leu Ala
195 200 205
Gly Gly Phe Asp Val Ala Asp Ile Phe Pro Ser Leu Lys Phe Leu His
210 215 220
Val Leu Ser Gly Met Lys Gly Lys Ile Met Asn Ala His His Lys Val
225 230 235 240
Asp Ala Ile Val Glu Asp Val Ile Asn Glu His Lys Lys Lys Phe Ala
245 250 255
Ile Gly Lys Thr Asn Gly Ala Leu Gly Gly Glu Asp Leu Ile Asp Val
260 265 270
Leu Ile Arg Leu Met Asn Asp Gly Gly Leu Gln Phe Pro Ile Thr Asn
275 280 285
Asp Asn Ile Lys Ala Ile Ile Phe Asp Met Phe Ala Ala Gly Thr Glu
290 295 300
Thr Ser Ser Ser Thr Leu Val Trp Ala Met Val Gln Met Met Lys Asn
305 310 315 320
Pro Ser Val Ile Ala Lys Ala Gln Ala Glu Val Arg Glu Ala Phe Lys
325 330 335
Asp Lys Glu Thr Phe Asp Glu Asn Asp Val Glu Glu Leu Lys Tyr Leu
340 345 350
Lys Leu Val Ile Lys Glu Thr Leu Arg Leu His Pro Pro Val Pro Leu
355 360 365
Leu Val Pro Arg Glu Cys Arg Glu Glu Thr Asp Ile Asn Gly Tyr Thr
370 375 380
Ile Pro Val Lys Thr Lys Val Met Val Asn Val Trp Ala Leu Gly Arg
385 390 395 400
Asp Pro Lys Tyr Trp Asp Asp Ala Glu Ser Phe Lys Pro Glu Arg Phe
405 410 415
Glu Gln Arg Ser Val Asp Phe Val Gly Asn Asn Phe Glu Tyr Leu Pro
420 425 430
Phe Gly Gly Gly Arg Arg Ile Cys Pro Gly Ile Ser Phe Gly Leu Ala
435 440 445
Asn Val Tyr Leu Pro Leu Ala His Leu Leu Tyr His Phe Asp Trp Lys
450 455 460
Leu Pro Ile Gly Met Glu Pro Lys Asp Leu Asn Leu Thr Glu Leu Val
465 470 475 480
Gly Val Thr Ala Ala Arg Lys Asp Asp Leu Ile Leu Val Ala Thr Pro
485 490 495
Tyr Glu Pro Pro Arg Gln
500
<210> 13
<211> 1506
<212> DNA
<213> 人工序列(Artificial Sequence)
<223> 编码CYP71D4的N-末端变体的密码子优化的cDNA,包括位于5’端的NdeI位点和位于3’端的SalI-HindIII位点(Codon optimized cDNA encoding for an N-terminalvariant of
CYP71D4, including NdeI site at 5'end and SalI-HindIII sites at
3'end)
<400> 13
atggctctgt tgctggcagt tttctggtcc gcattgatta ttttggttct gtctcgcaaa 60
tggaaaaata gcaacagcca gagcaaaaag ctgccaccag gcccgtggaa actgccgttg 120
ctgggtagca tgctgcacat ggcaggcggc ctgccacacc atgtgctgcg tgatctggcg 180
aagaaatacg gtccgttgat gcatctgcag ctgggtgaag tgagcgcggt cgtggtgacg 240
agcccggata tggcgaaaga agtgctgaag acccatgata tcgcattcgc aagccgtcca 300
aagctgctgg ctccggagat tgtctgctac aaccgtagcg acattgcgtt ctgtccatac 360
ggcgactact ggcgtcaaat gcgtaagatt tgtgtgctgg aactgctgag cgcgaaaaat 420
gtgcgcagct acggcagcat ccgtcgtgac gaggttgatc gtctggtgaa tttcattcgt 480
agcagcagcg gcgagccggt taactttacg gagcgtctgt ttctgtttac ctccagcatg 540
acctgccgtt ccgcgtttgg caaggtgttc aaggaacagg acaagttcat tcaactgatt 600
aaggaagtga tcggcctggc aggcggtttc gatgtggccg acatctttcc gagcctgaag 660
tttctgcacg tgctgtctgg tatgaaaggc aaaattatga atgcacacca caaggttgat 720
gcgatcgttg aagatgtgat taatgaacac aagaaaaagt tcgcgattgg taagacgaac 780
ggtgcgctgg gtggtgagga tctgatcgat gttctgattc gcttgatgaa cgacggtggt 840
ctgcagtttc cgatcaccaa tgacaatatc aaagcgatta tcttcgacat gttcgccgca 900
ggcacggaga cgtctagcag caccctggtt tgggcgatgg ttcaaatgat gaagaatcca 960
agcgttattg caaaagccca agcggaagtt cgtgaagcgt ttaaagataa agagactttc 1020
gacgaaaacg atgttgagga actgaagtat ctgaagctgg ttatcaagga gacgctgcgt 1080
ctgcacccgc cggttccgct gctggtgccg cgtgaatgcc gtgaggagac ggatattaat 1140
ggttacacga ttccggttaa aaccaaagtc atggtgaatg tgtgggcgtt gggccgtgat 1200
ccgaagtact gggacgatgc ggagagcttt aaaccggaac gcttcgaaca gcgtagcgtg 1260
gattttgttg gcaataactt tgaatatctg ccattcggtg gtggtcgccg catttgccca 1320
ggcatttctt tcggtctggc aaacgtttat ctgccgctgg cgcatttgct gtaccacttc 1380
gactggaaat tgccgattgg catggaaccg aaagacttga acctgacgga actggtcggc 1440
gtgacggcgg ctcgtaagga tgacctgatt ctggtcgcaa ccccatacga accgccgcgt 1500
caataa 1506
<210> 14
<211> 501
<212> PRT
<213> 人工序列(Artificial Sequence)
<223> CYP71D4opt, CYP7D的N-末端变体的氨基酸序列(CYP71D4opt, amino acidsequence of an N-terminal variant of CYP7D)
<400> 14
Met Ala Leu Leu Leu Ala Val Phe Trp Ser Ala Leu Ile Ile Leu Val
1 5 10 15
Leu Ser Arg Lys Trp Lys Asn Ser Asn Ser Gln Ser Lys Lys Leu Pro
20 25 30
Pro Gly Pro Trp Lys Leu Pro Leu Leu Gly Ser Met Leu His Met Ala
35 40 45
Gly Gly Leu Pro His His Val Leu Arg Asp Leu Ala Lys Lys Tyr Gly
50 55 60
Pro Leu Met His Leu Gln Leu Gly Glu Val Ser Ala Val Val Val Thr
65 70 75 80
Ser Pro Asp Met Ala Lys Glu Val Leu Lys Thr His Asp Ile Ala Phe
85 90 95
Ala Ser Arg Pro Lys Leu Leu Ala Pro Glu Ile Val Cys Tyr Asn Arg
100 105 110
Ser Asp Ile Ala Phe Cys Pro Tyr Gly Asp Tyr Trp Arg Gln Met Arg
115 120 125
Lys Ile Cys Val Leu Glu Leu Leu Ser Ala Lys Asn Val Arg Ser Tyr
130 135 140
Gly Ser Ile Arg Arg Asp Glu Val Asp Arg Leu Val Asn Phe Ile Arg
145 150 155 160
Ser Ser Ser Gly Glu Pro Val Asn Phe Thr Glu Arg Leu Phe Leu Phe
165 170 175
Thr Ser Ser Met Thr Cys Arg Ser Ala Phe Gly Lys Val Phe Lys Glu
180 185 190
Gln Asp Lys Phe Ile Gln Leu Ile Lys Glu Val Ile Gly Leu Ala Gly
195 200 205
Gly Phe Asp Val Ala Asp Ile Phe Pro Ser Leu Lys Phe Leu His Val
210 215 220
Leu Ser Gly Met Lys Gly Lys Ile Met Asn Ala His His Lys Val Asp
225 230 235 240
Ala Ile Val Glu Asp Val Ile Asn Glu His Lys Lys Lys Phe Ala Ile
245 250 255
Gly Lys Thr Asn Gly Ala Leu Gly Gly Glu Asp Leu Ile Asp Val Leu
260 265 270
Ile Arg Leu Met Asn Asp Gly Gly Leu Gln Phe Pro Ile Thr Asn Asp
275 280 285
Asn Ile Lys Ala Ile Ile Phe Asp Met Phe Ala Ala Gly Thr Glu Thr
290 295 300
Ser Ser Ser Thr Leu Val Trp Ala Met Val Gln Met Met Lys Asn Pro
305 310 315 320
Ser Val Ile Ala Lys Ala Gln Ala Glu Val Arg Glu Ala Phe Lys Asp
325 330 335
Lys Glu Thr Phe Asp Glu Asn Asp Val Glu Glu Leu Lys Tyr Leu Lys
340 345 350
Leu Val Ile Lys Glu Thr Leu Arg Leu His Pro Pro Val Pro Leu Leu
355 360 365
Val Pro Arg Glu Cys Arg Glu Glu Thr Asp Ile Asn Gly Tyr Thr Ile
370 375 380
Pro Val Lys Thr Lys Val Met Val Asn Val Trp Ala Leu Gly Arg Asp
385 390 395 400
Pro Lys Tyr Trp Asp Asp Ala Glu Ser Phe Lys Pro Glu Arg Phe Glu
405 410 415
Gln Arg Ser Val Asp Phe Val Gly Asn Asn Phe Glu Tyr Leu Pro Phe
420 425 430
Gly Gly Gly Arg Arg Ile Cys Pro Gly Ile Ser Phe Gly Leu Ala Asn
435 440 445
Val Tyr Leu Pro Leu Ala His Leu Leu Tyr His Phe Asp Trp Lys Leu
450 455 460
Pro Ile Gly Met Glu Pro Lys Asp Leu Asn Leu Thr Glu Leu Val Gly
465 470 475 480
Val Thr Ala Ala Arg Lys Asp Asp Leu Ile Leu Val Ala Thr Pro Tyr
485 490 495
Glu Pro Pro Arg Gln
500
<210> 15
<211> 709
<212> PRT
<213> 胡椒薄荷(Mentha piperita)
<400> 15
Met Glu Pro Ser Ser Gln Lys Leu Ser Pro Leu Glu Phe Val Ala Ala
1 5 10 15
Ile Leu Lys Gly Asp Tyr Ser Ser Gly Gln Val Glu Gly Gly Pro Pro
20 25 30
Pro Gly Leu Ala Ala Met Leu Met Glu Asn Lys Asp Leu Val Met Val
35 40 45
Leu Thr Thr Ser Val Ala Val Leu Ile Gly Cys Val Val Val Leu Ala
50 55 60
Trp Arg Arg Ala Ala Gly Ser Gly Lys Tyr Lys Gln Pro Glu Leu Pro
65 70 75 80
Lys Leu Val Val Pro Lys Ala Ala Glu Pro Glu Glu Ala Glu Asp Asp
85 90 95
Lys Thr Lys Ile Ser Val Phe Phe Gly Thr Gln Thr Gly Thr Ala Glu
100 105 110
Gly Phe Ala Lys Ala Phe Val Glu Glu Ala Lys Ala Arg Tyr Gln Gln
115 120 125
Ala Arg Phe Lys Val Ile Asp Leu Asp Asp Tyr Ala Ala Asp Asp Asp
130 135 140
Glu Tyr Glu Glu Lys Leu Lys Lys Glu Asn Leu Ala Phe Phe Phe Leu
145 150 155 160
Ala Ser Tyr Gly Asp Gly Glu Pro Thr Asp Asn Ala Ala Arg Phe Tyr
165 170 175
Lys Trp Phe Thr Glu Gly Lys Asp Arg Gly Glu Trp Leu Asn Asn Leu
180 185 190
Gln Tyr Gly Val Phe Gly Leu Gly Asn Arg Gln Tyr Glu His Phe Asn
195 200 205
Lys Ile Ala Ile Val Val Asp Asp Leu Ile Phe Glu Gln Gly Gly Lys
210 215 220
Lys Leu Val Pro Val Gly Leu Gly Asp Asp Asp Gln Cys Ile Glu Asp
225 230 235 240
Asp Phe Ala Ala Trp Arg Glu Leu Val Trp Pro Glu Leu Asp Lys Leu
245 250 255
Leu Arg Asn Glu Asp Asp Ala Thr Val Ala Thr Pro Tyr Ser Ala Ala
260 265 270
Val Leu Gln Tyr Arg Val Val Phe His Asp His Ile Asp Gly Leu Ile
275 280 285
Ser Glu Asn Gly Ser Pro Asn Gly His Ala Asn Gly Asn Thr Val Tyr
290 295 300
Asp Ala Gln His Pro Cys Arg Ser Asn Val Ala Val Lys Lys Glu Leu
305 310 315 320
His Thr Pro Ala Ser Asp Arg Ser Cys Thr His Leu Glu Phe Asn Ile
325 330 335
Ser Gly Thr Gly Leu Met Tyr Glu Thr Gly Asp His Val Gly Val Tyr
340 345 350
Cys Glu Asn Leu Leu Glu Thr Val Glu Glu Ala Glu Lys Leu Leu Asn
355 360 365
Leu Ser Pro Gln Thr Tyr Phe Ser Val His Thr Asp Asn Glu Asp Gly
370 375 380
Thr Pro Leu Ser Gly Ser Ser Leu Pro Pro Pro Phe Pro Pro Cys Thr
385 390 395 400
Leu Arg Thr Ala Leu Thr Lys Tyr Ala Asp Leu Thr Ser Ala Pro Lys
405 410 415
Lys Ser Val Leu Val Ala Leu Ala Glu Tyr Ala Ser Asp Gln Gly Glu
420 425 430
Ala Asp Arg Leu Arg Phe Leu Ala Ser Pro Ser Gly Lys Glu Glu Tyr
435 440 445
Ala Gln Tyr Ile Leu Ala Ser Gln Arg Thr Leu Leu Glu Val Met Ala
450 455 460
Glu Phe Pro Ser Ala Lys Pro Pro Leu Gly Val Phe Phe Ala Gly Val
465 470 475 480
Ala Pro Arg Leu Gln Pro Arg Phe Tyr Ser Ile Ser Ser Ser Pro Lys
485 490 495
Ile Ala Pro Phe Arg Ile His Val Thr Cys Ala Leu Val Tyr Asp Lys
500 505 510
Ser Pro Thr Gly Arg Val His Lys Gly Ile Cys Ser Thr Trp Met Lys
515 520 525
Asn Ala Val Pro Leu Glu Glu Ser Asn Asp Cys Ser Trp Ala Pro Ile
530 535 540
Phe Val Arg Asn Ser Asn Phe Lys Leu Pro Thr Asp Pro Lys Val Pro
545 550 555 560
Ile Ile Met Ile Gly Pro Gly Thr Gly Leu Ala Pro Phe Arg Gly Phe
565 570 575
Leu Gln Glu Arg Leu Ala Leu Lys Glu Ser Gly Ala Glu Leu Gly Pro
580 585 590
Ala Ile Leu Phe Phe Gly Cys Arg Asn Arg Lys Met Asp Phe Ile Tyr
595 600 605
Glu Asp Glu Leu Asn Asp Phe Val Lys Ala Gly Val Val Ser Glu Leu
610 615 620
Ile Val Ala Phe Ser Arg Glu Gly Pro Met Lys Glu Tyr Val Gln His
625 630 635 640
Lys Met Ser Gln Arg Ala Ser Asp Val Trp Asn Ile Ile Ser Asp Gly
645 650 655
Gly Tyr Val Tyr Val Cys Gly Asp Ala Lys Gly Met Ala Arg Asp Val
660 665 670
His Arg Thr Leu His Thr Ile Ala Gln Glu Gln Gly Ser Met Ser Ser
675 680 685
Ser Glu Ala Glu Gly Met Val Lys Asn Leu Gln Thr Thr Gly Arg Tyr
690 695 700
Leu Arg Asp Val Trp
705
<210> 16
<211> 2130
<212> DNA
<213> 胡椒薄荷(Mentha piperita)
<400> 16
atggaaccta gctctcagaa actgtctccg ttggaatttg ttgctgctat cctgaagggc 60
gactacagca gcggtcaggt tgaaggtggt ccaccgccag gtctggcagc tatgttgatg 120
gaaaataagg atttggtgat ggttctgacg acgtccgtgg cagtcctgat cggctgtgtc 180
gtggtcctgg catggcgtcg tgcggcaggt agcggtaagt acaagcaacc tgaactgcct 240
aaactggtgg tcccgaaagc agccgaaccg gaggaggcag aggatgataa aaccaagatc 300
agcgtgtttt tcggcaccca aaccggtacg gcagaaggtt tcgcgaaggc ttttgttgaa 360
gaggccaagg cgcgttatca gcaggcccgt ttcaaagtta tcgacctgga cgactatgcg 420
gcagacgatg acgagtacga agagaaactg aagaaggaaa acttggcatt cttcttcttg 480
gcgtcctacg gtgacggcga gccgacggac aacgcggcac gcttttacaa atggtttacg 540
gagggtaagg accgtggtga atggctgaac aatctgcagt acggcgtttt tggtctgggt 600
aaccgtcaat atgagcattt caataagatc gccattgtcg tcgatgatct gatcttcgag 660
caaggtggca agaagctggt tccggtgggt ctgggtgacg atgaccagtg cattgaggat 720
gattttgcgg cgtggcgtga actggtctgg ccggaactgg ataaactgct gcgtaacgaa 780
gacgacgcta ccgtggcaac cccgtacagc gccgctgtgc tgcaataccg cgtggttttc 840
cacgatcaca ttgacggcct gattagcgaa aacggtagcc cgaacggtca tgctaatggc 900
aataccgtgt acgatgcgca acacccgtgc cgtagcaacg tcgcggtcaa gaaggaattg 960
catactccgg cgagcgatcg cagctgcacc cacctggaat ttaacattag cggtaccggc 1020
ctgatgtacg agacgggtga ccacgtcggt gtgtattgcg agaacctgtt ggaaaccgtg 1080
gaggaggccg agaagttgtt gaacctgagc ccgcagacgt acttctccgt tcacaccgac 1140
aacgaggacg gtacgccgtt gagcggcagc agcctgccgc caccgtttcc gccgtgcacc 1200
ttgcgcacgg cattgaccaa atacgcagac ttgacttctg caccgaaaaa gtcggtgctg 1260
gtggcgctgg ccgagtacgc atctgaccag ggtgaagcgg atcgtttgcg tttcttggcg 1320
agcccgagcg gcaaagagga atatgcacag tacatcttgg caagccagcg cacgctgctg 1380
gaggtcatgg cggagttccc gtcggcgaaa ccgccgctgg gtgtcttttt cgcgggtgtc 1440
gctccgcgcc tgcagccgcg tttctattcc attagctcta gcccgaagat cgcaccgttc 1500
cgtattcacg tgacctgcgc cctggtttat gacaaatccc ctaccggtcg cgttcataag 1560
ggcatctgta gcacgtggat gaaaaatgcg gtcccgctgg aagaaagcaa cgattgttcc 1620
tgggctccga tcttcgtccg caacagcaac ttcaagctgc cgaccgaccc gaaggttccg 1680
attatcatga ttggtccggg taccggtctg gccccttttc gtggcttttt gcaagagcgc 1740
ttggcgttga aagagagcgg tgctgaattg ggtccggcga tcttgttctt tggttgccgt 1800
aaccgtaaaa tggactttat ttacgaggat gaactgaatg atttcgtcaa agcgggcgtt 1860
gtcagcgagc tgatcgtcgc ttttagccgc gaaggcccga tgaaagaata cgtgcaacac 1920
aaaatgagcc aacgtgcctc cgatgtgtgg aacatcatta gcgacggtgg ttatgtttat 1980
gtttgcggtg acgcgaaggg tatggctcgt gatgttcacc gtaccctgca taccatcgca 2040
caggagcaag gtagcatgtc cagctcggag gccgaaggta tggtcaaaaa cctgcaaacc 2100
accggtcgtt acctgcgtga tgtgtggtaa 2130
<210> 17
<211> 20
<212> PRT
<213> 人工序列(Artificial Sequence)
<223> 多肽片段(Polypeptide fragment)
<400> 17
Met Ala Leu Leu Leu Ala Val Phe Leu Gly Leu Ser Cys Leu Leu Leu
1 5 10 15
Leu Ser Leu Trp
20
<210> 18
<211> 18
<212> PRT
<213> 人工序列(Artificial Sequence)
<223> 多肽片段(Polypeptide fragment)
<400> 18
Met Ala Leu Leu Leu Ala Val Phe Trp Ser Ala Leu Ile Ile Leu Val
1 5 10 15
Leu Ser
<210> 19
<211> 66
<212> DNA
<213> 人工序列(Artificial Sequence)
<223> DNA多接头(DNA polylinker)
<400> 19
gtcgacaatt aaccatggtt aattaagctt atatatggta ccatatatga attcattaat 60
ctcgag 66
<210> 20
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<223> 含有间隔序列、SalI识别序列和核糖体结合位点的延伸序列(extensioncontaining a spacer sequence, the SalI recognition
sequence and ribosome binding site)
<400> 20
gtcgacaatt aggtaaaaaa taaacc 26
<210> 21
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<223> 包含HindIII识别位点和RBS序列的5’非编码序列(5' non-coding sequencecomprising a HindIII recognition site and
a RBS sequence)
<400> 21
aagcttaagg aggtaaaaa 19
<210> 22
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<223> 包含KpnI、EcoRI和XhoI识别位点的3’非编码序列(3' non coding sequencecomprising the KpnI, EcoRI and XhoI
recognition sites)
<400> 22
ggtaccatat atgaattcat taatctcgag 30

Claims (38)

1.一种生产一种或多种倍半萜化合物的方法,包括:
a.使无环法呢基二磷酸(FPP)前体与具有萜合酶活性的多肽接触,该萜合酶活性包括异朱栾倍半萜合酶活性、香根螺-1(10),7(11)-二烯合酶活性和/或朱栾倍半萜合酶活性中的一种或多种,
其中该多肽包含与SEQ ID NO:1具有至少55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或100%序列同一性的氨基酸序列,以产生从异朱栾倍半萜、香根螺-1(10),7(11)-二烯和朱栾倍半萜中选出的至少一种萜烯,或包含异朱栾倍半萜、香根螺-1(10),7(11)-二烯和/或朱栾倍半萜中的一种或多种的倍半萜的混合物;并且
b.可选地,分离从异朱栾倍半萜、香根螺-1(10),7(11)-二烯和朱栾倍半萜中选出的至少一种萜烯,或包含异朱栾倍半萜、香根螺-1(10),7(11)-二烯和/或朱栾倍半萜中的一种或多种的倍半萜的混合物。
2.根据权利要求1所述的方法,包括用编码具有倍半萜合酶活性的多肽的核酸转化宿主细胞或非人生物体,其中该多肽包含与SEQ ID NO:1具有至少55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或100%序列同一性的氨基酸序列。
3.根据权利要求1或2所述的方法,还包括培养能够产生FPP并经转化以表达多肽的非人宿主生物体或细胞,其中该多肽包含与SEQ ID NO:1具有至少55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或100%序列同一性的氨基酸序列。
4.根据权利要求2或3所述的方法,其中该宿主细胞或非人生物是原核生物、植物、微生物或真菌。
5.根据权利要求4所述的方法,其中该微生物是细菌或酵母。
6.根据权利要求5所述的方法,其中该细菌是大肠杆菌(E.coli),而该酵母是酿酒酵母(Saccharomyces cerevisiae)。
7.根据权利要求1至6中任一项所述的方法,还包括使用化学或生物化学合成或两者的组合将该一种或多种倍半萜氧化成衍生物。
8.根据权利要求1至7中任一项所述的方法,还包括使从异朱栾倍半萜、香根螺旋-1(10),7(11)-二烯和朱栾倍半萜中选出的倍半萜与至少一种酶接触以产生倍半萜衍生物。
9.根据权利要求8所述的方法,其中该至少一种酶包括:
a)细胞色素P450酶,
b)从香根草(Vetiveria zizanoides)中分离的细胞色素P450酶,
c)来自CYP71D家族的细胞色素P450酶,或
d)与SEQ ID NO:7、SEQ ID NO:10、SEQ ID NO:12或SEQ ID NO:14具有至少70%、75%、80%、85%、90%、95%、98%、99%或100%序列同一性的氨基酸序列。
10.根据权利要求9所述的方法,其中该至少一种酶伴随有选自下列的酶:
a)细胞色素P450还原酶(CPR)酶;或
b)从胡椒薄荷(Mentha piperita)中分离的CPR酶;或
c)包含与SEQ ID NO:15具有至少70%、75%、80%、85%、90%、95%、98%、99%或100%序列同一性的氨基酸序列的CPR酶。
11.根据权利要求8至10中任一项所述的方法,其中一种或多种该酶在宿主细胞中异源表达。
12.根据权利要求7至10中任一项所述的方法,其中使用选自原核或真核细胞的野生型生物体来氧化该化合物。
13.根据权利要求9至11中任一项所述的方法,其中该细胞色素P450酶和倍半萜合酶和可选的CPR酶在相同的宿主细胞中表达。
14.根据权利要求7至13中任一项所述的方法,其中该氧化是烯丙基氧化。
15.根据权利要求1至7中任一项所述的方法,还包括生产包含异朱栾倍半萜、香根螺-1(10),7(11)-二烯和朱栾倍半萜的萜烯混合物,其中相对于彼此的比例为约66%至68%的异朱栾倍半萜衍生物,约25%至26%的香根螺-1(10),7(11)-二烯衍生物和约6%至9%的朱栾倍半萜衍生物。
16.根据权利要求7至14中任一项所述的方法,还包括生产包含异朱栾倍半萜衍生物、香根螺-1(10),7(11)-二烯衍生物和朱栾倍半萜衍生物的萜烯混合物,其中相对于彼此的比例为约66%至68%的异朱栾倍半萜衍生物,约25%至26%的香根螺-1(10),7(11)-二烯衍生物和约6%至9%的朱栾倍半萜衍生物。
17.一种分离的多肽,包含:
a)来自香根草(Vetiveria zizanoides)的氨基酸序列,其包含具有合酶活性的倍半萜合酶,该合酶活性包括异朱栾倍半萜合酶活性、香根螺-1(10),7(11)-二烯合酶活性和/或朱栾倍半萜合酶活性;或者
b)与SEQ ID NO:1具有至少55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或100%序列同一性并具有倍半萜合酶活性的氨基酸序列。
18.一种分离的核酸分子,包含:
a)来自香根草(Vetiveria zizanoides)的核酸序列,其编码具有合酶活性的倍半萜合酶,该合酶活性包括异朱栾倍半萜合酶活性、香根螺-1(10),7(11)-二烯合酶活性和/或朱栾倍半萜合酶活性;
b)编码权利要求17的多肽的核苷酸序列;或者
c)与选自SEQ ID NO:3和SEQ ID NO:4的序列具有至少55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或100%序列同一性并且编码倍半萜合酶的核苷酸序列。
19.一种分离的细胞色素P450多肽序列,包含与SEQ ID NO:7、SEQ ID NO:10、SEQ IDNO:12或SEQ ID NO:14具有至少70%、75%、80%、85%、90%、95%、98%、99%或100%序列同一性的氨基酸序列。
20.一种分离的核酸分子,包含:
c)编码权利要求19的多肽的核苷酸序列;或者
d)包含核苷酸序列SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:11或SEQ IDNO:13的核酸分子,其编码细胞色素P450多肽。
21.一种表达载体,包含:
a).权利要求18的核酸分子;或者
b).权利要求20的核酸分子;或者
c).a)的核酸分子和b)的核酸分子。
22.一种非人宿主生物体或细胞,包含(1)至少一种根据权利要求18的核酸,使得其异源表达或过表达至少一种根据权利要求17的多肽;或(2)至少一种权利要求20的核酸;或(3)一种或多种权利要求21的表达载体。
23.根据权利要求22所述的非人宿主生物体或细胞,其中所述非人宿主生物体或细胞是植物、原核生物、真菌或微生物。
24.根据权利要求23所述的非人宿主生物体或细胞,其中该微生物是细菌或酵母。
25.根据权利要求24所述的非人宿主生物体或细胞,其中该细菌是大肠杆菌(E.coli),而该酵母是酿酒酵母(Saccharomyces cerevisiae)。
26.一种生产一种或多种倍半萜化合物的方法,包括:
使无环法呢基二磷酸(FPP)前体与具有倍半萜合酶活性的多肽接触,其中该多肽包含与SEQ ID NO:1具有至少55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或100%序列同一性的氨基酸序列,以产生一种或多种倍半萜。
27.一种生产倍半萜化合物的混合物的方法,包括:
a.使无环法呢基二磷酸(FPP)前体与具有倍半萜合酶活性的多肽接触,其中该多肽包含与SEQ ID NO:1具有至少55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或100%序列同一性的氨基酸序列,以产生倍半萜的混合物,其中该混合物包含异朱栾倍半萜、香根螺-1(10),7(11)-二烯和/或朱栾倍半萜中的一种或多种;并且
b.可选地,分离包含异朱栾倍半萜、香根螺-1(10),7(11)-二烯和/或朱栾倍半萜中的一种或多种的倍半萜的混合物。
28.根据权利要求26所述的方法,其中该一种或多种萜选自异朱栾倍半萜、香根螺-1(10),7(11)-二烯和朱栾倍半萜;或包含异朱栾倍半萜、香根螺-1(10),7(11)-二烯和/或朱栾倍半萜中的一种或多种的倍半萜的混合物。
29.权利要求17的多肽用于生产倍半萜化合物的混合物的用途,该混合物包含异朱栾倍半萜、香根螺-1(10),7(11)-二烯和/或朱栾倍半萜中的一种或多种。
30.权利要求17的多肽和权利要求19的多肽在生产氧化的倍半萜化合物或氧化的倍半萜化合物的混合物中的用途,可选地伴随使用P450还原酶(CPR)酶或含有与SEQ ID NO:15具有至少70%、75%、80%、85%、90%、95%、98%、99%或100%序列同一性的氨基酸序列的CPR酶,
其中该氧化的倍半萜选自异朱栾倍半萜衍生物、香根螺-1(10),7(11)-二烯衍生物和朱栾倍半萜衍生物,或包含异朱栾倍半萜衍生物、香根螺-1(10),7(11)-二烯衍生物和/或朱栾倍半萜衍生物中的一种或多种的倍半萜的混合物。
31.权利要求19的多肽和倍半萜合酶用于生产氧化的倍半萜化合物或氧化的倍半萜化合物的混合物的用途,可选地伴随使用异源表达的P450还原酶(CPR)酶。
32.一种生产氧化的倍半萜的方法,包括:
使用化学或生物化学合成或两者的组合与权利要求19的细胞色素P450多肽并伴随着CPR酶,将倍半萜氧化成氧化的倍半萜。
33.根据权利要求1至16或26至28中任一项所述的方法或根据权利要求29至31所述的用途,其中该混合物包含异朱栾倍半萜、香根螺-1(10),7(11)-二烯和朱栾倍半萜。
34.根据权利要求7至14中任一项或权利要求16所述的方法,其中该倍半萜衍生物是氧化的倍半萜。
35.根据权利要求32或权利要求34所述的方法或根据权利要求30或权利要求31所述的用途,其中该氧化的倍半萜包括异朱栾倍半萜烯醇、努特卡醇、β-岩兰烯醇和/或异努特卡醇中的一种或多种。
36.根据权利要求32至35中任一项所述的方法或根据权利要求30或权利要求31所述的用途,其中该氧化的倍半萜进一步被氧化成努特卡酮、α-岩兰烯酮和/或β-岩兰烯酮。
37.根据权利要求32所述的方法,其中该CPR酶包含与SEQ ID NO:15具有至少70%、75%、80%、85%、90%、95%、98%、99%或100%序列同一性的氨基酸序列。
38.根据权利要求32所述的方法,其中被氧化的倍半萜选自异朱栾倍半萜、香根螺-1(10),7(11)-二烯和朱栾倍半萜,或者是包含异朱栾倍半萜、香根螺-1(10),7(11)-二烯和/或朱栾倍半萜中的一种或多种的倍半萜的混合物。
CN201780043135.8A 2016-07-20 2017-07-19 香根草 Active CN109477120B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
GBGB1612609.6A GB201612609D0 (en) 2016-07-20 2016-07-20 Vetivier
GB1612609.6 2016-07-20
EP17159264.5 2017-03-03
EP17159264 2017-03-03
PCT/EP2017/068268 WO2018015453A2 (en) 2016-07-20 2017-07-19 Vetiver

Publications (2)

Publication Number Publication Date
CN109477120A true CN109477120A (zh) 2019-03-15
CN109477120B CN109477120B (zh) 2023-06-30

Family

ID=59523078

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201780043135.8A Active CN109477120B (zh) 2016-07-20 2017-07-19 香根草

Country Status (7)

Country Link
US (1) US11293040B2 (zh)
EP (1) EP3488008A2 (zh)
JP (1) JP7026671B2 (zh)
CN (1) CN109477120B (zh)
BR (1) BR112019000892A2 (zh)
MX (1) MX2019000501A (zh)
WO (1) WO2018015453A2 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110305855A (zh) * 2019-06-26 2019-10-08 昆明理工大学 天麻GeCPR基因及其应用

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111527203A (zh) * 2018-01-18 2020-08-11 弗门尼舍有限公司 细胞色素p450单加氧酶催化的倍半萜的氧化

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101194013A (zh) * 2005-06-17 2008-06-04 弗门尼舍有限公司 新颖的倍半萜合酶和它们的应用方法
US20120021475A1 (en) * 2009-05-20 2012-01-26 Firmenich Sa Method for producing (+)-zizaene
CN103649309A (zh) * 2011-06-21 2014-03-19 伊索碧奥尼克斯有限责任公司 朱栾倍半萜合酶
CN105555959A (zh) * 2013-09-19 2016-05-04 弗门尼舍有限公司 用于生产芳香醇的方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2954889A1 (en) * 2001-03-09 2002-09-19 University Of Kentucky Research Foundation Cytochrome p450s and uses thereof
EP3183353A2 (en) 2014-08-21 2017-06-28 Givaudan S.A. Process for producing oxygenated products of valencene

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101194013A (zh) * 2005-06-17 2008-06-04 弗门尼舍有限公司 新颖的倍半萜合酶和它们的应用方法
US20120021475A1 (en) * 2009-05-20 2012-01-26 Firmenich Sa Method for producing (+)-zizaene
CN103649309A (zh) * 2011-06-21 2014-03-19 伊索碧奥尼克斯有限责任公司 朱栾倍半萜合酶
CN105555959A (zh) * 2013-09-19 2016-05-04 弗门尼舍有限公司 用于生产芳香醇的方法

Non-Patent Citations (7)

* Cited by examiner, † Cited by third party
Title
PATERSON,A.H.等: "GenBank: EES10305.1", 《NCBI》 *
PATERSON,A.H.等: "NCBI Reference Sequence: XM_002465189.1", 《NCBI》 *
PATERSON,A.H.等: "NCBI Reference Sequence: XP_002466860.1", 《NCBI》 *
SCHNEIDER,M.等: "GenBank: AJ296346.1", 《NCBI》 *
SCHNEIDER,M.等: "GenBank: CAC24711.1", 《NCBI》 *
无: "A0A0A9VHA2", 《UNIPROT》 *
无: "NCBI Reference Sequence: NP_001305614.1", 《NCBI》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110305855A (zh) * 2019-06-26 2019-10-08 昆明理工大学 天麻GeCPR基因及其应用
CN110305855B (zh) * 2019-06-26 2022-03-22 昆明理工大学 天麻GeCPR基因及其应用

Also Published As

Publication number Publication date
BR112019000892A2 (pt) 2019-04-30
US20200308612A1 (en) 2020-10-01
WO2018015453A2 (en) 2018-01-25
JP2019524104A (ja) 2019-09-05
JP7026671B2 (ja) 2022-02-28
US11293040B2 (en) 2022-04-05
CN109477120B (zh) 2023-06-30
WO2018015453A3 (en) 2018-03-08
EP3488008A2 (en) 2019-05-29
MX2019000501A (es) 2019-03-28

Similar Documents

Publication Publication Date Title
Lee et al. Biochemical and genomic characterization of terpene synthases in Magnolia grandiflora
US8703454B2 (en) Method for producing (+)-zizaene
US10351880B2 (en) Drimenol synthases I
US9714440B2 (en) Method for producing patchoulol and 7-epi-α-selinene
JP6622220B2 (ja) ドリメノールシンターゼ及びドリメノールの製造方法
CN109477120A (zh) 香根草
CN110100003A (zh) 迈诺醇的生产
ES2949068T3 (es) Sesquiterpeno sintasas para la producción de drimenol y mezclas de los mismos
CN107849586B (zh) 芳香化合物的生产
CN107889506A (zh) 迈诺醇的生产
CN108473972A (zh) 补身醇合酶iii

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant