CN108239631B - 一种萜类合酶及其用途 - Google Patents

一种萜类合酶及其用途 Download PDF

Info

Publication number
CN108239631B
CN108239631B CN201710316673.1A CN201710316673A CN108239631B CN 108239631 B CN108239631 B CN 108239631B CN 201710316673 A CN201710316673 A CN 201710316673A CN 108239631 B CN108239631 B CN 108239631B
Authority
CN
China
Prior art keywords
leu
glu
ala
asp
ser
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710316673.1A
Other languages
English (en)
Other versions
CN108239631A (zh
Inventor
刘天罡
卞光凯
韩以超
侯安伟
苑玉杰
刘然
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan Hesheng Technology Co ltd
Original Assignee
J1 Biotech Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by J1 Biotech Co ltd filed Critical J1 Biotech Co ltd
Publication of CN108239631A publication Critical patent/CN108239631A/zh
Application granted granted Critical
Publication of CN108239631B publication Critical patent/CN108239631B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/88Lyases (4.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P15/00Preparation of compounds containing at least three condensed carbocyclic rings
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P5/00Preparation of hydrocarbons or halogenated hydrocarbons
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P5/00Preparation of hydrocarbons or halogenated hydrocarbons
    • C12P5/002Preparation of hydrocarbons or halogenated hydrocarbons cyclic
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P5/00Preparation of hydrocarbons or halogenated hydrocarbons
    • C12P5/007Preparation of hydrocarbons or halogenated hydrocarbons containing one or more isoprene units, i.e. terpenes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P5/00Preparation of hydrocarbons or halogenated hydrocarbons
    • C12P5/02Preparation of hydrocarbons or halogenated hydrocarbons acyclic
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/02Preparation of oxygen-containing organic compounds containing a hydroxy group
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/02Preparation of oxygen-containing organic compounds containing a hydroxy group
    • C12P7/04Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

本发明提出了萜类合酶、核酸分子、构建体、重组细胞及其用途和合成萜类化合物的方法。所述萜类合酶的催化底物为具有10~25个碳原子的化合物。本发明的萜类合酶具有广谱性,能够催化多种底物,合成不同萜类化合物,同时可以提高萜类化合物的产量。

Description

一种萜类合酶及其用途
技术领域
本发明涉及生物领域。具体地,本发明涉及一种萜类合酶及其用途。更具体地,本发明涉及萜类合酶、核酸分子、构建体、重组细胞及其用途和合成萜类化合物的方法。
背景技术
萜类化合物是含有异戊二烯单元的化合物的总称。迄今为止,人们已从动物、植物以及微生物体内发现大约76 000种萜类化合物。被广泛应用于香水生产行业、保健品行业、农业生产领域以及医疗行业。
然而,目前萜类化合物仍有待研究。
发明内容
本发明旨在至少在一定程度上解决现有技术中存在的技术问题至少之一。
为此,在本发明的一个方面,本发明提出了一种萜类合酶。根据本发明的实施例,所述萜类合酶的催化底物为具有10~25个碳原子的化合物。本发明的萜类合酶能够催化长碳链的化合物,且具有广谱性,能够催化多种底物,以便获得不同萜类化合物。
根据本发明的实施例,所述催化底物选自下列之一:香叶基焦磷酸;异戊烯焦磷酸;烯丙基焦磷酸;香叶基焦磷酸;法尼基焦磷酸;香叶基香叶基焦磷酸;以及香叶基法尼基焦磷酸。根据本发明实施例的每种萜类合酶均能够催化上述底物合成萜类化合物,并且针对相同的底物,不同萜类合酶会催化得到不同的萜类化合物。
根据本发明的实施例,所述萜类合酶具有SEQ ID NO:1~6任一项所示的氨基酸序列。由此,根据本发明实施例的萜类合酶具有广谱性,能够催化多种底物,以便获得不同萜类化合物。
在本发明的另一方面,本发明提出了一种核酸分子。根据本发明的实施例,所述核酸分子编码前面所述的萜类合酶。由此,根据本发明实施例的核酸分子能够有效地编码萜类合酶,从而催化多种底物,以便获得不同萜类化合物。
根据本发明的实施例,上述核酸分子还可以具有下列附加技术特征:
根据本发明的实施例,所述核酸分子具有SEQ ID NO:7~12任一项所示的核苷酸序列。由此,根据本发明实施例的核酸分子能够有效地编码萜类合酶,从而催化多种底物,以便获得不同萜类化合物。
在本发明的又一方面,本发明提出了一种构建体。根据本发明的实施例,所述构建体含有前面所述核酸分子。由此,根据本发明实施例的构建体可以通过表达核酸分子,编码合成萜类合酶,从而催化多种底物,以便获得不同萜类化合物。
在本发明的又一方面,本发明提出了一种重组细胞。根据本发明的实施例,所述重组细胞含有:第一核酸分子,所述第一核酸分子编码萜类合酶。由此,通过培养该重组细胞,获得萜类合酶,从而催化多种底物,以便获得不同萜类化合物。
根据本发明的实施例,所述萜类合酶具有SEQ ID NO:1~6任一项所示的氨基酸序列。由此,通过培养该重组细胞,获得萜类合酶,从而催化多种底物,以便获得不同萜类化合物。
根据本发明的实施例,所述第一核酸分子具有SEQ ID NO:7~12任一项所示的核苷酸序列。由此,通过培养该重组细胞,获得萜类合酶,从而催化多种底物,以便获得不同萜类化合物。
根据本发明的实施例,所述重组细胞进一步含有:第二核酸分子,所述第二核酸分子选自下列的至少之一:来源于大肠杆菌XL1-blue的atoB基因或idi基因;来源于酿酒酵母INVSC1的erg13基因、tHMG1基因、erg12基因、erg8基因或mvd1基因。通过对上述基因进行过量表达,以便合成大量催化底物,实现萜类化合物高产。
在本发明的又一方面,本发明提出了一种前面所描述的萜类合酶或核酸分子或构建体或重组细胞在合成萜类化合物中的用途。由此,以便获得不同萜类化合物。
根据本发明的实施例,所述合成是在宿主细胞中进行的,并且所述萜类合酶的催化底物是通过在宿主细胞中过量表达下列至少之一的基因而获得的:来源于大肠杆菌XL1-blue的atoB基因或idi基因;来源于酿酒酵母INVSC1的erg13基因、tHMG1基因、erg12基因、erg8基因或mvd1基因。通过对上述基因进行过量表达,以便合成大量催化底物,实现萜类化合物高产。
根据本发明的实施例,所述萜类化合物具有下列之一的结构:
Figure GDA0003071701110000021
在本发明的又一方面,本发明提出了一种合成前面所述萜类化合物的方法。根据本发明的实施例,所述方法包括:在适于所述萜类化合物表达的条件下,培养前面所述重组细胞,以便获得培养产物;以及从所述培养产物中分离所述萜类化合物。由此,以便获得大量不同萜类化合物。
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1显示了根据本发明一个实施例的GC-MS检测FgMS体外反应色谱图;
图2显示了根据本发明一个实施例的GC-MS检测FgGS体外反应色谱图;
图3显示了根据本发明一个实施例的质粒pMH1结构示意图;
图4显示了根据本发明一个实施例的质粒pFZ81结构示意图;
图5显示了根据本发明一个实施例的质粒pGB309结构示意图;
图6显示了根据本发明一个实施例的质粒pGB310结构示意图;
图7显示了根据本发明一个实施例的质粒pGB311结构示意图;
图8显示了根据本发明一个实施例的质粒pGB312结构示意图;
图9显示了根据本发明一个实施例的质粒pGB313结构示意图;
图10显示了根据本发明一个实施例的质粒pGB314结构示意图;
图11显示了根据本发明一个实施例的质粒pGB147结构示意图;
图12显示了根据本发明一个实施例的用于FgMS以及FgGS发酵合成不同类型产物的质粒及突变株的构建示意图;
图13显示了根据本发明一个实施例的合成萜类化合物方法的示意图,其中(a)为MVA途径高效合成萜类化合物底盘的构建示意图;(b)为萜类合酶与不同链长异戊烯焦磷酸合成酶组合,合成倍半萜(C15)、二萜(C20)以及二倍半萜(C25)化合物的示意图;(c)为6个E.coli菌株(T7-T12)的发酵产物的GS-MS色谱图
图14显示了根据本发明一个实施例的FgMS以及FgGS发酵产物的质谱图;
图15显示了根据本发明一个实施例的AaTS合成的产物;
图16显示了根据本发明一个实施例的化合物(1)的谱图,其中a为平面结构及1H-1HCOSY和关键的HMBC相关性;b为氢谱图(1H NMR,CDCl3,400MHz);c为碳谱图(13C NMR,CDCl3,101MHz);d为HSQC谱图(CDCl3);e为1H-1H COSY谱图(CDCl3);f为HMBC谱图(CDCl3);
图17显示了根据本发明一个实施例的化合物(2)的谱图,其中a为平面结构及1H-1HCOSY和关键的HMBC相关性;b为氢谱图(1H NMR,CDCl3,400MHz);c为碳谱图(13C NMR,CDCl3,101MHz);d为HSQC谱图(CDCl3);e为1H-1H COSY谱图(CDCl3);f为HMBC谱图(CDCl3);
图18显示了根据本发明一个实施例的化合物(3)的谱图,其中a为平面结构及1H-1HCOSY和关键的HMBC相关性;b为氢谱图(1H NMR,CDCl3,400MHz);c为碳谱图(13C NMR,CDCl3,101MHz);d为HSQC谱图(CDCl3);e为1H-1H COSY谱图(CDCl3);f为HMBC谱图(CDCl3);
图19显示了根据本发明一个实施例的化合物(4)的谱图,其中a为氢谱图(1H NMR,CDCl3,400MHz);b为碳谱图(13C NMR,CDCl3,101MHz);
图20显示了根据本发明一个实施例的化合物(5)的谱图,其中a为平面结构及1H-1HCOSY和关键的HMBC相关性;b为氢谱图(1H NMR,CDCl3,400MHz);c为碳谱图(13C NMR,CDCl3,101MHz);d为HSQC谱图(CDCl3);e为1H-1H COSY谱图(CDCl3);f为HMBC谱图(CDCl3);
图21显示了根据本发明一个实施例的化合物(6)的谱图,其中a为平面结构及1H-1HCOSY和关键的HMBC相关性;b为氢谱图(1H NMR,CDCl3,400MHz);c为碳谱图(13C NMR,CDCl3,101MHz);d为HSQC谱图(CDCl3);e为1H-1H COSY谱图(CDCl3);f为HMBC谱图(CDCl3);
图22显示了根据本发明一个实施例的化合物(7)的谱图,其中a为平面结构及1H-1HCOSY和关键的HMBC相关性;b为氢谱图(1H NMR,CDCl3,400MHz);c为碳谱图(13C NMR,CDCl3,101MHz);d为HSQC谱图(CDCl3);e为1H-1H COSY谱图(CDCl3);f为HMBC谱图(CDCl3);
图23显示了根据本发明一个实施例的化合物(8)的谱图,其中a为平面结构及1H-1HCOSY和关键的HMBC相关性;b为氢谱图(1H NMR,CDCl3,400MHz);c为碳谱图(13C NMR,CDCl3,101MHz);d为HSQC谱图(CDCl3);e为1H-1H COSY谱图(CDCl3);f为HMBC谱图(CDCl3);
图24显示了根据本发明一个实施例的化合物(9)的谱图,其中a为平面结构及1H-1HCOSY和关键的HMBC相关性;b为氢谱图(1H NMR,CDCl3,400MHz);c为碳谱图(13C NMR,CDCl3,101MHz);d为HSQC谱图(CDCl3);e为1H-1H COSY谱图(CDCl3);f为HMBC谱图(CDCl3);
图25显示了根据本发明一个实施例的化合物(10)的谱图,其中a为的平面结构及1H-1H COSY和关键的HMBC相关性;b为氢谱图(1H NMR,CDCl3,400MHz);c为碳谱图(13C NMR,CDCl3,101MHz);d为HSQC谱图(CDCl3);e为1H-1H COSY谱图(CDCl3);f为HMBC谱图(CDCl3);
图26显示了根据本发明一个实施例的化合物(11)的谱图,其中a为氢谱图(1HNMR,CDCl3,400MHz);b为碳谱图(13C NMR,CDCl3,101MHz);
图27显示了根据本发明一个实施例的化合物(12)的谱图,其中a为氢谱图(1HNMR,CDCl3,400MHz);b为碳谱图(13C NMR,CDCl3,101MHz);
图28显示了根据本发明一个实施例的化合物(53)的谱图,其中a为平面结构及1H-1H COSY和关键的HMBC相关性;b为氢谱图(1H NMR,CDCl3,400MHz);c为碳谱图(13C NMR,CDCl3,101MHz);d为HSQC谱图(CDCl3);e为1H-1H COSY谱图(CDCl3);f为HMBC谱图(CDCl3);以及
图29显示了根据本发明一个实施例的化合物(54)的谱图,其中a为平面结构及1H-1H COSY和关键的HMBC相关性;b为氢谱图(1H NMR,CDCl3,400MHz);c为碳谱图(13C NMR,CDCl3,101MHz);d为DEPT 135°谱图(CDCl3);e为HSQC谱图(CDCl3);f为1H-1H COSY谱图(CDCl3);g为HMBC谱图(CDCl3)。
具体实施方式
下面详细描述本发明的实施例。下面描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。
萜类合酶
在本发明的一个方面,本发明提出了一种萜类合酶。根据本发明的实施例,萜类合酶的催化底物为具有10~25个碳原子的化合物。发明人发现,现有的萜类合酶大多只能催化短碳链的底物(例如5~10个碳原子),且特异性较强,只能催化特定的底物,得到对应的萜类化合物。而本发明的萜类合酶能够催化长碳链的化合物(例如10~25个碳原子),且具有广谱性,能够催化多种底物,以便获得不同萜类化合物。
根据本发明的实施例,催化底物选自下列之一:异戊烯焦磷酸(IPP);烯丙基焦磷酸(DMAPP);香叶基焦磷酸(GPP);法尼基焦磷酸(FPP);香叶基香叶基焦磷酸(GGPP);以及香叶基法尼基焦磷酸(GFPP)。本发明的每种萜类合酶均能够催化上述底物合成萜类化合物,并且针对相同的底物,不同萜类合酶会催化得到不同的萜类化合物。
根据本发明的实施例,萜类合酶具有SEQ ID NO:1~6任一项所示的氨基酸序列。
发明人发现,上述萜类合酶具备将法尼基焦磷酸(FPP)、香叶基香叶基焦磷酸(GGPP)、香叶基法尼基焦磷酸(GFPP)、异戊烯焦磷酸(IPP)、烯丙基焦磷酸(DMAPP)及香叶基焦磷酸(GPP)转化成萜类化合物功能。进而,萜类合酶通过催化底物,能够有效地获得多种不同萜类化合物。
萜类合酶1(简称FgMS)具有SEQ ID NO:1所示的氨基酸序列,具体如下:
MDFTYRYSFEPTDYDTDGLCDGVPVRMHKGADLDEVAIFKAQYDWEKHVGPKLPFRGALGPRHNFICLTLPECLPERLEIVSYANEFAFLHDDITDVESAETVAAENDEFLDALQQGVREGDIQSRESGKRHLQAWIFKSMVAIDRDRAVAAMNAWATFINTGAGCAHDTNFKSLDEYLHYRATDVGYMFWHALIIFGCAITIPEHEIELCHQLALPAIMSVTLTNDIWSYGKEAEAAEKSGKPGDFVNALVVLMREHNCSIEEAERLCRARNKIEVAKCLQVTKETRERKDVSQDLKDYLYHMLFGVSGNAIWSTQCRRYDMTAPYNERQQARLKQTKGELTSTYDPVQAAKEAMMESTRPEIHRLPTPDSPRKESFAVRPLVNGSGQYNGNNHINGVSNEVDVRPSIERHASTKRATSADDIDWTAHKKVDSGADHKKTLSDIMLQELPPMEDDVVMEPYRYLCSLPSKGVRNKTIDALNFWLKVPIENANTIKAITESLHGSSLMLDDIEDHSQLRRGKPSAHAVFGEAQTINSATFQYIQSVSLISQLRSPKALNIFVDEIRQLFIGQAYELQWTSNMICPPLEEYLRMVDGKTGGLFRLLTRLMAAESTTEVDVDFSRLCQLFGRYFQIRDDYANLKLADYTEQKGFCEDLDEGKFSLPLIIAFNENNKAPKAVAQLRGLMMQRCVNGGLTFEQKVLALNLIEEAGGISGTEKVLHSLYGEMEAELERLAGVFGAENHQLELILEMLRID
萜类合酶2(简称D510A)具有SEQ ID NO:2所示的氨基酸序列,具体如下:
MDFTYRYSFEPTDYDTDGLCDGVPVRMHKGADLDEVAIFKAQYDWEKHVGPKLPFRGALGPRHNFICLTLPECLPERLEIVSYANEFAFLHDDITDVESAETVAAENDEFLDALQQGVREGDIQSRESGKRHLQAWIFKSMVAIDRDRAVAAMNAWATFINTGAGCAHDTNFKSLDEYLHYRATDVGYMFWHALIIFGCAITIPEHEIELCHQLALPAIMSVTLTNDIWSYGKEAEAAEKSGKPGDFVNALVVLMREHNCSIEEAERLCRARNKIEVAKCLQVTKETRERKDVSQDLKDYLYHMLFGVSGNAIWSTQCRRYDMTAPYNERQQARLKQTKGELTSTYDPVQAAKEAMMESTRPEIHRLPTPDSPRKESFAVRPLVNGSGQYNGNNHINGVSNEVDVRPSIERHASTKRATSADDIDWTAHKKVDSGADHKKTLSDIMLQELPPMEDDVVMEPYRYLCSLPSKGVRNKTIDALNFWLKVPIENANTIKAITESLHGSSLMLADIEDHSQLRRGKPSAHAVFGEAQTINSATFQYIQSVSLISQLRSPKALNIFVDEIRQLFIGQAYELQWTSNMICPPLEEYLRMVDGKTGGLFRLLTRLMAAESTTEVDVDFSRLCQLFGRYFQIRDDYANLKLADYTEQKGFCEDLDEGKFSLPLIIAFNENNKAPKAVAQLRGLMMQRCVNGGLTFEQKVLALNLIEEAGGISGTEKVLHSLYGEMEAELERLAGVFGAENHQLELILEMLRID
萜类合酶3(简称FgGS)具有SEQ ID NO:3所示的氨基酸序列,具体如下:
MDPYSETSDLVDISRFDTHGLGANYKLRRHKFEHLADTGCHKARSDWVKYIGPLTEFGGCNHINGNFSAVVLPLCRPDRLELIAYVLEFAFLHDSVLESENTSPESEVQAEAGLRLLYERCISRLLQTDEVCAKKIAKTWKDAINTTTKDKNVDFQSIEDYLEFRMIDTGAPFVEALMLFGLGMSLSPQEDDALGHVIRPCFAALALTNDYFSFDREIEEVDTSTLINSVAIVMRIQSLDIPTAKTIINETIQKYEREFLRRIDEYKQHKGPISNKIEQYMEAMTYQISGNLVWSLNCPRYNPDYRYGLEACQHEG
萜类合酶4(简称GGPPS-Aa)具有SEQ ID NO:4所示的氨基酸序列,具体如下:
MSTETHPFASPNAIPPRTSSTGQVTNGYPINPRHSVLRPLSEIDWMSQSKKSKTSHVSTEPLNSTQPHTRTLSQPQSQPDPMNLEEVSTNYPTPLSPPSDTKNLGEDLIYGNGAAWTEEKERILLGPYDYLWGHPGKDIRSQCIAAFNLWLKVPPERLEVITRAVGMLHTASLLVDDVEDSSILRRGIPVANSIFGVAQTINSANYVYFKALQELMHMGNPKLIEIFTEELLNLHRGQGMDLYWRDSLTCPSEADYLEMVGNKTGGLFRLAIKLMQAESAVQVDCAPLVSTIGLLFQILDDHLNLSPTSGYSSLKGLCEDLTEGKFSFPVIHAIRADPSNQILINILKQKTTDEEVKRYALKYMESKGSFEYSKRVIDDLRGKTEGLVSGIEKGLGEEGTQGAEALRKMLGRLVLR
萜类合酶5(简称AaTS)具有SEQ ID NO:5所示的氨基酸序列,具体如下:
MRYQYSERVESHRYRDDGLANNIHLRIHKDSYKEVIGTLRAQNDWSRLVSSMTKYHGGLGDLFSFISVTIPECLPERLEVVAYANEYAFLYDDQMERLDLKDFREGRDDMLDIFGIHGGASNLEDRRPEKTLQLQIFDELMAIDQDRAIVTMQAWAKFIDLASRTRVEPFNTLAAYLPSRTIDAGELFWFGMLTFAMALTIPAHELDVCMRLARPGYEAISLINDIYSWPKERAEAEKAGQDYVFNAVWVVMKERKCDEQKATEFCKNLARQSIQDFSTSVNTPQVTELSCDSRTYLGAVRLSYVGNLVWSIYCPRYNIAVPVYHSKL
萜类合酶6(简称FgAS)具有SEQ ID NO:6所示的氨基酸序列,具体如下:
MDFTYRYSFEPTDYDTDGLCDGVPVRMHKGADLDEVAIFKAQYDWEKHVGPKLPFRGALGPRHNLICLTLPECLPERLEIVSYANEFAFLHDDITDVESAETVAAENDEFLDALQQGVREGDIQSRESGKRHLQAWIFKSMVAIDRDRAVAAMNAWATFINTGAGCAHDTNFKSLDEYLHYRATDVGYMFWHALIIFGCAITIPEHEIELCHQLALPAIMSVTLTNDIWSYGKEAEAAEKSGKPGDFVNALVVLMREHNCSIEEAERLCRARNKIEVAKCLQVTKETRERKDVSQDLKDYLYHMLFGVSGNAIWSTQCRRYDMTAPYNERQQARLKQTKGELTSTYDPVQAAKEAMMESTRPEIHRLPTPDSPRKESFAVRPLVNGSGQYNGNNHINGVSNEVDVRPSIERHASTKRATSADDIDWTAHKKVDSGADHKKTLSDIMLQELPPMEDDVVMEPYRYLCSLPSKGVRNKTIDALNFWLKVPIENANTIKAITESLHGSSLMLDDIEDHSQLRRGKPSAHAVFGEAQTINSATFQYIQSVSLISQLRSPKALNIFVDEIRQLFIGQAYELQWTSNMICPPLEEYLRMVDGKTGGLFRLLTRLMAAESTTEVDVDFSRLCQLFGRYFQIRDDYANLKLADYTEQKGFCEDLDEGKFSLPLIIAFNENNKAPKAVAQLRGLMMQRCVNGGLTFEQKVLALNLIEEAGGISGTEKVLHSLYGEMEAELERLAGVFGAENHQLELILEMLRID
根据本发明的实施例,FgMS、D510A、FgGS和FgAS是由红豆杉的禾谷镰刀菌中分离得到的,GGPPS-Aa以及AaTS是由红豆杉的交链格孢中分离得到的。
根据本发明的实施例,通过将FgMS、D510A、FgGS、GGPPS-Aa、FgAS和AaTS在NCBI数据库中进行同源比对,发现序列号为XP_018034954.1、AHY23929.1、XP_002846409.1、XP_003025181.1、XP_003236661.1、CEF73922.1、XP_009262810.1、OBS27829.1、XP_011317573.1、EYB24413.1、XP_011317623.1、OBS27869.1、XP_009262762.1、XP_003343918.1、KFA74407.1与FgMS、D510A、FgGS、FgAS、GGPPS-Aa以及AaTS同源性较高,进而推测出上述序列也同样具有广谱的萜类合酶特性,能够催化多种底物,以获得不同萜类化合物。
核酸分子
在本发明的另一方面,本发明提出了一种核酸分子。根据本发明的实施例,该核酸分子编码前面的萜类合酶。由此,根据本发明实施例的核酸分子能够有效地编码萜类合酶,所得到的萜类合酶具有广谱性,能够催化多种底物,以便获得不同萜类化合物。
根据本发明的实施例,核酸分子具有SEQ ID NO:7~12任一项所示的核苷酸序列。由此,根据本发明实施例的核酸分子能够有效地编码萜类合酶,从而催化多种底物,以便获得不同萜类化合物。
核酸分子1具有SEQ ID NO:7所示的核苷酸序列,能够编码FgMS,具体核苷酸序列如下:
ATGGATTTCACCTACCGTTATAGCTTTGAACCGACCGACTACGATACCGACGGTCTGTGCGACGGTGTGCCGGTTCGTATGCACAAGGGTGCGGATCTGGACGAAGTGGCGATCTTCAAAGCGCAGTATGACTGGGAGAAGCACGTTGGCCCGAAACTGCCGTTCCGTGGTGCGCTGGGTCCGCGTCACAACTTTATTTGCCTGACCCTGCCGGAATGCCTGCCGGAACGTCTGGAGATCGTGAGCTACGCGAACGAGTTCGCGTTTCTGCACGACGATATTACCGATGTGGAAAGCGCGGAGACCGTTGCGGCGGAAAACGATGAGTTCCTGGACGCGCTGCAGCAAGGTGTTCGTGAAGGCGACATCCAAAGCCGTGAGAGCGGCAAGCGTCACCTGCAGGCGTGGATTTTTAAAAGCATGGTGGCGATCGATCGTGACCGTGCGGTTGCGGCGATGAACGCGTGGGCGACCTTCATTAACACCGGTGCGGGCTGCGCGCACGATACCAACTTTAAGAGCCTGGACGAGTACCTGCACTATCGTGCGACCGACGTGGGTTACATGTTCTGGCACGCGCTGATCATTTTTGGCTGCGCGATCACCATTCCGGAGCACGAAATCGAGCTGTGCCACCAGCTGGCGCTGCCGGCGATTATGAGCGTGACCCTGACCAACGACATCTGGAGCTATGGTAAAGAAGCGGAGGCGGCGGAAAAGAGCGGTAAACCGGGCGACTTCGTTAACGCGCTGGTTGTGCTGATGCGTGAACACAACTGCAGCATTGAGGAAGCGGAGCGTCTGTGCCGTGCGCGTAACAAGATCGAGGTGGCGAAATGCCTGCAAGTTACCAAGGAAACCCGTGAGCGTAAAGATGTGAGCCAGGATCTGAAGGACTACCTGTATCACATGCTGTTTGGTGTTAGCGGCAACGCGATCTGGAGCACCCAGTGCCGTCGTTACGACATGACCGCGCCGTATAACGAACGTCAGCAAGCGCGTCTGAAGCAAACCAAAGGCGAGCTGACCAGCACCTACGATCCGGTTCAGGCGGCGAAGGAAGCGATGATGGAGAGCACCCGTCCGGAAATTCACCGTCTGCCGACCCCGGACAGCCCGCGTAAAGAGAGCTTCGCGGTGCGTCCGCTGGTTAACGGTAGCGGCCAATATAACGGTAACAACCACATTAACGGCGTGAGCAACGAAGTGGACGTTCGTCCGAGCATCGAGCGTCACGCGAGCACCAAACGTGCGACCAGCGCGGACGACATCGATTGGACCGCGCACAAGAAAGTTGATAGCGGTGCGGACCACAAGAAAACCCTGAGCGACATTATGCTGCAGGAACTGCCGCCGATGGAGGACGATGTGGTTATGGAACCGTACCGTTATCTGTGCAGCCTGCCGAGCAAGGGTGTGCGTAACAAAACCATTGATGCGCTGAACTTTTGGCTGAAGGTTCCGATCGAAAACGCGAACACCATCAAAGCGATTACCGAGAGCCTGCACGGCAGCAGCCTGATGCTGGACGACATCGAAGACCACAGCCAACTGCGTCGTGGCAAGCCGAGCGCGCACGCGGTGTTCGGCGAGGCGCAGACCATTAACAGCGCGACCTTTCAGTACATTCAAAGCGTGAGCCTGATCAGCCAACTGCGTAGCCCGAAAGCGCTGAACATCTTCGTTGATGAAATTCGTCAGCTGTTTATCGGTCAAGCGTACGAGCTGCAGTGGACCAGCAACATGATCTGCCCGCCGCTGGAGGAATATCTGCGTATGGTTGACGGCAAGACCGGTGGCCTGTTCCGTCTGCTGACCCGTCTGATGGCGGCGGAAAGCACCACCGAGGTGGATGTTGACTTTAGCCGTCTGTGCCAACTGTTCGGTCGTTACTTTCAGATCCGTGACGATTATGCGAACCTGAAGCTGGCGGATTACACCGAACAGAAAGGTTTCTGCGAGGACCTGGACGAGGGCAAATTCAGCCTGCCGCTGATCATTGCGTTTAACGAGAACAACAAGGCGCCGAAAGCGGTGGCGCAACTGCGTGGCCTGATGATGCAGCGTTGCGTGAACGGTGGCCTGACCTTCGAACAAAAGGTTCTGGCGCTGAACCTGATTGAGGAAGCGGGTGGCATCAGCGGTACCGAGAAAGTGCTGCACAGCCTGTATGGCGAAATGGAGGCGGAACTGGAGCGTCTGGCGGGTGTTTTTGGCGCGGAGAACCACCAGCTGGAACTGATTCTGGAGATGCTGCGTATCGACTAA
核酸分子2具有SEQ ID NO:8所示的核苷酸序列,编码D510A,具体核苷酸序列如下:
ATGGATTTCACCTACCGTTATAGCTTTGAACCGACCGACTACGATACCGACGGTCTGTGCGACGGTGTGCCGGTTCGTATGCACAAGGGTGCGGATCTGGACGAAGTGGCGATCTTCAAAGCGCAGTATGACTGGGAGAAGCACGTTGGCCCGAAACTGCCGTTCCGTGGTGCGCTGGGTCCGCGTCACAACTTTATTTGCCTGACCCTGCCGGAATGCCTGCCGGAACGTCTGGAGATCGTGAGCTACGCGAACGAGTTCGCGTTTCTGCACGACGATATTACCGATGTGGAAAGCGCGGAGACCGTTGCGGCGGAAAACGATGAGTTCCTGGACGCGCTGCAGCAAGGTGTTCGTGAAGGCGACATCCAAAGCCGTGAGAGCGGCAAGCGTCACCTGCAGGCGTGGATTTTTAAAAGCATGGTGGCGATCGATCGTGACCGTGCGGTTGCGGCGATGAACGCGTGGGCGACCTTCATTAACACCGGTGCGGGCTGCGCGCACGATACCAACTTTAAGAGCCTGGACGAGTACCTGCACTATCGTGCGACCGACGTGGGTTACATGTTCTGGCACGCGCTGATCATTTTTGGCTGCGCGATCACCATTCCGGAGCACGAAATCGAGCTGTGCCACCAGCTGGCGCTGCCGGCGATTATGAGCGTGACCCTGACCAACGACATCTGGAGCTATGGTAAAGAAGCGGAGGCGGCGGAAAAGAGCGGTAAACCGGGCGACTTCGTTAACGCGCTGGTTGTGCTGATGCGTGAACACAACTGCAGCATTGAGGAAGCGGAGCGTCTGTGCCGTGCGCGTAACAAGATCGAGGTGGCGAAATGCCTGCAAGTTACCAAGGAAACCCGTGAGCGTAAAGATGTGAGCCAGGATCTGAAGGACTACCTGTATCACATGCTGTTTGGTGTTAGCGGCAACGCGATCTGGAGCACCCAGTGCCGTCGTTACGACATGACCGCGCCGTATAACGAACGTCAGCAAGCGCGTCTGAAGCAAACCAAAGGCGAGCTGACCAGCACCTACGATCCGGTTCAGGCGGCGAAGGAAGCGATGATGGAGAGCACCCGTCCGGAAATTCACCGTCTGCCGACCCCGGACAGCCCGCGTAAAGAGAGCTTCGCGGTGCGTCCGCTGGTTAACGGTAGCGGCCAATATAACGGTAACAACCACATTAACGGCGTGAGCAACGAAGTGGACGTTCGTCCGAGCATCGAGCGTCACGCGAGCACCAAACGTGCGACCAGCGCGGACGACATCGATTGGACCGCGCACAAGAAAGTTGATAGCGGTGCGGACCACAAGAAAACCCTGAGCGACATTATGCTGCAGGAACTGCCGCCGATGGAGGACGATGTGGTTATGGAACCGTACCGTTATCTGTGCAGCCTGCCGAGCAAGGGTGTGCGTAACAAAACCATTGATGCGCTGAACTTTTGGCTGAAGGTTCCGATCGAAAACGCGAACACCATCAAAGCGATTACCGAGAGCCTGCACGGCAGCAGCCTGATGCTGGCCGACATCGAAGACCACAGCCAACTGCGTCGTGGCAAGCCGAGCGCGCACGCGGTGTTCGGCGAGGCGCAGACCATTAACAGCGCGACCTTTCAGTACATTCAAAGCGTGAGCCTGATCAGCCAACTGCGTAGCCCGAAAGCGCTGAACATCTTCGTTGATGAAATTCGTCAGCTGTTTATCGGTCAAGCGTACGAGCTGCAGTGGACCAGCAACATGATCTGCCCGCCGCTGGAGGAATATCTGCGTATGGTTGACGGCAAGACCGGTGGCCTGTTCCGTCTGCTGACCCGTCTGATGGCGGCGGAAAGCACCACCGAGGTGGATGTTGACTTTAGCCGTCTGTGCCAACTGTTCGGTCGTTACTTTCAGATCCGTGACGATTATGCGAACCTGAAGCTGGCGGATTACACCGAACAGAAAGGTTTCTGCGAGGACCTGGACGAGGGCAAATTCAGCCTGCCGCTGATCATTGCGTTTAACGAGAACAACAAGGCGCCGAAAGCGGTGGCGCAACTGCGTGGCCTGATGATGCAGCGTTGCGTGAACGGTGGCCTGACCTTCGAACAAAAGGTTCTGGCGCTGAACCTGATTGAGGAAGCGGGTGGCATCAGCGGTACCGAGAAAGTGCTGCACAGCCTGTATGGCGAAATGGAGGCGGAACTGGAGCGTCTGGCGGGTGTTTTTGGCGCGGAGAACCACCAGCTGGAACTGATTCTGGAGATGCTGCGTATCGACTAA
核酸分子3具有SEQ ID NO:9所示的核苷酸序列,编码FgGS,具体核苷酸序列如下:
ATGGATCCCTACAGTGAAACATCAGATCTTGTTGACATTTCTCGCTTCGACACCCACGGCCTTGGAGCTAATTACAAACTACGACGACATAAGTTCGAACACCTAGCTGACACTGGATGTCACAAAGCAAGGTCAGATTGGGTAAAATACATTGGCCCTCTTACTGAATTCGGAGGCTGCAATCACATCAACGGGAATTTCTCTGCTGTAGTGTTGCCATTGTGCAGACCTGACCGCCTGGAGCTTATAGCATATGTACTCGAATTCGCATTTCTTCATGATTCCGTTCTCGAGTCAGAAAACACGTCTCCGGAATCCGAAGTGCAAGCCGAGGCTGGTCTACGCCTCTTATATGAACGATGCATAAGTCGACTCTTGCAGACAGACGAAGTATGCGCCAAAAAGATTGCAAAGACGTGGAAAGACGCGATCAACACAACTACAAAGGATAAGAACGTGGACTTCCAATCTATAGAAGACTACTTGGAGTTTCGCATGATTGATACTGGTGCACCGTTCGTCGAGGCCCTCATGCTTTTTGGATTGGGCATGTCGCTTTCACCGCAAGAAGATGATGCTCTTGGTCACGTTATTCGGCCATGTTTCGCCGCTTTGGCGTTGACGAACGACTACTTTTCGTTTGATCGAGAGATAGAAGAAGTCGATACTTCTACTCTTATCAACTCGGTTGCCATAGTAATGCGAATTCAGAGTCTGGACATTCCCACCGCCAAGACAATTATCAATGAGACTATACAGAAGTACGAGCGAGAGTTCCTCCGACGCATTGATGAGTACAAACAGCACAAAGGACCAATCTCTAACAAGATTGAACAATACATGGAAGCTATGACTTATCAGATCAGTGGGAATTTAGTATGGAGTCTGAATTGTCCTAGATATAATCCTGACTATCGGTACGGACTGGAGGCTTGTCAGCACGAGGGTTGA
核酸分子4具有SEQ ID NO:10所示的核苷酸序列,编码GGPPS-Aa,具体核苷酸序列如下:
ATGTCTACTGAAACGCATCCTTTCGCCTCGCCGAACGCCATACCACCTCGAACCAGCTCTACTGGCCAAGTCACGAACGGCTATCCTATAAATCCGCGGCACAGCGTCTTGCGCCCGCTCTCAGAAATTGACTGGATGAGCCAAAGTAAAAAGAGCAAGACCTCACACGTTTCCACCGAACCACTCAACAGCACACAACCACACACACGCACGCTGTCGCAACCACAGTCGCAGCCCGACCCTATGAACCTCGAAGAAGTCAGCACAAACTACCCCACCCCGCTCTCCCCGCCGAGTGACACCAAGAACCTGGGCGAAGACCTCATATACGGCAACGGCGCAGCATGGACAGAAGAGAAGGAGCGCATACTGCTGGGGCCTTATGATTACCTTTGGGGTCACCCGGGCAAGGACATAAGGTCACAATGCATAGCAGCGTTCAACCTGTGGCTGAAAGTACCACCAGAGCGGCTTGAGGTCATAACGCGCGCGGTGGGCATGCTACACACAGCATCTCTTTTGGTCGACGATGTCGAAGACAGCTCAATATTACGGCGAGGCATTCCTGTCGCGAATAGCATATTCGGCGTTGCGCAGACGATCAACTCGGCGAACTACGTATACTTCAAGGCGTTGCAGGAGCTGATGCACATGGGCAATCCCAAGCTCATCGAGATCTTCACAGAAGAGCTGTTGAACCTGCACAGAGGCCAGGGAATGGATCTGTACTGGCGGGACAGTTTGACATGTCCTAGCGAAGCAGATTACCTAGAGATGGTAGGCAACAAGACCGGTGGCCTGTTCAGGCTAGCGATCAAGCTCATGCAGGCCGAAAGCGCAGTACAAGTCGACTGCGCACCCCTCGTCTCCACAATCGGCCTCCTCTTCCAGATCCTCGACGATCACCTCAATCTCTCCCCCACGTCGGGCTACTCCTCGCTCAAAGGCCTCTGCGAAGACCTCACCGAAGGCAAATTCTCCTTCCCCGTCATCCACGCTATCCGCGCCGACCCGTCGAACCAGATCCTCATCAACATCCTCAAGCAGAAAACTACAGATGAGGAGGTCAAGCGCTATGCGCTCAAGTACATGGAGAGTAAGGGTAGCTTTGAATATTCCAAGAGGGTTATTGATGACTTGAGGGGGAAGACGGAGGGGCTTGTCAGTGGGATTGAGAAGGGGTTGGGCGAGGAGGGGACGCAGGGGGCGGAGGCGTTGAGGAAAATGTTAGGGAGGTTGGTGTTGAGGTAG
核酸分子5具有SEQ ID NO:11所示的核苷酸序列,编码AaTS,具体核苷酸序列如下:
ATGCGTTACCAGTATAGCGAGCGTGTGGAAAGCCACCGTTATCGTGACGATGGTCTGGCGAACAACATTCACCTGCGTATCCACAAGGATAGCTACAAAGAAGTGATTGGCACCCTGCGTGCGCAAAACGACTGGAGCCGTCTGGTTAGCAGCATGACCAAGTATCACGGTGGCCTGGGCGACCTGTTCAGCTTTATTAGCGTTACCATCCCGGAATGCCTGCCGGAGCGTCTGGAAGTGGTTGCGTACGCGAACGAGTATGCGTTCCTGTACGACGATCAGATGGAACGTCTGGACCTGAAAGATTTCCGTGAGGGTCGTGACGATATGCTGGACATCTTTGGCATTCACGGTGGCGCGAGCAACCTGGAGGATCGTCGTCCGGAAAAGACCCTGCAGCTGCAAATTTTTGACGAGCTGATGGCGATTGACCAGGATCGTGCGATCGTGACCATGCAAGCGTGGGCGAAATTCATCGATCTGGCGAGCCGTACCCGTGTTGAACCGTTTAACACCCTGGCGGCGTATCTGCCGAGCCGTACCATTGACGCGGGCGAGCTGTTCTGGTTTGGCATGCTGACCTTCGCGATGGCGCTGACCATCCCGGCGCACGAACTGGATGTGTGCATGCGTCTGGCGCGTCCGGGTTATGAGGCGATCAGCCTGATTAACGACATCTACAGCTGGCCGAAGGAACGTGCGGAGGCGGAAAAAGCGGGCCAGGATTACGTGTTTAACGCGGTTTGGGTGGTTATGAAGGAGCGTAAATGCGACGAACAAAAGGCGACCGAGTTCTGCAAAAACCTGGCGCGTCAGAGCATCCAAGATTTTAGCACCAGCGTGAACACCCCGCAAGTTACCGAGCTGAGCTGCGACAGCCGTACCTATCTGGGTGCGGTTCGTCTGAGCTACGTGGGCAACCTGGTTTGGAGCATTTATTGCCCGCGTTACAACATCGCGGTGCCGGTTTACCACAGCAAGCTGTA
核酸分子6具有SEQ ID NO:12所示的核苷酸序列,编码FgAS,具体核苷酸序列如下:
ATGGATTTCACCTACCGTTATAGCTTTGAACCGACCGACTACGATACCGACGGTCTGTGCGACGGTGTGCCGGTTCGTATGCACAAGGGTGCGGATCTGGACGAAGTGGCGATCTTCAAAGCGCAGTATGACTGGGAGAAGCACGTTGGCCCGAAACTGCCGTTCCGTGGTGCGCTGGGTCCGCGTCACAACCTGATTTGCCTGACCCTGCCGGAATGCCTGCCGGAACGTCTGGAGATCGTGAGCTACGCGAACGAGTTCGCGTTTCTGCACGACGATATTACCGATGTGGAAAGCGCGGAGACCGTTGCGGCGGAAAACGATGAGTTCCTGGACGCGCTGCAGCAAGGTGTTCGTGAAGGCGACATCCAAAGCCGTGAGAGCGGCAAGCGTCACCTGCAGGCGTGGATTTTTAAAAGCATGGTGGCGATCGATCGTGACCGTGCGGTTGCGGCGATGAACGCGTGGGCGACCTTCATTAACACCGGTGCGGGCTGCGCGCACGATACCAACTTTAAGAGCCTGGACGAGTACCTGCACTATCGTGCGACCGACGTGGGTTACATGTTCTGGCACGCGCTGATCATTTTTGGCTGCGCGATCACCATTCCGGAGCACGAAATCGAGCTGTGCCACCAGCTGGCGCTGCCGGCGATTATGAGCGTGACCCTGACCAACGACATCTGGAGCTATGGTAAAGAAGCGGAGGCGGCGGAAAAGAGCGGTAAACCGGGCGACTTCGTTAACGCGCTGGTTGTGCTGATGCGTGAACACAACTGCAGCATTGAGGAAGCGGAGCGTCTGTGCCGTGCGCGTAACAAGATCGAGGTGGCGAAATGCCTGCAAGTTACCAAGGAAACCCGTGAGCGTAAAGATGTGAGCCAGGATCTGAAGGACTACCTGTATCACATGCTGTTTGGTGTTAGCGGCAACGCGATCTGGAGCACCCAGTGCCGTCGTTACGACATGACCGCGCCGTATAACGAACGTCAGCAAGCGCGTCTGAAGCAAACCAAAGGCGAGCTGACCAGCACCTACGATCCGGTTCAGGCGGCGAAGGAAGCGATGATGGAGAGCACCCGTCCGGAAATTCACCGTCTGCCGACCCCGGACAGCCCGCGTAAAGAGAGCTTCGCGGTGCGTCCGCTGGTTAACGGTAGCGGCCAATATAACGGTAACAACCACATTAACGGCGTGAGCAACGAAGTGGACGTTCGTCCGAGCATCGAGCGTCACGCGAGCACCAAACGTGCGACCAGCGCGGACGACATCGATTGGACCGCGCACAAGAAAGTTGATAGCGGTGCGGACCACAAGAAAACCCTGAGCGACATTATGCTGCAGGAACTGCCGCCGATGGAGGACGATGTGGTTATGGAACCGTACCGTTATCTGTGCAGCCTGCCGAGCAAGGGTGTGCGTAACAAAACCATTGATGCGCTGAACTTTTGGCTGAAGGTTCCGATCGAAAACGCGAACACCATCAAAGCGATTACCGAGAGCCTGCACGGCAGCAGCCTGATGCTGGACGACATCGAAGACCACAGCCAACTGCGTCGTGGCAAGCCGAGCGCGCACGCGGTGTTCGGCGAGGCGCAGACCATTAACAGCGCGACCTTTCAGTACATTCAAAGCGTGAGCCTGATCAGCCAACTGCGTAGCCCGAAAGCGCTGAACATCTTCGTTGATGAAATTCGTCAGCTGTTTATCGGTCAAGCGTACGAGCTGCAGTGGACCAGCAACATGATCTGCCCGCCGCTGGAGGAATATCTGCGTATGGTTGACGGCAAGACCGGTGGCCTGTTCCGTCTGCTGACCCGTCTGATGGCGGCGGAAAGCACCACCGAGGTGGATGTTGACTTTAGCCGTCTGTGCCAACTGTTCGGTCGTTACTTTCAGATCCGTGACGATTATGCGAACCTGAAGCTGGCGGATTACACCGAACAGAAAGGTTTCTGCGAGGACCTGGACGAGGGCAAATTCAGCCTGCCGCTGATCATTGCGTTTAACGAGAACAACAAGGCGCCGAAAGCGGTGGCGCAACTGCGTGGCCTGATGATGCAGCGTTGCGTGAACGGTGGCCTGACCTTCGAACAAAAGGTTCTGGCGCTGAACCTGATTGAGGAAGCGGGTGGCATCAGCGGTACCGAGAAAGTGCTGCACAGCCTGTATGGCGAAATGGAGGCGGAACTGGAGCGTCTGGCGGGTGTTTTTGGCGCGGAGAACCACCAGCTGGAACTGATTCTGGAGATGCTGCGTATCGACTAA
本领域技术人员能够理解的是,前面针对萜类合酶所描述的特征和优点,同样适用于该核酸分子,在此不再赘述。
构建体
在本发明的又一方面,本发明提出了一种构建体。根据本发明的实施例,该构建体含有前面所述的核酸分子。由此,根据本发明实施例的构建体可以通过表达核酸分子,编码合成萜类合酶,从而催化多种底物,以便获得不同萜类化合物。
本领域技术人员能够理解的是,前面针对核酸分子所描述的特征和优点,同样适用于该构建体,在此不再赘述。
重组细胞
在本发明的又一方面,本发明提出了一种重组细胞。根据本发明的实施例,该重组细胞中含有:第一核酸分子,第一核酸分子编码萜类合酶。由此,通过培养该重组细胞,获得萜类合酶,从而催化多种底物,以便获得不同萜类化合物。
根据本发明的实施例,萜类合酶具有SEQ ID NO:1~6任一项所示的氨基酸序列,根据本发明的另一实施例,第一核酸分子具有SEQ ID NO:7~12任一项所示的核苷酸序列。
根据本发明的实施例,进一步含有:第二核酸分子,第二核酸分子选自下列的至少之一:来源于大肠杆菌XL1-blue的atoB基因(乙酰乙酰辅酶A硫酯酶)、idi基因(异戊烯焦磷酸异构酶)基因;来源于酿酒酵母INVSC1的erg13(HMG-CoA synthase)基因、tHMG1基因(HMG-CoA还原酶,删除了HMG1的跨膜区域)、erg12基因(甲羟戊酸激酶)、erg8基因(甲羟戊酸-5-磷酸激酶)、mvd1基因(甲羟戊酸-5-焦磷酸激酶)。
发明人发现,上述基因与萜类合酶的催化底物密切相关,可以通过对上述基因进行过量表达,从而获得大量催化底物。进而,在萜类合酶的催化下,能够使得本身合成量较少的萜类化合物大量合成。
本领域技术人员能够理解的是,前面针对萜类合酶和核酸分子所描述的特征和优点,同样适用于该重组细胞,在此不再赘述。
重组细胞在合成萜类化合物中的用途
在本发明的又一方面,本发明提出了一种前面所描述的萜类合酶或核酸分子或构建体或重组细胞在合成萜类化合物中的用途。由此,通过培养该重组细胞,获得萜类合酶,从而催化多种底物,以便获得不同萜类化合物。
根据本发明的实施例,合成是在宿主细胞中进行的,并且萜类合酶的催化底物是通过在宿主细胞中过量表达下列至少之一的基因而获得的:来源于大肠杆菌XL1-blue的atoB基因或idi基因;来源于酿酒酵母INVSC1的erg13基因、tHMG1基因、erg12基因、erg8基因或mvd1基因。通过对上述基因进行过量表达,从而获得大量底物。进而,在萜类合酶的催化下,能够使得本身合成量较少的萜类化合物大量合成。
需要说明的是,由于本发明的萜类合酶具有广谱性,能够催化不同的底物,以获得不同萜类化合物。根据本发明的实施例,萜类化合物具有下列之一的结构。发明人发现,在前面所描述的萜类合酶催化作用下获得了新的萜类化合物,例如化合物(5)、(6)、(7)、(8)、(9)、(10)、(11)、(12)和(54)。
Figure GDA0003071701110000111
本领域技术人员能够理解的是,前面针对萜类合酶、核酸分子、构建体及重组细胞所描述的特征和优点,同样适用于该用途,在此不再赘述。
合成萜类化合物的方法
在本发明的又一方面,本发明提出了一种合成前面所述萜类化合物的方法。根据本发明的实施例,该方法包括:在适于萜类化合物表达的条件下,培养前面重组细胞,以便获得培养产物;以及从培养产物中分离萜类化合物。由此,以便获得大量不同萜类化合物。
本领域技术人员能够理解的是,前面针对重组细胞所描述的特征和优点,同样适用于该合成萜类化合物的方法,在此不再赘述。
下面将结合实施例对本发明的方案进行解释。本领域技术人员将会理解,下面的实施例仅用于说明本发明,而不应视为限定本发明的范围。实施例中未注明具体技术或条件的,按照本领域内的文献所描述的技术或条件或者按照产品说明书进行。所用试剂或仪器未注明生产厂商者,均为可以通过市购获得的常规产品。
实施例1体外验证萜类合酶的功能
(1)蛋白的纯化
将含有目的基因(SEQ ID NO:7~12任一项所示的核苷酸序列)的表达载体转化表达宿主E.coli BL21(DE3),转化后挑取单克隆至含相应抗生素的LB培养基中,37℃,220rpm过夜培养。按1%接种量转接至1L含相应抗生素的新鲜的LB培养基中,37℃,220rpm培养至OD600约为0.6-0.8,降温至16℃,加入终浓度为0.1mM的IPTG,16℃,220rpm培养16-18h。8000rpm离心5min收集细胞,之后用30-40mL蛋白纯化缓冲液A(Buffer A:50mM Tris-HCl,300mM NaCl,4mMβ-巯基乙醇,pH 7.6)彻底重悬细胞,超声破碎(脉冲5s,停顿8s,超声破碎5min)。4℃,12,000g离心30min以上,收集上清,4℃,20,000rpm离心1h,收集上清,用0.45μm滤膜进行过滤,加入6%buffer B(Buffer B:500mM咪唑加入到Buffer A中)使咪唑约为30mM,混匀备用。
使用Bio-Rad的Biologic DuoFlow Chromatography System纯化组氨酸标签蛋白。蛋白分离柱加载至FPLC上加以控制,FPLC的流速始终为1.5mL/min,样品自动上样的流速为2mL/min。所得到的上清样品用5mL Hitrap HP Ni-NTA柱子经Biorad做第一步纯化,该镍离子螯合柱先经过30mL(6个柱体积)缓冲液A(Buffer A:50mM Tris-HCl,300mM NaCl,4mMβ-巯基乙醇,pH7.6)的平衡,然后通过自动进样器将准备好的30mL上清液加载到柱子上,再用20mL的缓冲液A(4个柱体积)对柱子进行清洗,这时启动缓冲液B(50mM Tris-HCl,150mM NaCl,250mM Imidazole pH 7.6)的线性梯度,在100mL(20个柱体积)的流量内,缓冲液B由0%增长为100%,再用20mL(4个柱体积)100%的缓冲液B清洗柱子。根据紫外吸收收集并通过SDS-PAGE检测带有组氨酸标签的目的蛋白。挑选比较纯的组分收集起来,通过Millipore公司的离心浓缩管Amicon Centricon-10(分子量在10,000以下的会被滤出)来离心浓缩至2.5mL,然后通过Pharmacia公司的PD-10柱子脱盐并交换到缓冲液C(20mMTris-HCl,10mM NaCl,pH 7.6)中。
从PD-10柱子上出来的蛋白体积被稀释为3.5mL,并将样品加载到离子交换柱Hitrap 16/10Q/FF上,并用FPLC加以纯化。该离子交换柱在完成样品装载后先用缓冲液C冲洗20mL(1个柱体积),再开始用缓冲液D(20mM Tris-HCl,1M NaCl,pH 7.6)来进行梯度洗脱,在20mL流量中,缓冲液D由0%增长到30%;再经过流量40mL(2个柱体积),缓冲液D由30%增长到50%;再经过流量20mL(1个柱体积),缓冲液D由50%增长到100%;最后再用100%的20mL缓冲液D来清洗柱子。根据紫外吸收收集并通过SDS-PAGE检测被洗脱下来的目的蛋白。
得到的蛋白再经过离心浓缩至2mL,再加载到凝胶过滤柱(gel filtrationSuperdex 200色谱柱)上,该柱在上样之前在FPLC上用缓冲液E(含有10%甘油的50mM磷酸缓冲液,pH 7.6)平衡240mL(2个柱体积),根据紫外吸收回收被洗脱下来的目的蛋白(FgMS、D510A、FgGS、GGPPS-Aa和AaTS)。用蛋白离心浓缩柱浓缩样品至2mL,分装后液氮速冻并保存于-80℃冰箱。
(2)萜类化合物合成酶的体外酶促反应
为了充分了解FgMS以及FgGS催化不同底物合成相应产物的潜力,设立了以下体外酶促反应体系:向200μL终浓度为50mM含有10%甘油的PB buffer(pH 7.6)缓冲液中添加10μM纯化的蛋白、100μM的底物(GPP、FPP,GGPP或GFPP)以及2mM的Mg2+,30℃过夜反应。随后用等体积的正己烷萃取2次,合并有机相并用GC-MS检测生成的产物。
萜类化合物检测所用的GC-MS为Thermo TRACE GC ULTRA气相色谱配备TSQQUANTUM XLS MS,气相色谱柱为TRACE TR-5MS(30m×0.25mm×0.25um)。每次分析进样1μL,以高纯的氦气为载气,设置流速为1mL/min。GC条件为80℃维持1min,随后以10℃/min的速率升温到220℃,再在220℃维持15min。进样器和传输线温度分别设定为230℃和240℃。
结果显示,FgMS以及FgGS两个酶具有非常广泛的底物专一性。它们都能够利用GPP、FPP、GGPP以及GFPP这4种底物合成对应的单萜、倍半萜,二萜以及二倍半萜(图1,图2)。这是迄今为止发现的底物利用最为广泛的萜类合酶。
实施例2构建表达载体
用Qiagen公司的Blood and Cell Culture DNA Mini Kit纯化获得大肠杆菌XL1-blue基因组DNA和酿酒酵母INVSC1基因组DNA。
质粒pMH1含有甲羟戊酸途径前三个基因:来源于大肠杆菌XL1-blue的atoB基因(乙酰乙酰辅酶A硫酯酶,https://www.ncbi.nlm.nih.gov/nucleotide/313848522?report=genbank&log$=nuclalign&blast_rank=74&RID=57CNRDHR014&from=2216464&to=2217648),来源于酿酒酵母INVSC1的erg13基因(HMG-CoA synthase,https://www.ncbi.nlm.nih.gov/nucleotide/1095459859?report=genbank&log$=nuclalign&blast_rank=1&RID=57DUY RMK014&from=13093&to=14568)和tHMG1基因(HMG-CoA还原酶,删除了HMG1的跨膜区域,https://www.ncbi.nlm.nih.gov/nucleotide/1034554135?report=genbank&log$=nuclalign&blast_rank=1&RID=57DN4VA2015&from=109257&to=110762)。
质粒pFZ81含有甲羟戊酸途径后四个基因:来源于酿酒酵母INVSC1的erg12基因(甲羟戊酸激酶,https://www.ncbi.nlm.nih.gov/nucleotide/1039023426?report=genbank&log$=nuclalign&blast_rank=1&RID=57DY1S95015&from=684102&to=685433),erg8基因(甲羟戊酸-5-磷酸激酶,https://www.ncbi.nlm.nih.gov/nucleotide/767197525?report=genbank&log$=nuclalign&blast_rank=1&RID=57E0JFF3015&from=684167&to=685522)和mvd1基因(甲羟戊酸-5-焦磷酸激酶,https://www.ncbi.nlm.nih.gov/nucleotide/1034554153?report=genbank&log$=nuclalign&blast_rank=1&RID=57E3RE8N015&from=677640&to=678830),来源于大肠杆菌XL1-blue的idi基因(异戊烯焦磷酸异构酶,https://www.ncbi.nlm.nih.gov/nucleotide/1114169151?report=genbank&log$=nuclalign&blast_rank=1&RID=57E42GK1014&from=3614163&to=3614711)。
质粒pGB309含有合成二倍半萜化合物的三个基因,分别是来源于禾谷镰刀菌(Fusarium graminearum)的FgMS基因(SEQ ID NO.7),其氨基酸序列为SEQ ID NO.1;来源于大肠杆菌XL1-blue的idi基因;来源于嗜热脂肪土芽孢杆菌(geobacillusstearothermophilus)的FPPS基因(法尼烯焦磷酸合成酶,https://www.ncbi.nlm.nih.gov/nucleotide/391609?report=genbank&log$=nuclalign&blast_rank=1&RID=57EBD7Z0015&from=85&to=978),该基因经定点突变得到SEQ ID NO:13所示的核苷酸序列,赋予其以GFPPS(香叶基法尼基焦磷酸合成酶)的功能,以IPP和DMAPP为底物合成C25焦磷酸的产物,用于二倍半萜产物的合成。
SEQ ID NO:13所示的核苷酸序列:
GTCGACAGAAGGAGATATACATATGTTTGATTTCAATGAATATATGAAAAGTAAGGCTGTTGCGGTAGACGCGGCTCTGGATAAAGCGATTCCGCTGGAATATCCCGAGAAGATTCACGAATCGATGCGCTACTCCCTGTTAGCAGGAGGGAAACGCGTTCGTCCGGCATTATGCATCGCGGCCTGTGAACTCGTCGGCGGTTCACAGGACTTAGCAATGCCAACTGCTTGCGCAATGGAAATGATTCACACAATGAGCCTGATTCATGATGATTTGCCTTGCATGGACAACGATGACTTTCGGCGCGGTAAACCTACTAATCATAAGGTTTTTGGCGAAGATACTGCAGTGCTGGCGGGCGATGCGCTGCTGTCGTTTGCCTTCGAACATATCGCCGTCGCGACCTCGAAAACCGTCCCGTCGGACCGTACGCTTCGCGTGATTTCCGAGCTGGGAAAGACCATCGGCTCTCAAGGACTCGTGGGTGGTCAGGTAGTTGATATCACGTCTGAGGGTGACGCGAACGTGGACCTGAAAACCCTGGAGTGGATCCATATTCACAAAACGGCCGTGCTGCTGGAATGTAGCGTGGTGTCAGGGGGGATCTTGGGGGGCGCCACGGAGGATGAAATCGCGCGTATTCGTCGTTATGCCCGCTGTGTTGGACTGTTATTTCAGGTGGTGGATGACATCCTGGATGTCACAAAATCCAGCGAAGAGCTTGGCAAGACCGCGGGCAAAGACCTTCTGACGGATAAGGCTACATACCCGAAATTGATGGGCTTGGAGAAAGCCAAGGAGTTCGCAGCTGAACTTGCCACGCGGGCGAAGGAAGAACTCTCTTCTTTCGATCAAATCAAAGCCGCGCCACTGCTGGGCCTCGCCGATTACATTGCGTTTCGTCAGAACTGAGCATGC
质粒pGB310含有合成二萜化合物的三个基因,分别是来源于禾谷镰刀菌并经定点突变(第510位的氨基酸D突变为A)后的缺失链延伸结构域的FgMS,简写为D510A(SEQ IDNO.8),其氨基酸序列为SEQ ID NO.2;来源于大肠杆菌XL1-blue的Idi基因;来源于南方红豆杉(Taxus canadensis)的牻牛儿基牻牛儿基焦磷酸合酶GGPPS(https://www.ncbi.nlm.nih.gov/nucleotide/507118460?report=genbank&log$=nuclalign&blast_rank=1&RID=57EEP8PR014&from=1&to=889),能够以IPP和DMAPP为底物合成香叶基香叶基焦磷酸,用于二萜产物的合成。
质粒pGB311含有合成倍半萜化合物的三个基因,分别是来源于禾谷镰刀菌并经定点突变后的缺失链延伸结构域的D510A,简写为D510A;来源于大肠杆菌XL1-blue的idi基因;来源于大肠杆菌XL1-blue的FPPS,能够以IPP和DMAPP为底物合成法尼基焦磷酸,用于倍半萜的合成。
质粒pGB312含有合成二倍半萜化合物的三个基因,分别是来源于禾谷镰刀菌(Fusarium graminearum)的FgGS基因(SEQ ID NO.9),其氨基酸序列为SEQ ID NO.3;来源于大肠杆菌XL1-blue的idi基因;来源于嗜热脂肪土芽孢杆菌(geobacillusstearothermophilus)的FPPS(法尼烯焦磷酸合成酶),该基因经定点突变得到SEQ ID NO:13所示的核苷酸序列,赋予其以GFPPS(香叶基法尼基焦磷酸合成酶)的功能,以IPP和DMAPP为底物合成C25焦磷酸的产物,用于二倍半萜产物的合成。
质粒pGB313含有合成二萜化合物的三个基因,分别是来源于禾谷镰刀菌的FgGS基因;来源于大肠杆菌XL1-blue的idi基因;来源于南方红豆杉(Taxus canadensis)的牻牛儿基牻牛儿基焦磷酸合酶GGPPS,能够以IPP和DMAPP为底物合成香叶基香叶基焦磷酸,用于二萜产物的合成。
质粒pGB314含有合成倍半萜化合物的三个基因,分别是来源于禾谷镰刀菌的FgGS;来源于大肠杆菌XL1-blue的idi基因;来源于大肠杆菌XL1-blue的FPPS,能够以IPP和DMAPP为底物合成法尼基焦磷酸,用于倍半萜的合成。
所有基因均通过PCR扩增获得,所用引物见表1。
表1引物序列表
Figure GDA0003071701110000141
Figure GDA0003071701110000151
Figure GDA0003071701110000161
具体构建方法如下:
①质粒pMH1的构建
首先将pBBR1MCS质粒的复制子替换为来源于pMSD15质粒的p15A复制子。以质粒pBBR1MCS为模板用引物P1/P2进行扩增,同时p15A复制子用引物P3/P4扩增,经PCR产物纯化后用Nanodrop测定DNA浓度,然后将20ng pCR扩增的p15A片段和等摩尔的pBBR1MCS片段混合,经过一轮PCR扩增,扩增条件为:98℃,2min预变性,然后30个PCR循环98℃,20s;60℃,20s;72℃,6min,最后72℃充分延伸10min。随后转化大肠杆菌XL1-blue获得质粒pBBR1MCS/p15A。
用引物P5/P6以pBBR1MCS/p15A为模板扩增pMH1质粒骨架,同时用P7/P8、P9/P10、P11/P12为引物扩增相应基因。经PCR产物纯化之后,取50ng pBBR1MCS/p15A扩增产物和等摩尔的各基因扩增产物混合,并用去离子水调整体积到5μL,随后加入至15μL的Gibson缓冲液中混匀,50℃反应1h后转化大肠杆菌XL1-blue,挑取克隆,并将阳性克隆测序获得质粒pMH1(图3)。
②质粒pFZ81的构建
用引物P13/P14以pBBR1MCS-2为模板扩增pFZ81质粒骨架,同时用P15/P16、P17/P18、P19/P20、P21/P22为引物扩增相应基因。经PCR产物纯化之后,取50ng pBBR1MCS-2扩增产物和等摩尔的各基因扩增产物混合,并用去离子水调整体积到5μL,随后加入至15μL的Gibson缓冲液中混匀,50℃反应1h后转化大肠杆菌XL1-blue,挑取克隆,并将阳性克隆测序获得质粒pFZ81(图4)。
③质粒pGB309的构建
为了构建产二倍半萜的质粒,我们分别用引物P33/P39,P40/P41以及P37/P38扩增获得FgMS(F.graminearum mangicdiene synthase),GFPPS(SEQ ID NO.9)以及pGB307骨架,并将上述3个片段组装起来获得质粒pGB309(图5)。
④质粒pGB310的构建
以密码子优化后的FgMS为模板,分别以P23/P26以及P24/P25扩增获得D510A定点突变的FgMS片段,并用SOE-PCR将这两个片段连接起来获得突变的D510A,随后将其克隆到pET21a(+)质粒上获得质粒pGB302。将idi基因克隆至pETduet-1获得质粒pGB307。用引物P33/P34,P35/P36以及P37/P38扩增D510A,GGPPS以及质粒pGB307骨架,将上述3个片段组装起来获得质粒pGB310(图6)。
⑤质粒pGB311的构建
用引物P29/P30以及P31/P32分别从E.coli BL21(DE3)基因组上扩增fpps基因以及idi基因,随后将fpps基因克隆至pET21a获得质粒pGB305;将idi克隆至pET21a(+)获得质粒pGB306。分别用XbaI/XhoI,SpeI/XhoI酶切质粒pGB305和pGB306,随后借助同尾酶将pGB306上酶切下来的idi片段连接至质粒pGB305从而获得质粒pGB308。随后用XbaI/XhoI从pGB308上酶切下来fpps-idi片段并借助同尾酶分别将其连接至质粒pGB302,获得质粒pGB311(图7)。
⑥质粒pGB312的构建
用引物P42/46,P41/P47以及P37/P45扩增FgGS(F.graminearum GJ1012synthase),GFPPS以及pGB307质粒骨架,将上述3个片段组装起来获得质粒pGB312(图8)。
⑦质粒pGB313的构建
用引物P42/43,P44/P36以及P37/P45扩增FgGS,GGPPS以及pGB307质粒骨架,将上述3个片段组装起来获得质粒pGB313(图9)。
⑧质粒pGB314的构建
用SacI/HindIII从含有密码子优化的FgGS的质粒pUC57-FgGS(pGB303)酶切下FgGS基因并将其连接到pET21a(+)上获得质粒pGB304。随后用XbaI/XhoI从pGB308上酶切下来fpps-idi片段并借助同尾酶分别将其连接至质粒pGB304上,获得质粒pGB314(图10)。
实施例3合成FgMS来源的二倍半萜化合物
为了生产二倍半萜化合物,将甲羟戊酸途径的两个质粒pMH1和pFZ81同时转入大肠杆菌BL21(DE3)中获得BL21(DE3)/pMH1/pFZ81,命名为PS,随后将pGB309转化进入菌株PS中,获得菌株T7(图12)。
随后分别挑取单克隆至10mL的LB培养基中(同时含有100μg/mL氨苄青霉素,50μg/mL卡那霉素和34μg/mL氯霉素),37℃,220rpm过夜培养,随后按1%接种量接种到新鲜的同一培养基中,37℃,220rpm继续培养至OD600约为0.6~0.8时,降温至16℃并加入终浓度为0.1mM的IPTG进行诱导表达,诱导表达18h后升温至28℃发酵72h,随后用等体积的正己烷萃取2次,减压蒸馏后甲醇复溶,用于产物纯化。
结果显示,含有FgMS的突变株E.coli T7能够以GFPP为底物合成8种二倍半萜化合物(图13c,图14),我们成功对其中化合物(1)和化合物(2)进行纯化鉴定,他们为两个二倍半萜新骨架化合物。其中化合物(1)具有抗炎症效果的化合物mangicol A以及mangicol B的前体物质。化合物(2)为具有抑制血管紧张素II受体以及具免疫抑制效果的二倍半萜化合物variecolin的前体物质。除此之外,通过比对已知二倍半萜化合物的GC-MS数据(图13c,图14),我们发现含有FgMS的突变株E.coli T7合成的化合物(37~42)为潜在的新的萜类化合物。
实施例4合成FgMS来源的二萜化合物
为了生产二萜化合物,将甲羟戊酸途径的两个质粒pMH1和pFZ81同时转入大肠杆菌BL21(DE3)中获得BL21(DE3)/pMH1/pFZ81,命名为PS,随后将pGB310转化进入菌株PS中,获得菌株T8(图12)。随后对其进行发酵及产物萃取,具体方法同实施例3。
结果显示,含有FgMS的突变株E.coli T8能够以GGPP为底物合成10种二萜化合物(图13c,图14)。其中主产物4与文献报道的由链霉菌来源的DtcycB所合成的化合物一致,为含有14元大环的化合物cembrene A(Meguro A,Tomita T,Nishiyama M,etal.Identification and characterization of bacterial diterpene cyclases thatsynthesize the cembrane skeleton[J].ChemBioChem,2013,14(3):316-321.)。此外,对突变株合成的一些二萜类副产物进行数据库搜索(NIST),结果显示,化合物(18)和化合物(19)含有与cembrene A相似的骨架,可能为其不同的立体异构体(图14)。这是我们首次在真菌来源的萜类合酶中发现该类型的单元大环二萜类化合物。成功对其中1个化合物进行纯化鉴定,结果显示,化合物(4)为Cembrebe A。在剩余的9个二萜类化合物中,化合物(16-19)的NIST搜库结果显示,化合物(16)为Trachylobane、化合物(18)为Cyclotetradecatetraene、化合物(17)为E,E-7,11,15-Trimethyl-3-methylene-hexadeca-1,6,10,14-tetraene、化合物(19)为(3E,7E,11E)-1-Isopropyl-4,8,12-trimethylcyclotetradeca-3,7,11-trienol。剩余结构未知的为化合物32-36。
实施例5合成FgMS来源的单萜化合物和倍半萜化合物
为了生产单萜和倍半萜化合物,基于FPPS以IPP和DMAPP为底物合成GPP,然后再加上1分子的IPP生成FPP,将甲羟戊酸途径的两个质粒pMH1和pFZ81同时转入大肠杆菌BL21(DE3)中获得BL21(DE3)/pMH1/pFZ81,命名为PS,随后将pGB311转化进入菌株PS中,获得菌株T9(图12)。随后对其进行发酵及产物萃取,具体方法同实施例3。
结果显示,含有FgMS的突变株E.coli T9能够以FPP为底物合成15种倍半萜化合物及2种单萜化合物(图13c,图14),其中两种单萜化合物为化合物(13)和(14)。化合物(11)为线性的trans-橙花叔醇(trans-nerolidol);化合物(12)为2E,6E-法尼醇(2E,6E-farnesol);NIST搜库结果显示,化合物(15)为a-Farnesene;化合物(20-31)为未知结构倍半萜化合物。通过将化合物(13)和(14)进行NIST搜库,再与对应的标准品进行比对,从而确定其结构。
同时,我们在发酵产物中还检测到了两个单萜化合物芳樟醇(linalool)和松油醇(terpineol),这是由于FPPS在合成FPP过程中会首先合成中间产物GPP所致。
实施例6合成FgGS来源的二倍半萜化合物
为了生产二倍半萜化合物,将甲羟戊酸途径的两个质粒pMH1和pFZ81同时转入大肠杆菌BL21(DE3)中获得BL21(DE3)/pMH1/pFZ81,命名为PS,随后将pGB312转化进入菌株PS中,获得菌株T10(图12)。随后对其进行发酵及产物萃取,具体方法同实施例3。
结果显示,含有FgGS的突变株E.coli T10只能合成二倍半萜化合物(3)(图13c,图14),通过NMR数据我们确认其与文献报道的EvVS合成的单环化合物2E-alpha-cericerene结构一致。
实施例7合成FgGS来源的二萜化合物
为了生产二萜化合物,将甲羟戊酸途径的两个质粒pMH1和pFZ81同时转入大肠杆菌BL21(DE3)中获得BL21(DE3)/pMH1/pFZ81,命名为PS,随后将pGB313转化进入菌株PS中,获得菌株T11(图12)。随后对其进行发酵及产物萃取,具体方法同实施例3。
结果显示,含有FgGS的突变株E.coli T11能够以GGPP为底物合成14种二萜化合物,我们对其中的化合物5-10进行了纯化鉴定(图13c,图14)。结果显示,化合物(5-10)为一类新骨架化合物。其中,化合物(5)为5-5-5-5环的四元二萜化合物;化合物(6)和(8)为具有不同双箭位置的5-5-9环的三元二萜化合物;化合物(7)为5-5-7-4环的四元二萜化合物;化合物(9)和(10)为5-5-7-4以及5-5-6-5环的不含双键的四元二萜醇化合物。值得注意的是,这6个化合物的前两个5-5元环为他们的共有结构。显示了他们在合成的起始阶段有着一些共同的环化步骤,将其命名为GJ1012 A–F。
实施例8合成FgGS来源的单萜化合物和倍半萜化合物
为了生产单萜化合物和倍半萜化合物,基于FPPS以IPP和DMAPP为底物合成GPP,然后再加上1分子的IPP生成FPP,将甲羟戊酸途径的两个质粒pMH1和pFZ81同时转入大肠杆菌BL21(DE3)中获得BL21(DE3)/pMH1/pFZ81,命名为PS,随后将pGB314转化进入菌株PS中,获得菌株T12(图12)。随后对其进行发酵及产物萃取,具体方法同实施例3。
结果显示,含有FgGS的突变株E.coli T12能够以FPP为底物合成4种二萜化合物和3种二萜化合物(图13c,图14),其中两个二萜化合物的结构与FgMS产物化合物(11)和(23)一致;化合物(23)、(43)、(44)为未知结构的二倍半萜化合物。合成的3种化合物分别为化合物(13)和(14)以及芳樟醇(linalool)。
实施例9合成AaTS来源的二萜产物化合物
AaTS为交链格孢(Alternaria alternata)来源的本发明新发现的萜类化合物合成酶。AaTS经密码子优化后通过酶切位点NdeI/EcoRI被连接至载体pET28a上得到质粒pGB136。随后按实施例1描述的方法纯化AaTS蛋白,并进行体外反应。体外反应结果显示,AaTS能够以GGPP为底物合成二萜化合物(图15)。
在证明其能够合成二萜化合物后,我们分别用引物P48/49,P50/P51以及P52/P53扩增获得AaTS,GGPPS-Aa以及pGB307骨架,并通过Gibson方法将上述3个片段组装起来获得质粒pGB147(图11)。随后我们将pMH1、pFZ81以及pGB147共同转化至E.coli BL21(DE3)体内获得突变株T13(图12),按实施例3描述的方法对其进行发酵并产物纯化。
经NMR结果解析,我们确定AaTS合成的产物与文献报道的分离自Cercosporatraversiana的产物Traversiadiene具有相同的结构(图15),该化合物为对软体动物具有很好杀灭效果的Traversianal的前体物质(Stoessl A,Cole RJ,Abramowski Z,etal.Some biological properties of traversianal,a strongly molluscicidalditerpenoid aldehyde from Cercospra traversiana[J].Mycopathologia,1989,106(1):41-46.),AaTS的发现使得通过组合生物合成手段提升Traversiadiene的产量以及研究其生物合成机理成为可能。
实施例10合成FgAS来源的二倍半萜产物化合物
萜类合酶6(FgAS,F.graminearum AJ1012 synthase)为与萜类合酶1(FgMS)具有高度相似性的酶。其与FgMS的区别在第65位氨基酸,FgMS该位点的氨基酸序列为F,FgAS该位点的氨基酸序列为L。利用相同的策略,参照实施例3的方法,在含有FgAS的产二倍半萜菌株中检测到了二倍半萜新骨架化合物(54)。
实施例11化合物鉴定
化合物(1)
图16显示了化合物(1)的谱图,1H NMR数据提示化合物(1)存在4个单峰的甲基信号(Me-20,Me-21,Me-22,Me-25),2个双峰的甲基信号(Me-23和Me-24),以及2个烯氢(H-11和H-18)(表2)。13C NMR和异核单量子相关谱(HSQC)确认存在25个碳原子,其中3个sp3杂化的季碳原子(C-6,C-12和C-15),2个sp2杂化的的季碳原子(C-10和C-19),4个脂肪族次甲基,2个烯次甲基,8个亚甲基以及6个甲基。这些数据提示化合物(1)为四环结构。1H-1H COSY提示的耦合关系有:H-24/H-9/H-8/H-7,H-5/H-23,H-1/H-2以及H-17/H-18。HMBC图谱可以看到甲基氢的相关信号有:Me-20与C-18,C-19,C-21;Me-21与C-18,C-19,C-20;Me-22与C-1,C-14,C-15,C-16;Me-23与C-4,C-5,C-6;Me-24与C-8,C-9,C-10;Me-25与C-1,C-11,C-12,C-13。此外HMBC图谱提示H-1与C-3,H-7与C-5,C-6,C-10;H-11与C-6,C-9,C-12;H-18与C-16之间有耦合关系。因此,化合物(1)的平面结构为一个四环二倍半萜。
化合物(2)
图17显示了化合物(2)的谱图,1H NMR数据提示化合物(2)存在6个甲基信号(Me-20,Me-21,Me-22,Me-23,Me-24,Me-25)和4个烯氢(H-2,H-6,H-9以及H-18)(表3)。13C NMR和HSQC确认存在25个碳原子,其中2个sp3杂化和4个sp2杂化的的季碳原子,4个烯次甲基,9个亚甲基以及6个甲基。这些数据提示化合物(2)为二环结构。1H-1H COSY提示的耦合关系有:H-1/H-2,H-5/H-6,H-8/H-9,H-16/H-17/H-18。HMBC图谱可以看到甲基氢的相关信号有:Me-20与C-2,C-3,C-4;Me-21与C-6,C-7,C-8;Me-22与C-1,C-10,C-11,C-12;M-23与C-13,C-14,C-15,C-16;Me-24与C-18,C-19,C-25;Me-25与C-18,C-19,C-24。此外,C-20与C-21的化学位移为14.96和18,提示C-2和C-3,C-6和C-7之间的双键为E构型。因此,化合物(2)的平面结构为一个11-6元二环二倍半萜。
化合物(3)
图18显示了化合物(3)的谱图,化合物(3)为(2E)-α-cericerene.
Figure GDA0003071701110000201
Figure GDA0003071701110000204
1H NMR数据提示存在6个甲基信号(Me-20,Me-21,Me-22,Me-23,Me-24,Me-25)和5个烯氢(表4)。13C NMR和HSQC确认存在25个碳原子,其中5个sp2杂化的的季碳原子(C-3,C-7,C-11,C-15,C-19),1个脂肪族和4个烯次甲基,8个亚甲基以及6个甲基。这些数据提示化合物(3)为单环结构。1H-1H COSY提示的耦合关系有:H-1/H-2,H-5/H-6,H-9/H-10,H-12/H-13/H-14,H-16/H-17/H-18。HMBC图谱可以看到甲基氢的相关信号有:Me-20与C-2,C-3,C-4;Me-21与C-6,C-7,C-8;Me-22与C-10,C-11,C-12;M-23与C-14,C-15,C-16;Me-24与C-18,C-19,C-25;Me-25与C-18,C-19,C-24。此外HMBC图谱提示H-2与C-14,C-4;H-6与C-4,C-8;H-10与C-8有耦合关系。因此,化合物(3)为一个14元单环二倍半萜。
化合物(4)
图19显示了化合物(4)的谱图,化合物(4)为无色油状化合物(R)-cembrene A。
Figure GDA0003071701110000202
Figure GDA0003071701110000203
1H NMR(400MHz,氘代氯仿)δ5.19(t,J=7.4Hz,1H),5.05(t,J=6.3Hz,1H),4.98(t,J=6.5Hz,1H),4.72–4.69(m,1H),4.67–4.63(m,1H),2.31–2.22(m,1H),2.20–2.17(m,1H),2.17–2.15(m,1H),2.15–2.12(m,2H),2.12–2.09(m,2H),2.07–2.05(m,1H),2.05–1.96(m,3H),1.96–1.89(m,1H),1.84–1.72(m,1H),1.71–1.63(m,1H),1.67–1.65(m,3H),1.59(s,3H),1.57(s,3H),1.56(s,3H),1.44–1.31(m,1H)。13C NMR(101MHz,cdcl3)δ149.29,134.79,133.91,133.43,125.90,124.05,121.85,110.11,45.98,39.41,38.95,33.98,32.43,28.21,24.89,23.76,19.31,18.00,15.52,15.30。HRMS(ESI)calculated for C20H31[M-H]+:m/z 271.2420;m/z found:271.2405.这些数据与以前报道的(R)-cembrene A一致。
化合物(5)
图20显示了化合物(5)的谱图,1H NMR数据提示化合物(5)存在4个单峰的甲基信号(Me-16,Me-18,Me-19,Me-20),1个双峰的甲基信号(Me-17),以及1个烯氢(H-4)(表5)。13CNMR和HSQC确认存在20个碳原子,其中3个sp3杂化的季碳原子(C-7,C-11,C-15),1个sp2杂化的的季碳原子(C-3),4个脂肪族次甲基,1个烯次甲基,6个亚甲基以及5个甲基。这些数据提示化合物(5)为四环结构。1H-1H COSY提示的耦合关系有:H-1/H-2/H-10/H-9/H-8,H-6/H-17。HMBC图谱可以看到甲基氢的相关信号有Me-16与C-3,C-4,C-7;Me-17与C-5,C-6,C-7;Me-18与C-1,C-11,C-12,C-14;M-19与C-13,C-14,C-15,C-20;Me-20与C-13,C-14,C-15,C-19。此外HMBC图谱提示H-6与C-2,C-3,C-4存在耦合关系。因此,化合物(5)的平面结构为5-5-5-5元四环二萜。
化合物(6)
图21显示了化合物(6)的谱图,化合物6为variediene,
Figure GDA0003071701110000211
1HNMR数据提示化合物(6)存在5个甲基信号(Me-16,Me-17,Me-18,Me-19以及Me-20),以及1个烯氢(H-6)(表6)。13C NMR和HSQC确认存在20个碳原子,其中2个sp3杂化的季碳原子(C-11,C-15),3个sp2杂化的的季碳原子(C-2,C-3,C-7),2个脂肪族次甲基,1个烯次甲基,7个亚甲基以及5个甲基。这些数据提示化合物(6)为三环结构。1H-1H COSY提示的耦合关系有:H-5/H-6,H-8/H-9。HMBC图谱可以看到甲基氢的相关信号有Me-16与C-2,C-3,,C-4;Me-17与C-6,C-7,C-8;Me-18与C-1,C-11,C-12,C-14;M-19与C-13,C-14,C-15,C-20;Me-20与C-13,C-14,C-15,C-19。此外HMBC图谱提示H-10与C-1,C-2,C-3,C-9,C-11和C-15存在耦合关系。因此,化合物(6)的平面结构为5-5-9元三环二萜。
化合物(7)
图22显示了化合物(7)的谱图,1H NMR数据提示化合物(7)存在5个甲基信号Me-16,Me-17,Me-18,Me-19,Me-20(表7)。13C NMR和HSQC确认存在20个碳原子,其中3个sp3杂化的季碳原子(C-3,C-11,C-15),2个sp2杂化的的季碳原子(C-6,C-7),3个脂肪族次甲基,7个亚甲基以及5个甲基。这些数据提示化合物(7)为四环结构。1H-1H COSY提示的耦合关系有:H-1/H-2/H-10/H-14,H-4/H-5以及H-8/H-9。HMBC图谱可以看到甲基氢的相关信号有Me-16与C-2,C-3,C-4,C-6;Me-17与C-6,C-7,C-8;Me-18与C-1,C-11,C-12,C-14;M-19与C-13,C-14,C-15,C-20;Me-20与C-13,C-14,C-15,C-19。因此,化合物(7)的平面结构为5-5-7-4元四环二萜。
化合物(8)
图23显示了化合物(8)的谱图,1H NMR结果提示化合物(8)存在4个甲基信号(Me-17,Me-18,Me-19以及Me-20),以及1个端烯氢(H-16)(表8)。13C NMR和HSQC确认存在20个碳原子,其中有2个sp3杂化的季碳原子(C-11,C-15)以及2个sp2杂化的季碳原子(C-3,C-7),1个烯次甲基,3个脂肪族次甲基,1个烯亚甲基,7个脂肪族亚甲基以及4个甲基。这些数据提示化合物(8)为三环结构。1H-1H COSY提示的耦合关系有:H-1/H-2,H-5/H-6,H-8/H-9/H-10。此外,HMBC图谱可以看到甲基氢的相关信号有Me-17与C-6,C-7,C-8;Me-18与C-1,C-11,C-12,C-14;M-19与C-13,C-14,C-15,C-20;Me-20与C-13,C-14,C-15,C-19。此外HMBC图谱提示H-5和C-4;H-10和C-14;H-2和C-10;H-16和C-2,C-4之间存在耦合关系。因此,化合物(8)的平面结构为9-5-5元三环二萜。
化合物(9)
图24显示了化合物(9)的谱图,1H NMR结果提示化合物(9)存在5个甲基信号Me-16,Me-17,Me-18,Me-19以及Me-20(表9)。13C NMR和HSQC确认存在20个碳原子,其中有4个sp3杂化的季碳原子(C-3,C-7,C-11和C-15),4个脂肪族次甲基,7个亚甲基以及5个甲基。这些数据提示化合物(9)为三环叔醇结构。1H-1H COSY提示的耦合关系有:H-1/H-2,H-4/H-5/H-6,H-8/H-9以及H-10/H-14。此外,HMBC图谱可以看到甲基氢的相关信号有Me-16与C-2,C-3,C-4,C-6;Me-17与C-6,C-7,C-8;Me-18与C-1,C-11,C-12,C-14;M-19与C-13,C-14,C-15以及C-20;Me-20与C-13,C-14,C-15,C-19。此外HMBC图谱提示H-8与C-10,H-9与C-2之间存在耦合关系。因此,化合物(9)的平面结构为5-5-7-4元四环二萜。
化合物(10)
图25显示了化合物(10)的谱图,1H NMR结果提示化合物(10)存在5个甲基信号(Me-16,Me-17,Me-18,Me-19以及Me-20),1个仲醇H-6(表10)。13C NMR和HSQC确认存在20个碳原子,其中有4个sp3杂化的季碳原子(C-3,C-7,C-11和C-15),4个脂肪族次甲基,7个亚甲基以及5个甲基。这些数据提示化合物(10)为四环结构。1H-1H COSY提示的耦合关系有:H-4/H-5/H-6,H-8/H-9/H-10,H-1/H-2。此外,HMBC图谱可以看到甲基氢的相关信号有Me-16与C-2,C-3,C-4,C-7;Me-17与C-3,C-6,C-7,C-8;Me-18与C-1,C-11,C-12,C-14;M-19与C-13,C-14,C-15,C-20;Me-20与C-13,C-14,C-15,C-19。此外HMBC图谱提示H-2与C-10,H-10与C-14之间存在耦合关系。因此,化合物(10)的平面结构为5-5-6-5元四环二萜。
化合物(11)
图26显示了化合物(11)的谱图,化合物(11)为物色油状物trans-nerolidol。1HNMR(400MHz,氘代氯仿)δ5.91(dd,J=17.3,10.8Hz,1H),5.21(dd,J=17.3,1.3Hz,1H),5.13(t,J=5.8Hz,1H),5.10–5.05(m,1H),5.06(dd,J=10.8,1.3Hz,1H),2.11–2.00(m,4H),1.99–1.95(m,2H),1.67(s,3H),1.59(s,6H),1.58(m,2H),1.27(s,3H)。13C NMR(101MHz,cdcl3)δ145.02,135.60,131.46,124.20,124.17,111.66,73.52,42.01,39.69,27.90,26.62,25.70,22.71,17.69,16.01。HRMS(ESI)calculated for C15H25[M-OH]+:m/z205.1951;m/z found:205.1939。
化合物(12)
图27显示了化合物(12)的谱图,化合物(12)为物色油状的化合物2E,6E-法尼醇。1H NMR(400MHz,氘代氯仿)δ5.42(t,J=7.0Hz,1H),5.10(q,J=6.9Hz,2H),4.15(d,J=6.9Hz,2H),2.12–2.08(m,2H),2.07–2.03(m,4H),2.00–1.96(m,2H),1.68(s,6H),1.60(s,6H)。13C NMR(101MHz,cdcl3)δ139.87,135.35,131.36,124.26,123.72,123.24,59.40,39.67,39.52,26.68,26.26,25.70,17.69,16.28,16.00。HRMS(ESI)calculated for C15H25[M-OH]+:m/z 205.1951;m/z found:205.1940。
化合物(53)
图28显示了化合物(53)的谱图,1H NMR数据提示化合物(53)存在3个单峰的甲基信号(Me-17,Me-18,Me-20),1个双峰的甲基信号(Me-19),以及3个烯氢(表11)。13C NMR和异核单量子相关谱(HSQC)确认存在20个碳原子,其中有1个sp3杂化的季碳原子(C-11),2个sp2杂化的的季碳原子(C-7和C-15),5个脂肪族次甲基,1个烯次甲基,6个脂肪族亚甲基,1个甲烯基以及4个甲基。这些数据提示化合物(53)为四环结构。1H-1H COSY提示的耦合关系有:H-1/H-2,H-3/H-19以及H-8/H-9。HMBC图谱可以看到甲基氢的相关信号有:Me-17与C-14,C-15以及C-16;Me-18与C-6,C-7以及C-8;M-19与C-2,C-3以及C-4;Me-20与C-1,C-10,C-11以及C-12。此外HMBC图谱提示H-1与C-2,C-6,C-10;H-3与C-5,C-6;H-5与C-6,C-7;H-8与C-10;H-10与C-15;H-13与C-15之间有耦合关系。因此,化合物(53)的平面结构为一个四环二倍半萜。
化合物(54)
图29显示了化合物(54)的谱图,1H NMR数据提示化合物(54)存在6个甲基信号(Me-20,Me-21,Me-22,Me-23,Me-24,Me-25)。13C NMR、异核单量子相关谱(HSQC)以及DEPT135°确认存在25个碳原子,其中有3个sp3杂化的季碳原子(C-11,C-14,C-17),3个sp2杂化的的季碳原子(C-2,C-3,C-7),3个脂肪族次甲基,1个烯次甲基,9个脂肪族亚甲基,以及6个甲基。这些数据提示化合物(54)为四环结构。1H-1H COSY提示的耦合关系有:H-4/H-5/H-6,H-8/H-9,H-12/H-13以及H-15/H-16。HMBC图谱可以看到甲基氢的相关信号有:Me-20与C-2,C-3以及C-4;Me-21与C-6,C-7以及C-8;M-22与C-1,C-10,C-11以及C-12;Me-23与C-13,C-14,C-15以及C-19;Me-24与C-16,C-17,C-18以及C-25;Me-25与C-16,C-17,C-18以及C-24。此外HMBC图谱提示H-1与C-2,C-3;H-9与C-11;H-18与C-19之间有耦合关系。因此,化合物(54)的平面结构为一个5-8-6-6元四环二倍半萜。
表2化合物(1)的核磁数据
Figure GDA0003071701110000231
表3化合物(2)的核磁数据
Figure GDA0003071701110000241
表4化合物(3)的核磁数据
Figure GDA0003071701110000242
Figure GDA0003071701110000251
表5化合物(5)的核磁数据
Figure GDA0003071701110000252
Figure GDA0003071701110000261
表6化合物(6)的核磁数据
Figure GDA0003071701110000262
表7化合物(7)的核磁数据
Figure GDA0003071701110000263
Figure GDA0003071701110000271
表8化合物(8)的核磁数据
Figure GDA0003071701110000272
表9化合物(9)的核磁数据
Figure GDA0003071701110000281
表10化合物(10)的核磁数据
Figure GDA0003071701110000282
Figure GDA0003071701110000291
表11化合物(53)的核磁数据
Figure GDA0003071701110000292
表12化合物(54)的核磁数据
Figure GDA0003071701110000301
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。
SEQUENCE LISTING
<110> 武汉臻智生物科技有限公司
<120> 一种萜类合酶及其用途
<130> PIDC1167797A
<160> 66
<170> PatentIn version 3.5
<210> 1
<211> 755
<212> PRT
<213> Artificial Sequence
<220>
<223> SEQ ID NO:1
<400> 1
Met Asp Phe Thr Tyr Arg Tyr Ser Phe Glu Pro Thr Asp Tyr Asp Thr
1 5 10 15
Asp Gly Leu Cys Asp Gly Val Pro Val Arg Met His Lys Gly Ala Asp
20 25 30
Leu Asp Glu Val Ala Ile Phe Lys Ala Gln Tyr Asp Trp Glu Lys His
35 40 45
Val Gly Pro Lys Leu Pro Phe Arg Gly Ala Leu Gly Pro Arg His Asn
50 55 60
Phe Ile Cys Leu Thr Leu Pro Glu Cys Leu Pro Glu Arg Leu Glu Ile
65 70 75 80
Val Ser Tyr Ala Asn Glu Phe Ala Phe Leu His Asp Asp Ile Thr Asp
85 90 95
Val Glu Ser Ala Glu Thr Val Ala Ala Glu Asn Asp Glu Phe Leu Asp
100 105 110
Ala Leu Gln Gln Gly Val Arg Glu Gly Asp Ile Gln Ser Arg Glu Ser
115 120 125
Gly Lys Arg His Leu Gln Ala Trp Ile Phe Lys Ser Met Val Ala Ile
130 135 140
Asp Arg Asp Arg Ala Val Ala Ala Met Asn Ala Trp Ala Thr Phe Ile
145 150 155 160
Asn Thr Gly Ala Gly Cys Ala His Asp Thr Asn Phe Lys Ser Leu Asp
165 170 175
Glu Tyr Leu His Tyr Arg Ala Thr Asp Val Gly Tyr Met Phe Trp His
180 185 190
Ala Leu Ile Ile Phe Gly Cys Ala Ile Thr Ile Pro Glu His Glu Ile
195 200 205
Glu Leu Cys His Gln Leu Ala Leu Pro Ala Ile Met Ser Val Thr Leu
210 215 220
Thr Asn Asp Ile Trp Ser Tyr Gly Lys Glu Ala Glu Ala Ala Glu Lys
225 230 235 240
Ser Gly Lys Pro Gly Asp Phe Val Asn Ala Leu Val Val Leu Met Arg
245 250 255
Glu His Asn Cys Ser Ile Glu Glu Ala Glu Arg Leu Cys Arg Ala Arg
260 265 270
Asn Lys Ile Glu Val Ala Lys Cys Leu Gln Val Thr Lys Glu Thr Arg
275 280 285
Glu Arg Lys Asp Val Ser Gln Asp Leu Lys Asp Tyr Leu Tyr His Met
290 295 300
Leu Phe Gly Val Ser Gly Asn Ala Ile Trp Ser Thr Gln Cys Arg Arg
305 310 315 320
Tyr Asp Met Thr Ala Pro Tyr Asn Glu Arg Gln Gln Ala Arg Leu Lys
325 330 335
Gln Thr Lys Gly Glu Leu Thr Ser Thr Tyr Asp Pro Val Gln Ala Ala
340 345 350
Lys Glu Ala Met Met Glu Ser Thr Arg Pro Glu Ile His Arg Leu Pro
355 360 365
Thr Pro Asp Ser Pro Arg Lys Glu Ser Phe Ala Val Arg Pro Leu Val
370 375 380
Asn Gly Ser Gly Gln Tyr Asn Gly Asn Asn His Ile Asn Gly Val Ser
385 390 395 400
Asn Glu Val Asp Val Arg Pro Ser Ile Glu Arg His Ala Ser Thr Lys
405 410 415
Arg Ala Thr Ser Ala Asp Asp Ile Asp Trp Thr Ala His Lys Lys Val
420 425 430
Asp Ser Gly Ala Asp His Lys Lys Thr Leu Ser Asp Ile Met Leu Gln
435 440 445
Glu Leu Pro Pro Met Glu Asp Asp Val Val Met Glu Pro Tyr Arg Tyr
450 455 460
Leu Cys Ser Leu Pro Ser Lys Gly Val Arg Asn Lys Thr Ile Asp Ala
465 470 475 480
Leu Asn Phe Trp Leu Lys Val Pro Ile Glu Asn Ala Asn Thr Ile Lys
485 490 495
Ala Ile Thr Glu Ser Leu His Gly Ser Ser Leu Met Leu Asp Asp Ile
500 505 510
Glu Asp His Ser Gln Leu Arg Arg Gly Lys Pro Ser Ala His Ala Val
515 520 525
Phe Gly Glu Ala Gln Thr Ile Asn Ser Ala Thr Phe Gln Tyr Ile Gln
530 535 540
Ser Val Ser Leu Ile Ser Gln Leu Arg Ser Pro Lys Ala Leu Asn Ile
545 550 555 560
Phe Val Asp Glu Ile Arg Gln Leu Phe Ile Gly Gln Ala Tyr Glu Leu
565 570 575
Gln Trp Thr Ser Asn Met Ile Cys Pro Pro Leu Glu Glu Tyr Leu Arg
580 585 590
Met Val Asp Gly Lys Thr Gly Gly Leu Phe Arg Leu Leu Thr Arg Leu
595 600 605
Met Ala Ala Glu Ser Thr Thr Glu Val Asp Val Asp Phe Ser Arg Leu
610 615 620
Cys Gln Leu Phe Gly Arg Tyr Phe Gln Ile Arg Asp Asp Tyr Ala Asn
625 630 635 640
Leu Lys Leu Ala Asp Tyr Thr Glu Gln Lys Gly Phe Cys Glu Asp Leu
645 650 655
Asp Glu Gly Lys Phe Ser Leu Pro Leu Ile Ile Ala Phe Asn Glu Asn
660 665 670
Asn Lys Ala Pro Lys Ala Val Ala Gln Leu Arg Gly Leu Met Met Gln
675 680 685
Arg Cys Val Asn Gly Gly Leu Thr Phe Glu Gln Lys Val Leu Ala Leu
690 695 700
Asn Leu Ile Glu Glu Ala Gly Gly Ile Ser Gly Thr Glu Lys Val Leu
705 710 715 720
His Ser Leu Tyr Gly Glu Met Glu Ala Glu Leu Glu Arg Leu Ala Gly
725 730 735
Val Phe Gly Ala Glu Asn His Gln Leu Glu Leu Ile Leu Glu Met Leu
740 745 750
Arg Ile Asp
755
<210> 2
<211> 755
<212> PRT
<213> Artificial Sequence
<220>
<223> SEQ ID NO:2
<400> 2
Met Asp Phe Thr Tyr Arg Tyr Ser Phe Glu Pro Thr Asp Tyr Asp Thr
1 5 10 15
Asp Gly Leu Cys Asp Gly Val Pro Val Arg Met His Lys Gly Ala Asp
20 25 30
Leu Asp Glu Val Ala Ile Phe Lys Ala Gln Tyr Asp Trp Glu Lys His
35 40 45
Val Gly Pro Lys Leu Pro Phe Arg Gly Ala Leu Gly Pro Arg His Asn
50 55 60
Phe Ile Cys Leu Thr Leu Pro Glu Cys Leu Pro Glu Arg Leu Glu Ile
65 70 75 80
Val Ser Tyr Ala Asn Glu Phe Ala Phe Leu His Asp Asp Ile Thr Asp
85 90 95
Val Glu Ser Ala Glu Thr Val Ala Ala Glu Asn Asp Glu Phe Leu Asp
100 105 110
Ala Leu Gln Gln Gly Val Arg Glu Gly Asp Ile Gln Ser Arg Glu Ser
115 120 125
Gly Lys Arg His Leu Gln Ala Trp Ile Phe Lys Ser Met Val Ala Ile
130 135 140
Asp Arg Asp Arg Ala Val Ala Ala Met Asn Ala Trp Ala Thr Phe Ile
145 150 155 160
Asn Thr Gly Ala Gly Cys Ala His Asp Thr Asn Phe Lys Ser Leu Asp
165 170 175
Glu Tyr Leu His Tyr Arg Ala Thr Asp Val Gly Tyr Met Phe Trp His
180 185 190
Ala Leu Ile Ile Phe Gly Cys Ala Ile Thr Ile Pro Glu His Glu Ile
195 200 205
Glu Leu Cys His Gln Leu Ala Leu Pro Ala Ile Met Ser Val Thr Leu
210 215 220
Thr Asn Asp Ile Trp Ser Tyr Gly Lys Glu Ala Glu Ala Ala Glu Lys
225 230 235 240
Ser Gly Lys Pro Gly Asp Phe Val Asn Ala Leu Val Val Leu Met Arg
245 250 255
Glu His Asn Cys Ser Ile Glu Glu Ala Glu Arg Leu Cys Arg Ala Arg
260 265 270
Asn Lys Ile Glu Val Ala Lys Cys Leu Gln Val Thr Lys Glu Thr Arg
275 280 285
Glu Arg Lys Asp Val Ser Gln Asp Leu Lys Asp Tyr Leu Tyr His Met
290 295 300
Leu Phe Gly Val Ser Gly Asn Ala Ile Trp Ser Thr Gln Cys Arg Arg
305 310 315 320
Tyr Asp Met Thr Ala Pro Tyr Asn Glu Arg Gln Gln Ala Arg Leu Lys
325 330 335
Gln Thr Lys Gly Glu Leu Thr Ser Thr Tyr Asp Pro Val Gln Ala Ala
340 345 350
Lys Glu Ala Met Met Glu Ser Thr Arg Pro Glu Ile His Arg Leu Pro
355 360 365
Thr Pro Asp Ser Pro Arg Lys Glu Ser Phe Ala Val Arg Pro Leu Val
370 375 380
Asn Gly Ser Gly Gln Tyr Asn Gly Asn Asn His Ile Asn Gly Val Ser
385 390 395 400
Asn Glu Val Asp Val Arg Pro Ser Ile Glu Arg His Ala Ser Thr Lys
405 410 415
Arg Ala Thr Ser Ala Asp Asp Ile Asp Trp Thr Ala His Lys Lys Val
420 425 430
Asp Ser Gly Ala Asp His Lys Lys Thr Leu Ser Asp Ile Met Leu Gln
435 440 445
Glu Leu Pro Pro Met Glu Asp Asp Val Val Met Glu Pro Tyr Arg Tyr
450 455 460
Leu Cys Ser Leu Pro Ser Lys Gly Val Arg Asn Lys Thr Ile Asp Ala
465 470 475 480
Leu Asn Phe Trp Leu Lys Val Pro Ile Glu Asn Ala Asn Thr Ile Lys
485 490 495
Ala Ile Thr Glu Ser Leu His Gly Ser Ser Leu Met Leu Ala Asp Ile
500 505 510
Glu Asp His Ser Gln Leu Arg Arg Gly Lys Pro Ser Ala His Ala Val
515 520 525
Phe Gly Glu Ala Gln Thr Ile Asn Ser Ala Thr Phe Gln Tyr Ile Gln
530 535 540
Ser Val Ser Leu Ile Ser Gln Leu Arg Ser Pro Lys Ala Leu Asn Ile
545 550 555 560
Phe Val Asp Glu Ile Arg Gln Leu Phe Ile Gly Gln Ala Tyr Glu Leu
565 570 575
Gln Trp Thr Ser Asn Met Ile Cys Pro Pro Leu Glu Glu Tyr Leu Arg
580 585 590
Met Val Asp Gly Lys Thr Gly Gly Leu Phe Arg Leu Leu Thr Arg Leu
595 600 605
Met Ala Ala Glu Ser Thr Thr Glu Val Asp Val Asp Phe Ser Arg Leu
610 615 620
Cys Gln Leu Phe Gly Arg Tyr Phe Gln Ile Arg Asp Asp Tyr Ala Asn
625 630 635 640
Leu Lys Leu Ala Asp Tyr Thr Glu Gln Lys Gly Phe Cys Glu Asp Leu
645 650 655
Asp Glu Gly Lys Phe Ser Leu Pro Leu Ile Ile Ala Phe Asn Glu Asn
660 665 670
Asn Lys Ala Pro Lys Ala Val Ala Gln Leu Arg Gly Leu Met Met Gln
675 680 685
Arg Cys Val Asn Gly Gly Leu Thr Phe Glu Gln Lys Val Leu Ala Leu
690 695 700
Asn Leu Ile Glu Glu Ala Gly Gly Ile Ser Gly Thr Glu Lys Val Leu
705 710 715 720
His Ser Leu Tyr Gly Glu Met Glu Ala Glu Leu Glu Arg Leu Ala Gly
725 730 735
Val Phe Gly Ala Glu Asn His Gln Leu Glu Leu Ile Leu Glu Met Leu
740 745 750
Arg Ile Asp
755
<210> 3
<211> 316
<212> PRT
<213> Artificial Sequence
<220>
<223> SEQ ID NO:3
<400> 3
Met Asp Pro Tyr Ser Glu Thr Ser Asp Leu Val Asp Ile Ser Arg Phe
1 5 10 15
Asp Thr His Gly Leu Gly Ala Asn Tyr Lys Leu Arg Arg His Lys Phe
20 25 30
Glu His Leu Ala Asp Thr Gly Cys His Lys Ala Arg Ser Asp Trp Val
35 40 45
Lys Tyr Ile Gly Pro Leu Thr Glu Phe Gly Gly Cys Asn His Ile Asn
50 55 60
Gly Asn Phe Ser Ala Val Val Leu Pro Leu Cys Arg Pro Asp Arg Leu
65 70 75 80
Glu Leu Ile Ala Tyr Val Leu Glu Phe Ala Phe Leu His Asp Ser Val
85 90 95
Leu Glu Ser Glu Asn Thr Ser Pro Glu Ser Glu Val Gln Ala Glu Ala
100 105 110
Gly Leu Arg Leu Leu Tyr Glu Arg Cys Ile Ser Arg Leu Leu Gln Thr
115 120 125
Asp Glu Val Cys Ala Lys Lys Ile Ala Lys Thr Trp Lys Asp Ala Ile
130 135 140
Asn Thr Thr Thr Lys Asp Lys Asn Val Asp Phe Gln Ser Ile Glu Asp
145 150 155 160
Tyr Leu Glu Phe Arg Met Ile Asp Thr Gly Ala Pro Phe Val Glu Ala
165 170 175
Leu Met Leu Phe Gly Leu Gly Met Ser Leu Ser Pro Gln Glu Asp Asp
180 185 190
Ala Leu Gly His Val Ile Arg Pro Cys Phe Ala Ala Leu Ala Leu Thr
195 200 205
Asn Asp Tyr Phe Ser Phe Asp Arg Glu Ile Glu Glu Val Asp Thr Ser
210 215 220
Thr Leu Ile Asn Ser Val Ala Ile Val Met Arg Ile Gln Ser Leu Asp
225 230 235 240
Ile Pro Thr Ala Lys Thr Ile Ile Asn Glu Thr Ile Gln Lys Tyr Glu
245 250 255
Arg Glu Phe Leu Arg Arg Ile Asp Glu Tyr Lys Gln His Lys Gly Pro
260 265 270
Ile Ser Asn Lys Ile Glu Gln Tyr Met Glu Ala Met Thr Tyr Gln Ile
275 280 285
Ser Gly Asn Leu Val Trp Ser Leu Asn Cys Pro Arg Tyr Asn Pro Asp
290 295 300
Tyr Arg Tyr Gly Leu Glu Ala Cys Gln His Glu Gly
305 310 315
<210> 4
<211> 416
<212> PRT
<213> Artificial Sequence
<220>
<223> SEQ ID NO:4
<400> 4
Met Ser Thr Glu Thr His Pro Phe Ala Ser Pro Asn Ala Ile Pro Pro
1 5 10 15
Arg Thr Ser Ser Thr Gly Gln Val Thr Asn Gly Tyr Pro Ile Asn Pro
20 25 30
Arg His Ser Val Leu Arg Pro Leu Ser Glu Ile Asp Trp Met Ser Gln
35 40 45
Ser Lys Lys Ser Lys Thr Ser His Val Ser Thr Glu Pro Leu Asn Ser
50 55 60
Thr Gln Pro His Thr Arg Thr Leu Ser Gln Pro Gln Ser Gln Pro Asp
65 70 75 80
Pro Met Asn Leu Glu Glu Val Ser Thr Asn Tyr Pro Thr Pro Leu Ser
85 90 95
Pro Pro Ser Asp Thr Lys Asn Leu Gly Glu Asp Leu Ile Tyr Gly Asn
100 105 110
Gly Ala Ala Trp Thr Glu Glu Lys Glu Arg Ile Leu Leu Gly Pro Tyr
115 120 125
Asp Tyr Leu Trp Gly His Pro Gly Lys Asp Ile Arg Ser Gln Cys Ile
130 135 140
Ala Ala Phe Asn Leu Trp Leu Lys Val Pro Pro Glu Arg Leu Glu Val
145 150 155 160
Ile Thr Arg Ala Val Gly Met Leu His Thr Ala Ser Leu Leu Val Asp
165 170 175
Asp Val Glu Asp Ser Ser Ile Leu Arg Arg Gly Ile Pro Val Ala Asn
180 185 190
Ser Ile Phe Gly Val Ala Gln Thr Ile Asn Ser Ala Asn Tyr Val Tyr
195 200 205
Phe Lys Ala Leu Gln Glu Leu Met His Met Gly Asn Pro Lys Leu Ile
210 215 220
Glu Ile Phe Thr Glu Glu Leu Leu Asn Leu His Arg Gly Gln Gly Met
225 230 235 240
Asp Leu Tyr Trp Arg Asp Ser Leu Thr Cys Pro Ser Glu Ala Asp Tyr
245 250 255
Leu Glu Met Val Gly Asn Lys Thr Gly Gly Leu Phe Arg Leu Ala Ile
260 265 270
Lys Leu Met Gln Ala Glu Ser Ala Val Gln Val Asp Cys Ala Pro Leu
275 280 285
Val Ser Thr Ile Gly Leu Leu Phe Gln Ile Leu Asp Asp His Leu Asn
290 295 300
Leu Ser Pro Thr Ser Gly Tyr Ser Ser Leu Lys Gly Leu Cys Glu Asp
305 310 315 320
Leu Thr Glu Gly Lys Phe Ser Phe Pro Val Ile His Ala Ile Arg Ala
325 330 335
Asp Pro Ser Asn Gln Ile Leu Ile Asn Ile Leu Lys Gln Lys Thr Thr
340 345 350
Asp Glu Glu Val Lys Arg Tyr Ala Leu Lys Tyr Met Glu Ser Lys Gly
355 360 365
Ser Phe Glu Tyr Ser Lys Arg Val Ile Asp Asp Leu Arg Gly Lys Thr
370 375 380
Glu Gly Leu Val Ser Gly Ile Glu Lys Gly Leu Gly Glu Glu Gly Thr
385 390 395 400
Gln Gly Ala Glu Ala Leu Arg Lys Met Leu Gly Arg Leu Val Leu Arg
405 410 415
<210> 5
<211> 328
<212> PRT
<213> Artificial Sequence
<220>
<223> SEQ ID NO:5
<400> 5
Met Arg Tyr Gln Tyr Ser Glu Arg Val Glu Ser His Arg Tyr Arg Asp
1 5 10 15
Asp Gly Leu Ala Asn Asn Ile His Leu Arg Ile His Lys Asp Ser Tyr
20 25 30
Lys Glu Val Ile Gly Thr Leu Arg Ala Gln Asn Asp Trp Ser Arg Leu
35 40 45
Val Ser Ser Met Thr Lys Tyr His Gly Gly Leu Gly Asp Leu Phe Ser
50 55 60
Phe Ile Ser Val Thr Ile Pro Glu Cys Leu Pro Glu Arg Leu Glu Val
65 70 75 80
Val Ala Tyr Ala Asn Glu Tyr Ala Phe Leu Tyr Asp Asp Gln Met Glu
85 90 95
Arg Leu Asp Leu Lys Asp Phe Arg Glu Gly Arg Asp Asp Met Leu Asp
100 105 110
Ile Phe Gly Ile His Gly Gly Ala Ser Asn Leu Glu Asp Arg Arg Pro
115 120 125
Glu Lys Thr Leu Gln Leu Gln Ile Phe Asp Glu Leu Met Ala Ile Asp
130 135 140
Gln Asp Arg Ala Ile Val Thr Met Gln Ala Trp Ala Lys Phe Ile Asp
145 150 155 160
Leu Ala Ser Arg Thr Arg Val Glu Pro Phe Asn Thr Leu Ala Ala Tyr
165 170 175
Leu Pro Ser Arg Thr Ile Asp Ala Gly Glu Leu Phe Trp Phe Gly Met
180 185 190
Leu Thr Phe Ala Met Ala Leu Thr Ile Pro Ala His Glu Leu Asp Val
195 200 205
Cys Met Arg Leu Ala Arg Pro Gly Tyr Glu Ala Ile Ser Leu Ile Asn
210 215 220
Asp Ile Tyr Ser Trp Pro Lys Glu Arg Ala Glu Ala Glu Lys Ala Gly
225 230 235 240
Gln Asp Tyr Val Phe Asn Ala Val Trp Val Val Met Lys Glu Arg Lys
245 250 255
Cys Asp Glu Gln Lys Ala Thr Glu Phe Cys Lys Asn Leu Ala Arg Gln
260 265 270
Ser Ile Gln Asp Phe Ser Thr Ser Val Asn Thr Pro Gln Val Thr Glu
275 280 285
Leu Ser Cys Asp Ser Arg Thr Tyr Leu Gly Ala Val Arg Leu Ser Tyr
290 295 300
Val Gly Asn Leu Val Trp Ser Ile Tyr Cys Pro Arg Tyr Asn Ile Ala
305 310 315 320
Val Pro Val Tyr His Ser Lys Leu
325
<210> 6
<211> 755
<212> PRT
<213> Artificial Sequence
<220>
<223> SEQ ID NO:6
<400> 6
Met Asp Phe Thr Tyr Arg Tyr Ser Phe Glu Pro Thr Asp Tyr Asp Thr
1 5 10 15
Asp Gly Leu Cys Asp Gly Val Pro Val Arg Met His Lys Gly Ala Asp
20 25 30
Leu Asp Glu Val Ala Ile Phe Lys Ala Gln Tyr Asp Trp Glu Lys His
35 40 45
Val Gly Pro Lys Leu Pro Phe Arg Gly Ala Leu Gly Pro Arg His Asn
50 55 60
Leu Ile Cys Leu Thr Leu Pro Glu Cys Leu Pro Glu Arg Leu Glu Ile
65 70 75 80
Val Ser Tyr Ala Asn Glu Phe Ala Phe Leu His Asp Asp Ile Thr Asp
85 90 95
Val Glu Ser Ala Glu Thr Val Ala Ala Glu Asn Asp Glu Phe Leu Asp
100 105 110
Ala Leu Gln Gln Gly Val Arg Glu Gly Asp Ile Gln Ser Arg Glu Ser
115 120 125
Gly Lys Arg His Leu Gln Ala Trp Ile Phe Lys Ser Met Val Ala Ile
130 135 140
Asp Arg Asp Arg Ala Val Ala Ala Met Asn Ala Trp Ala Thr Phe Ile
145 150 155 160
Asn Thr Gly Ala Gly Cys Ala His Asp Thr Asn Phe Lys Ser Leu Asp
165 170 175
Glu Tyr Leu His Tyr Arg Ala Thr Asp Val Gly Tyr Met Phe Trp His
180 185 190
Ala Leu Ile Ile Phe Gly Cys Ala Ile Thr Ile Pro Glu His Glu Ile
195 200 205
Glu Leu Cys His Gln Leu Ala Leu Pro Ala Ile Met Ser Val Thr Leu
210 215 220
Thr Asn Asp Ile Trp Ser Tyr Gly Lys Glu Ala Glu Ala Ala Glu Lys
225 230 235 240
Ser Gly Lys Pro Gly Asp Phe Val Asn Ala Leu Val Val Leu Met Arg
245 250 255
Glu His Asn Cys Ser Ile Glu Glu Ala Glu Arg Leu Cys Arg Ala Arg
260 265 270
Asn Lys Ile Glu Val Ala Lys Cys Leu Gln Val Thr Lys Glu Thr Arg
275 280 285
Glu Arg Lys Asp Val Ser Gln Asp Leu Lys Asp Tyr Leu Tyr His Met
290 295 300
Leu Phe Gly Val Ser Gly Asn Ala Ile Trp Ser Thr Gln Cys Arg Arg
305 310 315 320
Tyr Asp Met Thr Ala Pro Tyr Asn Glu Arg Gln Gln Ala Arg Leu Lys
325 330 335
Gln Thr Lys Gly Glu Leu Thr Ser Thr Tyr Asp Pro Val Gln Ala Ala
340 345 350
Lys Glu Ala Met Met Glu Ser Thr Arg Pro Glu Ile His Arg Leu Pro
355 360 365
Thr Pro Asp Ser Pro Arg Lys Glu Ser Phe Ala Val Arg Pro Leu Val
370 375 380
Asn Gly Ser Gly Gln Tyr Asn Gly Asn Asn His Ile Asn Gly Val Ser
385 390 395 400
Asn Glu Val Asp Val Arg Pro Ser Ile Glu Arg His Ala Ser Thr Lys
405 410 415
Arg Ala Thr Ser Ala Asp Asp Ile Asp Trp Thr Ala His Lys Lys Val
420 425 430
Asp Ser Gly Ala Asp His Lys Lys Thr Leu Ser Asp Ile Met Leu Gln
435 440 445
Glu Leu Pro Pro Met Glu Asp Asp Val Val Met Glu Pro Tyr Arg Tyr
450 455 460
Leu Cys Ser Leu Pro Ser Lys Gly Val Arg Asn Lys Thr Ile Asp Ala
465 470 475 480
Leu Asn Phe Trp Leu Lys Val Pro Ile Glu Asn Ala Asn Thr Ile Lys
485 490 495
Ala Ile Thr Glu Ser Leu His Gly Ser Ser Leu Met Leu Asp Asp Ile
500 505 510
Glu Asp His Ser Gln Leu Arg Arg Gly Lys Pro Ser Ala His Ala Val
515 520 525
Phe Gly Glu Ala Gln Thr Ile Asn Ser Ala Thr Phe Gln Tyr Ile Gln
530 535 540
Ser Val Ser Leu Ile Ser Gln Leu Arg Ser Pro Lys Ala Leu Asn Ile
545 550 555 560
Phe Val Asp Glu Ile Arg Gln Leu Phe Ile Gly Gln Ala Tyr Glu Leu
565 570 575
Gln Trp Thr Ser Asn Met Ile Cys Pro Pro Leu Glu Glu Tyr Leu Arg
580 585 590
Met Val Asp Gly Lys Thr Gly Gly Leu Phe Arg Leu Leu Thr Arg Leu
595 600 605
Met Ala Ala Glu Ser Thr Thr Glu Val Asp Val Asp Phe Ser Arg Leu
610 615 620
Cys Gln Leu Phe Gly Arg Tyr Phe Gln Ile Arg Asp Asp Tyr Ala Asn
625 630 635 640
Leu Lys Leu Ala Asp Tyr Thr Glu Gln Lys Gly Phe Cys Glu Asp Leu
645 650 655
Asp Glu Gly Lys Phe Ser Leu Pro Leu Ile Ile Ala Phe Asn Glu Asn
660 665 670
Asn Lys Ala Pro Lys Ala Val Ala Gln Leu Arg Gly Leu Met Met Gln
675 680 685
Arg Cys Val Asn Gly Gly Leu Thr Phe Glu Gln Lys Val Leu Ala Leu
690 695 700
Asn Leu Ile Glu Glu Ala Gly Gly Ile Ser Gly Thr Glu Lys Val Leu
705 710 715 720
His Ser Leu Tyr Gly Glu Met Glu Ala Glu Leu Glu Arg Leu Ala Gly
725 730 735
Val Phe Gly Ala Glu Asn His Gln Leu Glu Leu Ile Leu Glu Met Leu
740 745 750
Arg Ile Asp
755
<210> 7
<211> 2268
<212> DNA
<213> Artificial Sequence
<220>
<223> SEQ ID NO:7
<400> 7
atggatttca cctaccgtta tagctttgaa ccgaccgact acgataccga cggtctgtgc 60
gacggtgtgc cggttcgtat gcacaagggt gcggatctgg acgaagtggc gatcttcaaa 120
gcgcagtatg actgggagaa gcacgttggc ccgaaactgc cgttccgtgg tgcgctgggt 180
ccgcgtcaca actttatttg cctgaccctg ccggaatgcc tgccggaacg tctggagatc 240
gtgagctacg cgaacgagtt cgcgtttctg cacgacgata ttaccgatgt ggaaagcgcg 300
gagaccgttg cggcggaaaa cgatgagttc ctggacgcgc tgcagcaagg tgttcgtgaa 360
ggcgacatcc aaagccgtga gagcggcaag cgtcacctgc aggcgtggat ttttaaaagc 420
atggtggcga tcgatcgtga ccgtgcggtt gcggcgatga acgcgtgggc gaccttcatt 480
aacaccggtg cgggctgcgc gcacgatacc aactttaaga gcctggacga gtacctgcac 540
tatcgtgcga ccgacgtggg ttacatgttc tggcacgcgc tgatcatttt tggctgcgcg 600
atcaccattc cggagcacga aatcgagctg tgccaccagc tggcgctgcc ggcgattatg 660
agcgtgaccc tgaccaacga catctggagc tatggtaaag aagcggaggc ggcggaaaag 720
agcggtaaac cgggcgactt cgttaacgcg ctggttgtgc tgatgcgtga acacaactgc 780
agcattgagg aagcggagcg tctgtgccgt gcgcgtaaca agatcgaggt ggcgaaatgc 840
ctgcaagtta ccaaggaaac ccgtgagcgt aaagatgtga gccaggatct gaaggactac 900
ctgtatcaca tgctgtttgg tgttagcggc aacgcgatct ggagcaccca gtgccgtcgt 960
tacgacatga ccgcgccgta taacgaacgt cagcaagcgc gtctgaagca aaccaaaggc 1020
gagctgacca gcacctacga tccggttcag gcggcgaagg aagcgatgat ggagagcacc 1080
cgtccggaaa ttcaccgtct gccgaccccg gacagcccgc gtaaagagag cttcgcggtg 1140
cgtccgctgg ttaacggtag cggccaatat aacggtaaca accacattaa cggcgtgagc 1200
aacgaagtgg acgttcgtcc gagcatcgag cgtcacgcga gcaccaaacg tgcgaccagc 1260
gcggacgaca tcgattggac cgcgcacaag aaagttgata gcggtgcgga ccacaagaaa 1320
accctgagcg acattatgct gcaggaactg ccgccgatgg aggacgatgt ggttatggaa 1380
ccgtaccgtt atctgtgcag cctgccgagc aagggtgtgc gtaacaaaac cattgatgcg 1440
ctgaactttt ggctgaaggt tccgatcgaa aacgcgaaca ccatcaaagc gattaccgag 1500
agcctgcacg gcagcagcct gatgctggac gacatcgaag accacagcca actgcgtcgt 1560
ggcaagccga gcgcgcacgc ggtgttcggc gaggcgcaga ccattaacag cgcgaccttt 1620
cagtacattc aaagcgtgag cctgatcagc caactgcgta gcccgaaagc gctgaacatc 1680
ttcgttgatg aaattcgtca gctgtttatc ggtcaagcgt acgagctgca gtggaccagc 1740
aacatgatct gcccgccgct ggaggaatat ctgcgtatgg ttgacggcaa gaccggtggc 1800
ctgttccgtc tgctgacccg tctgatggcg gcggaaagca ccaccgaggt ggatgttgac 1860
tttagccgtc tgtgccaact gttcggtcgt tactttcaga tccgtgacga ttatgcgaac 1920
ctgaagctgg cggattacac cgaacagaaa ggtttctgcg aggacctgga cgagggcaaa 1980
ttcagcctgc cgctgatcat tgcgtttaac gagaacaaca aggcgccgaa agcggtggcg 2040
caactgcgtg gcctgatgat gcagcgttgc gtgaacggtg gcctgacctt cgaacaaaag 2100
gttctggcgc tgaacctgat tgaggaagcg ggtggcatca gcggtaccga gaaagtgctg 2160
cacagcctgt atggcgaaat ggaggcggaa ctggagcgtc tggcgggtgt ttttggcgcg 2220
gagaaccacc agctggaact gattctggag atgctgcgta tcgactaa 2268
<210> 8
<211> 2268
<212> DNA
<213> Artificial Sequence
<220>
<223> SEQ ID NO:8
<400> 8
atggatttca cctaccgtta tagctttgaa ccgaccgact acgataccga cggtctgtgc 60
gacggtgtgc cggttcgtat gcacaagggt gcggatctgg acgaagtggc gatcttcaaa 120
gcgcagtatg actgggagaa gcacgttggc ccgaaactgc cgttccgtgg tgcgctgggt 180
ccgcgtcaca actttatttg cctgaccctg ccggaatgcc tgccggaacg tctggagatc 240
gtgagctacg cgaacgagtt cgcgtttctg cacgacgata ttaccgatgt ggaaagcgcg 300
gagaccgttg cggcggaaaa cgatgagttc ctggacgcgc tgcagcaagg tgttcgtgaa 360
ggcgacatcc aaagccgtga gagcggcaag cgtcacctgc aggcgtggat ttttaaaagc 420
atggtggcga tcgatcgtga ccgtgcggtt gcggcgatga acgcgtgggc gaccttcatt 480
aacaccggtg cgggctgcgc gcacgatacc aactttaaga gcctggacga gtacctgcac 540
tatcgtgcga ccgacgtggg ttacatgttc tggcacgcgc tgatcatttt tggctgcgcg 600
atcaccattc cggagcacga aatcgagctg tgccaccagc tggcgctgcc ggcgattatg 660
agcgtgaccc tgaccaacga catctggagc tatggtaaag aagcggaggc ggcggaaaag 720
agcggtaaac cgggcgactt cgttaacgcg ctggttgtgc tgatgcgtga acacaactgc 780
agcattgagg aagcggagcg tctgtgccgt gcgcgtaaca agatcgaggt ggcgaaatgc 840
ctgcaagtta ccaaggaaac ccgtgagcgt aaagatgtga gccaggatct gaaggactac 900
ctgtatcaca tgctgtttgg tgttagcggc aacgcgatct ggagcaccca gtgccgtcgt 960
tacgacatga ccgcgccgta taacgaacgt cagcaagcgc gtctgaagca aaccaaaggc 1020
gagctgacca gcacctacga tccggttcag gcggcgaagg aagcgatgat ggagagcacc 1080
cgtccggaaa ttcaccgtct gccgaccccg gacagcccgc gtaaagagag cttcgcggtg 1140
cgtccgctgg ttaacggtag cggccaatat aacggtaaca accacattaa cggcgtgagc 1200
aacgaagtgg acgttcgtcc gagcatcgag cgtcacgcga gcaccaaacg tgcgaccagc 1260
gcggacgaca tcgattggac cgcgcacaag aaagttgata gcggtgcgga ccacaagaaa 1320
accctgagcg acattatgct gcaggaactg ccgccgatgg aggacgatgt ggttatggaa 1380
ccgtaccgtt atctgtgcag cctgccgagc aagggtgtgc gtaacaaaac cattgatgcg 1440
ctgaactttt ggctgaaggt tccgatcgaa aacgcgaaca ccatcaaagc gattaccgag 1500
agcctgcacg gcagcagcct gatgctggcc gacatcgaag accacagcca actgcgtcgt 1560
ggcaagccga gcgcgcacgc ggtgttcggc gaggcgcaga ccattaacag cgcgaccttt 1620
cagtacattc aaagcgtgag cctgatcagc caactgcgta gcccgaaagc gctgaacatc 1680
ttcgttgatg aaattcgtca gctgtttatc ggtcaagcgt acgagctgca gtggaccagc 1740
aacatgatct gcccgccgct ggaggaatat ctgcgtatgg ttgacggcaa gaccggtggc 1800
ctgttccgtc tgctgacccg tctgatggcg gcggaaagca ccaccgaggt ggatgttgac 1860
tttagccgtc tgtgccaact gttcggtcgt tactttcaga tccgtgacga ttatgcgaac 1920
ctgaagctgg cggattacac cgaacagaaa ggtttctgcg aggacctgga cgagggcaaa 1980
ttcagcctgc cgctgatcat tgcgtttaac gagaacaaca aggcgccgaa agcggtggcg 2040
caactgcgtg gcctgatgat gcagcgttgc gtgaacggtg gcctgacctt cgaacaaaag 2100
gttctggcgc tgaacctgat tgaggaagcg ggtggcatca gcggtaccga gaaagtgctg 2160
cacagcctgt atggcgaaat ggaggcggaa ctggagcgtc tggcgggtgt ttttggcgcg 2220
gagaaccacc agctggaact gattctggag atgctgcgta tcgactaa 2268
<210> 9
<211> 951
<212> DNA
<213> Artificial Sequence
<220>
<223> SEQ ID NO:9
<400> 9
atggatccct acagtgaaac atcagatctt gttgacattt ctcgcttcga cacccacggc 60
cttggagcta attacaaact acgacgacat aagttcgaac acctagctga cactggatgt 120
cacaaagcaa ggtcagattg ggtaaaatac attggccctc ttactgaatt cggaggctgc 180
aatcacatca acgggaattt ctctgctgta gtgttgccat tgtgcagacc tgaccgcctg 240
gagcttatag catatgtact cgaattcgca tttcttcatg attccgttct cgagtcagaa 300
aacacgtctc cggaatccga agtgcaagcc gaggctggtc tacgcctctt atatgaacga 360
tgcataagtc gactcttgca gacagacgaa gtatgcgcca aaaagattgc aaagacgtgg 420
aaagacgcga tcaacacaac tacaaaggat aagaacgtgg acttccaatc tatagaagac 480
tacttggagt ttcgcatgat tgatactggt gcaccgttcg tcgaggccct catgcttttt 540
ggattgggca tgtcgctttc accgcaagaa gatgatgctc ttggtcacgt tattcggcca 600
tgtttcgccg ctttggcgtt gacgaacgac tacttttcgt ttgatcgaga gatagaagaa 660
gtcgatactt ctactcttat caactcggtt gccatagtaa tgcgaattca gagtctggac 720
attcccaccg ccaagacaat tatcaatgag actatacaga agtacgagcg agagttcctc 780
cgacgcattg atgagtacaa acagcacaaa ggaccaatct ctaacaagat tgaacaatac 840
atggaagcta tgacttatca gatcagtggg aatttagtat ggagtctgaa ttgtcctaga 900
tataatcctg actatcggta cggactggag gcttgtcagc acgagggttg a 951
<210> 10
<211> 1251
<212> DNA
<213> Artificial Sequence
<220>
<223> SEQ ID NO:10
<400> 10
atgtctactg aaacgcatcc tttcgcctcg ccgaacgcca taccacctcg aaccagctct 60
actggccaag tcacgaacgg ctatcctata aatccgcggc acagcgtctt gcgcccgctc 120
tcagaaattg actggatgag ccaaagtaaa aagagcaaga cctcacacgt ttccaccgaa 180
ccactcaaca gcacacaacc acacacacgc acgctgtcgc aaccacagtc gcagcccgac 240
cctatgaacc tcgaagaagt cagcacaaac taccccaccc cgctctcccc gccgagtgac 300
accaagaacc tgggcgaaga cctcatatac ggcaacggcg cagcatggac agaagagaag 360
gagcgcatac tgctggggcc ttatgattac ctttggggtc acccgggcaa ggacataagg 420
tcacaatgca tagcagcgtt caacctgtgg ctgaaagtac caccagagcg gcttgaggtc 480
ataacgcgcg cggtgggcat gctacacaca gcatctcttt tggtcgacga tgtcgaagac 540
agctcaatat tacggcgagg cattcctgtc gcgaatagca tattcggcgt tgcgcagacg 600
atcaactcgg cgaactacgt atacttcaag gcgttgcagg agctgatgca catgggcaat 660
cccaagctca tcgagatctt cacagaagag ctgttgaacc tgcacagagg ccagggaatg 720
gatctgtact ggcgggacag tttgacatgt cctagcgaag cagattacct agagatggta 780
ggcaacaaga ccggtggcct gttcaggcta gcgatcaagc tcatgcaggc cgaaagcgca 840
gtacaagtcg actgcgcacc cctcgtctcc acaatcggcc tcctcttcca gatcctcgac 900
gatcacctca atctctcccc cacgtcgggc tactcctcgc tcaaaggcct ctgcgaagac 960
ctcaccgaag gcaaattctc cttccccgtc atccacgcta tccgcgccga cccgtcgaac 1020
cagatcctca tcaacatcct caagcagaaa actacagatg aggaggtcaa gcgctatgcg 1080
ctcaagtaca tggagagtaa gggtagcttt gaatattcca agagggttat tgatgacttg 1140
agggggaaga cggaggggct tgtcagtggg attgagaagg ggttgggcga ggaggggacg 1200
cagggggcgg aggcgttgag gaaaatgtta gggaggttgg tgttgaggta g 1251
<210> 11
<211> 986
<212> DNA
<213> Artificial Sequence
<220>
<223> SEQ ID NO:11
<400> 11
atgcgttacc agtatagcga gcgtgtggaa agccaccgtt atcgtgacga tggtctggcg 60
aacaacattc acctgcgtat ccacaaggat agctacaaag aagtgattgg caccctgcgt 120
gcgcaaaacg actggagccg tctggttagc agcatgacca agtatcacgg tggcctgggc 180
gacctgttca gctttattag cgttaccatc ccggaatgcc tgccggagcg tctggaagtg 240
gttgcgtacg cgaacgagta tgcgttcctg tacgacgatc agatggaacg tctggacctg 300
aaagatttcc gtgagggtcg tgacgatatg ctggacatct ttggcattca cggtggcgcg 360
agcaacctgg aggatcgtcg tccggaaaag accctgcagc tgcaaatttt tgacgagctg 420
atggcgattg accaggatcg tgcgatcgtg accatgcaag cgtgggcgaa attcatcgat 480
ctggcgagcc gtacccgtgt tgaaccgttt aacaccctgg cggcgtatct gccgagccgt 540
accattgacg cgggcgagct gttctggttt ggcatgctga ccttcgcgat ggcgctgacc 600
atcccggcgc acgaactgga tgtgtgcatg cgtctggcgc gtccgggtta tgaggcgatc 660
agcctgatta acgacatcta cagctggccg aaggaacgtg cggaggcgga aaaagcgggc 720
caggattacg tgtttaacgc ggtttgggtg gttatgaagg agcgtaaatg cgacgaacaa 780
aaggcgaccg agttctgcaa aaacctggcg cgtcagagca tccaagattt tagcaccagc 840
gtgaacaccc cgcaagttac cgagctgagc tgcgacagcc gtacctatct gggtgcggtt 900
cgtctgagct acgtgggcaa cctggtttgg agcatttatt gcccgcgtta caacatcgcg 960
gtgccggttt accacagcaa gctgta 986
<210> 12
<211> 2268
<212> DNA
<213> Artificial Sequence
<220>
<223> SEQ ID NO:12
<400> 12
atggatttca cctaccgtta tagctttgaa ccgaccgact acgataccga cggtctgtgc 60
gacggtgtgc cggttcgtat gcacaagggt gcggatctgg acgaagtggc gatcttcaaa 120
gcgcagtatg actgggagaa gcacgttggc ccgaaactgc cgttccgtgg tgcgctgggt 180
ccgcgtcaca acctgatttg cctgaccctg ccggaatgcc tgccggaacg tctggagatc 240
gtgagctacg cgaacgagtt cgcgtttctg cacgacgata ttaccgatgt ggaaagcgcg 300
gagaccgttg cggcggaaaa cgatgagttc ctggacgcgc tgcagcaagg tgttcgtgaa 360
ggcgacatcc aaagccgtga gagcggcaag cgtcacctgc aggcgtggat ttttaaaagc 420
atggtggcga tcgatcgtga ccgtgcggtt gcggcgatga acgcgtgggc gaccttcatt 480
aacaccggtg cgggctgcgc gcacgatacc aactttaaga gcctggacga gtacctgcac 540
tatcgtgcga ccgacgtggg ttacatgttc tggcacgcgc tgatcatttt tggctgcgcg 600
atcaccattc cggagcacga aatcgagctg tgccaccagc tggcgctgcc ggcgattatg 660
agcgtgaccc tgaccaacga catctggagc tatggtaaag aagcggaggc ggcggaaaag 720
agcggtaaac cgggcgactt cgttaacgcg ctggttgtgc tgatgcgtga acacaactgc 780
agcattgagg aagcggagcg tctgtgccgt gcgcgtaaca agatcgaggt ggcgaaatgc 840
ctgcaagtta ccaaggaaac ccgtgagcgt aaagatgtga gccaggatct gaaggactac 900
ctgtatcaca tgctgtttgg tgttagcggc aacgcgatct ggagcaccca gtgccgtcgt 960
tacgacatga ccgcgccgta taacgaacgt cagcaagcgc gtctgaagca aaccaaaggc 1020
gagctgacca gcacctacga tccggttcag gcggcgaagg aagcgatgat ggagagcacc 1080
cgtccggaaa ttcaccgtct gccgaccccg gacagcccgc gtaaagagag cttcgcggtg 1140
cgtccgctgg ttaacggtag cggccaatat aacggtaaca accacattaa cggcgtgagc 1200
aacgaagtgg acgttcgtcc gagcatcgag cgtcacgcga gcaccaaacg tgcgaccagc 1260
gcggacgaca tcgattggac cgcgcacaag aaagttgata gcggtgcgga ccacaagaaa 1320
accctgagcg acattatgct gcaggaactg ccgccgatgg aggacgatgt ggttatggaa 1380
ccgtaccgtt atctgtgcag cctgccgagc aagggtgtgc gtaacaaaac cattgatgcg 1440
ctgaactttt ggctgaaggt tccgatcgaa aacgcgaaca ccatcaaagc gattaccgag 1500
agcctgcacg gcagcagcct gatgctggac gacatcgaag accacagcca actgcgtcgt 1560
ggcaagccga gcgcgcacgc ggtgttcggc gaggcgcaga ccattaacag cgcgaccttt 1620
cagtacattc aaagcgtgag cctgatcagc caactgcgta gcccgaaagc gctgaacatc 1680
ttcgttgatg aaattcgtca gctgtttatc ggtcaagcgt acgagctgca gtggaccagc 1740
aacatgatct gcccgccgct ggaggaatat ctgcgtatgg ttgacggcaa gaccggtggc 1800
ctgttccgtc tgctgacccg tctgatggcg gcggaaagca ccaccgaggt ggatgttgac 1860
tttagccgtc tgtgccaact gttcggtcgt tactttcaga tccgtgacga ttatgcgaac 1920
ctgaagctgg cggattacac cgaacagaaa ggtttctgcg aggacctgga cgagggcaaa 1980
ttcagcctgc cgctgatcat tgcgtttaac gagaacaaca aggcgccgaa agcggtggcg 2040
caactgcgtg gcctgatgat gcagcgttgc gtgaacggtg gcctgacctt cgaacaaaag 2100
gttctggcgc tgaacctgat tgaggaagcg ggtggcatca gcggtaccga gaaagtgctg 2160
cacagcctgt atggcgaaat ggaggcggaa ctggagcgtc tggcgggtgt ttttggcgcg 2220
gagaaccacc agctggaact gattctggag atgctgcgta tcgactaa 2268
<210> 13
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> P1
<400> 13
catcttatta atcagataaa atatttctcg agctccggca aaaagtggcc cc 52
<210> 14
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> P2
<400> 14
catcttccag gaaatctccg ccccgctcga gaaacccacg gcggcaatgc 50
<210> 15
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> P3
<400> 15
gcattgccgc cgtgggtttc tcgagcgggg cggagatttc ctggaagatg 50
<210> 16
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> P4
<400> 16
ggggccactt tttgccggag ctcgagaaat attttatctg attaataaga tg 52
<210> 17
<211> 55
<212> DNA
<213> Artificial Sequence
<220>
<223> P5
<400> 17
tttgaaagat gggtccgtca cctgcattaa atcctaagga tccactagtt ctaga 55
<210> 18
<211> 59
<212> DNA
<213> Artificial Sequence
<220>
<223> P6
<400> 18
ttttatattc ctcctagtcg actctagagg atccccgggc tgcaggaatt cgatatcaa 59
<210> 19
<211> 59
<212> DNA
<213> Artificial Sequence
<220>
<223> P7
<400> 19
cccggggatc ctctagagtc gactaggagg aatataaaat gaaaaattgt gtcatcgtc 59
<210> 20
<211> 49
<212> DNA
<213> Artificial Sequence
<220>
<223> P8
<400> 20
gttgagagtt tcatttagct gtcctcctta attcaaccgt tcaatcacc 49
<210> 21
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> P9
<400> 21
acggttgaat taaggaggac agctaaatga aactctcaac taaact 46
<210> 22
<211> 49
<212> DNA
<213> Artificial Sequence
<220>
<223> P10
<400> 22
tggctgctgc ccatagtgta atcctcctta ttttttaaca tcgtaagat 49
<210> 23
<211> 47
<212> DNA
<213> Artificial Sequence
<220>
<223> P11
<400> 23
atgttaaaaa ataaggagga ttacactatg ggcagcagcc atcatca 47
<210> 24
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> P12
<400> 24
ttaggattta atgcaggtga cgg 23
<210> 25
<211> 59
<212> DNA
<213> Artificial Sequence
<220>
<223> P13
<400> 25
cagaaaacga ttatctgcat ttacccagct taaataagag ctccaattcg ccctatagt 59
<210> 26
<211> 55
<212> DNA
<213> Artificial Sequence
<220>
<223> P14
<400> 26
ttaagaacgg taatgacatg gttaattcct cctactgcag gaattcgata tcaag 55
<210> 27
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<223> P15
<400> 27
ctgcagtagg aggaattaac catgtcatta ccgttcttaa ct 42
<210> 28
<211> 44
<212> DNA
<213> Artificial Sequence
<220>
<223> P16
<400> 28
ctcaactctg acatttgatc tgcctcctat gaagtccatg gtaa 44
<210> 29
<211> 51
<212> DNA
<213> Artificial Sequence
<220>
<223> P17
<400> 29
ttaccatgga cttcatagga ggcagatcaa atgtcagagt tgagagcctt c 51
<210> 30
<211> 53
<212> DNA
<213> Artificial Sequence
<220>
<223> P18
<400> 30
gatgctgtgt aaacggtcat gagtattacc tcctatttat caagataagt ttc 53
<210> 31
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> P19
<400> 31
atcttgataa ataggaggta atactcatga ccgtttacac agcatccgtt 50
<210> 32
<211> 55
<212> DNA
<213> Artificial Sequence
<220>
<223> P20
<400> 32
tgcccatata gtaatcctcc tcccgggctg cagttattcc tttggtagac cagtc 55
<210> 33
<211> 51
<212> DNA
<213> Artificial Sequence
<220>
<223> P21
<400> 33
ggaataactg cagcccggga ggaggattac tatatgggca gcagccatca t 51
<210> 34
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> P22
<400> 34
ttatttaagc tgggtaaatg caga 24
<210> 35
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> P23
<400> 35
atatcatatg gatttcacct accgttatag 30
<210> 36
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> P24
<400> 36
atatctcgag actagttagt cgatacgcag catctc 36
<210> 37
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> P25
<400> 37
gcctgatgct ggccgacatc gaagaccaca gccaac 36
<210> 38
<211> 34
<212> DNA
<213> Artificial Sequence
<220>
<223> P26
<400> 38
cttcgatgtc ggccagcatc aggctgctgc cgtg 34
<210> 39
<211> 35
<212> DNA
<213> Artificial Sequence
<220>
<223> P27
<400> 39
gcacgagctc atggatccct acagtgaaac atcag 35
<210> 40
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> P28
<400> 40
agtcaagctt actagtcaac cctcgtgctg acaagc 36
<210> 41
<211> 31
<212> DNA
<213> Artificial Sequence
<220>
<223> P29
<400> 41
atatggatcc atggactttc cgcagcaact c 31
<210> 42
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> P30
<400> 42
atatgaattc actagtttat ttattacgct ggatgatg 38
<210> 43
<211> 34
<212> DNA
<213> Artificial Sequence
<220>
<223> P31
<400> 43
atcgcatatg caaacggaac acgtcatttt attg 34
<210> 44
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> P32
<400> 44
atatctcgag actagttatt taagctgggt aaatgc 36
<210> 45
<211> 43
<212> DNA
<213> Artificial Sequence
<220>
<223> P33
<400> 45
ctttaagaag gagatatacc atggatttca cctaccgtta tag 43
<210> 46
<211> 44
<212> DNA
<213> Artificial Sequence
<220>
<223> P34
<400> 46
caaacatatg tatatctcct tctttagtcg atacgcagca tctc 44
<210> 47
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> P35
<400> 47
gattctggag atgctgcgta tcgactaaag aaggagatat acatatgttt gatttcaatg 60
<210> 48
<211> 62
<212> DNA
<213> Artificial Sequence
<220>
<223> P36
<400> 48
ctgttcgact taagcattat gcggccgcaa gcttgtcgac tcagttctga cgaaacgcaa 60
tg 62
<210> 49
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> P37
<400> 49
gtcgacaagc ttgcggccgc ataatgctta agtcgaacag 40
<210> 50
<211> 41
<212> DNA
<213> Artificial Sequence
<220>
<223> P38
<400> 50
ataacggtag gtgaaatcca tggtatatct ccttcttaaa g 41
<210> 51
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<223> P39
<400> 51
gccatatgta tatctccttc tttagtcgat acgcagcatc tc 42
<210> 52
<211> 53
<212> DNA
<213> Artificial Sequence
<220>
<223> P40
<400> 52
gagatgctgc gtatcgacta aagaaggaga tatacatatg gcgcagctga gcg 53
<210> 53
<211> 62
<212> DNA
<213> Artificial Sequence
<220>
<223> P41
<400> 53
ctgttcgact taagcattat gcggccgcaa gcttgtcgac ttagtggtca cgcgccgcaa 60
cc 62
<210> 54
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> P42
<400> 54
ctttaagaag gagatatacc atggatccct acagtgaaac 40
<210> 55
<211> 41
<212> DNA
<213> Artificial Sequence
<220>
<223> P43
<400> 55
catatgtata tctccttctt caaccctcgt gctgacaagc c 41
<210> 56
<211> 61
<212> DNA
<213> Artificial Sequence
<220>
<223> P44
<400> 56
gcttgtcagc acgagggttg aagaaggaga tatacatatg tttgatttca atgaatatat 60
g 61
<210> 57
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> P45
<400> 57
gtttcactgt agggatccat ggtatatctc cttcttaaag 40
<210> 58
<211> 41
<212> DNA
<213> Artificial Sequence
<220>
<223> P46
<400> 58
catatgtata tctccttctt caaccctcgt gctgacaagc c 41
<210> 59
<211> 54
<212> DNA
<213> Artificial Sequence
<220>
<223> P47
<400> 59
ggcttgtcag cacgagggtt gaagaaggag atatacatat ggcgcagctg agcg 54
<210> 60
<211> 41
<212> DNA
<213> Artificial Sequence
<220>
<223> P48
<400> 60
ctttaagaag gagatatacc atgcgttacc agtatagcga g 41
<210> 61
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<223> P49
<400> 61
gacatatgta tatctccttc tttacagctt gctgtggtaa ac 42
<210> 62
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> P50
<400> 62
gtttaccaca gcaagctgta aagaaggaga tatacatatg tctactgaaa cgcatcc 57
<210> 63
<211> 59
<212> DNA
<213> Artificial Sequence
<220>
<223> P51
<400> 63
ctgttcgact taagcattat gcggccgcaa gcttgtcgac ctacctcaac accaacctc 59
<210> 64
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> P52
<400> 64
gtcgacaagc ttgcggccgc ataatgctta agtcgaacag 40
<210> 65
<211> 41
<212> DNA
<213> Artificial Sequence
<220>
<223> P53
<400> 65
ctcgctatac tggtaacgca tggtatatct ccttcttaaa g 41
<210> 66
<211> 919
<212> DNA
<213> Artificial Sequence
<220>
<223> SEQ ID NO:13
<400> 66
gtcgacagaa ggagatatac atatgtttga tttcaatgaa tatatgaaaa gtaaggctgt 60
tgcggtagac gcggctctgg ataaagcgat tccgctggaa tatcccgaga agattcacga 120
atcgatgcgc tactccctgt tagcaggagg gaaacgcgtt cgtccggcat tatgcatcgc 180
ggcctgtgaa ctcgtcggcg gttcacagga cttagcaatg ccaactgctt gcgcaatgga 240
aatgattcac acaatgagcc tgattcatga tgatttgcct tgcatggaca acgatgactt 300
tcggcgcggt aaacctacta atcataaggt ttttggcgaa gatactgcag tgctggcggg 360
cgatgcgctg ctgtcgtttg ccttcgaaca tatcgccgtc gcgacctcga aaaccgtccc 420
gtcggaccgt acgcttcgcg tgatttccga gctgggaaag accatcggct ctcaaggact 480
cgtgggtggt caggtagttg atatcacgtc tgagggtgac gcgaacgtgg acctgaaaac 540
cctggagtgg atccatattc acaaaacggc cgtgctgctg gaatgtagcg tggtgtcagg 600
ggggatcttg gggggcgcca cggaggatga aatcgcgcgt attcgtcgtt atgcccgctg 660
tgttggactg ttatttcagg tggtggatga catcctggat gtcacaaaat ccagcgaaga 720
gcttggcaag accgcgggca aagaccttct gacggataag gctacatacc cgaaattgat 780
gggcttggag aaagccaagg agttcgcagc tgaacttgcc acgcgggcga aggaagaact 840
ctcttctttc gatcaaatca aagccgcgcc actgctgggc ctcgccgatt acattgcgtt 900
tcgtcagaac tgagcatgc 919

Claims (11)

1.一种萜类合酶,其特征在于,所述萜类合酶的氨基酸序列如SEQ ID NO:1~6任一项所示。
2.一种核酸分子,其编码权利要求1所述的萜类合酶。
3.根据权利要求2所述的核酸分子,其特征在于,所述核酸分子的核苷酸序列如SEQ IDNO:7~12任一项所示。
4.一种构建体,其特征在于,其含有权利要求2或3所述核酸分子。
5.一种重组细胞,其特征在于,含有:
第一核酸分子,所述第一核酸分子编码萜类合酶,
所述萜类合酶的氨基酸序列如SEQ ID NO:1~6任一项所示。
6.根据权利要求5所述的重组细胞,其特征在于,所述第一核酸分子的核苷酸序列如SEQ ID NO:7~12任一项所示。
7.根据权利要求5所述的重组细胞,其特征在于,所述重组细胞进一步含有:
第二核酸分子,所述第二核酸分子选自下列的至少之一:
来源于大肠杆菌XL1-blue的atoB基因或idi基因;
来源于酿酒酵母INVSC1的erg13基因、tHMG1基因、erg12基因、erg8基因或mvd1基因。
8.权利要求1所述萜类合酶或权利要求2或3所述核酸分子或权利要求4所述构建体或权利要求5~7任一项所述重组细胞在合成萜类化合物中的用途。
9.根据权利要求8所述的用途,其特征在于,所述合成是在宿主细胞中进行的,并且所述萜类合酶的催化底物是通过在宿主细胞中过量表达下列至少之一的基因而获得的:
来源于大肠杆菌XL1-blue的atoB基因或idi基因;
来源于酿酒酵母INVSC1的erg13基因、tHMG1基因、erg12基因、erg8基因或mvd1基因。
10.根据权利要求8所述的用途,其特征在于,所述萜类化合物具有下列之一的结构:
Figure FDA0003022450440000011
11.一种合成权利要求8~10任一项所述用途中所限定的萜类化合物的方法,其特征在于,包括:
培养权利要求5~7任一项所述重组细胞,以便获得培养产物;以及
从所述培养产物中分离所述萜类化合物。
CN201710316673.1A 2016-12-27 2017-05-08 一种萜类合酶及其用途 Active CN108239631B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201611223498 2016-12-27
CN2016112234983 2016-12-27

Publications (2)

Publication Number Publication Date
CN108239631A CN108239631A (zh) 2018-07-03
CN108239631B true CN108239631B (zh) 2021-07-16

Family

ID=62701923

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710316673.1A Active CN108239631B (zh) 2016-12-27 2017-05-08 一种萜类合酶及其用途

Country Status (2)

Country Link
CN (1) CN108239631B (zh)
WO (1) WO2018120337A1 (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106906201B (zh) * 2017-04-10 2020-03-10 武汉大学 一种生产橙花叔醇的萜类合酶及其应用
CN113430218B (zh) * 2021-04-30 2022-06-21 中国医学科学院药用植物研究所 倍半萜类化合物的生物酶催化合成方法
CN113480660B (zh) * 2021-06-03 2022-11-18 武汉大学 一种嵌合萜类合酶及其应用

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7927794B2 (en) * 2003-09-29 2011-04-19 The Regents Of The University Of California Methods for identifying a biosynthetic pathway gene product
BRPI0513837B1 (pt) * 2004-07-27 2021-10-13 The Regents Of The University Of California Célula hospedeira saccharomyces cerevisiae geneticamente modificada; composição compreendendo a mesma e método para aumentar a produção de isoprenoides
US20090053797A1 (en) * 2005-08-19 2009-02-26 Yoichiro Shiba Genetically modified host cells and use of same for producing isoprenoid compounds
EP2723870B1 (en) * 2011-06-27 2017-09-06 Firmenich SA Modified microorganisms and use thereof for terpene production
CN103243065B (zh) * 2013-05-30 2014-12-03 武汉大学 一种生产法尼烯的菌株及其应用
CN105154420B (zh) * 2015-08-20 2018-04-10 中国医学科学院药用植物研究所 赤芝萜类合酶GL22395编码基因cDNA序列及其应用
CN105647879A (zh) * 2016-03-16 2016-06-08 武汉大学 一种二萜化合物variediene合成基因Au13192及其应用
CN106011090A (zh) * 2016-06-13 2016-10-12 西安电子科技大学 一种还原酶及其编码基因与应用
CN107083378A (zh) * 2017-04-10 2017-08-22 武汉大学 一种生产Longiborneol的萜类合酶及其应用
CN106987578B (zh) * 2017-04-10 2020-01-07 武汉大学 一种生产koraiol的萜类合酶及其应用
CN106906201B (zh) * 2017-04-10 2020-03-10 武汉大学 一种生产橙花叔醇的萜类合酶及其应用

Also Published As

Publication number Publication date
WO2018120337A1 (zh) 2018-07-05
CN108239631A (zh) 2018-07-03

Similar Documents

Publication Publication Date Title
Kim et al. Cloning and heterologous expression of the cyclooctatin biosynthetic gene cluster afford a diterpene cyclase and two p450 hydroxylases
CN106906201B (zh) 一种生产橙花叔醇的萜类合酶及其应用
Grundmann et al. Overproduction, purification and characterization of FtmPT1, a brevianamide F prenyltransferase from Aspergillus fumigatus
KR101834020B1 (ko) 이소프레노이드 경로로부터 화학 및 제약 제품의 생산을 위한 미생물 조작
CN108239631B (zh) 一种萜类合酶及其用途
Toyomasu et al. Biosynthetic gene-based secondary metabolite screening: a new diterpene, methyl phomopsenonate, from the fungus Phomopsis amygdali
Son et al. Enantioselective microbial synthesis of the indigenous natural product (−)-α-bisabolol by a sesquiterpene synthase from chamomile (Matricaria recutita)
Wallwey et al. Ergot alkaloid biosynthesis in Aspergillus fumigatus: Conversion of chanoclavine-I aldehyde to festuclavine by the festuclavine synthase FgaFS in the presence of the old yellow enzyme FgaOx3
Kong et al. Elucidation of the biosynthetic gene cluster and the post-PKS modification mechanism for fostriecin in Streptomyces pulveraceus
CN113046332B (zh) 一类二倍半萜骨架化合物及其合成基因及制备方法
Petříčková et al. Biosynthesis of Colabomycin E, a New Manumycin‐Family Metabolite, Involves an Unusual Chain‐Length Factor
Huang et al. Marine bacterial aromatic polyketides from host-dependent heterologous expression and fungal mode of cyclization
CN106987578B (zh) 一种生产koraiol的萜类合酶及其应用
Okada et al. Stereospecific prenylation of tryptophan by a cyanobacterial post-translational modification enzyme
Jiang et al. Schultriene and nigtetraene: Two sesterterpenes characterized from pathogenetic fungi via genome mining approach
Xing et al. Functional characterization and structural bases of two class I diterpene synthases in pimarane-type diterpene biosynthesis
Minagawa et al. ValC, a New Type of C7‐Cyclitol Kinase Involved in the Biosynthesis of the Antifungal Agent Validamycin A
CN110093329B (zh) 萜类合酶及其应用
CN107083378A (zh) 一种生产Longiborneol的萜类合酶及其应用
CN113015807A (zh) 萜类化合物的生产方法
JP6856553B2 (ja) マノオールの製造
Subramanian et al. Identification and biochemical characterization of a 5-dimethylallyl tryptophan synthase in Streptomyces coelicolor A3 (2)
CN112280754B (zh) 一种[4+2]环化酶的氨基酸序列及其应用
CN110484576B (zh) 一种提高榴菌素和榴菌素b产量的方法
WO2016161984A1 (en) Production of fragrant compounds

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20220719

Address after: 430075 room d102, building B5, building b4-b8, Wuhan National Biological Industry (Jiufeng innovation) base, No. 666, Gaoxin Avenue, East Lake New Technology Development Zone, Wuhan, Hubei

Patentee after: Wuhan Hesheng Technology Co.,Ltd.

Address before: Building B5, R & D building, Wuhan Institute of biotechnology, 666 Gaoxin Avenue, Donghu Development Zone, Wuhan City, Hubei Province, 430075

Patentee before: WUHAN J1 BIOTECH Co.,Ltd.

TR01 Transfer of patent right