CN116656641A - 咖啡酸o-甲基转移酶突变体及其应用 - Google Patents

咖啡酸o-甲基转移酶突变体及其应用 Download PDF

Info

Publication number
CN116656641A
CN116656641A CN202210149987.8A CN202210149987A CN116656641A CN 116656641 A CN116656641 A CN 116656641A CN 202210149987 A CN202210149987 A CN 202210149987A CN 116656641 A CN116656641 A CN 116656641A
Authority
CN
China
Prior art keywords
leu
gly
ala
val
gene
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210149987.8A
Other languages
English (en)
Inventor
王勇
张玉连
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Center for Excellence in Molecular Plant Sciences of CAS
Original Assignee
Center for Excellence in Molecular Plant Sciences of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Center for Excellence in Molecular Plant Sciences of CAS filed Critical Center for Excellence in Molecular Plant Sciences of CAS
Priority to CN202210149987.8A priority Critical patent/CN116656641A/zh
Priority to PCT/CN2023/076691 priority patent/WO2023155864A1/zh
Publication of CN116656641A publication Critical patent/CN116656641A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1003Transferases (2.) transferring one-carbon groups (2.1)
    • C12N9/1007Methyltransferases (general) (2.1.1.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/74Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0071Oxidoreductases (1.) acting on paired donors with incorporation of molecular oxygen (1.14)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/88Lyases (4.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/24Preparation of oxygen-containing organic compounds containing a carbonyl group
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/40Preparation of oxygen-containing organic compounds containing a carboxyl group including Peroxycarboxylic acids
    • C12P7/42Hydroxy-carboxylic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y114/00Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14)
    • C12Y114/14Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14) with reduced flavin or flavoprotein as one donor, and incorporation of one atom of oxygen (1.14.14)
    • C12Y114/14001Unspecific monooxygenase (1.14.14.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y201/00Transferases transferring one-carbon groups (2.1)
    • C12Y201/01Methyltransferases (2.1.1)
    • C12Y201/01068Caffeate O-methyltransferase (2.1.1.68)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y401/00Carbon-carbon lyases (4.1)
    • C12Y401/01Carboxy-lyases (4.1.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y403/00Carbon-nitrogen lyases (4.3)
    • C12Y403/01Ammonia-lyases (4.3.1)
    • C12Y403/01023Tyrosine ammonia-lyase (4.3.1.23)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12RINDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
    • C12R2001/00Microorganisms ; Processes using microorganisms
    • C12R2001/01Bacteria or Actinomycetales ; using bacteria or Actinomycetales
    • C12R2001/185Escherichia
    • C12R2001/19Escherichia coli

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Medicinal Chemistry (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明提供了一种咖啡酸O‑甲基转移酶(COMT)突变体及其应用。本发明人发现了与COMT氨基酸序列中与其催化活性密切相关的位点,在此基础上揭示了一种COMT突变体及其在催化O‑甲基化反应中的应用。所述突变体可参与香兰素生物合成途径、提高香兰素的产量。

Description

咖啡酸O-甲基转移酶突变体及其应用
技术领域
本发明属于生物技术和植物生物学领域,更具体地,本发明涉及咖啡酸O-甲基转移酶突变体及其应用。
背景技术
O-甲基转移酶(OMTs)是一类以甲基供体如S-腺苷甲硫氨酸(SAM)提供甲基,使底物的羟基取代为甲氧基的酶。OMTs种类有很多,通常根据蛋白质分子量的大小与催化反应时是否需要Mg2+可以将其分为两类:I类OMTs分子量为26-30kDa,反应过程需要Mg2+,且底物谱比较单一,如咖啡酰CoA O-甲基转移酶(Caffeoyl-CoA O-methyltransferase),主要参与植物木质素的合成,可将咖啡酰CoA(Caffeoyl-CoA)转化为阿魏酰CoA(Feruloyl-CoA)。II类OMTs蛋白分子量为38-43kDa,多为二聚体,参与反应时不需要金属阳离子的参与,底物具有杂泛性且种类比较多,如来源于拟南芥的咖啡酸O-甲基转移酶(AtCOMT,Arabidopsisthaliana Caffeic acid O-methyltransferase)属于O-甲基转移酶中的II型类酶,该酶主要参与木质素合成,可以将咖啡酸(Caffeic acid)O-甲基化得到阿魏酸(Ferulic acid),可催化一系列含类苯基丙烷结构的化合物,且不需要金属阳离子作为辅酶。与不同物种来源的同工酶进行比对分析,AtCOMT催化底物O-甲基化的机理:首先H267夺取底物酚羟基的质子,使酚羟基去质子化形成苯酚阴离子基团;随后底物新生成的阴离子基团,亲核进攻辅酶SAM的活性甲基,经过双分子亲核取代反应(SN2),底物的阴离子基团取代SAM的甲基,最终形成甲氧基,完成O-甲基化反应。AtCOMT底物谱比较广泛,涉及咖啡酸、N-乙酰-5羟色胺(NAS)、白藜芦醇、红霉素、愈创木酚、水杨酸甲酯、对羟基苯甲醛等十余种底物,而其蛋白晶体结构尚未得到解析。
发明内容
本发明的目的在于提供一种咖啡酸O-甲基转移酶突变体及其应用。
在本发明的第一方面,提供一种咖啡酸O-甲基转移酶(COMT)突变体,所述突变体包括:(1)氨基酸序列对应于SEQ ID NO:2,第310位发生突变的蛋白;或(2)(1)蛋白的保守性变异蛋白,其对应于SEQ ID NO:2的第310位的氨基酸与(1)蛋白相应位置突变后的氨基酸相同。
在一种或多种实施方式中,所述的保守性变异蛋白包括选自:(a)将(1)蛋白的氨基酸序列经过一个或多个(如1-20个;较佳地1-15个;更佳地1-10个,如5个,3个)氨基酸残基的取代、缺失或添加而形成的,且具有(1)蛋白功能的蛋白;(b)与(1)蛋白的氨基酸序列有80%以上(较佳地85%以上;更佳地90%以上;更佳95%以上,如98%,99%)同源性,且具有(1)蛋白功能的蛋白;(c)(1)蛋白的活性片段,其包含咖啡酸O-甲基转移酶空间结构中与甲基供体、甲基受体相互作用的结构,且具有(1)蛋白功能的蛋白;或(d)(1)或(2)任一所述蛋白的两端添加标签序列、信号序列或分泌信号序列后形成的蛋白。
在一种或多种实施方式中,所述甲基供体包括:S-腺苷甲硫氨酸。
在一种或多种实施方式中,所述甲基受体包括:存在酚羟基的化合物;较佳地,所述甲基受体包括(但不限于):阿魏酸,N-乙酰-5羟色胺(NAS),白藜芦醇,红霉素,愈创木酚,水杨酸甲酯,对羟基苯甲醛,苯乙醇,UV-0,2-十异戊二烯-3-甲基-5-羟基-6-甲氧基-对苯二酚。
在一种或多种实施方式中,所述第310位突变为Gly(G);较佳地,所述突变体的氨基酸序列如SEQ ID NO:4所示。
在本发明的另一方面,提供分离的多核苷酸,其编码所述的咖啡酸O-甲基转移酶突变体。
在本发明的另一方面,提供一种载体或含有该载体的宿主细胞,所述载体含有所述的多核苷酸。
在一种或多种实施方式中,所述的细胞中包括阿魏酸合成途径基因,从而该细胞能合成阿魏酸;较佳地,所述的阿魏酸合成途径基因包括编码以下酶的基因:酪氨酸脱氨酶(TAL),对香豆酸3-羟化酶(SAM5)和前面所述的咖啡酸O-甲基转移酶(COMT)突变体;较佳地,所述酪氨酸脱氨酶来自粘红酵母(Rhodotorula glutinis)、所述对香豆酸3-羟化酶来自西班牙酵母(Saccharothrix espanaensis)。
在一种或多种实施方式中,所述的细胞中还包括香兰素合成途径基因,从而该细胞能合成香兰素;较佳地,所述的香兰素合成途径基因包括:编码阿魏酸脱羧酶和双加氧酶的基因;较佳地所述编码阿魏酸脱羧酶的基因为fdc基因;较佳地,所述编码双加氧酶的基因为cso2基因;较佳地,所述fdc基因来自短小芽孢杆菌(Bacillus pumilus),所述cso2基因来自西格尼丝柄细菌(Caulobacter segnis);较佳地,所述cso2基因为突变体基因,其编码发生A49P和Q390A突变的酶(cso2(A49P-Q390A))。
在一种或多种实施方式中,所述宿主细胞包括:原核细胞或真核细胞;较佳地,所述原核宿主细胞包括大肠杆菌、枯草杆菌等;所述真核宿主细胞包括:真菌细胞、酵母细胞、昆虫细胞、哺乳动物细胞等。
在一种或多种实施方式中,所述宿主细胞为大肠杆菌。
在本发明的另一方面,提供一种生产所述的咖啡酸O-甲基转移酶突变体的方法,包括步骤:(1)培养所述的宿主细胞,获得培养物;(2)从培养物中分离所述的咖啡酸O-甲基转移酶突变体。
在本发明的另一方面,提供一种提高咖啡酸O-甲基转移酶的催化活性的方法,包括:将其氨基酸序列中对应于SEQ ID NO:2第310位的氨基酸进行突变;较佳地,所述第310位突变为Gly;更佳地,所述突变体的氨基酸序列如SEQ ID NO:4所示。
在一种或多种实施方式中,所述的催化活性的提高为具有统计学意义的提高,如提高20%以上、40%以上、60%以上、70%以上或更高。
在本发明的另一方面,提供前面任一所述的咖啡酸O-甲基转移酶突变体的应用,用于催化底物O-甲基化反应;或,用于制备催化底物O-甲基化反应的试剂(包括催化试剂)或培养基。
在一种或多种实施方式中,所述的咖啡酸O-甲基转移酶突变体的底物包括:存在酚羟基的化合物。
在一种或多种实施方式中,所述底物包括(但不限于):咖啡酸,N-乙酰-5羟色胺(NAS),白藜芦醇,红霉素,愈创木酚,水杨酸甲酯,对羟基苯甲醛,苯乙醇,UV-0,2-十异戊二烯-3-甲基-5-羟基-6-甲氧基-对苯二酚。
在一种或多种实施方式中,催化时,从甲基供体获得甲基;较佳地,所述甲基供体包括:S-腺苷甲硫氨酸。
在一种或多种实施方式中,所述的底物包括阿魏酸,其作为中间产物,在细胞中进一步能形成香兰素。
在一种或多种实施方式中,所述的细胞包括阿魏酸合成途径基因和/或香兰素合成途径基因。
在一种或多种实施方式中,所述的阿魏酸合成途径基因包括编码以下酶的基因:酪氨酸脱氨酶,对香豆酸3-羟化酶和所述的咖啡酸O-甲基转移酶突变体;较佳地,所述酪氨酸脱氨酶来自粘红酵母(Rhodotorula glutinis)、所述对香豆酸3-羟化酶来自西班牙酵母(Saccharothrix espanaensis);
在一种或多种实施方式中,所述的香兰素合成途径基因包括:编码阿魏酸脱羧酶和双加氧酶的基因;较佳地所述编码阿魏酸脱羧酶的基因为fdc基因;较佳地,所述编码双加氧酶的基因为cso2基因;较佳地,所述fdc基因包括来自短小芽孢杆菌(Bacilluspumilus)的fdc基因,所述cso2基因包括来自西格尼丝柄细菌(Caulobacter segnis)的cso2基因;较佳地,cso2基因为突变体基因,其编码发生A49P和Q390A突变的酶(cso2(A49P-Q390A))。
在本发明的另一方面,提供一种用于催化O-甲基化反应的组合物,所述组合物中含有:前面任一所述的咖啡酸O-甲基转移酶突变体;或所述的宿主细胞。
在一种或多种实施方式中,所述的组合物中,还包括药学上或工业合成上可接受的载体。
在本发明的另一方面,提供一种用于对底物进行O-甲基化的试剂盒,其中含有:前面任一所述的咖啡酸O-甲基转移酶突变体;前面任一所述的宿主细胞;或前面所述的组合物。
本发明的其它方面由于本文的公开内容,对本领域的技术人员而言是显而易见的。
附图说明
图1、AtCOMT琼脂糖凝胶电泳图及测序比对结果。
图2a、香兰素生物合成途径示意图。
图2b、AtCOMT突变体参与的发酵的产物情况。
图2c、利用人工构建的重组大肠杆菌系统合成香兰素的HPLC分析。
具体实施方式
本发明人经过深入的研究,找到了与咖啡酸O-甲基转移酶(简称COMT)氨基酸序列中与其催化活性密切相关的位点,在此基础上揭示了一种COMT突变体及其在催化O-甲基化反应中的应用。所述突变体可参与香兰素生物合成途径、提高香兰素的产量。
突变体
如本文所用,除非另外说明,所述的“咖啡酸O-甲基转移酶突变体”、“COMT突变体”、“突变型咖啡酸O-甲基转移酶”、“突变型COMT”可互换使用,是指对应于野生型咖啡酸O-甲基转移酶,在相应于其氨基酸序列第310位发生突变后构成的多肽。较佳地,该突变如Q310G。
若需要表示野生型的COMT,其可以为“氨基酸序列如SEQ ID NO:2的蛋白,或者也可以是该蛋白的同功能变体或活性片段。较佳地,所述的野生型COMT来源于拟南芥(Arabidopsis thaliana);但是应理解,本发明中也涵盖来源于其它物种的与之具有同源性且功能相同的COMT同源物。
如本文所用,“分离的COMT”是指所述COMT突变体基本上不含天然与其相关的其它蛋白、脂类、糖类或其它物质。本领域的技术人员能用标准的蛋白质纯化技术纯化COMT突变体。基本上纯的蛋白在非还原聚丙烯酰胺凝胶上能产生单一的主带。
本发明的蛋白可以是重组蛋白、天然蛋白、合成蛋白,优选重组蛋白。本发明的蛋白可以是天然纯化的产物,或是化学合成的产物,或使用重组技术从原核或真核宿主(例如,细菌、酵母、高等植物、昆虫和哺乳动物细胞)中产生。
本发明还包括所述COMT突变体的片段、衍生物和类似物。如本文所用,术语“片段”、“衍生物”和“类似物”是指基本上保持本发明的天然COMT突变体相同的生物学功能或活性的蛋白。本发明的蛋白片段、衍生物或类似物可以是(i)有一个或多个保守或非保守性氨基酸残基(优选保守性氨基酸残基)被取代的蛋白,而这样的取代的氨基酸残基可以是也可以不是由遗传密码编码的,或(ii)在一个或多个氨基酸残基中具有取代基团的蛋白,或(iii)附加的氨基酸序列融合到此蛋白序列而形成的蛋白(如前导序列或分泌序列或用来纯化此蛋白的序列或蛋白原序列,或融合蛋白)。根据本文的定义,这些片段、衍生物和类似物属于本领域熟练技术人员公知的范围。然而,所述的COMT突变体及其片段、衍生物和类似物的氨基酸序列中,肯定存在本发明上面所述的突变;较佳地,该突变为对应于SEQ ID NO:2中的第310位氨基酸的突变。。
在本发明中,术语“COMT突变体”还包括(但并不限于):若干个(通常为1-20个,更佳地1-10个,还更佳如1-8个、1-5个、1-3个、或1-2个)氨基酸的缺失、插入和/或取代,以及在C末端和/或N末端添加或缺失一个或数个(通常为20个以内,较佳地为10个以内,更佳地为5个以内)氨基酸。例如,在本领域中,用性能相近或相似的氨基酸进行取代时,通常不会改变蛋白质的功能。又比如,在C末端和/或N末端添加或缺失一个或数个氨基酸通常也不会改变蛋白质的功能。该术语还包括COMT突变体的活性片段和活性衍生物。但是在这些变异形式中,肯定存在本发明上面所述的突变;较佳地,该突变为对应于SEQ ID NO:2中的第310位氨基酸的突变。
在本发明中,术语“COMT突变体”还包括(但并不限于):与所述的COMT突变体的氨基酸序列具有80%以上,较佳地85%以上,更佳地90%以上,进一步更佳地95%以上,如98%以上、99%以上序列相同性的保留其蛋白活性的衍生的蛋白。同样地,这些衍生的蛋白中,肯定存在本发明上面所述的突变,较佳地,该突变为对应于SEQ ID NO:2中的第310位氨基酸的突变。
本发明还提供了编码本发明COMT突变体或其保守性变异蛋白的多核苷酸序列。
本发明的多核苷酸可以是DNA形式或RNA形式。DNA形式包括cDNA、基因组DNA或人工合成的DNA。DNA可以是单链的或是双链的。DNA可以是编码链或非编码链。
编码所述突变体的成熟蛋白的多核苷酸包括:只编码成熟蛋白的编码序列;成熟蛋白的编码序列和各种附加编码序列;成熟蛋白的编码序列(和任选的附加编码序列)以及非编码序列。
“编码蛋白的多核苷酸”可以是包括编码此蛋白的多核苷酸,也可以是还包括附加编码和/或非编码序列的多核苷酸。
本发明也涉及包含本发明的多核苷酸的载体,以及用本发明的载体或COMT突变体编码序列经基因工程产生的宿主细胞,以及经重组技术产生本发明所述蛋白的方法。
本发明中,COMT突变体多核苷酸序列可插入到重组表达载体中。术语“重组表达载体”指本领域熟知的细菌质粒、噬菌体、酵母质粒、植物细胞病毒、哺乳动物细胞病毒或其他载体。总之,只要能在宿主体内复制和稳定,任何质粒和载体都可以用。表达载体的一个重要特征是通常含有复制起点、启动子、标记基因和翻译控制元件。
本领域的技术人员熟知的方法能用于构建含COMT突变体编码DNA序列和合适的转录/翻译控制信号的表达载体。这些方法包括体外重组DNA技术、DNA合成技术、体内重组技术等。所述的DNA序列可有效连接到表达载体中的适当启动子上,以指导mRNA合成。表达载体还包括翻译起始用的核糖体结合位点和转录终止子。表达载体优选地包含一个或多个选择性标记基因,以提供用于选择转化的宿主细胞的表型性状。
包含上述的适当DNA序列以及适当启动子或者控制序列的载体,可以用于转化适当的宿主细胞,以使其能够表达蛋白质。
本发明中,所述的宿主细胞可以是原核细胞,如细菌细胞;或是低等真核细胞,如酵母细胞;或是高等真核细胞,如植物细胞。代表性例子有:大肠杆菌、枯草杆菌、链霉菌、农杆菌;真核细胞如酵母、植物细胞等。在本发明的具体实施例中,以大肠杆菌作为宿主细胞。
本领域一般技术人员都清楚如何选择适当的载体、启动子、增强子和宿主细胞。
通过常规的重组DNA技术,可利用本发明的多聚核苷酸序列来表达或生产重组的COMT突变体。一般来说有以下步骤:
(1).用本发明的编码COMT突变体的多核苷酸(或变异体),或用含有该多核苷酸的重组表达载体转化或转导合适的宿主细胞;
(2).在合适的培养基中培养的宿主细胞;
(3).从培养基或细胞中分离、纯化蛋白质。
在本发明的具体实施例中,COMT突变体在大肠杆菌中表达、纯化:通过PCR,将野生型COMT基因从克隆载体中扩增并亚克隆至原核表达载体中。以COMT基因表达载体为模板,通过PCR引物引入突变,经过PCR扩增,构建突变体蛋白表达载体。测序正确的突变体在大肠杆菌中进行异源表达。蛋白经纯化后,进行体外酶活性检测,或应用于其它方面。
作为本发明的优选实施例,所述表达方法的具体步骤如下:
工程菌构建:将所述COMT突变体的编码基因组装到合成阿魏酸的质粒与阿魏酸到香兰素合成的关键功能基因的质粒,共转于大肠杆菌BL21(DE3)中,获得含COMT突变体编码基因的大肠杆菌工程菌;
工程菌发酵:以1g/L L-酪氨酸为前体,将构建的大肠杆菌工程菌在TB培养基中,37℃250rpm,培养到OD=0.6时,加入IPTG(终浓度为0.1mM)22℃诱导发酵5days,获得发酵液。取500uL发酵液,加等体积乙酸乙酯萃取两次,将上清转移至洁净的EP管中,真空浓缩蒸干,用100uL甲醇复溶,进行HPLC检测。
突变体的应用
基于本发明的新发现,提供了所述COMT突变体的应用,用于催化底物O-甲基化反应;或,用于制备催化底物O-甲基化反应的试剂(包括催化试剂)或培养基。
鉴于COMT作为甲基转移酶,能够催化底物发生O-甲基化反应,且具有相对广泛的底物(存在酚羟基的化合物);例如,所述底物包括(但不限于):阿魏酸,N-乙酰-5羟色胺(NAS),白藜芦醇,红霉素,愈创木酚,水杨酸甲酯,对羟基苯甲醛等;可以理解,突变型COMT也具有野生型的COMT同样的功能,也具有相对广泛的底物、催化其发生O-甲基化反应。
作为本发明的一种优选方式,所述的COMT突变体可作为香兰素合成途径的一种甲基转移酶。
香兰素(Vanillin),3-甲氧基-4-羟基苯甲醛,又名香草醛,是一种广泛使用的可食用香料,是由德国的M·哈尔曼博士与G·泰曼博士于1874年合成成功是人类合成的第一种香精。其分子式为C8H8O3,分子量为152.15,密度为1.056,熔点81~82℃,沸点285℃,微甜,溶于热水、乙醇、乙醚、甘油和酒精,在冷水及植物油中不易溶解,其水溶液与三氯化铁作用呈蓝紫色。在空气中易氧化,遇碱性物质易变色。天然香兰素存在于烟叶、芦笋、咖啡和香荚兰(Vanilla fragrans(Salisb.)Ames)中,是目前全球使用最多的食品赋香剂之一,有“食品香料之王”的美誉。常用于婴幼儿配方食品和谷类食品,也可以作为植物生长促进剂、杀菌剂、润滑油消泡剂等,是合成药物和其他香料的重要中间体。目前,主要是通过化学合成法来制备香兰素,但该法得到的产品香型较为单一,缺乏天然香兰素的复合香气且容易引发环境污染等问题。在天然的香草荚里,香兰素就是最重要的一种香气成分。由于香草兰花荚植物对土壤及气候因素的要求非常高,而且天然加工的发酵处理工艺复杂,所以香兰素的天然来源非常有限。从天然植物中提取的香兰素产品在全球产量中的占比不到1%。新鲜的香草荚并没有那种甜香的气味,因为它所含有的香兰素不是游离的,而是以糖苷形式存在,此时香味还无法释放。在经过漫长的日晒、发酵的过程之后,香草荚最终获得了它的香气。
而随着代谢工程和合成生物学的发展,众多研究者们通过构建人工生物系统理解和发展植物天然产物。在微生物体内模拟天然产物自然合成途径和优化改造合成途径已经变得越来越重要和普遍。在本发明的优选实施例中,本发明人在大肠杆菌中完成香兰素途径的组装来模拟植物天然的合成途径,利用一系列代谢工程手段对发酵途径优化,使得在大肠杆菌中异源高效合成香兰素成为可能。突变型COMT的酶活性检测方法可以运用本领域公知的技术。例如,可使用相同条件的酶反应体系对不同突变体蛋白进行体外酶活性测试。反应后经HPLC检测产物生成,通过比较突变体与野生型对底物的相对转换率,分析突变体的催化活性变化。
在本发明的优选实施例中,以来源于拟南芥(Arabidopsis thaliana(L.)Heynh)的咖啡酸O-甲基转移酶AtCOMT作为亲本,将第310位的关键氨基酸残基的谷氨酰胺Gln(Q)位点突变为甘氨酸Gly(G),以提高咖啡酸化合物的催化活性。经改造后的咖啡酸O-甲基转移酶COMT突变体,应用于人工构建的重组大肠杆菌系统,该重组微生物能够生产香兰素,体内发酵产生香兰素的效率是野生型的1.6倍,具有更好的催化活性,更适用于香兰素的工业化生产。
本发明的突变型COMT或表达该突变型COMT的宿主细胞可以被配制于药学上或工业合成上可接受的载体中,获得适于进行催化反应、或适于储存的组合物。作为本发明的优选方式,所述的宿主细胞中还包括其它的阿魏酸合成途径基因和/或香兰素合成途径基因;较佳地,较佳地,所述的阿魏酸合成途径基因包括:Rgtal、sam5和AtCOMT;较佳地,所述香兰素合成途径基因包括:fdc和cso2(A49P-Q390A)。
本发明的突变型COMT或含有其(优选地还含有其它的阿魏酸合成途径基因和/或香兰素合成途径基因)的宿主细胞也可以被置于试剂盒中,以便于使用或销售,一般而言,所述的试剂盒中还包含使用说明书。
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件如J.萨姆布鲁克等编著,分子克隆实验指南,第三版,科学出版社,中所述的条件,或按照制造厂商所建议的条件。
材料和仪器
拟南芥cDNA取自拟南芥植物。寡核苷酸引物、抗生素、核酸染料溴化乙锭(EB)购自生工科技(Sangon Biotech)有限公司。多聚酶链式反应(PCR)胶回收试剂盒,质粒抽提试剂盒均为美国产品;聚合酶链式反应(PCR)高保真酶PrimeSTAR Max DNA Polymerase为日本宝生物公司(TAKARA)产品;II One Step Cloning Kit为Vazyme产品。大肠杆菌DH10B、BL21(DE3)菌株和pET21a、pET28a载体用于基因克隆、蛋白表达及发酵测试。
标准品化合物香兰素购自上海润捷化学试剂有限公司,标准品化合物阿魏酸购自上海源叶生物科技有限公司、标准品化合物咖啡酸购自艾览上海化工科技有限公司、标准品化合物对香豆酸购自上海源叶生物科技有限公司。L-酪氨酸购自生工科技(SangonBiotech)有限公司。其他试剂为国产分析纯或色谱纯试剂,购自国药集团化学试剂有限公司。色谱分离使用C18柱(Silgreen HPLC column 250×4.6mm)。
PCR使用Arktik Thermal Cycler(Thermo Fisher Scientific);恒温培养使用ZXGP-A2050恒温培养箱(智城)和ZWY-211G恒温培养振荡器(智城);离心使用5418R高速冷冻式离心机和5418小型离心机(Eppendorf)。真空浓缩使用Concentrator plus浓缩仪(Eppendorf);OD600使用UV-1200紫外可见分光光度计检测(上海美谱达仪器有限公司)。旋转蒸发系统由IKA RV 10digital旋转蒸发仪(IKA)和MZ 2C NT化学隔膜泵、CVC3000真空控制器(vacuubrand)组成。高效液相色谱使用Dionex UltiMate 3000液相色谱系统(ThermoFisher Scientific)。
后续实施例所用培养基和溶液如表1。
表1
后续实施例中所涉及的AtCOMT核苷酸序列如SEQ ID NO:1:
>AtCOMT
atgggttcaacggcagagacacaattaactccggtgcaagtcaccgacgacgaagctgccctcttcgccatgcaactagccagtgcttccgttcttccgatggctttaaaatccgcctta8gagcttgaccttcttgagattatggccaagaatggttctcccatgtctcctaccgagatcgcttctaaacttccgaccaaaaatcctgaagctccggtcatgctcgaccgtatcctccgtcttcttacgtcttactccgtcttaacctgctccaaccgtaaactttccggtgatggcgttgaacggatttacgggcttggtccggtttgcaagtatttgaccaagaacgaagatggtgtttccattgctgctctttgtcttatgaaccaagacaaggttctcatggaaagctggtaccatttgaaggatgcaattcttgatggtgggattccattcaacaaggcttatggaatgagcgcgttcgagtaccacgggactgaccctagattcaacaaggtctttaacaatggaatgtctaaccattccacaatcaccatgaagaagattcttgagacctataagggttttgaaggattgacttctttggttgatgttggtggtggcattggtgctacactcaaaatgattgtctccaagtaccctaatcttaaaggcatcaactttgatctcccacatgtcatcgaagatgctccttctcatcctggtattgagcatgttggaggagatatgtttgtaagtgtccctaaaggtgatgccatattcatgaagtggatatgtcatgactggagtgacgaacattgcgtgaaattcttgaagaactgctacgagtcacttccagaggatggaaaagtgatattagcagagtgtatacttccagagacaccagactcaagcctctcaaccaaacaagtagtccatgtcgattgcattatgttggctcacaatcccggaggcaaagaacgaaccgagaaagagtttgaggcattagccaaagcatcaggcttcaagggcatcaaagttgtctgcgacgcttttggtgttaaccttattgagttactcaagaagctctaa
后续实施例中所涉及的AtCOMT氨基酸序列如SEQ ID NO:2:
>AtCOMT
MGSTAETQLTPVQVTDDEAALFAMQLASASVLPMALKSALELDLLEIMAKNGSPMSPTEIASKLPTKNPEAPVMLDRILRLLTSYSVLTCSNRKLSGDGVERIYGLGPVCKYLTKNEDGVSIAALCLMNQDKVLMESWYHLKDAILDGGIPFNKAYGMSAFEYHGTDPRFNKVFNNGMSNHSTITMKKILETYKGFEGLTSLVDVGGGIGATLKMIVSKYPNLKGINFDLPHVIEDAPSHPGIEHVGGDMFVSVPKGDAIFMKWICHDWSDEHCVKFLKNCYESLPEDGKVILAECILPETPDSSLSTKQVVHVDCIMLAHNPGGKERTEKEFEALAKASGFKGIKVVCDAFGVNLIELLKKL*
如下实施例中所涉及的AtCOMT(Q310G)突变体核苷酸序列如SEQ ID NO:3:
>AtCOMT(Q310G)
atgggttcaacggcagagacacaattaactccggtgcaagtcaccgacgacgaagctgccctcttcgccatgcaactagccagtgcttccgttcttccgatggctttaaaatccgccttagagcttgaccttcttgagattatggccaagaatggttctcccatgtctcctaccgagatcgcttctaaacttccgaccaaaaatcctgaagctccggtcatgctcgaccgtatcctccgtcttcttacgtcttactccgtcttaacctgctccaaccgtaaactttccggtgatggcgttgaacggatttacgggcttggtccggtttgcaagtatttgaccaagaacgaagatggtgtttccattgctgctctttgtcttatgaaccaagacaaggttctcatggaaagctggtaccatttgaaggatgcaattcttgatggtgggattccattcaacaaggcttatggaatgagcgcgttcgagtaccacgggactgaccctagattcaacaaggtctttaacaatggaatgtctaaccattccacaatcaccatgaagaagattcttgagacctataagggttttgaaggattgacttctttggttgatgttggtggtggcattggtgctacactcaaaatgattgtctccaagtaccctaatcttaaaggcatcaactttgatctcccacatgtcatcgaagatgctccttctcatcctggtattgagcatgttggaggagatatgtttgtaagtgtccctaaaggtgatgccatattcatgaagtggatatgtcatgactggagtgacgaacattgcgtgaaattcttgaagaactgctacgagtcacttccagaggatggaaaagtgatattagcagagtgtatacttccagagacaccagactcaagcctctcaaccaaaggagtagtccatgtcgattgcattatgttggctcacaatcccggaggcaaagaacgaaccgagaaagagtttgaggcattagccaaagcatcaggcttcaagggcatcaaagttgtctgcgacgcttttggtgttaaccttattgagttactcaagaagctctaa
如下实施例中所涉及的AtCOMT突变体(Q310G)氨基酸序列如SEQ ID NO:4:
>AtCOMT(Q310G)
MGSTAETQLTPVQVTDDEAALFAMQLASASVLPMALKSALELDLLEIMAKNGSPMSPTEIASKLPTKNPEAPVMLDRILRLLTSYSVLTCSNRKLSGDGVERIYGLGPVCKYLTKNEDGVSIAALCLMNQDKVLMESWYHLKDAILDGGIPFNKAYGMSAFEYHGTDPRFNKVFNNGMSNHSTITMKKILETYKGFEGLTSLVDVGGGIGATLKMIVSKYPNLKGINFDLPHVIEDAPSHPGIEHVGGDMFVSVPKGDAIFMKWICHDWSDEHCVKFLKNCYESLPEDGKVILAECILPETPDSSLSTKGVVHVDCIMLAHNPGGKERTEKEFEALAKASGFKGIKVVCDAFGVNLIELLKKL*
如下实施例中所涉及的RgTAL核苷酸序列如SEQ ID NO:5:
>RgTAL
atggccccgcgtccgacctcacagaatcagtatcgtacctgtccgaccacccaggtgacccaggtggatattgtggaaaaaatgctggcagccccgaccgattcaaccttagaactggatggctatagtctgaatctgggcgatgttgtgagcgccgcacgtaaaggtcgtccggttcgtgttaaagatagcgatgaaattcgctctaaaattgataaatcagtggaatttctgcgctcacagctgtctatgagcgtgtatggcgtgaccaccggctttggcggtagtgcagatacccgtaccgaagatgccatttctttacagaaagcattattagaacatcagttatgtggcgtgctgccgagtagctttgatagctttcgcctgggtcgcggcttagaaaatagtctgccgttagaagtggttcgcggtgccatgaccattcgtgttaatagtttaacccgtggtcatagcgccgtgcgcttagttgtgttagaagccctgaccaattttctgaatcatggtattaccccgattgttccgttacgcggcaccattagtgcaagcggcgatctgagtccgctgagctatattgcagcagccatttcaggtcatccggattctaaagttcatgttgtgcatgaaggcaaagaaaaaattctgtatgcacgcgaagcaatggccctgtttaatctggaacccgttgttttaggcccgaaagaaggcctgggcttagttaatgggaccgcagtgagcgcctctatggccaccctggccttacatgatgcacacatgctgtcactgctgtctcagagcttaaccgcaatgaccgtggaagcaatggtgggtcatgcaggctcttttcatccgtttttacatgatgtgacccgtccgcatccgacccagattgaagttgccggtaatattcgtaaactgctggaaggctctcgctttgcagttcatcatgaagaagaagttaaagtgaaagatgatgaaggtattctgcgtcaggatcgctatccgttacgtacctctccgcagtggttaggcccgctggtgagcgatctgattcatgcacatgccgttttaaccattgaagccggccagtcaaccaccgataatccgctgattgatgtggaaaataaaacctcacatcatggcggtaattttcaggccgcagccgttgccaatactatggaaaaaacccgcctgggcttagcacagattggcaaactgaattttacccagttaaccgaaatgctgaatgccggtatgaatcgcggcttaccgtcttgtctggccgccgaagatccgagcttatcatatcattgtaaaggtttagatattgccgcagcagcctataccagcgaactgggtcatttagccaatccggtgaccacccatgttcagccggcagaaatggccaatcaggcagtgaatagcttagccctgattagtgcacgtcgtaccaccgaatctaatgatgtgctgtcactgttattagccacccatctgtattgtgtgttacaggcaattgatctgcgcgcaattgaatttgaatttaaaaaacagtttggtccggccattgtgtcactgattgatcagcattttggtagcgcaatgactggcagtaatttacgcgatgaactggttgaaaaagtgaataaaaccttagccaaacgcctggaacagaccaatagctatgatctggttccgcgttggcatgatgccttttcttttgcagcaggcaccgtggtggaagtgctgtcttcaacctcactgagtttagcagccgttaatgcatggaaagttgccgcagcagaaagcgccatttctttaacccgtcaggtgcgcgaaaccttttggagtgccgcctctacctcaagtccggccctgagctatctgtctccgcgtacccagattctgtatgcctttgttcgcgaagaactgggcgttaaagcacgtcgcggcgatgtgtttctgggcaaacaggaagtgaccattggtagtaatgtgagtaaaatttatgaagcaattaaatcaggtcgtattaataatgtgttactgaaaatgctggcataa
如下实施例中所涉及的RgTAL氨基酸序列如SEQ ID NO:6:
>RgTAL
MAPRPTSQNQYRTCPTTQVTQVDIVEKMLAAPTDSTLELDGYSLNLGDVVSAARKGRPVRVKDSDEIRSKIDKSVEFLRSQLSMSVYGVTTGFGGSADTRTEDAISLQKALLEHQLCGVLPSSFDSFRLGRGLENSLPLEVVRGAMTIRVNSLTRGHSAVRLVVLEALTNFLNHGITPIVPLRGTISASGDLSPLSYIAAAISGHPDSKVHVVHEGKEKILYAREAMALFNLEPVVLGPKEGLGLVNGTAVSASMATLALHDAHMLSLLSQSLTAMTVEAMVGHAGSFHPFLHDVTRPHPTQIEVAGNIRKLLEGSRFAVHHEEEVKVKDDEGILRQDRYPLRTSPQWLGPLVSDLIHAHAVLTIEAGQSTTDNPLIDVENKTSHHGGNFQAAAVANTMEKTRLGLAQIGKLNFTQLTEMLNAGMNRGLPSCLAAEDPSLSYHCKGLDIAAAAYTSELGHLANPVTTHVQPAEMANQAVNSLALISARRTTESNDVLSLLLATHLYCVLQAIDLRAIEFEFKKQFGPAIVSLIDQHFGSAMTGSNLRDELVEKVNKTLAKRLEQTNSYDLVPRWHDAFSFAAGTVVEVLSSTSLSLAAVNAWKVAAAESAISLTRQVRETFWSAASTSSPALSYLSPRTQILYAFVREELGVKARRGDVFLGKQEVTIGSNVSKIYEAIKSGRINNVLLKMLA*
如下实施例中所涉及的sam5核苷酸序列如SEQ ID NO:7:
>sam5
atgaccatcacctctccggcgccggcgggtcgtctgaacaacgttcgtccgatgaccggtgaagaatacctggaatctctgcgtgacggtcgtgaagtttacatctacggtgaacgtgttgacgacgttaccacccacctggcgttccgtaactctgttcgttctatcgcgcgtctgtacgacgttctgcacgacccggcgtctgaaggtgttctgcgtgttccgaccgacaccggtaacggtggtttcacccacccgttcttcaaaaccgcgcgttcttctgaagacctggttgcggcgcgtgaagcgatcgttggttggcagcgtctggtttacggttggatgggtcgtaccccggactacaaagcggcgttcttcggtaccctggacgcgaacgcggaattctacggtccgttcgaagcgaacgcgcgtcgttggtaccgtgacgcgcaggaacgtgttctgtacttcaaccacgcgatcgttcacccgccggttgaccgtgaccgtccggcggaccgtaccgcggacatctgcgttcacgttgaagaagaaaccgactctggtctgatcgtttctggtgcgaaagttgttgcgaccggttctgcgatgaccaacgcgaacctgatcgcgcactacggtctgccggttcgtgacaaaaaattcggtctggttttcaccgttccgatgaactctccgggtctgaaactgatctgccgtacctcttacgaactgatggttgcgacccagggttctccgttcgactacccgctgtcttctcgtctggacgaaaacgactctatcatgatcttcgaccgtgttctggttccgtgggaaaacgttttcatgtacgacgcgggtgcggcgaactctttcgcgaccggttctggtttcctggaacgtttcaccttccacggttgcacccgtctggcggttaaactggacttcatcgcgggttgcgttatgaaagcggttgaagttaccggtaccacccacttccgtggtgttcaggcgcaggttggtgaagttctgaactggcgtgacgttttctggggtctgtctgacgcgatggcgaaatctccgaactcttgggttggtggttctgttcagccgaacctgaactacggtctggcgtaccgtaccttcatgggtgttggttacccgcgtatcaaagaaatcatccagcagaccctgggttctggtctgatctacctgaactcttctgcggcggactggaaaaacccggacgttcgtccgtacctggaccgttacctgcgtggttctcgtggtatccaggcgatcgaccgtgttaaactgctgaaactgctgtgggacgcggttggtaccgaattcgcgggtcgtcacgaactgtacgaacgtaactacggtggtgaccacgaaggtatccgtgttcagaccctgcaggcgtaccaggcgaacggtcaggcggcggcgctgaaaggtttcgcggaacagtgcatgtctgaatacgacctggacggttggacccgtccggacctgatcaacccgggtacctaa
如下实施例中所涉及的sam5氨基酸序列如SEQ ID NO:8:
>sam5
MTITSPAPAGRLNNVRPMTGEEYLESLRDGREVYIYGERVDDVTTHLAFRNSVRSIARLYDVLHDPASEGVLRVPTDTGNGGFTHPFFKTARSSEDLVAAREAIVGWQRLVYGWMGRTPDYKAAFFGTLDANAEFYGPFEANARRWYRDAQERVLYFNHAIVHPPVDRDRPADRTADICVHVEEETDSGLIVSGAKVVATGSAMTNANLIAHYGLPVRDKKFGLVFTVPMNSPGLKLICRTSYELMVATQGSPFDYPLSSRLDENDSIMIFDRVLVPWENVFMYDAGAANSFATGSGFLERFTFHGCTRLAVKLDFIAGCVMKAVEVTGTTHFRGVQAQVGEVLNWRDVFWGLSDAMAKSPNSWVGGSVQPNLNYGLAYRTFMGVGYPRIKEIIQQTLGSGLIYLNSSAADWKNPDVRPYLDRYLRGSRGIQAIDRVKLLKLLWDAVGTEFAGRHELYERNYGGDHEGIRVQTLQAYQANGQAAALKGFAEQCMSEYDLDGWTRPDLINPGT*
如下实施例中所涉及的fdc核苷酸序列如SEQ ID NO:9:
>fdc
atggatcagtttgttggtctgcacatgatctatacctatgaaaatggttgggaatatgaaatctatatcaagaatgaccacaccattgattatcgcattcatagcggtatggttggcggccgctgggttcgtgatcaggaagtgaatattgttaaactgaccaaaggcgtgtataaagtgagctggaccgaaccgaccggtaccgatgtgagtctgaattttatgccggaagaaaaacgcatgcatggcgtgattttctttccgaaatgggttcatgaacgtccggatattaccgtgtgttatcagaatgattatatcgatctgatgaaggaaagccgcgaaaaatatgaaacctatccgaaatatgtggttccggaatttgccgatattacctatattcatcatgccggcgttaatgatgaaaccattattgcagaagcaccgtatgaaggtctgaccgatgaaattcgcgcaggccgtaaataa
如下实施例中所涉及的fdc氨基酸序列如SEQ ID NO:10:
>fdc
MDQFVGLHMIYTYENGWEYEIYIKNDHTIDYRIHSGMVGGRWVRDQEVNIVKLTKGVYKVSWTEPTGTDVSLNFMPEEKRMHGVIFFPKWVHERPDITVCYQNDYIDLMKESREKYETYPKYVVPEFADITYIHHAGVNDETIIAEAPYEGLTDEIRAGRK*
如下实施例中所涉及的cso2核苷酸序列如SEQ ID NO:11:
>cso2
atgaccgctcgttttccaaacacccgtgaatttactggcgcactgtatcgcccatctcgctttgaaggtgaagttttcgacctggaagtggatggtcagctgccgactgacattgatggtaccttcttctccgtagctccagatgctgctttcccgccgatgcgtgaagatgacatttttttcaacggcgacggtgccgtgtctgcattccgttttggtggtggtcatgtggatttccagcgccgttacgtacgcactcagcgtctggaagctcagcgtgcagctcgtcgctccctgcatggtgtttaccgcaacccgagcaccaatgacccgtctgttctgggcctgaacaactctaccgcgaataccaacgttctggaacatgcgggtgtcctgctggccatgaaagaggattctctgccatacgccctggaccctctgactctggaaaccaaaggcctgtggaatttcggcggccaactgaccgacgctccgtttactgctcatccaaagattgacccgctgactggtgacatgatcgcctttggttacgaggcgcgtggtgacggctctcgtgatattgtttattacgagttcgatgaacatggtgctaaaacccgtgagatttgggttcaggctccggtgtctgctatggttcacgattttgccgtcactgagcgttttgtggtcttcccgattatccctctgtccgttgatgttgaacgcctgcgtcaaggtggtcgtcatttccagtggcaaccggatctgccgcagtacttcggtgtgatgcgtcgtgacggtgatggcggtgatctgcactggttcaccgctccgaacggtttccagggccacacgctgaacgctttcgacgacggtgaaaaagtttatgcggacatgaccagcactaacggtaacgtattctacttctttccgccggctgatggttttgttccgagcccggaaaccctggttagccagctggtacgttggactttcgatctgagcgtgaagggtggtcgtctggacatgtctccgctgacccctttcccggcggaatttccgcgtattgacgaccgcgtagctctgcgtccgcatcgtcacggttggatgatggcaatggacccgactaaaccgtacgccgaagaccgtgttggtccacgtccgttcgcgttcttcaaccagctggctcatctgaacatcgctaccggcaaaatccagacttggttcgccgacgaagcgtcctgttttcaggaacctgtgttcgtcccgcgtaccggctcttcccgtgaaggtgacggttatctgctgtctctggttaaccgcctggacgaacgcaccacggacatggttgttctggatgcactgcgtctgggtgaaggtccggttgctaccgttaaactgccgctgcgtatgcgtatggctctgcacggcaactggtcccgtgcggtttctccgagctccatcaaagcggtgtaa
如下实施例中所涉及的cso2氨基酸序列如SEQ ID NO:12:
>cso2
MTARFPNTREFTGALYRPSRFEGEVFDLEVDGQLPTDIDGTFFSVAPDAAFPPMREDDIFFNGDGAVSAFRFGGGHVDFQRRYVRTQRLEAQRAARRSLHGVYRNPSTNDPSVLGLNNSTANTNVLEHAGVLLAMKEDSLPYALDPLTLETKGLWNFGGQLTDAPFTAHPKIDPLTGDMIAFGYEARGDGSRDIVYYEFDEHGAKTREIWVQAPVSAMVHDFAVTERFVVFPIIPLSVDVERLRQGGRHFQWQPDLPQYFGVMRRDGDGGDLHWFTAPNGFQGHTLNAFDDGEKVYADMTSTNGNVFYFFPPADGFVPSPETLVSQLVRWTFDLSVKGGRLDMSPLTPFPAEFPRIDDRVALRPHRHGWMMAMDPTKPYAEDRVGPRPFAFFNQLAHLNIATGKIQTWFADEASCFQEPVFVPRTGSSREGDGYLLSLVNRLDERTTDMVVLDALRLGEGPVATVKLPLRMRMALHGNWSRAVSPSSIKAV*
如下实施例中所涉及的cso2(A49P-Q390A)核苷酸序列如SEQ ID NO:13:
>cso2(A49P-Q390A)
atgaccgctcgttttccaaacacccgtgaatttactggcgcactgtatcgcccatctcgctttgaaggtgaagttttcgacctggaagtggatggtcagctgccgactgacattgatggtaccttcttctccgtagctccagatccggctttcccgccgatgcgtgaagatgacatttttttcaacggcgacggtgccgtgtctgcattccgttttggtggtggtcatgtggatttccagcgccgttacgtacgcactcagcgtctggaagctcagcgtgcagctcgtcgctccctgcatggtgtttaccgcaacccgagcaccaatgacccgtctgttctgggcctgaacaactctaccgcgaataccaacgttctggaacatgcgggtgtcctgctggccatgaaagaggattctctgccatacgccctggaccctctgactctggaaaccaaaggcctgtggaatttcggcggccaactgaccgacgctccgtttactgctcatccaaagattgacccgctgactggtgacatgatcgcctttggttacgaggcgcgtggtgacggctctcgtgatattgtttattacgagttcgatgaacatggtgctaaaacccgtgagatttgggttcaggctccggtgtctgctatggttcacgattttgccgtcactgagcgttttgtggtcttcccgattatccctctgtccgttgatgttgaacgcctgcgtcaaggtggtcgtcatttccagtggcaaccggatctgccgcagtacttcggtgtgatgcgtcgtgacggtgatggcggtgatctgcactggttcaccgctccgaacggtttccagggccacacgctgaacgctttcgacgacggtgaaaaagtttatgcggacatgaccagcactaacggtaacgtattctacttctttccgccggctgatggttttgttccgagcccggaaaccctggttagccagctggtacgttggactttcgatctgagcgtgaagggtggtcgtctggacatgtctccgctgacccctttcccggcggaatttccgcgtattgacgaccgcgtagctctgcgtccgcatcgtcacggttggatgatggcaatggacccgactaaaccgtacgccgaagaccgtgttggtccacgtccgttcgcgttcttcaaccagctggctcatctgaacatcgctaccggcaaaatccagacttggttcgccgacgaagcgtcctgttttcaggaacctgtgttcgtcccgcgtaccggctcttcccgtgaaggtgacggttatctgctgtctctggttaaccgcctggacgaacgcaccacggacatggttgttctggatgcactgcgtctgggtgaaggtccggttgctaccgttaaactgccgctgcgtatgcgtatggctctgcacggcaactggtcccgtgcggtttctccgagctccatcaaagcggtgtaa
如下实施例中所涉及的cso2(A49P-Q390A)氨基酸序列如SEQ ID NO:14:
>cso2(A49P-Q390A)
MTARFPNTREFTGALYRPSRFEGEVFDLEVDGQLPTDIDGTFFSVAPDPAFPPMREDDIFFNGDGAVSAFRFGGGHVDFQRRYVRTQRLEAQRAARRSLHGVYRNPSTNDPSVLGLNNSTANTNVLEHAGVLLAMKEDSLPYALDPLTLETKGLWNFGGQLTDAPFTAHPKIDPLTGDMIAFGYEARGDGSRDIVYYEFDEHGAKTREIWVQAPVSAMVHDFAVTERFVVFPIIPLSVDVERLRQGGRHFQWQPDLPQYFGVMRRDGDGGDLHWFTAPNGFQGHTLNAFDDGEKVYADMTSTNGNVFYFFPPADGFVPSPETLVSQLVRWTFDLSVKGGRLDMSPLTPFPAEFPRIDDRVALRPHRHGWMMAMDPTKPYAEDRVGPRPFAFFNQLAHLNIATGKIQTWFADEASCFQEPVFVPRTGSSREGDGYLLSLVNRLDERTTDMVVLDALRLGEGPVATVKLPLRMRMALHGNWSRAVSPSSIKAV*
实施例1、AtCOMT基因克隆
根据AtCOMT DNA序列(SEQ ID NO:1及其在拟南芥中的上下游序列),设计引物AtCOMT-F/R(如表2)。以AtCOMT-F/R为引物,以拟南芥cDNA为模板进行PCR扩增(反应体系及条件如表3),并进行1.0%的琼脂糖凝胶电泳(结果如图1),得到条带F-AtCOMT,与目标大小一致。
再以infu-AtCOMT-F/R为引物,以F-AtCOMT为模板进行PCR扩增(反应体系及条件同表3),再次进行1.0%的琼脂糖凝胶电泳(结果如图1),得到含pET28a同源臂的F1-infu-AtCOMT,与目标大小一致。再将F1-infu-AtCOMT与双酶切(NcoI&BamHI)的pET28a线性载体进行infusion同源重组反应体系及条件如表4),将其转入DH10B感受态细胞中进行转化,挑取单克隆进行测序,得到1号克隆正确,称为pZYL20-pET28a-AtCOMT。序列与NCBI序列一致,从而得到了AtCOMT全长基因。
表2、用于AtCOMT基因克隆的引物
表3、PCR反应体系及条件
表4、DNA无缝克隆技术连接体系和条件
实施例2、AtCOMT定点突变
采用定点技术构建突变体AtCOMT(Q310G)。首先设计定点突变引物(如表5),以pZYL20-pET28a-AtCOMT质粒为模板,进行PCR扩增(反应体系及条件同表3),并进行1.0%的琼脂糖凝胶电泳(结果如图1),得到条带F128,与目标大小一致。将胶回收产物转入DH10B感受态细胞中进行转化,挑取单克隆进行测序,即pZYL128:pET28a-AtCOMT(Q310G)。
表5、用于AtCOMT定点突变的引物
实施例3、AtCOMT(Q310G)组装到香兰素合成途径
本发明人分析了香兰素的合成途径,其合成需要5步酶催化反应,分别是TAL、Sam5、COMT、FDC和CSO2,考虑到大肠杆菌的筛选标记,先将前3个基因构建在含有氨苄霉素的载体pET21d上,即pZYL51:pET21d-Rgtal-sam5-AtCOMT;然后将剩余2个基因构建在含有卡那霉素的载体pET28a上,即pZYL33-pET28a-fdc-cso2(A49P-Q390A)。
pZYL51:pET21d-Rgtal-sam5-AtCOMT的建立:该质粒包括TAL、Sam5、COMT三个酶,即来自粘红酵母的TAL(编码酪氨酸解氨酶,RgTAL,SEQ ID NO:5)基因,来自西班牙糖酵母菌的sam5(编码ρ-香豆酸3-羟化酶,SeSAM5,SEQ ID NO:7)基因和来自拟南芥的COMT(编码咖啡酸O-甲基转移酶,AtCOMT,SEQ ID NO:1)基因。进行基因合成并进行密码子优化,将上述三个基因构建于pET21d-Rgtal、pET21a-sam5和pET21a-AtCOMT质粒中。基于BioBrick组装方法,使用XbaI/SpeI顺序组装整个途径。将来自pET21a-sam5的XbaI/HindIII切除的DNA片段插入pET21d-Rgtal的SpeI/HindIII位点之间,以获得质粒pET21d-tal-sam5。然后将来自pET21a-AtCOMT的XbaI/HindIII切除的DNA片段依次插入pET21d-Rgtal-sam5的SpeI/HindIII位点之间,以生成质粒pZYL51:pET21d-Rgtal-sam5-AtCOMT。
在pZYL51:pET21d-Rgtal-sam5-AtCOMT质粒的AtCOMT基因中引入单突变,同实施例1中质粒构建方法一致。首先设计定点突变引物(如表6),以pZYL51质粒为模板,以168-F/R为引物,进行PCR扩增(反应体系及条件同表2),并进行1.0%的琼脂糖凝胶电泳,得到条带F168(其含有AtCOMT(Q310G),SEQ ID NO:3),与目标大小一致。再将10uL F168直接转入DH10B感受态细胞中进行转化,挑取单克隆进行测序,得到pZYL168:pET-21d-Rgtal-sam5-Atcomt(Q310G),该质粒可用于合成阿魏酸,再与pZYL33:pET28a-fdc-cso2(A49P-Q390A)共转于大肠杆菌BL21(DE3),用于香兰素合成。
pZYL33:pET28a-fdc-cso2(A49P-Q390A)的建立:该质粒包括FDC、CSO2两个酶,短小芽孢杆菌的Fdc(阿魏酸脱羧酶,FDC,SEQ ID NO:9)基因和西格尼丝柄细菌的Cso2(类胡萝卜素裂解加氧酶,CSO2,SEQ ID NO:11)基因。进行基因合成并进行密码子优化,将上述两个基因构建于pET28a质粒骨架上的操纵子中,命名为pZYL34-pET28a-fdc-cso2,并在pZYL34-pET28a-fdc-cso2质粒的cso2基因中引入双突变,用于实现从阿魏酸生产香兰素。同实施例1中质粒构建方法一致。首先设计定点突变引物(如表6),以34-F/R为引物,以pZYL34质粒为模板,进行PCR扩增(反应体系及条件同表2),并进行1.0%的琼脂糖凝胶电泳,得到条带F35(其含有CSO2(A49P)),与目标大小一致。再以F35为模板,以33-F/R为引物,进行PCR扩增(反应体系及条件同表2),并进行1.0%的琼脂糖凝胶电泳,得到条带F33(其含有CSO2(A49P-Q390A),SEQ ID NO:13),与目标大小一致。将10uL PCR产物F33直接转入DH10B感受态细胞中进行转化,挑取单克隆进行测序,得到pZYL33:pET28a-fdc-cso2(A49P-Q390A),用于香兰素合成。
再将pZYL168-pET-21d-Rgtal-sam5-Atcomt(Q310G)与pZYL33-pET28a-fdc-cso2(A49P-Q390A)共转于大肠杆菌BL21(DE3),用于香兰素合成。
表6、用于定点突变的引物
本实施例所用菌株和质粒如表7。
表7、本实施例所用菌株和质粒
质粒或菌株 质粒描述 抗性
Strains:SYL100 BL21(DE3)-pZYL168-pZYL33-pGro7 Car+Kan+Cm
Plasmids:pZYL168 pZYL168-pET21d-Rgtal-sam5-Atcomt(Q310G) Car
Plasmids:pZYL33 pZYL33-pET28a-fdc-cso2(A49P-Q390A) Kan
实施例4、利用人工构建的重组大肠杆菌系统合成香兰素
将pZYL168(pET-21d-Rgtal-sam5-Atcomt(Q310G))、pZYL33(pET28a-fdc-cso2(A49P-Q390A))和pGro7(作为分子伴侣,购自上海生工)共转于大肠杆菌BL21(DE3),涂布于Car+Kan+Cm抗性平板中,37℃培养箱过夜倒置培养。第二天挑取平板单克隆,接种于2mL加有Car+Kan+Cm抗生素的LB(玻璃试管)中,过夜培养10h。将1%过夜菌液接种于加有Car+Kan+Cm抗生素的TB培养基中,并初始添加1g/L L-酪氨酸(图2a)。37℃,250rpm培养至OD600∈(0.6-1.0),冰浴10min。添加终浓度0.1mM的IPTG和终浓度10mM阿拉伯糖进行诱导,22℃发酵5天。
1)取样在OD600nm下进行检测,并记录。
2)将500uL发酵液用等体积(500uL)的乙酸乙酯进行萃取2次,真空旋转蒸干。用100uL甲醇复溶,12000rpm离心1min,将上清转移到装有内衬管的液相小瓶中,进行HPLC检测。
HPLC检测条件:发酵液产物色谱柱为C18柱(Silgreen HPLC column 250×4.6mm),液相色谱条件为:柱温30℃,流速1mL/min,使用流动相B相为含0.1%冰醋酸的水。C相为含0.1%冰醋酸的甲醇,0-2min 80%B+20%C,2-17min 50%B+50%C,17-22min 100%C,22-23min 80%B+20%C,25min 80%B+20%C。
根据HPLC检测结果,以WT、Atcomt(Q310G)突变体发酵样品进行检测,WT香兰素的产量只有198.65mg/L,而Atcomt(Q310G)香兰素的产量达327.72mg/L,显著提高香兰素的产量,产量增幅达到65%(图2b-c)。
此外本发明人还发现,伴随着香兰素浓度的升高,中间产物的积累也逐渐增加,说明Atcomt(Q310G)蛋白活性的改善可以打开整条香兰素合成途径的代谢通量,这是令人意外的。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。同时,在本发明提及的所有文献都在本申请中引用作为参考,就如同每一篇文献被单独引用作为参考那样。
序列表
<110> 中国科学院分子植物科学卓越创新中心
<120> 咖啡酸O-甲基转移酶突变体及其应用
<130> 21A686
<160> 26
<170> SIPOSequenceListing 1.0
<210> 1
<211> 1092
<212> DNA
<213> Arabidopsis thaliana
<400> 1
atgggttcaa cggcagagac acaattaact ccggtgcaag tcaccgacga cgaagctgcc 60
ctcttcgcca tgcaactagc cagtgcttcc gttcttccga tggctttaaa atccgcctta 120
gagcttgacc ttcttgagat tatggccaag aatggttctc ccatgtctcc taccgagatc 180
gcttctaaac ttccgaccaa aaatcctgaa gctccggtca tgctcgaccg tatcctccgt 240
cttcttacgt cttactccgt cttaacctgc tccaaccgta aactttccgg tgatggcgtt 300
gaacggattt acgggcttgg tccggtttgc aagtatttga ccaagaacga agatggtgtt 360
tccattgctg ctctttgtct tatgaaccaa gacaaggttc tcatggaaag ctggtaccat 420
ttgaaggatg caattcttga tggtgggatt ccattcaaca aggcttatgg aatgagcgcg 480
ttcgagtacc acgggactga ccctagattc aacaaggtct ttaacaatgg aatgtctaac 540
cattccacaa tcaccatgaa gaagattctt gagacctata agggttttga aggattgact 600
tctttggttg atgttggtgg tggcattggt gctacactca aaatgattgt ctccaagtac 660
cctaatctta aaggcatcaa ctttgatctc ccacatgtca tcgaagatgc tccttctcat 720
cctggtattg agcatgttgg aggagatatg tttgtaagtg tccctaaagg tgatgccata 780
ttcatgaagt ggatatgtca tgactggagt gacgaacatt gcgtgaaatt cttgaagaac 840
tgctacgagt cacttccaga ggatggaaaa gtgatattag cagagtgtat acttccagag 900
acaccagact caagcctctc aaccaaacaa gtagtccatg tcgattgcat tatgttggct 960
cacaatcccg gaggcaaaga acgaaccgag aaagagtttg aggcattagc caaagcatca 1020
ggcttcaagg gcatcaaagt tgtctgcgac gcttttggtg ttaaccttat tgagttactc 1080
aagaagctct aa 1092
<210> 2
<211> 363
<212> PRT
<213> Arabidopsis thaliana
<400> 2
Met Gly Ser Thr Ala Glu Thr Gln Leu Thr Pro Val Gln Val Thr Asp
1 5 10 15
Asp Glu Ala Ala Leu Phe Ala Met Gln Leu Ala Ser Ala Ser Val Leu
20 25 30
Pro Met Ala Leu Lys Ser Ala Leu Glu Leu Asp Leu Leu Glu Ile Met
35 40 45
Ala Lys Asn Gly Ser Pro Met Ser Pro Thr Glu Ile Ala Ser Lys Leu
50 55 60
Pro Thr Lys Asn Pro Glu Ala Pro Val Met Leu Asp Arg Ile Leu Arg
65 70 75 80
Leu Leu Thr Ser Tyr Ser Val Leu Thr Cys Ser Asn Arg Lys Leu Ser
85 90 95
Gly Asp Gly Val Glu Arg Ile Tyr Gly Leu Gly Pro Val Cys Lys Tyr
100 105 110
Leu Thr Lys Asn Glu Asp Gly Val Ser Ile Ala Ala Leu Cys Leu Met
115 120 125
Asn Gln Asp Lys Val Leu Met Glu Ser Trp Tyr His Leu Lys Asp Ala
130 135 140
Ile Leu Asp Gly Gly Ile Pro Phe Asn Lys Ala Tyr Gly Met Ser Ala
145 150 155 160
Phe Glu Tyr His Gly Thr Asp Pro Arg Phe Asn Lys Val Phe Asn Asn
165 170 175
Gly Met Ser Asn His Ser Thr Ile Thr Met Lys Lys Ile Leu Glu Thr
180 185 190
Tyr Lys Gly Phe Glu Gly Leu Thr Ser Leu Val Asp Val Gly Gly Gly
195 200 205
Ile Gly Ala Thr Leu Lys Met Ile Val Ser Lys Tyr Pro Asn Leu Lys
210 215 220
Gly Ile Asn Phe Asp Leu Pro His Val Ile Glu Asp Ala Pro Ser His
225 230 235 240
Pro Gly Ile Glu His Val Gly Gly Asp Met Phe Val Ser Val Pro Lys
245 250 255
Gly Asp Ala Ile Phe Met Lys Trp Ile Cys His Asp Trp Ser Asp Glu
260 265 270
His Cys Val Lys Phe Leu Lys Asn Cys Tyr Glu Ser Leu Pro Glu Asp
275 280 285
Gly Lys Val Ile Leu Ala Glu Cys Ile Leu Pro Glu Thr Pro Asp Ser
290 295 300
Ser Leu Ser Thr Lys Gln Val Val His Val Asp Cys Ile Met Leu Ala
305 310 315 320
His Asn Pro Gly Gly Lys Glu Arg Thr Glu Lys Glu Phe Glu Ala Leu
325 330 335
Ala Lys Ala Ser Gly Phe Lys Gly Ile Lys Val Val Cys Asp Ala Phe
340 345 350
Gly Val Asn Leu Ile Glu Leu Leu Lys Lys Leu
355 360
<210> 3
<211> 1092
<212> DNA
<213> Artificial Sequence
<400> 3
atgggttcaa cggcagagac acaattaact ccggtgcaag tcaccgacga cgaagctgcc 60
ctcttcgcca tgcaactagc cagtgcttcc gttcttccga tggctttaaa atccgcctta 120
gagcttgacc ttcttgagat tatggccaag aatggttctc ccatgtctcc taccgagatc 180
gcttctaaac ttccgaccaa aaatcctgaa gctccggtca tgctcgaccg tatcctccgt 240
cttcttacgt cttactccgt cttaacctgc tccaaccgta aactttccgg tgatggcgtt 300
gaacggattt acgggcttgg tccggtttgc aagtatttga ccaagaacga agatggtgtt 360
tccattgctg ctctttgtct tatgaaccaa gacaaggttc tcatggaaag ctggtaccat 420
ttgaaggatg caattcttga tggtgggatt ccattcaaca aggcttatgg aatgagcgcg 480
ttcgagtacc acgggactga ccctagattc aacaaggtct ttaacaatgg aatgtctaac 540
cattccacaa tcaccatgaa gaagattctt gagacctata agggttttga aggattgact 600
tctttggttg atgttggtgg tggcattggt gctacactca aaatgattgt ctccaagtac 660
cctaatctta aaggcatcaa ctttgatctc ccacatgtca tcgaagatgc tccttctcat 720
cctggtattg agcatgttgg aggagatatg tttgtaagtg tccctaaagg tgatgccata 780
ttcatgaagt ggatatgtca tgactggagt gacgaacatt gcgtgaaatt cttgaagaac 840
tgctacgagt cacttccaga ggatggaaaa gtgatattag cagagtgtat acttccagag 900
acaccagact caagcctctc aaccaaagga gtagtccatg tcgattgcat tatgttggct 960
cacaatcccg gaggcaaaga acgaaccgag aaagagtttg aggcattagc caaagcatca 1020
ggcttcaagg gcatcaaagt tgtctgcgac gcttttggtg ttaaccttat tgagttactc 1080
aagaagctct aa 1092
<210> 4
<211> 363
<212> PRT
<213> Artificial Sequence
<400> 4
Met Gly Ser Thr Ala Glu Thr Gln Leu Thr Pro Val Gln Val Thr Asp
1 5 10 15
Asp Glu Ala Ala Leu Phe Ala Met Gln Leu Ala Ser Ala Ser Val Leu
20 25 30
Pro Met Ala Leu Lys Ser Ala Leu Glu Leu Asp Leu Leu Glu Ile Met
35 40 45
Ala Lys Asn Gly Ser Pro Met Ser Pro Thr Glu Ile Ala Ser Lys Leu
50 55 60
Pro Thr Lys Asn Pro Glu Ala Pro Val Met Leu Asp Arg Ile Leu Arg
65 70 75 80
Leu Leu Thr Ser Tyr Ser Val Leu Thr Cys Ser Asn Arg Lys Leu Ser
85 90 95
Gly Asp Gly Val Glu Arg Ile Tyr Gly Leu Gly Pro Val Cys Lys Tyr
100 105 110
Leu Thr Lys Asn Glu Asp Gly Val Ser Ile Ala Ala Leu Cys Leu Met
115 120 125
Asn Gln Asp Lys Val Leu Met Glu Ser Trp Tyr His Leu Lys Asp Ala
130 135 140
Ile Leu Asp Gly Gly Ile Pro Phe Asn Lys Ala Tyr Gly Met Ser Ala
145 150 155 160
Phe Glu Tyr His Gly Thr Asp Pro Arg Phe Asn Lys Val Phe Asn Asn
165 170 175
Gly Met Ser Asn His Ser Thr Ile Thr Met Lys Lys Ile Leu Glu Thr
180 185 190
Tyr Lys Gly Phe Glu Gly Leu Thr Ser Leu Val Asp Val Gly Gly Gly
195 200 205
Ile Gly Ala Thr Leu Lys Met Ile Val Ser Lys Tyr Pro Asn Leu Lys
210 215 220
Gly Ile Asn Phe Asp Leu Pro His Val Ile Glu Asp Ala Pro Ser His
225 230 235 240
Pro Gly Ile Glu His Val Gly Gly Asp Met Phe Val Ser Val Pro Lys
245 250 255
Gly Asp Ala Ile Phe Met Lys Trp Ile Cys His Asp Trp Ser Asp Glu
260 265 270
His Cys Val Lys Phe Leu Lys Asn Cys Tyr Glu Ser Leu Pro Glu Asp
275 280 285
Gly Lys Val Ile Leu Ala Glu Cys Ile Leu Pro Glu Thr Pro Asp Ser
290 295 300
Ser Leu Ser Thr Lys Gly Val Val His Val Asp Cys Ile Met Leu Ala
305 310 315 320
His Asn Pro Gly Gly Lys Glu Arg Thr Glu Lys Glu Phe Glu Ala Leu
325 330 335
Ala Lys Ala Ser Gly Phe Lys Gly Ile Lys Val Val Cys Asp Ala Phe
340 345 350
Gly Val Asn Leu Ile Glu Leu Leu Lys Lys Leu
355 360
<210> 5
<211> 2082
<212> DNA
<213> Rhodotorula glutinis
<400> 5
atggccccgc gtccgacctc acagaatcag tatcgtacct gtccgaccac ccaggtgacc 60
caggtggata ttgtggaaaa aatgctggca gccccgaccg attcaacctt agaactggat 120
ggctatagtc tgaatctggg cgatgttgtg agcgccgcac gtaaaggtcg tccggttcgt 180
gttaaagata gcgatgaaat tcgctctaaa attgataaat cagtggaatt tctgcgctca 240
cagctgtcta tgagcgtgta tggcgtgacc accggctttg gcggtagtgc agatacccgt 300
accgaagatg ccatttcttt acagaaagca ttattagaac atcagttatg tggcgtgctg 360
ccgagtagct ttgatagctt tcgcctgggt cgcggcttag aaaatagtct gccgttagaa 420
gtggttcgcg gtgccatgac cattcgtgtt aatagtttaa cccgtggtca tagcgccgtg 480
cgcttagttg tgttagaagc cctgaccaat tttctgaatc atggtattac cccgattgtt 540
ccgttacgcg gcaccattag tgcaagcggc gatctgagtc cgctgagcta tattgcagca 600
gccatttcag gtcatccgga ttctaaagtt catgttgtgc atgaaggcaa agaaaaaatt 660
ctgtatgcac gcgaagcaat ggccctgttt aatctggaac ccgttgtttt aggcccgaaa 720
gaaggcctgg gcttagttaa tgggaccgca gtgagcgcct ctatggccac cctggcctta 780
catgatgcac acatgctgtc actgctgtct cagagcttaa ccgcaatgac cgtggaagca 840
atggtgggtc atgcaggctc ttttcatccg tttttacatg atgtgacccg tccgcatccg 900
acccagattg aagttgccgg taatattcgt aaactgctgg aaggctctcg ctttgcagtt 960
catcatgaag aagaagttaa agtgaaagat gatgaaggta ttctgcgtca ggatcgctat 1020
ccgttacgta cctctccgca gtggttaggc ccgctggtga gcgatctgat tcatgcacat 1080
gccgttttaa ccattgaagc cggccagtca accaccgata atccgctgat tgatgtggaa 1140
aataaaacct cacatcatgg cggtaatttt caggccgcag ccgttgccaa tactatggaa 1200
aaaacccgcc tgggcttagc acagattggc aaactgaatt ttacccagtt aaccgaaatg 1260
ctgaatgccg gtatgaatcg cggcttaccg tcttgtctgg ccgccgaaga tccgagctta 1320
tcatatcatt gtaaaggttt agatattgcc gcagcagcct ataccagcga actgggtcat 1380
ttagccaatc cggtgaccac ccatgttcag ccggcagaaa tggccaatca ggcagtgaat 1440
agcttagccc tgattagtgc acgtcgtacc accgaatcta atgatgtgct gtcactgtta 1500
ttagccaccc atctgtattg tgtgttacag gcaattgatc tgcgcgcaat tgaatttgaa 1560
tttaaaaaac agtttggtcc ggccattgtg tcactgattg atcagcattt tggtagcgca 1620
atgactggca gtaatttacg cgatgaactg gttgaaaaag tgaataaaac cttagccaaa 1680
cgcctggaac agaccaatag ctatgatctg gttccgcgtt ggcatgatgc cttttctttt 1740
gcagcaggca ccgtggtgga agtgctgtct tcaacctcac tgagtttagc agccgttaat 1800
gcatggaaag ttgccgcagc agaaagcgcc atttctttaa cccgtcaggt gcgcgaaacc 1860
ttttggagtg ccgcctctac ctcaagtccg gccctgagct atctgtctcc gcgtacccag 1920
attctgtatg cctttgttcg cgaagaactg ggcgttaaag cacgtcgcgg cgatgtgttt 1980
ctgggcaaac aggaagtgac cattggtagt aatgtgagta aaatttatga agcaattaaa 2040
tcaggtcgta ttaataatgt gttactgaaa atgctggcat aa 2082
<210> 6
<211> 693
<212> PRT
<213> Rhodotorula glutinis
<400> 6
Met Ala Pro Arg Pro Thr Ser Gln Asn Gln Tyr Arg Thr Cys Pro Thr
1 5 10 15
Thr Gln Val Thr Gln Val Asp Ile Val Glu Lys Met Leu Ala Ala Pro
20 25 30
Thr Asp Ser Thr Leu Glu Leu Asp Gly Tyr Ser Leu Asn Leu Gly Asp
35 40 45
Val Val Ser Ala Ala Arg Lys Gly Arg Pro Val Arg Val Lys Asp Ser
50 55 60
Asp Glu Ile Arg Ser Lys Ile Asp Lys Ser Val Glu Phe Leu Arg Ser
65 70 75 80
Gln Leu Ser Met Ser Val Tyr Gly Val Thr Thr Gly Phe Gly Gly Ser
85 90 95
Ala Asp Thr Arg Thr Glu Asp Ala Ile Ser Leu Gln Lys Ala Leu Leu
100 105 110
Glu His Gln Leu Cys Gly Val Leu Pro Ser Ser Phe Asp Ser Phe Arg
115 120 125
Leu Gly Arg Gly Leu Glu Asn Ser Leu Pro Leu Glu Val Val Arg Gly
130 135 140
Ala Met Thr Ile Arg Val Asn Ser Leu Thr Arg Gly His Ser Ala Val
145 150 155 160
Arg Leu Val Val Leu Glu Ala Leu Thr Asn Phe Leu Asn His Gly Ile
165 170 175
Thr Pro Ile Val Pro Leu Arg Gly Thr Ile Ser Ala Ser Gly Asp Leu
180 185 190
Ser Pro Leu Ser Tyr Ile Ala Ala Ala Ile Ser Gly His Pro Asp Ser
195 200 205
Lys Val His Val Val His Glu Gly Lys Glu Lys Ile Leu Tyr Ala Arg
210 215 220
Glu Ala Met Ala Leu Phe Asn Leu Glu Pro Val Val Leu Gly Pro Lys
225 230 235 240
Glu Gly Leu Gly Leu Val Asn Gly Thr Ala Val Ser Ala Ser Met Ala
245 250 255
Thr Leu Ala Leu His Asp Ala His Met Leu Ser Leu Leu Ser Gln Ser
260 265 270
Leu Thr Ala Met Thr Val Glu Ala Met Val Gly His Ala Gly Ser Phe
275 280 285
His Pro Phe Leu His Asp Val Thr Arg Pro His Pro Thr Gln Ile Glu
290 295 300
Val Ala Gly Asn Ile Arg Lys Leu Leu Glu Gly Ser Arg Phe Ala Val
305 310 315 320
His His Glu Glu Glu Val Lys Val Lys Asp Asp Glu Gly Ile Leu Arg
325 330 335
Gln Asp Arg Tyr Pro Leu Arg Thr Ser Pro Gln Trp Leu Gly Pro Leu
340 345 350
Val Ser Asp Leu Ile His Ala His Ala Val Leu Thr Ile Glu Ala Gly
355 360 365
Gln Ser Thr Thr Asp Asn Pro Leu Ile Asp Val Glu Asn Lys Thr Ser
370 375 380
His His Gly Gly Asn Phe Gln Ala Ala Ala Val Ala Asn Thr Met Glu
385 390 395 400
Lys Thr Arg Leu Gly Leu Ala Gln Ile Gly Lys Leu Asn Phe Thr Gln
405 410 415
Leu Thr Glu Met Leu Asn Ala Gly Met Asn Arg Gly Leu Pro Ser Cys
420 425 430
Leu Ala Ala Glu Asp Pro Ser Leu Ser Tyr His Cys Lys Gly Leu Asp
435 440 445
Ile Ala Ala Ala Ala Tyr Thr Ser Glu Leu Gly His Leu Ala Asn Pro
450 455 460
Val Thr Thr His Val Gln Pro Ala Glu Met Ala Asn Gln Ala Val Asn
465 470 475 480
Ser Leu Ala Leu Ile Ser Ala Arg Arg Thr Thr Glu Ser Asn Asp Val
485 490 495
Leu Ser Leu Leu Leu Ala Thr His Leu Tyr Cys Val Leu Gln Ala Ile
500 505 510
Asp Leu Arg Ala Ile Glu Phe Glu Phe Lys Lys Gln Phe Gly Pro Ala
515 520 525
Ile Val Ser Leu Ile Asp Gln His Phe Gly Ser Ala Met Thr Gly Ser
530 535 540
Asn Leu Arg Asp Glu Leu Val Glu Lys Val Asn Lys Thr Leu Ala Lys
545 550 555 560
Arg Leu Glu Gln Thr Asn Ser Tyr Asp Leu Val Pro Arg Trp His Asp
565 570 575
Ala Phe Ser Phe Ala Ala Gly Thr Val Val Glu Val Leu Ser Ser Thr
580 585 590
Ser Leu Ser Leu Ala Ala Val Asn Ala Trp Lys Val Ala Ala Ala Glu
595 600 605
Ser Ala Ile Ser Leu Thr Arg Gln Val Arg Glu Thr Phe Trp Ser Ala
610 615 620
Ala Ser Thr Ser Ser Pro Ala Leu Ser Tyr Leu Ser Pro Arg Thr Gln
625 630 635 640
Ile Leu Tyr Ala Phe Val Arg Glu Glu Leu Gly Val Lys Ala Arg Arg
645 650 655
Gly Asp Val Phe Leu Gly Lys Gln Glu Val Thr Ile Gly Ser Asn Val
660 665 670
Ser Lys Ile Tyr Glu Ala Ile Lys Ser Gly Arg Ile Asn Asn Val Leu
675 680 685
Leu Lys Met Leu Ala
690
<210> 7
<211> 1539
<212> DNA
<213> Saccharothrix espanaensis
<400> 7
atgaccatca cctctccggc gccggcgggt cgtctgaaca acgttcgtcc gatgaccggt 60
gaagaatacc tggaatctct gcgtgacggt cgtgaagttt acatctacgg tgaacgtgtt 120
gacgacgtta ccacccacct ggcgttccgt aactctgttc gttctatcgc gcgtctgtac 180
gacgttctgc acgacccggc gtctgaaggt gttctgcgtg ttccgaccga caccggtaac 240
ggtggtttca cccacccgtt cttcaaaacc gcgcgttctt ctgaagacct ggttgcggcg 300
cgtgaagcga tcgttggttg gcagcgtctg gtttacggtt ggatgggtcg taccccggac 360
tacaaagcgg cgttcttcgg taccctggac gcgaacgcgg aattctacgg tccgttcgaa 420
gcgaacgcgc gtcgttggta ccgtgacgcg caggaacgtg ttctgtactt caaccacgcg 480
atcgttcacc cgccggttga ccgtgaccgt ccggcggacc gtaccgcgga catctgcgtt 540
cacgttgaag aagaaaccga ctctggtctg atcgtttctg gtgcgaaagt tgttgcgacc 600
ggttctgcga tgaccaacgc gaacctgatc gcgcactacg gtctgccggt tcgtgacaaa 660
aaattcggtc tggttttcac cgttccgatg aactctccgg gtctgaaact gatctgccgt 720
acctcttacg aactgatggt tgcgacccag ggttctccgt tcgactaccc gctgtcttct 780
cgtctggacg aaaacgactc tatcatgatc ttcgaccgtg ttctggttcc gtgggaaaac 840
gttttcatgt acgacgcggg tgcggcgaac tctttcgcga ccggttctgg tttcctggaa 900
cgtttcacct tccacggttg cacccgtctg gcggttaaac tggacttcat cgcgggttgc 960
gttatgaaag cggttgaagt taccggtacc acccacttcc gtggtgttca ggcgcaggtt 1020
ggtgaagttc tgaactggcg tgacgttttc tggggtctgt ctgacgcgat ggcgaaatct 1080
ccgaactctt gggttggtgg ttctgttcag ccgaacctga actacggtct ggcgtaccgt 1140
accttcatgg gtgttggtta cccgcgtatc aaagaaatca tccagcagac cctgggttct 1200
ggtctgatct acctgaactc ttctgcggcg gactggaaaa acccggacgt tcgtccgtac 1260
ctggaccgtt acctgcgtgg ttctcgtggt atccaggcga tcgaccgtgt taaactgctg 1320
aaactgctgt gggacgcggt tggtaccgaa ttcgcgggtc gtcacgaact gtacgaacgt 1380
aactacggtg gtgaccacga aggtatccgt gttcagaccc tgcaggcgta ccaggcgaac 1440
ggtcaggcgg cggcgctgaa aggtttcgcg gaacagtgca tgtctgaata cgacctggac 1500
ggttggaccc gtccggacct gatcaacccg ggtacctaa 1539
<210> 8
<211> 512
<212> PRT
<213> Saccharothrix espanaensis
<400> 8
Met Thr Ile Thr Ser Pro Ala Pro Ala Gly Arg Leu Asn Asn Val Arg
1 5 10 15
Pro Met Thr Gly Glu Glu Tyr Leu Glu Ser Leu Arg Asp Gly Arg Glu
20 25 30
Val Tyr Ile Tyr Gly Glu Arg Val Asp Asp Val Thr Thr His Leu Ala
35 40 45
Phe Arg Asn Ser Val Arg Ser Ile Ala Arg Leu Tyr Asp Val Leu His
50 55 60
Asp Pro Ala Ser Glu Gly Val Leu Arg Val Pro Thr Asp Thr Gly Asn
65 70 75 80
Gly Gly Phe Thr His Pro Phe Phe Lys Thr Ala Arg Ser Ser Glu Asp
85 90 95
Leu Val Ala Ala Arg Glu Ala Ile Val Gly Trp Gln Arg Leu Val Tyr
100 105 110
Gly Trp Met Gly Arg Thr Pro Asp Tyr Lys Ala Ala Phe Phe Gly Thr
115 120 125
Leu Asp Ala Asn Ala Glu Phe Tyr Gly Pro Phe Glu Ala Asn Ala Arg
130 135 140
Arg Trp Tyr Arg Asp Ala Gln Glu Arg Val Leu Tyr Phe Asn His Ala
145 150 155 160
Ile Val His Pro Pro Val Asp Arg Asp Arg Pro Ala Asp Arg Thr Ala
165 170 175
Asp Ile Cys Val His Val Glu Glu Glu Thr Asp Ser Gly Leu Ile Val
180 185 190
Ser Gly Ala Lys Val Val Ala Thr Gly Ser Ala Met Thr Asn Ala Asn
195 200 205
Leu Ile Ala His Tyr Gly Leu Pro Val Arg Asp Lys Lys Phe Gly Leu
210 215 220
Val Phe Thr Val Pro Met Asn Ser Pro Gly Leu Lys Leu Ile Cys Arg
225 230 235 240
Thr Ser Tyr Glu Leu Met Val Ala Thr Gln Gly Ser Pro Phe Asp Tyr
245 250 255
Pro Leu Ser Ser Arg Leu Asp Glu Asn Asp Ser Ile Met Ile Phe Asp
260 265 270
Arg Val Leu Val Pro Trp Glu Asn Val Phe Met Tyr Asp Ala Gly Ala
275 280 285
Ala Asn Ser Phe Ala Thr Gly Ser Gly Phe Leu Glu Arg Phe Thr Phe
290 295 300
His Gly Cys Thr Arg Leu Ala Val Lys Leu Asp Phe Ile Ala Gly Cys
305 310 315 320
Val Met Lys Ala Val Glu Val Thr Gly Thr Thr His Phe Arg Gly Val
325 330 335
Gln Ala Gln Val Gly Glu Val Leu Asn Trp Arg Asp Val Phe Trp Gly
340 345 350
Leu Ser Asp Ala Met Ala Lys Ser Pro Asn Ser Trp Val Gly Gly Ser
355 360 365
Val Gln Pro Asn Leu Asn Tyr Gly Leu Ala Tyr Arg Thr Phe Met Gly
370 375 380
Val Gly Tyr Pro Arg Ile Lys Glu Ile Ile Gln Gln Thr Leu Gly Ser
385 390 395 400
Gly Leu Ile Tyr Leu Asn Ser Ser Ala Ala Asp Trp Lys Asn Pro Asp
405 410 415
Val Arg Pro Tyr Leu Asp Arg Tyr Leu Arg Gly Ser Arg Gly Ile Gln
420 425 430
Ala Ile Asp Arg Val Lys Leu Leu Lys Leu Leu Trp Asp Ala Val Gly
435 440 445
Thr Glu Phe Ala Gly Arg His Glu Leu Tyr Glu Arg Asn Tyr Gly Gly
450 455 460
Asp His Glu Gly Ile Arg Val Gln Thr Leu Gln Ala Tyr Gln Ala Asn
465 470 475 480
Gly Gln Ala Ala Ala Leu Lys Gly Phe Ala Glu Gln Cys Met Ser Glu
485 490 495
Tyr Asp Leu Asp Gly Trp Thr Arg Pro Asp Leu Ile Asn Pro Gly Thr
500 505 510
<210> 9
<211> 486
<212> DNA
<213> Bacillus pumilus
<400> 9
atggatcagt ttgttggtct gcacatgatc tatacctatg aaaatggttg ggaatatgaa 60
atctatatca agaatgacca caccattgat tatcgcattc atagcggtat ggttggcggc 120
cgctgggttc gtgatcagga agtgaatatt gttaaactga ccaaaggcgt gtataaagtg 180
agctggaccg aaccgaccgg taccgatgtg agtctgaatt ttatgccgga agaaaaacgc 240
atgcatggcg tgattttctt tccgaaatgg gttcatgaac gtccggatat taccgtgtgt 300
tatcagaatg attatatcga tctgatgaag gaaagccgcg aaaaatatga aacctatccg 360
aaatatgtgg ttccggaatt tgccgatatt acctatattc atcatgccgg cgttaatgat 420
gaaaccatta ttgcagaagc accgtatgaa ggtctgaccg atgaaattcg cgcaggccgt 480
aaataa 486
<210> 10
<211> 161
<212> PRT
<213> Bacillus pumilus
<400> 10
Met Asp Gln Phe Val Gly Leu His Met Ile Tyr Thr Tyr Glu Asn Gly
1 5 10 15
Trp Glu Tyr Glu Ile Tyr Ile Lys Asn Asp His Thr Ile Asp Tyr Arg
20 25 30
Ile His Ser Gly Met Val Gly Gly Arg Trp Val Arg Asp Gln Glu Val
35 40 45
Asn Ile Val Lys Leu Thr Lys Gly Val Tyr Lys Val Ser Trp Thr Glu
50 55 60
Pro Thr Gly Thr Asp Val Ser Leu Asn Phe Met Pro Glu Glu Lys Arg
65 70 75 80
Met His Gly Val Ile Phe Phe Pro Lys Trp Val His Glu Arg Pro Asp
85 90 95
Ile Thr Val Cys Tyr Gln Asn Asp Tyr Ile Asp Leu Met Lys Glu Ser
100 105 110
Arg Glu Lys Tyr Glu Thr Tyr Pro Lys Tyr Val Val Pro Glu Phe Ala
115 120 125
Asp Ile Thr Tyr Ile His His Ala Gly Val Asn Asp Glu Thr Ile Ile
130 135 140
Ala Glu Ala Pro Tyr Glu Gly Leu Thr Asp Glu Ile Arg Ala Gly Arg
145 150 155 160
Lys
<210> 11
<211> 1476
<212> DNA
<213> Caulobacter segnis
<400> 11
atgaccgctc gttttccaaa cacccgtgaa tttactggcg cactgtatcg cccatctcgc 60
tttgaaggtg aagttttcga cctggaagtg gatggtcagc tgccgactga cattgatggt 120
accttcttct ccgtagctcc agatgctgct ttcccgccga tgcgtgaaga tgacattttt 180
ttcaacggcg acggtgccgt gtctgcattc cgttttggtg gtggtcatgt ggatttccag 240
cgccgttacg tacgcactca gcgtctggaa gctcagcgtg cagctcgtcg ctccctgcat 300
ggtgtttacc gcaacccgag caccaatgac ccgtctgttc tgggcctgaa caactctacc 360
gcgaatacca acgttctgga acatgcgggt gtcctgctgg ccatgaaaga ggattctctg 420
ccatacgccc tggaccctct gactctggaa accaaaggcc tgtggaattt cggcggccaa 480
ctgaccgacg ctccgtttac tgctcatcca aagattgacc cgctgactgg tgacatgatc 540
gcctttggtt acgaggcgcg tggtgacggc tctcgtgata ttgtttatta cgagttcgat 600
gaacatggtg ctaaaacccg tgagatttgg gttcaggctc cggtgtctgc tatggttcac 660
gattttgccg tcactgagcg ttttgtggtc ttcccgatta tccctctgtc cgttgatgtt 720
gaacgcctgc gtcaaggtgg tcgtcatttc cagtggcaac cggatctgcc gcagtacttc 780
ggtgtgatgc gtcgtgacgg tgatggcggt gatctgcact ggttcaccgc tccgaacggt 840
ttccagggcc acacgctgaa cgctttcgac gacggtgaaa aagtttatgc ggacatgacc 900
agcactaacg gtaacgtatt ctacttcttt ccgccggctg atggttttgt tccgagcccg 960
gaaaccctgg ttagccagct ggtacgttgg actttcgatc tgagcgtgaa gggtggtcgt 1020
ctggacatgt ctccgctgac ccctttcccg gcggaatttc cgcgtattga cgaccgcgta 1080
gctctgcgtc cgcatcgtca cggttggatg atggcaatgg acccgactaa accgtacgcc 1140
gaagaccgtg ttggtccacg tccgttcgcg ttcttcaacc agctggctca tctgaacatc 1200
gctaccggca aaatccagac ttggttcgcc gacgaagcgt cctgttttca ggaacctgtg 1260
ttcgtcccgc gtaccggctc ttcccgtgaa ggtgacggtt atctgctgtc tctggttaac 1320
cgcctggacg aacgcaccac ggacatggtt gttctggatg cactgcgtct gggtgaaggt 1380
ccggttgcta ccgttaaact gccgctgcgt atgcgtatgg ctctgcacgg caactggtcc 1440
cgtgcggttt ctccgagctc catcaaagcg gtgtaa 1476
<210> 12
<211> 491
<212> PRT
<213> Caulobacter segnis
<400> 12
Met Thr Ala Arg Phe Pro Asn Thr Arg Glu Phe Thr Gly Ala Leu Tyr
1 5 10 15
Arg Pro Ser Arg Phe Glu Gly Glu Val Phe Asp Leu Glu Val Asp Gly
20 25 30
Gln Leu Pro Thr Asp Ile Asp Gly Thr Phe Phe Ser Val Ala Pro Asp
35 40 45
Ala Ala Phe Pro Pro Met Arg Glu Asp Asp Ile Phe Phe Asn Gly Asp
50 55 60
Gly Ala Val Ser Ala Phe Arg Phe Gly Gly Gly His Val Asp Phe Gln
65 70 75 80
Arg Arg Tyr Val Arg Thr Gln Arg Leu Glu Ala Gln Arg Ala Ala Arg
85 90 95
Arg Ser Leu His Gly Val Tyr Arg Asn Pro Ser Thr Asn Asp Pro Ser
100 105 110
Val Leu Gly Leu Asn Asn Ser Thr Ala Asn Thr Asn Val Leu Glu His
115 120 125
Ala Gly Val Leu Leu Ala Met Lys Glu Asp Ser Leu Pro Tyr Ala Leu
130 135 140
Asp Pro Leu Thr Leu Glu Thr Lys Gly Leu Trp Asn Phe Gly Gly Gln
145 150 155 160
Leu Thr Asp Ala Pro Phe Thr Ala His Pro Lys Ile Asp Pro Leu Thr
165 170 175
Gly Asp Met Ile Ala Phe Gly Tyr Glu Ala Arg Gly Asp Gly Ser Arg
180 185 190
Asp Ile Val Tyr Tyr Glu Phe Asp Glu His Gly Ala Lys Thr Arg Glu
195 200 205
Ile Trp Val Gln Ala Pro Val Ser Ala Met Val His Asp Phe Ala Val
210 215 220
Thr Glu Arg Phe Val Val Phe Pro Ile Ile Pro Leu Ser Val Asp Val
225 230 235 240
Glu Arg Leu Arg Gln Gly Gly Arg His Phe Gln Trp Gln Pro Asp Leu
245 250 255
Pro Gln Tyr Phe Gly Val Met Arg Arg Asp Gly Asp Gly Gly Asp Leu
260 265 270
His Trp Phe Thr Ala Pro Asn Gly Phe Gln Gly His Thr Leu Asn Ala
275 280 285
Phe Asp Asp Gly Glu Lys Val Tyr Ala Asp Met Thr Ser Thr Asn Gly
290 295 300
Asn Val Phe Tyr Phe Phe Pro Pro Ala Asp Gly Phe Val Pro Ser Pro
305 310 315 320
Glu Thr Leu Val Ser Gln Leu Val Arg Trp Thr Phe Asp Leu Ser Val
325 330 335
Lys Gly Gly Arg Leu Asp Met Ser Pro Leu Thr Pro Phe Pro Ala Glu
340 345 350
Phe Pro Arg Ile Asp Asp Arg Val Ala Leu Arg Pro His Arg His Gly
355 360 365
Trp Met Met Ala Met Asp Pro Thr Lys Pro Tyr Ala Glu Asp Arg Val
370 375 380
Gly Pro Arg Pro Phe Ala Phe Phe Asn Gln Leu Ala His Leu Asn Ile
385 390 395 400
Ala Thr Gly Lys Ile Gln Thr Trp Phe Ala Asp Glu Ala Ser Cys Phe
405 410 415
Gln Glu Pro Val Phe Val Pro Arg Thr Gly Ser Ser Arg Glu Gly Asp
420 425 430
Gly Tyr Leu Leu Ser Leu Val Asn Arg Leu Asp Glu Arg Thr Thr Asp
435 440 445
Met Val Val Leu Asp Ala Leu Arg Leu Gly Glu Gly Pro Val Ala Thr
450 455 460
Val Lys Leu Pro Leu Arg Met Arg Met Ala Leu His Gly Asn Trp Ser
465 470 475 480
Arg Ala Val Ser Pro Ser Ser Ile Lys Ala Val
485 490
<210> 13
<211> 1476
<212> DNA
<213> Artificial Sequence
<400> 13
atgaccgctc gttttccaaa cacccgtgaa tttactggcg cactgtatcg cccatctcgc 60
tttgaaggtg aagttttcga cctggaagtg gatggtcagc tgccgactga cattgatggt 120
accttcttct ccgtagctcc agatccggct ttcccgccga tgcgtgaaga tgacattttt 180
ttcaacggcg acggtgccgt gtctgcattc cgttttggtg gtggtcatgt ggatttccag 240
cgccgttacg tacgcactca gcgtctggaa gctcagcgtg cagctcgtcg ctccctgcat 300
ggtgtttacc gcaacccgag caccaatgac ccgtctgttc tgggcctgaa caactctacc 360
gcgaatacca acgttctgga acatgcgggt gtcctgctgg ccatgaaaga ggattctctg 420
ccatacgccc tggaccctct gactctggaa accaaaggcc tgtggaattt cggcggccaa 480
ctgaccgacg ctccgtttac tgctcatcca aagattgacc cgctgactgg tgacatgatc 540
gcctttggtt acgaggcgcg tggtgacggc tctcgtgata ttgtttatta cgagttcgat 600
gaacatggtg ctaaaacccg tgagatttgg gttcaggctc cggtgtctgc tatggttcac 660
gattttgccg tcactgagcg ttttgtggtc ttcccgatta tccctctgtc cgttgatgtt 720
gaacgcctgc gtcaaggtgg tcgtcatttc cagtggcaac cggatctgcc gcagtacttc 780
ggtgtgatgc gtcgtgacgg tgatggcggt gatctgcact ggttcaccgc tccgaacggt 840
ttccagggcc acacgctgaa cgctttcgac gacggtgaaa aagtttatgc ggacatgacc 900
agcactaacg gtaacgtatt ctacttcttt ccgccggctg atggttttgt tccgagcccg 960
gaaaccctgg ttagccagct ggtacgttgg actttcgatc tgagcgtgaa gggtggtcgt 1020
ctggacatgt ctccgctgac ccctttcccg gcggaatttc cgcgtattga cgaccgcgta 1080
gctctgcgtc cgcatcgtca cggttggatg atggcaatgg acccgactaa accgtacgcc 1140
gaagaccgtg ttggtccacg tccgttcgcg ttcttcaacc agctggctca tctgaacatc 1200
gctaccggca aaatccagac ttggttcgcc gacgaagcgt cctgttttca ggaacctgtg 1260
ttcgtcccgc gtaccggctc ttcccgtgaa ggtgacggtt atctgctgtc tctggttaac 1320
cgcctggacg aacgcaccac ggacatggtt gttctggatg cactgcgtct gggtgaaggt 1380
ccggttgcta ccgttaaact gccgctgcgt atgcgtatgg ctctgcacgg caactggtcc 1440
cgtgcggttt ctccgagctc catcaaagcg gtgtaa 1476
<210> 14
<211> 491
<212> PRT
<213> Artificial Sequence
<400> 14
Met Thr Ala Arg Phe Pro Asn Thr Arg Glu Phe Thr Gly Ala Leu Tyr
1 5 10 15
Arg Pro Ser Arg Phe Glu Gly Glu Val Phe Asp Leu Glu Val Asp Gly
20 25 30
Gln Leu Pro Thr Asp Ile Asp Gly Thr Phe Phe Ser Val Ala Pro Asp
35 40 45
Pro Ala Phe Pro Pro Met Arg Glu Asp Asp Ile Phe Phe Asn Gly Asp
50 55 60
Gly Ala Val Ser Ala Phe Arg Phe Gly Gly Gly His Val Asp Phe Gln
65 70 75 80
Arg Arg Tyr Val Arg Thr Gln Arg Leu Glu Ala Gln Arg Ala Ala Arg
85 90 95
Arg Ser Leu His Gly Val Tyr Arg Asn Pro Ser Thr Asn Asp Pro Ser
100 105 110
Val Leu Gly Leu Asn Asn Ser Thr Ala Asn Thr Asn Val Leu Glu His
115 120 125
Ala Gly Val Leu Leu Ala Met Lys Glu Asp Ser Leu Pro Tyr Ala Leu
130 135 140
Asp Pro Leu Thr Leu Glu Thr Lys Gly Leu Trp Asn Phe Gly Gly Gln
145 150 155 160
Leu Thr Asp Ala Pro Phe Thr Ala His Pro Lys Ile Asp Pro Leu Thr
165 170 175
Gly Asp Met Ile Ala Phe Gly Tyr Glu Ala Arg Gly Asp Gly Ser Arg
180 185 190
Asp Ile Val Tyr Tyr Glu Phe Asp Glu His Gly Ala Lys Thr Arg Glu
195 200 205
Ile Trp Val Gln Ala Pro Val Ser Ala Met Val His Asp Phe Ala Val
210 215 220
Thr Glu Arg Phe Val Val Phe Pro Ile Ile Pro Leu Ser Val Asp Val
225 230 235 240
Glu Arg Leu Arg Gln Gly Gly Arg His Phe Gln Trp Gln Pro Asp Leu
245 250 255
Pro Gln Tyr Phe Gly Val Met Arg Arg Asp Gly Asp Gly Gly Asp Leu
260 265 270
His Trp Phe Thr Ala Pro Asn Gly Phe Gln Gly His Thr Leu Asn Ala
275 280 285
Phe Asp Asp Gly Glu Lys Val Tyr Ala Asp Met Thr Ser Thr Asn Gly
290 295 300
Asn Val Phe Tyr Phe Phe Pro Pro Ala Asp Gly Phe Val Pro Ser Pro
305 310 315 320
Glu Thr Leu Val Ser Gln Leu Val Arg Trp Thr Phe Asp Leu Ser Val
325 330 335
Lys Gly Gly Arg Leu Asp Met Ser Pro Leu Thr Pro Phe Pro Ala Glu
340 345 350
Phe Pro Arg Ile Asp Asp Arg Val Ala Leu Arg Pro His Arg His Gly
355 360 365
Trp Met Met Ala Met Asp Pro Thr Lys Pro Tyr Ala Glu Asp Arg Val
370 375 380
Gly Pro Arg Pro Phe Ala Phe Phe Asn Gln Leu Ala His Leu Asn Ile
385 390 395 400
Ala Thr Gly Lys Ile Gln Thr Trp Phe Ala Asp Glu Ala Ser Cys Phe
405 410 415
Gln Glu Pro Val Phe Val Pro Arg Thr Gly Ser Ser Arg Glu Gly Asp
420 425 430
Gly Tyr Leu Leu Ser Leu Val Asn Arg Leu Asp Glu Arg Thr Thr Asp
435 440 445
Met Val Val Leu Asp Ala Leu Arg Leu Gly Glu Gly Pro Val Ala Thr
450 455 460
Val Lys Leu Pro Leu Arg Met Arg Met Ala Leu His Gly Asn Trp Ser
465 470 475 480
Arg Ala Val Ser Pro Ser Ser Ile Lys Ala Val
485 490
<210> 15
<211> 29
<212> DNA
<213> Artificial Sequence
<400> 15
atgggttcaa cggcagagac acaattaac 29
<210> 16
<211> 36
<212> DNA
<213> Artificial Sequence
<400> 16
ttagagcttc ttgagtaact caataaggtt aacacc 36
<210> 17
<211> 40
<212> DNA
<213> Artificial Sequence
<400> 17
ttaagaagga gatataccat gggttcaacg gcagagacac 40
<210> 18
<211> 59
<212> DNA
<213> Artificial Sequence
<400> 18
tcgagtgcgg ccgcaagctt ggatccttag agcttcttga gtaactcaat aaggttaac 59
<210> 19
<211> 27
<212> DNA
<213> Artificial Sequence
<400> 19
ggagtagtcc atgtcgattg cattatg 27
<210> 20
<211> 46
<212> DNA
<213> Artificial Sequence
<400> 20
tgcaatcgac atggactact cctttggttg agaggcttga gtctgg 46
<210> 21
<211> 82
<212> DNA
<213> Artificial Sequence
<400> 21
gatcaacccg ggtacctaaa ctagaaataa ttttgtttaa ctttaagaag gagatatacc 60
atgggttcaa cggcagagac ac 82
<210> 22
<211> 56
<212> DNA
<213> Artificial Sequence
<400> 22
agtgcggccg caagcttact agtttagagc ttcttgagta actcaataag gttaac 56
<210> 23
<211> 42
<212> DNA
<213> Artificial Sequence
<400> 23
ccttcttctc cgtagctcca gatccggctt tcccgccgat gc 42
<210> 24
<211> 49
<212> DNA
<213> Artificial Sequence
<400> 24
cggatctgga gctacggaga agaaggtacc atcaatgtca gtcggcagc 49
<210> 25
<211> 46
<212> DNA
<213> Artificial Sequence
<400> 25
tgttggtcca cgtccgttcg cgttcttcaa ccagctggct catctg 46
<210> 26
<211> 44
<212> DNA
<213> Artificial Sequence
<400> 26
cgcgaacgga cgtggaccaa cacggtcttc ggcgtacggt ttag 44

Claims (14)

1.咖啡酸O-甲基转移酶突变体,其特征在于,所述突变体包括:
(1)氨基酸序列对应于SEQ ID NO:2,第310位发生突变的蛋白;
(2)(1)蛋白的保守性变异蛋白,其对应于SEQ ID NO:2的第310位的氨基酸与(1)蛋白相应位置突变后的氨基酸相同。
2.如权利要求1所述的突变体,其特征在于,所述的保守性变异蛋白包括选自:
(a)将(1)蛋白的氨基酸序列经过一个或多个氨基酸残基的取代、缺失或添加而形成的,且具有(1)蛋白功能的蛋白;
(b)与(1)蛋白的氨基酸序列有80%以上同源性,且具有(1)蛋白功能的蛋白;
(c)(1)蛋白的活性片段,其包含咖啡酸O-甲基转移酶空间结构中与甲基供体、甲基受体相互作用的结构,且具有(1)蛋白功能的蛋白;
(d)(1)或(2)任一所述蛋白的两端添加标签序列、信号序列或分泌信号序列后形成的蛋白。
3.如权利要求1所述的突变体,其特征在于,所述第310位突变为Gly;较佳地,所述突变体的氨基酸序列如SEQ ID NO:4所示。
4.分离的多核苷酸,其编码权利要求1所述的咖啡酸O-甲基转移酶突变体。
5.一种载体或含有该载体的宿主细胞,其特征在于,所述载体含有权利要求4所述的多核苷酸。
6.如权利要求5所述的宿主细胞,其特征在于,所述的细胞中包括阿魏酸合成途径基因,从而该细胞能合成阿魏酸;较佳地,所述的阿魏酸合成途径基因包括编码以下酶的基因:酪氨酸脱氨酶,对香豆酸3-羟化酶和权利要求1所述的咖啡酸O-甲基转移酶突变体;较佳地,所述酪氨酸脱氨酶来自粘红酵母(Rhodotorula glutinis)、所述对香豆酸3-羟化酶来自西班牙酵母(Saccharothrix espanaensis)。
7.如权利要求6所述的宿主细胞,其特征在于,所述的细胞中还包括香兰素合成途径基因,从而该细胞能合成香兰素;较佳地,所述的香兰素合成途径基因包括:编码阿魏酸脱羧酶和双加氧酶的基因;较佳地所述编码阿魏酸脱羧酶的基因为fdc基因;较佳地,所述编码双加氧酶的基因为cso2基因;较佳地,所述fdc基因来自短小芽孢杆菌(Bacilluspumilus),所述cso2基因来自西格尼丝柄细菌(Caulobacter segnis);较佳地,所述cso2基因为突变体基因,其编码发生A49P和Q390A突变的酶。
8.一种生产权利要求1-3任一所述的咖啡酸O-甲基转移酶突变体的方法,其特征在于,包括步骤:
(1)培养所述的宿主细胞,获得培养物;
(2)从培养物中分离所述的咖啡酸O-甲基转移酶突变体。
9.一种提高咖啡酸O-甲基转移酶的催化活性的方法,包括:将其氨基酸序列中对应于SEQ ID NO:2第310位的氨基酸进行突变;较佳地,所述第310位突变为Gly;更佳地,所述突变体的氨基酸序列如SEQ ID NO:4所示。
10.权利要求1-3任一所述的咖啡酸O-甲基转移酶突变体的应用,用于催化底物O-甲基化反应;或,用于制备催化底物O-甲基化反应的试剂或培养基。
11.如权利要求9所述的方法或权利要求10所述的应用,其特征在于,所述的咖啡酸O-甲基转移酶突变体的底物包括:存在酚羟基的化合物;
较佳地,所述底物包括:咖啡酸,N-乙酰-5羟色胺,白藜芦醇,红霉素,愈创木酚,水杨酸甲酯,对羟基苯甲醛,苯乙醇,UV-0,2-十异戊二烯-3-甲基-5-羟基-6-甲氧基-对苯二酚;
催化时,从甲基供体获得甲基;较佳地,所述甲基供体包括:S-腺苷甲硫氨酸。
12.如权利要求11所述的方法或应用,其特征在于,所述的底物包括阿魏酸,其作为中间产物,在细胞中进一步能形成香兰素;较佳地,所述的细胞包括阿魏酸合成途径基因和/或香兰素合成途径基因;
较佳地,所述的阿魏酸合成途径基因包括编码以下酶的基因:酪氨酸脱氨酶,对香豆酸3-羟化酶和权利要求1所述的咖啡酸O-甲基转移酶突变体;较佳地,所述酪氨酸脱氨酶来自粘红酵母(Rhodotorula glutinis)、所述对香豆酸3-羟化酶来自西班牙酵母(Saccharothrix espanaensis);
较佳地,所述的香兰素合成途径基因包括:编码阿魏酸脱羧酶和双加氧酶的基因;较佳地所述编码阿魏酸脱羧酶的基因为fdc基因;较佳地,所述编码双加氧酶的基因为cso2基因;较佳地,所述fdc基因包括来自短小芽孢杆菌(Bacillus pumilus)的fdc基因,所述cso2基因包括来自西格尼丝柄细菌(Caulobacter segnis)的cso2基因;较佳地,cso2基因为突变体基因,其编码发生A49P和Q390A突变的酶。
13.一种用于催化O-甲基化反应的组合物,其特征在于,所述组合物中含有:
权利要求1-3任一所述的咖啡酸O-甲基转移酶突变体;或
权利要求5所述的宿主细胞。
14.一种用于对底物进行O-甲基化的试剂盒,其特征在于,其中含有:
权利要求1-3任一所述的咖啡酸O-甲基转移酶突变体;
权利要求5-7任一所述的宿主细胞;或
权利要求13所述的组合物。
CN202210149987.8A 2022-02-18 2022-02-18 咖啡酸o-甲基转移酶突变体及其应用 Pending CN116656641A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202210149987.8A CN116656641A (zh) 2022-02-18 2022-02-18 咖啡酸o-甲基转移酶突变体及其应用
PCT/CN2023/076691 WO2023155864A1 (zh) 2022-02-18 2023-02-17 咖啡酸o-甲基转移酶突变体及其应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210149987.8A CN116656641A (zh) 2022-02-18 2022-02-18 咖啡酸o-甲基转移酶突变体及其应用

Publications (1)

Publication Number Publication Date
CN116656641A true CN116656641A (zh) 2023-08-29

Family

ID=87577593

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210149987.8A Pending CN116656641A (zh) 2022-02-18 2022-02-18 咖啡酸o-甲基转移酶突变体及其应用

Country Status (2)

Country Link
CN (1) CN116656641A (zh)
WO (1) WO2023155864A1 (zh)

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102465135A (zh) * 2010-11-05 2012-05-23 中国中医科学院中药研究所 黄芩咖啡酰辅酶A-3-O-甲基转移酶(SbCCOMT2)基因及其编码产物和应用
EP3118304B1 (en) * 2011-08-08 2019-03-13 International Flavors & Fragrances Inc. Compositions and methods for the biosynthesis of vanillin or vanillin beta-d-glucoside
EP3150712B1 (en) * 2015-10-02 2021-12-01 Symrise AG Biotechnological methods for providing 3,4-dihydroxyphenyl compounds and methylated variants thereof
CN110760489B (zh) * 2019-11-18 2022-09-09 西南交通大学 一种川芎咖啡酸-o-甲基转移酶的突变体及其用途
CN111705031A (zh) * 2020-07-08 2020-09-25 四川盈嘉合生科技有限公司 生产阿魏酸的基因工程菌及阿魏酸的生物合成方法
CN113755422B (zh) * 2021-10-09 2023-03-24 陕西海斯夫生物工程有限公司 一种高产香兰素的重组拟无枝酸菌、其构建方法与应用

Also Published As

Publication number Publication date
WO2023155864A1 (zh) 2023-08-24

Similar Documents

Publication Publication Date Title
EP2935566B1 (en) Cyanobacterium sp. for production of compounds
CN106103729A (zh) 甜菊醇糖苷的重组制备
CN103710318A (zh) 利用微生物生产甜菊糖苷类化合物的方法
CN109423486B (zh) 新型udp-糖基转移酶及其应用
JPH10229885A (ja) 新規アルコールアルデヒド脱水素酵素
WO2021164673A1 (zh) 双功能碳苷糖基转移酶及其应用
CN109370967A (zh) 一种工程菌及其在酪醇生产中的应用
JP2021535757A (ja) バイカレインおよびスクテラレインを合成する微生物、その製造方法およびその使用
CN101748069B (zh) 一种重组蓝藻
JP2022524214A (ja) Udp-ラムノースの生合成生産
JP2017534268A (ja) 有用産物の生産のための改変微生物および方法
US20220049235A1 (en) Engineering Bacteria for Ferulic Acid Production, Preparation Method and Use Thereof
CN108473972B (zh) 补身醇合酶iii
CN110713962A (zh) 一株高产丙二酰辅酶a的基因工程菌及其构建方法和应用
CN116656641A (zh) 咖啡酸o-甲基转移酶突变体及其应用
WO2021057913A1 (zh) 糖基转移酶ugt76g1突变体的制备及其应用
KR20240032944A (ko) 람노스가 고도로 특이적인 글리코실트랜스퍼라제 및 이의 응용
CN108359652A (zh) 糖基转移酶及其应用
CN113584110A (zh) 一种以罗汉果醇为底物生物合成罗汉果糖苷v的工程菌株的构建及其应用
CN112662696B (zh) 一种生物合成对豆香酸的工程蓝细菌及其制备方法
WO2014128252A1 (en) Biosynthesis of o-methylated phenolic compounds
CN115478060B (zh) 一种糖基转移酶及其应用
WO2022148377A1 (zh) 异源合成黄酮类化合物的宿主细胞及其应用
WO2024120148A1 (zh) 新型二萜合成酶及其应用
CN110964704B (zh) 羟基氧化酶cyb5a突变体与环系列产品的制备方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination