CN113943716B - 一种分子间exo选择性Diels-Alder反应酶及其应用 - Google Patents

一种分子间exo选择性Diels-Alder反应酶及其应用 Download PDF

Info

Publication number
CN113943716B
CN113943716B CN202111228876.8A CN202111228876A CN113943716B CN 113943716 B CN113943716 B CN 113943716B CN 202111228876 A CN202111228876 A CN 202111228876A CN 113943716 B CN113943716 B CN 113943716B
Authority
CN
China
Prior art keywords
leu
mada
ser
ile
exo
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111228876.8A
Other languages
English (en)
Other versions
CN113943716A (zh
Inventor
雷晓光
高磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Peking University
Original Assignee
Peking University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Peking University filed Critical Peking University
Priority to CN202111228876.8A priority Critical patent/CN113943716B/zh
Publication of CN113943716A publication Critical patent/CN113943716A/zh
Application granted granted Critical
Publication of CN113943716B publication Critical patent/CN113943716B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P13/00Preparation of nitrogen-containing organic compounds
    • C12P13/001Amines; Imines
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P17/00Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
    • C12P17/02Oxygen as only ring hetero atoms
    • C12P17/04Oxygen as only ring hetero atoms containing a five-membered hetero ring, e.g. griseofulvin, vitamin C
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P17/00Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
    • C12P17/02Oxygen as only ring hetero atoms
    • C12P17/06Oxygen as only ring hetero atoms containing a six-membered hetero ring, e.g. fluorescein
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P17/00Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
    • C12P17/10Nitrogen as only ring hetero atom
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P17/00Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
    • C12P17/16Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms containing two or more hetero rings
    • C12P17/165Heterorings having nitrogen atoms as the only ring heteroatoms
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/24Preparation of oxygen-containing organic compounds containing a carbonyl group
    • C12P7/26Ketones

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

本发明属于生物酶催化技术领域,具体涉及一种分子间exo选择性Diels‑Alder反应酶及其应用。本发明提供的Diels‑Alder反应酶以查尔酮类似物和含有脱氢异戊烯基化合物为底物,立体专一性合成exo构型天然产物及其类似物。本发明提供的Diels‑Alder反应酶(MaDA)具有较好的底物容忍度,为解决不对称D‑A反应中的热点难点问题提供全新的思路,对于传统化学催化剂的开发具有一定启发性,同时具备工业化生产的应用价值。

Description

一种分子间exo选择性Diels-Alder反应酶及其应用
技术领域
本发明涉及生物酶催化技术领域,涉及一种分子间exo选择性Diels-Alder反应酶及其应用。
背景技术
狄尔斯-阿尔德反应(D-A)反应是有机化学中构建碳-碳键的重要方法之一,D-A反应能一步构建新的六元环和多个手性中心,迅速提高分子的复杂程度,在天然产物全合成、材料化学、化学工业生产等方面扮演着重要的角色。因此,开发新颖催化剂以提高D-A反应的速率和立体选择性一直以来都是合成化学中的研究热点。
传统上,手性Lewis酸、酸和有机催化剂已被成功地用于促进不对称D-A反应的发生,并能够较好实现对映立体选择性,然而这些催化剂并不能有效控制D-A反应中的endo/exo选择性,由于D-A反应endo过渡态中存在着次级轨道相互作用,动力学上有利endo产物通常是主要产物。因此,如何高效实现exo产物的不对称合成依旧是合成化学家们面临的合成难点。
相比于传统化学催化,酶催化是一种绿色、可持续的催化技术,越来越多地应用于在实验室合成以及工业化生产中。自然界中D-A反应酶的发现,解析,改造和设计可为解决D-A反应过程中的难点提供了新的思路,也是生物合成以及酶催化领域中的研究热点。
前期,在桑科植物的研究中,找到了首个单功能分子间D-A反应酶MaDA,该酶仅能催化endo选择性的D-A反应。因此,在桑科植物中发掘分子间exo选择性D-A反应酶的发现和应用将为解决不对称D-A反应中的热点难点问题提供全新的思路,对于传统化学催化剂的开发也具有一定启发性。
发明内容
本发明所要解决的技术问题是如何通过酶催化的方式高效实现exo构型D-A类型天然产物及其类似物的制备。为解决上述问题,本发明首先提供了一种exo选择性Diels-Alder反应酶MaDA-2及其同源蛋白MaDA-3的核酸序列及其氨基酸序列。本发明的另一目的是提供一种含有上述不含信号肽编码序列的MaDA-2和MaDA-3的表达载体,以及以昆虫细胞作为宿主高效表达MaDA-2和MaDA-3蛋白的技术。本发明还提供上述Diels-Alder反应酶的应用。本发明提供的技术方案如下。
第一方面,本发明提供一种分子间exo选择性Diels-Alder反应酶,所述分子间exo选择性Diels-Alder反应酶具有:1)如SEQ ID No.2或SEQ ID No.5所示的氨基酸序列;或
2)SEQ ID No.2或SEQ ID No.5所示的氨基酸序列经取代、缺失和/或增加一个或多个氨基酸的序列与SEQ ID No.2或SEQ ID No.5同源性为80%、85%、90%、95%、98%、99%,且具有同等活性的由1)衍生的蛋白质。
所述分子间exo选择性Diels-Alder反应酶包括,MaDA-2和MaDA-3,MaDA-2的氨基酸序列如SEQ ID No.2;MaDA-3的氨基酸序列如SEQ ID No.5所示。
第二方面,本发明提供编码分子间exo选择性Diels-Alder反应酶的基因,编码MaDA-2基因的核苷酸序列如SEQ ID No.1;编码MaDA-3基因的核苷酸序列如SEQ ID No.4所示。
在本发明提供的编码分子间exo选择性Diels-Alder反应酶的基因的核苷酸序列中,前1-87个碱基编码信号肽序列。
SEQ ID No.1作为Diels-Alder反应酶MaDA-2基因序列,是一个完整的开放阅读框(ORF),该开放阅读框是从ATG起始,以TAA结束,共有1632个核苷酸。其中,前87个核苷酸,ATGAAGTACTTTTCCTTCTCTTTGTCGTTTCCCAAAATCACCATTTTTCTTTTTTCATTTGTATTGCTAGCTTCAGCAAATCACGCT为信号肽序列。
成熟的Diels-Alder反应酶MaDA-2的氨基酸序列如SEQ ID No.2所示,下划线部分为SEQ ID No.2的氨基酸序列:
MKYFSFSLSFPKITIFLFSFVLLASANHAHESFLECLISTSTPESIIYTKHNPSYFTILNSTSLNSRF FSSPARYPLLIVTPLHASHVQATVHCAKKHGIQIRIRSGGHDYEGLSYMSNVTFAILDLRNLNSINVDVKRKSAWV QSGATLGELHYWIANKSQNLAFPGVVGHTVCMGGMLGAGGYGYSSRKYGLPADNILDAQLIDVRGRILNRKSMGED LFWAIRGGGAGSFGIVLAWKVRLVDVPSKVTVFTAIRDWDNNATKKFIHRYQRRIAKVDKNLTIIIRFVTESTTDE KSNKKIVISTFITALYHGSQDRLLSLMEKDFPELGLLAKECTEETWVQSILYFNFFTNGEPLEVLLNRTMNFELTS FKIKSDYLKKPIPDQVLENLLVMLYEEDIGETFVEFFPYGGKLDEISESEIPCPHRAGNLYNLRYLVSWKEGQNAT AVNKHLSWIRRAYNYMTPYVSKNPRGAFLNFRDLDIGTNPNENEINGAYNYIKQASNWGTKYFKNNFYKLIYVKTI VDPTNFFTYEQSIPSLLPH
Diels-Alder反应酶MaDA-2含有543个氨基酸,其中前29个氨基酸(MKYFSFSLSFPKITIFLFSFVLLASANHA)为基因编码的信号肽,其在成熟酶蛋白分泌到细胞外的过程中会被切除。因此成熟的MaDA-2是从His30开始(用下划线表示),共计514个氨基酸。
与MaDA-2相同,SEQ ID No.4作为Diels-Alder反应酶MaDA-3基因序列为一个完整的开放阅读框(ORF),该开放阅读框是从ATG起始,以TAA结束,共有1653个核苷酸。
其中,前87个核苷酸为信号肽序列。
成熟的Diels-Alder反应酶MaDA-3的氨基酸序列如SEQ ID No.5所示,下划线部分为SEQ ID No.5:
MKYFSFSLSFPKITIFLFSFVLVASANHAHESFLECLTTRISKSNSTSTPESIIYTKDNPSYSTILNS TSLNPRFFPSSARYPLLIVTPLHASHVQATVHCAKKHGIQIRIRSGGHDYEGLSYMSNVTFAIVDLRNLSSIDVDV KRKSAWVQSGATLGELHYWIAKKSQNLAFPGVVGHTVGIGGMLGAGGYGYSSRKYGLSADNILDAQLIDVRGRILN RKSMGEDLFWAIRGGGAGSFGIVLAWKVRLVDVPSKVTVFTAIRDWDNNATKKFIHRYQRRIAKVDKDLTIIVRFL TASITDEKGSKKIQISTFITATYHGSQDRLLSLMEKEFPELGLLAKECAEGAWVQSILYFNLLTNSKSLDVLLNRT LNFEWRAFKIKSDYLKKPIPDQVLENLLVKLYEEDIGETFVEFFPYGGKLDEISESEIPCPHRAGNLYNLRYMVLW KEGQNATAVNKHLSWIRRAYNYMTPYVSKNPRGAFLNFRDLDIGTNPNENEINGAYNYIKQASNWGTKYFKNNFYK LIYVKTIVDPTNFFTYEQSIPSLLPH。
Diels-Alder反应酶MaDA-3含有550个氨基酸,其中前29个氨基酸(MKYFSFSLSFPKITIFLFSFVLVASANHA)为基因编码的信号肽,其在成熟酶蛋白分泌到细胞外的过程中会被切除。因此成熟的MaDA-3是从His30开始(用下划线表示),共计521个氨基酸。
第三方面,本发明请求保护,编码上述的分子间exo选择性Diels-Alder反应酶的DNA片段,编码分子间exo选择性Diels-Alder反应酶MaDA-2的DNA片段如SEQ ID No.7所示;编码分子间exo选择性Diels-Alder反应酶MaDA-3的DNA片段如SEQ ID No.8所示。
第四方面,本发明提供扩增上述DNA片段的引物,所述引物如SEQ ID No.13-14所示或SEQ ID No.15-16所示。
第五方面,本发明请求保护含有上述基因或含有上述DNA片段或含有上述引物的生物材料,所述生物材料为表达盒、质粒、载体、微生物、昆虫细胞、植物细胞。
作为本发明的具体实施例,本发明构建包含MaDA-2基因序列的表达载体pI-sec-sumostar-tev2,并实现在昆虫细胞(Hi5)的大量表达。利用该载体在昆虫中表达出来的SUMO-MaDA-2蛋白在N端包含了信号肽、6×His标签以及SUMO标签,SUMO-MaDA-2蛋白氨基酸序列如SEQ ID No.3所示。
其中,前20个氨基酸(MVSAIVLYVLLAAAAHSAFA)为信号肽,HHHHHH为6×His标签。
QDSEVNQEAKPEVKPEVKPETHINLKVSDGSSEIFFKIKKTTPLRRLMEAFAKRQGKEMDSLTFLYDGIEIQADQTPEDLDMEDNDIIEAHREQIGG为SUMO标签。
ENLYFQG为TEV酶切位点。利用昆虫表达体系表达纯化出来的成熟蛋白不含信号肽,其蛋白理论分子量(MWt)为72753.62Da,酶蛋白的理论等电点(pI)为6.66,利用TEV酶水解后,能得到MaDA-2不带信号肽的成熟蛋白。
本发明还构建了包含MaDA-3基因序列的表达载体pI-sec-sumostar-tev2,并实现在昆虫细胞(Hi5)的大量表达。利用该载体在昆虫中表达出来的SUMO-MaDA-3蛋白在N端包含了信号肽、6×His标签以及SUMO标签,其氨基酸序列如SEQ ID No.6所示。
其中,前20个氨基酸(MVSAIVLYVLLAAAAHSAFA)为信号肽,HHHHHH为6×His标签,QDSEVNQEAKPEVKPEVKPETHINLKVSDGSSEIFFKIKKTTPLRRLMEAFAKRQGKEMDSLTFLYDGIEIQADQTPEDLDMEDNDIIEAHREQIGG为SUMO标签,ENLYFQG为TEV酶切位点。利用昆虫表达体系表达纯化出来的成熟蛋白不含信号肽,其蛋白理论分子量(MWt)为73225.17Da,酶蛋白的理论等电点(pI)为8.11,利用TEV酶水解后,能得到MaDA-3不带信号肽的成熟蛋白。
根据本领域技术人员的理解,本发明还请求保护上述分子间exo选择性Diels-Alder反应酶或其编码基因或上述的生物材料在催化Diels-Alder反应制备含有六元环骨架的桑树天然产物,或合成立体专一性exo构型的产物中的应用。
在本发明提供的应用中,以亲二烯体和二烯体为底物,以分子间exo选择性Diels-Alder反应酶MaDA-3为催化酶进行反应,合成立体专一性exo构型产物。
在本发明提供的应用中,亲二烯体为查尔酮或其衍生物,二烯体为含有脱氢异戊烯基的黄酮、二苯乙烯、查尔酮或苯并呋喃。
在本发明提供的应用中,所述反应的温度为50℃,pH为7.0。
本发明的有益效果在于:
(1)本发明首次提供一种来源于桑树的Diels-Alder反应酶,所述Diels-Alder反应酶可以特异性催化合成exo构型产物及其类似物;
(2)本发明提供的Diels-Alder反应酶,具有较好的底物容忍度,为解决不对称D-A反应中的热点难点问题提供全新的思路。
(3)本发明发现来源于桑树的Diels-Alder反应酶能够以查尔酮或其衍生物和含有脱氢异戊烯基化合物为底物,立体专一性合成exo构型天然产物,能够体外制备桑树中D-A类型天然产物及其衍生物。
(4)本发明提供的Diels-Alder反应酶底物适应性良好,可识别不同取代的查尔酮及其衍生物作为亲二烯体生成天然产物。为开发和利用桑科中这类天然产物的药用价值奠定了基础,同时也为其他含有六元环的重要化工前体、天然产物或非天然产物的合成提供了新的可能性。
附图说明
图1为本发明实施例1中川桑基因组中BBE-like家族蛋白的进化树分析。
图2为本发明实施例2中查尔酮体1与二烯体2的酶促反应液相分析结果。
图3为本发明实施例2中查尔酮体5与二烯体2的酶促反应液相分析结果。
图4为本发明实施例2中查尔酮体1与二烯体8的酶促反应液相分析结果。
图5为本发明实施例3中MaDA-3在不同反应温度下的相对活性。
图6为本发明实施例3中MaDA-3在不同pH下的相对活性。
图7为本发明实施例4中酶促产物mongolicin F的手性HPLC分析结果。
图8为本发明实施例4中酶促产物guangsangon J的手性HPLC分析结果图。
图9为本发明实施例4中酶促产物mulberrofuran J的手性HPLC分析结果图。
图10为本发明实施例4中酶促产物exo-kuwanol E的手性HPLC分析结果图。
图11为本发明实施例4中酶促产物exo-artonin I的手性HPLC分析结果图。
图12为本发明实施例4中酶促产物albafuran C的手性HPLC分析结果图。
图13为本发明实施例5中MaDA-3对于不同二烯体的转化率测定结果图。
图14为本发明实施例5中MaDA-3对于不同亲二烯体的转化率测定结果图。
具体实施方式
以下实施例用于说明本发明,但不用来限制本发明的范围。
1、菌株
大肠杆菌E.coli DH5α以及DH10Bac的感受态细胞均买自庄盟生物有限公司。表达用昆虫细胞Sf21以及Hi5购买自invitrogen公司。
2、载体
昆虫表达载体pI-secSUMOstar购买自LifeSensors公司,
3、培养基
LB固体培养基:蛋白胨10g/L,酵母粉5g/L,NaCl 10g/L,1.5%的琼脂。
LB液体培养基:蛋白胨10g/L,酵母粉5g/L,NaCl 10g/L。
4、主要试剂
植物基因组提取试剂盒、质粒小提试剂盒、胶回收试剂盒均买自天根生化有限公司;同源重组酶买自诺唯赞公司。PCR高保真酶买自全是金公司。PCR引物合成及质粒测序由金唯智生物技术有限公司完成。MS培养基购自北京索莱宝科技有限公司。
5、反应底物的制备
亲二烯体1、5、37以及43以及二烯体2、8参考已知文献(Nat Chem,2020,12,620);化合物11参考已知文献(Org.Lett.2016,18,360);二烯体12参考文献(Biotechnol.J2020,15,2000119)。
6、D-A反应催化酶
MaDA蛋白来源于已知文献Nat Chem,2020,12,620);
MaDA-1来源于中国专利(CN110951700A)。
7、本申请所用植物材料为广泛种植的白桑。
实施例1
1、川桑基因组中D-A反应酶MaDA同源蛋白的进化树分析
本实施例对川桑(morus notabilis)基因组中FAD依赖蛋白进行分析,共找到41个与endo反应酶MaDA同家族的蛋白(berberine bridge enzyme(BBE)-like家族)。通过将这个41个蛋白与家族中已知功能的D-A反应酶MaDA以及氧化酶MaMO,THCAS,BBE进行进化树分析后,找到了8个跟已知D-A反应酶进化关系最近的蛋白,如图1所示。
2、白桑的基因组DNA的提取
取大约100克白桑新鲜愈伤组织放入研钵中,加入液氮后研末至粉末状,然后依照天根生化公司的植物基因组提取试剂盒说明书提取桑树叶片中基因组DNA。
3、白桑中MaDA-2、MaDA-3基因片段的扩增
(1)根据川桑基因组中的数据,设计引物,以白桑基因组DNA为模板,快速扩增出其基因序列。然而通过5’-RACE扩增分析分析发现,以白桑基因组DNA为模板扩增出的序列,并不能进行蛋白编码,特别是在5’端的序列与NCBI中预测的基因序列存在差异。因此,重新对川桑基因组中的8个跟已知D-A反应酶进化关系最近的蛋白的编码序列进行校准,
根据川桑基因组中XP_024017780.1校准后的基因序列,设计引物MaDA-2-Fw(SEQID No.9:AACCTGTATTTTCAGGGATCCATGAAGTACTTTTCCTTCTCTTTG)和MaDA-2-Rv(SEQ IDNo.10:AACCTGTATTTTCAGGGATCCATGAAGTACTTTTCCTTCTCTTTG),并根据以下PCR条件:
PCR反应体系(50μL),32个循环:
PCR循环(50μl体系)
4℃
(2)MaDA-3基因的扩增,根据川桑基因组中XP 024017779.1校准后的基因序列,设计引物MaDA-3-Fw SEQ ID No.11:AACCTGTATTTTCAGGGATCCCATGAAAGCTTTCTTGAGTGCTTG和MaDA-3-Rv(SEQ ID No.12:CTAGTACTTCTCGACAAGCTTTTAATGTAGAAGAAGGGA),PCR扩增反应的条件同MaDA-2基因的PCR扩增反应条件。
4、载体构建与测序
pI-sec-sumostar-tev2空载用BamHI和HindIII双酶切过夜,1%琼脂糖凝胶电泳后,用胶回收试剂盒回收单一条带,用nanodrop测定回收的DNA浓度。利用Vazyme同源重组酶构建pI-sec-sumostar-tev2-MaDA-2质粒,10μL连接体系包括:
1μL Exnase II酶
2μL 5×CE buffer
3μL 线性化载体
4μL MaDA-2 PCR产物
上述连接体系中,MaDA-2与线性化pI-sec-sumostar-tev2载体的摩尔数之比大致为2:1。上述反应体系在37℃反应30min后,立即置于冰上,随后将连接产物加入100μL DH5α感受态中,冰浴30min后42℃热激1min,然后立即冰浴3min,加入1mL LB培养基37℃,220rpm培养。大约1小时后,离心弃900μL培养基,将菌体重悬在剩余的100μL培养基中,然后用移液枪全部取出并涂布于含有氨苄青霉素(100μg/mL)的固体LB平板。37℃过夜培养后,挑取固体培养基上的单克隆于LB液体培养基中培养12-16小时后提取质粒并送测序。根据以上相同的操作,构建pI-sec-sumostar-tev2-MaDA-3质粒,并测序。
5、MaDA-2和MaDA-3蛋白的外源表达
(1)不带信号肽的MaDA-2基因的扩增
上游引物序列:(SEQ ID No.13)
5’-GAAAACCTGTATTTTCAGGGATCCCATGAAAGCTTTCTTGAGTGC-3’
下游引物序列:(SEQ ID No.14)
5’-CTCTAGTACTTCTCGACAAGCTTTTAATGTGGAAGAAGGGACG-3’
(2)不带信号肽的MaDA-3基因的扩增
上游引物序列:(SEQ ID No.15)
5’-GAAAACCTGTATTTTCAGGGATCCCATGAAAGCTTTCTTGAGTGC-3’
下游引物序列:(SEQ ID No.16)
5’-CTAGTACTTCTCGACAAGCTTTTAATGTGGAAGAAGGGACG-3’
根据全长基因载体的构建方法,构建出不带信号肽片段的表达载体pI-sec-sumostar-tev2-MaDA-2和pI-sec-sumostar-tev2-MaDA-3,采用Invivogen公司所开发的“Bac-to-bac”方法,根据参考文献(Nat Chem 2020 12,620)的实验方法,表达和纯化含有SUMO标签的MaDA-2以及MaDA-3两个蛋白。
实施例2 MaDA-2和MaDA-3的酶活测试
1、查尔酮morachalcone A(1)与二烯体2之间的酶促反应
向97μL反应缓冲液(20mM Tris-HCl,pH=8.0)中加入1μL亲二烯体1(终浓度100μM)以及1μL二烯体2(终浓度200μM),然后加入1μL MaDA蛋白(终浓度137nM)或MaDA-1(终浓度139nM已知专利)或MaDA-2(终浓度207nM)或MaDA-3(终浓度207nM),50℃下反应10分钟后,加入100μL甲醇淬灭反应,13,000rpm离心30min后,利用UPLC-MS分析。
UPLC分析的条件为:
色谱柱:ACQUITY UPLC BEH C18 column(50mm×2.1mm i.d.,1.7μm,WatersCorporation);流动相:乙腈-水梯度洗脱,0~16min,30→70%乙腈,16~18min,70→95%乙腈;18~20min,95→30%乙腈;流速:0.3mL·min-1,柱温:40℃;
UPLC-MS分析结果如图2所示,endo选择性D-A反应酶MaDA以及MaDA-1专一性生成endo类型天然产物chalcomoracin,而新发现的MaDA-2和MaDA-3除了能产生天然产物chalcomoracin外,主要生成exo类型天然产物monglicin F。相较而言,MaDA-3具有更高的exo选择性。此类结果证明,虽然MaDA-2和MaDA-3是一类催化exo选择性D-A反应发生的全新D-A反应酶。
2、查尔酮morachalcone A(5)与二烯体2之间的酶促反应
向97μL反应缓冲液(20mM Tris·HCl,pH=8.0)中加入1μL亲二烯体5(终浓度100μM)以及1μL二烯体2(终浓度200μM),然后加入1μL MaDA蛋白(终浓度411nM)或MaDA-1(终浓度416nM已知专利)或MaDA-2(终浓度414nM)或MaDA-3(终浓度411nM),50℃下反应10分钟后,加入100μL甲醇淬灭反应,13,000rpm离心30min后,利用UPLC-MS分析。
UPLC分析的条件为:
色谱柱:ACQUITY UPLC BEH C18 column(50mm×2.1mm i.d.,1.7μm,WatersCorporation);流动相:乙腈-水梯度洗脱,0~16min,30→70%乙腈,16~18min,70→95%乙腈;18~20min,95→30%乙腈;流速:0.3mL·min-1,柱温:40℃;
UPLC-MS分析结果如图3所示,endo选择性D-A反应酶MaDA-1专一性生成endo类型天然产物mulberrofuran C,而新发现的MaDA-2生成exo类型天然产物mulberrofuran J。
3、查尔酮morachalcone A(1)与二烯体8之间的酶促反应
向97μL反应缓冲液(20mM Tris·HCl,pH=8.0)中加入1μL亲二烯体1(终浓度100μM)以及1μL二烯体8(终浓度200μM),然后加入1μL MaDA蛋白(终浓度137nM)或MaDA-1(终浓度139nM已知专利)或MaDA-2(终浓度207nM)或MaDA-3(终浓度207nM),50℃下反应10分钟后,加入100μL甲醇淬灭反应,13,000rpm离心30min后,利用UPLC-MS分析。
UPLC分析的条件为:
色谱柱:ACQUITY UPLC BEH C18 column(50mm×2.1mm i.d.,1.7μm,WatersCorporation);流动相:甲醇-水梯度洗脱,0~1min,50甲醇;1~8min,50→70%甲醇,8~16min,70→95%甲醇;16~18min,95→100%甲醇;18~20min,100→50%甲醇;流速:0.3mL·min-1,柱温:40℃;
UPLC-MS分析结果如图4所示,endo选择性D-A反应酶MaDA以及MaDA-1专一性生成endo类型天然产物guangsangon E,而新发现的MaDA-2和MaDA-3专一性生成exo类型天然产物guangsangon J。
实施例3 MaDA-3最适温度和pH测试
1、最适温度
以二烯体8和亲二烯体1为底物考察不同反应温度(30、35、40、45、50、55、60、70、75℃)对MaDA-3催化[4+2]环化反应的影响。反应体系(20mM Tris·HCl,pH=7.5)中含有100μM的二烯体8和亲二烯体1,140nM的MaDA-3,反应体积为100μL,反应时间为5min。反应结束后加入100μL的冷甲醇终止反应,涡旋混匀,高速离心机15000g离心30min,取上清液,利用UPLC进行检测。每组反应三个平行。底物的转化率通过产物的峰面积代入标准曲线计算底物的减少量来计算,最终得到在不同温度下MaDA-3的相对活性,如图5所示。从图5可以看出,MaDA-3最适反应温度在50摄氏度。
2、最适pH
以二烯体8和亲二烯体1为底物考察不同pH缓冲溶液(pH 4.0-6.0,柠檬酸-柠檬酸钠缓冲液;6.0-7.0,磷酸氢二钠-磷酸二氢钠缓冲液;7.0-9.0,Tris-HCl缓冲液;9.0-11.0,碳酸钠-碳酸氢钠缓冲液)对MaDA催化[4+2]环化反应的影响。反应体系(20mM Tris-HCl)中含有100μM的二烯体8和亲二烯体1,140nM的MaDA-3,反应体积为100μL,50℃条件下在不同pH缓冲液中反5min。反应结束后加入100μL的冷甲醇终止反应,涡旋混匀,高速离心机15000g离心30min,取上清液,利用UPLC进行检测。每组反应三个平行。底物的转化率通过产物的峰面积代入标准曲线计算底物的减少量来计算,最终得到在不同pH下MaDA-3的相对活性,如图6所示。如图6所示,MaDA-3的最适pH在7.0。
实施例4利用MaDA-3和MaDA-2来合成D-A类型天然产物
1、乙酰基前体S2、亲二烯体1和SUMO-MaDA-3得到mongolicin F。
对应二烯体的乙酰基前体S2(11.3mg,0.0260mmol)溶解在1毫升水和甲醇的混合溶液中(水:甲醇=1:4),然后加入碳酸钾(13.9mg,0.101mmol),室温搅拌35分钟后,加入到48毫升的反应缓冲液中(20mM Tris-HCl,pH=8.0),再向该反应体系中加入3.3毫克SUMO-MaDA-3和7.4毫克亲二烯体1(0.022mmol,溶解于0.37毫升的DMSO中),混匀后37℃静置培养12小时,随后加入50毫升饱和氯化铵溶液淬灭反应,再用乙酸乙酯(50mL)萃取三次后旋干。
旋干后利用C18反向高效液相色谱HPLC(Waters,XBridge@pre C18 OBDTM,150mm×19mm i.d.,5μm)进行分离纯化得到最终的产物mongolicin F(4.5mg,32%)。液相制备体系为水(A)和乙腈(B),梯度为:30%-40%B,0-1min,40%-64%B,1-12min,64%-66%B,12-15min,66%B,15-17min,66%-95%B,17-18min,95%-30%B,18-19min,and 30%B,19-20min。
[α]D23=-213(c=0.08,MeOH);
HRMS(ESI)calculated for C39H37O9[M+H]+649.2432,found 649.2436。该酶促产物的ee值大于99%,如图7所示。手性HPLC分析在岛津LC-2030C(DaicelIC,4.6mm×250mm,i.d.5μm)上进行,洗脱条件如下:n-hexane/i-PrOH=85/15,流速为1.0mL/min,λ=319nm。
2、乙酰基前体S8、亲二烯体1和SUMO-MaDA-3得到guangsangon J。
对应二烯体的乙酰基前体S8(10.9mg,0.0251mmol)溶解在1毫升水和甲醇的混合溶液中(水:甲醇=1:4),然后加入碳酸钾(17.3mg,0.125mmol),室温搅拌30分钟后,加入到48毫升的反应缓冲液中(50mM Tris-HCl,pH=7.0),再向该反应体系中加入1.5毫克SUMO-MaDA-3和10.2毫克亲二烯体1(0.03mmol,溶解于0.30毫升的DMSO中),混匀后37℃静置培养3天,随后加入50毫升饱和氯化铵溶液淬灭反应,再用乙酸乙酯(50mL)萃取三次后旋干。旋干后利用C18反向高效液相色谱HPLC(Waters,XBridge@pre C18 OBDTM,150mm×19mmi.d.,5μm)进行分离纯化得到最终的产物guangsangon J(5.2mg,32%)。液相制备体系为水(A)和乙腈(B),梯度为:30%-40%B,0-1min,40%-64%B,1-12min,64%-66%B,12-15min,66%B,15-17min,66%-95%B,17-18min,95%-30%B,18-19min,and 30%B,19-20min。
[α]D26=-298.9(c=0.20,MeOH);
HRMS(ESI)calculated for C39H37O9[M+H]+649.2432,found 649.2444。该酶促产物的ee值大于99%,如图8所示。
3、乙酰基前体S2、亲二烯体5和SUMO-MaDA-3得到mulberrofuran J。
对应二烯体的乙酰基前体S2(22.6mg,0.052mmol)溶解在2毫升水和甲醇的混合溶液中(水:甲醇=1:4),然后加入碳酸钾(28.8mg,0.21mmol),室温搅拌35分钟后,加入到48毫升的反应缓冲液中(50mM Tris-HCl,pH=8.0),再向该反应体系中加入3.8毫克SUMO-MaDA-3和11.4毫克亲二烯体5(0.0419mmol,溶解于0.419毫升的DMSO中),混匀后37℃静置培养36小时,随后加入50毫升饱和氯化铵溶液淬灭反应,再用乙酸乙酯(50mL)萃取三次后旋干。旋干后利用C18反向高效液相色谱HPLC(Waters,XBridge@pre C18 OBDTM,150mm×19mm i.d.,5μm)进行分离纯化得到最终的产物mulberrofuran J(2.5mg,10%)。液相制备体系为水(A)和乙腈(B),梯度为:30%-40%B,0-1min,40%-64%B,1-12min,64%-66%B,12-15min,66%B,15-17min,66%-95%B,17-18min,95%-30%B,18-19min,and 30%B,19-20min。
[α]D23=-339.4(c=0.125,MeOH)
HRMS(ESI)calculated for C34H29O9[M+H]+581.1806,found 581.1816。该酶促产物的ee值大于99%,如图9所示。
4、乙酰基前体S11、亲二烯体1和SUMO-MaDA-3得到exo-kuwanol E。
对应二烯体的乙酰基前体S11(11.1mg,0.0232mmol)溶解在2毫升水和甲醇的混合溶液中(水:甲醇=1:9),然后加入碳酸钾(19.2mg,0.139mmol),室温搅拌20分钟后,加入到48毫升的反应缓冲液中(20mM Tris-HCl,pH=7.0),再向该反应体系中加入2.0毫克SUMO-MaDA-3和5.1毫克亲二烯体1(0.015mmol,溶解于0.15毫升的DMSO中),混匀后37℃静置培养8小时,随后加入50毫升饱和氯化铵溶液淬灭反应,再用乙酸乙酯(50mL)萃取三次后旋干。旋干后利用C18反向高效液相色谱HPLC(Waters,XBridge@pre C18 OBDTM,150mm×19mmi.d.,5μm)进行分离纯化得到最终的产物exo-kuwanol E(2.6mg,27%)。液相制备体系为水(A)和乙腈(B),梯度为:30%-40%B,0-1min,40%-64%B,1-12min,64%-66%B,12-15min,66%B,15-17min,66%-95%B,17-18min,95%-30%B,18-19min,and 30%B,19-20min。
虽然exo-kuwanol E目前还没有分离报道,但考虑到MaDA-3和MaDA-2存在于桑科植物中,且桑科植物中存在亲二烯体1和二烯体11,因此exo-kuwanol E可能是桑科植物中还未被分离鉴定的一个新天然产物。
[α]D24=-254.7(c=0.25,MeOH)
HRMS(ESI)calculated for C39H39O9[M+H]+651.2589,found 651.2594,该酶促产物的ee值大于99%,如图10所示。
5、乙酰基前体S13、亲二烯体1和SUMO-MaDA-3得到exo-artonin I。
对应二烯体的乙酰基前体S13(6.2mg,0.0130mmol)溶解在2毫升水和甲醇的混合溶液中(水:甲醇=1:3),然后加入碳酸钾(7.2mg,0.0519mmol),室温搅拌35分钟后,加入到48毫升的反应缓冲液中(20mM Tris·HCl,pH=7.0),再向该反应体系中加入2.0毫克SUMO-MaDA-3和103微升100mM亲二烯体1(0.0103mmol)的DMSO溶液,混匀后37℃静置培养11小时,随后加入50毫升饱和氯化铵溶液淬灭反应,再用乙酸乙酯(50mL)萃取三次后旋干。旋干后利用C18反向高效液相色谱HPLC(Waters,XBridge@pre C18 OBDTM,150mm×19mm i.d.,5μm)进行分离纯化得到最终的产物exo-artonin I(14,6.3mg,89%)。液相制备体系为水(A)和乙腈(B),梯度为:30%-40%B,0-1min,40%-64%B,1-12min,64%-66%B,12-15min,66%B,15-17min,66%-95%B,17-18min,95%-30%B,18-19min,and 30%B,19-20min。
虽然exo-artonin I目前还没有分离报道,但考虑到MaDA-3和MaDA-2存在于桑科植物中,且桑科植物中存在亲二烯体1和二烯体13,因此exo-artonin I(14)可能是桑科植物中还未被分离鉴定的一个新天然产物。
[α]D24=-163.6(c=0.20,MeOH)
HRMS(ESI)calculated for C40H37O11[M+H]+693.2330,found 693.2333;该酶促产物的ee值大于99%,如图11所示。
6、乙酰基前体S8、亲二烯体5和SUMO-MaDA-2得到albafuran C。
对应二烯体的乙酰基前体S8(10.8mg,0.0249mmol)溶解在1毫升水和甲醇的混合溶液中(水:甲醇=1:4),然后加入碳酸钾(15.5mg,0.112mmol),室温搅拌35分钟后,加入到48毫升的反应缓冲液中(20mM Tris·HCl,pH=8.0),再向该反应体系中加入0.45毫克SUMO-MaDA-2和200微升亲二烯体5的DMSO溶液(0.02mmol),混匀后50℃静置培养7小时后补加100微升亲二烯体5的DMSO溶液(0.01mmol),继续反应7小时后加入50毫升饱和氯化铵溶液淬灭反应,再用乙酸乙酯(50mL)萃取三次后旋干。旋干后利用C18反向高效液相色谱HPLC(Waters,XBridge@pre C18 OBDTM,150mm×19mm i.d.,5μm)进行分离纯化得到最终的产物albafuran C(5.8mg,39%)。液相制备体系为水(A)和乙腈(B),梯度为:30%-40%B,0-1min,40%-64%B,1-12min,64%-66%B,12-15min,66%B,15-17min,66%-95%B,17-18min,95%-30%B,18-19min,and 30%B,19-20min。
[α]D26=-312.6(c=0.17,MeOH);
HRMS(ESI)calculated for C34H29O9[M+H]+581.1806,found 581.1806;该酶促产物的ee值大于99%,如图12所示。
实施例5 MaDA-3底物谱拓展
本实施例通过化学合成的方式,得到多种带有脱氢异戊烯基的二烯体(16-36),随后测定了MaDA-3对不同二烯体与亲二烯体1之间的转化率。
向96微升的反应缓冲液中(20mM Tris-HCl,pH=7.0)中加入1μL二烯体(终浓度100μM)和1μL亲二烯体1(终浓度100μM),再向该反应体系中加入1微升SUMO-MaDA-3(9.6μg)和1μL内参化合物4-甲氧基苯乙酮(终浓度100μM),混匀后在50℃静置反应5分钟,加入100μL甲醇淬灭反应,13,000rpm离心30min后,进行UPLC-MS分析。
底物的转化率通过比较加酶和不加酶两种反应体系中二烯体与内参的峰面积来计算得出,结果如图13所示。由上述结果可以看出,MaDA-3除了能够识别桑树中天然存在的二烯体外,还对一系列不同二烯体均具有活性,其中含有底物17骨架结构的二烯体活性更高。
另外,本实施例通过化学合成还获得了一系列不同结构的亲二烯体(37-48),随后测定了MaDA-3催化的不同亲二烯体(37-48)和二烯体(2和8)之间D-A反应的转化率。
具体操作如下:向96微升的反应缓冲液中(20mM Tris·HCl,pH=7.0)中加入1μL二烯体(2或者8,终浓度200μM)和1μL亲二烯体(终浓度100μM),再向该反应体系中加入1μL的SUMO-MaDA-3(9.6μg)和1μL内参化合物4-甲氧基苯乙酮(终浓度100μM),混匀后在50℃静置反应5分钟,加入100μL甲醇淬灭反应,13,000rpm离心30min后,进行UPLC-MS分析。底物的转化率通过比较加酶和不加酶两种反应体系中二烯体与内参的峰面积来计算得出,结果如图14所示。
实施例6 MaDA-3在D-A类型天然产物类似物上的合成应用
1、获得D-A类型天然产物类似物exo-50
对应二烯体的乙酰基前体S49(10.2mg,0.0321mmol)溶解在2毫升水和甲醇的混合溶液中(水:甲醇=1:9),然后加入碳酸钾(8.9mg,0.0642mmol),室温搅拌30分钟后,加入到由45毫升的反应缓冲液中(20mM Tris·HCl,pH=7.0),和3毫升甲醇组成的混合溶液中,再向该反应体系中加入2.0毫克SUMO-MaDA-3,随后分8次每12个小时加入50微升亲二烯体1的DMSO溶液(100mM储液),37℃下共反应5天。随后加入50毫升饱和氯化铵溶液淬灭反应,再用乙酸乙酯(50mL)萃取三次后旋干。旋干后利用C18反向高效液相色谱HPLC(Waters,XBridge@pre C18 OBDTM,150mm×19mm i.d.,5μm)进行分离纯化得到最终的产物exo-50(2.7mg,14%)以及回收2.8毫克的原料49。
[α]D24=-277.1(c=0.135,MeOH);
HRMS(ESI)calculated for C39H37O7[M+H]+617.2534,found 617.2528。
2、获得D-A类型天然产物类似物exo-52
对应二烯体的乙酰基前体S51(7.5mg,0.0237mmol)溶解在2毫升水和甲醇的混合溶液中(水:甲醇=1:9),然后加入碳酸钾(6.5mg,0.04732mmol),室温搅拌30分钟后,加入到由45毫升的反应缓冲液中(20mM Tris·HCl,pH=7.0),和3毫升甲醇组成的混合溶液中,再向该反应体系中加入2.0毫克SUMO-MaDA-3,随后分3次加入198微升亲二烯体1的DMSO溶液(100mM储液),37℃下共反应20小时。随后加入50毫升饱和氯化铵溶液淬灭反应,再用乙酸乙酯(50mL)萃取三次后旋干。旋干后利用C18反向高效液相色谱HPLC(Waters,XBridge@pre C18 OBDTM,150mm×19mm i.d.,5μm)进行分离纯化得到最终的产物exo-52(7.4mg,61%)。
[α]D24=-266.9(c=0.2,MeOH);
HRMS(ESI)calculated for C39H38NO6[M+H]+616.2694,found 616.2694。
3、获得D-A类型天然产物类似物exo-54
对应二烯体的乙酰基前体S53(11.3mg,0.0292mmol)溶解在2毫升水和甲醇的混合溶液中(水:甲醇=1:9),然后加入碳酸钾(12.1mg,0.0876mmol),室温搅拌30分钟后,加入到由45毫升的反应缓冲液中(20mM Tris·HCl,pH=7.0),和3毫升甲醇组成的混合溶液中,再向该反应体系中加入2.0毫克SUMO-MaDA-3,随后分3次加入150微升亲二烯体1的DMSO溶液(100mM储液),37℃下共反应10小时。随后加入50毫升饱和氯化铵溶液淬灭反应,再用乙酸乙酯(50mL)萃取三次后旋干。旋干后利用C18反向高效液相色谱HPLC(Waters,XBridge@pre C18 OBDTM,150mm×19mm i.d.,5μm)进行分离纯化得到最终的产物exo-54(7.4mg,77%)。
[α]D25=-211.8(c=0.73,MeOH);
HRMS(ESI)calculated for C41H39O7[M+H]+643.2690,found 643.2693。
4、获得D-A类型天然产物类似物exo-56
对应二烯体的乙酰基前体S55(9.5mg,0.0263mmol)溶解在1毫升水和甲醇的混合溶液中(水:甲醇=1:9),然后加入碳酸钾(5.5mg,0.0395mmol),室温搅拌30分钟后,加入到由45毫升的反应缓冲液中(20mM Tris·HCl,pH=7.0),和3毫升甲醇组成的混合溶液中,再向该反应体系中加入2.0毫克SUMO-MaDA-3,随后分2次加入100微升亲二烯体1的DMSO溶液(100mM储液),37℃下共反应2小时后,补加二烯体55(0.0263mmol)和亲二烯体1(0.0085mmol),继续反应2小时后加入50毫升饱和氯化铵溶液淬灭反应,再用乙酸乙酯(50mL)萃取三次后旋干。旋干后利用C18反向高效液相色谱HPLC(Waters,XBridge@pre C18OBDTM,150mm×19mm i.d.,5μm)进行分离纯化得到最终的产物exo-56(7.3mg,60%)。
[α]D25=-77.7(c=0.27,MeOH);
HRMS(ESI)calculated for C38H37FNO6[M+H]+660.2567,found 660.2574。
5、获得D-A类型天然产物类似物exo-58
对应二烯体的乙酰基前体S57(13.6mg,0.0373mmol)溶解在2毫升水和甲醇的混合溶液中(水:甲醇=1:9),然后加入碳酸钾(7.7mg,0.0559mmol),室温搅拌30分钟后,加入到48毫升的反应缓冲液中(20mM Tris·HCl,pH=7.0)中,再向该反应体系中加入2.0毫克SUMO-MaDA-3,随后分3次加入150微升亲二烯体1的DMSO溶液(100mM储液),37℃下共反应7小时后,加入50毫升饱和氯化铵溶液淬灭反应,再用乙酸乙酯(50mL)萃取三次后旋干。旋干后利用C18反向高效液相色谱HPLC(Waters,XBridge@pre C18 OBDTM,150mm×19mm i.d.,5μm)进行分离纯化得到最终的产物exo-58(8.5mg,86%)。
[α]D25=-148.6(c=0.5,MeOH);
HRMS(ESI)calculated for C39H43N4O6[M+H]+663.3177,found 663.3176。
6、获得D-A类型天然产物类似物exo-59
对应二烯体的乙酰基前体S22(13.3mg,0.0512mmol)溶解在1毫升水和甲醇的混合溶液中(水:甲醇=1:4),然后加入碳酸钾(21.2mg,0.154mmol),室温搅拌30分钟后,加入到48毫升的反应缓冲液中(20mM Tris·HCl,pH=7.0)中,再向该反应体系中加入2.0毫克SUMO-MaDA-3,随后每隔一小时分4次加入200微升亲二烯体1的DMSO溶液(100mM储液),37℃下反应9小时后,加入50毫升饱和氯化铵溶液淬灭反应,再用乙酸乙酯(50mL)萃取三次后旋干。旋干后利用C18反向高效液相色谱HPLC(Waters,XBridge@pre C18 OBDTM,150mm×19mmi.d.,5μm)进行分离纯化得到最终的产物exo-59(5.7mg,55%)。
[α]D24=-141.5(c=0.57,MeOH);
HRMS(ESI)calculated for C31H33O7[M+H]+517.2221,found 517.2222。
7、获得D-A类型天然产物类似物exo-60
/>
对应二烯体的乙酰基前体S8(12.5mg,0.0288mmol)溶解在2毫升水和甲醇的混合溶液中(水:甲醇=1:9),然后加入碳酸钾(15.6mg,0.115mmol),室温搅拌30分钟后,加入到48毫升的反应缓冲液中(20mM Tris·HCl,pH=7.0)中,再向该反应体系中加入2.0毫克SUMO-MaDA-3,随后每隔12小时加入50微升亲二烯体38的DMSO溶液(100mM储液),共加入四次,然后37℃下反应3天后,加入50毫升饱和氯化铵溶液淬灭反应,再用乙酸乙酯(50mL)萃取三次后旋干。旋干后利用C18反向高效液相色谱HPLC(Waters,XBridge@pre C18 OBDTM,150mm×19mm i.d.,5μm)进行分离纯化得到最终的产物exo-60(10.4mg,80%)。
[α]D26=-333.6(c=0.52,MeOH);
HRMS(ESI)calculated for C41H38NO7[M+H]+656.2643,found 656.2658。
8、获得D-A类型天然产物类似物exo-61及原料48
对应二烯体的乙酰基前体S8(11.4mg,0.0263mmol)溶解在2毫升水和甲醇的混合溶液中(水:甲醇=1:9),然后加入碳酸钾(16.3mg,0.118mmol),室温搅拌30分钟后,加入到48毫升的反应缓冲液中(20mM Tris·HCl,pH=7.0)中,再向该反应体系中加入2.0毫克SUMO-MaDA-3,随后每隔12小时加入50微升亲二烯体48的DMSO溶液(100mM储液),共加入四次,然后37℃下反应2天后,加入50毫升饱和氯化铵溶液淬灭反应,再用乙酸乙酯(50mL)萃取三次后旋干。旋干后利用C18反向高效液相色谱HPLC(Waters,XBridge@pre C18 OBDTM,150mm×19mm i.d.,5μm)进行分离纯化得到最终的产物exo-61(2.1mg,17%)以及原料48(4.8mg)。
[α]D26=-361.7(c=0.105,MeOH);
HRMS(ESI)calculated for C40H32NO6[M+H]+622.2224,found 622.2219。
9、获得D-A类型天然产物类似物exo-62及原料38
对应二烯体的乙酰基前体S57(15.5mg,0.0426mmol)溶解在2毫升水和甲醇的混合溶液中(水:甲醇=1:9),然后加入碳酸钾(8.8mg,0.0639mmol),室温搅拌20分钟后,加入到148毫升的反应缓冲液中(20mM Tris·HCl,pH=7.0)中,再向该反应体系中加入6.8毫克SUMO-MaDA-3和4.9毫克亲二烯体38(溶解在200微升DMSO中),37℃下反应4小时后,补加4.2毫克亲二烯体38(溶解在200微升DMSO中),在37℃下继续反应16小时后,加入50毫升饱和氯化铵溶液淬灭反应,再用乙酸乙酯(50mL)萃取三次后旋干。旋干后利用C18反向高效液相色谱HPLC(Waters,XBridge@pre C18 OBDTM,150mm×19mm i.d.,5μm)进行分离纯化得到最终的产物exo-62(4.0mg,23%)以及原料38(3.3mg)。
[α]D26=-163.0(c=0.2,MeOH);
HRMS(ESI)calculated for C41H44N5O4[M+H]+670.3388,found 670.3390。
10、获得D-A类型天然产物类似物exo-63及原料38
对应二烯体的乙酰基前体S53(12.1mg,0.0314mmol)溶解在2毫升水和甲醇的混合溶液中(水:甲醇=1:9),然后加入碳酸钾(13.0mg,0.0940mmol),室温搅拌30分钟后,加入到由45毫升的反应缓冲液中(20mM Tris·HCl,pH=7.0),和3毫升甲醇组成的混合溶液中,再向该反应体系中加入2.0毫克SUMO-MaDA-3,随后每隔6小时加入50微升亲二烯体38的DMSO溶液(100mM储液),共加入四次,在37℃下继续反应2天后,加入50毫升饱和氯化铵溶液淬灭反应,再用乙酸乙酯(50mL)萃取三次后旋干。旋干后利用C18反向高效液相色谱HPLC(Waters,XBridge@pre C18 OBDTM,150mm×19mm i.d.,5μm)进行分离纯化得到最终的产物exo-63(3.7mg,29%)以及原料38(4.2mg)。
[α]D26=-224.0(c=0.185,MeOH);
HRMS(ESI)calculated for C43H40NO5[M+H]+650.2901,found 650.2906。
本实施例证实,MaDA-3能催化不同反应底物,进行exo选择性D-A反应,生成不同D-A类型天然产物类似物。
虽然,上文中已经用一般性说明及具体实施方案对本发明作了详尽的描述,但在本发明基础上,可以对之作一些修改或改进,这对本领域技术人员而言是显而易见的。因此,在不偏离本发明精神的基础上所做的这些修改或改进,均属于本发明要求保护的范围。
序列表
<110> 北京大学
<120> 一种分子间exo选择性Diels-Alder反应酶及其应用
<130> KHP211120298.6
<160> 16
<170> SIPOSequenceListing 1.0
<210> 1
<211> 1632
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 1
atgaagtact tttccttctc tttgtcgttt cccaaaatca ccatttttct tttttcattt 60
gtattgctag cttcagcaaa tcacgctcat gaaagctttc ttgagtgctt gatctcaacc 120
tccactcccg aatccattat ctacactaaa cataatccgt cgtatttcac tatattaaat 180
tcaacgtctc taaattctcg ttttttttct tctccagcca gatatccctt gcttattgtc 240
acgccacttc atgcctccca cgtccaagcc actgttcact gcgccaagaa acacggcata 300
caaatcagaa tccgaagtgg tggccacgat tacgagggcc tctcttacat gtccaacgtt 360
acttttgcca tactcgactt gagaaaccta aattctatta acgttgatgt gaagagaaag 420
tctgcatggg ttcaatccgg agcgacgctt ggtgaacttc attattggat tgctaacaaa 480
agccaaaatc ttgcctttcc tggcgtcgtc ggacacactg tttgcatggg tggaatgcta 540
ggcgcaggtg gctatggcta ttcgtcgcga aaatacgggc tcccagctga taatattctt 600
gacgcgcaac ttatcgacgt gcgaggaaga attctcaatc gaaaatctat gggggaagat 660
ttgttttggg ccatacgtgg tggtggagca ggaagctttg gaatcgttct tgcctggaaa 720
gttcgcctag ttgacgtacc gtcgaaagtg actgtgttta cagccataag ggactgggat 780
aacaatgcaa caaagaagtt tattcaccga tatcagcgcc gtattgccaa ggtcgataag 840
aatctaacta tcattatcag attcgtaaca gaaagtacta ccgatgaaaa aagtaataag 900
aaaattgtaa tatcaacttt catcacggcc ctataccacg gcagccaaga taggctcctt 960
tcgttgatgg aaaaagactt tccagagctg ggtttgcttg caaaagaatg cactgaagag 1020
acatgggtcc aatccattct ctatttcaat tttttcacaa atggagaacc cttggaggtc 1080
ctactcaata gaacgatgaa ttttgaactg acgtctttca aaattaaatc tgactacttg 1140
aaaaagccta ttccggatca ggtgctggaa aatttgttgg ttatgttgta tgaagaagat 1200
attggagaaa cctttgtcga attttttcct tatgggggga aactggatga gatttcggag 1260
tctgaaatcc catgcccaca ccgagctgga aacctctaca accttcggta cctggtgtca 1320
tggaaagaag gtcaaaatgc tacagcagtc aacaagcatc tgagctggat aaggagagct 1380
tacaattaca tgactcccta tgtgtcaaaa aatccgagag gtgcatttct taactttaga 1440
gaccttgata ttggaactaa tcctaatgaa aatgagatca acggtgctta taactatatt 1500
aaacaagcga gcaattgggg tactaagtat tttaagaaca atttctacaa attaatttat 1560
gtaaagacta tagttgatcc aactaatttt tttacgtacg aacaaagcat cccgtccctt 1620
cttccacatt aa 1632
<210> 2
<211> 514
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 2
His Glu Ser Phe Leu Glu Cys Leu Ile Ser Thr Ser Thr Pro Glu Ser
1 5 10 15
Ile Ile Tyr Thr Lys His Asn Pro Ser Tyr Phe Thr Ile Leu Asn Ser
20 25 30
Thr Ser Leu Asn Ser Arg Phe Phe Ser Ser Pro Ala Arg Tyr Pro Leu
35 40 45
Leu Ile Val Thr Pro Leu His Ala Ser His Val Gln Ala Thr Val His
50 55 60
Cys Ala Lys Lys His Gly Ile Gln Ile Arg Ile Arg Ser Gly Gly His
65 70 75 80
Asp Tyr Glu Gly Leu Ser Tyr Met Ser Asn Val Thr Phe Ala Ile Leu
85 90 95
Asp Leu Arg Asn Leu Asn Ser Ile Asn Val Asp Val Lys Arg Lys Ser
100 105 110
Ala Trp Val Gln Ser Gly Ala Thr Leu Gly Glu Leu His Tyr Trp Ile
115 120 125
Ala Asn Lys Ser Gln Asn Leu Ala Phe Pro Gly Val Val Gly His Thr
130 135 140
Val Cys Met Gly Gly Met Leu Gly Ala Gly Gly Tyr Gly Tyr Ser Ser
145 150 155 160
Arg Lys Tyr Gly Leu Pro Ala Asp Asn Ile Leu Asp Ala Gln Leu Ile
165 170 175
Asp Val Arg Gly Arg Ile Leu Asn Arg Lys Ser Met Gly Glu Asp Leu
180 185 190
Phe Trp Ala Ile Arg Gly Gly Gly Ala Gly Ser Phe Gly Ile Val Leu
195 200 205
Ala Trp Lys Val Arg Leu Val Asp Val Pro Ser Lys Val Thr Val Phe
210 215 220
Thr Ala Ile Arg Asp Trp Asp Asn Asn Ala Thr Lys Lys Phe Ile His
225 230 235 240
Arg Tyr Gln Arg Arg Ile Ala Lys Val Asp Lys Asn Leu Thr Ile Ile
245 250 255
Ile Arg Phe Val Thr Glu Ser Thr Thr Asp Glu Lys Ser Asn Lys Lys
260 265 270
Ile Val Ile Ser Thr Phe Ile Thr Ala Leu Tyr His Gly Ser Gln Asp
275 280 285
Arg Leu Leu Ser Leu Met Glu Lys Asp Phe Pro Glu Leu Gly Leu Leu
290 295 300
Ala Lys Glu Cys Thr Glu Glu Thr Trp Val Gln Ser Ile Leu Tyr Phe
305 310 315 320
Asn Phe Phe Thr Asn Gly Glu Pro Leu Glu Val Leu Leu Asn Arg Thr
325 330 335
Met Asn Phe Glu Leu Thr Ser Phe Lys Ile Lys Ser Asp Tyr Leu Lys
340 345 350
Lys Pro Ile Pro Asp Gln Val Leu Glu Asn Leu Leu Val Met Leu Tyr
355 360 365
Glu Glu Asp Ile Gly Glu Thr Phe Val Glu Phe Phe Pro Tyr Gly Gly
370 375 380
Lys Leu Asp Glu Ile Ser Glu Ser Glu Ile Pro Cys Pro His Arg Ala
385 390 395 400
Gly Asn Leu Tyr Asn Leu Arg Tyr Leu Val Ser Trp Lys Glu Gly Gln
405 410 415
Asn Ala Thr Ala Val Asn Lys His Leu Ser Trp Ile Arg Arg Ala Tyr
420 425 430
Asn Tyr Met Thr Pro Tyr Val Ser Lys Asn Pro Arg Gly Ala Phe Leu
435 440 445
Asn Phe Arg Asp Leu Asp Ile Gly Thr Asn Pro Asn Glu Asn Glu Ile
450 455 460
Asn Gly Ala Tyr Asn Tyr Ile Lys Gln Ala Ser Asn Trp Gly Thr Lys
465 470 475 480
Tyr Phe Lys Asn Asn Phe Tyr Lys Leu Ile Tyr Val Lys Thr Ile Val
485 490 495
Asp Pro Thr Asn Phe Phe Thr Tyr Glu Gln Ser Ile Pro Ser Leu Leu
500 505 510
Pro His
<210> 3
<211> 659
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 3
Met Val Ser Ala Ile Val Leu Tyr Val Leu Leu Ala Ala Ala Ala His
1 5 10 15
Ser Ala Phe Ala Ala Gly Met Gly His His His His His His Gly Ser
20 25 30
Leu Gln Asp Ser Glu Val Asn Gln Glu Ala Lys Pro Glu Val Lys Pro
35 40 45
Glu Val Lys Pro Glu Thr His Ile Asn Leu Lys Val Ser Asp Gly Ser
50 55 60
Ser Glu Ile Phe Phe Lys Ile Lys Lys Thr Thr Pro Leu Arg Arg Leu
65 70 75 80
Met Glu Ala Phe Ala Lys Arg Gln Gly Lys Glu Met Asp Ser Leu Thr
85 90 95
Phe Leu Tyr Asp Gly Ile Glu Ile Gln Ala Asp Gln Thr Pro Glu Asp
100 105 110
Leu Asp Met Glu Asp Asn Asp Ile Ile Glu Ala His Arg Glu Gln Ile
115 120 125
Gly Gly Asp Tyr Asp Ile Pro Thr Thr Glu Asn Leu Tyr Phe Gln Gly
130 135 140
Ser His Glu Ser Phe Leu Glu Cys Leu Ile Ser Thr Ser Thr Pro Glu
145 150 155 160
Ser Ile Ile Tyr Thr Lys His Asn Pro Ser Tyr Phe Thr Ile Leu Asn
165 170 175
Ser Thr Ser Leu Asn Ser Arg Phe Phe Ser Ser Pro Ala Arg Tyr Pro
180 185 190
Leu Leu Ile Val Thr Pro Leu His Ala Ser His Val Gln Ala Thr Val
195 200 205
His Cys Ala Lys Lys His Gly Ile Gln Ile Arg Ile Arg Ser Gly Gly
210 215 220
His Asp Tyr Glu Gly Leu Ser Tyr Met Ser Asn Val Thr Phe Ala Ile
225 230 235 240
Leu Asp Leu Arg Asn Leu Asn Ser Ile Asn Val Asp Val Lys Arg Lys
245 250 255
Ser Ala Trp Val Gln Ser Gly Ala Thr Leu Gly Glu Leu His Tyr Trp
260 265 270
Ile Ala Asn Lys Ser Gln Asn Leu Ala Phe Pro Gly Val Val Gly His
275 280 285
Thr Val Cys Met Gly Gly Met Leu Gly Ala Gly Gly Tyr Gly Tyr Ser
290 295 300
Ser Arg Lys Tyr Gly Leu Pro Ala Asp Asn Ile Leu Asp Ala Gln Leu
305 310 315 320
Ile Asp Val Arg Gly Arg Ile Leu Asn Arg Lys Ser Met Gly Glu Asp
325 330 335
Leu Phe Trp Ala Ile Arg Gly Gly Gly Ala Gly Ser Phe Gly Ile Val
340 345 350
Leu Ala Trp Lys Val Arg Leu Val Asp Val Pro Ser Lys Val Thr Val
355 360 365
Phe Thr Ala Ile Arg Asp Trp Asp Asn Asn Ala Thr Lys Lys Phe Ile
370 375 380
His Arg Tyr Gln Arg Arg Ile Ala Lys Val Asp Lys Asn Leu Thr Ile
385 390 395 400
Ile Ile Arg Phe Val Thr Glu Ser Thr Thr Asp Glu Lys Ser Asn Lys
405 410 415
Lys Ile Val Ile Ser Thr Phe Ile Thr Ala Leu Tyr His Gly Ser Gln
420 425 430
Asp Arg Leu Leu Ser Leu Met Glu Lys Asp Phe Pro Glu Leu Gly Leu
435 440 445
Leu Ala Lys Glu Cys Thr Glu Glu Thr Trp Val Gln Ser Ile Leu Tyr
450 455 460
Phe Asn Phe Phe Thr Asn Gly Glu Pro Leu Glu Val Leu Leu Asn Arg
465 470 475 480
Thr Met Asn Phe Glu Leu Thr Ser Phe Lys Ile Lys Ser Asp Tyr Leu
485 490 495
Lys Lys Pro Ile Pro Asp Gln Val Leu Glu Asn Leu Leu Val Met Leu
500 505 510
Tyr Glu Glu Asp Ile Gly Glu Thr Phe Val Glu Phe Phe Pro Tyr Gly
515 520 525
Gly Lys Leu Asp Glu Ile Ser Glu Ser Glu Ile Pro Cys Pro His Arg
530 535 540
Ala Gly Asn Leu Tyr Asn Leu Arg Tyr Leu Val Ser Trp Lys Glu Gly
545 550 555 560
Gln Asn Ala Thr Ala Val Asn Lys His Leu Ser Trp Ile Arg Arg Ala
565 570 575
Tyr Asn Tyr Met Thr Pro Tyr Val Ser Lys Asn Pro Arg Gly Ala Phe
580 585 590
Leu Asn Phe Arg Asp Leu Asp Ile Gly Thr Asn Pro Asn Glu Asn Glu
595 600 605
Ile Asn Gly Ala Tyr Asn Tyr Ile Lys Gln Ala Ser Asn Trp Gly Thr
610 615 620
Lys Tyr Phe Lys Asn Asn Phe Tyr Lys Leu Ile Tyr Val Lys Thr Ile
625 630 635 640
Val Asp Pro Thr Asn Phe Phe Thr Tyr Glu Gln Ser Ile Pro Ser Leu
645 650 655
Leu Pro His
<210> 4
<211> 1653
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 4
atgaagtact tttccttctc tttgtcgttt cccaaaatca ccatctttct tttttcattt 60
gtattggtag cttcagcaaa tcacgctcat gaaagctttc ttgagtgctt gaccacccgt 120
atatctaagt ccaactcaac ctccactccc gaatccatta tctacactaa agataatccg 180
tcgtattcaa ctatattaaa ttcaacgtct ctaaatcctc gtttctttcc ttcttccgcc 240
agatatccct tgcttattgt cacgccactt catgcctccc acgtccaagc cactgttcac 300
tgcgccaaga aacacggcat acaaatcaga atccgaagtg gtggccacga ttacgagggc 360
ctctcttaca tgtccaacgt tacttttgcc atagtcgact tgagaaacct aagttccatt 420
gacgttgatg tgaagagaaa gtctgcatgg gttcaatccg gagcgacgct tggtgaactt 480
cattattgga ttgctaaaaa aagccaaaat cttgcctttc ctggcgtcgt cggacacact 540
gttggtatcg gtggaatgct aggtgcaggt ggctatggct attcgtcgcg aaaatacggg 600
ctctcagctg ataatattct tgacgcgcag cttatcgacg tgcgaggaag aattctcaat 660
cgaaaatcta tgggggaaga tttgttttgg gccatacgtg gtggtggagc aggaagcttt 720
ggaatcgttc ttgcctggaa agttcgccta gttgacgtac cgtcgaaagt gactgtgttt 780
acagccataa gggactggga taacaatgca acaaagaagt ttattcatcg atatcagcgc 840
cgtattgcca aggtcgataa ggatctaact atcattgtca gattcctaac agcaagtatt 900
accgatgaaa aagggagtaa gaaaattcaa atatcaactt tcatcacggc cacataccac 960
ggcagccagg ataggctcct ttcgttgatg gaaaaagagt ttccagagtt gggtttgctt 1020
gcaaaagaat gcgccgaagg ggcatgggtc caatccattc tctatttcaa tttattgaca 1080
aatagcaaat ccttggatgt cttactcaat agaacgctga attttgaatg gagggctttc 1140
aaaattaaat ctgactactt gaaaaagcct attccggatc aggtgctgga aaatttgttg 1200
gttaagttgt atgaagaaga tattggagaa acctttgtcg aattttttcc ttatgggggg 1260
aaactggatg agatttcaga atctgaaatc ccatgcccac accgagctgg aaatctctac 1320
aaccttcggt acatggtgtt gtggaaagaa ggtcaaaatg ccacagcagt caacaagcat 1380
ctgagctgga taaggagagc ttacaattac atgactccct atgtgtcaaa aaatccgagg 1440
ggtgcatttc tcaactttag agatcttgat attggaacta atcctaatga aaatgagatc 1500
aacggtgctt ataactatat taaacaagca agcaattggg gaactaagta ttttaagaat 1560
aatttttaca aattgattta tgtgaagact atagttgatc caactaattt ctttacgtac 1620
gaacaaagca tcccgtccct tcttccacat taa 1653
<210> 5
<211> 521
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 5
His Glu Ser Phe Leu Glu Cys Leu Thr Thr Arg Ile Ser Lys Ser Asn
1 5 10 15
Ser Thr Ser Thr Pro Glu Ser Ile Ile Tyr Thr Lys Asp Asn Pro Ser
20 25 30
Tyr Ser Thr Ile Leu Asn Ser Thr Ser Leu Asn Pro Arg Phe Phe Pro
35 40 45
Ser Ser Ala Arg Tyr Pro Leu Leu Ile Val Thr Pro Leu His Ala Ser
50 55 60
His Val Gln Ala Thr Val His Cys Ala Lys Lys His Gly Ile Gln Ile
65 70 75 80
Arg Ile Arg Ser Gly Gly His Asp Tyr Glu Gly Leu Ser Tyr Met Ser
85 90 95
Asn Val Thr Phe Ala Ile Val Asp Leu Arg Asn Leu Ser Ser Ile Asp
100 105 110
Val Asp Val Lys Arg Lys Ser Ala Trp Val Gln Ser Gly Ala Thr Leu
115 120 125
Gly Glu Leu His Tyr Trp Ile Ala Lys Lys Ser Gln Asn Leu Ala Phe
130 135 140
Pro Gly Val Val Gly His Thr Val Gly Ile Gly Gly Met Leu Gly Ala
145 150 155 160
Gly Gly Tyr Gly Tyr Ser Ser Arg Lys Tyr Gly Leu Ser Ala Asp Asn
165 170 175
Ile Leu Asp Ala Gln Leu Ile Asp Val Arg Gly Arg Ile Leu Asn Arg
180 185 190
Lys Ser Met Gly Glu Asp Leu Phe Trp Ala Ile Arg Gly Gly Gly Ala
195 200 205
Gly Ser Phe Gly Ile Val Leu Ala Trp Lys Val Arg Leu Val Asp Val
210 215 220
Pro Ser Lys Val Thr Val Phe Thr Ala Ile Arg Asp Trp Asp Asn Asn
225 230 235 240
Ala Thr Lys Lys Phe Ile His Arg Tyr Gln Arg Arg Ile Ala Lys Val
245 250 255
Asp Lys Asp Leu Thr Ile Ile Val Arg Phe Leu Thr Ala Ser Ile Thr
260 265 270
Asp Glu Lys Gly Ser Lys Lys Ile Gln Ile Ser Thr Phe Ile Thr Ala
275 280 285
Thr Tyr His Gly Ser Gln Asp Arg Leu Leu Ser Leu Met Glu Lys Glu
290 295 300
Phe Pro Glu Leu Gly Leu Leu Ala Lys Glu Cys Ala Glu Gly Ala Trp
305 310 315 320
Val Gln Ser Ile Leu Tyr Phe Asn Leu Leu Thr Asn Ser Lys Ser Leu
325 330 335
Asp Val Leu Leu Asn Arg Thr Leu Asn Phe Glu Trp Arg Ala Phe Lys
340 345 350
Ile Lys Ser Asp Tyr Leu Lys Lys Pro Ile Pro Asp Gln Val Leu Glu
355 360 365
Asn Leu Leu Val Lys Leu Tyr Glu Glu Asp Ile Gly Glu Thr Phe Val
370 375 380
Glu Phe Phe Pro Tyr Gly Gly Lys Leu Asp Glu Ile Ser Glu Ser Glu
385 390 395 400
Ile Pro Cys Pro His Arg Ala Gly Asn Leu Tyr Asn Leu Arg Tyr Met
405 410 415
Val Leu Trp Lys Glu Gly Gln Asn Ala Thr Ala Val Asn Lys His Leu
420 425 430
Ser Trp Ile Arg Arg Ala Tyr Asn Tyr Met Thr Pro Tyr Val Ser Lys
435 440 445
Asn Pro Arg Gly Ala Phe Leu Asn Phe Arg Asp Leu Asp Ile Gly Thr
450 455 460
Asn Pro Asn Glu Asn Glu Ile Asn Gly Ala Tyr Asn Tyr Ile Lys Gln
465 470 475 480
Ala Ser Asn Trp Gly Thr Lys Tyr Phe Lys Asn Asn Phe Tyr Lys Leu
485 490 495
Ile Tyr Val Lys Thr Ile Val Asp Pro Thr Asn Phe Phe Thr Tyr Glu
500 505 510
Gln Ser Ile Pro Ser Leu Leu Pro His
515 520
<210> 6
<211> 666
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 6
Met Val Ser Ala Ile Val Leu Tyr Val Leu Leu Ala Ala Ala Ala His
1 5 10 15
Ser Ala Phe Ala Ala Gly Met Gly His His His His His His Gly Ser
20 25 30
Leu Gln Asp Ser Glu Val Asn Gln Glu Ala Lys Pro Glu Val Lys Pro
35 40 45
Glu Val Lys Pro Glu Thr His Ile Asn Leu Lys Val Ser Asp Gly Ser
50 55 60
Ser Glu Ile Phe Phe Lys Ile Lys Lys Thr Thr Pro Leu Arg Arg Leu
65 70 75 80
Met Glu Ala Phe Ala Lys Arg Gln Gly Lys Glu Met Asp Ser Leu Thr
85 90 95
Phe Leu Tyr Asp Gly Ile Glu Ile Gln Ala Asp Gln Thr Pro Glu Asp
100 105 110
Leu Asp Met Glu Asp Asn Asp Ile Ile Glu Ala His Arg Glu Gln Ile
115 120 125
Gly Gly Asp Tyr Asp Ile Pro Thr Thr Glu Asn Leu Tyr Phe Gln Gly
130 135 140
Ser His Glu Ser Phe Leu Glu Cys Leu Thr Thr Arg Ile Ser Lys Ser
145 150 155 160
Asn Ser Thr Ser Thr Pro Glu Ser Ile Ile Tyr Thr Lys Asp Asn Pro
165 170 175
Ser Tyr Ser Thr Ile Leu Asn Ser Thr Ser Leu Asn Pro Arg Phe Phe
180 185 190
Pro Ser Ser Ala Arg Tyr Pro Leu Leu Ile Val Thr Pro Leu His Ala
195 200 205
Ser His Val Gln Ala Thr Val His Cys Ala Lys Lys His Gly Ile Gln
210 215 220
Ile Arg Ile Arg Ser Gly Gly His Asp Tyr Glu Gly Leu Ser Tyr Met
225 230 235 240
Ser Asn Val Thr Phe Ala Ile Val Asp Leu Arg Asn Leu Ser Ser Ile
245 250 255
Asp Val Asp Val Lys Arg Lys Ser Ala Trp Val Gln Ser Gly Ala Thr
260 265 270
Leu Gly Glu Leu His Tyr Trp Ile Ala Lys Lys Ser Gln Asn Leu Ala
275 280 285
Phe Pro Gly Val Val Gly His Thr Val Gly Ile Gly Gly Met Leu Gly
290 295 300
Ala Gly Gly Tyr Gly Tyr Ser Ser Arg Lys Tyr Gly Leu Ser Ala Asp
305 310 315 320
Asn Ile Leu Asp Ala Gln Leu Ile Asp Val Arg Gly Arg Ile Leu Asn
325 330 335
Arg Lys Ser Met Gly Glu Asp Leu Phe Trp Ala Ile Arg Gly Gly Gly
340 345 350
Ala Gly Ser Phe Gly Ile Val Leu Ala Trp Lys Val Arg Leu Val Asp
355 360 365
Val Pro Ser Lys Val Thr Val Phe Thr Ala Ile Arg Asp Trp Asp Asn
370 375 380
Asn Ala Thr Lys Lys Phe Ile His Arg Tyr Gln Arg Arg Ile Ala Lys
385 390 395 400
Val Asp Lys Asp Leu Thr Ile Ile Val Arg Phe Leu Thr Ala Ser Ile
405 410 415
Thr Asp Glu Lys Gly Ser Lys Lys Ile Gln Ile Ser Thr Phe Ile Thr
420 425 430
Ala Thr Tyr His Gly Ser Gln Asp Arg Leu Leu Ser Leu Met Glu Lys
435 440 445
Glu Phe Pro Glu Leu Gly Leu Leu Ala Lys Glu Cys Ala Glu Gly Ala
450 455 460
Trp Val Gln Ser Ile Leu Tyr Phe Asn Leu Leu Thr Asn Ser Lys Ser
465 470 475 480
Leu Asp Val Leu Leu Asn Arg Thr Leu Asn Phe Glu Trp Arg Ala Phe
485 490 495
Lys Ile Lys Ser Asp Tyr Leu Lys Lys Pro Ile Pro Asp Gln Val Leu
500 505 510
Glu Asn Leu Leu Val Lys Leu Tyr Glu Glu Asp Ile Gly Glu Thr Phe
515 520 525
Val Glu Phe Phe Pro Tyr Gly Gly Lys Leu Asp Glu Ile Ser Glu Ser
530 535 540
Glu Ile Pro Cys Pro His Arg Ala Gly Asn Leu Tyr Asn Leu Arg Tyr
545 550 555 560
Met Val Leu Trp Lys Glu Gly Gln Asn Ala Thr Ala Val Asn Lys His
565 570 575
Leu Ser Trp Ile Arg Arg Ala Tyr Asn Tyr Met Thr Pro Tyr Val Ser
580 585 590
Lys Asn Pro Arg Gly Ala Phe Leu Asn Phe Arg Asp Leu Asp Ile Gly
595 600 605
Thr Asn Pro Asn Glu Asn Glu Ile Asn Gly Ala Tyr Asn Tyr Ile Lys
610 615 620
Gln Ala Ser Asn Trp Gly Thr Lys Tyr Phe Lys Asn Asn Phe Tyr Lys
625 630 635 640
Leu Ile Tyr Val Lys Thr Ile Val Asp Pro Thr Asn Phe Phe Thr Tyr
645 650 655
Glu Gln Ser Ile Pro Ser Leu Leu Pro His
660 665
<210> 7
<211> 1545
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 7
catgaaagct ttcttgagtg cttgatctca acctccactc ccgaatccat tatctacact 60
aaacataatc cgtcgtattt cactatatta aattcaacgt ctctaaattc tcgttttttt 120
tcttctccag ccagatatcc cttgcttatt gtcacgccac ttcatgcctc ccacgtccaa 180
gccactgttc actgcgccaa gaaacacggc atacaaatca gaatccgaag tggtggccac 240
gattacgagg gcctctctta catgtccaac gttacttttg ccatactcga cttgagaaac 300
ctaaattcta ttaacgttga tgtgaagaga aagtctgcat gggttcaatc cggagcgacg 360
cttggtgaac ttcattattg gattgctaac aaaagccaaa atcttgcctt tcctggcgtc 420
gtcggacaca ctgtttgcat gggtggaatg ctaggcgcag gtggctatgg ctattcgtcg 480
cgaaaatacg ggctcccagc tgataatatt cttgacgcgc aacttatcga cgtgcgagga 540
agaattctca atcgaaaatc tatgggggaa gatttgtttt gggccatacg tggtggtgga 600
gcaggaagct ttggaatcgt tcttgcctgg aaagttcgcc tagttgacgt accgtcgaaa 660
gtgactgtgt ttacagccat aagggactgg gataacaatg caacaaagaa gtttattcac 720
cgatatcagc gccgtattgc caaggtcgat aagaatctaa ctatcattat cagattcgta 780
acagaaagta ctaccgatga aaaaagtaat aagaaaattg taatatcaac tttcatcacg 840
gccctatacc acggcagcca agataggctc ctttcgttga tggaaaaaga ctttccagag 900
ctgggtttgc ttgcaaaaga atgcactgaa gagacatggg tccaatccat tctctatttc 960
aattttttca caaatggaga acccttggag gtcctactca atagaacgat gaattttgaa 1020
ctgacgtctt tcaaaattaa atctgactac ttgaaaaagc ctattccgga tcaggtgctg 1080
gaaaatttgt tggttatgtt gtatgaagaa gatattggag aaacctttgt cgaatttttt 1140
ccttatgggg ggaaactgga tgagatttcg gagtctgaaa tcccatgccc acaccgagct 1200
ggaaacctct acaaccttcg gtacctggtg tcatggaaag aaggtcaaaa tgctacagca 1260
gtcaacaagc atctgagctg gataaggaga gcttacaatt acatgactcc ctatgtgtca 1320
aaaaatccga gaggtgcatt tcttaacttt agagaccttg atattggaac taatcctaat 1380
gaaaatgaga tcaacggtgc ttataactat attaaacaag cgagcaattg gggtactaag 1440
tattttaaga acaatttcta caaattaatt tatgtaaaga ctatagttga tccaactaat 1500
ttttttacgt acgaacaaag catcccgtcc cttcttccac attaa 1545
<210> 8
<211> 1566
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 8
catgaaagct ttcttgagtg cttgaccacc cgtatatcta agtccaactc aacctccact 60
cccgaatcca ttatctacac taaagataat ccgtcgtatt caactatatt aaattcaacg 120
tctctaaatc ctcgtttctt tccttcttcc gccagatatc ccttgcttat tgtcacgcca 180
cttcatgcct cccacgtcca agccactgtt cactgcgcca agaaacacgg catacaaatc 240
agaatccgaa gtggtggcca cgattacgag ggcctctctt acatgtccaa cgttactttt 300
gccatagtcg acttgagaaa cctaagttcc attgacgttg atgtgaagag aaagtctgca 360
tgggttcaat ccggagcgac gcttggtgaa cttcattatt ggattgctaa aaaaagccaa 420
aatcttgcct ttcctggcgt cgtcggacac actgttggta tcggtggaat gctaggtgca 480
ggtggctatg gctattcgtc gcgaaaatac gggctctcag ctgataatat tcttgacgcg 540
cagcttatcg acgtgcgagg aagaattctc aatcgaaaat ctatggggga agatttgttt 600
tgggccatac gtggtggtgg agcaggaagc tttggaatcg ttcttgcctg gaaagttcgc 660
ctagttgacg taccgtcgaa agtgactgtg tttacagcca taagggactg ggataacaat 720
gcaacaaaga agtttattca tcgatatcag cgccgtattg ccaaggtcga taaggatcta 780
actatcattg tcagattcct aacagcaagt attaccgatg aaaaagggag taagaaaatt 840
caaatatcaa ctttcatcac ggccacatac cacggcagcc aggataggct cctttcgttg 900
atggaaaaag agtttccaga gttgggtttg cttgcaaaag aatgcgccga aggggcatgg 960
gtccaatcca ttctctattt caatttattg acaaatagca aatccttgga tgtcttactc 1020
aatagaacgc tgaattttga atggagggct ttcaaaatta aatctgacta cttgaaaaag 1080
cctattccgg atcaggtgct ggaaaatttg ttggttaagt tgtatgaaga agatattgga 1140
gaaacctttg tcgaattttt tccttatggg gggaaactgg atgagatttc agaatctgaa 1200
atcccatgcc cacaccgagc tggaaatctc tacaaccttc ggtacatggt gttgtggaaa 1260
gaaggtcaaa atgccacagc agtcaacaag catctgagct ggataaggag agcttacaat 1320
tacatgactc cctatgtgtc aaaaaatccg aggggtgcat ttctcaactt tagagatctt 1380
gatattggaa ctaatcctaa tgaaaatgag atcaacggtg cttataacta tattaaacaa 1440
gcaagcaatt ggggaactaa gtattttaag aataattttt acaaattgat ttatgtgaag 1500
actatagttg atccaactaa tttctttacg tacgaacaaa gcatcccgtc ccttcttcca 1560
cattaa 1566
<210> 9
<211> 45
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 9
aacctgtatt ttcagggatc catgaagtac ttttccttct ctttg 45
<210> 10
<211> 45
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 10
aacctgtatt ttcagggatc catgaagtac ttttccttct ctttg 45
<210> 11
<211> 45
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 11
aacctgtatt ttcagggatc ccatgaaagc tttcttgagt gcttg 45
<210> 12
<211> 39
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 12
ctagtacttc tcgacaagct tttaatgtag aagaaggga 39
<210> 13
<211> 45
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 13
gaaaacctgt attttcaggg atcccatgaa agctttcttg agtgc 45
<210> 14
<211> 43
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 14
ctctagtact tctcgacaag cttttaatgt ggaagaaggg acg 43
<210> 15
<211> 45
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 15
gaaaacctgt attttcaggg atcccatgaa agctttcttg agtgc 45
<210> 16
<211> 41
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 16
ctagtacttc tcgacaagct tttaatgtgg aagaagggac g 41

Claims (8)

1.一种分子间exo选择性Diels-Alder反应酶,其特征在于,分子间exo选择性Diels-Alder反应酶MaDA-2的氨基酸序列如SEQ ID No.2;或分子间exo选择性Diels-Alder反应酶MaDA-3的氨基酸序列如SEQ ID No.5。
2.编码分子间exo选择性Diels-Alder反应酶的基因,其特征在于,编码分子间exo选择性Diels-Alder反应酶MaDA-2基因的核苷酸序列如SEQ ID No.1;编码分子间exo选择性Diels-Alder反应酶MaDA-3基因的核苷酸序列如SEQ ID No.4所示。
3.编码权利要求1所述的分子间exo选择性Diels-Alder反应酶的DNA片段,其特征在于,编码分子间exo选择性Diels-Alder反应酶MaDA-2的DNA片段如SEQ ID No.7所示;编码分子间exo选择性Diels-Alder反应酶MaDA-3的DNA片段如SEQ ID No.8所示。
4.扩增权利要求3所述DNA片段的引物,其特征在于,所述引物如SEQ ID No.13 -14所示或SEQ ID No.15-16所示。
5.含有权利要求2所述基因或含有权利要求3所述DNA片段的生物材料,所述生物材料为表达盒、载体、微生物或昆虫细胞。
6.权利要求1所述分子间exo选择性Diels-Alder反应酶在以亲二烯体和二烯体为底物,催化Diels-Alder反应制备含有六元环骨架的桑树天然产物,或合成立体专一性exo构型产物中的应用;所述亲二烯体为查尔酮或其衍生物,二烯体为含有脱氢异戊烯基的黄酮、二苯乙烯、查尔酮或苯并呋喃。
7.如权利要求6所述的应用,其特征在于,所述分子间exo选择性Diels-Alder反应酶的氨基酸序列如SEQ ID No.5所示。
8.如权利要求7所述的应用,其特征在于,所述反应的温度为50℃,pH为7.0。
CN202111228876.8A 2021-10-21 2021-10-21 一种分子间exo选择性Diels-Alder反应酶及其应用 Active CN113943716B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111228876.8A CN113943716B (zh) 2021-10-21 2021-10-21 一种分子间exo选择性Diels-Alder反应酶及其应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111228876.8A CN113943716B (zh) 2021-10-21 2021-10-21 一种分子间exo选择性Diels-Alder反应酶及其应用

Publications (2)

Publication Number Publication Date
CN113943716A CN113943716A (zh) 2022-01-18
CN113943716B true CN113943716B (zh) 2023-12-26

Family

ID=79332183

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111228876.8A Active CN113943716B (zh) 2021-10-21 2021-10-21 一种分子间exo选择性Diels-Alder反应酶及其应用

Country Status (1)

Country Link
CN (1) CN113943716B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111718910B (zh) * 2019-03-20 2023-01-13 中国中医科学院中药研究所 Diels-Alder型加合物合成代谢途径中的FAD依赖氧化酶Ma-1及应用

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108034641A (zh) * 2018-01-24 2018-05-15 浙江大学 一种紫外诱导桑叶中Diels-Alderase酶的分离纯化方法及其用途
CN110951700A (zh) * 2019-11-19 2020-04-03 北京大学 一种Diels-Alder反应酶及其应用
CN110964702A (zh) * 2019-11-19 2020-04-07 北京大学 一种Diels-Alder反应酶的应用及其突变体的制备方法与应用

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108034641A (zh) * 2018-01-24 2018-05-15 浙江大学 一种紫外诱导桑叶中Diels-Alderase酶的分离纯化方法及其用途
CN110951700A (zh) * 2019-11-19 2020-04-03 北京大学 一种Diels-Alder反应酶及其应用
CN110964702A (zh) * 2019-11-19 2020-04-07 北京大学 一种Diels-Alder反应酶的应用及其突变体的制备方法与应用

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
FAD-dependent enzyme-catalysed intermolecular [4+2] cycloaddition in natural product biosynthesis;Gao等;《Nat Chem 》;第12卷(第7期);全文 *
微生物来源Diels-Alder型加合物生物合成研究进展;张敏;戴均贵;;药学进展(第01期);全文 *

Also Published As

Publication number Publication date
CN113943716A (zh) 2022-01-18

Similar Documents

Publication Publication Date Title
EP3825398A1 (en) Diels-alderase and use thereof
CN107099516A (zh) 7β‑羟基甾醇脱氢酶突变体及其在熊脱氧胆酸合成中的应用
CN108239618A (zh) 共表达环己酮单加氧酶和异丙醇脱氢酶的基因工程菌及其应用
CN109706191A (zh) 一种托莫西汀中间体的酶催化合成方法
WO2020048523A1 (zh) 合成黄芩素和野黄芩素的微生物、其制备方法及其应用
CN113943716B (zh) 一种分子间exo选择性Diels-Alder反应酶及其应用
CN111778229B (zh) 环己烯甲酸酯水解酶及其突变体、编码基因、表达载体、重组菌与应用
CN112899177A (zh) 表达黑芥子酶tgg4的重组解脂耶氏酵母菌及其应用
CN109852644A (zh) 一种制备布瓦西坦中间体的方法
CN113583988B (zh) 氨基酸脱氢酶突变体及其应用
CN113322291A (zh) 一种手性氨基醇类化合物的合成方法
CN110358751A (zh) 一种重组脂肪酶突变体、编码基因、重组工程菌及应用
CN109355271A (zh) 一种海洋红酵母来源的环氧化物水解酶及其应用
CN113174377B (zh) 羰基还原酶、突变体及其在制备地尔硫卓中间体中的应用
CN109971730A (zh) 一种来源于黑曲霉的单胺氧化酶用于手性胺中间体的制备
KR20240032944A (ko) 람노스가 고도로 특이적인 글리코실트랜스퍼라제 및 이의 응용
CN114277024B (zh) 一种新型三萜合酶及其应用
CN108277216A (zh) 高活性s-氰醇裂解酶及其应用
CN106520743A (zh) 重组羟腈裂解酶及其用于制备光学纯手性氰醇的应用
CN109913431A (zh) 一种来源于白曲霉的单胺氧化酶用于手性胺中间体的制备
CN111718911A (zh) Diels-Alder型加合物合成代谢途径中的FAD依赖氧化酶Ma-2及应用
CN117230031B (zh) 羰基还原酶突变体及其应用
CN109897836A (zh) 一种来源于米曲霉的单胺氧化酶用于手性胺中间体的制备
CN111718910B (zh) Diels-Alder型加合物合成代谢途径中的FAD依赖氧化酶Ma-1及应用
CN112442523B (zh) 一种酶法拆分制备(r)-1,2,3,4-四氢异喹啉-1-甲酸及其衍生物的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant